大型社交网络社区结构演化
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Microcomputer Applications Vo1.32,No.2,2016
基 金项 目
微 型 电脑 应 用 2016年 第 32卷第 2期
文 章 编 号 : 1007.757X(2016)02—0039—04
大 型 社 交 网络 社 区结 构 演 化
宝鹏 庆 ,范磊
摘 要 : 大型 社 交 网络 已经 成 为 互联 网 最 主要 的组 成部 分 ,是人 们 获取 信 息 、分 享 交 流 的 主要 渠 道 。而 其 中 的 社 区结 构指 的是 社 交 网 络 中一 些 人 呈现 出 的 紧 紧 聚 集 的 群 落 关 系,同一 社 区 内 的用 户 往 往 拥 有 相 同的 兴趣 话 题 。 以往 对 社 区 结构 的研 究 大 多 集 中 于使 用 无 监 督 的 社 区发 现 算 法在 大型 社 交 网络 中给 出 用 户 的社 区 划 分 方 法 。而针 对 社 交 网络 中社 区对 应 的 拓扑 结构 ,重点在 时间维度上考察 以社 区结构为基础 的邻接 图的固有特征对 其社 区成 长的影响 ,利用有 监督 的机 器学 习方法, 给 出各 个 特征 的 重要 性 排 名 以 及 预 测 社 区成 员增 长 率 的预 测 模 型 。研 究数 据 集主 要 基 于豆 瓣 小 组功 能 。 关 键 词 : 社 交 网 络 ; 社 区结 构 ;社 区演 化 ; 中图分类号 :TP311文献标志码 :A
Evolution of Com m unities in Large Social Network
Bao Pengqing,Fan Lei
(Department of Information Security Engineering,Shanghai Jiaotong University,Shanghai 200240,China)
Biblioteka Baidu
0 引言
以往 的社 区结 构研 究主 要 集 中 在 从 巨大 的 社 交 网络 拓 扑图 中探索性 的发现社 区结 构[1】,而从 2006年开始 由 Lars Backstrom等开 始了动态社区的研究[2]。本文研 究社交 网络 的社 区结构 ,从 已经 人工划分 好的社区结构 中去寻找静态 的 拓扑信息与动态 的社 区成长 信息间的隐含关联 ,为在线社 区 甚至真实社 区的组 织者 和管 理者提供 社区更好成长 的管理 策 略 。
1研 究背 景
1.1在 线 社 交 网络 社 区结 构 社 交 网 络 是 由真 实 用 户 在 社 交 网络 平 台 上 构 建 起 的 复
杂网络 ,由于用户 间在真 实世 界中的关联关系 以及用户在社 交网络平 台上构建起 的关联关系 ,会形成 “物 以类 聚,人 以 群分 ”的 聚集效应 ,而在一定范 围内,聚集非常紧密 的用户 以及 用户关联关系 的集合 ,我们称之为社 区结构 。其他的命 名 方 法 也 有 “群 组 ” 、 “簇 ” 、 “社 团 ”l】。】等 等 ,本 文 则 以社 区 结 构 来 指 代 这 一 集 合 。 1.2 动 态 社 区结 构
在 以 前 的研 究 的 预 测 模 型 中 ,加 入 了预 测 目标 月 前 一 个 月的成长 率作 为预测模 型的一个特征,而单单使用社 区拓扑 信 息得 到 的模 型 准 确 率 却 不 尽 如 人 意 。此 外 ,以前 研 究 中并 没 有 将 社 区 的成 员 数 负增 长 作 为 一个 单独 的 目标 变 量 进 行 预测 ,原 因可 能是在其 数据 集中不存 在此类情况。
Abstract:As a main part of Intem et,large social network has become the main platform for people to gain information and share their thoughts in recent years.Com m unity in social netw ork indicates the group of users who are connected densely and share same topics and interests.Past works focus on the unsupervised lear n ing algorithm of exploring t he potential community structures W hile this paper studies the structure of communities which are already labeled in social network,and gives both a prediction model to predict the community growth and a rank of feature importance.The data are built on Douba n group. Key words:Socia1 Netw ork;Community Structure;Community Evolution
近年 来,这 种动态的社区属性逐渐被更多的学者关注和 研 究[ 。而 动 态 社 区结 构 的研 究又 可 以大 致 分 为 两 类 ,第 一 是动 态的社 区结构发现算法的研究l34], 即从原先 的某一时 间节 点上 的算法推广 到拥有 时间属性的社区发现算法,旨在 找 出一些平稳 的不随时间推 移而显著变化的核心社区结构 。 第 二 是 社 区结 构 的演 化 研 究 【2J【 , 即针 对 社 区 结 构 中 的 拓 扑 信 息的更新进 行分析,旨在对 其中的演化过程进行建模 以及 预测 ,从而对社 区结构 的变 化做 出量化的解释 。 1-3 动 态 社 区 的研 究 方法 及 不 足
基 金项 目
微 型 电脑 应 用 2016年 第 32卷第 2期
文 章 编 号 : 1007.757X(2016)02—0039—04
大 型 社 交 网络 社 区结 构 演 化
宝鹏 庆 ,范磊
摘 要 : 大型 社 交 网络 已经 成 为 互联 网 最 主要 的组 成部 分 ,是人 们 获取 信 息 、分 享 交 流 的 主要 渠 道 。而 其 中 的 社 区结 构指 的是 社 交 网 络 中一 些 人 呈现 出 的 紧 紧 聚 集 的 群 落 关 系,同一 社 区 内 的用 户 往 往 拥 有 相 同的 兴趣 话 题 。 以往 对 社 区 结构 的研 究 大 多 集 中 于使 用 无 监 督 的 社 区发 现 算 法在 大型 社 交 网络 中给 出 用 户 的社 区 划 分 方 法 。而针 对 社 交 网络 中社 区对 应 的 拓扑 结构 ,重点在 时间维度上考察 以社 区结构为基础 的邻接 图的固有特征对 其社 区成 长的影响 ,利用有 监督 的机 器学 习方法, 给 出各 个 特征 的 重要 性 排 名 以 及 预 测 社 区成 员增 长 率 的预 测 模 型 。研 究数 据 集主 要 基 于豆 瓣 小 组功 能 。 关 键 词 : 社 交 网 络 ; 社 区结 构 ;社 区演 化 ; 中图分类号 :TP311文献标志码 :A
Evolution of Com m unities in Large Social Network
Bao Pengqing,Fan Lei
(Department of Information Security Engineering,Shanghai Jiaotong University,Shanghai 200240,China)
Biblioteka Baidu
0 引言
以往 的社 区结 构研 究主 要 集 中 在 从 巨大 的 社 交 网络 拓 扑图 中探索性 的发现社 区结 构[1】,而从 2006年开始 由 Lars Backstrom等开 始了动态社区的研究[2]。本文研 究社交 网络 的社 区结构 ,从 已经 人工划分 好的社区结构 中去寻找静态 的 拓扑信息与动态 的社 区成长 信息间的隐含关联 ,为在线社 区 甚至真实社 区的组 织者 和管 理者提供 社区更好成长 的管理 策 略 。
1研 究背 景
1.1在 线 社 交 网络 社 区结 构 社 交 网 络 是 由真 实 用 户 在 社 交 网络 平 台 上 构 建 起 的 复
杂网络 ,由于用户 间在真 实世 界中的关联关系 以及用户在社 交网络平 台上构建起 的关联关系 ,会形成 “物 以类 聚,人 以 群分 ”的 聚集效应 ,而在一定范 围内,聚集非常紧密 的用户 以及 用户关联关系 的集合 ,我们称之为社 区结构 。其他的命 名 方 法 也 有 “群 组 ” 、 “簇 ” 、 “社 团 ”l】。】等 等 ,本 文 则 以社 区 结 构 来 指 代 这 一 集 合 。 1.2 动 态 社 区结 构
在 以 前 的研 究 的 预 测 模 型 中 ,加 入 了预 测 目标 月 前 一 个 月的成长 率作 为预测模 型的一个特征,而单单使用社 区拓扑 信 息得 到 的模 型 准 确 率 却 不 尽 如 人 意 。此 外 ,以前 研 究 中并 没 有 将 社 区 的成 员 数 负增 长 作 为 一个 单独 的 目标 变 量 进 行 预测 ,原 因可 能是在其 数据 集中不存 在此类情况。
Abstract:As a main part of Intem et,large social network has become the main platform for people to gain information and share their thoughts in recent years.Com m unity in social netw ork indicates the group of users who are connected densely and share same topics and interests.Past works focus on the unsupervised lear n ing algorithm of exploring t he potential community structures W hile this paper studies the structure of communities which are already labeled in social network,and gives both a prediction model to predict the community growth and a rank of feature importance.The data are built on Douba n group. Key words:Socia1 Netw ork;Community Structure;Community Evolution
近年 来,这 种动态的社区属性逐渐被更多的学者关注和 研 究[ 。而 动 态 社 区结 构 的研 究又 可 以大 致 分 为 两 类 ,第 一 是动 态的社 区结构发现算法的研究l34], 即从原先 的某一时 间节 点上 的算法推广 到拥有 时间属性的社区发现算法,旨在 找 出一些平稳 的不随时间推 移而显著变化的核心社区结构 。 第 二 是 社 区结 构 的演 化 研 究 【2J【 , 即针 对 社 区 结 构 中 的 拓 扑 信 息的更新进 行分析,旨在对 其中的演化过程进行建模 以及 预测 ,从而对社 区结构 的变 化做 出量化的解释 。 1-3 动 态 社 区 的研 究 方法 及 不 足