大数据环境下复杂社会网络的社区发现方法研究综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 社 区 定 义
社 区本 身 只是 一 个 定 性 的 概 念 , 自提 出 之 日起 , 关 于
绕此课题开展 了深 入研 究 , 取 得 了 一 系 列 重 要 的 研 究 成 果 。当 前 , 对 社 区发 现 研 究 的 分 析 与 综 述 工 作 较 少 , 不 利
之 间 的联 系 信 息 。局 部 社 区 定 义 一 般 会 给 出 一 种 社 区 应
满 足 的条 件 或 约 束 , 据 此 找 出 网络 中能 够 满 足 该 条 件 的极
摘 要 : 社会化媒体 大数据环境 下的社 区发现研 究, 是社会 网络分析与挖掘领域的一个热门研 究方向, 已有众 多学者
提 出各 种研 究 方 法 , 但 对 当前 研 究工 作 的 进 展 分 析 相 对 较 少 。首 先 从 局 部 、 全局 、 节 点 相 似 度 3个 角度 讨 论 社 区的 定
社 区 发 现 的 重要 性 , 吸 引 了 国 内外 学 者 的广 泛 关 注 。斯 坦 连边相对稀疏 。
组( 团) , 同一 组 内 的 节 点 之 间 连 接 相 对 紧 密 , 组 与 组 之 间
当前对社区的定义 , 可 以 分 为 3类 : 基 于 局 部 的社 区
定义 、 基 于 全 局 的 社 区 定 义 与 基 于 结 构 相 似 度 的 社 区 定
义, 然 后 针 对 网络 的 大规 模 、 动态、 异 构 3个 特 性 , 分 别调 研 与 梳 理 国 内外 相 关 文 献 , 并从采取 的主要技 术、 数 据 建 模 方法、 可 处理 的 网络 规 模 、 网 络 时序 特征 4个 方 面 比较 与 总 结 其 中 的代 表 性 方 法 , 分 析 当前 的 学 术 思路 与 发 展 动 态 , 最 后 指 出该 研 究 领 域 存 在 的 挑 战 及 未 来 可 能 的 研 究 方 向 。
关键词 : 大数据 ; 社 区发 现 ; 复 杂社 会 网 络
D O I : 1 0 . 1 1 9 0 7 / r j d k . 1 6 2 5 0 5
中图 分 类 号 : TP 3 O l
文献 标 识 码 : A
文章 编 号 : 1 6 7 2 — 7 8 0 0 ( 2 0 1 6 ) 0 1 2 — 0 1 6 4 — 0 4
义 ] : ① 基 于 局 部 的社 区 定 义 , 只 考 虑 社 区 内 部 节 点 及 社
区 内部 节 点 与 外 部 节 点 间 的联 系 , 而 不 考 虑 社 区 外 部 节 点
福大学 、 康奈 尔大 学 、 卡 内基梅 隆 大学 、 亚 利 桑 那 州 立 大 学、 清 华 大学 、 中科 院 等 国 内外 许 多 大 学 和 研 究 机 构 都 围
社 区 的定 量 定 义 就 引起 了 来 自不 同 领 域 学 者 们 的 争 议 与
0 引言
社 区发 现 旨在 探 测 复 杂 社 会 网 络 中 具 有 共 性 特 征 或
广泛 讨 论 , 直 至 目前 , 仍 然 没 有 一 个 被 广 为 接 受 的 定 量 定
义 。直 观上 讲 , 社 区通 常 被 认 为 是 复 杂 网 络 中 的一 些 节 点 紧密 关 系 的 群 体 。该 研 究 能 帮 助 人 们 从 介 观 ( Me s o s c o p — i c ) 的视 角 分 析 网络 的 拓 扑 结 构 , 理解 网络功能 , 揭 示 网 络 中 的 隐含 模 式 , 以及 分 析 预 测 网络 行 为 。 同 时 , 还 可 以 应 用 在 智 能推 荐 、 精 准 营销 、 个 性 化 服 务 等 诸 多 领 域 。 因此 , 社 区 发 现研 究 具 有 重 要 的 理 论 意 义 和 较 高 的应 用 价 值 。
( 代表性的有 E — R 网络) 为 参照 , 依 据 当 前 网 络 与 参 照 网
存在 的挑战及可能 的发展方 向。
络 的 偏 差 来 定 义 社 区 。 即在 保 证 两 种 网 络 节 点 度 分 布 相
同 的情 况 下 , 随 机 放 置 节 点 间 的边 , 若 某 一 个 子 网 络 内部
滚 动得 到最 终 的社 区 ; ②基于全 局的社 区定义 , 则 从 网 络
整体 出 发 , 通 过 网络 中 的某 个 性 质 间 接 给 出社 区定 义 。 全
局 定 义 方式 中 最有 代 表 性 的社 区 定 义 是 基 于 模 块 度 的 定
义( mo d u l a r i t y ) ¨ 3 ] 。基 于 模 块 度 的社 区定 义 , 以 随 机 网 络
第1 5 卷 第1 2 期 2 0 1 6 年1 2 月
软 件 导 刊
Sof t wa r e Gui de
Vb1 .1 5 NO.1 2 De c . 2O1 6
大 数 据 环 境 下 复 杂社 会 网络 的社 区发 现 方 法 研 究 综 述
赵 中英 , 李 超
( 1 . 山 东科 技 大 学 计 算机科 学 与工程 学 院 ; 2 . 山 东省 智 慧矿 山信 息技 术重 点 实验 室 , 山东 青岛 2 6 6 5 9 0 )
大子 网络 , 这 些 子 网络 则 被 称 为 社 区 。例 如 : P a l l a等口 提
出 k - c l i q u e ( 大 小 为 k的 c l i q u e ) 社 区定 义 , 通过 k — c l i q u e的
于把握境 下 复 杂 社 会 网 络 的 社 区 发 现 方 法 进 行 综 述 。首 先 从 三 个 层 面 讨论 社 区定 义 , 然 后 针 对 网 络 的大 规 模 、 动态 、 异 构 3个 特性 , 阐述 与 比较 已有 的社 区 发 现方法 , 分析现有工作 的学术思 路与发 展动态 , 最后指 出
相关文档
最新文档