虚拟社区发现技术与方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
静态计算发 现算法
通过优化网络的全局目标函 数,搜索网络社区划分的空 间,静态的找出最佳的虚拟 社区结构。
第三章 虚拟社区发现技术与方法
社交网络中虚拟社区发现技术与方法主要研究内容包括:
一
社区发现算 法评价体系
二
用于介绍当前流行的社区结 构评判数字指标和经典网络 数据集。
静态计算发 现算法
三
通过优化网络的全局目标函 数,搜索网络社区划分的空 间,静态的找出最佳的虚拟 社区结构。
节点的自然社区:具有最大健康度的子图,即向该子图中增加一个新节点或 者从该子图中删去一个节点都将降低子图的局部健康度。
二 静态计算发现算法
三 动态计算发现算法
LF M 算 法
1 4 5 2
6 9
3 7 以节点1为种子,局部扩展找出自然社区。
8
同理,以节点8为种子,局部扩展出另一个自然社区。
Beescratch SN90 Mus Number1
SN89
Zipfel
Notch
TSN83
SN63 Whitetip Kringel Hook Shmuddel TR120 Thumper TR88
第三章 虚拟社区发现技术与方法
一 算法评价体系
1、模块度最优化算法
以某种方式调整社区划分,使得模块度目标函数达到最优化值,即得到最终社区划分
13 14 14 13 14 11 11 13 11 13
第三章 虚拟社区发现技术与方法
一 算法评价体系
3、基于概率模型的算法
通过网络模型节点间的连接模式,假设其节点的聚类结构,利用贝叶斯似然概率最大 化推断出最符合网络真实拓扑结构的网络模型,得到真实网络的社区划分。 基 于 混 合 模 型 的 算 法
LPA算法
1 2 6 7
9 7
二 静态计算发现算法
三 动态计算发现算法
4 2
5 7
2
3 2
7
8 7
按照顺序{1,8,6,5,7,3,2,4,9}更新节点标签,每个节点 的标签被更新为其最大数量的邻居所具有的标签。
第三章 虚拟社区发现技术与方法
一 算法评价体系
4、局部扩展优化算法
基于网络的局部结构定义一个健康函数,从一个种子社区开始,迭代扩展该种子社区, 直到健康函数的值最优化,形成一个最优的自然社区。
M kv kw 1 A vw 2m 2m vC1 ,wC2 ,v w
最佳社区评判指标:
EQ
1 1 2m i vCi ,wCi OvOw
kv kw A vw 2m
最大派系{1,2,3,4}、{5}、{6,7,8}、{9}
社区I 0001 110 社区II 000
010
011
1010
1011
111
仅使用霍夫曼编码的情况,平均码 字长度较长。
利用社区结构,使用二级霍夫曼编码 的最优情况,平均码字长度较短
第三章 虚拟社区发现技术与方法
一 算法评价体系
1、团(派系)过滤算法
针对网络中节点可能同时属于多个团的性质,从初始团出发动态合并属于同一社区的 团,直至得到最佳重叠社区划分。
二 静态计算发现算法
三 动态计算发现算法
结果。
经典贪心算法
3. 在模块 度取值最 大的时候 划分网络
1 4 5 2 3
6 9
7
8
1. 初始时,每个节点单独作为一个社区
2. 迭代的合并使模块度增量最大的社区
1
2
3
4
5
6
7
8
9
第三章 虚拟社区发现技术与方法
一 算法评价体系
2、多目标优化算法
通过多目标函数刻画虚拟社区结构特征,借助智能优化/启发式算法等查找最佳社区 划分。 基 于 遗 传 算 法 的 基因序列a 连边编号: 多 基因序列 c 基因序列c 同社区连边: 目 标 优 基因序列 d 基因序列 e 基因序列 b 化
二 静态计算发现算法
三 动态计算发现算法
1 基因编码
2 基因交叉 3 基因变异 4 基因解码 1 1 1 2 2 2 1 1 2 2 2 2 2 4 4 4 2 2 1 4 1 3 3 3 2 2 5 3 3 5 2 2 4 4 4 1 1 1 4 4 1 2 1 5 5 5 2 2 2 5 5 3 2 3 6 6 6 5 5 5 6 6 4 5 4 7 7 7 6 6 9 7 7 9 6 6 8 8 8 5 5 5 8 8 6 5 6 9 9 9 13 13 13 9 9 12 13 12 10 10 10 12 12 12 10 10 11 12 11 11 11 11 12 12 12 11 11 12 12 12 12 12 13 13 13 12 12 11 13 11 13 13 13 11 11 11 14 14 14 11 11 11
3.将矩阵非对角线上小于2的元素和对角线上 小于3的元素置0,剩下的非零元素置1
第三章 虚拟社区发现技术与方法
一 算法评价体系 二 静态计算发现算法 三 动态计算发现算法
2、基于相似度的聚合算法
通过查找网络中的最大派系,迭代的合并相似度最大的子社区,直到最优划分被发现。 基于相似度的EAGLE聚合算法 子社区间相似度公式:
第三章 虚拟社区发现技术与方法
一 算法评价体系
4、信息编码算法
对网络节点进行编码描述,通过随机游走在网络上产生最短数据流,代表最佳社区划
二 静态计算发现算法
三 动态计算发现算法
分结果。
Infomap算法
11
00 101
0000 11
110
1000
111 00 1001
01
100
10
011
社区I
社区II
LFR人工网络
Zap CCL
Beak
Topless
TR99 SN4 Crin
MN105
Gallatin Feather DN16 DN21
Wave Web MN23 TR82
Fish Double SN100 Oscar SN96 Bumper SN9
Scabs
TSN103 Fork Stripes
1
4
6
9
融合派系{5}、{6,7,8} 融合派系{5,6,7,8}、{9}
5
8
2
3
7
第三章 虚拟社区发现技术与方法
一 算法评价体系
3、标签传播算法
为网络中所有的节点赋予不同的标签,设计一个传播规则,标签根据这个规则在网络 上迭代传播,直到所有节点的标签传播达到稳定,最后将具有相同标签的节点划分到 一个社区中。
二 静态计算发现算法
三 动态计算发现算法
1
6 4
1
6 4 5 9 8
1
4 5
6 9
2
9
5
2
3
7
2
8 3 7
3 社区I
7 社区II
8
1. 初始时,网络模型 生成的拓扑结构
2. 迭代m次后,网络模 型生成的拓扑结构
3. 迭代n次后,网络模型 生成拓扑结构。此时网 络模型最符合真实的拓 扑结构。(n>m)
Nij n
N i . N. j
)
N
i
i.
N N ln i. N j . ln . j n j n
3.Rand Index:正确划分入各社区的内部节点对数目与网络节点对的所有组合数目
的比值。该值越大,则社区划分越合理。
R(Y , Y ) ij
kv kw A (cv , cw ) vw 2m 2m vw
二 静态计算发现算法
三 动态计算发现算法
2.NMI:将社区结构和已知节点的社区归属信息作对比,构造混合矩阵,并基于混
合矩阵计算出的类信息熵值。NMI越大,社区划分越合理。
NMI
2 Nij ln(
i, j
团(Clique):网络中的完全子图;k团:具有k个节点的完全子图。
二 静态计算发现算法
三 动态计算发现算法
k=3
1 6 4 5 2 3 7 8 9
C P M 算 法
1. 找出网络中所有的最大团
1
4wk.baidu.com5 2 6
2. 建立该网络的团-团重叠矩阵
9
3 3-团社区I
7 3-团社区II
8
根据处理后的重叠矩阵,划分出两 个重叠的3-团社区
i j n
N ( ) 2
第三章 虚拟社区发现技术与方法
一 算法评价体系
2、社区结构基准图
实际网络基准图 人工网络基准图
GN人工网络
二 静态计算发现算法
三 动态计算发现算法
Five Cross MN83 SMN5 Trigger Vau Patchback Jonah MN60 Haecksel Zig Ripplefluke Quasi PL Knit Jet Upbang DN63 TR77
动态计算发 现算法
基于网络局部拓扑信息,由 网络中的节点动态逐步推演, 最终形成虚拟社区结构
第三章 虚拟社区发现技术与方法
一 算法评价体系 二 静态计算发现算法 三 动态计算发现算法 社交网络中虚拟社区发现技术与方法主要研究内容包括 :
一
社区发现算 法评价体系
二
用于介绍当前流行的社区结 构评判数字指标和经典网络 数据集。
姓名:黄丹华 学号:015034910056
虚拟社区发现技术与方法
信息检索
社交 圈子
信息推荐
组织管理
虚拟社区 发现
聚集 群体
公共安全事件管控
信息传播控制
社会安全事件预警
第三章 虚拟社区发现技术与方法
社交网络中虚拟社区发现技术与方法主要研究内容包括:
一
社区发现算 法评价体系
二
用于介绍当前流行的社区结 构评判数字指标和经典网络 数据集。
静态计算发 现算法
三
通过优化网络的全局目标函 数,搜索网络社区划分的空 间,静态的找出最佳的虚拟 社区结构。
动态计算发 现算法
基于网络局部拓扑信息,由 网络中的节点动态逐步推演, 最终形成虚拟社区结构
第三章 虚拟社区发现技术与方法
一 算法评价体系
1、算法划分准确度指标
1.模块度:同一社区内部边的比例减去随机网络中同样社区结构下社区内部边的比 例的期望值。模块度越大,则社区划分越合理。 Q 1