复杂网络综述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ER
泊松分布
弱
静态
单层
BA
幂律分布
弱
动态
单层
PAE
PSO GMM
幂律分布
幂律分布 幂律分布
弱
可调节 弱
29/30
动态
动态 动态
单层
单层 两层
谢谢大家!
30/30
• 假设网络由ER生成过程生成(Dirichlet Distribution, Beta Distribution) • 通过节点上附着的标签信息推测边的存在及生成原因
• S. W. Linderman and R. P. Adams. Discovering latent network structure in point process data. ICML2014.
• 假设网络由ER生成过程生成 • 通过在该网络上的扩散数据推测边的存在
• Peiyuan Sun. Inferring Multiplex Diffusion Network via Multivariate Marked Hawkes Process.
• 扩展至多层网络(仍基于ER生成过程)
4
2. Erdos-Renyi Model
5. Popularity versus Similarity Model
• 社区检测
幂律分布
动态网路
单层网络
相似度坐标接近的节点地理上属于同一国家
5. Popularity versus Similarity Model
• 链接预测
幂律分布
动态网路
单层网络
存在于低度节点间且 没有公共邻居
在难预测链接上性能优于目前已有方法
• hyperbolic distance小于半径
幂律分布
动态网路
单层网络
• 得到网络中已有节点吸引一条新边 的概率等价于Model4 • 则单节点度演化及网络度分布等价 于Model4中结论
18
5. Popularity versus Similarity Model
• 模型变种:
1. 将与最近的m个节点连接扩展为 随机选择节点并以特定概率连接 2. 尝试与每个节点以特定概率连接 3. 除了新节点加入的m条边,已有 节点间也以一定概率生成边
p( xst ) 1 e( xst R )/T
幂律分布
动态网路
单层网络
19
5. Popularity versus Similarity Model
• 扩展的意义:
1. 逐步加入缺失的现实因素 2. 生成的网络尽量与现实网络拟合
网络度分布
幂律分布
动态网路
单层网络
平均集群系数
平均邻居节点度
距离分布
10
4. PA Model with initial attractiveness
• 网络模型中非常有用的套路:
• Difference Equation & Generating Function Method
幂律分布
动态网路
单层网络
• 该模型的Master Equation为:
11
4. PA Model with initial attractiveness
平均中间性
节点诞生与度分布
20
5. Popularity versus Similarity Model
• 坐标求解:
1. 根据全局极大似然度得出流行度坐标:
• 节点度越大其出现时间越早
幂律分布
动态网路
单层网络
2. 根据每个节点的连接关系计算相似度坐标:
•
• 应用:
1. 根据现实网络拓扑计算节点的坐标 2. 可用于社区检测和链接预测
幂律分布
动态网路
单层网络
p(k )
p(ki (t ) k ) k 2m 2 t 1 m0 t k 3
Ak 3
8
3. BA Model
• 优点 • 缺点
• 简单 • 节点度满足幂律分布,且为动态网络 • 仍然与现实网络有出入
幂律分布
动态网路
单层网络
• 只能作为一个解释型模型
• 越小,层间关联性越低
6. Growing Multiplex Network Model
• 优点:
• 首次提出多层网络增长模型 • 刻画了节点延迟对层间关联强度的影响
幂律分布
动态网路
两层网络
• 缺点:
• 基于PA模型,所以也遗传了PA相应的缺点 • 只能用于解释,基本无法应用
总结
模型 度分布 集群系数 动态/静态 单层/多层
• 求解该Master Equation:
• 在t很大时,将差分转化为微分
幂律分布
动态网路
单层网络
• 在t很大时,假设网络分布极限存在
12
4. PA Model with initial attractiveness
• 求解该Difference Equation:
幂律分布
动态网路
单层网络
• 假设生成函数: • 以及一些基本推论:
• 缺点:
• 在网络度分布为2时失效 • 集群现象较弱 • 仅考虑单层
16
5. Popularity versus Similarity Model
• 生成过程:
幂律分布
动态网路
单层网络
17
5. Popularity versus Similarity Model
• 证明思路:
• 求解图中红色区域的半径 • 落入该区域中节点的期望数为m
通过吸引一条新加入的边度 变为(k,q)
新加入节点度为(k,q)时 t时刻度为(k,q)且发生变化
初始条件
6. Growing Multiplex Network Model
• 结论:
幂律分布
动态网路
两层网络
1. 当两层节点同步到达时,即使关联系数为0,仍然存在耦合关系
2. 当第2层节点到达时间为幂律延迟时,延迟指数 显著影响层间关联性
• 缺点:
• 仅考虑单层
24
6. Growing Multiplex Network Model
• 生成过程:
1. 每个时刻网络加入一个新增节点i 2. 该节点在每层均有一个stub节点并引入m条边 3. α层中j节点吸引其中一条边的概率为:
幂律分布
动态网路
两层网络
[ ] i j
F (k )
• 优点
• 简单高效 • 易与机器学习中概率图模型结合
泊松分布
静态网路
单层网络
• 缺点
• 与现实网络有出入
• 节点度为泊松分布而非幂律分布 • 不存在小世界现象 • 集群现象也很少见
• 效果一般 • 扩展的Watts-Strogatz网络满足Small World和Clustering,但仍为静态单层 网络
• 单个节点的度演化:
ki m ( ki ) t ki m kj
j
幂律分布
动态网路
单层网络
ki =m 2mt ki 2t
7
t 0.5 ki (t ) m( ) ti
3. BA Model
• 整个网络度分布:
m 2t p(ki (t ) k ) p(ti 2 ) k m 2t 1 p(ti 2 ) k m 2t 1 2 k (t m0 )
5. Popularity versus Similarity Model
• 优点:
幂律分布
动态网路
单层网络
• 克服了Model4中度分布指数为2时失效的情形 • 可以通过模型参数调节网络的集群现象强度 • 融入节点的相似度信息 Papadopoulos F, Kitsak M, Serrano M Á, et al. Popularity versus similarity in growing networks.[J]. Nature, 2012.(引用量180)
泊松分布
静态网路
单层网络
• 节点度分布为:
(np)k e np p(k ) k!
3
2. Erdos-Renyi Model
泊松分布
静态网路
单层网络
• Barbieri, Nicola, Francesco Bonchi, and Giuseppe Manco. "Who to follow and why: link prediction with explanations." KDD2014.
9
4. PA Model with initial attractiveness
• 每个网络节点s拥有一个初始的吸引参数:A • 每个时刻加入一个节点并引入m条边 • 网络中已存在节点s吸引其中一条边的概率为:
幂律分布
动态网路
单层网络
qs A ( s, t ) (m A)t
• 该模型生成网络满足节点度的幂律分布 • 由生成过程可知为动态网络模型
• 类比该套路可得单节点的度随时间变化公式:
幂律分布
动态网路
单层网络
• 同时可得单节点wk.baidu.com指数与整个网络度分布指数关系:
15
4. PA Model with initial attractiveness
• 优点:
幂律分布
动态网路
单层网络
• 克服了BA Model中度分布指数为3的局限性 • 得出了单节点度指数与整个网络度分布指数的关系 • 该模型假设较少,成为很多后续模型的基础 Dorogovtsev S N, Mendes J F, Samukhin A N. Structure of growing networks with preferential linking.[J]. Physical Review Letters, 2000(引用量1385)
5
3. BA Model
• 每个时刻加入一个节点并引入m条边 • 网络中已存在节点i吸引其中一条边的概率为:
幂律分布
动态网路
单层网络
ki (ki ) kj
j
Preferential Attachment
• 该模型生成网络满足节点度的幂律分布 • 由生成过程可知为动态网络模型
6
3. BA Model
l l
F (k j )
F为同一节点在两层中 度的线性组合函数
=
( c k c k 11 j 12 j )
l
c11k c k j 12 j
6. Growing Multiplex Network Model
• Master Equation:
幂律分布
动态网路
两层网络
1. 设 Nk ,q (t ) 为t时刻第1层节点度为k,第2层节点度为q的节点的数目 2. k ,q 函数当k=q时为1,其他为0
• 集群现象很弱 • 现实网络中节点度分布指数多有出入 • 用于生成随机网络 • 如LFRbenchmark即基于此模型的改进生成随机图
Lancichinetti A, Fortunato S. Benchmarks for testing community detection algorithms on directed and weighted graphs with overlapping communities.[J]. Physical Review E,2009. (引用量477)
13
4. PA Model with initial attractiveness
幂律分布
动态网路
单层网络
• 通过Generating Function转换为如下的Differential Equation:
• 这里可以套用教科书中的经典结论求解之 • 对比求解结果中Z的各次项系数可得:
14
4. PA Model with initial attractiveness
• 现实网络通常呈现多层特性
• 节点间存在多种连接关系
• 交通网络:公路,地铁,高铁等
• 层间关系影响网络的增长
2
2. Erdos-Renyi Model
• 假设节点间边的生成互相独立 • 整个网络的似然度为:
likelihood (G ) p ij (1 p)
a i j 1 aij
多层网络模型及其应用
孙佩源 2017年4月19日
1
1. 背景
• 现实网络(社交网络、引用网络、脑网络等)并非完全随机
• 节点度服从power law(Scale Free) • 节点间平均路径长度很小(Small World)
• 现实网络动态增长
• 节点加入、撤离;边的添加、删除及重连接等 • 仍保持Scale Free和Small World特性