复杂网络的度分布研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
网络的形成并不受资源的制约, 而是受到社会各种 思潮的影响。BB S 会员网的度分布指数小于 2, 说明 存在相当比例的HU B 会员, 也间接说明热点话题较 多。 情形 2 度分布指数介于 2 ~ 3 之间 这 类网络包括 In ternet A S、In ternet Rou ter、 Phone ca ll、 M ovie A cto rs。
第4 期
王 林等: 复杂网络的度分布研究
・407・
的增长, 度值很高的节点由于方差的发散而增加, 但 增加的速度会因为均值的有限而极为缓慢。 这一点 从网络运营的效率考虑, 意味着在不明显降低服务 质量的同时, 显著提高规模效益。 因此, 这回答了绝 大多数用于运营的技术类网络应该属于这个范畴的 理论原因。 情形 6 Χ > 3 显然, 当 N 充分大时, 度值的均值 d Λ 和方差 d Ρ 均收敛, 并且随着 Χ 的增加, 方差将越来越小, 均值 向 1 靠近。 此时, 网络中的绝大多数节点的度值很接 近, 网络中即使存在度值很高的节点, 其数量也是极 少, 且不会随着网络规模的增加而增加。 显然, 这样 的网络一方面不能够抵御网络的随机故障 ( 因其类 似于随机网络) ; 另一方面, 其通信效率极低 ( 因为度 值很高的 HU B 节点非常罕见, 即通信枢纽奇缺) 。 可以断言, 这样的网络属于极不稳定且效率极低的 一类。
CN =
W = N d Λ = O (N
)
1
N - 1
( 4)
- Χ
∑k
k= 1 N - 1
可以看出, 当网络的规模趋于无穷时, 一阶矩、 二阶矩均发散, 另外, 可以证明, 方差亦发散。 与情形 1 和情形 2 的区别是: 网络中总边数 W 的数量级 3- Χ ) 已显著低于完全网络中的总边数的数量 O (N 级。 这类网络属于稀疏网络, 但是由于均值和方差都 发散, 说明网络中度值很高的节点 ( 称为 HU B 节点) 偏多。 对于技术类网络来说, 这意味着建设成本显著 提高。 因此, 技术类网络 ( 如 In ternet ) 的度分布指数 不应位于这个范围。 情形 4 Χ = 2 该情形的结论与情形 3 类似。 情形 5 2 < Χ Φ 3 利用上述类似的讨论, 可以发现此时当 N 充分 大 时, 度值的均值 d Λ 收敛而方差 d Ρ 发散。 方差发散 说明度值的分布严重不均匀; 均值收敛则说明平均 度值不会因为网络规模的增大而大幅增加。 因此, 这 类网络存在大量度值很小的节点, 也存在数量较少 的度值很高的节点 (HU B 节点) , 并且随着网络规模
d Λ = d M d Ρ = dM 2 dM
2
( 7)
显然, 随着 Χ 的增加, 上述一阶矩和二阶矩均在 减小, Χ → ∞ 时, d Λ → 1, d Ρ → 0。 反映在网络的拓扑 结构上, 这意味着随着 Χ的增加, 网络由异质向均质 过渡。 下面针对 Χ 的不同取值对一阶矩和二阶矩进行 估计, 并说明其物理意义。
度分布指数
2. 2 1. 867 1. 6 ~ 1. 9 3. 4 2. 48 2. 3 1. 05 1. 13 2. 1
络, 虽然不是技术类网络, 但是由于受到通信成本 ( 话费) 的制约, 其度分布指数的范围与技术类网络 类似。 ~ 3 之间, 这 M ovie A cto rs 的度分布指数位于 2 说明存在一定数量的明星级演员, 但其数量并不是 特别多, 其原因是才能出众的明星级演员本来不可 能很多, 并且明星级演员出演的成本也太高。 这或许 从一个侧面说明为什么在影片中总会出现那么几个 熟悉的面孔 ( 少数 HU B 演员) 。 情形 3 度分布指数大于 3 这类网络是 Sexua l Con tact s 网络, 其度值指数 大于 3, 说明该类网络类似于随机网络, 这与 Sexua l Con tact s 网络的性质比较吻合。
0 Φ Χ< 1
N - 1
由于∑k - Χ = O (N 有
1- Χ
),
∑k
k= 1
1- Χ
= O (N
2- Χ
) ,
1 度分布指数与网络拓扑结构的理论
分析
可以将复杂网络看成一个图, 图中的节点就是 个体, 节点之间的边表示个体之间的关系。 设 G = (V , E ) 为一个复杂网络所对应的图, V 是所有节点 的集合, E 是所有边的集合, 节点的度是指连接到该 节点的边数。 本 文中将假定复杂网络中不存在孤立节点, 不 存在自环, 节点之间最多只有一条边。 定义度分布 ( ) Pd k 为 度等于 k 的节点数 ( P d (k ) = Π 正整数 k ) 节点总数
N - 1
W = N dM = O
Baidu Nhomakorabea
( 9)
类似于情形1 中的讨论, Χ= 1 在实际网络中也 是不存在的。 情形 3
1 < Χ< 2
N - 1 k= 1
∑P
k= 1
d
( k ) = 1 ( 完备性)
( 2)
对于无标度复杂网络, P d ( k ) 是一个幂函数, 即 存在 Χ > 0 及 C N > 0 , 使得 P d (k ) = CN k
些网络中的边数很多而接近于完全网络, 从而说明 每种动物的捕食范围较为广泛。 IP B ackbone 虽然属于技术类网络, 但为了保 证骨干节点之间通信的顺畅, 骨干节点之间的链路 较多, 从而导致 IP B ackbone 网络的度分布指数小 于 2。
BB S 会员网实际上是一个社会虚拟网络, 这类
N - 1 N - 1
由于∑k - Χ = O ( lnN ) ,
k= 1
∑k
k= 1
1- Χ
= O (N ) , 有
N lnN
2
dM = O
N lnN
dM 2 = O
N lnN
2
设节点总数为 N , 边总数为 W , 则由于每个节 点的度最少为 1、 最多为 N - 1 , 易知度分布存在下 列关系
摘 要: 复杂网络的度分布与其拓扑结构紧密相关。绝大多数复杂网络具有无标度性 (Sca le free) , 其幂律度分布完全由度分布指数所确定。 文中全面研究了复杂网络的度分布指数与其拓扑结构、 形 成原因以及传播动力学之间的关系, 获得了下列结论: 实际网络的度分布指数不会低于1; 度分布指 数介于 1 ~ 2 之间的复杂网络中存在数量较多的HU B 节点, 其边数与节点数之间的关系是非线性 的, 节点数的增加将导致边数的大幅度增加; 度分布指数介于 2 ~ 3 之间的复杂网络中存在一定数 量的HU B 节点, 其边数与节点数之间的关系是线性的, 大多数受成本制约的网络属于这种类型; 度 分布指数大于3 的复杂网络近似于均质网络; 度分布指数3 构成了复杂网络中病毒防治方式的临界 点。 关 键 词: 复杂网络, 无标度, 度分布, 度分布指数 中图分类号: T 94・T P 1 文献标识码: A 文章编号: 100022758 ( 2006) 042405205 复杂网络是复杂系统的高度抽象, 它充满着自 然界、 工程界和社会界, 如细胞中的新陈代谢网络、 大脑中的神经网络、 组成生态系统的食物链网络、 社 会关系网络、 科研合作网络、 经贸网络、 互联网、 万维 网以及电力网等等[ 1~ 5 ]。 由于各种复杂网络的规模庞大 ( 其节点数从几 千到几亿不等) , 过去研究人员将其抽象成随机网络 进行研究, 并形成了一套完整的随机图理论。 根据随 机图理论, 复杂网络的度分布服从 Po isson 分布, 其 特征是网络中绝大多数节点的度值分布在均值附 近, 在此意义下, 复杂网络是均质网络[ 6 ]。 近年来, 由于网络技术、 计算机技术以及信息处 理技术的迅速发展, 研究人员获得了许多大型实际 网络的数据并对其进行了一系列统计分析。 统计结 果表明, 复杂网络不是均质网络, 而是异质的; 复杂 网络的度分布不是服从Po isson 分布, 而是服从幂律 分布。 研究人员把度分布服从幂律分布的网络称为 无标度网络[ 6 ]。 无标度复杂网络的发现将人们对于复杂网络的 认识推向了新的高度, 来自若干研究领域 ( 包括统计 物理、 数学、 控制、 计算机网络及社会科学等) 的研究 人员从不同视角对复杂网络进行了深入研究。 研究 内容涉及复杂网络的拓扑结构、 复杂网络中无标度 特性的形成机理、 复杂网络的演化模型、 复杂网络上 的动力学行为等。研究方法包括 2 个方面: ①分析现 有实际网络的结构资料, 进一步揭示隐含在网络背 后的组成原则; ②建立各种分析模型, 进行理论研究 以及仿真分析[ 6~ 11 ]。 近5、 6 年来, 由于研究人员的努 力, 复杂网络已经成为一个横跨多门学科的边缘研 究方向。 研究表明, 复杂网络的拓扑结构性质以及复杂 网络上的动力学行为等均紧密依赖于复杂网络的度 分布。 进一步说, 由于复杂网络的无标度特性, 复杂 网络的度分布服从幂律分布, 因而度分布完全由其 幂指数 ( 度分布指数) 所确定。 统计结果表明, 绝大多 数 人造网络的度分布指数均在 2~ 3 之间; 另一方 面, 网络动力学 ( 如传染病传播、 病毒传播等) 的一些 关键性质 ( 如传播阈值) 也直接与度分布指数相关。 但是就作者所知, 专门针对复杂网络的度分布以及 度分布指数的研究尚未见诸于文献, 因而上述统计 结果的理论根由尚未揭示。 本文将对度分布指数的取值范围、 度分布指数
2 度分布指数与网络拓扑结构的实例
验证
本节将利用实际网络来说明或验证上一节中理 论分析的正确性。 本文将出现在多个文献中的若干 实际网络的度分布指数[ 6, 12 ] 列表如下:
表 1 实际网络的度分布指数 网络名称
In ternet A S IP B ackbone BB S 会员网 Sexua l Con tacts In ternet Rou ter M ovie A cto rs Y than estua ry Silw ood Pa rk Phone ca ll
Χ
此时, 当 N 充分大时, 由于∑k - Χ 收敛, 有
dM = O (N
2- Χ
( 3)
) d M 2 = O (N
3- Χ
3- Χ
) ( 10)
式中, Χ 称为度分布指数 ( deg ree exponen t ) 。 下面分 析 Χ 的取值范围与网络拓扑结构之间的关系。 根据完备性, 可得幂律中的系数如下
设度的一阶矩和二阶矩分别为 dM 和 dM , 则
2
N - 1
dM = dM 2 =
∑
k= 1
k P d (k ) = CN
2
∑k
k= 1 k= 1
1- Χ
( 5) ( 6)
N - 1
N - 1
∑
k= 1
k P d (k ) = CN
∑k
2- Χ
再设度的均值和方差分别为 d Λ 和 d Ρ , 则
In ternet A S 和 In ternet Rou ter 是技术类网络。
一方面, 为了保证通信效率, 必须存在HU B 节点; 另 一方面, 由于受到成本的制约, HU B 节点又不能太 多, 总的线路 ( 边) 也不能太多, 因而其度分布指数位 于2 ~ 3 之间。
Phone ca ll 是某一天的电话呼叫所形成的网
α
收稿日期: 2005212224 作者简介: 王 林 ( 1963- ) , 西北工业大学博士生, 主要从事复杂系统及复杂性科学的研究。
・406・
西 北 工 业 大 学 学 报
第 24 卷
与网络拓扑结构之间的关系以及度分布指数对于网 络动力学行为的影响等几个问题进行深入探讨。
情形 1
N - 1 k= 1
2 006年8月 第24卷第4 期
西北工业大学学报 Jou rna l of N o rthw estern Po lytechn ica l U n iversity
A ug. 2006 Vol . 24 N o. 4
复杂网络的度分布研究
王 林1, 2 , 戴冠中1
α
( 1. 西北工业大学 自动化学院, 陕西 西安 710072; 2. 西安理工大学 自动化学院, 陕西 西安 710048)
( 1)
2 2 d Λ = O (N ) d M 2 = O (N ) W = N d Λ = O (N )
( 8)
可以看出, 当网络的规模趋于无穷时, 一阶矩、 二阶矩均发散, 另外, 可以证明, 方差亦发散。 同时, 网络中的总边数W 与完全网络中的总边数 N (N - 1) 处于同一个数量级。 由于实际的大型 2 复杂网络都是稀疏网络, 因此, 可以断言, 0 Φ Χ< 1 在实际网络中是不存在的。 情形 2 Χ = 1