复杂网络及其应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

复杂网络理论及其应用研究概述

刘涛 ,陈忠,余哲

(上海交通大学安泰管理学院,上海市华山路1954号287#信箱,200030)

liuzhang@

摘 要:本文从统计特性、结构模型和网络上的动力学行为三个层次简述复杂网络相关研究,并着重介绍了网络上的传播行为,认为它代表了复杂网络在社会经济系统中的重要应用。 关键词:复杂网络、小世界、无标度网络、疾病传播

1. 引言

结构决定功能是系统科学的基本观点[1]。如果我们将系统内部的各个元素作为节点,元素之间的关系视为连接,那么系统就构成了一个网络,例如神经系统可以看作大量神经细胞通过神经纤维相互连接形成的网络、计算机网络可以看作是计算机通过通信介质如光缆、双绞线、同轴电缆等相互连接形成的网络,类似的还有电力网络、社会关系网络、交通网络等等[2][3]。强调系统的结构并从结构角度分析系统的功能正是复杂网络的研究思路,所不同的是这些抽象出来的真实网络的拓扑结构性质不同于以前研究的网络,且节点众多,故称其为复杂网络(complex networks )。近年来,大量关于复杂网络的文章发表在Science 、Nature 、PRL 、PNAS 等国际一流的刊物上,从一个侧面反映了复杂网络已经成为国际学术界一个新兴的研究热点。

复杂网络的研究可以简单概括为三方面密切相关却又依次深入的内容:通过实证方法度量网络的统计性质;构建相应的网络模型来理解这些统计性质何以如此;在已知网络结构特征及其形成规则的基础上,预测网络系统的行为[3]。

2. 复杂网络的统计性质

用网络的观点描述客观世界起源于1736年德国数学家Eular 解决哥尼斯堡七桥问题。复杂网络研究的不同之处在于首先从统计角度考察网络中大规模节点及其连接之间的性质,这些性质的不同意味着不同的网络内部结构,而网络内部结构的不同导致系统功能有所差异。所以,对这些统计性质的描述和理解是我们进行复杂网络相关研究的第一步,下面简述之。

2.1 平均路径长度(The average path length)

网络研究中,一般定义两节点间的距离为连接两者的最短路径的边的数目;网络的直径为任意两点间的最大距离;网络的平均路径长度则是所有节点对之间距离的平均值,它描述了网络中节点间的分离程度,即网络有多小。复杂网络研究中一个重要的发现是绝大多数大规模真实网络的平均路径长度比想象的小得多,称之为“小世界效应”l [2]。这一提法来源

资助项目:国家自然科学基金70401019,高等学校博士点科研基金2002048020。

作者简介:

- 1 -

于著名的Milgram “小世界”试验[4],试验要求参与者把一封信传给他们熟悉的人之一,使这封信最终传到指定的人,籍此来探明熟人网络中路径长度的分布,结果表明平均传过人数仅为六,这一试验也正是流行的“六度分离”概念的起源[5]。

2.2 聚集系数(The clustering coefficient)

聚集系数C 用来描述网络中节点的聚集情况,即网络有多紧密,比如在社会网络中,你朋友的朋友可能也是你的朋友或者你的两个朋友可能彼此也是朋友。其计算方法为:假设节点i 通过条边与其它个节点相连接,如果这个节点都相互连接,它们之间应该存在条边,而这个节点之间实际存在的边数只有的话,则它与之比就是节点的聚集系数,网络的聚集系数就是整个网络中所有节点的聚集系数的平均。显然,只有在全连通网络(每个节点都与其余所有的节点相连接)中,聚集系数才能等于1,一般均小于1。在完全随机网络中,i k i k i k 2/)1(i k −i k i k i E 2/)1(−i i k k i 1C N −∼,然而实证结果却表明大部分大规模真实网络

中的节点倾向于聚集在一起,尽管聚集系数C 远远小于1,但都远比1N −大[2]。

2.3 度分布(The degree distribution)

图论中节点i 的度为节点连接的边的总数目,所有节点i 的度的平均值称为网络的平均度,定义为。网络中节点的度分布用分布函数来表示,其含义为一个任意选择的节点恰好有条边的概率,也等于网络中度数为的结点的个数占网络结点总个数的比值。

i k i i k k 〈〉)(k p k k 2.4 其它性质

上述三种统计特性是复杂网络研究的基础,随着研究的深入,人们逐渐发现真实网络还具有一些其它重要的统计性质,例如:

2.4.1 网络弹性(Network Resilience)

网络的功能依赖其节点的连通性,我们称网络节点的删除对网络连通性的影响为网络弹性,其分析有两种方式:随机删除和有选择的删除,前者称为网络的鲁棒性分析,后者称为网络的脆弱性分析。Albert 等人分别对度分布服从指数分布的随机网络模型和度分布服从幂律分布的BA 网络模型进行了研究[6],结果显示:随机删除节点基本上不影响BA 网络的平均路径长度,相反,有选择的删除节点后,BA 网络的平均路径长度较随机网络的增长快得多。这表明,BA 模型相对随机网络具有较强的鲁棒性和易受攻击性。出现上述现象的原因在于幂律分布网络中存在的少数具有很大度数的节点在网络连通中扮演着关键角色,一般也称它们为Hub 节点。

2.4.2 介数(betweeness)

介数分为边介数和节点介数[7]。节点的介数为网络中所有的最短路径中经过该节点的数量比例;边的介数含义类似。介数反映了相应的节点或者边在整个网络中的作用和影响力,具有很强的现实意义。例如,在社会关系网络或技术网络中,介数的分布特征反映了不同人员、资源和技术在相应生产关系中的地位,这对于在网络中发现和保护关键资源和技术具有重要意义。

- 2 -

2.4.3 度和聚集系数之间的相关性

网络中度和聚集系数之间的相关性被用来描述不同网络结构之间的差异[8],它包括两个方面:不同度数节点之间的相关性和节点度分布与其聚集系数之间的相关性。前者指的是网络中与高度数(或低度数)节点相连接的节点的度数偏向于高还是低;后者指的是高度数节点的聚集系数偏向于高还是低。实证表明,在社会网络(演员合作网络、公司董事网络、电子邮箱网络)中节点具有正的度的相关性,而节点度分布与其聚集系数之间却具有负的相关性;其它类型的网络(信息网络、技术网络、生物网络)则相反[9]。正因为如此,这两种相关性被认为是社会网络区别于其他类型网络的重要特征,在社会网络研究中引起了高度重视

[10]。

3. 复杂网络模型

最简单的网络模型为规则网络,其特点是每个节点的近邻数目都相同,如一维链、二维晶格、完全图等。上世纪50年代末Paul Erdös 和Alfred Rényi 提出了一种完全随机的网络模型

[11],它由个节点构成的图中以概率N p 随机连接任意两个节点而成,其平均度;平均路径长度(1)k p N pN 〈〉=−≈ln()ln()l N k 〈〉∼;聚集系数C p =;当很大时,节点度分布近似为泊松分布:N ()!k k P k e k −〈〉≈〈〉。随机网络模型的提出是网络研究中的重大成果,但它仍不能很好的刻画实际网络的性质,人们又相继提出了一些新的网络模型。

3.1 小世界网络(Small-World networks)

实证结果表明,大多数的真实网络具有小世界性(较小的最短路径)和聚集性(相对较大的聚集系数)[2],见表1所示。然而,规则网络虽具有聚集性,平均最短路径却较大;随机图则正好相反,具有小世界性,但聚集系数却相当小。

表1:实际网络的Small-world 现象[2] Network Size k 〈〉

l rand l C rand C WWW, site level

153,127 35.21 3.1 3.35 0.1078 0.00023 Internet, domain level 3015-6209 3.52-4.11

3.7-3.76 6.36-6.18 0.18-0.3 0.001 Movie actors 225,226 61 3.65 2.99 0.79 0.00027 MEDLINE co-authorship 1,520,251 18.1

4.6 4.91 0.066 1.1×10-5Math. co-authorship 70975 3.9 9.5 8.2 0.59

5.4×10-5E.coli, reaction graph

315 28.3 2.62 1.98 0.59 0.09 Silwood Park food web 154 4.75 3.40 3.23 0.15 0.03

Workds, synonyms 22,311 13.48 4.5 3.84 0.7 0.0006 Power grid

4,941 2.67 18.7 12.4 0.08 0.005 C. Elegans 282 14 2.65 2.25 0.28 0.05 下标rand 为随机网络模型下的计算,通过对比实际网络与相应随机网络(相同的节点数和边数)的性质,可以发现真实网络具有小世界和较高聚集系数的性质。

可见规则网络和随机网络并不能很好展现真实网络的性质,这说明现实世界既不是完全确定的也不是完全随机的。Watts 和Strogatz 在1998年提出了一个兼具小世界性和高聚集性

的网络模型[12],

它是复杂网络研究中的重大突破!他们通过将规则网络中的每条边以概率p - 3 -

相关文档
最新文档