复杂网络的统计力学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)
这类网络称为无标度网(Barabási 和 Albert,1999)。当一些网络呈现出指数尾部时, p(k )
的函数形式常常与随机图的泊松分布有重要的偏离。 这些发现在过去几年中引起了网络建模的复兴,导致三类主要模型的推广和研究。首先
是与 Erdös-Rényi 模型不同的仍广泛地用于许多领域作为许多建模及实证研究标准的随机 图。第二是由群聚现象激发产生的一类模型统称为小世界模型的提出。这些模型介于高度群 集的规则网络和随机图之间。最后是幂律度分布的发现,导致了重点在于网络动态特性,目 的是要提供网络演化普适性理论的各种无标度模型的构建。
3
D. Barabási-Albert 模型特性 1.平均路径长度 2.节点度相关性 3.集群系数 4.频谱特性
Ⅷ 演化网络理论
A.择优连接法 Π(k ) 1.现实网络 Π(k ) 的测定法
2.非线性择优连接法 3.初始吸引度 B.增长 1.实证结果 2.解析结果 C.局部相互作用 1.固有边及重新连接边 2.固有边和边的移除 D.增长的制约条件 1.老龄化与成本 2.逐渐老龄化 E.演化网络中的竞争 1.适应度模型 2.边的继承性 F.择优连接的更迭机理 1.拷贝机理 2.边的重新定向
复杂网状结构描述各种各样的有着高技术及高智能重要性的系统。例如,细胞就被完美 地描述为通过化学反应连接化学物的复杂网络;国际互联网就被描述为通过各种物理的或无 线的连接把路由器和计算机连接在一起的复杂网络;奇想和理念在社会网上传播,其节点就 是人类,边就表示各种社会关系;万维网是一个网页通过超链接来连接的巨大的虚拟网络。 这些系统仅代表近来引起科学界研究确定复杂网络拓扑结构机理的许多系统中的几个例子。 了解这类交叉系统的愿望也遇到很大的困难。还原论的主要受惠者物理学已经开发出了一系 列有效的工具,来预测由部件的特性产生的整体系统行为。我们认识了数百万个自旋的集体 行为导致磁力出现,或量子微粒如何产生了象 Bose-Einstein 凝聚或超流体这样的特殊现 象。建模工作的成功基于元素间相互作用的简化:什么与什么相互作用很明确,且相互作用 强度由物理距离唯一确定。但是,我们对于描述物理距离不相关的系统,即两部件之间的相 互作用不明确的系统感到无能为力,对于许多具有非平凡网络拓扑结构的复杂系统自然呈现 出这种不明确性。在过去几年中,我们渐渐认识到统计力学的工具也为描述这些交叉系统提 供了一个理想的结构方法。这些进展为统计物理引入了新的并具有挑战性的问题,还出乎预 料地与从逾渗到 Bose-Einstein 凝聚的凝聚态物理主体相联系。
I 引言
3.网络行走 4.连接到边 G.统计力学中的其他有关问题 1.Simon 模型 2.Bose-Einstein 凝聚 IX 故障与攻击的耐受性 A.数值结果 1.随机网络节点的随机移除 2.无标度网络节点的随机移除 3.选择性的节点移除 B.故障耐受性:解析结果 C.攻击耐受性:解析结果 D.现实网络的稳健性 1.通讯网 2.细胞网 3.生态网 X 展望 A.网络的动力学过程 B.有向网络 C.加权网络、优化、allometric scaling D.国际互联网和万维网 E.一般性问题 F.结论 致谢 参考文献
自从采用该模型以来,它指导我们思考复杂网络。对复杂系统越来越感兴趣,促使许多科学
去重新考虑这个模型范例并提出一个简单问题:隐含在不同复杂系统后的现实网络象细胞或
国际互联网基本上是随机的吗?直觉清楚地指出,复杂系统必须显示出一些组织原则,这些
原则应在其拓扑结构的某些层次中代码化。但如果这些网络的拓扑结构的确背离随机图,我
说明并进行讨论,讨论还将扩展到后续章节。
小世界:小世界的概念以简单的措辞描述了这样一个事实。在大多数网络中,尽管其规
模通常很大,但任意两个节点间有一条相当短的路径。两节点间的距离定义为连接它们的最
短路的边数。小世界最为通用的表现形式就是由社会心理学家 Stanley Milgram(1967)提出
的“六度分离”概念,他断定在美国大多数人之间相互认识的途径的典型长度为六
以*标注,这些值相同。 lreal , lrand 和 l pow 分别表示具有幂律度分布的实际网络的平均路径长度。随机图
理论(17)预测的平均路径长度及 Newman,Strogatz 和 Watts(2001)的平均路径长度[见公式(63)]在第 V 章节讨论。最后一栏的数字对应于图 8 和图 9 中的符号。
复杂网络研究传统上属图论范畴。图论研究最初集中在规则图上,自从 20 世纪 50 年代 起,无明确设计原理的大规模网络被描述为随机图,这是最简单也是被多数人认识的复杂网
4
络。随机图首先由匈牙利数学家 Paul Erdös 和 Alfréd Rényi 进行研究。按照 ER 模型,开
始于 N 个节点,以概率 P 连接每一对节点,建立一个大约有 PN (N − 1) 2 条随机分布的边。
目录
Ⅰ引言 Ⅱ 现实网络的拓扑结构:实证结果
A.万维网 B.国际互联网 C.电影演员协作网 D.科学家合作图 E.人类性接触网 F.细胞网络 G.生态网络 H.电话网 I.引文网络 J.语言学网 K.电力网和神经网络 L.蛋白质折叠 Ⅲ 随机图论 A. Erdös-Renyi 模型 B.子图 C.图的演化 D.度分布 E.连通性和直径 F.集群系数 G.图谱 Ⅳ 逾渗理论 A.逾渗理论中关注的物理量(quantities of interest) B.一般结果
中讨论(Barrat 和 Weight,2000;Newman,Strogatz,和 Watts,2000)。
在随机图中,由于边随机连接,群系数 c = p (见 Ш.F)。而且,在大多数情况下,要
不然则在所有情况下,实际网络的群系数典型地远大于可与之相比的随机网络(即与实际网
络有相同的节点数和边数的网络)。
A 万维网
万维网代表了目前可获得拓扑信息的规模最大的网络。网络的节点就是网页,边就是从
一个网页指向另一个网页的超链接(见图 1)。该网络的规模在 1999 年底接近 10 亿个节点
(Lawrence 及 Giles,1998,1999),当发现了万维网网页的度分布服从超过几个数量级的幂
6
表 I 一些实际网络的一般特性。 对每个网络,我们给出节点数,平均度<k>,平均路径长度 l ,及群系数 c 。为了比较,我们也列出了同等规模和平均度的随机图的平均路径长度 lrand 和集群系数 crand 。最后一
栏数字对应于图 8 和图 9 中的符号。
( ) 表 II 一些无标度网络表征度分布的规模指数。 其 p k 服从幂律分布公式(2)。我们给出网络规模、 ( ) ( ) 平均度 k ,符号 k 表示幂律标度。对有向网络我们分别列出入度 rin 和出度 rout 指数。而对无向网络
度 分 布 与 泊 松 分 布 大 不 相 同 。 特 别 地 , 大 多 数 网 络 包 括 万 维 网 ( Albert , Jeong 和
Barabási,1999),国际互联网(Faloutsos 等人,1999 ),和代谢网(Jeong 等人,2000)
度分布具有一条幂律尾部。
p(k )~ k −r
他们能够揭示复杂网络的一般特性。最后,需要超越还原主义者的研究方法,作为一个整体
去尝试了解系统行为的呼声越来越大。沿着这条途径,理解部件之间的相互作用的拓扑结构,
及网络的拓扑结构就不可避免。
在这些发展趋势和环境的推动下,过去几年中,提出了许多新概念和新方法,进行深层
次的研究。三种概念在当代对复杂网络的思索中占有重要地位。本文中我们对它们进行详细
复杂网络的统计力学
翻泽:张宁① 王恒山① 狄增如② ① 上海理工大学管理学院、系统工程研究所 上海 200093 ② 北京师范大学复杂性科学研究中心 北京 100875
复杂网络可描述自然界及社会中的许多系统,经常引用的例子包括细胞,一个通过化学 相互作用连接在一起的化学网络,及国际互联网,一个通过物理连接把路由器和计算机结合 在一起的网络。这些系统传统上用随机图构建模型。人们逐渐认识到实际网络的拓扑结构及 演化受控于稳健的组织原则。本文回顾近年来在复杂网络领域中的进展,重点在于网络拓扑 特性及动力学的统计力学研究取得的进展。在回顾了激发起作者对网络感兴趣的以实证为基 础的资料后,讨论了主要模型及分析工具,包括随机图、小世界网络及无标度网络、演化网 络的形成理论及拓扑结构与网络对故障和攻击的稳健性之间的相互关系。
5
度分布:在网络中不是所有节点都有相同的边数(同节点度Βιβλιοθήκη Baidu。节点度分布用分布函数
p(k )来表示。它给出了一个任意选择的节点正好有 k 条边的概率。因为在随机图中,边随
机连接,大多数节点的度大约相同,接近网络的平均度 k 。随机图的度分布是泊松分布,
( ) 峰值在 p k 。在我们认识复杂网络的过程中,最有趣的现象之一是发现许多大型网络的
节点的最近邻点是群的一部分,则在它们之间有 ki (ki − 1) 2 条边连接。 ki 个节点之间实际
有的边数 Ei 与总边数 ki (ki − 1) 2 之比就给出了节点 i 的群系数值。
Ci
=
2Ei ki (ki −1)
(1)
整个网络的群系数为所有节点 Ci 的平均值。在文献中常用的 C 的另一个定义在章节 V1.B.2
(Kochen,1989)。小世界特性看起来似乎表征了大多数复杂网络的特性:在好莱坞平均三个
演员彼此合演,或在一个细胞中,化合物独特地用三种反应来分离。小世界概念不是以作为
一种特殊的组织原则的象征来引起人们的兴趣的。的确,正如 Erdös 和 Rényi 已经证实的那
样,在随机图中任意两节点间的标准距离按节点数的对数换算。于是,随机图也有小世界特
1.亚临界状态( P < PC )
2.超临界状态( P > PC )
C.精确解:Cayley 树上的渗流 D.临界区域内的标度 E.群结构 F.无限维逾渗 G.随机图论与逾渗的对应关系 Ⅴ 广义随机图 A.无标度随机图的阈值 B.生成函数形式
1.组分规模和相变 2.平均路径长度 C.幂律度分布的随机图 D.对分图和集群系数 Ⅵ 小世界网络 A.Watts-Strogatz 模型 B.小世界网络特性 1.平均路径长度 2.集群系数 3.度分布 4.频谱特性 Ⅶ 无标度网络 A.Barabási-Albert 模型 B.理论方法 C. Barabási-Albert 模型的限制条件
们需要开发工具及测量方法以量化的方式去捕捉隐含的组织原则。
过去几年中,在这个方向上,我们已目睹了一些并行研究取得的显著进展。首先,在各
个领域中,计算机化的数据采集使各种现实网络拓扑结构的大型数据库得以产生。第二,逐
渐增长的计算能力使我们可以研究含有数百万个节点的网络,探索以前不可能阐明的问题。
第三,逐步地且值得注意地打破学科界限,为研究人员使用各种数据库提供了便利条件,使
本文的目的是对这些模型研究作一回顾,重点放在复杂网络的统计力学上。我们的主要 目标是展示与理论进展并行的初始实证数据、及各种支持模型和理论工具。为达到这一目的, 我们开始先对实际网络及作为目前大多数建模研究实证基础的数据库进行简要描述。
II 实际网络的拓扑结构:实证结果
大多数复杂网络研究始于人们想要了解从通信网到生态网的各种实际网络的愿望。因 此,研究采用的数据库跨越了若干个不同的领域。为了揭示复杂网络的一般特性,本章中我 们简要回顾研究人员已经开展的研究工作。除了数据库说明之外,我们集中在网络拓扑结构 的三个固定的度量标准上:平均路径长度,群系数和度分布。在后续章节中讨论的其它量, 也将用这些数据库来测试。所研究的数据库的特性及所得到的指数概述在表 I 及表 II 中。
性。
集群:社会网络的一个共同特征是小集团形态,表示朋友圈或熟人圈,其中的每个成员
认识其它每个成员。这种内在的群聚倾向用群系数来量化(Watts and Strogatz,1998),
一个源于社会学的概念,以“三倍数传递”的名字出现(Wassermann 和 Faust,1994)。我
们先把重点放在网络中选出的节点 i 上,有 ki 条边使它与其它 ki 各节点相连接。如果初始