复杂网络研究与应用述评
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
j
(2)
偏好性也称为优先连接,指的是新结点与已经存在的结点之间的选择连接策略.可以证明,BA网络 的度分布为 2 m ( m + 1) ∝ 2 m2 k 3 (3) k (k + 1)(k + 2 ) 即BA网络服从y=3的幂率分布.BA模型揭示了无标度网络的形成机理,它模拟了 “富者愈富” 这种效应. P (k ) = 适应度模型赋予每个结点一个不同的适应度值,更能模拟无标度网络中存在的 “新星效应” ,克服 了BA模型中只能模拟 “越老越吃香” 现象的不足. 2.3 层出不穷的复杂网络模型 两篇开创性的文献[7]和[8]可以看作是复杂网络研究新纪元开始的标志,具有里程碑式的作用.此 后,出现了一系列关于具有多种性质的新的小世界网络模型、 无标度网络模型的构造方法,对于人们深
博士生导师主要从事高性能计算复杂系统建模及计算机模拟研究万方数据苏州市职业大学学报第20卷20世纪60年代由两位匈牙利数学家erd6s和r6nyi建立的随机图理论randomgraphtheory121被公认为在数学上开创了复杂网络理论的系统性研究该理论一直是研究复杂网络的基本理论
第20卷 第2期 2009年6月
2
复杂网络的形成机理
用图的顶点(或称为结点)代表所研究的事物,用图的边(无向或有向或带权重的边)表达事物之间的
联系,能较好地刻画所研究的系统.结点数N大、 边稀疏(即总边数约为O(N))是复杂网络的基本特征.在 大规模网络(N充分大)中,人们最先考虑的是其统计特征:平均路径长、 聚类系数 [6]和度分布律.具有较短 的平均路径长度、 较高的聚类系数是小世界网络的典型特征.网络的度分布服从幂率分布者被称为无标 度网络. 1998年,美国康奈尔大学Watts和Strogatz在Nature杂志上发表的论文 [7]揭示了小世界网络的形成机 理;1999年,美国圣母大学Barabási和Albert在Science杂志上发表的论文[8]揭示了无标度网络的生成机理. 2.1 WS小世界网络模型 既然大部分实际网络既不是完全规则的、 也不是完全随机的,文献[7]提出了在规则网络上进行随 机化重新连接的改造手续,引入了一个小世界网络模型,找到了小世界网络的形成机理.该模型被称为 WS小世界模型.其构造算法如下所述(参见图2) [7]: (1) 构造一个规则图.考虑含有N个结点的k-近邻网络(k为偶数),它们围成一个环,其中每个结点都 与其左右相邻的各k/2个结点相连; (2) 随机化重新连接.以概率p随机重新连接网络中的每条边,并规定任意两个结点之间最多只能有
人们曾基于某些规则网络(如:网格、 超立方体等)开展了大量的应用研究.甚至将一些不具有欧 树、
氏空间距离的问题,强行映射到欧氏空间中进行研究(如最初的互联网络模型、 流行病传播模型、 股票价 格波动的元胞自动机模型等). 显然,基于适当复杂网络的动力学应用研究将会给相应的研究工作带来新的思路、 新的成果.已经 有相当多的研究工作及成果涉及到复杂网络及其应用.下面仅简要叙述复杂网络上的传播临界值理论 和相继故障理论两个方面的基本结论,以说明将一些研究工作转移到复杂网络空间中来的必要性. 以 “易染-感染-易染” (SIS)模型为例,讨论某种流行病在某个种群中的传播行为.在这种典型的 传播动力学模型中,该种群内的个体处于易染状态(Susceptible)或感染状态(Infected).定义时刻t被感染 结点密度函数为p(t),考察被感染结点密度的极限情况 lim p(t)=p ,以分辨此种流行病将会大爆发、 或者被 t→ ∞ 彻底消灭还是被控制在某一低水平之内. 记从易染状态到感染状态的概率为v,从感染状态恢复到易染状态的概率为δ,定义有效传播率为 λ=ν/δ. 从经典的传播动力学理论可知,对于规则网络,存在一个正临界值λ c ,当有效感染率大于临界值λ c 时,这种流行病的发病率可能在某一程度附近波动,或可能造成大范围的传播;当有效感染率小于或等 于临界值λ c时,这种流行病将会被消灭. 对于BA无标度网络,经动力学分析,有感染结点的密度为: lim p(t)∝p ,即BA无标度网络上临界值 t→ ∞ λ c =0.这表明在BA无标度网络中,只要有效传播率大于0,这种传染病都能传播并最终维持在一个平衡
苏州市职业大学学报 Journal of Suzhou Vocational University
Vol.20,No.2 Jun. , 2009
复杂网络研究与应用述评
李 青,周美莲2
200072)
(.上海大学 计算机工程与科学学院,上海 200072;2.上海大学 机电工程与自动化学院,上海
BA无标度网络模型为线索,概述了复杂网络的概念、 相关发展历史及 摘 要:以WS小世界网络模型、 若干应用.阐述了复杂网络对复杂科学研究的重要作用.说明了将一些研究工作转移到复杂网络 上进行的必要性.
1
1.1
复杂网络的典型特征
网络研究经典理论 刻画网络拓扑结构常用图(Graph)这种数学工具.实际网络的图表示方法可以追溯到18世纪伟大的
数学家欧拉(Eüler)对 “哥尼斯堡七桥问题” 的研究.然而,在相当长的一段时间里,图论并未得到足够的 发展.对图论的研究较多地体现在对确定性的、 甚至是若干种规则图的研究.目前,图论的理论已经得到 很好的发展,其应用亦十分广泛.关于图论中的基本概念不在此赘述.
- 3 -
苏州市职业大学学报
第20卷
刻认识实际网络的形成机理,以及应用到实际问题中起到了很好的推动作用. 不仅如此,探讨复杂网络中的局部结构,如各种适应度模型、 等级结构网络、 局域世界网络、 复杂网 络中的模块(Module)及模体(Motif)、 自相似性等,被进一步深入研究 [6].
3
复杂网络的应用
(. School of Computer Engineering and Science, Shanghai University, Shanghai 200072, China; 2. College of Mechatronics Engineering and Automation, Shanghai University, Shanghai 200072, China)
Abstract: With the WS small-world network and BA scale-free network as examples, a survey of the
conception, the related history, and some typical applications of complex network was presented. It also illustrated the importance of complex networks to the complex science. It explains the necessity for some traditional researches to be redone in the context of certain complex networks.
- 2 -
2009年第2期
李
青等:复杂网络研究与应用述评
一条边、 每个结点不能有边与自身相连.
k-
p =0
p =1
迄今为止,虽然尚未得到WS小世界网络模型的平均路径长的精确解析表达式,但其平均路径长度 随p的增加而下降得很快.而网络的聚类系数 3(k−2) 3(1−p)3 (1) 4(k−1) 却显著地大于完全随机图的聚类系数.即这种网络具有较短的平均路径长,同时具有较高的聚类系 C(p)= 数.规则网络上的随机化重新连接手续模拟了人际关系网络中存在近邻朋友(短程连接),同时也存在远 方朋友(长程连接)的事实. WS模型可能导致网络中的某些结点成为孤立点.不去掉规则网络上原有的边,而直接进行随机化 添加边的改进模型,可克服WS模型的上述不足,同时网络的总边数仍然为O(N). 2.2 BA无标度网络模型 关注网络中具有不同度数的结点所出现的频数或频率,是研究网络结构及功能的基本出发点.网络 中,连接到某结点的边的数目称为该结点的度.结点的度直接反映该结点在网络中与其他结点相联系的 广度:结点的度越大常反映该结点的重要性越强.实际网络中常常存在为数不多的重要 “集散” 结点具有 较大的度数,而大量的结点的度数均较小.典型的度分布是幂率分布(Power-law).在一定意义下,服从 幂率分布的函数f(x)=cx-y与无标度条件( 对任意给定的常数a,存在常数b,使得f(a x)=b f(x))是等价的.因 此,度分布服从幂率分布的网络也被称为无标度网络. 文献[8]提出了用增长加偏好的手续来构造复杂网络.所构造的网络的度分布服从幂率分布.该模 型被称为BA无标度网络模型,其构造算法如下: 1) 增长性.从一个具有m 0 个结点的网络开始,每次引入一个新结点,并且与网络中已经存在的m个 结点相连( m≤m 0,且均为常量); 2) 偏好性.规定一个新结点与一个已经存在的结点i相连的概率与结点i的度成正比,即 ki pi= ∑ kj
Key words: complex network; small-world network; scale-free network; degree distribution; power-law 20世纪的科技突飞猛进,无论认为是 “科学的终结” “科学的转折” 还是 都蕴含着这样的观点:当今 科学正逐渐走出由易解问题构成的领地,开始接触真正难解的问题.从20世纪80年代中期起,一些有远 见的科学家就已经开始探索科学新领地——复杂科学.复杂科学主要研究复杂系统及其复杂性,它被有 些科学家誉为 “21世纪的科学” .成思危指出系统的复杂性主要表现在 [1]:①系统各组分的联系广泛而紧 密,构成一个网络;②系统的组分具有某种程度的智能;③系统具有多层次、 多功能的结构;④系统是动 态的;⑤系统是开放的.
收稿日期:2008--26;修回日期:2009-02-04简介:李 青(962-),男,湖北嘉鱼人,教授,博士,博士生导师,主要从事高性能计算、 复杂系统建模及计算机模拟研究.
- -
苏州市职业大学学报
第20卷
20世纪60年代,由两位匈牙利数学家Erdös和Rényi建立的随机图理论(Random graph theory) [2]被公 认为在数学上开创了复杂网络理论的系统性研究,该理论一直是研究复杂网络的基本理论. 1.2 网络研究巧妙实证 复杂系统(如社会系统、 生物系统、 Internet等)中的真实网络既不是规则的、 也不是完全随机的.大量 的实证研究揭示了真实网络中的 “小世界(Small-world)” 效应、 “无标度(Scale-free)” 特征,以及复杂网络 的各种层级、 社区关系等. 为了研究人际关系网络中人与人之间的平均距离,20世纪60年代美国哈佛大学社会心理学家 Stanley Milgram做了一个著名的小世界实验.在他的实验中,首先确定了两个极其普通的目标对象,然 后在较远的地区招募若干志愿者,命志愿者通过自己所认识的人,用自己认为尽可能少的转递次数,设 法将一封信转交到一个指定的目标对象手中.Stanley Milgram通过这个社会学实验得到:地球上任意两 个人之间的平均距离为6—这就是著名的六度分离(Six degrees of separation)推断 [3].换言之,地球上 任意两个人之间,平均需要朋友及朋友的朋友约5人便能建立起联系. 之后,电影演员的 “Bacon数” (Bacon Number)游戏(参见网站/cgi-bin/centercgi?who=Kevin+ Bacon)、 数学家的 “Erdös数” (Erdös Number)项目(参见网站/ enp/)、 以及美国哥伦比亚大学通过电子邮件验证六度分离的 “小世界项目” 都进一步证实了一些真实网 络具有小世界效应. 更有意思的是,有的人既有很小的Bacon数,同时又有很小的Erdös数.这说明在电影演员圈和数学 家圈中存在若干桥接,以使整个人际网络中的不同群体得以相互关联. 20世纪60年代末,哈佛大学研究生Mark Granovetter发现,网络的不 同群体之间的连接具有很高的强度 [4].弱连接的强度描绘了信息通过弱连 接传递的重要性、 有效性,如图1所示 [5]. 人们对真实世界客观事物间的相关关系进行了大量的实证分析,多 角度地证实了这些实际网络既不是所谓的规则网络、 也不是完全的随机 网络,而是具有某些典型特征的复杂网络.例如:社会领域中的电影演员 网、 科学家合作网、 电话呼叫图、 电子邮件交流网、 本体网等;生物领域中 的代谢网、 蛋白质相互作用网、 神经网络等;技术领域中的铁路网、 航空 网、 电力网、 Internet、 大型软件系统、 大规模电子电路等.
关键词: 复杂网络;小世界网络;无标度网络;度分布;幂率 中图分类号: O23.5 文献标志码: A 文章编号: 008-5475(2009)02-000-05
Review of Researches and Applications in Complex Networks
LI Qing1, ZHOU Mei-lian2
(2)
偏好性也称为优先连接,指的是新结点与已经存在的结点之间的选择连接策略.可以证明,BA网络 的度分布为 2 m ( m + 1) ∝ 2 m2 k 3 (3) k (k + 1)(k + 2 ) 即BA网络服从y=3的幂率分布.BA模型揭示了无标度网络的形成机理,它模拟了 “富者愈富” 这种效应. P (k ) = 适应度模型赋予每个结点一个不同的适应度值,更能模拟无标度网络中存在的 “新星效应” ,克服 了BA模型中只能模拟 “越老越吃香” 现象的不足. 2.3 层出不穷的复杂网络模型 两篇开创性的文献[7]和[8]可以看作是复杂网络研究新纪元开始的标志,具有里程碑式的作用.此 后,出现了一系列关于具有多种性质的新的小世界网络模型、 无标度网络模型的构造方法,对于人们深
博士生导师主要从事高性能计算复杂系统建模及计算机模拟研究万方数据苏州市职业大学学报第20卷20世纪60年代由两位匈牙利数学家erd6s和r6nyi建立的随机图理论randomgraphtheory121被公认为在数学上开创了复杂网络理论的系统性研究该理论一直是研究复杂网络的基本理论
第20卷 第2期 2009年6月
2
复杂网络的形成机理
用图的顶点(或称为结点)代表所研究的事物,用图的边(无向或有向或带权重的边)表达事物之间的
联系,能较好地刻画所研究的系统.结点数N大、 边稀疏(即总边数约为O(N))是复杂网络的基本特征.在 大规模网络(N充分大)中,人们最先考虑的是其统计特征:平均路径长、 聚类系数 [6]和度分布律.具有较短 的平均路径长度、 较高的聚类系数是小世界网络的典型特征.网络的度分布服从幂率分布者被称为无标 度网络. 1998年,美国康奈尔大学Watts和Strogatz在Nature杂志上发表的论文 [7]揭示了小世界网络的形成机 理;1999年,美国圣母大学Barabási和Albert在Science杂志上发表的论文[8]揭示了无标度网络的生成机理. 2.1 WS小世界网络模型 既然大部分实际网络既不是完全规则的、 也不是完全随机的,文献[7]提出了在规则网络上进行随 机化重新连接的改造手续,引入了一个小世界网络模型,找到了小世界网络的形成机理.该模型被称为 WS小世界模型.其构造算法如下所述(参见图2) [7]: (1) 构造一个规则图.考虑含有N个结点的k-近邻网络(k为偶数),它们围成一个环,其中每个结点都 与其左右相邻的各k/2个结点相连; (2) 随机化重新连接.以概率p随机重新连接网络中的每条边,并规定任意两个结点之间最多只能有
人们曾基于某些规则网络(如:网格、 超立方体等)开展了大量的应用研究.甚至将一些不具有欧 树、
氏空间距离的问题,强行映射到欧氏空间中进行研究(如最初的互联网络模型、 流行病传播模型、 股票价 格波动的元胞自动机模型等). 显然,基于适当复杂网络的动力学应用研究将会给相应的研究工作带来新的思路、 新的成果.已经 有相当多的研究工作及成果涉及到复杂网络及其应用.下面仅简要叙述复杂网络上的传播临界值理论 和相继故障理论两个方面的基本结论,以说明将一些研究工作转移到复杂网络空间中来的必要性. 以 “易染-感染-易染” (SIS)模型为例,讨论某种流行病在某个种群中的传播行为.在这种典型的 传播动力学模型中,该种群内的个体处于易染状态(Susceptible)或感染状态(Infected).定义时刻t被感染 结点密度函数为p(t),考察被感染结点密度的极限情况 lim p(t)=p ,以分辨此种流行病将会大爆发、 或者被 t→ ∞ 彻底消灭还是被控制在某一低水平之内. 记从易染状态到感染状态的概率为v,从感染状态恢复到易染状态的概率为δ,定义有效传播率为 λ=ν/δ. 从经典的传播动力学理论可知,对于规则网络,存在一个正临界值λ c ,当有效感染率大于临界值λ c 时,这种流行病的发病率可能在某一程度附近波动,或可能造成大范围的传播;当有效感染率小于或等 于临界值λ c时,这种流行病将会被消灭. 对于BA无标度网络,经动力学分析,有感染结点的密度为: lim p(t)∝p ,即BA无标度网络上临界值 t→ ∞ λ c =0.这表明在BA无标度网络中,只要有效传播率大于0,这种传染病都能传播并最终维持在一个平衡
苏州市职业大学学报 Journal of Suzhou Vocational University
Vol.20,No.2 Jun. , 2009
复杂网络研究与应用述评
李 青,周美莲2
200072)
(.上海大学 计算机工程与科学学院,上海 200072;2.上海大学 机电工程与自动化学院,上海
BA无标度网络模型为线索,概述了复杂网络的概念、 相关发展历史及 摘 要:以WS小世界网络模型、 若干应用.阐述了复杂网络对复杂科学研究的重要作用.说明了将一些研究工作转移到复杂网络 上进行的必要性.
1
1.1
复杂网络的典型特征
网络研究经典理论 刻画网络拓扑结构常用图(Graph)这种数学工具.实际网络的图表示方法可以追溯到18世纪伟大的
数学家欧拉(Eüler)对 “哥尼斯堡七桥问题” 的研究.然而,在相当长的一段时间里,图论并未得到足够的 发展.对图论的研究较多地体现在对确定性的、 甚至是若干种规则图的研究.目前,图论的理论已经得到 很好的发展,其应用亦十分广泛.关于图论中的基本概念不在此赘述.
- 3 -
苏州市职业大学学报
第20卷
刻认识实际网络的形成机理,以及应用到实际问题中起到了很好的推动作用. 不仅如此,探讨复杂网络中的局部结构,如各种适应度模型、 等级结构网络、 局域世界网络、 复杂网 络中的模块(Module)及模体(Motif)、 自相似性等,被进一步深入研究 [6].
3
复杂网络的应用
(. School of Computer Engineering and Science, Shanghai University, Shanghai 200072, China; 2. College of Mechatronics Engineering and Automation, Shanghai University, Shanghai 200072, China)
Abstract: With the WS small-world network and BA scale-free network as examples, a survey of the
conception, the related history, and some typical applications of complex network was presented. It also illustrated the importance of complex networks to the complex science. It explains the necessity for some traditional researches to be redone in the context of certain complex networks.
- 2 -
2009年第2期
李
青等:复杂网络研究与应用述评
一条边、 每个结点不能有边与自身相连.
k-
p =0
p =1
迄今为止,虽然尚未得到WS小世界网络模型的平均路径长的精确解析表达式,但其平均路径长度 随p的增加而下降得很快.而网络的聚类系数 3(k−2) 3(1−p)3 (1) 4(k−1) 却显著地大于完全随机图的聚类系数.即这种网络具有较短的平均路径长,同时具有较高的聚类系 C(p)= 数.规则网络上的随机化重新连接手续模拟了人际关系网络中存在近邻朋友(短程连接),同时也存在远 方朋友(长程连接)的事实. WS模型可能导致网络中的某些结点成为孤立点.不去掉规则网络上原有的边,而直接进行随机化 添加边的改进模型,可克服WS模型的上述不足,同时网络的总边数仍然为O(N). 2.2 BA无标度网络模型 关注网络中具有不同度数的结点所出现的频数或频率,是研究网络结构及功能的基本出发点.网络 中,连接到某结点的边的数目称为该结点的度.结点的度直接反映该结点在网络中与其他结点相联系的 广度:结点的度越大常反映该结点的重要性越强.实际网络中常常存在为数不多的重要 “集散” 结点具有 较大的度数,而大量的结点的度数均较小.典型的度分布是幂率分布(Power-law).在一定意义下,服从 幂率分布的函数f(x)=cx-y与无标度条件( 对任意给定的常数a,存在常数b,使得f(a x)=b f(x))是等价的.因 此,度分布服从幂率分布的网络也被称为无标度网络. 文献[8]提出了用增长加偏好的手续来构造复杂网络.所构造的网络的度分布服从幂率分布.该模 型被称为BA无标度网络模型,其构造算法如下: 1) 增长性.从一个具有m 0 个结点的网络开始,每次引入一个新结点,并且与网络中已经存在的m个 结点相连( m≤m 0,且均为常量); 2) 偏好性.规定一个新结点与一个已经存在的结点i相连的概率与结点i的度成正比,即 ki pi= ∑ kj
Key words: complex network; small-world network; scale-free network; degree distribution; power-law 20世纪的科技突飞猛进,无论认为是 “科学的终结” “科学的转折” 还是 都蕴含着这样的观点:当今 科学正逐渐走出由易解问题构成的领地,开始接触真正难解的问题.从20世纪80年代中期起,一些有远 见的科学家就已经开始探索科学新领地——复杂科学.复杂科学主要研究复杂系统及其复杂性,它被有 些科学家誉为 “21世纪的科学” .成思危指出系统的复杂性主要表现在 [1]:①系统各组分的联系广泛而紧 密,构成一个网络;②系统的组分具有某种程度的智能;③系统具有多层次、 多功能的结构;④系统是动 态的;⑤系统是开放的.
收稿日期:2008--26;修回日期:2009-02-04简介:李 青(962-),男,湖北嘉鱼人,教授,博士,博士生导师,主要从事高性能计算、 复杂系统建模及计算机模拟研究.
- -
苏州市职业大学学报
第20卷
20世纪60年代,由两位匈牙利数学家Erdös和Rényi建立的随机图理论(Random graph theory) [2]被公 认为在数学上开创了复杂网络理论的系统性研究,该理论一直是研究复杂网络的基本理论. 1.2 网络研究巧妙实证 复杂系统(如社会系统、 生物系统、 Internet等)中的真实网络既不是规则的、 也不是完全随机的.大量 的实证研究揭示了真实网络中的 “小世界(Small-world)” 效应、 “无标度(Scale-free)” 特征,以及复杂网络 的各种层级、 社区关系等. 为了研究人际关系网络中人与人之间的平均距离,20世纪60年代美国哈佛大学社会心理学家 Stanley Milgram做了一个著名的小世界实验.在他的实验中,首先确定了两个极其普通的目标对象,然 后在较远的地区招募若干志愿者,命志愿者通过自己所认识的人,用自己认为尽可能少的转递次数,设 法将一封信转交到一个指定的目标对象手中.Stanley Milgram通过这个社会学实验得到:地球上任意两 个人之间的平均距离为6—这就是著名的六度分离(Six degrees of separation)推断 [3].换言之,地球上 任意两个人之间,平均需要朋友及朋友的朋友约5人便能建立起联系. 之后,电影演员的 “Bacon数” (Bacon Number)游戏(参见网站/cgi-bin/centercgi?who=Kevin+ Bacon)、 数学家的 “Erdös数” (Erdös Number)项目(参见网站/ enp/)、 以及美国哥伦比亚大学通过电子邮件验证六度分离的 “小世界项目” 都进一步证实了一些真实网 络具有小世界效应. 更有意思的是,有的人既有很小的Bacon数,同时又有很小的Erdös数.这说明在电影演员圈和数学 家圈中存在若干桥接,以使整个人际网络中的不同群体得以相互关联. 20世纪60年代末,哈佛大学研究生Mark Granovetter发现,网络的不 同群体之间的连接具有很高的强度 [4].弱连接的强度描绘了信息通过弱连 接传递的重要性、 有效性,如图1所示 [5]. 人们对真实世界客观事物间的相关关系进行了大量的实证分析,多 角度地证实了这些实际网络既不是所谓的规则网络、 也不是完全的随机 网络,而是具有某些典型特征的复杂网络.例如:社会领域中的电影演员 网、 科学家合作网、 电话呼叫图、 电子邮件交流网、 本体网等;生物领域中 的代谢网、 蛋白质相互作用网、 神经网络等;技术领域中的铁路网、 航空 网、 电力网、 Internet、 大型软件系统、 大规模电子电路等.
关键词: 复杂网络;小世界网络;无标度网络;度分布;幂率 中图分类号: O23.5 文献标志码: A 文章编号: 008-5475(2009)02-000-05
Review of Researches and Applications in Complex Networks
LI Qing1, ZHOU Mei-lian2