复杂网络的基础知识

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章复杂网络的基础知识
2.1 网络的概念
所谓“网络”(networks),实际上就是节点(node)和连边(edge)的集合。

如果节点对(i,j)与(j,i)对应为同一条边,那么该网络为无向网络(undirected networks),否则为有向网络(directed networks)。

如果给每条边都赋予相应的权值,那么该网络就为加权网络(weighted networks),否则为无权网络(unweighted networks),如图2-1所示。

图2-1 网络类型示例
(a) 无权无向网络(b) 加权网络(c) 无权有向网络
如果节点按照确定的规则连边,所得到的网络就称为“规则网络”(regular networks),如图2-2所示。

如果节点按照完全随机的方式连边,所得到的网络就称为“随机网络”(random networks)。

如果节点按照某种(自)组织原则的方式连边,将演化成各种不同的网络,称为“复杂网络”(complex networks)。

图2-2 规则网络示例
(a) 一维有限规则网络(b) 二维无限规则网络
2.2 复杂网络的基本特征量
描述复杂网络的基本特征量主要有:平均路径长度(average path length )、簇系数(clustering efficient )、度分布(degree distribution )、介数(betweenness )等,下面介绍它们的定义。

2.2.1 平均路径长度(average path length )
定义网络中任何两个节点i 和j 之间的距离l ij 为从其中一个节点出发到达另一个节点所要经过的连边的最少数目。

定义网络的直径(diameter )为网络中任意两个节点之间距离的最大值。


}{max ,ij j
i l D = (2-1) 定义网络的平均路径长度L 为网络中所有节点对之间距离的平均值。


∑∑-=+=-=111)1(2N i N i j ij l
N N L (2-2)
其中N 为网络节点数,不考虑节点自身的距离。

网络的平均路径长度L 又称为特征路径长度(characteristic path length )。

网络的平均路径长度L 和直径D 主要用来衡量网络的传输效率。

2.2.2 簇系数(clustering efficient )
假设网络中的一个节点i 有k i 条边将它与其它节点相连,这k i 个节点称为节点i 的邻居节点,在这k i 个邻居节点之间最多可能有k i (k i -1)/2条边。

节点i 的k i 个邻居节点之间实际存在的边数N i 和最多可能有的边数k i (k i -1)/2之比就定义为节点i 的簇系数,记为C i 。


)
1(2-=i i i i k k N C (2-3) 整个网络的聚类系数定义为网络中所有节点i 的聚类系数C i 的平均值,记
为C 。


∑==N
i i
C N C 11 (2-4) 显然,0 ≤ C ≤ 1之间。

当C =0时,说明网络中所有节点均为孤立节点,即没有任何连边。

当C =1时,说明网络中任意两个节点都直接相连,即网络是全局耦合网络。

2.2.3 度分布(degree distribution )
网络中某个节点i 的度k i 定义为与该节点相连接的其它节点的数目,也就是该节点的邻居数。

通常情况下,网络中不同节点的度并不相同,所有节点i 的度k i 的的平均值称为网络的(节点)平均度,记为<k >。


∑==〉〈N i i k
N k 11 (2-5)
网络中节点的分布情况一般用度分布函数P (k )来描述。

度分布函数P (k )表示在网络中任意选取一节点,该节点的度恰好为k 的概率。


∑=-=N
i i
k k N k P 1)(1)(δ (2-6) 通常,一个节点的度越大,意味着这个节点属于网络中的关键节点,在某种意义上也越“重要”。

2.2.4 介数(betweenness )
节点i 的介数定义为网络中所有的最短路径中,经过节点i 的数量。

用B i 表示。


n m i n m,g g B n m n m n i m i ≠≠=∑ ,, (2-7)
式中g mn 为节点m 与节点n 之间的最短路径数,g min 为节点m 与节点n 之
间经过节点i的最短路径数。

节点的介数反映了该节点在网络中的影响力。

描述网络结构的特征量还有很多,这里就不一一介绍,在使用到它们的地方再给出详细的说明。

2.3 复杂网络的基本模型
人们在对不同领域内的大量实际网络进行广泛的实证研究后发现:真实网络系统往往表现出小世界特性、无标度特性和高聚集特性。

为了解释这些现象,人们构造了各种各样的网络模型,以便从理论上揭示网络行为与网络结构之间的关系,进而考虑改善网络的行为。

下面介绍几类基本的网络模型。

2.3.1 规则网络(regular network)
常见的规则网络有三种:全局耦合网络(globally coupled network)、最近邻耦合网络(nearest-neighbor coupled network)和星型网络模型(star coupled network),如图2-3所示。

图2-3 三种典型的规则网络
(a) 全局耦合网络(b) 最近邻耦合网络(c) 星型网络
图2-3(a)所示为一个含有N个节点的全局耦合网络。

网络中共有N(N-1)/2条边,其平均路径长度L=1(最小),簇系数C=1(最大)。

度分布P(k)为以N-1为中心的δ函数。

模型的优点:能反映实际网络的小世界特性和大聚类特性。

模型的缺点:不能反映实际网络的稀疏特性。

因为一个具有N个节点的全
局耦合网络的边的数目为O (N 2),而实际网络的边的数目一般是O (N )。

图2-3(b )所示为一个含有N 个节点的最近邻耦合网络。

网络中的每个节点只和它周围的邻居节点相连,其中每个节点都与它左右各K /2个邻居节点相连(K 为偶数)。

对于固定的K 值,网络的平均路径长度为:
)(2∞→∞→≈
N K N L (2-8) 对于较大的K 值,最近邻耦合网络的簇系数为:
4
3)1(4)2(3≈--=K K C (2-9) 度分布P (k )为以K 为中心的δ函数。

模型的优点:能反映实际网络的大聚类特性和稀疏特性。

模型的缺点:不能反映实际网络的小世界特性。

图2-3(c )所示为一个具有N 个节点的星型网络。

网络有一个中心节点,其余N -1个节点都只与这个中心节点相连,且它们彼此之间不连接。

网络的平均路径长度:
)(2)
1()1(22∞→→---=N N N N L (2-10) 网络的簇系数为:
)(11∞→→-=
N N
N C (2-11) 网络的度分布为:
⎪⎪⎩
⎪⎪⎨⎧-==-=其它 0)1()1(1)(11N K K K P N N (2-12) 规定:如果一个节点只有一个邻居,那么该节点的簇系数为1。

也有些文献规定只有一个邻居的节点的簇系数为0,若依此定义,则星型网络的簇系数为0。

模型的优点:能反映实际网络的小世界特性和稀疏特性。

模型的缺点:不能反映实际网络的大聚类特性。

2.3.2 ER 随机网络(random network )
该模型由匈牙利数学家Ed ös 和Rényi 在上世纪50年代最先提出,所以被人们称为ER 随机网络模型。

ER 随机网络的构造有两种方法。

第一种方法:定义有标记的N 个节(网络中的节点总数),并且给出整个网络的边数n ,这些边的选取采用从所有可能的N (N -1)/2种情况中随机选取。

第二种方法:给定有标记的N 个节点,以一定的随机概率p 连接所有可能出现的N (N -1)/2种连接,假设最初有N 个孤立的节点,每对节点以随机概率p 进行连接。

如图2-4所示。

图2-4 ER 随机网络的演化示意图
(a )p =0时,给定10个孤立节点;(b )~(c )p =0.1,0.15时,生成的随机图 ER 随机网络模型具有如下基本特性:
(1)涌现或相变
如果当N →∞时产生一个具有性质Q 的ER 随机图的概率为1,那么几乎每一个ER 随机图都具有性质Q 。

以连通性为例,若当连接概率p 达到某个临界值p c ∝(ln N )/N 时,整个网络连通起来,那么以概率p 生成的每一个网络几乎都是连通的,否则,当p 小于该临界值时,几乎每一个网络都是非连通的。

(2)度分布
对于一个给定连接概率为p 的随机网络,若网络的节点数N 充分大,则网络的度分布接近泊松(Poission )分布,如图2-5所示。

〉〈----〉〈≈-=k k k N k k N e k k p p C k P !
)1()(11 (2-13) 式中<k >=p (N -1)≈PN 表示ER 随机网络的平均度。

图2-5 ER 随机网络的度分布(取自文献[ ])
(3)平均路径长度
假定网络的平均路径长度为L ,从网络的一端走到网络的另一端,总步数大概为L 。

由于ER 随机网络的平均度为﹤k ﹥,对于任意一个节点,其一阶邻居的数目为﹤k ﹥,二阶邻居的数目为﹤k ﹥2,以此类推,当经过L 步后遍历了网络的所有节点,因此对于规模为N 的随机网络,有﹤k ﹥L =N 。

由此可以得到网络的平均路径长度为:
〉〈==k N pN N L ln ln )ln(ln (2-14)
由于ln N 的值随N 增长较慢,所以规模很大的ER 随机网络具有很小的平均路径长度,如图2-6所示。

图2-6 ER 随机网络的平均路径长度与网络规模的关系(取自文献[ ])
(4)簇系数
在ER 随机网络中,由于任何两个节点之间的连接概率p 都相等,所以ER 随机网络的聚类系数为:
N
k p C 〉〈== (2-15) 可见,当网络规模N 固定时,簇系数随着网络节点平均度<k >的增加而增加,如图2-7所示。

当网络节点平均度<k >固定时,簇系数随着网络规模N 的增加而下降,如图2-8和所示。

显然,当N 较大时,ER 随机网络的簇系数很小。

图2-7 (N=104)ER随机网络的簇系数与连接概率的关系(取自文献[ ])
图2-8 (p=0.0015)ER随机网络的簇系数与网络规模的关系(取自文献[ ])
模型的优点:能反映实际网络的小世界特性。

模型的缺点:不能反映实际网络的大聚类特性。

2.3.3 小世界网络(small-world network)
作为从完全规则网络向完全随机网络的过渡,美国学者Watts和Strogatz
于1998年设计了一个具有小的平均路径长度和大的聚类系数的小世界网络模型(small-world network),简称WS小世界网络模型。

WS小世界网络模型的构造算法:
(1)从规则网络开始:考虑一个含有N个节点的最近邻耦合网络,它们围成一个环,其中每一个节点都与它左右相邻的各K/2个节点相连,K是偶数。

(2)随机化重连:以概率p随机地重新连接网络中的每一条边,即将连边的一个端点保持不变,而另一个端点取为网络中随机选择的一个节点。

其中规定,任意两个不同的节点之间至多只能有一条边,并且每个节点不能有边与自身相连。

为了保证网络具有稀疏性,要求N>>K,这样构造出来的网络模型具有较高聚类系数。

而随机化重连过程大大减小了网络的平均路径长度,使网络模型具有小世界特性。

当p取值较小时,重连过程对网络的聚类系数影响不大。

当p=0时,模型退化为规则网络,当p=1时,模型退化为随机网络。

通过调节p 的值就可以控制模型从完全规则网络到完全随机网络的过渡,如图2-9所示.
图2-9 WS小世界网络模型(取自文献[ ])
WS小世界网络模型的其聚类系数和平均路径长度可以看作是重连概率p 的函数,分别记为C(p)和L(p),它们的变化规律如图2-10所示。

在某个p值范围内,WS网络模型可以得到既有较短的平均路径长度(小世界特性),又有较高聚类系数(高聚集特性)。

图2-10中p值在0.0l附近的网络即兼具这两方一面的特征。

图2-10 WS小世界网络模型的簇系数和平均路径长度随p的变化关系(取自文献[ ])由于在WS小世界网络模型的随机化重连过程中有可能破坏网络的连通性。

为了避免出现因重连而造成的孤立子网,美国学者Newman与Watts合作于1999年提出了用“随机化加边”取代“随机化重连”的小世界网络模型,称“NW小世界模型”。

NW小世界网络模型的构造算法:
(1)从规则网络开始:考虑一个含有N个节点的最近邻耦合网络,它们围成一个环,其中每一个节点都与它左右相邻的各K/2个节点相连,K是偶数。

(2)随机化加边:以概率p在随机选取的一对节点之间加上一条边。

其中规定,任意两个不同的节点之间至多只能加一条边,并且每个节点不能有边与自身相连。

当p=0时,模型退化为规则网络,当p=1时,模型退化为随机网络。

通过调节p的值就可以控制模型从完全规则网络到完全随机网络的过渡,如图2-11所示。

在p较小时,NW模型具有与WS模型类似的特性。

图2-11 NW 小世界网络模型(取自文献[ ])
小世界网络模型具有如下基本特性:
(1)簇系数
WS 小世界网络的聚类系数为:
3)1()
1(4)2(3)(p K K p C ---= (2-16) NW 小世界网络的聚类系数为:
)
2(4)1(4)2(3)(++--=
p Kp K K p C (2-17) (2)平均路径长度 至今为止,还没有人得到关于WS 小世界网络模型的平均路径长度的精确解析表达式,Newman ,Moore 和Watts 分别用重整化群和序列展开方法得到如下近似公式:
)2/(2)(NKp f K
N p L = (2-18) 式中f (u )为一普适标度函数,且满足:
⎩⎨⎧>><<=1/)(ln 1)(u u u u const u f (2-19)
目前为止,还没有f (u )的精确表达式,Newman 等人基于平均场方法给出了如下的近似表达式:
2
221
)(2++≈x x arctanh x x x f (2-20) (3)度分布
对于WS 小世界网络,当k ≥K /2时有:
22222)!
2/()2/()1()(2/),min(0pK K K K K e n K k pK p p C k P n k n n K n k n -----=---=∑ (2-21) 当k <K /2时,P (k )=0。

对于NW 小世界网络,每个节点的度至少为K ,因此当k ≥K 时,一个随机选取的节点的度为k 的概率为:
K k N K k N K
k N Kp N Kp C k P +---⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛=1)( (2-22)
当k <K 时,P (k )=0。

类似ER 随机网络模型,WS 小世界网络模型也是所有节点的度都近似相等的均匀网络。

综上所述,ER 随机网络、WS 小世界网络和NW 小世界网络的度分布可近似用Poisson 分布来表示,该分布在度的平均值﹤k ﹥处有一峰值,然后按指数快速衰减。

这类网络被称为均匀网络(homogeneous network )或指数网络(exponential network )。

2.3.4 无标度网络(scale-free network )
近年来,大量的实证研究表明,许多大规模真实网络(如WWW 、Internet 以及新陈代谢网络等)的度分布函数都是呈幂律分布的形式:P (k )∝k - γ。

在这样的网络中,大部分节点的度都很小,但也有一小部分节点具有很大的度,没有一个特征标度。

由于这类网络的节点的连接度并没有明显的特征标度,故称为“无标度网络”。

为了解释实际网络中幂律分布产生的机理,Barabási 和Albert 在1999
年提出了一个无标度网络模型,称为BA 无标度模型。

该模型的构造主要基于现实网络的两个内在机制:①增长机制:大多数真实网络是一个开放系统,随着时间的推移,网络规模将不断增大,即网络中的节点数和连边数是不断增加的。

②择优连接:新增加的节更倾向于与那些具有较高连接度的节点相连。

也就是富人更富的观点(rich get richer )。

BA 无标度网络模型的构造算法:
(1)增长:在初始时刻,假定网络中己有m 0个节点,在以后的每一个时间步长中,增加一个连接度为m 的节点(m ≤m 0),新增节点与网络中已经存在的m 个不同的节点相连,且不存在重复连接。

(2)优先连接:在选择新节点的连接点时,一个新节点与一个已经存在的节点i 相连的概率Пi 与节点i 的度k i 成正比:
∑∏=j j i i k k (2-23)
经过t 步后,这种算法能够产生一个含有N =t +m 0个节点、mt 条边的网络。

如图2-12所示的是m =m 0=2时,BA 网络的演化过程。

初始网络有两个节点,每次新增加的一个节点按优先连接机制与网络中已经存在的两个节点相连。

图2-12 BA 无标度网络的演化过程(取自文献[ ])
BA 无标度网络模型具有如下基本特性:
(1)平均路径长度
BA 无标度网络的平均路径长度为:
N
N L log log log ∝ (2-24) 这表明BA 无标度网络也具有小世界性。

(2)簇系数
BA 无标度网络的簇系数为:
[]t t m m m m m m C 22
2)ln(111ln )1(4)1(⎥⎦
⎤⎢⎣⎡+-⎪⎭⎫ ⎝⎛+-+= (2-25) 与ER 随机网络类似,当网络规模充分大时,BA 无标度网络不具有明显的聚类特性。

(3)度分布
BA 无标度网络的度分布计算主要有三种方法:①平均场理论(mean-field approach);②主方程法(master-equation approach);③速率方程法(rate-equation approach)。

三种方法得到的渐近结果相同。

其中,主方程法和速率方程法等价。

分析计算可得:
3
22)
2)(1()1(2)(-∝+++=k m k k k m m k P (2-26) 这表明BA 无标度网络的度分布可以由幂指数为3的幂律函数来近似描述,图2-13所示为网络规模为N =104的BA 无标度网络的度分布。

图2.13 BA无标度网络的度分布(N=100000),(取自文献[ ])下面比较WS小世界网络模型、BA无标度网络模型与真实网络的主要性质的异同。

如表2-1所示,小世界网络和无标度网络各自捕捉到了真实网络三个主要性质中的两个。

后来,学者们又建立了许多模型来更好地体现真实网络的所有特性,但由于这两种网络模型规则简洁,并抓住了复杂网络的基本性质,到目前依然是使用最普遍的复杂网络模型。

表2-1 小世界网络、无标度网络与真实网络的性质比较。

相关文档
最新文档