复杂网络(度相关性与社团结构)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

aij xi x j
x x cov( , ) i, j
i
j
aij
i, j
4.2.6 同配概念的一般化
x x a x x x x cov( , ) 1
(


2
)
i
j
2M i, j ij i j
i
j
a x x 1
2

2M i, j ij i j
社会网络同质性的两种基本解释: 1、选择,即人们倾向于和相似的人成为朋友; 2、影响,即人们由于成为朋友而相互影响,从而变得更相为 似。
社会网络面临的重大挑战:区分选择和影响这两个因素以及 如何判断哪一个因素的作用更大。
(P128)
4.2.6 同配概念的一般化
关于度同配性的一些方法也可以推广到判断其他特征的同配性
点i 的余平均度,即节点i的 ki 个邻居节点的平均度 knn i 如下:
knn
i
1 ki
ki
ki j .
j 1
(egP124图4-4)
假设网络中度为k的节点为 v1, v2,..., vik , 那么度为k的节点的余平 均度可计算如下:
1
knn (k ) ik
ik
kik j ) ij 2M i j
x x
1 2M
i, j
(kiij
kik j ) 2M
i
j
同配系数的定义就是归一化的协方差:
cov( ,
x x r
i 2
x
) j
i, j
(aij

kik j 2M
)xi x j
i, j
(ki ij

kik j 2M
)xi x j
放映结束 感谢各位的批评指导!
k nn vi
i 1
knn (k) 与条件概率和联合概率之间具有如下关系:
knn
kmax
(k)
k 'Pc (k ' | k)
k ' kmin
1 qk
kmax
k
'
e k
k'
k' kmin
如果 knn (k) 是k的增函数,那么就意味着平均而言,度大的 节点倾向于与度大的节点连接,从而表明网络是同配的;反之,
科研人员合作和电影演员合作等许多现实网络呈现同配性质; 不同的在线网络呈现不同的性质。
度同配起源的解释 1、社会学 2、心理学
近些年的社会网络发展冲破了社会阶层之间的无形壁垒。
(P127)
4.2.6 同配概念的一般化
同配就是指属性相近的节点倾向于互相连接。这里的属性可以 是度也可以是其他特性,例如社会网络中个体的职业、年龄、种族、 信仰等。

Pk P(k), qk Pn (k), e jk P( j, k).
下式表明网络的二阶度分布特性包含了1阶度分布特性:
k kmax
k
Pk
k
e jk
jkmin
k qk.
如果网络中两个节点之间是否有边相连与这两个节点的度值无 关,也就是说,网络中随机选择的一条边的两个端点的度是完全随 机的,即有
那么就意味着平均而言,度大的节点倾向于与度小的节点连接,从 而表明网络是异配的;如果网络不具有度相关性,那么 knn (k) 是 一个与k无关的常数:
knn (k)
j
je jk
e jk
jq jqk
j

qk
j
jqj
j
j jpj k 2 . k k
j
4.2.4 同配系数
网络是度相关的就意味着 e jk 和 qjqk 之间不恒等。
用二者的差刻画网络的同配或者异配程度,即:
e q q jk j k jk( jk j、k
j
)
k
(4-15)
当网络完全同配时,(4-17)达到最大,即为余度分布:
k q q 2
kik j ) ij 2M i j
x x
1 2M
i, j
(kiij
kik j ) 2M
i
j
同配系数的定义就是归一化的协方差:
cov( , )
x x r
i
j
2
x
4.2.6 同配概念的一般化
令 xi x j ,得到 xi 的方差如下:
(a x x
2 x

1 2M
i, j
络的邻接矩阵。每条边有两个端点,对所有M条边的2M个端点的属 性取平均值,得到:
4.2.6 同配概念的一般化


aij xi
i, j
aij

ki, j
i, j
(P129)
考虑网络中每条边的两个端点i和j所对应的
xi
,x

j
,他们的协
方差为:
j,k kmin
(3)余度分布,即
kmax
Pn (k) P( j, k), j kmin
其中km
in和km
分别为网络中节点的度
ax
的最小值和最大值。
kmax
Pn (k) P( j, k), j kmin
表示网络中随机选取的一个节点随机选取的一个邻居节点的度 为k的概率。也就是说,在网络中随机选取一个节点,然后再从该 节点出发随机地沿着一条边到达一个邻居节点,该邻居节点的度为 k的概率即为Pn (k). 一般而言,Pn (k) 与度分布P(k)是不同的。例如,我 们无法从一个节点出发到达网络中的孤立节点。因此,在网络中存 在孤立节点的情形:Pn (0) 0 P(0).
第4章 度相关性与社团结构
4.1 引言
度分布尽管是网络的一个重要拓扑特征,但是不能由它唯一的刻画一个网 络,因为具有相同度分布的两个网络可能具有非常不同的其他性质或行为。 为进一步刻画网络的拓扑结构,需考虑包含更多结构信息的高阶拓扑特征。 本章介绍刻画网络的二阶度分布特性(也称度相关性)的几种不同方法,包 括最为一般但较为复杂的联合概率分布、更为简洁但不宜比较的条件概率和 余平均度以及可以定量刻画度相关性但过于粗略的相关系数。
网络的0阶度分布特性:平均度<K>=2M/N
只告诉我们网络中有多少条边,并没有给出这些边是如何安置在网络中。给定网络的节 点数N和边数M,那么任一与该网络具有相同节点数和边数的网络模型也具有相同的平均度。
网络的1阶度分布特性:度分布P(k)=n(k)/N
其中n(k)是网络中度为k的节点数;度分布刻画了网络中不同度的节点各自所占的比例。
a x x k k x x 1
1
2M i, j
ij i
j (2M )2 i, j
i
ji
j
(a x x 1 2M i, j
kik j ) ij 2M i j
4.2.6 同配概念的一般化
令 xi x j ,得到 xi 的方差如下:
(a x x
2 x

1 2M
i, j
即使是联合概率分布也仍然不能完全刻画网络拓扑。一个典型例子就是 复杂网络的社团结构;实际网络往往可以视为是由若干个社团构成,每个社 团内部的节点之间的连接相对较为紧密,但是各个社团的连接相对比较稀疏。 本章将介绍大规模网络社团结构分析所面临的挑战以及几个有代表性的算法。
4.2 度相关性与同配性
4.21 高阶度分布的引入

显然度分布中已经包含了平均度的信息 k kP(k).
具有相同度分布的两个网络可能具有非常k不0 同的其他性质或行为。eg:P121 为进一步刻画网络的拓扑结构,考虑包含更多结构信息的高阶拓扑特性。
4.2 联合概率分布(2阶度分布特性)
联合概率:网络中随机选取的一条边的两个端点的度分别为j和k的概率, 即为网络中度为j的节点和度为k的节点之间存在的边数占网络总数的比例。
谢 谢!
让我们共同进步
e jk q jqk ,j, k
那么就称网络不具有度相关性,或者称网络是中性的;否则就称网 络具有度相关性。
对于度相关的网络,如果总体上度大的节点倾向于连接度大的 节点,就称网络是度正相关的,或称网络是同配的;如果总体上度 大的节点倾向于连接度大小的节点,就称网络是度负相关的,或称 网络是异配的。具有相同度序列/度分布的网络可以具有完全不同 的度相关性(P122图4-2)。
任一条边与某个节点相连的概率与该节点的度成正比,度不相关网
络的条件概率为
Pn
(k
'
|
k)

Pn
(k)

k 'P(k ' ) k
.
判断度相关性的更为简洁的方法:计算度为k的节点的邻居节 点的平均度,也称度为k的节点的余平均度,记为 knn (k).
假设节点i的 ki 个邻居节点的度为 kij , j 1,2,...,ki. 我们可以计算节
质:
社会网络中社会年龄性质的同配性。定义条件概率 Pc (t' | t) 为网络中随机选取的一个年龄为t的个体的一个邻居的年
龄为 t ' 的概率。P128的图4—8给出了t=20、30、40、50、60时
Facebook网络的条件概率分布。 可以看到,每一天曲线都是以t=t'为峰值的。
度同配性也可以推广到其他属性的情形。我们用标量参数 xi 表示节点的某个属性。假设一个无向网络中有M条边, A aij 为网
4.2.3 余平均度
条件概率:网络中随机选取的一个度为k的节点的一个邻居的 度为j的概率,记为 Pc ( j | k) .它与联合概率P( j, k)之间具有如下关系:
Pc ( j | k)Pn (k) P( j, k).
如果条件概率与k相关,那么就说明节点度之间具有相关性,
且网络结构具有层次结构;反之,说明网络没有度相关性。考虑到
2 [ k ]2
q j、k
k
k
k
(4-16)
于是得到归一化系数(同配系数):
e q q r
1
2
jk ( jk
q j、k
j
)
k
(4-17)
r>0,网络是同配的; r<0,网络异配。 r的数值大小反应了网络的同配或异配强弱程度。
4.2.5 实际网络的同配性质
蛋白质交互网络和神经网络以及交互互联网和WWW等技术都 是异配的;
P(
j,
k)

m(
j,
k)(
2M
j,
k
)
, jj

k, k,
( (
j, j,
k) k)

2 1
其中,m(j,k)是度为j的节点和度为k的节点之间的连边数。
联合概率分布的性质:
(1)对称性,即
P( j, k) P(k, j),j, k
(2)归一性,即 kmax
P( j, k) 1,
相关文档
最新文档