复杂网络9讲-加权网络
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八讲 加权网络
2010.11.13 李凯凯
主要内容: • 8.1 加权网络的统计性质 • 8.2 加权网络的演化模型
• 8.3 权重对网络结构性质的影响
8.1加权网络的统计性质
1. 加权网络的加权的必要性与方式 2. 加权网络上的统计量
1. 网络加权的必要性与赋权方式
网络加权的必要性:
例:为研究某一新思想的在一个学术领域的产生传播,研究科学家之间通 过文献相互作用的网络。相互作用分为三个层次:合作,引文,致谢 (无权 网中能体现相互作用的三个层次吗?) 。 我们可以根据不同的作用关系做三个网络:合作网络,引文网络,致谢网络. 但即便对于同一个网络比如引文网络,引文次数不同所代表的相互作用 关系不同。(无权网中能表现相互作用的强度吗?)
1 C (i) ( wij w jk wki ) ki (ki 1) j ,k
w o
1 3
wij
其中 wij 为网络中经最大权重标准化后的数值
Petter Holme 分析加权网络的聚类系数,指出它应该满足以下几条要求:
1.
C w [0,1]
2.加权网退化为无权网时,聚类系数应与Watts-Strogatz定义的聚类系数的计 算结果一致。 3.权值为0表示该边不存在。 4.包含节点i的三角形中三条边对 C w (i) 的贡献应与边的权重成正比。
时,具有较大权重的边倾向于连接具有较大度值的点
当 时,具有较大权重的边倾向于连接具有较小度值的点 w 所以,对于相互作用强度(权重)给定的边, knn ,i 表明它与具有不同度值的顶 点之间的亲和力。
• 最短路径
1.加权网络中两点之间的距离与权重的关系: 距离是权重的某种函数,这时需要看权重是相似权还是相异权。 相异权:定义两点之间的距离 lij wij 1 l 相似权:令 ij wij 假设顶点i和k分别通过两条权重分别为 wij 和 w jk 的边相连,现求i与k之 间的距离。 对于相异权: lik wij w jk
对于相似权:l i k
1 1 wi j 1 w jk
2.最短路径:两点之间所有连通的路径中距离之和最小的一条或几条路径。
无权网:边数最少的路径
最短路径
加权网:因为距离不满足三角不等式,所以两边距离之和不一定大于第三边. 边数最少的路径 最短路径
网络的其他全局统计量,如介数,可以在加权最短路径的基础上进行计算
k nn (k )
knn,i
1 ki
1 kj ki jN i
a k
jV ij
j
k nn,i
在加权网络中:
k
定义节点的加权平均近邻度 考虑权与度的相关性
当
w k nn ,i k nn ,i
w knn ,i knn ,i
w nn ,i
1 Si
jN j
a
ij
wij k j
这时必须考虑赋边权,表示相联系的强度.
另外,我们希望在同一个网络中研究这三个层次的相互作用,还应该考虑 加权的方式.
当系统中包含同一属性的不同层次的关系的时候,必须仔细研究加权方 式.
加权的方式:
根据相关的物理量(例如:电阻网络边上的权值代表电 阻值,邮递员问题中的距离) 根据相互作用的某种属性(例如:科学家通过文献相互 作用,把引文的次数作为权重) 边权按照意义划分: 相异权: 权值越大,两点之间的距离越大,关系越疏 远.(例:邮递员问题中的距离) 相似权: 权值越大,两点之间的距离越小,关系越亲 密.(例:科学家合作网中,把次数作为权重,得到相似 权) 注意: 在计算两点间的距离和聚类系数时,边权的意 义不同,计算方式也不同.
集聚系数
节点i的聚类系数 Ci 反映了该节点邻点的联系的程度。 Ci 越大,说明 该点的邻接点之间的联系越紧密。 加权网络中的聚类系数有多种定义方式; Barat 定义: wij w jk 1 w CB aij a jk aki si (k i 1) j ,k 2 分母上为单位权乘以最大可能的三角形的数目,分子上是实际三角形数 目乘以与i相连的边的权重的平均值 Onnela 定义:
1 ki
成正比。
Yi
jN i
[
wij Si
]2 [
wij w ki
]2 k i
wij
2
2 2
w ki
1 ki
如果权值相差较大,那么只有一条边的权重起主要作用,则
Yi 1
2.相关性分析 加权网络需要进行 度相关性分析 点权相关性分析 权与度相关性分析 度相关性分析:因为对网络加权不改变节点的度的性质,所以度相关性 分析与无权网络中分析相同。 在无权网络中: 定义节点i的近邻平均度 k nn,i ,得到度为 k 的所有节点的近邻平均度 显然 Knn(k) 是 k 的函数。那么度相关性可以通过函数 Knn(k) 的单调性得到: 如果 Knn(k) 是无单调性,那么该网络没有度相关性。 如果 Knn(k)是增函数,那么该网络是同向匹配网络。(度大的节点倾 向于与度大的节点相连) 如果 Knn(k) 是减函数,那么该网络是负向匹配网络。
jN i
[
wij Si
] 2 表示与i相连的边权分布的离散程度。
拥有相同点权与单位权的两个节点相比,差异性越大,离散程度越大。 点强度分布P(s)与度分布的作用类似,主要是考察节点具有点强度s的 概率。
边权分布P(w)代表一条边具有权重w的概率。
结论2:差异性 Y i 与度 k的关系
如果与顶点i关联的边的权重值差别不大,则 Y i 与
2.加权网络上的统计量
权相关性 最短路径 集聚系数
权相关性
1.基本概念: 点权:无权网中节点度的自然推广
点权 Si 的近邻集合)
S ki
wij ,即与节点 i i关联的边权之和。( 其中 N
jNi
i
是节点i
单位权: U i i, 顶点连接的平均权重.
Yi 权重分布的差异性:
Watts-Strogatz 定义的聚类系数:
C (i )
a
j ,k j ,k
ij
a jk a ki
ij
Hale Waihona Puke Baidu
a
a ki
加权网的聚类系数:
w CH
w
j ,k
ij
w jk wki
j ,k
maxij wij wij wik
一些加权网络的实证结果
• 1.生物网络 Almaas等人将酵母中的新陈代谢反应看作加权网络进行 研究,把从代谢物i到j的流量看作边权 ,观察到流量具有 高度非均匀性,在理想的培养下条件下,边权的分布符合 幂律分布 p()(0 ) 其中 0.0003, 1.5 此外还发现给定两端度值的边的权重平均值和两个端点的 ~ ( k k ) 度值的关系为 ij ,其中 0.5。除了全局流量 i j 分布的非均匀性外,计算边权差异性 Yi 还可以观察到在 单个代谢物的层面上边权分布的非均匀性。在此网络上对 出度和入度相同的顶点计算边权差异性,发现它们都服从 Yi ~ k 0.27 这是一种介于Y (k ) const 和 Y (k ) ~ k 1 之间的中间 状态,说明一个代谢物参与的化学反应越多,其中的某一 个化学反应携带主要流量的可能性就越高。??
2010.11.13 李凯凯
主要内容: • 8.1 加权网络的统计性质 • 8.2 加权网络的演化模型
• 8.3 权重对网络结构性质的影响
8.1加权网络的统计性质
1. 加权网络的加权的必要性与方式 2. 加权网络上的统计量
1. 网络加权的必要性与赋权方式
网络加权的必要性:
例:为研究某一新思想的在一个学术领域的产生传播,研究科学家之间通 过文献相互作用的网络。相互作用分为三个层次:合作,引文,致谢 (无权 网中能体现相互作用的三个层次吗?) 。 我们可以根据不同的作用关系做三个网络:合作网络,引文网络,致谢网络. 但即便对于同一个网络比如引文网络,引文次数不同所代表的相互作用 关系不同。(无权网中能表现相互作用的强度吗?)
1 C (i) ( wij w jk wki ) ki (ki 1) j ,k
w o
1 3
wij
其中 wij 为网络中经最大权重标准化后的数值
Petter Holme 分析加权网络的聚类系数,指出它应该满足以下几条要求:
1.
C w [0,1]
2.加权网退化为无权网时,聚类系数应与Watts-Strogatz定义的聚类系数的计 算结果一致。 3.权值为0表示该边不存在。 4.包含节点i的三角形中三条边对 C w (i) 的贡献应与边的权重成正比。
时,具有较大权重的边倾向于连接具有较大度值的点
当 时,具有较大权重的边倾向于连接具有较小度值的点 w 所以,对于相互作用强度(权重)给定的边, knn ,i 表明它与具有不同度值的顶 点之间的亲和力。
• 最短路径
1.加权网络中两点之间的距离与权重的关系: 距离是权重的某种函数,这时需要看权重是相似权还是相异权。 相异权:定义两点之间的距离 lij wij 1 l 相似权:令 ij wij 假设顶点i和k分别通过两条权重分别为 wij 和 w jk 的边相连,现求i与k之 间的距离。 对于相异权: lik wij w jk
对于相似权:l i k
1 1 wi j 1 w jk
2.最短路径:两点之间所有连通的路径中距离之和最小的一条或几条路径。
无权网:边数最少的路径
最短路径
加权网:因为距离不满足三角不等式,所以两边距离之和不一定大于第三边. 边数最少的路径 最短路径
网络的其他全局统计量,如介数,可以在加权最短路径的基础上进行计算
k nn (k )
knn,i
1 ki
1 kj ki jN i
a k
jV ij
j
k nn,i
在加权网络中:
k
定义节点的加权平均近邻度 考虑权与度的相关性
当
w k nn ,i k nn ,i
w knn ,i knn ,i
w nn ,i
1 Si
jN j
a
ij
wij k j
这时必须考虑赋边权,表示相联系的强度.
另外,我们希望在同一个网络中研究这三个层次的相互作用,还应该考虑 加权的方式.
当系统中包含同一属性的不同层次的关系的时候,必须仔细研究加权方 式.
加权的方式:
根据相关的物理量(例如:电阻网络边上的权值代表电 阻值,邮递员问题中的距离) 根据相互作用的某种属性(例如:科学家通过文献相互 作用,把引文的次数作为权重) 边权按照意义划分: 相异权: 权值越大,两点之间的距离越大,关系越疏 远.(例:邮递员问题中的距离) 相似权: 权值越大,两点之间的距离越小,关系越亲 密.(例:科学家合作网中,把次数作为权重,得到相似 权) 注意: 在计算两点间的距离和聚类系数时,边权的意 义不同,计算方式也不同.
集聚系数
节点i的聚类系数 Ci 反映了该节点邻点的联系的程度。 Ci 越大,说明 该点的邻接点之间的联系越紧密。 加权网络中的聚类系数有多种定义方式; Barat 定义: wij w jk 1 w CB aij a jk aki si (k i 1) j ,k 2 分母上为单位权乘以最大可能的三角形的数目,分子上是实际三角形数 目乘以与i相连的边的权重的平均值 Onnela 定义:
1 ki
成正比。
Yi
jN i
[
wij Si
]2 [
wij w ki
]2 k i
wij
2
2 2
w ki
1 ki
如果权值相差较大,那么只有一条边的权重起主要作用,则
Yi 1
2.相关性分析 加权网络需要进行 度相关性分析 点权相关性分析 权与度相关性分析 度相关性分析:因为对网络加权不改变节点的度的性质,所以度相关性 分析与无权网络中分析相同。 在无权网络中: 定义节点i的近邻平均度 k nn,i ,得到度为 k 的所有节点的近邻平均度 显然 Knn(k) 是 k 的函数。那么度相关性可以通过函数 Knn(k) 的单调性得到: 如果 Knn(k) 是无单调性,那么该网络没有度相关性。 如果 Knn(k)是增函数,那么该网络是同向匹配网络。(度大的节点倾 向于与度大的节点相连) 如果 Knn(k) 是减函数,那么该网络是负向匹配网络。
jN i
[
wij Si
] 2 表示与i相连的边权分布的离散程度。
拥有相同点权与单位权的两个节点相比,差异性越大,离散程度越大。 点强度分布P(s)与度分布的作用类似,主要是考察节点具有点强度s的 概率。
边权分布P(w)代表一条边具有权重w的概率。
结论2:差异性 Y i 与度 k的关系
如果与顶点i关联的边的权重值差别不大,则 Y i 与
2.加权网络上的统计量
权相关性 最短路径 集聚系数
权相关性
1.基本概念: 点权:无权网中节点度的自然推广
点权 Si 的近邻集合)
S ki
wij ,即与节点 i i关联的边权之和。( 其中 N
jNi
i
是节点i
单位权: U i i, 顶点连接的平均权重.
Yi 权重分布的差异性:
Watts-Strogatz 定义的聚类系数:
C (i )
a
j ,k j ,k
ij
a jk a ki
ij
Hale Waihona Puke Baidu
a
a ki
加权网的聚类系数:
w CH
w
j ,k
ij
w jk wki
j ,k
maxij wij wij wik
一些加权网络的实证结果
• 1.生物网络 Almaas等人将酵母中的新陈代谢反应看作加权网络进行 研究,把从代谢物i到j的流量看作边权 ,观察到流量具有 高度非均匀性,在理想的培养下条件下,边权的分布符合 幂律分布 p()(0 ) 其中 0.0003, 1.5 此外还发现给定两端度值的边的权重平均值和两个端点的 ~ ( k k ) 度值的关系为 ij ,其中 0.5。除了全局流量 i j 分布的非均匀性外,计算边权差异性 Yi 还可以观察到在 单个代谢物的层面上边权分布的非均匀性。在此网络上对 出度和入度相同的顶点计算边权差异性,发现它们都服从 Yi ~ k 0.27 这是一种介于Y (k ) const 和 Y (k ) ~ k 1 之间的中间 状态,说明一个代谢物参与的化学反应越多,其中的某一 个化学反应携带主要流量的可能性就越高。??