无标度网络拓扑的统计研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
作为一种系统理论, 无标度网络的提出, 为其他 学科研究提供了 很多有益启示: ( 1 ) 病毒传播。改变以往传染病模型认为病毒 的扩散取决于传染强度的阂值的观念, 发现无标度 网中 不存在这个阂 值, “ 所有病毒都可以在无标度网 络中传播和长期存在, 即使传染力很低的病毒也是
A i l o 等对无标度网络随度指数Y的变化而演 化的 情况 进 行了 详细的 研 究〔 1 0 ] , 他们证明: ① 存在
阑 值y o = 3 . 4 7 8 7 5 。 当y ‘ > y 。 时, 网 络 “ 几 乎 ” ③ 没
气毓气
=1 一 G o ( v " ) , 二1 一 F O ( u . ) ,
点的 概率② , 即, 二 G , ( v ) 。 记u 为任意边不被S C C 此 , , [ ! ! ] 。 的点所指的概率, 同样。二F , ( u ) 。解出这两个方 如 ( 2 ) 混沌 同 步 。 汪小帆 等证明 [ 1 2 1 , 当 无 标 度网 程的最小非负解, . , u, 则S ; a , S -S 。 可计算如下: 的藕合强度大于某一正临界值时, 无论规模如何都
亿网页和1 4 . 6 6 亿超链接, 得到凡 二 4 9 %, 并提出
了 著名的 基于 连通性的B o w - T i e 结构〔 . ] 。 N e w m a n 等按( 2 ) 式计算的理论结果S ; . - 5 3 %, 与B r o d e r 等
的实验结果较接近[ 1 5 1 。
2 . 3 无标度网络的演化
@ 2 0 0 7 S c i . T e c h E n g n g .
无标度网络拓扑的统计研究
王
羽
孙 颖1
(西北大学 信息学院, 西安 7 1 0 1 2 7 ; 西北工业大学 理学院‘ ; 西安7 1 0 0 7 2 )
摘 要 近年来, 无标度网络已成为系统科学研究的热点, 出现了一些通用的形式化分析方法。从概率论的角度, 分析了无
G o ( x )
1 对无标度性的解释
1 9 9 8 年, B a r a b b s i 等发现真实网 络的度分布既
非正态分布又非指数分布, 而是幂律分布p k =
C k 一 , , 其 中 、 二 1 , 2 , . . . ; 。 二 兴( “ , ) 是 K i e m a n n
Biblioteka Baidu会出现同步现象。 例如, 尽管不同路由器独立地发 ( 2 ) 布路由 消息, 但它们最终会达到同步状态, 造成网络
拥塞。 ( 3 ) 贪心搜索。小世界性表明, 在任意两个节
① S t r o n g l y C o n n e c t e d C o m p o n e n t 。 文 献【 1 0 ] 指出 , 当 度指数 ,< 3 . 4 7 8 7 5 时, 大 规 模S F 随 机网 络 存在唯 一S C C 的 概 率 几 乎为1 , ② 否则, 若 其 邻边指向S C C 中的点, 则该边与邻 边都在S C C
论预测在形式上相吻合。
2 . 2 We b的结构
通性 越来 越强。 ③ 当0< Y<1 时, 网 络“ 几乎” 是
完全图。
研究有向图时, 需要同时考虑出度与人度。以
{ P ; k I j , k = 0 , 1 , . . . } 表 示人 度为. 1 、 出 度 为k 的 联合 概
4 0 0 0 [ 8 ]
1 5 0 0 0 0 1 1
7 . 4 7 7 . 6 1 2 . 7 2 2 . 1
WW W
2 x 1 0 8 1 6
表1 显示了两个典型复杂系统 I n t e n r e t 和W e b 的拓扑指
标度的 形成机制 及其对复 杂系统宏观结构的影响, 介绍了 国际 上最有影响的一些成果和研究, 并简述了无标度网络的应用前
景。
关键词 复杂网 络 B A无标度网络 幕律 拓扑结构 最大等级法 中图法分类号 0 1 8 9 . 1 3 ; 文献标识码 A
无标度网 络是利用节点的 度分布来研究复杂系 统拓扑结构的理论。1 9 9 8年, B a r a b f k s i 等在研究
I n ( N / z , ) l=1+ I n ( z 2 / z , )
( 1 )
研 究 方向: 分布 式网 络, 网 络 安全 。 , F m a i l : w a n g y u . s i n l e @ p m a 7 . 二。 ,
1 5 1 8
科 学 技 术 与 工 程 表1 I n t e r n e t 和 We b 的几个拓扑指标。I n t e r d o m a i n 表示把子域着作节点, r o u t e r 表示把路由器看作节点
人度、 出度、 指向任意边、 任意边所指的概率的母函 数分别为 F . ( s ) 二 D( s , 1 ) , G o ( t )二 D ( 1 , t ) ,
率 分 布 , 其 母 函 数 为 D ( s , t ) = 艺 " J i k i s t k 。 那 么 , 也就是上文的 S C C .
中。
U , v =1 一 D ( u ` , 1 ) 一 D ( l , v ' ) + D ( B r o d e r 等利用搜索引擎 A l t a V i s t a 分析了2 . 0 3 5
③ “ 几乎” 的 意 思是, 随机事件序列I A 川 依概率收敛为1 , l i m n. . P I A n 卜1 ,
成 机制[ [ 4 1 。它基于两点假设: 动态增长和马太效
应。 这两个假设都是必要条件: 取消第一个后, 度分 布呈指数速度衰减; 取消第二个后, 度分布随时间逐 渐演变为正态分布。B a r a b 4 s i 等根据模型, 用5 个 初始节点迭代了2 0 0 0 0 ( 】 步, 得到度指数y = 2 . 9 的
2 0 0 6 年1 1 月2 7日 收到。 第 一 作者简介: 王 羽( 1 9 8 2 -) , 女, 计算 机软件与理论专 业研究生。
以 k ) ( 1 ) 。 设l 为网 络的 平均路径长度, 连通图中 任
意点的前 l 个连接层包含了所有节点, 因 此 1 +
I
叉‘= N 。 当N》z 1 , z 2 》 : : 时, 整 理 得
第一层邻接点数 目的期望( 不论人向方式、 出向方 式) 。
W e b 有最大强连通块S C C D 。以S j , S . " S 。 表
示网络中指向S C C 部分、 被S C C 所指部分和S C C 本 身的规模所占的比例。记, 为任意边不指向S C C中 节点的概率, 它等于该边所指的边都不指向S C C中
自B A模型出现以来, 学者们越来越重视度分
布的两极分化这一关键因素。胡海波等甚至借宏观 经济学中刻画收入差异程度的 G i n i 系数, 建立了一
它是判定整数型大样本幂律随机量的充要条件。我 们以平均相对误差为主要评价指标, 在相同条件下
拓扑指标 网络规模
I n t e r d o m a i n 3 0 1 5一 4 3 8 9
r o u t e r
7卷
实验值 l o r ,
理论值
出 度 指 数人 度 指 数
7 . w , 抽 2 . 1一2 . 2
K
1 p ,
参考文献
3 0 一 4 0 [ 6 ] 6 0 [ 7 ]
无标度网络。
W e b 的拓扑特点时, 提出这一理论[ 1 l 。实验证 实 [ 2 ) , 无 标 度网 络具 有“ 小世 界 效 应” 。 因 此, ’ 与正
则网格、 随机图、 小世界网络等模型相比, 它更贴近 真实网络, 已成为近年来系统科学研究的热点。
2 无标度性的宏观作用
讨论网络的宏观性质需要有一个形式化框架。 N e w m a n 与“ 小世界网 络” 的两位创始人利用母函数 法, 建立了处理具有任意度分布的随机图的统一途 径汇 , 〕 。 2 。 1 平均路径长度 …} , 其母函数为 任意给定度分布{ p k I k 二 0 , 1 ,
_ , 、 1 a D 尹, (s) = — I
G , ( t ) z a t ! 。 二 I ’
1 a D
名a s
N e w m a n 等用母函数法也算得相同的Y o 。 从表 1 可知, W e b 的 度指数小于3 , 因此它存在主连通块,
3 无标度网络的启示
( k + 1 ) p k . ,
‘、 7I
为, *
其 母 函 数 为G , ( x ) 二 艺。 * 二 ‘ =
E如 。.
G ' 卜) . . . , _ . I . ‘、、 , _ , 、 , 一. 。二 云哭 于 令 。任选一点, 经过 k 一 1 条边到达第 k 层连 G ' o { 1 ) ”一  ̄ , . ’ 一‘ ” 一 朴 ̄“ ̄/ . ‘ ” ’ “ ‘
的 极 少数 点却有1 0 0 ( 〕 以 上的 度[ 3 1 0
B a r a b f l s i 等提出了 一个模型 解释无标度网络生
通点, 这一层所包含的节点数目的期望为z k 二
d_ , 。, ,,、 、 、. 。 ,, _ 、_ t 。 - , 月、 _ _ G O ( G , ( . . . G , ( x ) ) ) 1 二 二 : =G ' o ( 1 ) G I . . 1 )= 山 ’ 。 、 一 ’ 、 一 ’ 、 ” 产 产 产’ ‘ ’ 互一 一”、 ‘ /’ 1 ・ ( 、 一 2一
④ 图‘二( V , E) 上的 强 连 通块G ' =( V ' , E ' ) , 如果
有I E ' I二0( I v i ) , 则称 G ' 为‘的主连通块。
8期
王 羽, 等; 无标度网络拓扑的统计研究
1 5 1 9
点间寻找短的路径( 网络规模的对数级大小) 是有
达1 0 . 6 5 %, 而频数法只有 5 . 5 1 %0
有主 连 通 块④ ; 当Y < Y 。 时, 网 络“ 几乎” 只 有 唯 一的
主 连通块。 ② 当1 < Y< Y 。 时, 随着Y 的 减小, 次连 通块的 规模从o ( 1 g川) 缩小为O ( 1 ) , 网 络的连
标。 其中, 系 数K 较 大, 实际 值l ‘比 理论 值l ,略 高。 A l b e t r 等测 定[ [ 9 ] , W e b 的 平 均路径长 度为l 二 0 . 3 5 十 2 . 0 6 1 g N , 与 理
希望的, 这对P 2 P 文件搜索很有启发性。K l e i n b e r g 在文献【 1 8 」 中, 我们设计了一种高精度的方 研究了带扰动的二维网格上的贪心搜索算法, 找到 法— 最大等级法, 可以弥补顺序法的不足, 并证明
一 种 对 数 平 方 级 的 算 法 〔 ” 〕 。
4 进一步的研究方向
第7 卷 第8 期 2 0 0 7 年4 月
1 6 7 1 - 1 8 1 9 ( 2 0 0 7 ) 0 8 - 1 5 1 7 - 0 4
科 学 技 术 与 工 程
S c i e n c e T e c h n o l o g y a n d E n g i n e e r i n g
V o l 7 N o . 8 A p r . 2 0 0 7
- z e t a 函 数, , > 1 [ ) ’ ' , S F 网 络 是 严 重 两 极 分 化 的 。
例如, W e b 基本上是由 少数度很高的节点串连起来 的, 8 0 %的页面的 度不到4 , 而占 总数不到万分之一
I p k x k 。 任 意 边 与 另 外人 条 边 相 邻 的 概 率
A i l o 等对无标度网络随度指数Y的变化而演 化的 情况 进 行了 详细的 研 究〔 1 0 ] , 他们证明: ① 存在
阑 值y o = 3 . 4 7 8 7 5 。 当y ‘ > y 。 时, 网 络 “ 几 乎 ” ③ 没
气毓气
=1 一 G o ( v " ) , 二1 一 F O ( u . ) ,
点的 概率② , 即, 二 G , ( v ) 。 记u 为任意边不被S C C 此 , , [ ! ! ] 。 的点所指的概率, 同样。二F , ( u ) 。解出这两个方 如 ( 2 ) 混沌 同 步 。 汪小帆 等证明 [ 1 2 1 , 当 无 标 度网 程的最小非负解, . , u, 则S ; a , S -S 。 可计算如下: 的藕合强度大于某一正临界值时, 无论规模如何都
亿网页和1 4 . 6 6 亿超链接, 得到凡 二 4 9 %, 并提出
了 著名的 基于 连通性的B o w - T i e 结构〔 . ] 。 N e w m a n 等按( 2 ) 式计算的理论结果S ; . - 5 3 %, 与B r o d e r 等
的实验结果较接近[ 1 5 1 。
2 . 3 无标度网络的演化
@ 2 0 0 7 S c i . T e c h E n g n g .
无标度网络拓扑的统计研究
王
羽
孙 颖1
(西北大学 信息学院, 西安 7 1 0 1 2 7 ; 西北工业大学 理学院‘ ; 西安7 1 0 0 7 2 )
摘 要 近年来, 无标度网络已成为系统科学研究的热点, 出现了一些通用的形式化分析方法。从概率论的角度, 分析了无
G o ( x )
1 对无标度性的解释
1 9 9 8 年, B a r a b b s i 等发现真实网 络的度分布既
非正态分布又非指数分布, 而是幂律分布p k =
C k 一 , , 其 中 、 二 1 , 2 , . . . ; 。 二 兴( “ , ) 是 K i e m a n n
Biblioteka Baidu会出现同步现象。 例如, 尽管不同路由器独立地发 ( 2 ) 布路由 消息, 但它们最终会达到同步状态, 造成网络
拥塞。 ( 3 ) 贪心搜索。小世界性表明, 在任意两个节
① S t r o n g l y C o n n e c t e d C o m p o n e n t 。 文 献【 1 0 ] 指出 , 当 度指数 ,< 3 . 4 7 8 7 5 时, 大 规 模S F 随 机网 络 存在唯 一S C C 的 概 率 几 乎为1 , ② 否则, 若 其 邻边指向S C C 中的点, 则该边与邻 边都在S C C
论预测在形式上相吻合。
2 . 2 We b的结构
通性 越来 越强。 ③ 当0< Y<1 时, 网 络“ 几乎” 是
完全图。
研究有向图时, 需要同时考虑出度与人度。以
{ P ; k I j , k = 0 , 1 , . . . } 表 示人 度为. 1 、 出 度 为k 的 联合 概
4 0 0 0 [ 8 ]
1 5 0 0 0 0 1 1
7 . 4 7 7 . 6 1 2 . 7 2 2 . 1
WW W
2 x 1 0 8 1 6
表1 显示了两个典型复杂系统 I n t e n r e t 和W e b 的拓扑指
标度的 形成机制 及其对复 杂系统宏观结构的影响, 介绍了 国际 上最有影响的一些成果和研究, 并简述了无标度网络的应用前
景。
关键词 复杂网 络 B A无标度网络 幕律 拓扑结构 最大等级法 中图法分类号 0 1 8 9 . 1 3 ; 文献标识码 A
无标度网 络是利用节点的 度分布来研究复杂系 统拓扑结构的理论。1 9 9 8年, B a r a b f k s i 等在研究
I n ( N / z , ) l=1+ I n ( z 2 / z , )
( 1 )
研 究 方向: 分布 式网 络, 网 络 安全 。 , F m a i l : w a n g y u . s i n l e @ p m a 7 . 二。 ,
1 5 1 8
科 学 技 术 与 工 程 表1 I n t e r n e t 和 We b 的几个拓扑指标。I n t e r d o m a i n 表示把子域着作节点, r o u t e r 表示把路由器看作节点
人度、 出度、 指向任意边、 任意边所指的概率的母函 数分别为 F . ( s ) 二 D( s , 1 ) , G o ( t )二 D ( 1 , t ) ,
率 分 布 , 其 母 函 数 为 D ( s , t ) = 艺 " J i k i s t k 。 那 么 , 也就是上文的 S C C .
中。
U , v =1 一 D ( u ` , 1 ) 一 D ( l , v ' ) + D ( B r o d e r 等利用搜索引擎 A l t a V i s t a 分析了2 . 0 3 5
③ “ 几乎” 的 意 思是, 随机事件序列I A 川 依概率收敛为1 , l i m n. . P I A n 卜1 ,
成 机制[ [ 4 1 。它基于两点假设: 动态增长和马太效
应。 这两个假设都是必要条件: 取消第一个后, 度分 布呈指数速度衰减; 取消第二个后, 度分布随时间逐 渐演变为正态分布。B a r a b 4 s i 等根据模型, 用5 个 初始节点迭代了2 0 0 0 0 ( 】 步, 得到度指数y = 2 . 9 的
2 0 0 6 年1 1 月2 7日 收到。 第 一 作者简介: 王 羽( 1 9 8 2 -) , 女, 计算 机软件与理论专 业研究生。
以 k ) ( 1 ) 。 设l 为网 络的 平均路径长度, 连通图中 任
意点的前 l 个连接层包含了所有节点, 因 此 1 +
I
叉‘= N 。 当N》z 1 , z 2 》 : : 时, 整 理 得
第一层邻接点数 目的期望( 不论人向方式、 出向方 式) 。
W e b 有最大强连通块S C C D 。以S j , S . " S 。 表
示网络中指向S C C 部分、 被S C C 所指部分和S C C 本 身的规模所占的比例。记, 为任意边不指向S C C中 节点的概率, 它等于该边所指的边都不指向S C C中
自B A模型出现以来, 学者们越来越重视度分
布的两极分化这一关键因素。胡海波等甚至借宏观 经济学中刻画收入差异程度的 G i n i 系数, 建立了一
它是判定整数型大样本幂律随机量的充要条件。我 们以平均相对误差为主要评价指标, 在相同条件下
拓扑指标 网络规模
I n t e r d o m a i n 3 0 1 5一 4 3 8 9
r o u t e r
7卷
实验值 l o r ,
理论值
出 度 指 数人 度 指 数
7 . w , 抽 2 . 1一2 . 2
K
1 p ,
参考文献
3 0 一 4 0 [ 6 ] 6 0 [ 7 ]
无标度网络。
W e b 的拓扑特点时, 提出这一理论[ 1 l 。实验证 实 [ 2 ) , 无 标 度网 络具 有“ 小世 界 效 应” 。 因 此, ’ 与正
则网格、 随机图、 小世界网络等模型相比, 它更贴近 真实网络, 已成为近年来系统科学研究的热点。
2 无标度性的宏观作用
讨论网络的宏观性质需要有一个形式化框架。 N e w m a n 与“ 小世界网 络” 的两位创始人利用母函数 法, 建立了处理具有任意度分布的随机图的统一途 径汇 , 〕 。 2 。 1 平均路径长度 …} , 其母函数为 任意给定度分布{ p k I k 二 0 , 1 ,
_ , 、 1 a D 尹, (s) = — I
G , ( t ) z a t ! 。 二 I ’
1 a D
名a s
N e w m a n 等用母函数法也算得相同的Y o 。 从表 1 可知, W e b 的 度指数小于3 , 因此它存在主连通块,
3 无标度网络的启示
( k + 1 ) p k . ,
‘、 7I
为, *
其 母 函 数 为G , ( x ) 二 艺。 * 二 ‘ =
E如 。.
G ' 卜) . . . , _ . I . ‘、、 , _ , 、 , 一. 。二 云哭 于 令 。任选一点, 经过 k 一 1 条边到达第 k 层连 G ' o { 1 ) ”一  ̄ , . ’ 一‘ ” 一 朴 ̄“ ̄/ . ‘ ” ’ “ ‘
的 极 少数 点却有1 0 0 ( 〕 以 上的 度[ 3 1 0
B a r a b f l s i 等提出了 一个模型 解释无标度网络生
通点, 这一层所包含的节点数目的期望为z k 二
d_ , 。, ,,、 、 、. 。 ,, _ 、_ t 。 - , 月、 _ _ G O ( G , ( . . . G , ( x ) ) ) 1 二 二 : =G ' o ( 1 ) G I . . 1 )= 山 ’ 。 、 一 ’ 、 一 ’ 、 ” 产 产 产’ ‘ ’ 互一 一”、 ‘ /’ 1 ・ ( 、 一 2一
④ 图‘二( V , E) 上的 强 连 通块G ' =( V ' , E ' ) , 如果
有I E ' I二0( I v i ) , 则称 G ' 为‘的主连通块。
8期
王 羽, 等; 无标度网络拓扑的统计研究
1 5 1 9
点间寻找短的路径( 网络规模的对数级大小) 是有
达1 0 . 6 5 %, 而频数法只有 5 . 5 1 %0
有主 连 通 块④ ; 当Y < Y 。 时, 网 络“ 几乎” 只 有 唯 一的
主 连通块。 ② 当1 < Y< Y 。 时, 随着Y 的 减小, 次连 通块的 规模从o ( 1 g川) 缩小为O ( 1 ) , 网 络的连
标。 其中, 系 数K 较 大, 实际 值l ‘比 理论 值l ,略 高。 A l b e t r 等测 定[ [ 9 ] , W e b 的 平 均路径长 度为l 二 0 . 3 5 十 2 . 0 6 1 g N , 与 理
希望的, 这对P 2 P 文件搜索很有启发性。K l e i n b e r g 在文献【 1 8 」 中, 我们设计了一种高精度的方 研究了带扰动的二维网格上的贪心搜索算法, 找到 法— 最大等级法, 可以弥补顺序法的不足, 并证明
一 种 对 数 平 方 级 的 算 法 〔 ” 〕 。
4 进一步的研究方向
第7 卷 第8 期 2 0 0 7 年4 月
1 6 7 1 - 1 8 1 9 ( 2 0 0 7 ) 0 8 - 1 5 1 7 - 0 4
科 学 技 术 与 工 程
S c i e n c e T e c h n o l o g y a n d E n g i n e e r i n g
V o l 7 N o . 8 A p r . 2 0 0 7
- z e t a 函 数, , > 1 [ ) ’ ' , S F 网 络 是 严 重 两 极 分 化 的 。
例如, W e b 基本上是由 少数度很高的节点串连起来 的, 8 0 %的页面的 度不到4 , 而占 总数不到万分之一
I p k x k 。 任 意 边 与 另 外人 条 边 相 邻 的 概 率