小世界现象
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一种什么样的形式化网络,既体现这两种力量的作用,也 便于我们分析其中是否有小世界现象?
模型中节点间有两
每
Watts-Strogatz模型
个距离的概念:网 格距离和网络距离
两
点 • 定义一种图(网络),体现上述因素
之 间
– 有许多“三角形”和少数随机的“远程边”
有
一
个
“
网
格
距
离”想象大量节点排布成均匀网格状 连接近邻:确定性,连接远程:随机性
些基本原理?
• 能否依据社会网络的某些基本原理,构建出反映这种性质
的网络模型?
后续研究
• 不少重复研究,包括Milgram(1970)自己 • 拓展
– 运用书信所做的研究具有重复性,电子邮件呢? – Dodds, Muhamad, and Watts(2003)
• 60,000个电子邮件用户 • 通过给熟人转发电子邮件的方式,将邮件送达13个国家的18位收件人
v
道人们成为朋友的概率真的随空间距离递
减,并且递减强度幂次q真的等u 于2吗?
存在社会关系的概率与 空间距离的关系的示意
3/4, 3/10, 4/12, 3/14
利用在线社会网络进行验证
• 真实大规模在线社会网络是否体现了这个(W-S-K )网络模型的优化性质?
两人成为朋友的概率与其空间距离的平方成反比 • 如果是,则说明随机形成的社会网络可能具有某种
人类社会的小世界现象
• 社会网络中两节点间包含丰富的短路径
– 任意两节点间存在短路径的概率很高
• 短视搜索能够有效地找到这些短路径
– 短视搜索:在达到目标节点过程中,每一步只能看到 邻居节点
对于“十分稀疏的”社会网络来说,这并不是必然的
从现象到问题
• 问题
– 为什么社会网络具有这样的性质?它们源于社会网络的 哪些基本原理?
,具有着不同的“可连通性”(社会含义)
– 社会地位高的人,具有更多的“关系资源”,更好的连通性
本质的参数! • 但,在线社会网络的节点间如何谈空间距离?
来自LiveJournal的实验数据
• 50万用户,含邮政编码信息(地理信息) • 但他们是不均匀分布
的,不符合模型的假 设,需要做一些“适 配性”工作
LiveJournal中用户的地理位置分布
社会网络中结合地理距离的节点相对排名
• 可以看成是节点在地理上均匀分布时区域范围概念的一种推广,“排名”与 “距离”有对应关系
• 第二次:从Nebraska的Omaha到Boston的Shanron的股票经纪人Jeffrey Travers
“实验”
• S. Milgram(1967)
– 结果
• 平均中间人数:5
资料来源:Milgram 1967
小世界现象
• 小世界问题
– 在Milgram的研究之前,人们感觉到世界很小,却没有证据
核心-边缘结构
资料来源:Borgatti and Everett. 1999: 377
资料来源:Borgatti and Everett. 1999: 380
理论与现实
• 理论上
– 处在网络结构中的节点,不同的节点如果有相同的聚集系数,其
被连接到的概率应该是一样的
• 现实中
– Milgram(1967)的第一次就已经暗示了,寻找地位较低的人(
– 发现
• 通过认识的人,不一定有多熟悉 • 中间路径:5-7步
网页之间的“社交”
•全球互联网超过几百亿的网页,比人口总数多 •问题
– 网页之间,有怎样的关系,也有“小世界”现象吗?
• Albert, Jeong, Barabási(1999); Barabási(2013
)
– 没有关系的两个网页之间的直径为18.59次点击
• 这就使我们能一般性地处理节点在地理上分布不均匀的问题了
这• 意要味验着证的,是大量微观社交关系的建立总体上呈现一这种最样优
化特• 征在,均匀或地者理说分布大情量形,人一群个的节点随在机任一社距会离活上的动朋相友数当量于在一同等台距计离算 机,完节成点总了数一中种的占优比化随距计离算平(方递实减现(1了/d2最) 优参数)--这可以 看• 成此是时社等价会于计要算看的一个实例,也是体现社会系统中微观与 宏观• 关一 中系个的节占的点比实在随例任排一名!排递名减上(的1/r朋)友(即有连接)数量在同等排名节点总数
Watts-Strogatz模型的意义和局限
• 证明了模型网络中任意两个节点之间存在短路径的 概率很高,即“小世界”。
• 但不能解释Milgram等人实验反映出的小世界现象 的另一个层面:在短视搜索情况下能找到短路径
– 在模型上执行短视搜索,常常导致较长路径
体会“短视搜索”概念
国务院
需要一个懂 得社会调查 的专家
通过局部,理解全局;通过微观,理解宏观
在小世界问题上我们面对的是
在人类社会网络上的 大量实验结果表明, 短视搜索是有效的, 这说明现实社会网络 结构支持这种做法
在WS社会网络模型 上的理论分析表明, 短视搜索效果不好, 这说明该模型没能抓 住现实网络的某个重 要特点
因此,需要一种社会网络模型
• 既反映任意节点对之间短路径的存在性,也支持 在这种信件转发方式下短路径的可实现性
近乎完美的验证!(PNAS, 2005) 真实社会网络的测量参数与模型最优参数相当吻合!
核心-边缘结构模型
• Borgatti and Everett(1999)观察到,在社会网络
中
– 地位较高的人,被连接在一个密集连接的核心 – 地位较低的人,都分散在网络的外围
• 核心 - 边缘结构
– 不仅是理论上的 – 现实社会中,同样普遍存在
神学院学生的妻子),会更加困难
– 人们观察到,媒体寻人较之个体寻人有更高的成功率 – 回想“结构洞”,处于结构洞位置上的人,其被找到的概率,远远大
于一般节点上的人
社会意义
• 如果处于更高社会地位、且在结构洞位置上呢?故
– 网络结构本身是重要的,尤其是在可计算性上 – 同样重要的是,网络结构的社会属性 – 具有相同网络结构,却有着不同社会属性的网络,在现实社会中
– q:控制远程连接的概率随距离递减的强度
v
w
µ1
dq v,w
u
不同q值对随机连接长度的影响
q值较小,随机边倾向于较远
q值较大,随机边倾向于较近
pµ 1 dq
• Watts-Strogatz模型对应于q=0
该模型的最佳工作参数(q)
• 理论结果:当q=2 时,分散搜索达到最 佳效果
• 仿真实验:由几亿个 节点组成的网络中, 考察不同的q值在分 散搜索中的效果
– 设计
• 选择一个随机起点,观察需要经过多少个中间人,
能够到达目标点
资料来源:Milgram 1967
– 规则
• 参与者只能将信件转发给能直呼其名的熟人,并请他继续转发;如果一个参与者
不认识目标收信人,则他不能直接将信寄给他;
• 参与者需力争让信件能尽早达到目的地
• 第一次:从Kansas的Wichita到哈佛大学神学院某学生的妻子
Watts-Strogatz模型(Nature,1998)
• 体现了同质连接和弱关系连接的概念,于是可以看 成是现实社会网络的一个合理近似
• 可以证明:在这样的网络中,任意两节点之间存在 短路径的概率很高
• 也可以证明,Watts-Strogatz模型不能很好地体现 第二个要求
– 短视搜索的路径太长,尽管短路径存在
• MIT的师生试图证明这一点,不过,没有结果 • 来自Harvard的Milgram,用信件传递,得到了一个平均数
• 小世界现象
– Milgram的研究证明
• 世界是小的(六度分隔);社会网络中包含丰富的短路径 • “自动寻找”短路径;“有意识的转发”能“自动地”找到这些短路径
启发
• 为什么社会网络具有这样的性质?它们源于社会网络的哪
Nature 2000
横轴为参数q,纵轴为从一个节点到达 另一个节点所需的平均时间(跳步)
在WSK网络模型上的最优参数q=2
最优:在模型中导致很短的搜
索路径
w
v
Pr[v has an edge to w] µ 1 dq
v,w
Milgram的实验表明,现实社会网络中,分 u
散搜索的路径也很w 短。于是很值得好奇:难
北京 大学
X 大学
社会 学系
社会 学系
邱泽奇
(1)有目标;(2)每一步,只有局部知识;(3)与目标的比对
短视搜索(分散搜索)
• 相对于我们已经熟悉的“广度优先搜索”(无目标 ),这是一种有目标的基于局部信息的搜索,具有 如下特点
– 每个节点有一个特征,任何两个节点之间的特征可以谈差 别(距离)(不同于图论中定义的距离!)
网络中需要什么样的结构特征来体现这样的要求?
• 两个节点无论相距多远,都要有机会很快接近; • 两个节点的距离越近,存在直接连接的机会越大
Watts-Strogatz-Kleinberg模型
• 在Watts-Strogatz模型基础上,让两个节点之间 存在随机边的概率与它们网格距离的某个幂次 (q)成反比
“实验” • S. Milgram(1967)
– 现象:俗语 “My it's a small world.” – 问题:两个互不相识的人,如果想认识,中间需要经过几个人 – 意义:a certain mathematical structure in society
“实验”
• S的短视搜
索:0-C-B-A
A
6 • 而不能是:0-F-A
9 8 7 “短视搜索”没走“最短路 径”!
一种一般的认识论方法
• 经常,在事物的宏观格局中存在某种性质,但若 缺乏宏观视野,仅凭基于微观视野的追求,不一 定能发现那种性质。
• 但如果事物的结构存在某种特征,使我们能够证 明,基于微观视野的追求,就能揭示宏观性质, 则是十分美妙的事情。
– 每个节点都知道目标节点的特征,也知道自己和自己邻居 节点的特征
– 搜索过程可看成是信息传递的过程,节点将信息传给离目 标节点距离较近(差别较小)的邻居节点
F
0
1
短视搜索示例
E
2
D
3 • 节点:0, 1, …, 9, A, …,F
• 特征距离(差别):由环上的
C
4 相对位置定义,例如,节点0
和A的距离为6
• 可以证明,完全随机的网络没有这样的性质
– 换句话说,能否依据社会网络的某些基本原理,说明这 种性质的必然性?
形成社会网络的两种基本力量
• 同质性
– 共同朋友,邻里关系,同学,同事,共同兴趣 – 对应社会网络中的大量的“三角形”(圈子)
• 弱联系
– 偶然的原因,认识的“远程”朋友 – 对其所在的圈子并不一定熟悉
模型中节点间有两
每
Watts-Strogatz模型
个距离的概念:网 格距离和网络距离
两
点 • 定义一种图(网络),体现上述因素
之 间
– 有许多“三角形”和少数随机的“远程边”
有
一
个
“
网
格
距
离”想象大量节点排布成均匀网格状 连接近邻:确定性,连接远程:随机性
些基本原理?
• 能否依据社会网络的某些基本原理,构建出反映这种性质
的网络模型?
后续研究
• 不少重复研究,包括Milgram(1970)自己 • 拓展
– 运用书信所做的研究具有重复性,电子邮件呢? – Dodds, Muhamad, and Watts(2003)
• 60,000个电子邮件用户 • 通过给熟人转发电子邮件的方式,将邮件送达13个国家的18位收件人
v
道人们成为朋友的概率真的随空间距离递
减,并且递减强度幂次q真的等u 于2吗?
存在社会关系的概率与 空间距离的关系的示意
3/4, 3/10, 4/12, 3/14
利用在线社会网络进行验证
• 真实大规模在线社会网络是否体现了这个(W-S-K )网络模型的优化性质?
两人成为朋友的概率与其空间距离的平方成反比 • 如果是,则说明随机形成的社会网络可能具有某种
人类社会的小世界现象
• 社会网络中两节点间包含丰富的短路径
– 任意两节点间存在短路径的概率很高
• 短视搜索能够有效地找到这些短路径
– 短视搜索:在达到目标节点过程中,每一步只能看到 邻居节点
对于“十分稀疏的”社会网络来说,这并不是必然的
从现象到问题
• 问题
– 为什么社会网络具有这样的性质?它们源于社会网络的 哪些基本原理?
,具有着不同的“可连通性”(社会含义)
– 社会地位高的人,具有更多的“关系资源”,更好的连通性
本质的参数! • 但,在线社会网络的节点间如何谈空间距离?
来自LiveJournal的实验数据
• 50万用户,含邮政编码信息(地理信息) • 但他们是不均匀分布
的,不符合模型的假 设,需要做一些“适 配性”工作
LiveJournal中用户的地理位置分布
社会网络中结合地理距离的节点相对排名
• 可以看成是节点在地理上均匀分布时区域范围概念的一种推广,“排名”与 “距离”有对应关系
• 第二次:从Nebraska的Omaha到Boston的Shanron的股票经纪人Jeffrey Travers
“实验”
• S. Milgram(1967)
– 结果
• 平均中间人数:5
资料来源:Milgram 1967
小世界现象
• 小世界问题
– 在Milgram的研究之前,人们感觉到世界很小,却没有证据
核心-边缘结构
资料来源:Borgatti and Everett. 1999: 377
资料来源:Borgatti and Everett. 1999: 380
理论与现实
• 理论上
– 处在网络结构中的节点,不同的节点如果有相同的聚集系数,其
被连接到的概率应该是一样的
• 现实中
– Milgram(1967)的第一次就已经暗示了,寻找地位较低的人(
– 发现
• 通过认识的人,不一定有多熟悉 • 中间路径:5-7步
网页之间的“社交”
•全球互联网超过几百亿的网页,比人口总数多 •问题
– 网页之间,有怎样的关系,也有“小世界”现象吗?
• Albert, Jeong, Barabási(1999); Barabási(2013
)
– 没有关系的两个网页之间的直径为18.59次点击
• 这就使我们能一般性地处理节点在地理上分布不均匀的问题了
这• 意要味验着证的,是大量微观社交关系的建立总体上呈现一这种最样优
化特• 征在,均匀或地者理说分布大情量形,人一群个的节点随在机任一社距会离活上的动朋相友数当量于在一同等台距计离算 机,完节成点总了数一中种的占优比化随距计离算平(方递实减现(1了/d2最) 优参数)--这可以 看• 成此是时社等价会于计要算看的一个实例,也是体现社会系统中微观与 宏观• 关一 中系个的节占的点比实在随例任排一名!排递名减上(的1/r朋)友(即有连接)数量在同等排名节点总数
Watts-Strogatz模型的意义和局限
• 证明了模型网络中任意两个节点之间存在短路径的 概率很高,即“小世界”。
• 但不能解释Milgram等人实验反映出的小世界现象 的另一个层面:在短视搜索情况下能找到短路径
– 在模型上执行短视搜索,常常导致较长路径
体会“短视搜索”概念
国务院
需要一个懂 得社会调查 的专家
通过局部,理解全局;通过微观,理解宏观
在小世界问题上我们面对的是
在人类社会网络上的 大量实验结果表明, 短视搜索是有效的, 这说明现实社会网络 结构支持这种做法
在WS社会网络模型 上的理论分析表明, 短视搜索效果不好, 这说明该模型没能抓 住现实网络的某个重 要特点
因此,需要一种社会网络模型
• 既反映任意节点对之间短路径的存在性,也支持 在这种信件转发方式下短路径的可实现性
近乎完美的验证!(PNAS, 2005) 真实社会网络的测量参数与模型最优参数相当吻合!
核心-边缘结构模型
• Borgatti and Everett(1999)观察到,在社会网络
中
– 地位较高的人,被连接在一个密集连接的核心 – 地位较低的人,都分散在网络的外围
• 核心 - 边缘结构
– 不仅是理论上的 – 现实社会中,同样普遍存在
神学院学生的妻子),会更加困难
– 人们观察到,媒体寻人较之个体寻人有更高的成功率 – 回想“结构洞”,处于结构洞位置上的人,其被找到的概率,远远大
于一般节点上的人
社会意义
• 如果处于更高社会地位、且在结构洞位置上呢?故
– 网络结构本身是重要的,尤其是在可计算性上 – 同样重要的是,网络结构的社会属性 – 具有相同网络结构,却有着不同社会属性的网络,在现实社会中
– q:控制远程连接的概率随距离递减的强度
v
w
µ1
dq v,w
u
不同q值对随机连接长度的影响
q值较小,随机边倾向于较远
q值较大,随机边倾向于较近
pµ 1 dq
• Watts-Strogatz模型对应于q=0
该模型的最佳工作参数(q)
• 理论结果:当q=2 时,分散搜索达到最 佳效果
• 仿真实验:由几亿个 节点组成的网络中, 考察不同的q值在分 散搜索中的效果
– 设计
• 选择一个随机起点,观察需要经过多少个中间人,
能够到达目标点
资料来源:Milgram 1967
– 规则
• 参与者只能将信件转发给能直呼其名的熟人,并请他继续转发;如果一个参与者
不认识目标收信人,则他不能直接将信寄给他;
• 参与者需力争让信件能尽早达到目的地
• 第一次:从Kansas的Wichita到哈佛大学神学院某学生的妻子
Watts-Strogatz模型(Nature,1998)
• 体现了同质连接和弱关系连接的概念,于是可以看 成是现实社会网络的一个合理近似
• 可以证明:在这样的网络中,任意两节点之间存在 短路径的概率很高
• 也可以证明,Watts-Strogatz模型不能很好地体现 第二个要求
– 短视搜索的路径太长,尽管短路径存在
• MIT的师生试图证明这一点,不过,没有结果 • 来自Harvard的Milgram,用信件传递,得到了一个平均数
• 小世界现象
– Milgram的研究证明
• 世界是小的(六度分隔);社会网络中包含丰富的短路径 • “自动寻找”短路径;“有意识的转发”能“自动地”找到这些短路径
启发
• 为什么社会网络具有这样的性质?它们源于社会网络的哪
Nature 2000
横轴为参数q,纵轴为从一个节点到达 另一个节点所需的平均时间(跳步)
在WSK网络模型上的最优参数q=2
最优:在模型中导致很短的搜
索路径
w
v
Pr[v has an edge to w] µ 1 dq
v,w
Milgram的实验表明,现实社会网络中,分 u
散搜索的路径也很w 短。于是很值得好奇:难
北京 大学
X 大学
社会 学系
社会 学系
邱泽奇
(1)有目标;(2)每一步,只有局部知识;(3)与目标的比对
短视搜索(分散搜索)
• 相对于我们已经熟悉的“广度优先搜索”(无目标 ),这是一种有目标的基于局部信息的搜索,具有 如下特点
– 每个节点有一个特征,任何两个节点之间的特征可以谈差 别(距离)(不同于图论中定义的距离!)
网络中需要什么样的结构特征来体现这样的要求?
• 两个节点无论相距多远,都要有机会很快接近; • 两个节点的距离越近,存在直接连接的机会越大
Watts-Strogatz-Kleinberg模型
• 在Watts-Strogatz模型基础上,让两个节点之间 存在随机边的概率与它们网格距离的某个幂次 (q)成反比
“实验” • S. Milgram(1967)
– 现象:俗语 “My it's a small world.” – 问题:两个互不相识的人,如果想认识,中间需要经过几个人 – 意义:a certain mathematical structure in society
“实验”
• S的短视搜
索:0-C-B-A
A
6 • 而不能是:0-F-A
9 8 7 “短视搜索”没走“最短路 径”!
一种一般的认识论方法
• 经常,在事物的宏观格局中存在某种性质,但若 缺乏宏观视野,仅凭基于微观视野的追求,不一 定能发现那种性质。
• 但如果事物的结构存在某种特征,使我们能够证 明,基于微观视野的追求,就能揭示宏观性质, 则是十分美妙的事情。
– 每个节点都知道目标节点的特征,也知道自己和自己邻居 节点的特征
– 搜索过程可看成是信息传递的过程,节点将信息传给离目 标节点距离较近(差别较小)的邻居节点
F
0
1
短视搜索示例
E
2
D
3 • 节点:0, 1, …, 9, A, …,F
• 特征距离(差别):由环上的
C
4 相对位置定义,例如,节点0
和A的距离为6
• 可以证明,完全随机的网络没有这样的性质
– 换句话说,能否依据社会网络的某些基本原理,说明这 种性质的必然性?
形成社会网络的两种基本力量
• 同质性
– 共同朋友,邻里关系,同学,同事,共同兴趣 – 对应社会网络中的大量的“三角形”(圈子)
• 弱联系
– 偶然的原因,认识的“远程”朋友 – 对其所在的圈子并不一定熟悉