C04 小世界实验及其惊奇
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“实验”
• Stanley Milgram(1967)
– 现象:俗语 “My it's a small world.” – 问题:两个互不相识的人,如果想认识,中间需要经过几个人 – 意义:a certain mathematical structure in society – 假设:
• •
由于每个人都有熟人,熟人之间没有芥蒂,可以交往,故,不曾有连接 的两个人之间,如果要建立连接,中间人的数量应该不多 每个人的确都有熟人,不过,不同类型或阶层熟人之间,不会有交往, 故,不曾有连接的两个人之间,不可能建立连接
F
0
1
短视搜索示例
2
3 4
E
D C B
5
A 9
7 8
6
• 节点:0, 1, …, 9, A, …,F • 特征距离(差别):由环上的 相对位置定义,例如,节点 0 和A的距离为6 • 从0开始,以A为目标的短视搜 索:0-C-B-A • 而不能是:0-F-A
“短视搜索”没走“最短路径”!
F
0
1
测试:短视搜索
– 在模型上执行短视搜索,常常导致较长路径
关于小世界的 Watts-Strogatz-Kleinberg模型
体会“短视搜索”概念
国务院
需要一个懂 得社会调查 的专家
中国人民 大学
社会与人 口学院
冯仕政
X 大学
社会 学系
(1)有目标;(2)每一步,只有局部知识;(3)与目标的比对
短视搜索(分散搜索)
WSK模型中优化参数的大 数据验证
在WSK网络模型上的最优参数q=2
最优:在模型中导致很短的搜 w 索路径
v
1 Pr[v has an edge to w] µ q d v, w
Milgram的实验表明,现实社会网络中,分 u
散搜索的路径也很短。于是很值得好奇:难 w
v
道人们成为朋友的概率真的随空间距离递减, 并且递减强度幂次q真的等于2吗?
– 短视搜索的路径太长,尽管短路径存在百度文库
Watts-Strogatz模型的意义和局限
• 证明了模型网络中任意两个节点之间存在短路径的概率很高, 即“小世界”。 • Watts-Strogatz模型,抽象地表达了社会网络成因的基本特征 ,从理论上说明了小世界现象(一个方面)的必然性。 • 对于重要的社会现象,如果可以用一个数学模型来解释,尽管 这个模型概括不了现象的所有细节,也是很值得追求的 • 但不能解释Milgram等人实验反映出的小世界现象的另一个层 面:在短视搜索情况下能找到短路径
网络中需要什么样的结构特征来体现这样的要求? • 两个节点无论相距多远,都要有机会很快接近; • 两个节点的距离越近,存在直接连接的机会越大
Watts-Strogatz-Kleinberg模型
• 在Watts-Strogatz模型基础上,让两个节点之间 存在随机边的概率与它们网格距离的某个幂次 (q)成反比
Nature 2000
横轴为参数q,纵轴为从一个节点到达 另一个节点所需的平均时间(跳步)
小结
• 发现WS模型不能反映现实社会网络的一个重要特征 ,促成了WSK模型 • WSK模型通过适当控制WS模型中的随机性,与实验 结果更加吻合 • 该模型中出现了一个优化参数(q),当取特定值的 时候效果最好,这个参数在现实社会网络中怎么体 现的呢?
“实验”
• S. Milgram(1967)
– 设计
• •
•
•
– 规则
选择一个随机起点,观察需要经过多少个中间人, 能够到达目标点
资料来源:Milgram 1967
参与者只能将信件转发给能直呼其名的熟人,并请他继续转发;如果一个参与者 不认识目标收信人,则他不能直接将信寄给他;
参与者需力争让信件能尽早达到目的地
通过局部,理解全局;通过微观,理解宏观
在小世界问题上我们面对的是
在人类社会网络上的 大量实验结果表明, 短视搜索是有效的, 这说明现实社会网络 结构支持这种做法
在WS社会网络模型 上的理论分析表明, 短视搜索效果不好, 这说明该模型没能抓 住现实网络的某个重 要特点
因此,需要一种社会网络模型
• 既反映任意节点对之间短路径的存在性,也支持 在这种信件转发方式下短路径的可实现性
• 也看到了大数据分析在推进这类研究中的作用
近乎完美的验证!(PNAS, 2005) 真实社会网络的测量参数与模型最优参数相当吻合!
小结
• 前面连着的三节,讨论了人们围绕小世界现象所展 开的一系列研究的思路 • 看到了“实验理论完善实验”研究范式的体现
– (小世界)现象抽象模型(解释现象)完善模型( 更好地解释)数据验证(得到对现实更深入的认识)
2
3 4
E
D C B
5
A 9
7 8
6
• 左图,距离(差别)由环上的 相对位置定义,例如,节点 0 和A的距离为6 • 试给出从 0 开始,以 9 为目标的 一条短视搜索路径,它是 0 和 9 之间在图中的最短路径吗?
一种一般的认识论方法
• 经常,在事物的宏观格局中存在某种性质,但若 缺乏宏观视野,仅凭基于微观视野的追求,不一 定能发现那种性质。 • 但如果事物的结构存在某种特征,使我们能够证 明,基于微观视野的追求,就能揭示宏观性质, 则是十分美妙的事情。
u
存在社会关系的概率与 空间距离的关系的示意
3/4, 3/10, 4/12, 3/14
利用在线社会网络进行验证
• 真实大规模在线社会网络是否体现了这个(W-S-K )网络模型的优化性质? 两人成为朋友的概率与其空间距离的平方成反比
• 如果是,则说明随机形成的社会网络可能具有某种本 质的参数! • 但,在线社会网络的节点间如何谈空间距离?
Watts-Strogatz模型
模型中节点间有两 个距离的概念:网 格距离和网络距离
Watts-Strogatz模型(Nature,1998)
• 体现了同质连接和弱关系连接的概念,于是可以看 成是现实社会网络的一个合理近似
• 可以证明:在这样的网络中,任意两节点之间存在 短路径的概率很高 • 也可以证明,Watts-Strogatz模型不能很好地体现 第二个要求
– q:控制远程连接的概率随距离递减的强度
w
v
1 µ q d v, w
u
不同q值对随机连接长度的影响
q值较小,随机边倾向于较远 q值较大,随机边倾向于较近
1 pµ q d
• Watts-Strogatz模型对应于q=0
该模型的最佳工作参数(q)
• 理论结果:当q=2 时,分散搜索达到最 佳效果 • 仿真实验:由几亿个 节点组成的网络中, 考察不同的q值在分 散搜索中的效果
• 参考:
– http://blog.sina.com.cn/pkuncm – http://blog.sina.com.cn/bhnetworks
小世界实验及其惊奇
斯坦利·米尔格拉姆
• 斯坦利·米尔格拉姆(Stanley Milgram,
1933年8月15日-1984年12月20日),美国 社会心理学家,于1960年在耶鲁大学工作时进 行了著名的米尔格拉姆实验,测试人们对权威 的服从性。未能在耶鲁大学获得终身教职的他 于1963年转往哈佛大学工作,进行小世界实验, 因而启发了六度分隔理论。未能在哈佛大学获 得终身教职的他于1967年接受了纽约市立大学 的终身教授席位。终年51岁,死于心脏病。
给内布拉斯加州奥马哈市160个随机的人寄送包裹,请他们转交到马萨诸塞州剑桥市某地点的股票经纪人
“实验”
• S. Milgram(1967)
– 结果
•
平均中间人数:5
资料来源:Milgram 1967
“实验”带来的惊奇
小世界现象
• 小世界问题
– 在Milgram的研究之前,人们感觉到世界很小,却没有证据
LiveJournal(LJ),1999年建立的社交网站
来自LiveJournal的实验数据
• 50万用户,含邮政编码信息(地理信息)
• 但他们是不均匀分布 的,不符合模型的假 设,需要做一些“适 配性”工作
LiveJournal中用户的地理位置分布
对社会网络的建立而言,地理距离范围内的人数比距离 具有更实质性的意义
• 弱联系
– 偶然的原因,认识的“远程”朋友 – 对其所在的圈子并不一定熟悉
一种什么样的形式化网络,既体现这两种力量的作用,也 便于我们分析其中是否有小世界现象?
每 两 点 • 定义一种图(网络),体现上述因素 之 – 有许多“三角形”和少数随机的“远程边” 间 有 一 个 “ 网 格 距 离” 想象大量节点排布成均匀网格状 连接近邻:确定性,连接远程:随机性
• 相对于我们已经熟悉的“广度优先搜索”(无目标 ),这是一种有目标的基于局部信息的搜索,具有 如下特点
– 每个节点有一个特征,任何两个节点之间的特征可以谈差 别(距离)(不同于图论中定义的距离!) – 每个节点都知道目标节点的特征,也知道自己和自己邻居 节点的特征 – 搜索过程可看成是信息传递的过程,节点将信息传给离目 标节点距离较近(差别较小)的邻居节点
• 不少重复研究,包括Milgram(1970)自己 • 拓展
• •
60,000个电子邮件用户 通过给熟人转发电子邮件的方式,将邮件送达13个国家的18位收件人 通过认识的人,不一定有多熟悉 中间路径:5-7步
– 运用书信所做的研究具有重复性,电子邮件呢? – Dodds, Muhamad, and Watts(2003) – 发现
• 问题
– 为什么社会网络具有这样的性质?它们源于社会网络的 哪些基本原理?
• 可以证明,完全随机的网络没有这样的性质
– 换句话说,能否依据社会网络的某些基本原理,说明这 种性质的必然性?
形成社会网络的两种基本力量
• 同质性
– 共同朋友,邻里关系,同学,同事,共同兴趣 – 对应社会网络中的大量的“三角形”(圈子)
• •
网页之间的“社交”
•全球互联网超过几百亿的网页,比人口总数多 •问题
(2013)
• Albert, Jeong, Barabási(1999); Barabási
– 没有关系的两个网页之间的直径为18.59次点击
– 网页之间,有怎样的关系,也有“小世界”现象吗?
思考
你是否可以验证六度理论?
关于小世界的 Watts-Strogatz模型
人类社会的小世界现象
• 社会网络中两节点间包含丰富的短路径
– – 任意两节点间存在短路径的概率很高 短视搜索:在达到目标节点过程中,每一步只能看到 邻居节点
• 短视搜索能够有效地找到这些短路径
对于“十分稀疏的”社会网络来说,这并不是必然的
从现象到问题
社会网络中结合地理距离的节点相对排名
•
•
可以看成是节点在地理上均匀分布时区域范围概念的一种推广,“排名”与 “距离”有对应关系 这就使我们能一般性地处理节点在地理上分布不均匀的问题了
这样 这意味着,大量微观社交关系的建立总体上呈现一种最优 • 要验证的是
• 在均匀地理分布情形,一个节点在任一距离上的朋友数量在同等距离 化特征,或者说大量人群的随机社会活动相当于一台计算 节点总数中的占比随距离平方递减(1/d2) 机,完成了一种优化计算(实现了最优参数)--这可以 • 此时等价于要看 看成是社会计算的一个实例,也是体现社会系统中微观与 • 一个节点在任一排名上的朋友(即有连接)数量在同等排名节点总数 宏观关系的实例! 中的占比随排名递减(1/r)
• •
MIT的师生试图证明这一点,不过,没有结果 来自Harvard的Milgram,用信件传递,得到了一个平均数
• 小世界现象
• •
– Milgram的研究证明
世界是小的(六度分隔);社会网络中包含丰富的短路径
“自动寻找”短路径;“有意识的转发”能“自动地”找到这些短路径
小世界现象的普遍性
后续研究
窦志成
2015年10月
• 基于课程所学内容,撰写一篇论文或者报告,用所学到的模型、概念或者理论 来阐述生活中、社会上、学习中或者科研中的现象,深入分析或者解决一个实 际问题 • 字数要求:不少于2000字 • 鼓励使用实际数据并进行实验分析 • 提交截止时间:12月3日 • 提交方式:
– 发邮件到: ruc_ncm@163.com,标题:课程报告1_学号_姓名 – 同时打印后交给授课教师