复杂系统中演化博弈研究背景介绍
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
复杂系统演化博弈复杂系统复杂系统理论复杂系统与复杂网络复杂系统建模与仿真复杂系统综述复杂系统建模演化博弈演化博弈论国际安全研究的演化
复杂系统中演化博弈研究 背景介绍
姜罗罗 中国科学技术大学
提纲 演化博弈理论简介 • 经典博弈理论 • 演化博弈理论
1、博弈理论简介
• 博弈论(Game Theory):研究具有斗争或竞争性质现象的 理论和方法。 三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集 分类:合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈; • 研究博弈论的意义:理解人类的经济行为;理解社会和生 态物种系统中的合作行为以及自自组织斑图。
如何分配才是合理的呢?
按可以票力分配,a50万、b40万、c10万;c向a提出:a70万、b0、c30 万b向a提出:a80万、b20万、c0…… 权力指数:每个决策者在决策时的权力体现在他在形成的获胜联盟中的 “关键加入者”的个数,这个“关键加入者”的个数就被称为权利指数。 夏普里值:在各种可能的联盟次序下,参与者对联盟的边际贡献之和除 以各种可能的联盟组合。
生态博弈
非合作博弈强调个体理性
(individual rationality),就是从个 体的角度考虑策略选择,使得个体 收益最大。所以非合作博弈研究的 是参与者在利益相互影响的情况下 如何选策略使自己的收益最大,即 策略选择问题。
约翰· 纳什 (J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
争当少数者博弈
智猪博弈
小猪和大猪住在猪圈的一边(食槽在这里),开启食物的 开关在另一头,谁去踩,谁丧失先机。如何小猪去踩开关, 等小猪回来的时候大猪已经把大部分食物吃完。如果大猪 去踩开关,等大猪回来的时候小猪已经把一半的食物吃完。 对于小猪来说,最佳策略是等待大猪去踩开关,然后“搭 便车”获得小部分食物。然而,当大猪不去踩开关的时候, 小猪也要冒风险去踩开关。例如腾讯毫无顾忌地跟风,做 QQ旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技 术研发的前期搞定了,大猪们只需要悄悄跟随,适当的时 候踢开挡路的,就可以了。
组合。此时,每一个理性的参与者都不会有单独改变策略,因为 当其他人不改变策略时如果他改变策略他的收益将会降低 。
例如:在两人合作博弈中,当参与者A采取其最优策略a*,参与者B也采取其 最优策略b*,如果B仍采取b*,而A却采取另一种策略a,那么A的收益不会超 过他采取原来的策略a*的收益。这一结果对B亦是如此。
次序 abc acb bac bca cab cba 关键加入者 a c a c a b
由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6 所以a,b,c应分别获得100万的2/3,1/3,1/3。
最后通牒博弈
酒吧博弈
在酒吧中消费,人太多则拥挤,人少则能够享受很好 的服务。第一次到酒吧的人多,那么大多人人认为酒吧人 太多,太挤。第二次决定的时候,参考前次而不去酒吧。 少数去的人发现酒吧的人第二天很少,感觉很爽,第三次 将继续回来,并重新带回许多人……循环就此开始。 如何决定下一次是否去酒吧消费?
(2)演化博弈论
进化稳定策略(Evolutionary stable strategy) 理性、重复博弈; 策略学习动力学。
针锋相对(tit for t)、宽容(forgiveness)、清晰(clarity)
“囚徒困境”博 弈
纳什(J. Nash)的博士论文 《非合作博弈》(1950)
应用举例:
田忌赛马:
贵族:上等马、中等马、下等马 田忌:下等马、上等马、中等马
司马迁 《史记》
财富分配:
a、b、c三人投票决定如何分配100万,他们分别拥有50%、40%、10% 的权力,规则规定,当超过50%的票认可了某种方案时才能通过。
M. A. Nowak and R. M. May, Evolutionary games and spatial chaos, Nature, 359, 826 (1992).
M. Nowak and R. May, Evolutionary games and spatial chaos, Nature (1992)
关税战:
任何一个国家在国际贸易中都面临着保持贸易自由与 实行贸易保护主义的两难选择。X国和Y国进行贸易就是 博弈。这里存在一Nash均衡,就是双方都实行贸易保护 主义,提高关税。在这个均衡中贸易双方采取不合作的 策略,结果使双方因贸易战受到损害。X国试图对Y国进 行进口贸易限制,比如提高关税,则Y国必然会进行反 击,也提高关税。结果贸易双方的利益都受到损害,也 就是损人不利己。反之,如果贸易双方都采取合作的策 略,都减少关税限制,那么双方都可以从贸易自由中获 得了最大利益。
(1)经典博弈论
合作博弈强调群体理性
(group rationality),就是从群体 的角度考虑策略的选择,使得整 体收益最大。所以合作博弈研究 的是参与者在达成合作时如何分 配合作得到的收益,即收益分配 问题。
约翰· 冯· 诺依曼 (J. von Neumann )
《Theory of games and economic behavior》 (1944)
(a)R = 1,R= 1.62,S = −0.07,P= 0 (b)R = 1,R= 1.62,S = 0.38, P= 0
C. Hauert and M. Doebeli, Spatial structure often inhibits the evolution of cooperation in the snowdrift game, Nature, 428, 643 (2004).
复杂系统中演化博弈研究 背景介绍
姜罗罗 中国科学技术大学
提纲 演化博弈理论简介 • 经典博弈理论 • 演化博弈理论
1、博弈理论简介
• 博弈论(Game Theory):研究具有斗争或竞争性质现象的 理论和方法。 三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集 分类:合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈; • 研究博弈论的意义:理解人类的经济行为;理解社会和生 态物种系统中的合作行为以及自自组织斑图。
如何分配才是合理的呢?
按可以票力分配,a50万、b40万、c10万;c向a提出:a70万、b0、c30 万b向a提出:a80万、b20万、c0…… 权力指数:每个决策者在决策时的权力体现在他在形成的获胜联盟中的 “关键加入者”的个数,这个“关键加入者”的个数就被称为权利指数。 夏普里值:在各种可能的联盟次序下,参与者对联盟的边际贡献之和除 以各种可能的联盟组合。
生态博弈
非合作博弈强调个体理性
(individual rationality),就是从个 体的角度考虑策略选择,使得个体 收益最大。所以非合作博弈研究的 是参与者在利益相互影响的情况下 如何选策略使自己的收益最大,即 策略选择问题。
约翰· 纳什 (J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
争当少数者博弈
智猪博弈
小猪和大猪住在猪圈的一边(食槽在这里),开启食物的 开关在另一头,谁去踩,谁丧失先机。如何小猪去踩开关, 等小猪回来的时候大猪已经把大部分食物吃完。如果大猪 去踩开关,等大猪回来的时候小猪已经把一半的食物吃完。 对于小猪来说,最佳策略是等待大猪去踩开关,然后“搭 便车”获得小部分食物。然而,当大猪不去踩开关的时候, 小猪也要冒风险去踩开关。例如腾讯毫无顾忌地跟风,做 QQ旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技 术研发的前期搞定了,大猪们只需要悄悄跟随,适当的时 候踢开挡路的,就可以了。
组合。此时,每一个理性的参与者都不会有单独改变策略,因为 当其他人不改变策略时如果他改变策略他的收益将会降低 。
例如:在两人合作博弈中,当参与者A采取其最优策略a*,参与者B也采取其 最优策略b*,如果B仍采取b*,而A却采取另一种策略a,那么A的收益不会超 过他采取原来的策略a*的收益。这一结果对B亦是如此。
次序 abc acb bac bca cab cba 关键加入者 a c a c a b
由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6 所以a,b,c应分别获得100万的2/3,1/3,1/3。
最后通牒博弈
酒吧博弈
在酒吧中消费,人太多则拥挤,人少则能够享受很好 的服务。第一次到酒吧的人多,那么大多人人认为酒吧人 太多,太挤。第二次决定的时候,参考前次而不去酒吧。 少数去的人发现酒吧的人第二天很少,感觉很爽,第三次 将继续回来,并重新带回许多人……循环就此开始。 如何决定下一次是否去酒吧消费?
(2)演化博弈论
进化稳定策略(Evolutionary stable strategy) 理性、重复博弈; 策略学习动力学。
针锋相对(tit for t)、宽容(forgiveness)、清晰(clarity)
“囚徒困境”博 弈
纳什(J. Nash)的博士论文 《非合作博弈》(1950)
应用举例:
田忌赛马:
贵族:上等马、中等马、下等马 田忌:下等马、上等马、中等马
司马迁 《史记》
财富分配:
a、b、c三人投票决定如何分配100万,他们分别拥有50%、40%、10% 的权力,规则规定,当超过50%的票认可了某种方案时才能通过。
M. A. Nowak and R. M. May, Evolutionary games and spatial chaos, Nature, 359, 826 (1992).
M. Nowak and R. May, Evolutionary games and spatial chaos, Nature (1992)
关税战:
任何一个国家在国际贸易中都面临着保持贸易自由与 实行贸易保护主义的两难选择。X国和Y国进行贸易就是 博弈。这里存在一Nash均衡,就是双方都实行贸易保护 主义,提高关税。在这个均衡中贸易双方采取不合作的 策略,结果使双方因贸易战受到损害。X国试图对Y国进 行进口贸易限制,比如提高关税,则Y国必然会进行反 击,也提高关税。结果贸易双方的利益都受到损害,也 就是损人不利己。反之,如果贸易双方都采取合作的策 略,都减少关税限制,那么双方都可以从贸易自由中获 得了最大利益。
(1)经典博弈论
合作博弈强调群体理性
(group rationality),就是从群体 的角度考虑策略的选择,使得整 体收益最大。所以合作博弈研究 的是参与者在达成合作时如何分 配合作得到的收益,即收益分配 问题。
约翰· 冯· 诺依曼 (J. von Neumann )
《Theory of games and economic behavior》 (1944)
(a)R = 1,R= 1.62,S = −0.07,P= 0 (b)R = 1,R= 1.62,S = 0.38, P= 0
C. Hauert and M. Doebeli, Spatial structure often inhibits the evolution of cooperation in the snowdrift game, Nature, 428, 643 (2004).