蜈蚣博弈
博弈论百度百科
博弈论
约翰·冯·诺依曼
博弈论的概念
博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展
博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人
们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n 人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。
蜈蚣博弈悖论理性人的认知分析
《长江丛刊·理论研究》2017.06
蜈蚣博弈悖论理性人的认知分析
董顺珍
【摘 要】蜈蚣博弈的逆推归纳法预测和现实不相符合,主要原因是局中人并不是完全理性人,博弈的收益信息以及局中人的主观信念或主观的认知状态,会影响局中人做出决策,造成实际博弈结果与理论预测结果大相径庭。引入新的参数,将主观信念与感受计入收益,是一种对蜈蚣博弈悖论的有效解释。
【关键词】博弈论 蜈蚣博弈悖论 认知分析
一、蜈蚣博弈悖论
蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。蜈蚣博弈具体如下:两个博弈方A、B轮流进行策略选择,可供选择的策略有“合作”和“不合作”两种。规则是:A、B两次决策为一组,第一次若A决策结束,A、B都得n,第二次若B决策结束,A得n-1而B得n+2;下一轮则从A、B 都得n+1开始。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为一有限次,比如198次。假定这个博弈的各自的支付给定如下图:
图中的数组第一个数是博弈方A得益,第二个是B得益。当A决策时,他考虑博弈的最后一步(第198步):B在“合作”和“不合作”之间做出选择时,因“合作”收益100,而“不合作”收益101,根据博弈逻辑的基本假设——理性人假设,B会选择“不合作”。但是,要经过第197步才到第198步。在197步,A考虑到B在第198步时会选择“不合作”——此时收益98,小于B合作时的100——那么在第197步时,他的最优策略是“不合作”——因为“不合作”的收益99大于“合作”的收益98;……如此推论结论是:在第一步A将选择“不合作”,此时各自的收益为1!这就是逆推归纳法悖论,即“蜈蚣博弈悖论”。
博弈论
博弈论
是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般
化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。
蜈蚣博弈
17
五、瞬间的选择决定人生
• 谁都在想自己的人生博弈中获得成功,那 么你就要为这个目标而努力。每天花时间 为自己修建成功的管道,享受人生博弈的 终点,是每个人可以做到而且应该做到的 事情。如果说出生的背景不公平的话,至 少时间对每个人来说都是公平的,你都可 以通过自己的努力争取胜利。当然,你除 了花时间在某件事上以外,还需要动点脑 筋,把精力用到关键点上。
8
三、海盗分金博弈的启示
• 5个海盗分100枚金币 • 抽签确定每个人的序号 • 1号先提出分配方案,超过半数同意即结束 博弈。否则,1号被丢入大海。 • 2号提出分配方案,超过半数同意即结束博 弈。否则,2号被丢入大海。 • 以此类推,直到其中一个海盗的分配方案 被同意,或者只剩5号一个海盗,获得全部 金币。
11
四、条条大路通罗马
• 达到成功路有很多,完成任务也有很多方 法。如果发现正在走的路、正在使用的方 法不适合自己,就要敢于放弃,善于寻找, 最后你总会找到最适合自己的方法。
12
四、条条大路通罗马
• 换个想法,便可能换来一切。在你试图改 变自己想法的同时,你的视角也开始变化; 移向自己从不注意的世界。你真的会有新 的发现,你的想法有了不同,一切也就随 之有了不同。 • 举例:大英博物馆的搬迁。 • 举例:杨振宁的选择。 • 举例:德国画家艾戈尔的成功。
13
四、条条大路通罗马
蜈蚣博弈悖论-概述说明以及解释
蜈蚣博弈悖论-概述说明以及解释
1.引言
1.1 概述
蜈蚣博弈悖论是一个有趣的概念,在博弈论和经济学领域引起了广泛的关注。它揭示了在一些情况下,个体的理性选择可能会导致整体结果的恶化,从而违背了我们对于理性行为的常识理解。蜈蚣博弈悖论的概念最早由约翰·内许·纳什提出,他是一位著名的博弈论学者,也是电影《美丽心灵》中的主角。
在蜈蚣博弈中,两个博弈者面对着一个简单的选择:继续合作还是背叛对方。合作会带来一定的收益,但背叛会获得更大的收益。然而,当双方都选择背叛时,他们获得的收益反而会比合作时更小,因为他们会陷入一个恶性循环,导致双方都无法取得最优结果。
这种现象的出现源于博弈过程中的信息不对称和不完全信息。当一方选择背叛时,对方无法得知其真实意图,因此会做出相同的回应。但如果双方都能够互相合作,他们将能够达到更优的结果。然而,由于彼此之间的不信任,他们陷入了一个无法打破的困境。
蜈蚣博弈悖论的研究对我们理解社会行为和决策过程有着深远的意义。它提醒我们,有时候人们的理性选择并不一定能够带来最好的结果,而可
能导致整体的恶化。在现实生活中,类似的悖论现象也存在于合作与竞争、公共利益与私人利益之间的权衡中。了解蜈蚣博弈悖论可以帮助我们更好地理解人类行为,并寻找解决方案来避免潜在的困境。
接下来的文章将进一步探讨蜈蚣博弈悖论的影响因素、应用领域以及可能的解决方法。我们将深入分析其中的数学模型和实证研究,以期对这一现象有一个更全面的认识。通过增加对于合作与竞争的了解,我们可以在个人和社会层面上做出更明智的决策,从而实现真正的共赢局面。
用“难得糊涂”来化解“蜈蚣博弈”的困境
基 本 特 征 就 是 : ‘ 从 事 经 济 活 动 的 人 每 个 活 动 的 人 所 采 取 的 经 济 行 为 都 是 力 图 以 自 己 的 最 小 经 济 代 价 去 获 得 自 的 最 人
戈 为 玉 帛 。 到共 创 和 谐 的 目的 。 达
三 、难得糊涂 ” “ 的启迪 “ 难得糊涂 ” 了我们启发, 给 小能只顾
眼 前 利 益 , 略 长期 的 收 益 , 是 在 任 何 忽 不 时 候 、 何 情 况 下 都 要 做 “ 性 人 ” 在 非 任 理 , 原 则 问题 上 不 计 较 ,在 细 小 问题 上 不 纠
方 B的收益。在这个博弈巾的博弈方 A、
B 是 如 何进 行 策 略 选 择 的 ?
2 难得糊涂 ” . “
悲伤 的。这就是‘ ‘ 蜈蚣博弈 ” 的困境。 2 蜈蚣博弈 ” 困境产生的原因
在 经 济 学 里 , 合 乎 理 性 的 人 ” 假 设 “ 的 通 常 简称 为 “ 性 人 ” 理 。西 方 经 济 学 家 指 出 , 谓 的“ 性 人 ” 所 理 的假 设 是 对 在 经 济 社
选 择 “ 合 作 ”博 弈 结 束 。 时 双 方 各 自 不 , 此 的收 益 均 为 1 个 结 论确 实 是非 常令 人 1这
第八讲 蜈蚣博弈
海盗分金
• 有5个海盗抢得100枚金币,在如何分赃问题上争吵不休。 于是他们决定: • (1)抽签决定各人的号码【1,2,3.4.5】。 • (2)由1号提出分配方案,然后5人表决,如果方案超过 半数同意就被通过.否则他将被扔进大海喂鲨鱼。 • (3)l号死后,由2号提方案,4人表决.当且仅当超过 半数同意时方案通过,否则2号同样被扔进大海。 • (4)依次类推,直到找到一个每个人都接受的方案。如 果只剩下5号,他当然接受一人独吞的结果。 • 假定海盗都是理性的,判决都能执行,那么,如果你 是第一个强盗,你该如何提出分配方案才能使自己的收益 最大化?
人生的倒后推理
• 李恕权 • 李恕权是一为知名艺人,在台湾及美国发行过很多张畅销 排行榜音乐专辑,黄子佼就是因为模仿他的蚱蜢舞步而走 红。 当时李恕权是葛来美奖史上唯一被提名的华裔流行歌 手,也是唯一打入Billboard杂志排行榜的华裔歌手。并 Billboard 曾荣获 「全美十大杰出青年」之殊荣,1992年甚至荣登 全美之「世界名人录」。 • 李恕权的第一首招牌歌是《回》,这使他一 • 夜成名。他的代表作还有《麦芽糖》、 • 《风中的枫》、《抹去你的口红》、《赤子》 • 《黑色寂寞》、《放假的日子》、 • 《一点暗示》等
人生博弈的目的和法则
• 决定命运是选择,而非机会。 • 人生博弈的目的是在最短时间内更好地实现想要实现的目 标(你必须把目前年度的4~10个目标写出来,找出一个 核心目标,并依次排列重要性,然后依照自己的目标设定 一些详细的计划,然后要做的唯一一件事情,就是依照计 划进行)。 • 人生博弈的法则:什么样的选择决定什么样的生活,你今 天的生活是由三年前所做出的选择决定的;而今天的抉择, 却将不仅决定你三年后的,更会影响你今后更长时间,甚 至最终离开人世时的样子。
博弈论故事集
博弈论
博弈论--这是一个热得烫手的概念。它不仅仅存在于数学的运筹学中,也正在经济学中占据越来越重要的地位(近几年诺贝尔经济学奖就频频授予博弈论研究者),但如果你认为博弈论的应用领域仅限于此的话,那你就大错了。实际上,博弈论甚至在我们的工作和生活中无处不在!在工作中,你在和上司博弈,也在和下属博弈,你也同样会跟其他相关部门人员博弈;而要开展业务,你更是在和你的客户以及竞争对手博弈。在生活中,博弈仍然无处不在。博弈论代表着一种全新的分析方法和全新的思想。
诺贝尔经济学奖获得者包罗·萨缪尔逊如是说:
要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。
也可以这样说,要相赢得生意,不可不学博弈论;要想赢得生活,同样不可不学博弈论。
下面是关于博弈的一些小故事
一、囚徒困境
两个夜贼,鲍伯(Bob)和艾尔(Al),在行窃现场附近被抓获并被警方隔离拷问。每个夜贼都必须选择是否坦白和揭发对方。如果两个贼都不坦白,他们都将被判刑一年。如果每个贼都坦白并揭发对方,他们都将在监狱中度过10年。但是,如果一个贼坦白并揭发对方,而另一个贼不坦白,那么与警方合作的贼将被释放而另一个贼将在监狱中度过20年。
在这个例子中的战略是:坦白与不坦白。赢利(payoff)(实际上是处罚)是判刑。我们可以用“赢利表(payoff table)”简洁地表达上述信息,这类赢利表已经成为博弈论中很好的标准表达式。以下是囚徒困境博弈的赢利表。
表2-1
艾尔
坦白不坦白
鲍伯坦白10,100,20
不坦白20,01,1
这个表的读法是这样的:每个囚犯从两个战略中选择一个。即,艾尔选择一列,鲍伯选择一行。每个单元格的两个数字告诉两个囚犯相应的战略被选择后的结果。逗号左边的数字表示选择行的人(鲍伯)的赢利,逗号右边的数字表示选择列的人(艾尔)的赢利。因此(先阅读第一列),如果他们都选择坦白,每人将判刑10年,但是如果艾尔坦白而鲍伯不坦白,鲍伯被判20年而艾尔将被释放。
博弈论经典案例
重复博弈
囚徒困境,砸了传统经济学的场子。因为个人的自利行为,并不一定导致集体利益的最大化,“看不见的手”拉不住,人类向堕落之城下滑的趋势,难道这真是一个悲哀?索性并非如此,撇去博弈论的理性假设不说。博弈论者很快发现囚徒困境只在单次博弈情形下明显,一旦博弈的开始陷入重复,合作将到来。因为,未来的收益将左右目前的决策。
以牙还牙
重复的博弈理论上导致了合作的产生,但是谁也不能保证合作的继续,因为之前已经说过,合作的代价是建立在损害个人利益基础之上的。如果个人放弃未来收益或当前背叛收益大于未来收益,背叛的风险仍然存在。那么在重复博弈中怎样的策略才是最优。若干睿智而复杂在经过计算机中PK 之后,极其原始的“以牙换牙”策略脱颖而出,固然这个策略简单至极,其威力却无穷,以至于人们在短暂的欣喜之后,发现这把太阿指之剑倒持的可怕,一旦重复链条中出现一次(也许不经意的)背叛,那据此原则行事的博弈将永无止境的背叛下去,个人利益极度膨胀的同时,集体利益无限衰微。幸好,这个世界不是模型,也不是如此简单。很多时候,我们不必以牙还牙,第三方的规范:道德与法律就是我们的假牙,他们更加有利、有理、有节。
人质困境
一场憋屈的博弈。抢打出头鸟,人质联合固然可以制服歹徒,但是谁愿出头。这一点给了无数处于劫持者地位的一方以机会,类似于秦的远交近攻、各个击破的策略,将最终全盘赢下。人质可有反制的策略,当然有,不过艰难至极。人质可以选择沉默,这样他有一定时间苟延残喘;或者联合劫持者对付人质,结局还是取决于劫持者,万一他过河拆桥怎么办;同时反抗,集体将获得左右策略,但是这需要壮士断腕的勇气,部分人可能因此受伤。这里是实力与勇气的较量,而且实力暂居上风。
蜈蚣博弈PPT课件
五、瞬间的选择决定人生
• 谁都在想自己的人生博弈中获得成功,那 么你就要为这个目标而努力。每天花时间 为自己修建成功的管道,享受人生博弈的 终点,是每个人可以做到而且应该做到的 事情。如果说出生的背景不公平的话,至 少时间对每个人来说都是公平的,你都可 以通过自己的努力争取胜利。当然,你除 了花时间在某件事上以外,还需要动点脑 筋,把精力用到关键点上。
. 18
五、瞬间的选择决定人生
• 一个具有哲理的小故事。 • 想一想,是不是也要等到晚年才追悔?我
们最在意的是什么?希望将来的自己和现 状有些什么不同?是不是可以做些什么不 让这个遗憾发生呢?
. 8
三、海盗分金博弈的启示
• 5个海盗分100枚金币 • 抽签确定每个人的序号 • 1号先提出分配方案,超过半数同意即结束
博弈。否则,1号被丢入大海。 • 2号提出分配方案,超过半数同意即结束博
弈。否则,2号被丢入大海。 • 以此类推,直到其中一个海盗的分配方案
被同意,或者只剩5号一个海盗,获得全部 金币。
• 敌人的敌人就是朋友。
. 11
四、条条大路通罗马
• 达到成功路有很多,完成任务也有很多方 法。如果发现正在走的路、正在使用的方 法不适合自己,就要敢于放弃,善于寻找, 最后你总会找到最适合自己的方法。
. 12
四、条条大路通罗马
• 换个想法,便可能换来一切。在你试图改 变自己想法的同时,你的视角也开始变化; 移向自己从不注意的世界。你真的会有新 的发现,你的想法有了不同,一切也就随 之有了不同。
蜈蚣博弈法
蜈蚣博弈法
作者:白诗诗
来源:《领导文萃》2016年第11期
少有人知,海盗是世界上最民主的团体。平时,他们的一切事务均由投票解决。船长的唯一特权只是拥有一套自己的餐具。海盗船上的唯一惩罚,就是把人丢到海里去喂鱼。现在我们知道,某一艘船上有若干个海盗,正准备瓜分抢来的100枚金币,这样的问题他们当然选择投票解决。
投票的规则如下:1.抽签确定各人的分配顺序号码(1、2、3、4、5);2.由抽到1号签的海盗提出分配方案,然后5人进行表决,如果方案得到超过半数的人同意,就按照他的方案进行分配,否则1号就要被扔进大海去喂鲨鱼;如果1号被扔进大海,则由2号提出分配方案,然后由剩余的人进行表决,同理当超过半数的人同意时,才会按照他的提案进行分配,否则他也将被扔入大海。
我们先要对海盗们做一些假设:
第一,每个海盗的凶残性都不同,而且所有海盗都知道其他几人的凶残性。第二,每个海盗当然都不愿意自己被丢到海里喂鱼。第三,每个海盗都希望自己能得到尽可能多的金币。第四,每个海盗都是功利主义者,他们相信二鸟在林,不如一鸟在手。第五,每个海盗都很喜欢其他海盗被丢到海里喂鱼。
如果海盗和他们的分配原则都如我们上面假设的那样,那么我们运用倒推法,得出海盗会做出如下的理性分析:
首先从5号海盗开始。5号海盗是最安全的,没有被扔下大海的风险,只要他保证始终投否定票。
接下来看4号,他的生存机会完全取决于前面是否还有人存活着,因为如果1号、2号和3号海盗全都喂了鲨鱼,在只剩4号与5号的情况下,不管4号提出怎样的分配方案,5号一定都会投反对票来让4号喂鲨鱼,以独吞全部金币。因此,他绝不能把存活的希望寄托在5号身上,而只能无条件地支持3号。
协调博弈的博弈模型
协调博弈(Coordination Game)是一种博弈模型,其核心在于参与者需要选择一种策略,以便与另一方的策略相协调。在协调博弈中,参与者通常面临两个或更多的可选策略,每个策略都有不同的收益。这种博弈模型通常用于研究合作行为和信息交流。
以下是协调博弈的几个例子:
猎鹿博弈(又称安全博弈、协调博弈):在一个村庄中,有两个猎人分别选择猎鹿和兔子作为猎物。如果一个猎人选择猎鹿,他需要另一人也选择猎鹿,这样他们才能成功狩猎。这是因为一个猎人单独外出捕猎只能捕到4只兔子,但如果两个猎人同时出动且合作就能捕到1只鹿。从填饱肚子的角度看,4只兔子可以作为4天的食物,而1只鹿则足以让猎人在10天内都不用外出捕猎。
蜈蚣博弈:这个博弈模型是一个动态的博弈过程,其名称来源于蜈蚣有多个腿。在这个博弈中,参与者需要在一系列的选择中做出决策,每个决策都会影响后续的步骤。如果一开始就选择背叛,最终收益会远远低于一开始就选择合作。
酒吧博弈:这个博弈模型研究的是在酒吧中的人数动态。假设每个想要去酒吧的人都是理性的,那么酒吧每天接待的人数几乎不会有过大的浮动。
蜈蚣博弈的现实例子
蜈蚣博弈的现实例子
蜈蚣博弈是一种博弈论中的经典博弈模型,用来描述两个参与者在决策时的利益冲突与合作。在这个模型中,两个参与者可以选择合作或背叛对方,从而产生不同的结果。下面列举了一些现实生活中的例子,来说明蜈蚣博弈的应用和影响。
1. 战争与和平:在国际关系中,不同国家之间的合作与背叛决定着和平与战争的结果。如果每个国家都选择合作,那么可以建立稳定的国际秩序,实现共同繁荣。然而,如果有一个国家选择背叛,可能会导致冲突和战争的爆发。
2. 竞争与合作:在商业领域,企业之间的竞争与合作也体现了蜈蚣博弈的特点。如果企业选择合作,可以通过合并、联盟等方式实现资源共享和互利共赢。然而,如果企业选择背叛,可能会采取不正当手段竞争,导致市场失衡和消费者受损。
3. 婚姻关系:夫妻之间的合作与背叛也体现了蜈蚣博弈的模式。如果夫妻双方都选择合作、信任和支持对方,他们的婚姻关系可能会更加稳定和幸福。然而,如果有一方选择背叛,比如出轨或隐瞒重要信息,可能会导致婚姻破裂。
4. 政府与市民:政府与市民之间的关系也可以用蜈蚣博弈来描述。如果政府能够提供公正、高效的公共服务,并保护市民的权益,市民则会愿意遵守法律、纳税并支持政府的决策。然而,如果政府没
有履行其职责,或者市民不信任政府,可能会导致社会秩序紊乱和公共利益受损。
5. 团队合作:在团队合作中,每个成员都可以选择合作或背叛。如果团队成员都能够相互信任、合作和支持,团队的绩效和效率会得到提升。然而,如果有个别成员选择背叛,比如不履行承诺或不尽职尽责,可能会破坏团队的凝聚力和合作精神。
群体与市场中的蜈蚣博弈
群体与市场中的蜈蚣博弈
1
[摘要] 蜈蚣博弈是博弈论中一个存在悖论的博弈模型。但是这种博弈在生活中却很常见,例如恋爱关系的维持以及投资期限的确定等等问题。通过对蜈蚣博弈的研究,能对生活中存在的部分群体现象和市场规律有一个较为合理的解释。
[关键字] 蜈蚣博弈恋爱经济群体市场
一、引言
我是在一个很偶然的情况下,误打误撞地看到了蜈蚣博弈的相关内容,而后继续搜了几个现实中的例子,发现原来没有解释的一些不合理的现象,还存在着理论的模型,本文的主要目的,一是介绍蜈蚣博弈和蜈蚣博弈悖论的基本概念,二是分别在群体和市场两个方面举了一个例子,来体现生活中常见的蜈蚣博弈的现象。
通过理解介绍的两个例子,加深了我对这种类型的认识和了解,也让我意识到,生活中的很多现象和规律,是能够进行抽象,在理论上找到相关的数学模型的,并且进而能够从中得到一些深层次的结论。
二、概述
根据百科的定义,蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它由两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和
“背叛”(“不合作”)两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如100次。
假定这个博弈各自的策略分别给定如下:
现在的问题是:A、B是如何进行策略选择的?
这个博弈因形状像一只蜈蚣,从而被命名成“蜈蚣博弈”。
蜈蚣博弈的一个奇特之处是:当A在博弈的最后一步即第100步进行决策时,B可在“合作”和“背叛”之间作出选择,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蜈蚣博弈
蜈蚣博弈(Centipede game)
什么是蜈蚣博弈
蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后是B,接着是A,如此交替进行。A、B 之间的博弈次数为有限次,比如100次。假定这个博弈各自的支付给定如下:1
合作合作合作合作...合作合作
A B A B …… A B (100,100)
合作合作合作合作...合作背叛
A B A B …… A B (98,101)
现在的问题是:A、B是如何进行策略选择的?
这个博弈因形状像一只蜈蚣,而被命名成“蜈蚣博弈”。
这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛”——此时A的收益是98,小于B合作时的100,那么在第99步时,他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100-99。1
蜈蚣博弈的悖论1
根据倒推法,结果是令人悲伤的。从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看,一开始A应取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?
这就是蜈蚣博弈的悖论。
什么是悖论?悖论(paradox)来源于希腊语,para意即“超越”,doxos的意思是“相信”。Paradox的意思是:本来可以相信的东西不能相信,而有的东西看起来不可信但是反而是正确的。悖论指由肯定它真,就推出它假,由肯定它假,就推出它真的一类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟”的芝诺悖论,“一个克里特人说‘所有克里特人都说谎’”的说谎者悖论,“一个理发师说:‘我给所有不给自己理发的人理发’”的理发师悖论或罗素悖论,等等。这些悖论在历史上对于逻辑和数学的发展起了巨大的作用。
对于蜈蚣悖论,许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验,目前通过实验验证集体的交互行为已成时尚,正如博弈论专家英国的宾莫(Ken Binmore)所言,诺贝尔奖也无疑在考虑这方面的先驱者,实验发现,不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略,从而走向合作。这种做法违反倒推法,但实际上双方这样做,要好于一开始A就采取不合作的策略。
倒推法似乎是不正确的。然而,我们会发现,即使双方开始能走向合作,即双方均采取合作策略,这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑,肯定在某一步采取不合作策略。倒推法肯定在某一步要起作用。只要倒推法在起作用,合作便不能进行下去。
这个悖论在现实中的对应情形是,参与者不会在开始时确定他的策略为“不合作”,但他难以确定在何处采取“不合作”策略。