博弈论经典案例“囚徒困境”以及其拓展

合集下载

博弈论典型事例

博弈论典型事例

博弈论典型事例我给你说啊,这博弈论里典型事例可太多了。

就说那个囚徒困境吧。

我就像亲眼见着那俩囚徒似的,一个瘦高个,眼睛滴溜溜转,透着那股子机灵劲儿又夹杂着害怕,另一个矮胖一些,脸上肉嘟嘟的,眉毛都快拧成麻花了,满是焦虑。

他们被关在那黑黢黢的牢房里,灯光昏黄得像要灭了似的,气氛压抑得很。

警察就站在外面,那表情严肃得像石头刻的。

警察说啊:“你们俩都坦白呢,就各判五年;要是一个坦白一个不坦白,坦白的那个立马走人,不坦白的就判十年;要是都不坦白呢,就各判一年。

”我就想啊,这瘦高个心里肯定在算计,他眼睛四处瞅着,那眼神像是在找什么出口。

他就想啊,要是我坦白了,对面那矮胖的不坦白,我可就直接走了,多好的事儿。

那矮胖的呢,他心里也没闲着,咬着嘴唇,手不停地搓着衣角,他也在想,我要是坦白了,不管对面咋样,我都有好处。

然后呢,你猜怎么着?他俩互相瞅了一眼,那眼神里有怀疑有试探。

瘦高个先开了口:“兄弟,你说咱咋办?”矮胖的哼哧了半天说:“我也不知道啊。

”其实心里都打着小九九呢。

最后啊,就像这博弈论里说的,他俩都选择了坦白,各判了五年。

你看,这就是博弈论里典型的情况,每个人都想着自己利益最大化,可结果呢,都没落到好。

这就像生活里很多事儿一样,人们都在互相算计着,有时候还不如坦诚一点呢。

就像那俩囚徒,要是一开始就说好都不坦白,也就各判一年了,多好的结果啊。

这博弈论啊,真就是把人性里那些小心思都给剖析出来了,看着简单,其实这里面的门道可深着呢。

再说说那个智猪博弈。

有个猪圈里啊,一头大猪和一头小猪。

大猪膘肥体壮的,那体型像小山一样,小猪呢,瘦巴巴的,看着有点可怜。

猪圈一头有个踏板,另一头是饲料的出口。

每踩一下踏板啊,就会有10个单位的猪食流出来,但是踩踏板得消耗2个单位的体力。

要是小猪去踩踏板,大猪在食槽边等着,大猪一下子就能吃掉9个单位的猪食,小猪只能吃到1个单位,还得减去踩踏板消耗的2个单位,那就亏了。

要是大猪去踩踏板呢,小猪在食槽边,小猪能吃到4个单位,大猪能吃到6个单位,虽然大猪消耗了体力,但还是有得吃。

博弈论的经典案例

博弈论的经典案例

博弈论的经典案例博弈论是研究冲突和合作情况下的决策科学,它广泛应用于经济学、政治学、生物学等领域。

在博弈论中,经典案例可以帮助我们理解各种策略和结果,下面将介绍几个经典的博弈案例。

1. 囚徒困境(Prisoner's Dilemma):囚徒困境是博弈论中最著名的案例之一。

假设有两个囚犯被逮捕,但检察官没有足够的证据来定罪。

如果两人都坦白认罪,他们将每人被判6个月的徒刑;如果两人都保持沉默,他们将只被判2个月的徒刑;如果一个人坦白认罪而另一个人保持沉默,坦白的人将被判1年刑,沉默的人将被无罪释放。

在这个案例中,每个囚犯都面临着合作(保持沉默)和背叛(坦白认罪)的选择,他们必须考虑对方的动作来做出最佳的选择。

尽管每个囚犯都会选择坦白认罪,这样他们能够获得较短的刑期,但合作(保持沉默)是最好的策略,因为这样两人都只会被判2个月的徒刑。

2. 非零和博弈(Non-zero Sum Game):非零和博弈是指在博弈中,各方的利益不是完全相反的。

一个典型的例子是坐在两个对面的人之间有一块饼的案例。

这两个人都可以选择合作或背叛,如果两人都合作,他们将平分饼的一半;如果一个人背叛而另一个人合作,背叛的人将获得全部饼;如果两人都背叛,他们将不会有任何饼。

在这个案例中,为了最大化自己的利益,每个人都会选择背叛,因为这样他们有机会获得全部饼。

然而,如果他们能够建立信任和合作,他们可以共同获得更多的饼。

3. 报复博弈(Tit for Tat Game):报复博弈是另一个经典的案例,它出现在许多情况下,比如政治、商业等。

这个案例可以被描述为一种策略,其中一个团队以对抗和报复的方式回应对手的行动。

一个经典的例子是在政治竞选中,如果一个候选人发起攻击广告,另一个候选人就会以类似的攻击广告回应。

这种博弈往往会导致恶性循环,双方都会不断升级攻击,最终导致双方的声誉受损。

然而,一个更好的策略是采取合作和积极的行动来推动利益最大化。

囚徒困境案例

囚徒困境案例

囚徒困境案例囚徒困境是博弈论中的一个经典案例,它揭示了在互相合作的情况下,个体之间的利益冲突和合作困境。

这个案例的背后蕴含着深刻的社会学和心理学意义,对于我们理解人类行为和社会关系具有重要的启示作用。

在囚徒困境案例中,两名罪犯被抓获并分开审讯,警察没有足够的证据定罪,只能凭借他们对彼此的供词来判决。

如果两名罪犯都沉默不语,警察只能以轻罪定罪,每人判刑1年;如果其中一人供认,而另一人保持沉默,供认的人将被释放,而另一人将被判10年;如果两人都供认,每人将被判刑8年。

在这种情况下,每个人都面临着一个选择,是合作沉默,还是背叛供认。

从个体的利益出发,无论对方选择什么,供认都是最好的选择。

因为无论对方是沉默还是供认,供认者都能通过合作获得最小的刑期。

但是,如果双方都选择供认,就会导致双方都得到最坏的结果。

这就是囚徒困境的本质,即使合作对每个人来说都是最好的选择,但由于彼此之间缺乏信任,最终导致了双方都选择背叛,从而陷入困境。

囚徒困境案例在现实生活中也有着广泛的应用。

在商业合作中,合作双方往往面临着相互竞争和利益冲突。

在国际关系中,各国之间也存在着类似的困境,例如军备竞赛和贸易争端。

在日常生活中,人们之间的合作也会受到囚徒困境的影响,例如环境保护、资源分配等方面。

如何打破囚徒困境,实现合作共赢呢?学者们提出了一些解决方案。

首先是建立信任,通过长期的合作积累信任,从而减少合作双方的不确定性和风险。

其次是建立有效的合作机制,通过契约、协议等方式规范双方行为,减少信息不对称和道德风险。

再次是采取激励措施,通过奖惩机制激励合作,促使双方选择合作而非背叛。

最后是加强监督,通过第三方监督和公众监督,降低合作双方的违约成本,提高合作的可信度。

囚徒困境案例告诉我们,合作是人类社会生存和发展的基础,但合作中也存在着利益冲突和信任危机。

打破囚徒困境,需要双方共同努力,建立信任、规范合作、激励合作和加强监督,从而实现合作共赢的局面。

博弈论的经典案例五篇

博弈论的经典案例五篇

博弈论的经典案例五篇博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。

本站为大家整理的相关的博弈论的经典案例供大家参考选择。

博弈论的经典案例篇一囚徒困境学习管理学或经济学的人一定都了解一些博弈论方面的知识。

在博弈论中有一个经典案例囚徒困境,非常耐人回味。

“囚徒困境”说的是两个囚犯的故事。

这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。

在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。

这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。

但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。

而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。

当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。

那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。

但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。

这种想法的诱惑力实在太大了。

但他也意识到,他的同伙也不是傻子,也会这样来设想他。

所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。

而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。

所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。

博弈论经典案例

博弈论经典案例

博弈论经典案例1. 囚徒困境:这是一种经典的博弈论案例,两名囚犯被关押在不同的牢房中,警方缺乏确凿的证据将他们定罪,决定让他们进行交涉。

如果两人都认罪,每人将会被判刑5年;如果一个人认罪而另一个人保持沉默,认罪的人将会被判刑1年,而保持沉默的人将被判无期徒刑;如果两人都保持沉默,每人将被判刑3年。

在这种情况下,每个囚犯都面临着是否信任对方合作的决策。

2. 麦氏定理:这是美国经济学家约翰·N·纳什于1950年提出的经典问题。

假设有两家咖啡店A和B,它们的位置一个在城市的北边,另一个在南边。

两家咖啡店需要决定每天早上的开门时间。

如果A咖啡店在北边开门,而B咖啡店在南边也同样开门,北部居民会去A店,南部居民会去B店,两家店的收入会平均分。

但是,如果A店在北边开门,而B店在南边关门,南部居民不得不去北边排队等待,这将导致北边的队伍变长,北部居民也会选择去B店。

麦氏定理指出,当两家店选择不同的开门时间时,总是有一种策略,使得两家店的收入之和最大。

3. 社交圈中的追逐游戏:在一个社交聚会上,一对情侣分手后,男方试图追回女方。

男方完成了一连串的行动,女方必须在每个行动之后做出回应。

游戏的目标是让女方接受男方的求爱。

这个案例涉及到博弈论中的策略选择和不确定性。

4. 价格竞争:在一场市场竞争中,两家公司决定销售产品的价格。

低价通常会吸引更多的消费者,但是公司也需要考虑到自己的成本和利润。

每家公司需要在出售产品的定价上权衡竞争和利润之间的平衡。

这个案例涉及到博弈论中的纳什均衡和即时反应策略。

5. 投标博弈:在一场拍卖中,多个竞争者竞相出价,以获得拍卖品。

每个竞争者必须决定自己的出价,以获得最大的利润。

这个案例涉及到博弈论中的最优出价和风险评估。

囚徒困境拓展实验报告

囚徒困境拓展实验报告

囚徒困境拓展实验报告1. 背景介绍囚徒困境是博弈论中的一个经典问题,讲述了两名罪犯被单独审问,被告诱供出对方的情况。

在此情景下,博弈的最优策略是什么?这个问题引发了学术界广泛的探讨,而囚徒困境拓展实验也是在此背景下展开的。

2. 实验设计为了更好地研究囚徒困境的策略选择,我们设计了一个拓展实验。

实验中参与者以角色扮演的方式,扮演囚徒和警察,通过决策和博弈来模拟真实的囚徒困境。

实验的主要内容如下:2.1 参与者分组我们招募了一百名参与者,将其以随机方式分为囚徒组和警察组。

每组各有五十名参与者。

2.2 游戏规则游戏分为五轮进行。

每个回合的游戏规则如下:- 每个囚徒对每个警察进行一次选择,可以选择合作或背叛。

- 合作表示不揭发对方,获得3分。

- 背叛表示揭发对方,获得1分。

- 如果两个囚徒都选择合作,则每个人获得2分。

- 如果一个囚徒选择背叛,而另一个选择合作,则背叛的囚徒获得5分,合作的囚徒获得0分。

2.3 统计数据在游戏进行的同时,我们记录了每一轮的参与者选择和获得分数情况。

通过统计数据,我们可以分析参与者的策略选择和博弈效果。

3. 实验结果经过五轮的游戏,我们得到了如下实验结果:3.1 囚徒组策略选择分析囚徒组中,参与者的策略选择大致分为两种:- 个体理性:有一部分囚徒参与者在前几轮中选择了背叛,以追求更高的个体收益,但在后续观察到其他囚徒普遍合作后,逐渐倾向于选择合作。

- 合作主义:另一部分囚徒参与者一直坚持选择合作,始终希望通过团队合作获得更高的总体收益。

3.2 警察组策略选择分析警察组中,参与者也有两种策略选择:- 鸽派:一部分警察参与者倾向于选择合作,希望通过与囚徒团结合作,减少犯罪行为,从而获得更好的社会效益。

- 鹰派:另一部分警察参与者更倾向于选择背叛,以对付囚徒的“欺骗”,以自身利益为出发点。

3.3 获得分数统计通过实验记录的数据,我们计算了每个参与者的平均得分。

囚徒组中,个体理性囚徒的平均得分为4.2分,合作主义者的平均得分为2.8分。

囚徒困境的例子

囚徒困境的例子

囚徒困境(prisoner's dilemma)是指两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。

囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。

虽然困境本身只属模型性质,但现实中的价格竞争、环境保护、人际关系等方面,也会频繁出现类似情况。

例子:北大清华的状元之争是一个典型的囚徒困境。

囚徒困境是社会合作面临的最大难题,它深刻揭示了个体理性和集体理性之间的矛盾和冲突:个体按照自身利益最大化的原则采取对自己最有利的占优战略,得到的却不一定是自己最想要的结果,相反可能导致集体的非理性。

就生源竞争而言,对于北大来说,无论清华抢不抢状元,抢状元都是北大的最好选择,即最优战略;对于清华来说也是一样。

用博弈论的专业术语来表述,(抢状元,抢状元)构成了北大清华招生博弈的纳什均衡。

纳什均衡是一个僵局,给定对手不改变行为,自己就没有激励改变行为,因而无法打破或单独偏离均衡。

纳什均衡最深刻的悲剧性在于,北大和清华都意识到抢状元是毫无意义的,但抢状元却是他们必然的选择。

即使两所大学都认同不抢状元是最好的,但这个结果却得不到,因为每所大学都不得不采取对自己最有利的行动——抢状元。

除非引入第三方力量改变博弈结构,否则囚徒困境就不可能被打破。

扩展资料相关应用:封闭交易霍夫施塔特曾提出,像囚徒困境一类的问题,若以简单博弈的形式来说明,人们会较容易理解。

例如他以“封闭袋子交易”的简单博弈来说明此论题:两人面对面互相交换封闭的袋子,共同了解其中一方放钱,另一方放商品。

双方可以诚实的依照承诺,把东西放到袋子里交换;又或者交空袋子给对方,选择背叛。

在这场博弈中,由于背叛可获得巨大利益,必然有多人选择背叛。

这意味着理性的商人不会进行这种交易,因而“封闭袋子交易”将由于逆向选择而失去市场。

简述囚徒困境及其结论

简述囚徒困境及其结论

简述囚徒困境及其结论
囚徒困境是一个经典的博弈论案例,描述了两个囚犯被捕后被关进两个单独的牢房,无法通过通信相互帮助或寻求逃脱机会。

他们必须选择自己的行为,要么合作,要么互相背叛,以最大化自己的收益。

囚徒困境的假设是:两个人的行为都是理性的,不会考虑到道德或法律的因素;两个人的利益是一致的,他们背叛对方会导致自己受到更严厉的惩罚;他们无法找到第三方来帮助或合作。

在囚徒困境中,两个囚犯的最优策略是合作,这意味着他们应该将对方供出,从而各自获得一次逃脱的机会。

然而,如果他们选择合作,那么他们就必须同时供出对方,这将导致他们一起被判刑。

因此,两个囚犯都选择背叛,并各自获得了更高的收益,即逃脱了惩罚。

囚徒困境的结论是,在极端的情况下,两个人的行为取决于他们的理性和利益一致性,而不考虑道德或法律的因素。

在这种情况下,合作或背叛都是最优策略,但无法找到第三方来协助或合作。

囚徒困境的案例表明,在复杂的社会中,人们的行为往往受到理性和利益因素的影响,而不考虑道德和法律的因素。

这也提醒我们在决策时需要考虑多个因素,并做出理性的判断。

囚徒困境博弈论最优策略

囚徒困境博弈论最优策略

囚徒困境博弈论最优策略今天我要给你们讲一个超级有趣的故事,这个故事里藏着一个很厉害的道理呢。

有两个小坏蛋,我们就叫他们小明和小刚吧。

他们一起做了坏事,被警察叔叔抓住了,然后分别关在两个不同的小房间里。

警察叔叔没有足够的证据给他们定很重的罪,就想了个办法。

警察叔叔分别对小明和小刚说:“如果你老实交代,而你的伙伴不交代,那你就可以被放出去,你的伙伴要被关10年哦。

要是你们两个都交代了,那你们每人都要关5年。

要是你们两个都不交代呢,那我们只能关你们1年啦。

”小明在自己的小房间里就开始想了,他想:“如果小刚交代了,我不交代,那我要被关10年,我要是交代了,就只要关5年;要是小刚不交代,我交代了,我就能直接被放出去,我要是也不交代,就只能关1年。

”小刚在他的房间里也这么想呢。

结果呀,他们两个都很害怕对方会先交代,最后都选择了交代。

这样他们每人都被关了5年。

其实呀,如果他们两个能够相信对方,都不交代,那他们每人就只要关1年就好了。

这就是囚徒困境啦。

那什么是最优策略呢?在这个故事里,最优策略其实就是他们两个相互信任,都保持沉默。

就像我们和小伙伴玩游戏的时候,如果大家都只想着自己,可能最后都得不到好结果。

比如说,我们在玩接力比赛的时候。

每个小组有好几个人,如果前面的小伙伴跑慢了一点,后面的小伙伴就想着“哼,他跑慢了,那我也不好好跑了”,那整个小组就输定了。

但如果后面的小伙伴想“没关系,他可能不小心摔倒了,我要加油把失去的时间追回来”,前面的小伙伴也想着“我要尽力跑,不能让后面的小伙伴难做”,那这个小组就很有可能赢。

在生活里还有很多这样的情况呢。

有一次,我和我的同桌一起做小组作业。

我觉得有个部分特别难,我要是随便做做,我自己能轻松点。

可是我想,如果我这样做了,同桌肯定也会不认真做他的部分,那我们的作业肯定会被老师批评。

所以我就很认真地做我的部分,我的同桌看到我这么认真,他也很认真。

最后我们的作业得到了老师的表扬。

博弈论故事及解析

博弈论故事及解析

博弈论故事及解析博弈论,又称为博奕论或博奕学,是研究冲突与合作的数学模型和分析方法。

它的研究对象是决策者在冲突和合作的环境中作出的决策,以及这些决策对其他决策者的影响。

博弈论被广泛应用于经济学、政治学、社会学、生物学等多个领域,它帮助我们理解和解决决策过程中的各种问题。

在博弈论中,存在许多经典的故事,这些故事通过描述具体的决策情境,展示了博弈论的原理和应用。

下面我们来看几个博弈论故事,并对其进行解析。

故事一:囚徒困境故事中有两个犯罪嫌疑人,警察将他们分开审问。

如果两人都坦白,将会分别判刑5年,如果两人都保持沉默,将会分别判刑1年,如果其中一个坦白,另一个保持沉默,坦白的人将会被赦免,而保持沉默的人将会被判10年。

在这个情境中,两个犯人面临一个重要的决策,是坦白还是保持沉默。

博弈论解析:在囚徒困境中,两个犯人面临一个合作与背叛的冲突。

博弈论中的解答是,无论对方采取什么策略,自己都应该选择坦白。

这是因为无论对方选择什么,坦白对自己的利益都是最大化的策略。

故事二:雁行队列一群大雁在迁徙时会形成一个V字形的队列。

这个队列的形状可以让大雁在飞行时节省能量,减少空气阻力。

队列中的每只大雁都可以感知到自己前方的大雁,它们会根据前方大雁的动作做出相应的调整。

如果前方的大雁飞得太累,它会离开队列,由后面的大雁取代。

博弈论解析:在这个故事中,每只大雁都是一个决策者,它们的决策会影响到整个队列的形状和飞行效率。

博弈论告诉我们,每只大雁都应该在队列中保持适当的距离,并根据前方大雁的行为做出相应的调整,以达到整个队列最佳的飞行效果。

故事三:拍卖在拍卖中,卖方希望能够以最高的价格卖出物品,而买方则希望能以最低的价格购买物品。

拍卖的形式有很多种,例如一口价拍卖、竞价拍卖等。

不同的拍卖形式会导致不同的结果。

博弈论解析:在拍卖中,卖方和买方都是决策者,他们的决策会直接影响到拍卖的结果。

博弈论提供了一些拍卖的理论模型,帮助卖方和买方制定最佳的决策策略。

精编博弈论经典案例资料

精编博弈论经典案例资料

精编博弈论经典案例资料在我们的生活中,博弈无处不在。

无论是在商业竞争、政治决策,还是日常的人际关系中,人们都在不断地进行着各种形式的博弈。

博弈论作为一门研究决策主体相互作用时的决策以及这种决策的均衡问题的学科,为我们理解和应对这些复杂的情况提供了有力的工具。

下面,让我们一起来看看一些经典的博弈论案例。

案例一:囚徒困境假设有两个犯罪嫌疑人 A 和 B 被警方抓获,但警方没有足够的证据指控他们。

于是,警方将两人分别关押在不同的房间进行审讯,并向他们分别提出了相同的条件:如果两人都保持沉默(即不坦白),那么他们都会被判刑 1 年;如果其中一人坦白而另一人保持沉默,坦白的人将被无罪释放,而沉默的人将被判刑 10 年;如果两人都坦白,那么他们都会被判刑 8 年。

对于 A 和 B 来说,他们都面临着两种选择:坦白或沉默。

从 A 的角度来看,如果 B 坦白,那么自己坦白会被判刑 8 年,沉默会被判刑10 年,所以坦白是更好的选择;如果 B 沉默,那么自己坦白会被无罪释放,沉默会被判刑1 年,还是坦白更好。

同样的逻辑对于B 也适用。

最终,两人都会选择坦白,尽管从整体上看,如果他们都保持沉默,结果会更好(两人总共判刑2 年),但由于他们无法相互信任和协调,最终都选择了坦白(两人总共判刑 16 年)。

囚徒困境揭示了个体理性与集体理性之间的冲突。

在很多情况下,人们从自身利益出发做出的决策,并不一定能带来整体的最优结果。

案例二:智猪博弈假设猪圈里有一头大猪和一头小猪,猪圈的一头有一个猪食槽,另一头安装着控制猪食供应的按钮。

按一下按钮会有 10 个单位的猪食进槽,但谁按按钮就会首先付出 2 个单位的成本。

若大猪先到槽边,大猪吃到 9 个单位,小猪只能吃到 1 个单位;若同时到槽边,大猪吃 7个单位,小猪吃 3 个单位;若小猪先到槽边,大猪吃 6 个单位,小猪吃 4 个单位。

那么,对于小猪来说,无论大猪是否去按按钮,等待都是它的最优选择。

囚徒困境的启示与意义

囚徒困境的启示与意义

囚徒困境的启示与意义1. 介绍囚徒困境囚徒困境是博弈论中一个经典的例子,描述了两个囚徒合作或背叛的情况下所面临的不同结果。

这个例子揭示了合作与竞争之间的矛盾,以及个体利益与集体利益之间的潜在冲突。

囚徒困境的实质在于强调了合作的重要性,并引出了一系列对社会和个体行为的启示与意义。

2. 结果分析和解释囚徒困境中的结果主要取决于双方的行为选择,包括合作和背叛两种策略。

以下是可能的结果及其解释:2.1. 双方合作•合作/合作:最优解。

双方选择合作可以获得相对较好的结果。

这种情况下,囚犯表现出相互信任和合作的精神。

2.2. 双方背叛•背叛/背叛:最差解。

双方的背叛选择导致最糟糕的结果。

这种情况下,囚犯表现出相互猜忌和自私的行为。

2.3. 一方合作,一方背叛•合作/背叛:合作者受损。

合作者选择信任对方,但被背叛者利用而受到损失。

这种情况下,背叛者表现出自私和利己主义的行为。

•背叛/合作:背叛者受益。

背叛者利用合作者的信任,取得了最好的结果。

这种情况下,合作者会感到被背叛和愤怒,并对未来的合作持怀疑态度。

3. 启示与意义囚徒困境对社会行为和决策制定产生了深远的影响,以下是囚徒困境的一些重要启示与意义:3.1. 非零和博弈囚徒困境展示了非零和博弈的概念,即在博弈中,协作与竞争之间存在复杂的关系。

双方通过合作可以获得最好的结果,但个体的背叛选择可能导致更好的个人结果。

3.2. 合作的重要性囚徒困境强调了合作的重要性。

只有通过合作,双方才能获得相对较好的结果。

囚犯在困境中体验到了相互合作的益处,这对于我们的社会和个人行为都有深远的启示。

3.3. 长期利益与短期利益的冲突囚徒困境揭示了长期利益与短期利益之间的冲突。

个体可能会选择为了自身短期利益而背叛合作,但这种行为可能会导致长期利益的损失。

在决策制定中,我们需要考虑到长期利益,并尽量避免受短期利益驱使。

3.4. 信任与合作的建立囚徒困境提醒我们建立信任和合作的重要性。

精编博弈论经典案例资料

精编博弈论经典案例资料

精编博弈论经典案例资料在我们的生活中,博弈论的身影无处不在。

从日常的购物决策到商业竞争,从国际关系到体育比赛,博弈论为我们提供了一种理解和预测人类行为的有力工具。

接下来,让我们一起走进几个经典的博弈论案例,感受其中的智慧与策略。

案例一:囚徒困境假设有两个犯罪嫌疑人 A 和 B 被警方抓获,但警方没有足够的证据指控他们。

于是,警方将两人分别关押,并分别告知他们以下政策:如果 A 和 B 都保持沉默(不坦白),那么两人都将被判刑 1 年;如果 A 坦白而 B 沉默,那么 A 将被释放,B 将被判刑 5 年;如果 B 坦白而 A 沉默,那么 B 将被释放,A 将被判刑 5 年;如果 A 和 B 都坦白,那么两人都将被判刑 3 年。

从理性的角度来看,对于 A 来说,如果 B 坦白,那么自己坦白会被判 3 年,沉默会被判 5 年,所以坦白更好;如果 B 沉默,那么自己坦白会被释放,沉默会被判 1 年,还是坦白更好。

同样的逻辑对于 B也适用。

最终的结果往往是A 和B 都选择坦白,两人都被判刑3 年。

然而,从整体的最优结果来看,如果两人都保持沉默,总共只需要判刑2 年。

这个案例反映了个体理性与集体理性之间的冲突。

在现实生活中,类似的情况也经常出现。

比如在商业竞争中,企业之间为了争夺市场份额,可能会采取过度降价的策略,最终导致双方的利润都受到损失。

案例二:智猪博弈猪圈里有一头大猪和一头小猪。

猪圈的一头有一个饲料槽,另一头安装着控制饲料供应的按钮。

按一下按钮会有 10 个单位的饲料进槽,但谁按按钮就需要先付出 2 个单位的成本。

而且,大猪吃的速度快,如果小猪去按按钮,大猪会在小猪跑回来之前吃掉大部分饲料;如果大猪去按按钮,小猪也能吃到一部分饲料。

如果小猪按按钮,大猪等待,那么大猪能吃到 9 个单位的饲料,小猪只能吃到 1 个单位的饲料(扣除成本后净收益为-1);如果大猪按按钮,小猪等待,那么大猪能吃到 6 个单位的饲料,小猪能吃到 4 个单位的饲料;如果大猪小猪都去按按钮,那么大猪能吃到 7 个单位的饲料,小猪能吃到 3 个单位的饲料(扣除成本后净收益为 1);如果大猪小猪都等待,那么双方都吃不到饲料。

囚徒困境博弈举例

囚徒困境博弈举例

2. 例子
在经济生活中,有许多“智猪博弈”的例 子。
例子6 股市博弈
在股票市场上,大户是大猪,他们要进行 技术分析,收集信息、预测股价走势,但大量 散户就是小猪。
他们不会花成本去进行技术分析,而是跟 着大户的投资战略进行股票买卖,即所谓“散 户跟大户”的现象。
例子7 为何股份公司中的大股东才有投 票权?
在股份公司中,大股东是大猪,他 们要收集信息监督经理,因而拥有决定 经理任免的投票权,而小股东是小猪, 不会直接花精力去监督经理,因而没有 投票权。
例子8 为什么中小企业不会花钱去开发 新产品?
在技术创新市场上,大企业是大猪, 它们投入大量资金进行技术创新,开发 新产品,而中小企业是小猪,不会进行 大规模技术创新,而是等待大企业的新 产品形成新的市场后生产 模仿大企业的新产品的产 品去销售。
WTO是一个自愿性申请加入的自由贸易 联盟,即WTO成员国之间实现低关税或零关 税的相互间自由贸易。为什么需要一个组织来 协调国家之间的自由贸易呢?这是因为,如果 没有一个协调组织,国与国之间的贸易就不会 呈现低关税或零关税的自由贸易局面,因为这 时国与国之间的贸易是一个“囚徒困境”。给 定一个国家对另一个国家的货物实行低关税, 另一个国家反过来对这个国家的货物实行高关 税是占优于实行低关税的战略的。
一、囚徒困境博弈
表1 囚徒困境博弈

坦白
不坦白
坦白 甲
不坦白
-5,-5 -8,0
0,-8 -1,-1
甲和乙都不会选择劣战略“不 招”,称为“剔除劣战略的占优战 略均衡”。其中“坦白”是占优于 (优于)“不坦白”的占优战略。
我们可以利用这个道理来分析 日常生活中的许多不合作现象。
2. 生活中的“囚徒困境”例子

囚徒困境商业案例说明

囚徒困境商业案例说明

囚徒困境是博弈论中的一个经典案例,用于解释在合作与背叛之间做出决策的难题。

在商业环境中,囚徒困境也经常出现。

以下是一个典型的商业案例,说明囚徒困境的实际应用。

假设有两家公司A和B,它们是市场上的主要竞争对手。

最近,它们共同发现了一个新的商业机会,如果两家公司合作开发,有望获得巨大的利润。

然而,如果其中一家公司背叛合作,独立开发并抢占市场,可能会获得更大的利益。

在这个情境下,A公司和B公司就陷入了一个囚徒困境。

如果两家公司都选择合作,它们将共同分享市场上的利润,实现双赢。

但如果其中一家公司选择背叛,它就有可能独占市场,获得更高的利润,而另一家公司则会受损。

同时,如果两家公司都选择背叛,它们将陷入激烈的市场竞争,可能导致两败俱伤。

为了确保合作的成功,A公司和B公司需要建立一种信任机制。

它们可以通过签订合同、分享风险和制定惩罚措施来约束对方的行为。

例如,它们可以约定在背叛的情况下必须支付巨额赔偿金,从而增加背叛的成本。

这样一来,即使其中一家公司面临背叛的诱惑,也会因为背叛的后果而选择合作。

总之,囚徒困境在商业环境中经常出现,但通过建立信任机制和约束措施,企业可以克服这一困境,实现合作与共赢。

法律经济学案例囚徒困境(3篇)

法律经济学案例囚徒困境(3篇)

第1篇一、引言囚徒困境是博弈论中一个著名的例子,它描述了两个理性个体在信息不完全的情况下,如何做出决策以最大化自己的利益。

在法律经济学领域,囚徒困境被广泛用来分析个体在法律规制下的行为选择。

本文将以一个具体的案例分析囚徒困境在法律经济学中的应用,探讨法律如何影响个体行为以及如何通过制度设计来优化社会资源配置。

二、案例分析1. 案例背景某市有两家相邻的工厂,分别生产有毒化学品。

由于环保法规的限制,两家工厂都必须采取措施减少污染物排放。

然而,由于信息不对称,两家工厂无法确切知道对方的具体排放情况。

在这种情况下,两家工厂面临着囚徒困境。

2. 个体决策(1)工厂A的决策工厂A考虑到如果工厂B遵守环保法规,而自己不遵守,将会面临高额的罚款。

因此,工厂A有动机选择不遵守法规。

但如果工厂B也不遵守法规,那么工厂A的罚款可能会降低。

在这种情况下,工厂A的理性选择是不遵守法规。

(2)工厂B的决策工厂B的决策过程与工厂A类似。

如果工厂A遵守环保法规,而工厂B不遵守,那么工厂B将面临高额罚款。

但如果工厂A也不遵守法规,那么工厂B的罚款可能会降低。

因此,工厂B的理性选择同样是不遵守法规。

3. 囚徒困境结果在囚徒困境中,两家工厂都选择了不遵守环保法规。

这种情况下,两家工厂都面临着罚款,但总体罚款金额比两家工厂都遵守法规时要低。

然而,这种结果并非最优,因为如果两家工厂都遵守法规,不仅罚款金额会降低,而且对环境的影响也会减少。

三、法律经济学分析1. 法律规制对囚徒困境的影响在法律经济学中,法律规制被视为一种外部干预,旨在影响个体的行为。

在本案例中,环保法规可以被视为一种法律规制。

通过分析囚徒困境,我们可以发现:(1)法律规制可以降低囚徒困境发生的概率。

在本案例中,如果环保法规更加严格,工厂A和工厂B选择遵守法规的可能性将增加。

(2)法律规制可以降低囚徒困境的结果。

在本案例中,如果环保法规对违反规定的罚款金额更高,那么两家工厂选择遵守法规的可能性将更大。

博弈论案例分析

博弈论案例分析

博弈论案例分析在经济学、政治学、社会学以及商业策略中,博弈论是一个重要的分析工具。

它研究在具有相互依赖关系的决策者之间如何做出最优决策。

以下是几个典型的博弈论案例分析:1. 囚徒困境囚徒困境是博弈论中最著名的例子之一。

它描述了两个被捕的罪犯面临的决策问题。

每个囚犯可以选择合作(保持沉默)或背叛(供出对方)。

如果两人都合作,他们都会被轻判;如果两人都背叛,他们都会被重判;如果一个合作而另一个背叛,背叛者将被释放,而合作者将受到最重的惩罚。

在这种情况下,尽管两人都合作是最优的集体结果,但个体理性导致他们最终选择背叛对方。

2. 纳什均衡纳什均衡是博弈论中的一个核心概念,由数学家约翰·纳什提出。

它指的是在一个非合作博弈中,每个参与者都选择了自己的最优策略,前提是其他参与者的策略是已知的。

在囚徒困境中,纳什均衡就是两人都选择背叛,因为无论对方如何选择,背叛都是每个囚犯的最优策略。

3. 公共物品的提供公共物品的提供是博弈论在现实世界中的一个应用。

公共物品具有非排他性和非竞争性,即一个人使用公共物品不会减少其他人的使用,且无法阻止未付费者使用。

这导致了一个“搭便车”的问题,即个体可能倾向于不支付公共物品的成本,而是依赖其他人的支付。

博弈论可以用来分析如何通过激励机制来解决这个问题,比如通过征税或罚款。

4. 拍卖理论拍卖理论是博弈论在经济活动中的一个应用。

它研究在不同拍卖规则下,买家和卖家如何制定策略以达到最优结果。

例如,在英式拍卖中,价格逐步上升,直到只剩下一个出价者;而在荷兰式拍卖中,价格从高到低下降,直到有人接受当前价格。

博弈论可以帮助分析在不同拍卖形式下,参与者如何制定出价策略以最大化自己的利益。

5. 冷战时期的核威慑冷战时期,美国和苏联之间的核威慑是一个典型的博弈论案例。

双方都拥有能够摧毁对方的核武器,但任何一方首先使用核武器都会导致灾难性的后果。

这种情况下,双方都有动机保持克制,以避免触发全面的核战争。

博弈论经典案例“囚徒困境”以及其拓展

博弈论经典案例“囚徒困境”以及其拓展
假设对策者所组成的策略群体是一代一代进化下去的,进化的规则包括:一,试错。人们在对待周围环境时,起初不知道该怎么做,于是就试试这个,试试那个,哪个结果好就照哪个去做。第二,遗传。一个人如果合作性好,他的后代的合作基因就多。第三,学习。比赛过程就是对策者相互学习的过程,"一报还一报"的策略好,有的人就愿意学。按这样的思路,艾氏设计了一个实验,假设63个对策者中,谁在第一轮中的得分高,他在第二轮的群体中所占比例就越高,而且是他的得分的正函数。这样,群体的结构就会在进化过程中改变,由此可以看出群体是向什么方向进化的。
合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺(Credible commitment) ,向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。如果该困境同时涉及多个对手,则要在博弈对手中形成声誉,并用心地维护这个声誉。这里“可信的承诺”是一个很牵强的翻译,“Credible commitment”并不是什么空口诺言,而是实实在在的付出。所以合作是非常困难的。 所以OPEC组织经常会有成员国不遵守组织的协定,私自增加石油产量。每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失。当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进一步下降--结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌……。
二、 合作的进行过程及规律
"一报还一报"的策略在静态的群体中得到了很好的分数,那么,在一个动态的进化的群体中,这种合作者能否产生、发展、生存下去呢?群体是会向合作的方向进化,还是向不合作的方向进化?如果大家开始都不合作,能否在进化过程中产生合作?为了回答这些疑问,艾氏用生态学的原理来分析合作的进化过程。

关于博弈论的小故事

关于博弈论的小故事

博弈论的小故事有很多,这里为您提供一个经典的囚徒困境的例子:
故事讲述的是两个囚犯一起犯罪被抓进警察局。

警察将他们分别关在不同的房间里,并告诉他们:如果两个人都坦白罪行,每人将入狱8年;如果两人都抵赖,将各判刑一年;但如果其中一人坦白,另一人抵赖,坦白的人将立刻释放,抵赖的人将判刑10年。

在这个故事中,每个囚犯都有两个选择:坦白或抵赖。

然而,无论同伙选择什么,每个囚犯的最优选择都是坦白:如果同伙抵赖、自己坦白的话,可以立刻释放;如果同伙坦白、自己抵赖的话,将会判刑10年。

但这个帕累托改进办不到,因为它不能满足人类的理性要求。

这个故事揭示了博弈论中的一个重要概念:即使合作对双方都有利,保持合作也是非常困难的。

因为每个参与者都会考虑自己的利益,从而导致集体非理性的结果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论经典案例“囚徒困境”以及其拓展05-06-13 10:57 发表于:《没有范的世界》分类:未分类博弈论(game theory)对人的基本假定是:人是理性的(rational,或者说自私的),理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。

“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。

讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。

可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。

A和B均坦白是这个博弈的纳什均衡。

这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。

即是说,不管A坦白或抵赖,B的最佳选择都是坦白。

反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。

结果,两个人都选择了坦白,各判刑8年。

在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

囚徒困境反映了个人理性和集体理性的矛盾。

如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。

当然,A和B可以在被警察抓到之前订立一个"攻守同盟",但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。

在经济学方面的实例:一.电信价格竞争根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。

假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争,一开始的价格都是P0。

A(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)则刚刚成立不久,翅膀还没有长硬,是政府为了打破垄断鼓励竞争而筹建起来的。

正因为B是政府扶植起来鼓励竞争的,所以B得到了政府的一些优惠,其中就有B的价格可以比P0低10%。

这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。

在这样的市场分配下,A、B可以达到平衡,但由于B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成了影响。

这时候,A该怎么做?不妨假定:A降价而B维持,则A获利15,B损失5,整体获利10;A维持且B也维持,则A获利5,B获利10,整体获利15;A维持而B降价,则A损失10,B获利15,整体获利5;A降价且B也降价,则A损失5,B损失5,整体损失10。

从A角度看,显然降价要比维持好,降价至少可以保证比B好,在概率均等的情况下,A降价的收益为15×50%-5×50%=5,维持的收益为5×50%-10×50%=-2.5,为了自身利益的最大化,A就不可避免地选择了降价。

从B角度看,效果也一样,降价同样比维持好,其降价收益为5,维持收益为2.5,它也同样会选择降价。

在这轮博弈中,A、B都将降价作为策略,因此各损失5,整体损失10,整体收益是最差的。

这就是此博弈最终所出现的纳什均衡。

我们构造的这一电信业价格战博弈模型是典型的囚徒困境现象,各个局部都寻求利益的最大化,而整体利益却不是最优,甚至是最差。

许多其他行业的价格竞争都是典型的囚徒困境现象,如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。

二.OPEC组织成员国之间的合作与背叛“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。

上述我们在对电信价格竞争的博弈分析中,只是一次性的“囚徒困境”博弈,因此得到了互相降价的纳什均衡。

而在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。

比如中东石油输出国组织(OrganizationofPetroleumExportingCountries简称OPEC)的成立,本身就是要限制各石油生产国的产量,以保持石油价格,以便获取利润,是合作的产物。

OPEC之所以能够成立,各组织成员国之间之所以能够合作,是因为囚徒困境如果是一次性博弈(One shot game)的话,基于个人利益最大化,得到纳什均衡解,但如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。

连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理”(Folk Theorem)的含义。

合作的可能性不是必然性。

博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺(Credible commitment) ,向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。

如果该困境同时涉及多个对手,则要在博弈对手中形成声誉,并用心地维护这个声誉。

这里“可信的承诺”是一个很牵强的翻译,“Credible commitment”并不是什么空口诺言,而是实实在在的付出。

所以合作是非常困难的。

所以OPEC组织经常会有成员国不遵守组织的协定,私自增加石油产量。

每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失。

当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进一步下降--结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌……。

理论上,几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守。

那么是不是不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。

但只要是有限次的合作,合作就不会成功。

比如合作10次,那么在第九次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了。

但是大家料到第九次会出现不合作,那么就很可能在第八次就采取不合作的态度。

第八次不合作会使大家在第七次就不合作……一直到,从第一次开始大家都不会采取合作态度。

以上是运用博弈论中的经典案例“囚徒困境”对现实经济生活的一些简单的理论上的分析,虽然在现实生活当中影响人们决策和态度的因素很多,但是,博弈论作为现代经济学的前沿领域,始终是一个强有力的分析工具。

囚徒困境在理论上的延伸:一、博弈中最优策略的产生艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。

也就是说,个人可以完全按照自己利益最大化的企图进行决策。

在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。

社会实践中有很多合作的问题。

比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。

在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。

对策论以著名的囚犯困境来描述这个问题。

A和B各表示一个人,他们的选择是完全无差异的。

选择C代表合作,选择D代表不合作。

如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C 的得零分,选D的得5分;如果AB都选D,双方各得1分。

显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。

如果一方选C,一方选D,总体得5分。

如果两人都选D,总体得2分。

对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。

在矩阵中,对于A来说,当对方选C,他选D得5分,选C只得3分;当对方选D,他选D得1分,选C得零分。

因此,无论对方选C或D,对A来说,选D都得分最多。

这是A单方面的优超策略。

而当两个优超策略相遇,即A,B都选D时,结果是各得1分。

这个结果在矩阵中并非最优。

困境就在于,每个人采取各自的优超策略时,得出的解是稳定的,但不是帕累托最优的,这个结果体现了个体理性与群体理性的矛盾。

在数学上,这个一次性决策的矩阵没有最优解。

如果博弈进行多次,只要对策者知道博弈次数,他们在最后一次肯定采取互相背叛的策略。

既然如此,前面的每一次也就没有合作的必要,因此,在次数已知的多次博弈中,对策者没有一次会合作。

如果博弈在多人间进行,而且次数未知,对策者就会意识到,当持续地采取合作并达成默契时,对策者就能持续地各得3分,但如果持续地不合作的话,每个人就永远得1分。

这样,合作的动机就显现出来。

多次对局下,未来的收益应比现在的收益多一个折现率W,W越大,表示未来的收益越重要。

在多人对策持续进行下去,且W比较大,即未来充分重要时,最优的策略是与别人采取的策略有关的。

假设某人的策略是,第一次合作,以后只要对方不合作一次,他就永不合作。

对这种对策者,当然合作下去是上策。

假如有的人不管对方采取什么策略,他总是合作,那么总是对他采取不合作的策略得分最多。

对于总是不合作的人,也只能采取不合作的策略。

艾克斯罗德做了一个实验,邀请多人来参加游戏,得分规则与前面的矩阵相同,什么时候结束游戏是未知的。

他要求每个参赛者把追求得分最多的策略写成计算机程序,然后用单循环赛的方式将参赛程序两两博弈,以找出什么样的策略得分最高。

第一轮游戏有14个程序参加,再加上艾克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作),运转了300次。

结果得分最高的程序是加拿大学者罗伯布写的"一报还一报"(tit for tat)。

这个程序的特点是,第一次对局采用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。

艾克斯罗德还发现,得分排在前面的程序有三个特点:第一,从不首先背叛,即"善良的";第二,对于对方的背叛行为一定要报复,不能总是合作,即" 可激怒的";第三,不能人家一次背叛,你就没完没了的报复,以后人家只要改为合作,你也要合作,即"宽容性"。

为了进一步验证上述结论,艾氏决定邀请更多的人再做一次游戏,并把第一次的结果公开发表。

相关文档
最新文档