经典的囚徒困境
囚徒困境案例
囚徒困境案例囚徒困境是博弈论中的一个经典案例,它揭示了在互相合作的情况下,个体之间的利益冲突和合作困境。
这个案例的背后蕴含着深刻的社会学和心理学意义,对于我们理解人类行为和社会关系具有重要的启示作用。
在囚徒困境案例中,两名罪犯被抓获并分开审讯,警察没有足够的证据定罪,只能凭借他们对彼此的供词来判决。
如果两名罪犯都沉默不语,警察只能以轻罪定罪,每人判刑1年;如果其中一人供认,而另一人保持沉默,供认的人将被释放,而另一人将被判10年;如果两人都供认,每人将被判刑8年。
在这种情况下,每个人都面临着一个选择,是合作沉默,还是背叛供认。
从个体的利益出发,无论对方选择什么,供认都是最好的选择。
因为无论对方是沉默还是供认,供认者都能通过合作获得最小的刑期。
但是,如果双方都选择供认,就会导致双方都得到最坏的结果。
这就是囚徒困境的本质,即使合作对每个人来说都是最好的选择,但由于彼此之间缺乏信任,最终导致了双方都选择背叛,从而陷入困境。
囚徒困境案例在现实生活中也有着广泛的应用。
在商业合作中,合作双方往往面临着相互竞争和利益冲突。
在国际关系中,各国之间也存在着类似的困境,例如军备竞赛和贸易争端。
在日常生活中,人们之间的合作也会受到囚徒困境的影响,例如环境保护、资源分配等方面。
如何打破囚徒困境,实现合作共赢呢?学者们提出了一些解决方案。
首先是建立信任,通过长期的合作积累信任,从而减少合作双方的不确定性和风险。
其次是建立有效的合作机制,通过契约、协议等方式规范双方行为,减少信息不对称和道德风险。
再次是采取激励措施,通过奖惩机制激励合作,促使双方选择合作而非背叛。
最后是加强监督,通过第三方监督和公众监督,降低合作双方的违约成本,提高合作的可信度。
囚徒困境案例告诉我们,合作是人类社会生存和发展的基础,但合作中也存在着利益冲突和信任危机。
打破囚徒困境,需要双方共同努力,建立信任、规范合作、激励合作和加强监督,从而实现合作共赢的局面。
博弈论经典案例
博弈论经典案例1. 囚徒困境:这是一种经典的博弈论案例,两名囚犯被关押在不同的牢房中,警方缺乏确凿的证据将他们定罪,决定让他们进行交涉。
如果两人都认罪,每人将会被判刑5年;如果一个人认罪而另一个人保持沉默,认罪的人将会被判刑1年,而保持沉默的人将被判无期徒刑;如果两人都保持沉默,每人将被判刑3年。
在这种情况下,每个囚犯都面临着是否信任对方合作的决策。
2. 麦氏定理:这是美国经济学家约翰·N·纳什于1950年提出的经典问题。
假设有两家咖啡店A和B,它们的位置一个在城市的北边,另一个在南边。
两家咖啡店需要决定每天早上的开门时间。
如果A咖啡店在北边开门,而B咖啡店在南边也同样开门,北部居民会去A店,南部居民会去B店,两家店的收入会平均分。
但是,如果A店在北边开门,而B店在南边关门,南部居民不得不去北边排队等待,这将导致北边的队伍变长,北部居民也会选择去B店。
麦氏定理指出,当两家店选择不同的开门时间时,总是有一种策略,使得两家店的收入之和最大。
3. 社交圈中的追逐游戏:在一个社交聚会上,一对情侣分手后,男方试图追回女方。
男方完成了一连串的行动,女方必须在每个行动之后做出回应。
游戏的目标是让女方接受男方的求爱。
这个案例涉及到博弈论中的策略选择和不确定性。
4. 价格竞争:在一场市场竞争中,两家公司决定销售产品的价格。
低价通常会吸引更多的消费者,但是公司也需要考虑到自己的成本和利润。
每家公司需要在出售产品的定价上权衡竞争和利润之间的平衡。
这个案例涉及到博弈论中的纳什均衡和即时反应策略。
5. 投标博弈:在一场拍卖中,多个竞争者竞相出价,以获得拍卖品。
每个竞争者必须决定自己的出价,以获得最大的利润。
这个案例涉及到博弈论中的最优出价和风险评估。
囚徒困境
囚徒困境(Prisoner's dilemma)囚徒困境是博弈论中具有代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
囚徒困境最早是由美国普林斯顿大学数学家阿尔伯特·塔克(Albert tucker)1950年提出来的。
他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最著名的案例。
故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。
2.经典的囚徒困境1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:∙若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
∙若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
博弈论囚徒困境案例
博弈论囚徒困境案例博弈论囚徒困境案例引言博弈论是研究人类决策行为的一门学科,它探讨的是在多个参与者之间进行决策时,每个参与者的最优策略和最终结果。
其中,囚徒困境是博弈论中比较典型的案例之一。
一、什么是囚徒困境囚徒困境是博弈论中的一个经典问题,它描述了两个犯罪嫌疑人被捕后面临的选择问题。
如果两个嫌疑人都保持沉默,则他们都会获得轻判;如果一个人供出另一个人,则供出者将获得免罪或轻判,而另一个人则会被判重刑;如果两个人都供出对方,则他们都将被判重刑。
这种情况下,每个嫌疑人都会考虑自己的利益和对方可能做出的选择。
二、实际案例分析1. 美苏核武器竞赛美苏核武器竞赛可以看作是一个大规模的囚徒困境问题。
在20世纪50年代和60年代,美国和苏联都在积极研发核武器,这导致了一种军备竞赛的局面。
如果两个国家都不研发核武器,则两国都可以获得和平和安全;如果一个国家研发核武器而另一个国家不研发,则前者可以获得军事优势,后者则会处于劣势;如果两个国家都研发核武器,则两国都将处于危险之中。
这种情况下,每个国家都会考虑自己的利益和对方可能做出的选择。
2. 环保问题环保问题也可以看作是一个囚徒困境问题。
如果每个人都能够积极参与环保行动,那么整个社会将会受益;但是,如果有些人不愿意参与环保行动而其他人却积极参与,那么后者将付出更多的代价。
这种情况下,每个人都要考虑自己的利益和其他人可能做出的选择。
三、如何解决囚徒困境1. 合作合作是解决囚徒困境的最佳策略。
在合作的情况下,两个嫌疑人都会保持沉默,从而都能够获得轻判。
在其他的囚徒困境问题中,合作也可以带来更好的结果。
2. 威慑威慑是解决囚徒困境的另一种策略。
在威慑的情况下,一个嫌疑人会选择供出另一个人,以期望获得免罪或轻判。
这种策略需要有足够的信誉和实力来支持,否则可能会适得其反。
3. 协商协商是解决囚徒困境的另一种策略。
通过协商,两个嫌疑人可以达成共识并保持沉默,从而都能够获得轻判。
博弈论经典案例
博弈论“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。
讲的是两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判6年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
简而言之就是:甲沉默,乙沉默 --> 二人同服刑1年甲坦白,乙坦白 --> 二人同服刑6年甲坦白,乙沉默 --> 甲即时获释;乙服刑10年甲沉默,乙坦白 --> 甲服刑10年;乙即时获释“囚徒困境”反应了个人理性和集体理性的矛盾。
不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判六年,不坦白的话判十年,坦白还是比不坦白好。
结果,两个嫌疑犯都选择坦白,各判刑六年。
如果两人都抵赖,各判一年,显然这个结果好。
囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
海盗分赃有五个海盗,劫掠了100公斤黄金,需要分赃。
办法是抓阄,盗亦有道。
五个纸团里写着1-5五个数字,按数字顺序抓阄,抓到“1”的人,可以先提出一个分配方案,如果他的方案被一半以上的人同意,就照他的方案分金子,否则,第一个人就要被杀掉。
余下的人也照此办理。
我的问题是:如果你是第一个人,你会提出怎样的分配方案,才能让自己利益最大化?(答案:第一个人提出自己独拿100公斤黄金)这个例子告诉我们,想问题,确实需要方法论,靠直觉是不可以的,直觉在很多情况下是错误的,必须依靠方法,依靠逻辑的力量。
红黑博弈这是一个关于输与赢之间的博弈游戏,游戏规则是这样的:所有参加培训的新人分为几个小组,其中两组作为对手。
每组选出队长作为团队的领导者和谈判官。
在游戏的进程中,每一组选择向对手亮出什么样颜色的牌,如果两组同时亮出了红牌,那么两组将同时被扣掉3分;如果其中一组选择红牌,而另一组选择黑牌,那么选择红牌的一组将得3分,而选择黑牌的小组将得0分;双方同时选择黑牌,将同时得到1分。
囚徒困境PPTPPT课件
面对囚徒困境,我们需要勇于创新和变革,打破固有的思维模式和制度限制,寻找更好的解决方案。这有助于推动社会的进步和发展。
对未来发展的影响
THANKS FOR
WATCHING
感谢您的观看
社会制度应该鼓励和促进合作,减少囚徒困境的发生。例如,可以通过制定合理的法律法规、加强监管等手段,来引导个体在面对类似情境时做出更有利于社会的选择。
公平与效率
制度设计与监管
对社会制度的思考
全球化与合作
随着全球化的发展,各国之间的相互依存度越来越高,囚徒困境的启示有助于推动国际间的合作与交流,共同应对全球性的挑战。
囚徒困境
囚徒困境简介 囚徒困境的基本模型 囚徒困境的解决方案 囚徒困境的实际案例 囚徒困境的启示与思考
contents
目 录
01
囚徒困境简介
囚徒困境是一种博弈论模型,描述了两个犯罪嫌疑人被捕后,在不能互相沟通的情况下,各自选择最优策略时所面临的困境。
定义
囚徒困境源于现实生活中的囚犯困境问题,即两个同谋的囚犯在接受审判时,如果他们都保持沉默,则可能获得较轻的判决;但如果他们互相背叛,则可能获得较重的判决。
合作
在囚徒困境中,参与者可以通过选择合作的方式,共同达成更好的结果。合作可以避免被对方背叛的风险,同时也有助于建立长期的关系和互信。
长期视角
参与者应该从长远的角度考虑问题,认识到合作带来的长期利益,而不仅仅关注眼前的短期利益。通过建立长期关系和互信,可以降低囚徒困境中的风险和不确定性。
合作策略
有效沟通
沟通与信任
引入第三方监管机制,可以对囚徒困境中的参与者进行监督和约束,防止他们采取不合作或背叛的行为。监管机制可以提供公正的裁决和惩罚,维护游戏的公平性和规则的执行。
囚徒困境
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
(单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样)1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:•若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
•若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
•若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:甲沉默(合作)甲认罪(背叛)乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。
参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势策略”,理性的参与者绝不会选择。
另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒甲和乙该怎么办呢?他们作为本博弈中的两个博弈方,他们都有两个选择——坦白或抵赖。
很显然,最好的策略是双方都抵赖,结果是大家都只被判一年。
但是由于两人处于隔离的情况下无法串供。
所以,根据个体理性原则,两个博弈方的目标都是要实现自身利益最大化。
对于囚徒甲来说,囚徒乙有坦白和抵赖的两种可能的选择,如果囚徒乙选的是抵赖,则对于囚徒甲来说,他应该选择坦白,因为抵赖的得益为-1,坦白的得益为-1/2;,如果囚徒乙选的是坦白,则对于囚徒甲来说,他应该选择坦白,因为抵赖的得益-10,坦白的得益为-5。
总结囚徒困境
总结囚徒困境什么是囚徒困境?囚徒困境(Prisoner’s Dilemma)是博弈论中的一个经典问题。
它描述了两个囚犯被困在同一个牢房,被指控共同犯下了一起罪行。
检察官分别与两名囚犯进行单独的审讯,并给出以下两个选择:1.合作:囚犯们不相互揭发,共同保持沉默。
2.背叛:囚犯们可以选择揭发对方,以换取自己的自由。
囚犯们无法沟通,也不知道对方选择了什么。
如果两人都选择合作,则每个人都会被判轻刑。
但如果其中一人选择背叛而另一人选择合作,则背叛者将会被判轻刑,而合作者将面临重刑。
如果两人都选择背叛,则每个人都会被判处较重的刑罚。
囚徒困境的特征囚徒困境有以下几个特征:1.互动性:囚犯的选择会相互影响,彼此的行为会对对方产生影响。
2.博弈论性质:囚徒困境可以用博弈论的方式进行分析,确定最佳策略。
3.利益最大化:每个囚犯都希望通过选择能够获得最大利益。
4.缺乏合作:由于囚犯无法沟通且不能相信对方,他们往往倾向于选择背叛。
囚徒困境的应用囚徒困境不仅仅是一个理论问题,它在现实生活中也有广泛的应用。
1.经济学:囚徒困境可以用来分析市场竞争中的合作与背叛的策略。
企业在价格战中的选择、合作与联盟等都与囚徒困境有关。
2.政治学:囚徒困境可以解释国际关系中的合作与冲突。
国家间的合作与背叛,如军备竞赛和防务合作等,都可以用囚徒困境来解释。
3.社会学:囚徒困境可以研究社会交往中的合作与背叛。
合作与背叛的选择在社会伦理、互助关系、信任建立等领域都有重要意义。
4.生态学:囚徒困境可以分析生态系统中的合作与竞争。
例如,在资源有限的情况下,个体的自利选择往往导致整体利益的损失。
解决囚徒困境的策略囚徒困境中,最理性的策略就是背叛对方,因为无论对方选择合作还是背叛,背叛者都能够获得更好的结果。
然而,背叛对方最终会导致双方都无法获得最优解。
为了克服囚徒困境,可以通过以下几种策略:1.长期合作:如果双方能够建立长期的合作关系,增加彼此之间的信任和依赖,就有可能避免囚徒困境的恶性循环。
囚徒困境囚徒困境完美资料
囚徒困境囚徒困境完美资料囚徒困境:完美资料囚徒困境(Prisoner's Dilemma)是博弈论中的一个经典问题,它描述了两个囚犯在被关在单独的房间里,并且不能彼此沟通的情况下,面临是否合作或背叛的抉择。
囚徒困境以其独特的结构和反直觉的结果,引起了广泛的研究和讨论。
本文将介绍囚徒困境的定义、经典案例、策略分析以及实际应用,并深入探讨其意义和启示。
一、囚徒困境的定义囚徒困境是一种标准的非合作博弈模型,涉及两个参与者的决策问题。
在囚徒困境中,每个参与者面临两个选择:合作或背叛。
如果两名囚犯都选择合作,则他们各自会得到一个较轻的刑罚;如果两名囚犯都选择背叛,则他们各自会得到一个较重的刑罚;如果其中一名囚犯选择背叛而另一名选择合作,则背叛者将获得最低刑罚,而合作者将面临最严重的刑罚。
二、经典案例囚徒困境最早由梅尔文·邓纳姆和阿尔伯特·塔克在1950年提出。
以下是一个经典的囚徒困境案例:两名囚犯,A和B,被控犯有某起案件。
检察官没有足够的证据来定罪,但他们每人都面临着一项轻微的定罪罪名。
在封闭的审讯室内,检察官分别向A和B提供了一个选择:合作或背叛。
他们的选择如下:- 如果A和B都选择合作,他们各自会被判处一年徒刑;- 如果A选择背叛而B选择合作,A会被判无罪释放,B将被判刑十年;- 如果A选择合作而B选择背叛,A将被判刑十年,而B会被判无罪释放;- 如果A和B都选择背叛,他们各自会被判刑五年。
三、策略分析在囚徒困境中,每个参与者都有两个选择:合作和背叛。
根据博弈论的思想,每个囚犯都应该选择对自己最有利的策略。
然而,这里的困境在于,如果每个囚犯只考虑自己的利益,那么背叛是最理性的选择。
因为无论对方选择什么,背叛都能给自己带来较轻的刑罚。
这衍生出了一个结果,即在理性选择的前提下,囚徒困境是一个导致双方都背叛的结果。
然而,如果两名囚犯能够进行合作,并在心理上互相信任和合作,那么他们将能够达成最佳的结果,即共同选择合作,各自只受到一年徒刑的处罚。
博弈论囚徒困境
博弈论囚徒困境
xxxxx
2
-
目录
CONTENTS
1 囚徒困境的基本概念
2 囚徒困境的起源
3 囚徒困境的原理
4 囚徒困境的实例
5 如何解决囚徒困境
6 结论
1
囚徒困境的基本概念
➢ 囚徒困境
囚徒困境的基本概念
➢ 是博弈论中一个非常著名 的问题,它描述了两个或 多个参与者在面临选择时 ,由于彼此之间的决策相 互影响,最终可能做出对 双方都不利的选择。这个 困境实际上是一种"纳什 均衡",即每个参与者都 认为自己的选择是最优的 ,但最终的结果却不是对 所有人都有利的
例如,在国际贸易中,各国可 以通过制定规则来限制贸易保 护主义措施的使用,从而避免
全球贸易萎缩的情况出现
如果各国之间能够进行 谈判并达成共识,那么 他们就可以避免陷入对
双方都不利的局面
6
结论
结论
囚徒困境是博弈论中一个非常经典的问题,它描 述了两个或多个参与者之间决策相互影响的情况
在现实生活中,囚徒困境有很多实例,例如国际贸易、环 境保护、军备竞赛等
这就是囚徒困 境的基本原理
4
囚徒困境的实例
囚徒困境的实例
囚徒困境在现实生活中有 很多实例,比如国际贸易、 环境保护、军备竞赛等
在这些情况下,各国可能 会因为彼此之间的决策相 互影响而陷入一种对所有 人都不利的局面
例如,如果各国都采取贸易 保护主义措施来保护自己的 产业,那么其他国家为了应 对这种局面也必须采取同样 的措施,最终导致全球贸易 萎缩、经济增长放缓
不利的局面
3
囚徒困境的原理
囚徒困境的原理
在囚徒困境中 ,每个参与者 都有两种选择 :合作或竞争
囚徒困境理论
囚徒困境理论囚徒困境是博弈论中一种经典问题,其理论对于研究合作与竞争的冲突具有重要意义。
本文将介绍囚徒困境理论的背景、问题描述以及可能的解决方案。
一、背景介绍囚徒困境理论最早由美国数学家A·W·塔克在1950年提出,后来由加拿大数学家梅尔文·邓纳姆发展完善。
它从博弈论的角度探讨了个体与整体之间的合作与竞争的问题。
囚徒困境是指在某些情况下,个体追求自身利益最大化会导致整体利益的减小,而合作对于整体利益的最大化是有利的。
二、囚徒困境的问题描述囚徒困境的典型情景是这样的:两名嫌疑犯被警方抓获,被控犯有一起抢劫案。
警察将两人分开审讯,没有足够的证据定罪,但如果两人都认罪,警方将对两人定罪,每人判5年监禁。
如果只有一个人认罪,而另一个人不认罪,认罪的人将被判10年监禁,不认罪的人将被判1年监禁。
两人都不认罪,警方只能以非法拘禁的罪名对两人各判刑3年。
这个问题给了每个嫌疑犯两个选择:合作或背叛。
合作即都不认罪,背叛即只有一个人认罪。
根据每个人的利益最大化原则,认罪是一个利于个体的选择,因为无论对方合作与否,认罪都能使自己的刑期缩短。
三、囚徒困境的解决方案囚徒困境的解决方案中,最为经典的是“互相背叛”的结果。
因为无论对方如何,背叛都能使个体的利益最大化。
在现实生活中,这种结果带来了相互不信任及合作无序的后果。
然而,有许多研究者在囚徒困境的研究中寻求寻找其他的解决方案。
其中最有名的是“互相合作”的策略。
这种策略的核心是建立信任,通过共同合作来达到整体利益的最大化。
如果嫌疑犯们能够相互合作,拒绝认罪,那么他们都可以只被判3年监禁,从而使得整体利益得到最大化。
这需要在囚徒困境中,个体放弃短期利益,选择合作,以求获得更大的长期回报。
四、囚徒困境理论的应用囚徒困境理论被广泛应用于多个领域,例如经济学、国际关系、生物学等。
在经济学中,囚徒困境理论被用来解释市场中的合作与竞争。
在国际关系中,它被应用于研究不同国家之间的合作与冲突。
经典的囚徒困境
经典的囚徒困境1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。
参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。
另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。
以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。
现实中囚徒困境的实例
现实中囚徒困境的实例引言囚徒困境是博弈论中一个经典的概念,用于描述在合作和背叛之间做出选择时所面临的困境。
在现实生活中,我们可以找到许多与囚徒困境相关的实例,这些实例涉及各个领域,包括社会、经济和政治等。
本文将通过几个具体案例来说明现实中囚徒困境的存在及其影响。
实例一:环保与经济发展环保与经济发展之间存在着一种常见的囚徒困境。
让我们以一个虚构的案例来说明这个问题。
假设某国政府面临着两个选择:A. 实施严格的环保政策;B. 推动经济发展。
如果该国采取A,将会对工业企业施加更严格的环保限制和监管措施,以减少污染和资源消耗;如果该国采取B,则会放松对工业企业的环保要求,鼓励更多投资和增加就业机会。
两种选择都有其利弊。
如果该国政府选择A,即采取严格的环保政策,工业企业将面临更高的成本和限制,可能导致一些企业无法承受而倒闭,从而造成失业问题。
另一方面,环境质量的改善将有益于整个社会,减少污染对人类健康的影响。
如果该国政府选择B,即推动经济发展,工业企业将会获得更多的自由和机会来扩大产能和利润。
然而,这可能导致环境污染的加剧和资源消耗的增加,给未来带来更大的环境问题。
在这种情况下,每个企业都希望其他企业采取环保措施,以便它们可以在竞争中获得更大的优势。
然而,在缺乏有效监管和合作机制的情况下,很少有企业愿意主动采取环保措施。
这就形成了一个囚徒困境:如果每个企业都不采取环保措施,则整个社会将面临更大的环境问题;但如果一个企业单独采取环保措施,它可能会在竞争中处于劣势。
解决这个困境需要政府与企业之间的合作和监管。
政府可以通过制定明确的环保政策和法规,并提供相应的激励措施,鼓励企业采取环保措施。
同时,政府还需要建立有效的监管机制,确保企业遵守环保要求。
只有在政府和企业之间建立起合作与监管的平衡,才能实现环保与经济发展的双赢。
实例二:合作与背叛合作与背叛是囚徒困境中另一个重要的概念。
让我们以一个实际的案例来说明这个问题。
博弈论经典案例
博弈论经典案例在我们的生活中,博弈论的应用无处不在。
从商业竞争到日常决策,从国际关系到体育比赛,博弈论的智慧都在发挥着重要作用。
接下来,让我们一起探讨几个经典的博弈论案例,深入理解其中的策略和思维。
案例一:囚徒困境假设有两个犯罪嫌疑人 A 和 B 被警方抓获,但警方并没有足够的证据证明他们的罪行。
于是,警方将两人分别关押在不同的房间进行审讯,并分别告知他们以下的规则:如果两人都保持沉默(不坦白),那么他们都将被判处较轻的刑罚,比如监禁 1 年。
如果一人坦白,而另一人保持沉默,那么坦白的人将被立即释放,而沉默的人将被判处 8 年监禁。
如果两人都坦白,那么他们都将被判处 5 年监禁。
对于 A 和 B 来说,他们都面临着两种选择:坦白或者沉默。
从 A的角度来看,如果 B 坦白,那么自己坦白将被判处 5 年监禁,沉默将被判处 8 年监禁,所以坦白是更好的选择;如果 B 沉默,那么自己坦白将被立即释放,沉默将被判处 1 年监禁,还是坦白更好。
同样的逻辑对于 B 也适用。
最终,两人往往都会选择坦白,尽管从整体上看,如果他们都保持沉默,两人的总刑期会更短。
这就是著名的囚徒困境,它反映了个体理性与集体理性之间的冲突。
在现实生活中,囚徒困境的例子也屡见不鲜。
比如,在商业竞争中,两个企业可能会面临是否降价的决策。
如果都不降价,可能都能保持较高的利润;但如果一方降价,而另一方不降价,那么降价的一方可能会抢占更多市场份额,不降价的一方则会损失市场。
因此,双方可能都会选择降价,导致整个行业的利润下降。
案例二:智猪博弈假设猪圈里有一头大猪和一头小猪,猪圈的一头有一个猪食槽,另一头安装着控制猪食供应的按钮。
按一下按钮会有 10 个单位的猪食进槽,但谁按按钮就会首先付出 2 个单位的成本。
而且,大猪吃的速度比小猪快。
如果小猪去按按钮,大猪在猪食槽边等待,那么当小猪跑回来时,大猪已经几乎吃光了 10 个单位的猪食,小猪只能吃到 1 2 个单位,扣除按按钮的 2 个单位成本,小猪是亏损的。
囚徒困境
囚徒困境(Prisoner's dilemma)•1 囚徒困境简介•2 经典的囚徒困境•3 一般形式•4 囚徒困境的应用•5 现实的例子◦5.1 政治学例子:军备竞赛◦5.2 经济学例子:关税战◦5.3 商业例子:广告战◦5.4 自行车赛例子•6 与囚徒困境相关的各事件◦6.1 异想◦6.2 “认罪减刑”不可行◦6.3 公用品悲剧•7 重复的囚徒困境◦7.1 学习心理学和博弈论囚徒困境简介囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
囚徒困境最早是由美国普林斯顿大学数学家阿尔伯特·塔克(Albert tucker)1950年提出来的。
他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最著名的案例。
故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。
在重复的囚徒困境中,博弈被反复地进行。
因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。
经典的囚徒困境-博弈策略
清楚地分析囚徒困境。
实验经济学常用这种博弈的一般形式分析各种论题。
以下是实现一般形式的其中一例:有两个参与者和一个庄家。
参与者每人有一式两张卡片,各印有“合作”和“背叛”。
参与者各把一张卡片文字面朝下,放在庄家面前。
文字面朝下排除了参与者知道对方选择的可能性1。
然后,庄家翻开两个参与者卡片,根据以下规则支付利益:一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。
二人都合作:各得3分(合作报酬)。
二人都背叛:各得1分(背叛惩罚)。
用支付矩阵表格展示支付如下(以红和蓝分别表示二参与者):一般形式囚徒困境的支付矩阵合作背叛合作3, 3 0, 5背叛5, 0 1, 1以“T、R、P、S”符号表示合作背叛合作R, R S, T背叛T, S P, P以“胜-负”术语表示合作背叛合作胜, 胜大负, 大胜背叛大胜, 大负负, 负简单博弈获得的点数可以得出一些一般化的结论。
T、R、P、S符号表符号分数解释T 5 单独背叛成功所得。
R 3 共同合作所得P 1 共同背叛所得S 0 被单独背叛所获若以T(Temptation)=背叛诱惑,R(Reward)=合作报酬,P(Punishment)=背叛惩罚,S(Suckers)=受骗支付,以个人选择得分而言,可得出以下不等式。
T>R>P>S 解:从5>3>1>0获得以上不等式若以整体获分而言,将得出以下不等式。
2R>T+S或2R>2P解:2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及单独背叛的共得5分,显然合作获分比背叛高。
合作在团体而言是支配性策略。
而重复博弈或重复的囚徒困境将会使参与者从注重T>R>P>S转变成注重2R>T+S。
就是说将使参与者脱离困境。
以上理论是道格拉斯·霍夫施塔特创建的。
在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。
日常生活中囚徒困境的例子
日常生活中囚徒困境的例子囚徒困境是博弈论中的一个经典问题,用来描述个体理性行为下的集体无序结果。
在日常生活中,我们可以找到许多类似囚徒困境的例子,来说明个人行为对整体利益的影响。
以下是十个囚徒困境的例子:1. 路边垃圾:每个人都知道不应该随意乱丢垃圾,但是如果每个人都不负责任地丢弃垃圾,最后导致整个环境变得肮脏不堪,影响到自己和他人的生活质量。
2. 交通堵塞:每个人都希望自己能够尽快到达目的地,但如果每个人都选择自私地占用道路空间或违规驾驶,最后导致交通堵塞,影响到整个交通系统的运行效率。
3. 考试作弊:每个人都知道作弊是不道德的行为,但是如果有人作弊,其他人可能会感到被不公平对待,从而受到影响。
如果每个人都选择作弊,整个考试制度将失去公正性和可信度。
4. 公共资源的过度使用:每个人都希望能够充分利用公共资源,但如果每个人都贪图私利,过度使用公共资源,最终导致资源匮乏,影响到所有人的利益。
5. 环境污染:每个人都应该对环境负责,但如果每个人都选择不负责任地排放废弃物或污染环境,最终导致整个环境受到破坏,影响到所有人的健康和生活质量。
6. 抢购现象:每个人都希望能够得到自己想要的商品,但如果每个人都选择抢购,最终导致商品供不应求,价格上涨,影响到消费者的利益。
7. 公共交通礼让:每个人都希望其他人能够礼让自己,但如果每个人都只顾自己,不愿主动让座或让行,最终导致公共交通秩序混乱,影响到所有人的出行体验。
8. 疫苗接种:每个人都希望自己和家人能够免受疾病侵害,但如果每个人都不接种疫苗,最终导致疾病的传播,影响到整个社会的健康和安全。
9. 道德缺失:每个人都希望生活在一个正直、诚实的社会中,但如果每个人都违背道德规范,不守信用,最终导致整个社会失去信任,影响到人与人之间的关系。
10. 共享经济的争议:每个人都希望从共享经济中获得便利和利益,但如果每个人都只顾自己,不考虑共享经济的整体利益,最终导致共享经济平台的不稳定和失衡,影响到所有人的使用体验。
囚徒困境的生活例子
囚徒困境的生活例子
某市有两个电厂,分别由两家能源公司运营。
这两家公司都可以选择是否要购买先进的污染减排设备,这种设备价格昂贵。
如果两家公司都购买设备,则可以实现环保减排,推动清洁能源的发展,但如果其中一家公司不购买设备,另一家公司将面临更大的成本和生产压力,加重环境污染。
如果两家公司都不购买设备,虽然短期内可以减少成本,但长期来看,环境污染将越来越严重,甚至会造成生态破坏和健康问题。
所以,两家公司面临着密切博弈的困境:如果双方都购买设备,则双方都能受益,如果其中一家购买设备而另一家不购买,则购买设备者将会面临更大的成本和生产压力,成为囚徒的输家。
而如果双方都不购买设备,则双方都将受到损失。
这就是一个经典的囚徒困境案例:两方都只考虑自己的利益,并不知道对方的决策,因此很难在彼此之间建立信任和合作,而合作又是解决问题的最佳途径。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
经典的囚徒困境1950年,由就職於兰德公司的梅里尔·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式阐述,並命名为「囚徒困境」。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但沒有足够证据指控二人入罪。
於是警方分开囚禁嫌疑犯,分别和二人见面,并向雙方提供以下相同的选择:∙若一人認罪並作证检控對方(相關術語稱「背叛」對方),而對方保持沉默,此人将即時獲释,沉默者将判監10年。
∙若二人都保持沉默(相關術語稱互相「合作」),则二人同樣判监半年。
∙若二人都互相检举(互相「背叛」),則二人同樣判監2年。
用表格概述如下:解說如同博弈論的其他例證,囚徒困境假定每個參與者(即「囚徒」)都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。
參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為「嚴格劣勢」,理性的參與者絕不會選擇。
另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由於隔絕監禁,並不知道對方选择;而即使他们能交谈,還是未必能夠盡信對方不會反口。
就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。
試設想困境中兩名理性囚徒會如何作出選擇:∙若對方沉默、我背叛會讓我獲釋,所以會選擇背叛。
∙若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。
二人面對的情況一樣,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是兩種策略之中的支配性策略。
因此,这場博弈中唯一可能达到的纳什均衡,就是雙方参与者都背叛對方,結果二人同樣服刑2年。
这場博弈的纳什均衡,顯然不是顧及團體利益的帕累托最优解决方案。
以全体利益而言,如果两个参与者都合作保持沉默,兩人都只會被判刑半年,总体利益更高,結果也比兩人背叛對方、判刑2年的情況較佳。
但根據以上假設,二人均為理性的個人,且只追求自己個人利益。
均衡狀況會是兩個囚徒都选择背叛,结果二人判监均比合作為高,總體利益較合作為低。
这就是“困境”所在。
例子華麗地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
固定局數的囚徒困境試想像囚徒困境的情況進行十次。
我們可以合理地設想,如果囚徒第一次被對方指控,第二次這個囚徒也會指控對方。
相反,如果第一次別人保持沉默,建立了互信的關係,你也會保持沉默,達致帕累托最优。
當然,兩個囚徒都會有相似的想法,在第一局保持沉默,以期望建立互信關係,所以雙方都會保持沉默。
第二局時,雙方亦應有相似的想法,繼續保持沉默,以期繼續在互信的情況下進行第三局,以致餘下的八局。
這種想法合理嗎?在第十局時,互信的關係明顯是没有意義的,因為十局已經完結,囚徒没有必要為維持互信的關係而沉默(没有第十一局),所以第十局囚徒一定會背叛對方的,理由和只有一局囚徒困境一樣。
問題是,既然大家都知道在第十局,無論如何對方都會背叛自己的,你在第九局保持沉默也是没有意思的,要知道,保持沉默(友好關係)的原因是為了希望下一局別人保持沉默。
所以第九局雙方都一定會背叛對方的。
下一個問題是,雙方都有相同的想法,明知第九局對方會背叛自己,所以第八局保持沉默也是没有意思的,第七局亦然,如此類推,纳什均衡是十局都會互相背叛,建立互信關係是没有可能的。
只有在囚徒困境的局數大家都不肯定的情況下,上述的推論才不會發生,才會出現互相保持沉默的現象。
一般形式整理囚徒困境的基本博弈结构,可更清楚地分析囚徒困境。
实验经济学常用這種博弈的一般形式分析各种论题。
以下是實現一般形式的其中一例:有两个参与者和一个庄家。
参与者每人有一式两张卡片,各印有“合作”和“背叛”。
参与者各把一张卡片文字面朝下,放在庄家面前。
文字面朝下排除了參與者知道對方選擇的可能性1。
然后,庄家翻开兩個参与者卡片,根據以下規則支付利益:∙一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。
∙二人都合作:各得3分(合作报酬)。
∙二人都背叛:各得1分(背叛惩罚)。
简单博弈获得的点数可以得出一些一般化的结论。
T、R、P、S符号表符号分数英文中文(非术语)解释T 5 Temptation 背叛诱惑单独背叛成功所得。
R 3 Reward 合作报酬共同合作所得P 1 Punishment 背叛惩罚共同背叛所得S 0 Suckers 受骗支付被单独背叛所获若以T(Temptation)=背叛诱惑,R(Reward)=合作报酬,P(Punishment)=背叛惩罚,S(Suckers)=受骗支付,以个人选择得分而言,可得出以下不等式。
T>R>P>S(解:从5>3>1>0获得以上不等式)备。
似乎自相矛盾的是,雖然增加軍備會是兩國的「理性」行為,但结果卻顯得「非理性」(例如會对经济造成都有损坏等)。
这可視作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。
经济学例子:关税战两个国家,在关税上可以有以两个选择:当一国因某些因素不遵守关税协定,而独自提高关税(背叛)时,另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。
然后二国又重新达成关税协定。
(重复博弈的结果是将发现共同合作利益最大。
)商业例子:广告战商业活动中亦会出现各种囚徒困境例子。
以广告竞争为例。
两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。
但若二者同时期发出质量类似的广告,收入增加很少但成本增加。
但若不提高广告质量,生意又会被对方夺走。
此二公司可以有二选择:1.互相达成协议,减少广告的开支。
(合作)2.增加广告开支,设法提升广告的质量,压倒对方。
(背叛)若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。
在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。
自行车赛例子自行车赛事的比赛策略也是一种博弈,而其结果可用囚徒困境的研究成果解释。
例如每年都举办的環法自由車賽中有以下情况:选手们在到终点前的路程常以大队伍(英文:Peloton)方式前进,他们采取这策略是为了令自己不至于太落后,又出力适中。
而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。
通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作),使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其他选手以及大队伍就会趕上(共同背叛)。
而通常的情况是,在最前面次数最多的选手(合作)通常会到最后被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比较不费力。
与囚徒困境相关的各事件异想威廉·庞德斯通(William Poundstone)在他的著作中,以一新西兰的例子来说明囚徒困境。
在新西兰,报亭既无管理员也不上锁,买报纸的人自行放下钱后拿走报纸。
当然某些人可能取走报纸却不付钱(背叛),但由于大家认识到如果每个人都偷窃报纸(共同背叛)会造成以后不方便的有害结果,这种情形很少发生。
这例子特别之处是新西兰人并没有被任何其他因素影响而能脱离囚徒困境。
并没有任何人特别去注意报亭,人们守规则是为了避免共同背叛带来的恶果。
这种避免囚徒困境的大家共同的推理或想法被称为“异想(magical thinking)”。
[3]“認罪減刑”不可行囚徒困境的结论是许多国家中認罪減刑(英文:plea bargain)被禁止的原因之一。
囚徒困境带来的结论是:如果有二个罪犯,其中一人犯罪而另外一人是无辜的,犯罪者会为了减刑坦白一切甚至冤枉清白者(单独背叛)。
最糟糕的情况是,如果他们二人都被判入狱,坦白的犯罪者刑期少,坚持无罪的冤枉者刑期反而更多。
公用品悲劇现实的博弈参与者不只一方,会有多方参与的囚徒困境。
加勒特·詹姆斯·哈丁(Garrett James Hardin)的公用品悲劇就是一例:「公用品悲劇是指凡是屬於最多數人的公共财产常常是最少受人照顧的事物」,例如渔业,公海中的鱼是属于公共的,而在本身不滥捕其他人也滥捕的思想下,渔民会没有节制的大捞特捞,结果海洋生态破坏,渔民的生计也受影响(共同背叛的结果)。
但是,多方囚徒困境的提法有待商榷,因为其总是可以被分解为一组组经典的二方囚徒困境。
就是说只有二方的囚徒困境,没有多方的。
所谓多方的囚徒困境只是由多个二方囚徒困境混杂在一起而形成的错觉。
重复的囚徒困境罗伯特·阿克塞尔罗德在其著作《合作的进化》中,探索了经典囚徒困境情景的一个扩展,并把它称作“重复的囚徒困境”(IPD)。
在这个博弈中,参与者必须反复地选择他们彼此相关的策略,并且记住他们以前的对抗。
阿克塞尔罗德邀请全世界的学术同行来设计计算机策略,并在一个重复囚徒困境竞赛中互相竞争。
参赛的程序的差异广泛地存在于这些方面:算法的复杂性、最初的对抗、宽恕的能力等等。
阿克塞尔罗德发现,当这些对抗被每个选择不同策略的参与者一再重复了很长时间之后,从利己的角度来判断,最终“贪婪”策略趋向于减少,而比较“利他”策略更多地被采用。
他用这个博弈来说明,通过自然选择,一种利他行为的机制可能从最初纯粹的自私机制进化而来。
最佳确定性策略被认为是“以牙还牙”,这是阿纳托尔·拉波波特(Anatol Rapoport)开发并运用到锦标赛中的方法。
它是所有参赛程序中最简单的,只包含了四行BASIC语言,并且赢得了比赛。
这个策略只不过是在重复博弈的开头合作,然后,采取你的对手前一回合的策略。
更好些的策略是“宽恕地以牙还牙”。
当你的对手背叛,在下一回合中你无论如何要以小概率(大约是1%-5%)时而合作一下。
这是考虑到偶尔要从循环背叛的受骗中复原。
当错误传达被引入博弈时,“宽恕地以牙还牙”是最佳的。
这意味着有时你的动作被错误地传达给你的对手:你合作但是你的对手听说你背叛了。
通过分析高分策略,阿克塞尔罗德指定了策略获得成功的几个必要条件。
友善最重要的条件是策略必须“友善”,这就是说,不要在对手背叛之前先背叛。
几乎所有的高分策略都是友善的。
因此,完全自私的策略仅仅出于自私的原因,也永远不会首先打击其对手。
报复但是,阿克斯洛德主张,成功的策略必须不是一个盲目乐观者。
要始终报复。
一个非报复策略的例子是始终合作。
这是一个非常糟糕的选择,因为“下流”策略将残酷地剥削这样的傻瓜。