摆脱“囚徒困境”对策研究
囚徒困境的破解方法

囚徒困境的破解方法囚徒困境是一种博弈论中经常出现的情形,它描述了两个合作囚犯在被分开审讯的情况下面临的选择。
在这种情况下,每个囚犯都面临着合作和背叛的选择,而他们的最终结果又取决于对方的选择。
在现实生活中,囚徒困境不仅仅存在于刑事案件中,也存在于商业竞争、国际关系等各个方面。
如何破解囚徒困境,实现合作共赢,是一个重要的课题。
下面我们将从几个方面来探讨囚徒困境的破解方法。
首先,建立信任是破解囚徒困境的关键。
在囚徒困境中,囚犯之间缺乏信任,这导致他们往往会选择背叛对方,以谋求个人利益的最大化。
而在现实生活中,建立信任同样是破解囚徒困境的关键。
只有建立起相互信任的基础,才能够实现合作共赢的局面。
因此,各方在面临困境时,应该努力去建立彼此之间的信任,而不是陷入相互猜疑的怪圈之中。
其次,加强沟通是破解囚徒困境的重要手段。
囚徒困境的产生往往与信息不对称有关,当双方缺乏有效的沟通渠道时,很容易导致误解和冲突的产生。
因此,在面对困境时,各方应该加强沟通,及时交流信息,消除误解,寻求共识。
只有通过充分的沟通,才能够找到最适合双方利益的解决方案,从而打破囚徒困境的局面。
再次,建立有效的激励机制也是破解囚徒困境的关键。
在囚徒困境中,囚犯之间缺乏有效的激励机制,这导致他们往往会选择短期个人利益的最大化,而忽视长期合作带来的利益。
在现实生活中,同样需要建立起有效的激励机制,激励各方共同合作,共同谋求长远利益。
只有通过建立有效的激励机制,才能够真正地破解囚徒困境,实现合作共赢的局面。
最后,建立良好的制度约束也是破解囚徒困境的重要手段。
在囚徒困境中,缺乏有效的制度约束,导致囚犯往往会选择背叛对方,以谋求个人利益的最大化。
在现实生活中,同样需要建立良好的制度约束,约束各方的行为,防止其陷入囚徒困境的怪圈之中。
只有通过建立良好的制度约束,才能够有效地防止囚徒困境的产生,实现合作共赢的局面。
综上所述,囚徒困境的破解方法包括建立信任、加强沟通、建立有效的激励机制和建立良好的制度约束。
通证破解囚徒困境难题

International Financing
May 2019 国际融资
Token Solves the Prisoner’s Dilemma
通证破解囚徒困境难题■源自陈源 戴剑人与动物区分的非常重要的一点协作就是大规模协作。协作也是现今商业 社会极度缺乏的资源。本文通过分析合作困境,找寻解决方案,并通过现实的 案例进行了解析
释,沉默者因抗拒从严而被重判入 狱20年;若互相揭发,则因证据确 实,二人各判10年监禁。
两个合作者进行博弈后,两者 均获得“奖励”; 两个背叛者进行 博弈后,两者均获得“惩罚”; 当 合作者与背叛者进行博弈后,背 叛者获得“诱惑”,而合作者则获 得“被骗”。相比之下,两个囚徒 都拒供是对他们最好的结果,都供 认是最糟糕的结果。但是,这个对 两个囚徒都好的结果实际上很难发 生。因为每个囚徒都会发现:
囚徒困境通常被看作是个人理 性和集体理性冲突的经典情形。因 为在囚徒困境的局势之下,每个人 根据自己的利益做出的决策,但最 后的结果却是集体遭殃。现实中的 诸多问题和现象都是囚徒困境的翻 版。比如:厂商之间的价格战,价 格同盟,军备竞赛,公地的悲剧, 团队中的偷懒卸责行为,学校教育 中的应试教育的问题等。
合作演化的解
自20世纪60年代以来,人们为了 研究广泛存在的协作行为,学界做了 如下的探索。比如亲缘选择,直接互 惠、间接互惠、空间互惠,以及群组 选择等。我们从下面几个角度分别讨 论合作演化的机理。
直接互惠 直接互惠:通俗的理解就是 “今天我帮你,明天你帮我”,他 指的是两个个体间相互帮助的情 景。这个合作的模式需要两个个体 有重复博弈的机会。重复博弈的机 会越大合作的机会就越大,显正相 关性。 依据这个模型设计的一个典型 的策略就是“针锋相对”。他是由 英国数学家、生物学家R a p o p o r t 提出的,并在A x e l r o d 锦标赛中 夺冠。其策略非常简单:初始博弈 的时候个体采取合作策略,然后在 接下来的演化中,个体都将重复对 手上一步所使用的策略,即针锋相 对,或者说以牙还牙。研究结果表 明,这种策略能够有效地抑制背叛 策略的传播和蔓延。但这种策略也
囚徒困境的破解方法

囚徒困境的破解方法囚徒困境是一种经典的博弈理论,描述了两个合作者在缺乏沟通和合作的情况下如何面对决策。
在这种情况下,每个人都面临着合作和背叛的选择,而选择的结果会直接影响到双方的利益。
如何在囚徒困境中找到破解的方法,是一个备受关注的问题。
下面将探讨一些破解囚徒困境的方法。
首先,要建立信任。
在囚徒困境中,缺乏信任是导致合作失败的主要原因之一。
因此,要想破解囚徒困境,首先需要建立起双方之间的信任。
只有建立了信任,双方才能够在合作中放下戒备,共同谋求最大化的利益。
其次,要加强沟通。
在囚徒困境中,缺乏有效的沟通是导致合作失败的另一个重要原因。
双方需要通过充分的沟通,了解彼此的意图和利益,才能够更好地协调行动,避免陷入背叛的局面。
此外,要建立长期合作的意识。
囚徒困境通常是一个单次博弈的情况,但在现实生活中,人们往往会面临多次博弈的情况。
因此,要想破解囚徒困境,双方需要树立长期合作的意识,不仅要考虑眼前的利益,还要考虑未来的合作机会,从而形成稳定的合作关系。
最后,要建立有效的激励机制。
在囚徒困境中,双方往往会因为利益的诱惑而选择背叛对方,因此需要建立起有效的激励机制,对合作者给予适当的奖励,从而增强合作的动力,降低背叛的成本。
总之,囚徒困境是一个复杂而又普遍存在的问题,要想破解囚徒困境,需要双方共同努力,建立信任、加强沟通、树立长期合作的意识,建立有效的激励机制,从而实现合作共赢的局面。
希望以上方法能够对破解囚徒困境有所帮助。
论文

打破“囚徒困境”——合作行为和社会发展囚徒困境作为博弈论的一个经典案例,涉及经济学、管理学、哲学等各种领域,囚徒困境不仅仅体现在《博弈论》一本简单的书本里,透过书本,我们也能抓住在实际生活中人与人合作的本质,我们在自以为选择了最优结果的时候,是否考虑到自己也许就是其中的一个囚徒呢。
囚徒困境经典案例分析囚徒困境的主要内容是说:两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。
警察知道两人有罪,但缺乏足够的证据。
警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。
于是,每个囚徒都面临两种选择:坦白或抵赖。
拿表格具体表现如下:甲抵赖甲坦白乙抵赖两人各判刑一年甲释放;乙判刑10年甲、乙两人判刑8年乙坦白乙释放;甲判刑10年如果他们可以串通则答案显而易见,甲、乙都抵赖同时获刑一年,但是两个囚徒一旦被隔离开,并且不可以相互交流,即任何一人在选择策略时都不知道另外一人的选择,于是在不可以交流的情况下,两个囚徒各人追求自己利益的最大化,双方难以确信对方可以“合作”,沉默可能被出卖获刑10年,坦白相对来说可能获刑8年甚至被释放,结果双方都选择了自己觉得合理的决定,结果两个都因为坦白各自获刑8年,他们达到了团体最优结果了吗?显然并没有。
郑也夫说过:“理性的个人,加在一起成了非理性的社会”。
“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低集体的利益,我们在实现个人利益最大化的情况下,损害了集体的利益。
有人可能会认为:囚徒困境只是“象牙之塔”中的理论家虚构的一种“思想游戏”,或者根本不可能在现实发生的特例,这是一种对理论的极大错觉。
囚徒困境最初确实是“象牙之塔”中的“抽象理论思维”的产物,但是随着研究的深入,人们愈来愈感受到它同现实世界息息相关。
囚徒困境的实例解析在现实生活中,这种博弈时时刻刻在发生。
囚徒困境的推理方法基础

囚徒困境的推理方法基础
囚徒困境的解法:
一、双方达成合作协议:确保公平和正义。
合则两利,分则两伤。
在囚徒困境中,如果双方可以见面交流,达成合作,那么双方就会实现利益最大化。
这可见交流合作,达成协议,是解决囚徒困境的重要条件。
在双方达成合作协议时,一定要确保公平和正义。
不然协议纵使达成,一方不免心怀怨恨,极可能打破合作协议。
二、保证双方不变卦。
害人之心不可有,防人之心不可无。
为保证双方不变卦,双方可以寻找外部的权威人士来促成合作并守护公平。
当农民工遇到不良老板,恶意克扣及延发农民工工资,农民就会寻找劳动部门以解决纠纷。
此时,劳动部门就相当于外部的权威人士,保证了合作协议的进行。
“囚徒困境”的解决办法

一个决策过程:假如我招了, 他也作均衡实际上是陷入僵局的一种招了, 我们都坐5年牢。
我招了, 他均衡, 在这种均衡里, 双方都采取了不合作的态度, 每个人首先想到不招, 我就只坐3个月;他招了, 我的都是自己的利益, 进行的都是有不招, 我就会坐10年牢。
所以不管利于自己的选择决策, 但最后的结他招不招, 对我来说都是招了划果, 不仅没有使自己获利, 而且还算。
两个人都动了这样的脑筋, 最损害了对方的利益, 最后大家共同终都选择了招供, 结果都被判5年损失。
刑。
而原本对两人都有利的策略前些年, 我国彩电市场上, 为(抵赖)和结局(被判1年刑)则了各自利益的最大化, 每一个厂家不会出现。
都像囚徒那样进行了一番选择:我的家乡也有一个类似的故如果我降价, 我可以赢得更大的市事:两个人分别叫黑蛋和白蛋, 在场;如果我不降价, 别人降价了, 一个漆黑的夜晚要共同去装一车别人就会占领更大的市场。
因此粪。
黑蛋带了一把炭锨(加炭用不论别人怎样, 对于我来说, 降价的, 锨头不到巴掌大小), 反正天都是最优选择。
当每一个厂家都黑看不见, 装作很卖力的样子, 每这样选择的时候, 彩电市场打起了往车上撂一锨粪, 嘴里就发出“嗨国外有一个故事:一天, 一一轮又一轮的价格战。
最后大家吆”的声音, 还把炭锨在车厢上个富翁在家中被杀, 财物被盗。
警都遭受到重大损失。
“咣”的磕一下。
白蛋也很卖力, 方在破案的过程中, 抓到两个嫌疑还有些企业, 为了利润最大嘴里使劲的同时, 车厢也发出很响犯汤姆和彼得, 并从他们的住处搜化, 降低员工待遇;而员工为了获的声音。
黑蛋暗自高兴, 并暗骂白出丢失的财物。
可他们矢口否认得高薪和自身发展, 频频跳槽, 结蛋傻瓜。
过了很长时间, 黑蛋用手曾杀过人, 于是警方将两人隔离审果双方都遭受损失。
去摸车厢, 还差很远。
后来又摸了讯, 分别对他们说, 你们的偷盗罪所以成功不是一个人的事, 几次, 车厢总不见满。
囚徒困境的论文

走出“囚徒困境”囚徒困境作为博弈论中的一个经典范例,其博弈理论逐渐被经济学、哲学、伦理学、管理学等诸多学科的研究所重视,辩证的看待这一研究现象,是促进人们深入研究相关社会现象的一种特殊的思维路劲和方法。
一、囚徒困境经典案例分析囚徒困境的内容是这样的:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时做出的。
博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因此只能实现对他们都不理想的结果(各判2年),并且这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒困境”。
“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。
但是这样的分析是基于单次博弈的基础之上,而在重复的囚徒困境中,博弈会被反复的进行,因而没个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
二、类似囚徒困境的经典案例分析在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。
囚徒困境的破解方法

囚徒困境的破解方法囚徒困境囚徒困境是博弈论的一个重要概念;意思是两个合谋犯罪的人被警察抓住,关在两个单独的牢房里,无法互相交流。
警方给了两名嫌疑人三个选择:一是两人都没有交代罪行,根据掌握的证据,各判两年;二是两人都坦白自己的罪行,根据已经掌握的证据和新坦白的罪行,可能判四年;第三,一个什么都没坦白,另一个罪犯选择背叛搭档,坦白自己的罪行。
认罪立功,当庭释放。
另一个将被判六年。
从共同利益出发,两个嫌疑人都守口如瓶,共同掩盖罪行,才是最好的结果。
他们每个人只在里面呆两年。
但从个人利益来说,你肯定是希望自己认罪,而你的同伙什么都不会告诉你,这样你就无罪释放了。
从个人角度来说,这是一个理性的选择。
但是,每个人都会这么想,都会考虑自身利益的最大化。
最终两人都供认了自己的罪行,但都没有被判无罪,加重了罪行,被判了四年。
人性是自私的;每个人都期望自己的利益最大化,但是这些追求自身利益最大化的理性选择,最终的结果是没有人获利。
对个人来说理性的决定对集体来说是不理性的。
在商业上,类似的案例比比皆是;创业,大家激情澎湃,勇往直前,企业利润蒸蒸日上。
不能长久;在利益面前,一些人开始盘算如何让自己的利益最大化。
于是,相互怯懦、荣辱与共的创业激情不再;取而代之的是团队之间的猜忌和内斗。
企业的经营也停滞不前,甚至分崩离析。
最终,短期内可能会有人的利益最大化。
但是集体利益严重受损。
长期来看,即使是那些短期可能盈利的,长期收益也会缩水甚至消失。
个人所谓的理性选择,导致集体利益的损失;如何解决囚徒困境,促使我们选择合作,在集体层面做出理性决策?密歇根大学数学心理学教授拉波波特发明了一个非常简单的策略:以眼还眼,以牙还牙。
具体来说,有两个步骤:1.一开始,选择合作。
2.在后续的沟通中,你要像他上次对待你那样对待他。
这就是所谓的“以眼还眼,以牙还牙”,用这个策略和对方互动几次之后,对方就会开始主动选择合作了,这就是囚徒困境的破解。
社会科学中的囚徒困境现象及其解-2019年精选文档

社会科学中的囚徒困境现象及其解、囚徒困境与外部性人是社会关系的总和。
所谓的“鲁滨逊”式的人只是一种假设世界无摩擦的理想世界,人类社会的进步史在一定意义上也是部社会的分工史。
从原始社会到现代社会,社会分工已经极度精细化。
而这种分工不是说人们之间的合作减少了,相反地,这种分工是建立在更为紧密的合作的基础之上:人们通过分工生产更为专业化的商品,用来同其他人生产的商品进行组合,生产出最终产品;或者与其他人生产的商品进行交换获得自己需要的产品。
从这个意义上来说,“合作”是人类社会的主题之一。
但现实世界中,人类很多的行为会伤害到他们之间的合作,如欺诈、掠夺、偷盗以及敲竹杠(holdup) 以及搭便车(free rid ,er) 等,我们称这类行为具有外部性(externality) 。
现实世界中,人们的行为选择都或多或少地具有外部性特征,当我们把外部性问题形式化表达时,发现它们大多可以表达为囚徒困境(prisoner's dilemma) 的形式。
囚徒困境中每个囚徒的行为选择都会影响到另一个人的收益,如一囚徒选择合作(不坦白) ,则此行为对另一囚徒具有正的外部性;如他选择不合作( 坦白) ,则会给另一囚徒带来负的外部性。
当行为选择具有正的外部性,而又不能保证这种正外部性的排他性”和“竞争性”时,这种正的外部性则会带来搭便车行为,因为其他人可以不付出或少付出努力就可获得外部性收益。
而搭便车行为就是一个典型的囚徒困境问题。
当行为选择具有负外部性时,若没有合适的机制来对此进行制约,则会造成私人成本与社会成本的不一致,从而个人利益的最优会损害社会利益的最优。
而个人利益与社会利益的不一致正是囚徒困境表达的内容:当每个囚徒都追求个人利益最大化时,选择不合作策略是一个严格占优策略,尽管这种策略不是社会最优的。
这也表明,这种外部性问题可以形式地表达为囚徒困境问题。
囚徒困境问题部分地否定了Smith 的思想。
Smith(1776) 认为,人们在追逐个人利益时,会在无意中促进整个社会利益;而囚徒困境问题告诉我们,个人在追求个人利益时,常常损害了社会利益。
【项目管理知识】让管理者摆脱“囚徒困境”

让管理者摆脱“囚徒困境”随着市场竞争的深入,企业管理从粗放到规范精细成为一种必然,然而实践中的精细化程度总是难以尽如人意。
管理者并非不知道管理规范性和精细化的好处,只是缺乏践行管理精细化的推动力,常常陷入“囚徒困境”式的选择,担心难以实现预想的价值均衡而白费精力。
因而促使管理者摆脱“囚徒困境”,克服通过粗放管理侥幸取胜的诱惑,应当成为管理精细化的当务之急。
管理者的选择困惑负责任的管理者当然明白“细节决定成败”的道理,然而他们也深知在社会经济体制转换的过渡阶段,实行精细化管理的同时也要防止别人粗放式管理的侵袭。
这就使我们想起了西方经济学中经常提及的“囚徒困境”。
在两个被分别关押的囚徒之间,他们将受到的制裁的轻重不仅取决于自己的认罪态度,也取决于同伙的认罪态度。
为了减轻自己所可能受到的制裁,在同伙间缺乏合作诚信,又无法沟通的情况下,每个囚徒都在决定自己是坦白还是不坦白的策略选择上左右为难,这就是所谓的“囚徒困境”。
如此说来,管理者在“囚徒”式的困境中,精细化管理就相当于囚徒的“坦白”,继续实行粗放式管理就相当于“不坦白”。
“囚徒困境”中所反映的关联性:“两个自由意志可以自行选择影响到双方的策略”,必然反映在单个企业实行精细化管理的策略选择上。
也就是说,实行精细化管理能否取得优效果,并不是单个管理者能够完全把握住的事情。
假如甲企业的管理者准备通过精细化管理提高企业效益,但是他并不知道乙企业的管理者是否也和自己一样放弃粗放式管理,如果乙企业继续实行粗放式管理能够不断扩大市场份额,而甲企业单独实行精细化管理反而受到挤压,甲企业的管理者选择实行精细化管理的策略就会感到风险很大,缺乏实行和继续坚持管理精细化的动力。
摆脱选择困惑的途径加大对品牌精品的支持力度,促进社会资源的组合。
管理者努力推进和实践管理精细化,一方面需要树立靠质量取胜的坚定信念和为社会多做奉献的价值追求,真诚地承担起应尽的社会责任,把管理精细化当作事业来做,而不是像“囚徒”那样把“坦白”当作减刑的策略。
囚徒困境与走出囚徒困境

囚徒困境与走出囚徒困境引言:在一堂课中,一个小组讲到了囚徒困境这问题,老师当堂随机提问了两位同学,一位同学的回答是选择背叛检举对方,另一位同学的回答是不检举对方。
而我所说的“另一位同学”也就是我,当这个问题出现的时候,我的脑海里先浮现的是不检举对方,对于这个问题,我就在考虑如果我背叛了对方,那么我么两个人的刑期之和将会大大增加,如果我不检举对方,对方也不检举我,那么我们两个人将会之服刑期一年,这样我们两个人也就是一个集体所能够达到的利益才是最大的。
但是在博弈论中,按照纳什均衡的理论,我的这个选择说明我不是一个理性的个体,所以我将会在此讨论一下囚徒困境的问题一、囚徒困境囚徒困境是这样一个问题,问题的背景是警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(也就是背叛对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(也就是双方合作),则二人同样判监1年。
若二人都互相检举(背叛),则二人同样判监8年。
表格1囚徒困境结果乙合作乙背叛甲合作甲1年,乙1年甲10年,乙0年甲背叛甲0年,乙10年甲8年,乙8年这个困境成立的条件:1.甲乙两人分开囚禁,不能互通信息2.两个人都知道规则与结果3.每个人都是一个理性的个体。
所以大部分人在看到这个问题的时候都会有这样的分析:如果对方选择合作,我选择合作,那么我们都会一年刑期,我选择背叛呢,那么我将会被释放。
如果对方选择背叛,我也只有选择背叛才会让自己的兴起最短。
根据纳什均衡,每个囚徒都是理性的个体(即追求自身利益的最大化,并不关心其他人自身的利益),只会选择利益最大的一个选项(即背叛),这样的一个结果出现的一个基本条件就是两个囚徒并不能够相互串通,所以他们只能相互揣摩对方的心里来选择一个最佳的答案。
正是因为两个人面对的情况一样,两个理性的个人作出的选择也都一样,所以囚徒的困境才会出现(即两个人选择的结果都为背叛),也就达到了纳什均衡。
如何突破囚徒困境?

如何突破囚徒困境?1950年,美国普林斯顿大学数学家阿尔伯特•塔克(Albert tucker)编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最著名的案例。
故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
那么,囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于被分开监禁,并不知道对方的选择;而且即使他们能订立攻守同盟,也未必能尽信对方不会反咬。
在现实中,这样的例子很多,两个人作案前发誓相约一旦被抓,要守口如瓶,不出卖对方,但在警方三审两审之后,就都扛不住招供了。
因为就个人的理性选择而言,出卖背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:• 若对方沉默、我选择背叛会让我获释,所以我该选择背叛。
• 若对方背叛指控我,我也要指控对方才能得到较低的刑期——八年,所以也应选择背叛。
• 所以无论对方是沉默还是背叛,至少我能得到次好的结果——被判八年,但如果我沉默而对方选择坦白,则我将面临最坏的结果被判十年。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是两种策略之中的支配性策略,不依赖于对方的合作,不依赖于对方的守约行为。
因此,这场博弈中唯一可能达到的均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。
在囚徒困境中,如果两个囚徒都拒绝坦白,则二人都能获得最少刑期一年,所以都不坦白,是能让两个囚徒获得共赢结果的唯一方案,也说明个人最佳选择并非团体最佳选择。
但如何才能得到最优的共赢结果呢?黑手党的招数曾非常有效地破解了警方设置的囚徒困境,首先,黑手党组织将忠实视为成员必须具备的最重要的品质,组织内的提升必会考虑其对组织的忠诚度,同时,一旦有组织成员出卖自己人,黑手党组织将不惜代价,天涯海角地追杀背叛者。
囚徒困境的破解方法

囚徒困境的破解方法
囚徒困境是博弈论中的经典问题,涉及到两名囚徒在独立的审判中如何作出合作与背叛的决策。
在囚徒困境中,每个囚徒都面临着合作与背叛之间的抉择,而最优的结果是两人都合作。
然而,由于缺乏信任和可能的坦白窃取,各方往往会选择背叛,导致最不理想的结果。
为了破解囚徒困境,有几种策略和方法可以被采用:
1. 进行重复博弈:在重复进行博弈的情况下,囚徒有机会观察和记住对方的行为。
这使得合作成为可能,因为囚徒们知道背叛可能会导致连续的背叛,从而带来更坏的结果。
这种重复博弈策略也被称为“赌咒策略”,因为它基于对对方决策的观察和回应。
2. 使用策略性沟通:囚徒可以通过策略性的沟通来建立信任和合作,从而避免陷入困境。
例如,囚徒可以告诉对方他们打算合作,并建议对方也选择合作来达到双方的最佳利益。
这种沟通可以增加囚徒之间的合作概率。
3. 设定奖惩机制:引入奖励和惩罚机制可以激励囚徒选择合作。
例如,如果两个囚徒都选择合作,他们可以获得共同的奖励。
另一方面,如果一个囚徒选择背叛而另一个囚徒选择合作,背叛的囚徒将受到严厉的惩罚。
这样的奖惩机制可以鼓励囚徒们选择合作而不是背叛。
4. 采用心理战略:通过使用心理战略,囚徒可以影响对方的选
择。
例如,他们可以表现出决心和信心,让对方相信他们会选择背叛。
这样一来,对方可能会害怕风险而选择合作,以避免被背叛。
总的来说,囚徒困境的破解方法通常基于建立信任、引入奖惩机制以及采用心理战略等策略,目的是为了激励各方选择合作,从而达到最有利的结果。
论纳什均衡与“囚徒困境”的解决方式论文

论纳什均衡与“囚徒困境”的解决方式摘要本文对于“囚徒困境”与纳什平均进行了简要分析,提出了静态博弈中要找出自己的优势策略以及动态博弈中合作重要性的观点。
关键词:“囚徒困境”优势策略合作一、“囚徒困境”博弈及其纳什均衡“囚徒困境”博弈是图克(Tucker)1950年提出的一个著名的博弈模型,是完全信息静态博弈的典型例子。
囚徒困境博弈的基本情况如下:警察抓住了两个合伙犯罪的罪犯,但却缺乏足够的证据指证他们所犯的罪行。
如果其中至少有一人供认犯罪,就能确认罪名成立。
为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟,并给他们同样的选择机会;如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑;如果两人中有一人坦白认罪,则坦白者从轻认罪,立即释放,而另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们将被各判5年监禁如果分别用-1、-5和-8 表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即释放的得益,则两囚徒的得益矩阵如下:囚徒2囚徒1在上图中,“囚徒1”、“囚徒2”分别代表本博弈中的两个博弈方,也就是两个罪犯;他们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时做出的。
其中矩阵中第一个数字代表决策结果后囚徒1的得益,第二个数字代表决策结果后囚徒2的得益。
博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因此只能实现对他们都不理想的结果(各判5年),并且这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒困境。
二、寻找自己的优势策略从“极小极大原理”到“纳什理论”,都是希望揭示博弈中的策略选择和博弈结果之间的关系,使博弈论研究可以在一个博弈结构里寻找比较稳定的结果,并为策略的选择提供依据。
论囚徒困境与解决方式

论“囚徒困境”与解决方式两个涉嫌共谋犯罪的嫌疑犯被捕后被警察关在相互隔离的牢房中。
他们面临的选择是:或者坦白或者保持沉默(即不坦白)。
他们被告知:①如果某个嫌疑犯坦白而其同伙不坦白,则坦白者可获自由而拒不坦白者要被判10年监禁;②如果二人都坦白,则二人都被判5年监禁;③如果二人都不坦白,则二人皆被判1年监禁。
在这种情况下,两个嫌疑犯将如何决策和选择呢?在囚徒困境的分析和推论中有以下的前提性设定:①每个局中人(在囚徒困境中就是两个囚徒)都知道“博奕的规则”和“博奕结果”的支付矩阵;②每个局中人都是理性的,而这里的所谓“理性”是指只要给出两种备择策略,将总是选择其中对他更有利的那种策略;③局中人是相互隔离不能“串通”,不能“结盟”的。
从甲的“立场”来看,共有两种可能情况。
第一种可能情况是乙采取坦白的策略,这时,如果他也坦白则要入狱5年,如果他不坦白,则更糟:要入狱10年;两相比较,结论是他应以坦白“对付”乙的坦白策略。
第二种可能情况是乙采取沉默的策略,这时他若也沉默,要入狱1 年,如果他坦白,则可获得自由;两相比较,结论是他应以坦白对付乙的“沉默”策略。
把以上两种可能情况的结论归纳在一起,“总结论”是:无论乙采用坦白策略还是沉默策略,甲都以采取坦白策略为更“佳”的对策;所以,甲要采取坦白策略。
很显然,以上推理对于乙也是适用的。
这样,两个囚徒在“精心推理”之后都采取了坦白策略,结局是两人都被判5年徒刑。
不难看出,这个推理中似乎带有某种悖论性的因素;因为,如果甲、乙两个囚徒都采取沉默策略,则二人都只被判1年徒刑,显然它是一个比二人都入狱5年更好的结果。
然而,甲、乙两个富于“理性计算”精神的囚徒在“逻辑上正确”的计算一番之后都采取了坦白策略,获得了都被判5年徒刑的结果。
以上所诉就是所谓的“囚徒困境”,那么怎样解决这种困境呢?通过对“囚徒困境”的若干分析及实例来看解决方式。
一、关于“囚徒困境”的分析有人说:“囚徒的苦恼在于他们不能商量沟通,于是,有人便提出了如下的解决问题的途径:两个局中人可以进行通信,然后进行合作。
囚徒困境拓展实验报告(3篇)

第1篇一、实验背景与目的囚徒困境是博弈论中一个经典的案例,它揭示了个体理性选择与集体利益之间的冲突。
为了深入理解这一理论,我们设计并实施了一系列的囚徒困境拓展实验,旨在探讨不同情境下个体决策对整体结果的影响,以及沟通、信任与合作在解决囚徒困境中的作用。
二、实验设计1. 实验对象:实验对象为30名大学生,随机分为15组,每组2人。
2. 实验材料:囚徒困境支付矩阵、实验指导手册、记录表格。
3. 实验流程:- 向实验对象介绍囚徒困境的背景和规则。
- 实验分为两个阶段:无沟通阶段和有沟通阶段。
- 在无沟通阶段,实验对象需独立作出决策。
- 在有沟通阶段,实验对象可进行交流,共同决定策略。
- 记录实验过程中各组的决策结果。
三、实验结果与分析1. 无沟通阶段:- 大部分实验对象在无沟通阶段选择了背叛策略,追求自身利益最大化。
- 少数实验对象选择了合作策略,但最终并未获得理想的结果。
2. 有沟通阶段:- 在有沟通阶段,实验对象通过交流,多数组别选择了合作策略。
- 合作策略的实施使得整体结果优于无沟通阶段。
3. 不同情境下的决策:- 在资源有限、竞争激烈的情况下,实验对象更倾向于选择背叛策略。
- 在资源充足、合作共赢的情境下,实验对象更倾向于选择合作策略。
四、实验结论1. 囚徒困境揭示了个体理性选择与集体利益之间的冲突。
在无沟通阶段,个体为了自身利益最大化,往往选择背叛策略,导致整体结果不佳。
2. 沟通与合作在解决囚徒困境中起着关键作用。
通过交流,实验对象能够相互了解对方的意图,共同制定合作策略,从而实现共赢。
3. 情境因素对个体决策有显著影响。
在资源有限、竞争激烈的情况下,个体更倾向于选择背叛策略;而在资源充足、合作共赢的情境下,个体更倾向于选择合作策略。
五、实验启示1. 提高沟通能力:在现实生活中,沟通能力对于解决问题、实现共赢至关重要。
2. 培养合作精神:合作是实现共同利益的重要途径,个体应学会在合作中实现自身价值。
有关“囚徒困境”的研究【经济学经典】

研究性学习结题报告:有关“囚徒困境”的研究组长:组员:指导老师:主导科目:政治研究目的:通过研究“囚徒困境”,了解形成囚徒困境的原因、走出囚徒困境的方法和利用囚徒困境解决生活问题。
研究目标:了解囚徒困境,囚徒效应。
研究意义:利用囚徒困境解决各个领域的问题。
研究内容:囚徒困境、囚徒效应、博弈、社会心理学。
研究方法:1、从网上图书馆查找有关资料2、把收集到的资料、故事等加以综合分析,并加以整理3、听有关专家报告4、走访有关心理专家5、参加社会调查(教育、市场经济、军事、刑侦等)研究思路:1、研究《博弈学习理论》(【美】朱·弗登伯格、戴维·K·莱文著)《社会心理学》(沙莲香著)2、进行调查研究3、综合分析并整理研究时间:2009年7月13日~8月25日活动计划:7月13日至15日讨论研究内容、拟定实施方案、人员分工 7月16日至31日学习研究《博弈学习理论》及《社会心理学》8月1日至3日从网上图书馆查找有关资料8月4日至6日听有关专家报告8月7日至9日走访有关心理专家8月10日至18日参加社会调查8月19日至25日综合分析整理资料、完结报告囚徒困境的理论研究第一部分:什么是囚徒困境(prisoner's dilemma )一、囚徒困境(prisoner's dilemma )是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。
在重复的囚徒困境中,博弈被反复地进行。
因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
走出囚徒困境的方法

走出囚徒困境的方法
走出囚徒困境的方法可以有以下几种途径:
1. 合作和沟通:囚徒困境的核心是缺乏合作,如果双方能够进行充分的沟通和合作,就能避免困境。
双方可以通过交流、协商和互相理解来达成合作的共识。
2. 建立互信:在囚徒困境中,由于双方的不信任,往往会选择背叛对方。
如果双方能够建立起彼此的信任,就能够增加合作的可能性。
通过展示自己的诚信和信任对方,可以逐渐建立互信。
3. 设计激励机制:合理的激励机制可以促使双方在囚徒困境中做出合作的选择。
例如,双方可以设定奖励机制,对于合作的行为给予奖励,从而鼓励双方进行合作。
4. 第三方介入:囚徒困境中的双方常常缺乏独立的仲裁者。
如果有第三方介入,可以帮助双方解决纠纷,促使双方达成合作。
第三方可以提供公正的评判和协助,减少双方之间的争端。
5. 长期利益考虑:囚徒困境往往是由于双方只关注眼前的利益而忽视了长远利益。
如果双方能够意识到合作对于双方的长期利益是有益的,就能够更好地选择合作。
需要指出的是,走出囚徒困境是一个复杂的过程,具体方法取决于个体的情况和背景。
以上方法仅供参考,并不能保证一定能够成功。
打破囚徒困境的四种方法

打破囚徒困境的四种方法囚徒困境是博弈论中的一个经典问题,它描述了两个囚犯被捕后面临的选择。
如果两个囚犯都保持沉默,那么他们都只会被判处轻罪;如果其中一个人选择揭发另一个人,那么揭发者将被判处轻罪,而另一个人将被判处重罪;如果两个人都选择揭发对方,那么他们都将被判处重罪。
这个问题的解决方法可以启示我们在现实生活中如何打破困境,以下是四种方法:1. 合作合作是打破囚徒困境的最好方法。
如果两个囚犯都能够相互信任,相互合作,那么他们都可以避免被判处重罪。
在现实生活中,我们也可以通过合作来解决问题,例如在工作中与同事合作,共同完成任务,或者在家庭中与家人合作,共同分担家务。
2. 沟通沟通是打破囚徒困境的另一种方法。
如果两个囚犯能够进行有效的沟通,相互了解对方的想法和意愿,那么他们就可以更好地协调行动,避免被判处重罪。
在现实生活中,我们也可以通过沟通来解决问题,例如在工作中与同事沟通,了解对方的需求和意见,或者在家庭中与家人沟通,解决矛盾和分歧。
3. 妥协妥协是打破囚徒困境的第三种方法。
如果两个囚犯都能够妥协,相互让步,那么他们也可以避免被判处重罪。
在现实生活中,我们也可以通过妥协来解决问题,例如在工作中与同事妥协,达成共识,或者在家庭中与家人妥协,平衡各自的需求和利益。
4. 制度设计制度设计是打破囚徒困境的最后一种方法。
如果能够设计出一套公正、合理的制度,那么就可以避免囚徒困境的发生。
在现实生活中,我们也可以通过制度设计来解决问题,例如在公司中制定公正的考核制度,或者在社会中制定公正的法律和规章制度。
打破囚徒困境需要我们积极探索各种方法,寻找最适合的解决方案。
无论是合作、沟通、妥协还是制度设计,都可以帮助我们在现实生活中解决问题,实现共赢。
囚徒困境的破解方法

囚徒困境的破解方法囚徒困境是博弈论中的一个经典问题,描述了两个囚犯被捕后面临的选择。
如果两个囚犯都选择沉默,则他们都会被判处较轻的刑罚;如果其中一个人选择交待,而另一个人选择沉默,那么交待的人将获得豁免,而沉默的人将被判处重刑;如果两个人都选择交待,那么他们都将被判处较重的刑罚。
在这个困境中,个人的最佳选择是交待,但是如果两个人都这样选择,结果将是最糟糕的。
那么,面对这样的困境,我们应该如何破解呢?以下是一些方法:1. 合作是关键。
在囚徒困境中,最佳的结果是两个囚犯都选择沉默。
因此,合作是破解困境的关键。
在现实生活中,无论是在个人关系还是商业合作中,合作都是最有效的方式。
通过合作,双方可以共同谋求最大化的利益,避免陷入困境。
2. 建立信任。
建立信任是破解困境的基础。
在囚徒困境中,囚犯之间缺乏信任,导致了最糟糕的结果。
在现实生活中,建立信任可以减少误解和猜疑,促进双方的合作,从而避免陷入困境。
3. 寻求第三方的帮助。
在囚徒困境中,如果有第三方介入并提供合作的机会,那么囚犯们就有可能避免最糟糕的结果。
在现实生活中,当双方陷入困境时,可以寻求第三方的帮助,寻求解决问题的方法,避免陷入僵局。
4. 思考长远利益。
在囚徒困境中,囚犯们往往只考虑眼前的利益,而忽视了长远的影响。
在现实生活中,我们应该学会思考长远利益,考虑合作对双方的长期利益,而不是仅仅满足眼前的利益。
5. 寻求双赢的解决方案。
在囚徒困境中,最糟糕的结果是双方都选择交待,导致双方都受到伤害。
在现实生活中,我们应该寻求双赢的解决方案,通过合作和妥协,实现双方的利益最大化,避免陷入困境。
总之,囚徒困境是一个经典的博弈论问题,但在现实生活中,我们也经常面临类似的困境。
通过合作、建立信任、寻求第三方帮助、思考长远利益以及寻求双赢的解决方案,我们可以破解困境,避免陷入僵局,实现最大化的利益。
希望以上方法能够帮助您更好地应对困境,实现成功和发展。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摆脱“囚徒困境”对策研究【摘要】“囚徒困境”是博弈论中的一个经典案例,对这个问题的研究涉及经济学、政治学、社会学、哲学、伦理学等广泛的领域。
本文通过分析“囚徒困境”及其假设条件,找出“囚徒困境”的缺陷,进而结合案例提出摆脱“囚徒困境”的方法。
【关键词】“囚徒困境”;理性人;信息不对称;重复博弈一、“囚徒困境”的含义及其提出博弈论是西方经济学中的重要理论,而“囚徒困境”是博弈论中的一个经典案例,人们经常运用“囚徒困境”来分析一些实际问题。
在现实世界中,“囚徒困境”也是随处可见,正所谓”你我皆囚徒,何处无困境”。
(一)定义“囚徒困境”(prisoner’s dilemma)是指两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的①。
(二)提出及其模型分析1950年,由就职于兰德公司的梅里·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
“囚徒困境”是博弈论的经典案例,常被用来解释生活中的一些现象,如公共物品提供不足,垄断行业价格同盟的破坏等[2],它的具体内容如下:两个嫌疑犯A、B 合伙作案后被警察抓住,由于缺乏足够的证据指证他们所犯的罪行,分别把他们关在不同的屋子里审讯以防止他们串供。
警察分别告诉他们:如果两个人都认罪坦白,各判八年;如果两个人都抵赖不坦白,各判一年(或许因证据不足);如果其中一人坦白另一人抵赖,坦白的被释放,不坦白的判刑十年(“坦白从宽,抗拒从严”)。
在两个囚犯都是理性人的前提假设下,囚犯A会进行权衡抉择:如果B坦白了,A选择坦白被判8年,不坦白被判10年,坦白是优势策略;如果B不坦白,A坦白被释放,不坦白被判1年,同样对于A来说坦白是优势策略,这样A 就选择了坦白。
囚犯B基于同样的考虑,也选择了坦白,两人都被判8年。
易知囚徒双方都独立地追求个人利益最大化,坦白成为了两个囚徒的优势策略,是唯一的纳什均衡:(坦白、坦白),其结果是(- 8,- 8),但是最终却未能达到帕累托最优的集体利益最大化结果(- 1,- 1)。
显然如果两个囚徒都抵赖,下场会好于都坦白,两人只会被判1年而不是8年,即好于纳什均衡的情况。
两个囚徒陷入了“求之不得”却又“身不由己”的困境[3]。
二、“囚徒困境”的缺陷(一)给定他人的战略条件不充足“囚徒困境”这一模型中,给定他人的战略条件不充足,因为当囚徒A看到对方“抵赖”时囚徒A选择坦白,实际上囚徒B同时也在考虑这个问题,B想到A 选择坦白,囚徒B就不会选择“抵赖”,这样你假设的“给定他人的战略”就变了,成了他人的战略不确定[6]。
这个模型虽然是静态博弈,但是博弈双方考虑整个过程时都在模拟对方的选择,这其中有动态的成分(你假设对方抵赖,你选择坦白,实际对方猜到你选择坦白,他会改变自己的策略不再抵赖也选择坦白,最后达到均衡(坦白,坦白),这个决策过程有先后顺序,实际上是动态博弈过程),所以完全按照静态博弈方法分析会有问题,导致“囚徒困境”的产生。
(二)博弈双方并不是真正的理性人“囚徒困境”博弈模型中个体理性和集体理性的冲突对经济学的基本假设——“理性经济人”造成了严重挑战。
其实“囚徒困境”中之所以出现个体理性导致了集体的非理性,这种表面的理性冲突是因为囚徒并非真正“理性人”[7]。
双方相互不能猜透对方,从而各自只能采取自己的优势策略。
如果是两个嫌疑人都是理性人,而且都是博弈论专家,他们相互理解对方且确信对方的策略,最后博弈均衡就会变为(抵赖,抵赖)。
所以说参与人实际上是不完全理性的。
(三)利己主义者的前提不成立有人认为“囚徒困境”的产生源于利己主义,而在小说《麦琪的礼物》中吉姆和德拉在圣诞节都想给对方买礼物,因拮据吉姆卖了心爱的金表,买了漂亮发卡,德拉卖了心爱的头发,买了表链和表袋。
但是失去了头发的德拉得到了漂亮发夹也无法发挥发夹的作用,同样,没有了金表,吉姆得到的表链也变得毫无价值。
他们无私利他的选择却使两人的利益受损,可见“囚徒困境”无须受限于利己的假设,只要局中人受非理性因素(感情、信念、同情心等)的影响,就无法避免个体理性和集体理性的矛盾[8]。
三、摆脱“囚徒困境”的途径(一)利用强化的力量当出现“囚徒困境”时,靠囚徒们的自律,并不总是能够走出困境。
一个鲜活的例子是中国彩电企业首次“价格联盟” 的失败[9],当不合作有很高的“利润” 诱惑时,没有哪家企业愿意合作。
此时政府可以通过制度、政策、奖惩措施等强化手段约束成员的个人理性与行为,鼓励和激发创新与奉献,通过强化手段的诱发和约束,加大群体成员进行更具建设性选择的酬赏与份量,引发成员在引入了新的强化因素后做出更具合理性的个人选择,打破原有利益格局中的纳什均衡,建立起更有利于群体进化和群体成员利益的新的“纳什均衡”,克服多人“囚徒困境”所带来的群体内耗[10]。
例如当两家烟草公司——万宝路与骆驼用广告来吸引相同的顾客时,它们面临与“囚徒困境”类似的问题,并且最终走出困境的方法也颇具意义。
如果两家烟草公司都不做广告,它们瓜分市场。
如果两家公司都做广告,它们依然瓜分市场,但利润减少了,因为每家公司都要承担广告费用。
但如果一家公司做广告而另一家不做,做广告的一家就把另一家的顾客吸引走了,不做广告的一家利润就会减少。
做广告是骆驼和万宝路两家公司的优势策略,所以两家公司都选择了做广告,但其实两家企业都不做广告,状况会更好,分别得到40亿美元利润而不仅仅是30亿美元利润。
这种广告理论的检验出现在1971年,当时美国国会通过了禁止在电视上做香烟广告的法律。
另许多观察者奇怪的是,烟草公司并没有利用他们在政治上相当大的影响力去反对这项法律。
当该法律实施后,香烟广告减少了,烟草公司的利润却增加了。
这项法律为烟草公司做了一件它们自己做不到的事:它通过强制禁止实现了低广告高利润的合作,成功解决了“囚徒困境”问题。
(二)由外部环境决定的依存关系有可能使双方摆脱囚徒的困境有时候,由于来自外部环境的威胁,进行“囚徒困境”博弈的两个囚徒之间的合作(抵赖、抵赖)可能作为一种受迫性反应而出现[11]。
还是“囚徒困境”中的两个囚徒A、B,不同的是这里假设A、B被抓前一起得罪过一个流氓C,囚徒A、B 都知道若他们同在一起生活,C不敢报复(可能是A、B 在一起,实力较强,C 斗不过),但若A、B 有一个在监狱中,另一个在社会上一定会遭到C 的报复而得- 2 单位的支付。
C 报复A、B 之一可得到4 单位的支付,不实施报复可得零单位支付。
此模型用逆向归纳法很容易地解出此两阶段动态博弈的唯一纳什均衡②是:A 抵赖,B 抵赖;C 当A、B 不合作时报复其中坦白者。
均衡结果是(- 1,- 1,0),均衡时该博弈实际上不会进入第二阶段,也即囚徒A、B 不会给C 以报复的机会[12],这或许可以解释如下事实:当村民们修公共防水堤时,人们的劳动力供给成了公共物品,当未涨水时,人们懒散、窝工现象严重,陷入“囚徒困境”,公共防水堤的质量不高;当涨水且岌岌可危时,人们更加齐心合力修建水堤,公共防水堤的质量明显提高,走出了囚徒的困境。
以上例子说明:来自外部的竞争压力会凸显集体的重要,合作可以作为一个受迫性反应出现[13],从而迫使囚徒进行合作而走出困境。
(三)运用“重复博弈”走出“囚徒困境”囚徒两难的困境抓住了人与人之间不信任和需要相互防范背叛这种真实的一面,但是在现实世界里,信任与合作很少达到如此两难的境地。
无论在自然界还是在人类社会,合作都是一种随处可见的现象。
通过无限次重复博弈,合作的可能性增强,就有可能走出困境。
假定有甲、乙两个厂商,他们都以追求自身利润最大化为目的并且不能控制对方的决策。
他们签有100万元的商品购销合同。
在合同即将履行前,来了一位“倒爷”,分别对这两个厂商的主要负责人施以小利并游说它们:如甲厂商将商品销给“倒爷”则甲厂商可获得120万的收入,但乙厂商则不得不以更高的价格获得这些商品从而使得乙厂商获益减少至60万;或者如果乙厂商从“倒爷”手中价购入可获得120万的收益,但甲厂商则只能低价出售从而使其获益减少至60万;或者两厂商同时违约分别从“倒爷”手中购销该产品从而使“倒爷”获取渔翁之利,致双方获利都降至80万。
显然,如果甲乙双方做的是“一锤子买卖”[14],对于甲乙厂商来说,他们的优势策略是选择违约,但实际上如果双方选择守约实行合作,将获得100万的收益而不仅仅是80万,双方陷入“囚徒困境”最终导致资源的浪费和效率的降低。
如果甲乙厂商是长期合作伙伴,那么“囚徒困境”就会迎刃而解,因为甲乙厂商会进行多次重复博雾,产生了新的动力结构,违约不再是优势策略。
在重复性“囚徒困境”下,理性博弈者将考虑:如果我拒绝合作,执行背叛,为了减少你的损失你也会背叛。
如果博弈者不仅关心眼前收益也关心未来收益,而且博弈没有确定的时间限度,被惩罚的威胁似乎足以高到保证每一博弈阶段的稳定合作。
这样,每个厂商都理性地克制投机行为,进行重复博弈和长期合作,实现双方策略上的“合作均衡”和综合利益最大化,将成为他们的最优选择。
每一厂商会努力在重复博弈中建立起自己的好名声,减少道德风险,降低交易成本,以较低的边际成本获取较高的边际收益。
他们深知,要是欺骗的话最多在博弈中只能占一次便宜,如上表中所示,得到120万,这比守约的报酬多20万,但这一欺骗却带来了长期的损失。
所以一方面,重复博弈使得博弈双方都在更大程度上了解了对方的信息,使得更多的私人信息变为博弈双方的公共信息。
另一方面,重复博弈使得“一报还一报”式的报复得以实现。
“一报还一报”[15]式的报复指的是博弈一方永远不先背叛对方,而且还会在下一轮中对对手的前一次合作给予回报,但它也会采取背叛的行动来惩罚对手前一次的背叛。
这样囚徒在经过多次博弈之后,它们采取合作的态度逃避法律制裁的可能性就会大大增强,就有可能走出“囚徒困境”。
参考文献:[1]曼昆.经济学原理[M].机械工业出版社,2003(8).[2]张维迎.博弈论与信息经济学[M].上海人民出版社,2004(11).[3]冯晓明.寡头垄断市场竞争下的“囚徒困境”与突破策略[J].合作经济与科技,2011(2).[4]王玉珍.理性只是对自利最大化的追求吗[J].经济学家.2004.(6):84—89.[5]高鸿业.微观经济学(第3 版)[M],中国人民大学出版社.[6]郭洪伟.“囚徒困境”的均衡辨析[J].技术经济与管理研究,2011(2).[7]崔志军.浅析“囚徒困境”模型中的“理性”假设[J].经济研究☆,2011(12).[8]李伯聪,李军,关于”囚徒困境”的几个问题[J],自然辩证法通讯,1996(4)[9]陶章华.企业“竞争—合作” 博弈研究[J].西南交通大学博士学位论文(98 级).[10]曼瑟尔.奥尔森.集体行动的逻辑[M].陈郁等译.上海:上海人民出版社,1995.13.[11]朱晓宁,赵爽.“囚徒困境”下的抉择[J].商业文化学术探讨,2007(4)[12]马本江,邱菀华.论摆脱“囚徒困境”的途径[J],生产力研究.,2004(10).[13]刘辉.人才群体中的“囚徒困境”及其克服[J].中国人才,1999,(1):13-15[14]代礼忠,翟江涛.重复博弈的制度安排:走出信用制度建设“囚徒困境”的必由之路[J],甘肃理论学刊,2005(5).[15]周厚虎.运用“重复博弈”走出“囚徒困境”[J],探索,2011(1).注释:①曼昆的《经济学原理》里指出“囚徒困境”是两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。