囚徒困境的根源与启示
对囚徒困境的理解

对囚徒困境的理解囚徒困境是博弈论中的一个经典问题,它描述了两个囚徒之间的决策情景。
在这个困境中,两个囚徒被关押在不同的牢房中,他们被指控犯有同样的罪行。
检察官向每个囚徒提供了一个选择:合作还是背叛。
如果两个囚徒都选择合作,即不揭发彼此,那么他们将会被判处较轻的刑罚。
而如果两个囚徒都选择背叛,即相互揭发对方,那么他们将会受到较重的惩罚。
然而,如果一个囚徒选择合作,而另一个囚徒选择背叛,那么背叛的囚徒将会获得最小的刑期,而合作的囚徒将会受到最严厉的惩罚。
这个问题的关键在于,每个囚徒在做出决策时,无法知道对方会选择什么。
因此,每个囚徒都需要权衡自己的选择。
如果他们只考虑个人利益,那么背叛是最理性的选择,因为无论对方选择什么,背叛都能获得较轻的刑罚。
但是,如果两个囚徒都这样选择,那么最终他们都将受到较重的惩罚。
相反,如果每个囚徒考虑到对方的选择,那么合作就成为了最优策略。
因为如果两个囚徒都选择合作,他们都能够获得较轻的刑罚。
而如果一个囚徒选择背叛,那么他将面临较重的刑罚,而另一个囚徒的选择将不会对他造成任何影响。
囚徒困境的核心在于协作与背叛之间的冲突。
每个囚徒都有动机追求自己的利益,但如果他们只顾自己,最终结果可能是对双方都不利的。
只有通过相互合作,才能够达到双方的最佳结果。
囚徒困境不仅仅是一个理论问题,它在现实生活中也有很多应用。
例如,在商业谈判中,各方之间存在着合作与背叛的选择。
如果每个人只追求自己的利益,那么谈判可能会陷入僵局。
但如果各方能够相互信任、相互合作,那么谈判可能会达成双赢的结果。
在囚徒困境中,合作是一种理性的选择。
虽然背叛可能会在短期内带来一些好处,但从长远来看,合作才能够带来最大的利益。
通过合作,囚徒可以减轻自己的刑罚,并且为对方也创造了一个减轻刑罚的机会。
囚徒困境还提醒我们,相互信任和合作是社会发展的重要基石。
如果每个人都只考虑自己的利益,那么整个社会可能陷入恶性循环。
只有通过相互信任和合作,才能够实现社会的和谐与进步。
囚徒困境的根源与启示解读

举例来是说,我是供应商,你是大超市,你可 以选择拖欠货款,我也可以选择延迟发货或较低的 质量,套用上面的模型:
在囚徒困境中,参与者会受到背叛(坦白)的 短期诱惑,但是通过与对方建立长期的合作的 模式,可以获得更多的长期的好处。
所以,要破解囚徒困境,就要跳出这个模型本 身,从更高的层面上给以制度性的约束,或让
大家都明白合作的好处。
1984年,美国联邦预算赤字实在太高了。裁减必要的巨 额开支在政治上并不可行,因此,大幅增税应该是不可避免 的。不过,谁愿意带头主张这么做呢?
下一个问题是,双方都有相同的想法,明知第九局对方会背叛自己,所 以第八局保持沉默也是没有意思的,第七局亦然,如此类推,纳什均衡是十 局都会互相背叛,建立互信关系是没有可能的。
只有在囚徒困境的局数大家都不肯定的情况下,上述的推论才不会发生, 才会出现互相保持沉默的现象
在个体之间存在行为和利益相互制约的博弈 结构中,以个体理性和个体选择为基础的分 散决策方式,无法有效地协调各方面的利益, 并实现整体、个体利益共同的最优。简单地 说,“囚徒的困境”问题都是个体理性和集 体理性的矛盾引起的。
单次发生的囚徒困境,和多次重复的囚徒困境结果 不会一样。
在重复的囚徒困境中,博弈被反复地进行。因 而每个参与者都有机会去“惩罚”另一个参与者前 一回合的不合作行为。这时,合作可能会作为均衡 的结果出现。欺骗的动机这时可能被受到惩罚的威 胁所克服,从而可能导向一个较好的、合作的结果的其他例证,囚徒困境假定每 个参与者(即“囚徒”)都是利己的,即 都寻求最大自身利益,而不关心另一参与 者的利益。参与者某一策略所得利益,如 果在任何情况下都比其他策略要低的话, 此策略称为“严格劣势”,理性的参与者 绝不会选择。另外,没有任何其他力量干 预个人决策,参与者可完全按照自己意愿 选择策略。
从囚徒困境中得到的启示

从囚徒困境中得到的启示
囚徒困境,这个经典的对局模型,给我们提出了一个重要的问题:在一个社会中,如何才能做出最佳的决策?这个问题也引发了很多讨论,并且深刻地影响了社会各个领域的发展。
囚徒困境的核心思想是:一个人自私地寻求最大效益并不能促进公共的善。
这意味着,如果只有一方自私,那么最终的结果可能是“各败俱伤”的局面。
但是,如果两方都能做出合理的考虑,并能够相互合作,那么就有可能达到双赢的局面。
这个模型有很多启示。
首先,它提醒我们,在做出决定时,要考虑到其他人的利益,而不是只考虑自己的利益。
其次,它也提醒我们,合作才能获得最好的结果。
最后,它还告诉我们,在设计社会制度时,要从最没有德性的人出发,以保障社会正义。
囚徒困境的启示很重要,它不仅引领着社会发展,还指导着我们如何做出正确的决策。
它说明,在遇到复杂的决策问题时,要考虑到更多的因素:不能只考虑自己的利益,而要考虑到其他人的利益;不能只考虑眼前的利益,而要考虑长远的利益;不能只考虑自身的目的,而要考虑实现公共利益的目的。
囚徒困境的结局启示着我们,在做出决定时要充分考虑,不能只考虑自己的利益,而要考虑其他人的利益,不能只考虑眼前的利益,而要考虑长远的利益,不能只考虑自身的目的,而要考虑实现公共利益的目的。
只有这样,才能使社会发展走向正确的方向,才能让社会变得更加和谐、繁荣。
《囚徒困境》论文

(一)囚徒困境理论在学习和生活中,我们会遇到诸多面临决策,进退两难的问题,那么如何决策呢?不同的策略带来不同的损益,有时当博弈双方都以自己的最大利益为策略博弈时,结果相反,时双方都陷入自己所要逃避的困境,这便是囚徒困境!囚徒困境经典案例①:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。
若二人都互相检Array举(相关术语称互相“背叛”),则二人同样判监8年。
嫌疑人甲、乙双方均不知对方的策略,且都是自私利己之人。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑5年。
(二)生活中的囚徒困境博弈在现实生活中不出不在。
博弈双方大到国际贸易国与国之间的竞争,小到个人与个人之间的经济交易;动物之间同样也存在博弈,甚至植物在阳关下吸收养分也存在博弈。
有竞争就有博弈,有交易就有博弈,博弈渗透到生活中的每个角落。
参与博弈的双方或多方如何采取策略,保障自己最大的利益和最小的损失;往往利益最大的也是风险最大的,一旦失败,损失也是最大的,如何决策,这便使得博弈人陷入“囚徒困境”。
博弈的囚徒困境覆盖面极广,涉及军事决策,政治手段,企业经营,市场策略,生活理财等诸多方面。
囚徒困境经济学原理

囚徒困境经济学原理引言:囚徒困境是博弈论中一个经典的问题,也是经济学中的重要原理之一。
囚徒困境的情境是两个囚徒被捕后被分开审讯,检方没有足够的证据定罪,但却希望能定罪并判刑。
如果两个囚徒都保持沉默,则检方只能以轻罪定罪。
然而,如果其中一个囚徒选择合作并供出另一个囚徒,那么供出者将获得免罪的机会,而被供出者将面临重刑。
如果两个囚徒都选择供出对方,则两人都将面临有限的刑期。
囚徒困境问题展示了个人理性行为在博弈过程中可能导致的不利结果,对经济学有着重要的启示意义。
1.囚徒困境的基本情景囚徒困境的基本情景是两个囚徒在被捕后被审讯,他们面临着个人决策的困难。
在这个情境中,囚徒可以选择合作或背叛对方。
合作意味着保持沉默,而背叛意味着供出对方。
囚徒的决策将决定他们的命运,而他们并不知道对方的选择。
在这种情况下,囚徒需要权衡自己的利益和对方的选择来做出决策。
2.囚徒困境的策略和收益在囚徒困境中,每个囚徒都有两种策略可选择:合作或背叛。
合作的收益是较低的刑期,而背叛的收益是免罪。
然而,如果两个囚徒都选择背叛,那么他们都将面临较长的刑期。
因此,囚徒困境的最佳策略是背叛,因为无论对方选择什么,背叛都能获得更好的结果。
3.囚徒困境的启示意义囚徒困境问题揭示了个人理性行为可能导致不利结果的情况。
尽管合作对于整体利益是最好的选择,但个人追求自身利益往往会导致困境的产生。
囚徒困境的启示意义在于,个体之间的合作需要建立在互信和合作机制的基础上,才能避免困境的发生。
4.囚徒困境与经济学的关系囚徒困境经济学原理在经济学领域有着广泛的应用。
例如,在市场竞争中,企业可能面临类似的囚徒困境。
如果所有企业都选择合作并遵守竞争规则,市场将保持公平竞争的状态。
然而,如果有企业选择背叛并采取不正当手段获取竞争优势,其他企业也会被迫采取同样的策略,从而导致整个市场的恶性竞争。
囚徒困境经济学原理提醒我们,建立公平竞争的机制和规则对于市场的稳定和发展至关重要。
从囚徒困境到企业竞争与合作

从囚徒困境到企业竞争与合作一、“囚徒困境”的原理1.“囚徒困境”说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被判刑较轻甚至释放。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放。
而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照重的罪来判决,谁也不会得到奖赏。
2.“囚徒困境”支付(得益)矩阵。
具体的,如果他们两人都拒不认罪,则根据已经掌握的证据他们会被释放;如果双方都坦白招认,都将被判入狱 8 年;如果两人中有一人坦白认罪,则坦白者从轻处理,立即释放,而另一人则重判10年徒刑。
支付(得益)矩阵如下:3.“囚徒困境”的理性分析。
这两个囚犯该怎么办?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了。
但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。
所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了糟糕的报应:坐牢。
囚徒困境案例

囚徒困境案例囚徒困境是博弈论中的一个经典案例,它揭示了在互相合作的情况下,个体之间的利益冲突和合作困境。
这个案例的背后蕴含着深刻的社会学和心理学意义,对于我们理解人类行为和社会关系具有重要的启示作用。
在囚徒困境案例中,两名罪犯被抓获并分开审讯,警察没有足够的证据定罪,只能凭借他们对彼此的供词来判决。
如果两名罪犯都沉默不语,警察只能以轻罪定罪,每人判刑1年;如果其中一人供认,而另一人保持沉默,供认的人将被释放,而另一人将被判10年;如果两人都供认,每人将被判刑8年。
在这种情况下,每个人都面临着一个选择,是合作沉默,还是背叛供认。
从个体的利益出发,无论对方选择什么,供认都是最好的选择。
因为无论对方是沉默还是供认,供认者都能通过合作获得最小的刑期。
但是,如果双方都选择供认,就会导致双方都得到最坏的结果。
这就是囚徒困境的本质,即使合作对每个人来说都是最好的选择,但由于彼此之间缺乏信任,最终导致了双方都选择背叛,从而陷入困境。
囚徒困境案例在现实生活中也有着广泛的应用。
在商业合作中,合作双方往往面临着相互竞争和利益冲突。
在国际关系中,各国之间也存在着类似的困境,例如军备竞赛和贸易争端。
在日常生活中,人们之间的合作也会受到囚徒困境的影响,例如环境保护、资源分配等方面。
如何打破囚徒困境,实现合作共赢呢?学者们提出了一些解决方案。
首先是建立信任,通过长期的合作积累信任,从而减少合作双方的不确定性和风险。
其次是建立有效的合作机制,通过契约、协议等方式规范双方行为,减少信息不对称和道德风险。
再次是采取激励措施,通过奖惩机制激励合作,促使双方选择合作而非背叛。
最后是加强监督,通过第三方监督和公众监督,降低合作双方的违约成本,提高合作的可信度。
囚徒困境案例告诉我们,合作是人类社会生存和发展的基础,但合作中也存在着利益冲突和信任危机。
打破囚徒困境,需要双方共同努力,建立信任、规范合作、激励合作和加强监督,从而实现合作共赢的局面。
囚徒困境对人际交往的启示

囚徒困境对人际交往的启示囚徒困境这个概念,听起来像是个复杂的游戏理论,其实它对我们的日常人际交往有着很大的启示。
想象一下,两个小伙伴被抓进了一个小黑屋,警察给他们下了个选择题:如果都不说话,各自轻轻松松,可能只会被关几天;但如果一个人背叛另一个,那背叛者就能溜之大吉,另一个人就得承受重罚;要是俩人都选择背叛,那就两败俱伤,结果都不怎么好。
听起来是不是有点像我们生活中那些微妙的选择?我们在朋友间、在工作里,其实也常常面临这样的决策。
朋友间的关系,真的是微妙无比。
你知道的,很多时候我们都想为了彼此好,想着“我对你好,你对我好”,这才是最理想的状态嘛。
但是,现实中总有那种情况,比如你帮了朋友,他却没能回报你,或者甚至在关键时刻选择了自私。
哎,这种时候就像囚徒困境一样。
你心里难免会想,自己是不是傻得太简单,给别人机会,结果却是竹篮打水一场空。
就像人们常说的“放长线钓大鱼”,可有时候你放出去的线却没钓到鱼,反而被风吹跑了。
囚徒困境告诉我们一个道理:信任和合作是很重要的。
就像那句老话说的“人心齐,泰山移”,在合作的时候,你越信任对方,大家的利益就越能最大化。
你想啊,假如大家都选择合作,谁也不背叛,那生活就会变得多么美好,大家都能安安稳稳,乐呵呵地过日子。
可是偏偏有一些人,眼里只有自己的利益,结果就让整个局面变得复杂。
哎,这真是让人哭笑不得。
我们常常忽视了沟通的重要性。
很多时候,误会就像那隐藏的雷区,随便一踩就炸了。
其实只要好好聊聊,坦诚相待,很多问题都能迎刃而解。
你想想,如果两个囚徒能坐下来,互相坦诚自己的想法,或许就能找到更好的解决办法。
正如“良言一句三冬暖”,彼此理解,才能让关系更进一步。
可是,很多人总是抱着“我不说,他也不说”的心态,结果只会让事情越演越烈。
咱们说到背叛,真是人生百态。
那些在关键时刻选择背叛的人,往往是最自私的那种。
可你也不能全怪他们,人性就是那么复杂,有时候自私的选择似乎能带来短期的利益。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这种想法合理吗? 在第十局时,互信的关系明显是没有意义的,因为十局已经完结,囚徒
没有必要为维持互信的关系而沉默(没有第十一局),所以第十局囚徒一定会 背叛对方的,理由和只有一局囚徒困境一样。
问题是,既然大家都知道在第十局,无论如何对方都会背叛自己的,你 在第九局保持沉默也是没有意思的,要知道,保持沉默(友好关系)的原因是 为了希望下一局别人保持沉默。所以第九局双方都一定会背叛对方的。
下一个问题是,双方都有相同的想法,明知第九局对方会背叛自己,所 以第八局保持沉默也是没有意思的,第七局亦然,如此类推,纳什均衡是十 局都会互相背叛,建立互信关系是没有可能的。
只有在囚徒困境的局数大家都不肯定的情况下,上述的推论才不会发生, 才会出现互相保持沉默的现象
在个体之间存在行为和利益相互制约的博弈 结构中,以个体理性和个体选择为基础的分 散决策方式,无法有效地协调各方面的利益, 并实现整体、个体利益共同的最优。简单地 说,“囚徒的困境”问题都是个体理性和集 体理性的矛盾引起的。
自然,供应商也会如此推理。按照博弈论的 观点,这是唯一的平衡点,在这一点上,任何一 方改变策略,都会得到更差的结果。
囚徒困境的实际运用
但是,这与我们的日常经验不符合。为什么现 实中的供应商与经销商都会选择合作呢? 原因在于: 1.不嫉妒,现实中的博弈大多是非零合的。大家赚 取自己应有的利润,没有理由去嫉妒对方的高额利 润,因为对方的成功是你成功的前提。 2.不首先背叛,对合作或背叛都要给于惩罚。在契 约社会,有法律、行规的制约,背叛是要付出巨大 的代价的。再回到囚徒困境中,则是黑社会团伙对 囚犯家属的行动。这会让囚徒在做决策时,偏向于 合作。当双方尝到合作的甜头,又知道背叛的惩罚 后,合作就会成为第一选择。 囚徒困境的解决方法应该在困境本身之外。
但是,假如自己提出这样的政策,而对方并不附和,则自己会落得糟糕的下场。显而易见,对每 一方而言,保持被动是一个优势策略。而这正是真实发生的情况:这一届国会根本没有作出任何 加税决定。这就是为什么美国是世界上最富有的国家,却同时又是最大的债务国的原因。
举例来是说,我是供应商,你是大超市,你可 以选择拖欠货款,我也可以选择延迟发货或较低的 质量,套用上面的模型:
理论上,几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳 什均衡,没有成员有兴趣遵守。那么是不是不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双 方考虑长远利益,他们的合作是会成功的。但只要是有限次的合作,合作就不会成功。比如合作10次,那 么在第九次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你 合作了。但是大家料到第九次会出现不合作,那么就很可能在第八次就采取不合作的态度。第八次不合作会 使大家在第七次就不合作……一直到,从第一次开始大家都不会采取合作态度。
从这个意义上说,“纳什均衡”提出的悖论实际 上动摇了西方经济学的基石。因此,从“纳什均 衡”中我们还可以悟出一条真理:合作是有利的 “利己策略”。但它必须符合以下黄金定律:按 照你愿意别人对你的方式来对别人,但只有他们 也按同样方式行事才行。也就是中国人说的“己 所不欲勿施于人”。但前提是人所不欲勿施于我。
单次发生的囚徒困境,和多次重复的囚徒困境结果 不会一样。
在重复的囚徒困境中,博弈被反复地进行。因 而每个参与者都有机会去“惩罚”另一个参与者前 一回合的不合作行为。这时,合作可能会作为均衡 的结果出现。欺骗的动机这时可能被受到惩罚的威 胁所克服,从而可能导向一个较好的、合作的结果。 作为反复接近无限的数量,纳什均衡趋向于帕累托 最优。
正因为B是政府扶植起来鼓励竞争的,所以B得到了政府的一些优惠,其中B的价格可以比P0 低10%。这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。在这样的市场 分配下,A、B可以达到平衡,但由于B在价格方面的优势,市场份额逐步壮大,到了一定程度, 对A造成了影响。这时候,A该怎么做?不妨假定:
对电信价格竞争的博弈分析中,只是一次性的“囚徒困境”博弈,因此得到了互相降价的纳什均衡。而 在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作”都是一种 随处可见的现象。比如中东石油输出国组织(OPEC)的成立,本身就是要限制各石油生产国的产量,以 保持石油价格,以便获取利润,是合作的产物。OPEC之所以能够成立,各组织成员国之间之所以能够合作, 是因为囚徒困境如果是一次性博弈(One shot game)的话,基于个人利益最大化,得到纳什均衡解,但如果是 多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。连续的合作有可能成为 重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理”(Folk Theorem)的含义。
如同博弈论的其他例证,囚徒困境假定每 个参与者(即“囚徒”)都是利己的,即 都寻求最大自身利益,而不关心另一参与 者的利益。参与者某一策略所得利益,如 果在任何情况下都比其他策略要低的话, 此策略称为“严格劣势”,理性的参与者 绝不会选择。另外,没有任何其他力量干 预个人决策,参与者可完全按照自己意愿 选择策略。
“囚徒的两难选择”有着广泛而深刻的意义。个 人理性与集体理性的冲突,各人追求利己行为而 导致的最终结局是一个“纳什均衡”,也是对所 有人都不利的结局。他们两人都是在坦白与抵赖 策略上首先想到自己,这样他们必然要服长的刑 期。只有当他们都首先替对方着想时,或者相互 合谋(串供)时,才可以得到最短时间的监禁的结 果。
数十道“减负令”难见效 中小学生课业负担不减反增
仅1985年至2000年的15年里,中央就下达" 减负令"49次。减轻中小学生过重负担喊了20多年, 实际情况却是学生课业负担不但没减下来,反倒呈现 出越演越烈之势,致使学生作业做到深夜、节假日仍 然上课、业余时间奔忙于各种补习班等。
“我没买房,结果房价还是涨了,因为 我们无法保证大家都不买房。可是,我错了 吗?没有。当初如果我买房了,房价下跌了 呢?因为我不能保证大家都买房。人们根本 不能预知在疾风暴雨式的调控之下,房价竟 还能且调且涨。可是,我对了吗?没有。”
囚徒困境的现实意义
简单的说,就是如果你认为以后大家还要相处, 那么最好选择合作;反之,如果你认为以后不再会 相遇或对你以后的利益不太关心,那么就 选择背叛 (把对方供出来)。这样又回到问题的原点:如果 未来是重要的,那么就要选择合作,而合作的策略 取决于对方的策略。 于是结论是:没有最优策略!
囚徒困境的现实意义
囚徒困境的实际运用
大家都合作 ,大家都赢利,长期利益; 一方不合作,一方盈利,短期利益; 都不合作全都陪钱,没有利益; 一般情况下,长期赢利都会比短期赢利要高的 多。
假设此博弈的参加者为电信运营商A与B, 一开始的价格都是P0。A(中国电信)是老牌企 业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)则刚成立不久,翅膀还没有长硬, 是政府为了打破垄断鼓励竞争而筹建起来的。
在囚徒困境中,参与者会受到背叛(坦白)的 短期诱惑,但是通过与对方建立长期的合作的 模式,可以获得更多的长期的好处。
所以,要破解囚徒困境,就要跳出这个模型本 身,从更高的层面上给以制度性的约束,或让
大家都明白合作的好处。
1984年,美国联邦预算赤字实在太高了。裁减必要的巨 额开支在政治上并不可行,因此,大幅增税应该是不可避免 的。不过,谁愿意带头主张这么做呢?
A降价而B维持,则A获利15,B损失5,整体获利10; A维持且B也维持,则A获利5,B获利10,整体获利15; A维持而B降价,则A损失10,B获利15,整体获利5; A降价且B也降价,则A损失5,B损失5,整体损失10。 从A角度看,显然降价要比维持好,降价至少可以保证比B好,在概率均等的情况下,A降价 的收益为15×50%-5×50%=5,维持的收益为5×50%-10×50%=-2.5,为了自身利益 的最大化,A就不可避免地选择了降价。从B角度看,效果也一样,降价同样比维持好,其降价 收益为5,维持收益为2.5,它也同样会选择降价。在这轮博弈中,A、B都将降价作为策略, 因此各损失5,整体损失10,整体收益是最差的。这就是此博弈最终所出现的纳什均衡。我们构 造的这一电信业价格战博弈模型是典型的囚徒困境现象,各个局部都寻求利益的最大化,而整体 利益却不是最优,甚至是最差。
不合作 供应商
合作
不合作 -5 -5
-8 2
超市 合果供应 商合作,我只要不合作,就可以得到2个单位的 利润,而合作却只有1个单位的利润,显然不合 作比合作好;如果供应商不合作,我若合作,则 要损失8个单位的利润,但不合作却只损失5个单 位的利润,显然还是不合作比较好。无论供应商 是否合作,超市的最佳策略都是不合作。
试想像囚徒困境的情况进行十次。 我们可以合理地设想,如果囚徒第一次被对方指控,第二次这个囚徒也
会指控对方。相反,如果第一次 别人保持沉默,建立了互信的关系,你也会保持沉默,达致帕累托最优。
当然,两个囚徒都会有相似的想法,在第一局保持沉默,以期望建立互 信关系,所以双方都会保持沉默。第二局时,双方亦应有相似的想法,继续 保持沉默,以期继续在互信的情况下进行第三局,以致余下的八局。
民主党总统候选人沃尔特·蒙代尔在竞选活动中提出增税 政策,却被罗纳德·里根打得落花流水,因为里根许诺绝不加 税。
里根当选之后,这个议题陷入僵局,无论你怎么划分政 治派别,民主党对共和党,众议院对参议院,还是政府对国 会,各方都希望把提出加税的主动权推给对方。
双方都知道,联合起来共同倡议加税和削减开支,可以 共同分享荣誉,分担谴责。这么做与同时坚守被动,眼看巨 额赤字上升而无所作为相比,显然会对整个国家更有利,即 便对他们自己的政治生涯从长期而言也会有好处。