囚徒困境的论文 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

走出“囚徒困境”

囚徒困境作为博弈论中的一个经典范例，其博弈理论逐渐被经济学、哲学、伦理学、管理学等诸多学科的研究所重视，辩证的看待这一研究现象，是促进

人们深入研究相关社会现象的一种特殊的思维路劲和方法。

一、囚徒困境经典案例分析

囚徒困境的内容是这样的：警方逮捕甲、乙两名嫌疑犯，但没有足够证据

指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以

下相同的选择：若一人认罪并作证检举对方（相关术语称“背叛”对方），而

对方保持沉默，此人将即时获释，沉默者将判监10年。若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。若二人都互相检举（互相

“背叛”），则二人同样判监2年。

用表格概述如下：

们各自都有“不坦白”和“坦白”两种可选择的策略；因为这两个囚徒被隔离开，其中任何一人在选择策略时都不可能知道另一人的选择是什么，因此不管

他们决策的时间是否真正相同，我们都可以把他们的决策看作是同时做出的。

博弈的结果是：由于这两个囚徒之间不能串通，并且各人都追求自己的最大利

益而不会顾及同伙的利益，双方又都不敢相信或者说指望对方有合作精神，因

此只能实现对他们都不理想的结果（各判2年），并且这个结果具有必然性，

很难摆脱，因此这个博弈被称为“囚徒困境”。

“囚徒困境”告诉我们，个人理性和集体理性之间存在矛盾，基于个人理

性的正确选择会降低大家的福利，也就是说，基于个人利益最大化的前提下，

帕累托改进得不到进行，帕累托最优得不到实现。但是这样的分析是基于单次

博弈的基础之上，而在重复的囚徒困境中，博弈会被反复的进行，因而没个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。

二、类似囚徒困境的经典案例分析

在现实生活当中，信任与合作很少达到如此两难的境地，无论在自然界还是在人类社会，“合作”都是一种随处可见的现象。比如中东石油输出国组织（简称ＯＰＥＣ）的成立，本身就是要限制各石油生产国的产量，以保持石油价格，以便获取利润，是合作的产物。OPEC之所以能够成立，各组织成员国之间之所以能够合作，是因为囚徒困境如果是一次性博弈的话，基于个人利益最大化，得到纳什均衡解，但如果是多次博弈，人们就有了合作的可能性，囚徒困境就有可能破解，合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解。

但合作的可能性不是必然性。博弈论的研究表明，要想使合作成为多次博弈的均衡解，博弈的一方（最好是实力更强的一方）必须主动通过可信的承诺向另一方表示合作的善意，努力把这个善意表达清楚，并传达出去。如果该困境同时涉及多个对手，则要在博弈对手中形成声誉，并用心地维护这个声誉。这里“可信的承诺”是实实在在的付出，所以合作是非常困难的。因此OPEC 组织经常会有成员国不遵守组织的协定，私自增加石油产量。每个成员国都这样想，只要他们不增加产量，我增加一点点产量对价格没什么影响，结果每个国家都增加产量，造成石油价格下跌，大家的利润都受到损失。当然，一些产量增加较少的国家损失更多，于是也更加大量生产，造成价格进一步下降。结果，陷入一个困境：大家都增加产量，价格下跌，大家再增加产量，价格再下跌……

理论上，如果是无限期的合作，双方考虑长远利益，他们的合作是会成功的。但只要是有限次的合作，合作就不会成功。比如合作１０次，那么在第九次博弈参与人就会采取不合作态度，因为大家都想趁最后一次机会捞一把，反

正以后我也不会跟你合作了。但是大家料到第九次会出现不合作，那么就很可

能在第八次就采取不合作的态度。第八次不合作会使大家在第七次就不合作……一直到，从第一次开始大家都不会采取合作态度。

以上是运用博弈论中的经典案例“囚徒困境”对现实经济生活的一些简单的理论上的分析，虽然在现实生活当中影响人们决策和态度的因素很多，但是，博弈论作为现代经济学的前沿领域，始终是一个强有力的分析工具。

三、个人理性与集体理性存在的矛盾及解决方式

囚徒困境是建立在三大基础假设之上的：一是信息不对称博弈双方对自己

敌人的选择一无所知；二是竞争中的非合作性，在单次博弈中，竞争者之间不

存在合作关系，因此博弈双方为了争取自己利益的最大化，会发展成恶性竞争；三是陌生人背景，即博弈双方不熟识，不会在日后的长期发展中建立各种人际

关系，不存在长期的合作和博弈。因此，被自己最大化的利益所驱使，集体理

性和个人理性会发生悖离，产生矛盾。

奥尔森在1965年提出的“集体行动的逻辑”中描述了这点，当集体人数较少时，集体行动比较容易产生，然而，随着集体人数的增大，产生集体行动就

会越来越困难。因为在人数众多的大集体内，要通过协商解决如何分担集体行

动的成本很不容易。而且人数越多，人均收益就相应减少，搭便车的动机变越

强烈，搭便车的行为也越难被发现。一个理性人只要不被排斥在分享由他人努

力所带来的利益之外，就没有动力为共同的利益做贡献，而大多人只会选择做

一个搭便车者。奥尔森“集体行动的逻辑”与一些社会学家所假设的“一个具

有共同利益的群体，一定会为实现这个共同利益采取集体行动”这一必然推导

结果产生了不一致。因为个人利益相加并不等于集体利益，每个人使得自己利

益最大化不代表集体利益就实现了最大化。因为个人利益不会总是与集体利益

保持一致。无论是囚徒困境还是集体行动的逻辑都反映出：个人理性未必是集

体理性的充分必要条件；个人的理性行动最终导致的未必是集体的理性的结果。

个人理性和集体理性的冲突似乎是人类社会面临的根本性问题之一，也是

在人们在社会管理过程难以跨越的障碍。但是也并不是毫无办法。