囚徒困境的论文

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

走出“囚徒困境”

囚徒困境作为博弈论中的一个经典范例,其博弈理论逐渐被经济学、哲学、伦理学、管理学等诸多学科的研究所重视,辩证的看待这一研究现象,是促进

人们深入研究相关社会现象的一种特殊的思维路劲和方法。

一、囚徒困境经典案例分析

囚徒困境的内容是这样的:警方逮捕甲、乙两名嫌疑犯,但没有足够证据

指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以

下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而

对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。若二人都互相检举(互相

“背叛”),则二人同样判监2年。

用表格概述如下:

们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管

他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时做出的。

博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利

益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因

此只能实现对他们都不理想的结果(各判2年),并且这个结果具有必然性,

很难摆脱,因此这个博弈被称为“囚徒困境”。

“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理

性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,

帕累托改进得不到进行,帕累托最优得不到实现。但是这样的分析是基于单次

博弈的基础之上,而在重复的囚徒困境中,博弈会被反复的进行,因而没个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。

二、类似囚徒困境的经典案例分析

在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。比如中东石油输出国组织(简称OPEC)的成立,本身就是要限制各石油生产国的产量,以保持石油价格,以便获取利润,是合作的产物。OPEC之所以能够成立,各组织成员国之间之所以能够合作,是因为囚徒困境如果是一次性博弈的话,基于个人利益最大化,得到纳什均衡解,但如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解。

但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。如果该困境同时涉及多个对手,则要在博弈对手中形成声誉,并用心地维护这个声誉。这里“可信的承诺”是实实在在的付出,所以合作是非常困难的。因此OPEC 组织经常会有成员国不遵守组织的协定,私自增加石油产量。每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失。当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进一步下降。结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌……

理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。但只要是有限次的合作,合作就不会成功。比如合作10次,那么在第九次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反

正以后我也不会跟你合作了。但是大家料到第九次会出现不合作,那么就很可

能在第八次就采取不合作的态度。第八次不合作会使大家在第七次就不合作……一直到,从第一次开始大家都不会采取合作态度。

以上是运用博弈论中的经典案例“囚徒困境”对现实经济生活的一些简单的理论上的分析,虽然在现实生活当中影响人们决策和态度的因素很多,但是,博弈论作为现代经济学的前沿领域,始终是一个强有力的分析工具。

三、个人理性与集体理性存在的矛盾及解决方式

囚徒困境是建立在三大基础假设之上的:一是信息不对称博弈双方对自己

敌人的选择一无所知;二是竞争中的非合作性,在单次博弈中,竞争者之间不

存在合作关系,因此博弈双方为了争取自己利益的最大化,会发展成恶性竞争;三是陌生人背景,即博弈双方不熟识,不会在日后的长期发展中建立各种人际

关系,不存在长期的合作和博弈。因此,被自己最大化的利益所驱使,集体理

性和个人理性会发生悖离,产生矛盾。

奥尔森在1965年提出的“集体行动的逻辑”中描述了这点,当集体人数较少时,集体行动比较容易产生,然而,随着集体人数的增大,产生集体行动就

会越来越困难。因为在人数众多的大集体内,要通过协商解决如何分担集体行

动的成本很不容易。而且人数越多,人均收益就相应减少,搭便车的动机变越

强烈,搭便车的行为也越难被发现。一个理性人只要不被排斥在分享由他人努

力所带来的利益之外,就没有动力为共同的利益做贡献,而大多人只会选择做

一个搭便车者。奥尔森“集体行动的逻辑”与一些社会学家所假设的“一个具

有共同利益的群体,一定会为实现这个共同利益采取集体行动”这一必然推导

结果产生了不一致。因为个人利益相加并不等于集体利益,每个人使得自己利

益最大化不代表集体利益就实现了最大化。因为个人利益不会总是与集体利益

保持一致。无论是囚徒困境还是集体行动的逻辑都反映出:个人理性未必是集

体理性的充分必要条件;个人的理性行动最终导致的未必是集体的理性的结果。

个人理性和集体理性的冲突似乎是人类社会面临的根本性问题之一,也是

在人们在社会管理过程难以跨越的障碍。但是也并不是毫无办法。

相关文档
最新文档