浅析“囚徒困境”模型中的“理性”假设
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅析“囚徒困境”模型中的“理性”假设
“囚徒困境”博弈模型中个体理性和集体理性的冲突对经济学的基本假设——“理性经济人”造成了严重挑战。认为“囚徒困境”中之所以出现表面的理性冲突是因为囚徒并非真正理性,之后笔者试着给出了两种可以化解这种冲突的方案:一种是改变博弈的理性选择方式,一种是集体理性工具说或集体利益幻象说,这一过程构成笔者对“理性经济人”假设的反思。
标签:“理性经济人”假设;囚徒困境;个体理性;集体理性
引言
“理性经济人”假设是西方经济学理论分析的逻辑起点,它为构建精致庞大的经济学理论体系奠定了一个公理化的起点。在以此为前提取得了丰硕的理论研究成果的同时,它也遭到了众多批判和质疑。1950年普林斯顿大学的塔克(Tucker)教授提出的“囚徒困境”博弈模型是对这一假设的有力冲击。在这一模型里,每个囚徒都是“理性的”,而且他们也都知道对方是“理性的”,每个囚徒都选择了对自己而言是理性的“占优策略”,而结果对每个人而言却都是次劣的,对集体而言则是最劣的[1],这不符合“理性经济人”假设的逻辑结果,即个体理性的利益最大化行为的自然结果即是集体利益的最大化。这促使笔者思考,或者是研究者们在这一模型里对“理性经济人”假设的理解有偏差,或者是这一假设本身即有暗伤存在,囚徒博弈只是帮助我们发现了这一点;或者是这一假设根本不适用于分析该模型中囚徒的策略选择行为,这一点显然是试图逐渐扩张到解释预测一切人类行为的帝国主义经济学所不愿意承认的。而笔者深信,每个囚徒可以选择的“沉默”(合作)与“坦白”(背叛)两种策略不可能都是不理性的,至少有一个策略是相对最为理性的;同样,仅有可能出现的四种结果(最优,次优,次劣,最劣)也不可能对于每个囚徒而言都是不理性的,至少有一个结果是相对最为理性的[2],在模型中如何使理性的策略与理性的结果统一起来,即实现手段理性与目标理性的统一,这是理性的任务。
一、“囚徒困境”及其出现的原因分析
“囚徒困境”博弈模型最初由普林斯顿大学的塔克教授提出。经典的“囚徒困境”如下所述[3]:
两个囚徒被警察抓住后分别关押,警方知道他们有罪,但是苦于缺乏充足的证据。警察给他们的政策是“坦白从宽,抗拒从严”。每个囚徒面临的两个策略选择“沉默”(合作)和“坦白”(背叛)。如果一方“坦白”,而另外一方“沉默”,则坦白方将被释放,而沉默方将被判重刑10年;如果双方均“坦白”,则每人将被判刑8年;如果双方均“沉默”,警方因为没有足够的证据而只能给他们轻微的象征性惩戒,判刑半年。
他们的支付矩阵如下所示:
显然,这是一个完全静态的一次性非合作博弈,且双方都有一个占优策略,博弈的最终结果是占优策略纳什均衡,即双方都选择“坦白”策略,最后的支付是(-8,-8)。这一支付结果显然要劣于(-0.5,-0.5),个体理性的结果对集体而言并不是理性的,个体理性和集体理性发生了冲突;或者我们也可以说,结果不是帕累托最优的,仍有改进的空间,每个囚徒都可以在不损害自己利益的前提下增进对方的福利(少坐牢7年半),同时也增进自己的福利。
那么问题究竟出在哪里呢?
首先,囚徒能不能被抽象为“理性经济人”或者说“理性经济人”能不能以囚徒为代表从某种程度上说,囚徒(比如说他们去偷钱)希望通过偷盗的行为去获取利益,这种不劳而获的想法如果从成本—收益角度考虑自然是理性的,因为它的成本低廉,几乎为零(仅从货币角度而言),而收益相对于成本可能会很大,试图以最小投入获得最大产出毫无疑问是理性的。不过笔者认为社会中大部分人不会通过偷盗或者类似的犯罪行为去获取自身利益,“理性经济人”假设是从千千万万普通的生产者和消费者身上抽象出来的,现在我们不能把它还原为囚徒。
其次,囚徒的偏好发生了变化。当两个囚徒一起作案的时候,他们是集体主义的,通过他们的合作,彼此获益,比如说一个把风,另一个偷盗,为了自己可以分到一部分钱,他们必须为另一个人着想:把风的人要让行窃的人成功偷到钱,而行窃的人必须承诺给把风的人一笔钱,否则把风的人就会告发他;可是当被抓到以后,他们都变成了只顾自己的个人主义者。(事实上,这里所说的个人主义或者集体主义有尚未被挖掘到的内涵,笔者将在后文展开论述。)如果主体的偏好前后发生变化,不再有一致性,那我们也不能称该主体为“理性经济人”,“理性经济人”的偏好具有稳定性。
第三,即使我们承认囚徒也可以是“理性经济人”,难道他们不可以有其它的理性选择方式而不是根据占优策略行事吗?打个比方,两个囚徒通过做一道只可能有四个选项的单项选择题来选择自己坐多少年牢,ABCD四个选项分别对应矩阵中的四个结果:
A.(-0.5,-0.5)
B.(-10,0)
C.(0,-10)
D.(-8,-8)(甲在前,乙在后)
由于甲乙两个囚徒同样是“理性经济人”,他们可以被认为是同质的,有理由认为两个同质的人在相同的情景下做出的选择也应该完全一致,他们承担的罪责也一定和对方的一样多,因为他们谁也不比谁更聪明些,任何一个也就没有能力让对方承担更多的罪责,那么就只剩下AD两个选项,又因为他们都是理性的人,他们当然都会选择A,于是他们都只能选择“沉默”。既然至少有两条理性的道路,而它们得出的结论又大相径庭,这就让笔者不得不认为根据占优策略行事的原则是不是理性的,而笔者的思路则显然不会引起这种冲突。
二、重新定义“集体理性”——不依靠第三方解决冲突的一种努力
在上面的分析里笔者曾指出,个人主义和集体主义有尚待挖掘的内涵。首先,集体是由个体组成的,没有个体就不会有集体,那么集体的种种属性便只可能是个体某种属性的集合或者说结果。个体有理性和非理性两种属性,集体同样也有这两种属性,问题是:集体的非理性是不是有可能是个体理性的结果?首先,把“囚徒困境”中的集体非理性移植到这里,将其单纯理解为某一行为将对集体中的所有个体造成利益损失,那么集体非理性对于每一个总是理性的个体而言也将造成损失,为了逻辑自洽,个体在明知道自己的选择行为会造成集体非理性的情况下不进行相关行为才是理性的,对每个个体而言都是这样。至少在囚徒博弈模型里,每个人都仍然是从自利出发并且着眼于自身利益的最大化,只不过他们的自利必须通过利他的手段来实现,或者说利他只是每个人自利的自然结果,所谓的集体利益或者集体理性不过是个体实现自利的工具;集体利益是不存在的,就像集体理性是个体理性或者非理性的组合与结果一样,集体利益是个体利益的加总,而且最终还是会落实到个体身上,所以它就只是作为词汇在概念上有意义,作为工具在分析时起作用,集体利益是一种幻相。
两个囚徒正像组成了一个卡特尔组织,他们都应选择“沉默”策略,通过实现集体理性这一手段来达到个体理性这一目的。真正理性的行为主体是可以为了长远个体利益选择不去打开提供了自我瓦解激励的潘多拉盒子的,一个理性的决策者知道应该在哪一点停止,理性王国是有其领土范围的。
结论
传统的“理性经济人”假设在“囚徒困境”中遇到了挑战,在种种困境出现的可能的原因里面有一点是对于“理性”定义的误解导致的。文章首先简要地回顾了一下“囚徒困境”模型,分析了其出现的可能原因在于根据占优策略原则行事是我们对“理性”的一种误解,然后通过思辨和对个体理性与集体理性的重新界定,笔者找到了解决囚徒困境的两种方案:一是把“理性经济人”理解为同质的行为主体,完全剥离掉现实因素的影响,纯粹在逻辑层面分析囚徒博弈的必然结果是双方合作,个体理性实现个体利益在约束条件下的最大化(尽管是次优的,然而已经是约束下的最优),同时集体理性作为结果也得到实现;二是重新理解个体理性与集体理性的内涵及二者关系,指出了集体利益和集体理性作为概念的虚假性,笔者认为个体利益和个体理性才是第一义的,个体利益既是理性选择行为的出发点也是其最终归宿,集体利益和集体理性只是个体利益和个体理性的组合或者结果,从而博弈中自利的囚徒个体将集体作为一个工具加以利用来实现其利益,而且每个囚徒都必须理性地通过集体这一幻象。
有读者可能会困惑:本文究竟是对“理性经济人”的质疑还是维护?笔者的思路是这样的:诸多研究者认为是“理性经济人”假设造成了“囚徒困境”,而笔者认为“困境”并不是这一假设的必然逻辑结果,于是本文就是对多数人理解的“理性经济人”的质疑;笔者自己则认为质疑是对假设的重新发现,重新回到经济学的理论原点,然而却已经是站在一个更高的层次上。
参考文献: