“囚徒困境”引发的思考
博弈论论文囚徒困境的启示和思考

囚徒困境的启示和思考二、囚徒困境的解释如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。
参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。
另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。
就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是两种策略之中的支配性策略。
因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。
以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。
但根据以上假设,二人均为理性的个人,且只追求自己个人利益。
均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。
这就是“困境”所在。
实际上囚徒困境在我们的实际生活中也有很多,下面举两个进行说明三、经济学例子:关税战两个国家,在关税上可以有以两个选择:提高关税,以保护自己的商品。
(背叛)与对方达成关税协定,降低关税以利各自商品流通。
(合作)当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。
然后二国又重新达成关税协定。
对囚徒困境的理解

对囚徒困境的理解囚徒困境是博弈论中的一个经典问题,它描述了两个囚徒之间的决策情景。
在这个困境中,两个囚徒被关押在不同的牢房中,他们被指控犯有同样的罪行。
检察官向每个囚徒提供了一个选择:合作还是背叛。
如果两个囚徒都选择合作,即不揭发彼此,那么他们将会被判处较轻的刑罚。
而如果两个囚徒都选择背叛,即相互揭发对方,那么他们将会受到较重的惩罚。
然而,如果一个囚徒选择合作,而另一个囚徒选择背叛,那么背叛的囚徒将会获得最小的刑期,而合作的囚徒将会受到最严厉的惩罚。
这个问题的关键在于,每个囚徒在做出决策时,无法知道对方会选择什么。
因此,每个囚徒都需要权衡自己的选择。
如果他们只考虑个人利益,那么背叛是最理性的选择,因为无论对方选择什么,背叛都能获得较轻的刑罚。
但是,如果两个囚徒都这样选择,那么最终他们都将受到较重的惩罚。
相反,如果每个囚徒考虑到对方的选择,那么合作就成为了最优策略。
因为如果两个囚徒都选择合作,他们都能够获得较轻的刑罚。
而如果一个囚徒选择背叛,那么他将面临较重的刑罚,而另一个囚徒的选择将不会对他造成任何影响。
囚徒困境的核心在于协作与背叛之间的冲突。
每个囚徒都有动机追求自己的利益,但如果他们只顾自己,最终结果可能是对双方都不利的。
只有通过相互合作,才能够达到双方的最佳结果。
囚徒困境不仅仅是一个理论问题,它在现实生活中也有很多应用。
例如,在商业谈判中,各方之间存在着合作与背叛的选择。
如果每个人只追求自己的利益,那么谈判可能会陷入僵局。
但如果各方能够相互信任、相互合作,那么谈判可能会达成双赢的结果。
在囚徒困境中,合作是一种理性的选择。
虽然背叛可能会在短期内带来一些好处,但从长远来看,合作才能够带来最大的利益。
通过合作,囚徒可以减轻自己的刑罚,并且为对方也创造了一个减轻刑罚的机会。
囚徒困境还提醒我们,相互信任和合作是社会发展的重要基石。
如果每个人都只考虑自己的利益,那么整个社会可能陷入恶性循环。
只有通过相互信任和合作,才能够实现社会的和谐与进步。
囚徒的困境读后感

囚徒的困境读后感最近读了一本关于“囚徒的困境”的书,这可真是让我大开眼界,也让我对人与人之间的关系和选择有了更深的思考。
书里讲的“囚徒的困境”,简单来说就是两个嫌疑人被警察分别审讯,如果两个人都不坦白,那可能都判得比较轻;要是一个坦白一个不坦白,坦白的那个能从轻处罚,不坦白的那个就惨了;要是两个人都坦白,那就都得重判。
这看起来好像很简单,但背后的逻辑和对人性的考验可太复杂了。
这让我想起了有一次我和朋友的经历,简直就是现实版的“囚徒困境”。
那是一个阳光明媚的周末,我和朋友小李相约去逛街。
逛着逛着,我们看到了一家新开的手机店,橱窗里展示着最新款的手机,那外观,那功能,简直太诱人了。
我们忍不住走了进去,店员热情地迎上来,给我们介绍各种手机的特点。
我俩眼睛都直了,心里那叫一个喜欢。
就在这时,店员说店里正在搞一个活动,如果我们能在店里的一个小游戏中获胜,就有机会以超低的折扣买到这款手机。
游戏规则是这样的,我们俩分别被带到两个房间,然后各自在一张纸上写下一个数字,范围是 1 到 100。
如果我们写的数字之和等于或者最接近店家事先设定的一个数字,我们就能赢。
我被带进房间后,心里就开始盘算起来。
我想,如果小李写个 50,那我写个 50,加起来就是 100,说不定就中了。
但又一想,万一他写个 30 呢,那我写 70 是不是更保险?可要是他也这么想,写了 70,那我俩加起来可就超了。
我纠结得不行,感觉自己就像那困境中的囚徒,不知道该怎么选择。
我坐在那里,手握着笔,脑门都开始冒汗了。
我想给小李使个眼色,或者偷偷交流一下,可这根本不可能,规则严着呢。
最后,我心一横,随便写了个 60。
等我们都交了纸条,店员宣布结果的时候,我的心都提到嗓子眼了。
结果出来,我俩写的数字之和远远超过了店家设定的数字,我们输了。
走出手机店,我和小李互相看着,都无奈地笑了。
我说:“哎呀,我当时就在那想来想去,不知道你会写多少,又怕咱俩写的差距太大。
囚徒困境,信任博弈,最后通牒,独裁者博弈。感想

囚徒困境,信任博弈,最后通牒,独裁者博弈。
感想在囚徒困境中,两名囚犯被关押在不同的牢房里,缺乏沟通的情况下面临做出合作或背叛的选择。
他们都知道如果两人都选择合作,那么他们的处境会比较好;但如果其中一人选择背叛而另一人选择合作,背叛者将获益而合作者将受损;如果两人都选择背叛,那么两人都会受到损失。
这个困境暗示了在没有信任和沟通的情况下,个人间的最优选择可能并不是最佳的整体结果。
信任博弈是一种涉及到信任和背叛的博弈。
在信任博弈中,两个参与者可以选择相互合作或者背叛对方。
如果两者都选择合作,他们都会受益;如果两者都选择背叛,他们都会受损;如果一个选择合作而另一个选择背叛,合作者将受到最大的损失而背叛者则获益最大。
在这种情况下,信任和合作是建立稳定关系的基础,但也存在被背叛的风险。
最后通牒是一种博弈策略,其中一方在给定时间内要求对方做出决策,否则将采取一定的行动。
这种策略常用于谈判和冲突解决中。
通过设置时间限制,最后通牒可以迫使对方在有限的时间内做出决策,以避免无休止的博弈和僵局。
独裁者博弈是一种博弈理论中的模型,描述了一个独裁者与其他个体之间的互动。
在这种博弈中,独裁者可以自行决定资源的分配方式,而其他个体只能接受独裁者的决策。
这种博弈模型中,独裁者通常会追求自己的最大利益,而其他个体则被动接受结果。
通过对囚徒困境、信任博弈、最后通牒和独裁者博弈的了解和思考,我认为在现实生活中,信任、合作和建立有效的沟通渠道非常重要。
尽管存在着各种博弈策略和困境,但通过互相理解和协商,我们可以寻求双赢的解决方案,促进社会的稳定与发展。
在处理复杂的问题时,我们应该尝试建立合作关系,避免盲目追求个人利益,以期实现更大范围的利益最大化。
囚徒困境在生活中的启示

囚徒困境在生活中的启示囚徒困境是博弈论中的一个经典问题,也是一种常见的社会情境。
它发生在两个囚徒之间,被捕后皆面临可能的刑期。
虽然囚徒有合作的动机,但由于缺乏信任,他们往往面临互相背叛的冲动。
囚徒困境给我们生活带来了许多启示。
首先,囚徒困境教会我们理性思考。
在这个问题中,每个囚徒都需要考虑自己的最佳选择,无法依赖他人的行动。
这使得囚徒必须根据自己的利益,以及对其他囚徒行为的猜测,进行决策。
类似的情况在现实生活中也经常出现,我们需要根据自身利益和情境来做出决策,而不是盲目地依赖他人。
其次,囚徒困境提醒我们合作的重要性。
在囚徒困境中,如果两个囚徒都选择合作,两人的刑期会比互相背叛更短。
这告诉我们合作可以带来更好的结果,而不是仅仅追求个人利益。
在现实生活中,合作不仅能够帮助我们实现共同目标,还可以建立起信任和良好的人际关系。
再次,囚徒困境启示了信任的重要性。
在囚徒困境中,两个囚徒之间缺乏信任,因此很容易被诱导选择背叛。
这告诉我们信任是建立在互相了解和信念上的,而不是盲目的。
在现实生活中,信任可以使人与人之间的交流更加顺畅,也可以为合作提供坚实的基础。
此外,囚徒困境还提醒我们考虑长期利益而非短期利益。
在囚徒困境中,如果两个囚徒都视短期利益为重,选择背叛,最终的结果将是两个人都受损。
然而,如果他们能够着眼于长期利益,选择合作,两人的刑期将会缩短。
在现实生活中,我们也应该考虑到长远的结果来做出决策,而不是仅仅追求眼前的利益。
最后,囚徒困境还展示了适应能力的重要性。
在囚徒困境中,囚徒之间的行为会互相影响,而且在不同的情境下会产生不同的结果。
因此,囚徒需要根据情境的变化来调整自己的策略。
在现实生活中,我们也需要具备灵活性和适应性,根据不同的场景和局势来做出相应的调整。
综上所述,囚徒困境在生活中给我们带来了诸多启示。
它提醒我们理性思考、合作、信任、考虑长期利益以及适应能力的重要性。
通过理解和应用这些启示,我们可以在现实生活中做出更明智的决策,建立更良好的人际关系,实现更好的个人发展。
从囚徒困境中得到的启示

从囚徒困境中得到的启示
囚徒困境,这个经典的对局模型,给我们提出了一个重要的问题:在一个社会中,如何才能做出最佳的决策?这个问题也引发了很多讨论,并且深刻地影响了社会各个领域的发展。
囚徒困境的核心思想是:一个人自私地寻求最大效益并不能促进公共的善。
这意味着,如果只有一方自私,那么最终的结果可能是“各败俱伤”的局面。
但是,如果两方都能做出合理的考虑,并能够相互合作,那么就有可能达到双赢的局面。
这个模型有很多启示。
首先,它提醒我们,在做出决定时,要考虑到其他人的利益,而不是只考虑自己的利益。
其次,它也提醒我们,合作才能获得最好的结果。
最后,它还告诉我们,在设计社会制度时,要从最没有德性的人出发,以保障社会正义。
囚徒困境的启示很重要,它不仅引领着社会发展,还指导着我们如何做出正确的决策。
它说明,在遇到复杂的决策问题时,要考虑到更多的因素:不能只考虑自己的利益,而要考虑到其他人的利益;不能只考虑眼前的利益,而要考虑长远的利益;不能只考虑自身的目的,而要考虑实现公共利益的目的。
囚徒困境的结局启示着我们,在做出决定时要充分考虑,不能只考虑自己的利益,而要考虑其他人的利益,不能只考虑眼前的利益,而要考虑长远的利益,不能只考虑自身的目的,而要考虑实现公共利益的目的。
只有这样,才能使社会发展走向正确的方向,才能让社会变得更加和谐、繁荣。
囚徒困境的启示与意义

囚徒困境的启示与意义一、引言囚徒困境是博弈论中的一个经典问题,它描述了两个独立的参与者在缺乏沟通和合作的情况下做出决策的情形。
这个问题不仅仅存在于博弈论中,也广泛应用于社会学、政治学、经济学等领域。
本文将探讨囚徒困境的启示与意义。
二、囚徒困境的定义囚徒困境是指两个独立的参与者在缺乏沟通和合作的情况下做出决策,其结果会受到对方行为的影响。
具体来说,每个参与者都有两种选择:合作或背叛。
如果两个人都选择合作,则他们都会获得最好的结果;如果两个人都选择背叛,则他们都会获得最差的结果;如果一个人选择合作而另一个人选择背叛,则前者将获得最差的结果,而后者将获得最好的结果。
三、囚徒困境在社会学中的应用1. 社交心理学在社交心理学中,研究人员使用囚徒困境来探索人们如何做出互动和合作决策。
研究表明,人们更容易选择合作,特别是在长期互动的情况下。
此外,研究还发现,当人们认为对方可能会背叛时,他们更倾向于选择背叛。
2. 社会合作囚徒困境也可以应用于社会合作的研究中。
例如,在环保领域,囚徒困境可以描述一个社区中的人如何决定是否采取环保措施。
如果每个人都采取措施,则整个社区将获得好处;如果只有少数人采取措施,则其他人可以从中受益而不必自己付出代价;但是,如果所有人都不采取措施,则整个社区将遭受损失。
四、囚徒困境在政治学中的应用1. 国际关系在国际关系中,囚徒困境可以描述两个国家之间的互动。
例如,在贸易谈判中,两个国家可能面临着类似于囚徒困境的情况:如果两个国家都签署了协议,则他们都会获得好处;如果两个国家都没有签署协议,则他们都会遭受损失;但是,如果一个国家签署了协议而另一个国家没有签署,则前者将获得好处,而后者将遭受损失。
2. 政治合作囚徒困境也可以应用于政治合作的研究中。
例如,在政府间的合作中,囚徒困境可以描述两个政府之间的互动。
如果两个政府都采取措施,则他们都会获得好处;如果两个政府都不采取措施,则他们都会遭受损失;但是,如果一个政府采取措施而另一个政府没有采取措施,则前者将获得好处,而后者将遭受损失。
囚徒困境的启示

囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。
警察知道两人有罪,但缺乏足够的证据。
警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。
于是,每个囚徒都面临两种选择:坦白或抵赖。
然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。
结果,两个嫌疑犯都选择坦白,各判刑八年。
如果两人都抵赖,各判一年,显然这个结果好。
但这个帕累托改进办不到,因为它不能满足人类的理性要求。
囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
感悟一:一厢情愿的信任很可贵,人与人之间的相互信任更难得!这也就是团队的价值所在今天带来囚徒困境的第二个分享:在囚徒困境试验中,做了一个这样延伸的实验,不同组固定的成员重复多次进行囚徒困境实验,如果在第一次实验时,小组当中一人选择了背叛的话,那么后面的试验中小组两人再合作的可能性为零,同样如果小组两个成员在一开始就选择了忠于对方的话,在代价不变的情况下,他们会选择继续合作。
感悟二:信任就像一张纸,揉皱了就很难抚平了。
人与人之间,企业与员工之间,企业与企业之间开始的合作非常重要,如果企业在一开始就无法兑现员工的薪资、绩效、福利,承诺的事做不到的话,想留住员工就很难;同样,如果员工在进入公司一开始就不能遵守公司的纪律,领导交办的任务不能保质、保量、按时完成的话,企业也会失掉对员工的信任,想要再委以给重任就很难了。
k“将在外,君令有所不受。
”有如此底气,是否你积累了足够的信任呢?大家早上好,今天带来囚徒困境的第三个分享:在信息透明的前提下,如果选择背叛对方付出的代价要远远高于合作的代价的话,几乎所有的人都会选择合作;但是随着背叛获得的个人利益越来越大,也就有越来越多的囚徒选择背叛。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“囚徒困境”引发的思考
“囚徒困境”博弈是图克(Tucker)1950年提出的一个著名的博弈模型,是完全信息静态博弈的典型例子。
一、基本模型
囚徒困境博弈的基本情况如下:警察抓住了两个合伙犯罪的罪犯,但却缺乏足够的证据指证他们所犯的罪行。
如果其中至少有一人供认犯罪,就能确认罪名成立。
为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟,并给他们同样的选择机会;如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑;如果两人中有一人坦白认罪,则坦白者从轻认罪,立即释放,而另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们将被各判5年监禁。
如果分别用-1、-5和-8 表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即释放的得益,则两囚徒的得益矩阵如下:
囚徒2
坦白不坦白
囚徒1 坦白-5,-5 0,-8
不坦白-8,0 -1,-1
在上图中,“囚徒1”、“囚徒2”分别代表本博弈中的两个博弈方,也就是两个罪犯;他们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时做出的。
其中矩阵中第一个数字代表决策结果后囚徒1的得益,第二个数字代表决策结果后囚徒2的得益。
博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因此只能实现对他们都不理想的结果(各判5年),并且这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒困境”。
[1]
二、关于完全理性的思考
囚徒困境博弈的一个假设是博弈方都是完全理性。
完全理性来源于经济学中的理性人假设,即博弈方都以个体利益最大化为目标,且有准确的判断选择能力,也不会“犯错误”。
以个体利益最大为目标被称为“个体理性”,有完美的分析判断能力和不会犯选择行为的错误称为“完全理性”。
完全理性包括追求最大利益的理性意识、分析推理能力、识别判断能力、记忆能力和准确行为能力等多方面的完美性要求,其中任何一方面不完美就不属于完全理性。
[1]我们可以看出,这是一个要求非常严格的假设。
即便如此,完全理性仍在一个方面没有做出规定(至少是没有意识到或明确地规定出来),就是思维方式,也即是博弈方是以将问题分解的方式来思考问题呢,还是以系统的整体的方式来思考问题的。
我引用《第五项修炼》上的一段话来表达这两种思维方式的不同。
自幼我们就被教导把问题加以分解,把世界拆成片片段段来理解。
这显然能够使复杂的问题容易处理,但是无形中,我们却付出了巨大的代价——全然失掉对“整体”的连属感,也不了解自身行动所带来的一连串后果。
于是,当我们想一窥全貌时,便努力重整心中的
片段,试图拼凑所有的碎片。
但是就如物理学家鲍姆(David Bohm)所说的,这只是白费力气;就像试着重新组合一面破镜子的碎片,想要看清镜中的真像。
经过一阵子努力,我们甚至干脆放弃一窥全貌的意图。
现在我们以系统的整体的思维方式来重新分析囚徒困境博弈。
警察的目的是获得证据,以使囚徒获得应有的惩罚,囚徒的目的是“获取”最少的惩罚。
双方的这种矛盾使得囚徒有串通的倾向,为了离间两个囚徒,警察确立了模型中的规则(且不论这些规则和设置合不合理)。
对每个囚徒来说,要想达到自身的目的,而不考虑整个模型设置的目的,很显然是不行的。
囚徒该如何选择呢?答案是不坦白。
如果囚徒看出了该模型的目的,若选择坦白,以自推人,对方也会选择坦白,必然落入警察的圈套,此所谓鹬蚌相争,渔翁得利。
当两博弈方都用系统思维来考虑这个问题时,相互配合1是其最好的选择,因为在完全理性假设前提下,自己选择坦白而另一方选择不坦白,这种机会是没有的,这种饶幸心理也是取不得的,剩余的只有要不都坦白,要不都不坦白,所以相互配合是其最好的选择,结果一定是不坦白。
此所谓兄弟阋于墙,外御其侮,这也是空城记能够唱成的原因。
如果任何博弈方不是采用系统的思维方式来思虑这个问题的,因为一方用分解的思维方式来思考囚徒困境,他会选择坦白,那么另一方不管用什么思维方式来思考这个问题,选择坦白都是最好的,因此其结果必然是都坦白。
三、关于概率的思考
从概率上来说,都坦白的概率上是非常大的,可能很接近1或者等于1。
但概率没有表示出事件到底是怎么样发生的,它只表示了发生的可能。
概率等于1代表的是事件发生的可能性是100%,而不是事件发生了;同样,概率为0代表的是事件发生的可能性为0,但这不能就此说事件不会发生了。
例如,我们掷飞镖,从理论上讲,对于圆盘上每一点来说概率都为0,但只要我们把飞镖掷到了圆盘上,对于圆盘上的被掷到的那一点来说,被掷到的概率为0,但它还是被掷到了,事件还是发生了。
这有点像红军的爬雪山过草地,在蒋介石看来,并且从当时的历史和实际来看,红军的爬过雪山走过草地的可能性为0,但正是这个0的概率,使中国的历史走到了今天。
反过来,我们也可以说概率等于1的事件不一定就发生。
在概率论中,随机变量分为离散型随机变量和连续型随机变量两种。
对于离散型随机变量,由于其对概率为0的可能值不会包括在内,这使我们习惯性地把概率为0的可能值视为不会发生。
也正是由于此,我们无法找到概率为0的离散型随机变量,也就无法证明它会发生。
对于任意的连续型随机变量,对于任何常数和(),。
对于随机变量的取值范围内的任何一点来说,其概率为,显然为0;对于某一事件来说,其发生的值假定为,那么,我们得出在概率为0的点事件发生了。
在大家都认为都坦白的概率等于1时,其实其前提是大家都是以分解的思维方式来考虑问题的。
现在我们假定在社会中用系统思维方式考虑问题的人占所有社会人的(),用分解思维方式考虑问题的为。
假定用系统思维方式考虑问题的人相遇时,囚徒困境的结果是都不坦白。
假定一方坦白,另一方不坦白的概率为0。
假定两种不同的思维方式相遇或都用分解思维方式时,结果都是坦白。
那么警察能够达到目的的概率为。
在双方都知道对方是什么样的思维方式的前提下,一方坦白另一方不坦白的博弈结果,因为其概率为0,所以不会对我们的概率(统计)结果有什么明显的影响。
然而就某一次博弈来说,我们无法确定最后的结果是什么,只能说一切皆有可能发生。
四、关于完全信息的思考
关于完全信息,我的问题是完全信息是等于共同知识还是等于一致信念?共同知识指的是“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道……”的知识。
一致信念是指这种情况,即使所有参与人“共同”享有某种知识,每个参与人也许并不知道其他参与人知道这些知识,或者并不知道其他人知道自己拥有这些知识。
[2]
张维迎在《博弈论与信息经济学》中关于完全信息的表述为:完全信息是指自然不首先行动或自然的初始行动被所有参与人准确观察到的情况,即没有事前的不确定性。
信息是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。
谢识予在《经济博弈论》在的表述为:各博弈方都完全了解其他博弈方各种情况下得益的博弈称为“完全信息(Complete Information)博弈”。
我们可以看出,张维迎认为完全信息即没有事前的不确定性,也就是说完全信息等于共同知识。
谢识予认为只要各博弈方都完全了解其他博弈方各种情况下得益就是完全信息,可以说他认为完全信息等于一致信念。
当完全信息等于共同知识时,就如上面的分析。
但当完全信息只等于一致信念时,情况就会变得比较复杂。
在完全信息等于一致信念的情况下,我们假定囚徒困境中的博弈方只知道各博弈方在各种情况下得益,任何一方都不知道另一方知道不知道自己知道这些得益以及以后的情况2。
如果我们假定双方都以对方不知道自己知道这些得益为前提来思考这个博弈,那么情况会怎么样呢?因为囚徒困境中的均衡是一个上策纳什均衡,在分解思维方式下,不管自己还是对方知道不知道这些信息,自己的上策都是坦白,所以在信息方面不用考虑那么多。
但在系统思维方式下,如果完全信息仅仅是一致信念,以后的信息就可以说是具有不确定性。
在面临不确定性时,我们的完全理性假设就不成立,因为不确定性是指决策者根本不知道某一变量有几个可能的取值,更不知道第一可能值发生的概率;Knight(1921)指出有限理性的根基是所谓的“根本的不确定性”。
可以和完全理性并存的是不完全信息或称风险,即决策者知道某一变量所有可能的取值,以及每一值发生的概率。
[3]因此,完全信息应该等于共同知识,否则我们无法分析囚徒困境。
通过以上的分析,本文认为,即便我们对囚徒困境的前提假设再增加上以分解思维方式思考和完全信息等于共同知识,在面临概率的问题时我们仍然不能确保囚徒困境一定发生,要不现实中对犯罪的审问也就非常简单了。
参考文献:
[1]谢识予.经济博弈论[M].上海:复旦大学出版社,2002.
[2]张维迎.博弈论与信息经济学[M].上海:上海三联书店上海人民出版,2002.[3]杨小凯.不完全信息与有限理性的差别[N].经济学信息报.2001-11-23.
1. 此处的相互配合不是指串通或合作,是指各博弈方在得益驱动下各自自觉、独立采取的合作态度和行为。
2. 以后的情况是指任何一方都不知道任何一方都不知道另一方知道不知道自己知道这些得益,任何一方都不知道任何一方都不知道任何一方都不知道另一方知道不知道自己知道这些得益……。