“囚徒困境”中非纳什均衡出现的可能性及其原因分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

摘要:“囚徒困境”博弈是完全信息静态博弈的典型例子,被认为是上策纳

什均衡,具有必然性,但在现实中非纳什均衡也同样出现。本文就“囚徒困境”中非纳什均衡出现的问题,对博弈的前提假设完全理性、完全信息以及概率进

行了分析,得出的结论是:完全理性中的整体思维方式和概率为零的事件的发

生以及完全信息等于一致信念时引起的不确定性,都可能导致非纳什均衡出现,而其出现的可能性则取决于采取整体思维方式的人的比例。

关键词:囚徒困境;完全理性;概率;完全信息;整体思维方式

The Analysis about the Probability and Reasons of Non-

Nash Equilibrium in Prisoners’Dilemma

Abstract: The prisoners’dilemma, which is the representative example of complete information static game, is deemed to dominant-

strategy Nash equilibrium and has the inevitability, but in fact non-

Nash equilibrium also appears. To the question of non-

Nash equilibrium in prisoners’dilemma, this paper makes an analysis to Game Theory’s hypothesis: complete rationality, complete information and probability, and gets a result: sy stems thinking style in complete rationality, the happen of the event of zero probability, and the uncertainty that is brought out when complete information is concordant beliefs,

all can bring the appearance of non-

Nash equilibrium, and the probability of appearance is decide

d by th

e proportion o

f men who think in systems thinkin

g s tyle.

Key Words: prisoners’dilemma; complete rationality; probabili ty; complete information; systems thinking style

“囚徒困境”博弈是图克(Tucker)1950年提出的一个著名的博弈模型,是完

全信息静态博弈的典型例子。

一、“囚徒困境”博弈及其纳什均衡

囚徒困境博弈的基本情况如下:警察抓住了两个合伙犯罪的罪犯,但却缺乏足

够的证据指证他们所犯的罪行。如果其中至少有一人供认犯罪,就能确认罪名

成立。为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串供或结

成攻守同盟,并给他们同样的选择机会;如果他们两人都拒不认罪,则他们会

被以较轻的妨碍公务罪各判1年徒刑;如果两人中有一人坦白认罪,则坦白者

从轻认罪,立即释放,而另一人则将重判8年徒刑;如果两人同时坦白认罪,

则他们将被各判5年监禁。

如果分别用-1、-5和-8 表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即释放的得益,则两囚徒的得益矩阵如下:

囚徒2

坦白不坦白

囚徒1 坦白-5,-5 0,-8

不坦白-8,0 -1,-1

在上图中,“囚徒1”、“囚徒2”分别代表本博弈中的两个博弈方,也就是两个罪犯;他们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个

囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时

做出的。其中矩阵中第一个数字代表决策结果后囚徒1的得益,第二个数字代

表决策结果后囚徒2的得益。

博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利

益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因

此只能实现对他们都不理想的结果(各判5年),并且这个结果具有必然性,

很难摆脱,因此这个博弈被称为“囚徒困境”。[1]

二、非纳什均衡出现的可能性及其原因分析

1、完全理性与非纳什均衡

囚徒困境博弈的一个假设是博弈方具有完全理性的行为能力。完全理性来源于

经济学中的理性人假设,即博弈方都以个体利益最大化为目标,且有准确的判

断选择能力,也不会“犯错误”。以个体利益最大为目标被称为“个体理性”,有完美的分析判断能力和不会犯选择行为的错误称为“完全理性”。具体地说来,完全理性包括追求最大利益的理性意识、分析推理能力、识别判断能力、

记忆能力和准确行为能力等多方面的完美性要求,其中任何一方面不完美就不

属于完全理性。[1]我们可以看出,这是一个要求非常严格的假设。即便如此,完全理性仍在一个方面没有做出规定(至少是没有意识到或明确地规定出来),就是思维方式,也即是博弈方是以将问题分解的方式来思考问题呢,还是以系

统的整体的方式来思考问题的。我引用《第五项修炼》上的一段话来表达这两

种思维方式的不同。

自幼我们就被教导把问题加以分解,把世界拆成片片段段来理解。这显然能够

使复杂的问题容易处理,但是无形中,我们却付出了巨大的代价――全然失掉

对“整体”的连属感,也不了解自身行动所带来的一连串后果。于是,当我们

想一窥全貌时,便努力重整心中的片段,试图拼凑所有的碎片。但是就如物理

学家鲍姆(David Bohm)所说的,这只是白费力气;就像试着重新组合一面破镜子的碎片,想要看清镜中的真像。经过一阵子努力,我们甚至干脆放弃一窥

全貌的意图。

现在我们以系统的整体的思维方式来重新分析囚徒困境博弈。警察的目的是获

得证据,以使囚徒获得应有的惩罚,囚徒的目的是“获取”最少的惩罚。双方

的这种矛盾使得囚徒有串通的倾向,为了离间两个囚徒,警察确立了模型中的

规则(且不论这些规则和设置合不合理)。对每个囚徒来说,要想达到自身的

目的,而不考虑整个模型设置的让双方都坦白的目的,很显然是不行的。囚徒

该如何选择呢?答案是不坦白。如果囚徒看出了该模型的目的,若选择坦白,

以自推人,对方也会选择坦白,必然落入警察的圈套,此所谓鹬蚌相争,渔翁

得利。当两博弈方都用整体思维来考虑这个问题时,相互配合是其最好的选择,因为在完全理性假设前提下,自己选择坦白而另一方选择不坦白,这种机

会是没有的,这种饶幸心理也是取不得的,剩余的只有要不都坦白,要不都不

坦白,所以相互配合是其最好的选择,结果一定是不坦白。此所谓兄弟阋于墙,

相关文档
最新文档