从“囚徒困境”理解博弈论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从“囚徒困境”理解博弈论
【摘要】:根据老师的名言“在当今时代,学习了博弈论,就能够成为一位有深度的智者。
”因而本文通过介绍博弈论的相关概念及其引申内容,借助纳什均衡所精炼出的策略组合,剖析博弈论中的经典模型,加强对博弈论这一独特思想分支的理解与领悟。
【关键词】:博弈论,纳什均衡,经典模型,理解。
一、什么是博弈论
博弈论,又叫做游戏理论或对策论,是一门以数学为基础,研究对抗冲突中最优解问题的学科。
谈到博弈,首先想到的肯定就是棋盘上的对弈,其实博弈论最初主要是研究象棋、桥牌、赌博中的胜负问题,只是人们对博弈局势的把握只停留在经验上,没有向理论化发展。
而现如今,只要有存在竞争、存在输赢的局面出现,就可以应用到博弈论。
因为在很多层次的格局中,对于决策层来说,正确有效地做出合理的决策一定能够产生决定性因素,而博弈论正是运用在这个过程中的核心方法。
二、博弈论中的纳什均衡
博弈论从本质上来讲是研究决策问题.但与传统的决策分析相比,博弈论更加关注的是博弈决策中博弈各方的互动行为。
这是由于每一场竞争的竞争结果依赖于所有局中人的抉择,每个局中人都企图预测其他人的可能抉择,以确定自己的最佳对策。
所以在博弈论的研究中,关注每个人的均衡问题就成为了核心。
约翰·纳什(John Nash)分别在1950年与1951年发表了《n人博弈中的均衡点》和题为《非合作博弈》两篇论文。
在上述论文中,纳什介绍了合作博弈与非合作博弈的区别。
他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,并证明了均衡解的存在。
论文刊登在美国全国科学院每月公报上后,引起巨大轰动,因此该解概念后来被称为纳什均衡。
以两家公司的价格大战为例,纳什平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。
于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是纳什平衡。
三、基于纳什均衡的经典模型
在课堂上,老师介绍诸多基于纳什均衡的经典模型,通过对案例的剖析,来帮助我们更好地理解纳什均衡的核心要领。
其中,最令人影响深刻的便是“囚徒困境”。
有两个小偷A和B联合盗窃、私入民宅被警察抓住。
将他们抓获后从他们的住处搜出受害人家中丢失的财物。
但是,他们都矢口否认,于是警方将两人分开审讯。
为了击垮
他们的心理防线,警方告诉他们,如果主动坦白,可以从轻处罚;如果顽抗到底,一旦同伙招供,就要受到严惩。
当然,如果两人都坦白,就不存在“主动交代”,两人都要受到严惩。
只不过比抵赖要处罚轻一些。
在这种情形下,两个囚犯都可以作出自己的选择,或者招供,即与警察合作,从而背叛他的同伙;或者保持沉默,与警察对抗到底。
这样,就会出现以下几种情况:
对于这个案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。
如果从两个人承受的罪责总和来看,两个人加起来只是被判了2年,相比于其他三种情况都从轻了。
但是由于两人处于隔离的情况,所以首先应该是从心理学的角度来看,双方都会怀疑对方会出卖自己以求自保,所以有很大的可能会从利己的目的出发进行选择。
这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。
对于一个面临要坐牢的罪犯来说,释放的诱惑力永远大于被判刑,无论是10年8年,甚至只有1年,因此在这个过程中,某一方的小偷一定会在考虑到得到被释放的机会同时,忽略掉对方的处境。
综合以上几种情况考虑,不管对方坦白与否,对自己而言都是坦白了划算。
两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。
但是在这个例子里,纳什均衡就是(坦白,坦白)。
若B抵赖,A坦白的话则A被释放,抵赖的话被判1年,所以坦白比抵赖好:若B坦白,A坦白的话被判8年,抵赖的话被判10年,所以坦白还是比抵赖好。
所以可以得出:在给定B坦白的情况下,A的最优策略是坦白,同理,给定A坦白的情况下,B的最优策略也是坦白。
实际上,这里的(坦白,坦白)不仅是纳什均衡,而且是一个占优策略均衡,就是说,不论对方如何选择,个人的最优选择都是坦白。
因而坦白既是A的占优策略,又是B的占优策略,结果是每个人都选择坦白,各判8年。
“囚徒困境”反映了个人理性与集体理性的矛盾,虽然两个都抵赖各判刑1年显然比都坦白各判刑8年好,但是这种选择不满足个人利己心理学的要求,即(抵赖,抵赖)不是纳什均衡。
这也印证了上述的纳什平衡意味着两败俱伤的可能,也同时启示我们如果博弈双方都以个体理性作为决策基础时,此时无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。
简单地说,“囚徒困境”中的冲突都是个体理性和集体理性的矛盾引起的。
当个体利益与集体利益发生冲突时,首先考虑自己的利益会造成一个比维护集体利益更差的结果,只有所有人都采取合作的态度或者首先替别人着想的情况下,才可以有最好的效果。
四、“囚徒困境”的生活化应用
在社会生活中,常有老人摔倒没有路人敢搀扶的现象,这就是一个生活化的囚徒困境。
摔倒者有两种选择:讹诈或不讹诈。
路人也有两种选择:搀扶或不搀扶。
假设路人搀扶而摔倒者不讹诈,则路人因为帮助别人收益1,摔倒者没有出事收益0;假设路人搀扶而摔倒者讹诈,路人因为受到讹诈收益一1,摔倒者因为讹诈收益1;假设路人不搀扶,则摔倒者无所谓讹诈,路人收益0,摔倒者有可能出事收益一2。
用表格概述如下:
路人
五、理解与感悟
每个人都会遇到相关的“囚徒困境”,在困境中争论人性的善恶意义并不大,因为每个人考虑的方向与因素不尽相同。
但是,我们都可以通过制度来创造一个和谐的社会。
虽然博弈论中的参与者都是以利己为最终目的的“理性人”,但博弈论本身并无所谓好坏,我们应该更好地利用它,使它更好地去探索在博弈过程中的是非判别。
博弈模型发展的过程也生动地反映了制度进化的过程,制度公平决定内容公平。
良好的制度是大家在博弈和合作中形成的,大家当然应该积极遵守,从而使社会良性发展,从而形成博弈平衡的和谐社会。
博弈论模型还有很多,对现在的社会发展有很好的借鉴作用。
同时也有跟多的博弈论的知识需要我们去发掘,这就要求我们在不断地探索中发现,在实践中得到真知。
【参考文献】
[1]谢识予.经济博弈论(第二版IM].上海:复旦大学出版社,2002年
[2]樊友恒.博弈论与价格战[J].当代经理人(中旬刊),2OO6,21:890-891.
[3]迈尔森.《博弈论:矛盾冲突分析》[J.].北京:中国经济出版社,2001。