博弈论中的纳什均衡

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论中的纳什均衡

纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。

定义:纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。

纳什均衡的经典范例就是囚徒博弈,但是研究博弈论常常会使人陷入一种只追求个人利益的误区,事实上我们应该明白所谓的博

弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设,并不总能说明事实。只是假定他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是

中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。

从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。

因此说,学习博弈论不仅是我们接触到最前沿的经济学思想,也在一定程度上有利于我们分析客观世界,并一定程度上减少损人不利己的行为。在博弈中,人们掌握的信息经常是不完全的,这就需要在博弈进

行过程(即动态博弈)中不断地收集信息、积累知识、修正判断。成语故事“黔驴技穷”实际上就包含了一个不完全信息动态博弈。毛驴刚到贵州时,老虎摸不准这个大动物究竟有多大本领,因而躲在树林里偷偷观察,这在老虎当时拥有的信息条件下是一种最优策略选择。过了一阵子,老虎走出树林,逐渐接近毛驴,就是想获得有关毛驴的进一步信息。一天,毛驴大叫一声,老虎吓了一跳,急忙逃走,这也是最优策略选择。又过了一些天,老虎又来观察,并对毛驴挨得很近,往毛驴身上挤碰,故意挑衅它。毛驴在忍无可忍的情况下,就用蹄子踢老虎,除此之外,别无它法。老虎最终了解到毛驴的真实本领后,就扑过去将它吃了。在这个故事里,老虎通过观察毛驴的行为逐渐修正对毛驴的看法,直到看清它的真面目。事实上,毛驴的策略也是正确的,它知道自己的技能有限,总想掩藏自己的真实技能。老虎吃掉毛驴的策略,在“博弈论”中就是所谓的“精炼贝叶斯均衡”。

人们常提到的“上有政策、下有对策”,其实是对管理者与被管理者之间的动态博弈的一

种描述,面对上边的政策,下边寻求对策是正常的、必然的。从“博弈论”的角度讲,上边的政策制定必须在考虑到下边可能会有的对策的基础上进行,否则,政策就不会是科学、合理的。

相关文档
最新文档