纳什均衡的重要影响及其问题局限
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究领域:微观经济学
纳什均衡的重要影响及其问题局限
高红阳
(东北师范大学传媒科学学院,吉林长春 130117;吉林大学管理学院博士生,吉林长春 130022)
摘要:纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,其对经济学以及其他社会科学甚至自然科学产生了重要影响。
尽管纳什均衡理论及其应用得到了空前的肯定,但近年来纳什均衡分析却遭到了前所未有的质疑。
论文从理性前提、犯错误、多重性、静态分析、动态分析、期望效用等六个角度论述了目前理论所存在的问题局限,而且将学界尝试解决上述问题的有限理性、好像理性、颤抖手均衡、聚焦均衡、风险占优均衡、帕累托最优均衡、防联盟均衡、相关均衡等方法一并加以讨论阐述。
关键词:纳什;纳什均衡;局限
博弈论(game theory)研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,纳什均衡(Nash Equilibrium)是博弈解的一般名称,是当前博弈理论体系的核心概念。
从1994年纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi)三位博弈论专家获得诺奖,博弈论一直是十余年来学界最活跃的研究领域之一,被经济学、政治学、生物学、军事学等许多学科奉为重要的方法论基础。
1纳什均衡的重要影响
1.1纳什及纳什均衡的得来
纳什1928年生于美国西弗吉尼亚州。
关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是纳什在普林斯顿大学攻读博士学位时完成的。
实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。
然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。
图克(Tucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。
它发展了本身很有意义的n人有限非合作博弈的概念和性质。
并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。
在概念和方法两方面,该论文都是作者的独立创造。
”
1.2纳什均衡的重要影响
纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。
”纳什均衡的重要影响可以概括为以下六个方面(谢识予,1999):
(1)改变了经济学的体系和结构。
非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。
(2)扩展了经济学研究经济问题的范围。
原有经济学缺乏将不确定性因素、变动环境因素以及经济
个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。
纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。
(3)加强了经济学研究的深度。
纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。
(4)形成了基于经典博弈的研究范式体系。
即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。
(5)扩大和加强了经济学与其他社会科学、自然科学的联系。
纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。
纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。
纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。
(6)改变了经济学的语言和表达方法。
在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给’和‘需求’”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡’”。
2纳什均衡的问题局限及解决尝试
尽管纳什均衡理论及其应用得到了空前的肯定,但仍有纳什均衡的反对者或怀疑者以及理论研究过程中取得的某些进展对纳什均衡分析方法的有效性提出了严正质疑,而纳什均衡的支持者们则不遗余力地试图从多个思路运用多种方法去尝试解决这些问题。
概括起来,体现在以下六个角度:
2.1从理性(rationality)前提角度
纳什均衡分析方法,特别是对一些复杂的博弈问题进行纳什均衡分析,是很复杂的数学计算和逻辑推理过程,因此对决策者的理性能力有特别高的要求。
纳什均衡分析一般以决策者的“交互理性”为前提,而交互理性是层次比较高的理性,当相关的决策者之间的理性层次存在明显差异,或决策者之间缺乏足够了解及相互信任条件下,要求决策者满足交互理性比较困难;交互理性在理性层次方面的进一步上升,构成理性的共同知识,包括博弈结构规则、各博弈方得益函数、可能类型及其分布概率等,这对纳什均衡分析的有效性有着举足轻重的影响,然而该假设在现实性方面却存在着很大的疑问和缺陷;尤其在面临信息不完全、不对称的博弈问题时,更要求决策者具有最大限度地获得信息以形成准确判断力的“知识理性”,目前知识理性是以主观概率的贝叶斯理论为基础的,但近年来这种贝叶斯理性框架却受到了包括宾莫尔(Binmore)、萨缪尔森(Samuelson)、莫里奥蒂(Moriotti)和哈蒙德(Hammond)等的广泛批评。
也许理性意识比理性能力容易满足,对博弈方的理性假设,往往是在理性能力方面比较难以与现实相符。
因此在纳什均衡分析中,假设能够满足主观的理性意识要求,但不能完全满足客观的理性能力要求的“有限理性(limited rationality)”,可能就比较具有现实性。
对这种有限理性以及在这种理性条件下的纳什均衡的机制和分析,是纳什均衡分析重要的发展方向之一。
目前,关于学习机制的探讨是纳什均衡理论在有限理性条件下解决理论困境的最主要出路。
此外,传统的主流经济学用如下方法论证这个新古典经济学的基本假定前提,即用“好像理性”的方法解释经济学的理性基础和理性经济人假设的可行性思路:经济个体可能并不全部有意识地追求利益最大化,但他们的行为却“好像”(As if)是理性的,因为经济竞争会将追求利润最大化的经济个体筛选出来。
其中,阿尔切安(Alchian,1950)和弗里德曼(Friedman,1953)的论述最有代表性。
该假设尽管完全可从进化博弈论的发展尤其是它在生物进化领域的成功延伸获得支持,但是进化博弈论自身相当初级的发展阶段也使其必然成为作用还非常有限的理论。
2.2从犯错误(make mistakes)角度
人非圣贤,孰能无过!博弈方在现实的经济活动选择过程中一旦“犯错误”的时候,纳什均衡分析方
法是否仍然奏效呢?事实上,这也是纳什均衡分析最主要的弱点之一。
因为按照“完全理论(complete theory)”观点,即没有哪种行为是绝对排除在外的,即使是那些不是任何均衡的一部分,很难在事先认为有可能性的行为,也可以说明有可能性或某种合理性,所以犯错误是可能的必然的。
对这一问题的解决,比较有价值的是作为完全理论思想反映的颤抖手均衡(trembling-hand equilibrium)的提出。
泽尔腾(1975)认为,在任何一个博弈中,每一个参与人都有一定的可能性犯错误,类似用手抓东西时手的颤抖使人没有抓到想抓的东西,一个战略组合只有在满足“允许所有参与人都可能犯错误时仍是最优战略组合”的条件下,才可以称为一个均衡。
泽尔腾将非均衡事件的发生解释为颤抖并把它归结为某一个参与人的非蓄意错误,通过引入颤抖,使博弈树(game tree)上的每个决策结(decision nodes)出现的概率都为正,即每一个决策结的最优反应都有定义,则原博弈的均衡可以理解为被颤抖扰动后的博弈均衡的极限。
为了排除参与人犯错误的动态相关性,泽尔腾还引入“代理人战略式表述(agent-strategic form)”以修正颤抖手均衡的概念。
即将同一参与人的不同次选择当作不同参与人的选择,而且这些选择发生颤抖的概率是独立的,这样,原参与人就类似一个委托人,他在不同信息集(information set)上雇佣不同的代理人,授权后者决策。
而且同一委托人的所有代理人的支付函数均与委托人相同,因此将完全按照委托人的利益决策。
泽尔腾证明,在所有有限博弈中,至少存在一个颤抖手均衡,即至少可以找到一个允许参与人犯错的均衡结果。
以此为基础,梅耶森(Meyerson,1978)提出了适度均衡(proper equilibrium)的概念。
他认为,如果一个战略比另一个战略代表更大的错误,即对给定参与人有更大的损害,那么参与人选择前一个战略的可能性就应该小于选择后一个战略的可能性。
考尔伯格和默顿(Kohlberg and Merten,1986)提出稳定均衡(stable equilibrium),认为均衡解应该是某些战略组合的集合而非单一战略组合,且该战略组合集合对于所有可能的颤抖扰动都应该是稳定的,即如果博弈被颤抖所扰动,那么扰动后的博弈解仍然接近于集合中的每个战略组合。
虽然上述探讨提供了有益的理论借鉴,但是必须承认,寻找包含容错机制的均衡对于广大决策者来说,仍然不能说是一个简单的问题。
2.3从纳什均衡多重(multiple)性的角度
纳什均衡的多重性问题也是一个普遍的问题,甚至某些仅有少数几个可选策略的简单博弈也存在多重纳什均衡,这也是使纳什均衡分析的有效性大打折扣的原因之一,尤其是当某些博弈出现无穷多个纳什均衡时,情况更是糟糕。
因此,研究“从多重纳什均衡中挑选一个作为合理且正确预测”的一般性规律,将有助于多重问题的解决。
正如弗得伯格和泰勒尔(Fudenberg and Tirole,1991)所说,“当存在多个纳什均衡时,说某个纳什均衡一定会被采用,必须有某种能够导致每个博弈方都预期同一个纳什均衡出现的机制或者程序”。
目前,对此有所启发的做法,概括起来有:
(1)施林(schelling,1960)的“焦点(focal point)”理论,以聚焦均衡的方式实现多重的化简。
如要求两个局中人独立地写出(-1/2, 1/2)中的任意一个实数,若两人所写实数吻合则每人获得奖励,否则,每人受到惩罚。
显然,对于一切t∈(-1/2, 1/2),(t,t)都构成博弈的纳什均衡,且博弈有无穷多个纳什均衡。
究竟哪个均衡才是最可能使两人获益的最优结果呢?或许“心有灵犀一点通”,(0,0)才是最可能出现的焦点。
(2)风险占优实现多重化简。
如在共同投资问题中,只存在“所有公司都投资大工程”和“所有公司都投资小工程”两个纯策略纳什均衡,前者收益较大但风险也大,后者收益较小但风险也小。
对二者最终的判断与选择取决于参与人对大、小工程可能收益、参与对方的行为偏好与习惯以及对投资获益的期望等。
从风险角度来看,“全部投资小工程”是优于“全部投资大工程”的风险占优(海萨尼和泽尔腾,1988)。
(3)帕累托(Pareto)最优均衡实现多重化简。
帕累托最优均衡是符合帕累托效率的均衡,即任何参与人在不损害他人的前提下都无法再增加自己的收益,从而是达到经济效率的有效结局。
如果参与人可以在决策前进行廉价磋商(cheap talk),以确保局中人在选择帕累托最优均衡时只冒较低的风险,那么最终可能增加帕累托均衡出现的可能性。
(4)防联盟(coalition-proof)均衡实现多重化简。
当博弈包含三个及三个以上的参与人时,就有可能出现部分人结盟以极大化联盟成员利益并同时损害其他局中人利益的情形。
这时,谁能成为博弈多重结果的一个合理预测呢?1987年,伯恩海默(Bernheim)、佩莱(Peleg)、惠斯顿(Whinston)提出,
从防联盟观点出发,任何k(1≤k≤n-1)人联盟都不会发生背离现象的纳什均衡是一个合理预测,符合这种推理的预测结局称作防联盟均衡。
(5)相关均衡实现多重化简。
相关均衡描述参与人的策略选择与某个信息或信号装置有关的最优结果。
比如鸣金收兵就是两位势均力敌的大将都会接受的体面结束战斗的信号,二者的选择都与鸣金信号相关,且收兵就是该信号条件下的最优选择。
相关均衡实际上相当于在适当巧妙的信号装置下博弈的“条件纳什均衡”,这一方面使纳什均衡分析可以对应于不同的实际条件,从而更具有现实性与针对性,一方面必然表现为在不同条件下多重纳什均衡的筛选与简化。
2.4从静态博弈(static game)分析的角度
纳什均衡理论起始于对静态博弈的分析,然而即便如此,研究证明,仍有许多非常简单的静态博弈却无法用纳什均衡分析方法来加以分析和预测。
如A、B两个博弈方同时各任意选择一个整数,他们获得的得益取决于双方所选整数的相对大小,选择到较大整数者得250单位得益,选择到较小整数者得100单位得益,如果双方所选择的整数相同,则各得25个单位。
该博弈没有任何复杂之处,具有普通智力的人都很容易弄清其博弈规则以及在博弈中的处境和可能获得的结果。
只是因为不加任何限制的整数是无穷多的,且可以趋向于无穷大,因此在理论上该博弈对任何博弈方来说,显然都不可能有最好的、最保险的策略或双方都愿意接受的策略。
该博弈无法用纳什均衡分析加以解决,其原因在于博弈中没有可以肯定的博弈方法从而导致不存在确定性的、双方都会接受而不会偏离的均衡结果。
城市博弈(cities game)等其他没有肯定博弈方法类型的博弈问题,纳什均衡分析都无法给出有实质意义的预测。
不过,对此,有学者认为,这并不足以严重损害纳什均衡理论的地位,毕竟当面临实际问题时,总会找出为大多数人所接受的对策规则和方法。
2.5从动态博弈(dynamic game)分析的角度
对动态博弈展开的质疑,主要体现在以下两个方面:
(1)是对作为纳什均衡动态分析的重要方法之一的“逆推归纳法(backward induction)”的有效性提出严重挑战。
逆推归纳法由齐默罗(Zermelo,1913)最早提出,后由泽尔腾(1965)加以完善推广。
逆推归纳法依据的逻辑是坚持博弈方的理性经济人的假设,它并没有把现实中决策者会考虑的因素,放进自己的分析框架或推理的逻辑前提,加之理性前提问题的制约,它的结论必然会有时表现为与现实不一致。
如“蜈蚣博弈”(centipede game)是罗森塞尔(Rosenthal,1981)提出的一个动态博弈问题。
在该博弈中,从个体理性出发的最优选择最终竟导致了极差的结果。
如图示,依逆推归纳法取得的结论是(1,1),这显然是一个不能令人满意与信服的结论。
因为在现实生活中,精明到连1元风险也不愿意冒的人毕竟不多见,而且结合长远利益的考虑,现实的最优选择很可能是(100,100)。
对该博弈进行实验的结果也证实,在绝大多数任意选择的博弈方之间进行该博弈,一般都不会出现逆推归纳法所预测的结论。
麦克凯维和帕弗利(Mckelvey and Palfrey,1990)给出了细致的实证检验的证据,证明上述理论上的均衡结果一般不会在实践中出现;克瑞普斯(1990)也报告曾与学生进行过该博弈,结论在A第一次就选择D的情况是很少见的。
笔者对学生的检测也符合上述结论。
蜈蚣博弈是揭示纳什均衡分析的某些深刻的内在矛盾和弱点的最好范例。
图蜈蚣博弈
再如“Newcombe悖论”,从另一角度反映了逆推归纳法与直觉间的矛盾,其实质也是逆推归纳法唯理性唯得益的表现。
尽管该博弈对逆推归纳法的意义和价值并不构成真正的威胁,但该博弈也是逆推归纳法局限性的生动反映。
(2)对于步骤过多的动态博弈问题,纳什均衡分析同样很难适用。
以“象棋博弈”为例。
理论上象棋博弈是有限博弈,两博弈方可选择的策略都是有限的,是可以被列举被穷尽的,因此应当可以通过比较确定出最优的策略选择。
但实际上该博弈的有限策略数已大到远远超出人们的分析考察能力,对只有有限生命的人类来说,与无穷大几乎没有什么差别。
据研究结果,已知在下象棋时平均每步大约有35种合法的可行选择,通常一局棋有几十个、上百个甚至更多的步骤或回合,因此一局棋的可能路径数至少应该是35的几十、上百次方。
比较现实的是分析有限个回合内的全部可能性,但这个回合数也必须相当小。
如我们分析7个回合,即14步棋,平均的合法可能性就多达3514种,这是一个十亿万亿以上的数,即使把其中一些明显较差的可能性先筛选掉,然后用世界上最先进的每秒运算速度上亿次的计算机来处理,下一步棋也仍然需要很长时间,而人力则无论如何都无法达到这样的要求。
象棋博弈揭示了纳什均衡分析一个重要的薄弱环节,即无力解决步骤过多的博弈问题。
实际上,在象棋比赛中更重要的概念是“棋形”(position),在博弈的初始阶段或大部分时间里,棋形都比纳什均衡更重要。
只有在博弈接近尾声,进入所谓“残局”阶段,局面已经大大简化,各博弈方可能的选择和后续阶段的博弈中纳斯均衡的数量已经很少的时候,纳什均衡分析才可能奏效。
即这时双方都已经可以判断出最后的结果,这也是为什么往往有时一方会主动认输或双方接受和局结果的原因。
2.6从期望效用(expected utility)分析的角度
期望效用概念最初是由伯奴里(Bernoulli,1738)受到“彼得堡悖论(The St. Petersburg Paradox)”的启发,认识到人们通常是根据期望效用而非期望回报来评价博彩机会的。
因为大多数人都只愿意付出很小的代价获得参与这种拥有无穷大期望回报的博彩资格,无穷大的期望回报并不等于无穷大的期望效用。
两个多世纪以后,诺依曼与摩根斯坦(1944)从风险选择集合上的偏好关系的行为公理出发,确认了通常所说的期望效用函数。
萨维奇(Savage,1954)首先将期望效用和主观概率结合,作为判断和比较不确定性下行为选择和决策的依据,纳什均衡理论的贝叶斯知识理性框架就是从萨维奇决策理论框架发展来的。
然而著名的阿莱斯悖论(Allais Paradox,1979)却证明,人们的选择并不总是遵循期望效用。
即使是萨维奇也在阿莱斯设计的例子中犯了和一般个体同样的错误,违背了期望效用要求的独立性,但当他意识到这个问题以后,立即把选择改变成为符合期望效用的选择,并认为只要表述更清楚,个体的选择总是符合期望效用的。
但不幸的是,Slovic和Tversky(1992)的实验发现,当表述更清楚后,转向违反期望效用的个体数量和转向符合的数量相当。
实际上,笔者认为对期望效用分析的疑问,也部分地源于主观概率本身存在的问题。
埃尔斯伯格悖论(Ellsberg Paradox)很好地证明了,人们经常对同一种不确定性,产生前后两种不同甚至彼此矛盾的主观概率。
这主要因为人们很可能会被一些表面现象的错觉所误导。
3结论
应当承认,由于人类认识能力的有限和研究工作仍不够深入,纳什均衡理论还有许多未解决的问题。
正如谢识予先生所说,用严格的标准衡量,纳什均衡理论可能无论在理论方面还是应用方面,都不是一种成熟的理论。
甚至可以说,它留下和引出的问题比解决的问题多,模棱两可的结论比明确的结论多,不统一的东西比统一的东西多,争论比共识多,纯理论的意义比应用的价值大等。
但无论还有多少未解决的问题,纳什均衡理论对人类更好更深刻地理解经济现象做出了很大贡献,这一点是毋庸置疑的。
任何对它的批评,都必须在肯定这一点的基础上才有道理。
引用奥曼(Aumann)的话,就是“我们肯定做着某些正确的事情。
”这也可以从该理论越来越得到重视这一点得到证实。
也许正因为它是一种不完全成熟的理论,所以纳什均衡理论才更有魅力、价值和发展潜力。
这完全可为策略型均衡(strategic equilibrium)、防止集体背离纳什均衡(CPNE)、进化稳定策略(ESS)等纳什均衡概念的成功拓展所证实。
对纳什均衡理论,笔者认为应当从理论上,概念上将其理解为一般地分析决策问题的方法,更多地表现为一种决策的观念,而在具体实践环节,则应具体问题具体设定、具体分析具体决策,不能指望任何理论成为包治百病的显学。