进化对策论：理论、模型与应用

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

进化对策论：理论、模型与应用

来源：《经济评论》2002第6期作者：王忠玉冯英浚

摘要：进化对策论是20世纪80年代末兴起的对策论理论的一个分支，近年来其影响日渐扩大，已经对传统的非合作对策论理论提出了挑战。本文在阐述纳什均衡的解释之后，着重从ESS概念、复制动力学、强化学习模型以及模仿学习等几个方面对进化对策论的基本理论和模型的内容进行详细而深入的探讨，并阐明进化对策论的一些应用，提出了未来的发展方向和研究重点。

关键词：纳什均衡复制动力学学习模型

对于经济学家而言，非合作对策论又称非合作博弈论，是用来分析和研究经济问题的极有价值的工具，因为它提供了建立经济行为人策略相互作用的分析语言，而且它还能导致人们直观的洞察力由简单内容转向更复杂的内容上来。当然，相当多的观点是凭借纳什均衡概念的运用而得到的。这种深受人们喜欢的博弈理论思想日益增长促使人们对另一种事实不断增长的认识和思索，均衡分析在什么时候以及为什么是合适的?对这个问题的解答不是一个简单而容易回答的。可惜的是，博弈论的理论和分析方法还没有提出对纳什均衡概念之外的可供选择的内容。

然而，直到最近10多年来，在均衡选择方面才取得进展，这些进展提出当存在多个均衡时，应该怎样去做。

一、纳什均衡

纳什，在1950年就已经对纳什均衡给出两种解释。第一种是群体作用的解释。此种解释假设，在博弈中存在对每个参与者又称局中人(player)起作用的参与者群体。参与者不断地积累各种纯策略中的令人注意的经验信息，如果此博弈稳定下来，那么这种均衡必是纳什均衡。然而。Shapley在 1964年证明，如果博弈没有稳定下来，那么必然存在一种策略选择的有限循环。第二种解释的观点是把均衡看成一个“自动实施协议”或者是理性的预测。如果基于理性的预测是唯一的，那么博弈均衡确实得以存在，这时倘若均衡是众所周知的，它必是纳什均衡。纳什本人对此做了阐述，这是“一种十分强的理性化和理想化的解释”。这对阐述均衡而言是有效的，解决均衡选择问题是一个基本的问题。因此，对于经济学家的研究目的而言，与均衡选择相关的问题是必须加以分析和深入探讨。

对纳什均衡的第三种解释，是由Maynard Smith和 Price在1973年首次提出的，它源于生物学领域的研究。在这种解释中完全不存在有意识的选择：参与者预先选取某一种策略，而且更为成功的策略生存下来；如果种群(population在生物学上称为种群，在经济学中我们将其称为群体更好)达到一种稳定状态，那么所有策略必是等价的，因此，这种状态必是纳什均衡。这种生物学上的方法，其优点是它不仅具体指出稳定的结果，而且它还靠可能达成的一些结果来给出一种显示性的过程。

当然，经济学家清楚地意识到将涉及到的生物学领域中的思想和方法应用到经济学领域中的疑问和困难，比如，像生物学中的“复制方程”扩展到经济学领域中的内容和意义是什么，至今还在探索中。

二、进化思想在经济学中应用的回顾

对经济学给出进化的解释不是一种新的手法。实际上，进化解释在社会科学中是先于达尔文(Darwin)而出现。例如，亚当·斯密(Adam Smith)曾说：“带来许多利益的劳动分工，原本不是人类智能的结果，虽然人类智能预见到劳动分工产生普遍富裕，并想利用它来实现普遍富裕。尽管在人类本能里没有意识到这样广泛效用中的一种互通有无、物物交换，以及相互之间交易的倾向，此倾向很缓慢并且渐进产生结果，但是劳动分工是必须的。”

进化思想也能够在马尔萨斯(Malthus)、马歇尔 (Marshall)，熊彼特(Schumpeter)和哈耶克(Hayek)所写的著作中找到。关于进化经济学，这是一个单独的学科领域，经常与熊彼特的工作相联系。Robson在2001年系统地给出了经济行为的生物学方面的基本解释。

进化经济学与进化对策论至今是完全相互独立地发展起来的。在经济学的理论研究中，理性人的偏好通常是固定的。然而，对于理性人的偏好变化或者进化选择，经济学家对此也进行了研究，特别是利他主义的生存价值以及风险态度等。然而，我们这里的进化对策论是将偏好作为固定的和已知的。

关于市场生存进化方面的研究和探讨，开始于Winter在1964年的文章“经济的…自然选择‟与厂商理论”，接下来 Winter在1971年发表了“满足、选择与改革残余物”，Nelson和Winter在1982年出版的著作《经济变迁的演化理论》(有中文版)，是这一领域中出现的最为重要的文献。最近由Blume和Easley(1992，1995，1996)，Dutta(1992)Dutt和 Radner(1993)，Radner(1995)，Bega—redondo以及Boldeke和Samuelson(1997)等学者在此领域进行探索和研究。虽然这个论题与进化对策论紧密相联系，但是，目前这两种文献在方法论上相距甚远。

三、进化对策论的基本原理与结论

最近10多年里，不像对策论的传统分析方法那样——考虑有限理性的经济行为人以及在严格的认知局限之下必须学习执行策略，这样的对策论理论及其应用有了迅速的发展。这方面的大量研究工作是在称为进化对策论所提供的框架下进行的。正如此学科标题所表示的，这一新学科的原理借用生物学中的进化模型所具有的与众不同的一些特征。然而，此学科本身也发展了一些新的方法和技术，特别地适合于有限理性基本假设下对社会和经济体制方面的分析。进化对策论在10多年里以快速的步伐取得长足的发展。

进化对策沦为人们提供一种具有广泛适用性的工具。其潜在的应用领域从进化生物学延伸到一般的社会科学，特别是经济学中。进化理论在经济学中有着悠久的历史传统。直到最近，这种方法在非合作对策论框架中才得到应用。

进化对策论是研究策略行为的稳健性，它是针对有限理性行为人所组成的大群体中多次博弈背景下的进化力量而言的。这种新的组成部分在经济理论里导致一种新的预测方法，并且为其他社会科学开辟一条崭新的研究途径。

进化对策论的基本内容：

(一)进化稳定策略概念。进化对策论理论中，一个关键概念是进化稳定策略(ESS)，这一概念的提出归功于Maynard Smith和Price在1973年的“动物冲突的逻辑”一文。此种策略在特定的意义上对进化压力而言是稳健的：群体执行该种策略对执行任何其他策略而言是非入侵的。假定一对个体是重复随机地来自于大的群体，去参与一个对称并有限的两人博弈，还假定所有的个体在博弈中起初都执行某一个纯的或混合的策略x是进化稳定的，那么对于每一个变异策略y，都存在一个正的“入侵障碍”，使得执行变异策略y的个体群体所获得的支付低于此障碍，从而x赢得的预期支付比执行的y所得要高。下面的不等式对于充分小的ε>0成立，即：

u[x,(1-ε)x+εy]>u[y,(1-ε)x+εy] (1)

其中左边的表达式记为对于策略x而言，当执行相对应策略的个体进入之后，混合群体情况的混合策略(1-ε)x+εy时的预期支付，而右边的表达式记为对于策略y而言，其所对应的情况的预期支付。

实际上，由上述定义知道，进化稳定性十分有用的特性是一个策略x是进化稳定的当且仅当(1)它是对自身的最佳反应；(2)它是对所有其他最佳反应的反应，当这些策略对其自身的反应比较时。为了弄清楚(1)是必要的，只需充分观察即知，否则会存在一个对x而言的最佳反应y。在一个充分小的种群中，表现出的这个“变异”策略几乎总会遇到策略x，从而会赢得比x水平高的收益。同样，(2)是必需的，因为否则的话一定会存在一个对x而言的可供选择的最佳反应y，它会赢得与x遇到x的时候或者至少x遇到y时候的收益相同，从而y的平均水平会赢得比混合种群要高一些的收益。

注意到，进化稳定性准则没有解释种群是如何达到这种策略的。然而，一旦达到这种策略，则这样的策略对进化压力来说是稳健的。同时，人们发现，进化稳定性没有处理种群中具有两个或更多“变异”同时出现的情况。因而，它隐含地把变异当成稀少事件，以致于种群有时间在另一个变异出现之前响应这种状况。