演化博弈论

合集下载

相关主题

evolutionary

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

演化博弈论
演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想，不再将人模型化为超级理性的博弈方，认为人类通常是通过试错的方法达到博弈均衡的，与生物演化具有共性，所选择的均衡是达到均衡的均衡过程的函数，因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。

在理论应符合现实意义上，该理论对于生物学以及各种社会科学尤其是经济学，均大有用场。

演化博弈理论最早源于Fisher，Hamilton，Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析，他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。

但直到Smith and
Price(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后，才标志着演化博弈理论的正式诞生。

生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic)，这是演化博弈理论的又一次突破性发展。

模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念，它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程，ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。

编辑本段主要应用领域
演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科，是证券投资研究的一个具有生命力和丰富内涵的新领域。

与现代金融学的“理性人”、“有效市场”相关假设不同，演化证券学重视对“生物本能”和“竞争与适应”的研究，强调人性和市场环境在股市演化中的重要地位，是揭示股市生存法则最有潜力的前沿科学。

其开山之作《股市真面目》颠覆了股市运行机理的传
统理论，可称为达尔文式的范式革命。

演化经济学:演化经济学是现代经济学研究的一个具有广阔发展前景的崭新学科，与新古典经济学的静态均衡分析相比，演化经济学用动态、演化分析方法观察经济发展进程，探索经济变迁和技术变迁的内在规律，认为惯例、新奇创新和对创新的模仿在经济演化中起着关键性作用。

演化经济学的发展历经坎坷，在20世纪五、六十年代，它已被绝大多数经济学家所遗忘，一直到了20世纪八十年代，它才开始被越来越多有远见的经济学家所注意。

本书是演化博弈论领域内的一本关键性的核心著作，探讨了演化博弈论这一博弈论分支的一般理论进展，对其核心内容进行了全面阐述，重点论述了演化博弈论与非合作博弈论之间的概念性和技术性联系，给出了有关概念的定义及各相关命题，，并从特殊到一般地对各内容进行了数学证明。

《演化与博弈论》是演化博弈论研究领域的经典著作。

1982年，约翰?梅纳德?史密斯因此书的出版被称为演化博弈论之父。

在《演化与博弈论》中，作者把博弈论的思想纳入到生物演化的分析中，揭示了动物群体行为变化的动力学机制。

虽然论述的思想和知识涉及生物学、博弈论和数学等交叉领域，但看似艰深的理论，作者却信手拈来，融精妙思想与优雅文笔于一体，大大增强了《演化与博弈论》的可读性，也使其在学界享有盛誉，长销不衰。

《演化与博弈论》致力于讨论生物演化的建模方法，而不是运用上述方法去解决任何具体问题。

本章讨论了这种方法的应用范围及其局限性，同时还涉及这些模型的学术价值。

当生物的特定表现型的适应度依赖于其在种群中的频率分布时，演化博弈论就成为从表现型这个角度思考生物演化问题的一种方法。

例如，在对鸟的翅膀形态演化和同一鸟类分布行为演化的比较研究中，为了搞清楚翅膀的形态就有必要了解该鸟类所生活其间的大气的状况，以及随翅膀形状不同所导致升力和阻力的差异。

同时也有必要将鸟翼是由羽毛所构成的这个约束条件也纳入考虑的范围，因为对于蝙
蝠和翼龙来说，这种约束条件显然有所不同。

然而这里没有必要去考虑种群中其他成员的行为。

恰恰相反，生物分布的演化则主要取决于其他同种生物是如何行动的，因为生物的分布与寻找合适的配偶、避免对资源的竞争、联合防范掠夺者等因素密切相关。

在关于鸟翼形态的案例中，我们想知道为什么自然选择总有利于某些特定的表现型。

最优化理论是分析这个问题的比较合适的数学工具。

我们面临的问题是要判断哪些特征(比如，一个较高的升力阻力比，一个较小的转向圆)对适应度的变化有作用，而不是面对当个体的生存取决于其他个体的行为时所引致的特殊困难。

而这些困难正是下文中所涉及的内容。

Von Neumann和Morgenstern(1953)在研究人类经济行为时，首次将博弈论纳入规范的分析框架。

而后，博弈论经历了长足的发展，可参考Lute和
Raiffa(1957)的精彩综述。

明智的是，研究人员认识到古典博弈理论中博弈的参与者将根据自利的原则表现出理性行为。

这一假设在生物演化的背景下显然是不合适的。

作为替代，理性原则被种群动态性和稳定性所取代，而自利原则则被达尔文适应度所取代。

演化博弈论的一些重要假设将会在第二章中给出。

这些假设将导向一个博弈的新形式“解”，即“演化稳定策略”，简称ESS。

演化博弈论演化博弈论与传统博弈理论不同，演化博弈理论并不要求参与人是完全理性的，也不要求完全信息的条件。

有限理性这一概念最早是由西蒙(Simon。

H。

A。

)在研究决策问题时提出的，它是指人的行为只能是“意欲合理，但只能有限达到”。

威廉姆森在研究影响交易费用的因素时，对有限理性的问题进行了归纳总结人的有限理性是由两方面的原因引起的:一方面是由于人的感知认识能力限制，它包括个人在获取、储存、追溯和使用信息的过程中不可能做到准确无误;人的有限理性的另一方面则是来自语言上的限制，因为个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有限制的(这或许是因
为他们没有掌握到所必需的词汇，或许是因为这些词汇还不存在)，不管多么努力，人们都将发现，语言上的限制会使他们在行动中感到挫折。

从这两个方面而言，完全理性的人根本就不可能存在。

演化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种理论。

在方法论上，它不同于博弈论将重点放在静态均衡和比较静态均衡上，强调的是一种动态的均衡。

演化博弈理论源于生物进化论，它曾相当成功地解释了生物进化过程中的某些现象。

如今，经济学家们运用演化博弈论分析社会习惯、规范、制度或体制形成的影响因素以及解释其形成过程，也取得了令人瞩目的成绩。

演化博弈论目前成为演化经济学的一个重要分析手段，并逐渐发展成一个经济学的新领域。

演化博弈论 - 产生发展
(一)理论渊源经济演化思想很早就存在于经济理论中，即使是在以静态分析为主的新古典经济学盛行的年代，演化思想也仍然在经济学中占有一席之地。

马歇尔(Marshall，1948)就曾指出，演化的概念比静态的概念更复杂，因此大量的经济基础理论研究还是以机械类比、均衡、稳定、决定性为主;阿尔钦(Alchian，1950)建议在经济分析中用自然选择的概念代替利润最大化的概念，认为适度的竞争可以作为决定各种制度形式存在的动态选择机制。

在这种选择机制下，即使不把行为主体看作是理性的，但来自社会的演化压力(优胜劣汰)也将促使每个行为主体采取最适合自身生存的行动，从而使得达到的演化均衡为纳什均衡。

阿尔钦的这种演化观不仅为新制度经济学研究制度的选择提供了一个思路，而且也为演化博弈论的发展提供了思路;纳什(Nash，1950)的“群体行为解释”，则认为是包含较完整的演化博弈思想的最早理论成果。

纳什认为，不需要假设参加者有关于总体博弈结构的充分知识，也不要求参加者有进行任何复杂推理的愿望和能力，只需假定参加者能够积累关于各种纯策略被采用时的相对优势的实证信息，纳什均衡仍可达到。

(二)领域扩展演化博弈理论能够在各个不同的领域得到极大的发展应归功于斯密斯(Smith，1973)与普瑞斯(Price，1974)，他们提出了演化博弈理论中的基本概念——演化稳定策略(Evolutionary Stable Strategy)。

斯密斯和普瑞斯的工作把人们的注意力从博弈论的理性陷阱中解脱出来，从另一个角度为博弈理论的研究寻找到可能的突破口。

自此以后，演化博弈论迅速发展起来。

20世纪80年代，随着对演化博弈论研究的深入，许多经济学家
把演化博弈理论引入到经济学领域，用于分析社会制度变迁、产业演化以及股票市场等等，同时对演化博弈理论的研究也开始由对称博弈向非对称博弈深入，并取得了一定的成果。

20世纪90年代以来，演化博弈理论的发展进入了一个新的阶段。

威布尔(W。

Weibull，1995)比较系统、完整地总结了演化博弈理论，其中包含了一些最新的理论研究成果。

其他的一些理论成果包括克瑞斯曼(Cressman，1992)以及萨缪尔森(Samuelson，1997)的着作。

(三)应用研究与此同时，演化博弈论在经济学中的应用研究也飞速发展。

弗里德曼(Friedman，1991)认为演化博弈在经济领域有着极大的应用前景，并对一些具体应用前景的动态系统进行了探讨;巴苏(Basu，1995)研究了公民规范和演化之间的关系，认为规范的长期存活依赖于演化过程和自然选择;弗里德曼和方(Friedman, Fung，1996)以日本和美国的企业组织模式为背景，用演化博弈分析了在无贸易和有贸易情形下企业组织模式的演化;拜斯特和古斯(Bester,Guth，1998)用演化博弈理论研究人类在经济活动中利他行为的存在性及其演化稳定性。

登弗伯格和古斯(Dufwenberg,Guth，1999)在双寡头垄断竞争的情形下比较了两种解释经济制度的方法:间接演化方法和策略代理方法，研究了在怎样的市场环境中这两种方法会导致相似的市场结果;戈特曼(Guttman，2000)用演化博弈理论研究了互惠主义在有机会主义存在的群体中是否能够存活的问题;青木昌彦(2001)从认知的角度提出了一个关于进化博弈的主观博弈模型;哈如威和普拉赛德(Haruvy, Prasad，
2001)运用演化博弈的方法研究在具有网络外部性的条件下免费软件的最优价格和质量;科斯菲尔德(Kosfeld，2002)建立了德国超市购物时间反常的演化博弈模型;奈宝格和瑞戈(Nyborg,Rege，2003)用演化博弈理论研究了顾及别人感受的吸烟行为的社会规范的形成;加斯米那和约翰(Jasmina,John，2004)研究了三种不同的学习规则在公共物品博弈中仿制人类行为时谁表现得更好的问题;丹尼尔、阿瑟和托德(Daniel，Arce, Todd，2005)研究了四种不同类型的囚徒困境博弈，指出这四种囚徒困境要达成合作所需的演化和信息要求。

(四)国内关注进入2l世纪以来，国内的学者也开始关注演化博弈论。

谢识予(2001)、张良桥(2001)、盛昭瀚和蒋德鹏(2002)介绍了演化博弈理论的一些基本概念和相关内容;崔浩、陈晓剑和张道武(2004 )用演化博弈论的方法分析了有限理性的利益相关者在共同治理结构下参与企业所有权配置并达到纳什均衡的演化博弈过程;胡支军和黄登仕(2004 )给出证券组合选择的一个演化博弈方法;高洁和盛昭瀚(2004)研究了发电侧电力市场竞价的演化稳定策略;周峰和徐翔(2005)运用演化博弈论探讨了农村税费改革问题;刘振彪和陈晓红(2005)创建了从单阶段创新投资决策到多阶段创新投资决策的演化博弈均衡模型研究企业家创新投资决策问题;石岿然和肖条军(2004)在一个三阶段Hotelling博弈模型的基础上研究双寡头零售市场价格策略的演化稳定性问题;易余胤等(2003;2004;2005)运用演化博弈方法研究了信贷市场、双寡头市场、自主创新行为、合作研发中的机会主义行为等一系列问题。

从以上的研究成果来看，近一两年来有越来越多国内学者关注该领域，并且应用演化博弈论探讨了经济学领域中的很多问题。

但国内的研究成果仍然存在着不少问题，主要体现在:
(1)对演化博弈论的特征以及基本概念不够清晰，演化博弈并不是演化的观点和博弈的思想简单相加，动态演化的博弈模型也不一定就是演化博弈模型;
(2)运用演化博弈论解释某些问题显得“牵强附会”，让人感觉只是单纯套用演化博弈论，或是不清楚演化博弈论的理论框架;
(3)只能运用一些非常简单的演化博弈模型，研究不够深入。

事实上，问题(2)、(3)的产生至少部分是由于(1)引起的，因此，有必要把演化博弈论(模型)的特征以及基本概念界定清楚。

演化博弈论一般的演化博弈理论具有如下特征:它的研究对象是随着时间变化的某一群体，理论探索的目的是为了理解群体演化的动态过程，并解释说明为何群体将达到目前的这
一状态以及如何达到。

影响群体变化的因素既具有一定的随机性和扰动现象(突变)，又有通过演化过程中的选择机制而呈现出来的规律性。

大部分演化博弈理论的预测或解释能力在于群体的选择过程，通常群体的选择过程具有一定的惯性，同时这个过程也潜伏着突变的动力，从而不断地产生新变种或新特征。

几乎所有的演化博弈理论都具有上述特征。

然而，演化博弈论在经济学领域的应用与运用演化博弈理论解释生物进化现象有所不同，演化博弈论中的一些生物进化的概念在经济学领域中无法应用。

比如，性别和交配，染色体和代际等等，这些概念很难被引入到经济学领域中来。

演化博弈论在经济学领域的应用主要是考虑微观个体在演化的过程中可以学习和模仿其他个体的行为，即沿用拉马克的遗传基因理论。

一般的演化博弈模型的建立主要基于两个方面:选择(Selection)和突变(Mutation)。

选择是指能够获得较高支付的策略在以后将被更多的参与者采用;突变是指部分个体以随机的方式选择不同于群体的策略(可能是能够获得高支付的策略，也可能是获得较低支付的策略)。

突变其实也是一种选择，但只有好的策略才能生存下来。

突变是一种不断试错的过程，也是一种学习与模仿的过程，这个过程是适应性且是不断改进的。

不具备这两个方面的模型不能称为演化博弈模型。

比
如，艾格则等(Agiza，Hegazi&Elsadany，2001)提出了一个动态演化的博弈模型，它在有限理性的企业都采取一定的行为规则(产量调整机制)下研究企业重复博弈是否可以达到纳什均衡。

这个模型虽然研究的是有限理性个体和动态演化过程，但不属于演化博弈模型，因为没有包含选择和突变的过程。

如果把这个模型作如下修改，便可以看作演化博弈模型:假设企业有许多不同的行为规则，而采用某些行为规则的企业比那些不采用这些行为规则的企业获益更大;随着时间的推移，采用这些行为规则的企业生存下来，而不采用这些行为规则的企业被淘汰。

这样修改后的模型既有选择过程又有突变过程，便成为一个演化博弈模型。

总之，演化博弈模型有如下几个特征:第一，以参与人群体为研究对象，分析动态的演化过程，解释群体为何达到以及如何达到目前的这一状态;第二，群体的演化既有选择过程也有突变过程;第三，经群体选择下来的行为具有一定的惯性。

演化博弈论演化博弈论在经济学领域的应用优势 (一)方法论新古典经济学以原子论和机械力学为理论基础，它假定参与人是完全理性和一致偏好的。

参与人在既定的条件下可以得到一个最优方案，比如生产商在技术和资源一定的情况下可以找到一个获得最大收益的生产方案，消费者在既定的预算条件下可以获得一个最大效用的消费方案等等。

博弈论在新古典经济学的基础上增加了行为主体之间的互动，使得理论更贴近现实，但总的来说，博弈论仍然没有跳出新古典经济学的框架。

因此，在运用博弈论建立模型时，对各种关系做出的假设往往不切合实际，因此，根据此类模型做出的决策往往和现实相差较远，容易导致失误。

演化博弈论摒弃了完全理性的假设，以达尔文生物进化论和拉马克的遗传基因理论为思想基础，从系统论出发，把群体行为的调整过程看作为一个动态系统，在其中每个个体的行为及其与群体之间的关系得到了单独的刻画，可以把从个人行为到群体行为的形成机制以及其中涉及到的各种因素都纳入到演化博弈模型中去，构成一个具微观基础的宏观模型，因此能够更真实地反映行为主体的多样性和复杂
性，并且可以为宏观调控群体行为提供理论依据。

因此，演化博弈论提供的经济现象的解释比博弈论更深刻、更贴近实际、更有说服力。

(二)认识论博弈论假设行为主体具有完美的理性思维，即行为主体始终以自身最大利益为目标，具有各种环境中追求自身利益最大化的判断和决策能力，具有在存在交互作用的博弈环境中完美的判断和预测能力，不会犯错、不会冲动、没有不理智。

另外，博弈论中的一个最重要的假设就是博弈双方行为人的“共同知识”假设，即所有参与人都是理性的，所有参与人知道所有参与人都是理性的，如此类推，以至无限。

这是一个令人难以想象的无限
推理过程，就行为人对现实世界的认识能力而言，是一条非常严格的假设。

很显然，现实世界这种假设通常是得不到保证的。

演化博弈论对于行为主体采取的是有限理性假设，因此，这些个体不具备博弈论中行为主体的“全知全能”，无法在经济活动中瞬间能够获得最优的结果。

在演化博弈论中，行为主体被假设为程序化地采用某一既定行为，它对于经济规律或某种成功的行为规则、行为策略的认识是在演化的过程中得到不断的修正和改进的，成功的策略被模仿，进而产生出一些一般的“规则”和“制度”作为行为主体的行动标准。

在这些一般的规则下，行为主体获得“满意”的收益。

这与现实情况更相符合。

(三)时间的不可逆性博弈论注重均衡状态的研究，忽视达到均衡的过程。

在博弈论中，行为主体能够立即对外部环境作出完美判断，达到均衡状态。

博弈论忽视时间问题，强调行为主体瞬问的均衡，即使考虑时间问题，也把时间看作对称或可逆的。

在演化博弈论中，时间占有非常重要的地位。

行为主体在演化过程中不断修正和改进自己的行为，模仿成功的策略等等，都需要一个相对较长的时间。

演化博弈
论认为，时间是不可逆的，过去时间内的状态与未来时间的状态是不对称的，因而，行为主体状态的演化跟初始的时间状态息息相关。

(四)随机(突变)因素在博弈论模型中，不确定因素以随机变量的形式出现，通过给定随机变量的分布，模型的研究将最终集中于一些重要变量的平均值上，而不确定因素往往被忽略。

因此，在博弈论中，即使存在不确定性因素，理性的行为人仍可实现最优化的结果。

在演化博弈模型中，随机(突变)因素起着关键的作用，演化过程常被看成是一种试错的过程。

行为人会尝试各种不同的行为策略，并且每一次都将发生部分替代。

在多数情况下，用概率分布来描述这种不确定性是不可能的，这种不确定使长期最优化决策难以实现，演化过程的长期趋势很难预测，但如果选择过程的适应性标准确定，演化过程呈现一定的规律性，此时，演化过程的长期趋势又是可预测的。

(五)选择机制及均衡传统的博弈理论中的行为主体是完全理性的，通常，在完全理性的假设下，如果纳什均衡存在，那么博弈双方博弈一次就可直接达到纳什均衡。

这个结果不依赖于市场的初始状态，所以不需要任何的动态调整过程。

而演化博弈论认为，纳什均衡的达到应当是在多次博弈后才能达到的，需要有一个动态的调整过程，均衡的达到依赖于初始状态，是路径依赖的。

另外，在有多个纳什均衡的情况下，若某个纳什均衡一定会被采用时，必须存在有某种能够导致每个博弈方都预期到的某个均衡出现的机制。

然而，博弈论中的纳什均衡概念本身却不具有这种机制。

因此，当博弈存在多个纳什均衡时，即使假设博弈方都是完全理性的，也无法预测博弈的结果是什么，如果博弈方只有有限理性，就更难预测博弈的结果了。

当然，在博弈论中，当存在多个纳什均衡时，可以利用后向归纳法来实现对纳什均衡的精炼，但这种方法的前提条件是参与人需要满足一个比完全理性更强的理性假定——序贯理性。

这在现实中是无法达到的。

而在演化博弈理论中，均衡的精炼通过前向归纳法来实现，即参与人根据博弈的历史来
选择其未来的行为策略，是一个动态的选择及调整过程。

因此，尽管参与人都是有限理性的，但动态的选择机制将使得在有多个纳什均衡存在的情形下达到其中的某一个纳什均衡，实现纳什均衡的精练。

最常见的选择机制动态方程有三类:第一类为正支付动态方程，在这类动态方程中，所有获得的支付大于群体的平均支付的纯策略都有正增长率，所有获得的支付小于群体的平均支付的纯策略都有负增长率;第二类为单调动态方程，在这类动态方程中，若一个纯策略或混合策略获得的支付大于另一个纯策略所获得的支付，则前者的增长率大于后者;第三类为弱正支付动态方程，在这类动态方程中，至少有某些获得支付比群体的平均支付高的纯策略(若存在)有正的增长率。

显然，弱正支付动态方程包含了正支付动态方程和单调动态方程。

在演化博弈理论中运用最为广泛的选择机制动态方程是泰勒和朱克
(Taylor&Jonker，1978)提出的复制者动态方程，当时他们仅仅研究了对称两人博弈。

随后，泰勒(Taylor，1979)把对称情形推广到不对称情形。

在复制者动态方程中，纯策略的增长率与相对支付或适应度(纯策略所获得的支付与群体的平均支付之差)成正比。

显然，复制者动态方程包括在前三类选择机制动态方程中。

复制者动态方程在经济领域的应用最为广泛，学者们运用复制者动态方程对社会习俗、制度、行为规范等一系列社会经济问题进行了成功的研究。

那么，怎样把演化博弈论的基本概念——演化稳定策略与选择机制动态方程联系起来呢,是否通过选择机制所获得的均衡的精练就是演化稳定策略,从直观看来，演化稳定策略似乎可以保证均衡是稳定的。

但正式的稳定性的定义针对的是动态系统，而不是博弈的支付或适应度函数，并且演化稳定策略只能描述系统的局部动态性质，它不能够表现均衡与动态的选择过程之间的关系。

因此，演化稳定策略与选择机制动态方程所达到的动态均衡并不一定是同一个概念。

因此，为了更好地描述动态的演化过程，把演化博弈理论中的静态概念与动态过程统一起来，荷什勒佛。