演化博弈论简介
演化博弈论
演化博弈论:演化博弈论(Evolutionary Game Theory)不再将人模型化为超级理性的博弈方,而是认为人类通常是通过试错的方法达到博弈均衡的,与生物进化原理具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。
在理论应符合现实意义上,该理论对于生物学、经济学、金融学和证券学等学科均大有用场。
在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。
在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。
与传统博弈理论不同。
有限理性这一概念最早是由西蒙(Simon.H.A.)在研究决策问题时提出的,因为个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有限制的(这或许是因为他们没有掌握到所必需的词汇,或许是因为这些词汇还不存在)。
2021年演化经济学方法论与演化博弈论的比较研究
演化博弈论与演化经济学方法论简述演化博弈论是与传统博弈论相对应的一种方法论。
它摒弃了传统博弈论完全理性和完全信息的假设。
因而与传统博弈论相比,演化博弈论具有两个特点一是有限理性;二是动态性。
演化经济学则是一门研究“演化”的科学,演化经济学以达尔文主义为哲学基础,以累积因果为主要原则,其方法论基础是批判实在论,具体分为层级本体论与转换本体论,强调的是隐藏在现象背后的结构和趋势。
演化经济学方法论与演化博弈论的主要区别两者的哲学基础存在根本的对立哲学基础是研究纲领的硬核。
科学革命一般是以世界观、方法论变革开始的。
能够为科学研究(包括社会科学研究)提供的哲学体系有两种牛顿主义和达尔文主义。
前者是演化博弈论的哲学基础,后者是演化经济学方法论的哲学基础。
一位英国经济思想史学家曾指出,科学革命后,标准教科书的前身——边际革命的目的是要把经济学改造成为像数学、物理学一样精密的科学。
这正是现代主流经济学的起源,也是演化博弈论的哲学源泉。
这种思想是受到了当时实证主义科学哲学和牛顿主义的支配,理由是实证科学是精密的、可以预测的。
与演化博弈论坚持牛顿主义针锋相对,演化经济学方法论坚持达尔文传统,坚持动态的、有机的、系统的宇宙观和世界观。
演化经济学方法论建立在物理学大革命、耗散结构理论、复杂性科学基础之上。
二者的研究起点存在区别演化博弈论的研究起点是个人主义,演化经济学方法论的研究起点是个体群思维。
个人主义是用个人行为解释社会,即社会可以从个人进行推导,体现在经济学中就是简约论和还原论。
简约论是用“典型性”的消费者和生产者代替所有消费者和生产者;还原论是用微观现象解释宏观现象。
于是,在这种思维的影响下,当宏观经济学无法解释某些现象时,就要千方百计地寻找宏观经济学的微观基础。
而整体主义认为,个人的行为受制于整体的社会规则和状态,是制度决定个人。
虽然在经济思想史上还有老制度学派等“异端”经济学流派走向了整体主义,但由于它们没有受到达尔文革命科学思维的训练,也只是直觉上认为主流经济学的个人主义方法是不对的。
演化博弈名词解释
演化博弈名词解释
演化博弈是指博弈论中的一个重要研究领域,它研究在自然选择、适者生存和进化的背景下,博弈参与者的策略如何随时间变化和演化。
演化博弈理论试图理解个体在选择策略时如何在更大的演化系统中相互作用和影响。
在演化博弈中,参与者被称为“生物种群”或“策略集”,其中每个参与者都选择一种策略(通常是有限的)来与其他参与者互动。
策略集通常包括三个组件:基因(个体的特征)、环境(包括其他参与者的行为和特征)和适应度函数(度量个体在某种环境下成功的程度)。
演化博弈的一个核心观点是自然选择和适者生存。
在这种竞争激烈的环境中,成功的个体将有更高的适应度,他们的后代将更有可能存活并继承这些特征。
随着时间的推移,选择过程会导致策略的多样化和优化,最终使得参与者能够更好地适应环境。
演化博弈研究方法通常包括以下几个步骤:
1.设定博弈场景,确定参与者、策略、适应度函数以及其他参数。
2.计算每个参与者的适应度函数值,评估他们在竞争中的表现。
3.通过自然选择和适者生存的原理,分析策略的演变和优化过程。
4.根据演化博弈理论,预测未来策略的变化趋势。
演化博弈在生物学、经济学、社会学和其他领域都有广泛的应用。
这种理论有助于我们理解复杂系统中策略和行为的动态变化,为研究合作、竞争和演化过程提供了有价值的视角。
演化博弈论
• 演化博弈的发展出现了一些新的思路,对演化稳定策略和合作演化 博弈的研究不断深入,学者开始关注带有随机因素影响的演化过程。
21世纪 进入2l世纪以来,国内的学者也开始关注演化博弈论,也做出了大 量的研究。
如果(S,S)不是纳什均衡,那 么S不是演化稳定策略
纳什均衡和演化稳定(2)
a
X b
a 1,1
Y b
0,0
0,0
0,0
策略b是否是演化稳定的? 有一个规模为E的策略b入侵
策略b的平均适应度: (1 E)*0 E *0 0
策略a的平均适应度:
(1 E)*0 E *1 E
如果(S,S)是严格的纳 什均衡,那么S是演化稳
•
pi [ u(ei , x) ] pi (1)
对恒等式 p(t)xi (t) pi (t) 两边求t的导数 得:
•
•
•
p xi pi p xi (2)
将式(1)带入(2)中,稍加整理可得:
•
xi [u(ei , x) u(x, x)]xi (3)
式(3)说明: 采用策略i的总 体比例的增长 率 等于策略收
与传统博弈理论不同,演化博弈理论并不要求参 与人是完全理性的,也不要求完全信息的条件。
演化博弈论(Evolutionary Game Theory)把博弈 理论分析和动态演化过程分析结合起来的一种理 论。在方法论上,它不同于博弈论将重点放在静 态均衡和比较静态均衡上,强调的是一种动态的 均衡。演化博弈理论源于生物进化论。
0
X*
1
x
标准的N总体复制子动态
演化博弈
ቤተ መጻሕፍቲ ባይዱ
预先规定好的要素博弈如何确定?既然大家 都是有限理性,那由谁来规定要素博弈的结 构和规则(是人为设计的,还是自发演化形 成的) 现有的一些学习模型是否与现实中群体的理 性水平相符? 对于超出2维空间的动态系统以及非线性系 统难于进行稳定性分析(恰好体现了人的认 知能力有限理性)。
我们以一个简单的“签协议博弈” 为例,说明学习速度很慢、理性层次较 低的有限理性博弈方通过模仿学习博弈 和调整策略的复制动态和策略稳定性。
经济活动中的各种合作都可以用签协 议来代表,因为一旦签订协议,那么重 要的经济合作就有了保证。下图中得益 矩阵表示的就是一个关于签协议的博弈。
博弈方2
同意 博 弈 方 1 同意 不同意 不同意
有限理论博弈的有限分析框架是有限理论博弈方构成的, 一定规模的特定群体内成员的某种反复博弈。 例如某个由缺乏足够预见性的个体组成的小群体,其成 员都对当前局面做出反应,或者相互学习、模仿邻居的 优势策略的情况。也可以是在大量博弈方组成的群体中 成员之间随机配对的反复博弈,相当于现实经济中对象 或伙伴不固定的,多个或大量个体之间的较长经济关系。 这些分析框架通常假设博弈方有一定的统计分析能力和 对不同策略效果的判断能力,但没有事先的预见能力和 预测能力。这种分析框架和人们在享受决策活动中的实 际行为模式是比较接近的。
有限理性意味着博弈方往往不会一开始就找到 最优策略,会在博弈过程中学习博弈,必须通 过试错寻找较好的策略;有限理性也意味着均 衡是不断调整和改进而不是一次性选择的结果, 而且即使达到了均衡也可能再次偏离。
三、有限理性下的博弈分析
1、有限理性博弈分析的目标
A.放宽参与者严格的理性要求,分析有限理性 的参与者通过各种学习过程,如何达到稳定的 均衡状态。 B.有限理性博弈分析主要解决:不同条件下具 体的学习过程(构建的学习模型体现了理性的 不同要求)、学习调整过程中均衡的稳定性 (运用稳定性理论,分析原Nash均衡是否收 敛)。
演化博弈与自组织合作
演化博弈与自组织合作一、本文概述本文旨在深入探讨演化博弈论与自组织合作之间的紧密联系及其在实际应用中的价值。
演化博弈论作为一种新兴的理论框架,为我们理解生物进化、社会动态和经济行为提供了新的视角。
自组织合作作为一种自然现象,普遍存在于社会、生态和经济系统中,对系统的稳定性和发展具有重要影响。
本文将通过综合运用文献综述、理论分析和案例研究等方法,系统阐述演化博弈论的基本原理和自组织合作的形成机制,分析二者之间的相互作用和影响,并探讨如何将演化博弈论应用于自组织合作的研究和实践中。
在内容上,本文首先将对演化博弈论的基本概念、发展历程和核心思想进行梳理和评述,为后续分析奠定理论基础。
接着,将重点分析自组织合作的形成条件、演化过程和影响因素,揭示自组织合作背后的动力学机制和演化规律。
在此基础上,本文将深入探讨演化博弈论与自组织合作之间的内在联系,分析二者在理论和实践中的互补性和相互促进关系。
本文将结合具体案例,探讨演化博弈论在自组织合作研究和实践中的应用前景,以期为相关领域的研究和实践提供有益的参考和启示。
通过本文的研究,我们期望能够加深对演化博弈论和自组织合作的理解,揭示二者之间的内在联系和相互影响,为相关领域的研究和实践提供新的思路和方法。
我们也希望通过本文的探讨,能够激发更多学者和实践者关注演化博弈论与自组织合作的研究和应用,共同推动相关领域的发展和创新。
二、演化博弈论基础演化博弈论,作为博弈论的一个分支,将博弈理论与生物进化理论相结合,主要研究在动态环境中参与者策略的选择与变化。
它突破了经典博弈论中理性参与者和完全信息的假设,强调参与者在有限理性、不完全信息和不断试错的过程中学习和适应。
演化博弈论认为,参与者的策略选择并非一次性决策,而是在多次重复博弈中逐渐演化的。
这种演化过程受到多种因素的影响,包括参与者之间的相互作用、环境变化以及参与者自身的学习和适应能力。
在演化博弈论中,一个关键的概念是“演化稳定策略”(Evolutionary Stable Strategy, ESS)。
演化博弈论研究的现状与展望
演化博弈论研究的现状与展望一、本文概述《演化博弈论研究的现状与展望》一文旨在全面梳理和深入分析演化博弈论这一交叉学科领域的研究现状,并在此基础上展望其未来的发展趋势。
演化博弈论,作为一种独特的博弈理论,融合了生物学、生态学、经济学、社会学等多个学科的理论和方法,为研究复杂系统中的动态演化过程提供了新的视角和工具。
本文首先回顾了演化博弈论的发展历程,阐述了其基本概念和核心思想,然后重点分析了当前国内外在演化博弈论研究方面的主要成果和进展,包括理论模型的构建、实证研究的应用以及与其他学科的交叉融合等方面。
在此基础上,文章进一步探讨了演化博弈论在未来可能的研究方向和挑战,旨在为相关领域的研究者提供有益的参考和启示。
二、演化博弈论的基本概念与理论框架演化博弈论,作为一种新兴的理论体系,融合了博弈论与演化理论的精髓,主要研究在动态变化的环境中,参与者如何通过试错、学习、适应和变异等过程,不断调整和优化自身的策略行为。
它突破了传统博弈论中完全理性、完全信息等理想化假设的限制,更贴近现实世界的复杂性和不确定性。
基本概念方面,演化博弈论将参与者视为有限理性的决策者,其策略选择受到历史经验、外部环境以及自身学习能力等多重因素的影响。
同时,演化博弈论强调策略的动态调整过程,而非静态均衡。
它认为,参与者通过不断的试错和学习,逐渐适应环境,并在演化过程中形成稳定的策略分布。
在理论框架上,演化博弈论借鉴了生物演化理论中的自然选择、遗传变异等机制,构建了以策略空间、适应度函数、选择机制和变异机制为核心的理论体系。
策略空间描述了参与者所有可能的策略组合;适应度函数则用于衡量不同策略在特定环境下的表现优劣;选择机制决定了哪些策略能够在演化过程中得以保留和传承;而变异机制则为策略空间引入新的可能性,使得系统能够不断适应外部环境的变化。
通过这一理论框架,演化博弈论能够更好地刻画现实世界中的复杂动态演化过程,为我们理解和预测参与者的行为决策提供有力的分析工具。
演化博弈论
演化博弈论演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想,不再将人模型化为超级理性的博弈方,认为人类通常是通过试错的方法达到博弈均衡的,与生物演化具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。
在理论应符合现实意义上,该理论对于生物学以及各种社会科学尤其是经济学,均大有用场。
演化博弈理论最早源于Fisher,Hamilton,Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析,他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。
但直到Smith andPrice(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后,才标志着演化博弈理论的正式诞生。
生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic),这是演化博弈理论的又一次突破性发展。
模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念,它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程,ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。
编辑本段主要应用领域演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科,是证券投资研究的一个具有生命力和丰富内涵的新领域。
与现代金融学的“理性人”、“有效市场”相关假设不同,演化证券学重视对“生物本能”和“竞争与适应”的研究,强调人性和市场环境在股市演化中的重要地位,是揭示股市生存法则最有潜力的前沿科学。
其开山之作《股市真面目》颠覆了股市运行机理的传统理论,可称为达尔文式的范式革命。
演化博弈论简介
演化博弈论简介丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。
他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。
传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。
正因为如此,这些新理论才显示出强大的生命力,获得广泛运用。
我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。
先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。
我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。
从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。
我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。
我这里用演化,避免用演进,可以减少误解。
演化理论中有两条最重要的机制。
一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。
在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。
我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。
我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。
严复说物竞天择,就是这个意思。
另一种机制叫突变机制(mutant),这保证了种群的变化。
如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。
演化博弈论简介
dx/dt
0
ESS: x*=1
1
x
0
1
x
ESS: x*=1
当c≤v时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因
在于当一方忍让时,另一方可获得更多收益。
这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。
(四)蛙鸣博弈的复制动态和ESS
则: dx x2 x3
dx dt
x UY
U
dt
当x=0时,稳定;
复制动态方程 当x>0时,最终稳定于x*=1
dx/dt
dx x2 x3
dt
甲Y
N
第6讲:演化博弈论简介
乙
Y
N
1,1
0 ,0
0, 0
0,0
0
1x
图1 签协议博弈的复制动态相位图
x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
1-m,m-z
0 ,0
② 若(m-z)/(1-P) <0,即z>m
第6讲:演化博弈论简介
F
x
dx dt
x
1
x
m
z
1
P
x
③ 若(m-z)/(1-P) >1,即m-z>1-P
dx/dt
dx/dt
0
1
x
0
1
x
ESS: x*=0
ESS: x*=1
显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫”。 当“鸣叫”的收益大于群体鸣叫而个别雄蛙“搭便车”的收益时,所有雄蛙都将鸣
演化与博弈论
演化与博弈论演化与博弈论:共生共存的竞争研究演化和博弈论是生物学和社会学领域的两个重要概念。
它们描述了竞争、合作和共存这些基本生存策略在不同情境下发展的演化和动态变化。
本文将介绍演化和博弈论的基本概念,讨论它们在生物学和社会学中的应用,并探讨两个领域之间的联系。
一、演化与博弈论基本概念演化: 演化是一种逐渐的生物学过程,它涉及生物种群的基因变异、多样性、选择和适应性。
演化理论描述了生物特征随时间和环境变化的逐步改变,从单细胞生物到复杂有机体(如鸟类和哺乳动物)。
博弈论: 博弈论研究决策者在有竞争和合作关系的情境下制定策略和取得优势的过程。
博弈论在经济学和政治学中非常有用,也可以应用于动物和人的社交行为研究。
二、生物学中的演化与博弈论1. 昆虫共生昆虫共生是一种生态互利关系,是昆虫与其他生物之间的合作关系。
以蚂蚁和蚜虫的共生为例,蚜虫从植物上吸取汁液,而蚂蚁则保持它们的羽毛清洁,并且保护它们免受天敌的攻击。
这种关系既是共生又是竞争,因为蚜虫和蚂蚁需要利用不同的资源,但他们同时也相互依赖和协同合作,以便达到最大化的生存和繁殖效益。
2. 环境选择和行为协作环境选择和行为协作在演化中具有很重要的作用。
环境选择是指生物对环境的适应性,通过适应环境中的资源和威胁来生存和繁殖。
行为协作是指合作以提高生存和繁殖效益,例如猎食或保护幼崽。
这些策略是为了提高生存能力和繁殖潜力。
三、社会科学中的演化与博弈论1. 政治和经济博弈在政治和经济博弈中,决策者必须考虑其他参与者的行为和反应,以便制定最优策略。
这包括考虑协作和竞争的因素,以及考虑时间、成本和利益等变量。
2. 社交行为社交行为包括对他人的关注和对他人的行为做出反应。
社交行为包括合作、竞争、合理和报复等多种行为。
博弈论可用于研究这些社交行为,以预测人们可能做出的最佳行为。
四、演化与博弈论之间的联系演化和博弈论之间存在联系,因为它们都涉及到生物和个体在不同情境下定制和执行策略。
演化博弈论的复制动态方程
演化博弈论的复制动态方程
演化博弈论是一种研究在群体中个体之间的相互作用和竞争的
数学模型。
在演化博弈论中,不同的策略会根据其在竞争中的成功程度而获得不同的收益。
当个体之间的策略的选择不断变化时,演化博弈的复制动态方程可以用来描述不同策略之间的选择和比例的变化。
复制动态方程的基本形式为:
dx/dt = x(f(y) - f(x))
dy/dt = y(g(x) - g(y))
其中,x、y分别表示两种策略在群体中的比例,f和g为策略的收益函数。
这个方程描述了当一种策略的收益高于另一种策略时,该策略的比例会增加。
换句话说,当一个策略在竞争中更加成功时,它将更快地在群体中传播。
复制动态方程提供了一种框架,用于研究演化博弈中的策略选择和变化。
它可以帮助我们更好地理解各种群体行为的演化和变化,从而有助于我们设计更有效的政策和策略来解决各种社会问题。
- 1 -。
生物演化博弈论
生物演化博弈论生物演化博弈论是一种研究生物种群中个体之间相互作用和适应策略的理论。
这个理论主要探讨了在自然选择的过程中,个体之间如何通过博弈来竞争资源、求偶、避免捕食以及其他种种交互行为。
下面我将详细解释生物演化博弈论的几个关键概念。
1. 生物演化:生物演化指的是物种在时间上的变化和适应,通过适应环境的能力以及遗传变异的积累,物种可以适应不同的生存条件和生态位。
2. 博弈:博弈是指在个体之间进行的互动过程,这些个体之间会根据自身利益进行选择和行动。
博弈的目的是为了获得最大的利益或者避免被对手获得利益。
3. 演化博弈:演化博弈是指在生物种群中,个体之间通过博弈来选择最优的适应策略。
这些策略会随着时间的推移而演化,使得物种能够适应环境并增加生存和繁殖的成功率。
4. 适应策略:适应策略是指个体在博弈中采取的行动方式,这些策略可以是攻击、逃避、合作等不同的行为。
个体的适应策略会受到自身遗传基因、环境因素和对手行为的影响。
5. 自然选择:自然选择是演化博弈中的一种机制,它通过选择最适应环境的个体来改变种群的遗传构成。
在博弈过程中,那些采取更有效适应策略的个体会更有可能生存下来,繁殖后代,从而在种群中逐渐增加其基因频率。
6. 博弈策略的稳定性:博弈策略的稳定性指的是在一种演化博弈中,一旦某个适应策略达到一个稳定状态,就很难被其他策略所替代。
这种稳定性可以使得种群中的个体能够在一段时间内保持相对稳定的策略分布。
总的来说,生物演化博弈论是一种研究个体之间相互作用和适应策略的理论,它可以帮助我们理解生物种群中的个体行为和种群演化的原因和机制。
通过研究演化博弈,我们可以更好地理解生物的进化过程以及为什么某些策略在自然选择中具有优势。
演化博弈模型及其应用
参考内容
内容摘要
在当今复杂多变的社会环境中,合作与竞争并存的现象越来越普遍。这种环 境下,博弈论为我们提供了一个理解和分析这种复杂性的有力工具。特别是合作 竞争博弈模型,它强调了博弈中ቤተ መጻሕፍቲ ባይዱ与者之间的合作和竞争的交互性质,对于我们 理解和解决实际问题具有重要的启示作用。
一、合作竞争博弈模型概述
一、合作竞争博弈模型概述
2、社会学
2、社会学
在社会学领域,演化博弈模型被用来解释社会规范、社会习俗、文化传承等 社会现象的形成和演变。例如,研究者可以通过演化博弈模型来分析个体之间的 行为互动如何影响整个群体的行为模式和文化传承。
3、经济学
3、经济学
在经济学领域,演化博弈模型被广泛应用于研究市场行为、产业演化、金融 风险等方面。例如,研究者可以通过演化博弈模型来分析企业在市场竞争中如何 调整自己的策略,以及这种策略调整如何影响整个市场的竞争格局和稳定性。
四、结论
四、结论
总的来说,合作竞争博弈模型为我们理解和解决实际问题提供了一个有效的 框架。它让我们认识到,在复杂的现实世界中,合作和竞争并存是一种常态。通 过理解和运用这种博弈模型,我们可以更好地处理各种人际关系,实现更大的利 益。
谢谢观看
二、合作竞争博弈模型的策略选 择
二、合作竞争博弈模型的策略选择
在合作竞争博弈模型中,策略的选择是关键。一般来说,主要有以下几种策 略:
1、合作策略:这种策略主要是为了通过合作实现更大的利益。合作策略通常 需要考虑的是如何与其他局中人建立合作关系,以及如何维护这种合作关系。
二、合作竞争博弈模型的策略选择
3、随机演化博弈模型
随机演化博弈模型则考虑了更多随机因素对博弈过程的影响。例如,个体的 策略调整可能会受到随机事件的影响,或者整个群体的策略分布可能会因为随机 因素而发生意想不到的变化。在这种模型中,随机性成为了影响策略演化的重要 因素。
第三章 第五节 演化博弈模型
1
y
y
(a) x=0
(b) x≠0 ESS: y*=0
y*∈[0,1]
打击 A 进入 不进 0 ,0 1 ,5
B
不打击 2 , 2 1, 5
A:“进入”的群体比例为x “不进”的群体比例为1-x B:“打击”的群体比例为y “不打击”的群体比例为1-y
乙 鹰 甲
(v-c)/2 鹰 (v-c)/2,
鸽 v ,0 v/2 ,v/2
鸽
0 ,v
F x
dx v vc x 1 x x 1 x dt 2 2
② 假设v=8,c=8(表示种群间和平共
处所得到的收益等于两者冲突导致的损失)
dx/dt
(v-c)/2 鹰 (v-c)/2,
鸽 v ,0 v/2 ,v/2
鸽
0 ,v
F x
dx v vc x 1 x x 1 x dt 2 2
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
dx/dt
1/6 0 1
F x
dx x a c 1 x b d x U1 U x 1 x dt
当F(x) =0时,
复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)
稳定性定理
F(x)=dx/dt,t↑,则x↑
x*=0和x*=1为ESS
0 11/61 1
x
这意味着: 当初始x<11/61时,ESS为x*=0;
图2 协调博弈的复制动态相位图
当初始x>11/61时,ESS 为x*=1.
演化博弈论案例
演化博弈论案例演化博弈论是博弈论的一个重要分支,它研究的是在演化过程中个体之间的相互作用和竞争。
在自然界和社会生活中,演化博弈论都有着广泛的应用。
下面,我们将通过一些具体的案例来说明演化博弈论在现实生活中的应用。
案例一,斑马群体的迁徙。
斑马群体的迁徙过程中存在着一种“安全性与效率”的博弈。
斑马在迁徙过程中需要面对掠食者的威胁,为了保护自己,它们会形成一个紧密的群体,以增加自身的安全性。
然而,这种紧密的群体也会降低迁徙的效率,因为群体中的每一只斑马都需要花费更多的精力来保持队形。
因此,斑马群体在迁徙过程中需要在安全性和效率之间进行权衡,这就是一个典型的演化博弈过程。
案例二,企业之间的竞争。
在市场经济中,各个企业之间存在着激烈的竞争。
在这种竞争中,企业需要考虑自身的利润最大化和市场份额的扩大。
如果一个企业选择了高品质的产品,那么它可能会获得更多的市场份额,但同时也需要承担更高的生产成本。
而如果一个企业选择了低品质的产品,那么它的生产成本会降低,但市场份额可能会受到影响。
因此,企业之间的竞争可以看作是一个演化博弈的过程,它需要在产品质量和成本之间进行权衡。
案例三,社会合作与自利之间的博弈。
在社会生活中,个体之间存在着合作与竞争的关系。
在一些公共事务中,个体可以通过合作获得更大的利益,但同时也需要承担一定的成本。
然而,如果个体选择了自私行为,那么整个社会可能会面临一些问题。
因此,社会合作与自利之间的博弈成为了一个重要的研究课题。
演化博弈论可以帮助我们理解在社会生活中个体之间的合作与竞争的动态平衡。
结语。
演化博弈论作为博弈论的一个重要分支,对于理解自然界和社会生活中的种种现象具有重要的意义。
通过以上案例的介绍,我们可以看到演化博弈论在现实生活中的广泛应用,它为我们理解个体之间的相互作用和竞争提供了重要的理论工具。
希望本文的介绍能够帮助读者更好地理解演化博弈论的概念和应用。
演化博弈理论
演化和博弈理论Larry Samuelson1朱宪辰译博弈论由John yon Neumann and Oskar Morgenstern (1944)提出,经John Nash (1950)加入纳什均衡(Nash equilibrium)概念而完善,被二十世纪80年代的策略革命推广之后,非合作博弈论(noncooperative game theory)在经济研究中已经成为一种标准工具。
这个过程当中,人们越来越以博弈观点为基础分析问题。
主要关注两个问题:我们能否期望纳什均衡是这样的:即我们能否预期博弈双方的选择都是在明确对方的选择下做出的最优反应?如果结论是肯定的,在多种博弈中出现的多重纳什均衡(multiple Nash equilibria),我们能预期哪一种呢?二十世纪80年代,研究博弈论的学者们忙于讨论上述问题,并建立了模型。
基于这样的假定:行为人是完全理性的,并且基于相同理性都有共同的知识水平(common knowledge)。
然而,进入二十世纪90年代,讨论的重点由以理性为基础的模型转到以演化论为基础的模型上来。
原因之一是以理性为基础的模型存在局限性。
这些模型可以容易地推动纳什均衡的一个必要条件:博弈双方会相信对方的行为并根据它们做出最佳反应;但是不能证明另一个必要条件,即他们相信的都正确。
同时,纳什均衡之中的理性选择标准产生可选择的精炼纳什均衡增强概念,意图排除具有充分委付的不真实的纳什均衡以迅速放弃从中选择一个方面作为正确的想法。
原因之二是由于博弈所代表的潜在观念有了变化。
一旦用博弈论解释描述理想相互作用状态时,其中完全理性假定就显得十分自然了。
目前像其它经济模型一样,更加普遍地用一个近似的类似于真实的模型来解释博弈游戏,在此完全理性看起来也不是那么恰当了。
演化博弈论涵盖的模型很广泛。
共同主题是在一个动态过程中描述博弈者如何在一个游戏的重复较量过程中调整他们的行为以重新适应。
演化博弈论研究的现状与展望
演化博弈论研究的现状与展望演化博弈论是近年来备受的研究领域,其研究对象是在演化过程中相互作用的个体行为和策略。
本文将简要介绍演化博弈论的核心主题、研究现状,阐述存在的问题与挑战,并展望未来的研究方向。
演化博弈论主要研究个体在演化过程中如何学习和适应环境,以及个体之间的相互作用和策略选择。
其核心主题是探讨博弈论与演化的结合,即个体在博弈过程中的学习、策略选择及演化稳定策略等问题。
目前,演化博弈论的研究已经涉及多个领域,如经济学、生物学、心理学等。
在经济学领域,演化博弈论被广泛应用于解释市场现象,如产业动态、市场竞争等;在生物学领域,演化博弈论被用来解释物种之间的相互作用和进化;在心理学领域,演化博弈论则被用来揭示人类行为和决策的机制。
尽管演化博弈论已经取得了许多重要的研究成果,但仍存在以下问题与挑战:演化稳定策略的普适性:演化博弈论中的演化稳定策略在不同环境和条件下是否具有普适性仍需进一步验证。
复杂动态网络的模拟:现实中的个体相互作用和演化过程往往涉及到复杂动态网络,如何构建和分析这些网络的模型是一个重要挑战。
实验设计与数据分析:演化博弈论需要大量的实验数据来支持理论分析,因此实验设计和数据分析显得尤为重要。
本文以演化博弈论中的囚徒困境为例,说明其研究历程。
研究者通过对囚徒困境的实验研究发现,个体的短视和自私会导致群体的整体利益受损。
随后,研究者通过数学模型和计算机模拟等方法,进一步探讨了演化稳定策略和纳什均衡等问题。
通过对真实世界的实验和观察,发现囚徒困境的演化博弈论可以解释很多现实中的现象,如公共品提供、资源分配等。
演化博弈论的研究方法主要包括实验方法、数学模型和计算机模拟等。
实验方法:演化博弈论的实验通常涉及人类、动物甚至计算机程序等参与者。
通过操控不同的参数和条件,研究者在实验中观察和记录参与者的行为和策略选择,并运用统计分析等方法来验证理论预测。
数学模型:数学模型是演化博弈论中常用的工具,可以用来描述个体之间的相互作用和演化过程。
第八章--演化博弈--《博弈论与经济》-PPT课件(2024版)
A
a1 0
0 a2
▪ 1. a1 0, a2 。0
▪ 由表2-1知,此时该博弈的纯纳什均衡为 (e1, e1) ,(e2,e2) 及
▪ 混合策略纳什均衡 X ( a2 , a1 ) ,Y ( a2 , a1 )
a1 a2 a1 a2
a1 a2 a1 a2
▪ 该博弈有2个ESS,e1 与 e2 。
k
▪ 必有 E(e1, X ) E(e2, X ) E(ek , X ) C ,否则, E(X , X ) xiE(ei, X ) ,与 i 1
▪ (*)相矛盾。这样 ,
▪
k
E( X , X ) C xi C E(ei , X )
i 1
, i 1,2,,k
.
▪ 性质2 设 Y 为单总体演化博弈 G 的ESS, X 为 G 的纳什均衡策
▪ 由定理8.1的1阶最优反应条件(1)知,若 X为ESS ,X 必为纳什均衡 策略。
▪ 命题8.1 若 (X, X) 为G的严格纳什均衡,则 X 为ESS。 ▪ 例8.1 在囚徒困境问题中,(坦白,坦白)是严格纳什均
衡,因而“坦白”是ESS。它表明演化稳定性并不排除低 效率均衡策略。 ▪ 命题8.2对单总体演化博弈的支付矩阵 A 进行局部变换,即 任何一列加上一个常数,ESS不变。 ▪ 命题8.2成立的原因是ESS可由支付差所决定。
参与人1的支付矩阵。由于 E(X ,Y ) 关于X 与 Y 是双线性的,即 E(X ,Y ) 满足
▪ E(aX1 bX2 , cY1 dY2 ) acE(X1,Y1) adE(X1,Y2 ) bcE(X2 ,Y1) bdE(X2 ,Y2 ) ,
▪ 因而(1)等价于 ▪ E(X ,Y) (1 )E(X , X ) E(Y,Y) (1 )E(Y, X )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
演化博弈论简介说明:这篇东西是我上周六在浙大思想讨论班上做演讲的讲稿和主要内容。
讲完以后,叶航老师提出了很多宝贵的意见。
我也正好乘这机会把没有讲或者没有讲清楚的东西梳理了一下。
整理过程中还发现了了很多问题,请大家批评。
丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。
他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。
传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。
正因为如此,这些新理论才显示出强大的生命力,获得广泛运用。
我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。
先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。
我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。
从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。
我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。
我这里用演化,避免用演进,可以减少误解。
演化理论中有两条最重要的机制。
一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。
在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。
我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。
我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。
严复说物竞天择,就是这个意思。
另一种机制叫突变机制(mutant),这保证了种群的变化。
如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。
对于突变机制,我也要强调它是没有方向性的,可能会提高个体的适应性,但更有可能降低个体的适应性。
突变同样是上帝的选择,微观个体无能为力。
接下来,我们就可以回顾演化经济学的思想史了。
我在幻灯片里给出了一长串人的名字,他们都可以看作是具有演化思想的经济学家,都是演化经济学的先驱。
斯密,马克思,门格尔,马歇尔,凡勃仑,熊彼特,直到哈耶克。
我尤其要强调雄彼特的贡献,他研究经济发展和经济周期,提出了著名的“创新”思想。
这带有明显的动态的特征,并影响了随后的尼尔森和温特。
安德森把熊彼特以后,尼尔森-温特以前这段时间(1930-1970)比作黑暗时代(当然这仅指演化经济学而言,对于新古典经济学无疑是黄金时代呢),这段时间很少有人关心动态的演化的经济学理论。
(阿尔奇安也许是个例外)从70年代初开始,尼尔森和温特提出了一系列演化经济学模型。
同时,梅纳德.史密斯在1973年提出了著名的演化稳定策略,奠定了演化经济学的基础。
从此,演化经济学可以算真正诞生了。
尼尔森自称是熊彼特的忠实信徒,而温特是达尔文进化论的信徒,他们的演化理论非常鲜明地具有这些特征。
计算机能够很好地模拟生态学上物种数量的演化,因而也被广泛地用于经济模型的演化模拟。
尼尔森-温特的多数模型都很容易被改编成计算机模型,用现实数据进行实证检验。
大家认为他们的模型在产业组织(IO)的应用比较成功,我就以这方面的模型为例子。
尼尔森-温特给出了个体在演化过程中的几个重要特征,我把他们列在下面1个体永远不会完美信息(局部知识或吉尔兹的地方性知识,而不是全局性知识)2个体行为受制度(正式和非正式),规范,习俗,意识系统等条件约束3个体(或者企业)可以模仿对手4开发和模仿(也就是R&D)既有“积聚效应”(可以参考Becker关于“上瘾”以及孩子教育的论文)和路径依赖的效果,又与原创性科学研究相关。
5个体竞争的结果往往是非均衡的-即败者出局(被淘汰)6个体的特征是非决定性的-这里他们是在反驳“决定论”的批评。
同时,演进的结果通常是不可逆的。
7主流经济学喜欢讨论“潜在的”均衡(也就是往往达不到的,但理论上可能的均衡),而对非均衡状态的分析要远比那些均衡来的重要。
我们重点讲其中的“创新”部分。
熊彼特的创新,到了尼尔森和温特那里,运用到对firm 的研究,被偷换成了R&D(更具体一些,是innovation/imitation)。
创新当然不完全等同于R&D,但这样做是必要的。
我们可以参考Becker的研究方法,我们脚站在工具里,把能够工具化的变量尽量工具化,也许我们只抓住了变量的很次要一部分,我们只迈出了一小步,但对这一小步我们有足够的自信心。
回到R&D,我下面主要依据他们1982年那本著名的教科书Evolutionary theory of economic change。
我们根据以下知识列出计算方程1 资本生产率是由企业的专门化知识决定的2R&D的产物是innovation和imitation。
3R&D密度(就是R&D占总资金比例,例如微软好像是5%)由一固定规则决定。
4原创能否实现是一个柏松过程。
再加上一些常识,就能写出联立方程组,用计算机来算。
5创新是不连续的,有跳跃,有“高原现象”。
接着我们就可以批评他们的工作了。
先是一个小问题,就是如何区分原创和模仿,两者之间的关系是怎样的(互补或互替或其他),他们也做了回应。
接着是一个大问题,就是他们把R&D看作在一个搜索空间(search space)里的搜索过程。
让我先打个岔,说说经典博弈论里的共同知识(common knowledge)的事情。
耶路撒冷学派的领袖奥曼(Aumann)说,博弈论的基础是一团乱麻。
要理出一根阿里阿德涅线,我们要找到一个线头,这就是共同知识。
共同知识就是,我知道你的策略,你知道我的策略,我知道你知道我的策略,你知道我知道你的策略...宾莫尔(Binmore)等人试图用一个自明之理来取代这个共同知识。
有些事情,只要发生了,人人都应该知道(例如911事件,现在的美伊战争等)。
但他们在公理化这个自明之理时,又遇到致命的阻碍。
这就是所谓的第五公理和第六公理。
第五公理说,我知我所知。
这还算了,第六公理说,我知我所不知,这立刻遇到了哲学问题。
亚里斯多德的“愈学愈无知”的故事正好拿来反驳。
一个人如何能知道自己的策略空间,更如何能知道自己策略空间以外的空间?从语言学或者认识论的角度来看,这个公理更显得荒谬了。
博弈论大师在共同知识这个问题前的狼狈是可想而知的。
我这里只是想类比一下,R&D真的能表示成在给定的搜索空间里搜索吗?从实践的角度,我们只能处理一维和二维的情况,丁丁说的“一切人在一切方向上的创新”,这就超出我们能够处理的范围了。
我们能够在一个时点讨论多个维度(一般均衡),我们也能在时间连续情形下讨论一个维度(演化稳定-这就是尼尔森和温特他们的工作),但我们无法讨论时间连续下多个维度的情况,这超出了理性的范围,但这正是创新的特点。
说了那么多,我只是想指出,他们这派的方法论是排除个人的理性选择的。
所以他们的模型可以被很好地运用到产业组织的研究中。
他们的路子跟泰勒尔(Tirole ),美国的博弈论四人帮等的路子很不同。
传统的经验型的产业组织研究(张伯伦,罗宾逊他们的研究,到后来贝恩那里所谓的SCP 范式)已经彻底被博弈论征服了。
而尼尔森,温特他们用演进理论借尸还魂,恢复产业组织的经验研究(很显然,计算机模拟的结果可以跟实证数据对比)是很成功的。
其中最微妙的与人的选择关系最密切的R&D 活动也被巧妙的模型化了。
(但我们看到,把多维的创新压缩到1,2维的搜索空间里的搜索,这里面问题很大)接着,我们可以讨论一些重要的概念了,主要是一些博弈论的概念。
当然,其中最重要的概念就是演化稳定策略(ESS )。
我想强调,ESS 是一种策略,而不是均衡。
策略在前,均衡在后。
由策略看演化,是由前往后看,由均衡看演化,是由后往前看。
我们先给出一个严格的定义,在两人对称博弈情况下(我们下面主要讨论对称的情况,不对称通常可以转换成对称的情形),存在策略σ,σσ'≠,()(0,1)εσ'∈,使得(,(1))(,(1))u u σεσεσσεσεσ'''+->+-,那么σ就被称为演化稳定策略。
由上面的定义可以看到,博弈双方都会采用这最优的演化稳定策略。
我们有两条性质如下 性质1:演化稳定策略必然是纳什均衡。
性质2:只有严格的(即唯一的)纳什均衡才能由演化稳定策略得出。
下面我介绍一个通俗的例子,表明演化稳定策略往往会不存在,所以我们有时不得不转向均衡的分析。
这个例子很简单,叫“石头-剪刀-布”博弈。
石头胜剪刀,剪刀胜布,布胜石头,当双方的策略相同时,收益都为x.很显然,这个博弈有一个混合策略纳什均衡,即用1/3的概率分别选择出石头-剪刀-布{1/3,1/3,1/3},或者说随机选择,这个策略的期望收益是13X 。
假设这个博弈存在演化稳定策略 ,那么双方都采取这个策略,收益显然为X.由定义得,既然策略是ESS ,那么必然有X>13X ,我们知道这只有在X>0时才满足。
当X<0时,这个博弈不存在演化稳定策略,但显然它是存在纳什均衡的,所以我们需要另一种分析方法,叫演化稳定均衡(EES )我把定义写在下面X 是个非空纳什均衡策略闭集合,存在(0,1)ε'∈,X σ∈,((1))BR σεσεσ''∈-+,0εε'<<,(1)X εσεσ'-+∈,则X 是演化稳定均衡。
我们可以证明,每个对称博弈都存在演化稳定均衡,每个演化稳定均衡是纳什均衡集的一个元素。
这样,我们就有了几个相关的工具。
一个是演化稳定策略,由这个策略可以推导最后的均衡,但这个占优策略未必存在。
一个是演化稳定均衡,它一定是存在的,但只是最后的结果。
一个是纳什均衡,但我们知道纳什均衡往往不唯一。
接下去,我们来讨论演化策略的稳定性。
我们有时候会发现ESS 虽然是占优的,但不是稳定的-这很重要,这导致我们必须引入一种“突变”(mutant )机制。
我下面举一个例子,是Robson(1990)年提出的,被称为“秘密握手”博弈。
有支付矩阵如下 (0.1)显然,这个博弈有2个纳什均衡,分别是(d,d)和(m,m),(m,m)帕累托占优于(d,d)。
因为(d,d)与(d,m),(m,d)无差异,而(m,m)优于(d,m)和(m,d),因此,只有(m,m)是演化稳定策略。