第三章-第五节-演化博弈模型解读

合集下载

演化博弈论PPT课件

演化博弈论PPT课件
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与 人最优策略组成。即在给定别人策略的情况下,没有人有足够 理由打破这种均衡。
纳什均衡可以通过划线法得出
13
纳什均衡和演化稳定(1)
a
X b
a 0,0
Y b
1,1
1,1
0,0
策略b是否是演化稳定的? 有一个规模为E的策略a入侵
策略b的平均适应度: (1 E)*0 E *1 E 策略a的平均适应度: (1 E)*1 E*0 1 E
Y/q(1p)2p0
p1/3
18
N-群体的演化稳定策略
定义1:策略组合 x{x1,x2,..x.n,}是纳什均衡, 如果x是演化稳定策略,如果对于任意的策 略组合 yx 存在某个 (0,1) 使得对于所有的
(0,
)
和y(1)x,有
ui(xi, i) ui(yi, i)
i I
i I
定义2:策略组合x是演化稳定策略,当且 仅当x是一个严格的纳什均衡。
:是一个与突变策略y有关的常数,称之为侵入界限; εy + (1 − ε)x:表示选择进化稳定策略群体与选择突变策略群
体所组成的混合群体。
16
演化稳定策略的定义(2)
Definition 2: 对任意的s'∈S×S,满足
(i) f(s,s)≥f(s',s); (ii)如果f(s,s)=f(s',s),那么对任意的s≠s'有 f(s,s)>f(s',s'); 则s是演化稳定策略
➢ 自演化博弈论诞生之日起,它就逐渐的被人们用 来分析生物、经济等领域的问题。
1. Selten Reinhard.A Note on Evolutionary Stable Strategies in Asymmetric Animal Conflicts [J]. Journal of Theoretical Biology, 1980,(84).

演化博弈方法

演化博弈方法

演化博弈方法演化博弈方法是一种理论工具,用来描述在多个个体、组织之间互动的过程中,在适应和合作之间寻求平衡的方式。

演化博弈方法可以帮助我们理解复杂的生物和社会系统,以及它们如何演化和适应。

演化博弈方法的基本概念演化博弈方法的基本概念包括两个相互关联的概念:演化和博弈。

其中演化是指一个物种或个体针对环境的适应性变化,博弈则是指互动参与者追求最大利益的过程。

演化博弈方法的步骤演化博弈方法主要包括以下步骤:1. 设定基本模型演化博弈方法的第一步是确定基本模型。

模型中需要包括参与者的数量、行为选项、收益函数和演化规则等信息。

2. 计算策略的收益演化博弈方法通过计算策略的收益,来分析策略是否能够稳定存在或者演化。

这个过程中需要考虑到参与者的互动和环境的变化。

3. 推导出一组稳定策略在经过多次迭代和优化之后,演化博弈方法可以推导出一组稳定策略,这些策略可以在长期的互动中获得最大利益。

这些策略通常被称为纳什均衡。

4. 分析演化路径演化博弈方法还可以用来分析演化路径,即为什么一种策略会取代另一种策略,以及这个过程是如何进行的。

演化博弈方法的应用演化博弈方法在生物和社会学等领域中都有广泛的应用。

在生物学中,演化博弈方法可以用来研究有机体之间的互动和自然选择。

例如,通过使用演化博弈方法可以研究动物之间的搏斗、求偶和繁殖等行为。

在社会学中,演化博弈方法可以用来研究群体行为和社会结构的演化。

例如,通过使用演化博弈方法可以研究社交网络中的合作、竞争和共存等现象。

总之,演化博弈方法是一种有用的理论工具,可以帮助我们理解复杂的自然和社会系统。

它的应用领域包括生物学、心理学、社会学、经济学等。

演化博弈论

演化博弈论

演化博弈论演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想,不再将人模型化为超级理性的博弈方,认为人类通常是通过试错的方法达到博弈均衡的,与生物演化具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。

在理论应符合现实意义上,该理论对于生物学以及各种社会科学尤其是经济学,均大有用场。

演化博弈理论最早源于Fisher,Hamilton,Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析,他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。

但直到Smith andPrice(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后,才标志着演化博弈理论的正式诞生。

生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic),这是演化博弈理论的又一次突破性发展。

模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念,它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程,ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。

编辑本段主要应用领域演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科,是证券投资研究的一个具有生命力和丰富内涵的新领域。

与现代金融学的“理性人”、“有效市场”相关假设不同,演化证券学重视对“生物本能”和“竞争与适应”的研究,强调人性和市场环境在股市演化中的重要地位,是揭示股市生存法则最有潜力的前沿科学。

其开山之作《股市真面目》颠覆了股市运行机理的传统理论,可称为达尔文式的范式革命。

第三章-第五节-演化博弈模型报告

第三章-第五节-演化博弈模型报告
误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策 略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个
稳定的策略。
复制动态实际上是描述某一特定策略在一个种群中被采用 的频数或频度的动态微分方程,可以用下式表示:
d xi dt xi [(usi , x) u ( x, x)]
演化博弈关注的问题
F ‘(0) >0, F’(1)>0,而 F‘(1/6)<0,
在方法论上,它不同于博弈论将重点放在静态均衡
和比较静态均衡上,强调的是一种动态的均衡。演 化博弈理论源于生物进化论。
为什么将演化思想引入到博弈论中?
(1)博弈论对生物学的影响。博弈论的策略对应生
物学中的基因 ,博弈论的收益对应生物学中的 适应度。在生物学中应用的博弈论与经济学中的 传统博弈论最大区别就是非完全理性的选择。 (2)演化化思想对社会科学的影响。例如,在市场 竞争中,我们不必要去理性的想那个策略才是最 优的,最后能够在市场存活下来的企业,一定是
(v-c)/2 鹰 (v-c)/2,
鸽 v ,0 v/2 ,v/2

0 ,v
F x
dx v vc x 1 x x 1 x dt 2 2
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
dx/dt
1/6 0 1
F x
dx x a c 1 x b d x U1 U x 1 x dt
当F(x) =0时,
复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)
稳定性定理
F(x)=dx/dt,t↑,则x↑

演化博弈

演化博弈

Taylor和Jonker提出了演化博弈理论的基本动态概念——复制动态
• 经济学家把演化博弈理论引入到经济学领域,用于分析社会制度变迁、产业演化以及股票 市场等,同时对演化博弈理论的研究也开始由对称博弈向非对称博弈深入,并取得了一定
1980s
的成果
演化博弈的产生与发展
• 演化博弈理论的发展进入了一个新的阶段。Weibull(1995)比较系统、完整地总结了演 1990s 化博弈理论,其中包含了一些最新的理论研究成果。
则竞争者群体的复制动态方程F1(x):
dx/dt dx/dt 1 x y=1/2 y>1/2 1 dx/dt
x 1 x
y<1/2
复制动态中的非对称博弈
对于博弈方2: 博弈方2 打击 博 弈 方 1 容忍
进入
不进
0, 0
1, 5
2, 2
1, 5
则在位者群体的复制动态方程F2(y):dy/dt 1 x演化博弈的基本分析过程
一般的演化博弈模型的建立主要基于两个方面:选择(Selection)和突变 (Mutation)。 选择是指能够获得较高支付的策略在以后将被更多的参与者采用;突变 是指部分个体以随机的方式选择不同于群体的策略(可能是能够获得高支付的 策略,也可能是获得较低支付的策略)。 突变其实也是一种选择,但只有好的策略才能生存下来。突变是一种不 断试错的过程,也是一种学习与模仿的过程,这个过程是适应性且是不断改进 的。
目录页
PART TWO
最优反应动态
协调博弈的有限博弈方快速学习模型
模型: 博 弈 A 方 B 1 博弈方2 A B 50,50 49,0 0,49 60,60 协调博弈
1 5 4 3 2
5个博弈方,相邻者彼此博弈,初始策略组合为32种。

博弈模型汇总

博弈模型汇总

博弈模型汇总博弈模型是博弈论的重要工具,用于描述博弈参与者之间的策略和利益关系。

在博弈论中,通过建立合适的博弈模型,可以帮助我们分析和理解各种不同类型的博弈情境,并预测博弈参与者的行为和可能的结果。

下面将对几种常见的博弈模型进行汇总和介绍。

1. 零和博弈模型:零和博弈模型是博弈论中最简单和最基本的模型之一。

在零和博弈中,博弈参与者的利益完全相反,一方的利益的增加必然导致另一方的利益的减少。

这种博弈模型常常用于描述双方的冲突和竞争情境。

常见的零和博弈模型有二人零和博弈和多人零和博弈。

2. 非合作博弈模型:非合作博弈模型是博弈论中较为常见的模型之一。

在非合作博弈中,博弈参与者之间的行动和决策是相互独立的,每个博弈参与者都追求自身的最大利益。

在非合作博弈模型中,博弈参与者可以选择不同的策略,根据对手的行动做出最优的响应。

常见的非合作博弈模型有纳什均衡模型和博弈树模型。

3. 合作博弈模型:合作博弈模型是博弈论中另一个重要的模型。

在合作博弈中,博弈参与者之间可以进行协作和合作,共同追求最大化整体利益。

合作博弈模型通常用于描述多个博弈参与者之间的联盟和合作情境。

常见的合作博弈模型有核心模型和合作博弈解。

4. 演化博弈模型:演化博弈模型是博弈论中较为新颖和有趣的模型之一。

在演化博弈中,博弈参与者的行动和策略可以随时间变化和演化。

演化博弈模型通常用于描述博弈参与者之间的适应性和进化过程。

常见的演化博弈模型有进化博弈动力学模型和演化博弈解。

博弈模型的应用广泛,不仅在经济学中有重要的地位,也在其他学科领域得到广泛运用。

博弈模型可以帮助我们分析和解决各种决策和策略问题,对于理解社会、经济和生物系统中的行为和演化具有重要意义。

总结起来,博弈模型是博弈论的核心工具之一,用于描述和分析博弈参与者之间的策略和利益关系。

常见的博弈模型包括零和博弈模型、非合作博弈模型、合作博弈模型和演化博弈模型。

这些模型在各个领域中都有广泛的应用,对于理解和解决各种决策和策略问题具有重要意义。

演化博弈论简介

演化博弈论简介
处所得到的收益大于两者冲突导致的损失)
dx/dt
0
ESS: x*=1
1
x
0
1
x
ESS: x*=1
当c≤v时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因
在于当一方忍让时,另一方可获得更多收益。
这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。
(四)蛙鸣博弈的复制动态和ESS
则: dx x2 x3
dx dt

x UY
U

dt
当x=0时,稳定;
复制动态方程 当x>0时,最终稳定于x*=1
dx/dt
dx x2 x3
dt
甲Y
N
第6讲:演化博弈论简介

Y
N
1,1
0 ,0
0, 0
0,0
0
1x
图1 签协议博弈的复制动态相位图
x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
1-m,m-z
0 ,0
② 若(m-z)/(1-P) <0,即z>m
第6讲:演化博弈论简介
F

x

dx dt

x
1
x
m

z


1

P

x
③ 若(m-z)/(1-P) >1,即m-z>1-P
dx/dt
dx/dt
0
1
x
0
1
x
ESS: x*=0
ESS: x*=1
显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫”。 当“鸣叫”的收益大于群体鸣叫而个别雄蛙“搭便车”的收益时,所有雄蛙都将鸣

演化博弈均衡解

演化博弈均衡解

演化博弈均衡解
《演化博弈均衡解》是一种游戏理论,它提出了一种模型,用于描述两个或多个参与者之间的博弈行为。

它提出了一种演化均衡解,即参与者之间的行为会趋向于一种稳定的状态,这种状态可以被认为是一种最优解。

演化博弈均衡解的核心思想是,参与者之间的行为会趋向于一种稳定的状态,这种状态可以被认为是一种最优解。

它的基本原理是,参与者之间的行为会趋向于一种稳定的状态,这种状态可以被认为是一种最优解。

演化博弈均衡解的应用非常广泛,它可以用于描述经济学、政治学、社会学等多个领域中的博弈行为。

它可以帮助我们更好地理解参与者之间的行为,从而更好地分析和解决博弈问题。

总之,演化博弈均衡解是一种有效的游戏理论,它可以帮助我们更好地理解参与者之间的行为,从而更好地分析和解决博弈问题。

演化博弈论模型下经济决策的心理因素分析——以股票市场为例

演化博弈论模型下经济决策的心理因素分析——以股票市场为例

演化博弈论模型下经济决策的心理因素分析——以股票市场为例演化博弈论模型下经济决策的心理因素分析——以股票市场为例导言:股票市场作为现代经济的核心组成部分,不仅是公司融资的重要平台,也是投资者获取财富的重要工具。

在股票市场中,投资者的经济决策不仅受到外在的经济因素的影响,还深受心理因素的制约。

本文将运用演化博弈论模型,分析股票市场中经济决策的心理因素,探讨其对市场的影响。

一、演化博弈论模型的基本原理演化博弈论是对生物进化与博弈论相结合的理论模型,通过描述参与者之间的策略选择,进一步研究不同策略的进化过程以及社会群体的演化稳定态。

在经济领域中,演化博弈论模型被广泛应用于分析各类市场中的参与者行为,揭示其背后的动因。

二、心理因素对经济决策的影响1. 互惠原则与道德约束在股票交易中,投资者常常遵循互惠原则,即期望其他投资者也能对其提供良好的回报,同时也会考虑市场中的道德约束。

演化博弈论模型显示,当投资者遵循互惠原则并遵循道德规范时,市场能够更加稳定,投资者之间的信任度也会得到提高。

2. 样本偏见与跟风行为心理学研究表明,人们常常容易受到过去经验的影响,即样本偏见。

在股票市场中,投资者倾向于参考过去的股票表现,从而做出决策。

此外,投资者的跟风行为也常常受到心理因素的影响,当市场中出现大量跟风者时,市场变得更加动荡。

3. 损失厌恶与风险偏好人们对于损失的感受远远大于相同数量的利益,这种心理特征称为损失厌恶。

在股票市场中,投资者常常因为对损失的恐惧而过度谨慎,往往选择较为保守的投资策略。

此外,风险偏好也是影响经济决策的心理因素之一,不同的投资者会对风险的承受能力有所差别。

三、演化博弈论模型在股票市场中的应用1. 模拟投资者行为演化博弈论模型可以帮助模拟投资者的决策行为,探究其背后的动因。

通过对投资者心理因素的分析,可以更好地理解投资者的行为模式,从而为市场监管者制定相关政策提供依据。

2. 预测市场波动性利用演化博弈论模型,可以预测市场的波动性。

演化博弈论简介

演化博弈论简介

演化博弈论简介丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。

他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。

传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。

正因为如此,这些新理论才显示出强大的生命力,获得广泛运用。

我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。

先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。

我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。

从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。

我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。

我这里用演化,避免用演进,可以减少误解。

演化理论中有两条最重要的机制。

一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。

在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。

我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。

我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。

严复说物竞天择,就是这个意思。

另一种机制叫突变机制(mutant),这保证了种群的变化。

如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。

博弈的演化模型应用

博弈的演化模型应用

博弈的演化模型应用随着信息技术的发展,博弈理论在金融、管理、经济、和社会等多个领域发挥着越来越重要的作用。

博弈理论的基本思想是研究两个或多个博弈者对同一局面的策略选择,研究在该局面下达成最优博弈结果的方法。

其中,演化博弈模型是其中一种重要的研究方法,具有自适应和自我学习的特点,可以用来研究一系列博弈中的动态演化、策略竞争、协商合作等问题。

演化博弈模型的基本概念是基于非对称矩阵博弈的理论,模型由一系列变量来描述,例如策略池概念,即可以描述不同策略池中参与者的策略以及当前及潜在环境下策略收益的变化。

通过演化博弈模型,我们可以模拟和调查不同博弈者之间的策略演变,以及某种策略在不断演变中如何优化和改变自身以及其他参与者的结果。

另外,演化博弈模型可以与其他智能算法(如人工神经网络、监督式学习等)相结合,全面解决博弈问题,使博弈者可以有效地识别所处局面并针对当前局势进行合理的策略选择。

演化博弈模型在实际应用中表现出了广泛的用处。

一般来说,它的应用在于帮助博弈者在博弈中达到最佳结果。

比如,我们可以利用演化博弈模型研究在市场竞争中两个企业之间的战略决定;可以利用模型来研究全球货币政策中政府和商业银行之间的博弈等。

此外,演化博弈模型也可以用于研究国际关系,模拟不同国家之间的策略博弈环境、资源分配等问题。

在研究国际关系中,演化博弈模型可以用来模拟不同国家之间的战略选择,从而研究其策略的有效性,以及影响策略选择的各种因素,像财政政策、贸易政策、外交政策等。

最后,演化博弈模型对现实生活也有很多应用。

以金融博弈为例,演化博弈模型可以帮助金融机构进行精确的风险管理,预测金融行业的发展趋势,以及优化金融投资的收益等。

此外,演化博弈模型还可以应用于分析多边贸易环境中各国之间的策略博弈情况,以及解决国际商业纠纷等问题。

综上所述,演化博弈模型是一种强大而多用的博弈分析工具,它不仅可以应用于研究金融、管理、经济以及国际关系等,还可以用于解决实际应用中的各种问题。

演化博弈模型及其应用

演化博弈模型及其应用

参考内容
内容摘要
在当今复杂多变的社会环境中,合作与竞争并存的现象越来越普遍。这种环 境下,博弈论为我们提供了一个理解和分析这种复杂性的有力工具。特别是合作 竞争博弈模型,它强调了博弈中ቤተ መጻሕፍቲ ባይዱ与者之间的合作和竞争的交互性质,对于我们 理解和解决实际问题具有重要的启示作用。
一、合作竞争博弈模型概述
一、合作竞争博弈模型概述
2、社会学
2、社会学
在社会学领域,演化博弈模型被用来解释社会规范、社会习俗、文化传承等 社会现象的形成和演变。例如,研究者可以通过演化博弈模型来分析个体之间的 行为互动如何影响整个群体的行为模式和文化传承。
3、经济学
3、经济学
在经济学领域,演化博弈模型被广泛应用于研究市场行为、产业演化、金融 风险等方面。例如,研究者可以通过演化博弈模型来分析企业在市场竞争中如何 调整自己的策略,以及这种策略调整如何影响整个市场的竞争格局和稳定性。
四、结论
四、结论
总的来说,合作竞争博弈模型为我们理解和解决实际问题提供了一个有效的 框架。它让我们认识到,在复杂的现实世界中,合作和竞争并存是一种常态。通 过理解和运用这种博弈模型,我们可以更好地处理各种人际关系,实现更大的利 益。
谢谢观看
二、合作竞争博弈模型的策略选 择
二、合作竞争博弈模型的策略选择
在合作竞争博弈模型中,策略的选择是关键。一般来说,主要有以下几种策 略:
1、合作策略:这种策略主要是为了通过合作实现更大的利益。合作策略通常 需要考虑的是如何与其他局中人建立合作关系,以及如何维护这种合作关系。
二、合作竞争博弈模型的策略选择
3、随机演化博弈模型
随机演化博弈模型则考虑了更多随机因素对博弈过程的影响。例如,个体的 策略调整可能会受到随机事件的影响,或者整个群体的策略分布可能会因为随机 因素而发生意想不到的变化。在这种模型中,随机性成为了影响策略演化的重要 因素。

演化博弈

演化博弈



(1)博弈方1的收益计算
设“进入”、“不进”两类博弈方的期望收益以及平均收益分别为 u1e、u1n、u1a: u1e= y*0 +(1-y)*2 =2(1-y) u1n= y*1 +(1-y)*1 =1 u1a = x u1e +(1-x) u1n =2x(1-y)+(1-x)


由于是一群鸟在博弈,那么每只鸟的每次博弈碰到另一只鸟采用H策略 的概率就有25%,而碰到采用D策略的鸟的概率为75%,这样可以计算 期望收益。假定z为鹰在整个种群中的比例(这里为0.25)。因此(1-z) 即为鸽子所占的比例。鹰的收益期望为: EV(H)=(-25z)+14(1-z)=14-39z 而鸽子的收益期望为: EV(D)=(-9z)+5(1-z)=5-14z 这里,EV(H)=4.25, EV(D)=1.5 。


种群收益与种群的繁殖是成比例的, 所以两个种群都会不断增长。 显然,鹰的增长速度要快于鸽子。 这样,鹰和鸽子的比例就会改变, 鸟 最后,鹰和鸽子的比例会是多少呢? A 这就是一个演化战略,即ESS.
鸟B H D
14, -9
5, 5
H
D
-25, -25
-9, 14
8.3 最优反应动态

1、协调博弈的快速学习模 型(表2)
8.4 复制动态和演化稳定性: 两人对称博弈


有限理性博弈方有多种不同的理性层次,学习的速度 差别也很大。最优反应动态是具有较快学习速度的有 限理性博弈方的策略调整和策略稳定性。下面讨论学 习速度较慢的动态策略调整及其稳定性。 分析框架是这种博弈方组成的大群体成员的随机配对 反复博弈。这一节讨论群体中博弈方是相似的,即进 行的博弈是博弈位置无差异的两人对称博弈。下一节 讨论群体成员是有差异的,进行非对称博弈的情况。

演化博弈参数

演化博弈参数

演化博弈参数演化博弈参数是指在演化博弈理论中所涉及的各种参数,这些参数直接决定了演化博弈过程中参与者的选择策略和得到收益的表现。

了解演化博弈参数对于理解和分析博弈过程中的各种现象及其背后的规律是至关重要的。

首先,演化博弈参数中的游戏矩阵是非常重要的一个参数。

游戏矩阵可以很好地描述博弈过程中各参与者的收益和选择策略。

它通常是一个二维矩阵,其中每个元素都代表了一个参与者在选择某一策略时所能获得的收益。

在演化博弈过程中,参与者根据游戏矩阵中的相应收益和自身的背景条件,来选择最优的策略。

除了游戏矩阵,演化博弈参数中的演化规则也是非常重要的。

演化规则直接影响着参与者选择策略和得到收益的表现。

在演化博弈理论中,最常见的演化规则包括复制动态规则和最小演化规则。

复制动态规则是指参与者按照自己和邻居之间的收益差异来选择最优的策略,并用其在游戏中取得的收益来替换邻居的策略,从而实现自我修正的过程。

最小演化规则则是一种较为保守的演化规则,即参与者会始终以自己最小收益的策略为基础去寻找更优的策略,并尽量避免冒险和失败的风险。

此外,在演化博弈参数中,选择策略的初始分布和演化速率也是非常重要的参数。

选择策略的初始分布关系着参与者在演化博弈的过程中最开始选择的策略,这会直接影响到游戏演化结果和表现。

演化速率则决定了参与者在演化过程中所采取的策略变化的速度和频率,以及演化结果的收敛速度。

总的来说,演化博弈参数是演化博弈理论中极为重要的一个方面。

了解不同的演化博弈参数可以帮助我们深入理解博弈现象,并且更好地进行演化博弈的分析和应用。

在实际应用中,我们可以根据具体的情况来对各种演化博弈参数进行合理选择和调整,以达到最佳的演化效果和最优的收益表现。

演化和博弈理论

演化和博弈理论

演化和博弈理论Larry Samuelson1朱宪辰译博弈论由John yon Neumann and Oskar Morgenstern (1944)提出,经John Nash (1950)加入纳什均衡(Nash equilibrium)概念而完善,被二十世纪80年代的策略革命推广之后,非合作博弈论(noncooperative game theory)在经济研究中已经成为一种标准工具。

这个过程当中,人们越来越以博弈观点为基础分析问题。

主要关注两个问题:我们能否期望纳什均衡是这样的:即我们能否预期博弈双方的选择都是在明确对方的选择下做出的最优反应?如果结论是肯定的,在多种博弈中出现的多重纳什均衡(multiple Nash equilibria),我们能预期哪一种呢?二十世纪80年代,研究博弈论的学者们忙于讨论上述问题,并建立了模型。

基于这样的假定:行为人是完全理性的,并且基于相同理性都有共同的知识水平(common knowledge)。

然而,进入二十世纪90年代,讨论的重点由以理性为基础的模型转到以演化论为基础的模型上来。

原因之一是以理性为基础的模型存在局限性。

这些模型可以容易地推动纳什均衡的一个必要条件:博弈双方会相信对方的行为并根据它们做出最佳反应;但是不能证明另一个必要条件,即他们相信的都正确。

同时,纳什均衡之中的理性选择标准产生可选择的精炼纳什均衡增强概念,意图排除具有充分委付的不真实的纳什均衡以迅速放弃从中选择一个方面作为正确的想法。

原因之二是由于博弈所代表的潜在观念有了变化。

一旦用博弈论解释描述理想相互作用状态时,其中完全理性假定就显得十分自然了。

目前像其它经济模型一样,更加普遍地用一个近似的类似于真实的模型来解释博弈游戏,在此完全理性看起来也不是那么恰当了。

演化博弈论涵盖的模型很广泛。

共同主题是在一个动态过程中描述博弈者如何在一个游戏的重复较量过程中调整他们的行为以重新适应。

博弈论与信息经济学-5.演化博弈

博弈论与信息经济学-5.演化博弈

演化稳定策略是 什么呢?
C C D 2,2 3,0
D 0,3 1,1
假定一个群体由背叛者构成,由于基因变异出现 了比例为ε的合作者。 此时背叛者的收益为:(1-ε)*1+ε*3=1+2ε 合作者的收益为:(1-ε)*0+ε*2=2ε 由于合作者的收益低于背叛者的收益,合作者会 逐渐消亡,因此背叛是一个演化稳定策略。
路径依赖与制度变革
对组织而言,一种制度形成后,会形成某 个既得利益集团,他们对现在的制度有强 烈的要求,只有巩固和强化现有制度才能 保障他们继续获得利益,哪怕新制度对全 局更有效率。对个人而言,一旦人们做出 选择以后会不断地投入精力、金钱及各种 物资,如果哪天发现自己选择的道路不合 适也不会轻易改变,因为这样会使得自己 在前期的巨大投入变得一文不值,这在经 济学上叫“沉没成本”。沉没成本是路径 依赖的主要原因。
路径依赖的例子
有人将5只猴子放在一只笼子里,并在笼子中间吊上一串香蕉,只要 有猴子伸手去拿香蕉,就用高压水教训所有的猴子,直到没有一只猴 子再敢动手。 然后用一只新猴子替换出笼子里的一只猴子,新来的猴子不知这 里的“规矩”,竟又伸出上肢去拿香蕉,结果触怒了原来笼子里的4 只猴子,于是它们代替人执行惩罚任务,把新来的猴子暴打一顿,直 到它服从这里的“规矩”为止。 试验人员如此不断地将最初经历过高压水惩戒的猴子换出来,最 后笼子里的猴子全是新的,但没有一只猴子再敢去碰香蕉。 起初,猴子怕受到“株连”,不允许其他猴子去碰香蕉,这是合 理的。 但后来人和高压水都不再介入,而新来的猴子却固守着“不许拿 香蕉”的制度不变,这就是路径依赖的自我强化效应。
例3:找出ESS
A A B 1,1 1,1 B 1,1 0,0
U(A,A)=U(B,A) U(A,B)>U(B,B) 因此A是演化稳10 0,0
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设:群体比例的动态变化速度为
dx x U Y U dt
dx 则: x 2 x3 dt
当x=0时,稳定;
复制动态方程
当x>0时,最终稳定于x*=1
dx/dt
dx x 2 x3 dt
乙 Y 甲 Y N 1,1 0, 0 N 0 ,0 0,0
0
1
图1 签协议博弈的复制动态相位图 x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
在方法论上,它不同于博弈论将重点放在静态均衡
和比较静态均衡上,强调的是一种动态的均衡。演 化博弈理论源于生物进化论。
为什么将演化思想引入到博弈论中?
(1)博弈论对生物学的影响。博弈论的策略对应生
物学中的基因 ,博弈论的收益对应生物学中的 适应度。在生物学中应用的博弈论与经济学中的 传统博弈论最大区别就是非完全理性的选择。 (2)演化化思想对社会科学的影响。例如,在市场 竞争中,我们不必要去理性的想那个策略才是最 优的,最后能够在市场存活下来的企业,一定是
若x<x*,为使x→x*,应满足F(x)>0;
若x>x*,为使x→x*,应满足F(x)<0.
F(x)=dx/dt,t↑,则x↓
F(x)
这意味着:
x* 0 x
当F'(x*)<0,x*为ESS
(三)协调博弈的复制动态和ESS
复制动态方程F(x):
甲 A B
乙 A 50,50 0,49 B 49,0 60,60
x
(二)一般两人对称博弈
甲 S1 S2
乙 S1 a,a c, b S2 b ,c d,d
群体中采用S1的比例为x,S2的比例为1-x,对于甲
U1 x a 1 x b
U2 x c 1 x d
U x U1 1 x U2
则复制动态方程F(x):
误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策 略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个
稳定的策略。
复制动态实际上是描述某一特定策略在一个种群中被采用 的频数或频度的动态微分方程,可以用下式表示:
d xi dt xi [(usi , x) u ( x, x)]
演化博弈关注的问题
(v-c)/2 鹰 (v-c)/2,
鸽 v ,0 v/2 ,v/2

0 ,v
F x
dx v vc x 1 x x 1 x dt 2 2
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
dx/dt
1/6 0 1
F x
dx x a c 1 x b d x U1 U x 1 x dt
当F(x) =0时,
复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)
稳定性定理
F(x)=dx/dt,t↑,则x↑
x*=0和x*=1为ESS
0 11/61 1
x
这意味着: 当初始x<11/61时,ESS为x*=0;
图2 协调博弈的复制动态相位图
当初始x>11/61时,ESS 为x*=1.
(四)鹰鸽博弈的复制动态和ESS
鹰 甲
乙 鸽 v ,0 v/2 ,v/2
(v-c)/2 鹰 (v-c)/2,

0 ,v
令x为采用“鹰”策略的群体比例,1-x为采用“鸽”策略的群体比 例 则复制动态方程F(x):
第五节 演化博弈模型
一、演化博弈思想
传统博弈理论的两个苛刻假设: (1)完全理性(2)完全信息 与传统博弈理论不同,演化博弈理论并不要求参与 人是完全理性的,也不要求完全信息的条件。 演化博弈论(Evolutionary Game Theory)把博弈 理论分析和动态演化过程分析结合起来的一种理论。
当时间趋于无穷大时,博弈参与方策略选择行为是怎样的? 这就是演化博弈稳定性问题,一个稳定状态必须对微小扰 动具有稳健性才能称为演化稳定策略。也就是说,如果我 们假定为演化稳定策略的稳定点,则该点除了本身必须是 均衡状态以外,还必须具有这样的性质:如果某些博弈方 由于偶然的错误偏离了它们,复制动态仍然会使x回复到 x*。在数学上,这相当于要求:当干扰使x低于时x* , dx/dt必须大于0;当干扰使得x出现高于时x*, dx/dt必 须小于0,这就要求这些稳定状态处于的导数必须小于0。 演化稳定策略的影响因素分析
适应能力最强的公司。
在演化博弈理论中,演化稳定策略 (Evolutionary Stable
Strategy, ESS)和复制动态(Replication Dynamics)是两个核
心概念。演化稳定策略是指在博弈的过程中,博弈双方由于有 限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。
于是,博弈方在博弈的过程中需要不断进行学习,有过策略失
F ‘(0) >0, F’(1)>0,而 F‘(1/6)<0,
二、复制动态中的对称博弈
乙 Y N 0 ,0 0,0
Y:同意 N:不同意
(一)签协议博弈

Y N
1,1 0, 0
假设:群体中“Y”的比例为x,“N”的比例为1-x,对于 甲
UY x 1 1 x 0 x
U N x 0 1 x 0 0
U x UY 1 x U N x2
F x
dx x 1 x x a c 1 x b d dt v vc x 1 x x 1 x 2 2
当F(x) =0时,x*=0,x*=1,x*=v/c为稳定状态
乙 鹰 甲
F x
dx x 1 x x a c 1 x b d dt x 1 x 61x 11
当F(x) =0时,x*=0,x*=1, x*ห้องสมุดไป่ตู้11/61为稳定状态
dx/dt
可知,当F '(0) <0, F'(1)<0, 而F'(11/61)>0,则
相关文档
最新文档