演化博弈论简介-萧敢

合集下载

演化博弈论

演化博弈论

演化博弈论:演化博弈论(Evolutionary Game Theory)不再将人模型化为超级理性的博弈方,而是认为人类通常是通过试错的方法达到博弈均衡的,与生物进化原理具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。

在理论应符合现实意义上,该理论对于生物学、经济学、金融学和证券学等学科均大有用场。

在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。

在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。

与传统博弈理论不同。

有限理性这一概念最早是由西蒙(Simon.H.A.)在研究决策问题时提出的,因为个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有限制的(这或许是因为他们没有掌握到所必需的词汇,或许是因为这些词汇还不存在)。

演化博弈论PPT课件

演化博弈论PPT课件
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与 人最优策略组成。即在给定别人策略的情况下,没有人有足够 理由打破这种均衡。
纳什均衡可以通过划线法得出
13
纳什均衡和演化稳定(1)
a
X b
a 0,0
Y b
1,1
1,1
0,0
策略b是否是演化稳定的? 有一个规模为E的策略a入侵
策略b的平均适应度: (1 E)*0 E *1 E 策略a的平均适应度: (1 E)*1 E*0 1 E
Y/q(1p)2p0
p1/3
18
N-群体的演化稳定策略
定义1:策略组合 x{x1,x2,..x.n,}是纳什均衡, 如果x是演化稳定策略,如果对于任意的策 略组合 yx 存在某个 (0,1) 使得对于所有的
(0,
)
和y(1)x,有
ui(xi, i) ui(yi, i)
i I
i I
定义2:策略组合x是演化稳定策略,当且 仅当x是一个严格的纳什均衡。
:是一个与突变策略y有关的常数,称之为侵入界限; εy + (1 − ε)x:表示选择进化稳定策略群体与选择突变策略群
体所组成的混合群体。
16
演化稳定策略的定义(2)
Definition 2: 对任意的s'∈S×S,满足
(i) f(s,s)≥f(s',s); (ii)如果f(s,s)=f(s',s),那么对任意的s≠s'有 f(s,s)>f(s',s'); 则s是演化稳定策略
➢ 自演化博弈论诞生之日起,它就逐渐的被人们用 来分析生物、经济等领域的问题。
1. Selten Reinhard.A Note on Evolutionary Stable Strategies in Asymmetric Animal Conflicts [J]. Journal of Theoretical Biology, 1980,(84).

第6讲:演化博弈论简介

第6讲:演化博弈论简介

NE: (A,A) , (B,B) ,(11/61,11/61)
其中,(B,B)为pareto最优,但(A,A)为风险上策均衡
第6讲:演化博弈论简介
最优反应动态:能根据对方的上期策略调整自己的策略。
例如:
5 1
乙 A
2
B 49,0 60,60

A B
50,50 0,4943 5个博弈方,相邻者彼此博弈,初始策略组合为32种。 实际上为8种:无A,1A,相邻2A,不相邻2A,3连A,非3连A,4A,5A 令xi(t)为t时期博弈方i 的采用策略A的邻居的数量,则xi(t) = 0,1,2.
假设: A:“进入”的群体比例为x “不进”的群体比例为1-x B:“打击”的群体比例为y “不打击”的群体比例为1-y
对A而言:
Uy 01 y 2 2 2 y A e
U y 1 1y 11 A n
U x Ux 1 U 2 x 1 y 1 x A A e A n
d x x x U Ux 1 x 1 2 y 竞争者群体的复制动态方程: F A A e A d t
竞争者的群体复制动态相位图为:
dx/dt
dx/dt
dx/dt
0 1
x
0 1
0
1
x
x
(a) y=1/2 x*∈[0,1]
(b) y>1/2 ESS: x*=0
Ux t 5 02 t 4 9 A i i x
可知,当xi(t)>22/61时,UA>UB
Ux t 0 2 x t 6 0 在t时期,当2个邻居中只要有1个邻 B i i

第6讲:演化博弈论简介

第6讲:演化博弈论简介
11 61
学习速度慢
理性程度低

1 2
n
当n≥3
学习速度快 理性程度高
所以,在有限理性程度下,理性程度较高的一方不一定能得到比 理性程度较低的一方更理想的结果。
第6讲:演化博弈论简介
(四)鹰鸽博弈的复制动态和ESS
鹰 甲
乙 鸽 v ,0 , v/2 ,v/2
(v-c)/2 鹰 (v-c)/2,
可知,当xi(t)>22/61时,UA>UB
U B xi t 0 2 xi t 6 0
在t时期,当2个邻居中只要有1个邻
居采用策略A,则i在t+1时期必然采用A
第6讲:演化博弈论简介
例举如下:
1、当初始情况为1A时
A B B B B A B B B A B A A A B A A A B A A A A A A
dx dt x U U
竞争者群体的复制动态方程: F A x
Ae
A
x 1 x 1 2 y
竞争者的群体复制动态相位图为:
dx/dt
dx/dt
dx/dt
0 1
x
0 1
0
1
x
x
(a) y=1/2 x*∈[0,1]
(b) y>1/2 ESS: x*=0
(c) y<1/2 ESS: x*=1
2、当初始情况为2连A时
A A B B B A A B A A A A A A A
3、当初始情况为3连A时
A A B B A A A A A A
综上可知,32种初始情况下, 只有1种情况稳定于5B,其余31 中情况最后都将稳定于5A。(此时, A为“进化稳定策略”,即ESS, evolutionary stable strategy)

演化博弈论

演化博弈论
其他的一些理论成果包括Cressman(1992)以及Samuelson(1997)的著 作。
• 演化博弈的发展出现了一些新的思路,对演化稳定策略和合作演化 博弈的研究不断深入,学者开始关注带有随机因素影响的演化过程。
21世纪 进入2l世纪以来,国内的学者也开始关注演化博弈论,也做出了大 量的研究。
如果(S,S)不是纳什均衡,那 么S不是演化稳定策略
纳什均衡和演化稳定(2)
a
X b
a 1,1
Y b
0,0
0,0
0,0
策略b是否是演化稳定的? 有一个规模为E的策略b入侵
策略b的平均适应度: (1 E)*0 E *0 0
策略a的平均适应度:
(1 E)*0 E *1 E
如果(S,S)是严格的纳 什均衡,那么S是演化稳

pi [ u(ei , x) ] pi (1)
对恒等式 p(t)xi (t) pi (t) 两边求t的导数 得:



p xi pi p xi (2)
将式(1)带入(2)中,稍加整理可得:

xi [u(ei , x) u(x, x)]xi (3)
式(3)说明: 采用策略i的总 体比例的增长 率 等于策略收
与传统博弈理论不同,演化博弈理论并不要求参 与人是完全理性的,也不要求完全信息的条件。
演化博弈论(Evolutionary Game Theory)把博弈 理论分析和动态演化过程分析结合起来的一种理 论。在方法论上,它不同于博弈论将重点放在静 态均衡和比较静态均衡上,强调的是一种动态的 均衡。演化博弈理论源于生物进化论。
0
X*
1
x
标准的N总体复制子动态

演化博弈论——精选推荐

演化博弈论——精选推荐

演化博弈论我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。

先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。

我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。

从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。

我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。

我这里用演化,避免用演进,可以减少误解。

演化理论中有两条最重要的机制。

一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。

在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。

我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。

我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。

严复说物竞天择,就是这个意思。

另一种机制叫突变机制(mutant),这保证了种群的变化。

如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。

对于突变机制,我也要强调它是没有方向性的,可能会提高个体的适应性,但更有可能降低个体的适应性。

突变同样是上帝的选择,微观个体无能为力。

接下来,我们就可以回顾演化经济学的思想史了。

我在幻灯片里给出了一长串人的名字,他们都可以看作是具有演化思想的经济学家,都是演化经济学的先驱。

斯密,马克思,门格尔,马歇尔,凡勃仑,熊彼特,直到哈耶克。

我尤其要强调雄彼特的贡献,他研究经济发展和经济周期,提出了著名的"创新"思想。

第6讲:演化博弈论简介

第6讲:演化博弈论简介

dx/dt
可知,当F '(0) <0, F'(1)<0, 而F'(11/61)>0,则
x*=0和x*=1为ESS
0 11/61 1
x
这意味着: 当初始x<11/61时,ESS为x*=0;
图2 协调博弈的复制动态相位图
当初始x>11/61时,ESS 为x*=1.
第6讲:演化博弈论简介
复制动态与最优反应动态的比较:
稳定性定理
F(x)=dx/dt,t↑,则x↑
若x<x*,为使x→x*,应满足F(x)>0;
若x>x*,为使x→x*,应满足F(x)<0.
F(x)=dx/dt,t↑,则x↓
F(x)
这意味着:
x* 0 x
当F'(x*)<0,x*为ESS
第6讲:演化博弈论简介
(三)协调博弈的复制动态和ESS
复制动态方程F(x):
非对称博弈:不同群体间的演化博弈行为
(一) 市场阻入博弈
竞争者
有两个群体:竞争者和在位者
不进入
打击 竞 进入 争 者 不进 0 ,0 1 ,5 在位者 不打击 2 , 2 1, 5
进入 在位者 打击 (0,0) 不打击 (2,2)
(1,5)
第6讲:演化博弈论简介
采用A表示竞争者,B表示在位者
打击 A 进入 不进 0 ,0 1 ,5 B 不打击 2 , 2 1, 5
则复制动态方程F(x):
d x x 1 x x a c 1 x b d Fx xU U 1 d t
当F(x) =0时,
复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)

演化博弈论

演化博弈论

演化博弈论演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想,不再将人模型化为超级理性的博弈方,认为人类通常是通过试错的方法达到博弈均衡的,与生物演化具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。

在理论应符合现实意义上,该理论对于生物学以及各种社会科学尤其是经济学,均大有用场。

演化博弈理论最早源于Fisher,Hamilton,Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析,他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。

但直到Smith andPrice(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后,才标志着演化博弈理论的正式诞生。

生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic),这是演化博弈理论的又一次突破性发展。

模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念,它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程,ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。

编辑本段主要应用领域演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科,是证券投资研究的一个具有生命力和丰富内涵的新领域。

与现代金融学的“理性人”、“有效市场”相关假设不同,演化证券学重视对“生物本能”和“竞争与适应”的研究,强调人性和市场环境在股市演化中的重要地位,是揭示股市生存法则最有潜力的前沿科学。

其开山之作《股市真面目》颠覆了股市运行机理的传统理论,可称为达尔文式的范式革命。

演化博弈论简介

演化博弈论简介

演化博弈论简介丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。

他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。

传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。

正因为如此,这些新理论才显示出强大的生命力,获得广泛运用。

我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。

先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。

我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。

从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。

我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。

我这里用演化,避免用演进,可以减少误解。

演化理论中有两条最重要的机制。

一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。

在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。

我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。

我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。

严复说物竞天择,就是这个意思。

另一种机制叫突变机制(mutant),这保证了种群的变化。

如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。

演化博弈论简介

演化博弈论简介
处所得到的收益大于两者冲突导致的损失)
dx/dt
0
ESS: x*=1
1
x
0
1
x
ESS: x*=1
当c≤v时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因
在于当一方忍让时,另一方可获得更多收益。
这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。
(四)蛙鸣博弈的复制动态和ESS
则: dx x2 x3
dx dt

x UY
U

dt
当x=0时,稳定;
复制动态方程 当x>0时,最终稳定于x*=1
dx/dt
dx x2 x3
dt
甲Y
N
第6讲:演化博弈论简介

Y
N
1,1
0 ,0
0, 0
0,0
0
1x
图1 签协议博弈的复制动态相位图
x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
1-m,m-z
0 ,0
② 若(m-z)/(1-P) <0,即z>m
第6讲:演化博弈论简介
F

x

dx dt

x
1
x
m

z


1

P

x
③ 若(m-z)/(1-P) >1,即m-z>1-P
dx/dt
dx/dt
0
1
x
0
1
x
ESS: x*=0
ESS: x*=1
显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫”。 当“鸣叫”的收益大于群体鸣叫而个别雄蛙“搭便车”的收益时,所有雄蛙都将鸣

演化博弈论简介

演化博弈论简介

演化博弈论简介丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。

他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。

传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。

正因为如此,这些新理论才显示出强大的生命力,获得广泛运用。

我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。

先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。

我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。

从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。

我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。

我这里用演化,避免用演进,可以减少误解。

演化理论中有两条最重要的机制。

一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。

在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。

我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。

我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。

严复说物竞天择,就是这个意思。

另一种机制叫突变机制(mutant),这保证了种群的变化。

如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。

演化博弈论

演化博弈论

演化博弈论演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想,不再将人模型化为超级理性的博弈方,认为人类通常是通过试错的方法达到博弈均衡的,与生物演化具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。

在理论应符合现实意义上,该理论对于生物学以及各种社会科学尤其是经济学,均大有用场。

演化博弈理论最早源于Fisher,Hamilton,Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析,他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。

但直到Smith andPrice(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后,才标志着演化博弈理论的正式诞生。

生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic),这是演化博弈理论的又一次突破性发展。

模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念,它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程,ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。

编辑本段主要应用领域演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科,是证券投资研究的一个具有生命力和丰富内涵的新领域。

与现代金融学的“理性人”、“有效市场”相关假设不同,演化证券学重视对“生物本能”和“竞争与适应”的研究,强调人性和市场环境在股市演化中的重要地位,是揭示股市生存法则最有潜力的前沿科学。

其开山之作《股市真面目》颠覆了股市运行机理的传统理论,可称为达尔文式的范式革命。

演化博弈论简介

演化博弈论简介

演化博弈论简介演化博弈论简介说明:这篇东西是我上周六在浙⼤思想讨论班上做演讲的讲稿和主要内容。

讲完以后,叶航⽼师提出了很多宝贵的意见。

我也正好乘这机会把没有讲或者没有讲清楚的东西梳理了⼀下。

整理过程中还发现了了很多问题,请⼤家批评。

丁丁1994年有⼀篇重要的⽂章,介绍发展经济学的最新进展。

他⽐较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内⽣增长理论,哈耶克的“⾃发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。

传统新古典经济学是静态的,重视均衡点,但很难进⾏历史的研究。

正因为如此,这些新理论才显⽰出强⼤的⽣命⼒,获得⼴泛运⽤。

我们这⾥讲演化博弈(evolutionary game theory),它显然有2条理论来源,⼀是演化理论,⼀是博弈论。

先来看演化理论,我⾸先要纠正⼀个常见的误解,即演化均衡是帕累托最优的,或者说最⼤化整个社群的福利。

我们要注意到,演化均衡不等于⼀般均衡,等会我会给出⼀些严格的定义。

从福利经济学第⼀定理可以得知,⼀般均衡必然是帕累托最优的,即所谓的看不见的⼿的含义,但是演化均衡并没有类似的定理。

我们⽤常识来分析,如果演化均衡最⼤化社群的福利,那么什么是社群的福利呢?是个体的总数最⼤吗,是个体的多样性最多吗,抑或是个体预期存活概率最⼤?即使我们能为适应性(fitness)找出合适的测量⽅法,我们也⽆法保证演化是朝向个体适应性最⼤的⽅向演化。

我这⾥⽤演化,避免⽤演进,可以减少误解。

演化理论中有两条最重要的机制。

⼀个叫⾃然选择,即不是每种⽣物都有相同的概率在下⼀期存活。

在这个世界上,有些⽣物个体(或者⼈)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。

我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。

我特别要强调⾃然选择,对于我们来说是被选择(be selected),我们能决定我们的⾏为和策略,但不能决定我们是否被选择,那是上帝的事情。

博弈论与信息经济学-5.演化博弈

博弈论与信息经济学-5.演化博弈

演化稳定策略是 什么呢?
C C D 2,2 3,0
D 0,3 1,1
假定一个群体由背叛者构成,由于基因变异出现 了比例为ε的合作者。 此时背叛者的收益为:(1-ε)*1+ε*3=1+2ε 合作者的收益为:(1-ε)*0+ε*2=2ε 由于合作者的收益低于背叛者的收益,合作者会 逐渐消亡,因此背叛是一个演化稳定策略。
路径依赖与制度变革
对组织而言,一种制度形成后,会形成某 个既得利益集团,他们对现在的制度有强 烈的要求,只有巩固和强化现有制度才能 保障他们继续获得利益,哪怕新制度对全 局更有效率。对个人而言,一旦人们做出 选择以后会不断地投入精力、金钱及各种 物资,如果哪天发现自己选择的道路不合 适也不会轻易改变,因为这样会使得自己 在前期的巨大投入变得一文不值,这在经 济学上叫“沉没成本”。沉没成本是路径 依赖的主要原因。
路径依赖的例子
有人将5只猴子放在一只笼子里,并在笼子中间吊上一串香蕉,只要 有猴子伸手去拿香蕉,就用高压水教训所有的猴子,直到没有一只猴 子再敢动手。 然后用一只新猴子替换出笼子里的一只猴子,新来的猴子不知这 里的“规矩”,竟又伸出上肢去拿香蕉,结果触怒了原来笼子里的4 只猴子,于是它们代替人执行惩罚任务,把新来的猴子暴打一顿,直 到它服从这里的“规矩”为止。 试验人员如此不断地将最初经历过高压水惩戒的猴子换出来,最 后笼子里的猴子全是新的,但没有一只猴子再敢去碰香蕉。 起初,猴子怕受到“株连”,不允许其他猴子去碰香蕉,这是合 理的。 但后来人和高压水都不再介入,而新来的猴子却固守着“不许拿 香蕉”的制度不变,这就是路径依赖的自我强化效应。
例3:找出ESS
A A B 1,1 1,1 B 1,1 0,0
U(A,A)=U(B,A) U(A,B)>U(B,B) 因此A是演化稳10 0,0

第三章 第五节 演化博弈模型

第三章 第五节 演化博弈模型
0 1
1
y
y
(a) x=0
(b) x≠0 ESS: y*=0
y*∈[0,1]
打击 A 进入 不进 0 ,0 1 ,5
B
不打击 2 , 2 1, 5
A:“进入”的群体比例为x “不进”的群体比例为1-x B:“打击”的群体比例为y “不打击”的群体比例为1-y
乙 鹰 甲
(v-c)/2 鹰 (v-c)/2,
鸽 v ,0 v/2 ,v/2

0 ,v
F x
dx v vc x 1 x x 1 x dt 2 2
② 假设v=8,c=8(表示种群间和平共
处所得到的收益等于两者冲突导致的损失)
dx/dt
(v-c)/2 鹰 (v-c)/2,
鸽 v ,0 v/2 ,v/2

0 ,v
F x
dx v vc x 1 x x 1 x dt 2 2
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
dx/dt
1/6 0 1
F x
dx x a c 1 x b d x U1 U x 1 x dt
当F(x) =0时,
复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)
稳定性定理
F(x)=dx/dt,t↑,则x↑
x*=0和x*=1为ESS
0 11/61 1
x
这意味着: 当初始x<11/61时,ESS为x*=0;
图2 协调博弈的复制动态相位图
当初始x>11/61时,ESS 为x*=1.

演化博弈理论

演化博弈理论

演化和博弈理论Larry Samuelson1朱宪辰译博弈论由John yon Neumann and Oskar Morgenstern (1944)提出,经John Nash (1950)加入纳什均衡(Nash equilibrium)概念而完善,被二十世纪80年代的策略革命推广之后,非合作博弈论(noncooperative game theory)在经济研究中已经成为一种标准工具。

这个过程当中,人们越来越以博弈观点为基础分析问题。

主要关注两个问题:我们能否期望纳什均衡是这样的:即我们能否预期博弈双方的选择都是在明确对方的选择下做出的最优反应?如果结论是肯定的,在多种博弈中出现的多重纳什均衡(multiple Nash equilibria),我们能预期哪一种呢?二十世纪80年代,研究博弈论的学者们忙于讨论上述问题,并建立了模型。

基于这样的假定:行为人是完全理性的,并且基于相同理性都有共同的知识水平(common knowledge)。

然而,进入二十世纪90年代,讨论的重点由以理性为基础的模型转到以演化论为基础的模型上来。

原因之一是以理性为基础的模型存在局限性。

这些模型可以容易地推动纳什均衡的一个必要条件:博弈双方会相信对方的行为并根据它们做出最佳反应;但是不能证明另一个必要条件,即他们相信的都正确。

同时,纳什均衡之中的理性选择标准产生可选择的精炼纳什均衡增强概念,意图排除具有充分委付的不真实的纳什均衡以迅速放弃从中选择一个方面作为正确的想法。

原因之二是由于博弈所代表的潜在观念有了变化。

一旦用博弈论解释描述理想相互作用状态时,其中完全理性假定就显得十分自然了。

目前像其它经济模型一样,更加普遍地用一个近似的类似于真实的模型来解释博弈游戏,在此完全理性看起来也不是那么恰当了。

演化博弈论涵盖的模型很广泛。

共同主题是在一个动态过程中描述博弈者如何在一个游戏的重复较量过程中调整他们的行为以重新适应。

第三章 第五节 演化博弈模型

第三章 第五节 演化博弈模型
第五节 演化博弈模型
一、演化博弈思想
传统博弈理论的两个苛刻假设: (1)完全理性(2)完全信息 与传统博弈理论不同,演化博弈理论并不要求参与 人是完全理性的,也不要求完全信息的条件。 演化博弈论(Evolutionary Game Theory)把博弈 理论分析和动态演化过程分析结合起来的一种理论。
(一) 市场阻入博弈
竞争者
有两个群体:竞争者和在位者
不进入
打击 竞 进入 争 者 不进 0 ,0 1 ,5 在位者 不打击 2 , 2 1, 5
进入 在位者 打击 (0,0) 不打击 (2,2)
(1,5)
采用A表示竞争者,B表示在位者
打击 A 进入 不进 0 ,0 1 ,5 B 不打击 2 , 2 1, 5
F x
dx x 1 x x a c 1 x b d dt v vc x 1 x x 1 x 2 2
当F(x) =0时,x*=0,x*=1,x*=v/c为稳定状态
乙 鹰 甲
x
(二)一般两人对称博弈
甲 S1 S2
乙 S1 a,a c, b S2 b ,c d,d
群体中采用S1的比例为x,S2的比例为1-x,对于甲
U1 x a 1 x b
U2 x c 1 x d
U x U1 1 x U2
则复制动态方程F(x):
设:群体比例的动态变化速度为
dx x U Y U dt
dx 则: x 2 x3 dt
当x=0时,稳定;
复制动态方程
当x>0时,最终稳定于x*=1
dx/dt
dx x 2 x3 dt

第6讲:演化博弈论简介

第6讲:演化博弈论简介

第6讲:演化博弈论简介
(二)一般两人对称博弈

S1
S2
甲 S1 a , a S2 c, b

b ,c d,d
群体中采用S1的比例为x,S2的比例为1-x
U1 x a 1 x b
U2 x c 1 x d
U x U1 1 x U2
则复制动态方程F(x):
学习速度较慢的成员组成的大群体中的反复博弈,可以采用
“复制动态”。
一、最优反应动态
(一)协调博弈
甲A B

A
B
50,50
49,0
0,49
60,60
第6讲:演化博弈论简介
NE: (A,A) , (B,B) ,(11/61,11/61)
其中,(B,B)为pareto最优,但(A,A)为风险上策均衡
第6讲:演化博弈论简介

1
x
v 2

① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
dx/dt
1/6 0
1x
F ‘(0) >0, F’(1)>0,而 F‘(1/6)<0,
A
B
B
BA
A
B
B
B
B
第6讲:演化博弈论简介
A
B
B
BA
A

A
A
A
A
A
A
A
A
A
2、当初始情况为2连A时
A
A
A
BA
AA
A A
B
B
A
B
A
A
3、当初始情况为3连A时

演化博弈论简介-萧敢

演化博弈论简介-萧敢

演化博弈论简介说明:这篇东西是我上周六在浙大思想讨论班上做演讲的讲稿和主要内容。

讲完以后,叶航老师提出了很多宝贵的意见。

我也正好乘这机会把没有讲或者没有讲清楚的东西梳理了一下。

整理过程中还发现了了很多问题,请大家批评。

丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。

他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。

传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。

正因为如此,这些新理论才显示出强大的生命力,获得广泛运用。

我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。

先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。

我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。

从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。

我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。

我这里用演化,避免用演进,可以减少误解。

演化理论中有两条最重要的机制。

一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。

在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。

我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。

我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

演化博弈论简介说明:这篇东西是我上周六在浙大思想讨论班上做演讲的讲稿和主要内容。

讲完以后,叶航老师提出了很多宝贵的意见。

我也正好乘这机会把没有讲或者没有讲清楚的东西梳理了一下。

整理过程中还发现了了很多问题,请大家批评。

丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。

他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。

传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。

正因为如此,这些新理论才显示出强大的生命力,获得广泛运用。

我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。

先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。

我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。

从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。

我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。

我这里用演化,避免用演进,可以减少误解。

演化理论中有两条最重要的机制。

一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。

在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。

我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。

我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。

严复说物竞天择,就是这个意思。

另一种机制叫突变机制(mutant),这保证了种群的变化。

如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。

对于突变机制,我也要强调它是没有方向性的,可能会提高个体的适应性,但更有可能降低个体的适应性。

突变同样是上帝的选择,微观个体无能为力。

接下来,我们就可以回顾演化经济学的思想史了。

我在幻灯片里给出了一长串人的名字,他们都可以看作是具有演化思想的经济学家,都是演化经济学的先驱。

斯密,马克思,门格尔,马歇尔,凡勃仑,熊彼特,直到哈耶克。

我尤其要强调雄彼特的贡献,他研究经济发展和经济周期,提出了著名的“创新”思想。

这带有明显的动态的特征,并影响了随后的尼尔森和温特。

安德森把熊彼特以后,尼尔森-温特以前这段时间(1930-1970)比作黑暗时代(当然这仅指演化经济学而言,对于新古典经济学无疑是黄金时代呢),这段时间很少有人关心动态的演化的经济学理论。

(阿尔奇安也许是个例外)从70年代初开始,尼尔森和温特提出了一系列演化经济学模型。

同时,梅纳德.史密斯在1973年提出了著名的演化稳定策略,奠定了演化经济学的基础。

从此,演化经济学可以算真正诞生了。

尼尔森自称是熊彼特的忠实信徒,而温特是达尔文进化论的信徒,他们的演化理论非常鲜明地具有这些特征。

计算机能够很好地模拟生态学上物种数量的演化,因而也被广泛地用于经济模型的演化模拟。

尼尔森-温特的多数模型都很容易被改编成计算机模型,用现实数据进行实证检验。

大家认为他们的模型在产业组织(IO)的应用比较成功,我就以这方面的模型为例子。

尼尔森-温特给出了个体在演化过程中的几个重要特征,我把他们列在下面1个体永远不会完美信息(局部知识或吉尔兹的地方性知识,而不是全局性知识)2个体行为受制度(正式和非正式),规范,习俗,意识系统等条件约束3个体(或者企业)可以模仿对手4开发和模仿(也就是R&D)既有“积聚效应”(可以参考Becker关于“上瘾”以及孩子教育的论文)和路径依赖的效果,又与原创性科学研究相关。

5个体竞争的结果往往是非均衡的-即败者出局(被淘汰)6个体的特征是非决定性的-这里他们是在反驳“决定论”的批评。

同时,演进的结果通常是不可逆的。

7主流经济学喜欢讨论“潜在的”均衡(也就是往往达不到的,但理论上可能的均衡),而对非均衡状态的分析要远比那些均衡来的重要。

我们重点讲其中的“创新”部分。

熊彼特的创新,到了尼尔森和温特那里,运用到对firm 的研究,被偷换成了R&D(更具体一些,是innovation/imitation)。

创新当然不完全等同于R&D,但这样做是必要的。

我们可以参考Becker的研究方法,我们脚站在工具里,把能够工具化的变量尽量工具化,也许我们只抓住了变量的很次要一部分,我们只迈出了一小步,但对这一小步我们有足够的自信心。

回到R&D,我下面主要依据他们1982年那本著名的教科书Evolutionary theory of economic change。

我们根据以下知识列出计算方程1 资本生产率是由企业的专门化知识决定的2R&D的产物是innovation和imitation。

3R&D密度(就是R&D占总资金比例,例如微软好像是5%)由一固定规则决定。

4原创能否实现是一个柏松过程。

再加上一些常识,就能写出联立方程组,用计算机来算。

5创新是不连续的,有跳跃,有“高原现象”。

接着我们就可以批评他们的工作了。

先是一个小问题,就是如何区分原创和模仿,两者之间的关系是怎样的(互补或互替或其他),他们也做了回应。

接着是一个大问题,就是他们把R&D看作在一个搜索空间(search space)里的搜索过程。

让我先打个岔,说说经典博弈论里的共同知识(common knowledge)的事情。

耶路撒冷学派的领袖奥曼(Aumann)说,博弈论的基础是一团乱麻。

要理出一根阿里阿德涅线,我们要找到一个线头,这就是共同知识。

共同知识就是,我知道你的策略,你知道我的策略,我知道你知道我的策略,你知道我知道你的策略...宾莫尔(Binmore)等人试图用一个自明之理来取代这个共同知识。

有些事情,只要发生了,人人都应该知道(例如911事件,现在的美伊战争等)。

但他们在公理化这个自明之理时,又遇到致命的阻碍。

这就是所谓的第五公理和第六公理。

第五公理说,我知我所知。

这还算了,第六公理说,我知我所不知,这立刻遇到了哲学问题。

亚里斯多德的“愈学愈无知”的故事正好拿来反驳。

一个人如何能知道自己的策略空间,更如何能知道自己策略空间以外的空间?从语言学或者认识论的角度来看,这个公理更显得荒谬了。

博弈论大师在共同知识这个问题前的狼狈是可想而知的。

我这里只是想类比一下,R&D真的能表示成在给定的搜索空间里搜索吗?从实践的角度,我们只能处理一维和二维的情况,丁丁说的“一切人在一切方向上的创新”,这就超出我们能够处理的范围了。

我们能够在一个时点讨论多个维度(一般均衡),我们也能在时间连续情形下讨论一个维度(演化稳定-这就是尼尔森和温特他们的工作),但我们无法讨论时间连续下多个维度的情况,这超出了理性的范围,但这正是创新的特点。

说了那么多,我只是想指出,他们这派的方法论是排除个人的理性选择的。

所以他们的模型可以被很好地运用到产业组织的研究中。

他们的路子跟泰勒尔(Tirole ),美国的博弈论四人帮等的路子很不同。

传统的经验型的产业组织研究(张伯伦,罗宾逊他们的研究,到后来贝恩那里所谓的SCP 范式)已经彻底被博弈论征服了。

而尼尔森,温特他们用演进理论借尸还魂,恢复产业组织的经验研究(很显然,计算机模拟的结果可以跟实证数据对比)是很成功的。

其中最微妙的与人的选择关系最密切的R&D 活动也被巧妙的模型化了。

(但我们看到,把多维的创新压缩到1,2维的搜索空间里的搜索,这里面问题很大)接着,我们可以讨论一些重要的概念了,主要是一些博弈论的概念。

当然,其中最重要的概念就是演化稳定策略(ESS )。

我想强调,ESS 是一种策略,而不是均衡。

策略在前,均衡在后。

由策略看演化,是由前往后看,由均衡看演化,是由后往前看。

我们先给出一个严格的定义,在两人对称博弈情况下(我们下面主要讨论对称的情况,不对称通常可以转换成对称的情形),存在策略σ,σσ'≠,()(0,1)εσ'∈,使得 (,(1))(,(1))u u σεσεσσεσεσ'''+->+-,那么σ就被称为演化稳定策略。

由上面的定义可以看到,博弈双方都会采用这最优的演化稳定策略。

我们有两条性质如下 性质1:演化稳定策略必然是纳什均衡。

性质2:只有严格的(即唯一的)纳什均衡才能由演化稳定策略得出。

下面我介绍一个通俗的例子,表明演化稳定策略往往会不存在,所以我们有时不得不转向均衡的分析。

这个例子很简单,叫“石头-剪刀-布”博弈。

石头胜剪刀,剪刀胜布,布胜石头,当双方的策略相同时,收益都为x.很显然,这个博弈有一个混合策略纳什均衡,即用1/3的概率分别选择出石头-剪刀-布{1/3,1/3,1/3},或者说随机选择,这个策略的期望收益是13X 。

假设这个博弈存在演化稳定策略 ,那么双方都采取这个策略,收益显然为X.由定义得,既然策略是ESS ,那么必然有X>13X ,我们知道这只有在X>0时才满足。

当X<0时,这个博弈不存在演化稳定策略,但显然它是存在纳什均衡的,所以我们需要另一种分析方法,叫演化稳定均衡(EES )我把定义写在下面X 是个非空纳什均衡策略闭集合,存在(0,1)ε'∈,X σ∈,((1))BR σεσεσ''∈-+,0εε'<<,(1)X εσεσ'-+∈,则X 是演化稳定均衡。

我们可以证明,每个对称博弈都存在演化稳定均衡,每个演化稳定均衡是纳什均衡集的一个元素。

这样,我们就有了几个相关的工具。

一个是演化稳定策略,由这个策略可以推导最后的均衡,但这个占优策略未必存在。

一个是演化稳定均衡,它一定是存在的,但只是最后的结果。

一个是纳什均衡,但我们知道纳什均衡往往不唯一。

接下去,我们来讨论演化策略的稳定性。

我们有时候会发现ESS 虽然是占优的,但不是稳定的-这很重要,这导致我们必须引入一种“突变”(mutant )机制。

我下面举一个例子,是Robson(1990)年提出的,被称为“秘密握手”博弈。

有支付矩阵如下 (0.1)显然,这个博弈有2个纳什均衡,分别是(d,d)和(m,m),(m,m)帕累托占优于(d,d)。

因为(d,d)与(d,m),(m,d)无差异,而(m,m)优于(d,m)和(m,d),因此,只有(m,m)是演化稳定策略。

相关文档
最新文档