博弈论(第五章)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
dx/dt
稳定性定理:F(x)=0与横轴相交 且交点处切线斜率为负的点为相 应博弈复制动态的进化稳定策略。
0
x*
1
x
2 × 2对称博弈复制动态方程相位图
谢富纪 2008年4月
23
3.复制动态和进化稳定性:两人对称博弈
协调博弈的复制动态和进化稳定策略
策略1 博 弈 策略1 方 1 策略2 博弈方2 策略2
谢富纪 2008年4月
31
3.复制动态和进化稳定性:两人对称博弈
蛙鸣博弈的复制动态和进化稳定策略
雄蛙2 鸣叫 不鸣
雄 鸣叫 蛙 1 不鸣
P -z,P-z
m-z,1-m
1-m,m-z
0,0
谢富纪 2008年4月
32
3.复制动态和进化稳定性:两人对称博弈
m 1
鸣叫 混合策略 m=1-P+z m =z
●在有限理性博弈中具有真正稳定性和较强预测能力的均 衡,必须能通过博弈方模仿、学习的调整过程达到, 具有能经受错误偏离的干扰,在受到少量干扰后仍能 “恢复”的稳健的均衡。
谢富纪 2008年4月 3
1.有限理性博弈
●有限理性博弈的有效分析框架是有限理性博弈方构成 的,一定规模的特定群体内成员的某种反复博弈, 也可以是大量博弈方组成的群体中成员之间随机配 对的反复博弈,相当于现实经济中对象或伙伴不固 定的,多个或大量个体之间的较长期经济关系。 ●在这样的分析框架中,博弈分析的核心不是博弈方的 最优策略选择(这是大多数经济分析和决策分析的 核心),而是有限理性博弈方组成群体成员的策略 调整过程、趋势和稳定性。 ●稳定性指群体成员采用特定策略的比例不变,而非某 个博弈方的策略不变。
●所有博弈方都采用A的稳定状态具有稳健性,而采用B并 不真正具有稳健性。
●具有在博弈方的动态策略调整中会达到,且又对少数偏离 的扰动有稳健性的稳定状态,在进化博弈论中称为“进 化稳定策略”。因此A是一个进化稳定策略,B不是。
谢富纪 2008年4月 14
2.最优反应动态
古诺调整 两个寡头的发应函数分别是: q1=3-q2/2 q2=3-q1/2
●有限理性:完全理性中的任何一方面不完美就属于有限 理性。
●完全理性博弈:博弈方都是完全理性的博弈。
●有限理性博弈:存在有限理性博弈方的博弈。
谢富纪 2008年4月
2
1.有限理性博弈
●完全理性是唯一的,但有限理性却有多种情况和层次。
●有限理性意味着博弈方往往不会一开始就找到最优策略, 会在博弈过程中学习博弈,必须通过试错寻找较好的 策略;也意味着一般至少有部分博弈方不会采用完全 理性博弈的均衡策略,意味着均衡是不断调整和改进 而不是一次性选择的结果,而且即使达到了均衡也可 能再次偏离。
如果开始一方生产2.5,另一方生产3,则调整过程如下:
2.5 3 1.5 1.75 2.125 2.25 1.875 1.937 5
…… ……
2 2
谢富纪 2008年4月
15
3.复制动态和进化稳定性:两人对称博弈
学习较慢的博弈方组成的大群体成员的随机配对
反复博弈。有限理性博弈方组成群体成员的策
略调整过程、趋势和稳定性。 所有博弈方都相似,学习很慢,所进行的博弈是 博弈位置无差异的两人对称博弈。 学习较慢意味着向优势策略转变是一个渐进的过
谢富纪 2008年4月
8
2.最优反应动态
1
5
2
4
3
谢富纪 2008年4月
9
2.最优反应动态
初次博弈的部分可能情况
B
A
A
B
A
A
B
A来自百度文库
B
B
A
B
A
A
A
在与相邻博弈方反复进行该博弈的过程中,是否会出现策略 的收敛,是否会趋向于一个唯一的稳定状态。
谢富纪 2008年4月
10
2.最优反应动态
A B B A B A B A B
dx x ( 1 x )[ x ( a c ) ( 1 x )( b d )] F ( x ) dt
该复制动态方程最多有三个稳定状态,分别为:
b d x 0 , x 1 和 x a b c d
* * *
谢富纪 2008年4月
22
3.复制动态和进化稳定性:两人对称博弈
谢富纪 2008年4月
5
2.最优反应动态
相邻博弈方相互博弈的快速学习动态调整模型,讨论具 有快速学习能力的有限理性博弈方的动态策略调整和 稳定性问题 。
协调博弈的有限博弈方快速学习模型: 博弈方2 A B
博A 弈 方B 1
50,50
49,0
0,49
60,60
谢富纪 2008年4月
6
2.最优反应动态
谢富纪 2008年4月
34
3.复制动态和进化稳定性:两人对称博弈
dx/dt
0 (m-z)/(1-P)
1
x
蛙鸣博弈复制动态相位图(0<(m-z)/(1-P)<1)
谢富纪 2008年4月
35
3.复制动态和进化稳定性:两人对称博弈
dx/dt
0
1
x
蛙鸣博弈复制动态相位图((m-z)/(1-P)<0)
谢富纪 2008年4月
谢富纪 2008年4月
20
3.复制动态和进化稳定性:两人对称博弈
两人对称博弈的复制动态和进化稳定策略
博弈方2 策略1 策略2
博 策略1 弈 方 策略2 1
a ,a c, b
b ,c d, d
谢富纪 2008年4月
21
3.复制动态和进化稳定性:两人对称博弈
假设在该群体中,有比例为x的博弈方采用策略1, 比例为1-x的博弈方采用策略2。则复制动态方程为:
不鸣叫
0
1
z
蛙鸣博弈不同均衡的条件
谢富纪 2008年4月
33
3.复制动态和进化稳定性:两人对称博弈
复制动态方程为:
dx x ( 1 x )[ x ( P z 1 m ) ( 1 x )( m z )] dt
三个稳定状态为:
m z * * * x 0 , x 1 和 x 1 P
2.最优反应动态
●在32种可能的初次博弈情况中,只有1种是稳定于所有博 弈方采用B的状态,其余31种都会收敛采用A的状态。 这说明博弈方都采用A策略和都采用B策略是有限理性博 弈方进行上述协调博弈的稳定状态,但前一种稳定状态 显然更重要一些,因为博弈方的策略调整收敛到这种情 况的机会要大大高于后一种情况
谢富纪 2008年4月
7
2.最优反应动态
我们在有限理性的基础上来分析这个问题。假设 博弈方虽然缺乏分析交互动态关系和预见能力, 但能马上对上一阶段的博弈结果进行总结,并 立即作出相应的策略调整。 假设共有5个博弈方分别处于如图中圆周上的5个 位置(可以理解为5户居民环山而居),每户居 民都与自己的左右邻居反复博弈。
谢富纪 2008年4月 18
3.复制动态和进化稳定性:两人对称博弈
dx/dt
0
0.5
1
x
签协议博弈复制动态相位图
谢富纪 2008年4月
19
3.复制动态和进化稳定性:两人对称博弈
x*=0,x*=1是上述复制动态的两个稳定状态,其中 x*=1是对应大多数初始状态的稳定状态 。 有限理性的博弈方通过学习最终找到了本博弈比较有效 率的纳什均衡。 x*=1是进化稳定策略,而x*=0则不是。
在较大规模群体长期进化中,采取进攻型策略的博弈 方的数量最终会稳定在1/6的水平上,大多数博弈方 (5/6)会采取比较和平的策略。这意味着发生严重战 争的机会虽然存在,但可能性比较小(1/36),相互 间和平共处的可能性最大(约占25/36),比较忍让的
一方受比较霸道的一方欺负的机会居中(约占10/36)。
谢富纪 2008年4月
28
3.复制动态和进化稳定性:两人对称博弈
采用“鹰”策略博弈方比例的复制动态方程为:
取v=2,c=12,则复制动态方程为
dx x ( 1 x )( 1 6 x ) dt
dx x ( v c )( 1 x ) v x ( 1 x )[ ] dt 2 2
假设整个群体中“同意”类型的博弈方比例为x,那么 “不同意”类型博弈方的比例为1-x 。博弈方策略类 型比例动态变化是有限理性博弈分析的核心。
以采用“同意”策略类型博弈方比例为例,其动态变化 速度可以用下列动态微分方程表示: dx x ( uy u ) dt uy,un表示“同意”和“不同意”两种类型博弈方各自 的期望得益。u 表示群体成员的平均得益。
谢富纪 2008年4月
4
1.有限理性博弈
●有限理性博弈分析的关键是确定博弈方学习和策略调整的 模式或机制,以模拟博弈方的策略调整过程。 ●最优反应动态(Best-response Dynamics)针对有快 速学习能力的小群体成员的反复博弈。 ●复制动态(Replicator Dynamics)针对学习速度很慢 的成员组成的大群体随机配对的反复博弈。 ●这两种机制实际上是模拟了生物进化的两种动态机制,因 此我们把研究有限理性博弈的理论称为“进化博弈论” 或“经济学中的进化博弈论”。
程。
谢富纪 2008年4月
16
3.复制动态和进化稳定性:两人对称博弈
签协议博弈的复制动态和进化稳定策略: 博弈方2 同意 不同意 博 弈 同 意 方 1 不同意
1,1 0,0
0,0 0,0
谢富纪 2008年4月
17
3.复制动态和进化稳定性:两人对称博弈
在理性层次较低的有限理性博弈方组成的大群体成员随 机配对的分析框架内进行分析。
第五章 有限理性和进化博弈
前面分析基本是假定博弈方具有完全的理性,但对 于现实中的决策者来说往往外很难满足这一要求,
当社会经济环境和决策问题很复杂时,人们的理
性通常是有限的,因此需要讨论博弈方在有限理 性条件下的博弈问题。
谢富纪 2008年4月
1
1.有限理性博弈
●完全理性:包括(追求最大利益的)理性意识、分析推 理能力、识别判断能力、和准确行为能力等多方面的 完美要求。
36
3.复制动态和进化稳定性:两人对称博弈
dx/dt
0
1
x
蛙鸣博弈复制动态相位图((m-z)/(1-P)>1)
B B
B
B A
B
A
A
A A
A A
A A
A A
初次博弈为1A的最优反应动态
谢富纪 2008年4月 11
2.最优反应动态
B
A
A
B
A
B
A
A
A
B
A
A
A
A
A
初次博弈为相邻2A的最优反应动态
谢富纪 2008年4月 12
2.最优反应动态
A B A A
A A
B
A
A
A
初次博弈为相邻3A的最优反应动态
谢富纪 2008年4月 13
三个稳定状态为:
1 * * * x 0 ,x 1 和 x 6
只有第三个点是真正稳定的进化稳定策略。
谢富纪 2008年4月
29
3.复制动态和进化稳定性:两人对称博弈 dx/dt
0
1/6
1
x
鹰鸽博弈复制动态相位图
谢富纪 2008年4月
30
3.复制动态和进化稳定性:两人对称博弈
该博弈的现实意义:
50,50 0,49
49,0 60,60
谢富纪 2008年4月
24
3.复制动态和进化稳定性:两人对称博弈
复制动态方程为:
dx x ( 1 x )( 61 x 11 ) dt
三个稳定状态为:
11 * * * x 0 ,x 1 和 x 61
前两个点是该博弈的进化稳定策略。
谢富纪 2008年4月
25
3.复制动态和进化稳定性:两人对称博弈 dx/dt
0
11/61
1
x
协调博弈复制动态方程相位图
谢富纪 2008年4月
26
3.复制动态和进化稳定性:两人对称博弈
●通过复制动态最终实现前一种更高效率进化稳定策略 均衡的机会是11/61,实现后一种相对较差进化稳定 策略均衡的机会是50/61。这说明,有限理性博弈方 通过复制动态的学习和策略调整,也并不一定能实 现最理想的结果。同时也说明,复制动态进化博弈 的结果常常是取决于带有很大偶然性的初始状态。 事实上这也正是为什么在相似的规律作用下,事物 的形态特点会如此丰富多彩的原因。 ●比较协调博弈以复制动态为核心的进化博弈分析和以 最优反应动态为核心的进化博弈分析,结果表明, 理性程度高的博弈方并不一定能得到比理性差的博 弈方更理想的结果。
该博弈有两个纯策略纳什均衡(A,A)和(B, B)。如果是在完全理性的博弈方之间进行的博弈, 通常的预测结果应该是(B,B);如果考虑到博 弈方相互之间对对方理性的信任问题,或者对风 险的敏感性等问题,那么(A,A)可能是更好的 预测结果。在一次性博弈中,即使博弈方是高度
理性的,博弈结果也有不确定性。
谢富纪 2008年4月 27
3.复制动态和进化稳定性:两人对称博弈
鹰鸽博弈的复制动态和进化稳定策略:揭示人类社会或动 物世界发生战争或冲突的可能性及频率,国际关系中霸道 和软弱,侵略与反抗等共存的原因。
鹰
博 弈 鹰 方 1 鸽
博弈方2
鸽
(v-c)/2, (v- c)/2
v ,0 v/2,v/2
0,v
稳定性定理:F(x)=0与横轴相交 且交点处切线斜率为负的点为相 应博弈复制动态的进化稳定策略。
0
x*
1
x
2 × 2对称博弈复制动态方程相位图
谢富纪 2008年4月
23
3.复制动态和进化稳定性:两人对称博弈
协调博弈的复制动态和进化稳定策略
策略1 博 弈 策略1 方 1 策略2 博弈方2 策略2
谢富纪 2008年4月
31
3.复制动态和进化稳定性:两人对称博弈
蛙鸣博弈的复制动态和进化稳定策略
雄蛙2 鸣叫 不鸣
雄 鸣叫 蛙 1 不鸣
P -z,P-z
m-z,1-m
1-m,m-z
0,0
谢富纪 2008年4月
32
3.复制动态和进化稳定性:两人对称博弈
m 1
鸣叫 混合策略 m=1-P+z m =z
●在有限理性博弈中具有真正稳定性和较强预测能力的均 衡,必须能通过博弈方模仿、学习的调整过程达到, 具有能经受错误偏离的干扰,在受到少量干扰后仍能 “恢复”的稳健的均衡。
谢富纪 2008年4月 3
1.有限理性博弈
●有限理性博弈的有效分析框架是有限理性博弈方构成 的,一定规模的特定群体内成员的某种反复博弈, 也可以是大量博弈方组成的群体中成员之间随机配 对的反复博弈,相当于现实经济中对象或伙伴不固 定的,多个或大量个体之间的较长期经济关系。 ●在这样的分析框架中,博弈分析的核心不是博弈方的 最优策略选择(这是大多数经济分析和决策分析的 核心),而是有限理性博弈方组成群体成员的策略 调整过程、趋势和稳定性。 ●稳定性指群体成员采用特定策略的比例不变,而非某 个博弈方的策略不变。
●所有博弈方都采用A的稳定状态具有稳健性,而采用B并 不真正具有稳健性。
●具有在博弈方的动态策略调整中会达到,且又对少数偏离 的扰动有稳健性的稳定状态,在进化博弈论中称为“进 化稳定策略”。因此A是一个进化稳定策略,B不是。
谢富纪 2008年4月 14
2.最优反应动态
古诺调整 两个寡头的发应函数分别是: q1=3-q2/2 q2=3-q1/2
●有限理性:完全理性中的任何一方面不完美就属于有限 理性。
●完全理性博弈:博弈方都是完全理性的博弈。
●有限理性博弈:存在有限理性博弈方的博弈。
谢富纪 2008年4月
2
1.有限理性博弈
●完全理性是唯一的,但有限理性却有多种情况和层次。
●有限理性意味着博弈方往往不会一开始就找到最优策略, 会在博弈过程中学习博弈,必须通过试错寻找较好的 策略;也意味着一般至少有部分博弈方不会采用完全 理性博弈的均衡策略,意味着均衡是不断调整和改进 而不是一次性选择的结果,而且即使达到了均衡也可 能再次偏离。
如果开始一方生产2.5,另一方生产3,则调整过程如下:
2.5 3 1.5 1.75 2.125 2.25 1.875 1.937 5
…… ……
2 2
谢富纪 2008年4月
15
3.复制动态和进化稳定性:两人对称博弈
学习较慢的博弈方组成的大群体成员的随机配对
反复博弈。有限理性博弈方组成群体成员的策
略调整过程、趋势和稳定性。 所有博弈方都相似,学习很慢,所进行的博弈是 博弈位置无差异的两人对称博弈。 学习较慢意味着向优势策略转变是一个渐进的过
谢富纪 2008年4月
8
2.最优反应动态
1
5
2
4
3
谢富纪 2008年4月
9
2.最优反应动态
初次博弈的部分可能情况
B
A
A
B
A
A
B
A来自百度文库
B
B
A
B
A
A
A
在与相邻博弈方反复进行该博弈的过程中,是否会出现策略 的收敛,是否会趋向于一个唯一的稳定状态。
谢富纪 2008年4月
10
2.最优反应动态
A B B A B A B A B
dx x ( 1 x )[ x ( a c ) ( 1 x )( b d )] F ( x ) dt
该复制动态方程最多有三个稳定状态,分别为:
b d x 0 , x 1 和 x a b c d
* * *
谢富纪 2008年4月
22
3.复制动态和进化稳定性:两人对称博弈
谢富纪 2008年4月
5
2.最优反应动态
相邻博弈方相互博弈的快速学习动态调整模型,讨论具 有快速学习能力的有限理性博弈方的动态策略调整和 稳定性问题 。
协调博弈的有限博弈方快速学习模型: 博弈方2 A B
博A 弈 方B 1
50,50
49,0
0,49
60,60
谢富纪 2008年4月
6
2.最优反应动态
谢富纪 2008年4月
34
3.复制动态和进化稳定性:两人对称博弈
dx/dt
0 (m-z)/(1-P)
1
x
蛙鸣博弈复制动态相位图(0<(m-z)/(1-P)<1)
谢富纪 2008年4月
35
3.复制动态和进化稳定性:两人对称博弈
dx/dt
0
1
x
蛙鸣博弈复制动态相位图((m-z)/(1-P)<0)
谢富纪 2008年4月
谢富纪 2008年4月
20
3.复制动态和进化稳定性:两人对称博弈
两人对称博弈的复制动态和进化稳定策略
博弈方2 策略1 策略2
博 策略1 弈 方 策略2 1
a ,a c, b
b ,c d, d
谢富纪 2008年4月
21
3.复制动态和进化稳定性:两人对称博弈
假设在该群体中,有比例为x的博弈方采用策略1, 比例为1-x的博弈方采用策略2。则复制动态方程为:
不鸣叫
0
1
z
蛙鸣博弈不同均衡的条件
谢富纪 2008年4月
33
3.复制动态和进化稳定性:两人对称博弈
复制动态方程为:
dx x ( 1 x )[ x ( P z 1 m ) ( 1 x )( m z )] dt
三个稳定状态为:
m z * * * x 0 , x 1 和 x 1 P
2.最优反应动态
●在32种可能的初次博弈情况中,只有1种是稳定于所有博 弈方采用B的状态,其余31种都会收敛采用A的状态。 这说明博弈方都采用A策略和都采用B策略是有限理性博 弈方进行上述协调博弈的稳定状态,但前一种稳定状态 显然更重要一些,因为博弈方的策略调整收敛到这种情 况的机会要大大高于后一种情况
谢富纪 2008年4月
7
2.最优反应动态
我们在有限理性的基础上来分析这个问题。假设 博弈方虽然缺乏分析交互动态关系和预见能力, 但能马上对上一阶段的博弈结果进行总结,并 立即作出相应的策略调整。 假设共有5个博弈方分别处于如图中圆周上的5个 位置(可以理解为5户居民环山而居),每户居 民都与自己的左右邻居反复博弈。
谢富纪 2008年4月 18
3.复制动态和进化稳定性:两人对称博弈
dx/dt
0
0.5
1
x
签协议博弈复制动态相位图
谢富纪 2008年4月
19
3.复制动态和进化稳定性:两人对称博弈
x*=0,x*=1是上述复制动态的两个稳定状态,其中 x*=1是对应大多数初始状态的稳定状态 。 有限理性的博弈方通过学习最终找到了本博弈比较有效 率的纳什均衡。 x*=1是进化稳定策略,而x*=0则不是。
在较大规模群体长期进化中,采取进攻型策略的博弈 方的数量最终会稳定在1/6的水平上,大多数博弈方 (5/6)会采取比较和平的策略。这意味着发生严重战 争的机会虽然存在,但可能性比较小(1/36),相互 间和平共处的可能性最大(约占25/36),比较忍让的
一方受比较霸道的一方欺负的机会居中(约占10/36)。
谢富纪 2008年4月
28
3.复制动态和进化稳定性:两人对称博弈
采用“鹰”策略博弈方比例的复制动态方程为:
取v=2,c=12,则复制动态方程为
dx x ( 1 x )( 1 6 x ) dt
dx x ( v c )( 1 x ) v x ( 1 x )[ ] dt 2 2
假设整个群体中“同意”类型的博弈方比例为x,那么 “不同意”类型博弈方的比例为1-x 。博弈方策略类 型比例动态变化是有限理性博弈分析的核心。
以采用“同意”策略类型博弈方比例为例,其动态变化 速度可以用下列动态微分方程表示: dx x ( uy u ) dt uy,un表示“同意”和“不同意”两种类型博弈方各自 的期望得益。u 表示群体成员的平均得益。
谢富纪 2008年4月
4
1.有限理性博弈
●有限理性博弈分析的关键是确定博弈方学习和策略调整的 模式或机制,以模拟博弈方的策略调整过程。 ●最优反应动态(Best-response Dynamics)针对有快 速学习能力的小群体成员的反复博弈。 ●复制动态(Replicator Dynamics)针对学习速度很慢 的成员组成的大群体随机配对的反复博弈。 ●这两种机制实际上是模拟了生物进化的两种动态机制,因 此我们把研究有限理性博弈的理论称为“进化博弈论” 或“经济学中的进化博弈论”。
程。
谢富纪 2008年4月
16
3.复制动态和进化稳定性:两人对称博弈
签协议博弈的复制动态和进化稳定策略: 博弈方2 同意 不同意 博 弈 同 意 方 1 不同意
1,1 0,0
0,0 0,0
谢富纪 2008年4月
17
3.复制动态和进化稳定性:两人对称博弈
在理性层次较低的有限理性博弈方组成的大群体成员随 机配对的分析框架内进行分析。
第五章 有限理性和进化博弈
前面分析基本是假定博弈方具有完全的理性,但对 于现实中的决策者来说往往外很难满足这一要求,
当社会经济环境和决策问题很复杂时,人们的理
性通常是有限的,因此需要讨论博弈方在有限理 性条件下的博弈问题。
谢富纪 2008年4月
1
1.有限理性博弈
●完全理性:包括(追求最大利益的)理性意识、分析推 理能力、识别判断能力、和准确行为能力等多方面的 完美要求。
36
3.复制动态和进化稳定性:两人对称博弈
dx/dt
0
1
x
蛙鸣博弈复制动态相位图((m-z)/(1-P)>1)
B B
B
B A
B
A
A
A A
A A
A A
A A
初次博弈为1A的最优反应动态
谢富纪 2008年4月 11
2.最优反应动态
B
A
A
B
A
B
A
A
A
B
A
A
A
A
A
初次博弈为相邻2A的最优反应动态
谢富纪 2008年4月 12
2.最优反应动态
A B A A
A A
B
A
A
A
初次博弈为相邻3A的最优反应动态
谢富纪 2008年4月 13
三个稳定状态为:
1 * * * x 0 ,x 1 和 x 6
只有第三个点是真正稳定的进化稳定策略。
谢富纪 2008年4月
29
3.复制动态和进化稳定性:两人对称博弈 dx/dt
0
1/6
1
x
鹰鸽博弈复制动态相位图
谢富纪 2008年4月
30
3.复制动态和进化稳定性:两人对称博弈
该博弈的现实意义:
50,50 0,49
49,0 60,60
谢富纪 2008年4月
24
3.复制动态和进化稳定性:两人对称博弈
复制动态方程为:
dx x ( 1 x )( 61 x 11 ) dt
三个稳定状态为:
11 * * * x 0 ,x 1 和 x 61
前两个点是该博弈的进化稳定策略。
谢富纪 2008年4月
25
3.复制动态和进化稳定性:两人对称博弈 dx/dt
0
11/61
1
x
协调博弈复制动态方程相位图
谢富纪 2008年4月
26
3.复制动态和进化稳定性:两人对称博弈
●通过复制动态最终实现前一种更高效率进化稳定策略 均衡的机会是11/61,实现后一种相对较差进化稳定 策略均衡的机会是50/61。这说明,有限理性博弈方 通过复制动态的学习和策略调整,也并不一定能实 现最理想的结果。同时也说明,复制动态进化博弈 的结果常常是取决于带有很大偶然性的初始状态。 事实上这也正是为什么在相似的规律作用下,事物 的形态特点会如此丰富多彩的原因。 ●比较协调博弈以复制动态为核心的进化博弈分析和以 最优反应动态为核心的进化博弈分析,结果表明, 理性程度高的博弈方并不一定能得到比理性差的博 弈方更理想的结果。
该博弈有两个纯策略纳什均衡(A,A)和(B, B)。如果是在完全理性的博弈方之间进行的博弈, 通常的预测结果应该是(B,B);如果考虑到博 弈方相互之间对对方理性的信任问题,或者对风 险的敏感性等问题,那么(A,A)可能是更好的 预测结果。在一次性博弈中,即使博弈方是高度
理性的,博弈结果也有不确定性。
谢富纪 2008年4月 27
3.复制动态和进化稳定性:两人对称博弈
鹰鸽博弈的复制动态和进化稳定策略:揭示人类社会或动 物世界发生战争或冲突的可能性及频率,国际关系中霸道 和软弱,侵略与反抗等共存的原因。
鹰
博 弈 鹰 方 1 鸽
博弈方2
鸽
(v-c)/2, (v- c)/2
v ,0 v/2,v/2
0,v