演化博弈论谢识予 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈方策略类型比例动态变化是有限理性博弈分析的核心，其关键是动态变化的速度
以采用“同意”策略类型博弈方的比例为例，其动态变化速度可用下列微分方程反映：
dx dt
x(u y
u)
x(x
x2)
x2 (1
x)
x2
x3
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点：x*=0, x*=1
进化稳定策略的检验
比例的博弈方偏离“同意”
策略选择了“不同意”
uy (1 )1 0 1 un (1 ) 0 0 0 u (1 )u y un (1 )2
uy 1 0
x 1是进化稳定策略ESS
比例的博弈方偏离“不同意”
策略选择了“同意”
uy (1 ) 0 1 un (1 ) 0 0 0 u (1 ) un uy 2
其中abcd可以是任何得益，根据问题设定。
复制动态分析
复制动态的进化规则是生物学中生物特征进化规则设x为采用策略1的比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
dx dt
x(u1
u)
x[u1
xu1
(1
全理性博弈的均衡策略有限理性意味着均衡是不断调整和改进而不是一次
性选择的结果，而且即使到达了均衡也可能再次偏离有限理性博弈方会在博弈过程中学习博弈通过试错寻找较好的策略
5.1.2 有限理性博弈分析框架
最优反应动态：有快速学习能力的小群体成员的反复博弈
复制动态：学习速度很慢的成员组成的大群体随机配对的反复博弈
最优反应动态模拟：初次博弈1个A
A
B
A
B
BA
AB
B
B
B
B
B
A
A
A
B
A
A
A
A
A
A
A
A
初次博弈相邻2个A
B
A
A
B
AB
AA
A
B
A
A
A
A
A
初次博弈相连3个A
A
B
A
B
A
A
A
A
A
A
5.2.2 古诺调整过程
古诺模型反应函数最优反应动态模拟
q1
3
q2 2
q2
3
q1 2
1
2
3
4………
博弈方1 2.5 1.5 2.125 1.875
x)u2 ]
x(1 x)(u u)
x(1 x)[ x(a c) (1 x)(b d )]
复制动态相位图
x
1
x
5.3.3 协调博弈的复制动态和进化稳定博弈
博弈方2 策略1 策略2 策略1 50，50 49，0 策略2 0，49 60，60 一般2*2对称博弈
dx/dt
11/16
dx F(x) x(1 x)[x(a c) (1 x)(b d)] dt
进化稳定策略（ESS）
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方快速学习模型
5.2.2 古诺调整过程
5.2.1 协调博弈的有限博弈方快速学习模型
模型：
博弈方2
A
B
A 50，50 49，0 B 0，49 60，60
协调博弈
1
2 5
4
3
反应、策略调整规则推导
采用A的得益：xi (t) 50 [2 xi (t)] 49 采用B的得益：xi (t) 0 [2 xi (t)] 60 当xi (t) 22 / 61时，采用A；当xi (t) 22 / 61时，采用B
1
Z
蛙鸣博弈复制动态方程和不动点
x——鸣叫雄蛙比例复制动态方程
dx x(1 x)[x(P z 1 m) (1 x)(m z)] dt
可能的不动点： x*=0 x*=1 x*=(m-z)/(1-p)
蛙鸣博弈复制动态相位图
dx/dt
dx/dt
பைடு நூலகம்
1
x
(m-z)/(1-P)<0
dx/dt
(m-z)/(1-P)
博弈方2 3
1.75 2.25 1.9375
收敛条件 | dr1 || dr2 | 1
dq2 dq1
问题：两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性：两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定策略 5.3.3 协调博弈的复制动态和进化稳定博弈 5.3.4 鹰鸽博弈的复制动态和进化稳定策略 5.3.5 蛙鸣博弈的复制动态和进化稳定策略
本章分四节
5.1有限理性博弈及其分析框架 5.2最优反应动态 5.3复制动态和进化稳定性：
两人对称博弈 5.4复制动态和进化稳定性：
两人非对称博弈
5.1 有限理性博弈及其分析框架
5.1.1 有限理性及其对博弈的影响 5.1.2 有限理性博弈分析框架
5.1.1 有限理性及其对博弈的影响
有限理性博弈方：不满足完全理性假设的博弈方有限理性意味着一般至少有部分博弈方不会采用完
dt
2
2
x(1 x)(1 6x)
dx/dt 1/6
1
x
5.3.5 蛙鸣博弈的复制动态和进化稳定策略
动物进化竞争是生物多样性、复杂性的基本机制
蛙鸣博弈：
雄蛙2
鸣叫
不鸣
鸣叫 P-z, P-z m-z, 1-m 不鸣 1-m, m-z 0, 0
蛙鸣博弈不同均衡的条件
M 1
鸣叫混合策略
不鸣叫
m=1-P+z m=z
uy 0 un
x 0不是进化稳定策略
5.3.2一般两人对称博弈复制动态和进化稳定策略
一般模型
策略1 策略2
博弈方2 策略1 策略2 a, a b, c c, b d, d
一般2X2对称博弈
进化博弈设定是在一个大群体的成员中进行随机配对的反复博弈。
基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置是无差异的。
x(1 x)(61x 11)
复制动态进化博弈的结果常常取决与带有很大偶然性的初始状态。
1
x
5.3.4 鹰鸽博弈的复制动态和进化稳定策略
博弈方2
鹰
鸽
鹰
vc , vc
2
2
v, 0
鸽
0, v
v 2
,v
2
鹰鸽博弈
复制动态方程和相位图
dx F(x) x(1 x)[ x(v c) (1 x)v]
1x
0<(m-z)/(1-P)<1
(m-z)/(1-P)>1
1x
5.4 复制动态和进化稳定性：两人非对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略
签协议博弈：
同意不同意
博弈方2 同意不同意
1，1 0，0 0，0 0，0
假设群体中采用“同意”比例x
则得不益同为策：略期望得益和uy平均x 1 (1 x) 0 x un x 0 (1 x) 0 0 u x u y(1 x) un x2