演化博弈论谢识予
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈方策略类型比例动态变化是有限理性博弈分 析的核心,其关键是动态变化的速度
以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
dx dt
x(u y
u)
x(x
x2)
x2 (1
x)
x2
x3
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
进化稳定策略的检验
比例的博弈方偏离“同 意”
策略选择了“不同意”
uy (1 )1 0 1 un (1 ) 0 0 0 u (1 )u y un (1 )2
uy 1 0
x 1是进化稳定策略ESS
比例的博弈方偏离“不 同意”
策略选择了“同意”
uy (1 ) 0 1 un (1 ) 0 0 0 u (1 ) un uy 2
其中abcd可以是任何得益,根据问题设定。
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
dx dt
x(u1
u)
x[u1
xu1
(1
全理性博弈的均衡策略 有限理性意味着均衡是不断调整和改进而不是一次
性选择的结果,而且即使到达了均衡也可能再次偏 离 有限理性博弈方会在博弈过程中学习博弈通过试错 寻找较好的策略
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群体随 机配对的反复博弈
最优反应动态模拟:初次博弈1个A
A
B
A
B
BA
AB
B
B
B
B
B
A
A
A
B
A
A
A
A
A
A
A
A
初次博弈相邻2个A
B
A
A
B
AB
AA
A
B
A
A
A
A
A
初次博弈相连3个A
A
B
A
B
A
A
A
A
A
A
5.2.2 古诺调整过程
古诺模型反应函数 最优反应动态模拟
q1
3
q2 2
q2
3
q1 2
1
2
3
4………
博弈方1 2.5 1.5 2.125 1.875
x)u2 ]
x(1 x)(u u)
x(1 x)[ x(a c) (1 x)(b d )]
复制动态 相位图
x
1
x
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
dx F(x) x(1 x)[x(a c) (1 x)(b d)] dt
进化稳定策略(ESS)
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型
5.2.2 古诺调整过程
5.2.1 协调博弈的有限博弈方快速学习模型
模型:
博弈方2
A
B
A 50,50 49,0 B 0,49 60,60
协调博弈
1
2 5
4
3
反应、策略调整规则推导
采用A的得益:xi (t) 50 [2 xi (t)] 49 采用B的得益:xi (t) 0 [2 xi (t)] 60 当xi (t) 22 / 61时,采用A;当xi (t) 22 / 61时,采用B
1
Z
蛙鸣博弈复制动态方程和不动点
x——鸣叫雄蛙比例 复制动态方程
dx x(1 x)[x(P z 1 m) (1 x)(m z)] dt
可能的不动点: x*=0 x*=1 x*=(m-z)/(1-p)
蛙鸣博弈复制动态相位图
dx/dt
dx/dt
பைடு நூலகம்
1
x
(m-z)/(1-P)<0
dx/dt
(m-z)/(1-P)
博弈方2 3
1.75 2.25 1.9375
收敛条件 | dr1 || dr2 | 1
dq2 dq1
问题:两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性: 两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定策略 5.3.3 协调博弈的复制动态和进化稳定博弈 5.3.4 鹰鸽博弈的复制动态和进化稳定策略 5.3.5 蛙鸣博弈的复制动态和进化稳定策略
本章分四节
5.1有限理性博弈及其分析框架 5.2最优反应动态 5.3复制动态和进化稳定性:
两人对称博弈 5.4复制动态和进化稳定性:
两人非对称博弈
5.1 有限理性博弈及其分析框架
5.1.1 有限理性及其对博弈的影响 5.1.2 有限理性博弈分析框架
5.1.1 有限理性及其对博弈的影响
有限理性博弈方:不满足完全理性假设的博弈方 有限理性意味着一般至少有部分博弈方不会采用完
dt
2
2
x(1 x)(1 6x)
dx/dt 1/6
1
x
5.3.5 蛙鸣博弈的复制动态 和进化稳定策略
动物进化竞争是生物多样性、复杂性的基本机制
蛙鸣博弈:
雄蛙2
鸣叫
不鸣
鸣叫 P-z, P-z m-z, 1-m 不鸣 1-m, m-z 0, 0
蛙鸣博弈不同均衡的条件
M 1
鸣叫 混合策略
不鸣叫
m=1-P+z m=z
uy 0 un
x 0不是进化稳定策略
5.3.2一般两人对称博弈复制动态 和进化稳定策略
一般模型
策略1 策略2
博弈方2 策略1 策略2 a, a b, c c, b d, d
一般2X2对称博弈
进化博弈设定是在一个大群体的成员中进行随机配对的反复博 弈。
基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置 是无差异的。
x(1 x)(61x 11)
复制动态进化博弈的结果 常常取决与带有很大偶然 性的初始状态。
1
x
5.3.4 鹰鸽博弈的复制动态 和进化稳定策略
博弈方2
鹰
鸽
鹰
vc , vc
2
2
v, 0
鸽
0, v
v 2
,v
2
鹰鸽博弈
复制动态方程和相位图
dx F(x) x(1 x)[ x(v c) (1 x)v]
1x
0<(m-z)/(1-P)<1
(m-z)/(1-P)>1
1x
5.4 复制动态和进化稳定性: 两人非对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略
签协议博弈:
同意 不同意
博弈方2 同意 不同意
1,1 0,0 0,0 0,0
假设群体中采用“同意”比 例x
则 得不益同为策:略期望得益和uy平均x 1 (1 x) 0 x un x 0 (1 x) 0 0 u x u y(1 x) un x2