演化博弈论 谢识予 ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(m-z)/(1-P) 1
x
(m-z)/(1-P)<0 0<(m-z)/(1-P)<1
dx/dt
1
x
(m-z)/(1-P)>1
5.4 复制动态和进化稳定性: 两人非对称博弈
5.4.1 市场阻入博弈的复制动态 和进化稳定策略 5.4.2 非对称鹰鸽博弈的进化分析
5.4.1 市场阻入博弈的复制动态和进化稳定策略
dy/dt
1 x
x=0
dy/dt
1
x
x=0
两群体复制动态的关系和稳定性
y 1
1/2
0
1
x
5.4.2 非对称鹰鸽博弈的进化分析
u1e y (1) (1 y ) 10 10 11y u1d y 0 (1 y ) 5 5 5 y u1 x u1e (1 x) u1d 5 5 x 5 y 6 xy
u1e y 0 (1 y ) 2 2(1 y ) u1n y 1 (1 y ) 1 1 u1 x u1e (1 x)u1n 2 x(1 y ) (1 x)
打击 进入
1
不进
2
不打ห้องสมุดไป่ตู้
(1,5)
u2 s x 0 (1 x) 5 5 5 x u2 n x 2 (1 x) 5 5 3x u2 y u2 s (1 y )u2 n 5 2 xy 3x
有限理性博弈方:不满足完全理性假设的博弈方 有限理性意味着一般至少有部分博弈方不会采用完 全理性博弈的均衡策略 有限理性意味着均衡是不断调整和改进而不是一次 性选择的结果,而且即使到达了均衡也可能再次偏 离 有限理性博弈方会在博弈过程中学习博弈通过试错 寻找较好的策略
5.1.2 有限理性博弈分析框架
5 3
2
协调博弈
反应、策略调整规则推导
采用A的得益:xi (t ) 50 [2 xi (t )] 49 采用B的得益:xi (t ) 0 [2 xi (t )] 60 当xi (t ) 22 / 61 时,采用A;当xi (t ) 22 / 61 时,采用B
最优反应动态模拟:初次博弈1个A
最优反应动态:有快速学习能力的小群体成员的 反复博弈 复制动态:学习速度很慢的成员组成的大群体随 机配对的反复博弈 进化稳定策略(ESS)
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型 5.2.2 古诺调整过程
5.2.1 协调博弈的有限博弈方快速学习模型
模型:
博弈方2 A B A B 50,50 0,49 49,0 60,60 4 1
x(1 x)(1 6 x)
dx/dt 1/6 1 x
5.3.5 蛙鸣博弈的复制动态 和进化稳定策略
动物进化竞争是生物多样性、复杂性的基本机制
蛙鸣博弈:
雄蛙2 鸣叫 鸣叫 不鸣 P-z, P-z 1-m, m-z 不鸣 m-z, 1-m 0, 0
蛙鸣博弈不同均衡的条件
M 1
鸣叫
混合策略 不鸣叫
复制动态分析
u1 x a (1 x ) b
复制动态的进化规 则是生物学中生物 特征进化规则
u 2 x c (1 x ) d u x u1 (1 x ) u 2
设x为采用策略1的 比例
dx x(u1 u ) x[u1 xu1 (1 x)u2 ] dt x(1 x)(u u ) x(1 x)[x(a c) (1 x)(b d )]
5.3.1 签协议博弈的复制动态和进化稳定策略
签协议博弈:
同意 不同意 博弈方2 同意 不同意 1,1 0,0 0,0 0,0
假设群体中采用“同意”比 例x
则不同策略期望得益和平均 u y x 1 (1 x) 0 得益为:
x
un x 0 (1 x) 0 0 u x u y (1 x) un x 2
第五章 有限理性和进化博弈
本章介绍有限理性基础上的进化博弈分析。 完全理性在现实中很难满足,当社会经济环境 和决策问题较复杂时,人们必须存在很大的理 性局限。有限理性对人们的决策、行为选择方 式有很大影响,有限理性基础上的博弈分析与 完全理性博弈分析也有很大区别。进化博弈分 析是有限理性博弈分析的基本框架。本章介绍 以最优反应动态和复制动态为核心,以进化稳 定策略为基本均衡概念的进化博弈分析,包括 基本方法、概念和各种经典模型等。
dx/dt
复制动态 相位图
x
1
x
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60
dx F ( x) x(1 x)[ x(a c) (1 x)( b d )] dt
x(1 x)(61x 11)
5.3.2一般两人对称博弈复制动态 和进化稳定策略
一般模型
策略1 策略2 博弈方2 策略1 策略2 a, a c, b b, c d, d
一般2X2对称博弈
进化博弈设定是在一个大群体的成员中进行随机配对的反复博 弈。 基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置 是无差异的。 其中abcd可以是任何得益,根据问题设定。
2
u y (1 ) 0 1 un (1 ) 0 0 0 u (1 ) u n u y 2
uy 1 0 x 1是进化稳定策略 ESS
u y 0 un x 0不是进化稳定策略
1
m=1-P+z m=z
Z
蛙鸣博弈复制动态方程和不动点
x——鸣叫雄蛙比例
复制动态方程
dx x(1 x)[ x( P z 1 m) (1 x)( m z )] dt
可能的不动点: x*=0 x*=1 x*=(m-z)/(1-p)
蛙鸣博弈复制动态相位图
dx/dt 1 x dx/dt
0, v2
v1 v2 , 2 2
非对称鹰鸽博弈博弈方1群体复制动态相位图
dx x[u1e u1 ] x(1 x)( 5 6 y ) dt
dx/dt 1 dx/dt
x 1
x
y<5/6
y>5/6
dx/dt x
y=5/6
1
非对称鹰鸽博弈博弈方2群体复制动态相位图
dy y[u2 e u2 ] y (1 y )(1 6 x) dt
(0,0) (2,2)
博弈方1位置博弈群体复制动态相位图
dx x[u1e u1 ] x(1 x)(1 2 y ) dt
dx/dt 1 x x dx/dt
1
y>1/2
dx/dt
y<1/2
y=1/2
1
x
博弈方2位置博弈群体复制动态相位图
dy y[u2 s u2 ] y (1 y )( 2 x) dt
最优反应动态模拟
博弈方1 博弈方2
1 2.5 3 2 1.5 1.75
1 2 收敛条件 | dr || dr | 1
dq2
dq1
问题:两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性: 两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定策略 5.3.3 协调博弈的复制动态和进化稳定博弈 5.3.4 鹰鸽博弈的复制动态和进化稳定策略 5.3.5 蛙鸣博弈的复制动态和进化稳定策略
本章分四节
5.1有限理性博弈及其分析框架 5.2最优反应动态 5.3复制动态和进化稳定性: 两人对称博弈 5.4复制动态和进化稳定性: 两人非对称博弈
5.1 有限理性博弈及其分析框架
5.1.1 有限理性及其对博弈的影响 5.1.2 有限理性博弈分析框架
5.1.1 有限理性及其对博弈的影响
dy/dt 1 y 1 y
dy/dt
x<1/6
x>1/6
dy/dt 1 y
x=1/6
两群体复制动态关系和稳定性
A
B
Y 1
5/6
C
1/6
D
1
x
博弈方策略类型比例动态变化是有限理性博弈分 析的核心,其关键是动态变化的速度 以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
dx x(u y u ) x( x x 2 ) x 2 (1 x) x 2 x 3 dt
动态微分方程的相位图
博 弈 鹰 方鸽 1
博弈方2 鹰 鸽 v c v c , v1 ,0 2 2
1 2
u2e x (5) (1 x) 2 2 7 x u2 d x 0 (1 x) 5 1 x u2 y u2e (1 y )u2 d 1 x y 6 xy
dx/dt
0 0.5
1
x
稳定状态、不动点:x*=0, x*=1
进化稳定策略的检验
比例的博弈方偏离“同 意”
策略选择了“不同意”
比例的博弈方偏离“不 同意”
策略选择了“同意”
u y (1 ) 1 0 1 un (1 ) 0 0 0 u (1 ) u y un (1 )
一般2*2对称博弈
dx/dt
复制动态进化博弈的结果 常常取决与带有很大偶然 性的初始状态。
1 x
11/16
5.3.4 鹰鸽博弈的复制动态 和进化稳定策略
博弈方2 鹰
vc 2
鸽 v, 0
v 2
鹰 鸽
, vc
2
0, v
,
v 2
鹰鸽博弈
复制动态方程和相位图
dx x(v c) (1 x)v F ( x) x(1 x)[ ] dt 2 2
A
B
A A B A B A B
B
B B
B
A B B
A
A A A A A A
A A
初次博弈相邻2个A
B
A
A A A A A A
B
B A
A
B A A
初次博弈相连3个A
A
B B A A A A
A
A A
5.2.2 古诺调整过程
古诺模型反应函数
q1 3 q2 q2 2 q 3 1 2
3 2.125 2.25 4……… 1.875 1.9375