演化博弈论-谢识予ppt

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

u1 x u1e (1 x) u1d 5 5x 5y 6xy

弈鹰
u2e x (5) (1 x) 2 2 7x
方鸽
u2d x 0 (1 x) 5 1 x
1
u2 y u2e (1 y)u2d 1 x y 6xy
博弈方2


v1 c , v2 c 22
uy 0 un
x 0不是进化稳定策略
5.3.2一般两人对称博弈复制动态 和进化稳定策略
一般模型
策略1 策略2
博弈方2 策略1 策略2 a, a b, c c, b d, d
一般2X2对称博弈
进化博弈设定是在一个大群体的成员中进行随机配对的反复博 弈。
基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置 是无差异的。
本章分四节
5.1有限理性博弈及其分析框架 5.2最优反应动态 5.3复制动态和进化稳定性:
两人对称博弈 5.4复制动态和进化稳定性:
两人非对称博弈
5.1 有限理性博弈及其分析框架
5.1.1 有限理性及其对博弈的影响 5.1.2 有限理性博弈分析框架
5.1.1 有限理性及其对博弈的影响
有限理性博弈方:不满足完全理性假设的博弈方 有限理性意味着一般至少有部分博弈方不会采用完
进化稳定策略(ESS)
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型
5.2.2 古诺调整过程
5.2.1 协调博弈的有限博弈方快速学习模型
模型:
博弈方2
A
B
A 50,50 49,0 B 0,49 60,60
协调博弈
1
2 5
4
3
反应、策略调整规则推导
采用A的得益:xi (t) 50 [2 xi (t)] 49 采用B的得益:xi (t) 0 [2 xi (t)] 60 当xi (t) 22 / 61时,采用A;当xi (t) 22 / 61时,采用B
进化稳定策略的检验
比例的博弈方偏离“同 意”
策略选择了“不同意”
uy (1 )1 0 1 un (1 ) 0 0 0 u (1 )u y un (1 )2
uy 1 0
x 1是进化稳定策略ESS
比例的博弈方偏离“不 同意”
策略选择了“同意”
uy (1 ) 0 1 un (1 ) 0 0 0 u (1 ) un uy 2
其中abcd可以是任何得益,根据问题设定。
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
dx dt
x(u1
u)
x[u1
xu1
(1
0, v2
v1,0
v1 , v2 22
非对称鹰鸽博弈博弈方1群体复制动态相位图
dx dt
x[u1e
u1 ]
x(1
x)(5
6y)
dx/dt
dx/dt
1
x
dx/dt
y>5/6
y<5/6
1x
x 1
y=5/6
非对称鹰鸽博弈博弈方2群体复制动态相位图
dy dt
y[u2e
u2
]
y(1
y)(1
6x)
dy/dt
第五章 有限理性和进化博弈
本章介绍有限理性基础上的进化博弈分析。 完全理性在现实中很难满足,当社会经济环境 和决策问题较复杂时,人们必须存在很大的理 性局限。有限理性对人们的决策、行为选择方 式有很大影响,有限理性基础上的博弈分析与 完全理性博弈分析也有很大区别。进化博弈分 析是有限理性博弈分析的基本框架。本章介绍 以最优反应动态和复制动态为核心,以进化稳 定策略为基本均衡概念的进化博弈分析,包括 基本方法、概念和各种经典模型等。
dt
2
2
x(1 x)(1 6x)
dx/dt 1/6
1
x
5.3.5 蛙鸣博弈的复制动态 和进化稳定策略
动物进化竞争是生物多样性、复杂性的基本机制
蛙鸣博弈:
雄蛙2
鸣叫
不鸣
鸣叫 P-z, P-z m-z, 1-m 不鸣 1-m, m-z 0, 0
蛙鸣博弈不同均衡的条件
M 1
鸣叫 混合策略
不鸣叫
m=1-P+z m=z
博弈方策略类型比例动态变化是有限理性博弈分 析的核心,其关键是动态变化的速度
以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
dx dt
x(u y
u)
x(x
x2)
x2 (1
x)
x2
x3
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
全理性博弈的均衡策略 有限理性意味着均衡是不断调整和改进而不是一次
性选择的结果,而且即使到达了均衡也可能再次偏 离 有限理性博弈方会在博弈过程中学习博弈通过试错 寻找较好的策略
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群体随 机配对的反复博弈
博弈方2 3
1.75 2.25 1.9375
收敛条件 | dr1 || dr2 | 1
dq2 dq1
问题:两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性: 两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定策略 5.3.3 协调博弈的复制动态和进化稳定博弈 5.3.4 鹰鸽博弈的复制动态和进化稳定策略 5.3.5 蛙鸣博弈的复制动态和进化稳定策略
1
Z
蛙鸣博弈复制动态方程和不动点
x——鸣叫雄蛙比例 复制动态方程
dx x(1 x)[x(P z 1 m) (1 x)(m z)] dt
可能的不动点: x*=0 x*=1 x*=(m-z)/(1-p)
蛙鸣博弈复制动态相位图
dx/dt
dx/dt
1
x
(m-z)/(1-P)<0
dx/dt
(m-z)/(1-P)
最优反应动态模拟:初次博弈1个A
A
B
A
B
BA
AB
B
B
B
B
B
A
A
A
B
A
A
A
A
A
A
A
A
初次博弈相邻2个A
B
A
A
B
AB
AA
A
B
A
A
A
A
A
初次博弈相连3个A
A
B
A源自文库
B
A
A
A
A
A
A
5.2.2 古诺调整过程
古诺模型反应函数 最优反应动态模拟
q1
3
q2 2
q2
3
q1 2
1
2
3
4………
博弈方1 2.5 1.5 2.125 1.875
1
进入
不进
2
(1,5)
打击
不打
u2s x 0 (1 x)5 5 5x u2n x 2 (1 x)5 5 3x u2 y u2s (1 y)u2n 5 2xy 3x
(0,0)
(2,2)
博弈方1位置博弈群体复制动态相位图
dx dt
x[u1e
u1 ]
x(1
x)(1
2y)
dx/dt
dx/dt
1
x
y>1/2
dx/dt
y<1/2
1x
x 1
y=1/2
博弈方2位置博弈群体复制动态相位图
dy dt
y[u2s
u2]
y(1
y)(2x)
dy/dt
1
x
dy/dt
x=0
x=0
1
x
两群体复制动态的关系和稳定性
y 1
1/2
0
1
x
5.4.2 非对称鹰鸽博弈的进化分析
u1e y (1) (1 y) 10 10 11y u1d y 0 (1 y) 5 5 5y
x(1 x)(61x 11)
复制动态进化博弈的结果 常常取决与带有很大偶然 性的初始状态。
1
x
5.3.4 鹰鸽博弈的复制动态 和进化稳定策略
博弈方2



vc , vc
2
2
v, 0

0, v
v 2
,v
2
鹰鸽博弈
复制动态方程和相位图
dx F(x) x(1 x)[ x(v c) (1 x)v]
dy/dt
1
y
x>1/6
x<1/6
1y
dy/dt
x=1/6
1
y
两群体复制动态关系和稳定性
Y
A
1
B
5/6
C
1/6
D x
1
1x
0<(m-z)/(1-P)<1
(m-z)/(1-P)>1
1x
5.4 复制动态和进化稳定性: 两人非对称博弈
5.4.1 市场阻入博弈的复制动态 和进化稳定策略
5.4.2 非对称鹰鸽博弈的进化分析
5.4.1 市场阻入博弈的复制动态和进化稳定策略
u1e y 0 (1 y) 2 2(1 y) u1n y 1 (1 y)1 1 u1 x u1e (1 x)u1n 2x(1 y) (1 x)
x)u2 ]
x(1 x)(u u)
x(1 x)[ x(a c) (1 x)(b d )]
复制动态 相位图
x
1
x
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
dx F(x) x(1 x)[x(a c) (1 x)(b d)] dt
5.3.1 签协议博弈的复制动态和进化稳定策略
签协议博弈:
同意 不同意
博弈方2 同意 不同意
1,1 0,0 0,0 0,0
假设群体中采用“同意”比 例x
则 得不益同为策:略期望得益和uy平均x 1 (1 x) 0 x un x 0 (1 x) 0 0 u x u y(1 x) un x2
相关文档
最新文档