对称进化博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对该对称博弈进行进化博弈分析: 博弈方2 策略1 (x) 博 弈 方 1 策略1 (x) 策略2 (1-x)
(a, a )
(b, c )
(d , d )
策略2 (1-x)
(c, b )
假设在该群体中有比例为x的博弈方采用策略1,比例为1—x 的博弈 方采用策略2。则采用两种策略的博弈方的期望得益和群体平均期望得益 分别为:
*
=0 是进化稳定策略ESS,也就是所有
雄蛙都是不鸣叫的。如果从所有雄蛙不鸣叫的开始,即使出现少量鸣叫 的变异,他们也会很快的消失掉。只要不是开始时所有雄蛙都是鸣叫的 极端情况,最终都会在长期的动态变化中趋于不鸣叫。
3、当
(m z ) /(1 p) 1 时,此时复制动态的稳定状态点只有 * x* =0 和 x =1。此时 F (0) m z 0 F (1) 1 p m+z 0
两人对称博弈的复制动态和进化稳定性
分析内容:学习速度较慢的有限理性博弈方的动态策略调整及其 稳定性。
分析框架:是这种博弈方组成的大群体成员的随机配对反复博弈。
两人对称博弈:分析框架中的大群体成员随机配对博弈暗指所有 博弈方都是相似的,也意味着进行的博弈的博弈 位Βιβλιοθήκη Baidu无差异。
博弈方策略类型比例动态变化是有限理性博弈分析的核心,其关键是动 态变化的速度(方向可由速度的正负号反映)。动态变化的速度取决于博弈方学 习模仿的速度。博弈方学习模仿的速度取决于两个因素,一是模仿对象的数
则复制动态方程的相位图如下:
dx/dt
0.16 0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
x
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
结论:从图中可以看出,x
*
=1是进化稳定策略ESS,也就是所有雄
蛙都鸣叫。这种情况在青蛙的天敌较少,而且气候不是很寒冷,从而 鸣叫的好处大大超过成本代价时是合理的。
*
F ( x) 到 x 。在数学上这相当于要求当干扰使 x 出现低于 x 时,
必须大于0,当干扰使 x 出现低于 x 时 F ( x ) 必须小于0。
*
*
*
蛙鸣博弈的复制动态和进化稳定策略
雄蛙2 鸣叫 雄 蛙 1 鸣叫 不鸣
( p z, p z ) (1 m, m z)
(m z,1 m)
2、当
F (0) m z 0 F (1) 1 p m+z 0
则该复制动态方程的相位图如下
dx/dt
0
x
-0.02
-0.04
-0.06
-0.08
-0.1
-0.12
-0.14
-0.16 0 0.1 0.2 0.3 0.4 0.5 x 0.6 0.7 0.8 0.9 1
结论:从上述相位图看出,x
博弈方2 策略1 博 弈 方 1 策略1 策略2
( a, a )
(b, c )
(d , d )
策略2
(c, b )
一般22对称博弈的得益矩阵
表中在没有给定具体数值的情况下,不能确定有哪些纳
什均衡。但是对于有限理性的博弈方来说并不重要。因为有
限理性博弈方不一定有能力找到纳什均衡,不一定会采用纳 什均衡策略。
0 (m z ) /(1 p) 1
时(也就是 m
z和p z 1 m
同时成立),则该复制动态的三个稳定状态都是合理的。此时
F (0) m z 0 F (1) 1 p m+z 0
这时复制动态方程的相位图如下
1 dx/dt 0
(m-z)/(1-p)
dx =0 得到三个可能的稳定状态点,分别为 令 dt
x* =0 、x* =1 和
x* =(m z) /(1 p)
复制动态方程的导数为
F ( x) (1 2 x)[ x( p 1) m z ] F (0) m z F (1) 1 p m+z
1、当
群体的平均期望得益:
pz u =(x,1 x) 1 m m z x 0 1 x
二、策略稳定性分析
该蛙鸣博弈的复制动态方程为:
dx x(1 x)[ x( p z 1 m) (1 x)(m z )] dt
u1 x a (1 x ) b
u2 x c (1 x ) d u x u1 (1 x ) u 2
根据上述得益得到对称博弈的复制动态方程为:
dx x(u1 u ) dt x(1 x)[ x(a c) (1 x)(b d )]
一般地可以把该复制动态方程简记为
量大小(可用相应类型博弈方的比例表示),因为这关系到观察和模仿的难易程
度;二是模仿对象的成功程度(可用模仿对象策略得益超过平均得意的幅度表 示),因为这关系到判断差异的难易程度和对模仿激励的大小。
故动态变化速度可用下列动态微分方程表示:
dx (t ) x (t ) (u1 u ) dt
其中
蛙鸣博弈不同的均衡条件
1
z
对该博弈进行进化博弈分析
一、博弈的复制动态方程
dx (t ) x (t ) (u1 u ) dt
鸣叫时的期望得益:
pz u1 =(1,0) 1 m m z x 0 1 x
不鸣叫时的期望得益:
pz u2 =(0,1) 1 m m z x 0 1 x
dx F ( x) dt
只要令复制动态方程中 F ( x)=0 ,即可接触所有的复制动态稳定状 态。不难知道,该复制动态最多有三个稳定状态,分别是
x* =0、
x* =1 和 x* =(b - d ) /(a - b - c d )
。
根据进化稳定策略的性质可知,一个稳定状态必须对微小扰动具 有稳健性才能成为稳定策略。也就是说作为进化稳定策略的点 x , 除了本身必须是均衡状态 以外,还必须具有这样的性质,那就是如果 某些博弈方由于偶然的错误偏离了它们,复制动态仍然会使 x 回复
不鸣
(0,0)
m: 有一只雄蛙鸣叫,引来一只雌蛙,鸣叫雄蛙与其交配的机会 p: 两只青蛙都鸣叫,获得交配的机会
z: 青蛙鸣叫的成本
其中0.5<m<1,m<p<1
对该博弈进行纳什均衡分析: 1、若m-z<0,有p-z<1-m,两只雄蛙都不鸣叫是唯一的纳什均衡。 2、若m-z>0,且p-z<1-m,有p-1+m<z<m。该博弈有两个纳什均衡,分 别是两只雄蛙一鸣叫和一不鸣叫。还有一个混合策略纳什均衡,两 只雄蛙都以一定的概率随机决定是否鸣叫。 3、m-z>0,且p-z>1-m,则两只雄蛙都鸣叫是唯一的纯策略纳什均衡。 m 1 鸣叫 混合策略 不鸣叫 m=1-p-z m=z
x(t )
u1 表示博弈 表示博弈方在t时刻采取“策略1”类型的比例,
方采取“策略1”的期望得益,u 表示所有博弈方的平均期望得益。 上述动态微分方程与生物进化中描述特定性状个体频数变化自然选择过程的 “复制动态”方程是一致的,因此我们也称它为“ 复制动态 ”或“复制动态
方程 ”
一般两人对称博弈的复制动态和进化稳定策略
达到占整个雄蛙数量的比重为
x* =(m z) /(1 p) 。
2、如果雄蛙中鸣叫雄蛙所占比重超过这个水平,甚至全部是鸣叫的, 那么这时候少量不鸣叫的变异则又会在种群中扩散,因为此时不鸣叫雄蛙
“搭便车”的机会和利益特别大,最终会回到
衡比例。
x* =(m z) /(1 p)的均
(m z ) /(1 p) 0 ,即 m z 时,该复制动态方程的 * * 稳定状态点只有 x =0和 x =1 两个。此时
-1
x
-2
-3
-4
-5
-6
-7 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
蛙鸣博弈复制动态相位图
结论: 1、从图中可以看出,只有
x* =(m z) /(1 p)
是进化稳定策略ESS。
这意味着如果环境条件等决定的蛙鸣的利益关系是稳定的,那么一旦发生少 数雄蛙从不鸣到鸣叫的变异,那么这种变异的雄蛙的数量会不断增加,直到