第三章-第五节-演化博弈模型

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

dx/dt
dx/dt
dx/dt
0
1x
(a) y=1/2 x*∈[0,1]
0
1x
(b) y>1/2 ESS: x*=0
.
0
1x
(c) y<1/2 ESS: x*=1
进入 A
不进
B 打击
0 ,0
1 ,5
不打击
2 ,2 1 ,5
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
dx/dt
1/6 0
1x
F ‘(0) >0, F’(1)>0,而 F‘(1/6)<0,
则ESS为: x*=1/6
当冲突损失严重时,例如c/v=6时,两个种群发生战争的可能性为1/36;和平共处的
可能性为25/36;一方霸道、一方忍让的可能性为10/36。
发生战争的可能性随着c/v比值的增加而.降低,即:和平共处的可能性也随着增加。
.
(二)一般两人对称博弈
甲 S1 S2

S1
S2
a,a
b ,c
c, b
d,d
群体中采用S1的比例为x,S2的比例为1-x,对于甲
U1xa1xb
U2xc1xd UxU 11xU 2
则复制动态方程F(x):
Fxddxt xU1U x 1 x x a c 1 x b d
当F(x) =0时, 复制动态稳定状态为:x*=0,x*=1,. x*=(d-b)/(a-b-c+d)
.
为什么将演化思想引入到博弈论中? (1)博弈论对生物学的影响。博弈论的策略对应生
物学中的基因 ,博弈论的收益对应生物学中的 适应度。在生物学中应用的博弈论与经济学中的 传统博弈论最大区别就是非完全理性的选择。 (2)演化化思想对社会科学的影响。例如,在市场 竞争中,我们不必要去理性的想那个策略才是最 优的,最后能够在市场存活下来的企业,一定是 适应能力最强的公司。
对A而言: U A e y 0 1 y 2 2 2 y
U A ny11y11
U A x U A e 1 x U A n 2 x 1 y 1 x
则竞争者群体的复制动态方程FA(x):
F A x d d x t x U A e U A x 1 x 1 2 y
若简化问题分析,令v1=10,v2=2,c=12
鹰 甲




-1 ,-5
10 ,0
0 ,2
5 ,1
.
采用A表示甲,B表示乙
鹰 A

B 鹰
-1 ,-5
0 ,2
鸽 10 ,0 5 ,1
假设:
A:采用“鹰”策略的群体比例为x “鸽”策略的群体比例为1-x
B:采用“鹰”策略的群体比例为y “鸽”策略的群体比例为1-y
对B而言: U B s x0 1 x 5 5 5 x
U B n x2 1 x 5 5 3 x
U B y U B s 1 y U B n 5 2 x y 3 x
则在位者群体的复制动态方程FB(x):
F B y d d y t y U B s U B y 1 y 2 x
鹰 A

B 鹰
-1 ,-5
0 ,2
鸽 10 ,0 5 ,1
A:采用“鹰”策略的群体比例为x “鸽”策略的群体比例为1-x
B:采用“鹰”策略的群体比例为y “鸽”策略的群体比例为1-y
A群体的复制动态方程: F A x d d x t xU A e U A x 1 x 5 6 y
.
进入 A
不进
B 打击
0 ,0
1 ,5
不打击
2 ,2 1 ,5
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
在位者群体的复制动态方程: F B y d d y t y U B s U B y 1 y 2 x
在位者的群体复制动态相位图为:
dy/dt
dy/dt
0
1y
(a) x=0 y*∈[0,1]
0
1y
(b) x≠0
ESS: y*=0
.
进入 A
不进
B 打击
0 ,0
1 ,5
不打击
2 ,2 1 ,5
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例
x*=0和x*=1为ESS
这意味着: 当初始x<11/61时,ESS为x*=0; 当初始x>11/61时,ESS 为x*=1.
(四)鹰鸽博弈的复制动态和ESS



鹰 (v-c)/2,(v-c)/2 v ,0

鸽 0 ,v
v/2 ,v/2
令x为采用“鹰”策略的群体比例,1-x为采用“鸽”策略的群体比 例 则复制动态方程F(x):
稳定性定理
ห้องสมุดไป่ตู้
F(x)=dx/dt,t↑,则x↑
若x<x*,为使x→x*,应满足F(x)>0; 若x>x*,为使x→x*,应满足F(x)<0.
F(x)
F(x)=dx/dt,t↑,则x↓
x* 0
这意味着: 当F'(x*)<0,x*为ESS
x
.
(三)协调博弈的复制动态和ESS

A
B
复制动态方程F(x):
则: dx x2 x3
dx dt
xUY
U
dt
当x=0时,稳定;
复制动态.方程
当x>0时,最终稳定于x*=1
dx/dt
dx x2 x3
dt
甲Y
N

Y
N
1,1
0 ,0
0, 0
0,0
0
1x
图1 签协议博弈的复制动态相位图
x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
ESS: x*=1
显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫”。 当“鸣叫”的收益大于群体鸣叫而个别雄. 蛙“搭便车”的收益时,所有雄蛙都将鸣
叫。
三、复制动态中的非对称博弈
➢ 对称博弈:相似/相同群体中的演化博弈行为 ➢ 非对称博弈:不同群体间的演化博弈行为
(一) 市场阻入博弈
有两个群体:竞争者和在位者
第五节 演化博弈模型
.
一、演化博弈思想
传统博弈理论的两个苛刻假设: (1)完全理性(2)完全信息
与传统博弈理论不同,演化博弈理论并不要求参与 人是完全理性的,也不要求完全信息的条件。
演化博弈论(Evolutionary Game Theory)把博弈 理论分析和动态演化过程分析结合起来的一种理论。 在方法论上,它不同于博弈论将重点放在静态均衡 和比较静态均衡上,强调的是一种动态的均衡。演 化博弈理论源于生物进化论。
A 甲
B
50,50 0,49
49,0 60,60
Fxd dxtx1xxac1xbd 当F(x) =0时,x*=0,x*=1,
x1x61x11
x*=11/61为稳定状态
dx/dt
0
11/61
1x
图2 协调博弈的复制动态相位图 .
可知,当F '(0) <0, F'(1)<0, 而F'(11/61)>0,则
m-z ,1-m
1-m,m-z
0 ,0
➢ m、P为求偶成功的概率 ➢ z为机会成本(体力消耗、危险性等)
满足:m ∈ (0.5,1],m<P≤1
令x为采用“鸣”策略的群体比例,1-x为采用“不鸣”策略的群体 比例 则复制动态方程F(x):
F xd d x tx1 x m z 1 P x
稳定状态:x*=0,x*=1,x*=(m-z)/(1-P) .
.
进入 A
不进
B 打击
0 ,0
1 ,5
不打击
2 ,2 1 ,5
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
竞争者群体的复制动态方程: F A x d d x t x U A e U A x 1 x 1 2 y
竞争者的群体复制动态相位图为:
蛙鸣 A 不鸣
蛙B

不鸣
P-z ,P-z
m-z ,1-m
1-m,m-z
0 ,0
F xd d x tx1 x m z 1 P x
① 若(m-z)/(1-P) ∈ (0,1),即1-P>m-z>0
dx/dt
mz 1 P
0
ESS: x*= (m-z)/(1-P)
1x
在这种情况下,无论初始状况如何,最后总有(m-z)/(1-P)比例的雄蛙鸣叫。 当个别雄蛙“搭便车”的收益大于群体. 雄蛙“鸣叫”所获得的收益时,则总会存
复制动态实际上是描述某一特定策略在一个种群中被采用 的频数或频度的动态微分方程,可以用下式表示:
dxi dt
xi[(usi ,x)u(x,x)]
.
演化博弈关注的问题
当时间趋于无穷大时,博弈参与方策略选择行为是怎样的? 这就是演化博弈稳定性问题,一个稳定状态必须对微小扰 动具有稳健性才能称为演化稳定策略。也就是说,如果我 们假定为演化稳定策略的稳定点,则该点除了本身必须是 均衡状态以外,还必须具有这样的性质:如果某些博弈方 由于偶然的错误偏离了它们,复制动态仍然会使x回复到 x*。在数学上,这相当于要求:当干扰使x低于时x* , dx/dt必须大于0;当干扰使得x出现高于时x*, dx/dt必 须小于0,这就要求这些稳定状态处于的导数必须小于0。



鹰 (v-c)/2,(v-c)/2 v ,0

鸽 0 ,v
v/2 ,v/2
F xd d x tx1x xv 2c1x2 v
② 假设v=8,c=8(表示种群间和平共
处所得到的收益等于两者冲突导致的损失)
dx/dt
③ 假设v=8,c=4(表示种群间和平共
处所得到的收益大于两者冲突导致的损失)
在搭便车“不鸣叫”的雄蛙。
蛙鸣 A 不鸣
蛙B

不鸣
P-z ,P-z
m-z ,1-m
1-m,m-z
0 ,0
② 若(m-z)/(1-P) <0,即z>m
F xd d x tx1 x m z 1 P x
③ 若(m-z)/(1-P) >1,即m-z>1-P
dx/dt
dx/dt
0
1
x
0
1
x
ESS: x*=0
竞争者
不进入
进入
竞 进入 争 者 不进
在位者
打击
不打击
0 ,0
2 ,2
1 ,5
1 ,5
(1,5) 打击
在位者 不打击
(0,0) (2,2)
.
采用A表示竞争者,B表示在位者
B
打击
不打击
进入 A
不进
0 ,0 1 ,5
2 ,2 1 ,5
假设:
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
y
1
1/2
通过分析可知:ESS为x*=1,y*=0
即无论两个群体的初始状态落在哪个区
0
1x
域,最终的演化博弈结果为竞争者“进
入”,在位者“不打击”
.
(二) 非对称鹰鸽博弈
有两个实力不同的群体,争夺/分享资源
鹰 甲




(v1-c) /2
,(v/2-2c)
v1 ,0
0 ,v2
v1/2,v2/2
对A而言:
U A e y 1 1 y 1 0 1 0 1 1 y
U A d y 0 1 y 5 5 5 y
U A x U A e 1 x U A d 5 5 x 5 y 6 x y
则A群体的复制动态方程FA(x):
F A x d d x t x U A e U A x 1 x 5 6 y .
dx/dt
0
ESS: x*=1
1
x
0
1
x
ESS: x*=1
当c≤v时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因
在于当一方忍让时,另一方可获得更多收益。
.
这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。
(四)蛙鸣博弈的复制动态和ESS
蛙鸣 A 不鸣
蛙B

不鸣
P-z ,P-z
Fxddxt x1xxac1xbd x1xxv2c1x2v
当F(x) =0时,x*=0,x*=1,x*=v/c为稳定状态
.



鹰 (v-c)/2,(v-c)/2 v ,0

鸽 0 ,v
v/2 ,v/2
F xd d x tx1x xv 2c1x2 v
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
.
在演化博弈理论中,演化稳定策略 (Evolutionary Stable Strategy, ESS)和复制动态(Replication Dynamics)是两个核 心概念。演化稳定策略是指在博弈的过程中,博弈双方由于有 限理性,博弈方不可能一开始就找到最优策略以及最优均衡点。 于是,博弈方在博弈的过程中需要不断进行学习,有过策略失 误会逐渐改正,并不断模仿和改进过去自己和别人的最有利策 略。经过一段时间的模仿和改错,所有的博弈方都会趋于某个 稳定的策略。
演化稳定策略的影响因素分析
.
二、复制动态中的对称博弈

Y
N
(一)签协议博弈
甲Y N
1,1 0, 0
0 ,0 0,0
Y:同意 N:不同意
假设:群体中“Y”的比例为x,“N”的比例为1-x,对于
甲 U Yx11x0x
U Nx01x00
U xU Y 1 x U N x 2
设:群体比例的动态变化速度为
相关文档
最新文档