第6讲:演化博弈论简介

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

NE: (A,A) , (B,B) ,(11/61,11/61)
其中,(B,B)为pareto最优,但(A,A)为风险上策均衡
第6讲:演化博弈论简介
最优反应动态:能根据对方的上期策略调整自己的策略。
例如:
5 1
乙 A
2
B 49,0 60,60

A B
50,50 0,4943 5个博弈方,相邻者彼此博弈,初始策略组合为32种。 实际上为8种:无A,1A,相邻2A,不相邻2A,3连A,非3连A,4A,5A 令xi(t)为t时期博弈方i 的采用策略A的邻居的数量,则xi(t) = 0,1,2.
假设: A:“进入”的群体比例为x “不进”的群体比例为1-x B:“打击”的群体比例为y “不打击”的群体比例为1-y
对A而言:
Uy 01 y 2 2 2 y A e
U y 1 1y 11 A n
U x Ux 1 U 2 x 1 y 1 x A A e A n
d x x x U Ux 1 x 1 2 y 竞争者群体的复制动态方程: F A A e A d t
竞争者的群体复制动态相位图为:
dx/dt
dx/dt
dx/dt
0 1
x
0 1
0
1
x
x
(a) y=1/2 x*∈[0,1]
(b) y>1/2 ESS: x*=0
Ux t 5 02 t 4 9 A i i x
可知,当xi(t)>22/61时,UA>UB
Ux t 0 2 x t 6 0 在t时期,当2个邻居中只要有1个邻 B i i
居采用策略A,则i在t+1时期必然采用A
x
第6讲:演化博弈论简介
(二)一般两人对称博弈
甲 S1 S2
乙 S1 a,a c, b S2 b ,c d,d
群体中采用S1的比例为x,S2的比例为1-x
U xa 1 x b 1
U xc 1 x d 2
Ux U 1xU 2 1
发生战争的可能性随着c/v比值的增加而降低,即:和平共处的可能性也随着增加。
第6讲:演化博弈论简介
乙 鹰 甲
(v-c)/2 鹰 (v-c)/2,
鸽 v ,0 v/2 ,v/2

0 ,v
d x v vc F x x 1 xx 1 x d t 2 2
每个人都有学习和改进过错的经历;每个人学习和改进错误的
速度是有差异的。
具有快速学习能力的小群体成员之间的反复博弈,可以采用
“最优反应动态”。
学习速度较慢的成员组成的大群体中的反复博弈,可以采用
“复制动态”。
第6讲:演化博弈论简介
一、最优反应动态
(一)协调博弈
乙 A 甲 A B 50,50 0,49 B 49,0 60,60
③ 假设v=8,c=4(表示种群间和平共
处所得到的收益大于两者冲突导致的损失)
② 假设v=8,c=8(表示种群间和平共
处所得到的收益等于两者冲突导致的损失)
dx/dt
dx/dt
0
1
x
0
1
x
ESS: x*=1
在于当一方忍让时,另一方可获得更多收益。
ESS: x*=1
当c≤v时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因
则复制动态方程F(x):
d x x 1 x x a c 1 x b d Fx xU U 1 d t
当F(x) =0时,
复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)
第6讲:演化博弈论简介
11 1 n 61 2
学习速度慢
理性程度低
当n≥3
学习速度快 理性程度高
所以,在有限理性程度下,理性程度较高的一方不一定能得到比 理性程度较低的一方更理想的结果。
第6讲:演化博弈论简介
(四)鹰鸽博弈的复制动态和ESS
鹰 甲
乙 鸽 v ,0 v/2 ,v/2
(v-c)/2 鹰 (v-c)/2,
二、复制动态中的对称博弈
(一)签协议博弈
甲 Y N
乙 Y 1,1 0, 0 N 0 ,0 0,0
Y:同意 N:不同意
假设:群体中“Y”的比例为x,“N”的比例为1-x
U x 1 1x 0 x Y
U x 0 1x 00 N
2 U x U 1 x Ux Y N
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
dx/dt
1/6 0 1
F ‘(0) >0, F’(1)>0,而 F‘(1/6)<0,
x
则ESS为: x*=1/6
当冲突损失严重时,例如c/v=6时,两个种群发生战争的可能性为1/36;和平共处的
可能性为25/36;一方霸道、一方忍让的可能性为10/36。
这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。
第6讲:演化博弈论简介
(四)蛙鸣博弈的复制动态和ESS
蛙B 鸣 蛙 鸣 A 不鸣
P-z , P-z 1-m, m-z
不鸣
m-z , 1-m 0, 0
m、P为求偶成功的概率 z为机会成本(体力消耗、危险性等)
满足:m ∈ (0.5,1],m<P≤1 令x为采用“鸣”策略的群体比例,1-x为采用“不鸣”策略的群体 比例 则复制动态方程F(x):
(c) y<1/2 ESS: x*=1
第6讲:演化博弈论简介
打击 A 进入 不进 0 ,0 1 ,5
B
不打击 2 , 2 1, 5
A:“进入”的群体比例为x “不进”的群体比例为1-x B:“打击”的群体比例为y “不打击”的群体比例为1-y
对B而言:
Ux 01 x 5 5 5 x B s
非对称博弈:不同群体间的演化博弈行为
(一) 市场阻入博弈
竞争者
有两个群体:竞争者和在位者
不进入
打击 竞 进入 争 者 不进 0 ,0 1 ,5 在位者 不打击 2 , 2 1, 5
进入 在位者 打击 (0,0) 不打击 (2,2)
(1,5)
第6讲:演化博弈论简介
采用A表示竞争者,B表示在位者
打击 A 进入 不进 0 ,0 1 ,5 B 不打击 2 , 2 1, 5
d x F x x 1 x m z 1 P x d t
稳定状态:x*=0,x*=1,x*=(m-z)/(1-P)
第6讲:演化博弈论简介
蛙B 鸣 蛙 鸣 A 不鸣
P-z , P-z 1-m, m-z
不鸣
m-z , 1-m 0, 0
d x F x x 1 x m z 1 P x d t
稳定性定理
F(x)=dx/dt,t↑,则x↑
若x<x*,为使x→x*,应满足F(x)>0;
若x>x*,为使x→x*,应满足F(x)<0.
F(x)=dx/dt,t↑,则x↓
F(x)
这意味着:
x* 0 x
当F'(x*)<0,x*为ESS
第6讲:演化博弈论简介
(三)协调博弈的复制动态和ESS
复制动态方程F(x):

0 ,v
令x为采用“鹰”策略的群体比例,1-x为采用“鸽”策略的群体比 例 则复制动态方程F(x):
d x F 1 x x c 1 x d x x a b d t v c v x 1 x x 1 x 2 2
甲 A B
乙 A 50,50 0,49 B 49,0 60,60
d x Fx x 1 x xa c 1 x b d 当F(x) =0时,x*=0,x*=1, d t x*=11/61为稳定状态 x 1 x 6 1 x 1 1
打击的群体比例为y不打击的群体比例为1y进入不进打击不打击即无论两个群体的初始状态落在哪个区域最终的演化博弈结果为竞争者进入在位者不打击12第6讲
第6讲: 演化博弈论简介
浙江工业大学经贸管理学院 曹柬
第6讲:演化博弈论简介
在前面的学习中,我们都假设博弈参与人为完全理性的人;但
在现实中,不存在完全理性的人。
Ux 21 x 5 5 3 x B n
U y U 1 y U 5 23 x y x B B s B n
dx/dt
可知,当F '(0) <0, F'(1)<0, 而F'(11/61)>0,则
x*=0和x*=1为ESS
0 11/61 1
x
这意味着: 当初始x<11/61时,ESS为x*=0;
图2 协调博弈的复制动态相位图
当初始x>11/61时,ESS 为x*=1.
第6讲:演化博弈论简介
复制动态与最优反应动态的比较:
第6讲:演化博弈论简介
(一)连续型的古诺调整过程 反应函数:
q q 1 3 2 2
q q 2 3 1 2
则调整过程为:
企业1 企业2
2.5 1.5 2.215 1.1875 …
3.0 1.75 2.25 1.9375 …
则最终的进化稳定 策略(ESS)为:
q1=2,q2=2
第6讲:演化博弈论简介
第6讲:演化博弈论简介
例举如下:
1、当初始情况为1A时
A B B B B A B B B A B A A A B A A A B A A A A A A
2、当初始情况为2连A时
A A B B B A A B A A A A A A A
3、当初始情况为3连A时
A A B B A A A A A A
综上可知,32种初始情况下, 只有1种情况稳定于5B,其余31 中情况最后都将稳定于5A。(此时, A为“进化稳定策略”,即ESS, evolutionary stable strategy)
dx/dt
dx/dt
0 1
x
0 1
x
ESS: x*=0
ESS: x*=1
显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫”。 当“鸣叫”的收益大于群体鸣叫而个别雄蛙“搭便车”的收益时,所有雄蛙都将鸣
叫。
第6讲:演化博弈论简介
三、复制动态中的非对称博弈
对称博弈:相似/相同群体中的演化博弈行为
第6讲:演化博弈论简介
蛙B 鸣 蛙 鸣 A 不鸣
P-z , P-z 1-m, m-z
不鸣
m-z , 1-m 0, 0
d x F x x 1 x m z 1 P x d t
② 若(m-z)/(1-P) <0,即z>m
③ 若(m-z)/(1-P) >1,即m-z>1-P
① 若(m-z)/(1-P) ∈ (0,1),即1-P>m-z>0
dx/dt
mz 1 P
ESS: x*= (m-z)/(1-P)
1
0
x
在这种情况下,无论初始状况如何,最后总有(m-z)/(1-P)比例的雄蛙鸣叫。 当个别雄蛙“搭便车”的收益大于群体雄蛙“鸣叫”所获得的收益时,则总会存
在搭便车“不鸣叫”的雄蛙。
当F(x) =0时,x*=0,x*=1,x*=v/c为稳定状态
第6讲:演化博弈论简介
乙 鹰 甲
(v-c)/2 鹰 (v-c)/2,
鸽 v ,0 v/2 ,v/2

0 ,v
d x v vc F x x 1 xx 1 x d t 2 2
则竞争者群体的复制动态方程FA(x):
d x F x x U Ux 1 x 1 2 y A A e A d t
第6讲:演化博弈论简介
打击 A 进入 不进 0 ,0 1 ,5
B
不打击 2 , 2 1, 5
A:“进入”的群体比例为x “不进”的群体比例为1-x B:“打击”的群体比例为y “不打击”的群体比例为1-y
设:群体比例的动态变化速度为
dx xUY U dt
dx 则: x 2 x3 dt
当x=0时,稳定;
复制动态方程
当x>0时,最终稳定于x*=1
第6讲:演化博弈论简介
dx/dt
dx x 2 x3 dt
乙 Y 甲 Y N 1,1 0, 0 N 0 ,0 0,0
0
1
图1 签协议博弈的复制动态相位图 x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
相关文档
最新文档