第五章 有限理性和进化博弈

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)(2/3,1/3)是否是一个严格纳什均衡? (3)(2/3,1/3)是否是ESS?
鹰鸽博弈
H
D
H
(v-c)/2,(v-c)/2
v,0
D
0,v
v/2,v/2
博弈的演化稳定策略是什么?
当v>c时,(H,H)是严格纳什均衡,因此H是演化稳定策 略。
当v=c时,(H,H)是弱纳什均衡,因为U(H,D)>U(D,D), 因此H是演化稳定策略 当v<c时,不存在纯策略演化稳定策略。 此时是否存在混合策略ESS? 首先找出混合策略纳什均衡(v/c,1-v/c), 其次验证其是否为ESS。
第五章 有限理性和进化博弈
完全理性在现实中很难满足,当社会经济环 境和决策问题较复杂时,人们必须存在很大 的理性局限。
有限理性对人们的决策、行为选择方式有很 大影响.
❖ 有限理性(bounded rationality)的概念最初 是阿罗提出.
❖ 一是环境是复杂的,在非个人交换形式中, 人们面临的是一个复杂的、不确定的世界, 而且交易越多,不确定性就越大,信息也就 越不完全;
结论:
❖ 严格劣策略不可能是演化稳定策略。
纳什均衡与演化稳定策略
A
B
A
1,1
0,0
B
0,0
0,0
博弈的纳什均衡(A,A)和(B,B)。 B是否是一个演化稳定策略? 结论: 1. 纳什均衡并不意味着演化稳定策略; 2. 严格纳什均衡意味着演化稳定策略。
纯策略下演化稳定策略的定义1 (Maynard Smith, 1972)
找出以下博弈的混合策略ESS
AB
A 0,0 2,1
B 1,2 0,0
(1)找出博弈的混合策略纳什均衡。 由于博弈的对称性,双方的混合策略纳什均衡必然是相同
的,设为(p,1-p) 给定局中人1的策略(p,1-p) 局中人2选择A的收益:p*0+(1-p)*2=2-2p 局中人2选择B的收益:p*1+(1-p)*0=p 根据2-p=p,解出p=2/3
经济学与生物学
❖ 经济学和生物学的历史从来就交织在一起。
❖ 二者研究的都是个体在给定环境下的最优策 略。它们包含的内在逻辑相当一致:所有生 命体的行为看上去总好像设法使其基因的遗 传频率最大化,正如企业最大化其利润一样。
经济学与生物学
经济学 企业 最优化 策略 利润 扩张 倒闭 创新
生物学 物种(或个体)
❖ 进化稳定策略(ESS)
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型
5.2.2 古诺调整过程
5.2.1 协调博弈的有限博弈方快速学习模型
模型:
1 博弈方2
A
B
2
A
50,50 49,0
5
B
0,49 60,60
4
3
协调博弈
反应、策略调整规则推导
xi (t) t时刻博弈方i的邻居中采用A策略的数量, xi (t) 0,1,2 2 xi (t) t时刻博弈方i的邻居中采用B策略的数量, 采用A的得益:xi (t) 50 [2 xi (t)] 49 采用B的得益:xi (t) 0 [2 xi (t)] 60 当xi (t) 22 / 61时,博弈方i在t 1时刻采用A; 当xi (t) 22 / 61时,博弈方i在t 1时刻采用B
❖ 有限理性意味着均衡是不断调整和改进而不是 一次性选择的结果,而且即使到达了均衡也可 能再次偏离
❖ 有限理性博弈方会在博弈过程中学习博弈通过 试错寻找较好的策略
5.1.2 有限理性博弈分析框架
❖ 最优反应动态:有快速学习能力的小群体 成员的反复博弈
❖ 复制动态:学习速度很慢的成员组成的大 群体随机配对的反复博弈
分析:
C
D
C 2,2 0,3
D 3,0 1,1
假定一个群体由合作者构成,由于基因变异出现 了比例为ε的背叛者。 此时合作者的收益为:(1-ε)*2+ε*0=2-2ε
背叛者的收益为:(1-ε)*3+ε*1=3-2ε 由于背叛者的收益高于合作者的收益,背叛者不 仅不会消亡,反而会越来越多。因此,合作不是 一个演化稳定策略。
蜥蜴的生存策略
动态演化
❖ 复制者(replicator)
能够大致精确地复制自身的个体。 例如基因、生物体或是弥母(meme)
❖ 动态演化的复制者系统
不同复制者的所占比例随时间的变化过程,其中 不同策略复制的速度与他们的收益呈正相关。
复制者的策略
❖ 考虑一个n人演化博弈(i=1,2,...n),博弈在每个时间点t 上进行(t=1,2,...).设pit为在t期中采用策略si的局中人的 比例,此时si的收益为πit=πi(pt),其中p=(p1,...,pn)。不妨 设π1t≤π2t≤…≤πnt
自然界中的博弈
❖ 白色念珠菌(Monilia albican 或 canidia Albicans),是一种真菌,通常存在于正常人口腔和 消化道粘膜中,一般在正常机体中数量少,不引起疾 病。当机体免疫功能或一般防御力下降,则本菌大量 繁殖并改变生长形式(芽生菌丝相)侵入细胞引起疾 病。
❖ 演化博弈论(evolutionary stable strategy) 整合了理性经济学与演化生物学的思想,不 再将参与人模型化为超级理性的博弈方,认 为参与人通常是通过试错的方法达到博弈均 衡的,与生物演化具有共性。
❖ 二是人对环境的计算能力和认识能力是有限 的,人不可能无所不知;
❖ 20世纪40年代,西蒙详尽而深刻地指出了 新古典经济学理论的不现实之处,分析了它 的两个致命弱点:
❖ (1)假定目前状况与未来变化具有必然的一致 性;
❖ (2)假定全部可供选择的“备选方案”和“策 略”的可能结果都是已知的。
❖ 而事实上这些都是不可能的。
❖ 假定在每个时期dt,每个个体i都以α dt的概率发现某个随 机个体j的收益,如果i发现j的收益比自己高,就以pijt的概 率转变为j的策略。
pitj
(
t j
0
t i
)

t j
t i

t j
t i
此时在t+dt期使用si策略的局中人所占比例的期望 值Epit+dt为:
n
i
Epitdt pit dtpit
问题2:此博弈是否存在演化稳定策略
AB
A 0,0 2,1
B 1,2 0,0
混合策略下演化稳定策略的定义
在二人对称博弈中,混合策略P*是演化稳定策略,如果 以下两式成立:
1U P*, P* U P ', P* 2若U P*, P* =U P ', P*,则U P*, P ' U P ', P '
最优反应动态模拟:初次博弈1个A
A
B
A
B
BA
AB
B
B
B
B
B
A
A
A
B
A
A
A
A
A
A
A
A
初次博弈相邻2个A
B
A
A
B
AB
AA
A
B
A
A
A
A
A
初次博弈相连3个A
A
B
A
B
A
A
A
A
A
A
5.2.2 古诺调整过程
古诺模型反应函数
q1
3
q2 2
最优反应动态模拟
q2
3
q1 2
1 博弈方1 2.5 博弈方2 3
2 1.5 1.75
❖ 在演化博弈中,认为参与人的选择行为可以 依据前人的经验、学习与模仿他人行为、受 遗传因素的决定等。
❖ 因而演化博弈把具有主观选择行为的参与人 扩展为包括动物、植物在内的有机体,动植 物参与者的支付可被理解为为某种适应程度。
❖ 把博弈论的分析与应用从研究人类的竞争行为扩展 为研究有机体的策略互动关系。
pit
(
t i
t )
这个式子称为复制者动态(replicator dynamic)方程
5.3.1 签协议博弈的复制动态和进化稳定策略
签协议博弈:
假设群体中采用“同意” 比例x(t)
同意 不同意
博弈方2 同意 不同意
1,1 0,0 0,0 0,0
则不同策略期望得益wenku.baidu.com 平均得益为:
uy x 1 (1 x) 0 x
适应 基因 适应性(fitness) 繁殖 灭绝 变异
自然界中的博弈
❖ 吸血蝙蝠夜间去大型哺乳动物那里吸血,有些个 体偶尔会空腹而归,此时吸饱血的个体就会吐出 胃内的血液喂给饥饿的个体,尽管它们之间并没 有直接血缘关系。
❖ 吸血蝙蝠更有可能回吐血液给以前曾经回吐过血 液的蝙蝠,而骗子(拒绝分享的蝙蝠)将被蝙蝠 群体记住,并且被排除在这种协作之外。
1U S*, S * U S ', S * 2若U S*, S * =U S ', S *,则U S*, S ' U S ', S '
例2:找出ESS
A
B
A
1,1
1,1
B
1,1
0,0
U(A,A)=U(B,A) U(A,B)>U(B,B) 因此A是演化稳定策略
另一个例子 问题1:此博弈对应现实生活中的什么情况
本章分四节
5.1有限理性博弈及其分析框架 5.2最优反应动态 5.3复制动态和进化稳定性:
两人对称博弈 5.4复制动态和进化稳定性:
两人非对称博弈
5.1 有限理性博弈及其分析框架
5.1.1 有限理性及其对博弈的影响 5.1.2 有限理性博弈分析框架
5.1.1 有限理性及其对博弈的影响
❖ 有限理性意味着一般至少有部分博弈方不会采 用完全理性博弈的均衡策略
演化稳定策略是
C
D
什么呢?
C 2,2 0,3
D 3,0 1,1
假定一个群体由背叛者构成,由于基因变异出现 了比例为ε的合作者。 此时背叛者的收益为:(1-ε)*1+ε*3=1+2ε
合作者的收益为:(1-ε)*0+ε*2=2ε 由于合作者的收益低于背叛者的收益,合作者会 逐渐消亡,因此背叛是一个演化稳定策略。
❖ 它探讨种群选择的策略是否获得最佳的收 益,并消除任何小的突变群体的扰动。
一个例子:对称博弈演化博弈
❖ 首先假定群体中的参与人都是完全相同的 (对称博弈) 。
❖ 其次,假定每个参与人只能机械地选择某种 策略(而无法改变自己的策略)。如果某种 策略获得了成功,采用这种策略的参与人将 越来越多,反之如果某种策略不成功,采用 这种策略的参与人就越来越少。
p
t j
(
t j
t i
)
dtpit
ptj
(
t i
t j
)
j i 1
j 1
n
pit dtpit
p
t j
(
t i
t j
)
j 1
pit
dtpit
(
t i
t)
其中 t
1t p1t
t n
pnt
如果个体数量很多,则Epit+dt≈pit+dt
pt dt i
pit
dtpit
(
t i
t)
pit
dpit dt
❖ 这个领域的开创性工作是由英国生物学家约翰·梅 纳德·史密斯(John Maynard Smith)和G.R. 普莱斯(G.R.Price)1973年进行的。
❖ 演化博弈现在正逐渐被广泛应用于社会经济学领域。
演化博弈的关注内容
❖ 演化博弈强调经济变迁过程中以个体多样 性变异机制和偏好选择机制为代表的种群 研究。
演化稳定策略(ESS)
❖ 演化稳定策略,是指如果占群体绝大多数的 个体选择演化稳定策略,那么小的突变者群 体就不可能侵入到这个群体。
❖ 或者说,在自然选择压力下,突变者要么改 变策略而选择演化稳定策略,要么退出系统 而在进化过程中消失。
例1:囚徒困境博弈
C
D
C
2,2
0,3
D
3,0
1,1
C代表合作,D代表背叛。 合作是否是一种演化稳定策略?
3
4………
2.125 1.875
2.25 1.9375
收敛条件
| dr1 || dr2 | 1 dq2 dq1
问题:两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性: 两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定
策略 5.3.3 协调博弈的复制动态和进化稳定博弈
un x 0 (1 x) 0 0 u x u y (1 x) un x2
❖ 博弈方策略类型比例动态变化是有限理性博 弈分析的核心,其关键是动态变化的速度
❖ 以采用“同意”策略类型博弈方的比例为例, 其动态变化速度可用下列微分方程反映(复 制动态方程)
dx dt
x(u y
u)
在二人对称博弈中,纯策略S*是演化稳定策略,如果
存在0 1,对于 ,下式对于所有的纯策略S '成立:
1 U S*, S * U S*, S ' 1 U S ', S * U S ', S '
纯策略下演化稳定策略的定义2
在二人对称博弈中,纯策略S*是演化稳定策略,如果 以下两式成立:
❖ 西蒙的分析结论使整个新古典经济学理论和 管理学理论失去了存在的基础。
❖ 西蒙指出传统经济理论假定了一种“经济 人”。
❖ 他们具有一个很有条理的、稳定的偏好体 系,并拥有很强的计算能力,靠此能计算 出在他们的备选行动方案中,哪个可以达 到尺寸上的最高点。
❖ 西蒙认为人们在决定过程中寻找的并非是 “最大”或“最优”的标准,而只是“满 意”的标准。
相关文档
最新文档