经济博弈论 02 完全信息静态博弈(Park)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
YBU
Economics department
Cont
三、纳什均衡与严格下策反复消去法 上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡 命题1:在n个博弈方的博弈 G={S1, ...Sn; u1, ...un}中,如果 严格下策反复消去法排除了除 {S1*, ...Sn*}之外的所有策略组 合,那么 {S1*, ...Sn*}一定是该博弈的唯一的纳什均衡 命题2:在n个博弈方的博弈中 G={S1, ...Sn; u1, ...un}中,如 果 {S1*, ...Sn*}是G的一个纳什均衡,那么严格下策反复消去 法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严格下 策反复消去法简化博弈是可行的
2
p1*=0.5(30- 0.5p2*); p2*=0.5(30- 0.5p1*); p1*=p2*=20
YBU
Economics department
Cont。
公共草地养羊问题 Player:3个农户 Strategy:[0 ,q1,max], …,[0 ,qn,max],Q=q1 +q2 +q3 Payoff:ui=qi[100- (q1+q2+q3); ] -qic; Howe to find the equilibrium?
maxu1=maxq1[100- (q1+q2+q3); ] –q1c; q1 maxu2=maxq2[100- (q1+q2+q3); ] –q2c; q2 max q3 u3=maxq3[100- (q1+q2+q3); ] –q3c; q1*=q2*= q3*= 24, u1*=u2*= u3*= 576
YBU
Economics department
2.3 无限策略分析和反应函数
古诺的寡头模型 Player:厂商1,2 Strategy:q1, q2 Payoff: P=8-(q1+q2), c1=c2=2; u1=6q1-q1q2-q12, u2=6q2-q1q2-q22, How to find the equilibrium?
YBU
Economics department
Cont.
三、一个例子 该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析
Player 2 C (q ) D (1-q) A (p) B (1-p)
Player 1
2, 3 3, 1
Payoff
5, 2 1, 5
I 的混合策略(p):3p+1(1-p)=2p+5(1-p) II的混合策略(q):2q+5(1-q)=3q+1(1-q) u1 = p[2q+5(1-q)]+(1-p)[3q+1(1-q)]=2.6 u2 = q[3p+1(1-p)]+(1-q)[2p+5(1-p)]=2.6
Cont。
伯特兰德寡头模型模型 Player:厂商1,2 Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium? maxu1=max(p1-2)(28- p1-0.5p2); p1 max u =max(p2-2)(28- p2-0.5p1); p 2
YBU
Economics department
2.1 Cont.
寻找均衡的技术技巧 划线法
1, 0 0, 4 囚 徒 困 境 1, 3 0, 2 0, 1 2, 0 夫 妻 之 争
-5, -5 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
猜 硬 币
-1, 1
1, -1
ui(S1*, ... Si-1*, Si*, Si+1*, ... Sn*) ≥ui(S1, ... Si-1*, Sij, Si+1*,… Sn*)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会 出现,所有博弈方都不会利用该预测或者这种预测能力 选择与预测结果不一致的策略,即没有哪个博弈方有偏 离这个预测结果的愿望,因此预测结果会成为博弈的最 终结果 只有纳什均衡才具有一致预测的性质 一致预测性是纳什均衡的本质属性 一致预测并不意味着一定能准确预测,因为有多重均衡, 预测不一致的可能
p = 0.8, q = 0.8
u 1= 2.6, u 2= 2.6
YBU
Economics department
Cont.
Player 2 C (q) D (1-q)
博弈方2选C的收益(p混) 2, 3 5, 2 A (p ) 3p+1(1-p)=1+2p Player 1 博弈方2选D的收益(p混) 3, 1 1, 5 B (1-p) 2p+5(1-p)=5-3p 博弈方1选A的收益(q混) Payoff 2q+5 (1-q) =5-3q 博弈方1选B的收益(q混): 3q+1(1-q)=1+2q
-1, 1 1, -1
1, -1 -1, 1
YBU
Economics department
2.2 纳什均衡
一、纳什均衡的定义 博弈方:1,…,n ;表示有n个博弈方 策略空间:S1, ...,Si,…Sn,博弈方 i 的第 j 个策略 Sij∈ Si 博弈方 i 的得益: ui 博弈:G={S1, ...Sn; u1, ...un} 纳什均衡:在博弈 G={S1, ...Sn; u1, ...un}中,如果由各个博 弈方的各一个策略组成的某个策略组合 {S1*, ...Sn*}中,任一 博弈方 i 的策略 Si*, 都是对其余博弈方策略的组合 {S1*, ... Si-1*, Si+1*,… Sn*}的最佳对策,也即对任意
YBU
Economics department
第二章 完全信息静态博弈
分析思路 纳什均衡 混合策略和混合策略纳什均衡 * 纳什均衡的存在性 * 纳什均衡的选择和存在性
2014-6-24
1
YBU
Economics department
楔子
本章介绍完全信息静态博弈。完全信息静态博弈即 各博弈方同时决策,且所有博弈方对各方得益都了解 的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石 头剪子布、古诺产量决策都属于这种博弈。完全信息 静态博弈属于非合作博弈最基本的类型。 本章介绍完全信息静态博弈的一般分析方法、纳什 均衡概念、各种经典模型及其应用等。
q=1
u2(D)
u2(C)
u1(A) u1(B)
0
0 0.8 p=1
0.8 q=1
0
0.8
p=1
YBU
Economics department
五、小偷和守卫的博弈 小偷p混合下,守卫的得益 睡时:-Dp+S(1-p) 不睡时:0*p + 0*(1-p)
S 小 偷 守卫 偷 不偷 得益((睡)
守卫 睡 V,-D 0,S 不睡 -P,0 0,0
1, -1
-1, 1
YBU
Economics department
2.1 Cont.
寻找均衡的技术技巧 箭头法
1, 0 0, 4 囚 徒 困 境 1, 3 0, 2 0, 1 2, 0 夫 妻 之 争
-5, -5 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
猜 硬 币
YBU
Economics department
2.1 Cont.
妻(囚徒 2 ) 坦白 不坦白 夫 (囚徒1 ) 坦白 不坦白 -5, -5 -8, 0 0, -8 -1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
YBU
Economics department
2.1 基本分析思路和方法
一、上策均衡 上策(dominate str.):不管其它博弈方选择什么策略, 一博弈方的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略 ui (Si*, S-i )≥ ui (Si, S-i)
上策均衡:一个博弈的某个策略组合中的所有策略都是 各个博弈方的上策,则称为上策均衡。 *** 上策均衡必然是该博弈比较稳定的结果 上策均衡不是普遍存在的
如何变化,给一个博弈方带来的收益总是比另一种 策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下策 严格下策反复消去 Player 2 R L M
U D 1, 0 0, 4 1, 3 0, 2
Payoff
Player 1
0, 1 2, 0
如果总体来看, maxQ[100- Q ] –Qc; Q*=48,u=2304 公共资源的悲剧!!!
YBU
Economics department
Cont.
反应函数的问题和局限性 有此博弈中,博弈方的策略是有限且非连续时, 其得益函数不是连续可导函数,无法求得反应 函数,从而不能通过解方程组的方法求得纳什 均衡。 即使得益函数可以求导,也可能各博弈方的得 益函数比较复杂,因此各自的反应函数也比较 复杂,并不总能保证各博弈方的反应函数有交 点,特别不能保证有唯一的交点。
守卫睡觉时的得益
守卫不睡觉 时的得益
-D - D’
0
p*
p=1
加重对首位的处罚:短期中的效果是使守卫真正尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概略
Economics department
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的策 略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随机在 其k个可选策略中选择的“策略”,称为一个“混合策略”, 其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。 混合策略纳什均衡:包含混合策略的策略组合,构成纳什 均衡。
YBU
Economics department
2.4 混合策略和混合策略纳什均衡
一、猜硬币博弈
猜硬币方
正面 反面
正面 盖硬币方 反面
-1, 1 1, -1
1, -1 -1, 1
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略
这类博弈很多,引出混合策略纳什均衡概念
YBU
YBU
Economics department
Cont
证明:纳什均衡与严格下策反复消去法(反证法) 命题1:如果 消去所有后余下的{Si*, S-i*}不是纳什均衡 不是纳什均衡,一定存在那么{Si’, S-i*}, 使得{Si*, S-i*}<{Si’, S-i*}。 然而,反复消去法消去了{Si’, S-i}, 说明{Si*, S-i}>{Si’, S-i} {Si*, S-i*} in{Si*, S-i}, {Si’, S-i*} in {Si’, S-i} 所以, {Si*, S-i*} > {Si’, S-i*} 命题2: 如果纳什均衡{Si*, S-i*} 被严格下策反复消去; 那么必然存在一个Si‘, 使得{Si’, S-i} >{Si*, S-i} 进而, {Si‘, S-i*} > {Si*, S-i*} 与纳什均衡的定义,矛盾
q2
R1(q2)
R2(q1)
(3,0) (6,0) q1 古诺模型的反应函数图示
maxu1 max(6q1 q1q2 q12 )
q1
Biblioteka Baidu
(0,6) (0,3)
q1 R1 (q2 ) 1 2 ( 6 q2 ) q2 R2 (q1 ) 1 2 (6 q1 )
YBU
Economics department