博弈论复习题及答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博 弈 论
题型一:纯策略纳什均衡
1、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。
按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。
谁去按按纽则谁后到;都去按则同时到。
若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。
各种情况组合扣除成本后的支付矩阵可如下表示(每格第一个数字是大猪的得益,第二个数字是小猪的得益):
小猪
按 等待 大猪 按 5,1 4,4
等待 9,-1 0,0
求纳什均衡。
在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。
即不管大猪选择按还是不按,小猪的最佳策略都是等待。
也就是说,无论如何,小猪都只会选择等待。
这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。
所以纳什均衡是(大猪按,小猪等待)。
题型二:混合策略的纳什均衡
2、求出下面博弈的纳什均衡(含纯策略和混合策略)。
乙
甲
U D 可得如下不等式组
Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1
可得混合策略Nash 均衡((9
891,),(7
374,)
据说是去年考了的原题!
3、Smith 和John 玩数字匹配游戏,每个人选择1、2、3,如果数字相同, John 给Smith 3美元,如果不同,Smith 给John 1美元。
(1)列出收益矩阵。
(2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少?
答:(1)此博弈的收益矩阵如下表。
该博弈是零和博弈,无纳什均衡。
(2)Smith 选(1/3,1/3,1/3)的混合概率时,
John 选1的效用为:3
1131131)3(311-=⨯+⨯+-⨯=U John 选2的效用为:3
1131)3(311312-=⨯+-⨯+⨯=U John 选3的效用为:3
1)3(311311313-=-⨯+⨯+⨯=U 类似地,John 选(1/3,1/3,1/3)的混合概率时, Smith 选1的效用为:3
1)1(31)1(31331'1=-⨯+-⨯+⨯=U Smith 选2的效用为:3
1)1(31331)1(31'2=-⨯+⨯+-⨯=U Smith 选3的效用为:3
1331)1(31)1(31'3=⨯+-⨯+-⨯=U
因为321U U U ==,'3
'2'1U U U ==,所以: ⎥⎦
⎤⎢⎣⎡)31,31,31(),31,31,31(是纳什均衡,策略值分别为John :31-=U ;Smith :31'
=U 。
这个也是据说的去年原题 古诺模型 斯塔伯格模型我觉得还是很重要的 4、假设双头垄断企业的成本函数分别为:1120Q C =,2222Q C =,市场需求曲线为
Q P 2400-=,其中,21Q Q Q +=。
(1)求出古诺(Cournot )均衡情况下的产量、价格和利润,求出各自的反
应和等利润曲线,并图示均衡点。
(2)求出斯塔克博格(Stackelberg )均衡情况下的产量、价格和利润,并以图形表示。
(3)说明导致上述两种均衡结果差异的原因。
答:(1)对于垄断企业1来说:
2
19020)](2400max[211
121Q Q Q Q Q Q -=
⇒-+- 这是垄断企业1的反应函数。
其等利润曲线为:21211122380Q Q Q Q --=π 对垄断企业2来说:
4
502)](2400max[122
2
221Q Q Q Q Q Q -=⇒-+- 这是垄断企业2的反应函数。
其等利润曲线为:22212242400Q Q Q Q --=π 在达到均衡时,有:
⎩⎨⎧==⇒⎪
⎭⎫ ⎝⎛
--=30
80245019021
11Q Q Q Q 均衡时的价格为:180)3080(2400=+⨯-=P 两垄断企业的利润分别为:
12800802308028038021=⨯-⨯⨯-⨯=π
3600304308023040022=⨯-⨯⨯-⨯=π
均衡点可图示为:
(2)当垄断企业1为领导者时,企业2视企业1的产量为既定,其反应函数为:
4/5012Q Q -=
则企业1的问题可简化为:
⎩⎨⎧==⇒-⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛
-+-3
/803/280204502400max 21
1
111Q Q Q Q Q Q
均衡时价格为:16038032802400=⎪⎭⎫
⎝
⎛+-=P 利润为:3/392001=π,9/256002=π 该均衡可用下图表示:
企业2领先时可依此类推。
(3)当企业1为领先者时,其获得的利润要比古诺竞争下多。
而企业2获得的利润较少。
这是因为,企业1先行动时,其能考虑企业2的反应,并以此来制定自己的生产计划,而企业2只能被动地接受企业1的既定产量,计划自己的产出,这是一种“先动优势”
题型三:子博弈完美纳什均衡
5、在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q 1-q 2-q 3,这里q i 是企业i 的产量。
每一企业生产的单位成本为常数c 。
三企业决定各自产量的顺序如下:(1)企业1首先选择q 1≥0;(2)企业2和企业3观察到q 1,然后同时分别选择q 2和q 3。
试解出该博弈的子博弈完美纳什均衡。
答:该博弈分为两个阶段,第一阶段企业1选择产量q 1,第二阶段企业2和3观测到q 1后,他们之间作一完全信息的静态博弈。
我们按照逆向递归法对博弈进行求解。
(1)假设企业1已选定产量q 1,先进行第二阶段的计算。
设企业2,3的利润函数分别为:
223212cq q )q q q a (----=π 323213cq q )q q q a (----=π
由于两企业均要追求利润最大,故对以上两式分别求一阶条件:
023212
2
=----=∂∂c q q q a q π (1)
0c q 2q q a q 3213
3
=----=∂π∂ (2) 求解(1)、(2)组成的方程组有:
3
c
q a q q 1*
3*2--=
= (3)
(2)现进行第一阶段的博弈分析: 对与企业1,其利润函数为; 113211cq q )q q q a (----=π 将(3)代入可得:
3
)
c q a (q 111--=
π (4) 式(4)对q 1求导:
0c q 2a q 11
1
=--=∂π∂ 解得:
)c a (2
1
q *1-=
(5) 此时,2*1
)c a (12
1
-=π (3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:
)c a (21q *
1-=
,)c a (6
1q q *3*2-== 题型四 重复博弈的触发机制 求δ的范围这个是重点
6、如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因子为δ。
试问δ
参考答案:
由划线法求得该博弈的纯策略纳什均衡点为(不坦白,不坦白),均衡结果为(1,1),采用触发策略,局中人i 的策略组合s 的最好反应支付
)s ,s (P max )s (i i i S s i i
i -∈=φ=5,P i (s*)=4,P i (s c
)=1。
若存在子博弈完美纳什均衡,必须满
足:41
1545)
s (P )s ()s (P )s (c
i *i *i *i =--=-φ-φ≥δ,即只有当贴现因子δ>1/4时,才存在子博弈完美纳什均衡。
7、在Bertrand 价格博弈中,假定有n 个生产企业,需求函数为P=a-Q ,其中P 是市场价格,Q 是n 个生产企业的总供给量。
假定博弈重复无穷多次,每次的价格都立即被观测到,企业使用“触发策略”(一旦某个企业选择垄断价格,则执行“冷酷策略”)。
求使垄断价格可以作为完美均衡结果出现的最低贴现因子δ是多少。
并请解释δ与n 的关系。
分析:此题可分解为3个步骤
(1)n 个企业合作,产量总和为垄断产量,价格为垄断价格,然后平分利润。
(2)其中一个企业采取欺骗手段降价,那个这家企业就占有的全部市场,获得
垄断利润
(3)其他企业触发战略,将价格降到等于边际成本,所有的企业利润为零。
参考答案:
(1)设每个企业的边际成本为c,固定成本为0
P=a-Q
TR=P*Q=(a-Q)*Q
MR=a-2Q
因为:MR=MC
a-2Q=c
则:Q=(a-c)/2
P=(a+c)/2
π=(P-c)*Q=(a-c)2/4
每家企业的利润为(a-c)2/4n
(2)假设A企业自主降价,虽然只是微小的价格调整,但足以占领整个市场,获得所有的垄断利润——(a-c)2/4
(3)其他企业在下一期采取冷酷策略,使得所有企业的利润为0
考虑:
A企业不降价: (a-c)2/4n, (a-c)2/4n,……
A企业降价: (a-c)2/4, 0,……
使垄断价格可以作为完美均衡结果,就要使得不降价的贴现值大于等于降价的贴现值。
设贴现因子为δ
A不降价的贴现值: [(a-c)2/4n][1/(1- δ)]
A降价的现值: (a-c)2/4
于是:[(a-c)2/4n][1/(1- δ)]≥ (a-c)2/4
解得:δ≥1-1/n
题型五
不完全信息下的静态博弈产生的贝叶斯均衡
详情请见PPT 302面 303面以及不完全信息下的古诺模型
8、市场进入博弈(贝叶斯均衡)
一个完全垄断企业B正在垄断一个行业市场,另一个潜在的试图进入该行业的企业A,称A为进入者,B为在位者。
A不知道B的成本特征,设B有两种可能的成本,即高成本和低成本。
两种成本情况下的博弈矩阵如表6.1。
表6.1 市场进入博弈
B
高成本低成本
A 进入
不进入
假定B 知道进入者A 的成本为高成本,且与B 为高成本时的成本相同。
假若信息是完全的,则当B 为高成本时,唯一的精炼纳什均衡为(进入,默认),另一纳什均衡(不进入,斗争)是含有不可置信的威胁。
当B 为低成本时,唯一的纳什均衡为(不进入,斗争),即若A 进入行业,具有低成本优势的B 将通过降低价格将A 逐出市场。
由于存在行业进入成本,所以A 被逐出市场后将有净的10单位进入成本的损失。
当A 不知道B 的成本情况时,他的选择将依赖于他对B 的成本类型的主观概率或先验概率密度。
设A 对B 是高成本的先验概率判断为P ,则A 认为B 为低成本的概率为P -1。
如果A 进入,其期望支付为 )10)(1()40(--+P P 如果1不进入,其期望支付为0。
当且仅当0)10)(1()40(≥--+P P 或51≥P 时,A 选择进入;反之,当5
1
<P 时,A 不进入。
于是,贝叶斯均衡为:
(进入,默认),高成本,51≥P ; (进入,斗争),低成本,5
1
≥P ;
(不进入,*),5
1
<P
其中*表示可以是斗争,也可以是默认。
不完全信息下的动态博弈产生的完美精炼贝叶斯均衡挺难的 我没找到例题,要是明天早上还有时间可以简单的找个例子说一下~。