博弈论各章节课后习题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章纳什均衡的扩展与精炼
1.什么是完全信息和不完全信息?什么是完美信息和不完美信息?在海萨尼转换中,自然对局中人类型的确定都是有限的吗?举例说明。
(见教材)
2.什么是重复博弈中的策略?什么是一个重复博弈中的子博弈?什么是一个子博弈完美纳什均衡?(见教材)
3.以下(虚线框中的)子博弈的划分是否正确?
答:两个扩展式中的子博弈划分均不正确,图1中的划分对同一信息集产生了分割,图2中的子博弈不是开始于单节信息集的决策结点。
4.在双寡头古诺模型中,设逆需求函数为p=a-Q,其中Q=q 1+q 2为市场总需求,但a 有a H 和a L 两种可能的情况,并且企业1知道a 究竟是a H 还是a L ,而企业2只知道a=a H 和a=a L 的概率分别是θ和1-θ,该信息是双方都知道的。
双方的总成本函数分别是cq 1和cq 2。
如果两企业同时选择产量,双方的策略空间是什么?试计算出贝叶斯纳什均衡。
假设企业2的产量为q 2,企业1将选择q 1最大化利润函数
(这里a 取a H 或a L )
)c q q a (q 12111−−−=π由此得:
)
c q a (q H H 12121
−−=)
c q a (q L L 1212
1
−−=企业2将选择q 2最大化它的期望利润
)c q q a (q )()c q q a (q )(E L L H H 2212221221−−−−+−−−=θθπ由此得:]c )q )(q (a )(a [q L H L H 2112112
1
−−+−−+=
θθθθ在均衡时,q 1,q 2应满足
⎪⎪⎩
⎪⎪⎨
⎧−−+−−+=−−=]c )q )(q (a )(a [q )c q a (q L H L H 2112121112121θθθθ由此得:
企业1的策略为:
]c c a )(a [)c a (q L H H *
H 211
1216121−+−+−−=θθ]c c a )(a [)c a (q L H L *
L 2111216121−+−+−−=
θθ企业2的策略为:
]c c a )(a [q L H *212
213
1−+−+=θθ因此博弈的贝叶斯纳什均衡是:当a=a H 时,企业1生产;当a=a L 时,企业1生产,
*H q 1*
L q 1企业2生产。
*q 25.在下面的静态贝叶斯博弈中,求出所有的纯策略贝叶斯纳什均衡。
(1)自然决定收益情况是由博弈1给出,还是由博弈2给出,选择每一博弈的概率相等;(2)局中人1了解到自然选择了博弈1,还是选择了博弈2,但局中人2不知道;(3)局中人1选择行动T 或B ,同时局中人2选择行动L 或R ;(4)根据自然选择的博弈,两局中人得到相应的收益。
博弈1
博弈2
自然选择了博弈1时,局中人1选择T ,自然选择了博弈2时,局中人1选择B 。
局中人2的策略是根据期望收益最大的原则确定。
局中人2的选择策略L 的期望收益为0.5×1+0.5×0=0.5,选择策略R 的期望收益为0.5×0+0.5×2=1,因此局中人2会选择策略R 。
该博弈的纯策略贝叶斯纳什均衡为:自然选择博弈1时,局中人1选择T ,自然选择博弈2时,局中人1选择B ;局中人2会选择策略R 。
6.在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q 1-q 2-q 3,这里q i 是企业i 的产量。
每一企业生产的单位成本为常数c 。
三企业决定各自产量的顺序如下:(1)企业1首先选择q 1≥0;(2)企业2和企业3观察到q 1,然后同时分别选择q 2和q 3。
试解出该博弈的子博弈完
L R L R T 1,10,0T 0,00,0B
0,0
0,0
B
0,0
2,2
美纳什均衡。
答:该博弈分为两个阶段,第一阶段企业1选择产量q 1,第二阶段企业2和3观测到q 1后,他们之间作一完全信息的静态博弈。
我们按照逆向递归法对博弈进行求解。
(1)假设企业1已选定产量q 1,先进行第二阶段的计算。
设企业2,3的利润函数分别为:
223212cq q )q q q a (−−−−=π3
23213cq q )q q q a (−−−−=π由于两企业均要追求利润最大,故对以上两式分别求一阶条件:
(1)0c q q 2q a q 3212
2
=−−−−=∂π∂(2)
0c q 2q q a q 3213
3
=−−−−=∂π∂求解(1)、(2)组成的方程组有:
(3)
3
c
q a q q 1*
3*2−−=
=(2)现进行第一阶段的博弈分析:对与企业1,其利润函数为;
1
13211cq q )q q q a (−−−−=π将(3)代入可得:
(4)
3
)
c q a (q 111−−=
π式(4)对q 1求导:
0c q 2a q 11
1
=−−=∂π∂解得:
(5)
)c a (2
1
q *1−=
此时,2*
1)c a (12
1
−=
π(3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:
,)c a (21q *
1−=
)c a (6
1q q *3*2−==7.如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因子为δ。
试问
δ应满足什么条件,才存在子博弈完美纳什均衡?
由划线法求得该博弈的纯策略纳什均衡点为(不坦白,不坦白),均衡结果为(1,1),采用触发策略,局中人i 的策略组合s 的最好反应支付=5,P i (s*)=4,P i (s c )=1。
若存
)s ,s (P max )s (i i i S s i i
i −∈=φ在子博弈完美纳什均衡,必须满足:,即只有当贴现因子>1/44
1
1545)s (P )s ()s (P )s (c i *i *i *i =−−=−φ−φ≥
δδ时,才存在子博弈完美纳什均衡。
乙
甲坦白不坦白坦白4,40,5不坦白
5,0
1,1
8.假设有一博弈G=[N,S,P],其中N={1,2},S 1=[0,50],S 2=[0,50],,
212
111s s 10s 10s 100)s (P +−=,i=1,2。
(1)求纳什均衡点;(2)在纳什均衡下的最优反应函数;(3)若该
212222s s 10s 15s 200)s (P +−=博弈重复无限次,是否存在触发策略构成的子博弈完美纳什均衡,其条件是什么?解:局中人1,2的最优反应函数分别为:
s 1=5+1/2s 2s 2=20/3+1/3s 1
由此得唯一的纯策略纳什均衡点:s c =(10,10).相应的有P(s c )=(1000,1500).容易求得s *=(35,30),相应的有P(s *)=(1750,3000),.
)5042,4000()s (*=φ当时,存在触发策略构成的子博弈完美
576.01500
50423000
5042,75.0100040001750400021=−−≥δ=−−≥
δ纳什均衡(s *,s c )
9.求如图所示完全信息动态博弈的子博弈完美纳什均衡(图中数字(a,b,c)分别表示局中人1、2、3的收益)。
答:局中人1采取A 2行动,局中人2采取行动B 1时,局中人3必然采取C
2行动(因为3<6),因而该博弈的顶点只能是(7,6,6)。
同样对于局中人3右边一个子博弈,必然采取C 1行动(9>2),因而该博弈的顶点只能是(2,1,9)。
进而原博弈简化为:
这时,假设局中人1采取行动A
1,对于左边一个子博弈,局中人3必定采取行动C 2(3<8),因而在该子博弈顶点的结果只会是(1,7,8).同样,若局中人1采取行动A 2,此时局中人2必然采取行动B 1(6>1),因而在该子博弈顶点的结果只会是(7,6,6).进而,该博弈又简化为:
这时,局中人1必然选择行动A 2(1<7)。
由于局中人1选择A 2时,局中人2选择B 1,进而局中人3选择C 2。
因此,策略组合(A 2,B 1,((A 1,C 2),(B 1,C 2),(B 2,C 1)))构成整个博弈的子博弈完美纳什均衡(这里(A 1,C 2)表示如果局中人1选择A1,则局中人3选择C2,对(B 1,C 2),(B 2,C 1)的解释类似)。
10.考虑如下诉讼威胁博弈。
如果提起诉讼的话,局中人1为原告,局中人2为被告,博弈顺序如下:
(1)原告决定是否指控被告,指控的成本是c 1;(2)如果决定指控的话,在告上法庭之前,原告提出一个无协商余地的赔偿金额s 以私了;(3)被告决定接受还是拒绝原告的要求;(4)如果被告拒绝原告的要求,原告决定是放弃还是上法庭,自己的成本是c 2,给被告带来的成本是d ;(5)如果告上法庭,原告以概率P 胜诉而获得赔偿r ,否则什么也得不到。
试问胜诉概率P 满足什么条件时,原告的诉讼威胁才是可信的?
,-s)
12,1一)局中人1不指控局中人2时两个人的收益均为0
二)局中人1决定指控局中人2,在告上法庭之前,局中人1提出一个无协商余地的赔偿金额s 以私了,
(1)当局中人2接受要求时局中人的收益为s-c 1;局中人2的收益为-s ;(2)当局中人2拒绝局中人1的要求,
1)局中人1放弃上诉时,局中人1的收益为-c 1,局中人2的收益为0;
2)当局中人1起诉时,局中人1的期望收益为Pr-(c 1+c 2);局中人2的期望收益为-Pr-d 因此,当局中人1的期望收益P r -(c 1+c 2)>max{0,s-c 1},即P>max{(c 1+c 2)/r,(s+c 2)/r}时原告的诉讼威胁是可信的。
11.在伯川德模型中,假定有n 个生产企业,需求函数为(b>0),其中p i 是企业i
∑≠=+−=n
i
j 1j j
i i p
b
p a q 的定价,q i 是企业i 的需求量。
假设企业生产没有固定成本,并且边际成本为常数c,c<a.假定博弃重复无穷多次,每次的价格都立即被观察到,企业使用触发策略。
求使垄断价格可以作为完美均衡结果出现的最低贴现因子δ,并解释δ与n 的关系。
分以下几个步骤进行。
1)计算纳什均衡
当企业i 选择价格p i ,其它企业选择价格p j (j=1,2,…,n,j≠i)时,企业i 的利润为:,i=1,2,…,n
))p p p p p (b p a )(c p (q )c p (n 1i 1i 21i i i i i +++++++−−=−=π+−⋯⋯价格组合()若是纳什均衡,则对每个企业i,应是如下最优问题的解:c n c 2c 1p ,,p ,p ⋯c
i p ))
p p p p p (b p a )(c p (max *n *1i *1i *2*1i i p 0i ++++++−−+−∞
<≤⋯⋯
求解该问题,得;
i=1,2,..,n
)p b c a (21
p n
i
j 1
j c j c
i ∑
≠=++=解该方程组,得:,i=1,2,…,n
b
)1n (2c
a p c i −−+=
企业i 的利润为:2
c i )
b
)1n (2)1n (bc c a (
−−−+−=π2)计算垄断情况下的价格
若n 家企业合并为一家,即形成垄断价格,则n 家企业的价格相同,即p 1=p 2=…=p n .
可求得总利润最大时的价格为:)
1b )1n ((2a
c )1b )1n ((p *i
−−−−−=那么每个企业的利润为(这里(n-1)b<1)
1
b )1n ()
c )1b )1n ((a (412*
i
−−−−+−=π易证,即在垄断价格下,各企业的利润增加了。
c
i *i π>π3)计算使垄断价格可以作为完美均衡结果出现的最低贴现因子δ,并解释δ与n 的关系。
2
*i ))
1b )1n ((4)a c )1b )1n (((b )1n (2c a (
)p (−−−−−−−−=φ当时,触发策222
2c i *i *i
*i )b
)1n (2)1n (bc c a ())1b )1n ((4)a c )1b )1n (((b )1n (2c a (1b )1n ()c )1b )1n ((a (41))1b )1n ((4)a c )1b )1n (((b )1n (2c a ()p ()p (−−−+−−−−−−−−−−−−−−++
−−−−−−−−=
π−φπ−φ≥δ略(p *,p c )是子博弈完美纳什均衡.
12.有一在位企业生产某种产品,其成本可能低,也可能高。
该企业可以选择低价或高价两种策略。
另一企业准备进入生产同类产品,但完全不知道在位企业的生产成本是高还是低,只能观察到其价格是低价还是高价。
其具体收益见下面博弈的扩展式表述。
求该博弈的子博弈完美贝叶斯纳什均衡。
该题的求解与第115页例题类似。
13.求例3.4.1的子博弈完美贝叶斯纳什均衡。