博弈论各章节课后习题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章纳什均衡的扩展与精炼
1.什么是完全信息和不完全信息?什么是完美信息和不完美信息?在海萨尼转换中,自然对局中人类型的确定都是有限的吗?举例说明。(见教材)
2.什么是重复博弈中的策略?什么是一个重复博弈中的子博弈?什么是一个子博弈完美纳什均衡?(见教材)
3.以下(虚线框中的)子博弈的划分是否正确?
答:两个扩展式中的子博弈划分均不正确,图1中的划分对同一信息集产生了分割,图2中的子博弈不是开始于单节信息集的决策结点。
4.在双寡头古诺模型中,设逆需求函数为p=a-Q,其中Q=q 1+q 2为市场总需求,但a 有a H 和a L 两种可能的情况,并且企业1知道a 究竟是a H 还是a L ,而企业2只知道a=a H 和a=a L 的概率分别是θ和1-θ,该信息是双方都知道的。双方的总成本函数分别是cq 1和cq 2。如果两企业同时选择产量,双方的策略空间是什么?试计算出贝叶斯纳什均衡。
假设企业2的产量为q 2,企业1将选择q 1最大化利润函数
(这里a 取a H 或a L )
)c q q a (q 12111−−−=π由此得:
)
c q a (q H H 12121
−−=)
c q a (q L L 1212
1
−−=企业2将选择q 2最大化它的期望利润
)c q q a (q )()c q q a (q )(E L L H H 2212221221−−−−+−−−=θθπ由此得:]c )q )(q (a )(a [q L H L H 2112112
1
−−+−−+=
θθθθ在均衡时,q 1,q 2应满足
⎪⎪⎩
⎪⎪⎨
⎧−−+−−+=−−=]c )q )(q (a )(a [q )c q a (q L H L H 2112121112121θθθθ由此得:
企业1的策略为:
]c c a )(a [)c a (q L H H *
H 211
1216121−+−+−−=θθ]c c a )(a [)c a (q L H L *
L 2111216121−+−+−−=
θθ企业2的策略为:
]c c a )(a [q L H *212
213
1−+−+=θθ因此博弈的贝叶斯纳什均衡是:当a=a H 时,企业1生产;当a=a L 时,企业1生产,
*H q 1*
L q 1企业2生产。
*q 25.在下面的静态贝叶斯博弈中,求出所有的纯策略贝叶斯纳什均衡。
(1)自然决定收益情况是由博弈1给出,还是由博弈2给出,选择每一博弈的概率相等;(2)局中人1了解到自然选择了博弈1,还是选择了博弈2,但局中人2不知道;(3)局中人1选择行动T 或B ,同时局中人2选择行动L 或R ;(4)根据自然选择的博弈,两局中人得到相应的收益。
博弈1
博弈2
自然选择了博弈1时,局中人1选择T ,自然选择了博弈2时,局中人1选择B 。局中人2的策略是根据期望收益最大的原则确定。
局中人2的选择策略L 的期望收益为0.5×1+0.5×0=0.5,选择策略R 的期望收益为0.5×0+0.5×2=1,因此局中人2会选择策略R 。
该博弈的纯策略贝叶斯纳什均衡为:自然选择博弈1时,局中人1选择T ,自然选择博弈2时,局中人1选择B ;局中人2会选择策略R 。
6.在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q 1-q 2-q 3,这里q i 是企业i 的产量。每一企业生产的单位成本为常数c 。三企业决定各自产量的顺序如下:(1)企业1首先选择q 1≥0;(2)企业2和企业3观察到q 1,然后同时分别选择q 2和q 3。试解出该博弈的子博弈完
L R L R T 1,10,0T 0,00,0B
0,0
0,0
B
0,0
2,2
美纳什均衡。
答:该博弈分为两个阶段,第一阶段企业1选择产量q 1,第二阶段企业2和3观测到q 1后,他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。
(1)假设企业1已选定产量q 1,先进行第二阶段的计算。设企业2,3的利润函数分别为:
223212cq q )q q q a (−−−−=π3
23213cq q )q q q a (−−−−=π由于两企业均要追求利润最大,故对以上两式分别求一阶条件:
(1)0c q q 2q a q 3212
2
=−−−−=∂π∂(2)
0c q 2q q a q 3213
3
=−−−−=∂π∂求解(1)、(2)组成的方程组有:
(3)
3
c
q a q q 1*
3*2−−=
=(2)现进行第一阶段的博弈分析:对与企业1,其利润函数为;
1
13211cq q )q q q a (−−−−=π将(3)代入可得:
(4)
3
)
c q a (q 111−−=
π式(4)对q 1求导:
0c q 2a q 11
1
=−−=∂π∂解得:
(5)
)c a (2
1
q *1−=
此时,2*
1)c a (12
1
−=
π(3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:
,)c a (21q *
1−=
)c a (6
1q q *3*2−==7.如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因子为δ。试问
δ应满足什么条件,才存在子博弈完美纳什均衡?
由划线法求得该博弈的纯策略纳什均衡点为(不坦白,不坦白),均衡结果为(1,1),采用触发策略,局中人i 的策略组合s 的最好反应支付=5,P i (s*)=4,P i (s c )=1。若存
)s ,s (P max )s (i i i S s i i
i −∈=φ在子博弈完美纳什均衡,必须满足:,即只有当贴现因子>1/44
1
1545)s (P )s ()s (P )s (c i *i *i *i =−−=−φ−φ≥
δδ时,才存在子博弈完美纳什均衡。
乙
甲坦白不坦白坦白4,40,5不坦白
5,0
1,1