高鸿业《西方经济学(微观部分)》章节习题精编详解(第十章 博弈论初步)(第6版)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十章博弈论初步
一、名词解释
1.纳什均衡
答:纳什均衡又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰·纳什的名字命名。
纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略的情况下,他选择了最好的策略。
纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而没有人有积极性去打破这个均衡。
2.囚徒困境
答:囚徒困境指两个被捕获的囚徒之间的一种特殊“博弈”,说明为什么在合作对双方都有利时,保持合作也是困难的。
具体情况如下:两囚徒被指控是同案犯。
他们被分关在不同的牢房里且无法互通信息,各囚徒都被要求坦白罪行。
如果两囚徒都坦白,则各将被判入狱5年;如果两人都不坦白,则各将被判入狱2年;如果一方坦白另一方不坦白,则坦白方入狱1年,另一方入狱10年。
下面的支付矩阵列明了两囚徒选择的结果。
如果囚徒A不坦白,他就冒着被囚徒B利用的危险,因为不管囚徒A怎么选择,坦白总是
囚徒B的最优方案。
同样,坦白也总是囚徒A的最优方案。
总之,从上面可以看出,对囚徒个人而言,选择坦白总比不坦白收益高,但从两人的支付总和来看,双方都不坦白的收益是最高的。
因此,囚徒困境揭示了社会和经济生活中的一种普遍情况,即“个人理性”与“集体理性”之间的矛盾。
它意味着个人理性并不是实现集体理性的充分条件。
二、判断题
1.每一个博弈至少存在一个纯策略纳什均衡。
()
【答案】F
【解析】在纯策略的博弈中,并不一定存在纳什均衡。
但是,如果允许行为人使他们的策略随机化,即对每一项选择都指定一个概率,再按照这些概率做出选择,则至少可以得到一个纳什均衡,这样的均衡称为混合策略纳什均衡。
2.企业之间的串谋是不稳定的,因为串谋的结果不是纳什均衡。
()
【答案】T
【解析】对于串谋而言,当其他串谋参与人不改变自己的策略,即控制产量或控制价格时,任何一个参与人都存在多生产或降低价格的诱惑,也就是他们的最优选择是改变自己的策略,所以串谋不是一种纳什均衡状态。
当每一个参与者都这样考虑的时候,串谋就是不稳定的。
三、单项选择题
1.下列博弈(支付矩阵如表10-1所示)中的混合策略均衡是()。
表10-1 行动主体1、2的支付矩阵
A .1采取的概率是3/7,采取的概率是4/7;2采取的概率是3/7,采取的概率是4/7
B .1采取的概率是4/7,采取的概率是3/7;2采取的概率是4/7,采取的概率是3/7
C .1采取的概率是4/7,采取的概率是3/7;2采取的概率是3/7,采取的概率是4/7
D .1采取的概率是1/2,采取的概率是1/2;2采取的概率是1/2,采取的概率是1/2
【答案】C
【解析】设1选“”的概率为,2选“”的概率为。
混合策略均衡表明,在2以概率选择“”,以概率()选择“”时,1选择“”或“”的收益是无差异
的;同理,在1以概率选择“”,以概率()选择“”时,2选择“”或“”
的收益是无差异的。
因此,对1来说,可以列出等式
;对2来说,。
求解可得,。
2.在一条狭窄巷子里,两个年青人骑着自行车相向而行。
每个人都有两个策略,即选择“冲过去”或者选择“避让”。
如果选择“避让”,不管对方采取什么策略,他得到的收益都是0。
A B U D A B U D A B U D A B U D A p U q q U 1q -D A B p A 1p -B U D ()()
801061q q q q ⨯+⨯-=⨯+⨯-()()301041p p p p ⨯+⨯-=⨯+⨯-47p =
37q =
如果其中一人采取“冲过去”的策略,如果对方采取“避让”,那么他得到的收益是9;如果对方不避让,那么他得到的收益是-36。
这个博弈有两个纯策略纳什均衡和( )。
A .一个混合策略纳什均衡,即两人都以80%概率选择“避让”,以20%的概率选择“冲过去”
B .两个混合策略纳什均衡,即每个年青人轮流采取避让或者冲过去
C .一个混合策略纳什均衡,即一人以80%的概率选择“避让”,另一人以20%的概率选择“冲过去”
D .一个混合策略纳什均衡,即两人都以40%的概率选择“避让”,以60%的概率选择“冲过去”
【答案】A
【解析】根据题中条件,收益矩阵如表10-2所示。
表10-2 甲乙的支付矩
从收益矩阵可以看出,这个博弈有两个纯策略纳什均衡(9,0),(0,9)。
甲选择冲过去的
概率为,乙选择冲过去的概率为,则有:
,,可得存
在一个混合策略纳什均衡为(0.2,0.2)。
四、简答题
1.设在一个同时博弈中,包括A 和B 两个参与人,且每个参与人均有三个纯策略。
当把A 与B 的策略分别放在矩阵的左边和上边时,他们的支付矩阵分别为:
r c ()36910c c -+-=()36910r r -+-=
A 的支付矩阵
B 的支付矩阵 试确定它的纯策略纳什均衡。
答:根据条件策略下划线法,在A 的支付矩阵的每一列的最大值和B 的支付矩阵的每一行的最大值下划线后得到:
A 的支付矩阵
B 的支付矩阵 再将A 与B 的支付矩阵合并后得到
A 与
B 的共同支付矩阵 其中,只有第一行第一列的两个数字之下都有下划线。
在该博弈中,与第一行第一列相应的策略组合是其唯一的纳什均衡。
2.在货币政策博弈中,博弈双方货币当局和工会的策略分别是:是否增加货币供给和是否提高工资。
其支付矩阵(用货币测度的好处)如表10-3所示。
表10-3 货币政策博弈
说明:
(1)单期静态博弈的结果。
(2)根据跨期博弈讨论“规则”及其信誉。
230123222⎛⎫ ⎪= ⎪ ⎪⎝
⎭212322032⎛⎫ ⎪= ⎪ ⎪⎝⎭230123222⎛⎫ ⎪= ⎪ ⎪⎝⎭212322032⎛⎫ ⎪= ⎪ ⎪⎝
⎭2,23,10,21,32,23,22,02,32,2⎛⎫ ⎪= ⎪ ⎪⎝
⎭
答:(1)单期静态博弈的结果为(增加工资,增加货币供给),这是一个纳什均衡,对应的支付为(2,2)。
工会增加工资,政府增加货币供给,政府得益为2;政府不增加货币供给,政府得益为1。
工会不增加工资,政府增加货币供给,政府得益为8;政府不增加货币供给,政府得益为6。
因此,无论工会增加工资与否,政府的最优策略都是增加货币供给,于是可以肯定政府会增加货币供给。
面对政府增加货币供给,工会的最优策略就是增加工资。
所以,在货币政策博弈中,单期静态博弈的结果就是,政府增加货币供给,工会增加工资。
此时政府、工会得到的支付都不是最大的。
(2)在动态博弈的条件下,参与者的策略选择是相互影响的,由于博弈参与者的行动有先有后,后行动者又能观察到先行动者的行为,其间就会产生一个可信性问题。
后行动者可以承诺采取对先行动者有利的行为,也可以威胁先行动者,以使先行动者不得不采取对后行动者有利的策略。
承诺与威胁就存在一个可信性的问题。
在跨期博弈中,如果政府和工会信誉良好,且与工会约定不增加货币供给,工会不增加工资,一旦一方违约另一方必然采取相反的策略,这样会使得双方选择(不增加工资,不增加货币供给)的策略组合,此时的支付组合为(6,6)。
一旦有一方(如政府)擅自违反约定增加货币供给,则在以后的博弈中,工会很难再相信政府的承诺,不论政府如何保证不会增加货币供给,工会都会选择增加工资的策略组合,即政府的信誉一旦受损很难恢复。
因此博弈双方良好的信誉有利于摆脱“囚徒困境”,但信誉是脆弱的,一旦受损又将陷入使双方都不利的困境。
五、计算题。