博弈论练习题 第一组 参考答案

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(3)宝玉和段誉的心理支付矩阵如下:
黛玉
C
D
C (4+4r, 4+4r) 宝玉 D (6, 6r)
(6r, 6) (2+2r, 2+2r)
由原题目,(C,C)是一个纳什均衡,由于它是对称的,因此只需要解宝玉的选 择即可确定r的取值范围,对宝玉而言,4+4r>6,6r>2+2r,解得r>1/2。
若 1 ﹤r﹤ 1 ,则6>4+4r,2+2r>6r,故而D是宝玉和黛玉的占优策略,均衡在(D,
博弈论练习题第一组 第一章 囚徒困境与经典矩阵博弈
习题集(2011年9月30日)
1.(单项选择)甲乙两人各在纸片上写下“合作”或“斗争”两词,然后双方同
时翻开纸片。如果两人都写“合作”,每人各得100元;若两人都写“斗争”,
两人什么也得不到;若一人写“斗争”,另一人写“合作”,则:“合作”
者得S, “斗争”者得 T。要使“斗争”为占优策略,S和T必须是( )。
A.S+T>200
B.S<T, T>100
C.S<0,T>100
D.以上都不是
解答,答案为C,写出这个博弈的支付矩阵如下:

合作
斗争
合作 (100, 100) (S, T) 甲 斗争 (T, S) (0, 0)
由于这个博弈是对称的,因此,只需要解其中一个人的最优反应即可(对于 对称博弈而言,两个人的占优策略及其支付是完全相同的),我们不妨解 乙的反应。要使“斗争”为占优策略,意味着无论甲选择什么行动,对于 乙而言,斗争总是好于合作,于是,若甲选择合作,那么乙选择斗争的收 益是T,选择合作的收益是100,因此T>100;若甲选择斗争,乙选择斗争的 收益是0,选择合作的收益是S,要使对于乙而言斗争好于合作,则0>S。因 此要选C。
求x的取值范围)。
(2)(困难)假设在这个博弈中,你看不到具体的支付,也不知道G和H代表的
是“合作”还是“不合作”,你只知道这是一个囚徒困境博弈,假设你想用
罚款的方式来促进A和B的合作。此时你应当如何设计罚款方案,而使“合作,
合作”成为一个纳什均衡?
B
G
H
AG
%,%
&,*
H
*,&
#,#
解答:(1)如果对不合作的人罚款x元,则收益矩阵改为
2. 某博弈中甲乙双方各有三个策略,其相应的支付矩阵如下图所示: 问: (1)甲会不会采用策略A,为什么? (2)请剔除上述支付矩阵里的占劣策略。 (3)请找出该博弈的纯策略纳什均衡。
A 甲B
C
D 3,7 4,2 3,7
乙 E
3,5 2,7 4,8
F 1,2 6,4 2,5
1
答案:1)甲不会采用策略A,策略A是甲的劣策略,它是劣于C的。 2)对于甲而言,A是一个劣策略。对于乙而言,F是一个劣策略(做到这一步即
B
合作
不合作
A 合作
2,2
0,3-x
不合作
3-x,0
1-x,1-x
现在(合作,合作)是纳什均衡,亦即2>3-x,0>1-x,联合两式子,解得x>1。也 就是至少要对不合作的人罚款1元。
(2)这个题目的困难之处在于不知道G和B代表什么,也不知道具体的支付情况, 因此,你是不能对G或H的特定行为去罚款的,即使你认为初次达到的均衡是 一个囚徒困境中最坏的结果,你也不能确定罚款的数额。
值范围是多少?假设 1 ﹤r﹤ 1 ,那么纯策略纳什均衡解是什么?
3
2
2
解答:(1)这个博弈的货币收益矩阵如下:
B
C
D
C
AD
(4, 4) (6, 0)
(0, 6) (2, 2)
这是一个囚徒困境博弈,该博弈的占优策略均衡是(D,D)。
(2)段誉和王语嫣的心理支付矩阵如下:
王语嫣
C
ห้องสมุดไป่ตู้
D
C (4+4r, 4) 段誉 D (6, 0)
但是,可以这样设想,我们不需要把囚徒困境转变成一个囚徒顺境,只需要把它 转变成一个协调博弈。
根据这一思路,只需设计这样一个罚款制度:如果观察到(G,H)或(H,G), 不妨设支付较高的一方的支付为*,则应对其处以(*-&)数额以上的罚款, 这样,就把囚徒困境博弈变成了一个协调博弈,此时,“合作,合作”是纳 什均衡(但不是占优策略纳什均衡)。
4
6.一个支付组合是帕累托有效率的,当且仅当没有任何其他的支付组合可以同时 改善所有人的处境。假定A和B两人组成一个社会,可能的支付组合如下:
组合1(200,200),组合2(0,300),组合3(300,0),组合4(100,100), (这里(200,200)表示A的支付为200,B的支付为200)。 (1)假定只有如上可能的四个支付组合。找出下列支付组合中帕累托有效率的
5
可算正确)。 但当剔除了A和F这两个策略后,对乙而言,D又变成了劣策略,可以剔除。 当剔除了A,F,D之后,对甲而言,B是劣策略,可以剔除。因此,纳什均衡是(C,E)
(做到这一步也是正确的,且可以一并解决问题3) 3)可以用重复剔除劣策略法,如上,纳什均衡为(C,E)。也可以用最优反应
法(用红色数字标出),答案相同。
(6r, 6) (2+2r, 2)
“该博弈最后的均衡结果是段誉往王语嫣的衣袋里放了1元钱,而王语嫣也往自 己的衣袋里放了1元钱”,亦即根据原题目,(C,D)是一个纳什均衡。 余江锋的解法:对于王语嫣而言,D是一个占优策略,因此不需考虑王语嫣选择C 策略的情况。当王语嫣选择D的时候,段誉选择C好于D,就可以使(C,D)成为 纳什均衡。 故令6r>2+2r,解得r>1/2。
步骤2:两人的最优反应的组合即是纳什均衡。即(U,L)和(D,R)(注意不要 写(6,2),(2,6))。
这个博弈在经典矩阵博弈中叫做“协调博弈”。 4.A和B手中各有一个魔瓶,魔瓶中各有1元钱,他们可以把这1元钱从魔瓶取出放
入自己的衣袋,也可以把这1元钱放入对方的衣袋。但是,如果放入自己的衣 袋,这1元钱会变为2元钱,如果放入对方的衣袋,这1元钱会魔术般地变为4 元。 (1)假设A和B互不关心,只关心自己的收益,他们各自的备选行动是“把1元钱 放入自己的口袋”(可用字母D表示),“把1元钱放入对方的口袋”(可用 字母C表示)(注意只有这两个备选行动,没有其他可能的行动),写出该博 弈的货币收益矩阵,并解出它的占优策略均衡。 (2)假设A是段誉王子,B是王语嫣姑娘,段誉非常喜欢王语嫣,在计算自己的 支付时,段誉会把王语嫣的收入乘以r加在自己的收入上,而王语嫣则并不关 心段誉,她只计算自己的货币收入,例如,如果段誉有x元钱,王语嫣有y元 钱,则段誉的心理支付是x+ry,而王语嫣的心理支付为y。如果该博弈最后的 均衡结果是段誉总是往王语嫣的衣袋里放1元钱,而王语嫣也往自己的衣袋里 放了1元钱,问r的取值范围是多少? (3)假设A是贾宝玉,B是林黛玉,两人互相关爱对方,因此,在计算自己的心 理支付时,两人互相把对方的收入乘以r加在自己的收入上,例如,如果宝玉 有x元钱,黛玉有y元钱,则宝玉的心理支付是x+ry,而黛玉的心理支付为y+rx。 如果该博弈最后的均衡结果是双方都总是往对方的衣袋里放1元钱,问r的取
支付。 (2)在一个囚徒困境博弈里面(例如可考虑习题5中的囚徒困境博弈),找出帕
累托有效的支付。帕累托有效的支付是否是纳什均衡? 答案:1)在四种状态中,帕累托有效率的支付是组合1-3,组合4是帕累托无效
率的(组合1可以同时改善两人的支付)。 2)在囚徒困境博弈中,帕累托有效的支付不是纳什均衡。
7.假定A和B一起参加一场奇特的拍卖,拍品是100元人民币,拍卖规则是价高者 得到100元,并付给拍卖商自己的出价,出价低者完全丧失自己的出价(例如, 若A出价50元,B出价40元,则A的净收入为50元(即100元减去50元出价),而B 净损失40元),如果出价相同,则每人得50元,但需要支付给拍卖行自己的出价。 现在,假定在这场拍卖中A和B只有两个策略,C——出价90元,D——出价120元, 假定两人是同时出价(各写一个纸条交给拍卖商,由拍卖商根据A和B出价的多少 和以上的博弈规则决定100元的分配)。 (1)写出此时两人的收益矩阵,并计算出纳什均衡,写出纳什均衡下的双方净 收入。 (2)这个博弈可以对应于真实世界中的哪些情况?
3.(05年北京大学考研题)求下列博弈的纯策略纳什均衡。这个博弈在经典矩阵 博弈的名称是什么? 参与人 2
参与人 1 U D
L (2, 6) (0, 0)
R (5, 5) (6, 2)
答:步骤 1:先找两人的最优反应,用划圈法。(注意:划圈的时候,要记住, 如果找列参与人的最优策略,就要固定行参与人的行动。反之亦然)。
(1)这个博弈的收益矩阵如下:
C
C (-40, -40)
A
D (-20, -90)
B D
(-90, -20) (-70, -70)
用最优反应法可知,纳什均衡是(D,D),双方的净收入均为-70。
(2)这个博弈其实不是真正的拍卖(虽然也有这样的拍卖,但不典型),但它 很好地刻画了现实生活中的过度、恶性竞争。现实中人们在不断地竞争,但并不 是所有竞争都是过度竞争,过度竞争发生的条件,就是“如果一方输了,投入会 完全沉没掉”,“赢家通吃”,例如公司研发产品,价格战,考研,军备竞赛…… 在“不能输”的刺激下,各方都加紧投入,结果是两败俱伤,所谓“太宗皇帝真 长策,赚得英雄尽白头”。
3
2
D)点上达到。
3
5.考虑下面的囚徒困境博弈:
B
合作
A 合作
2,2
不合作
3,0
不合作 0,3 1,1
此时囚徒困境博弈的均衡是(不合作,不合作)。
(1)假设你想用对不合作者罚款的方法促进A和B的合作。为了使(合作,合作)
成为一个占优策略纳什均衡,你需要对不合作者罚款多少元?
(假设你可以观察到谁不合作,而且对不合作的人征缴罚款x元,这个题是让你
相关文档
最新文档