策略博弈习题部分解答
完整第十章 习题答案
第十章博弈论开端1.什么是纳什平衡?纳什平衡必定是最优的吗?解答:(1)所谓纳什平衡,是参加人的一种战略组合,在该战略组合上,任何参加人独自改动战略都不会掉掉落益处。
(2)不必定。
纳什平衡能够是最优的,也能够不是最优的。
比方,在存在多个纳什平衡的状况下,此中有一些纳什平衡就不是最优的;即便在纳什平衡是独一时,它也能够不是最优的——因为与它相对应的领取组合能够会小于与其余战略组合相对应的领取组合。
2.在只要两个参加人且每个参加人都只要两个战略可供选择的状况下,纯战略的纳什平衡最多可有多少个?什么原因?解答:在只要两个参加人(如A跟B)且每个参加人都只要两个战略可供选择的状况下,纯战略的纳什平衡最多可有四个。
比方,当A与B的领取矩阵可分不表现如下时,总的领取矩阵中一切四个单位格的两个数字均有下划线,从而,统共有四个纳什平衡。
A的领取矩阵=B的领取矩阵=3.在只要两个参加人且每个参加人都只要两个战略可供选择的状况下,纯战略的纳什平衡能够有三个。
试举一例阐明。
解答:比方,当参加人A与B的领取矩阵可分不表现如下时,总的领取矩阵中恰恰有三个单位格的两个数字均有下划线,从而,统共有三个纳什平衡。
A的领取矩阵=B的领取矩阵=4.在只要两个参加人且每个参加人都只要两个战略可供选择的状况下,怎样寻到一切的纯战略纳什平衡?解答:可运用前提战略下划线法。
详细步调如下:起首,设两个参加人分不为左参加人跟上参加人,并把全部的领取矩阵剖析为这两个参加人的领取矩阵;其次,在左参加人的领取矩阵中,寻出每一列的最年夜者,并在其下划线;再次,在上参加人的领取矩阵中,寻出每一行的最年夜者,并在其下划线;再再次,将曾经划好线的两个参加人的领取矩阵再兼并起来,掉掉落带有下划线的全部领取矩阵;最初,在带有下划线的全部领取矩阵中,寻到两个数字之下均划有线的一切的领取组合。
这些领取组合所代表的战略组合确实是纳什平衡。
5.设有A、B两个参加人。
关于参加人A的每一个战略,参加人B的前提战略有无能够不止一个。
博弈论战略分析入门课后练习题含答案
博弈论战略分析入门课后练习题含答案题目翻译:
1.两个人轮流选择从1到7之间的数字,不能重复选择,哪个人最后选
择7就赢了。
如果两个人都采用最优策略,第一个选择数字的人能否保证获胜?
2.有两个球队A和B,比赛规则为A队挑选一个数字k,B队猜测这个
数字是奇数还是偶数。
如果B队猜错了,A队获胜;反之,B队获胜。
如果A队更喜欢奇数,那么它们应该挑选多少奇数呢?
解答:
1.第一个选择数字的人不能保证获胜,因为第二个人可以选择数字4,
让第一个人面临两个选择:选择数字2或6。
无论哪个数字,第二个人都可以接下来选择数字3,然后赢得游戏。
所以第一个人不能获胜。
2.如果A队总是选择奇数,那么B队的最优策略是选择奇数。
因为如果
A队选择奇数,B队就获胜,如果A队选择偶数,B队有50%的机会猜对,平局的概率为25%,B队的总胜率为75%。
因此A队最好选择所有奇数,这样B 队只有50%的机会获胜。
思路解析:
1.对于第一道题,我们需要根据规则分析游戏的局面,然后确定最优策
略。
在此基础上,我们可以找到第一个人的必胜策略,或者证明无论如何第一个人都不能获胜。
2.对于第二道题,我们需要考虑两个球队的思考方式,并且理解如何最
小化选手的期望获胜率。
这也需要一些概率的基础知识。
以上就是本次博弈论战略分析入门课后练习题答案。
希望这些题目能够帮助您加深对博弈论和战略分析的理解,进一步提升您的分析能力和决策能力!
1。
平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)
平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡1 •假设厂商A与厂商B的平均成本与边际成本都是常数,MC A=10,MC B =8,对厂商产出的需求函数是Q D二500 -20 p(1)如果厂商进行Bertrand竞争,在纳什均衡下的市场价格是多少?(2)每个厂商的利润分别为多少?(3)这个均衡是帕累托有效吗?解:(1)如果厂商进行Bertrand竞争,纳什均衡下的市场价格是p B =10 一;,p A =10 , 其中;是一个极小的正数。
理由如下:假设均衡时厂商A和B对产品的定价分别为p A和p B,那么必有p A刃0 , p B K8,即厂商的价格一定要高于产品的平均成本。
其次,达到均衡时,p A和p B都不会严格大于10。
否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。
所以均衡价格一定满足p A空10 , p B・「0。
但是由于p A的下限也是10,所以均衡时P A =10。
给定P A =10 ,厂商B的最优选择是令P B =10- ;,这里:是一个介于0到2 之间的正数,这时厂商B可以获得整个市场的消费者。
综上可知,均衡时的价格为P A =10 , P B =10 -;。
(2)由于厂商A的价格严格高于厂商B的价格,所以厂商A的销售量为零,从而利润也是零。
下面来确定厂商B的销售量,此时厂商B是市场上的垄断者,它的利润最大化问题为:max pq —cq ①其中p =10 _ q =500 -20 107、把这两个式子代入①式中,得到:max (10 —芯―)500 —20(10 —名卩解得;=0,由于;必须严格大于零,这就意味着;可以取一个任意小的正数,所以厂商B 的利润为:||500-20 10 -; 10-;。
(3)这个结果不是帕累托有效的。
因为厂商B的产品的价格高于它的边际成本,所以如果厂商B和消费者可以为额外1单位的产品协商一个介于8到10一;之间的价格,那么厂商B的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A的剩余(因为A的利润还是零)。
博弈论第二章答案
nc + a a − c a−c a−c ⋅ −c⋅ = n +1 n +1 n +1 n +1
企业违背垄断产量时的各期利润:
n −1 (a − c ) − qi πi = a − qi − cqi 2n ∂π i (n − 1)(a − c) =a− − qi − q j − c = 0 ∂qi 2n n +1 (n + 1)a + (3n − 1)c (a − c), p = 4n 4n 2 (n + 1) 利润为 (a − c) 2 16n 2 ⇒ qi =
仅供参考! !
-4-
E-mail:beckham.23@
2
出) ,只要任何一方违背时,以后就转向阶段博弈的价格 pi = c 。 如一直使用垄断价格,则每个企业收益每期都一样为, π i = (a − c) / 8 如在t期某企业违背了战略, t+1期开始双方的收益相同都为0, 在t期它的最大收益为 ( a − c) / 4 (考虑此企业只是把价格边际上减少一点点,所有的利润都归它) ,如不违背则把以后无限期
一阶条件:
V ' ( I p − B) = kU 2' ( S + B) ,
反应函数满足:
−1 < dB* / dS = kU 2" /(−kU 2" − V " ) < 0 即,孩子储蓄减少,家
*
长给予更高的赠与。 接着最大化孩子的收益:给定反应函数 B ,来选 S:
MaxU1 ( I c − S ) + U 2 ( S + B* )
∂π i = a − ∑ qi − qi − c = 0 ∂qi a−c (i = 1,2,3 n) n +1
博弈论习题解答 浙江大学
3.(投票博弈)假定有三个参与人(1、2 和 3)要在三个项目(A、B 和 C)中选中一个。三人同 时投票,不允许弃权,因此,每个参与人的战略空间 Si={A,B,C}。得票最多的项目被选中, 如果没有任何项目得到多数票,项目 A 被选中。参与人的支付函数如下:
U1(A)=U2(B)=U3(C)=2
等于 11/2。9/2<11/2 表明 L 和 M 的混合战略的期望效用小于 R 战略的期望效用,因此,这一混合 战略也不满足纳什均衡。
(3)S2 选择 L 和 R 混合战略。如果两种战略同时混合,必然满足两种战略的期望效用相同,
2
因此,需要满足以下方程: 6α + 5(1 − α ) = 2α + 7(1 − α ) ,解得:α=1/3。同样,将 α=1/3 代入
师;如果所有人要求的钱加总大于已有钱的总数,则所有的钱归律师所有。写出这个博弈每个参
与人的战略空间与支付函数,求出所有的纳什均衡。(假设钱的总数为 M,M 为共同知识)。
{ } 博弈参与人的战略空间是 C1 = C2 = x ∈ R 0 ≤ x ≤ M ,参与人 i 的支付函数是:
∑ ui = xi ,
U1(B)=U2(C)=U3(A)=1
U1(C)=U2(A)=U3(B)=0 求解以上博弈的所有纯战略纳什均衡。
首先:将上述博弈过程转换为战略式博弈矩阵。
2和3
1
A3
B3
C3
A2 B2 C2 A2 B2 C2 A2 B2 C2
A1 2,0,1 2,0,1 2,0,1 2,0,1 1,2,0 2,0,1 2,0,1 2,0,1 0,1,2
6.一群赌徒围成一圈赌博,每个人将自己的钱放在边上(每个人只知道自己有多少钱),突然一 阵风吹来将所有的钱混在一起,使得他们无法分辨哪些钱是属于自己的,他们为此发生了争执,
博弈论习题及解答
※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)2. 分别用规范式和扩展式表示下面的博弈。
两个相互竞争的企业考虑同时推出一种相似的产品。
如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。
企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? (见教材)4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。
例子:厂商之间的价格战,广告竞争等。
※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? (见教材)2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。
先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。
然后用划线法求出该矩阵博弈的纯策略Nash均衡。
乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。
乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知,该矩阵博弈没有纯策略Nash均衡。
由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。
解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线,如下图,图中粗的折线,就是F(x)的图象由图可知,纳什均衡点与β1无关,所以原问题化为新的2*2矩阵博弈:由公式计算得:。
博弈复习题及参考答案
第一章复习题2,4,5,6,7第一章参考答案2、设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。
如果设定博弈模型时不专门设定后两个方面,就是隐含假定是完全、完美信息和完全理性的非合作博弈。
4、“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整个、个体利益共同的最优。
简单地说,“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。
现实中“囚徒的困境”类型的问题是很多的。
例如厂商之间价格战、恶性的广告竞争,初中、中等教育中的应试教育等,其实都是“囚徒的困境”博弈的表现形式。
5、首先可根据博弈方的行为逻辑,是否允许存在有约束力协议,分为非合作博弈和合作博弈两大类。
其次可以根据博弈方的理性层次,分为完全理性博弈和有限理性博弈两大类,有限理性博弈就是进化博弈。
第三是可以根据博弈过程分为静态博弈、动态博弈和重复博弈三大类。
第四是根据博弈问题的信息结构,根据博弈方是否都有关于得益和博弈过程的充分信息,分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈和不完全信息动态博弈几类。
第五是根据得益的特征分为零和博弈、常和博弈和变和博弈。
第六是根据博弈中博弈方的数量,可将博弈分为单人博弈、两人博弈和多人博弈。
第七是根据博弈方策略的数量,分为有限博弈和无限博弈两类。
战略博弈习题答案
战略博弈习题答案战略博弈习题答案战略博弈是一种通过推演和思考来制定最优决策的过程。
在这个过程中,我们需要分析各种可能的情况和对手的行为,以制定最佳的策略。
下面将给出几个战略博弈习题的答案,希望能够帮助读者更好地理解和应用战略博弈的原理。
习题一:囚徒困境在囚徒困境中,两个囚徒面临合作与背叛的选择。
如果两个囚徒都选择合作,则每个人都会获得较轻的刑罚;如果两个囚徒都选择背叛,则每个人都会获得较重的刑罚;如果一个囚徒选择合作而另一个囚徒选择背叛,则合作的囚徒将会受到极重的刑罚,而背叛的囚徒将会获得较轻的刑罚。
答案:在囚徒困境中,最稳定的策略是背叛。
因为无论对方选择合作还是背叛,背叛都能够保证自己获得较轻的刑罚。
这是一个典型的非合作博弈,每个囚徒都会选择背叛,因为他们无法相信对方会选择合作。
习题二:博弈论中的狼羊菜问题在一个河边,有一只狼、一只羊和一堆菜。
现在农夫要将它们一只一只地运到河对岸,但是他只能带一样东西过河。
而且,如果农夫不在场时,狼会吃羊,羊会吃菜。
答案:农夫首先带羊过河,然后回来自己过河,然后带狼过河,但是农夫带狼过河后,要把狼放在对岸,然后回到河这边,再带羊过河,最后带菜过河。
这样可以确保在任何时候都不会有狼吃羊或羊吃菜的情况发生。
习题三:拍卖策略在拍卖中,不同的竞拍者会根据自己的估价来决定出价。
最终,出价最高的竞拍者将赢得物品,并支付自己的出价。
答案:在拍卖中,最理性的策略是出价等于自己对物品的估价。
这样可以最大程度地保证自己以最低的价格赢得物品。
然而,在实际拍卖中,竞拍者还需要考虑其他竞拍者的行为,以及拍卖的规则和策略。
因此,拍卖策略的制定需要综合考虑多种因素。
总结:战略博弈是一个复杂而有趣的领域,它涉及到许多数学和逻辑原理。
在解决战略博弈问题时,我们需要深入分析各种可能的情况和对手的行为,以制定最佳的策略。
本文给出了几个常见的战略博弈习题的答案,希望能够帮助读者更好地理解和应用战略博弈的原理。
博弈论习题解答.doc
博弈论习题解答一、判断题1.X,只要任一博弈方单独改变策略不会增加得益,策略组合就是纳什均衡了。
2.V3.V4.X,某些情况下参与者具有先动优势,例如进入市场的博弈。
5.V6.X,逆向归纳法最基本的特征就是能排除扩展式博弈中所有不可信行为,包括不可信威胁和不可信承诺。
7.V8.X,对于零和博弈或者不满足合作条件的其他博弈来说,无限次重复博弈并不意味着效率的提局,得益不一定同。
9.V10.X,有些是故意隐瞒自己的行为。
11.X,在一个子博弈中出现的必须是完整的信息集,由于多节点信息集开始的博弈必然分割一个信息集,因此不可能是个子博弈。
12.X,不完美信息是指没有完美信息而非完全没有信息。
13.X,是因为其他参与者必然会考虑这些行为选择并作为他们自己选择行为的依据。
即使参与者自己不设定针对自己所有类型的行为选择,其他参与者也会替他考虑,弄清楚其他参与者对自己策略的判断。
14.X,仍然可能后悔,因为古玩交易的价格和利益不仅取决于古玩的实际价值和自己的估价,还取决于对方的估价和愿意接受的成交价格,因此仅仅自己做出正确的估价并不等于实现了最大的潜在利益。
15.X,不一定,因为可能消息的发送方的类型与接收方利益无关,或者消息接收方的行为与发送方的利益无关。
16.X,经济学并没有证明;教育是作为重要的信号,反映劳动力的素质。
17.V18.V19.X,纳什均衡是指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。
20.X,参与者总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标。
参与者A参与者A参与人1二、计算题1.纯策略均衡解为(D, R) 参与者B设3以y的概率执行L策略,对A来说选择混合策略则有1XY +2X(1— Y)=4XY +6X(1— Y)得/ = 4〉1,这是不可能的,故无混合战略均衡。
2.由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。
战略博弈习题答案
战略博弈习题答案战略博弈习题答案在现代社会中,战略博弈已经成为了一种普遍存在的现象。
无论是在商业领域、政治舞台还是日常生活中,我们都在不经意间参与着各种博弈。
在这篇文章中,我们将探讨一些常见的战略博弈习题,并给出相应的答案。
一、囚徒困境囚徒困境是博弈论中的一个经典问题。
假设有两个囚犯,被警察分别关在不同的房间里。
警察给每个囚犯提供了一个选择:如果两人都保持沉默,那么两人都将被判轻罪;如果其中一个人供认而另一个人保持沉默,供认的人将被判无罪,而保持沉默的人将被判重罪;如果两人都供认,那么两人都将被判重罪。
这个问题的关键在于囚犯之间的合作与背叛。
如果两人都选择合作,即保持沉默,那么他们都能避免受到重罪的惩罚。
然而,由于彼此之间缺乏信任,囚犯往往会选择背叛,即供认。
这样一来,虽然囚犯之间的利益得到了最大化,但整体利益却减少了。
因此,囚徒困境的最佳策略是合作。
如果两人都能够建立起互信,共同选择保持沉默,那么他们都能够避免受到重罪的惩罚,实现最佳的结果。
二、鸽子与鹰的博弈鸽子与鹰的博弈是另一个常见的战略博弈问题。
假设有两个玩家,一个是鸽子,一个是鹰。
他们分别可以选择合作或者背叛对方。
如果两个玩家都选择合作,那么他们将共同获得奖励;如果一个玩家选择合作而另一个玩家选择背叛,那么背叛的玩家将获得更大的奖励,而合作的玩家将受到惩罚;如果两个玩家都选择背叛,那么他们将受到双方都不愿意看到的惩罚。
在这个问题中,鸽子代表着合作,鹰代表着背叛。
如果两个玩家都选择合作,他们都能够获得奖励,实现最佳的结果。
然而,由于彼此之间的不信任,玩家往往会选择背叛,以获取更大的奖励。
这样一来,虽然个体利益得到最大化,但整体利益却减少了。
因此,鸽子与鹰的最佳策略是合作。
只有通过建立起互信,共同选择合作,才能够实现最佳的结果。
三、零和博弈零和博弈是一种特殊的博弈形式,其中一个玩家的收益等于另一个玩家的损失。
在这种博弈中,玩家之间存在着强烈的对抗性。
Gibbons《博弈论基础》习题解答Gibbons_key_ch2
2.1采用逆向归纳法,先最大化家长的收益:给定孩子的行动A ,来选择自己的行动B,()()p c BMaxV I B k I B −++一阶条件: '()p V I B k −=, ⇒*'1()()p B I A Vk −=−接着最大化孩子的收益,给定家长的反应函数*B ,来选A :'1(()()())c p AMaxU I A I A V k −+−一阶条件: '*''()[()()]0c c p U I B I A I A ++= 由于U 是递增又严格凹的,'*()0c U I B +≠这与孩子的选择可是全家的收入最大化的一阶条件相同:''()()0c p I A I A += 2.2采用逆向归纳法,先最大化家长的收益:给定的孩子的行动S ,来选择自己的行动B,12()[()()]p c BMaxV I B k U I S U S B −+−++一阶条件: ''2()()p V I B kU S B −=+,反应函数满足: *"""221//()0dB dS kU kU V −<=−−< 即,孩子储蓄减少,家长给予更高的赠与。
接着最大化孩子的收益:给定反应函数*B ,来选S :*12()()c SMaxU I S U S B −++一阶条件: ''**12()()(1/)c U I S U S B dB dS −=++,由此可得:''**120()/()(1/)1c U I S U S B dB dS <−+=+< (*)因此当增加S 时, 1()c U I S −会减小,同时,()/0d S B dS +> ,S B ∴+会增加,∴2()U S B +会增加,因为(*)式,2()U S B +增加的幅度比11()U I S −减小的幅度大,所以孩子的收益效用增大了,同时家长的收益效用也增大了。
博弈论习题和参考答案与解析
博弈论?习题一、单项选择题1.博弈论中,局中人从一个博弈中得至口的结果常被称为〔〕. A?效用B.支付C.决策D.利润2.博弈中通常包括下面的内容,除了〔〕.A.局中人B.占优战略均衡C策略D?支付3.在具有占优战略均衡的囚徒困境博弈中〔〕.A.只有一个囚徒会坦白氏两个囚徒都没有坦白C?两个囚徒都会坦白D.任何坦白都被法庭否决了4.在屡次重复的双头博弈中,每一个博弈者努力〔〕.A.使行业的总利润到达最大B?使另一个博弈者的利润最小C?使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是〔〕A.策略组合B.策略C信息D.行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最正确行为,此时的博弈具有〔〕0A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D?激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为〔〕.A.一报还一报的策略B.激发策略8.在囚徒困境的博弈中,合作策略会导致〔〕oA博弈双方都获胜B博弈双方都失败C使得先米取行动者获胜D使得后米取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现〔〕oA.当一个垄断竞争行业是由一个主导企业限制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D.当一个寡头行业进行一次博弈时一个企业米取的彳丁为10.与另一个企业在前一阶段采取的行为一致〞这种策略是一种〔〕A.主导策略B.激发策略C.一报还一报策略D.主导策略11-关于策略式博弈,正确的说法是〔〕0A.策略式博弈无法刻划动态博弈B.策略式博弈无法说明行动顺序C.策略式博弈更容易求解D.策略式博弈就是一个支付矩阵12.以下关于策略的表达哪个是错误的〔〕:A.策略是局中人选择的一套行动方案;B.参与博弈的每一个局中人都有假设干个策略;C.一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D.策略与行动是两个不同的概念,策略是行动的规那么,而不是行动本身.13.囚徒困境说明〔〕:A.双方都独立依照自己的利益行事,那么双方不能得到最好的结果;B.如果没有某种约束,局中人也可在〔抵赖,抵赖〕的根底上到达均衡;C.双方都依照自己的利益行事,结果一方赢,一方输;D.每个局中人在做决策时,不需考虑对手的反响14.一个博弈中,直接决定局中人损益的因素是〔〕:A.策略组合B.策略C信息D.行动15.动态博弈参与者在关于博弈过程的信息方面是〔〕A不对称的B对称的C不确定的D无序的16.古诺模型表达了寡头企业的〔〕决策模型A本钱B价格C产量D质量17.伯特兰德模型表达了寡头企业〔〕决策模型.A本钱价格C产量 D 质量18.用囚徒困境来说明两个寡头企业的情况,说明了:〔〕A、每个企业在做决策时,不需考虑竞争对手的反响E. 一个企业制定的价格对其它企业没有影响C、企业为了预防最差的结果,将不能得到更好的结果D、一个企业制定的产量对其它企业的产量没有影响19.子博弈精炼纳什均衡〔〕:A.是一个一般意义上的纳什均衡;B.和纳什均衡没有什么关系;C.要求某一策略组合在每一个子博弈上都构成一个纳什均衡;D.要求某一策略组合在原博弈上都构成一个纳什均衡.20.在一般产品销售市场上,以下哪种原因导致了逆向选择.〔〕A产品质量的不确定性B私人信息C公共信息D产品价格21.完全信息动态博弈参与者的行动是〔〕A无序的B有先后顺序的C不确定的D因环境改变的22.市场交易中普遍存在的讨价还价属于哪种博弈.〔〕A完全信息静态博弈B完全信息动态博弈C不完全信息静态博弈D不完全信息动态博弈23.下面哪种模型是一种动态的寡头市场博弈模型〔〕A古诺模型B伯川德模型C斯塔克尔伯格模型D田忌齐威王赛马24?博弈方根据一组选定的在两种或两种以上可能行为中随机选择的策略为血玄〔、A纯策略B混合策略C激发策略D 一报还一报策略25.影响重复博弈均衡结果的主要因素是〔〕A博弈重复的次数B信息的完备性C支付的大小DA和B26.在动态博弈战略行动中,只有当局中人从实施某一威胁所能获得的总收益()不实施该威胁所获得的总收益时,该威胁才是可信的.A大于B等于C小于D以上都有可能二、判断正误并简要说明理由I,纳什均衡一定是上策均衡,上策均衡一定是纳什均衡.2?在一个博弈中博弈方可以有很多个.3.在一个博弈中只可能存在一个纳什均衡.4.由于零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈.5.在一个博弈中如果存在多个纳什均衡那么不存在上策均衡.6.曲于两个罪犯只打算犯罪一次〞所以被捕后才出现了不合作的问题即囚徒困境.但如果他们打算重复合伙屡次,比方说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供.7,在博弈中纳什均衡是博弈双方能获得的最好结果.8.在博弈中如果某博弈方改变策略后得益增加那么另一博弈方得益减少.9,纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合.10.囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是由于两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长.11.斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润.12.在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系〞使重复博弈无法实现更高效率均衡的关键问题.13.子博弈精炼纳什均衡不是一个纳什均衡.14.零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡.15.原博弈惟一的纳什均衡本身是帕雷托效率意义上最正确战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别.16.在动态博弈中,由于后行动的博弈方可以先观察对方行为后再选择行为 ,因此总是有利的.入计算与分析题1、A、B两企业利用广告进行竞争.假设A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;假设A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;假设A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;假设A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润.〔,〕画出A、B两企业的损益矩阵.〔2 〕求纯策略纳什均衡.2、可口可乐与百事可乐〔参与者〕的价格决策:双方都可以保持价格不变或者提升价格〔策略〕;博弈的目标和得失情况表达为利润的多少〔收益〕;利润的大小取决于双方的策略组合〔收益函数〕;博弈有四种策略组合,其结局是:〔1〕双方都不涨价,各得利润10单位;〔2 〕可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30 ;(3 )可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30 ;(4 )双方都涨价,可口可乐利润140,百事可乐利润35 ;画出两企业的损益矩阵求纳什均衡.3、假定某博弈的报酬矩阵如下:(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>?(2 )如果(上,左)是纳什均衡,上述哪几个不等式必须满足4、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场.如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元.如果一方在价格决策方面选择合作而另一方却选择降低价格,那么合作的厂商获利将为零,竞争厂商将获利900000元.(1)将这一市场用囚徒困境的博弈加以表示.(2 )解释为什么均衡结果可能是两家公司都选择竞争性策略.5、博弈的收益矩阵如下表:⑴如果(上/左)是占优策略均衡/那么a、b、c、d、G、f、g、h之间必然满足哪些关系〔尽量把所有必要的关系式都写出来〕〔2 〕如果〔上,左〕是纳什均衡,那么〔1〕中的关系式哪些必须满足〔3 〕如果〔上,左〕是上策均衡,那么它是否必定是纳什均衡为什么〔4 〕在什么情况下,纯策略纳什均衡不存在6、猪圈里有一头大猪和_头小猪,猪圈的一头有一个饲料槽,另一头装有限制饲料供给的按钮.按一下按钮就会有,0个单位饲料进槽,但谁按谁就要付出2个单位的本钱.谁去按按纽那么谁后到;都去按那么同时到.假设大猪先到,大猪吃到9个单位,小猪吃到一个单位;假设同时到,大猪吃7个单位,小猪吃3个单位;假设小猪先到,大猪吃六个单位,小猪吃4个单位.求〔1〕各种情况组合扣除本钱后的支付矩阵〔2 〕求纳什均衡.7、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润〔单位:万元〕由以下图的得益矩阵给出:1〕有哪些结果是纳什均衡(2 )两厂商合作的结果是什么8、求出以下博弈的所有纯策略纳什均衡.9、求出下面博弈的纳什均衡(含纯策略和混合10、根据两人博弈的损益绸邛仲I答问题:(1) ◎出两人各自的金部策略.图示均衡点.(2 )求出斯塔克博格rstackelberg )均衡情况下的产量、价格和利润.(3)说明导致上述两种均衡结果差异的原因.13.下面的得益矩阵两博弈方之间的一个静态博弈,该博弈有没有纯策略的纳什均衡,博弈的结果是什么14.两个兄弟分一块冰激凌.哥哥先提出一个分割比例 ,弟弟可以接受或拒绝,接受那么按哥哥的提议分割,假设拒绝就自己提出一个比例.但这时候冰激凌已化得只剩1/2 了,对弟弟提议的比例哥哥也可以接受或拒绝,假设接受那么按弟弟的建议分割,假设拒绝冰激凌会全部化光.由于兄弟之间不应该做损人不利己的是“因此我们假设接受和拒绝利益相同时兄弟俩都会接受.求该博弈的子博弈完美纳什均衡.15?如果学生在测试之前全面复习,考好的概率为90%,如果学生只复习一局部重点,那么有50% 的概率考好.全面复习花费的时间tl = 100小时,重点复习之需要花费t2=20小时.学生的效用函数为:U二W-2巳其中W是测试成绩,有上下两种分数Wh和Wl, e为努力学习的时间.问老师如何才能促使学生全面复习16?在以下监工与工人之间的博弈中,试用划线法分析该博弈有无纯策略纳什均衡;如果没有,那么写出混合策略纳什均衡的结果.监工17 ?求解以下博弈的纳什均衡.博弈方29 18 ?某人正在打一场官司,不请律师肯定会输,请律师后的结果与律师的努力程度有关.假设当律师努力工作〔100小时〕时有50%的概率能赢,律师不努力工作<10小时〕那么只有15%的概率能赢.如果诉讼获胜可得到250万元赔偿,失败那么没有赔偿.由于委托方无法监督律师的工作,因此双方约定根据结果付费,赢官司律师可获赔偿金额的10%,失败那么律师一分钱也得不到.如果律师的效用函数为m 0.05e,其中m是报酬e是努力小时数,且律师有时机本钱5万元.求这个博弈的均衡.四、论述题Is解释"囚犯困境;并举商业案例说明.2、用〃小偷与守卫的博弈"说明〃鼓励〔监管〕悖论"博弈论?习题参考答案>单项选择题r 5 B. B. C.D ' A.11 15. B. C. A.6 10 C. A. A.D. C.16 20 C. B. C.21 26. B. B. C. B. D. A.,判断正误并简要说明理由1. F 上策均衡是比纳什均衡更严格的均衡.所以上策均衡一定是纳什均衡 一定是上策均衡,2. T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈3. IF 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在多个纳什均衡4. T 零和博弈才旨参与博弈各方在严格竞争下,一方收益等于另一方损失与损失之和恒为零,所以双方不存在合作可能性而纳什均衡不 ,如性别战.,博弈各方收益 ,只能有一个5.T上策均衡是通过严格下策消去法〔重复剔除下策〕所得到的占优策略纳什均衡6.IF只要两囚犯只打算合作有限次,其最优策略均为招供.比方最后一次合谋,两小偷被抓住了,由于将来没有合作时机了,最优策略均为招供.回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢.依此类推,对于有限次内的任何一次,两小偷均不可能合作.7.F纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的.团F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.T虽然斯塔格伯格模型各方利润总和小于古诺模型〞但是领导者的利润比古诺模型时12..T无限次重复博弈没有结束重复确实定时间;而在有限次重复博弈中,存在最后一次重复,并且正是有结束重复确实定时间,使重复博弈无法实现更高效率均衡.13.F子博弈精炼纳什均衡一定是一个纳什均衡.14.F零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡.15.T原博弈惟一的纳什均衡本身是帕雷托效率意义上最正确战略组合,因此不管是重复有限次还是无限次,不会和一次性博弈有区别.16.F动态博弈是指各博弈方的选择和行动又先后次序的博弈.动态博弈的信息盯以是不对称的.所以策略分为先发制人和.斯塔克伯格博弈揭示“先发制人〞更有禾L而"后发制人"后行动的博弈方可以先观察对方行为后再选择行为反而处于不利境地.三、计算与分析题Is (1)(2)纯策略纳什均衡为(做广告,做广告),(不做广告,不做广告)得长价-20, 30140,35纳什均衡〔不涨价,不涨价〕,〔涨价,涨价〕.从帕累托均衡角度,为〔涨价,涨价〕3、〔 1〕如果〔上/左〕是上策均衡,那么,a>e b>d, g<c, f>h 〔2 〕如果〔上〕左〕是纳什均衡,a>e b>d,不等式必须满足新华航空北方航空 合作竞争50, 50 90, 00, 90 6, 65、 略纳什均衡为〔按,等〕 7、略8、纯策略纳什均衡〔氏甲〕,〔⑴不存在纯策略纳什均衡合作肓争⑵设甲选择"U"的概率为概率为1-P1乙选择"『的概率为P2,贝V选择" R" 的概率为1-P2对甲而言,最正确策略是按定的概率选〃上"和‘下’,使乙选择“左〃和〃右"的期望值相等即PI*8+ (l-PI) *0-P1*1+ (1-P1) *5解得PI = 5/12即⑸12, 7/12 )按5/12概率选〃上“、7/12概率选〃下"为甲的混合策略Nash均衡对乙而言,最正确策略是按一定的概率选“左“和“右",使乙选择〃上"和‘下’的期望值相等即P2*5+(l-P2)*0- P2*2 + (l-P2)*4即(4/7, 3/7肢4/7概率选‘左’、3/7概率选"右"为乙的混合策略Nash均衡10、略.11、见笔记12、见笔记.13、首先,运用严格下策反复消去法的思想,不难发现在博弈方1的策略中,B是相对于T的严格下策.把博弈方1的B策略消去后又可以发现,博弈方2的策略中C是相对于R的严格下策,从而也可以消去.两个博弈方各消去一个策略后的博弈是如下的两人2X 2博弈,己经不存在任何严格下策.再运用划线或箭头法,很容易发现这个2X2博弈有两个纯策略纳什均衡(M,L )和(1R ) 0由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系,一次性静态博弈的结果不能肯定.由于双方在该博弈中可能采取混合策略,因此实际上该博弈的结果可以是4个纯策略组合中的任何一个.14.假设哥的方案是SI: 1-S1淇中S1是自己的份额,弟的方案是S2: 1-S2, S2是哥的份额,那么可用如下的扩展形表示该博弈:Hi SiC5V2eS? 2)CO O)运用逆推归纳法先分析最后一阶段哥的选择.由于只要接受的利益不少于不接受的利益哥就会接受,因此在这个阶段只要弟的方案满足S2/2 $0,也就是S2$0,哥就会接受,否那么不会接受.由于冰激凌的份额不可能是负数,也就是说由于哥不接受弟的方案冰激凌会全部化掉〞因此任何方案哥都会接受.现在回到前一阶段弟的选择.由于弟知道后一阶段哥的选择方法,因此知道如果不接受前一阶段哥提出的比例,自己可以取S2=0,独享此时还未化掉的1/2块冰激凌;如果选择接受前一阶段哥的提议,那么自己将得到出1,显然只要l-Sn/2 ,即S1W1/2,弟就会接受哥的提议.再回到第一阶段哥的选择.哥清楚后两个阶段双方的选择逻辑和结果 ,因此他在这一阶段选择Sl = 1/2,正是能够被弟接受的自己的最大限度份额,超过这个份额将什么都不能得到,因此SI二1/2是最正确选择.综上,该博弈的子博弈完美纳什均衡是:哥哥开始时就提议按(1/2J/2)分割,弟弟接受.15.此题中老帅的调控于段高分和低分的差距.该博弈的扩•展形如下:只有当Ul» U2时学生才会选择全面复习.根据Ul» U2我们可以算出Wh- WD 400o这就是老师能有效全面复习需要满足的条件.其实在奖学金与成绩挂钩时,Wh- W1也可以理解成不同等奖学金的差额.16泄有纯策略均衡,只有混合策略均衡((0. 25,0.75 ),(0. 5,0. 5 ))17. 可以根据画线法求得有唯一纯策略均衡(上,左)18.参见第15题四、论述题1、解释〃囚犯困境〃,并举商业案例说明.(1)假设条件举例:两囚徒被指控是一宗罪案的同案犯.他们被分别关在不同的牢房无法互通信息.各囚徒都被要求坦白罪行.如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年.(2)囚徒困境的策略矩阵表.每个囚徒都有两种策略:坦白或不坦白.表中的数字分别代表囚徒甲和乙的得益.囚徒乙3〕分析:通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都〃坦白〃.给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白.这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不管对方如何选择,个人的最优选择是坦白.其结果是双方都坦白.4〕商业案例:寡头垄断厂商经常发现它们自己处于一种囚徒的困境.当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润.但卡特尔协定不是一个纳什均衡,由于给尢双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润.2用〞小偷与守卫的博弈〃说明〃鼓励〔监管〕悖论〃.〔1〕假设条件举例:偷窃和预防偷窃是小偷和门卫之间进行博弈的一场游戏.门卫可以不睡觉,或者睡觉.小偷可以采取偷、不偷两种策略.如果小偷知道门卫睡觉, 他的最正确选择就是偷;如果门卫不睡觉,他最好还是不偷.对于门卫,如果他知道小偷想偷,他的最正确选择是不睡觉,如果小偷采取不偷,自己最好去睡觉.〔2 〕小偷与门卫的支付矩阵表〔假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住〕:。
策略博弈复习题及答案
策略博弈复习题及答案1. 什么是纳什均衡?纳什均衡是指在一个博弈中,每个参与者选择了自己的最优策略,并且考虑到其他参与者的策略选择后,没有任何一个参与者能够通过单方面改变策略来获得更好的结果。
换句话说,当所有参与者都选择了自己的最优策略时,就达到了纳什均衡。
2. 描述囚徒困境的基本结构。
囚徒困境是一个典型的非零和博弈,涉及两个参与者,他们各自面临合作或背叛的策略选择。
如果两人都选择合作,他们都会获得中等的收益;如果一个合作而另一个背叛,背叛者将获得最大的收益,而合作者则会受到惩罚;如果两人都选择背叛,他们都会得到最差的收益。
3. 博弈论中的混合策略是什么?混合策略是指参与者在博弈中以一定的概率选择不同的纯策略。
在混合策略中,参与者不是每次都选择相同的策略,而是根据一定的随机化规则在不同策略之间做出选择。
4. 举例说明什么是博弈的动态演化。
博弈的动态演化是指随着时间的推移,博弈参与者的策略选择可能会发生变化。
例如,在重复博弈中,参与者可能会根据之前博弈的结果调整自己的策略,以期望在未来获得更好的收益。
这种策略的调整和演化过程就是博弈的动态演化。
5. 如何识别一个博弈是否具有多个纳什均衡?要识别一个博弈是否具有多个纳什均衡,可以分析每个参与者的最优反应函数。
如果存在多个策略组合,使得每个参与者在给定其他参与者策略的情况下,都没有动机单方面改变策略,那么这个博弈就具有多个纳什均衡。
6. 什么是合作博弈和非合作博弈的区别?合作博弈和非合作博弈的主要区别在于参与者是否可以形成具有约束力的协议。
在合作博弈中,参与者可以达成协议并共同执行,而在非合作博弈中,参与者不能形成具有约束力的协议,他们只能独立选择自己的策略。
7. 描述博弈论在经济学中的应用。
博弈论在经济学中有广泛的应用,包括市场结构分析、拍卖理论、合同理论、产业组织等。
通过博弈论,经济学家可以分析不同市场参与者在特定情境下的策略选择,以及这些选择如何影响市场结果。
策略博弈习题部份解答
博弈论与政治第三小组作业第二章名词说明:一、理性行为(rational behavior):参与人精于算计并严格依照其最优策略行事。
其中理性有两个重要的内涵:一个人对自己的利益完全了解,并能完美地计算出何种行动能够最大化其利益。
二、不完美信息(imperfect information):在博弈的每一个行动时点上,参与人可能无法得悉决策所需的全数信息。
这包括相关的外部环境——比如天气——的不确信性,和对方先前或当前的行动。
这种情形称为不完美信息。
3、不完全信息(incomplete information):当一个参与人比另一个参与人了解更多信息时,阴谋狡计就会产生。
这种情形称为不完全信息。
4、合作博弈(cooperative game):博弈论利用两个专门术语来区分协议具有强制力和不具有强制力的情形。
假设协议对参与人行为具有强制力,那么称此类博弈为合作博弈。
五、非合作博弈(noncooperate game):个体参与人可依照其利益采取行动,那么称此类博弈为非合作博弈。
第三章名词说明:一、中间评估函数(intermediate valuation function):给予非终点结支付的规那么被称为中间评估函数。
二、先动优势(firstmover advantage):在博弈的进程中先做决策带来的优势。
先动优势来自于将其自身置于一个优势地位和迫使其他参与人同意它的许诺能力。
后动优势(second-mover advantage):在博弈的进程中后做决策带来的优势。
后动优势源于自己可对他人选择做出的灵活性。
第四章名词说明:一、占优策略(dominant strategy)、劣策略(dominated strategy):每一个博弈中的参与者通常都拥有不止一个竞争策略,其所有策略的集合组成了该企业的策略集。
在参与者各自的策略集中,若是存在一个与其他竞争对手可能采取的策略无关的最优选择,那么称其为占优策略(Dominant Strategy),与之相对的其他策略那么为劣势策略。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论与政治第三小组作业第二章名词解释:1、理性行为(rational behavior):参与人精于算计并严格按照其最优策略行事。
其中理性有两个重要的内涵:一个人对自己的利益完全了解,并能完美地计算出何种行动可以最大化其利益。
2、不完美信息(imperfect information):在博弈的每一个行动时点上,参与人可能无法获悉决策所需的全部信息。
这包括相关的外部环境——比如天气——的不确定性,以及对方先前或当前的行动。
这类情况称为不完美信息。
3、不完全信息(incomplete information):当一个参与人比另一个参与人了解更多信息时,阴谋诡计就会产生。
这类情况称为不完全信息。
4、合作博弈(cooperative game):博弈论使用两个专门术语来区分协议具有强制力和不具有强制力的情况。
若协议对参与人行为具有强制力,则称此类博弈为合作博弈。
5、非合作博弈(noncooperate game):个体参与人可根据其利益采取行动,则称此类博弈为非合作博弈。
第三章名词解释:1、中间评估函数(intermediate valuation function):赋予非终点结支付的规则被称为中间评估函数。
2、先动优势(firstmover advantage):在博弈的过程中先做决策带来的优势。
先动优势来自于将其自身置于一个优势地位以及迫使其他参与人接受它的承诺能力。
后动优势(second-mover advantage):在博弈的过程中后做决策带来的优势。
后动优势源于自己可对他人选择做出的灵活性。
第四章名词解释:1、占优策略(dominant strategy)、劣策略(dominated strategy):每一个博弈中的参与者通常都拥有不止一个竞争策略,其所有策略的集合构成了该企业的策略集。
在参与者各自的策略集中,如果存在一个与其他竞争对手可能采取的策略无关的最优选择,则称其为占优策略(Dominant Strategy),与之相对的其他策略则为劣势策略。
占优策略是博弈论(game theory)中的专业术语,所谓的占优策略就是指无论竞争对手如何反应都属于本企业最佳选择的竞争策略。
2、占优可解(dominance solvable):在规模较大的博弈中,或许没有单个策略占优于其他所有的策略,但可能也存在一些策略劣于其他某些策略。
如果参与人发现自己处于这样一种博弈中,他们可以通过将劣策略从可选策略中剔除的办法求得均衡。
剔除劣策略缩小了博弈的规模,得到的“新”的博弈又可能出现对于同一个参与人或其他参与人而言的另外一些劣策略,进而又可以继续剔除这些劣策略;或者在“新”的博弈中,某个参与人存在占优策略。
重复剔除劣策略的过程可以剔除劣策略或缩小博弈的规模,直到不能进一步剔除为止。
如果这个过程最后只剩下一个唯一的结果,那么这个博弈就被称为占优可解。
3、聚点(focal point):参与人得以成功协调所依赖的这种共同预期策略称为聚点。
4、预期收敛(convergence of expectation):如果参与人在博弈中具备的共同认识,那么他们关于行动的预期会收敛到一个平衡点,即预期收敛。
5、零和博弈(zero-sum game)在一些博弈中,博弈双方的利益是完全相对的。
对参与人的每个策略组合而言,一个参与人的支付就是另一个人支付的相反数,我们称这种博弈为零和博弈。
6、纳什均衡(Nash equilibrium)纳什均衡可以定义为这昂的一种策略组合:其中每个参与人的策略都是对其他人的策略的最优反应。
或者有这样一个策略组合,每个参与人都选择了一个相应的策略,并且具备如下性质:(1)每个参与人都对其他参与人的策略有正确的信念;(2)给定每个参与人关于其他参与人策略的信念,自己所选择的策略是最优的。
第五章名词解释:1、最优反应曲线(best-response curves):列出收益函数后,求导得到的函数所对应的曲线即为最优反应曲线。
2、最优反应原则(best-response rule):最大化其支付的最优定价的集合就是最优反应原则。
5. 第二章作业题1(a)这是一个博弈。
因为不同口味的酸乳酪可能会给这些杂货店老板带来不同的收益。
(b)这是一个博弈。
因为如果这两个少女考虑到对方在舞会时要穿的衣服来选择自己要穿什么衣服才会让自己更加有利。
比如避免出现两个人穿同样衣服的情况出现。
(c)这是一个决策。
因为这位大学生在做出选择的时候不用考虑到他人的反应。
(d )这是一个博弈。
因为微软和网景公司在作出定价的时候都要考虑到对方的反应对自己的影响。
(e )这是一个决策。
因为这位州长候选人只需按照自己的意愿去选择自己的竞选搭档即可,不必考虑到其他人的反应对自己的决策带来的影响。
4(a )预期支付=0.5*20+0.1*50+0.4*0=15(元)(b )预期支付=0.5*50+0.5*0=25(元)(c )预期支付=0.8*0+0.1*50+0.1*20=7(元)第三章作业题1决策结:2个终点结:6个 决策结:3个 终点结:9个 (c决策结:4个Array终点结:8个2解:(a)s方向,即(1,0)(b)s-u方向,即(3,3,3,)(c)s-n-S-n-N方向,即(4,5)4解:错,在序贯行动博弈中,先手不一定会获胜。
因为在序贯行动博弈中,不单会有先动优势,使得对手被迫做出次一级的选择;同时也存在后动优势,即可以依据别人的选择做出相应的反应,具有灵活性。
比如,如果猜拳变成序贯行动博弈的话,那么,一定是后动的人有绝对优势。
5解:有博弈树得到均衡点为(3,3),即波音公司采用和平竞争,而空中客车参与竞争。
7.此题为必胜策略题:先手占优势,只要先手第一轮出“1”,之后每轮保证与对方说的之和为11即可获胜;后手在先手未说“1”时,与对方说的凑成12,然后之后每轮与对方凑成11即可获胜。
7. 第四章作业题1,这句话不对,因为虽然某个参与人有一个占优策略,但是在这个占优策略的前提下,另外一个参与人可能会做出不同的选择,使得有占优策略的人不能得到对他来说最好的结果。
例如下面的这个博弈过程(教材75页)联邦储备银行低利率高利率国会预算平衡3,4 1,3预算赤字4,1 2,2我们来分析这个博弈中的占优策略:如果联邦储备银行认为国会会选择“预算平衡”,那么它自己则会选择“低利率”(因为这样它可以得到支付4而不是支付3);但如果它认为国会会选择“预算赤字”,则它选择“高利率”将会更好些(这样可以得到支付2而不是支付1)。
由此可见,联邦储备银行不存在占优策略,而国会却有占优策略。
如果国会认为联邦储备银行会选择“低利率”,国会最优选择是“预算赤字”而不是“预算平衡”;如果国会认为联邦储备银行会选择“高利率”,它的最优选择仍是“预算赤字”而不是“预算平衡”。
因此,“预算赤字”是国会的占优策略。
但是这个博弈的平衡点式国会选择“预算赤字”而联邦储备银行选择“高利率”;并不是对国会的最好结果,这是因为当国会选择“预算赤字”这个最优策略的时候,联邦储备银行可以预见到它的这一选择,从而选择“高利率”。
2.(a)列左右行上 1 4 Min=1下 2 3Min=2Max=2 Max=3 (2,2)根据占优策略原则,对于“列“,“左”是占优策略,而当“列”选择“左”的时候,行会选择“下”,纳什平衡点是(Max,Min)=(2,2)。
根据最大最小值也可以验证,如上面的表格。
(b)列左右行上 1 2 Min=1下 4 3 Min=3Max=4 Max=3 (3,3)根据占优策略原则,对于“行”,占优策略是“下”,而当“行”选择“下”的时候,列会选择“右”,所以纳什平衡点是(Max,Min)=(3,3)。
根据最大最小值也可以验证,如上面的表格。
(c)列左中右行上 5 3 1 Min=1直 6 2 1 Min=1下 1 0 0 Min=0Max=6 Max=3 Max=1 (1,1)根据最大最小值方法,这个博弈有两个纳什平衡点。
如上图所示。
3,(a)列左右行上2,4 1,0下6,5 4,2“行”的占优策略是选择“下”,当“行”选择“下”的时候,“列”会选择“左”来得到更多的支付,纳什平衡点是(6,5)(b)列左右行上1,1 0,1下1,0 1,1 “行”的占优策略是选择“下”,当“行”选择“下”的时候,“列”会选择“右”来得到更多的支付,纳什平衡点是右下方的(1,1);同样“列”的占优策略是选择“右”,当“列”选择“右”的时候,“行”会选择“下”来得到更多的支付,纳什平衡点是右下方的(1,1)(c)列左中右行上0,1 9,0 2,3直5,9 7,3 1,7下7,5 10,10 3,5对于“行”,最优策略是“下”,当“行”选择“下”的时候,“列”会选择“中”来获得最大的支付。
(10,10)为纳什平衡点,表格中红色的部分表示被划掉过。
或者用逐格检查的方法也可以实现。
(d)列西中东行北2,3 8,2 10,6上3,0 4,5 6,4下5,4 6,1 2,5南4,5 2,3 5,2此题采用逐格检查法,(10,6)为纳什平衡点。
5列左中右行上1,2 2,1 1,0水平0,5 1,2 7,4下-1,1 3,0 3,2此题采用逐格检查法,(1,2)为纳什均衡点。
寻找过程,对于“列”在每一行中划掉对“列”来说支付最小的两个策略组合,对于“行”在每一列中划掉对“行”来说支付最小的两个策略。
最后看哪个策略组合没有被划掉过,就是纳什平衡点。
因为支付最大的组合并不一定是纳什均衡点所在的地方,这个博弈中(1,2)是平衡点,但是这个平衡点对应的不是支付最大的点,所以要使用参与人的策略而不知识均衡时的支付来描述均衡。
4.7.表格如图所示:红色的字和数字对应所获利益,此处默认快乐和时间的单位相同且有等价值。
帮助不帮帮助2,22,3不帮3,20,0此时没有nash均衡点,A帮助时B会选择不帮,而A不帮时B会帮助。
但是由于同时决策,所以没有均衡点。
4.11A 不买时:其中按A,B,C排列B C 0元票 15元票 30元票0元票0,0,0 0,0,150,0,015元票0,15,00,0,00,-15,030元票0,0,0,0,0,-15 0,-15,-15A买 15元票时:B C 0元票 15元票 30元票0元票15,0,00,0,0-15,0,015元票0,0,0-5,-5,-5 -15,-15,030元票-15,0,0-15,0,-15 -15,-15,-15A买30元票时:B C 0元票 15元票 30元票0元票0,0,00,0,-15 -15,0,-1515元票0,-15,0 0,-15,-15 -15,-15,-1530元票-15,-15,0 -15,-15,-15 -20,-20,-20其中经过简单的连续删除分析(由于其实两人对称),可知其中的考虑B,C两人时的均衡点为红字所示!而对于A 来说没有重合的,所以没有nash 均衡点。