博弈论 课后习题答案
“博弈论”习题及参考答案
《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。
A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。
A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。
A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。
A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。
A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。
A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。
A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。
A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。
A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。
A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。
A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。
博弈论基础吉本斯课后答案
博弈论基础吉本斯课后答案
一、原题
1. 什么是博弈论?
答:博弈论是一门研究决策者之间的竞争性行为的学科,它研究的是如何在竞争性环境中获得最佳结果。
它涉及到决策者之间的博弈,以及如何利用策略来获得最佳结果。
2. 什么是吉本斯博弈论?
答:吉本斯博弈论是一种研究两个或多个决策者之间的博弈的学科,它研究的是如何在竞争性环境中获得最佳结果。
它是由美国经济学家约翰·吉本斯在20世纪50年代提出的,他提出了一种新的方法来研究博弈,即使用数学模型来分析博弈的结果。
3. 吉本斯博弈论的基本概念是什么?
答:吉本斯博弈论的基本概念是博弈矩阵,它是一个表格,用来描述两个或多个决策者之间的博弈。
它由行和列组成,每一行代表一个决策者,每一列代表另一个决策者,每个单元格中的数字代表每个决策者在每种可能的结果下的收益。
4. 吉本斯博弈论中的均衡点是什么?
答:吉本斯博弈论中的均衡点是指当两个或多个决策者之间的博弈结果达到一种平衡时,每个决策者都不会有更多的收益。
这种平衡可以是一个纳什均衡,也可以是一个非纳什均衡,具体取决于博弈的结构。
博弈论指定习题和参考答案
指定习题和参考答案Chapter 2: 1, 21. (a) D. There is so much amount and kinds of yogurt that each shopper need not consider whatothers do.(b) G. A prom is likely to be small enough that any participant can have some conceivable influence on others. For example, these two should prevent from dressing the same. However, in a BIG CITY, this may not be a case.(c) D. If he is not restricted to any specific university.(d) G. There are so few competitors for this specific product.(e) G. He must consider the interaction between him and his running mate. Even more, he must consider the response of the constituency when he chooses the mate.2. (a) Z; R/NR; I; F; NC.(b) NZ; NR; A; F; C.(c) NZ;NR; I; F; CChapter 3: 1, 2, 6, 71. (a) D=3, T=6(b) D=4, T=9(c) D=5, T=82. (a) #S(A)=2, S(A)={N,S}; #S(B)=2, S(B)={t, b}(b) #S(A)=2*2*2=8, S(A)={NNN, NNS, NSN, NSS, SNN, SNS, SSN, SSS}(left, right-up,right-down)#S(B)=2, S(B)={t, b}; #S(C)=2, S(C)={u,d}(c) #S(A)=2*2*2=8, S(A)= {NNN, NNS, NSN, NSS, SNN, SNS, SSN, SSS}(left, middle,right)#S(B)=8, S(B)={nnn, nns, nsn, nss, snn, sns, ssn, sss}6. (a) At the final run, B must take dimes. At the run next to final, if A choose to pass, given Btake dime at the final run, he can only get the reward accumulating at a speed of 5 cents per turn, initially 0 cents. If he takes dimes, he gets the dimes accumulating at a speed of 20 cents per turn, initially 10 cents. He surely takes dimes. Given this, B must take dimes at the run second next to final (B’s payoffs are the same as in our initial game) . Then A has the same reasoning as at the next to final run. And so on. So the rollback equilibrium strategy is always taking dime, for both players.(b) Using rollback method, let’s consider from the second round.No matter what payoffs both have got in the first round, they have sunk and cannot affect both players’ decisions in the second round. So two players play the second round as if it is a single-round centipede. So each plays is always choosing to take dimes, resulting payoffs of10 to A and 0 to B.Keeping this in both players’ mind, the first round is played almost as a single-roundcentipede, except that A always gets a reward of 10, whether she passes the dime or take it.But the fact that you always get something will neither affect your decision. So finally the first round game is exactly as a single-round centipede.Use rollback to this reduced single-round centipede. Notice the game is essential the same as before in the first 6 runs when the total amount is not accumulated to 50 when it’s player A’ s turn to play. If we can decide that the game after the 6th run will have an equilibrium of both players always taking dimes, we can be sure that B will get at most 20 when the 7th run comes and A (at most) takes 50.Now consider this ‘small’ equilibrium with only the last 4 runs. B will take dimes at in the final run (with a payoff of 90, otherwise 0). In any round before for A to play, taking dimes will leave her at least 50, but passing it will leave her at most 100-90=10 if B takes dimes then. In any round before for B, taking dime will leave him at least 60, but passing it will leave her at most 100-50=50 if A takes dimes then. Given the final run’s action of B (taking dimes), we can derive that both will always take dime in any round before, but after 6th run.Now let’s go back to our 6th run. B will take dimes at the 6th run (with a payoff of 60, otherwise 20). Given B’s choice, the game before the 6th run goes like the original one.The equilibrium is that both players always take dimes.(c) All the logic of (b) applies here until we begin to consider the last 5 runs (not 4 runs at thistime) of the first round game. Use rollback.B takes dimes in the final run, but get only 40 and leave 50 (as we restricts) to A. In the9th(second to the last) run, A can choose either to pass or take dimes(getting 50 both). The game essential the same when it ends in 9th run or 10th run.However, the 8th run is crucial. B can choose either to pass or to take dimes (getting 40 both). If B chooses to take dimes, A will definitely chooses to take dimes in the 7th run, and so on. The cooperation totally breaks and results in taking dimes always (our old equilibrium outcome).In any round before, but after 5th run, if both expect complete cooperation throughout the future, then they can either choose to pass or take. Any single deviation from cooperation (taking dimes) will result in total breakdown. So the 6-8th runs are all crucial points, given cooperation afterwards.Consider both pass dimes. Given this, at the 5th run, A chooses to pass is at least as good as to take. Taking them leads to breakdown as well. Suppose she passes it. B will also be indifferent with passing or taking dimes. So the 4-5th runs are also crucial points.However the 3rd run and the earlier are not crucial. If cooperation always happens afterward, passing dimes are always strictly better than taking dimes. If breakdown has already happen afterwards, taking dimes are definitely better choices.Summary: this game has multiple equilibria. Always passing dimes is one of them. Any deviations in one of 4-8th runs, given cooperation afterwards, will lead to breakdown from the very beginning. ( The number of equilbria is (1+5)*2=12, taking into account in the 9th run, both passing or taking dimes are indifferent for A.)7. (a) Amy; Beth.The player who reaches exactly 89 first will win; thus the player who reaches 78 first will win;thus 67,56, 45, 34, 23, 12, 1. Obviously Amy will reach 1 first.The player who reaches exactly 99 first will win. Then 88, 77, 66, 55, 44, 33, 22, 11.Obviously Beth will reach 11 first.(b) For Amy: 1 in the first run, then 11 no matter what Beth chooses, and 22, and so on. ForBeth, she can choose any amount between 1 and10.For Amy: any amount between 1 and 10. For Beth, 11 in his first run, 22 in his second run, and so on.Chapter 4: 2(d), 3(d), 5, 6, 9, 122. (d) Up is dominated by Straight (for Row). Then Left and Middle are both dominated by Right(for Column). Given Column plays Right, Row chooses Straight. The only NE is (Straight, Right).3. (d) (North, East) (unique NE). No dominant or dominated for both. Best-response analysis.5. Dominance solvable. (Up, Left). (Level, Center) has the same payoffs but not NE. There arealso other strategy configurations having strictly higher payoffs but not NEs.6. (1)JapaneseNorthern Southern AmericanNorthern 2 2Southern 1 3 (2) “Southern” is weakly dominated by “Northern” for Japanese. (North, North) is the only NE.(Check if “Southern” for Japanese can be part of any NE before you eliminate it.)9. (a) 3 NEs: (1, 1), (2, 2), (3, 3). The first is less likely to be focal point. But the other two areequally likely to be.(b) 12.5; Yes; Mixed strategy (just like flipping coins) can be used.12. (a) Two NEs: (Brunette, Blonde), and (Blonde, Brunette), yielding payoffs (5, 10) and (10, 5)respectively.Player 2Blonde BrunettePlayer 15Blonde 0,0 10,Brunette 5, 10 5, 5(b)Player 3Blonde BrunettePlayer 2 Player 2Blonde Brunette Blonde Brunette Player 1Blonde 0, 0, 0 0, 5, 0 0, 0, 5 10, 5, 5Brunette 5, 0, 0 5, 5, 10 5, 10, 5 5, 5, 53 NEs: (Blonde, Brunette, Brunette), (Brunette, Blonde, Brunette), and (Brunette, Brunette, Blonde), with payoffs 10 for who wins the Blonde, 5 for who wins Brunette.(c) The only possible NEs are those with only one pursues and wins the only Blonde and all others pursues and wins somehow excessive Brunettes.Or, follow the assumption given in text. Given k>=1, for any player, his payoffs of pursuing the Blonde is 0 and definitely worse than pursuing the Brunette with payoff 5. However, if k=0, you’d better pursue the Blonde.Consider this for a while, you will get the NE solutions.Thus All players choose Brunette cannot be a NE.。
博弈论习题及解答
※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)2. 分别用规范式和扩展式表示下面的博弈。
两个相互竞争的企业考虑同时推出一种相似的产品。
如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。
企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? (见教材)4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。
例子:厂商之间的价格战,广告竞争等。
※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? (见教材)2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。
先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。
然后用划线法求出该矩阵博弈的纯策略Nash均衡。
乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。
乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知,该矩阵博弈没有纯策略Nash均衡。
由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。
解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线,如下图,图中粗的折线,就是F(x)的图象由图可知,纳什均衡点与β1无关,所以原问题化为新的2*2矩阵博弈:由公式计算得:。
博弈论习题及参考答案
《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。
A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。
A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。
A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。
A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。
A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。
A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。
A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。
博弈双方都失败 B.博弈双方都获胜A.C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。
A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。
A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。
A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。
博弈论课后习题答案
博弈论课后习题答案博弈论课后习题答案博弈论是一门研究决策和策略的学科,它涉及到多个参与者之间的相互作用和决策过程。
在博弈论的学习过程中,习题是非常重要的一部分,通过解答习题可以加深对博弈论概念和原理的理解。
下面是一些常见博弈论习题的答案,希望对大家的学习有所帮助。
1. 两人囚徒困境博弈在囚徒困境博弈中,两个囚犯被关押在不同的牢房里,检察官给每人提供了一个选择:合作(合作供认)或背叛(沉默)。
如果两人都合作,那么每个人的刑期都会较短;如果两人都背叛,那么每个人的刑期都会较长;如果一个人合作而另一个人背叛,那么背叛的人将会获得较短的刑期,而合作的人将会获得较长的刑期。
答案:在囚徒困境博弈中,每个囚犯都会追求自己的最大利益。
根据博弈论的原理,无论对方选择什么,背叛都是最优策略。
因此,两人都会选择背叛,最终导致双方都获得较长的刑期。
2. 石头剪刀布博弈石头剪刀布是一种常见的博弈游戏,两个参与者同时出示石头、剪刀或布,根据两者的选择,结果会有不同的得分。
答案:在石头剪刀布博弈中,每个参与者都有三种选择,而且每种选择的胜负关系都不同。
根据博弈论的原理,最优策略是随机选择,使得对手无法预测自己的选择。
这样做可以最大程度地减少对手的获胜概率。
3. 拍卖博弈拍卖是一种常见的博弈形式,参与者通过竞价来争夺一个物品或服务。
在拍卖中,不同的拍卖规则和策略会对结果产生影响。
答案:在拍卖博弈中,最常见的策略是以自己的估值为基准进行竞价。
如果一个参与者的估值高于其他参与者,那么他可以通过竞价来获得物品或服务。
然而,如果其他参与者也有较高的估值,那么竞价将会继续上升,直到只剩下一个竞价者。
在这种情况下,最高的竞价者将会获得物品或服务,但是他需要支付他的竞价。
4. 价格战博弈价格战是一种常见的博弈形式,不同的公司通过调整价格来争夺市场份额。
在价格战中,公司的利润和市场份额会受到价格策略的影响。
答案:在价格战博弈中,最优策略取决于对手的策略和市场需求。
“博弈论”习题及参考答案
《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。
A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。
A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。
A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。
A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。
A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。
A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。
A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。
A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。
A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。
A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。
A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。
“博弈论”习题及参考答案
《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。
A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。
A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。
A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。
A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。
A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。
A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。
A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。
A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。
A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。
A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。
A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。
博弈论各章节课后习题答案 (2)
1 π1 = (10 − 2q1 − 2q2 )q1 − 2 − 4q1
1 π2 = (10 − 2q1 − 2q2 )q2 − 2 − 4q2
求导得:
∂π1 ∂q1
= 10 − 4q1
−
2q 2
−
4
=
0
∂π2 ∂q 2
= 10 − 4q2
− 2q1 − 4 = 0
解得均衡时
q1=q2=1,则
p=8,利润为:π1=π2=
aijx*i y j 。由于 d 是
i =1 j=1
i =1 j=1
i =1 j=1
mn
mn
mn
∑∑ ∑∑ ∑∑ 常数,因此有
(aij + d)xi y j =
aijxi y j + d 。显然不等式
(aij + d)xi y*j ≤
i =1 j=1
i =1 j=1
i =1 j=1
mn
mn
∑ ∑ ∑ ∑ (aij + d)x*i y*j ≤
,要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需
a>10。此时乙企
业的收益为 100+a。
11. 假设有一博弈 G=[N,S,P],其中 N={1,2},S1=[10,20],S2=[0,15], P1 (s) = 40s1 − 2s12 + 5s1s 2 ,
P2 (s)
= 50s 2
−
s
2 2
(aij + d)x*i y j 是成 立的 , 此即 为 XA2Y* ≤ X*A2Y* ≤ X*A2Y 。所以
i =1 j=1
i =1 j=1
(X*,Y*)是矩阵博弈 G2 的纳什均衡点,并且
博弈论 课后习题答案
博弈论课后习题答案第四部分课后习题答案1. 参考答案:括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙的得益,而b表示甲的得益。
在第三阶段,如果,则乙会选择不打官司。
这时逆推回第二阶段,甲会选择a,0不分,因为分的得益2小于不分的得益4。
再逆推回第一阶段,乙肯定会选择不借,因为借的最终得益0比不借的最终得益1小。
在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是(a,b)。
a,0逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为(a,b)。
b,2在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0),当a,1时乙肯定会选择借,最后双方得益为(a,b)。
在第二阶段如果,则甲会选择a,1b,2分,此时双方得益为(2,2)。
再逆推回第一阶段,乙肯定会选择借,因为借的得益2大于不借的得益1,最后双方的得益(2,2)。
根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况:(1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0得益(1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益(a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。
要本博弈的“威胁”,即“打”是可信的,条件是。
要本博弈的“承诺”,即a,0“分”是可信的,条件是且。
a,0b,2注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。
不过最终的结果并不会超出上面给出的范围。
2. 参考答案:静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。
博弈论各章节课后习题答案 (1)
第一章绪论
1.什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)
2.分别用规范式和扩展式表示下面的博弈。
两个相互竞争的企业考虑同时推出一种相似的产品。
如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。
3.什么是特征函数?(见教材)
4.产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。
例子:厂商之间的价格战,广告竞争等。
企业B
推出
不推出企业A 推出
(400,400)(700,-600)不推出(-600,700)(-500,-500)
(。
“博弈论”习题参考附标准答案
《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。
A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。
A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。
A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。
A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。
A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。
A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。
A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。
A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。
A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。
A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。
A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。
博弈论课后题答案
博弈论课后题答案(总9页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--;第二章第三章PPT问题第四章第五章第六章一、用柠檬原理和逆向选择的思想解释老年人投保困难的原因。
答:“柠檬原理”是在信息不完美且消费者缺乏识别能力的市场中,劣质品赶走优质品,最后搞垮整个市场的机制。
“逆向选择”是在同样不完美信息和消费者缺乏识别能力的市场中,当价格可变时,价格和商品质量循环下降,市场不断向低端发展的机制.高龄人群的保险市场是一个典型的柠檬原理和逆向选择会起作用,从而会导致发展困难的市场。
老年人的健康情况差别很大,比年轻人之间的差别要大得多,而保险公司要了解老年人投保人的实际健康状况又很困难或成本很高,这就造成了保险公司对老年投保人健康状况的信息不完美。
则保险公司就无法根据每个老年投保人的实际健康情况确定不同的保费率,只能根据平均健康情况确定保费率。
这种平均保费率对健康情况很差的老年人是合算的,但对健康状况较好的老年人则不合算。
因此前者倾向于投保,后者则不愿意投保,这就会导致投保的老年人的平均健康情况会很差。
这使得保险公司的赔付风险大大提高,不仅不能赢利而且要亏损,从而失去经营老年保险的积极性,最终导致老年人的投保难问题。
这就是柠檬原理作用的结果。
如果允许调整保费率,那么保险公司为了避免亏损会上调保费率。
而这又会使得原来投保或者准备投保者中相对较健康的老人退出,从而投保老人的平均健康状况会变得更差。
如此循环,最终保费会升得很高而投保老人的平均健康情况则会越来越差,对市场的发展当然是很不利。
这就是逆向选择作用的结果。
二、为什么消费者偏好去大商店买东西而不太信赖走街穿巷的小商贩消费者去大商店更接近无限次重复博弈,商场提供高质量产品的概率更大,虽然个别消费者不一定能对商店以往售出商品的质量作出反应,但消费者群体肯定可以作出反应,因此大商店保持高质量符合自己的长期利益,一股会自觉保证质量,从而消费者也比较可以信任大商店的商品。
“博弈论”习题及参考答案
博弈论》习题、 单项选择题1. 博弈论中,局中人从一个博弈中得到的结果常被称为(A. 使行业的总利润达到最大B. 使另一个博弈者的利润最小A. 效用B. 支付C. 决策D. 利润 2. 博弈中通常包括下面的内容, 除了( )。
A. 局中人B.占优战略均衡C.策略D. 支付 3. 在具有占优战略均衡的囚徒困境博弈中( )。
A. 只有一个囚徒会坦白 B. 两个囚徒都没有坦白 C. 两个囚徒都会坦白 D. 任何坦白都被法庭否决了 4. 在多次重复的双头博弈中,每一个博弈者努力( )。
)。
C. 使其市场份额最大D.使其利润最大5. 一个博弈中,直接决定局中人支付的因素是()。
A. 策略组合B. 策略C. 信息D.行动6. 对博弈中的每一个博弈者而言, 无论对手作何选择, 其总是拥有惟一最佳行为, 此时的博弈具有)。
A. 囚徒困境式的均衡B. 一报还一报的均衡C. 占优策略均衡D.激发战略均衡7. 如果另一个博弈者在前一期合作, 博弈者就在现期合作; 但如果另一个博弈者在前一期违约, 博弈者在现期也违约的策略称为( A. 一报还一报的策略 B.激发策略 C. 双头策略D.主导企业策略8. 在囚徒困境的博弈中,合作策略会导致)。
A. 博弈双方都获胜B.博弈双方都失败 C. 使得先采取行动者获胜D.使得后采取行动者获胜9. 在什么时候,囚徒困境式博弈均衡最可能实现()A. 当一个垄断竞争行业是由一个主导企业控制时B. 当一个寡头行业面对的是重复博弈时C. 当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10. 一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()A. 主导策略B. 激发策略C. 一报还一报策略D. 主导策略11. 关于策略式博弈,正确的说法是()。
A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12. 下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。
博弈论习题参考答案(2)
《博弈论》习题参考答案(第2次作业)一、选择题1.B2.C3.A4.A5.B6.ABCD7.C 8.B 9.C二、判断正误并说明理由1.F 上策均衡是比纳什均衡更严格的均衡概论2.T 上策均衡是比纳什均衡更严格的均衡概论3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。
8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高三、计算与分析题1、 (1)画出A 、B 两企业的损益矩阵。
(2)求纯策略纳什均衡。
(做广告,做广告)2、画出两企业的损益矩阵求纳什均衡。
(1)画出A 、B 两企业的损益矩阵(2)求纳什均衡。
两个:(原价,原价),(涨价,涨价) 3、假定某博弈的报酬矩阵如下:甲乙 左 右 上 下(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>? 答:a>e, b>d, f>h, g<c(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足? 答:a>e, b>d 4、答:(1)将这一市场用囚徒困境的博弈加以表示。
“博弈论”习题及参考答案
《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为( )。
A.效用B.支付C.决策 D.利润2.博弈中通常包括下面的内容,除了( )。
A.局中人 B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中( )。
A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力( )。
A.使行业的总利润达到最大 B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是( )。
A. 策略组合 B. 策略C. 信息 D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。
A.囚徒困境式的均衡 B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。
A.一报还一报的策略 B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致( )。
A.博弈双方都获胜 B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。
A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D.当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种( )。
A.主导策略 B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是( )。
A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的( ):A. 策略是局中人选择的一套行动计划;B.参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。
博弈论各章节课后习题答案
9. 求如图所示完全信息动态博弈的子博弈完美纳什均衡(图中数字(a,b,c)分别表示局中人 1、
2、3 的 收 益 )。
1
A1
A2
3
2
C1
C2
B1
B2
(4,2,3)
(1,7,8) 3
C1
C2 C1
3
C2
(5,4,3) (7,6,6) (2,1,9) (0,4,2)
答:局中人 1 采取 A2 行 动 ,局中人 2 采取行动 B1 时,局中人 3 必然采取 C2 行 动( 因为 3<6), 因而该博弈的顶点只能是(7,6,6)。同样对于局中人 3 右边一个子博弈,必然采取 C1 行动 (9>2),因而该博弈的顶点只能是(2,1,9)。进而原博弈简化为:
的定价,qi是企业i的需求量。假设企业生产没有固定成本,并且边际成本为常数c,c<a.假定博弃 重复无穷多次,每次的价格都立即被观察到,企业使用触发策略。求使垄断价格可以作为完美 均衡结果出现的最低贴现因子δ,并解释δ与n的关系。
分以下几个步骤进行。
1)计算纳什均衡 当企业 i 选择价格 pi,其它企业选择价格 pj(j=1,2,…,n,j≠i)时,企业 i 的利润为: πi = (pi − c)qi = (pi − c)(a − pi + b(p1 + p2 + ⋯ + pi−1 + pi+1 + ⋯ + pn )) ,i=1,2,…,n
∂π2 ∂q 2
= a − q1
− 2q2
− q3
−c=0
∂π3 ∂q3
=
a
− q1
− q2
− 2q3
−c
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论课后习题答案
第四部分课后习题答案
1. 参考答案:
括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙
的得益,而b表示甲的得益。
在第三阶段,如果,则乙会选择不打官司。
这时逆推回第二阶段,甲会选择
a,0
不分,因为分的得益2小于不分的得益4。
再逆推回第一阶段,乙肯定会选择
不借,因为借的最终得益0比不借的最终得益1小。
在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是
(a,b)。
a,0
逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为
(a,b)。
b,2
在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0),
当a,1
时乙肯定会选择借,最后双方得益为(a,b)。
在第二阶段如果,则甲会选择
a,1b,2分,此时双方得益为(2,2)。
再逆推回第一阶段,乙肯定会选择借,因为
借的得益2大于不借的得益1,最后双方的得益(2,2)。
根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况:
(1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0
得益
(1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且
是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12
且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益
(a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。
要本博弈的“威胁”,即“打”是可信的,条件是。
要本博弈的“承诺”,即a,0
“分”是可信的,条件是且。
a,0b,2
注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。
不过最终的结果并不会超出上面给出的范围。
2. 参考答案:
静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。
或者换句话说,静态贝叶斯博弈中博弈方的策略就是类型空间到行为空间的一个函数,可以是线性函数,也可以是非线性函数,当博弈方的类型只有有限几种时是离散函数,当博弈方的类型空间是连续区间或空间时则是连续函数。
只有一种类型的博弈方的策略仍然是一种行为选择,但我们同样可以认为是其类型的函数。
静态贝叶斯博弈中博弈方的策略之所以必须是针对自己所有可能类型的函数,原因是博弈方相互会认为其他博弈方可能属于每种类型,因此会考虑其他博弈方所有可能类型下的行为选择,并以此作为自己行为选择的根据。
因此各个博弈方必须设定自己在所有各种可能类型下的最优行为,而不仅仅只考虑针对真实类型的行为选择。
3. 参考答案:
正确。
事实上,不完全信息动态博弈与完全但不完美信息动态博弈本质上常常是相同的,是一种博弈问题的两种不同理解方法,而把它们联系起来的桥梁就是海萨尼转换。
4. 参考答案:
(1)错误。
即使自己对古玩价值的判断是完全正确的,仍然有可能后悔。
因为古玩交易的价格和利益不仅取决于古玩的实际价值和自己的估价,还取决于对方的估价和愿意接受的成交价格,因此仅仅自己作出正确的估价并不等于实现了最大的潜在利益。
(2)错误。
事实上经济学并没有证明教育对于提高劳动力素质有不可替代的作用。
此外,我们之所以认为教育对劳动力市场招聘员工有重要参考价值,是因为教育除了(很可能)对提高劳动力素质有作用以外,还具有重要的信号机制的作用。
也就是说,即使教育并不能提高劳动力素质,往往也可以反映劳动力的素质。
5. 参考答案:
在这个静态的贝叶斯博弈中,博弈方1的策略是私人信息类型的函数:当“自然”选择得益矩阵1时选择T,当“自然”选择得益矩阵2时选择B。
博弈方2的策略则根据期望利益最大化决定。
博弈方2选择L策略的期望得益为
,选择R策略的期望得益为,因此博弈方2必
0.510.500.5,,,,0.500.521,,,,
定选择R。
所以该博弈的纯策略贝叶斯纳什均衡只有:博弈方1在“自然”选择得益矩阵1时选择T,当“自然”选择得益矩阵2时选择B,博弈方2选择R。
6. 参考答案:
根据对完全信息静态博弈的分析方法,我们很容易发现上述两市场博弈中有两个纯策略纳什均衡(A,B)和(B,A),以及一个对称的混合策略纳什均衡:每个厂商都以0.5的概率随机选择A和B。
现在我们把上述两市场博弈改成不完全信息的版本。
设两个厂商的得益如下面的得益矩阵所示:
其中分别是两个厂商的私人信息,对方只知道它们都均匀分布在上。
tt和[,],,,12
这时候,我们不难证明厂商1采用策略“时选择A,否则选择B”,厂商2也采用t,01
策略“时选择A,否则选择B”,构成这个不完全信息静态博弈的一个贝叶斯纳什t,02
均衡。
根据的上述分布,我们知道两个厂商选择A和B的概率都是0.5。
当趋tt和,12
向于0时,这个不完全信息博弈与完全信息博弈越来越接近,其纯策略贝叶斯均衡当然与完全信息博弈的混合策略纳什均衡完全相同。