耶鲁博弈论习题

合集下载

博弈论考试题及答案

博弈论考试题及答案

博弈论考试题及答案一、单项选择题(每题2分,共10题,共20分)1. 博弈论中,参与者在决策时不知道其他参与者的选择,这种博弈类型被称为:A. 完全信息博弈B. 不完全信息博弈C. 零和博弈D. 非零和博弈答案:B2. 在博弈论中,以下哪个概念描述的是参与者在博弈中所追求的目标?A. 纳什均衡B. 帕累托最优C. 占优策略D. 博弈收益答案:D3. 囚徒困境中,两个参与者如果都选择合作,他们将获得的收益是:A. 最大的B. 最小的C. 中等的D. 不确定的答案:A4. 以下哪个选项不是博弈论中的均衡概念?A. 纳什均衡B. 子博弈完美均衡C. 贝叶斯均衡答案:D5. 在博弈论中,如果一个策略在任何情况下都是最优的,那么这个策略被称为:A. 占优策略B. 纳什均衡C. 帕累托最优D. 混合策略答案:A6. 博弈论中的“混合策略”是指:A. 参与者随机选择纯策略B. 参与者总是选择相同的策略C. 参与者只选择一种策略D. 参与者不进行策略选择答案:A7. 在博弈论中,如果一个参与者的策略选择不依赖于其他参与者的策略选择,这种策略被称为:A. 占优策略B. 独立策略C. 混合策略D. 纳什均衡答案:A8. 博弈论中,以下哪个概念描述的是所有参与者都不可能通过单方面改变策略来提高自己的收益?A. 帕累托最优B. 纳什均衡C. 占优策略答案:B9. 在博弈论中,如果一个参与者的策略在其他所有参与者的策略给定时是最优的,这种策略被称为:A. 占优策略B. 纳什均衡C. 最优反应D. 混合策略答案:C10. 博弈论中的“动态博弈”是指:A. 参与者同时做出决策的博弈B. 参与者按顺序做出决策的博弈C. 参与者只进行一次决策的博弈D. 参与者不进行决策的博弈答案:B二、多项选择题(每题3分,共5题,共15分)1. 以下哪些是博弈论中的基本类型?A. 合作博弈B. 非合作博弈C. 完全信息博弈D. 不完全信息博弈答案:A, B, C, D2. 在博弈论中,以下哪些是描述均衡的概念?A. 纳什均衡B. 帕累托最优C. 占优策略均衡D. 混合策略均衡答案:A, C, D3. 以下哪些是博弈论中可能的结果?A. 帕累托最优B. 纳什均衡C. 占优策略均衡D. 混合策略均衡答案:A, B, C, D4. 在博弈论中,以下哪些是描述策略的概念?A. 纯策略B. 混合策略C. 占优策略D. 最优反应答案:A, B, C, D5. 以下哪些是博弈论中可能的决策顺序?A. 同时决策B. 顺序决策C. 重复决策D. 单次决策答案:A, B, C, D三、简答题(每题5分,共2题,共10分)1. 请简述博弈论中的“纳什均衡”是什么?答案:纳什均衡是指在一个博弈中,每个参与者都选择了自己的最优策略,并且这些策略在其他参与者的策略给定时是最优的,没有任何一个参与者可以通过单方面改变策略来提高自己的收益。

博弈论指定习题和参考答案

博弈论指定习题和参考答案

指定习题和参考答案Chapter 2: 1, 21. (a) D. There is so much amount and kinds of yogurt that each shopper need not consider whatothers do.(b) G. A prom is likely to be small enough that any participant can have some conceivable influence on others. For example, these two should prevent from dressing the same. However, in a BIG CITY, this may not be a case.(c) D. If he is not restricted to any specific university.(d) G. There are so few competitors for this specific product.(e) G. He must consider the interaction between him and his running mate. Even more, he must consider the response of the constituency when he chooses the mate.2. (a) Z; R/NR; I; F; NC.(b) NZ; NR; A; F; C.(c) NZ;NR; I; F; CChapter 3: 1, 2, 6, 71. (a) D=3, T=6(b) D=4, T=9(c) D=5, T=82. (a) #S(A)=2, S(A)={N,S}; #S(B)=2, S(B)={t, b}(b) #S(A)=2*2*2=8, S(A)={NNN, NNS, NSN, NSS, SNN, SNS, SSN, SSS}(left, right-up,right-down)#S(B)=2, S(B)={t, b}; #S(C)=2, S(C)={u,d}(c) #S(A)=2*2*2=8, S(A)= {NNN, NNS, NSN, NSS, SNN, SNS, SSN, SSS}(left, middle,right)#S(B)=8, S(B)={nnn, nns, nsn, nss, snn, sns, ssn, sss}6. (a) At the final run, B must take dimes. At the run next to final, if A choose to pass, given Btake dime at the final run, he can only get the reward accumulating at a speed of 5 cents per turn, initially 0 cents. If he takes dimes, he gets the dimes accumulating at a speed of 20 cents per turn, initially 10 cents. He surely takes dimes. Given this, B must take dimes at the run second next to final (B’s payoffs are the same as in our initial game) . Then A has the same reasoning as at the next to final run. And so on. So the rollback equilibrium strategy is always taking dime, for both players.(b) Using rollback method, let’s consider from the second round.No matter what payoffs both have got in the first round, they have sunk and cannot affect both players’ decisions in the second round. So two players play the second round as if it is a single-round centipede. So each plays is always choosing to take dimes, resulting payoffs of10 to A and 0 to B.Keeping this in both players’ mind, the first round is played almost as a single-roundcentipede, except that A always gets a reward of 10, whether she passes the dime or take it.But the fact that you always get something will neither affect your decision. So finally the first round game is exactly as a single-round centipede.Use rollback to this reduced single-round centipede. Notice the game is essential the same as before in the first 6 runs when the total amount is not accumulated to 50 when it’s player A’ s turn to play. If we can decide that the game after the 6th run will have an equilibrium of both players always taking dimes, we can be sure that B will get at most 20 when the 7th run comes and A (at most) takes 50.Now consider this ‘small’ equilibrium with only the last 4 runs. B will take dimes at in the final run (with a payoff of 90, otherwise 0). In any round before for A to play, taking dimes will leave her at least 50, but passing it will leave her at most 100-90=10 if B takes dimes then. In any round before for B, taking dime will leave him at least 60, but passing it will leave her at most 100-50=50 if A takes dimes then. Given the final run’s action of B (taking dimes), we can derive that both will always take dime in any round before, but after 6th run.Now let’s go back to our 6th run. B will take dimes at the 6th run (with a payoff of 60, otherwise 20). Given B’s choice, the game before the 6th run goes like the original one.The equilibrium is that both players always take dimes.(c) All the logic of (b) applies here until we begin to consider the last 5 runs (not 4 runs at thistime) of the first round game. Use rollback.B takes dimes in the final run, but get only 40 and leave 50 (as we restricts) to A. In the9th(second to the last) run, A can choose either to pass or take dimes(getting 50 both). The game essential the same when it ends in 9th run or 10th run.However, the 8th run is crucial. B can choose either to pass or to take dimes (getting 40 both). If B chooses to take dimes, A will definitely chooses to take dimes in the 7th run, and so on. The cooperation totally breaks and results in taking dimes always (our old equilibrium outcome).In any round before, but after 5th run, if both expect complete cooperation throughout the future, then they can either choose to pass or take. Any single deviation from cooperation (taking dimes) will result in total breakdown. So the 6-8th runs are all crucial points, given cooperation afterwards.Consider both pass dimes. Given this, at the 5th run, A chooses to pass is at least as good as to take. Taking them leads to breakdown as well. Suppose she passes it. B will also be indifferent with passing or taking dimes. So the 4-5th runs are also crucial points.However the 3rd run and the earlier are not crucial. If cooperation always happens afterward, passing dimes are always strictly better than taking dimes. If breakdown has already happen afterwards, taking dimes are definitely better choices.Summary: this game has multiple equilibria. Always passing dimes is one of them. Any deviations in one of 4-8th runs, given cooperation afterwards, will lead to breakdown from the very beginning. ( The number of equilbria is (1+5)*2=12, taking into account in the 9th run, both passing or taking dimes are indifferent for A.)7. (a) Amy; Beth.The player who reaches exactly 89 first will win; thus the player who reaches 78 first will win;thus 67,56, 45, 34, 23, 12, 1. Obviously Amy will reach 1 first.The player who reaches exactly 99 first will win. Then 88, 77, 66, 55, 44, 33, 22, 11.Obviously Beth will reach 11 first.(b) For Amy: 1 in the first run, then 11 no matter what Beth chooses, and 22, and so on. ForBeth, she can choose any amount between 1 and10.For Amy: any amount between 1 and 10. For Beth, 11 in his first run, 22 in his second run, and so on.Chapter 4: 2(d), 3(d), 5, 6, 9, 122. (d) Up is dominated by Straight (for Row). Then Left and Middle are both dominated by Right(for Column). Given Column plays Right, Row chooses Straight. The only NE is (Straight, Right).3. (d) (North, East) (unique NE). No dominant or dominated for both. Best-response analysis.5. Dominance solvable. (Up, Left). (Level, Center) has the same payoffs but not NE. There arealso other strategy configurations having strictly higher payoffs but not NEs.6. (1)JapaneseNorthern Southern AmericanNorthern 2 2Southern 1 3 (2) “Southern” is weakly dominated by “Northern” for Japanese. (North, North) is the only NE.(Check if “Southern” for Japanese can be part of any NE before you eliminate it.)9. (a) 3 NEs: (1, 1), (2, 2), (3, 3). The first is less likely to be focal point. But the other two areequally likely to be.(b) 12.5; Yes; Mixed strategy (just like flipping coins) can be used.12. (a) Two NEs: (Brunette, Blonde), and (Blonde, Brunette), yielding payoffs (5, 10) and (10, 5)respectively.Player 2Blonde BrunettePlayer 15Blonde 0,0 10,Brunette 5, 10 5, 5(b)Player 3Blonde BrunettePlayer 2 Player 2Blonde Brunette Blonde Brunette Player 1Blonde 0, 0, 0 0, 5, 0 0, 0, 5 10, 5, 5Brunette 5, 0, 0 5, 5, 10 5, 10, 5 5, 5, 53 NEs: (Blonde, Brunette, Brunette), (Brunette, Blonde, Brunette), and (Brunette, Brunette, Blonde), with payoffs 10 for who wins the Blonde, 5 for who wins Brunette.(c) The only possible NEs are those with only one pursues and wins the only Blonde and all others pursues and wins somehow excessive Brunettes.Or, follow the assumption given in text. Given k>=1, for any player, his payoffs of pursuing the Blonde is 0 and definitely worse than pursuing the Brunette with payoff 5. However, if k=0, you’d better pursue the Blonde.Consider this for a while, you will get the NE solutions.Thus All players choose Brunette cannot be a NE.。

【博弈论-耶鲁公开课】博弈论作业(博弈论24讲)数应专业

【博弈论-耶鲁公开课】博弈论作业(博弈论24讲)数应专业

博弈论作业(博弈论24讲)数应专业一、1、理性人:指代这一类人,他们只关心自己的利益。

2、如果选择a的结果严格优于b,那么就说a相对于b来说是一个严格优势策略。

结论:不要选择严格略施策略。

3、理性人的理性选择造成了次优的结果4、举例:囚徒困境、宿舍卫生打扫问题、企业打价格战等5、协和谬误收益很重要,“如欲得之,必先知之”6、要学会换位思考,站在别人的立场上看别人会怎么做,在考虑自己受益的同时,要注意别人会怎么选择二、1、2、3、4、5、打渔问题、全球气候变暖与碳排放问题博弈的要素:参与人、策略集合、收益如果策略a严格劣于策略b,那么不管他人怎么选择,b总是更好的选择军队的入侵与防卫问题所有人都从1到100中选个数字,最接近所有人选的数字的均值的2/3者为胜,这个数字是多少呢?作为理性人,每个人都会选择67(100*2/3)以下的数,进一步假设你的对手也是理性的,你会选择45(100*4/9)以下的数……依据哲学观点,如果大家都是理性程度相当的,那么最后数字将为1,然而结果却是9,这说明博弈的复杂性6、共同知识与相互知识的区别三、1、利用迭代剔除法领悟中间选民问题2、迭代剔除法就是严格下策反复消去法,不断地把劣势策略剔除出去,最后只剩下相对优势的策略3、中间选民问题就是,在两党制中,政党表述施政纲领要吸引位于中间位置的选民,他们认为在选举中处于中间标度可以吸引左右两边的选民,并以此获得胜利。

4、中间选民问题理论成立的条件是有两个参与人;政治立场能使选民相信。

5、由此延伸出来的还有加油站选址问题,两家加油站不是在不同的路口选址,而是在不确定哪个位置较佳的时候会选在同一处,这也是“中间选民定理”的凸显6、在迭代剔除法不能运用时,比如说该博弈中博弈方1和2均没有严格下策,可以用二维坐标系画出选择策略之后的收益分布四、1、罚点球:一个经过模型简化的点球模型:罚球者可以选择左路,中路,右路3种路线去踢点球,门将可以选择向左扑救或者向右扑救(门将没有傻站着不动的option)。

博弈论习题集及解答9_sol

博弈论习题集及解答9_sol
Problem Set 9 Solution
Econ 159a/MGT522a, Yale University
M.Chen momotocmx@
1. War of Attrition.
f(2) F(2) q(2)
(-c-c,-c-c) (-c+v,-c+0)
A
f(1) F(1) q(1) Q(2)
B
f(2) q(2)
(-c+0,-c+v) (-c+0,-c+0)
(v,0) A
Q(1) q(1)
B
f(1)
(0,v)
(0,0)
First we calculate the pure SPEs in this game. • Second sub-game
f(2) F(2) q(2)
(-c,-c)
F(2)
f(2) q(2)
v, 0 0, 0 1-p p 1-p
-c +
F(2) Q(2)
-c,-c 0, v p
− cp + v (1 − p) = 0 · p + 0 · (1 − p) v c ⇒p= , 1−p= c+v c+v
v c v c Mixed NE is [( c+ v , c+v ), ( c+v , c+v )], and the payoff is (0, 0). Back to first stage, we have following payoff matrix

SPE of mixed strategy in first stage and pure strategy in second stage We already compute the pure NE in second stage {(F (2), q (2)), (Q(2), f (2))}. Back to the first stage: • For (F (2), q (2)) in second stage, we have the following payoff matrix

博弈论耶鲁考试题及答案

博弈论耶鲁考试题及答案

博弈论耶鲁考试题及答案1. 定义博弈论,并简述其在经济学中的应用。

答案:博弈论是研究具有冲突和合作特征的决策者之间的战略互动的数学理论。

在经济学中,博弈论被用来分析市场参与者如何在竞争和合作中做出最优决策,例如在寡头垄断市场中企业如何设定价格,或在国际贸易中各国如何制定关税政策。

2. 描述纳什均衡的概念,并给出一个经典的例子。

答案:纳什均衡是指在一个博弈中,每个参与者都选择了最优策略,前提是其他参与者的策略是已知的。

在这种情况下,没有任何一个参与者可以通过单方面改变策略来获得更好的结果。

一个经典的例子是囚徒困境,其中两名犯罪嫌疑人被分别审讯,如果两人都保持沉默,他们将获得较轻的刑罚;但如果一人背叛而另一人保持沉默,则背叛者将获得自由而沉默者将受到重罚;如果两人都互相背叛,则都会受到较重的刑罚。

在这种情况下,尽管两人合作(都保持沉默)对双方来说是最好的结果,但纳什均衡却是两人都选择背叛。

3. 解释什么是零和博弈,并给出一个例子。

答案:零和博弈是指博弈中所有参与者的收益总和为零的博弈。

在这种博弈中,一个参与者的收益必然以另一个参与者的损失为代价。

一个例子是赌博,比如扑克牌游戏中,赢家赢得的金额正好等于输家输掉的金额,因此游戏的总收益为零。

4. 描述博弈论中的混合策略,并解释其在实际中的应用。

答案:混合策略是指在博弈中,参与者以一定的概率选择不同的纯策略。

在实际应用中,混合策略可以增加策略的不可预测性,从而提高博弈的复杂性。

例如,在拍卖中,参与者可能会以一定的概率出不同的价格,以迷惑对手并提高自己获胜的机会。

5. 简述博弈论中的动态博弈与静态博弈的区别。

答案:动态博弈是指参与者在博弈过程中可以多次做出决策,并且每个决策都可能基于之前博弈的结果。

静态博弈则是指参与者只做出一次决策,且决策不受之前博弈结果的影响。

动态博弈的一个例子是重复囚徒困境,参与者在每一轮中选择合作或背叛,并根据之前轮次的结果调整自己的策略。

耶鲁大学博弈论第一章答案

耶鲁大学博弈论第一章答案
player 3 (b>c>a) b c player 2 (c>a>b) c
a a a a c
Now player 2 has strategy a weakly dominated by c and player 3 has b weakly dominated by c. The predicted outcome is that player 1,2 and 3 will choose strategy a,c and c respectively and finally winner is player candidate c.
Problem Set 1 Solution
Econ 159a/MGT522a, Yale University
M.Chen momotocmx@
1. Strictly and Weakly Dominated Strategies? A strategy si is a strictly dominated strategy if there exists a strategy si such that si always does strictly better than strategy si no matter what others do, that is ui (si , s−i ) > ui (si , s−i ) for all s−i A strategy si is a weakly dominated strategy if there exists a strategy si such that ui (si , s−i ) ≥ ui (si , s−i ) for all s−i ui (si , s−i ) > ui (si , s−i ) for some s−i ExampБайду номын сангаасe:

[耶鲁大学开放课程:博弈论].Problem.Set.4

[耶鲁大学开放课程:博弈论].Problem.Set.4
人2 选择诚实的概率会有怎样的变化?参与人1拒绝更换光头的概率又有怎样的变化?请解释说
明。
(g).有人说 ,在美国当人们生病了去看医生时,他们从来不觉得自己感冒了,而是认为自己是在
“修音响”。请解释一下,为什么人们会认为医生经常欺骗患者不当牟利呢?[提示:可以通过分
析 值对于这个模型的均衡有何影响来入手]
D 5,8 4,2
(a). 找出所有的纳什均衡(包括纯策略纳什均衡和混合策略纳什均衡),并解释说明为何你所找
出的就是所有的纳什均衡。
(b). 假设参与人2的收益 从8减小到6,而其他收益均不变。找出此情况下所有的纳什均衡。
3. 我要修音响(来自Osborne的习题):参与人1的立体音响系统出毛病了,只有一个声道有声。
他不知道需要简单维修 (比如说清理)还是需要彻底维修(比如更换光头)。需要更换光头的概
率为 。在家附近的维修网点里,更换光头的费用是L,而清理的费用是C (其中L>C)。他认识维
修专家-参与人2,参与人2的利润用 表示。她可以选择诚实(收费L为参与人1更换光头或收费C
却在考虑是(y)否(x)要使用他的炸药来制造一次雪崩。博弈的收益如下:
002
x y
a 12,0 0,6
时,001 应该怎么办?
(b). 假如你是耶鲁大学训练出来的 “Queue”先生。作为英国军事情报局的顾问,你会建议001
不要选择哪些路线呢?请说明你的理由。
(c). 热情的观众们现在很想知道这部大片最后的结局是什么样的。请找出一个纳什均衡,使其中
一个参与人采用的是纯策略 而另一个参与人采用的是混合策略 。再找出另外一个纳什均衡使得
其中策略 被赋予概率0。这rse |人人影视博弈论制作小组Darrencui翻译 1

耶鲁大学《博弈论》第一节课的游戏

耶鲁大学《博弈论》第一节课的游戏

耶鲁大学《博弈论》一
———课堂游戏
1、在不被同桌看到的情况下,在□中填写字母α或者字母β,吧这看成成绩的赌注,我会随机把你们分成两两一组,你们不知道会跟谁分到一组,按如下方法给出你们的成绩,如果选择而你的对手选择了α,那么你得A,你对手得C,如果你们都选择了α,那么你们都得B-,如果你选择β,你对选择α,你得C,你对手得A,如果你们都选择β,你们都得B+。

讲解表格:对手
αβ

β
注解:表格里的第一个选择是我做出选择后会遇到的结果,相对的,表格里的第二个是对方的结果。

课堂五个结论:1、不要选择劣势策略。

2、耶鲁大学的学生很自私(其实大多人的性格里都有自私的一面)。

3、理性选择导致次优的结果。

4、学会换为思考,站着别人的立场去分析对方想要得到的收益是什么,会做出怎样的选择,对方的优势策略与劣势策略是什么,当然做出选择的同时也要考虑到对方也回这样考虑你的立场,你的选择。

5、汝欲得之,必先知之,如果你想得到什么,必先要明白自己的动机及收益是什么,了解自己的目的。

2、从1到100之间选择一个数字填写到□内,不要让你们的同桌看到,我们会计算全班的平均数,谁选的数字最接近平均数的三分之二,谁就是赢家,赢家的奖金是5美元减去所选数和平均数三分之二差的百分数。

例:三个人分别选择数字,25、5、60。

他们的平均数是(25+5+60)÷3=30,平均数的三分之二等于:30÷3×2=20,在本本例题中最接近平均数三分之二的数字是25,那么相对而言奖金是5美元减去5美分,就是4美元95美分。

博弈论各章节课后习题答案

博弈论各章节课后习题答案

9. 求如图所示完全信息动态博弈的子博弈完美纳什均衡(图中数字(a,b,c)分别表示局中人 1、
2、3 的 收 益 )。
1
A1
A2
3
2
C1
C2
B1
B2
(4,2,3)
(1,7,8) 3
C1
C2 C1
3
C2
(5,4,3) (7,6,6) (2,1,9) (0,4,2)
答:局中人 1 采取 A2 行 动 ,局中人 2 采取行动 B1 时,局中人 3 必然采取 C2 行 动( 因为 3<6), 因而该博弈的顶点只能是(7,6,6)。同样对于局中人 3 右边一个子博弈,必然采取 C1 行动 (9>2),因而该博弈的顶点只能是(2,1,9)。进而原博弈简化为:
的定价,qi是企业i的需求量。假设企业生产没有固定成本,并且边际成本为常数c,c<a.假定博弃 重复无穷多次,每次的价格都立即被观察到,企业使用触发策略。求使垄断价格可以作为完美 均衡结果出现的最低贴现因子δ,并解释δ与n的关系。
分以下几个步骤进行。
1)计算纳什均衡 当企业 i 选择价格 pi,其它企业选择价格 pj(j=1,2,…,n,j≠i)时,企业 i 的利润为: πi = (pi − c)qi = (pi − c)(a − pi + b(p1 + p2 + ⋯ + pi−1 + pi+1 + ⋯ + pn )) ,i=1,2,…,n
∂π2 ∂q 2
= a − q1
− 2q2
− q3
−c=0
∂π3 ∂q3
=
a
− q1
− q2
− 2q3
−c

博弈论习题参考答案(3)

博弈论习题参考答案(3)

《博弈论》习题参考答案(第3次作业)一、选择题10.C 11. BCD 12. ACD 13.B 14.C15.B 16.B 17.A二、判断正误并说明理由13. .T无限次重复博弈没有结束重复的确定时间;而在有限次重复博弈中,存在最后一次重复,并且正是有结束重复的确定时间,使重复博弈无法实现更高效率均衡。

14. .T无限次重复博弈必须考虑后一期得益的贴现系数,对局中人和博弈均衡的分析必须以得益的现值为根据。

15. F 子博弈精炼纳什均衡一定是一个纳什均衡。

16. T 零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。

17.F 同第16题。

零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。

18.T 原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,因此不管是重复有限次还是无限次,不会和一次性博弈有区别。

19.T 有限次重复博弈,特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。

20.T 多个纯策略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯策略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯策略轮流采用。

21.F 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。

22.F 只要两囚犯只打算合作有限次,其最优策略均为招供。

比如最后一次合谋,两小偷被抓住了,因为将来没有合作机会了,最优策略均为招供。

回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢。

依此类推,对于有限次内的任何一次,两小偷均不可能合作。

23.T 如果阶段博弈G 有唯一的Nash 均衡,那么对任意有限次T ,重复博弈G(T)有唯一的子博弈完美结局:在每一阶段取G 的Nash 均衡策略。

博弈论习题和参考答案与解析

博弈论习题和参考答案与解析

博弈论?习题一、单项选择题1.博弈论中,局中人从一个博弈中得至口的结果常被称为〔〕. A?效用B.支付C.决策D.利润2.博弈中通常包括下面的内容,除了〔〕.A.局中人B.占优战略均衡C策略D?支付3.在具有占优战略均衡的囚徒困境博弈中〔〕.A.只有一个囚徒会坦白氏两个囚徒都没有坦白C?两个囚徒都会坦白D.任何坦白都被法庭否决了4.在屡次重复的双头博弈中,每一个博弈者努力〔〕.A.使行业的总利润到达最大B?使另一个博弈者的利润最小C?使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是〔〕A.策略组合B.策略C信息D.行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最正确行为,此时的博弈具有〔〕0A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D?激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为〔〕.A.一报还一报的策略B.激发策略8.在囚徒困境的博弈中,合作策略会导致〔〕oA博弈双方都获胜B博弈双方都失败C使得先米取行动者获胜D使得后米取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现〔〕oA.当一个垄断竞争行业是由一个主导企业限制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D.当一个寡头行业进行一次博弈时一个企业米取的彳丁为10.与另一个企业在前一阶段采取的行为一致〞这种策略是一种〔〕A.主导策略B.激发策略C.一报还一报策略D.主导策略11-关于策略式博弈,正确的说法是〔〕0A.策略式博弈无法刻划动态博弈B.策略式博弈无法说明行动顺序C.策略式博弈更容易求解D.策略式博弈就是一个支付矩阵12.以下关于策略的表达哪个是错误的〔〕:A.策略是局中人选择的一套行动方案;B.参与博弈的每一个局中人都有假设干个策略;C.一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D.策略与行动是两个不同的概念,策略是行动的规那么,而不是行动本身.13.囚徒困境说明〔〕:A.双方都独立依照自己的利益行事,那么双方不能得到最好的结果;B.如果没有某种约束,局中人也可在〔抵赖,抵赖〕的根底上到达均衡;C.双方都依照自己的利益行事,结果一方赢,一方输;D.每个局中人在做决策时,不需考虑对手的反响14.一个博弈中,直接决定局中人损益的因素是〔〕:A.策略组合B.策略C信息D.行动15.动态博弈参与者在关于博弈过程的信息方面是〔〕A不对称的B对称的C不确定的D无序的16.古诺模型表达了寡头企业的〔〕决策模型A本钱B价格C产量D质量17.伯特兰德模型表达了寡头企业〔〕决策模型.A本钱价格C产量 D 质量18.用囚徒困境来说明两个寡头企业的情况,说明了:〔〕A、每个企业在做决策时,不需考虑竞争对手的反响E. 一个企业制定的价格对其它企业没有影响C、企业为了预防最差的结果,将不能得到更好的结果D、一个企业制定的产量对其它企业的产量没有影响19.子博弈精炼纳什均衡〔〕:A.是一个一般意义上的纳什均衡;B.和纳什均衡没有什么关系;C.要求某一策略组合在每一个子博弈上都构成一个纳什均衡;D.要求某一策略组合在原博弈上都构成一个纳什均衡.20.在一般产品销售市场上,以下哪种原因导致了逆向选择.〔〕A产品质量的不确定性B私人信息C公共信息D产品价格21.完全信息动态博弈参与者的行动是〔〕A无序的B有先后顺序的C不确定的D因环境改变的22.市场交易中普遍存在的讨价还价属于哪种博弈.〔〕A完全信息静态博弈B完全信息动态博弈C不完全信息静态博弈D不完全信息动态博弈23.下面哪种模型是一种动态的寡头市场博弈模型〔〕A古诺模型B伯川德模型C斯塔克尔伯格模型D田忌齐威王赛马24?博弈方根据一组选定的在两种或两种以上可能行为中随机选择的策略为血玄〔、A纯策略B混合策略C激发策略D 一报还一报策略25.影响重复博弈均衡结果的主要因素是〔〕A博弈重复的次数B信息的完备性C支付的大小DA和B26.在动态博弈战略行动中,只有当局中人从实施某一威胁所能获得的总收益()不实施该威胁所获得的总收益时,该威胁才是可信的.A大于B等于C小于D以上都有可能二、判断正误并简要说明理由I,纳什均衡一定是上策均衡,上策均衡一定是纳什均衡.2?在一个博弈中博弈方可以有很多个.3.在一个博弈中只可能存在一个纳什均衡.4.由于零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈.5.在一个博弈中如果存在多个纳什均衡那么不存在上策均衡.6.曲于两个罪犯只打算犯罪一次〞所以被捕后才出现了不合作的问题即囚徒困境.但如果他们打算重复合伙屡次,比方说20次,那么对策论预测他们将采取彼此合作的态度,即谁都不招供.7,在博弈中纳什均衡是博弈双方能获得的最好结果.8.在博弈中如果某博弈方改变策略后得益增加那么另一博弈方得益减少.9,纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合.10.囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是由于两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长.11.斯塔克博格产量领导者所获得的利润的下限是古诺均衡下它得到的利润.12.在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系〞使重复博弈无法实现更高效率均衡的关键问题.13.子博弈精炼纳什均衡不是一个纳什均衡.14.零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡.15.原博弈惟一的纳什均衡本身是帕雷托效率意义上最正确战略组合,符合各局中人最大利益:采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果,符合所有局中人的利益,因此,不管是重复有限次还是无限次,不会和一次性博弈有区别.16.在动态博弈中,由于后行动的博弈方可以先观察对方行为后再选择行为 ,因此总是有利的.入计算与分析题1、A、B两企业利用广告进行竞争.假设A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;假设A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;假设A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;假设A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润.〔,〕画出A、B两企业的损益矩阵.〔2 〕求纯策略纳什均衡.2、可口可乐与百事可乐〔参与者〕的价格决策:双方都可以保持价格不变或者提升价格〔策略〕;博弈的目标和得失情况表达为利润的多少〔收益〕;利润的大小取决于双方的策略组合〔收益函数〕;博弈有四种策略组合,其结局是:〔1〕双方都不涨价,各得利润10单位;〔2 〕可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30 ;(3 )可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30 ;(4 )双方都涨价,可口可乐利润140,百事可乐利润35 ;画出两企业的损益矩阵求纳什均衡.3、假定某博弈的报酬矩阵如下:(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>?(2 )如果(上,左)是纳什均衡,上述哪几个不等式必须满足4、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场.如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元.如果一方在价格决策方面选择合作而另一方却选择降低价格,那么合作的厂商获利将为零,竞争厂商将获利900000元.(1)将这一市场用囚徒困境的博弈加以表示.(2 )解释为什么均衡结果可能是两家公司都选择竞争性策略.5、博弈的收益矩阵如下表:⑴如果(上/左)是占优策略均衡/那么a、b、c、d、G、f、g、h之间必然满足哪些关系〔尽量把所有必要的关系式都写出来〕〔2 〕如果〔上,左〕是纳什均衡,那么〔1〕中的关系式哪些必须满足〔3 〕如果〔上,左〕是上策均衡,那么它是否必定是纳什均衡为什么〔4 〕在什么情况下,纯策略纳什均衡不存在6、猪圈里有一头大猪和_头小猪,猪圈的一头有一个饲料槽,另一头装有限制饲料供给的按钮.按一下按钮就会有,0个单位饲料进槽,但谁按谁就要付出2个单位的本钱.谁去按按纽那么谁后到;都去按那么同时到.假设大猪先到,大猪吃到9个单位,小猪吃到一个单位;假设同时到,大猪吃7个单位,小猪吃3个单位;假设小猪先到,大猪吃六个单位,小猪吃4个单位.求〔1〕各种情况组合扣除本钱后的支付矩阵〔2 〕求纳什均衡.7、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润〔单位:万元〕由以下图的得益矩阵给出:1〕有哪些结果是纳什均衡(2 )两厂商合作的结果是什么8、求出以下博弈的所有纯策略纳什均衡.9、求出下面博弈的纳什均衡(含纯策略和混合10、根据两人博弈的损益绸邛仲I答问题:(1) ◎出两人各自的金部策略.图示均衡点.(2 )求出斯塔克博格rstackelberg )均衡情况下的产量、价格和利润.(3)说明导致上述两种均衡结果差异的原因.13.下面的得益矩阵两博弈方之间的一个静态博弈,该博弈有没有纯策略的纳什均衡,博弈的结果是什么14.两个兄弟分一块冰激凌.哥哥先提出一个分割比例 ,弟弟可以接受或拒绝,接受那么按哥哥的提议分割,假设拒绝就自己提出一个比例.但这时候冰激凌已化得只剩1/2 了,对弟弟提议的比例哥哥也可以接受或拒绝,假设接受那么按弟弟的建议分割,假设拒绝冰激凌会全部化光.由于兄弟之间不应该做损人不利己的是“因此我们假设接受和拒绝利益相同时兄弟俩都会接受.求该博弈的子博弈完美纳什均衡.15?如果学生在测试之前全面复习,考好的概率为90%,如果学生只复习一局部重点,那么有50% 的概率考好.全面复习花费的时间tl = 100小时,重点复习之需要花费t2=20小时.学生的效用函数为:U二W-2巳其中W是测试成绩,有上下两种分数Wh和Wl, e为努力学习的时间.问老师如何才能促使学生全面复习16?在以下监工与工人之间的博弈中,试用划线法分析该博弈有无纯策略纳什均衡;如果没有,那么写出混合策略纳什均衡的结果.监工17 ?求解以下博弈的纳什均衡.博弈方29 18 ?某人正在打一场官司,不请律师肯定会输,请律师后的结果与律师的努力程度有关.假设当律师努力工作〔100小时〕时有50%的概率能赢,律师不努力工作<10小时〕那么只有15%的概率能赢.如果诉讼获胜可得到250万元赔偿,失败那么没有赔偿.由于委托方无法监督律师的工作,因此双方约定根据结果付费,赢官司律师可获赔偿金额的10%,失败那么律师一分钱也得不到.如果律师的效用函数为m 0.05e,其中m是报酬e是努力小时数,且律师有时机本钱5万元.求这个博弈的均衡.四、论述题Is解释"囚犯困境;并举商业案例说明.2、用〃小偷与守卫的博弈"说明〃鼓励〔监管〕悖论"博弈论?习题参考答案>单项选择题r 5 B. B. C.D ' A.11 15. B. C. A.6 10 C. A. A.D. C.16 20 C. B. C.21 26. B. B. C. B. D. A.,判断正误并简要说明理由1. F 上策均衡是比纳什均衡更严格的均衡.所以上策均衡一定是纳什均衡 一定是上策均衡,2. T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈3. IF 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在多个纳什均衡4. T 零和博弈才旨参与博弈各方在严格竞争下,一方收益等于另一方损失与损失之和恒为零,所以双方不存在合作可能性而纳什均衡不 ,如性别战.,博弈各方收益 ,只能有一个5.T上策均衡是通过严格下策消去法〔重复剔除下策〕所得到的占优策略纳什均衡6.IF只要两囚犯只打算合作有限次,其最优策略均为招供.比方最后一次合谋,两小偷被抓住了,由于将来没有合作时机了,最优策略均为招供.回退到倒数第二次,既然已经知道下次不会合作,这次为什么要合作呢.依此类推,对于有限次内的任何一次,两小偷均不可能合作.7.F纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的.团F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.T虽然斯塔格伯格模型各方利润总和小于古诺模型〞但是领导者的利润比古诺模型时12..T无限次重复博弈没有结束重复确实定时间;而在有限次重复博弈中,存在最后一次重复,并且正是有结束重复确实定时间,使重复博弈无法实现更高效率均衡.13.F子博弈精炼纳什均衡一定是一个纳什均衡.14.F零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡.15.T原博弈惟一的纳什均衡本身是帕雷托效率意义上最正确战略组合,因此不管是重复有限次还是无限次,不会和一次性博弈有区别.16.F动态博弈是指各博弈方的选择和行动又先后次序的博弈.动态博弈的信息盯以是不对称的.所以策略分为先发制人和.斯塔克伯格博弈揭示“先发制人〞更有禾L而"后发制人"后行动的博弈方可以先观察对方行为后再选择行为反而处于不利境地.三、计算与分析题Is (1)(2)纯策略纳什均衡为(做广告,做广告),(不做广告,不做广告)得长价-20, 30140,35纳什均衡〔不涨价,不涨价〕,〔涨价,涨价〕.从帕累托均衡角度,为〔涨价,涨价〕3、〔 1〕如果〔上/左〕是上策均衡,那么,a>e b>d, g<c, f>h 〔2 〕如果〔上〕左〕是纳什均衡,a>e b>d,不等式必须满足新华航空北方航空 合作竞争50, 50 90, 00, 90 6, 65、 略纳什均衡为〔按,等〕 7、略8、纯策略纳什均衡〔氏甲〕,〔⑴不存在纯策略纳什均衡合作肓争⑵设甲选择"U"的概率为概率为1-P1乙选择"『的概率为P2,贝V选择" R" 的概率为1-P2对甲而言,最正确策略是按定的概率选〃上"和‘下’,使乙选择“左〃和〃右"的期望值相等即PI*8+ (l-PI) *0-P1*1+ (1-P1) *5解得PI = 5/12即⑸12, 7/12 )按5/12概率选〃上“、7/12概率选〃下"为甲的混合策略Nash均衡对乙而言,最正确策略是按一定的概率选“左“和“右",使乙选择〃上"和‘下’的期望值相等即P2*5+(l-P2)*0- P2*2 + (l-P2)*4即(4/7, 3/7肢4/7概率选‘左’、3/7概率选"右"为乙的混合策略Nash均衡10、略.11、见笔记12、见笔记.13、首先,运用严格下策反复消去法的思想,不难发现在博弈方1的策略中,B是相对于T的严格下策.把博弈方1的B策略消去后又可以发现,博弈方2的策略中C是相对于R的严格下策,从而也可以消去.两个博弈方各消去一个策略后的博弈是如下的两人2X 2博弈,己经不存在任何严格下策.再运用划线或箭头法,很容易发现这个2X2博弈有两个纯策略纳什均衡(M,L )和(1R ) 0由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系,一次性静态博弈的结果不能肯定.由于双方在该博弈中可能采取混合策略,因此实际上该博弈的结果可以是4个纯策略组合中的任何一个.14.假设哥的方案是SI: 1-S1淇中S1是自己的份额,弟的方案是S2: 1-S2, S2是哥的份额,那么可用如下的扩展形表示该博弈:Hi SiC5V2eS? 2)CO O)运用逆推归纳法先分析最后一阶段哥的选择.由于只要接受的利益不少于不接受的利益哥就会接受,因此在这个阶段只要弟的方案满足S2/2 $0,也就是S2$0,哥就会接受,否那么不会接受.由于冰激凌的份额不可能是负数,也就是说由于哥不接受弟的方案冰激凌会全部化掉〞因此任何方案哥都会接受.现在回到前一阶段弟的选择.由于弟知道后一阶段哥的选择方法,因此知道如果不接受前一阶段哥提出的比例,自己可以取S2=0,独享此时还未化掉的1/2块冰激凌;如果选择接受前一阶段哥的提议,那么自己将得到出1,显然只要l-Sn/2 ,即S1W1/2,弟就会接受哥的提议.再回到第一阶段哥的选择.哥清楚后两个阶段双方的选择逻辑和结果 ,因此他在这一阶段选择Sl = 1/2,正是能够被弟接受的自己的最大限度份额,超过这个份额将什么都不能得到,因此SI二1/2是最正确选择.综上,该博弈的子博弈完美纳什均衡是:哥哥开始时就提议按(1/2J/2)分割,弟弟接受.15.此题中老帅的调控于段高分和低分的差距.该博弈的扩•展形如下:只有当Ul» U2时学生才会选择全面复习.根据Ul» U2我们可以算出Wh- WD 400o这就是老师能有效全面复习需要满足的条件.其实在奖学金与成绩挂钩时,Wh- W1也可以理解成不同等奖学金的差额.16泄有纯策略均衡,只有混合策略均衡((0. 25,0.75 ),(0. 5,0. 5 ))17. 可以根据画线法求得有唯一纯策略均衡(上,左)18.参见第15题四、论述题1、解释〃囚犯困境〃,并举商业案例说明.(1)假设条件举例:两囚徒被指控是一宗罪案的同案犯.他们被分别关在不同的牢房无法互通信息.各囚徒都被要求坦白罪行.如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年.(2)囚徒困境的策略矩阵表.每个囚徒都有两种策略:坦白或不坦白.表中的数字分别代表囚徒甲和乙的得益.囚徒乙3〕分析:通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都〃坦白〃.给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白.这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不管对方如何选择,个人的最优选择是坦白.其结果是双方都坦白.4〕商业案例:寡头垄断厂商经常发现它们自己处于一种囚徒的困境.当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润.但卡特尔协定不是一个纳什均衡,由于给尢双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润.2用〞小偷与守卫的博弈〃说明〃鼓励〔监管〕悖论〃.〔1〕假设条件举例:偷窃和预防偷窃是小偷和门卫之间进行博弈的一场游戏.门卫可以不睡觉,或者睡觉.小偷可以采取偷、不偷两种策略.如果小偷知道门卫睡觉, 他的最正确选择就是偷;如果门卫不睡觉,他最好还是不偷.对于门卫,如果他知道小偷想偷,他的最正确选择是不睡觉,如果小偷采取不偷,自己最好去睡觉.〔2 〕小偷与门卫的支付矩阵表〔假定小偷在门卫睡觉时一定偷成功,在门卫不睡觉时偷一定会被抓住〕:。

耶鲁大学公开课博弈论课习题

耶鲁大学公开课博弈论课习题

耶鲁大学公开课:博弈论习题集1(第1-3讲内容)Ben Polak, Econ 159a/MGT522a.由人人影视博弈论制作组Darrencui翻译1.严格劣势策略与弱劣势策略:严格劣势策略的定义是什么?弱劣势策略的定义是什么?请用一个包含两个参与人的博弈矩阵来举例说明,要求其中一个参与人有三个策略且三者之一为严格劣势策略;另一个参与人有三个策略但三者之一为弱劣势策略。

请指出你所举例子中的劣势策略。

2.迭代剔除(弱)劣势策略:请看下面的博弈2(a). 这个博弈中是否存在严格劣势策略和弱劣势策略?如果存在,请指出并说明。

(b). 剔除掉严格劣势策略和弱劣势策略之后,在简化的博弈中是否还有劣势策略呢?如果是,请指出并说明。

最后哪些策略不会被剔除呢?(c). 回顾你第一次剔除劣势策略时哪些策略是劣势策略并给出解释。

把它与第二次剔除的劣势策略作比较。

从中你能得出关于迭代剔除劣势策略的何种结论?3. 霍特林的选址博弈(也称霍特林模型):回顾一下课堂中所讲的选票博弈。

其中有两个参与人,每个参与人都从集合* +中选出自己的立场。

这十个立场均分全部的选票。

选民把选票投给与自己立场最接近的候选人。

如果两个候选人站在同一个立场上,那么持该立场选民的选票平均分给每个候选人。

候选人想要最大化自己的得票率。

举例来说,()。

而() [提示:回答这道题时不必画出整个矩阵](a).课堂中我们指出立场2严格优于立场1,而实际上还有其它的立场也是严格优于立场1的,请找出所有优于立场1的立场并作出解释。

(b).假设现在有三名候选人。

举例来说,()而()。

此时立场2是否严格优于立场1?立场3呢?请作出解释。

另外,假设我们剔除了立场1和10,但是该立场的选票依然存在。

在简化的博弈中,立场2是否严格劣于或弱劣于其它(纯)策略?请作出解释。

4. “到底谁的话语权更重”:由三人组成的评审委员会要决出一场全国艺术大赛的冠军。

经过激烈的讨论之后,有三名选手进入最后的获奖候选人名单,分别是:一名画城市中的羚羊的女画家、一名做铅盒的男工匠、一名做根雕的男雕塑家。

博弈论书后习题

博弈论书后习题

第一章1.下图是两人博弈的标准式表述形式,其中参与者1的战略空间},{1D U S =,参与者2的战略空间},{2R L S =。

参与者2 参与者1LR D U这里h g f e d c b a ,,,,,,,为参数。

(1) 设),(*L U S =是此博弈的占优战略均衡,问:上述参数之间应满足哪些条件?(2) 设),(*R U S =是此博弈的逐步剔除严格劣战略均衡,问:上述参数之间应满足哪些条件?(用两种剔除顺序讨论)(3) 设),(*R D S =是此博弈的纳什均衡,问:上述参数之间应满足哪些条件?(4) 设),(*1L U S =和),(*2R D S =是此博弈的纳什均衡,问:上述参数之间应满足什么条件?这时两个参与者有无严格劣战略?2.在下图所示的标准式表述的博弈中,找出逐步剔除严格劣战略均衡。

参与者2 参与者1 LM MUD R 3.在下图所示的标准式表述的博弈中,哪些战略不会被重复剔除严格劣战略所剔除?纯战略纳什均衡又是什么?参与者2 参与者1 LC MTB R 4.下图所示的标准式表述的三人博弈中,参与者1的战略空间},{1D U S =,参与者2的战略空间},{2R L S =,参与者3的战略空间},,{3C B A S=。

参与者1选择两行中的某一行,参与者2选择两列中的某一列,参与者3选择三个矩阵的某矩阵。

找出此博弈的纯战略纳什均衡。

LR D UA L RB L R C5.(投票博弈)设有三个参与者)3,2,1(=i 要在三个项目(A,B 和C )中投票选出一个。

三个参与者同时投票,不允许弃权。

因此,三个参与者的战略空间为)3,2,1}(,,{==i C B A S i 。

得票最多的项目被选中。

如果没有任何项目得到多票数,那么项目A 就被选中。

某个项目被选中后三个参与者的收益函数如下:2)()()(321===C u B u A u1)()()(321===A u C u A u0)()()(321===B u A u C u(1) 写出此博弈的标准式表达;(2) 求出此博弈的纯战略纳什均衡。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本题,并不需要知道确切的收益,任何符合评审委员偏好顺序的收益都满足题意,并且你也不需
要画出整个矩阵]
(b).假设我们剔除了所有的劣势策略。请指出这种情况下,对于每位评审委员来说哪些策略是弱
劣势策略和严格劣势策略?请预测一下投票的结果,然后把它和评审委员1 的偏好进行比较,你
会发现什么?请作答。
要进行保密投票,每位评审委员只能投一票。如果仍出现平局,评审委员1 的投票将决定哪位选
手能够获奖。咋一看,评审委员1 似乎掌握了更多的话语权。
(a).仔细分析一下这个投票博弈。每位评审委员都有3 个严格劣势策略或是弱劣势策略吗?[提示:在讨论评审委员1 的时候请仔细考虑。想要回答
(B). 考虑问题时“现实一点”就可以得出更有说服力的结论。当我们排除了完全替代品这一个极端假设后,这个模型就更具有现实意义了。
略作比较。从中你能得出关于迭代剔除劣势策略的何种结论?
3. 霍特林的选址博弈(也称霍特林模型):回顾一下课堂中所讲的选票博弈。其中有两个参与
人,每个参与人都从集合 * +中选出自己的立场。这十个立场均分全部的选票。选民
把选票投给与自己立场最接近的候选人。如果两个候选人站在同一个立场上,那么持该立场选民
优于立场1?立场3呢?请作出解释。另外,假设我们剔除了立场1和10,但是该立场的选票依然存
在。在简化的博弈中,立场2是否严格劣于或弱劣于其它(纯)策略 ?请作出解释。
Open Yale Course |人人影视博弈论制作小组Darrencui 翻译 2
4. “到底谁的话语权更重”:由三人组成的评审委员会要决出一场全国艺术大赛的冠军。经过激
的(纯策略)纳什均衡是什么?
(b).第二条规则是,如果 ,并且每个人的预期金额是不同的,那么预期金额最小的参
与人分得等值的钱款而剩余的钱款归另一个参与人。如果 ,并且 ,那么每个人
都分得5 美元。这种情况下的(纯策略)纳什均衡是什么?
(c).假如我们为前两条规则增加一个限制条件,即预期金额必须是整数。这是否会改变前两条规
一个包含两个参与人的博弈矩阵来举例说明,要求其中一个参与人有三个策略且三者之一为严格
劣势策略;另一个参与人有三个策略但三者之一为弱劣势策略。请指出你所举例子中的劣势策略。
2.迭代剔除(弱)劣势策略:请看下面的博弈
2
l c r
T 1,1 0,1 3,1
1 M 1,0 2,2 1,3
D 1,3 3,1 2,2
(d)
其中 表示收入, 表示成本
4. 通过表达式(c)和(d),运用简单的微积分知识即可发现,在 不取极端值时:
5. 绘制公司1和公司2的最佳对策图线。在图像中指出当 和 时 会发生什么样的变化?[提示:运用一下问题1和问题2的答案]并在同一个图像中绘制出 的图像。
6. 通过算术方法找出纳什均衡。
则下的(纯策略)纳什均衡?
Open Yale Course |人人影视博弈论制作小组 Darrencui 翻译 1
耶鲁大学公开课:博弈论
习题集3(第6-7讲内容)
Ben Polak, Econ 159a/MGT522a.
由人人影视博弈论制作组Darrencui翻译
线性城市模型:差异产品的价格竞争:
烈的讨论之后,有三名选手进入最后的获奖候选人名单,分别是:一名画城市中的羚羊的女画家、
一名做铅盒的男工匠、一名做根雕的男雕塑家。不妨称这三个选手分别为a、d、c,三名评审委
员为1、2、3。评审委员有如下偏好:评审委员1 认为a 优于b,b 优于c;评审委员2 认为c 优
于a,a 优于b。委员3 认为b 优于c,c 优于a。比赛规则规定,如果评审委员意见不统一时,需
Open Yale Course |人人影视博弈论制作小组Darrencui 翻译 1
耶鲁大学公开课:博弈论
习题集1(第1-3 讲内容)
Ben Polak, Econ 159a/MGT522a.
由人人影视博弈论制作组Darrencui 翻译
1. 严格劣势策略与弱劣势策略:严格劣势策略的定义是什么?弱劣势策略的定义是什么? 请用
的选票平均分给每个候选人。候选人想要最大化自己的得票率。举例来说, ( ) 。而
( ) [提示:回答这道题时不必画出整个矩阵]
(a).课堂中我们指出立场2严格优于立场1,而实际上还有其它的立场也是严格优于立场1的,请找
出所有优于立场1的立场并作出解释。
(b).假设现在有三名候选人。举例来说, ( ) 而 ( ) 。此时立场2是否严格
律师2 付出的劳动量。参数 反映了两人的协同效果:一名律师付出越多的辛劳,合伙人就会
获得越多的收益。假设
并且 。两名律师的收益分别是:
其中
表示劳动的成本(注意:边际成本递增)。假设这家律师事务所没有其它的开销。在课堂
上我们论证了,理性策略(即迭代剔除非最佳对策后剩余的策略)是
Open Yale Course |人人影视博弈论制作小组Darrencui 翻译 2
? 每位顾客都只购买1单位的产品,要么买公司1的,要么买公司2的。也就是说总需求是1单位产品。
? 处于位置 的顾客她与公司1的距离是 而与公司2的距离是
- 当且仅当满足下列条件时,她会选择公司1的产品
(a)
当且仅当满足下列条件时,她会选择公司2的产品
(b)
如果恰好位于两家公司正中间时,她就抛硬币决定买哪家公司的产品
(a). 假设两名律师达成一致,决定两个人都付出一样多的劳动,并通过合同的形式规定了劳动量
的指标。如果他们想要最大化净收益(即收益减去劳动成本),他们应该在合同中规定各自付出
多大的劳动量 呢?这与课堂上得出的理性策略的劳动量相比有什么不同?[提示:为了解题方
便,可以暂时考虑b=0 的特殊情况]
(a). 这个博弈中是否存在严格劣势策略和弱劣势策略?如果存在,请指出并说明。
(b). 剔除掉严格劣势策略和弱劣势策略之后,在简化的博弈中是否还有劣势策略呢?如果是,请
指出并说明。最后哪些策略不会被剔除呢?
(c). 回顾你第一次剔除劣势策略时哪些策略是劣势策略并给出解释。把它与第二次剔除的劣势策
Open Yale Course |人人影视博弈论制作小组Darrencui 翻译 1
耶鲁大学公开课:博弈论
习题集2(第4-5 讲内容)
Ben Polak, Econ 159a/MGT522a.
由人人影视博弈论制作组Darrencui 翻译
1. 回顾罚球的案例:裁判判罚给参与人1 一次点球的机会,参与人1 即将执行判罚。她有三种射
对于模型的解读:顾客需要同时考虑价格和与公司的距离这两个因素。如果把线段想象成现实中的道路的话,我们可以用 距离 来表示到该公司的交通成本。或者,如果把线段想象成产品某方面的质量(比如冰激凌中的脂肪含量),那么此时 差异 就表示产品实际体验与顾客最佳预期之间的差异。从顾客的角度上看,参数 越大,那么两家公司生产的产品的差异也就越大。如果 ,那么这两种产品就是完全替代品。
(b). 在对参与人1的策略存在何种信念下,参与人2会觉得策略m是最佳对策?在对参与人2的策略
存在何种信念下,参与人1会觉得策略M是最佳对策?[提示:本题不需要绘制三维图像!]
(c). 假设参与人2 站在参与人1 的立场上思考后发现,无论参与人1 存在何种信念,她都会选择
改信念下的最佳对策。在这种情况下,参与人2 是否应该选择策略m 呢?
这种情况下的最佳对策函数,并绘制相应的函数图像,找出这种情况下对应的理性策略。把它与
(a)中的指标作比较。[提示:并不需要重做(a)的全部过程]
3. 纳什均衡与迭代剔除(Gibbons教科书上的习题):请看下面的这个博弈:
L C R
T 2,0 1,1 4,2
M 3,4 1,2 2,3
B 1,3 0,2 3,0
7. 当 时纳什均衡是什么?请给出你的答案。有人认为:“当产品相似度叫小而差异较大时竞争的激烈程度就会减弱。”这一点在本模型中是如何体现出来的呢?
Open Yale Course |人人影视博弈论制作小组 Darrencui 翻译 3
几个博弈论结论:
(A). 公司希望产品存在差异。这样公司可以定更高的价格和获得更高的利润。这个想法很简单,因为新进入市场的公司会终结这种高利润的情况。
(b). 假设第(a)题中的合同只对合伙人2有约束力,即合伙人2需要按照要求中的 付出等量的劳
动,而合伙人1可以任意在[0,4]的劳动量中自由选择。合伙人1会选择付出多少劳动呢?这与

有什么不同吗?请给出简明的解释。
(c). 回到最开始的博弈状态,假设现在
,即合伙人的辛勤劳动起到了反协同效果。求出
门路径:左路、中路、右路。参与人2 是门将。他可以选择防守左路、中路或者右路。两名参与
人的行为同时发出。收益(以达成目概率的十倍计算)如下:
2
l m r
L 4,6 7,3 9,1
1 M 6,4 3,7 6,4
R 9,1 7,3 4,6
(a). 对于每一个参与人来说,有哪个策略严格劣于另一个(纯)策略吗?
在课堂中我们学到了两种双寡头垄断竞争模型:古诺(产量)竞争模型和伯川德(价格)竞争模型。把企业间的竞争考成价格竞争的情况似乎更合情合理一些,然而古诺的结论却比伯川德的结论更令人信服。在这次习题集中我们来探讨一下第三种寡头竞争模型。和伯川德模型类似,这个模型中两家公司会进行价格竞争而非产能竞争。但与伯川德模型的不同之处在于,本模型中两家公司的产品并不是同质产品。用经济学的行话来说,产品之间是存在差异的。这次我就不在板书上给大家讲解如何分析这个模型了,各位不妨独自求索。大家也不必惊慌,本次习题集采用循序渐进的模式。请各位按照顺序依次回答每个问题。
相关文档
最新文档