不存在纯策略纳什均衡的重复博弈

本科《博弈论及其在管理中的应用58个问题答案》

表 8：两人博弈得益矩阵解：对乙来讲无论甲选择任何策略 M 都比 L 好，L 是乙的下策将其划去得到 3 行 2 列矩阵，此矩阵中对甲来讲无论乙选择任何策略 U 都比 M 好， M 是甲的下策将其划去得到表 8a 中 2 行 2 列矩阵（5 分） M 甲 U B (4, 1) (2, 0) 乙 R (1, 0) (2, 2)
1 ( , ) [5 1 ] (1 )[0 1 ]
猎人 2 [5 1 ] (1 )[0 1 ]
根据(5)和(6)，可得
1 ( , ) ( , ) 5 1, 2 5 1
问题 24 解答：猜硬币博弈有盖硬币方 A 和猜硬币方 B 游戏，(a)若盖硬币方
盖正面，猜硬币方猜正确(猜正面)，则盖硬币方输 1 元，猜硬币方赢 1 元；(b) 若盖硬币方盖正面，猜硬币方猜错(猜反面)，则盖硬币方赢 1 元，猜硬币方输 1 元。问题:(i)写出猜硬币博弈的得益矩阵；(ii)猜硬币博弈是否有纯策略纳什均衡解？解：赢利矩阵 (payoff matrix)如表 2 所示： B 猜正面 A 盖正面盖反面 (-1, 1) (1, -1) 猜反面 (1, -1) (-1, 1)
2 3 1 3
表 7：两人博弈得益矩阵解：对乙来讲无论甲选择任何策略 Y 都比 X 好，X 是乙的下策将其划去得到 3 行 2 列矩阵，此矩阵中对甲来讲无论乙选择任何策略 C
5
都比 B 好， B 是甲的下策将其划去得到表 7a 中 2 行 2 列矩阵（10 分）乙 Y 甲 A C (8, 20) (20, 0) Z (0, 8) (4, 4)
B 的期望得益为
(1)
2 ( , ) [ (1 )] (1 )[ (1 )]

博弈论第二章习题

问题1：博弈方2就如何分10000元钱进行讨价还价。

假设确定了以下原则：双方提出自己要求的数额1s 和2s ，10000021≤≤s s ，。

如果设博弈方1和，1000021≤+s s ，则两博弈方的要求都得到满足，即分得1s 和2s ；但如果1000021>+s s ，则该笔钱就被没收。

问该博弈的纯策略纳什均衡是什么？如果你是其中一个博弈方，你会选择什么数额，为什么？解：112111210000()010000s s s u s s s ≤-⎧=⎨>-⎩，那么，1210000s s =-221222110000()010000s ss u s s s ≤-⎧=⎨>-⎩那么，2110000s s =-它们是同一条直线，1210000s s +=上的任意点12(,)s s ，都是本博弈的纯策略的Nash 均衡。

假如我是其中一个博弈方，我将选择15000s =元，因为(5000,5000)是比较公平和容易接受的。

它又是一个聚点均衡。

问题2：设古诺模型中有n 家厂商。

i q 为厂商i 的产量，n q q q Q +++= 21为市场总产量。

P 为市场出清价格，且已知Q a Q P P -==)(（当a Q <时，否则0=P ）。

假设厂商i 生产产量i q 的总成本为ii i i cq q C C ==)(，也就是说没有固定成本且各厂的边际成本都相同，为常数)(a c c <。

假设各厂同时选择产量，该模型的纳什均衡是什么？当趋向于无穷大时博弈分析是否仍然有效？解：1()ni i i j i j pq cq a c q q π==-=--∑，1,2,,i n =令20ii j j ii a c q q q π≠∂=---=∂∑，1,2,,i n =解得：***121na c q q q n -====+，2***121na c n πππ-⎛⎫==== ⎪+⎝⎭当n 趋向于无穷大时，这是一个完全竞争市场，上述博弈分析方法其实已经失效。

第6.2讲：Repeated Games(II)：以“猜硬币博弈”为例

有预见能力的理性博弈方都知道最后一个阶段的结果，因此在该阶段也不可能有合作的可能性。
猜硬币方猜正面猜反面盖正面盖硬币方盖反面 -1,1 1,-1 1,-1 -1,1
9
“猜硬币博弈” 的有限次重复博弈
依此类推
得出结论，在整个零和博弈的有限次重复博弈中，所有博弈方的唯一选择就是始终采用原博弈的混合策略纳什均衡策略。
最后一次重复博弈是原零和博弈本身，而且不再有任何后续博弈，因此博弈方之间既没有任何合作的机会，也没有合作的必要，采用原博弈的混合策略纳什均衡是唯一合理的选择。
猜硬币方猜正面猜反面
盖正面
盖硬币方盖反面
-1,1 1,-1
1,-1 -1,1
8
“猜硬币博弈” 的有限次重复博弈
逆推到倒数第二阶段：
1
Lecture 6: Repeated Games（II）
──以“猜硬币博弈”为例
2
严格竞争博弈
在博弈论中，通常把各博弈方的利益和偏好严格对立，没有纯策略纳什均衡的博弈问题称为“严格竞争博弈”。例如，猜硬币博弈。
3
猜硬币博弈
猜硬币方
猜正面
盖正面
猜反面
-1,1 1,-1
1,-1 -1,1
11
“猜硬币博弈” 的无限次重复博弈
12
“猜硬币博弈” 的无限次重复博弈
以“猜硬币博弈”为原博弈的无限次重复博弈
逆推归纳法不再适用。
猜硬币方猜正面猜反面盖正面
-1,1 1,-1猜硬币博弈” 的无限次重复博弈
【直观判断】重复博弈的无限次增加不会改变原博弈中博弈方之间在利益上的对立关系，也不会创造出潜在的合作利益，因此在这种博弈的无限次重复博弈中，博弈方仍然是每次重复博弈都根据当时的最大利益行为，采用原博弈的混合策略纳什均衡。

博弈论习题[1]

一、完全信息静态博弈
习题 2
解：令(L，M，R)是参与人 A 的战略；（ U，M，D）是参与人 B 的战略。从表 1A.2 中可以看出，对于参与人 B 而言，M 战略是严格劣于 R 战略，按照重复提出的占有均衡剔除 M 战略，则得出如表（a）博弈。在表（a）博弈，参与人 A 的 M 和 D 战略严格劣于 U 战略，重复剔除 M 和 D 战略，得出表（b）博弈。该博弈为单人决策，则重复剔除的占优均衡为（U，L）。
r3 ( A, A, A) = r3 ( A, A, B) = r3 (A, A, C) = {A, B, C} r3 ( A, B, A) = r3 ( A, B, B) = r3 (A, B, C) = {A, C} r3 ( A, C, A) = r3 ( A, C, B) = r3 ( A, C, C) = {C} r3 (B, A, A) = r3 (B, A, B) = r3 (B, A, C) = {A, C} r3 (B, B, A) = r3 (B, B, B) = r3 (B, B, C) = {B, C} r3 (B, C, A) = r3 (B, C, B) = r3 (B, C, C) = {C} r3 (C, A, A) = r3 (C, A, B) = r3 (C, A, C) = {C} r3 (C, B, A) = r3 (C, B, B) = r3 (C, B, C) = {C} r3 (C, C, A) = r3 (C, C, B) = r3 (C, C, C) = {A, B, C}
（0，0）律师得到 100 （0，0）律师得到 100）
通过上面的支付矩阵，我们可以得出答案，只有 A 和 B 都做出选择得到 50 的时候，他
们才能得到钱，不多一分也不少分，如果有一方想多得，二者将一分也得不到，钱全部归律

范里安-微观经济学现代观点(第7版)-28博弈论(含习题解答)

Chapter 28: Game TheoryIntermediate Microeconomics:A Modern Approach (7th Edition)Hal R. Varian(University of California at Berkeley)第28章:博弈论（含习题解答）含习题解答）中级微观经济学：现代方法（第7版）范里安著（加州大学伯克利）曹乾译（东南大学caoqianseu@）简短说明：翻译此书的原因是教学的需要，当然也因为对现行中文翻译版教材的不满。

市场中的翻译版翻译生硬错误百出。

此次翻译的错误是微不足道的，但仍欢迎指出。

仅供教学和学习参考。

28博弈理论我们在上一章阐述的寡头理论，是企业间策略性互动的经典经济理论解释。

但这只是冰山一角。

经济行为人（agents）的策略性互动有多种方式，经济学家借助博弈理论（game theory）这个工具已研究了很多种策略性互动的行为。

博弈理论关注的是策略性互动的一般分析。

人们可使用博弈理论研究室内游戏（parlor games）、政治协商和经济行为（一）。

在本章，我们将简要分析这一迷人的学科，目的是让你感受一下它是如何运行的，以及让你初步知道如何使用博弈理论分析寡头市场中的经济行为。

28.1博弈的收益矩阵策略性互动可能涉及很多选手和很多策略，但是我们仅限于分析两个选手之间的博弈，而且限于分析策略的数量有限的情形。

这样做的好处是可以用收益矩阵（payoff matrix）描述博弈。

最好举例进行分析。

假设两人玩一种简单的游戏。

选手A在纸上写出“上”或“下”。

与此同时，选手B独立地写出“左”或“右”。

在两人写好后，经过分析，将他们的收益标记于表28.1中。

若A 选上且B选左，我们看矩阵的左上角的小方格。

在该小方格中，A的收益是第一个数，B 的收益是第二个数。

类似地，如果A选下B选右，则A得到收益为1，B得到的收益为0.表28.1：一个博弈的收益矩阵选手A有两个策略：上或下。

范里安《微观经济学(高级教程)》(第3版)课后习题-博弈论(圣才出品)

第15章博弈论1．计算便士匹配博弈中的所有纳什均衡。

Calculate all the Nash equilibria in the game of Matching Pennies.答：表15-1为便士匹配博弈的支付矩阵。

表15-1便士匹配博弈这是一个典型的零和博弈。

在零和博弈里，不存在纯策略纳什均衡，唯一的混合策略纳什均衡为每一局中人以12／的概率选择正面或反面，此时混合策略纳什均衡的收益均为0。

根据同等支付原则，此时以12／的概率选择正面或反面的策略为混合策略纳什均衡。

2．在有限重复囚犯悖论博弈中，证明了一个纳什均衡为每一回合都背叛，请证明它事实上也是占优均衡。

In a finitely repeated Prisoner’s Dilemma game we showed that it was a Nash equilibrium to defect every round.Show that,in fact,this is the dominant strategy equilibrium.答：令r和2r为行参与人的两个策略。

1r严格占优于2r是说，不论列参与人选择何种策1略，行参与人选择r得到的支付至少和他选择2r得到的支付一样多，并且对列参与人做的一1些选择，行参与人选择r得到的支付要严格大于选择2r的支付。

1一个占优策略均衡是指均衡的策略组合对每个人而言都是其占优策略。

表15-2囚徒困境在表15-2中，如果行选择背叛，当列选择合作时，行得到4大于列的0，当列选择背叛时，行得到1等于列的1，因此选择背叛对行来说是占优策略；同理可以证明对列来讲，选择背叛也是占优策略。

对于有限重复的博弈，在最后一轮回合中，选择背叛行为是不可能被报复或受到惩罚的。

于是，最后一轮回合出于理性的占优策略就是选择背叛。

逆推到倒数第二回合，由于每个参与者都知道下一回合是背叛，因此，这一回合的占优策略也是选择背叛。

税收征纳中的博弈分析

税收征纳中的博弈分析［摘要］本文旨在运用博弈论的有关知识，通过建立税收征纳模型来分析现实生活中征税方与纳税方的关系及其存在的问题，并从双方的博弈关系中得出几点建议与思考。

［关键词］税收征纳；混合策略；纳什均衡税收收入是我国财政收入的重要组成部分，一般来说，税收收入都会占到财政收入的90％以上，可见，保证税收收入的及时缴纳，防止偷税逃税等对一个国家是极其重要的。

但是，对于纳税人来讲，税收是他们的一项费用支出，国家征收税款，虽然说是“取之于民，用之于民”，但很多纳税人并不愿意主动缴纳税款，总希望能够逃避这项义务，正是由于国家和纳税人之间在征纳关系方面存在矛盾，因此，国家一方面大力宣传依法纳税知识，另一方面又不断完善税收征管法，期望使纳税人主动纳税，同时使税务机关减轻征管负担。

那么在实际生活中，征纳方之间的矛盾能否有效地解决呢？本文就此问题，通过建立博弈模型来分析税收征纳关系，以期构建一个完善的税收征纳体系。

一、税收征纳关系中的行为主体分析经济学对人的行为的考察是建立在“理性人”的理论假设基础上的，研究税收征纳关系中的各类主体同样也要以这个假设为基础。

在现实生活中，征纳双方都是追求自身利益最大化的，因而他们在作出一定行为之前总要对各种可选行为方式的成本和收益大小进行分析比较，从中选择能给自己带来最大利益的行为。

从理论上讲，征税主体是国家，而在实际执行过程中，国家却将征税的权力委托给了税收征管人员，因此，博弈行为会出现在征税人与国家、征税人与纳税人、征税人与征税人以及纳税人与纳税人等各类行为人之间。

这些错综复杂的博弈行为给税收征管带来了相当大的困难，在各方追求利益最大化的前提下，征税人有可能因为私利而损害国家利益，而纳税人之间也可能存在逃避税款与告发之间的博弈。

当然，在这诸多博弈中，最重要的还是征税人与纳税人之间的博弈。

一方面，纳税人总存在偷税的意图，另一方面，征税人又会通过稽查等手段防止偷税事件的发生。

博弈论

博弈论[单项选择题]1、博弈论中，局中人从一个博弈中得到的结果常被称为（）。

A.效用B.支付C.决策D.利润参考答案：B[单项选择题]2、博弈中通常包括下面的内容，除了（）。

A.局中人B.占优战略均衡C.策略D.支付参考答案：B[单项选择题]3、在具有占优战略均衡的囚徒困境博弈中（）。

A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了参考答案：C[单项选择题]4、在多次重复的双头博弈中，每一个博弈者努力（）。

A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大参考答案：D[单项选择题]5、一个博弈中，直接决定局中人支付的因素是（）。

A.策略组合B.策略C.信息D.行动参考答案：A[单项选择题]6、对博弈中的每一个博弈者而言，无论对手作何选择，其总是拥有惟一最佳行为，此时的博弈具有（）。

A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡参考答案：C[单项选择题]7、在囚徒困境的博弈中，合作策略会导致（）。

A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜参考答案：A[单项选择题]8、在什么时候，囚徒困境式博弈均衡最可能实现（）。

A.当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D.当一个寡头行业进行一次博弈时参考答案：D[单项选择题]9、一个企业采取的行为与另一个企业在前一阶段采取的行为一致，这种策略是一种（）。

A.主导策略B.激发策略C.一报还一报策略D.双头策略参考答案：C[单项选择题]10、关于策略式博弈，正确的说法是（）。

A.策略式博弈无法刻划动态博弈B.策略式博弈无法表明行动顺序C.策略式博弈更容易求解D.策略式博弈就是一个支付矩阵参考答案：B[单项选择题]11、下列关于策略的叙述哪个是错误的（）A.策略是局中人选择的一套行动计划；B.参与博弈的每一个局中人都有若干个策略；C.一个局中人在原博弈中的策略和在子博弈中的策略是相同的；D.策略与行动是两个不同的概念，策略是行动的规则，而不是行动本身。

“博弈论”习题及参考答案

《博弈论》习题一、单项选择题1.博弈论中，局中人从一个博弈中得到的结果常被称为（）。

A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容，除了（）。

A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中（）。

A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中，每一个博弈者努力（）。

A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中，直接决定局中人支付的因素是（）。

A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言，无论对手作何选择，其总是拥有惟一最佳行为，此时的博弈具有（）。

A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作，博弈者就在现期合作；但如果另一个博弈者在前一期违约，博弈者在现期也违约的策略称为（）。

A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中，合作策略会导致（）。

A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候，囚徒困境式博弈均衡最可能实现（）。

A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致，这种策略是一种（）。

A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈，正确的说法是（）。

A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的（）：A. 策略是局中人选择的一套行动计划；B. 参与博弈的每一个局中人都有若干个策略；C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的；D. 策略与行动是两个不同的概念，策略是行动的规则，而不是行动本身。

博弈论复习题及答案

博弈论复习题及答案标准化工作室编码[XX968T-XX89628-XJ668-XT689N]囚徒困境说明个人的理性选择不一定是集体的理性选择。

（√）子博弈精炼纳什均衡不是一个纳什均衡。

（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。

（）博弈中知道越多的一方越有利。

（×）纳什均衡一定是上策均衡。

（×）上策均衡一定是纳什均衡。

（√）在一个博弈中只可能存在一个纳什均衡。

（×）在一个博弈中博弈方可以有很多个。

（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。

（√）在博弈中纳什均衡是博弈双方能获得的最好结果。

（×）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。

（×）上策均衡是帕累托最优的均衡。

（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。

（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。

（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。

囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。

（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。

（√）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。

（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t<T，在t阶段的结局并不是G的Nash均衡。

经济博弈论判断题

判断下列表述是否正确，并作简单讨论：（1）如果一博弈有两个纯策略纳什均衡，则一定还存在一个混合策略纳什均衡。

（2）上策均衡一定是帕累托最优的均衡。

（3）有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。

（4）完全但不完美信息动态博弈中各博弈方都不清楚博弈的进程，但清楚博弈的得益。

（5）囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。

（6）帕累托上策均衡一定是上策均衡。

（7）风险上策均衡一定是上策均衡。

（8）上策均衡一定是纳什均衡。

（9）纳什均衡的一致预测性质是指不同博弈方的预测相同、无差异。

（10）静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型都设定行为选择，而不是只针对实际类型设定行为选择，是因为能够迷惑其他博弈方，从而可以获得对自己更有利的均衡。

（11）严格下策反复消去法不会消去任何上策均衡，但却可以简化博弈。

（12）严格下策反复消去法把严格下策消去时，不会消去纳什均衡。

（13）多重纳什均衡不会影响纳什均衡的一致预测性质。

（14）纯策略纳什均衡和混合策略纳什均衡都不一定存在。

（15）在动态博弈中后行为博弈方有更多信息，可减少决策的盲目性，并作有针对性的选择，因此总处于较有利的地位。

（16）在动态博弈中先行为博弈方可以抢先采取有利于自己的行为，因此一定有行动优势。

（17）子博弈完美纳什均衡能够排除均衡策略中不可信的行为（威胁或承诺）因此具有真正的稳定性。

（18）子博弈完美纳什均衡和逆推归纳法并不能解决动态博弈分析的所有问题。

（19）子博弈完美纳什均衡和逆推归纳法能解决动态博弈分析的所有问题。

（20）重复博弈能否促进博弈方更合作和提高博弈效率，取决于原博弈的结构和重复博弈次数。

博弈论

不完全信息博弈：对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息，在这种情况下进行的博弈就是不完全信息博弈。

不完美信息博弈：如果没有参与者能够获得其他参与者的行动信息，也就是说当参与者做选择的时候不知道其他参与者的选择，这被称为不完美信息博弈。

简单来说，如果把其他参与者的行动理解为一个参与者做决策时所面对的环境，信息不完美就是决策者不知道自己所处的决策环境。

纳什均衡：是一种策略组合，使得每个参与人的策略是对其他参与人策略的最优反应。

所有参与人的最优战略的组合：给定该战略中别人的选择，没有人有积极性改变自己的选择。

贝叶斯均衡：在不完全信息静态博弈中，参与人同时行动，没有机会观察到别人的选择。

给定其他参与人的战略选择，每个参与人的最优战略依赖于自己的类型。

由于每个参与人仅知道其他参与人有关类型的分布概率，而不知道其真实类型，因而，他不可能知道其他参与人实际上会选择什么战略。

但是，他能够正确地预测到其他参与人的选择与其各自的有关类型之间的关系。

即不完全信息下的静态博弈均衡称为完美贝叶斯均衡。

子博弈精炼纳什均衡：1）在原博弈是一个纳什均衡；（2）在每一个子博弈上都是纳什均衡。

子博弈：由原博弈中某个决策点（信息集）开始的部分构成一个子博弈。

冷酷策略：是博弈论中的一个名词，它又称为“触发战略”。

它是指参与人在开始时选择合作，在接下来的博弈中，如果对方合作则继续合作，而如果对方一旦背叛，则永远选择背叛，永不合作。

囚徒困境：说明为什么甚至在合作对双方都有利时，保持合作也是困难的。

囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。

帕累托改进：，如果不存在另一种状态能使得没有任何人的处境变坏同时至少有一个人的处境变得更好，则这种状态（资源配置、社会制度等）被称为帕累托最优状态。

简单的说法是：对每个人来说，除非“损人”就不可能“利己”，社会就达到了帕累托最优状态。

博弈论习题解答浙江大学

3．（投票博弈）假定有三个参与人（1、2 和 3）要在三个项目（A、B 和 C）中选中一个。三人同时投票，不允许弃权，因此，每个参与人的战略空间 Si=｛A，B，C｝。得票最多的项目被选中，如果没有任何项目得到多数票，项目 A 被选中。参与人的支付函数如下：
U1(A)=U2(B)=U3(C)=2
等于 11/2。9/2<11/2 表明 L 和 M 的混合战略的期望效用小于 R 战略的期望效用，因此，这一混合战略也不满足纳什均衡。
（3）S2 选择 L 和 R 混合战略。如果两种战略同时混合，必然满足两种战略的期望效用相同，
2
因此，需要满足以下方程： 6α + 5(1 − α ) = 2α + 7(1 − α ) ，解得：α＝1/3。同样，将 α＝1/3 代入
师；如果所有人要求的钱加总大于已有钱的总数，则所有的钱归律师所有。写出这个博弈每个参
与人的战略空间与支付函数，求出所有的纳什均衡。（假设钱的总数为 M，M 为共同知识）。
{ } 博弈参与人的战略空间是 C1 = C2 = x ∈ R 0 ≤ x ≤ M ，参与人 i 的支付函数是：
∑ ui = xi ，
U1(B)=U2(C)=U3(A)=1
U1(C)=U2(A)=U3(B)=0 求解以上博弈的所有纯战略纳什均衡。
首先：将上述博弈过程转换为战略式博弈矩阵。
2和3
1
A3
B3
C3
A2 B2 C2 A2 B2 C2 A2 B2 C2
A1 2,0,1 2,0,1 2,0,1 2,0,1 1,2,0 2,0,1 2,0,1 2,0,1 0,1,2
6．一群赌徒围成一圈赌博，每个人将自己的钱放在边上（每个人只知道自己有多少钱），突然一阵风吹来将所有的钱混在一起，使得他们无法分辨哪些钱是属于自己的，他们为此发生了争执，

博弈论习题及解答

※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?（见教材）2. 分别用规范式和扩展式表示下面的博弈。

两个相互竞争的企业考虑同时推出一种相似的产品。

如果两家企业都推出这种产品，那么他们每家将获得利润400万元；如果只有一家企业推出新产品，那么它将获得利润700万元,没有推出新产品的企业亏损600万元；如果两家企业都不推出该产品，则每家企业获得200万元的利润。

企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? （见教材）4. 产生“囚犯困境”的原因是什么？你能否举出现实经济活动中囚徒困境的例子？原因：个体理性与集体理性的矛盾。

例子：厂商之间的价格战，广告竞争等。

※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? （见教材）2. 剔除以下规范式博弈中的严格劣策略，再求出纯策略纳什均衡。

先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。

然后用划线法求出该矩阵博弈的纯策略Nash均衡。

乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。

乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知，该矩阵博弈没有纯策略Nash均衡。

由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。

解：设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线，如下图，图中粗的折线，就是F(x)的图象由图可知，纳什均衡点与β1无关，所以原问题化为新的2*2矩阵博弈：由公式计算得：。

博弈论复习题与答案

博弈论复习题与答案博弈论判断题（每⼩题1分，共15分）囚徒困境说明个⼈的理性选择不⼀定是集体的理性选择。

（√）⼦博弈精炼纳什均衡不是⼀个纳什均衡。

（×）若⼀个博弈出现了皆⼤欢喜的结局，说明该博弈是⼀个合作的正和博弈。

（）博弈中知道越多的⼀⽅越有利。

（×）纳什均衡⼀定是上策均衡。

（×）上策均衡⼀定是纳什均衡。

（√）在⼀个博弈中只可能存在⼀个纳什均衡。

（×）在⼀个博弈中博弈⽅可以有很多个。

（√）在⼀个博弈中如果存在多个纳什均衡则不存在上策均衡。

（√）在博弈中纳什均衡是博弈双⽅能获得的最好结果。

（×）在博弈中如果某博弈⽅改变策略后得益增加则另⼀博弈⽅得益减少。

（×）上策均衡是帕累托最优的均衡。

（×）因为零和博弈中博弈⽅之间关系都是竞争性的、对⽴的，因此零和博弈就是⾮合作博弈。

（×）在动态博弈中，因为后⾏动的博弈⽅可以先观察对⽅⾏为后再选择⾏为，因此总是有利的。

（×）在博弈中存在着先动优势和后动优势，所以后⾏动的⼈不⼀定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。

囚徒的困境博弈中两个囚徒之所以会处于困境，⽆法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本⾝，只在乎不能⽐对⽅坐牢的时间更长。

（×）纳什均衡即任⼀博弈⽅单独改变策略都只能得到更⼩利益的策略组合。

（√）不存在纯战略纳什均衡和存在惟⼀的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的⼦博弈完美纳什均衡就是每次重复采⽤原博弈的纳什均衡。

（√）多个纯战略纳什均衡博弈的有限次重复博弈⼦博弈完美纳什均衡路径：两阶段都采⽤原博弈同⼀个纯战略纳什均衡，或者轮流采⽤不同纯战略纳什均衡，或者两次都采⽤混合战略纳什均衡，或者混合战略和纯战略轮流采⽤。

（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的⼦博弈完美均衡结局，其中对于任意的t零和博弈的⽆限次重复博弈中，所有阶段都不可能发⽣合作，局中⼈会⼀直重复原博弈的混合战略纳什均衡。

《经济博弈论》复习题参考答案

《经济博弈论》复习题及参考答案一、名词解释1、混合战略纳什均衡如果在博弈的利益表中，无法找到任何一方都可以接受（不一定利益最大化）的方案，也就是没有哪一种组合是在给定对手策略下没有动机改变自己策略的情况。

这时博弈没有纯策略均衡，需要一个“概率表”指导博弈结果。

在博弈G={S1,S2……Sn；U1,U2……Un}中第i个博弈方策略空间为Si={Si1……Sik}则博弈方以概率分布Pi=(Pi……Pik)随机在k个可选策略中选的的策略称为一个混合策略纳什均衡。

2、子博弈精炼纳什均衡对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。

子博弈精练纳什均衡所要求的是参与人应该是序惯理性的。

对于有限完美信息博弈，逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。

3、完全信息动态博弈完全信息动态博弈，是指博弈中信息是完全的，即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解，但行动是有先后顺序的，后动者可以观察到前者的行动，了解前者行动的所有信息。

4、不完全信息动态博弈指在动态博弈中，行动有先后次序，博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率，即知道“自然”参与人的不同类型与相应选择之间的关系，但是，参与人并不知道其他的参与人具体属于哪一种类型。

由于行动有先后顺序，后行动者可以通过观察先行动者的行为，获得有关先行动者的信息，从而证实或修正自己对先行动者的行动。

5、完全信息静态博弈完全信息静态博弈指的是信息对于博弈双方来说是完全公开的情况下，双方在博弈中所决定的决策是同时的或者不同时但在对方做决策前不为对方所知的。

6、囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。

虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

南开大学19秋学期《初级博弈论》在线作业答案1

【南开】19秋学期（1709、1803、1809、1903、1909）《初级博弈论》在线作业-0001试卷总分:100 得分:100一、判断题 (共 50 道试题,共 100 分)1.因为零和博弈中博弈方之间的关系都是竞争性的、对立的，因此零和博弈就是非合作博弈（）[仔细分析上述试题，并完成选择]正确答案：错误2.合作博弈就是博弈方采取相互合作态度的博弈（）[仔细分析上述试题，并完成选择]正确答案：错误3.纯策略纳什均衡和混合策略纳什均衡都不一定存在（）[仔细分析上述试题，并完成选择]正确答案：错误4.凡是博弈方的选择、行为有先后次序的一定是动态博弈（）[仔细分析上述试题，并完成选择]正确答案：错误5.如果一个动态博弈中存在几个博弈方同时选择的情况，这时这些博弈方的同时选择构成一个阶段。

（）[仔细分析上述试题，并完成选择]正确答案：正确6.如果在一个博弈中，不管其他博弈方的策略如何变化，一个博弈方的某种策略给他带来的得益，总是比另一种策略给他带来的得益要小，那么我们称前一种策略为相对于后一种策略的一个“严格下策”。

（）[仔细分析上述试题，并完成选择]正确答案：正确7.在动态博弈中，因为后行为的博弈方可以先观察对方行为后再选择行为，因此总是有利的（）[仔细分析上述试题，并完成选择]正确答案：错误8.触发策略是重复博弈中实现合作和提高均衡效率的关键机制，是重复博弈分析的重要“构件”之一。

（）[仔细分析上述试题，并完成选择]正确答案：正确9.上策均衡一定是帕累托最优的均衡（）[仔细分析上述试题，并完成选择]正确答案：错误。

动态博弈、重复博弈练习题答案

动态博弈练习题一、名词解释1、子博弈完美纳什均衡如果在一个完美信息的动态博弈中，一个策略组合满足在整个动态博弈及它所有的子博弈中都构成纳什均衡，那么该策略组合称为—个“子博弈完美纳什均衡”。

因为要求在所有子博弈中都构成纳什均衡，因此子博弈完美纳什均衡能够排除均衡策略中不可信的行为(威胁或承诺)，因此具有真正的稳定性。

非子博弈完美的纳什均衡不能做到这一点。

子博弈完美纳什均衡是动态博弈分析的核心均衡概念。

子博弈完美纳什均衡本身也是纳什均衡，是比纳什均衡更强的均衡概念。

2、逆推归纳法从动态博弈的最后一个阶段博弈方的行为开始分析，确定所分析阶段博弈方的选择和路径，然后再确定前一个阶段博弈方的选择和路径，逐步倒到第一个阶段的分析方法，称为逆推归纳法。

逆推归纳法是动态博弈分析最重要、基本的方法。

二、单项选择题1.下列关于策略的叙述哪个是错误的（ C ）：A. 策略是局中人选择的一套行动计划；B. 参与博弈的每一个局中人都有若干个策略；C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的；D. 策略与行动是两个不同的概念，策略是行动的规则，而不是行动本身。

2. 子博弈精炼纳什均衡（ C ）：A. 是一个一般意义上的纳什均衡；B. 和纳什均衡没有什么关系；C. 要求某一策略组合在每一个子博弈上都构成一个纳什均衡；D. 要求某一策略组合在原博弈上都构成一个纳什均衡。

3．（C ）可以排除不可信威胁。

A．纳什均衡B．帕雷托上策均衡C．子博弈完美均衡D．风险上策均衡4. 寻找子博弈完美均衡的方法一般是（D ）。

A．划线法B．箭头法C．上策均衡分析D．逆推归纳法5.在动态博弈战略行动中，只有当局中人从实施某一威胁所能获得的总收益（ A ）不实施该威胁所获得的总收益时，该威胁才是可信的。

A 大于B 等于C 小于D 以上都有可能三、判断题1.子博弈精炼纳什均衡不是一个纳什均衡。

（ × ）2.在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。