博弈论基础吉本斯课后习题答案

合集下载

博弈论基础吉本斯课后答案

博弈论基础吉本斯课后答案

博弈论基础吉本斯课后答案

一、原题

1. 什么是博弈论?

答:博弈论是一门研究决策者之间的竞争性行为的学科,它研究的是如何在竞争性环境中获得最佳结果。它涉及到决策者之间的博弈,以及如何利用策略来获得最佳结果。

2. 什么是吉本斯博弈论?

答:吉本斯博弈论是一种研究两个或多个决策者之间的博弈的学科,它研究的是如何在竞争性环境中获得最佳结果。它是由美国经济学家约翰·吉本斯在20世纪50年代提出的,他提出了一种新的方法来研究博弈,即使用数学模型来分析博弈的结果。

3. 吉本斯博弈论的基本概念是什么?

答:吉本斯博弈论的基本概念是博弈矩阵,它是一个表格,用来描述两个或多个决策者之间的博弈。它由行和列组成,每一行代表一个决策者,每一列代表另一个决策者,每个单元格中的数字代表每个决策者在每种可能的结果下的收益。

4. 吉本斯博弈论中的均衡点是什么?

答:吉本斯博弈论中的均衡点是指当两个或多个决策者之间的博弈结果达到一种平衡时,每个决策者都不会有更多的收益。这种平衡可以是一个纳什均衡,也可以是一个非纳什均衡,具体取决于博弈的结构。

博弈论基础 习题答案

博弈论基础 习题答案

博弈论基础习题答案

博弈论基础习题答案

博弈论是研究决策制定和行为选择的数学模型,它在经济学、政治学、生物学

等领域都有广泛的应用。通过分析博弈论的习题,我们可以更好地理解博弈论

的基本概念和原理。下面是一些博弈论习题的答案,希望能对大家的学习有所

帮助。

1. 两个囚犯问题

在两个囚犯问题中,假设两个囚犯被抓住,检察官给每个囚犯提供了一个选择:合作或者背叛。如果两个囚犯都合作,他们将各自被判刑1年;如果两个囚犯

都背叛,他们将各自被判刑3年;如果一个囚犯合作而另一个背叛,合作的囚

犯将被判刑5年,而背叛的囚犯将被判刑0年。根据这个情景,请回答以下问题:

a) 如果两个囚犯之间不能沟通,他们应该选择合作还是背叛?

答:在这种情况下,由于两个囚犯无法协调行动,他们都会选择背叛。因为无

论对方选择什么,背叛都能使自己的刑期最短。

b) 如果两个囚犯之间可以沟通,他们应该选择合作还是背叛?

答:在这种情况下,两个囚犯可以通过沟通来协调行动。他们应该选择合作,

因为这样可以使双方的刑期都最短。

2. 霍夫斯塔德的囚徒困境

在霍夫斯塔德的囚徒困境中,两个犯罪嫌疑人被抓住,检察官给他们提供了一

个选择:合作或者背叛。如果两个嫌疑人都合作,他们将各自被判刑2年;如

果两个嫌疑人都背叛,他们将各自被判刑4年;如果一个嫌疑人合作而另一个

背叛,合作的嫌疑人将被判刑5年,而背叛的嫌疑人将被判刑1年。根据这个

情景,请回答以下问题:

a) 如果两个嫌疑人只进行一次选择,他们应该选择合作还是背叛?

答:在这种情况下,由于只进行一次选择,两个嫌疑人都会选择背叛。因为无

博弈论答案(Gametheoryanswer)

博弈论答案(Gametheoryanswer)

博弈论答案(Game theory answer)

Game theory, exercises, reference answers (second assignments)

First, the multiple-choice question

1.B,

2.C,

3.A,

4.A,

5.B,

6.ABCD

7.C 8.B 9.C

Two, judge and explain the reason

1.F best balance is an equilibrium more rigorous than the Nash equilibrium

2.T best balance is an equilibrium more rigorous than the Nash equilibrium

3.T game types are divided into single game, double game and multiplayer game according to the number of players in the game

Under the condition that both sides of the 4.F game have different preferences, there may be 2 Nash equilibria in a game model, such as the sex war

5.T zero sum game refers to the participation of all parties in the game, under strict competition, one side of revenue is equal to the other party's loss, the sum of gains and losses of the game is always zero, so there is no possibility of cooperation between the two sides

博弈论习题答案

博弈论习题答案

博弈论习题答案

博弈论习题答案

博弈论是一门研究决策和策略的数学分支,它通过分析参与者之间的互动,揭

示他们的利益和行为模式。在博弈论中,常常会遇到各种各样的习题,这些习

题旨在让我们思考和解决实际生活中的决策问题。本文将给出一些常见的博弈

论习题的答案,帮助读者更好地理解和应用博弈论的概念。

1. 零和博弈问题

零和博弈是指参与者的利益完全相反,一方的收益等于另一方的损失。考虑以

下情景:两个商人A和B在市场上销售相同的产品,他们的利润取决于他们的

定价策略。如果A的定价高于B,那么B将失去一部分市场份额,反之亦然。

假设A和B的收益函数分别为R_A(p_A, p_B)和R_B(p_A, p_B),其中p_A和p_B

分别是A和B的定价。问题是,A和B应该如何定价以最大化自己的利润?

答案:由于这是一个零和博弈问题,A和B的利益完全相反。因此,他们的最

佳策略是采取纳什均衡策略。纳什均衡是指在互动中,没有参与者能够通过改

变自己的策略来提高自己的收益。在这个例子中,纳什均衡定价是使得A和B

的利润最大化的定价组合。通过求解收益函数的偏导数,我们可以找到纳什均

衡定价。

2. 合作与背叛

在博弈论中,合作与背叛是一个经典的主题。考虑以下情景:两个犯罪团伙A

和B同时被捕,他们面临着与检察官合作还是背叛的选择。如果两个团伙都选

择合作,那么他们将面临较轻的刑罚;如果一个团伙选择合作而另一个团伙选

择背叛,那么合作的团伙将面临较重的刑罚,而背叛的团伙将面临较轻的刑罚;

如果两个团伙都选择背叛,那么他们将面临较重的刑罚。问题是,A和B应该

博弈论 课后习题答案

博弈论 课后习题答案

博弈论课后习题答案

第四部分课后习题答案

1. 参考答案:

括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙

的得益,而b表示甲的得益。

在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择

a,0

不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择

不借,因为借的最终得益0比不借的最终得益1小。

在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是

(a,b)。a,0

逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为

(a,b)。b,2

在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0),

当a,1

时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择

a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为

借的得益2大于不借的得益1,最后双方的得益(2,2)。

根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况:

(1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0

得益

(1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12

且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益

(a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。

要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0

博弈论基础作业及答案

博弈论基础作业及答案

博弈论基础作业

一、名词解释

纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡

贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识

见PPT

二、问答题

1.举出囚徒困境和智猪博弈的现实例子并进行分析。

囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等;

以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。

请用同样的方法分析其他例子。

智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略

以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。

请用同样的方法分析其他例子。

2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。

破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论 课后习题答案

博弈论 课后习题答案

博弈论课后习题答案

第四部分课后习题答案

1. 参考答案:

括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙

的得益,而b表示甲的得益。

在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择

a,0

不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择

不借,因为借的最终得益0比不借的最终得益1小。

在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是

(a,b)。a,0

逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为

(a,b)。b,2

在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0),

当a,1

时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择

a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为

借的得益2大于不借的得益1,最后双方的得益(2,2)。

根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况:

(1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0

得益

(1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12

且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益

(a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。

要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0

博弈论基础吉本斯课后习题答案

博弈论基础吉本斯课后习题答案
率 不 变 。 因 为 ui (sij , p−*i ) < ui (sik , p−*i ) , 所 以 ui ( pi*, p−*i ) < ui ( pi ', p−*i ) , 而 这 与 ( pi*, p−*i ) 为
混合战略纳什均衡矛盾,假设不成立,原命题得证。
猪头非整理
3
ebwf@163.com
c1 < c2 < a 且 2c2 > a + c1 时 , 纳 什 均 衡 解 为 角 点 解 , 即 q1* = (a − c1) / 2 , q2* = 0 。 此 题 目
说明:当厂商的生产成本有较大差异时,具有成本优势的厂商将垄断整个市场,而处于成 本劣势的厂商将退出市场。
1.7 简 单 证 明 (c,c)为 唯 一 的 纳 什 均 衡 。 首 先 , 给 定 对 方 定 价 c, 己 方 定 价 c 时 , 利 润 为 0。 而 己 方 定 价 高 于 c 时 , 利 润 为 0, 低 于 c 时 , 利 润 为 负 。 所 以 给 定 对 方 定 价 c, 己 方 定 价 c 是 最 优 反 应 , 这 对 于 双 方 都 成 立 , 也 即 (c,c) 是纳什均衡。 其 次 , 由 于 不 存 在 固 定 成 本 , 所 以 市 场 中 企 业 的 定 价 不 可 能 低 于 c。 而 双 方 定 价 都 高 于 c 时 , 每一方理论上都倾向于定价低于对方但无限接近对方,从而占据整个市场,从而此时没有 稳 定 的 均 衡 ; 而 一 方 定 价 高 于 c、 另 一 方 定 价 为 c 同 样 不 够 成 稳 定 均 衡 , 因 为 定 价 为 c 的 企 业 更 倾 向 于 定 价 高 于 c 但 低 于 另 一 方 的 定 价 。 由 此 , 可 以 证 明 纳 什 均 衡 (c,c)的 唯 一 性 。 1.8

博弈论基础作业及答案

博弈论基础作业及答案

博弈论基础作业

一、名词解释

纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡

贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识

见PPT

二、问答题

1.举出囚徒困境和智猪博弈的现实例子并进行分析。

囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等;

以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。

请用同样的方法分析其他例子。

智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略

以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。

请用同样的方法分析其他例子。

2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。

破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。

博弈论第4章答案

博弈论第4章答案

R R M 4.1.a 标准式

1↖2 L ’ R ’

4,1 0,0 3,0 0,1 2,2 2,2

纯战略纳什均衡:( L, L ’ ) ( R, R ’ )

子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ )

精炼贝叶斯纳什均衡:( L, L ’ )

4.1.b 标准式

1↖2 L ’ M ’ R ’

1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4

纯战略纳什均衡:( R, M ’ )

子博弈精炼纳什均衡:( R, M ’ )

精炼贝叶斯均衡: 没有

4.2

标准式

1↖2 L ’ R ’

2,2 2,2 3,0 0,1 0,1 3,0

六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。

求混合战略精炼贝叶斯均衡:

设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p −−

参与者2选择L ’和R ’的概率分别为,(1)q q −

在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212

120*1*1*0*p p p p p p +=+⇒=

给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则:

121212

12[3*0*(1)][0*3*(1)]2*(1)

41:**,*112

p q q p q q p p p p p p q +−=+−=−−===

=又 联立得 所以 L L

M

L L

M L R

L

4.3答案(见4.5)

4.4

表示方法

第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号;

博弈论各章节课后习题答案

博弈论各章节课后习题答案

LR
LR
T 1,1 0,0
T 0,0 0,0
B 0,0 0,0 博弈 1
B 0,0 2,2 博弈 2
N
1
0.5
2
0.5
1
1
T
B
T
B
2
2
2
2
LR
L RL R
LR
(1,1) (0,0) (0,0) (0,0)(0,0) (0,0) (0,0) (0,2)
自然选择了博弈 1 时,局中人 1 选择 T,自然选择了博弈 2 时,局中人 1 选择 B。 局中人 2 的策略是根据期望收益最大的原则确定。 局中人 2 的选择策略 L 的期望收益为 0.5×1+0.5×0=0.5,选择策略 R 的期望收益为 0.5×0+0.5×2=1,因此局中人 2 会选择策略 R。 该博弈的纯策略贝叶斯纳什均衡为:自然选择博弈 1 时,局中人 1 选择 T,自然选择博 弈 2 时,局中人 1 选择 B;局中人 2 会选择策略 R。 6. 在一个由三寡头操纵的垄断市场中,逆需求函数为 p=a-q1-q2-q3,这里 qi 是企业 i 的产量。 每一企业生产的单位成本为常数 c。三企业决定各自产量的顺序如下:(1)企业 1 首先选择 q1≥0;(2)企业 2 和企业 3 观察到 q1,然后同时分别选择 q2 和 q3。试解出该博弈的子博弈完

博弈论 习题答案

博弈论 习题答案

博弈论习题答案

博弈论习题答案

博弈论是一门研究决策制定和策略选择的学科,它通常应用于经济学、政治学

和生物学等领域。在博弈论中,人们通过分析参与者之间的相互作用和利益冲

突来预测他们的行为。下面是一些常见的博弈论习题及其答案,希望能对读者

有所帮助。

1. 零和游戏

零和游戏是一种博弈论中的基本概念,指的是参与者的利益完全相反,一方的

利益的增加必然导致另一方的利益减少。一个经典的例子是赌博,赌徒的损失

就是庄家的收益,反之亦然。

2. 囚徒困境

囚徒困境是博弈论中的一个重要概念,描述了两个囚徒面临的决策问题。假设

两个囚徒被警察逮捕,警察缺乏直接证据,但有足够的证据定罪他们。如果两

个囚徒都保持沉默,他们只会被判轻罪;如果一个人供认而另一个人保持沉默,供认者将获得减刑而沉默者将被判重罪;如果两人都供认,他们将被判重罪。

在这种情况下,最理性的策略是保持沉默,但由于彼此之间的信任缺失,往往

导致两人都供认,结果双输。

3. 纳什均衡

纳什均衡是博弈论中的一个重要概念,指的是在参与者选择最佳策略的情况下,没有人可以通过单方面改变策略来获得更好的结果。简单来说,就是每个人都

在给定其他人的策略时,选择了自己的最佳策略。纳什均衡在博弈论中具有重

要的理论和实践意义。

4. 合作博弈与非合作博弈

合作博弈是指参与者之间可以通过合作来获得更好结果的博弈情形,而非合作博弈则指的是参与者之间没有合作的情况。在合作博弈中,参与者可以通过协商和合作来达成最优解,而在非合作博弈中,参与者通常会采取自私的策略,追求个人最大利益。

5. 混合策略

博弈论课后习题

博弈论课后习题

第一章导论

1、什么是博弈?博弈论的主要研究内容是什么?

2、设定一个博弈模型必须确定哪几个方面?

3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。

4、“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。

5、博弈有哪些分类方法,有哪些主要的类型?

6、你正在考虑是否投资100万元开设一家饭店。假设情况是这样的:你决定开,则0.35的概率你讲收益300万元(包括投资),而0.65的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择?(c)如果你是风险规避的,且期望得益的折扣系数为0.9,你的策略选择是什么?(d)如果你是风险偏好的,期望得益折算系数为1.2,你的选择又是什么?

7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。

第二章完全信息静态博弈

1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么?

2、为什么说纳什均衡是博弈分析中最重要的概念?

3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。

4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响?

5、下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡?博弈的结果是什么?

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
率 不 变 。 因 为 ui (sij , p−*i ) < ui (sik , p−*i ) , 所 以 ui ( pi*, p−*i ) < ui ( pi ', p−*i ) , 而 这 与 ( pi*, p−*i ) 为
混合战略纳什均衡矛盾,假设不成立,原命题得证。
猪头非整理
3
ebwf@163.com
{ } ((2w1 − w2 ) /(w1 + w2 ), (2w2 − w1) /(w1 + w2 )) ,((2w1 − w2 ) /(w1 + w2 ), (2w2 − w1) /(w1 + w2 ))
1.14
证 明 : 在 混 合 战 略 纳 什 均 衡 中 , 参 与 人 i 的 混 合 战 略 为 pi* , 其 中 选 择 第 j 个 纯 战 略 sij 的 概
对于参与人
1来 说 ,
s1*
=
max{ max 0≤s1 ≤1−s*2
s1
,
max
1−s*2 <s1 ≤1
s1}
=
max{1−
s2* , 0} = 1−
s2*

同 理 , s2* = 1− s1* 。
也 即 , 此 博 弈 的 纯 战 略 纳 什 均 衡 为 ( s1* , s2* ), 且 满 足 s1* + s2* = 1, 0 ≤ s1*, s2* ≤ 1。
( 1) 式 两 端 乘 以 2, 再 减 qi* , 可 得 : qi* =Βιβλιοθήκη Baidua − Q* − c … … ( 2), 对 于 任 意 的 i 都 成 立 。
∑ 所 以 所 有 的 qi* 都 相 等 。 由 此 , 将 Q* = qi* = nqi* 代 入 ( 2) 式 , 可 得 : i
qi* = (a − c) /(n +1) , Q* = n(a − c) /(n +1) , p* = (a + nc) /(n +1) 。
MaxV B
(I
p

B)
+
k[U1 ( I c

S)
+U2
(S
+
B)]
一阶条件:
V
'(I
p

B)
=
kU
' 2
(S
+
B)

反应函数满足:
−1 <
dB*
/
dS
=
kU
" 2
/(−kU
" 2
−V")
<
0
即,孩子储蓄减少,家
长给予更高的赠与。
接着最大化孩子的收益:给定反应函数 B* ,来选 S:
Max S
U1
∴ U2 (S + B) 会增加,因为(*)式,U2 (S + B) 增加的幅度比U1(I1 − S ) 减小的幅度大,所以
孩子的收益效用增大了,同时家长的收益效用也增大了。
2.3 根据Shaked和Sutton的研究发现,我们可以把无限博弈截开(见Gibbons教材55页),首先分
析前三阶段: 假设在第三阶段参与人1提出S,参与人2接受1-S,则解决方案为(S,1-S)。
1.4 对 于 第 i个 厂 商 , 其 目 标 为 最 大 化 自 己 的 利 润 , 即 :
max πi
=
max( p qi ≥0
− c)qi
=
max qi ≥0
(
a

qi

q−*i
− c)qi

由 一 阶 条 件 ∂π i / ∂qi = 0 , 可 得 : qi* = (a − q−*i − c) / 2 … … ( 1)
4, 2 2, 3
针 对 上 面 的 博 弈 , 设 参 与 人 1 的 战 略 为 ( p,1-p), 参 与 人 2 的 战 略 为 ( q,1-q)。
则 对 于 1 来 说 , 2q* + 4(1− q* ) = 3q* + 2(1− q* ) , 得 : q* = 2 / 3 ;
对 于 2 来 说 , 4(1− p*) = 2 p* + 3(1− p*) , 得 p* = 1/ 3 。
时 , 生 产 qm / 2 的 一 方 的 利 润 为 π 2 = 5(a − c)2 / 48 , 生 产 qc 的 一 方 的 利 润 为
π3 = 5(a − c)2 / 36 ; 双 方 都 生 产 qc 时 , 每 一 方 的 利 润 都 为 π 4 = (a − c)2 / 9 。 以 标 准 式 表 示
当 n 趋 近 于 无 穷 时 , p* 趋 近 于 边 际 成 本 c, 市 场 趋 近 于 完 全 竞 争 市 场 。
1.5
双 方 都 生 产 qm / 2 时 , 每 一 方 的 利 润 都 为 π1 = (a − c)2 / 8 ; 一 方 生 产 qm / 2 , 另 一 方 生 产 qc
π1 , π1
qc
π3 ,π2
q’
π1 ,π5
π2 ,π3 π4,π4 π7 ,π6
π5 ,π1 π6 ,π7 π8 ,π8
其 中 , π5 = (a − c)2 /16 , π 6 = (a − c)2 /18 , π 7 = (a − c)2 /12 , π8 = 0 。 此 博 弈 符 合 题
率 为 pi*j 。 用 反 证 法 证 明 。
假 设 pi*j > 0 , 且 sij 是 第 一 个 被 重 复 剔 除 劣 战 略 所 剔 除 的 战 略 。 那 么 参 与 人 i 必 定 存 在 另 一
个 纯 战 略 Sik, 使 得 ui (sij , p−i ) < ui (sik , p−i ) , p−i 是 其 他 参 与 人 任 意 的 战 略 组 合 。 因 为 sij 第
目 要 求 , 即 ( qc , qc )是 唯 一 的 纳 什 均 衡 , 并 且 在 纳 什 均 衡 下 , 每 一 企 业 的 福 利 都 要 比 他 们 相
互合作时低,但两个企业都没有严格劣战略。 1.6
当 0 < c1, c2 < a / 2 时 , 易 求 均 衡 产 量 q1* = (a + c2 − 2c1) / 3 , q2* = (a + c1 − 2c2 ) / 3 。 而 当
一 个 被 剔 除 , 那 么 ui (sij , p−*i ) < ui (sik , p−*i ) 必 然 成 立 。
构 建 参 与 人 i 的 另 一 个 混 合 战 略 pi ' , 其 中 pij ' = 0 , pik ' = pi*k + pi*j , 其 他 纯 战 略 的 选 择 概
如 果 有 两 个 候 选 人 , 唯 一 的 纯 战 略 纳 什 均 衡 为 x1* = x2* = 0.5 , 即 两 候 选 人 集 聚 于 中 点 , 平
分全部选票。下面简单证明:无论两候选人都在中点右侧,都在中点左侧,还是分居中点 两侧,每一候选人都倾向于比另一候选人更接近中点以获得超过半数的选票,所以没有稳 定 的 均 衡 ; 都 在 中 点 时 , 每 个 人 都 有 1/2 的 胜 出 概 率 , 而 偏 离 必 定 输 掉 选 举 , 所 以 没 有 人 会 偏离中点。由此得证上述均衡为唯一的纯战略纳什均衡。 如果有三个候选人,可以用类似于上面的方法证明不存在纯战略纳什均衡:无论三个候选 人的相对位置如何,都不会形成稳定的均衡。所以题目要求的是混合纳什均衡。具体方法 请 参 见 Hotelling, H. (1929) “Stability in Competition”, Economic Journal 39: 41-57.
第一章
( qc , qc )。 因 为 π1 > π 4 , 所 以 均 衡 状 态 时 , 每 一 企 业 的 福 利 都 要 比 他 们 相 互 合 作 时 下 降 。
至 于 q’, 不 妨 令 q ' = (a − c) / 2 , 则 同 理 可 得 如 下 标 准 式 :
qm/2
qc
q’
qm/2
Gibbons《 博 弈 论 基 础 》 习 题 解 答 ( CENET)
第一章
1.1 略
1.2 不 会 被 重 复 剔 除 严 格 劣 战 略 剔 除 的 战 略 是 : T, M, L, R; 纯 战 略 纳 什 均 衡 是 (T, R)和 (M, L)。 1.3
设 此 博 弈 的 纯 战 略 纳 什 均 衡 是 ( s1* , s2* )。
(Ic

S
)
+
U
2
(S
+
B*
)
一阶条件:
U1'
(Ic

S)
=
U
' 2
(S
+
B* )(1 +
dB*
/
dS
)
,由此可得:
0
<
U1' (Ic

S)
/
U
' 2
(S
+
B* )
=
(1 +
dB*
/
dS )
<
1
(*)
因 此 当 增 加 S 时 , U1(Ic − S) 会 减 小 , 同 时 , d (S + B) / dS > 0 , ∴ S + B 会 增 加 ,
Gibbons《博弈论基础》第二章习题解答(部分)
2.1 采用逆向归纳法,先最大化家长的收益:给定孩子的行动 A,来选择自己的行动 B,
MaxV B
(I
p

B)
+
k(Ic
+
B)
一阶条件: V ' (I p − B) = k , ⇒ B* = I p ( A) −V '−1(k)
接着最大化孩子的收益,给定家长的反应函数 B* ,来选 A:
c1 < c2 < a 且 2c2 > a + c1 时 , 纳 什 均 衡 解 为 角 点 解 , 即 q1* = (a − c1) / 2 , q2* = 0 。 此 题 目
说明:当厂商的生产成本有较大差异时,具有成本优势的厂商将垄断整个市场,而处于成 本劣势的厂商将退出市场。
1.7 简 单 证 明 (c,c)为 唯 一 的 纳 什 均 衡 。 首 先 , 给 定 对 方 定 价 c, 己 方 定 价 c 时 , 利 润 为 0。 而 己 方 定 价 高 于 c 时 , 利 润 为 0, 低 于 c 时 , 利 润 为 负 。 所 以 给 定 对 方 定 价 c, 己 方 定 价 c 是 最 优 反 应 , 这 对 于 双 方 都 成 立 , 也 即 (c,c) 是纳什均衡。 其 次 , 由 于 不 存 在 固 定 成 本 , 所 以 市 场 中 企 业 的 定 价 不 可 能 低 于 c。 而 双 方 定 价 都 高 于 c 时 , 每一方理论上都倾向于定价低于对方但无限接近对方,从而占据整个市场,从而此时没有 稳 定 的 均 衡 ; 而 一 方 定 价 高 于 c、 另 一 方 定 价 为 c 同 样 不 够 成 稳 定 均 衡 , 因 为 定 价 为 c 的 企 业 更 倾 向 于 定 价 高 于 c 但 低 于 另 一 方 的 定 价 。 由 此 , 可 以 证 明 纳 什 均 衡 (c,c)的 唯 一 性 。 1.8
为:
qm/2
qc
qm/2
π1 , π1
π2 ,π3
qc
π3 ,π2
π4 ,π4
因 为 π1 < π3 , π 2 < π 4 , 所 以 每 一 方 都 有 一 个 严 格 劣 战 略 , 即 qm/2, 从 而 最 后 的 均 衡 为
猪头非整理
1
ebwf@163.com
Gibbons《 博 弈 论 基 础 》 习 题 解 答 ( CENET)
Max A
U
(
I
c
(
A)
+
I
p
(
A)

V
'−1
(k
))
一阶条件:
U
'(Ic
+
B*
)[
I
' c
( A)
+
I
' p
(
A)]
=
0
由于 U 是递增又严格凹的,U ' (Ic + B*) ≠ 0
这与孩子的选择可是全家的收入最大化的一阶条件相同:
I
' c
(
A)
+
I
' p
(
A)
=
0
2.2 采用逆向归纳法,先最大化家长的收益:给定的孩子的行动 S,来选择自己的行动 B,
则在第二阶段2提出不少于 δ1S 给参与人1,1就会接受,解决方案 (δ1S,1− δ1S ) 。
则 原 博 弈 的 混 合 战 略 纳 什 均 衡 为 : { (1/3, 2/3, 0), (2/3, 0, 1/3) }。 1.12 按 照 1.11 的 解 法 , 可 得 混 合 战 略 纳 什 均 衡 为 : { (2/3, 1/3), (3/4, 1/4) }。 过 程 略 。 1.13 此博弈有两个纯战略纳什均衡、一个混合战略纳什均衡。 纯 战 略 纳 什 均 衡 为 :( 向 企 业 1 申 请 , 向 企 业 2 申 请 );( 向 企 业 2 申 请 , 向 企 业 1 申 请 )。 混合战略纳什均衡为:
猪头非整理
2
ebwf@163.com
Gibbons《 博 弈 论 基 础 》 习 题 解 答 ( CENET)
第一章
1.9 略
1.10 按照求解混合战略纳什均衡的方法去解这些博弈,发现不存在混合战略纳什均衡,也就证 明了。过程略。
1.11 首先重复剔除严格劣战略,可得下面的博弈:
L
R
T
2, 0
M
3, 4
相关文档
最新文档