平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)
平新乔《微观经济学十八讲》课后习题详解(策略性博弈与纳什均衡)
第10讲 策略性博弈与纳什均衡1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是50020D Q p =-(1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗?解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。
理由如下:假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。
其次,达到均衡时,A p 和B p 都不会严格大于10。
否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。
所以均衡价格一定满足10A p ≤,10B p ≤。
但是由于A p 的下限也是10,所以均衡时10A p =。
给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。
综上可知,均衡时的价格为10A p =,10B p ε=-。
(2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。
下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为:max pq cq ε>- ①其中10p ε=-,()5002010q ε=-⨯-,把这两个式子代入①式中,得到:()()0max 1085002010εεε>----⎡⎤⎣⎦解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为:()()500201010εε-⨯--⎡⎤⎣⎦。
(3)这个结果不是帕累托有效的。
因为厂商B 的产品的价格高于它的边际成本,所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。
完整第十章 习题答案
第十章博弈论开端1.什么是纳什平衡?纳什平衡必定是最优的吗?解答:(1)所谓纳什平衡,是参加人的一种战略组合,在该战略组合上,任何参加人独自改动战略都不会掉掉落益处。
(2)不必定。
纳什平衡能够是最优的,也能够不是最优的。
比方,在存在多个纳什平衡的状况下,此中有一些纳什平衡就不是最优的;即便在纳什平衡是独一时,它也能够不是最优的——因为与它相对应的领取组合能够会小于与其余战略组合相对应的领取组合。
2.在只要两个参加人且每个参加人都只要两个战略可供选择的状况下,纯战略的纳什平衡最多可有多少个?什么原因?解答:在只要两个参加人(如A跟B)且每个参加人都只要两个战略可供选择的状况下,纯战略的纳什平衡最多可有四个。
比方,当A与B的领取矩阵可分不表现如下时,总的领取矩阵中一切四个单位格的两个数字均有下划线,从而,统共有四个纳什平衡。
A的领取矩阵=B的领取矩阵=3.在只要两个参加人且每个参加人都只要两个战略可供选择的状况下,纯战略的纳什平衡能够有三个。
试举一例阐明。
解答:比方,当参加人A与B的领取矩阵可分不表现如下时,总的领取矩阵中恰恰有三个单位格的两个数字均有下划线,从而,统共有三个纳什平衡。
A的领取矩阵=B的领取矩阵=4.在只要两个参加人且每个参加人都只要两个战略可供选择的状况下,怎样寻到一切的纯战略纳什平衡?解答:可运用前提战略下划线法。
详细步调如下:起首,设两个参加人分不为左参加人跟上参加人,并把全部的领取矩阵剖析为这两个参加人的领取矩阵;其次,在左参加人的领取矩阵中,寻出每一列的最年夜者,并在其下划线;再次,在上参加人的领取矩阵中,寻出每一行的最年夜者,并在其下划线;再再次,将曾经划好线的两个参加人的领取矩阵再兼并起来,掉掉落带有下划线的全部领取矩阵;最初,在带有下划线的全部领取矩阵中,寻到两个数字之下均划有线的一切的领取组合。
这些领取组合所代表的战略组合确实是纳什平衡。
5.设有A、B两个参加人。
关于参加人A的每一个战略,参加人B的前提战略有无能够不止一个。
“博弈论”习题及参考答案
《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。
A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。
A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。
A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。
A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。
A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。
A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。
A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。
A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。
A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。
A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。
A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。
策略博弈与纳什均衡
结果
构模者在博弈进行了以后从 行动、收益与别的变量的数 值中取到的一组感兴趣的要 素的集合。
结果代表了的是博弈可能发 生的结局。
囚犯B
不揭发 揭发
囚 犯
不揭发 5,5 -1,6
A
揭发 6,-1 0,0
均衡
博弈中的均衡,记为 s* (s1* , s2* , , sn* ) ,是博弈中 n 个参与者各自都采
博弈里参与者是作出决策的个人。每个决策者 通过选择行动使自己效用极大化。
OPEC组织中,沙特和科威特是参与者,而中 国老百姓并不是参与者。
行动集与行动组合
行 动 集:参与者i 的行动集(action set),记为 Ai ai,是该参与者可能采取 的全部行动之集合。 行动组合:一个行动组合是一个有序集 a ai(i 1,2, n) ,是由一人博弈中 n 个 游戏者各取一个行动而组合成的。
行动是你采取的某种行动方式,只要可能,你都 可以采取;策略是一种有条件的应对行动方案;
行动是一种客观可能性,是可以观察到的。策略 是一种主观的、心理上的应变对策,你不可能观 察到对手心中的策略,并不能见到他心中会设计 好的应对的行动方案。
收益(payoff)
收益就是博弈后给参与者的效用。 参与者与别的参与者选择的策略的函数带给参与者的预期 效用。 收益只是博弈带给参与者的效用,收益不等同于结果。
第三讲 策略博弈与纳什均衡
第一节 基本概念
博弈是对许多人一个策略相互依存的构架中相互作用这 种情况的正式表述。 一个博弈的基本要素:
参与者players 行动actions 信息information 策略strategies 收益payoffs 结果outcomes 均衡equilibrium
平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)
平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡1 •假设厂商A与厂商B的平均成本与边际成本都是常数,MC A=10,MC B =8,对厂商产出的需求函数是Q D二500 -20 p(1)如果厂商进行Bertrand竞争,在纳什均衡下的市场价格是多少?(2)每个厂商的利润分别为多少?(3)这个均衡是帕累托有效吗?解:(1)如果厂商进行Bertrand竞争,纳什均衡下的市场价格是p B =10 一;,p A =10 , 其中;是一个极小的正数。
理由如下:假设均衡时厂商A和B对产品的定价分别为p A和p B,那么必有p A刃0 , p B K8,即厂商的价格一定要高于产品的平均成本。
其次,达到均衡时,p A和p B都不会严格大于10。
否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。
所以均衡价格一定满足p A空10 , p B・「0。
但是由于p A的下限也是10,所以均衡时P A =10。
给定P A =10 ,厂商B的最优选择是令P B =10- ;,这里:是一个介于0到2 之间的正数,这时厂商B可以获得整个市场的消费者。
综上可知,均衡时的价格为P A =10 , P B =10 -;。
(2)由于厂商A的价格严格高于厂商B的价格,所以厂商A的销售量为零,从而利润也是零。
下面来确定厂商B的销售量,此时厂商B是市场上的垄断者,它的利润最大化问题为:max pq —cq ①其中p =10 _ q =500 -20 107、把这两个式子代入①式中,得到:max (10 —芯―)500 —20(10 —名卩解得;=0,由于;必须严格大于零,这就意味着;可以取一个任意小的正数,所以厂商B 的利润为:||500-20 10 -; 10-;。
(3)这个结果不是帕累托有效的。
因为厂商B的产品的价格高于它的边际成本,所以如果厂商B和消费者可以为额外1单位的产品协商一个介于8到10一;之间的价格,那么厂商B的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A的剩余(因为A的利润还是零)。
博弈论各章节课后习题答案 (2)
1 π1 = (10 − 2q1 − 2q2 )q1 − 2 − 4q1
1 π2 = (10 − 2q1 − 2q2 )q2 − 2 − 4q2
求导得:
∂π1 ∂q1
= 10 − 4q1
−
2q 2
−
4
=
0
∂π2 ∂q 2
= 10 − 4q2
− 2q1 − 4 = 0
解得均衡时
q1=q2=1,则
p=8,利润为:π1=π2=
aijx*i y j 。由于 d 是
i =1 j=1
i =1 j=1
i =1 j=1
mn
mn
mn
∑∑ ∑∑ ∑∑ 常数,因此有
(aij + d)xi y j =
aijxi y j + d 。显然不等式
(aij + d)xi y*j ≤
i =1 j=1
i =1 j=1
i =1 j=1
mn
mn
∑ ∑ ∑ ∑ (aij + d)x*i y*j ≤
,要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需
a>10。此时乙企
业的收益为 100+a。
11. 假设有一博弈 G=[N,S,P],其中 N={1,2},S1=[10,20],S2=[0,15], P1 (s) = 40s1 − 2s12 + 5s1s 2 ,
P2 (s)
= 50s 2
−
s
2 2
(aij + d)x*i y j 是成 立的 , 此即 为 XA2Y* ≤ X*A2Y* ≤ X*A2Y 。所以
i =1 j=1
i =1 j=1
(X*,Y*)是矩阵博弈 G2 的纳什均衡点,并且
平新乔18讲10-12
第十讲策略性博弈与纳什均衡§1 策略博弈与占优博弈论:研究主体(人)的行为发生相互作用时候的决策以及这种决策的均衡问题。
其中,人:理性人,即在一定的限制条件下,最大化自身的利益;行为:相互影响;目的:达到均衡。
博弈论是一种方法,严格地讲并不是经济学的一个分支。
一、博弈分类1、零和博弈与非零和博弈例如:(石头、剪刀、布)零和博弈=两个参与人得数之和为零(或为常数c),为相对份额大小而博弈(和为常数),争夺(不可再生)资源。
2、合作博弈与非合作博弈(nash 1950’s – 1990’s)按是否有无约束力的协议来区分。
合作博弈强调的是团体理性、效率、公正和公平,个人理性可能导致集体的非理性,所以要设计制度,在满足个人理性的前提下,达到集体的理性。
非合作博弈强调的是个人理性,个人最优决策的结果可能有效率,也可能无效率。
合作博弈最近10多年再度兴起,两者在一定条件下等价。
3、静态博弈(同时)与动态博弈(序贯):按行动的顺序(时间)区分,可以是静态的,也可以是动态的。
4、完全信息与非完全信息博弈信息是参与人在博弈中的知识,如对其他参与人的特征、战略方向及支付函数的知识。
信息可能是完全的,也可能是不完全的。
二、静态博弈(同时)定义:{}{}{},,i i N I S u =,其中,I :参与人集合;{}i S :参与人的策略集;{}i u :参与人的得益函数集。
i u :SR→,12...I S S S S =⨯⨯⨯规定:两人的博弈,行博弈人A ,列博弈人B 。
对A ,进行行比较,对B ,进行列比较。
三人博弈:前两人同上,第三人取矩阵。
例1 {}1234min ,,i i u x x x x =-,“i ”报数{}1,2,3i x =,对整体鼓励多报,对个人鼓励少报。
如第三人选“1”,则:同样,第三人选“2”或“3”,则可得另外的两个矩阵(见教材p198)。
可能的结果有27个,但均衡至少有3个:三个人同时报1、2、3。
策略性博弈与纳什均衡
二、纳什均衡: 1、纳什均衡的定义: 一个策略组合S*=(S1*,S2*, …,Sn*)被称 为纳什均衡,如果别的游戏者不背离这一组合, 就没有人背离他自己的最优反应S,换言之,对 于所有的i, Ui(Si*,S-i*) ≥ Ui(Si*,S-i*) 这也就是说,当参与博弈的每一个游戏者都选 择了自己最优反应策略时,并且这些最优反应 形成一个组合,便形成了纳什均衡
第十章 策略性博弈与纳什均衡
第一节 基本概念 第二节 策略博弈与占优 第三节 最优反应与纳什均衡 第四节 混合策略与最大最小策略
第一节 基本概念 一、游戏者: 博弈里的游戏者是作决策的个人。每个游 戏者的目标是通过选择行动使自己的效用极大 化。
二、行动或步骤: 指参与人的所有可能的策略或行动的集合。
B 左 上 右
A
1,0
1,1
下
-1000,0
2,1
谢
谢
感谢全体区域经济学同学的帮助,他们分 别是岳松、周岩、吕伟伟、余欢、王朝晖、高 佳虹、何佳琛
主讲:罗登义
在一个博弈中,博弈方i策略空间为 Si={Si1,Si2,…,Sin},则博弈方i以概率Pi=(pi1, pi2,…,pin)随机在其K个可选策略中选择的“策 略”,称为一个“混合策略”,其中0 《 Pij 《 1对 j=1,2,…,k都成立,且Pi1+…+pik=1
二、最大最小策略: 这是一种保守的策略,又是风险比较小的 策略。当游戏者想回避风险时,他会采取该策 略。
3、举例
囚徒B 不揭发 囚徒A 不揭发 揭发同伴 5 ,5 6,-1 揭发同伴 -1,6 0 ,0
4、纳什均衡不唯一的例证
丈夫 看拳击 妻子 看拳击 看芭蕾 4 ,5 0,0 看芭蕾 0,0 5 ,4
《博弈入门》第二章:纳什均衡:理论
努⼒⼯作游⼿好闲努⼒⼯作2,23,0游⼿好闲0,31,1《博弈⼊门》第⼆章:纳什均衡:理论1 策略型博弈策略型博弈是决策者之间相互作⽤的模型。
正是因为相互作⽤,我们称决策者为局中⼈。
每个局中⼈有⼀个可选⾏动的集合。
模型中的每个局中⼈受到所有局中⼈⾏动的影响,⽽不仅是受到她⾃⼰⾏动的影响,从⽽获得局中⼈之间的相互作⽤。
尤其是,每个局中⼈对于⾏动剖⾯⼀-所有局中⼈⾏动的列表(参见17.4节中关于剖⾯的讨论)---都有⾃⼰的偏好。
定义2.1(具有序数偏好的策略型博弈)(具有序数偏好的)策略型博弈由如下要素组成:局中⼈集合对于每个局中⼈,有⼀个⾏动集合对于每⼀个局中⼈,有关于⾏动剖⾯集合的偏好2.2 囚徒困境2.2.1 合作项⽬你和朋友合作-⼀个项⽬。
你们每个⼈可以要么努⼒⼯作要么游⼿好闲。
如果你的朋友努⼒⼯作,⽽你乐意游⼿好闲(如果你也努⼒⼯作的话,项⽬的结局将会好--些,可是其价值的增量对你来讲不值得付出额外的努⼒)。
你喜欢你们俩都努⼒⼯作的结局甚于你们俩都游⼿好闲(在这种情况下,什么都没有完成),对于你,最差的结局是你⼯作很努⼒⽽你的朋友却游⼿好闲(你痛恨被“剥削")。
如果你的朋友有相同的偏好,那么模拟你所⾯对情形的博弈将在图2.2中给出,如你所看到,这个博弈与“囚徒困境”的不同仅在于⾏动的名称。
我们并没有断⾔,两个⼈从事⼀个合作项⽬的情况必定具有“囚徒困境”的结构,只有当局中⼈的偏好与“囚徒困境”中⼀样时才是!例如,如果在其他⼈努⼒⼯作时每个⼈都喜欢努⼒⼯作甚于游⼿好闲,那么“囚徒困境”就不模拟这种情况:局中⼈的偏好与图2.2中给出的偏好不同。
2.2.2 双寡头垄断左图的博弈与“囚徒困境”的不同之处不仅在于局中⼈⾏动的名称,还在于其中两个局中⼈的偏好上有所不同。
右图的博弈与“囚徒困境”的不同之处仅在于局中⼈⾏动的名称。
随机坚持随机1/2(H+L),1/2(H+L)L,H坚持H,L S,SS>L2.4例证:匹配硬币(⽆冲突博弈)我们研究的求解理论有两个部分。
平新乔微观经济学十八讲》答案
5.1. 当 ρ = 1 ,该效用函数为线性.
证明:当 ρ = 1 时,效用函数为
u(x1, x2 ) = α1x1 + α 2 x2 此时,函数 u 是线性的.
4
第一讲 偏好、效用……
5.2.
当ρ
→
0 时,该效用函数趋近于 u(x1 ,
x2 )
=
x α1 1
x α2 2
β1
证明:令
=
α1 α1 + α2
2 x12
因此 x1 的边际效用是递减的.同理, x2 的边际效用也是递减的.i
4.2. 请给出一个效用函数形式,使该形式不具备边际效用递减的性质.
答:可能的一个效用函数是 u(x1, x2 ) = x1 + x2 .
5. 常见的常替代弹性效用函数形式为
请证明:
( )1
u(x1 , x2 ) = α1 x1ρ + α 2 x2 ρ ρ
述的偏好中,商品 1 与商品 2 是完全替代的.
4. 若某个消费者的效用函数为
u ( x1 ,
x2 )
=
1 2
ln
x1
+
1 2
ln
x2
其中, x1, x2 ∈ R+
4.1. 证明: x1 与 x2 的边际效用都递减.
证明: u(x1, x2 ) 对 x1 取二阶偏导:
∂2u = − 1 < 0
∂x12
不具有完备性.同理可以说明无差异关系也不具有完备性.
8.2. ≈ 满足反身性
说明:如果无差异关系不具有完备性,那么根据无差异关系的定义,则必存在一个消
费束严格偏好于它自身,也就是说,这个消费束同时既偏好于它本身又不偏好于它本
第十章 习题答案
第十章 博弈论初步1.什么是纳什均衡?纳什均衡一定是最优的吗?解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
(2)不一定。
纳什均衡可能是最优的,也可能不是最优的。
例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是最优的;即使在纳什均衡是唯一时,它也可能不是最优的——因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。
2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有几个?为什么?解答:在只有两个参与人(如A 和B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。
例如,当A 与B 的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。
A 的支付矩阵=⎥⎦⎤⎢⎣⎡22211211a a a aB 的支付矩阵=⎥⎦⎤⎢⎣⎡22211211b b b b3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。
试举一例说明。
解答:例如,当参与人A 与B 的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。
A 的支付矩阵= ⎥⎦⎤⎢⎣⎡22211211a a a aB 的支付矩阵=⎥⎦⎤⎢⎣⎡22211211b b b b 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所有的纯策略纳什均衡?解答:可使用条件策略下划线法。
具体步骤如下:首先,设两个参与人分别为左参与人和上参与人,并把整个的支付矩阵分解为这两个参与人的支付矩阵;其次,在左参与人的支付矩阵中,找出每一列的最大者,并在其下划线;再次,在上参与人的支付矩阵中,找出每一行的最大者,并在其下划线;再再次,将已经划好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个支付矩阵;最后,在带有下划线的整个支付矩阵中,找到两个数字之下均划有线的所有的支付组合。
平新乔《微观经济学十八讲》(章节题库第10讲策略性博弈与纳什均衡)【圣才出品】
平新乔《微观经济学十八讲》(章节题库第10讲策略性博弈与纳什均衡)【圣才出品】第10讲策略性博弈与纳什均衡一、简答题1.假设政府与流浪者之间存在如下社会福利博弈:请分析下,在这场博弈中政府和流浪汉各自有没有优势策略均衡?有没有纳什均衡?在此基础上说明优势策略均衡和纳什均衡的区别和联系。
(复旦大学856经济学综合2012研)答:(1)从流浪汉的角度来看,如果政府选择“救济”,流浪汉的最佳策略是“游手好闲”;如果政府选择“不救济”,流浪汉的最佳策略是“寻找工作”。
因此,流浪汉没有优势策略。
从政府的角度来看,如果流浪汉选择“寻找工作”,政府的最佳策略是“救济”;如果流浪汉选择“游手好闲”,政府的最佳策略是“不救济”。
因此,政府也没有优势策略。
从而,这场博弈中没有优势策略均衡。
如果流浪汉选择“寻找工作”,则政府会选择“救济”;反过来,如果政府选择“救济”,则流浪汉会选择“游手好闲”。
因此,(救济,寻找工作)不是纳什均衡,同理,可以推断出其他三个策略组合也不是纳什均衡。
所以,这场博弈中也没有纳什均衡。
(2)当博弈的所有参与者都不想改换策略时所达到的稳定状态称为均衡。
无论其他参与者采取什么策略,该参与者的唯一最优策略就是他的优势策略。
由博弈中所有参与者的优势策略所组成的均衡就是优势策略均衡。
给定其他参与者策略条件下每个参与者所选择的最优策略所构成的策略组合则是纳什均衡。
优势策略均衡与纳什均衡的关系可以概括为:优势策略均衡一定是纳什均衡,纳什均衡不一定是优势策略均衡。
2.请找出下列策略型博弈中的混合策略均衡:表10-1策略型博弈答:(1)对于表10-1左边的博弈:设参与人2选择策略L 的概率为q ,选择策略R 的概率即为1q -,则参与人1的收益应满足:()()601361q q q q +?-=+?-可得:23q =。
设参与人1选择策略T 的概率为p ,选择B 的概率即为1p -。
则参与人2的收益应满足:()()021601p p p p ?+-=+?-可得:14p =。
策略博弈复习题及答案
策略博弈复习题及答案1. 什么是纳什均衡?纳什均衡是指在一个博弈中,每个参与者选择了自己的最优策略,并且考虑到其他参与者的策略选择后,没有任何一个参与者能够通过单方面改变策略来获得更好的结果。
换句话说,当所有参与者都选择了自己的最优策略时,就达到了纳什均衡。
2. 描述囚徒困境的基本结构。
囚徒困境是一个典型的非零和博弈,涉及两个参与者,他们各自面临合作或背叛的策略选择。
如果两人都选择合作,他们都会获得中等的收益;如果一个合作而另一个背叛,背叛者将获得最大的收益,而合作者则会受到惩罚;如果两人都选择背叛,他们都会得到最差的收益。
3. 博弈论中的混合策略是什么?混合策略是指参与者在博弈中以一定的概率选择不同的纯策略。
在混合策略中,参与者不是每次都选择相同的策略,而是根据一定的随机化规则在不同策略之间做出选择。
4. 举例说明什么是博弈的动态演化。
博弈的动态演化是指随着时间的推移,博弈参与者的策略选择可能会发生变化。
例如,在重复博弈中,参与者可能会根据之前博弈的结果调整自己的策略,以期望在未来获得更好的收益。
这种策略的调整和演化过程就是博弈的动态演化。
5. 如何识别一个博弈是否具有多个纳什均衡?要识别一个博弈是否具有多个纳什均衡,可以分析每个参与者的最优反应函数。
如果存在多个策略组合,使得每个参与者在给定其他参与者策略的情况下,都没有动机单方面改变策略,那么这个博弈就具有多个纳什均衡。
6. 什么是合作博弈和非合作博弈的区别?合作博弈和非合作博弈的主要区别在于参与者是否可以形成具有约束力的协议。
在合作博弈中,参与者可以达成协议并共同执行,而在非合作博弈中,参与者不能形成具有约束力的协议,他们只能独立选择自己的策略。
7. 描述博弈论在经济学中的应用。
博弈论在经济学中有广泛的应用,包括市场结构分析、拍卖理论、合同理论、产业组织等。
通过博弈论,经济学家可以分析不同市场参与者在特定情境下的策略选择,以及这些选择如何影响市场结果。
博弈10
甲 分 乙 不借 不分 (1,0) (0,4) 乙 借 甲 开金矿博弈 分 (2,2) 打 不借 借 甲 分 (2,2) 打 (1,0) 不分 乙 乙 不借
(2,2)
(1,0) 不分 乙 不打
(-1,0)
(0,4)
不打 (0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
(1,0)
有法律保障的开金矿博弈 ——分钱打官司都可信
• 承诺行动
– 改变自己的行动空间 – 改变自己的得益函数
2013-8-7
中南财经政法大学信息学院
19
(一)子博弈(sub-game)
定义:一个扩展式博弈 的子博弈G由一个决策结 和所有该 x 决策结的后续结 ( x(包括终点结)组成, T ) 满足如下条件
(1)x是一个单结信息集的元 素,即h( x ) {x};
2013-8-7 中南财经政法大学信息学院 14
• 动态博弈需要考虑下列问题:
一个博弈可能有多个(甚至无穷多个)纳什均衡,究 竟哪个更合理?
纳什均衡假定每一个博弈方在选择自己的最优策略时 假定所有其他博弈方的策略是给定的,但是如果博弈 方的行动有先有后,后行动者的选择空间依赖于前行 动者的选择,前行动者在选择时不可能不考虑自己的 行动对后行动者的影响。
2013-8-7 中南财经政法大学信息学院 25
例4、设有一扩展式博弈
开发
A
不开发
X
大 小
1/2
X
大
小
1/2 1/2 1/2
B
不开发 开发
B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4)
(8,0) (-3,-3)
纳什均衡
博弈的正规型表述
用 表示一个博弈,其中有 人可选策略集合分别用 个局中人,每个局中 表示;
可取有限个
表示局中人 的第 个策略,其中 值、也可取无限个值;
Ui是 博弈方 的得益用 Ui 表示; 各博弈方策略的多元函数, 个局 中人的博弈 常写成
策略型表述
正规型表述
wuweiwei100@
wuweiwei100@
是可行的
4、不同均衡概念之间的关系
上策均衡 累次严优均衡 纯策略纳什均衡 混合策略纳什均衡
wuweiwei100@
前情概要:张三李四需要修路,修路成 ( 1, 1) 本4,效益3. 共同修效益1,只有一家修效 益分别是-1(修), 3(不修). 征税后的故事 现政府征收税2.
wuweiwei100@
这就是我们看到的为什么大多数路、桥等公共
设施都是由政府出资修建的原因。
同样的道理,国承担这方面服务的积极性和能力。
wuweiwei100@
修路博弈
李四 修 修 张三 不修 1,1 3,-1 不修 -1,3 0,0
wuweiwei100@
修路博弈
我们看到,对两家居民来说,“修路”都是劣
政府收税 4 单位,修好这 战略,因而他们都不会出资修路。
条对大家都有好处的路。 但是,为了解决这条新路的建设问题,政府强 两家的效益 从 (0,0) 变 成 制性地分别向每家征税 2单位。
•10
修路博弈
设想有两户相居为邻的农家,十分需要有一条好 路从居住地通往公路。修一条路的成本为 4,每个农 家从修好的路上获得的好处为3。
如果你是其中一个 农户 你会怎样选择呢?
wuweiwei100@
修路博弈
微观经济学第十章 习题答案
让每个人平等地提升自我地理物理化学复习题 练习解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
(2)不一定。
纳什均衡可能是最优的,也可能不是最优的。
例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是最优的;即使在纳什均衡是唯一时,它也可能不是最优的——因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。
2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人(如A 和B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。
例如,当A 与B 的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。
A 的支付矩阵=⎥⎦⎤⎢⎣⎡22211211a a a aB 的支付矩阵=⎥⎦⎤⎢⎣⎡22211211b b b b 3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。
试举一例说明。
解答:例如,当参与人A 与B 的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。
A 的支付矩阵= ⎥⎦⎤⎢⎣⎡22211211a a a aB 的支付矩阵=⎥⎦⎤⎢⎣⎡22211211b b b b 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所有的纯策略纳什均衡? 解答:可使用条件策略下划线法。
具体步骤如下:首先,设两个参与人分别为左参与人和上参与人,并把整个的支付矩阵分解为这两个参与人的支付矩阵;其次,在左参与人的支付矩阵中,找出每一列的最大者,并在其下划线;再次,在上参与人的支付矩阵中,找出每一行的最大者,并在其下划线;再再次,将已经划好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个支付矩阵;最后,在带有下划线的整个支付矩阵中,找到两个数字之下均划有线的所有的支付组合。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
平新乔《微观经济学十八讲》第10讲 策略性博弈与纳什均衡1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是50020D Q p =-(1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗? 解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。
理由如下:假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。
其次,达到均衡时,A p 和B p 都不会严格大于10。
否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。
所以均衡价格一定满足10A p ≤,10B p ≤。
但是由于A p 的下限也是10,所以均衡时10A p =。
给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。
综上可知,均衡时的价格为10A p =,10B p ε=-。
(2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。
下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为:max pq cq ε>- ①其中10p ε=-,()5002010q ε=-⨯-,把这两个式子代入①式中,得到:()()0max 1085002010εεε>----⎡⎤⎣⎦解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为:()()500201010εε-⨯--⎡⎤⎣⎦。
(3)这个结果不是帕累托有效的。
因为厂商B 的产品的价格高于它的边际成本,所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。
2.(单项选择)在下面的支付矩阵(表10-1)中,第一个数表示A 的支付水平,第二个数表示B 的支付水平,a 、b 、c 、d 是正的常数。
如果A 选择“下”而B 选择“右”,那么:表10-1 博弈的支付矩阵(1)1b >且1d < (2)1c <且1b < (3)1b <且c d < (4)b c <且1d < (5)1a <且b d < 【答案】(3)【分析】由于(下,右)是均衡策略,所以给定B 选择“右”,“下”是A 的最优选择,这就意味着c d <;同样的,给定A 选择“下”,“右”也是B 的最优选择,这就意味着1b <。
3.史密斯与约翰玩数字匹配游戏。
每一个人选择1、2或者3。
如果数字相同,约翰支付给斯密3美元。
如果数字不同,斯密支付给约翰1美元。
(1)描述这个对策的报酬矩阵,并且证明没有纯策略纳什均衡策略组。
(2)如果每一个局中人以13的概率选择每一个数字,证明这个对策的混合策略确实有一纳什均衡。
这个对策的值是什么?解:(1)根据题意,构造如下的支付矩阵(表10-2)(其中每一栏中前一个数字是史密斯的支付,后一个数字是约翰的支付):表10-2 玩数字匹配游戏的支付矩阵首先由史密斯来选择,假设史密斯选择1,并期望约翰选择1,从而使自己得到3的支付。
但是,如果史密斯选择1,则约翰一定会选择2或者3,从而使自己得到1,而不是-3。
假设约翰选择2,他期望史密斯选择1或者3,以使得自己得到1,而实际上史密斯会选择2,使得约翰得到-3,等等。
不断的循环反复,最终也无法达成一个使得双方都能够接受的方案。
因此,这个对策没有一个纯策略纳什均衡。
(2)假设均衡时,约翰选择1、2、3的概率分别为1x 、2x 和121x x --,那么此时史密斯在选择1、2、3之间是没有区别的,即:()()()121212121212313131x x x x x x x x x x x x ----=-+---=--+--从而解得1212113x x x x ==--=类似的方法可以解得史密斯在均衡状态下选择1、2、3的概率分别为1/3。
4.假定世界上氪的整个供给由20个人控制,每一个人拥有这种强有力的矿物10000克。
世界对氪的需求是10001000Q p =-其中p 是每克的价格。
(1)如果所有拥有者合谋控制氪的价格,他们设置的价格是多少?他们能够卖出的量是多少?(2)为什么(1)中计算的价格是不稳定的?(3)通过改变要求保持市场价格的产出,在没有厂商能够获利的意义下存在一个稳定的均衡时,氪的价格是多少?解:(1)所有拥有者合谋控制氪的价格,此时总的利润函数为:111000Q Q π⎛⎫=- ⎪⎝⎭利润最大化的一阶条件为:d 110d 500Q Q π=-= 解得总供应量为500Q =(克)。
此时111000.50Q p =-=,每个厂商的供应量为500/2025=(克)。
(2)对第一个厂商而言,给定其他每个厂商的供应量为25克,那么他的利润最大化问题为:111525max1000q q q - 根据一阶条件解得:1262.5q =可见在其他厂商的供应量为25克的条件下,厂商1增加供应量会提高自己的利润。
类似的结论对市场上的其他厂商也成立,所以合谋是不稳定的。
(3)题目要求完全竞争市场的均衡结果。
令p MC =,得到氪的价格为零。
市场上的总供给量为1000克,每个成员的出售量为50克。
5.在下表所示的策略型博弈(表10-3)中,找出占优均衡。
表10-3 博弈的支付矩阵答:对于行为人2而言,R 优于M ,所以行为人2将会剔除掉M 策略,只在R 、L 这两个策略中进行选择;对于行为人1来说,知道了行为人2会在L 、R 策略中选择,则U 占优于M 和D 策略。
当行为人2知道行为人1选择了U 策略时,他则最终会选择L 策略。
所以,最终的占优均衡为(U ,L )。
6.模型化下述划拳博弈:两个老朋友在一起划拳喝酒,每个人有四个纯策略:杆子、老虎,鸡和虫子。
输赢规则是:杆子降考虎,老虎降鸡,鸡降虫子,虫子降杆子。
两个人同时出令。
如果一个打败另一个,赢者的效用为1,输者的效用为-1;否则,效用均为0。
写出这个博弈的收益矩阵。
这个博弈有纯策略纳什均衡吗?计算出混合策略纳什均衡。
答:(1)该题的支付矩阵(表10-4)为:表10-4 划拳博弈的支付矩阵(2)这是一个零和博弈,没有纯策略纳什均衡。
这是因为:对两个参与者,给定对方策略时,本方的占优策略对应的支付以下划线标注,均衡存在当且仅当在同一栏中出现两个下划线。
由此可知,该博弈没有纯策略纳什均衡。
(3)记游戏者1分别选择各个策略的概率为{}1234,,,p p p p ,游戏者2分别选择各个策略的概率为{}1234,,,q q q q 。
当游戏者2分别以概率{}1234,,,q q q q 选择四个策略时,游戏者1的四个策略的收益应该相等(根据同等支付原则):()()()()2413241311111111q q q q q q q q ⨯+-⨯=-⨯+⨯=-⨯+⨯=⨯+-⨯又因为12341q q q q +++=,可以得到:123414q q q q ====。
同理,当对于游戏者1分别以概率{}1234,,,p p p p 选择四个策略时,游戏者2的四个策略的收益应该相等(根据同等支付原则):()()()()2413241311111111p p p p p p p p ⨯+-⨯=-⨯+⨯=-⨯+⨯=⨯+-⨯又因为12341p p p p +++=,可以得到:123414p p p p ====。
因此混合策略纳什均衡为:(1σ,2σ),其中111114444σ⎛⎫= ⎪⎝⎭,,,,211114444σ⎛⎫= ⎪⎝⎭,,,7.巧克力市场上有两个厂商,各自都可以选择去市场的高端(高质量),还是去低端(低质量)。
相应的利润由如下收益矩阵(表10-5)给出:表10-5 巧克力商的博弈(1)如果有的话,哪些结果是纳什均衡?(2)如果各企业的经营者都是保守的,并都采用最大最小化策略,结果如何? (3)合作的结果是什么?(4)哪个厂商从合作的结果中得好处最多?哪个厂商要说服另一个厂商需要给另一个厂商多少好处?解:(1)纳什均衡的结果是(高,低)和(低,高),相应的收益分别为(100,800)和(900,600)。
(2)如果1选择低,则有{}min 20,90020-=-;如果1选择高,则有{}min 100,5050=。
因此如果1想要最大化它的最小支付,其最优决策为:{}{}{}{}max min 20,900,min 100,50max 20,5050-=-=所以1会选择高。
类似的分析表明2也会选择高,因此两个人都采用最大最小策略的均衡结果为(高,高),相应的支付为(50,50)。
(3)如果双方进行合作,那么他们的目标就是总利润最大化,这样最终的结果就是(低,高),相应的支付为(900,600)。
(4)厂商1从合作的结果中获得的好处多。
为了使得厂商2不选择另外一个纳什均衡(高,低),厂商1应当给厂商2一笔800600200-=的支付。
8.考虑在c ,f ,g ,三个主要汽车生产商之间的博弈。
每一个厂商可以生产要么大型车,要么小型车,但不可同时生产两种型号的车。
即,对于每一个厂商i ,i c =,f ,g ,他的行动集合为{},AI SM LG =。
用i α代表i 所选择的行动,i I A α,(),,I c f g πααα代表厂商i 的利润。
假设,每个厂商的利润函数定义如下:i πγ≡,如果j LG α=,j c =,f ,g ;γ,如果j SM α=, j c =,f ,g ; α,如果i LG α=,且j SM α=,j i ≠; α,如果i SM α=,且j LG α=,j i ≠;β,如果i j LG αα==,且k SM α=,j k i ≠≠;β,如果i j SM αα==,且k LG α=,j k i ≠≠; (1)当0αβγ>>>时,是否存在纳什均衡?请证明。
(2)当0αγβ>>>时,是否存在纳什均衡?请证明。
证明:该博弈的支付矩阵如表10-6和10-7所示。
表10-6 G 汽车厂生产SM 型汽车表10-7 G 汽车厂生产LG 型的汽车(1)该博弈存在纳什均衡。
首先考虑三家选择的行动相同,那么任一个厂家都将得到数量为γ的利润。