平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

合集下载

平新乔《微观经济学十八讲》课后习题详解(策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》课后习题详解(策略性博弈与纳什均衡)

第10讲 策略性博弈与纳什均衡1.假设厂商A 与厂商B 的平均成本与边际成本都是常数,10A MC =,8B MC =,对厂商产出的需求函数是50020D Q p =-(1)如果厂商进行Bertrand 竞争,在纳什均衡下的市场价格是多少? (2)每个厂商的利润分别为多少? (3)这个均衡是帕累托有效吗?解:(1)如果厂商进行Bertrand 竞争,纳什均衡下的市场价格是10B p ε=-,10A p =,其中ε是一个极小的正数。

理由如下:假设均衡时厂商A 和B 对产品的定价分别为A p 和B p ,那么必有10A p ≥,8B p ≥,即厂商的价格一定要高于产品的平均成本。

其次,达到均衡时,A p 和B p 都不会严格大于10。

否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。

所以均衡价格一定满足10A p ≤,10B p ≤。

但是由于A p 的下限也是10,所以均衡时10A p =。

给定10A p =,厂商B 的最优选择是令10B p ε=-,这里ε是一个介于0到2之间的正数,这时厂商B 可以获得整个市场的消费者。

综上可知,均衡时的价格为10A p =,10B p ε=-。

(2)由于厂商A 的价格严格高于厂商B 的价格,所以厂商A 的销售量为零,从而利润也是零。

下面来确定厂商B 的销售量,此时厂商B 是市场上的垄断者,它的利润最大化问题为:max pq cq ε>- ①其中10p ε=-,()5002010q ε=-⨯-,把这两个式子代入①式中,得到:()()0max 1085002010εεε>----⎡⎤⎣⎦解得0ε=,由于ε必须严格大于零,这就意味着ε可以取一个任意小的正数,所以厂商B 的利润为:()()500201010εε-⨯--⎡⎤⎣⎦。

(3)这个结果不是帕累托有效的。

因为厂商B 的产品的价格高于它的边际成本,所以如果厂商B 和消费者可以为额外1单位的产品协商一个介于8到10ε-之间的价格,那么厂商B 的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A 的剩余(因为A 的利润还是零)。

完整第十章 习题答案

完整第十章  习题答案

第十章博弈论开端1.什么是纳什平衡?纳什平衡必定是最优的吗?解答:(1)所谓纳什平衡,是参加人的一种战略组合,在该战略组合上,任何参加人独自改动战略都不会掉掉落益处。

(2)不必定。

纳什平衡能够是最优的,也能够不是最优的。

比方,在存在多个纳什平衡的状况下,此中有一些纳什平衡就不是最优的;即便在纳什平衡是独一时,它也能够不是最优的——因为与它相对应的领取组合能够会小于与其余战略组合相对应的领取组合。

2.在只要两个参加人且每个参加人都只要两个战略可供选择的状况下,纯战略的纳什平衡最多可有多少个?什么原因?解答:在只要两个参加人(如A跟B)且每个参加人都只要两个战略可供选择的状况下,纯战略的纳什平衡最多可有四个。

比方,当A与B的领取矩阵可分不表现如下时,总的领取矩阵中一切四个单位格的两个数字均有下划线,从而,统共有四个纳什平衡。

A的领取矩阵=B的领取矩阵=3.在只要两个参加人且每个参加人都只要两个战略可供选择的状况下,纯战略的纳什平衡能够有三个。

试举一例阐明。

解答:比方,当参加人A与B的领取矩阵可分不表现如下时,总的领取矩阵中恰恰有三个单位格的两个数字均有下划线,从而,统共有三个纳什平衡。

A的领取矩阵=B的领取矩阵=4.在只要两个参加人且每个参加人都只要两个战略可供选择的状况下,怎样寻到一切的纯战略纳什平衡?解答:可运用前提战略下划线法。

详细步调如下:起首,设两个参加人分不为左参加人跟上参加人,并把全部的领取矩阵剖析为这两个参加人的领取矩阵;其次,在左参加人的领取矩阵中,寻出每一列的最年夜者,并在其下划线;再次,在上参加人的领取矩阵中,寻出每一行的最年夜者,并在其下划线;再再次,将曾经划好线的两个参加人的领取矩阵再兼并起来,掉掉落带有下划线的全部领取矩阵;最初,在带有下划线的全部领取矩阵中,寻到两个数字之下均划有线的一切的领取组合。

这些领取组合所代表的战略组合确实是纳什平衡。

5.设有A、B两个参加人。

关于参加人A的每一个战略,参加人B的前提战略有无能够不止一个。

博弈论习题答案

博弈论习题答案

博弈论习题答案博弈论习题答案博弈论是一门研究决策和策略的数学分支,它通过分析参与者之间的互动,揭示他们的利益和行为模式。

在博弈论中,常常会遇到各种各样的习题,这些习题旨在让我们思考和解决实际生活中的决策问题。

本文将给出一些常见的博弈论习题的答案,帮助读者更好地理解和应用博弈论的概念。

1. 零和博弈问题零和博弈是指参与者的利益完全相反,一方的收益等于另一方的损失。

考虑以下情景:两个商人A和B在市场上销售相同的产品,他们的利润取决于他们的定价策略。

如果A的定价高于B,那么B将失去一部分市场份额,反之亦然。

假设A和B的收益函数分别为R_A(p_A, p_B)和R_B(p_A, p_B),其中p_A和p_B分别是A和B的定价。

问题是,A和B应该如何定价以最大化自己的利润?答案:由于这是一个零和博弈问题,A和B的利益完全相反。

因此,他们的最佳策略是采取纳什均衡策略。

纳什均衡是指在互动中,没有参与者能够通过改变自己的策略来提高自己的收益。

在这个例子中,纳什均衡定价是使得A和B的利润最大化的定价组合。

通过求解收益函数的偏导数,我们可以找到纳什均衡定价。

2. 合作与背叛在博弈论中,合作与背叛是一个经典的主题。

考虑以下情景:两个犯罪团伙A和B同时被捕,他们面临着与检察官合作还是背叛的选择。

如果两个团伙都选择合作,那么他们将面临较轻的刑罚;如果一个团伙选择合作而另一个团伙选择背叛,那么合作的团伙将面临较重的刑罚,而背叛的团伙将面临较轻的刑罚;如果两个团伙都选择背叛,那么他们将面临较重的刑罚。

问题是,A和B应该如何决策以最大化自己的利益?答案:这是一个经典的囚徒困境问题,合作是最佳策略。

在囚徒困境中,纳什均衡是使得参与者无法通过改变自己的策略来提高自己的收益。

在这个例子中,如果A和B都选择合作,他们将获得较轻的刑罚。

然而,如果一个团伙选择背叛而另一个团伙选择合作,背叛的团伙将获得更轻的刑罚,而合作的团伙将获得更重的刑罚。

北大课上纳什均衡的两个案例

北大课上纳什均衡的两个案例

中微补充讲义 (7)平新乔 (2006年12月17日)关于纳什均衡的两个案例二、占优策略与“密封次高价”拍卖机制拍卖是一种古老且至今仍存在的市场交易方式。

从最宽的定义来说,“拍卖”是指将经济资源配置到某一个当事人手中的方式。

现实生活中,古董的拍卖、艺术品的拍卖、短期国债的拍卖、海上油矿开采权拍卖、天然气开采权拍卖,到无线频道拍卖、国有企业拍卖等。

拍卖形式繁多,而且涉及大宗商品的交易。

“有效”的拍卖机制中涉及到两个概念:(1)有效性:这是指(a )要让资源经过拍卖配置到对该资源(标的物)评价最高的当事人手里;(2)要使得标的物的卖者得到最优高度收益。

(2)机制:机制是指博弈形式(有参与人,有策略集,有博弈规则,有偏好序(支付函数)),该博弈形式让拍卖过程达到有效。

这里只讲“密封次高价拍卖”:这是指这样一个博弈,有几个竞拍人对一个标的物竞拍,他们同时把自己的“出价”写在纸上装入信封交给卖主,出价最高的竞标者赢得购买权,并按次高价买下标的物。

这里有三个问题:第一、 为什么要求赢者以“次高价”而不是自己的出价(即最高价)来买下标的物? 第二、 这里会发生均衡吗? 第三、 均衡唯一吗?我们先回答后两个问题,再回答第一个问题。

分3点来讲解: 1、 模型 假设:(1)设有几个竞拍人,标的物为1个。

(2)竞拍人i (i=1,…,n) 对标的物的真实评价为i v 。

这个i v 是i 独立评判的,不受他人j i ≠对标的物的评价j v 的影响。

(3)几个评估值12{,,...,,}n v v v 按大小排序为:121...n n v v vv ->>>>>0(4)竞拍规则为“密封次高价”:即若竞拍人的竞拍出价(bid price )(){()}max i i j j j ib v b v ≠>则i 赢下标的物,并且只按次高价付款。

于是,i 的得益(payoff )为i 的消费者剩余: i i j u v b =- 这里,{()}max j jjj ib b v ≠=,显然jb是价格(P=j b )。

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔课后习题详解(第10讲--策略性博弈与纳什均衡)

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡1 •假设厂商A与厂商B的平均成本与边际成本都是常数,MC A=10,MC B =8,对厂商产出的需求函数是Q D二500 -20 p(1)如果厂商进行Bertrand竞争,在纳什均衡下的市场价格是多少?(2)每个厂商的利润分别为多少?(3)这个均衡是帕累托有效吗?解:(1)如果厂商进行Bertrand竞争,纳什均衡下的市场价格是p B =10 一;,p A =10 , 其中;是一个极小的正数。

理由如下:假设均衡时厂商A和B对产品的定价分别为p A和p B,那么必有p A刃0 , p B K8,即厂商的价格一定要高于产品的平均成本。

其次,达到均衡时,p A和p B都不会严格大于10。

否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。

所以均衡价格一定满足p A空10 , p B・「0。

但是由于p A的下限也是10,所以均衡时P A =10。

给定P A =10 ,厂商B的最优选择是令P B =10- ;,这里:是一个介于0到2 之间的正数,这时厂商B可以获得整个市场的消费者。

综上可知,均衡时的价格为P A =10 , P B =10 -;。

(2)由于厂商A的价格严格高于厂商B的价格,所以厂商A的销售量为零,从而利润也是零。

下面来确定厂商B的销售量,此时厂商B是市场上的垄断者,它的利润最大化问题为:max pq —cq ①其中p =10 _ q =500 -20 107、把这两个式子代入①式中,得到:max (10 —芯―)500 —20(10 —名卩解得;=0,由于;必须严格大于零,这就意味着;可以取一个任意小的正数,所以厂商B 的利润为:||500-20 10 -; 10-;。

(3)这个结果不是帕累托有效的。

因为厂商B的产品的价格高于它的边际成本,所以如果厂商B和消费者可以为额外1单位的产品协商一个介于8到10一;之间的价格,那么厂商B的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A的剩余(因为A的利润还是零)。

博弈论各章节课后习题答案 (2)

博弈论各章节课后习题答案 (2)

1 π1 = (10 − 2q1 − 2q2 )q1 − 2 − 4q1
1 π2 = (10 − 2q1 − 2q2 )q2 − 2 − 4q2
求导得:
∂π1 ∂q1
= 10 − 4q1

2q 2

4
=
0
∂π2 ∂q 2
= 10 − 4q2
− 2q1 − 4 = 0
解得均衡时
q1=q2=1,则
p=8,利润为:π1=π2=
aijx*i y j 。由于 d 是
i =1 j=1
i =1 j=1
i =1 j=1
mn
mn
mn
∑∑ ∑∑ ∑∑ 常数,因此有
(aij + d)xi y j =
aijxi y j + d 。显然不等式
(aij + d)xi y*j ≤
i =1 j=1
i =1 j=1
i =1 j=1
mn
mn
∑ ∑ ∑ ∑ (aij + d)x*i y*j ≤
,要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需
a>10。此时乙企
业的收益为 100+a。
11. 假设有一博弈 G=[N,S,P],其中 N={1,2},S1=[10,20],S2=[0,15], P1 (s) = 40s1 − 2s12 + 5s1s 2 ,
P2 (s)
= 50s 2

s
2 2
(aij + d)x*i y j 是成 立的 , 此即 为 XA2Y* ≤ X*A2Y* ≤ X*A2Y 。所以
i =1 j=1
i =1 j=1
(X*,Y*)是矩阵博弈 G2 的纳什均衡点,并且

平新乔18讲10-12

平新乔18讲10-12

第十讲策略性博弈与纳什均衡§1 策略博弈与占优博弈论:研究主体(人)的行为发生相互作用时候的决策以及这种决策的均衡问题。

其中,人:理性人,即在一定的限制条件下,最大化自身的利益;行为:相互影响;目的:达到均衡。

博弈论是一种方法,严格地讲并不是经济学的一个分支。

一、博弈分类1、零和博弈与非零和博弈例如:(石头、剪刀、布)零和博弈=两个参与人得数之和为零(或为常数c),为相对份额大小而博弈(和为常数),争夺(不可再生)资源。

2、合作博弈与非合作博弈(nash 1950’s – 1990’s)按是否有无约束力的协议来区分。

合作博弈强调的是团体理性、效率、公正和公平,个人理性可能导致集体的非理性,所以要设计制度,在满足个人理性的前提下,达到集体的理性。

非合作博弈强调的是个人理性,个人最优决策的结果可能有效率,也可能无效率。

合作博弈最近10多年再度兴起,两者在一定条件下等价。

3、静态博弈(同时)与动态博弈(序贯):按行动的顺序(时间)区分,可以是静态的,也可以是动态的。

4、完全信息与非完全信息博弈信息是参与人在博弈中的知识,如对其他参与人的特征、战略方向及支付函数的知识。

信息可能是完全的,也可能是不完全的。

二、静态博弈(同时)定义:{}{}{},,i i N I S u =,其中,I :参与人集合;{}i S :参与人的策略集;{}i u :参与人的得益函数集。

i u :SR→,12...I S S S S =⨯⨯⨯规定:两人的博弈,行博弈人A ,列博弈人B 。

对A ,进行行比较,对B ,进行列比较。

三人博弈:前两人同上,第三人取矩阵。

例1 {}1234min ,,i i u x x x x =-,“i ”报数{}1,2,3i x =,对整体鼓励多报,对个人鼓励少报。

如第三人选“1”,则:同样,第三人选“2”或“3”,则可得另外的两个矩阵(见教材p198)。

可能的结果有27个,但均衡至少有3个:三个人同时报1、2、3。

博弈论各章节课后习题答案

博弈论各章节课后习题答案

第三章纳什均衡的扩展与精炼1.什么是完全信息和不完全信息?什么是完美信息和不完美信息?在海萨尼转换中,自然对局中人类型的确定都是有限的吗?举例说明。

(见教材)2.什么是重复博弈中的策略?什么是一个重复博弈中的子博弈?什么是一个子博弈完美纳什均衡?(见教材)3.以下(虚线框中的)子博弈的划分是否正确?答:两个扩展式中的子博弈划分均不正确,图1中的划分对同一信息集产生了分割,图2中的子博弈不是开始于单节信息集的决策结点。

4.在双寡头古诺模型中,设逆需求函数为p=a-Q,其中Q=q 1+q 2为市场总需求,但a 有a H 和a L 两种可能的情况,并且企业1知道a 究竟是a H 还是a L ,而企业2只知道a=a H 和a=a L 的概率分别是θ和1-θ,该信息是双方都知道的。

双方的总成本函数分别是cq 1和cq 2。

如果两企业同时选择产量,双方的策略空间是什么?试计算出贝叶斯纳什均衡。

假设企业2的产量为q 2,企业1将选择q 1最大化利润函数(这里a 取a H 或a L ))c q q a (q 12111−−−=π由此得:)c q a (q H H 12121−−=)c q a (q L L 12121−−=企业2将选择q 2最大化它的期望利润)c q q a (q )()c q q a (q )(E L L H H 2212221221−−−−+−−−=θθπ由此得:]c )q )(q (a )(a [q L H L H 21121121−−+−−+=θθθθ在均衡时,q 1,q 2应满足⎪⎪⎩⎪⎪⎨⎧−−+−−+=−−=]c )q )(q (a )(a [q )c q a (q L H L H 2112121112121θθθθ由此得:企业1的策略为:]c c a )(a [)c a (q L H H *H 2111216121−+−+−−=θθ]c c a )(a [)c a (q L H L *L 2111216121−+−+−−=θθ企业2的策略为:]c c a )(a [q L H *2122131−+−+=θθ因此博弈的贝叶斯纳什均衡是:当a=a H 时,企业1生产;当a=a L 时,企业1生产,*H q 1*L q 1企业2生产。

平新乔微观经济学十八讲》答案

平新乔微观经济学十八讲》答案

5.1. 当 ρ = 1 ,该效用函数为线性.
证明:当 ρ = 1 时,效用函数为
u(x1, x2 ) = α1x1 + α 2 x2 此时,函数 u 是线性的.
4
第一讲 偏好、效用……
5.2.
当ρ

0 时,该效用函数趋近于 u(x1 ,
x2 )
=
x α1 1
x α2 2
β1
证明:令
=
α1 α1 + α2
2 x12
因此 x1 的边际效用是递减的.同理, x2 的边际效用也是递减的.i
4.2. 请给出一个效用函数形式,使该形式不具备边际效用递减的性质.
答:可能的一个效用函数是 u(x1, x2 ) = x1 + x2 .
5. 常见的常替代弹性效用函数形式为
请证明:
( )1
u(x1 , x2 ) = α1 x1ρ + α 2 x2 ρ ρ
述的偏好中,商品 1 与商品 2 是完全替代的.
4. 若某个消费者的效用函数为
u ( x1 ,
x2 )
=
1 2
ln
x1
+
1 2
ln
x2
其中, x1, x2 ∈ R+
4.1. 证明: x1 与 x2 的边际效用都递减.
证明: u(x1, x2 ) 对 x1 取二阶偏导:
∂2u = − 1 < 0
∂x12
不具有完备性.同理可以说明无差异关系也不具有完备性.
8.2. ≈ 满足反身性
说明:如果无差异关系不具有完备性,那么根据无差异关系的定义,则必存在一个消
费束严格偏好于它自身,也就是说,这个消费束同时既偏好于它本身又不偏好于它本

平新乔《微观经济学十八讲》(章节题库第10讲策略性博弈与纳什均衡)【圣才出品】

平新乔《微观经济学十八讲》(章节题库第10讲策略性博弈与纳什均衡)【圣才出品】

平新乔《微观经济学十八讲》(章节题库第10讲策略性博弈与纳什均衡)【圣才出品】第10讲策略性博弈与纳什均衡一、简答题1.假设政府与流浪者之间存在如下社会福利博弈:请分析下,在这场博弈中政府和流浪汉各自有没有优势策略均衡?有没有纳什均衡?在此基础上说明优势策略均衡和纳什均衡的区别和联系。

(复旦大学856经济学综合2012研)答:(1)从流浪汉的角度来看,如果政府选择“救济”,流浪汉的最佳策略是“游手好闲”;如果政府选择“不救济”,流浪汉的最佳策略是“寻找工作”。

因此,流浪汉没有优势策略。

从政府的角度来看,如果流浪汉选择“寻找工作”,政府的最佳策略是“救济”;如果流浪汉选择“游手好闲”,政府的最佳策略是“不救济”。

因此,政府也没有优势策略。

从而,这场博弈中没有优势策略均衡。

如果流浪汉选择“寻找工作”,则政府会选择“救济”;反过来,如果政府选择“救济”,则流浪汉会选择“游手好闲”。

因此,(救济,寻找工作)不是纳什均衡,同理,可以推断出其他三个策略组合也不是纳什均衡。

所以,这场博弈中也没有纳什均衡。

(2)当博弈的所有参与者都不想改换策略时所达到的稳定状态称为均衡。

无论其他参与者采取什么策略,该参与者的唯一最优策略就是他的优势策略。

由博弈中所有参与者的优势策略所组成的均衡就是优势策略均衡。

给定其他参与者策略条件下每个参与者所选择的最优策略所构成的策略组合则是纳什均衡。

优势策略均衡与纳什均衡的关系可以概括为:优势策略均衡一定是纳什均衡,纳什均衡不一定是优势策略均衡。

2.请找出下列策略型博弈中的混合策略均衡:表10-1策略型博弈答:(1)对于表10-1左边的博弈:设参与人2选择策略L 的概率为q ,选择策略R 的概率即为1q -,则参与人1的收益应满足:()()601361q q q q +?-=+?-可得:23q =。

设参与人1选择策略T 的概率为p ,选择B 的概率即为1p -。

则参与人2的收益应满足:()()021601p p p p ?+-=+?-可得:14p =。

策略性博弈与纳什均衡

策略性博弈与纳什均衡

K
1 ik 1.
第21页/共28页
用 代表i的混合策略空间( i ), (1,,i ,,
i
i
n )代表混合策略组合 ,其中,i为i的一个混合策略 ,而
i 代表混合策略组合空间 ••( ). i
用vi ( ) vi ( i , i )表示参与人 i的期望效用函数 [ i (1,, i1, i1,, n)是除i之外所有其他参与人的 混合
第11页/共28页
小猪

等待
大 按 3,1 2, 4

等待 7, 1 0, 0
智猪游戏
第12页/共28页
2、纳什均衡及其存在性
每个人的选择战略是其他参与人战略选择的最优反映,它是在一个博弈中给定其他个博弈方选定的条件下没个 博弈方所选择的最优的策略。这是各方都得到最大的收益,没有一个博弈方会选择另外一个策略以试图改 善自己的状况,从自己的角度来说达到了帕累托最优的状态。
第4页/共28页
4、博弈的表示
(1)得益矩阵
囚徒2
坦白
不坦白
囚 徒
坦白 5, 5
不坦白 8, 0
0, 8
1, 1
第5页/共28页
1


正方

方 反方
猜硬币方
正方
1,1
反方
1, 1
1, 1 1,1
第6页/共28页
博弈方2
石头
剪刀

博 石头 0, 0
1, 1

方 剪刀 1,1 0, 0
1,1
1, 1
表示为:
ui (si,
,
s i 1
)
ui
(si
,
第13页/共28页

博弈论--纳什均衡

博弈论--纳什均衡

文通学院 10市场营销孙磊 331035024浅谈博弈论中的纳什均衡一、纳什均衡的由来纳什均衡(Nash equilibrium)又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。

其研究成果见于题为《非合作博弈》(1950)的博士论文。

该博士论文导致了《N人博弈中的均衡点》(1950年)和题为《非合作博弈》(1951年)两篇论文的发表。

纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。

他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈,该解概念后来被称为纳什均衡。

二、什么是纳什均衡?最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。

纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。

即在给定别人策略的情况下,没有人有足够理由打破这种均衡。

纳什均衡,从实质上说,是一种非合作博弈状态。

所有局中人策略构成一个策略组合(Strategy Profile)。

纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。

纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。

三、纳什均衡经典案例——“囚徒困境”假设有两个小偷A和B一起去偷东西,但是很不幸,由于技术不精,在作案过程中被警察抓住了。

警方将两个人分别关在两个房间里分别进行审问。

这时A、B都有抵赖和招供两个选择,如果他们都选择抵赖的话,警方由于证据不足,最多只能关他们一年。

但是如果都坦白的话,有了证据他俩都会被判8年。

如果其中一个坦白,另一个抵赖,坦白的一方由于破案有功,会被当场释放,而抵赖的一方则要被关十年。

你知道最终他们会如何选择吗?下面我们看看A与B所获得的支付:(其中-1表示关一年,-8表示关八年)从图表里我们可以看到,整体来说,都抵赖是最优选择,总共只需要关两年。

纯策略纳什均衡知识讲解

纯策略纳什均衡知识讲解

纯策略纳什均衡纯策略纳什均衡(Pure Strategy Nash Equilibrium)[编辑]什么是纯策略纳什均衡纯策略纳什均衡是指在一个纯策略组合中,如果给定其他的策略不变,该节点不会单方面改变自己的策略,否则不会使节点访问代价变小。

[编辑]存在纯策略纳什均衡的有限次重复博弈[1]如果重复博弈中有惟一纯策略纳什均衡,那么我们怎么找出它的纯策略纳什均衡呢?首先看下面囚徒的困境的博弈的例子:我们现在考虑该博弈重复两次的重复博弈,这可以理解成给囚徒两次坦白机会,最后的得益是两个阶段博弈中各自得益之和.在两次博弈过程中,双方知道第一次博弈的结果再进行二次博弈.用逆推归纳法来分析,先分析第二阶段,也就是第二次重复时两博弈方的选择.很明显,这个第二阶段仍然是两囚徒之间的一个囚徒的困境博弈,此时前一阶段的结果已成为既成事实,此后又不再有任何的后续阶段,因此实现自身当前的最大利益是两博弈方在该阶段决策中的惟一原则.因此我们不难得出结论,不管前一次的博弈得到的结果如何,第二阶段的惟一结果就是原博弈惟一的纳什均衡(坦白,坦白),双方得益(-5,-5).现在再回到第一阶段,即第一次博弈.理性的博弈方在第一阶段就对后一阶段的结局非常清楚,知道第二阶段的结果必然是(坦白,坦白),因此不管第一阶段的博弈结果是什么,双方在整个重复博弈中的最终得益,都将是第一阶段的基础上各加-5.因此从第一阶段的选择来看,这个重复博弈与图l中得益矩阵表示的一次性博弈实际上是完全等价的.于是我们可以得出惟一纯策略均衡的有限次重复博弈的结果就是重复原博弈惟一的纯策略纳什均衡,这就是这种重复博弈惟一的子博弈完美纳什均衡路径.如果重复博弈中有多个纯策略纳什均衡,设某一市场有两个生产同样质量产品的厂商,他们对产品的定价同有高(H)、中(M)、低(L)三种可能.设高价时市场总利润为10个单位,中价时市场总利润为6个单位,低价时市场总利润为2个单位.再假设两厂商同时决定价格,价格不等时低价格者独享利润,价格相等时双方平分利润.这时候两厂商对价格的选择就构成了一个静态博弈问题.我们看一个三价博弈的重复博弈的例子:显然,这个得益矩阵有两个纯策略纳什均衡(M,M)和(L,L),我们也可以看出实际上两博弈方最大的得益是策略组合(H,H),但是它并不是纳什均衡.现在考虑重复两次该博弈,我们采用一种触发策略(Trigger Strategy):博弈双方首先试图合作,一旦发觉对方不合作也用不合作相报复的策略.使得在第一阶段采用(H,H)成为子博弈完美纳什均衡,其双方的策略是这样的:博弈方1:第一次选H;如果第一次结果为(H,H),则第二次选M,如果第一次结果为任何其他策略组合,则第二次选择L.博弈方2:同博弈方1.在上述双方策略组合下,两次重复博弈的路径一定为第一阶段(H,H),第二阶段(M,M),这是一个子博弈完美纳什均衡路径.因为第二阶段是一个原博弈的纳什均衡,因此不可能有哪一方愿意单独偏离;其次,第一阶段的(H,H)虽然不是原来的博弈纳什均衡,但是如果一方单独偏离,采用M能增加1单位得益,这样的后果却是第二阶段至少要损失2单位的得益,因为双方采用的是触发策略,即有报复机制的策略,因此合理的选择是坚持H.这就说明了上述策略组合是这个两次重复博弈的子博弈完美纳什均衡.从上述的例子我们可以看出,有多个纯策略纳什均衡的博弈重复两次的子博弈完美纳什均衡路径是,第一阶段采用(H,H),第二阶段采用原博弈的纳什均衡(M,M).如果这个重复博弈重复三次,或者更多次,结论也是相似的,仍然用触发策略,它的子博弈完美纳什均衡路径为除了最后一次以外,每次都采用(H,H),最后一次采用原博弈的纳什均衡(M,M).[编辑]存在纯策略纳什均衡的无限次重复博弈[1]与有限次重复博弈一样,无限次重复博弈也是基本博弈的简单重复,但是无限次重复博弈没有最后一次重复,因此无限次重复博弈与有限次有一些不同.任何博弈中博弈方策略选择的依据都是得益的大小,这在重复博弈中仍然是成立的.但是重复博弈又与一次性博弈有所不同,因为在重复博弈中,每一阶段都是一个博弈,并且各博弈方都有得益,因此对于重复博弈,我们要计算的就是博弈结束时的一个总的得益.由于前一次博弈和后一次博弈之间会有损失,因此我们采用一种方法,就是将后一阶段的得益折算成当前阶段得益的(现在值)的贴现系数δ.有了贴现系数δ,那么在无限次重复博弈中,某博弈方各阶段得益为π1,π2,...,则该博弈方总得益的现在值为:对于存在惟一纯策略纳什均衡博弈的无限次重复博弈,我们从下面的例子来看:其中博弈方1和博弈方2分别表示两个厂商,H 和L分别表示高价和低价.显然,该博弈的一次性博弈有惟一的纯策略纳什均衡(L,L),但是这个纳什均衡并不是最佳策略组合,因为策略组合(H,H)的得益(4,4)比(1,1)要高的多.但是由于(H,H)不是该博弈的纳什均衡,所以在一次性博弈中不会被采用.根据上面的分析,此博弈在有限次重复博弈并不能实现潜在的合作利益,两博弈方在每次重复中都不会采用效率较高的(H,H).为了实现效率较高的合作利益(H,H),假设两博弈方都采用触发策略,也即报复性策略:第一阶段采用H,在第t阶段,如果前t-l阶段的结果都是(H,H),则继续采用L.假设博弈方1已经采用了这种策略,现在我们来确定博弈方2在第一阶段的最优选择.如果博弈方2采用L,那么在第一阶段能得到5,但这样会引起博弈方1一直采用L的报复,自己也只能一直采用L,得益将永远为1,总得益的现在值为如果博弈方2采用H,则在第一阶段他将得4,下一阶段又面临同样的选择.若记V为博弈方2在该重复博弈中每阶段都采用最佳选择的总得益现在值,那么从第二阶段开始的无限次重复博弈因为与从第一阶段开始的只差一阶段,因而在无限次重复时可看作相同的,其总得益的现在值折算成第一阶段的得益为,因此当第一阶段的最佳选择是H时,整个无限次重复博弈总得益的现在值为或者因此,当解得时,博弈方2会采用H策略,否则会采用L策略.也就是说当时,博弈方2对博弈方1触发策略的最佳反应是第一阶段采用H.这时我们就说双方采用上述触发策略是一个纳什均衡.于是我们得出,在有限次重复博弈中,惟一纯策略纳什均衡不能实现最大得益(H,H),而在无限次重复博弈中,通过触发策略却可以实现(H,H)。

第十章 习题答案

第十章  习题答案

第十章 博弈论初步1.什么是纳什均衡?纳什均衡一定是最优的吗?解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。

(2)不一定。

纳什均衡可能是最优的,也可能不是最优的。

例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是最优的;即使在纳什均衡是唯一时,它也可能不是最优的——因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。

2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有几个?为什么?解答:在只有两个参与人(如A 和B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。

例如,当A 与B 的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。

A 的支付矩阵=⎥⎦⎤⎢⎣⎡22211211a a a aB 的支付矩阵=⎥⎦⎤⎢⎣⎡22211211b b b b3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。

试举一例说明。

解答:例如,当参与人A 与B 的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。

A 的支付矩阵= ⎥⎦⎤⎢⎣⎡22211211a a a aB 的支付矩阵=⎥⎦⎤⎢⎣⎡22211211b b b b 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所有的纯策略纳什均衡?解答:可使用条件策略下划线法。

具体步骤如下:首先,设两个参与人分别为左参与人和上参与人,并把整个的支付矩阵分解为这两个参与人的支付矩阵;其次,在左参与人的支付矩阵中,找出每一列的最大者,并在其下划线;再次,在上参与人的支付矩阵中,找出每一行的最大者,并在其下划线;再再次,将已经划好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个支付矩阵;最后,在带有下划线的整个支付矩阵中,找到两个数字之下均划有线的所有的支付组合。

第十章 纳什均衡

第十章 纳什均衡

纳什均衡
甲:不合作是最优的,此时不会改变自己的策略。 条件策略组合(不合作,合作),(不合作,不合
作) 乙:条件策略在不同情况下分别为合作和不合作,
都不会单独改变自己的策略。 (合作,合作)(不合作,不合作)
甲乙都不改变自己的策略,就要求他们的条件策略 应当相同 (不合作,不合作)
嫌犯A
坦白
嫌犯B
坦白
-10 -10
不坦白
-12 -1
不坦白
-1 -12 -2 -2
• 如果两个疑犯都能够选择不坦白的话,他们 将明显地得到一个更大的收益,但由于两人 的信息无法沟通,选择不坦白并不是两人的 理性选择。对于两人而言,不管对方坦白或 是不坦白,自己选择坦白都是更优的选择, 因而,(坦白,坦白)就是均衡战略。
坦白
嫌犯A
坦白
-10 -10
不坦白
-12 -1
不坦白
-1 -12 -2 -2
囚犯困境的占优策略均衡反应了个人理性与团体理性的冲突
(2)囚犯困境模型的扩展应用:寡头厂商合作的不稳定性
卡特尔
寡头A
违约
寡头B
违约
守约
1024 1024
1296 864
守约
864 1296
1152 1152
(3)重复博弈:走出囚徒困境
博弈:多人决策过程
博奕论的基本要素
参与者(博奕方、局中人、对局者):即有哪 些人参与博弈。一般至少有两个参与者。
策略与策略空间:什么人在什么时候行动;当 他行动时,他具有什么样的信息;他能做什么, 不能做什么。
报酬(支付):博弈的结果给参与人带来的好 处。
博弈的类型
(1)合作博弈与不合作博弈 (2)完全信息博弈和不完全信息博弈 (3)静态博弈和动态博弈

博弈10

博弈10

甲 分 乙 不借 不分 (1,0) (0,4) 乙 借 甲 开金矿博弈 分 (2,2) 打 不借 借 甲 分 (2,2) 打 (1,0) 不分 乙 乙 不借
(2,2)
(1,0) 不分 乙 不打
(-1,0)
(0,4)
不打 (0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
(1,0)
有法律保障的开金矿博弈 ——分钱打官司都可信
• 承诺行动
– 改变自己的行动空间 – 改变自己的得益函数
2013-8-7
中南财经政法大学信息学院
19
(一)子博弈(sub-game)
定义:一个扩展式博弈 的子博弈G由一个决策结 和所有该 x 决策结的后续结 ( x(包括终点结)组成, T ) 满足如下条件
(1)x是一个单结信息集的元 素,即h( x ) {x};
2013-8-7 中南财经政法大学信息学院 14
• 动态博弈需要考虑下列问题:
一个博弈可能有多个(甚至无穷多个)纳什均衡,究 竟哪个更合理?
纳什均衡假定每一个博弈方在选择自己的最优策略时 假定所有其他博弈方的策略是给定的,但是如果博弈 方的行动有先有后,后行动者的选择空间依赖于前行 动者的选择,前行动者在选择时不可能不考虑自己的 行动对后行动者的影响。
2013-8-7 中南财经政法大学信息学院 25
例4、设有一扩展式博弈
开发
A
不开发
X
大 小
1/2
X


1/2 1/2 1/2
B
不开发 开发
B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4)
(8,0) (-3,-3)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

平新乔《微观经济学十八讲》第10讲策略性博弈与纳什均衡1 •假设厂商A与厂商B的平均成本与边际成本都是常数,MC A=10, MC B =8,对厂商产出的需求函数是Q D二500 -20 p(1)如果厂商进行Bertrand竞争,在纳什均衡下的市场价格是多少?(2)每个厂商的利润分别为多少?(3)这个均衡是帕累托有效吗?解:(1)如果厂商进行Bertrand竞争,纳什均衡下的市场价格是p B =10 一;,p A =10 , 其中;是一个极小的正数。

理由如下:假设均衡时厂商A和B对产品的定价分别为p A和p B,那么必有p A刃0 , p B K8,即厂商的价格一定要高于产品的平均成本。

其次,达到均衡时,p A和p B都不会严格大于10。

否则,价格高的厂商只需要把自己的价格降得比对手略低,它就可以获得整个市场,从而提高自己的利润。

所以均衡价格一定满足p A空10 , p B・「0。

但是由于p A的下限也是10,所以均衡时P A=10。

给定P A =10 ,厂商B的最优选择是令 P B =10- ;,这里:是一个介于0到2 之间的正数,这时厂商B可以获得整个市场的消费者。

综上可知,均衡时的价格为P A =10 , P B =10 -;。

(2)由于厂商A的价格严格高于厂商B的价格,所以厂商A的销售量为零,从而利润也是零。

下面来确定厂商B的销售量,此时厂商B是市场上的垄断者,它的利润最大化问题为:max pq —cq ①其中p =10 _ q =500 -20 107、把这两个式子代入①式中,得到:max (10 —芯―)500 —20(10 —名卩解得;=0,由于;必须严格大于零,这就意味着;可以取一个任意小的正数,所以厂商B 的利润为:||500-20 10 -; 10-;。

(3)这个结果不是帕累托有效的。

因为厂商B的产品的价格高于它的边际成本,所以如果厂商B和消费者可以为额外1单位的产品协商一个介于8到10一;之间的价格,那么厂商B的利润和消费者的剩余就都可以得到提高,同时又不损害厂商A的剩余(因为A的利润还是零)。

2.(单项选择)在下面的支付矩阵(表10-1 )中,第一个数表示A的支付水平,第二个数表示B的支付水平,a、b、c、d是正的常数。

如果A选择“下”而B选择“右”,那么:(1) b .1 且 d :::1(2)c:::1 且 b :::1(3) b :::1 且 c ::: d(4) b ::: c 且 d :::1(5) a :::1 且 b ::: d【答案】(3)【分析】由于(下,右)是均衡策略,所以给定B选择“右”,“下”是A的最优选择,这就意味着c ::: d ;同样的,给定A选择“下”,“右”也是B的最优选择,这就意味着 b :::1。

3•史密斯与约翰玩数字匹配游戏。

每一个人选择1、2或者3。

如果数字相同,约翰支付给斯密3美元。

如果数字不同,斯密支付给约翰1美元。

(1)描述这个对策的报酬矩阵,并且证明没有纯策略纳什均衡策略组。

(2)如果每一个局中人以1的概率选择每一个数字,证明这个对策的混合策略确实有3一纳什均衡。

这个对策的值是什么?解:(1 )根据题意,构造如下的支付矩阵(表10-2 )(其中每一栏中前一个数字是史密斯的支付,后一个数字是约翰的支付) :表10-2 玩数字匹配游戏的支付矩阵首先由史密斯来选择,假设史密斯选择1,并期望约翰选择1,从而使自己得到3的支付。

但是,如果史密斯选择1,则约翰一定会选择2或者3,从而使自己得到1,而不是-3。

假设约翰选择2,他期望史密斯选择1或者3,以使得自己得到1 ,而实际上史密斯会选择2, 使得约翰得到-3 ,等等。

不断的循环反复,最终也无法达成一个使得双方都能够接受的方案。

因此,这个对策没有一个纯策略纳什均衡。

(2)假设均衡时,约翰选择1、2、3的概率分别为为、X2和1 -为-x2,那么此时史密斯在选择1、2、3之间是没有区别的,即:3X1 - X2 - 1 - X1 - X2 = —X1 ' 3冷-1 - X1 - X2 = —X1 - X2 3 _ x-i - X2 i 从而解得1人=x2 =1 -为-X23类似的方法可以解得史密斯在均衡状态下选择1、2、3的概率分别为1/3。

4.假定世界上氟的整个供给由20个人控制,每一个人拥有这种强有力的矿物10000 克。

世界对氟的需求是Q =1000 T000p其中p 是每克的价格。

(1) 如果所有拥有者合谋控制氟的价格,他们设置的价格是多少?他们能够卖出的量 是多少?(2) 为什么(1)中计算的价格是不稳定的?(3) 通过改变要求保持市场价格的产出,在没有厂商能够获利的意义下存在一个稳定 的均衡时,氟的价格是多少?解:(1 )所有拥有者合谋控制氟的价格,此时总的利润函数为:-1 —Q QV 1000 丿利润最大化的一阶条件为:兰亠丄Q=0dQ 500解得总供应量为Q =500 (克)。

此时p=1・Q =0.5 ,每个厂商的供应量为1000500/20 =25 (克)。

(2) 对第一个厂商而言,给定其他每个厂商的供应量为25克,那么他的利润最大化问题为:525 T max qq 1000根据一阶条件解得:q =262.5可见在其他厂商的供应量为 25克的条件下,厂商 1增加供应量会提高自己的利润。

类 似的结论对市场上的其他厂商也成立,所以合谋是不稳定的。

(3) 题目要求完全竞争市场的均衡结果。

令 p 二MC ,得到氟的价格为零。

市场上的总 供给量为1000克,每个成员的出售量为 50克。

5•在下表所示的策略型博弈(表10-3 )中,找出占优均衡。

答:对于行为人2而言,R 优于M ,所以行为人2将会剔除掉M 策略,只在R 、L 这 两个策略中进行选择; 对于行为人1来说,知道了行为人2会在L 、R 策略中选择,则U 占 优于M 和D 策略。

当行为人2知道行为人1选择了 U 策略时,他则最终会选择 L 策略。

所 以,最终的占优均衡为(U ,L )。

6 •模型化下述划拳博弈:两个老朋友在一起划拳喝酒,每个人有四个纯策略:杆子、 老虎,鸡和虫子。

输赢规则是:杆子降考虎,老虎降鸡,鸡降虫子,虫子降杆子。

两个人 同时出令。

如果一个打败另一个,赢者的效用为1,输者的效用为-1 ;否则,效用均为0。

写出这个博弈的收益矩阵。

这个博弈有纯策略纳什均衡吗?计算出混合策略纳什均衡。

答:(1 )该题的支付矩阵(表 10-4 )为:表10-4 划拳博弈的支付矩阵(2)这是一个零和博弈,没有纯策略纳什均衡。

这是因为:对两个参与者,给定对方策略时,本方的占优策略对应的支付以下划线标注,均衡存在当且仅当在同一栏中出现两个下划线。

由此可知,该博弈没有纯策略纳什均衡。

(3)记游戏者1分别选择各个策略的概率为P i, p2, p3, p/?,游戏者2分别选择各个策当游戏者2分别以概率bqq,® [选择四个策略时,游戏者1的四个策略的收益应该相等(根据同等支付原则):1 业亠I 1 4 = -1 q 1 q3 = -1 q2 1 q4 =1 q i 亠[1 q3又因为q1 *q2 +q3 *q4 二1,可以得到:q =q2 =q3 =q4 =—。

4同理,当对于游戏者1分别以概率fp1,P2,P3, P4 [选择四个策略时,游戏者2的四个策略的收益应该相等(根据同等支付原则):1XP2 +(二尸P4 =(—1 F P1 +仆P3 =(—1〃P2 +仔卩4=1汇P1 +(—1『P3又因为P1 ■ P2 ■P3 ' P4 ",可以得到:P1 二P2 二P3 二P4 = 1。

4因此混合策略纳什均衡为:(q,ff2),其中疔_『 1 1 1 1 )疔一『1 1 1 1〕-■ 1 ,,,, 2 *4 4 4 4 4 4 4 47.巧克力市场上有两个厂商,各自都可以选择去市场的咼端(咼质量),还是去低端(低质量)。

相应的利润由如下收益矩阵(表10-5 )给出:(2)如果各企业的经营者都是保守的,并都采用最大最小化策略,结果如何?(3)合作的结果是什么?(4)哪个厂商从合作的结果中得好处最多?哪个厂商要说服另一个厂商需要给另一个厂商多少好处?解:(1)纳什均衡的结果是(高,低)和(低,高),相应的收益分别为(100,800)和(900,600)。

(2)如果1选择低,则有min [20,900? - _20 ;如果1选择高,则有min [100,50“.; =50。

因此如果1想要最大化它的最小支付,其最优决策为:max [mi n\_20,900?,min [100,50》=max 1-20,50] =50所以1会选择高。

类似的分析表明2也会选择高,因此两个人都采用最大最小策略的均衡结果为(高,高),相应的支付为(50,50)。

(3)如果双方进行合作,那么他们的目标就是总利润最大化,这样最终的结果就是(低,高),相应的支付为(900,600 )。

(4)厂商1从合作的结果中获得的好处多。

为了使得厂商2不选择另外一个纳什均衡(高,低),厂商1应当给厂商2 一笔800—600=200的支付。

&考虑在c,f,g,三个主要汽车生产商之间的博弈。

每一个厂商可以生产要么大型车,要么小型车,但不可同时生产两种型号的车。

即,对于每一个厂商i , i=c, f,g,他的行动集合为Al =[S M,L G >用:・i代表i所选择的行动,「A1,二1「c,J 代表厂商i的利润。

假设,每个厂商的利润函数定义如下:* 三?,如果a j =LG,j =c , f,g ;,如果:j=SM,j =c , f,g ;a,如果& =LG,且a j =SM ,j H i ;:-,如果=SM,且「=LG,j -i ;1 ,如果=:-j =LG,且:-k =SM,j =k=i ;3,如果=:■j =SM,且:・k =LG , j =k=i ;(1)当:> 0时,是否存在纳什均衡?请证明。

(2)当:• •■ - 0时,是否存在纳什均衡?请证明。

证明:该博弈的支付矩阵如表10-6和10-7所示。

表10-6 G汽车厂生产SM型汽车(1)该博弈存在纳什均衡。

首先考虑三家选择的行动相同,那么任一个厂家都将得到数量为的利润。

因为爲=?叮#,所以任何厂商只要选择和其他两个工厂生产不同型号的产品,就可以获得更高的利润,所以三家工厂生产相同的产品不是纳什均衡。

如果三个工厂生产不同的产品,比如说:.c, ]=[SM,LG,SM,因为:£>『■>',所以C厂已经获得了它可能获得的最高利润,因此它不会背叛;给定其他厂商的选择,F厂生产LG型号的汽车只能获得数量为1的利润,高于它生产SM型号的汽车获得的数量为的利润,所以F厂也不会背叛;给定其他厂商的选择,G厂在生产两种型号的汽车之间是没有差异的,因为无论那种情况下,他都只能获得数量为1的利润,所以G厂同样不会背叛。

相关文档
最新文档