子博弈精炼Nash均衡
子博弈精炼纳什均衡非均衡路径极小极大化精炼法
3 极小极大化精炼法
给定纯策略组合 s= (s1, s2, …, sn) 和信息集 h Ζ 对 h 上行动集合 A (h) 中的每个行动 a (h) ,
u i (h) (s (a (h ) )
h,
x
)
,
x
∈h
是一个
n
(h )
维向量,
将其分量按从小到大排序 (相等时任意排序)
后记为
→
u i (h)
(s (a
如果它确定的非均衡路径上每个信息集 h (参与人 i (h) ) 的行动选择 as3 (h) 关于 s3 满足极小极大化准则Ζ
定义 3 (极小极大化理性子博弈精炼纳什均衡) 一个纳什均衡 s3 称为极小极大化理性子博弈精炼 的, 如果它既是子博弈精炼纳什均衡, 又是极小极大化精炼的Ζ
从定义明显地看出, 极小极大化精炼方法是对非均衡路径进行精炼的Ζ 在均衡策略 s3 下, 非均衡路径
博弈论的发展过程中各种重要的基本的均衡解的概念都很难在保证存在性的同时保证唯一性由此产生的均衡多重性问题是博弈论面临的一个难解决均衡多重性问题的主要方法是在一种均衡概念中利用特定的评价准则进一步分辨出其中哪些是较合理的哪些是不太合理的从而从多重解中剔出不甚合理的那些解这种方法被称为均衡的精炼完全信息动态博弈中子博弈精炼纳什均衡就是在纳什均衡中精炼挑选的在每个子博弈上都构成纳什均衡的一种符合序贯理性的均衡但子博弈要求从单结信息集开始且不能分割信息集这种限制使得许多后序博弈部分的策略不能进一步精炼见文中例子部分本文给出的精炼概念与方法试图在所有非均衡路径上对子博弈精炼纳什均衡进一步进行精炼挑选记号考虑的信息集的集合博弈树描述中信息集是一些决策结的集合的纯策略空间si的一个纯策略的支付这是完全信息动态博弈的策略式描述本文再引进如下记号开始的后序博弈这时起点上决策结的数目na极小极大化精炼法给定纯策略组合维向量将其分量按从小到大排序相等时任意排序后记为确定的参与人的支付向量定义极小极大化准则称信息集满足极小极大化准则如果对所有其中表示两向量按字典序比较大小后文同义例如非均衡路径极小极大化纳什均衡一个纳什均衡满足极小极大化准则定义极小极大化理性子博弈精炼纳什均衡一个纳什均衡如果它既是子博弈精炼纳什均衡又是极小极大化精炼的从定义明显地看出极小极大化精炼方法是对非均衡路径进行精炼的在均衡策略非均衡路径上的信息集是不能到达的极小极大化精炼法要求合理的均衡也应该在不能到达的信息集上做出较好的安排子博弈精炼也是要求在各个子博弈上做出最优安排但对子博弈的构成要求过高要求从单结信息集开始极小极大化精炼法在一定程度上弥补了这种不足它精炼的信息集开始的后序博弈可以从多结信息集开始在作优化考虑时虽然信息集未到达但在最坏的情况中安排最好的行动选择不失为一种理性行为下面的命题能够说明这种精炼方法在一定意义下是合乎理性的先引入一个定义的严格优超行动如果对每个都成立向量不等式两向量的分量都按其中某些分量可以取等号但至少有一个严格大于成立记为并且诸向量不等式中至少有一个严格小于成立记为命题设信息集的非均衡路径上则下列事实成立是按从小到大排序的支付向量由于排序后向量间的大小关系不变成立时必有由于子博弈只有原博弈及从参与人左边单结信息集开始的后序博弈显然这两个纳什均衡都是子博弈精炼纳什均衡唯一的纯策略极小极大化理性子博弈精炼纳什均衡事实上参与人然该信息集不
子博弈完美纳什均衡
子博弈完美纳什均衡
“子博弈精炼纳什均衡”的创立者是1994年诺贝尔经济学奖获奖者、莱茵哈德·泽尔腾。
泽尔腾则在60年代中期将纳什均衡概念引入动态分析。
在1965年发表《需求减少条件下寡头垄断模型的对策论描述》一文,提出了“子博弈精炼纳什均衡”的概念,又称“子对策完美纳什均衡”。
这一研究对纳什均衡进行了第一次改进,选择了更具说服力的均衡点。
海萨尼在60年代末把不完全信息引入博弈分析。
子博弈精炼纳什均衡用于区分动态博弈中的"合理纳什均衡"与"不合理纳什均衡",将纳什均衡中包含有不可置信威胁策略的均衡剔除出去,就是说,使最后的均衡中不再包含有不可置信威胁策略的存在。
子博弈精炼纳什均衡坏孩子例题
子博弈精炼纳什均衡坏孩子例题摘要:1.子博弈精炼纳什均衡的概念2.子博弈精炼纳什均衡的创立者3.子博弈精炼纳什均衡的例子4.子博弈精炼纳什均衡的应用正文:一、子博弈精炼纳什均衡的概念子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium)是一种在完全信息动态博弈中求解纳什均衡的方法。
它是由1994 年诺贝尔经济学奖获奖者、莱茵哈德·泽尔腾(Reinhard Selten)在20 世纪60 年代中期提出的。
泽尔腾将纳什均衡概念引入动态分析,为求解动态博弈问题提供了一种有效的工具。
二、子博弈精炼纳什均衡的创立者子博弈精炼纳什均衡的创立者是莱茵哈德·泽尔腾。
他在1965 年发表的《需求减少条件下寡头垄断模型》一文中,首次提出了这一概念。
在此基础上,泽尔腾对动态博弈进行了深入研究,并因此荣获1994 年诺贝尔经济学奖。
三、子博弈精炼纳什均衡的例子为了更好地理解子博弈精炼纳什均衡,我们可以通过一个例子来说明。
假设有两个玩家A 和B,他们要决定是否合作完成一个任务。
任务的完成需要两个玩家的共同努力,如果两人都努力,则任务完成概率高;如果只有一个人努力,则任务完成概率较低。
玩家A 和B 都可以选择努力或不努力。
在这个例子中,子博弈精炼纳什均衡的解为:A 和B 都努力。
这是因为,如果A 努力而B 不努力,那么任务很难完成,A 的收益会受到影响;同样,如果B 努力而A 不努力,任务也很难完成,B 的收益会受到影响。
因此,A 和B 都会选择努力,这样任务才能顺利完成,双方收益最大。
四、子博弈精炼纳什均衡的应用子博弈精炼纳什均衡在经济学、社会学、政治学等领域具有广泛的应用。
例如,在拍卖市场中,竞拍者可以通过子博弈精炼纳什均衡来确定最佳的竞拍策略;在劳资谈判中,雇主和工会可以通过子博弈精炼纳什均衡来达成最有利于双方的协议。
子博弈精炼纳什均衡的基本概念
子博弈精炼纳什均衡的基本概念在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行为,来获得有关先行动者的信息,从而证实或修正自己对先行动者的判断。
完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息。
在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。
而在不完全信息动态博弈中,问题变得更加简单。
博弈开始时,某一参与人既不知道其他参与人的真实类型,也不知道其他参与人所属类型的分布概率。
他只是对这一概率分布有自己的主观判断,即有自己的信念。
博弈开始后,该参与人将根据他所观察到的其他参与人的行为,来修正自己的信念。
并根据这种不断变化的信念,作出自己的战略选择。
动态博弈行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择,因此,为了做最优的行动选择,每个参与人都必须这样思考问题:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?如下棋。
[1]子博弈精炼纳什均衡包含两层含义:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。
子博弈精炼纳什均衡就是要剔除那些只在特定情况下是合理的,而在其他情况下并不合理的行动规则在动态博弈中,参与人的行动有先后顺序,后行动的参与人在自己行动之前就可以观察到先行动者(参与人)的行为,并在此基础上选择相应的策略。
而且,由于先行动者拥有后行动者可能选择策略的完全信息,因而先行动者在选择自己的策略时,就可以预先考虑自己的选择对后行动者选择的影响,并采取相应的对策。
子博弈是指在动态博弈中,所有参与人先后都采取了一次行动后所构成的一组新的博弈,这组博弈中的每一个都称为“子博弈”。
当只当参与人的战略在其子博弈的系列(第二代、第三代…)中,每一个子博弈都构成纳什均衡,就构成了子博弈精练纳什均衡子博弈子博弈(Subgame)[编辑]什么是子博弈子博弈是指在动态博弈中,所有参与人先后都采取了一次行动后所构成的一组新的博弈,这组博弈中的每一个都称为“子博弈”。
博弈论子博弈精炼纳什均衡分析
主讲人:张三
一.问题的提出
进入者的成本
•市场需求
•未来收益
1
2
3
Page 2
二.模型的建立
具有理性的“ 经济人”
信息的完全性
动态博弈过程 各店铺的所有收益支付不单指货币的 收入和支出,但在次均已货币形式表 示。
模型的假设
Page 3
二.模型的建立
假设美食店A考虑是否要在步行街投资10万 元开一家美食店,在做此决定时候衡量的标 准当然是是否有利可图。首先要考虑的因素 就是市场需求是大还是小。另外要考虑的因 素就是其他竞争对手,美食店B。假定B在 知道A决策和市场需求后进行选择是否投资 15万进入市场。 假定在市场上,如果有两家美食店,那么需 求大时,每家美食店每年平均能有30万的收 入,需求小时,每家平均每家美食店只能有 13万的收入;如果只有一家美食店,需求大 时,能有40万的收入,需求小时,只能有 20万的收入。
30,0 0,0
从以上战略式表达中,可以看出这个博弈有两个纯战略纳 什均衡,分别为(进入,{进入,进入}),(进入,{ 进入,不进入})。
四.子博弈精炼模型
结论
(进入,{进入,进入}) 是这个博弈的唯一的子博弈精 炼纳什均衡,我们有理由相信 A进入B进入是这个博弈唯一合 理的均衡结果。 所以,步行街会有很多同种 类型的店铺。
Page 4
二.模型的建立
1.需求大时:A进入,B不进入;A的利润是30万,B的利润 是0 2.需求大时:A不进入,B进入;A的利润是0,B的利润是25 万. 3.需求大时:A进入,B进入;A的利润20万,B的利润是15 万. 4.需求大时:A不进入,B也不进入;各自的利润都是0. 5.需求小时:A进入,B不进入;A的利润是10万,B的利润 是0 6.需求小时:A不进入,B进入;A的利润是0,B的利润是5
子博弈完美Nash均衡
• Again there are two methoidt?s:
– M1 ~ Convert to a normal form
– M2 ~ Deal directly in extensive form
Normal form analysis: How?
– DM1: 3 strategies, L, M, and R
A
Subgames
E -1,-2
F 0,-3 2,-1 1,0
– Subgame perfect equilibrium: No subgame can any player do better by choosing a different strategy
Some examples that is not subgames
C
E -1,-2
F 0,-3 2,-1
DM1 DM2 DM1 DM2 1,0
Subgames and Subgame
Subgames Perfection
– for any non-terminal history h is the part of the game that remains after h occurred.
Q. If DM1 selected L, wthhisaptrsohbloeumld DM2 do?
How about if DM1 selected M or R? • The solution process is backward induction
– Starting from leaf nodes and work backward until the root node is reached, each time solve a simple problem
子博弈精炼Nash均衡
市场开发博弈——市场需求大
Nash均衡:(开发,(不开发,开发))、(开发,(不开发,不 开发))、(不开发,(开发,开发))
企业1
开发
x1
不开发
企业2 开发
x2 不开发
x3 企 业 2
开发
不开发
x4
-4 0 0 ,-4 0 0
x5
2 0 0 ,0
x6
0 ,2 0 0
x7
0 ,0
• 虽然(不开 发,(开发, 开发))和 (开发,(不 开发,不 开发))是Na sh均衡, 但并不是 子博弈精 炼纳什均 衡。
(2)子博弈 ( x 3 )
例2:找出下列博弈的子博弈
1
1
E 3 ,0 x 7
C
2
A x1 B
x2
x4
D 2 ,1
x3 F
1 ,1 x 5
1
x
,2
6
该博弈存在3个子博弈:除了原博弈自己以 外,还存在下面两个子博弈。
2
x2
C
D
1 x3
x5
1 ,1
E
F
x7
3 ,0
x6
1 ,2
1 x3
E
F
x7
3 ,0
• 但是,如果在博弈开始之前,企业2采取某种 行动使自己的支付(或行动空间)发生改变,那 么原来不可置信的威胁就有可能变得可信。
新产品开发博弈的再考察
• 假设企业投入的2000万元中,有1000万元用来 购买研发设备(即固定成本),另外1000万元用 来支付新产品开发中的人力、原材料等投入(即 可变成本)。
• 因为在(B,C)中,包含了参与人2不可置信 的威胁:当参与人1在决策结x1选择A时, 参与人2在决策结选择C。事实上,只要博 弈达到决策结x2,参与人2的理性选择就是 D。
答疑]动态博弈与子博弈精练纳什均衡
我们已经了解了完全信息静态博弈的内容。
这时候,参与人同时行动,或者不同时行动,但是后动的人观察不到先动的人的任何有关其行动的信息,这于同时行动等价。
这时候,任何一个参与人选择行动的时候,没有任何可以依据的信息。
当博弈成为动态的时候,参与人先后行动,后动者可以观察到先动者的行动,因此,后动者选择他的行动的时候,可以依据观察到的信息作选择。
因为先动者可能采取的行动是若干个,所以后动者就有可能观察到同样多的信息。
因此,这时后动者选择的已经不简单的行动,而是一套完整的行动计划——这套行动计划指出,在观察到不同的信息时该怎样随机应变选择自己的行动。
因此,现在后动者的选择变量就是行动计划,我们就把一套完整的行动计划叫做一个策略。
以下图为例,参与人1先动,之后参与人2行动,参与人2可以观察到参与人1的选择。
参与人的选择就是L或者R,这既是他的行动有时他的策略,因为参与人1行动时可能出现的信息只有一种情况——空信息集——因为他先动,这时什么信息也没有。
1行动之后,1的行动可以被2观察,因此2可能观察到的信息就有可能是L或者R,因此,2的行动会根据这些信息作出。
2的一套完整的行动计划应该告诉他,在观察到L时选择什么,观察到R时选择什么,由此我们也可以看出,如果2把行动的选择委托给另外的人,这个人可以根据2的行动计划处理任何可能发生或者面对的形式。
这样,2的行动计划——我们称为策略,就有四种可能:1,观察到L时,选F,观察到R时,选F。
我们用一个有序二维向量(F,F)表示。
2,观察到L时,选F,观察到R时,选C。
我们用一个有序二维向量(F,C)表示。
3,观察到L时,选C,观察到R时,选F。
我们用一个有序二维向量(C,F)表示。
4,观察到L时,选C,观察到R时,选C。
我们用一个有序二维向量(C,C)表示。
总结:参与人1的行动是L或者R,由于是先动,没有信息,所以策略也就是行动。
参与人2的行动是F或者C,由于是后动,有信息,策略是建立在信息上的完整行动——计划,有四个策略:(F,F),(F,C)(C,F)(C,C)。
子博弈精炼纳什均衡+贝叶斯法则+信号博弈
一:子博弈精炼纳什均衡在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。
子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。
即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。
子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。
为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。
譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a 子博弈和图3.6b子博弈。
在静态博弈分析时,我们所说的战略是指参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。
这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。
而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。
这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。
定义3.1:子博弈精炼纳什均衡(SPNE):扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。
如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足:在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。
07-子博弈精炼Nash均衡的应用
• 最优化的一阶条件:
q2
1 2
(a
q1
c)
s2 (q1 )
• 由于1可预测到2将根据s2(q1)选择q2。 所以企业1的利润函数为
Max 1(q1, s2 (q1)) q1 (a q1 s2 (q1) c)
• 由最优化一阶条件得:
q1*
1 2
(a
c)
q2*
s2 (q1* )
1 4
(a
c)
• 均衡结果:(1 (a c), 1 (a c))
2
4
均衡: (q1*, s2 (q1))
此均衡为子博弈精炼Nash均衡。
与Cournot模型的比较
1) 产量
Qs
3 (a 4
c)
Qc
2 3
(a
c)
由此知: Qs>Qc
其中:
Qs1
1 2
人1得到整个蛋糕(即一美元);
2. 给定1,当2 1时,s 0,参与
人2得到整个蛋糕(即一美元);
• 从上述分析可以看到:有绝对耐心的参与 人总可以通过拖延时间使自己独吞整个蛋 糕。
• 这种“耐心优势”在一般情况也成立:给 定其他条件(如参与人的出价次序),越有 耐心的参与人得到的份额越大。
比如说,令1 0.5, 2 0.9,
s1=1- (1- s)
因此博弈的均衡结果为:参 与人1在第一阶段建议
s1=1- (1- s),
参与人2接受该建议。 博弈结束。
第二种情形:
假设参与人的贴现率分别为:1,
。
2
参与人2在第二阶段提出自己的最优建议
s2=1 s
子博弈计算
子博弈计算
子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium,SPNE)是一种均衡策略,它在所有子博弈中都是最优的。
它是纳什均衡的精炼,也就是说,如果一个策略组合是纳什均衡,并且它在所有子博弈中都是最优的,那么它就是子博弈精炼纳什均衡。
在计算子博弈精炼纳什均衡时,需要先确定博弈的子博弈。
子博弈是原博弈的一部分,它包含了原博弈中的某些信息集和行动。
然后,在这些子博弈中,寻找最优的策略组合,使得每个参与者在每个子博弈中都能够获得最优的结果。
具体来说,计算子博弈精炼纳什均衡的步骤如下:
确定博弈的子博弈。
这可以通过分析博弈的信息集和行动来实现。
对于每个子博弈,分别计算每个参与者的最优策略。
这可以通过求解子博弈中的最优策略问题来实现。
如果存在多个最优策略,则需要比较它们的预期收益。
选择预期收益最高的策略作为子博弈精炼纳什均衡。
重复以上步骤,直到所有子博弈都找到最优策略。
需要注意的是,子博弈精炼纳什均衡的计算可能需要较高的计算能力和技巧。
因此,在实际应用中,可能需要借助计算机软件或算法来求解子博弈精炼纳什均衡。
此外,子博弈精炼纳什均衡是一种理想化的均衡概念,它假设每个参与者在每个子博弈中都能够理性地选择最优策略。
但在实际情况下,参与者的行为可能会受到各种因素的影响,使得他们无法总是选择最优策略。
因此,在实际应用中,需要考虑参与者的行为特征和限制,并在此基础上进行均衡分析和计算。
11-完全信息动态博弈(子博弈完美的纳什均衡)
威胁 ---- 事后:B威胁,若A选下,自己选左
• A相信
• A不信
(U,L) (2,9) (D,R) (3,1)
问题:可信性 Credibility
承诺和威胁都是不可信的!
思考:
如何能使承诺和威胁变得可信?
增加撤销承诺或威胁所要受到的损失 让对方知道 “破釜沉舟” & “穷寇莫追”
B
(L,L) U 2, 9 1, 0 (L,R) 2, 9 3, 1 (R,R) 2, 1 3, 1 (R,L) 2, 1 1, 0
A
D
例:动态游戏 - 博弈树
假设:A 先行动,B 后行动
L U
( 2, 9 )
( 2, 1 )
B1
R
A
D
B2
L R
( 1, 0 )
( 3, 1 )
博弈树
game tree
完全信息动态博弈
Subgame Perfect Nash Equilibrium
完全信息动态博弈
序贯博弈问题
动态博弈经典模型 重复博弈与合作问题
§3.1 序贯博弈问题
Sequential Games
强盗分金
答案是:
1号强盗分给 3号1枚金币, 五个强盗抢得100 枚金币,他们决定:
dbackwardbackwardinductioninduction3311均衡路径均衡路径equilibriumpathequilibriumpathspnespne子博弈精炼纳什均衡子博弈精炼纳什均衡seltenselten19651965subgameperfectnashequilibriumsubgameperfectnashequilibrium泽尔腾19651965年发表年发表需求减少条件下寡需求减少条件下寡头垄断模型的对策论描述头垄断模型的对策论描述一文提出了一文提出了子博弈精炼纳什均衡子博弈精炼纳什均衡的概念又称的概念又称子子对策完美纳什均衡对策完美纳什均衡reinhardseltenreinhardselten19301930reinhardseltenreinhardselten子博弈精子博弈精炼纳什均均衡的创立者
第四章第二讲子博弈精炼纳什均衡
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
23
第四节 延伸分析
三、子博弈精炼纳什均衡存在的问题 (二)旅行者困境 2.规则:甲、乙分别写出花瓶价格 索价低者得益:所索低价格+2 索价高者得益:所索低价格-2 索价相同得益:所索取的价格
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
8
第三节
子博弈精炼纳什均衡
二、子博弈精炼纳什均衡 (二)分析 1. (入驻,{容忍,容忍})
子博弈:指向(0, 10)的策略组合— —在位者无单独偏 子博弈:指向( 离激励 1, 5)的策略组合— —在位者无单独偏 离激励
2015年12月6日
与用倒推法求出的结果相2010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡142010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡152010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡16candyjohnjohn121100212010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡172010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡1865464032高价低价高价低价高价低价2010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡192010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡202010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡21残酷的蜈蚣博不结束10不结束02不结束30不结束04不结束50不结束09998不结束9999001000002010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡22三子博弈精炼纳什均衡存在的问题一序贯博弈的问题2
第9章 子博弈精炼Nash均衡的应用
假定:
需求函数: P a (q1 q2 ) 成本: Ci c qi 利润: i (q1, q2 ) qi ( P ci )
Department of Mathematics
Northwest University
可用逆向归纳法求解。 给定q1,求2的最优选择。
Max 2 (q1, q2 ) q2 (a q1 q2 c)
q1 Q1 q2 : Q1 Q2
Department of Mathematics
Northwest University
均衡产出: (q1, q2 (q1 ))
支付: ui (q1, q2 (q1 ))
Department of Mathematics
Northwest University
主要内容: 一、Stackelberg寡头竞争模型 二、Leontief劳资谈判模型 三、关税与国际市场 四、工作竞赛模型 五、投票次序效应
Department of Mathematics
Northwest University
二、Leontief劳资谈判模型
• 考虑Leontief模型。在这个模型中参 与人为工会与雇主,工会决定工资, 雇主决定就业水平。
Department of Mathematics
Northwest University
• 最优化的一阶条件:
1 q2 q2 (q1 ) (a q1 c) 2
Department of Mathematics
Northwest University
• 由于1可预测到:2根据q2(q1)选择q2。 所以
第二部分: 完全信息动态博弈
第九章 子博弈精炼Nash均衡的应用
《博弈论:原理、模型与教程》第章子博弈精炼Nash均衡第节子博弈精炼Nash均衡的求解
《博弈论:原理、模型与教程》第二部分完全信息动态博弈第7章子博弈精炼Nash均衡7.2 子博弈精炼Nash均衡的求解(重点!)(已精细订正!)定义7-1虽然给出了子博弈精炼Nash的定义,但没有说明如何求解子博弈精炼均Nash衡。
下面以图6-8 中扩展式博弈为例,介绍一种最常用的求解子博弈精炼Nash均衡的方法—逆向归纳法。
(讲!)考察图6-8中的博弈。
参与人1在博弈开始时(即在信息集}{)(11x I 上面临两种选择—行动A 和行动B 。
参与人1此时选择哪种行动呢?对于理性的参与人1来讲,只会选择使自己支付最大化的行动。
从图6-8很容易知道参与人1选择行动B 时所得到的支付为2;但是,如果参与人1选择行动A ,则所得支付就要取决于参与人2在信息集}{)(22x I 上的选择,以及博弈达到决策结3x 时参与人1在信息集}{)(31x I 上的选择。
也就是说,参与人1选择行动A 所得支付,取决于子博弈)(2x Γ的结果。
因此,为了确定参与人1在博弈开始时的选择,就必须确定参与人1选择行动A 的所得支付,而为了确定参与人1选择行动A 的所得支付,就必须先求解子博弈)(2x Γ。
如何求解博弈)(2x Γ呢?可以采用同样的方法来求解子博弈)(2x Γ,即在求解子博弈)(3x Γ的基础上,确定参与人2在信息集}{)(22x I 上的选择,从而求解子博弈)(2x Γ。
由以上分析可以得到图6-8中博弈的求解过程:首先求解博弈树中最底层的子博弈)(3x Γ得到子博弈)(3x Γ的结果为(3,0)(即参与人1选择E ); 再求解博弈)(2x Γ,容易得到博弈的结果(1,1)(即参与人2选择D ); 最后求解原博弈,即子博弈)(1x Γ,得到博弈的结果为(2,1)(即参与人1选择B )。
(讲!)考察更一般的情形。
对于图7-6中的博弈树,参与人i 在信息集})({i i x I 选择行动L 还是行动R ,取决于选择行动L 和行动R 所带来的后果。
《博弈论:原理、模型与教程》第07章 子博弈精炼Nash均衡 第01节 子博弈精炼Nash均衡
《博弈论:原理、模型与教程》第二部分完全信息动态博弈第7章子博弈精炼Nash均衡本章将介绍一种新的博弈的解——子博弈精炼Nash均衡,并对子博弈精炼Nash均衡的唯一性、求解方法及存在的不足进行分析。
7.1 子博弈精炼Nash均衡(已精细订正!)对于扩展式博弈,同样可以用Nash均衡作为博弈的解,但是,与Nash均衡作为战略式博弈的解一样,面临着Nash均衡的多重性问题,而且在多个Nash均衡中有些是明显不合理的。
例如,在图6-1中,博弈存在两个Nash 均衡—))((开发开发开发,,和))((不开发开发开发,,,其中均衡))((不开发开发开发,,要求企业2采取战略“企业1开发自己就开发,企业1不开发自己就不开发”。
在“新产品开发博弈”中,如果市场需求大,不管对方是否开发,每个企业都应该选择“开发”(因为只要开发即可盈利)1 。
所以“当企业1开发时,企业2开发”是合理的;但是当“当企业1不开发时,企业2不开发”是不合理了。
所以,均衡))((不开发开发开发,,不是一个关于博弈结果的合理预测。
在图6-6中博弈存在三个Nash 均衡——))((开发不开发开发,,、))((不开发不开发开发,,和))((开发开发不开发,,,但这三个均衡是否都是合理的呢?在“新产品开发博弈”中,如果市场需求小,那么就只能一个企业开发,另一个企业不开发。
问题在于谁选择开发,谁选择不开发。
对于先行动的企业1来讲,只要自己选择“开发”,理性的企业2就只会选择“不开发”2,所以均衡))((开发开发不开发,,是不合理的。
而对于企业2来讲,企业1开发自己当然不应开发,如果企业11参见图1-1.2否则,企业2就会亏本,还不如选择“不开发”。
不开发自己显然应该开发,所以均衡))((不开发不开发开发,,也是不合理的。
因此 ,对于图6-6中的扩展式博弈,合理的Nash 均衡是))((开发不开发开发,,。
(讲!)在图6-8中,博弈存在两个Nash 均衡——)),,(()),,((D F B D E B 和。
子博弈精炼纳什均衡
子博弈精炼纳什均衡●将纳什均衡中包含的不可置信的威胁策略剔除出去。
它要求参与者的决策在任何时点上都是最优的,决策者要“随机应变”,“向前看”,而不是固守旧略。
●由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。
这一点对预测分析是非常有意义的。
与纳什均衡的区别●在纳什均衡中,参与人在选择自己战略时,把其他参与人策略当作给定的,不考虑自己的选择将如何影响对手的策略。
●实际上,当一个人行动在前,另一个人行动在后时,后者自然会根据前者的选择而调整自己的选择,前者在作选择时自然会理性地考虑这一点,所以不可能不考虑自己的选择对其对手选择的影响。
博弈表达的标准型与扩展型●博弈的标准型表达有三个要素:参与人,可选择策略及支付函数。
•两人有限策略博弈的标准型可用一个矩阵表来表示。
●扩展型表达包括五个要素:•(1)参与人;(2)每个参与人选择行动的时点;(3)每个参与人在每次行动时可供选择的行动集合;(4)每个参与人在每次行动时有关对手过去行动选择的信息;(5)支付函数。
市场进入阻挠博弈●假设一个企业A是市场上的唯一供给者,面临企业B可能的竞争威胁。
企业A有两种可选策略,即斗争与默许。
斗争表现为采用降低价格使B的收益为0,默许意味着维持高价格。
企业B也有两种策略:进入或者不进入。
假定进入之前垄断利润为300,进入之后寡头利润共为100(各得50),进入成本是10。
各种策略组合下的支付矩阵如下表:举例分析●该博弈显然有两个纳什均衡,即(进入,高价),(不进入,低价)。
●静态分析方法,得到两个纳什均衡。
分析●给定企业B进入的话,企业A选择高价时得50利润,选择低价时得不到利润,所以最优战略是高价(默许)。
同理,给定企业A高价时,进入策略成为企业B最优选择。
尽管在企业B 选择不进入时,企业A采取任何一种策略都是一样得,但只有当企业A选择低价时,不进入才是企业B的最优选择,所以(不进入,低价)也是一个纳什均衡,而(不进入,高价)不是纳什均衡。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-400,-400 0,200
-400,-400 0, 0
200,0 0,200
200,0 0, 0
• 该博弈存在三个Nash均衡——(开发,(不开发, 开发))、(开发,(不开发,不开发))和(不开发, (开发,开发)),但这三个均衡是否都是合理的 呢?
• 在“新产品开发博弈”中,如果市场需求小, 那么就只能一个企业开发,另一个企业不开发, 问题在于谁选择开发,谁选择不开发。
Nash均衡: (开发,(开发,开发))和(开发,(开发,不开发))
企业1
开发
x1 不 开 发
企业2 x2
x3 企 业 2
开发
不开发 开发 不开发
x4
x5 x6
x7
3 0 0 ,3 0 0 8 0 0 ,0
0 ,8 0 0 0 ,0
• 虽然(开发, (开发,不开 发))是Nash均 衡,但并不 是子博弈精 炼Nash均衡。
开 发 企 业 1
不 开 发
300, 300 0, 800
300, 300 0, 0
800, 0 0, 800
800, 0 0, 0
• 博弈存在两个Nash均衡——(开发,(开发, 开发))和(开发,(开发,不开发)),其中 均衡(开发,(开发,不开发))要求企业2采 取战略“企业1开发自己就开发,企业1 不开发自己也不开发”。
• 作为求解子博弈精炼Nash均衡的方法,逆 推归纳法可以将Nash均衡中的“不可置信 的威胁”剔除掉。
例:
1
C
2
A x1
x2
D
B
1 ,2
0 ,0
2 ,1
A 1
B
2
C
D
0, 0
2, 1
1, 2
1, 2
• 战略组合(A,D)和(B,C)都是Nash均衡,但 是,只有(A,D)为子博弈精炼Nash均衡。
子博弈精炼Nash均衡
主要内容: 一、子博弈精炼Nash均衡 二、子博弈精炼Nash均衡的求解 三、承诺行动与要挟诉讼
一、子博弈精炼Nash均衡
• 博弈论的研究目的是寻找博弈的解。在静 态博弈中我们将Nash均衡作为博弈的解, 但纳什均衡作为博弈的解面临一个很大的 问题——多重性问题。
• 当我们将Nash均衡作为扩展式博弈的解时, 同样也会遇到Nash均衡的多重性问题,而 且在多个Nash均衡中有些是明显不合理的。
(2)子博弈 ( x 3 )
例2:找出下列博弈的子博弈
1
1
E x7
3 ,0
C
2
A x1 B
x2
x4
D 2 ,1
x3 F
1 ,1 x 5
x6
1 ,2
该博弈存在3个子博弈:除了原博弈自己以 外,还存在下面两个子博弈。
2
x2
C
D
1 x3
x5
1 ,1EFra bibliotekFx7
3 ,0
x6
1 ,2
1 x3
E
F
x7
3 ,0
新产品开发博弈
购买
企业2 x0
不购买
企业1
开发
x1
不开发
企业2 开发
x2
x3
不开发 开发
企业2 不开发
开发
企业1 x4 不开发
企业2 开发
x5
x6
不开发 开发
企业2 不开发
-300,-400 -500,200 300,0
-500,0
• 但是,如果在博弈开始之前,企业2采取某种 行动使自己的支付(或行动空间)发生改变,那 么原来不可置信的威胁就有可能变得可信。
新产品开发博弈的再考察
• 假设企业投入的2000万元中,有1000万元用来 购买研发设备(即固定成本),另外1000万元用 来支付新产品开发中的人力、原材料等投入(即 可变成本)。
子博弈的概念
• 子博弈:是原博弈的一部分,它始于原博 弈中一个单结信息集中的决策结x,并由决 策结x及其后续结共同组成。一般用 ( x i )表 示博弈树中始于决策结xi的一个子博弈。
• 注意:1)子博弈可以作为一个独立的博弈 进行分析,并且与原博弈具有相同的信息 结构;2)原博弈可以作为自身的一个子博 弈;
• 因为在(B,C)中,包含了参与人2不可置信 的威胁:当参与人1在决策结x1选择A时, 参与人2在决策结选择C。事实上,只要博 弈达到决策结x2,参与人2的理性选择就是 D。
三、承诺行动与要挟诉讼
• 前面分析的“新产品开发”博弈提到,当市场 需求小时,Nash均衡(不开发,(开发,开发)) 由于含有不可置信的威胁(即企业1选择“开发” 时,企业2仍选择“开发”),而不是子博弈精 炼Nash均衡。
• 解决Nash均衡多重性问题的一种主要方法 就是精炼的方法,即在Nash均衡的基础上, 通过定义更加合理的博弈解并剔除不合理 的均衡。
• Selten在1965年提出的“子博弈精炼Nash均 衡”(subgame perfect Nash equlibrium)的概 念,就是这样一种新的纳什均衡解,我们 首先给出子博弈的定义。
• 由于参与人i选择行动L时使博弈进入了子 博弈Γ(xi+1) ,因此,参与人i选择行动L的结 果就是得到子博弈Γ(xi+1) 。
• 同样,参与人i选择行动R的结果就是得到 子博弈Γ(xi+2) 。
• 所以,参与人i在信息集Ii ({xi})上的最优选 择,取决于参与人i在信息集Ii ({xi})上可能 采取的行动所导致的各个子博弈。
• 在市场需求小的“新产品开发博弈”中, (开发,(不开发,开发))为子博弈精炼Nas h均衡,该均衡不仅在均衡路x径1 x2 x5 上而且在任一非均衡路径上,都能给出参 与人的最优决策。
• Nash均衡(开发,(不开发,不开发))虽然 在均衡路径 x1 x2 x5上给出了参与人的 最优决策,但却包含了参与人在非均衡路 径上的不合理选择:当企业1选择“不开 发”时,企业2也选择“不开发”。
市场开发博弈——市场需求小
子博弈精炼纳什均衡的理解
• 只有当一个战略规定的行动在所有可能 的情况下都为最优时,它才是一个合理 的、可置信的战略。
• 子博弈精炼纳什均衡就是要剔除那些只 在特定情况下合理而在其他情况下并不 合理的行动规则。
二、子博弈精炼Nash均衡的求解
• 逆推归纳法是最常用的求解子博弈精炼 Nash均衡的方法。
• 假设企业提前购买研发设备(即在决定是否开发 之前就购买),可得到一定的优惠,只需900万 元即可。但是如果企业购买了设备而决定“不 开发”,那么所购买的研发设备就只能当“废 品”处理,收回400万元。
考察如下博弈情形:
• 企业1先选择是否开发,企业2观测到企 业1的决策后选择是否开发,但在企业1 决策之前,企业2可以决定是否提前购买 研发设备。
• 再求解子博弈Γ(x2) ,容易得到博弈的结果 为(1,1)(即参与人2选择D);
• 最后求解原博弈即子博弈Γ(x1) ,得到博弈 的结果为(2,1) (即参与人1选择B)。
一般情形:
i
L
xi
R
j
L xi1 R
j
L xi2 R
• 参与人i在信息集Ii ({xi})选择行动L还是行 动R,取决于选择行动L和行动R所引致的 后续结果。
市场开发博弈——市场需求大
Nash均衡:(开发,(不开发,开发))、(开发,(不开发,不 开发))、(不开发,(开发,开发))
企业1
开发
x1
不开发
企业2 开发
x2 不开发
x3 企 业 2
开发
不开发
x4
-4 0 0 ,-4 0 0
x5
2 0 0 ,0
x6
0 ,2 0 0
x7
0 ,0
• 虽然(不开 发,(开发, 开发))和 (开发,(不 开发,不 开发))是Na sh均衡, 但并不是 子博弈精 炼纳什均 衡。
x9
4,1
• 由于子博弈精炼Nash均衡在任一决策结上 都能给出最优决策,这也使得子博弈精炼 纳什均衡不仅在均衡路径(即均衡战略组合 所对应的路径)上给出参与人的最优选择, 而且在非均衡路径(即除均衡路径以外的其 它路径)上也能给出参与人的最优选择。
• 所以,子博弈精炼Nash均衡不会含有参与 人在博弈进程中不合理的、不可置信的行 动。这就是子博弈精炼Nash均衡与Nash均 衡的实质性区别。
• 这意味着,参与人i在信息集Ii ({xi})上的最 优选择,一定是使博弈进入能给自己带来
最大支付的子博弈。
• 因此,为了确定参与人i在信息集Ii ({xi})上 的选择,就必须先求解参与人i在信息集Ii ({xi})上可能采取的行动所导致的各个子博 弈。
• 由以上分析可得求解有限扩展式博弈的 一般步骤:
• 对于先行动的企业1来讲,只要自己选择 “开发”,理性的企业2就只会选择“不 开发” ,所以,均衡(不开发,(开发,开 发))是不合理的。
• 对于企业2来讲,企业1开发自己当然不能 开发,如果企业1不开发自己显然应该开 发。均衡(开发,(不开发,不开发))也是不 合理的。因此,合理的Nash均衡是(开发, (不开发,开发))。
• 逆推归纳法对于完美信息(perfect information)博弈问题尤为适用,但在有些情 形下,对于不完美信息博弈,也能运用 逆推归纳法进行求解。
例:
1
1
E 3 ,0 x 7
C
2
A x1 B
x2
x4
D 2 ,1
x3 F
1 ,1 x 5
1
x
,2
6
由以上分析可以得到博弈的求解过程:
• 首先求解博弈树中最底层的子博弈Γ(x3), 得到子博弈Γ(x3)的结果为(3,0) (即参与人1 选择E);