第7章 子博弈精炼Nash均衡

合集下载

子博弈精炼纳什均衡非均衡路径极小极大化精炼法

子博弈精炼纳什均衡非均衡路径极小极大化精炼法

3 极小极大化精炼法
给定纯策略组合 s= (s1, s2, …, sn) 和信息集 h Ζ 对 h 上行动集合 A (h) 中的每个行动 a (h) ,
u i (h) (s (a (h ) )
h,
x
)
,
x
∈h
是一个
n
(h )
维向量,
将其分量按从小到大排序 (相等时任意排序)
后记为

u i (h)
(s (a
如果它确定的非均衡路径上每个信息集 h (参与人 i (h) ) 的行动选择 as3 (h) 关于 s3 满足极小极大化准则Ζ
定义 3 (极小极大化理性子博弈精炼纳什均衡) 一个纳什均衡 s3 称为极小极大化理性子博弈精炼 的, 如果它既是子博弈精炼纳什均衡, 又是极小极大化精炼的Ζ
从定义明显地看出, 极小极大化精炼方法是对非均衡路径进行精炼的Ζ 在均衡策略 s3 下, 非均衡路径
博弈论的发展过程中各种重要的基本的均衡解的概念都很难在保证存在性的同时保证唯一性由此产生的均衡多重性问题是博弈论面临的一个难解决均衡多重性问题的主要方法是在一种均衡概念中利用特定的评价准则进一步分辨出其中哪些是较合理的哪些是不太合理的从而从多重解中剔出不甚合理的那些解这种方法被称为均衡的精炼完全信息动态博弈中子博弈精炼纳什均衡就是在纳什均衡中精炼挑选的在每个子博弈上都构成纳什均衡的一种符合序贯理性的均衡但子博弈要求从单结信息集开始且不能分割信息集这种限制使得许多后序博弈部分的策略不能进一步精炼见文中例子部分本文给出的精炼概念与方法试图在所有非均衡路径上对子博弈精炼纳什均衡进一步进行精炼挑选记号考虑的信息集的集合博弈树描述中信息集是一些决策结的集合的纯策略空间si的一个纯策略的支付这是完全信息动态博弈的策略式描述本文再引进如下记号开始的后序博弈这时起点上决策结的数目na极小极大化精炼法给定纯策略组合维向量将其分量按从小到大排序相等时任意排序后记为确定的参与人的支付向量定义极小极大化准则称信息集满足极小极大化准则如果对所有其中表示两向量按字典序比较大小后文同义例如非均衡路径极小极大化纳什均衡一个纳什均衡满足极小极大化准则定义极小极大化理性子博弈精炼纳什均衡一个纳什均衡如果它既是子博弈精炼纳什均衡又是极小极大化精炼的从定义明显地看出极小极大化精炼方法是对非均衡路径进行精炼的在均衡策略非均衡路径上的信息集是不能到达的极小极大化精炼法要求合理的均衡也应该在不能到达的信息集上做出较好的安排子博弈精炼也是要求在各个子博弈上做出最优安排但对子博弈的构成要求过高要求从单结信息集开始极小极大化精炼法在一定程度上弥补了这种不足它精炼的信息集开始的后序博弈可以从多结信息集开始在作优化考虑时虽然信息集未到达但在最坏的情况中安排最好的行动选择不失为一种理性行为下面的命题能够说明这种精炼方法在一定意义下是合乎理性的先引入一个定义的严格优超行动如果对每个都成立向量不等式两向量的分量都按其中某些分量可以取等号但至少有一个严格大于成立记为并且诸向量不等式中至少有一个严格小于成立记为命题设信息集的非均衡路径上则下列事实成立是按从小到大排序的支付向量由于排序后向量间的大小关系不变成立时必有由于子博弈只有原博弈及从参与人左边单结信息集开始的后序博弈显然这两个纳什均衡都是子博弈精炼纳什均衡唯一的纯策略极小极大化理性子博弈精炼纳什均衡事实上参与人然该信息集不

子博弈完美纳什均衡

子博弈完美纳什均衡

子博弈完美纳什均衡
“子博弈精炼纳什均衡”的创立者是1994年诺贝尔经济学奖获奖者、莱茵哈德·泽尔腾。

泽尔腾则在60年代中期将纳什均衡概念引入动态分析。

在1965年发表《需求减少条件下寡头垄断模型的对策论描述》一文,提出了“子博弈精炼纳什均衡”的概念,又称“子对策完美纳什均衡”。

这一研究对纳什均衡进行了第一次改进,选择了更具说服力的均衡点。

海萨尼在60年代末把不完全信息引入博弈分析。

子博弈精炼纳什均衡用于区分动态博弈中的"合理纳什均衡"与"不合理纳什均衡",将纳什均衡中包含有不可置信威胁策略的均衡剔除出去,就是说,使最后的均衡中不再包含有不可置信威胁策略的存在。

子博弈完美Nash均衡PPT27页

子博弈完美Nash均衡PPT27页
• 一个Nash均衡称为子博弈完美的,如果它在每 一个子博弈都给出Nash均衡。
子博弈完美Nash均衡
• 行为混合策略:对于扩展型博弈来说,行为混合 策略的概念比上节介绍的混合策略概念更适用。 局中人在他的每一个信息集中按照某个概率分布 随机地选用各个着,就构成他的一个行为混合策 略;也就是说,一个局中人如果有H个信息集, 他的一个行为混合策略就包括H个概率分布。行 为混合策略集合的维数一般低于混合策略集合的 维数。每一个混合策略都存在一个与之等价的行 为混合策略;反之,每一个行为混合策略都存在 一组混合策略与之等价。
子博弈完美Nash均衡
• 有完美信息的扩展型博弈:如果一个扩展型博弈 中的每一个信息集都只包含一个节点,那么就称 它为一个某完美信息的博弈。
• 每一个有完美信息的有限扩展型博弈,都可以用 倒推对纳法算出至少一个纯策略子博弈完美Nash 均衡。
• 关于子博弈完美Nash均衡(SPNE)的存在性和 完美信息博伊德SPNE的算法见附录2。
子博弈完美Nash均衡
子博弈完美Nash均衡
• 我们知道,一个博弈可以有多于一个的Nash均衡。 在某些情况下,我们可以按照“子博弈完美”的 要求,把不符合这个要求的均衡去掉。
• 扩展型博弈G的一部分g叫做一个子博弈,如果g 包含某个节点和它所有的后继点,并且一个G的 信息集或者和g不相交,或者整个含于g。
– Then moving forward from the root to obtain
Example. With a slight variation:
DM1
L
R
DM2
M 2A
• If DM1 selected 2B M or R, DM2
L

子博弈精炼纳什均衡的基本概念

子博弈精炼纳什均衡的基本概念

子博弈精炼纳什均衡的基本概念在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行为,来获得有关先行动者的信息,从而证实或修正自己对先行动者的判断。

完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息。

在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。

而在不完全信息动态博弈中,问题变得更加简单。

博弈开始时,某一参与人既不知道其他参与人的真实类型,也不知道其他参与人所属类型的分布概率。

他只是对这一概率分布有自己的主观判断,即有自己的信念。

博弈开始后,该参与人将根据他所观察到的其他参与人的行为,来修正自己的信念。

并根据这种不断变化的信念,作出自己的战略选择。

动态博弈行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择,因此,为了做最优的行动选择,每个参与人都必须这样思考问题:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?如下棋。

[1]子博弈精炼纳什均衡包含两层含义:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。

子博弈精炼纳什均衡就是要剔除那些只在特定情况下是合理的,而在其他情况下并不合理的行动规则在动态博弈中,参与人的行动有先后顺序,后行动的参与人在自己行动之前就可以观察到先行动者(参与人)的行为,并在此基础上选择相应的策略。

而且,由于先行动者拥有后行动者可能选择策略的完全信息,因而先行动者在选择自己的策略时,就可以预先考虑自己的选择对后行动者选择的影响,并采取相应的对策。

子博弈是指在动态博弈中,所有参与人先后都采取了一次行动后所构成的一组新的博弈,这组博弈中的每一个都称为“子博弈”。

当只当参与人的战略在其子博弈的系列(第二代、第三代…)中,每一个子博弈都构成纳什均衡,就构成了子博弈精练纳什均衡子博弈子博弈(Subgame)[编辑]什么是子博弈子博弈是指在动态博弈中,所有参与人先后都采取了一次行动后所构成的一组新的博弈,这组博弈中的每一个都称为“子博弈”。

博弈论子博弈精炼纳什均衡分析

博弈论子博弈精炼纳什均衡分析
为何步行街会存在很多同类 型的店铺?
主讲人:张三
一.问题的提出
进入者的成本
•市场需求
•未来收益
1
2
3
Page 2
二.模型的建立
具有理性的“ 经济人”
信息的完全性
动态博弈过程 各店铺的所有收益支付不单指货币的 收入和支出,但在次均已货币形式表 示。
模型的假设
Page 3
二.模型的建立
假设美食店A考虑是否要在步行街投资10万 元开一家美食店,在做此决定时候衡量的标 准当然是是否有利可图。首先要考虑的因素 就是市场需求是大还是小。另外要考虑的因 素就是其他竞争对手,美食店B。假定B在 知道A决策和市场需求后进行选择是否投资 15万进入市场。 假定在市场上,如果有两家美食店,那么需 求大时,每家美食店每年平均能有30万的收 入,需求小时,每家平均每家美食店只能有 13万的收入;如果只有一家美食店,需求大 时,能有40万的收入,需求小时,只能有 20万的收入。
30,0 0,0
从以上战略式表达中,可以看出这个博弈有两个纯战略纳 什均衡,分别为(进入,{进入,进入}),(进入,{ 进入,不进入})。
四.子博弈精炼模型
结论
(进入,{进入,进入}) 是这个博弈的唯一的子博弈精 炼纳什均衡,我们有理由相信 A进入B进入是这个博弈唯一合 理的均衡结果。 所以,步行街会有很多同种 类型的店铺。
Page 4
二.模型的建立
1.需求大时:A进入,B不进入;A的利润是30万,B的利润 是0 2.需求大时:A不进入,B进入;A的利润是0,B的利润是25 万. 3.需求大时:A进入,B进入;A的利润20万,B的利润是15 万. 4.需求大时:A不进入,B也不进入;各自的利润都是0. 5.需求小时:A进入,B不进入;A的利润是10万,B的利润 是0 6.需求小时:A不进入,B进入;A的利润是0,B的利润是5

《博弈论:原理、模型与教程》第章子博弈精炼Nash均衡第节子博弈精炼Nash均衡的求解

《博弈论:原理、模型与教程》第章子博弈精炼Nash均衡第节子博弈精炼Nash均衡的求解

《博弈论:原理、模型与教程》第二部分完全信息动态博弈第7章子博弈精炼Nash均衡7.2 子博弈精炼Nash均衡的求解(重点!)(已精细订正!)定义7-1虽然给出了子博弈精炼Nash的定义,但没有说明如何求解子博弈精炼均Nash衡。

下面以图6-8 中扩展式博弈为例,介绍一种最常用的求解子博弈精炼Nash均衡的方法—逆向归纳法。

(讲!)考察图6-8中的博弈。

参与人1在博弈开始时(即在信息集}{)(11x I 上面临两种选择—行动A 和行动B 。

参与人1此时选择哪种行动呢?对于理性的参与人1来讲,只会选择使自己支付最大化的行动。

从图6-8很容易知道参与人1选择行动B 时所得到的支付为2;但是,如果参与人1选择行动A ,则所得支付就要取决于参与人2在信息集}{)(22x I 上的选择,以及博弈达到决策结3x 时参与人1在信息集}{)(31x I 上的选择。

也就是说,参与人1选择行动A 所得支付,取决于子博弈)(2x Γ的结果。

因此,为了确定参与人1在博弈开始时的选择,就必须确定参与人1选择行动A 的所得支付,而为了确定参与人1选择行动A 的所得支付,就必须先求解子博弈)(2x Γ。

如何求解博弈)(2x Γ呢?可以采用同样的方法来求解子博弈)(2x Γ,即在求解子博弈)(3x Γ的基础上,确定参与人2在信息集}{)(22x I 上的选择,从而求解子博弈)(2x Γ。

由以上分析可以得到图6-8中博弈的求解过程:首先求解博弈树中最底层的子博弈)(3x Γ得到子博弈)(3x Γ的结果为(3,0)(即参与人1选择E ); 再求解博弈)(2x Γ,容易得到博弈的结果(1,1)(即参与人2选择D ); 最后求解原博弈,即子博弈)(1x Γ,得到博弈的结果为(2,1)(即参与人1选择B )。

(讲!)考察更一般的情形。

对于图7-6中的博弈树,参与人i 在信息集})({i i x I 选择行动L 还是行动R ,取决于选择行动L 和行动R 所带来的后果。

《博弈论:原理、模型与教程》第07章子博弈精炼Nash均衡第01节子博弈精炼Nash均衡

《博弈论:原理、模型与教程》第07章子博弈精炼Nash均衡第01节子博弈精炼Nash均衡
例如,对于图6-1中的扩展式博弈,子博弈 和 的Nash的均衡为企业2选择“开发”,所以原博弈的Nash 对所有的子博弈(包括原博弈)构成Nash均衡,因此 是子博弈精炼Nash均衡。由于 对子博弈 没有给出Nash均衡,因此虽然 是Nash均衡,但并不是子博弈精炼Nash均衡。
再例如,对于图6-6中的扩展式博弈,子博弈 的Nash 均衡为企业2选择“不开发”,子博弈 的Nash均衡为企业2的选择“开发”,所以原博弈的Nash均衡 是子博弈精炼Nash 均衡。由于 和 分别对子博弈 和 没有给出Nash均衡 ,因此虽然 和 是Nash均衡,但并不是子博弈精炼Nash均衡。
定义7-1扩展式博弈的战略组合 是一个子博弈精炼Nash均衡,当且仅当满足以下条件:
(1)它是原博弈的Nash均衡;
(2)它在每一个子博弈上给出(或构成)Nash均衡.
上述定义意味着:一个战略组合是子博弈精炼Nash均衡当且仅当它对所有的子博弈(包括原博弈)构成Nash均衡,同时也意味着原博弈的Nash均衡并不一定是子博弈精炼Nash均衡,除非它还对所有子博弈构成Nash均衡。
(讲!)
子博弈的表示
在以后的讨论中,为了叙述方便,用 表示博弈树中开始于决策结 的子博弈。例如,对于图6-8中的博弈树, 比表示开始于决策结 的子博弈,如图7-2(a)所示; 表示开始于决策结 的子博弈,如图7-2(b)所示;而 表示开始于决策结 的子博弈,即原博弈,如图6-8所示。
下面给出子博弈精炼Nash均衡的定义。
在给出子博弈精炼Nash均衡的正式定义之前,需要介绍“子博弈”这个概念。
所谓“子博弈”,就是原博弈的一部分,它始于原博弈中一个位于单结信息中的决策结 ,并由决策结 及其后续结共同组成。
子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

一:子博弈精炼纳什均衡在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。

子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。

即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。

子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。

为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。

譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a 子博弈和图3.6b子博弈。

在静态博弈分析时,我们所说的战略是指参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。

这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。

而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。

这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。

定义3.1:子博弈精炼纳什均衡(SPNE):扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。

如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足:在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。

用逆向归纳法求解子博弈精炼纳什均衡_博弈论与信息经济学--PBL教程_[共2页]

用逆向归纳法求解子博弈精炼纳什均衡_博弈论与信息经济学--PBL教程_[共2页]

博弈论与信息经济学︱︱P B L 教程发,{开发,开发})不是一个子博弈精炼纳什均衡;类似地,纳什均衡(开发,{不开发,不开发})中B的均衡战略{不开发,不开发}在子博弈Ⅰ上构成纳什均衡,但在子博弈Ⅱ上不构成纳什均衡,因此,(开发,{不开发,不开发})也不是一个子博弈精炼纳什均衡。

与上述两个纳什均衡不同,纳什均衡(开发,{不开发,开发})中B的均衡战略{不开发,开发}无论在子博弈Ⅰ上还是在子博弈Ⅱ上都构成纳什均衡(即如果A开发,B不开发;如果A不开发,B开发),因此,(开发,{不开发,开发})是这个博弈的唯一的子博弈精炼纳什均衡。

我们有理由相信“A开发,B不开发”是这个博弈唯一合理的均衡结果。

对如图3.14(a)所示的博弈,这个博弈有两个子博弈(参与人2的决策结开始一个子博弈),纳什均衡(U, R)不是精炼均衡,因为在从2的决策结开始的子博弈上,R不是一个均衡,而纳什均衡(D, L)是一个精炼均衡:当l选择D博弈进入2的决策结时,2选择L得到1单位的支付,选择R得到0单位的支付,因此,2将选择L。

3.3.3 用逆向归纳法求解子博弈精炼纳什均衡【逆向归纳法思维:生活中的例子】有一位青年人问一位老爷爷:“请问您高寿几何。

”老爷爷笑呵呵地说:“我这个人喜欢动脑筋,让我出道题考考你吧!把我年龄加上12,再除以4,然后减去15,再乘以10,恰好是100岁,你说我多大了。

”不知为什么,这位青年被难住了,想了好一会都没有说出答案。

这时,从围观的人群中传来一个小男孩大声的回答:“用100除以10,再加15乘4,最后减去12,就是88岁!”老爷爷听了他的话,哈哈大笑说道:“不错,我正是88岁。

”这个小孩用的就是逆向归纳法思维:倒推法,这也是博弈求解的一种重要方法。

其实,每个人在自己的小学时代都曾用过这种方法来解数学题,只是成年以后反倒很少将这种思维方法抽象出来,作为自己分析和解决问题的一种思路了。

对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。

07-子博弈精炼Nash均衡的应用

07-子博弈精炼Nash均衡的应用
Max 2(q1, q2) q2 (a q1 q2 c)
• 最优化的一阶条件:
q2
1 2
(a
q1
c)
s2 (q1 )
• 由于1可预测到2将根据s2(q1)选择q2。 所以企业1的利润函数为
Max 1(q1, s2 (q1)) q1 (a q1 s2 (q1) c)
• 由最优化一阶条件得:
q1*
1 2
(a
c)
q2*
s2 (q1* )
1 4
(a
c)
• 均衡结果:(1 (a c), 1 (a c))
2
4
均衡: (q1*, s2 (q1))
此均衡为子博弈精炼Nash均衡。
与Cournot模型的比较
1) 产量
Qs
3 (a 4
c)
Qc
2 3
(a
c)
由此知: Qs>Qc
其中:
Qs1
1 2
人1得到整个蛋糕(即一美元);
2. 给定1,当2 1时,s 0,参与
人2得到整个蛋糕(即一美元);
• 从上述分析可以看到:有绝对耐心的参与 人总可以通过拖延时间使自己独吞整个蛋 糕。
• 这种“耐心优势”在一般情况也成立:给 定其他条件(如参与人的出价次序),越有 耐心的参与人得到的份额越大。
比如说,令1 0.5, 2 0.9,
s1=1- (1- s)
因此博弈的均衡结果为:参 与人1在第一阶段建议
s1=1- (1- s),
参与人2接受该建议。 博弈结束。
第二种情形:
假设参与人的贴现率分别为:1,

2
参与人2在第二阶段提出自己的最优建议
s2=1 s

子博弈计算

子博弈计算

子博弈计算
子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium,SPNE)是一种均衡策略,它在所有子博弈中都是最优的。

它是纳什均衡的精炼,也就是说,如果一个策略组合是纳什均衡,并且它在所有子博弈中都是最优的,那么它就是子博弈精炼纳什均衡。

在计算子博弈精炼纳什均衡时,需要先确定博弈的子博弈。

子博弈是原博弈的一部分,它包含了原博弈中的某些信息集和行动。

然后,在这些子博弈中,寻找最优的策略组合,使得每个参与者在每个子博弈中都能够获得最优的结果。

具体来说,计算子博弈精炼纳什均衡的步骤如下:
确定博弈的子博弈。

这可以通过分析博弈的信息集和行动来实现。

对于每个子博弈,分别计算每个参与者的最优策略。

这可以通过求解子博弈中的最优策略问题来实现。

如果存在多个最优策略,则需要比较它们的预期收益。

选择预期收益最高的策略作为子博弈精炼纳什均衡。

重复以上步骤,直到所有子博弈都找到最优策略。

需要注意的是,子博弈精炼纳什均衡的计算可能需要较高的计算能力和技巧。

因此,在实际应用中,可能需要借助计算机软件或算法来求解子博弈精炼纳什均衡。

此外,子博弈精炼纳什均衡是一种理想化的均衡概念,它假设每个参与者在每个子博弈中都能够理性地选择最优策略。

但在实际情况下,参与者的行为可能会受到各种因素的影响,使得他们无法总是选择最优策略。

因此,在实际应用中,需要考虑参与者的行为特征和限制,并在此基础上进行均衡分析和计算。

子博弈精炼纳什均衡名词解释

子博弈精炼纳什均衡名词解释

子博弈精炼纳什均衡名词解释嘿,朋友们!今天咱来聊聊子博弈精炼纳什均衡这个听起来有点高大上的玩意儿。

你看啊,这就好比是一场复杂的游戏。

在这个游戏里,每个人都有自己的策略和选择。

子博弈精炼纳什均衡呢,就是在这个游戏中的某个局部,大家都找到了一个最佳的玩法,谁也不愿意轻易改变。

咱可以想象一下,一群人在玩扑克牌,每个人都在算计着怎么出牌才能赢。

在某个特定的局面下,大家都形成了一种默契,都按照某种特定的方式出牌,因为这样对自己最有利呀。

这就是一种子博弈精炼纳什均衡。

它可不是随随便便就能达到的哦!就像爬山一样,得一步一步找到最合适的路径。

在这个过程中,大家都得不断地思考、算计,权衡各种利弊。

而且啊,它还很稳定呢,一旦达到了,就不太容易被打破。

比如说在商业竞争中,几家公司在市场上争斗。

他们会根据对手的行动来调整自己的策略,直到找到一个大家都觉得不错的状态,这其实就是一种子博弈精炼纳什均衡啦。

再想想下棋,每一步棋都是在追求一种平衡和最优解。

高手下棋的时候,不就是在寻找那个子博弈精炼纳什均衡嘛!他们可不会瞎走,都是深思熟虑的呀。

那这个子博弈精炼纳什均衡有啥用呢?用处可大啦!它能帮我们更好地理解人与人之间的互动和竞争。

知道了这个,我们就能在各种情况下做出更明智的选择。

比如说在谈判的时候,如果你能理解对方的策略,找到那个子博弈精炼纳什均衡,不就能更好地达成自己的目的了嘛!在团队合作中也是一样,大家找到共同的最优策略,工作就能更顺利地进行呀。

总之,子博弈精炼纳什均衡就像是一个隐藏在各种复杂局面背后的秘密武器。

只要我们能发现它、理解它、运用它,就能在生活和工作中更加得心应手。

难道不是吗?所以啊,大家可得好好琢磨琢磨这个有趣的概念哦!。

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

子博弈精炼纳什均衡+贝叶斯法则+信号博弈一:子博弈精炼纳什均衡在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。

子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。

即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。

子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。

为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。

譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a子博弈和图3.6b子博弈。

在静态博弈分析时,我们所说的战略是指参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。

这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。

而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。

这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。

定义3.1:子博弈精炼纳什均衡(SPNE):扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。

子博弈精炼纳什均衡坏孩子例题

子博弈精炼纳什均衡坏孩子例题

子博弈精炼纳什均衡坏孩子例题
(最新版)
目录
1.子博弈精炼纳什均衡的概述
2.子博弈精炼纳什均衡的创立者
3.子博弈精炼纳什均衡的应用案例
4.子博弈精炼纳什均衡的结论
正文
一、子博弈精炼纳什均衡的概述
子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium)是一种在完全信息动态博弈中求解的纳什均衡。

它是由 1994 年诺贝尔经济学奖获奖者、莱茵哈德·泽尔腾(Reinhard Selten)在 20 世纪 60 年代中期引入动态分析的概念,并进一步完善的。

子博弈精炼纳什均衡用于分析一个博弈过程中,在给定其他参与者策略的情况下,一个参与者的最佳策略选择。

二、子博弈精炼纳什均衡的创立者
子博弈精炼纳什均衡的创立者是莱茵哈德·泽尔腾。

他在 1965 年发表的《需求减少条件下寡头垄断模型》一文中,首次将纳什均衡概念引入动态分析,并在此基础上提出了子博弈精炼纳什均衡的概念。

三、子博弈精炼纳什均衡的应用案例
子博弈精炼纳什均衡在许多经济学领域都有广泛应用,例如在寡头垄断市场中,企业间通过价格博弈来竞争市场份额。

在这个过程中,企业需要考虑到其他企业的策略选择,以便找到自己的最佳策略。

通过运用子博弈精炼纳什均衡,可以更好地分析和解释这些经济现象。

四、子博弈精炼纳什均衡的结论
总的来说,子博弈精炼纳什均衡是一种重要的纳什均衡概念,它可以帮助我们在完全信息动态博弈中找到参与者的最佳策略。

《博弈论:原理、模型与教程》第07章 子博弈精炼Nash均衡 第01节 子博弈精炼Nash均衡

《博弈论:原理、模型与教程》第07章  子博弈精炼Nash均衡  第01节  子博弈精炼Nash均衡

《博弈论:原理、模型与教程》第二部分完全信息动态博弈第7章子博弈精炼Nash均衡本章将介绍一种新的博弈的解——子博弈精炼Nash均衡,并对子博弈精炼Nash均衡的唯一性、求解方法及存在的不足进行分析。

7.1 子博弈精炼Nash均衡(已精细订正!)对于扩展式博弈,同样可以用Nash均衡作为博弈的解,但是,与Nash均衡作为战略式博弈的解一样,面临着Nash均衡的多重性问题,而且在多个Nash均衡中有些是明显不合理的。

例如,在图6-1中,博弈存在两个Nash 均衡—))((开发开发开发,,和))((不开发开发开发,,,其中均衡))((不开发开发开发,,要求企业2采取战略“企业1开发自己就开发,企业1不开发自己就不开发”。

在“新产品开发博弈”中,如果市场需求大,不管对方是否开发,每个企业都应该选择“开发”(因为只要开发即可盈利)1 。

所以“当企业1开发时,企业2开发”是合理的;但是当“当企业1不开发时,企业2不开发”是不合理了。

所以,均衡))((不开发开发开发,,不是一个关于博弈结果的合理预测。

在图6-6中博弈存在三个Nash 均衡——))((开发不开发开发,,、))((不开发不开发开发,,和))((开发开发不开发,,,但这三个均衡是否都是合理的呢?在“新产品开发博弈”中,如果市场需求小,那么就只能一个企业开发,另一个企业不开发。

问题在于谁选择开发,谁选择不开发。

对于先行动的企业1来讲,只要自己选择“开发”,理性的企业2就只会选择“不开发”2,所以均衡))((开发开发不开发,,是不合理的。

而对于企业2来讲,企业1开发自己当然不应开发,如果企业11参见图1-1.2否则,企业2就会亏本,还不如选择“不开发”。

不开发自己显然应该开发,所以均衡))((不开发不开发开发,,也是不合理的。

因此 ,对于图6-6中的扩展式博弈,合理的Nash 均衡是))((开发不开发开发,,。

(讲!)在图6-8中,博弈存在两个Nash 均衡——)),,(()),,((D F B D E B 和。

子博弈精炼纳什均衡

子博弈精炼纳什均衡

子博弈精炼纳什均衡●将纳什均衡中包含的不可置信的威胁策略剔除出去。

它要求参与者的决策在任何时点上都是最优的,决策者要“随机应变”,“向前看”,而不是固守旧略。

●由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。

这一点对预测分析是非常有意义的。

与纳什均衡的区别●在纳什均衡中,参与人在选择自己战略时,把其他参与人策略当作给定的,不考虑自己的选择将如何影响对手的策略。

●实际上,当一个人行动在前,另一个人行动在后时,后者自然会根据前者的选择而调整自己的选择,前者在作选择时自然会理性地考虑这一点,所以不可能不考虑自己的选择对其对手选择的影响。

博弈表达的标准型与扩展型●博弈的标准型表达有三个要素:参与人,可选择策略及支付函数。

•两人有限策略博弈的标准型可用一个矩阵表来表示。

●扩展型表达包括五个要素:•(1)参与人;(2)每个参与人选择行动的时点;(3)每个参与人在每次行动时可供选择的行动集合;(4)每个参与人在每次行动时有关对手过去行动选择的信息;(5)支付函数。

市场进入阻挠博弈●假设一个企业A是市场上的唯一供给者,面临企业B可能的竞争威胁。

企业A有两种可选策略,即斗争与默许。

斗争表现为采用降低价格使B的收益为0,默许意味着维持高价格。

企业B也有两种策略:进入或者不进入。

假定进入之前垄断利润为300,进入之后寡头利润共为100(各得50),进入成本是10。

各种策略组合下的支付矩阵如下表:举例分析●该博弈显然有两个纳什均衡,即(进入,高价),(不进入,低价)。

●静态分析方法,得到两个纳什均衡。

分析●给定企业B进入的话,企业A选择高价时得50利润,选择低价时得不到利润,所以最优战略是高价(默许)。

同理,给定企业A高价时,进入策略成为企业B最优选择。

尽管在企业B 选择不进入时,企业A采取任何一种策略都是一样得,但只有当企业A选择低价时,不进入才是企业B的最优选择,所以(不进入,低价)也是一个纳什均衡,而(不进入,高价)不是纳什均衡。

博弈论精品课件 (7)

博弈论精品课件 (7)
以下条件 的战略与信念构成: (3) 参与人在均衡路径信息集上的信念设定 应满足与战略一致性原则,即通过贝叶 斯法则与参与人的均衡战略来确定; (4) 参与人在非均衡路径信息集上的信念设 定应满足结构一致性原则,即通过贝叶 斯法则和参与人可能的均衡战略来确定。
1 2
共同信念
• 指所有参与人在任一信息集(包括给定战 略下能够到达的信息集与未能到达的信 息集)上的信念相同。
精炼贝叶斯Nash均衡
主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较
• 精炼贝叶斯Nash均衡是Selten子博弈精炼 Nash均衡的“均衡精炼”的思想,在不 完全信息扩展式博弈中的自然推广。
R
L
R L
2
R L
R L
2
R
L
R
x p (t1 L)
1 p1 p1 1 p1 1 p2 1 p3 p1 p2 p3
1 p2 p2 1 p1 1 p2 1 p3 p1 p2 p3 1 p3 p3 1 x x p (t3 L) 1 p1 1 p2 1 p3 p1 p2 p3 x p (t2 L)
精炼贝叶斯Nash均衡
主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较
精炼贝叶斯Nash均衡
主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较
• 在完全信息动态博弈中,假设s*为一子博 弈精炼Nash均衡,那么在参与人采用均 衡战略s*的情况下,不管博弈的进程如何 或是否发生,每个参与人的战略对从任 一决策结开始的子博弈(或在其后轮着他 采取的行动)都是最优的。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Department of Mathematics
Northwest University
分配博弈的扩展式描述 为:
1
A
2 2
B Y
1,1
C
2
Y
2,0
N
0,0
N
0,0
Y
0,2
N
0,0
• • ห้องสมุดไป่ตู้ • •
A表示“参与人1得2件物品,参与人2得0件物品”分配方案, B表示“两个参与人各得1件物品”分配方案, C表示“参与人1得0件物品,参与人2得2件物品”分配方案 ; Y表示参与人2接受参与人1的分配方案, N表示参与人2拒绝参与人1的分配方案 。
• 虽然(开发,(开发,不开发))是Nash均衡, 但并不是子博弈精炼Nash均衡。
企业2 ( 开 发 , 开 发 ) ( 开 发 , 不 开 发 )( 不 开 发 , 开 发 ) 不 开 发 , 不 开 发 ) ( 开发 企业1 不开发 300, 300 0, 800 300, 300 0, 0 800, 0 0, 800 800, 0 0, 0
• 如何解决Nash均衡的多重性问题,人们 已做了很多探讨,如前面我们讨论过的 “焦点效应”、相关均衡等等,但这些 方法都是一些非规范式的方法,需要结 合具体的博弈问题,剔除不合理的Nash 均衡。
Department of Mathematics
Northwest University
一、子博弈精炼Nash均衡
Department of Mathematics
Northwest University
• 在分配博弈中,参与人1有三个战略—— 战略A、B和C,参与人2有8个战略—— 战略(Y,Y,Y)、(Y,Y,N)、(Y,N,Y)、(N,Y,Y)、 (Y,N,N)、(N,Y,N)、(N,N,Y)和(N,N,N)。
• 虽然(不开发,(开发,开发))和(开发,(不开发, 不开发))是Nash均衡,但前者说明企业2任何时 候都开发,并不是子博弈精炼Nash均衡,后者 同理。因此,它们不是子博弈精炼Nash均衡。
企业2 ( 开 发 , 开 发 ) ( 开 发 , 不 开 发 )( 不 开 发 , 开 发 ) 不 开 发 , 不 开 发 ) ( 开发 企业1 不开发 -400,-400 0,200 -400,-400 0, 0 200,0 0,200 200,0 0, 0
该博弈存在3个子博弈:除了原博弈自己以 外,还存在下面两个子博弈。
2
2
L
x4
x2
3
R
x5
L
x6
x3
3
R
x7
L
R
L
R
L
R
L
R
(1)子博弈 ( x2 ) 从x4往下的部分是否是子博弈?
Department of Mathematics
(2)子博弈 ( x3 )
第二部分: 完全信息动态博弈
第七章 子博弈精炼Nash均衡
主要内容: 一、子博弈精炼Nash均衡 二、子博弈精炼Nash均衡的求解 三、承诺行动与要挟诉讼 四、子博弈精炼Nash均衡的合理性讨论 五、子博弈精炼Nash均衡的惟一性讨论
第七章 子博弈精炼Nash均衡
主要内容: 一、子博弈精炼Nash均衡 二、子博弈精炼Nash均衡的求解 三、承诺行动与要挟诉讼 四、子博弈精炼Nash均衡的合理性讨论 五、子博弈精炼Nash均衡的惟一性讨论
Department of Mathematics
Northwest University
例子:找出下列博弈的子博弈。
1
L
2
x1
R
2
L
x4
x2
3
R
x5 x6
L
x3
3
R
x7
L
R
L
R L
R
L
R
Department of Mathematics
Northwest University
企业1 开发 企业2 开发
x1
不开发
x2
不开发 开发
x3 企业2
不开发
x4
说明:企业1开发,企业2开发
x5
x6
0,800
x7
0,0
300,300 800,0
企业2
(开发,开发) (开发,不开发) (不开发,开发) (不开发,不开发)
企业1
开发
300,300
300,300
800,0
800,0
不开发
0,800
Department of Mathematics
Northwest University
例子:
开发 企业2 开发
企业1
x1
不开发
x2
不开发 开发
x3 企业2
不开发
x4
x5
x6
0,800
x7
0,0
300,300 800,0
Department of Mathematics
Northwest University
Department of Mathematics
Northwest University
例子:新产品开发博弈
企业1 开发 企业2 开发
x1
不开发
x2
不开发 开发
x3 企业2
不开发
x4
-400,-400
x5
200,0
x6
0,200
0,0
x7
Department of Mathematics
Northwest University
0,0
0,800
0,0
Department of Mathematics
Northwest University
上述均衡说明了企业2如果观察到企业1开发, 则自己就开发,隐含了企业2如果观察到企业1不开 发,则自己就不开发。
当新产品开发的市场需求大时,不管对方是否 开发,每个企业都应该选择开发(因为只要开 发就盈利)
Department of Mathematics
Northwest University
考察下面的分配博弈问题:
• 两人使用下列过程去分配两个相同的不 可分割的物品:他们中的某一个人提出 一种分配方式,另一个人可能接受也可 能拒绝。如果拒绝,两人都得不到任何 东西。假设每个人仅关心所得的物品数 量。
Northwest University
该博弈存在两个Nash均衡——((B,E),D)和 ((B,F),D)。
• 当参与人1在信息集 I1 ({x1}) 采取行动B时,博 弈结束。但是,作为参与人1的战略必须告诉 参与人1,如果他在信息集 I1 ({x3}) 上他应如 何选择? • 显然,如果轮到参与人1在信息集 I1 ({x3}) 上 决策,他的最优选择为行动E。所以,均衡是 不合理的((B,F),D) 。
当新产品开发的市场需求小时,只能一个企业开 发,另一个企业不开发,于是,应该的情况是:理 性的企业2观察到企业1开发,则自己就不开发,但 是,如果观察到企业1不开发,则自己就开发,这显 然是不合理的。
均衡(不开发,(开发,开发)):隐含了不论企业1 是否开发,企业2都会选择开发。仍有其不合理性。
Department of Mathematics Northwest University
• 我们知道Nash均衡是一个静态均衡, 将Nash均衡作为扩展式博弈的解同样 会遇到Nash均衡的多重性问题,而且 在多个Nash均衡中有些是明显不合理 的。
Department of Mathematics
Northwest University
• 除了非规范式的方法以外,解决Nash均 衡的多重性问题的一种主要方法就是精 炼的方法,即从博弈解的定义入手,在 Nash均衡的基础上,通过定义更加精炼 的博弈解剔除Nash均衡中不合理的均衡。
Department of Mathematics
Northwest University
• 博弈论的研究目的就是寻找博弈问题的 解。到目前为止人们主要是将Nash均衡 作为博弈的解,但Nash均衡作为博弈的 解面临一个很大的问题——多重性问题。
Department of Mathematics
Northwest University
Department of Mathematics
Northwest University
• Selten在1965年提出的“子博弈精炼Nash 均衡”(subgame perfect Nash equlibrium) 的概念,就是这样一种新的博弈解。子 博弈精炼Nash均衡不仅在一定程度上解 决了Nash均衡的不足,而且对完全信息 的动态博弈问题尤为适用。
Department of Mathematics
Northwest University
• 博弈的Nash均衡为:(A,(Y,Y,Y))、(A,(Y,Y,N))、 (A,(Y,N,Y))、(A,(Y,N,N))、(A,(N,N,Y))、(A,(N,N, N))、(B,(N,Y,Y))、(B,(N,Y,N))、(C,(N,N,Y))。
Department of Mathematics
Northwest University
• 子博弈可以作为一个独立的博弈进行分 析,并且与原博弈具有相同的信息结构。
Department of Mathematics
Northwest University
• 为了叙述方便,用 ( xi ) 表示博弈树中开 始于决策结的子博弈。
* * s* (s1 ,..., sn )
Department of Mathematics
Northwest University
相关文档
最新文档