第四章第二讲子博弈精炼纳什均衡
子博弈纳什均衡
子博弈纳什均衡
《子博弈纳什均衡》是一种博弈理论,它是由美国数学家纳什提出的。
它的核心思想是,博弈双方应该通过分析双方的策略,使双方的利益最大化,从而达到一个均衡点。
这种均衡点又被称为“纳什均衡”。
纳什均衡是一种抉择,它反映了双方可以通过分析双方的策略,使双方的利益最大化,从而达到一个均衡点,使双方的利益最大化。
它的特点是双方的行动是互相制约的,一方的行动会影响另一方的行动,双方都会尽量获得最大的利益。
纳什均衡的应用非常广泛,它可以用于经济学、政治学、军事学等多个领域,可以用来分析和解决各种博弈问题。
它的核心思想是,双方应该通过分析双方的策略,使双方的利益最大化,从而达到一个均衡点。
纳什均衡是一种博弈理论,它有助于双方在博弈中达成和谐、公平的结果,从而使双方都能获得最大的利益。
它的应用非常广泛,可以用于经济学、政治学、军事学等多个领域,是一种有效的博弈理论。
子博弈完美纳什均衡
子博弈完美纳什均衡
“子博弈精炼纳什均衡”的创立者是1994年诺贝尔经济学奖获奖者、莱茵哈德·泽尔腾。
泽尔腾则在60年代中期将纳什均衡概念引入动态分析。
在1965年发表《需求减少条件下寡头垄断模型的对策论描述》一文,提出了“子博弈精炼纳什均衡”的概念,又称“子对策完美纳什均衡”。
这一研究对纳什均衡进行了第一次改进,选择了更具说服力的均衡点。
海萨尼在60年代末把不完全信息引入博弈分析。
子博弈精炼纳什均衡用于区分动态博弈中的"合理纳什均衡"与"不合理纳什均衡",将纳什均衡中包含有不可置信威胁策略的均衡剔除出去,就是说,使最后的均衡中不再包含有不可置信威胁策略的存在。
子博弈精炼纳什均衡的基本概念
子博弈精炼纳什均衡的基本概念在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行为,来获得有关先行动者的信息,从而证实或修正自己对先行动者的判断。
完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息。
在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。
而在不完全信息动态博弈中,问题变得更加简单。
博弈开始时,某一参与人既不知道其他参与人的真实类型,也不知道其他参与人所属类型的分布概率。
他只是对这一概率分布有自己的主观判断,即有自己的信念。
博弈开始后,该参与人将根据他所观察到的其他参与人的行为,来修正自己的信念。
并根据这种不断变化的信念,作出自己的战略选择。
动态博弈行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择,因此,为了做最优的行动选择,每个参与人都必须这样思考问题:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?如下棋。
[1]子博弈精炼纳什均衡包含两层含义:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。
子博弈精炼纳什均衡就是要剔除那些只在特定情况下是合理的,而在其他情况下并不合理的行动规则在动态博弈中,参与人的行动有先后顺序,后行动的参与人在自己行动之前就可以观察到先行动者(参与人)的行为,并在此基础上选择相应的策略。
而且,由于先行动者拥有后行动者可能选择策略的完全信息,因而先行动者在选择自己的策略时,就可以预先考虑自己的选择对后行动者选择的影响,并采取相应的对策。
子博弈是指在动态博弈中,所有参与人先后都采取了一次行动后所构成的一组新的博弈,这组博弈中的每一个都称为“子博弈”。
当只当参与人的战略在其子博弈的系列(第二代、第三代…)中,每一个子博弈都构成纳什均衡,就构成了子博弈精练纳什均衡子博弈子博弈(Subgame)[编辑]什么是子博弈子博弈是指在动态博弈中,所有参与人先后都采取了一次行动后所构成的一组新的博弈,这组博弈中的每一个都称为“子博弈”。
博弈论第四章
(1)起始结是一个单结的信息结;
(2)子博弈保留了原博弈的所有结构。 则称它为原博弈的一个子博弈(子博弈)。
按照博弈树的延伸的时序,或者按照博弈 树生长的时序,我们用一个扁椭圆形的虚 线的圈,把所论局中人在同一个时点的若
干决策节点罩起来,成为他的一个信息集。
(1)起始结是一个单结的信息结
x1
L L 1 2 S L 2 S (1,1) (2,2) 1 (-1,-1) (-1,-1) S 2 L L S (2,2)
镇上能卖6000元;但如果另一家商铺同时在小镇上卖
鞭炮,价格下跌使得这批鞭炮只能卖4000元。纳什均
衡是什么?
• 假设甲先行动,商铺乙看到对方的选择后再决定是否
进货,子博弈精炼纳什均衡是什么?
如果甲先行动,但在博弈开始前商铺主乙有一次行动A 的机会,利用子博弈精炼均衡概念分析下述两种情况下
的博弈结果: 何行动他都不会改变这个决定;
一颗大树表示一个博弈,一颗小树同样可以表示
一个博弈。如果小树是大树的一颗子树,并且
小树表示的博弈不破坏大树表示的博弈的结构,
那么小树表示的博弈,就叫做大树表示的博弈
的子博弈。
一、子博弈(sub-game)
子博弈定义:在一个扩展型博弈中,如果一 个博弈由它的一个决策结及其所有后续结 构成,并满足:
信息集的时候,面临决策的局中人对于博弈迄今的历史是
不清楚的,他不清楚博弈具体走到了他的这个信息集里面 的哪个决策节点。
在市场进入博弈中,包含3个子博弈(包括原博 弈)。而在囚徒博弈中,只有一个子博弈(?)
收益: A
B 容忍
进入 抵抗 A 不进入 B
B
抵赖
B 抵赖
-1 ,-1 -9 ,0 0 ,-9
博弈论子博弈精炼纳什均衡分析
主讲人:张三
一.问题的提出
进入者的成本
•市场需求
•未来收益
1
2
3
Page 2
二.模型的建立
具有理性的“ 经济人”
信息的完全性
动态博弈过程 各店铺的所有收益支付不单指货币的 收入和支出,但在次均已货币形式表 示。
模型的假设
Page 3
二.模型的建立
假设美食店A考虑是否要在步行街投资10万 元开一家美食店,在做此决定时候衡量的标 准当然是是否有利可图。首先要考虑的因素 就是市场需求是大还是小。另外要考虑的因 素就是其他竞争对手,美食店B。假定B在 知道A决策和市场需求后进行选择是否投资 15万进入市场。 假定在市场上,如果有两家美食店,那么需 求大时,每家美食店每年平均能有30万的收 入,需求小时,每家平均每家美食店只能有 13万的收入;如果只有一家美食店,需求大 时,能有40万的收入,需求小时,只能有 20万的收入。
30,0 0,0
从以上战略式表达中,可以看出这个博弈有两个纯战略纳 什均衡,分别为(进入,{进入,进入}),(进入,{ 进入,不进入})。
四.子博弈精炼模型
结论
(进入,{进入,进入}) 是这个博弈的唯一的子博弈精 炼纳什均衡,我们有理由相信 A进入B进入是这个博弈唯一合 理的均衡结果。 所以,步行街会有很多同种 类型的店铺。
Page 4
二.模型的建立
1.需求大时:A进入,B不进入;A的利润是30万,B的利润 是0 2.需求大时:A不进入,B进入;A的利润是0,B的利润是25 万. 3.需求大时:A进入,B进入;A的利润20万,B的利润是15 万. 4.需求大时:A不进入,B也不进入;各自的利润都是0. 5.需求小时:A进入,B不进入;A的利润是10万,B的利润 是0 6.需求小时:A不进入,B进入;A的利润是0,B的利润是5
子博弈精炼Nash均衡
市场开发博弈——市场需求大
Nash均衡:(开发,(不开发,开发))、(开发,(不开发,不 开发))、(不开发,(开发,开发))
企业1
开发
x1
不开发
企业2 开发
x2 不开发
x3 企 业 2
开发
不开发
x4
-4 0 0 ,-4 0 0
x5
2 0 0 ,0
x6
0 ,2 0 0
x7
0 ,0
• 虽然(不开 发,(开发, 开发))和 (开发,(不 开发,不 开发))是Na sh均衡, 但并不是 子博弈精 炼纳什均 衡。
(2)子博弈 ( x 3 )
例2:找出下列博弈的子博弈
1
1
E 3 ,0 x 7
C
2
A x1 B
x2
x4
D 2 ,1
x3 F
1 ,1 x 5
1
x
,2
6
该博弈存在3个子博弈:除了原博弈自己以 外,还存在下面两个子博弈。
2
x2
C
D
1 x3
x5
1 ,1
E
F
x7
3 ,0
x6
1 ,2
1 x3
E
F
x7
3 ,0
• 但是,如果在博弈开始之前,企业2采取某种 行动使自己的支付(或行动空间)发生改变,那 么原来不可置信的威胁就有可能变得可信。
新产品开发博弈的再考察
• 假设企业投入的2000万元中,有1000万元用来 购买研发设备(即固定成本),另外1000万元用 来支付新产品开发中的人力、原材料等投入(即 可变成本)。
• 因为在(B,C)中,包含了参与人2不可置信 的威胁:当参与人1在决策结x1选择A时, 参与人2在决策结选择C。事实上,只要博 弈达到决策结x2,参与人2的理性选择就是 D。
子博弈精炼纳什均衡+贝叶斯法则+信号博弈
一:子博弈精炼纳什均衡在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。
子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。
即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。
子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。
为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。
譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a 子博弈和图3.6b子博弈。
在静态博弈分析时,我们所说的战略是指参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。
这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。
而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。
这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。
定义3.1:子博弈精炼纳什均衡(SPNE):扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。
如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足:在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。
07-子博弈精炼Nash均衡的应用
• 最优化的一阶条件:
q2
1 2
(a
q1
c)
s2 (q1 )
• 由于1可预测到2将根据s2(q1)选择q2。 所以企业1的利润函数为
Max 1(q1, s2 (q1)) q1 (a q1 s2 (q1) c)
• 由最优化一阶条件得:
q1*
1 2
(a
c)
q2*
s2 (q1* )
1 4
(a
c)
• 均衡结果:(1 (a c), 1 (a c))
2
4
均衡: (q1*, s2 (q1))
此均衡为子博弈精炼Nash均衡。
与Cournot模型的比较
1) 产量
Qs
3 (a 4
c)
Qc
2 3
(a
c)
由此知: Qs>Qc
其中:
Qs1
1 2
人1得到整个蛋糕(即一美元);
2. 给定1,当2 1时,s 0,参与
人2得到整个蛋糕(即一美元);
• 从上述分析可以看到:有绝对耐心的参与 人总可以通过拖延时间使自己独吞整个蛋 糕。
• 这种“耐心优势”在一般情况也成立:给 定其他条件(如参与人的出价次序),越有 耐心的参与人得到的份额越大。
比如说,令1 0.5, 2 0.9,
s1=1- (1- s)
因此博弈的均衡结果为:参 与人1在第一阶段建议
s1=1- (1- s),
参与人2接受该建议。 博弈结束。
第二种情形:
假设参与人的贴现率分别为:1,
。
2
参与人2在第二阶段提出自己的最优建议
s2=1 s
博弈论第四章 完全且完美信息动态博弈
房地产开发博弈 精选ppt
支付
横向扩展式举例:
进入者
进入 在位者
合作(40,50) 斗争(-10,0)
不进入(0,300) 市场进入阻挠博弈树
精选ppt
扩展型
为了让“树”描绘博弈,其结点和枝需要满足三 条性质:
1.单一的出发点。重要的是知道博弈从何处开 始,所以必须有一个,也只能有一个出发点。
2. 无循环。重要的是在博弈运行中,我们不要 陷入僵局;树枝循原路折回并造成一个循环一定 是不可接受的。
3. 单方向前进。重要的是,对于博弈如何进行 下去不能模棱两可,因此,必定不存在二个或多 个枝导向同一个结。
精选ppt
为保证这三条性质,在前结点上强加下述限
制: 1.结点不能是自身的前结点。
一个纳什均衡称为精炼纳什均衡,当只当参与人 的战略在每个子博弈中都构成纳什均衡,也就是 说,组成完美纳什均衡的战略必须在每一个子博 弈中都是最优的。
一个精炼纳什均衡首先必须是一个纳什均衡,但 纳什均衡不一定是精炼纳什均衡。
承诺行动-当事人使自己的威胁战略变得可置信的 行动。
精选ppt
子博弈完美纳什均衡
精选ppt
完全且完美信息动态博弈的主要特点
(1)行动是顺序发生的, (2)下一步行动选择之前,所有以前的行动都
可以被观察到, (3)每个可能的行动组合下局中人的收益是共
同知识。
精选ppt
第三章 完全且完美信息动态博弈
一 博弈扩展式表述 二 子博弈完美纳什均衡 三、用逆向归纳法求-子博弈完美
精选ppt
扩展式表示的一个例子
精选ppt
博弈树始于 局中人1 的一个决策结点,这时1
要从L和R中作出选择,如果局中人1选择L,其后就
子博弈计算
子博弈计算
子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium,SPNE)是一种均衡策略,它在所有子博弈中都是最优的。
它是纳什均衡的精炼,也就是说,如果一个策略组合是纳什均衡,并且它在所有子博弈中都是最优的,那么它就是子博弈精炼纳什均衡。
在计算子博弈精炼纳什均衡时,需要先确定博弈的子博弈。
子博弈是原博弈的一部分,它包含了原博弈中的某些信息集和行动。
然后,在这些子博弈中,寻找最优的策略组合,使得每个参与者在每个子博弈中都能够获得最优的结果。
具体来说,计算子博弈精炼纳什均衡的步骤如下:
确定博弈的子博弈。
这可以通过分析博弈的信息集和行动来实现。
对于每个子博弈,分别计算每个参与者的最优策略。
这可以通过求解子博弈中的最优策略问题来实现。
如果存在多个最优策略,则需要比较它们的预期收益。
选择预期收益最高的策略作为子博弈精炼纳什均衡。
重复以上步骤,直到所有子博弈都找到最优策略。
需要注意的是,子博弈精炼纳什均衡的计算可能需要较高的计算能力和技巧。
因此,在实际应用中,可能需要借助计算机软件或算法来求解子博弈精炼纳什均衡。
此外,子博弈精炼纳什均衡是一种理想化的均衡概念,它假设每个参与者在每个子博弈中都能够理性地选择最优策略。
但在实际情况下,参与者的行为可能会受到各种因素的影响,使得他们无法总是选择最优策略。
因此,在实际应用中,需要考虑参与者的行为特征和限制,并在此基础上进行均衡分析和计算。
第四章第二讲子博弈精炼纳什均衡
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
23
第四节 延伸分析
三、子博弈精炼纳什均衡存在的问题 (二)旅行者困境 2.规则:甲、乙分别写出花瓶价格 索价低者得益:所索低价格+2 索价高者得益:所索低价格-2 索价相同得益:所索取的价格
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
8
第三节
子博弈精炼纳什均衡
二、子博弈精炼纳什均衡 (二)分析 1. (入驻,{容忍,容忍})
子博弈:指向(0, 10)的策略组合— —在位者无单独偏 子博弈:指向( 离激励 1, 5)的策略组合— —在位者无单独偏 离激励
2015年12月6日
与用倒推法求出的结果相2010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡142010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡152010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡16candyjohnjohn121100212010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡172010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡1865464032高价低价高价低价高价低价2010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡192010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡202010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡21残酷的蜈蚣博不结束10不结束02不结束30不结束04不结束50不结束09998不结束9999001000002010年12月24日博弈论第四章第二讲子博弈精炼纳什均衡22三子博弈精炼纳什均衡存在的问题一序贯博弈的问题2
子博弈精炼纳什均衡名词解释
子博弈精炼纳什均衡名词解释嘿,朋友们!今天咱来聊聊子博弈精炼纳什均衡这个听起来有点高大上的玩意儿。
你看啊,这就好比是一场复杂的游戏。
在这个游戏里,每个人都有自己的策略和选择。
子博弈精炼纳什均衡呢,就是在这个游戏中的某个局部,大家都找到了一个最佳的玩法,谁也不愿意轻易改变。
咱可以想象一下,一群人在玩扑克牌,每个人都在算计着怎么出牌才能赢。
在某个特定的局面下,大家都形成了一种默契,都按照某种特定的方式出牌,因为这样对自己最有利呀。
这就是一种子博弈精炼纳什均衡。
它可不是随随便便就能达到的哦!就像爬山一样,得一步一步找到最合适的路径。
在这个过程中,大家都得不断地思考、算计,权衡各种利弊。
而且啊,它还很稳定呢,一旦达到了,就不太容易被打破。
比如说在商业竞争中,几家公司在市场上争斗。
他们会根据对手的行动来调整自己的策略,直到找到一个大家都觉得不错的状态,这其实就是一种子博弈精炼纳什均衡啦。
再想想下棋,每一步棋都是在追求一种平衡和最优解。
高手下棋的时候,不就是在寻找那个子博弈精炼纳什均衡嘛!他们可不会瞎走,都是深思熟虑的呀。
那这个子博弈精炼纳什均衡有啥用呢?用处可大啦!它能帮我们更好地理解人与人之间的互动和竞争。
知道了这个,我们就能在各种情况下做出更明智的选择。
比如说在谈判的时候,如果你能理解对方的策略,找到那个子博弈精炼纳什均衡,不就能更好地达成自己的目的了嘛!在团队合作中也是一样,大家找到共同的最优策略,工作就能更顺利地进行呀。
总之,子博弈精炼纳什均衡就像是一个隐藏在各种复杂局面背后的秘密武器。
只要我们能发现它、理解它、运用它,就能在生活和工作中更加得心应手。
难道不是吗?所以啊,大家可得好好琢磨琢磨这个有趣的概念哦!。
子博弈精炼纳什均衡
子博弈精炼纳什均衡
吴建设
子博弈精炼纳什均衡
子博弈:一个扩展式表示博弈的子博弈G是 由一个单结信息集x开始的与所有该决策结 的后续结(包括终点结)组成的能自成一个 博弈的原博弈的一部分。
扩展式描述的博弈的子博 弈,是由一个单节点信息 集(决策节)开始的与所 有该决策节后续的决策节 (包括终点节)组成的博 弈。
子博弈精炼纳什均衡
这个是子博展式博弈的策略 组合 S*=(S1*,…,Si*,…,Sn *),如果它是原博弈的 纳什均衡;它在每一个 子博弈上也都构成纳什 均衡,则它是一个子博 弈精炼纳什均衡。
子博弈与整个博弈的关系
只有当某一策略组合在每一个子博弈(包 括原博弈)上都构成一个纳什均衡,这一 策略组合才是子博弈精炼纳什均衡解。 显然,如果整个博弈是唯一的子博弈,纳 什均衡与子博弈精炼纳什均衡是完全相同 的
练习:找出全部子博弈
练习:找出全部子博弈
动态博弈也可以以概率形式出现
完全信息动态搏弈-子博弈精炼纳什均衡
二 子博弈精练纳什均衡
一个纳什均衡称为精练纳什均衡,当只当 参与人的战略在每个子博弈中都构成纳什 均衡,也就是说,组成精练纳什均衡的战 略必须在每一个子博弈中都是最优的。
博弈战略表述
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 不开发
开发商B 开发 不开发
4000,4000 0,8000 8000,0 0,0
开发商B
开发
-3000,-3000 0,1000
不开发
1000,0 0,0
开发商A
博弈的战略式表述
一 博弈扩展式表述
博弈的扩展式表述包括三个要素:
行动顺序 信息 完全信息
动态 完全信息动态博弈 子博弈精练纳什均衡 泽尔腾(1965) 不完全信息动态博弈 精练贝叶斯纳什均衡 泽尔腾(1965) Kreps 和Wilson(1982) Fudenberg 和Tirole(1991)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡 海萨尼(1967-1968)
一 博弈扩展式表述 二 子博弈精练纳什均衡 三 应用举例
博弈的战略表述
案例- 房地产开发项目-假设有A、B两家开发商
市场需求:可能大,也可能小
投入:1亿
假定市场上有两栋楼出售: 需求大时,每栋售价1.4亿,
需求小时,售价7千万;
如果市场上只有一栋楼 需求大时,可卖1.8亿 需求小时,可卖1.1亿
x之前的所有结的集合,称为x的前列集P(x),x之后的所有结的 集合称为x的后续集T(x)。
枝: 枝是从一个决策结到它的直接后续结的连线,每一个枝代表参 与人的一个行动选择. 信息集: 每个信息集是决策结集合的一个子集,该子集包括所有满 足下列条件的决策结: 1 每个决策结都是同一个参与人的决策结; 2 该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟 处于哪一个决策结.
子博弈精炼纳什均衡
子博弈精炼纳什均衡●将纳什均衡中包含的不可置信的威胁策略剔除出去。
它要求参与者的决策在任何时点上都是最优的,决策者要“随机应变”,“向前看”,而不是固守旧略。
●由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。
这一点对预测分析是非常有意义的。
与纳什均衡的区别●在纳什均衡中,参与人在选择自己战略时,把其他参与人策略当作给定的,不考虑自己的选择将如何影响对手的策略。
●实际上,当一个人行动在前,另一个人行动在后时,后者自然会根据前者的选择而调整自己的选择,前者在作选择时自然会理性地考虑这一点,所以不可能不考虑自己的选择对其对手选择的影响。
博弈表达的标准型与扩展型●博弈的标准型表达有三个要素:参与人,可选择策略及支付函数。
•两人有限策略博弈的标准型可用一个矩阵表来表示。
●扩展型表达包括五个要素:•(1)参与人;(2)每个参与人选择行动的时点;(3)每个参与人在每次行动时可供选择的行动集合;(4)每个参与人在每次行动时有关对手过去行动选择的信息;(5)支付函数。
市场进入阻挠博弈●假设一个企业A是市场上的唯一供给者,面临企业B可能的竞争威胁。
企业A有两种可选策略,即斗争与默许。
斗争表现为采用降低价格使B的收益为0,默许意味着维持高价格。
企业B也有两种策略:进入或者不进入。
假定进入之前垄断利润为300,进入之后寡头利润共为100(各得50),进入成本是10。
各种策略组合下的支付矩阵如下表:举例分析●该博弈显然有两个纳什均衡,即(进入,高价),(不进入,低价)。
●静态分析方法,得到两个纳什均衡。
分析●给定企业B进入的话,企业A选择高价时得50利润,选择低价时得不到利润,所以最优战略是高价(默许)。
同理,给定企业A高价时,进入策略成为企业B最优选择。
尽管在企业B 选择不进入时,企业A采取任何一种策略都是一样得,但只有当企业A选择低价时,不进入才是企业B的最优选择,所以(不进入,低价)也是一个纳什均衡,而(不进入,高价)不是纳什均衡。
子博弈完美Nash均衡
• Again there are two methoidt?s:
– M1 ~ Convert to a normal form
– M2 ~ Deal directly in extensive form
Normal form analysis: How?
– DM1: 3 strategies, L, M, and R
A
Subgames
E -1,-2
F 0,-3 2,-1 1,0
– Subgame perfect equilibrium: No subgame can any player do better by choosing a different strategy
Some examples that is not subgames
C
E -1,-2
F 0,-3 2,-1
DM1 DM2 DM1 DM2 1,0
Subgames and Subgame
Subgames Perfection
– for any non-terminal history h is the part of the game that remains after h occurred.
Q. If DM1 selected L, wthhisaptrsohbloeumld DM2 do?
How about if DM1 selected M or R? • The solution process is backward induction
– Starting from leaf nodes and work backward until the root node is reached, each time solve a simple problem
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
16
第四节 延伸分析
二、后行一步的优势 (一)案例:定价博弈 纳什均衡:(高价,低价)
高价 × 高价 A 低价× B B 低价 (6,5) (4,6)
高价 ×
低价
(4,0)
(3,2)
17
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
第四节 延伸分析
二、后行一步的优势 (二)结论:后动优势
二、子博弈精炼纳什均衡 (二)分析 3. (不入驻,{阻挠,容忍})
(1,5)
(-2,2) (0,10) (0,4)
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
11
真正的纳什均衡
(入驻,{容忍,容忍}) 启示:垄断还是竞争?
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
12
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
23
第四节 延伸分析
三、子博弈精炼纳什均衡存在的问题 (二)旅行者困境 2.规则:甲、乙分别写出花瓶价格 索价低者得益:所索低价格+2 索价高者得益:所索低价格-2 索价相同得益:所索取的价格
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
第三节
子博弈精炼纳什均衡
三、纳什均衡的存在性:库恩定理 完全信息的有限序贯博弈都存在纳什均衡
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
13
情侣博弈再思考
延伸:仅有惊喜是不够的=> 序贯决策博弈再研究
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
14
第四节 延伸分析
一、先行一步的优势 (一)案例:情侣博弈 纳什均衡:(芭蕾,芭蕾)
A
B
A
(0,100000)
…… 结
束
结 束
(1,0)
(0,2)
(3,0) (0,4) (5,0)
博弈论第四章 第二讲子博弈精炼纳什均衡
(0,9998) (9999,0)
20
2015年12月6日
第四节 延伸分析
三、子博弈精炼纳什均衡存在的问题 (一)残酷的蜈蚣博弈 2.理论分析:倒推法——理论结论 A:9999>0,选“结束”。But, B:9998>0,选“结束”, A在最后一轮无机会选择。But, B在倒数第二轮无机会选择 …… 博弈论第四章 2015 年12月6日 A——1>0 第一轮: ,选“结束”
2
第三节
子博弈精炼纳什均衡
一、子博弈:针对树型(展开型)博弈 (一)定义 给定n人展开型博弈T(tree), 若博弈S(sub)满足三个条件:
1.S博弈树是T博弈树的一枝
案例
2.S不能分割T的信息集 (1)S的根为T的单点信息集 (2)S的信息集不与 T的其他信息集相交 博弈论第四章 2015年12月6日
第二讲子博弈精炼纳什均衡
3
第三节
一、子博弈: (一)定义
子博弈精炼纳什均衡
3.S的末端节点处支付向量继承自T
则:S为T的子博弈 T:原博弈、母博弈
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
4
第三节
子博弈精炼纳什均衡
乙
借 甲 分 (2,2) 不分 乙 不借 (1,0)
一、子博弈 (二)案例:虚线 圈住法
F
F 夏娃 B 亚当 × 亚当 B × × F (1,2) (-1,-1)
(0,0)
B (2,1)
15
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
第四节 延伸分析
一、先行一步的优势 (二)结论:先动优势(先下手为强)
参与人(夏娃)先行得益 大于后行得益
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
市场入驻阻挠博弈
三个纳什均衡:多重纳什均衡 (入驻,{容忍,容忍}) (入驻,{容忍,阻挠}) (不入驻,{阻挠,容忍}) 最终均衡?
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
1
第四章
序贯决策博弈
第三节 子博弈精炼纳什均衡 :序贯博弈多重纳什均衡
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
打
不打 (0,4)
(1,0)
有法律保障的开金矿博弈
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
5
子博弈案例:仿冒和反仿冒博弈
A 仿冒 B 不仿冒
制止
仿冒 (-2,5) 制止 B
不制止 A
(0,10)
不仿冒
(5,5)
不制止
(2,2)
2015年12月6日
(10,4)
6
博弈论第四章 第二讲子博弈精炼纳什均衡
参与人(B)后行得益 大于先行得益
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
18
第四节 延伸分析
三、子博弈精炼纳什均衡存在的问题: 理论结果与现实的出入 令人瞬间碉堡的奇葩理论模型—— (1)利率=120% (2)自行车污染>汽车污染 (3)石家庄地震风险度最高; (4)石家庄居民幸福指数最高。
思考:最终的纳什均衡?
答:能够经得起双重考验的纳什均衡 (1)经得起原博弈的考验 (2)经得起子博弈的考验 —— 子博弈精炼纳什均衡
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
7
第三节
子博弈精炼纳什均衡
二、子博弈精炼纳什均衡 (一)市场入驻阻挠
三种纳什均衡 (入驻,{容忍,容忍}) (入驻,{容忍,阻挠}) (不入驻,{阻挠,容忍})
(1,5)
(-2,2) (0,10) (0,4)
9
博弈论第四章 第二讲子博弈精炼纳什均衡
第三节
子博弈精炼纳什均衡
二、子博弈精炼纳什均衡 (二)分析 2. (入驻,{容忍,阻挠})
(1,5)
(-2,2) (0,10) (0,4)
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
10
第三节
子博弈精炼纳什均衡
第二讲子博弈精炼纳什均衡
21
第四节 延伸分析
三、子博弈精炼纳什均衡存在的问题 (一)残酷的蜈蚣博弈
3.现实 结果:参与人事先订立协议, 博弈9999次,奖金平分。
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
22
第四节 延伸分析
三、子博弈精炼纳什均衡存在的问题 (二)旅行者困境
1.案例 旅行者甲、乙托运的花瓶被损坏, 向航空公司索赔
2015ห้องสมุดไป่ตู้12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
19
第四节 延伸分析
三、子博弈精炼纳什均衡存在的问题 (一)残酷的蜈蚣博弈 理论分析 与现实的 1.案例:分钱博弈 冲突 规则:选择“结束”者得全部奖赏
不结束
不结束
不结束
不结束
不结束
不结束
不结束
A 结 束
结 束
B 结 束
A 结 束
B 结 束
24
第四节 延伸分析
三、子博弈精炼纳什均衡存在的问题 (二)旅行者困境
3.理论分析:参与人的“理性”心理状态 纳什均衡:(索低价,索低价) (0,0)
4.现实 参与人事先订立协议,索高价
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
25
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
8
第三节
子博弈精炼纳什均衡
二、子博弈精炼纳什均衡 (二)分析 1. (入驻,{容忍,容忍})
子博弈:指向(0, 10)的策略组合— —在位者无单独偏 子博弈:指向( 离激励 1, 5)的策略组合— —在位者无单独偏 离激励
2015年12月6日