06 子博弈精炼Nash均衡
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 在市场需求小的“新产品开发博弈”中, (开发,(不开发,开发))为子博弈精炼Nas x1 → h均衡,该均衡不仅在均衡路径 x2 → x5 上而且在任一非均衡路径上,都能给出参 与人的最优决策。 • Nash均衡(开发,(不开发,不开发))虽然 在均衡路径 x1 → x2 → x5上给出了参与人的 最优决策,但却包含了参与人在非均衡路 径上的不合理选择:当企业1选择“不开 发”时,企业2也选择“不开发”。
子博弈精炼Nash均衡 均衡 子博弈精炼
主要内容: 一、子博弈精炼Nash均衡 二、子博弈精炼Nash均衡的求解 三、承诺行动与要挟诉讼
一、子博弈精炼Nash均衡
• 博弈论的研究目的是寻找博弈的解。在静 态博弈中我们将Nash均衡作为博弈的解, 但纳什均衡作为博弈的解面临一个很大的 问题——多重性问题。 • 当我们将Nash均衡作为扩展式博弈的解时, 同样也会遇到Nash均衡的多重性问题,而 且在多个Nash均衡中有些是明显不合理的。
• 该博弈存在三个Nash均衡——(开发,(不开发, 开发))、(开发,(不开发,不开发))和(不开发, (开发,开发)),但这三个均衡是否都是合理的 呢? • 在“新产品开发博弈”中,如果市场需求小, 那么就只能一个企业开发,另一个企业不开发, 问题在于谁选择开发,谁选择不开发。
• 对于先行动的企业1来讲,只要自己选择 “开发”,理性的企业2就只会选择“不 开发” ,所以,均衡(不开发,(开发,开 发))是不合理的。 • 对于企业2来讲,企业1开发自己当然不能 开发,如果企业1不开发自己显然应该开 发。均衡(开发,(不开发,不开发))也是不 合理的。因此,合理的Nash均衡是(开发, (不开发,开发))。
• (不开发,(开发,开发))虽然为Nash均衡, 但却包含了企业2不可置信的战略:无论企 业1如何选择,企业2都将选择“开发”。 • 在Nash均衡(不开发,(开发,开发))中, “企业2无论什么情况下都开发”这种不可 置信的战略亦称为“不可置信的威胁”(inc redi-ble threat)。 • 作为求解子博弈精炼Nash均衡的方法,逆 推归纳法可以将Nash均衡中的“不可置信 的威胁”剔除掉。
例:
1 A x B 1 2 x x4 2 C D 2,1 1 x 3 x5 E F 1,1 x7 x6
1,2
3,0
由以上分析可以得到博弈的求解过程: • 首先求解博弈树中最底层的子博弈Γ(x3), 得到子博弈Γ(x3)的结果为(3,0) (即参与人1 选择E); • 再求解子博弈Γ(x2) ,容易得到博弈的结果 为(1,1)(即参与人2选择D); • 最后求解原博弈即子博弈Γ(x1) ,得到博弈 的结果为(2,1) (即参与人1选择B)。
• 博弈存在两个Nash均衡——(开发,(开发, 开发))和(开发,(开发,不开发)),其中 均衡(开发,(开发,不开发))要求企业2采 取战略“企业1开发自己就开发,企业1 不开发自己也不开发”。
• 我们知道,“新产品开发博弈”中,如果市 场需求大的话,不管对方是否开发,每个企 业都应选择“开发”。因此,“当企业1开发 时,企业2开发”是合理的,但是,“当企业 1不开发时,企业2不开发”就不合理了。均 衡(开发,(开发,不开发))不是关于博弈结果 ( ( )) 的合理预测。
R′
L ′′
R ′′
L ′′
R′
(1)子博弈 Γ( x2 )
(2)子博弈 Γ( x3 )
例2:找出下列博弈的子博弈
1 A x B 1 2 x x4 2 C D 2,1 1 x 3 x5 E F 1,1 x7 x6
1,2
3,0
该博弈存在3个子博弈:除了原博弈自己以 外,还存在下面两个子博弈。
2
x2
例1:新产品开发博弈
企业1 开发 企业2 开发
x1
不开发
x2
不开发 开发
x3
企业2 不开发
x4
300,300
x5
800,0
x6
0,800
x7
0,0
市场需求大时候的情况
企业2 ( 开 发 , 开 发 ) ( 开 发 , 不 开 发 )( 不 开 发 , 开 发 ) 不 开 发 , 不 开 发 ) ( 开发 企业1 不开发 300, 300 0, 800 300, 300 0, 0 800, 0 0, 800 800, 0 0, 0
例2:新产品开发博弈
企业1 开发 企业 2 开发
x1
不开发
x2
不开发 开发
x3 企 业 2
不开 发
x4
-4 00 ,-40 0
x5
20 0, 0
x6
0 ,20 0
0, 0
x7
市场需求小时候的情况
企业2 ( 开 发 , 开 发 ) ( 开 发 , 不 开 发 )( 不 开 发 , 开 发 ) 不 开 发 , 不 开 发 ) ( 开发 企业1 不开发 -400,-400 0,200 -400,-400 0, 0 200,0 0,200 200,0 0, 0
三、承诺行动与要挟诉讼
• 前面分析的“新产品开发”博弈提到,当市场 需求小时,Nash均衡(不开发,(开发,开发)) 由于含有不可置信的威胁(即企业1选择“开发” 时,企业2仍选择“开发”),而不是子博弈精 炼Nash均衡。 • 但是,如果在博弈开始之前,企业2采取某种 行动使自己的支付(或行动空间)发生改变,那 么原来不可置信的威胁就有可能变得可信。
L ′′ x8
2,3
x5
• 由于子博弈精炼Nash均衡在任一决策结上 都能给出最优决策,这也使得子博弈精炼 纳什均衡不仅在均衡路径(即均衡战略组合 所对应的路径)上给出参与人的最优选择, 而且在非均衡路径(即除均衡路径以外的其 它路径)上也能给出参与人的最优选择。 • 所以,子博弈精炼Nash均衡不会含有参与 人在博弈进程中不合理的、不可置信的行 动。这就是子博弈精炼Nash均衡与Nash均 衡的实质性区别。
例1:找出下列博ቤተ መጻሕፍቲ ባይዱ的子博弈。
1
L
2
x1
R
2
L′ x4
x2
3
R′ x5 x6
L′
x3
3
R′ x7
L ′′
R ′′
L ′′
R ′′
L′
R ′′
L ′′
R′
该博弈存在3个子博弈:除了原博弈自己以 外,还存在下面两个子博弈。
2
2
L′ x4
x2
3
R′ x5
L′ x6
x3
3
R′ x7
L ′′
R ′′
L ′′
企业1 开发 企业2 开发
x1
不开发
x2
不开发 开发
x3 企业2
不开发
x4
x5
x6
0,800
x7
0,0
300,300 800,0
• 虽然(开发, (开发,不开 发))是Nash均 衡,但并不 是子博弈精 炼Nash均衡。
市场开发博弈——市场需求大
Nash均衡:(开发,(不开发,开发))、(开发,(不开发,不 开发))、(不开发,(开发,开发))
企业1 开发 企业2 开发
x1
不开发
x2
不开发 开发
x3 企 业 2
不开发
x4
-400,-400
x5
200,0
x6
0,200
0,0
x7
• 虽然(不开 发,(开发, 开发))和 (开发,(不 开发,不 开发))是Na sh均衡, 但并不是 子博弈精 炼纳什均 衡。
市场开发博弈——市场需求小
子博弈精炼纳什均衡的理解
* * s* = ( s1 ,..., sn )
说明:
一个战略组合是子博弈精炼Nash均 衡当且仅当它对所有的子博弈(包括原博 弈)构成Nash均衡,同时也意味着原博弈 的Nash均衡并不一定是子博弈精炼Nash 均衡,除非它还对所有子博弈构成Nash 均衡。
Nash均衡: (开发,(开发,开发))和(开发,(开发,不开发))
子博弈的概念
• 子博弈:是原博弈的一部分,它始于原博 弈中一个单结信息集中的决策结x,并由决 策结x及其后续结共同组成。一般用 Γ( xi )表 示博弈树中始于决策结xi的一个子博弈。 • 注意:1)子博弈可以作为一个独立的博弈 进行分析,并且与原博弈具有相同的信息 结构;2)原博弈可以作为自身的一个子博 弈;
例:
1 2 x 2 D C
0,0
2
A
x1 B
1,2
1
C A B
0, 0 1, 2
D
2, 1 1, 2
2,1
• 战略组合(A,D)和(B,C)都是Nash均衡,但 是,只有(A,D)为子博弈精炼Nash均衡。 • 因为在(B,C)中,包含了参与人2不可置信 的威胁:当参与人1在决策结x1选择A时, 参与人2在决策结选择C。事实上,只要博 弈达到决策结x2,参与人2的理性选择就是 D。
C 1 x3 E
3,0
D
1 E
3,0
x5
x6
x3
F
F
1,1
x7
x7
1,2
x6
1,2
(1)子博弈 Γ( x2 )
(2)子博弈 Γ( x3 )
子博弈精炼Nash均衡的定义
扩展式博弈的战略组合 是一个子博弈精炼Nash均衡,当且仅当 满足以下条件: 1) 它是原博弈的Nash均衡; 2) 它在每一个子博弈上构成Nash均衡。
• 解决Nash均衡多重性问题的一种主要方法 就是精炼的方法,即在Nash均衡的基础上, 通过定义更加合理的博弈解并剔除不合理 的均衡。 • Selten在1965年提出的“子博弈精炼Nash均 衡”(subgame perfect Nash equlibrium)的概 念,就是这样一种新的纳什均衡解,我们 首先给出子博弈的定义。
一般情形:
i
L
j
xi
R
j
L′
xi +1
R′
L′
xi + 2
R′
• 参与人i在信息集Ii ({xi})选择行动L还是行 动R,取决于选择行动L和行动R所引致的 后续结果。 • 由于参与人i选择行动L时使博弈进入了子 博弈Γ(xi+1) ,因此,参与人i选择行动L的结 果就是得到子博弈Γ(xi+1) 。 • 同样,参与人i选择行动R的结果就是得到 子博弈Γ(xi+2) 。 • 所以,参与人i在信息集Ii ({xi})上的最优选 择,取决于参与人i在信息集Ii ({xi})上可能 采取的行动所导致的各个子博弈。
x1
R
2
L′
1
x2
R′
1
L′ x10 R ′′ x9
4,1 2,3
x3
R′ x1 1
5,1
L ′′ x6
2,1
x4
R ′′ x7
3,2
L ′′ x8
2,3
x5
1
L
2
x1
R
2
L′
1
x2
R′
1
L′ x10 R ′′ x9
4,1 2,3
x3
R′ x1 1
5,1
L ′′ x6
2,1
x4
R ′′ x7
3,2
新产品开发博弈的再考察
• 假设企业投入的2000万元中,有1000万元用来 万元用来 购买研发设备(即固定成本),另外1000万元用 购买研发设备 来支付新产品开发中的人力、原材料等投入(即 可变成本)。 • 假设企业提前购买研发设备(即在决定是否开发 之前就购买),可得到一定的优惠,只需900万 元即可。但是如果企业购买了设备而决定“不 开发”,那么所购买的研发设备就只能当“废 品”处理,收回400万元。
• 只有当一个战略规定的行动在所有可能 的情况下都为最优时,它才是一个合理 的、可置信的战略。 • 子博弈精炼纳什均衡就是要剔除那些只 在特定情况下合理而在其他情况下并不 合理的行动规则。
二、子博弈精炼Nash均衡的求解
• 逆推归纳法是最常用的求解子博弈精炼 Nash均衡的方法。 • 逆推归纳法对于完美信息 完美信息(perfect infor完美信息 mation)博弈问题尤为适用,但在有些情 形下,对于不完美信息博弈,也能运用 逆推归纳法进行求解。
考察如下博弈情形:
• 企业1先选择是否开发,企业2观测到企 业1的决策后选择是否开发,但在企业1 决策之前,企业2可以决定是否提前购买 研发设备。
• 上述求解有限扩展式博弈的方法亦称 “逆推归纳法”(backward induction)。 • 由于逆推归纳法对各个子博弈逐一进行 求解,因此,逆推归纳法所得到的解在 各子博弈上构成Nash均衡,这意味着逆推 归纳法所得的解为子博弈精炼纳什均衡。
例:求解下列博弈的子博弈精炼Nash均衡
1
L
2
• 这意味着,参与人i在信息集Ii ({xi})上的最 优选择,一定是使博弈进入能给自己带来 最大支付的子博弈。 • 因此,为了确定参与人i在信息集Ii ({xi})上 的选择,就必须先求解参与人i在信息集Ii ({xi})上可能采取的行动所导致的各个子博 弈。
• 由以上分析可得求解有限扩展式博弈的 一般步骤: 1) 找出博弈的所有子博弈; 2) 按照博弈进程的“反方向”逐一求解 各个子博弈,即最先求解最底层的子博 弈,再求解上一层的子博弈,......,直至 原博弈。