第二节完全信息动态博弈(2.2)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


三 应用举例
用逆向归纳法求-子博弈精练纳什均衡
给定博弈达到最后一个 决策结,该决策结上行动 的参与人有一个最优选择, U 这个最优选择即该决策结 开始的子博弈的纳什均衡
倒数第二个决策结, 2,2 找倒数第二个的最优选择, 这个最优选择与我们在第 一步找到的最优选择构成 一个纳什均衡。 1
D
2
L
R
个不可置信威胁,纳什均衡(开发,(不 开发,x
不开发
B
开发
x’
不开发
(-3,-3)
(1,0) (0,1)
(0,0)
(不开发,(开发,开发)),(开发,(不开发,开发)),(开发,(不开发,不开发))
如果A选择开发,B的最优选择是不开发,如果A选择不开发,B的最优选 择是开发,A预测到自己的选择对B的影响,因此开发是A的最优选择。子博 弈精练纳什均衡结果是:A选择开发,B选择不开发。

完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)

子博弈:是原博弈的一部分,它本身也可以作为一个独立的 博弈进行分析:
(1)子博弈必须从一个单结信息点开始:只有决策者在原 博弈中确切地知道博弈进入一个特定的决策结时,该决策结 才能作为一个子博弈的初始结。如果信息集包含两个以上的 决策结,则这两个都不可以作为子博弈的初始结(见下页)。 (2)子博弈的信息集和支付向量都直接继承自原博弈,即 当x’和x’’在原博弈中属于同一信息集时,他们在子博弈中才 属于同一信息集;子博弈的支付函数只是原博弈留存在子博 弈上的部分。 习惯上,任何博弈的本身称为自身的一个子博弈。
(0,0)
(3,1)
如此重复直到初始结。每一步都得到对应于子博弈的一个 纳什均衡,并且根据定义,该纳什均衡一定是该子博弈的 子博弈的纳什均衡,这个过程的最后一步得到整个博弈的 纳什均衡
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)

用逆向归纳法求 子博弈精练纳什 均衡
B
A
开发 不开发
x
不开发
的确,如果弟弟是会算计自己利益的理性人,在这样的环境下,还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可置信的。

哥哥想,你真要告诉爸爸,我是要倒霉的, 可是你不告状不过没有玩具玩,而告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你不会告状,因此哥哥对弟弟的警告置之不理。

子博弈精练纳什均衡

A
开发
不开发
X
大 小
1/2
X


1/2 1/2 1/2
B
不开发 开发
B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8)
(0,0)
(0,1)
(0,0)
参与人X的信息集不能开始一个子博弈, 否则的话,参与人B的信息将被切割。
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)



子博弈精练纳什均衡
1
U D U
1 h’’
R (a4 b4)
2
L
h
R L
2
D
2 h’
R
L (a1,b1)
h
R
L
2
h’’
R
(a4 b4)
(a1,b1)
(a2, b2) (a3, b3)
2
L
(a1,b1) R
h
L
2
(a2, b2) (a3, b3)
(a2, b2) (a3, b3)
(a4 b4)
子博弈精练纳什均衡
行动
进入
进入者
在位者
合作(40,50) 斗争(-10,0)
不可置信威胁
不进入(0,300)
市场进入阻挠博弈树
支付函数
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)

练习:
参与人1(丈夫)和参与人2(妻子)必须独立决定出门时是否带伞。 他们知道下雨和不下雨的可能性军委50%,支付函数为:如果只有 一人带伞,下雨时带伞者的效用为-2.5,不带伞者的效用为-3不下 雨时带伞的效用为-1,不带的效用为0;如两人都不带伞,下雨时每人 的效用为-5,不下雨时每人的效用为1;给出下列四种情况下的扩展 式及战略式表述: (1)两人出门前都不知道是否会下雨;并且两人同时决定是否带伞 (即每一方在决策时都不知道对方的决策);


子博弈定义:一个扩展式博弈的子博弈G由一 个决策结x和所有该决策结的后续结T(x)(包括 终点结)组成,它满足下列条件: (1)x是一个单结点信息集,即h(x)={x}; 1 (2)对于所有的 x T ( x) ,如果 x h( x1 ) , 那么 x T ( x).
条件(1)和(2)意味着子博弈不能切割原博 弈的信息集。


序贯理性:指不论过去发生了什么,参 与人应该在博弈的每一个时点上最优化 自己的决策。 子博弈精炼纳什均衡要求所有参与者都 是序贯理性的。
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡

• • • • •
一 博弈扩展式表述 二 子博弈精练纳什均衡
扩展式表述博弈的纳什均衡 子博弈精练纳什均衡 用逆向归纳法求子搏弈精练纳什均衡 承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问题
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡

• • • • •
一 博弈扩展式表述 二 子博弈精练纳什均衡
扩展式表述博弈的纳什均衡 子博弈精练纳什均衡 用逆向归纳法求子搏弈精练纳什均衡 承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问题

三 应用举例
子博弈精炼纳什均衡

泽尔腾引入子博弈精练纳什均衡的概念 的目的是将那些不可置信威胁战略的纳 什均衡从均衡中剔除,从而给出动态博 弈的一个合理的预测结果,简单说,子 博弈精练纳什均衡要求均衡战略的行为 规则在每一个信息集上是最优的。

完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)
A
开发 不开发
开发
x
不开发 开发
x’
不开发
B
开发
x
不开发
B
开发
x’
(-3,-3)
(1,0)
(0,1)
(0,0)
子博弈I
子博弈II
不开发
b
c
(-3,-3)
(1,0) (0,1)
(0,0)
a
房地产开发博弈
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)
A
开发 不开发
对于(不开发,(开发,开发)), 这个组合之所以构成纳什均衡,是因 为B威胁不论A开发还是不开发,他都 将选择开发,A相信了B的威胁,不开 发是最优选择,但是A为什么要相信B 的威胁呢?
毕竟,如果A真开发,B选择开发 得-3,不开发得0,所以B的最优选择 是不开发。如果A知道B是理性的,A 将选择开发,逼迫B选择不开发。自 己得1,B得0,即纳什均衡(不开发, (开发,开发))是不可置信的。因 为它依赖于B的一个不可置信的威胁。 同样: (不开发,不开发)也是一
子博弈精练纳什均衡

泽尔腾引入子博弈精练纳什均衡的概念的目的 是将那些不可置信威胁战略的纳什均衡从均衡 中剔除,从而给出动态博弈的一个合理的预测 结果,简单说,子博弈精练纳什均衡要求均衡 战略的行为规则在每一个信息集上是最优的。 什么是子博弈,什么是子博弈精练纳什均衡? 有没有更好的方法找到子博弈精练纳什均衡?
对于有限完 美信息博弈,逆 向归纳法求解子 博弈精练纳什均 衡是一个最简便 的方法。
B
开发
x’
开发
(-3,-3)
(1,0) (0,1) 房地产开发博弈
(0,0)
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)
1
子博弈精练纳什均衡 ((U,U’),L). U’和L分别是参与人1和 参与人2在非均衡路径上的 选择。 逆向归纳法求解子博弈 精练纳什均衡的过程,实质 上是重复剔除劣战略的过程: 从最后一个决策结依次剔除 每个子博弈的劣战略,最后 生存下来的战略构成精练纳 什均衡。 U D
(0,0)
(c) 判断下列均衡结 果哪个构成子博弈精练 纳什均衡? (b)
子博弈I
子博弈II
(不开发,(开发,开发)),(开发,(不开发,开发),(开发,(不开发,不开发)) 在c上构成均衡,在b上不构成; 在b和c上都构成 在c上构成均衡,在b上不构成
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)


(2)两人在出门前都不知道是否会下雨,但丈夫先决策,妻子观察到 丈夫是否带伞后才决定自己是否带伞;
(3)丈夫出门前知道是否会下雨,但妻子不知道,但丈夫先决策,妻 子后决策; (4),同(3),但妻子先决策,丈夫后决策.


第三章 完全信息动态搏弈 -子博弈精炼纳什均衡

• • • • •
一 博弈扩展式表述 二 子博弈精练纳什均衡



1 0 0 5 0 0 第第 一四 季季
承诺行动与子博弈精练纳什均衡
曹操与袁绍的仓亭之战, 曹操召集将领来献破袁之策, 程昱献了十面埋伏之计,他 让曹操退军河上,诱袁前来 追击,到那时“我军无退路, 必将死战,可退袁矣”。 曹操采纳此计,令许褚 诱袁军军至河上,曹军无退 路,操大呼曰:“前无去路, 诸军何不死战!”,众军奋 力回头反击,袁军大败。
2,0
L
2 R
1
(1,1)
U’
D’
(3,0)
(0,2)
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)

用逆向归纳法求解的子博弈精 练纳什均衡要求“所有的参与 人是理性的”是共同知识。
如果博弈由多个阶段组成,则 从逆向归纳法得到的均衡可能 并不非常令人信服。

完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)
扩展式表述博弈的纳什均衡 子博弈精练纳什均衡 用逆向归纳法求子搏弈精练纳什均衡 承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问题

三 应用举例
承诺行动与子博弈精练纳什均衡

承诺行动与子博弈精练纳什均衡

有些战略之所以不是精练纳什均衡,是因为它包含了不可置 信的威胁战略,如果参与人能在博弈之前采取某种行动改变 自己的行动空间或支付函数,原来不可置信威胁将变得可置 信,博弈的精练纳什均衡也会随之改变. 这些改变博弈结果而采取的措施称为承诺行动. 完全承诺:承诺可以使某项行动完全没有可能(破釜沉舟). 不完全承诺:承诺只是增加了某个行动的成本而不是使该活 动完全没有可能.

如果一个博弈有几个子博弈,一个特定的纳什均衡决 定了原博弈树上唯一的一条路径,这条路径称为“均 衡路径”,博弈树上的其他路径称为“非均衡路径”。 纳什均衡只要求均衡战略在均衡路径的决策结上是最 优的;
而构成子博弈精练纳什均衡不仅要求在均衡路径上策 略是最优的,而且在非均衡路径上的决策结上也是最 优的。这是纳什均衡与子博弈精练纳什均衡的实质区 别。


完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)

战略是参与人行动规则的完备描述,它要告诉参与人 在每一种可预见的情况下(即每一个决策结)上选择 什么行动,即使这种情况实际上没有发生(甚至参与 人并不预期它会发生)。 因此,只有当一个战略规定的行动规则在所有可能的 情况下都是最优的,它才是一个合理的可置信的战略, 子博弈精练纳什均衡就是要剔除那些只在特定情况下 是合理的而在其他情况下不合理的行动规则。
简言之,一个战略组合是子博弈精炼纳什均衡, 当且仅当在每一个子博弈上都构成一个纳什均衡。

完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)
A
开发 不开发
开发
x
不开发 开发
x’
不开发
B
开发
x
不开发
B
开发
x’
(-3,-3)
(1,0)
(0,1)
(0,0)
不开发
(-3,-3)
(1,0) (0,1) (a) 房地产开发博弈
子博弈精炼纳什均衡-不可置信威胁

美国普林斯顿大学古尔教授在1997年的《经济学 透视》里发表文章,提出一个例子说明威胁的可 信性问题:
两兄弟为玩具吵架,哥哥老是要抢弟弟的玩具, 不耐烦的父亲宣布政策:好好去玩,不要吵我, 不管你们谁向我告状,我都把你们两个关起来, 关起来比没有玩具更可怕。现在,哥哥又把弟弟 的玩具抢去玩了,弟弟没有办法,只好说:快把 玩具还我,不然我就要去告诉爸爸。
(-8,-8)
(不开发,(开发,开发)),(开发,(不开发,开发),(开发,(不开发,不开发))
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)

子博弈精练纳什均衡:


扩展式博弈的战略组合是一个子博弈 精练纳什均衡,如果: (1)它是原博弈的纳什均衡; (2)它在每一个子博弈上给出纳什均衡。
A
开发
不开发
开发
x
x’
开发 不开发
不开发
B
开发
x
不开发
B
开发
x’
不开发
(-3,-3)
(1,0)
A
(0,1)
(0,0)
子博弈I
坦白
子博弈II
抵赖
(-3,-3)
(1,0) (0,1) 房地产开发博弈
(0,0)
B 抵赖 坦白 坦白 (0,-10) (-10,0) (-1,-1) B
找出房地产开发博弈的子博弈
相关文档
最新文档