第4章 不完全信息动态博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(7,0) (3,1)
(7,0) (7,0)
(6,0) (5,-1)
(6,0) (9,0)
(9,0) (5,-1)
(9,0) (9,0)
(8,0) (5,-1)
(8,0) (9,0)
博弈论与信息经济学 江西财经大学 陶长琪
图4.1 市场进入博弈
4.1-1 基本思路
注意:进入者第一阶段的利润恒为0.我们省略了第二阶段博弈的扩展式,代 之以库诺特均衡支付向量和垄断利润.这样做的理由是,在博弈进入第二阶段后, 如果进入者已经进入,库诺特均衡产量(和对应的价格)是每个企业的最优选择; 如果进入者没有进入,单阶段垄断产量(和价格)是在位者的最优选择。 赵乐欢制作历经 10天终于于2005.1.11日凌晨基本完成,非常感谢
博弈论与信息经济学 江西财经大学 陶长琪
4.1-3 精炼贝叶斯均衡
定义:精炼贝叶斯均衡是一个战略组合 p ( p1 , , pn ) 和一个 * * * s ( ) ( s ( ), , s (n )),满足: 后验概率组合 1 1 n 赵乐欢制作历经10天终于于2005.1.11 日凌晨基本完成,非常感谢 (A) 对于所有的参与人i,在每一个信息集h ! 刘艳艳同学第四章及第六章,第七章的文档
只有当下列条件满足时,高成本在位者才不会选择低成本在位者的均衡价 格: H H H L H ( A ) M D M ( p ) M 赵乐欢制作历经 10 天终于于 2005.1.11 日凌晨基本完成,非常感谢 或 1 1 1 1 1
L ( A' )M1H M1H ( p1 ) (M1H 刘艳艳同学第四章及第六章,第七章的文档 ! D1H )
(1,3)
[1-p]
[p] B (0,0)
2 (0,2)
U (2,1)
U
B (0,1)
这个博弈有两个纯战略纳什均衡:(L,B)和(M,U).(检查一下为什么 (L,B)是一个纳什均衡:给定参与人1选择L,参与人2的信息集没有 到达;给定参与人2选择B,L是参与人1的最选择.)进一步,因为 这个博弈只有一个子博弈,即原判博弈,(L,B)和(M,U)都是 子博弈精炼纳什均衡.但是,精炼纳什均衡(L,B)显然依赖于一个 不可置信的威胁:如果博弈进入参与人2的信息集,U严格优于B,选 择B不是序贯理性的;顺此,参与人1不应该相信参与人2会选择 B.尽 管子博弈精炼均衡不能剔除(L,B),我们可以使用精炼贝叶斯均衡 剔除(L,B) 博弈论与信息经济学 江西财经大学 陶长琪
只有当下列条件成立时,才是低成本在位者的均衡价格: L ( B)M1L ( p1 ) M1L M1L D1L 或
L ( B' )M1L M1L ( p1 ) (M1L D1L ) L L 为了使分析有意义,我们假定不存在p1 = pm的分离均衡,
L L 果 p= ,高成本的在位者也将选择 pm
博弈论与信息经济学 江西财经大学 陶长琪
4.2-1米尔格罗姆-罗伯茨 (Milgrom-Roberts)垄断限价模型
( SM ) ( M 1H ( p1 ) M 1L ( p1 )) 0 p2005.1.11 赵乐欢制作历经或 10天终于于 日凌晨基本完成,非常感谢 1
H L 刘艳艳同学第四章及第六章,第七章的文档 ! ( p1 ) M 1 ( p1 ) M 1
让我们再一次考虑市场进入的例子:
[u] 在位者 P=4 进入者 进入 不进入 进入
第一阶段: (2,0) (2,0) 第二阶段: (3,1) (7,0)
N
高 低 [1-u]
P=6 P=5 不进入 进入 不进入 进入
P=4
P=5 不进 入 进入 不进入 进入
P=6 不进入
( 6,0) (3,1)
(6,0) (7,0)
博弈论与信息经济学 江西财经大学 陶长琪
4.1-4 不完美信息博弈的精炼贝叶斯均衡
赵乐欢制作历经10天终于于2005.1.11 L R 日凌晨基本完成,非常感谢 不 刘艳艳同学第四章及第六章,第七章的文档 ! M 完
全 信 息 博 弈
因为不完全信息博弈被模型为不完美信息博弈,精炼贝叶斯均衡概念也 适用于不完美信息博弈.举例如下:
1
p
L 1
即:如
L (C)M1H M1H ( pm ) (M1H D1H )
为了找到满足条件(A)和(B)的,我们必须对需求函数和成本函数作 一些特定的假设.存在区间的关键假设是所谓的"斯宾塞-莫里斯条 (Spence-Mirrlees condition,又称分离条件(sorting condition)或单 交叉条件(single-crossing condition)
即i属于 k 并选择 a 的联合概率等于i属于 的先验概率乘以给定a 的概率,或等 于 k h h a a i 选择 的总概率乘以给定 情况下 i 属于 的后验概率.因此,我们有贝叶斯法则 赵乐欢制作历经10天终于于2005.1.11 日凌晨基本完成,非常感谢
h
kቤተ መጻሕፍቲ ባይዱ
h
刘艳艳同学第四章及第六章,第七章的文档 !p(a h | k ) p( k ) h k k p ( a | ) p ( ) k h
4. 不完全信息动态博弈
4.1 精炼贝叶斯纳什均衡
4.1.1 基本思路
4.3.2直观标准
4.3.3克瑞普斯-威尔逊(Kreps-
赵乐欢制作历经 10天终于于2005.1.11日凌晨基本完成,非常感谢 Wilson)序贯均衡 4.1.2 贝叶斯法则 刘艳艳同学第四章及第六章,第七章的文档!
4.1.3 4.1.4 精炼贝叶斯均衡
博弈论与信息经济学 江西财经大学 陶长琪
4.2-1米尔格罗姆-罗伯茨 (Milgrom-Roberts)垄断限价模型
垄断限制性定价模型(简称垄断限价模型)试图解释的问题是,价格作 为一种承诺是不可置信的,因为不论垄断者现在索取什么价格,一旦其 赵乐欢制作历经 10天终于于2005.1.11日凌晨基本完成,非常感谢 他企业进入,垄断者就会改变价格,因此,靠低价格是不可能阻止进入 刘艳艳同学第四章及第六章,第七章的文档 ! 的.米尔格罗姆和罗伯茨提出的解释是,垄断限价可能反映了这样一个 事实,即其他企业不知道垄断者的生产成本,垄断者谋略用低价格来告 诉其他企业自己是低成本,进入是无利可图的
p1
p1
这个条件说的是,改变价格对不同类型企业的利润的影响是不同的;特 别地,高成本企业比低成本企业更愿意选择高价格(或者说,更不愿意 选择低价格).容易证明,这个条件一般是满足的.(SpenceMirrlees条件是所有信号传递博弈分离均衡存在的基本条件.)如果成 本类型是连续分布的,条件(SM)变为 :
P r ob { |a } P r ob {a }
h
p(a
j 1
K
h
| j ) p( j )
应该指出的是,贝叶斯法则并不是一个技术性法则,而是人们修正信念的唯一合 理方法. 精炼贝叶斯均衡假定参与人是根据贝叶斯法则修正先验概率的.不过,贝叶斯法 则要求 Pr ob i必须以正的概率选择 a h ,否则,后验概率没 {a h } 0,即参与人 {a h } 0 ,我们允许Pr ob{a h } 0 在[0,1]区间取任 有定义.如果 Pr ob 何值,只要所取的值与均衡战略相容.在动态博弈中,Pr ob{ k | a h } 对应的是 非均衡中径上的信息集
2 M ( p, c) Q( p) (( p c)Q( p)) 0 pc pc p
从图4.5中可以看出,所有的满足分离均衡条件(A’)和(B’),其中是最 低成本分离价格,是最高成本分离价格.同样,上述必要条件也是充足 条件.证略 博弈论与信息经济学 江西财经大学 陶长琪
我们用 Pr ob{ | a } 代表这个后验概率,即给定 a 的 情况下, i 属于 类型 k 的概率:
k h
h
Prob(ah , k ) p(ah | k ) p( k ) Prob{ k | ah }Prob{ah }
博弈论与信息经济学 江西财经大学 陶长琪
4.1-2 贝叶斯法则
h s ( si , i ) arg max pi ( i | a i )ui ( si , si , i ); * i
h (B)pi ( i | ai ) 是使用贝叶斯法则从先验概率 ~
~
~
~
~
h s 和最优战略 a i
* i
( .)得到(在可能的情况下)
pi (i | i ,观测到的 )
4.3.4泽尔腾(Selten)的颤抖手精炼
均衡 4.4 不完全信息重复博弈与声誉 4.4.1 KWRW声誉模型 4.4.2声誉模型的一个应用:政府的 货币政策 4.5 博弈论均衡概念简要总结
不完美信息博弈的精炼贝叶
斯均衡 4.2 信息传递弈及其应用举例 4.3 精炼贝叶斯均衡的再精炼及其 他均衡概念 4.3.1剔除劣战略
刘艳艳同学第四章及第六章,第七章的文档 ! 精炼贝叶斯均衡(perfect Bayesian equilibrium)是贝叶斯均衡、子博弈精炼
均衡和贝叶斯推断的结合它要求:(1)在每一个信息集上,决策者必须有一个 定义在属于该信息集的所有决策结上的一个概率分布(信念);(2)给定该信 息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;(3) 每一个参与人根据贝叶斯法则和均衡战略修正后验概率。 统计学上,修正之前的判断称为“先验概率”,修正之后的判断称 为“后验概 率”.贝叶斯法则正是人们根据新的信息从先验概率得 到解决后验概率的基本 方法
4.2 信号传递博弈及其应用举例
赵乐欢制作历经10天终于于2005.1.11 日凌晨基本完成,非常感谢 ~ * ( p1 ) a (m) arg max p( | m)u2 (! m, a, ); 刘艳艳同学第四章及第六章,第七章的文档
(m* ( ), a* (m)) 和后验概率 定义 : 领带传递博弈的精炼贝叶斯均衡是战略组合 ~ 的 p ( | m) 结合,它满足:
回主目录 博弈论与信息经济学 江西财经大学 陶长琪
4.1-1 基本思路
博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的 过程 。 精炼贝叶斯均衡是不完全信息动态博弈均衡的基本均衡概念,它是泽尔 赵乐欢制作历经 10 天终于于2005.1.11日凌晨基本完成,非常感谢 腾(Selten )的完全信息动态博弈子博弈精炼纳什均衡和海萨尼 (Harsanyi)的不完全信息表态博弈贝叶斯均衡的结合。 刘艳艳同学第四章及第六章,第七章的文档 ! 精炼贝叶斯均衡要求,给定有关其他参与人的类型的信念,参与人的战 略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡;并且,在所 有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人的类型的 信念.
( p2 )m* ( ) arg maxu1 (m, a* (m), );
信号传递博弈的所有可能的精炼贝叶斯均衡可以划分成三类,即:分离均衡、混 同均衡和准分离均衡.分别定义如下: 分离均衡(separating equilibrium):不同类型的发送者(参与人1)以1的概 率选择不同的信号,或者说,没有任何类型选择与其他类型相同的信号.在分离 均衡下,信号准确地提示出类型 混同均衡(pooling equilibrium):不同类型的发送者(参与人1)选择相同的信号, 或者说,没有任何类型选择与其他类型不同的信号,因此,接收者(参与人2) 不修正先验概率(参与人1的选择没有信息量) 准分离均衡(semi-separating equilibrium):一些类型的发送者(参与人1)随 机地选择信号,另一些类型的发送者选择特定的信号.
(M1L D1L )
M1L M1L ( p1L )
M1H M1H ( p1L )
(M1H D1H )
p
pp
~
L m
H pm p
p1L
图4.5垄断限价模型 博弈论与信息经济学 江西财经大学 陶长琪
4.2-1米尔格罗姆-罗伯茨 (Milgrom-Roberts)垄断限价模型