精炼贝叶斯均衡
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
则要求Pr ob{ah} 0,即参与人i必须以正的概率选择 a h ,否则,后验概率没
有定义.如果 Pr ob{a h} 0 ,我们允许Pr ob{ah} 0 在[0,1]区间取任 何值,只要所取的值Βιβλιοθήκη Baidu均衡战略相容.在动态博弈中,Pr ob{ k | ah} 对应的是
非均衡中径上的信息集
精炼贝叶斯均衡要求,给定有关其他参与人的类型的信念,参与人的战 略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡;并且,在所 有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人的类型的 信念.
N
让我们再一次考虑市场进入的例子: 高 [u]
在位者
低 [1-u]
P=4
进入者
P=5
进入
不进入 进入
博弈论与信息经济学 江西财经大学 陶长琪
4.1-2 贝叶斯法则
即i属于 k 并选择 a h的联合概率等于i属于 k的先验概率乘以给定a h的概率,或等
于
赵乐欢制i选作择历a h的经总1概0率天乘终以给于定a于h情2况0下0i5属.于1.1k的1日后验凌概率晨.基因此本,完我们成有,贝叶非斯常法则感谢
4.1-4 不完美信息博弈的精炼贝叶斯均衡
因为不完全信息博弈被模型为不完美信息博弈,精炼贝叶斯均衡概念也
适用于不完美信息博弈.举例如下:
赵乐欢制作历经10天终于于2L 005.1R.11日凌晨基本完成,非常感谢
刘艳艳同学第四章不完 及第六章,第M七章的文档!
全 信
(1,3)
息 博
[p]
2
弈
UB
(2,1)
P=6
不进入 进入
第一阶段: (2,0) (2,0) 第二阶段: (3,1) (7,0)
( 6,0) (3,1)
(6,0) (7,0) (7,0) (3,1)
不进入 进入
P=4 P=5
P=6
不进 入 进入
不进入 进入
不进入
(7,0)
(6,0)
(6,0) (9,0) (9,0) (8,0) (8,0)
(0,0)
[1-p]
U (0,2)
B (0,1)
这个博弈有两个纯战略纳什均衡:(L,B)和(M,U).(检查一下为什么
(L,B)是一个纳什均衡:给定参与人1选择L,参与人2的信息集没有
到达;给定参与人2选择B,L是参与人1的最选择.)进一步,因为
这个博弈只有一个子博弈,即原判博弈,(L,B)和(M,U)都是
统计学上,修正之前的判断称为“先验概率”,修正之后的判断称 为“后验概 率”.贝叶斯法则正是人们根据新的信息从先验概率得 到解决后验概率的基本 方法
我们用 Pr ob{ k | ah} 代表这个后验概率,即给定 a h 的 情况下, i 属于 类型 k 的概率:
Pr ob(ah , k ) p(ah | k ) p( k ) Pr ob{ k | ah}Pr ob{ah}
博弈论与信息经济学 江西财经大学 陶长琪
4.1-3 精炼贝叶斯均衡
~
~
~
定义:精炼贝叶斯均衡是一个战略组合 p ( p1,, pn ) 和一个
赵乐欢制后作验历概经率组10合天s*终( )于 (于s1*(210), 05, s.n*1(.1n )1),日满凌足晨:基本完成,非常感谢
刘艳艳同(A学) 对第于四所章有的及参第与六人章i,,在第每一七个章信的息文集档h !
子博弈精炼纳什均衡.但是,精炼纳什均衡(L,B)显然依赖于一个
不可置信的威胁:如果博弈进入参与人2的信息集,U严格优于B,选
择B不是序贯理性的;顺此,参与人1不应该相信参与人2会选择 B.尽
管子博弈精炼均衡不能剔除(L,B),我们可以使用精炼贝叶斯均衡
剔除(L,B)
博弈论与信息经济学 江西财经大学 陶长琪
~
si* (si ,i ) arg max
pi ( i | ahi )ui (si , si ,i );
~
(B)pi (i | ahi ) 是使用贝叶斯法则从先验概率 pi (i | i,) 观测到的
a
h和最优战略
i
s
*
i
(.)
得到(在可能的情况下)
博弈论与信息经济学 江西财经大学 陶长琪
(7,0)
(5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
博弈论与信息经济学 江西财经大学图4.陶1长市琪场进入博弈
4.1-1 基本思路
注意:进入者第一阶段的利润恒为0.我们省略了第二阶段博弈的扩展式,代 之以库诺特均衡支付向量和垄断利润.这样做的理由是,在博弈进入第二阶段后, 如果进入者已经进入,库诺特均衡产量(和对应的价格)是每个企业的最优选择;
4.1-1 基本思路
博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的 过程 。
精炼贝叶斯均衡是不完全信息动态博弈均衡的基本均衡概念,它是泽尔
赵乐欢制腾作(历Se经lte1n0)天的终完全于信于息2动0态0博5.弈1.子11博日弈精凌炼晨纳基什均本衡完和成海萨,尼非常感谢 刘艳艳同(学H第ars四an章yi)及的第不六完全章信,息第表态七博章弈的贝叶文斯档均!衡的结合。
赵乐如欢果制进作入者历没经有1进0入天,终单于阶段于垄2断0产05量.1(.1和1价日格凌)是晨在基位本者的完最成优,选非择。常感谢 刘艳精艳炼同贝学叶斯第均四衡章(p及er第fec六t B章ay,es第ian七eq章ui的libr文ium档)!是贝叶斯均衡、子博弈精炼
均衡和贝叶斯推断的结合它要求:(1)在每一个信息集上,决策者必须有一个 定义在属于该信息集的所有决策结上的一个概率分布(信念);(2)给定该信 息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;(3) 每一个参与人根据贝叶斯法则和均衡战略修正后验概率。
刘艳艳P同r o学b{第 k四| 章ah及} 第p六(章aPhr,|o第bk{)七aph章(}的k )文档K!p(pa(ha
|
h|
k ) p( k ) j ) p( j
)
j 1
应该指出的是,贝叶斯法则并不是一个技术性法则,而是人们修正信念的唯一合 理方法.
精炼贝叶斯均衡假定参与人是根据贝叶斯法则修正先验概率的.不过,贝叶斯法
4.2 信号传递博弈及其应用举例
定义 :领带传递博弈的精炼贝叶斯均衡是战略组合(m*( ), a*(m)) 和后验概率 ~
有定义.如果 Pr ob{a h} 0 ,我们允许Pr ob{ah} 0 在[0,1]区间取任 何值,只要所取的值Βιβλιοθήκη Baidu均衡战略相容.在动态博弈中,Pr ob{ k | ah} 对应的是
非均衡中径上的信息集
精炼贝叶斯均衡要求,给定有关其他参与人的类型的信念,参与人的战 略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡;并且,在所 有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人的类型的 信念.
N
让我们再一次考虑市场进入的例子: 高 [u]
在位者
低 [1-u]
P=4
进入者
P=5
进入
不进入 进入
博弈论与信息经济学 江西财经大学 陶长琪
4.1-2 贝叶斯法则
即i属于 k 并选择 a h的联合概率等于i属于 k的先验概率乘以给定a h的概率,或等
于
赵乐欢制i选作择历a h的经总1概0率天乘终以给于定a于h情2况0下0i5属.于1.1k的1日后验凌概率晨.基因此本,完我们成有,贝叶非斯常法则感谢
4.1-4 不完美信息博弈的精炼贝叶斯均衡
因为不完全信息博弈被模型为不完美信息博弈,精炼贝叶斯均衡概念也
适用于不完美信息博弈.举例如下:
赵乐欢制作历经10天终于于2L 005.1R.11日凌晨基本完成,非常感谢
刘艳艳同学第四章不完 及第六章,第M七章的文档!
全 信
(1,3)
息 博
[p]
2
弈
UB
(2,1)
P=6
不进入 进入
第一阶段: (2,0) (2,0) 第二阶段: (3,1) (7,0)
( 6,0) (3,1)
(6,0) (7,0) (7,0) (3,1)
不进入 进入
P=4 P=5
P=6
不进 入 进入
不进入 进入
不进入
(7,0)
(6,0)
(6,0) (9,0) (9,0) (8,0) (8,0)
(0,0)
[1-p]
U (0,2)
B (0,1)
这个博弈有两个纯战略纳什均衡:(L,B)和(M,U).(检查一下为什么
(L,B)是一个纳什均衡:给定参与人1选择L,参与人2的信息集没有
到达;给定参与人2选择B,L是参与人1的最选择.)进一步,因为
这个博弈只有一个子博弈,即原判博弈,(L,B)和(M,U)都是
统计学上,修正之前的判断称为“先验概率”,修正之后的判断称 为“后验概 率”.贝叶斯法则正是人们根据新的信息从先验概率得 到解决后验概率的基本 方法
我们用 Pr ob{ k | ah} 代表这个后验概率,即给定 a h 的 情况下, i 属于 类型 k 的概率:
Pr ob(ah , k ) p(ah | k ) p( k ) Pr ob{ k | ah}Pr ob{ah}
博弈论与信息经济学 江西财经大学 陶长琪
4.1-3 精炼贝叶斯均衡
~
~
~
定义:精炼贝叶斯均衡是一个战略组合 p ( p1,, pn ) 和一个
赵乐欢制后作验历概经率组10合天s*终( )于 (于s1*(210), 05, s.n*1(.1n )1),日满凌足晨:基本完成,非常感谢
刘艳艳同(A学) 对第于四所章有的及参第与六人章i,,在第每一七个章信的息文集档h !
子博弈精炼纳什均衡.但是,精炼纳什均衡(L,B)显然依赖于一个
不可置信的威胁:如果博弈进入参与人2的信息集,U严格优于B,选
择B不是序贯理性的;顺此,参与人1不应该相信参与人2会选择 B.尽
管子博弈精炼均衡不能剔除(L,B),我们可以使用精炼贝叶斯均衡
剔除(L,B)
博弈论与信息经济学 江西财经大学 陶长琪
~
si* (si ,i ) arg max
pi ( i | ahi )ui (si , si ,i );
~
(B)pi (i | ahi ) 是使用贝叶斯法则从先验概率 pi (i | i,) 观测到的
a
h和最优战略
i
s
*
i
(.)
得到(在可能的情况下)
博弈论与信息经济学 江西财经大学 陶长琪
(7,0)
(5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
博弈论与信息经济学 江西财经大学图4.陶1长市琪场进入博弈
4.1-1 基本思路
注意:进入者第一阶段的利润恒为0.我们省略了第二阶段博弈的扩展式,代 之以库诺特均衡支付向量和垄断利润.这样做的理由是,在博弈进入第二阶段后, 如果进入者已经进入,库诺特均衡产量(和对应的价格)是每个企业的最优选择;
4.1-1 基本思路
博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的 过程 。
精炼贝叶斯均衡是不完全信息动态博弈均衡的基本均衡概念,它是泽尔
赵乐欢制腾作(历Se经lte1n0)天的终完全于信于息2动0态0博5.弈1.子11博日弈精凌炼晨纳基什均本衡完和成海萨,尼非常感谢 刘艳艳同(学H第ars四an章yi)及的第不六完全章信,息第表态七博章弈的贝叶文斯档均!衡的结合。
赵乐如欢果制进作入者历没经有1进0入天,终单于阶段于垄2断0产05量.1(.1和1价日格凌)是晨在基位本者的完最成优,选非择。常感谢 刘艳精艳炼同贝学叶斯第均四衡章(p及er第fec六t B章ay,es第ian七eq章ui的libr文ium档)!是贝叶斯均衡、子博弈精炼
均衡和贝叶斯推断的结合它要求:(1)在每一个信息集上,决策者必须有一个 定义在属于该信息集的所有决策结上的一个概率分布(信念);(2)给定该信 息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;(3) 每一个参与人根据贝叶斯法则和均衡战略修正后验概率。
刘艳艳P同r o学b{第 k四| 章ah及} 第p六(章aPhr,|o第bk{)七aph章(}的k )文档K!p(pa(ha
|
h|
k ) p( k ) j ) p( j
)
j 1
应该指出的是,贝叶斯法则并不是一个技术性法则,而是人们修正信念的唯一合 理方法.
精炼贝叶斯均衡假定参与人是根据贝叶斯法则修正先验概率的.不过,贝叶斯法
4.2 信号传递博弈及其应用举例
定义 :领带传递博弈的精炼贝叶斯均衡是战略组合(m*( ), a*(m)) 和后验概率 ~