不完全信息动态博弈(续1)——信号博弈
不完全信息动态博弈
创立目的就是和波音这样已成规模的公司竞争。
波音早于空客成立,所以当欧洲各国抢占市场时,波音早
已在欧洲站稳脚跟。波音公司先进入市场,就可能出现两种情
况——波音公司是一个“无先发优势”的企业,也可能是一个
“有先发优势”的企业。
第5页
2
波音与空客之战
第五章
不完全信息动态博弈
主要内容
第一节
不完全信息动态博弈
第二节
精炼贝叶斯纳什均衡
第三节
信号博弈
第四节
先验信念、策略互动、后验概率
第 2 页
第一节
不完全信息动态博弈
不完全信息动态博弈特点
波音与空客之战
第3页
1
不完全信息动态博弈特点
不完全信息动态博弈:指至少有一方参与者对于博弈的信息不是
完全了解,并且参与者的行动存在先后顺序。和不完全信息静态
由方程 2q1 q2 8 和 q1 2q2 8 可得:
q1=8/3,q2=8/3
在“无先发优势”条件下波音公司利润π(q1)=64/3,空客
公司利润为π(q2)=10/3。
也就是说,在波音公司是“无先发优势”条件下,空客
公司会选择生产,与波音公司竞争。
第 13 页
第二节
精炼贝叶斯纳什均衡
自己肯定选择策略R,所以对这个动态博弈来说,博弈路径必
定是甲选择策略T,乙选择策略R。
第 22 页
3
不可置信的威胁与可置信的威胁
不可置信威胁又称空洞威胁,是完全没有任何威胁作用的威
胁。比如在上述博弈中,乙为了让甲选择策略N,就对甲说,
如果不选择N,乙会选择策略L,局中人甲得益就是0,但甲选
不完全信息动态博弈
2的信息集在均衡 路径上
1
均衡(M,U)中,2的推断 一定是:给1的均衡战
略M,参与者2知道已
经到达了信息集中的哪 一个节,即p=1。
L M
精炼贝叶斯均衡为{M,U;p=1}
R
精炼贝叶斯均衡是均衡战略和
p
2
1-p 均衡信念的结合
(1,3)
U
B
B
U
(2,1)
(0,0)
(0,2)
(0,1)
设想存在一个混合战略均衡,其中参与者1选择M 的概率为q1,R的
后验信念:参与人根据贝叶斯法则和均衡战略修正后验 概率
后续博弈:从每个信息集开始的博弈的剩余部分称为一 个后续博弈。
一、精炼贝叶斯均衡
引入精炼贝叶斯均衡的目的是为了进一步强化(即加强对 条件的要求)贝叶斯纳什均衡,这和子博弈精炼纳什均衡 强化了纳什均衡是相同的。
如果参与者的战略要成为博弈的一个精炼贝叶斯均衡,它 们不仅必须是整个博弈的贝叶斯纳什均衡,而且还必须构 成每一个后续博弈的贝叶斯纳什均衡。如果参与者的战略 要成为一个子博弈精炼纳什均衡,则它们不仅必须是整个 博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。
(2,0
(8,0)
θ<1/2,下列战略组合是一个贝叶斯均衡:不论在位者选 择什么价格,进入者总是认为在位者高成本概率为 θ*<1/2 ,总是选择不进入;高成本在位者选择p=6,低成 本在位者选择p=5。
该均衡是否合理?——均衡中包含不可置信的战略。
一个合理均衡应满足如下要求:给定每个参与人有关其 他参与人类型的后验信念,参与人的战略组合在每个后 续博弈上构成贝叶斯均衡。
➢ 后行动者通过观察先行动者的行动来推断其类型或修正对其 类型的先验信念(概率分布),然后选择自己的行动。
第四部分 不完全信息动态博弈 第六章 信号博弈(signalling games)
a1
[1]
m1
a2 R
a1 [0]
a2
m1
S
t1
N 1- t2
S
m2
[0] a1
a2
R
[1] a1
m2
a2
• 结论:[(m1,m2), (a1,a2), p=1, q=0]是博弈的分离完美Bayes均衡。
厂商的分离均衡纯策略(保修,不保修)
(1,0.5) Y [1] (0,0) N 客户
(-1,-0.5) Y [0]
• SR(1):μ(软弱/热狗)=p;μ(粗暴/热狗)=1-p;μ(软弱/啤酒)=q; μ(粗暴/啤酒)=1-q
• 发送者的纯策略:(热狗,热狗), (热狗,啤酒), (啤酒,热狗), (啤 酒,啤酒)
• 接收者的纯策略:(冲突,冲突), (冲突,不冲突), (不冲突,冲突), (不冲突,不冲突)
1、发送者的分离均衡纯策略(热狗,啤酒)
(ti m j ) 1
t i T
a1 [p] m1 a2
S
m2
[q] a1
t1
a2
R
a1 [1-p]
a2
m1
N 1- t2
S
R
[1-q] a1
m2
a2
条件R2
• 在给定的信念下,局中人的策略必须是序贯理 性的(sequentially rational)。就是说,在每一 个信息集,具行动的局中人所采取的行动(以 及局中人往后的行动)在给定该局中人在该信 息集上的信念与其他局中人以后的策略下必须 是最优的。
1 R (1,3)
L
M
p
2
1-p
A
BA B
(2,1) (0,0) (0,2) (0,1)
不完全信息动态博弈
不完全信息动态博弈不完全信息动态博弈(Dynamic Games with Incomplete Information)[编辑]什么是不完全信息动态博弈在动态博弈中,行动有先后次序;在不完全信息条件下,博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率,即知道“自然”参与人的不同类型与相应选择之间的关系,但是,参与人并不知道其他的参与人具体属于哪一种类型。
由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。
在不完全信息动态博弈一开始,某一参与人根据其他参与人的不同类型及其所属类型的概率分布,建立自己的初步判断。
当博弈开始后,该参与人就可以根据他所观察到的其他参与人的实际行动,来修正自己的初步判断。
并根据这种不断变化的判断,选择自己的策略。
[编辑]相关例子以下是几个关于不完全信息动态博弈的例子:1.黔驴技穷精炼贝叶斯均衡是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态博弈的贝叶斯纳什均衡的结合。
贝叶斯方法是概率统计中的一种分析方法。
它是指根据所观察到现象的有关特征,并对有关特征的概率分布的主观判断(即先验概率)进行修正的标准方法。
中国著名成语故事黔驴技穷,就是贝叶斯方法思想的一个典型表达。
老虎没有见过驴子,因而不知道自己比驴子强还是弱。
老虎的战略是:如果自己弱,那就只能躲,如果自己强,那就吃驴子。
对于自己并不了解驴子,老虎的做法是不断试探,通过试探,修改自己对驴子的看法。
如果驴子表现温顺无能,老虎就认为驴子是美食的概率比较大,起初驴子没有反应,老虎认为驴子不像强敌,胆子越来越大。
后来驴子大叫,老虎以为驴子要吃它,吓的逃走,但后来想想,又觉得不一定,于是继续试探,直到驴子踢老虎,老虎才觉得驴子“仅此技耳”,于是采取自己强时的最优行动——吃驴子。
2.信号传递由于信息不完全,每个人都希望向对方传递对自己有利的信号。
比如,在招聘时,应聘者总是显示自己最好的一面。
博弈论四种博弈类型
华为在阿根廷电信设备市场上的竞争博弈华为技术有限公司是一家总部位于中国广东省深圳市的生产销售电信设备的员工持股的民营科技公司,经过数十年的发展,成为全球最大的电信网络解决方案提供商,全球第二大电信基站设备供应商,同时也是全球第六大手机厂商,其海外市场的利润占到其总利润的75%。
在华为进入阿根廷电信设备市场之前,阿根廷的电信设备市场由爱立信、阿尔卡特-朗讯以及阿根廷本土设备供应商三家共同分享市场份额,接下来,我们将分析其不同条件下的博弈结果:1、完全信息情况下的静态博弈A 、纳什均衡:我们将上述三家公司统称为原有垄断者,华为称为虎视眈眈的潜在进入者,原有垄断者想要保住自己现有的垄断地位,就会想要阻止潜在进入者进入,在这个博弈中,原有垄断者有两种选择:一是进行斗争,打价格战;二是不斗争,默许其进入从而共同竞争,具体的支付矩阵结果表示如下:原有垄断者潜在进入者 进入 不进入根据纳什均衡的定义:各个参与者所做的是在给定其他参与者的策略是所能够做出的最好的一组策略。
当潜在进入者选择进入时,原有垄断者的最优选择是不斗争,获得70单位的利润;同样的,原有垄断者选择不斗争的情况下,潜在进入者的最优选择是进入,获得20单位的利润,从而获得一个要求纳什均衡的均衡(进入,不斗争),同理可以得出另一个纳什均衡(不进入,斗争)。
B 、占优策略:现假设华为公司已经获得了阿根廷电信集团的经营许可证,在严格管制情况下二者都不能以低于成本的价格进行价格战,同时禁止出现单一寡头垄断的情形,(各自均有正的利润)在这两种情况下考虑两者是否进行价格战的情况,具体支付矩阵如下所示:原有垄断者 低价 高价潜在进入者低价 高价对于潜在进入者而言,不论原有垄断者是否进行价格战,潜在进入者的占优策略都是进行价格战,因为在原有垄断者定低价时,潜在进入者定低价可以获得额外的20单位利润,在原有垄断者定高价时,潜在进入者定低价可以获得额外的10单位利润,从而确定华为必将进行价格战,在完全信息情况下,原有垄断者会将自己置于潜在进入者的位置进行决策,从而决定自己也要进行价格战,否则会失去更多的利润。
@第7章 不完全信息动态博弈
三 、 信 号 博 弈
1. 行为传递的信息和信号机制 2. 信号博弈模型和完美贝叶斯均衡 3. 股权换投资 4.劳动市场信号博弈
行为传递的信息和信号机制
• 萨摩亚岛居民的文身;波那佩岛的山药;孔雀开屏; 蛙鸣 • 信号:经济或其他活动中具有信息传递作用的行为 • 信号机制:通过信号传递信息的过程 • 信号发出方:通过行为传递信息的一方 • 信号接收方:获得信息的一方 • 二手车模型中昂贵的承诺
连续型声明博弈
• 声明方类型标准分布于区间[0,1],即T=[0,1],行为方 的行动空间A= [0,1]。 • 声明方得益函数 ,行为方得益函 数 。 (t , a ) = −[a − (t + b)] U U (t , a ) = −(a − t )
2 S
2
R
可以看出,当声明方类型为t时,声明方最希望的行为 方行为是 ,而行为方对自己最有利的行动是 。
(一)声明的信息传递作用
二 、 空 口 声 明 博 弈
•声明 声明:消费者偏好,企业新闻发布会,国家间威胁恐吓。 声明 •声明不直接影响事物、利益,但往往影响接受声明者行为, 通过接受声明者行为对利益产生影响。 •声明无或几乎无成本,接受者不一定采取有利于声明者的 行为,因为双方利益往往不一致,因此声明的真实性没有保 证。接受者不会轻易相信声明。 •声明的影响取决于接受者的理解、判断和反应。 •当声明者和接受者利益一致或没有冲突时,声明会使接受 者相信。房客声明不喜欢暖气太足房东会相信;工人提出有 恐高症不适合高空作业雇主会相信;顾客喜欢甜或咸厨师会 相信。工人声明自己高素质雇主并不会轻易相信因为相信。
一、不完全信息动态博弈的海萨尼转换
二、空口声明博弈 三、信号博弈 四、不完全信息下的谈判博弈 五、有限次重复囚徒困境中的声誉模型
不完全信息动态博弈
4 不完全信息动态博弈4.1 精炼贝叶斯均衡概述不完全信息动态博弈就其基本要素来看是不完全信息与博弈的动态性质的一种综合。
在处理不完全信息要素时,通过将某些参与人“类型”的不确定性作为信息不完全性的一种表征,这种方法将继续得以采用,即博弈中参与人面临的信息不完全性(无论它是指何种信息)将完全由某些参与人的“类型”的不确定性加以刻画。
同时,作为动态博弈,“序贯理性”的思想将一直得到贯彻。
我们在不完全信息动态博弈中将信息不完全程度削减到零,则不完全信息动态博弈就自然应退化成一种完全信息动态博弈,其相应的精炼均衡概念就由精炼贝叶斯回到子博弈精炼均衡。
从这种意义上来看,不完全信息动态博弈的精炼均衡概念是子博弈精炼均衡概念的一种推广,正如不完全信息动态博弈应被视作完全信息动态博弈的一种推广一样。
例简单的非完全信息动态博弈Nt1(p) t2 (1–p)1 1L R L R2 2L R L R L R L Ru1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2参与人1的类型t 为个人信息。
参与人2 不知道t ,但知道t 的概率分布。
博弈的时序:(1)参与人1选择行动a 1 A 1;(2)参与人2观察a 1,选择a 2 A 2博弈的收益: u 1 (a 1, a 2, t ), u 2 (a 1, a 2, t )精炼贝叶斯均衡博弈的纳什均衡是一种“僵持”状态的战略组合,当所有的参与人都选择该战略组合中给出的相应战略时,任何一个参与人都不会有单方面偏离这一选择的动机。
作为动态博弈,一个战略是参与人在其可能进行行动选择的所有信息集上将作何选择的一整套规定或计划,而作为不完全信息博弈,这种规定或计划还是“类型依存”的,即不同类型的参与人将选择不同的战略规定。
因此,一个不完全信息动态博弈的纳什均衡将是指这样的一种类型依存性的战略组合(或战略组合的族),当给定其他参与人的战略时(其他参与人的战略是类型依存的,所以,说给定其他参与人的战略即指给定其他参与人的战略与类型的依存关系),任一参与人在其任何类型下由该组合给出的类型依存战略是其最优的。
信息经济学(博弈论与信息经济学)讲义11不完全信息动态博弈-.
1 1 / 2 1 Pr ob{GP GT } 1 1 / 2 1 1 / 2 2
3、介于上述两种情况之间:好人肯定会干,但坏人可能会干也可能不 会干:p(GT|GP)=1/2 p(GT|BP)=1/2
1 1 / 2 2 Pr ob{GP GT } 1 1 / 2 1 / 2 1 / 2 3
在均衡情况下,在位者究竟选择什么价格,不仅与成 本函数有关,而且与进入者的先验概率x有关。而不关 x为多少,单阶段最优垄断价格不构成均衡。
基本思路-不完全信息动态博弈
在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡 该概念没有规定参与人如何修正自己的信念。但是,如果 进入者可以任意修订自己有关在位者成本函数的信念,上 述不完全信息动态博弈可以有任意均衡。 如假定x<1/2,下列战略组合是一个贝叶斯均衡:不论在 位者选择什么价格,进入者总认为在位者是低成本的概率 为x*<1/2,总是选择不进入;搞成本在位者选择p=6,低成 本在位者选择p=5。 但显然这个均衡是不合理的,因为它包含了一个不可置信 威胁:进入者不会修正对在位者成本函数的信念。
p (a h k ) p ( k ) P r ob{a }
h
P r ob{ k a h }
p (a h k ) p ( k )
h j j p ( a ) p ( ) j 1 k
贝叶斯法则
人:好人(GP),坏人(BP) 事:好事(GT),坏事(BP) 一个好人干好事的概率等于他是好人的概率p(GP)乘以好 人干好事的概率p(GT|GP),加上他是坏人的概率p(BP) 乘以坏人干好事的概率p(GT|BP): Prob{GT}= p(GT|GP)* p(GP)+ p(GT|BP)* p(GT|BP) 假定观测到一个人干了一件好事,那么这个人的是好人的 后验概率是:
博弈的四种基本类型
博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。
例如,囚徒困境。
2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争。
3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈。
4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。
例如,信号传递博弈。
每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。
例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。
完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。
不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。
不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。
例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。
博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。
举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。
你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。
二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。
举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。
不完全信息动态博弈(续1)——信号博弈
一 精练贝叶斯纳什均衡
基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡
二 信号传递博弈及其应用举例
精练贝叶斯纳什均衡的定义
定义:精炼贝叶斯均衡是一个战略组合 s*( ) (s1*(1), pn ,满足: 和一个后验概率组合p= p1 (P)对于所有的参与人i,在每一个信息集h, h si ( si , i ) arg max pi ( i a i )ui ( si , s i , i )
分离均衡:不同类型的发送者(参与人1)以1的概 率选择不同的信号,或者说,没有任何类型选择与 其他类型相同的信号;在分离均衡下,信号准确地 揭示出类型。 混同均衡:不同类型的发送者选择相同的信号,或 者说,没有任何类型选择与其他类型不同的信号, 因此,接收者不修正先验概率。 准分离均衡:一些类型的发送者随机地选择信号, 另一些类型的发送者选择特定的信号。
在K=J=2时的信号传递博弈模型
这里p=p(t1|m1),q=p(ti|m2)(省略了得益):
t1
1 N
[p]
t2
[1-p]
1
m1
[P]2 a1 a2
m2
[ q] 2 a1 a2
m1
[1-p] 2 a1 a2
m2
2 [1-q] a1 a2
在K=J=2时信号传递博弈的四种纯战略
信号发送者(参与人1)的四种纯战略:
1 1 2 t 2 2 2 p ( t m ) u ( m , a , t ) u ( m , a, t 2 ) 2 2 t
即: a* (m1 ) arg max u2 (m1 , a, t1 )
不完全信息动态博弈(续1)——信号博弈共52页
46、我们若已接受最坏的,就再没有什么损失。——卡耐基 47、书到用时方恨少、事非经过不知难。——陆游 48、书籍把我们引入最美好的社会,使我们认识各个时代的伟大智者。——史美尔斯 49、熟读唐诗三百首,不会作诗也会吟。——孙洙 50、谁和我一样用功,谁就会和我一样成功。——莫扎特
不完全信息动基础有两个,而且只有两个……公平和实用。——伯克 7、有两种和平的暴力,那就是法律和礼节。——歌德
8、法律就是秩序,有好的法律才有好的秩序。——亚里士多德 9、上帝把法律和公平凑合在一起,可是人类却把它拆开。——查·科尔顿 10、一切法律都是无用的,因为好人用不着它们,而坏人又不会因为它们而变得规矩起来。——德谟耶克斯
信号博弈
Spence’s Job-Market Signalling
劳动力市场模型探讨了在劳动力市场上,当需要雇 佣劳动力的企业(或雇主)对出卖劳动力的工人的能力 不清楚时,工人如何通过选择自己接收教育的程度 向企业传递有关自己能力的信息。
这里有个假设就是教育并不能提高工人的能力。
s : HR A
其中,HR为接收者的信息集集合, 即HR={IR({x3,x4}), IL({x5,x6})}。
接收者有以下4种纯战略:
1) 战略(a1, a1)——如果发送者选择m1, 则接收者选择a1 ,即s(m1)=a1;如果发 送者选择m2 ,则接收者选择a1,即 s(m2)=a1; 2) 战略(a1, a2)——如果发送者选择m1, 则接收者选择a1 ,即s(m1)=a1;如果发 送者选择m2 ,则接收者选择a2,即 s(m2)=a2;
信号博弈(signaling games)是一类比较简 单而应用相当广泛的不完全信息动态博弈, 其基本特征是博弈参与人分为信号发送者 (Sender,用S表示)和信号接收者 (Receiver,用R表示)两类,信号发送者先 行动,发送一个关于自己类型的信号,信 号接收者根据所接收到的信号选择自己的 行动。
在信号博弈中,发送者发出的信号依赖于 自然赋予的类型,因此,先行动的信号发 送者的行动,对后行动的信号接收者来说, 具有传递信息的作用。同时,这又使得接 收者的行动依赖于发送者选择的信号。
考察信号博弈的一种简单情况的扩展式描述(不 考虑支付)
a1 x3 a2
接受者
m1
发送者 t1
m2
a1 x5 a2
3) 战略(m2,m1)——如果自然赋予t1,则发送 者选择m2,即s(t1)= m2;如果自然赋予t2, 则发送者选择m1,即s(t2)=m1; 4) 战略(m2, m2)——如果自然赋予t1,则发 送者选择m2,即s(t1)= m2;如果自然赋予 t2,则发送者选择m2,即s(t2)=m2。
07 不完全信息动态博弈
行为方行为
a1
声明方 类型
a2
1,1 2,0 1. 2. 3. 不同类型的声明方必须偏好行为方不同行为 对应声明方不同类型,行为方必须偏好不同行为 行为方的偏好必须与声明方具有一致性
t1 t2
2,0 1,1
不能传递信息(声明方 与行为方偏好相反)
练习
行为方行为
a1
声明方 t2 类型
t3
t1
0,1 0,0 0,0
信号博弈精炼贝叶斯均衡
1.信号接收方 R在观察到信号发出方 S的信号 m j 之后,必须有关于 S的类型 的判断,即 S选择 m j时, S是每种类型 ti的概率分布 p (ti | m j ) ≥ 0, ∑ p (ti |m j ) = 1
ti
2.给定 R的判断 p (ti | m j )和 S的信号 m j,R的行为 a * ( m j )必须使 R的期望得益 最大,即 a * ( m j )是最大化问题 max ∑ p (ti |m j )u R (ti , m j , ak )的解
引例2 引例2
N
[u ] 高
在位者 P=4 进入者 进 不进 进 进 不进 不进 进 P=6
底 [1 − u ]
P=5
P=4
P=5
P=6
进 不进
不进 进
不进
在位者的垄断利润情况 P=4 高成本 低成本 2 6 P=5 6 9 P=6 7 8
两企业同在市场的各自利润情况 均衡价格 高成本 低成本 5 4 在位者 3 5 进入者 3-2=1 1-2= -1
那么在第一阶段,低成本的甲权衡: 那么在第一阶段,低成本的甲权衡: 选择价格5 无法扭转乙的信念,甲的收益为14 14; 选择价格5,无法扭转乙的信念,甲的收益为14; 选择价格4 进一步揭示自己的低成本,则乙不进入,甲收益15 15; 选择价格4,进一步揭示自己的低成本,则乙不进入,甲收益15; 权衡比较选择价格4 权衡比较选择价格4 高成本的甲则需要权衡: 高成本的甲则需要权衡: 选择价格为6,导致乙坚定的进入市场,甲收益为10 选择价格为 ,导致乙坚定的进入市场,甲收益为 选择价格5,乙无法修正先验概率则进入,甲收益为9 选择价格 ,乙无法修正先验概率则进入,甲收益为 选择4不划算 选择 不划算 权衡比较选择价格6 权衡比较选择价格
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例题
下图是一个信号传递博弈:自然首先选择参与人1的类型,参与 人1知道自然的选择,参与人2 不知道,只知道参与人1属于类型 t1和t1的可能性相等,参与人1然后选择信号m1或m2,参与人2选 择行动a1或a2,博弈结束,支付向量如图所示,给出这个博弈所 有纯战略分离均衡和混同均衡。
1 1 2 t 2 2 2 p ( t m ) u ( m , a , t ) u ( m , a, t 2 ) 2 2 t
即: a* (m1 ) arg max u2 (m1 , a, t1 )
a
a* (m 2 ) arg max u2 (m 2 , a, t2 )
a
准分离均衡(semi-separating equilibrium):
m2
2 [1-q] a1 a2
信号传递博弈实际上是不完全信息情况 下的Stackelberg博弈
信号发出者是领头者(leader),信号接收者是尾随者 (Follower)。 当参与人1发出信号时,他预测到参与人2将根据他发出的信 号修正对自己类型的判断,因而他的问题是如何选择一个 最优的类型依存信号战略m*(tj)? 同样,参与人2知道参与人1选择的是给定类型和考虑信息效 应情况下的最优战略,因此他的问题是使用Bayes法则修 正对参与人1类型的判断,选择自己的最优行动a*(m)。
μ<1/2时,精练贝叶斯均衡为: 不论是高成本还是低成本,在 位者选择p=5;进入者进入, 当且仅当进入者观察到p=6(基 于(6)=1)。 混同均衡
N
[μ ] 高 低 [1-μ]
μ≥1/2时,精练贝叶斯均衡为: 低成本在位者选择p=4,高成本 在位者选择p=6;进入者选择不 进入,如果观测到p=4;进入者 选择进入,如果观测到p=6或 p=5(基于 (6)=1, (5)≥1/2)。 在位者 p=5 分离均衡 p=6
即: a* (m1 ) arg max[ p(t1 )u2 ( m1 , a, t1 ) p(t2 )u2 ( m1 , a, t2 )]
a
a* (m 2 ) arg max[ p(t1 )u2 ( m 2 , a, t1 ) p(t2 )u2 ( m 2 , a, t2 )]
a
在K=J=2时: 分离均衡
不同类型的发送者(参与人1)以概率1选择发送 不同的信号,这时信号准确地揭示出类型, u1(m1,a*(m),t1)>u1(m2,a*(m),t1); u1(m2,a*(m),t2)>u1(m1,a*(m),t2); 因此,后验概率是: p(t1|m1)=1,p(t1|m2)=0; p(t2|m1)=0,p(t2|m2)=1。
目录导航
一 精练贝叶斯纳什均衡
基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡
二 信号传递博弈及其应用举例
精练贝叶斯纳什均衡的定义
定义:精炼贝叶斯均衡是一个战略组合 s*( ) (s1*(1), pn ,满足: 和一个后验概率组合p= p1 (P)对于所有的参与人i,在每一个信息集h, h si ( si , i ) arg max pi ( i a i )ui ( si , s i , i )
p
(t1|m1)=
p(t1 ) 0 p(t2 )
p(t1 )
1
(1 ) p(t1 ) p(t1 ) 2 P (t1|m )= (1 ) p(t ) 1 p(t ) 1 2
P
(t2|m2)=
1 p(t2 ) p(t2 ) (1 ) p(t1 ) 1 p(t2 )
(4)双方的得益函数为u1(m,a,t)和u2(m,a,t )。 下图是一个简单的信号传递博弈的展开式表述,这 里K=J=H=2,p=p(t1|m1),q=p(ti|m2)(省略 了得益):
t1
1 N
[p]
t2
[1-p]
1
m1
[P]2 a1 a2
m2
[ q] 2 a1 a2
m1
[1-p] 2 a1 a2
在K=J=2时信号传递博弈的四种纯战略
信号接受者(参与人2)的四种纯战略:
战略1(总是选择a1):如果发送者选择信号m1,选择行动 a1;如果发送者选择信号m2,选择行动a1 。 战略2 (跟随mi选择ai) :如果发送者选择信号m1,选择 行动a1;如果发送者选择信号m2,选择行动a2。 战略3 (与mi相反选择aj,i≠j) :如果发送者选择信号m1, 选择行动a2;如果发送者选择信号m2,选择行动a1。
在K=J=2时的分离均衡
后验概率 p(t1|m1)=1,p(t1|m2)=0; p(t2|m1)=0,p(t2|m2)=1。 意味着:
p(t m)u (m, a, t ) p(t
2 t
1
m)u2 ( m, a, t1 ) p (t2 m)u2 ( m, a, t 2 )
1 2 1
从而
p(t m )u (m , a, t ) u (m , a, t )
(3,1)
参与人? 博弈顺序? 博弈结果? 市场进入博弈-2阶段不完全信息动态博弈
(7,0) (5,-1) (9,0) (5,-1)
(9,0) (5,-1)
(9,0)
信号博弈模型描述
假设: (1)参与人1的类型为ti∈T={t1,t2,…,tK} 参与人1知道ti,但参与人2不知道,只知道1的类型的先验概 率p(ti), Σp(ti)=1。 (2)参与人1在知道自己的类型后选择发出信号m∈M={m1, m2,…,mJ}。 (3)参与人2观测到参与人1发出的信号(但不是类型) 使用Bayes法则从先验概率p=p(ti)得到后验概率p=p(ti|m), 然后选择行动a∈A={a1,a2,…,aH};
即看到m1就知 道参与人1是 类型t1的;看 到m2就不能确 定1的类型, 但会推断属于 1的概率下降, 属于2的概率 上升了。
关于信号博弈模型的均衡
在所有上述三个定义中,都应该适当加 上参与人2的最优化条件和非均衡路径 上的后验概率。在只有两个类型和两 个信号的情况(即J=K=H=2)下,只 有混同均衡有非均衡路径,分离均衡 和准分离均衡的所有信息集都在均衡 路径上。但一般说来,如果信号的种 类多于类型的种类,每种均衡下均有 非均衡路径。
在K=J=2时的信号传递博弈模型
这里p=p(t1|m1),q=p(ti|m2)(省略了得益):
t1m1
[P]2 a1 a2
m2
[ q] 2 a1 a2
m1
[1-p] 2 a1 a2
m2
2 [1-q] a1 a2
在K=J=2时信号传递博弈的四种纯战略
信号发送者(参与人1)的四种纯战略:
一些类型的发送者随机地发送信号,另 一些类型的发送者选择特定的信号。 假定类型t1的发送者以概率分布( , 1- )随机地选择 m1或m2,类型t2的 发送者以概率1选择m2。如果这个策 略组合是均衡策略组合,那么:
准分离均衡
u1(m1, a*(m),t1)=u1(m2, a*(m),t1) u1(m1, a*(m),t2)<u1(m2, a*(m),t2)
2 t
从而
1 1 1 1 p ( t m ) u ( m , a , t ) p ( t ) u ( m , a , t ) p ( t ) u ( m , a, t 2 ) 2 1 2 1 2 2 t 2 2 2 2 p ( t m ) u ( m , a , t ) p ( t ) u ( m , a , t ) p ( t ) u ( m , a, t 2 ) 2 1 2 1 2 2 t
( P2 )a (m) arg max a p
* t * *
(ti | m)u2 (m, a, ti );
(P 1 ) m (t ) arg max m u1 ( m, a , ti ); ( B) p(t | m)是参与人2使用Bayes法则得到的.
精练贝叶斯均衡
信号传递博弈的所有可能的精练贝叶斯均 衡可以划分为3类:
在位者
p=4 p=5 p=6
在位者
p=4
进入者
进入 不进入 进入 不进入 进入
不进入
不进入 进入
不进入
进入
不进入
进入
(2,0) (2,0)
(6,0)
(6,0)
(7,0)
(7,0)
(6,0)
(6,0)
(9,0)
(9,0) (8,0)
(8,0)
第一阶段 第二阶段
(3,1) (7,0) (3,1) (7,0)
p(tk|mj)≡p(tk)
在K=J=2时的混同均衡
后验概率 p(t1|m1)=p(t1), p(t1|m2)=p(t1); p(t2|m1)=p(t2), p(t2|m2)=p(t2)。 意味着:
2 1 2 1 2 2
p(t m)u (m, a, t ) p(t )u (m, a, t ) p(t )u (m, a, t )
——此处参与人的最优是指根据修正概率计算的期望支付最优。
其中:m(t)是参与人1的类型依存信号策略,a(m)是参与人2 的行为策略(允许混合策略)。
信号传递博弈的精练Bayes均衡定义
定义: 信号传递博弈的精练Bayes均衡是战略组 合(m*(t),a*(m))和后验概率p(ti|m)的结合, 它满足:
信号传递博弈及其应用举例
信号传递博弈是一种比较简单的但有广泛应用意义的 不完全信息动态博弈。 它是由两阶段市场在位者和进入者博弈衍生出来的一 类特定背景下的博弈,并在许多领域如劳动力市场招 聘者和应聘者博弈、二手车市场博弈等等有广泛应用