经济博弈论8——不完全信息动态博弈

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信号博弈模型
1.博弈方0以概率p(ti )为S选择类型ti,并让S知道 2.S选择行为m j 3.R看到m j后选择行为ak 4.S和R的得益uS和uR都取决于ti , m j和ak
Βιβλιοθήκη Baidu
信号博弈完美贝叶斯均衡
1.信号接收方R在观察到信号发出方S的信号m j之后,必须有关于S的类型
的判断,即S选择m j时,S是每种类型ti的概率分布p(ti | m j ) 0, p(ti |m j ) 1
2.声明方了解对自己的ti以后,从T中选择t
作为自己声明的类型。
j
当然t j可以与ti相同(说真话),也可以不同(说假话)
3.行为方在听到声明方的声明t j后,在可选择的行为集合
A {a1, , aK }中选aK
4.声明方的得益为uS (ti , ak ),行为方的得益为uR (ti , ak )
动是a t。
克劳馥和索贝尔证明,当b不等于0时,存在一种“部分合并均衡”
的[完0,美x 贝),[叶x ,斯x 均),衡,。[x其,基1)本特征是类型空间[0,1]被分成n个区
1
1
2
n1

,属于同一区间类型的声明方作同样声明,在
不同区间类型的声明方作不同声明。
先对n=2的简单分割[0进, x行)论和证[x。,1]
8.2.2 连续型声明博弈
声明方类型标准分布于区间[0,1],即T=[0,1],行为 方的行动空间A= [0,1]。
声明方得益函数 U (t, a) [a (t b)]2 ,行为方得益 S 函数 U (t, a) (a t)2 。 R
可以看出,当声明方类型为t时,声明方最希望的
行为方行为是a t b ,而行为方对自己最有利的行
这时类型空间分为 1
1 ,属于前一区间的声明方作一个
同样声明,属于后一区间的声明方作另一同样声明。行为x 方2 听到前一
1
种声明时根据期望利(x益最1)大2化分析,确定出最佳行动是 ,后一种
1
情况时最佳行动是

x2
1
时,声才明会方声清明楚自行己为属方于的[0,判x1断),和另决一策区思间路类,似因。此而只当有行当为声方明的方行偏为好t离 bt b
的概率p( H )和p( L)是员工和厂商的共同知识
2.员工清楚自己的生产能力属于高还是低,然后为
W
自己选择一个受教育水平e 0
2
1 0 y(, e)
3.有两个厂商同时观察到员工观察到员工的受教育 w*()
水平,然后同时提出愿支付给员工的工资率
4.员工接受工资较高的一份工作。若两厂商的工资 相同,则随机决定为谁工作。用w表示员工工资率
概率 (%)
25
一般选手
21 21 获胜次数概率
12 12
4
4
1
1
0 1 2 3 4 5 6 7 8 9 10 次 数
一次比赛试用期
p(S |W )
0.5 0.9
0.643
0.5 0.9 0.5 0.5
p(M |W ) 1 p(S |W ) 0.357
p(S | L) 0.167, p(M | L) 0.833
如果声明的类型只有 x 1
2 和(x 1) 1
2 两种,那么出
现其余所有类型的声明都不在均衡路径上。采
用任何其他特定类型作为共同的声明也都会有
该问题。
上述问题的实质是分两个区间以后,如何作出 声明的问题——精确到具体类型则还是会存在 对方不信的问题。
克劳鳆和索贝尔采用的一种随机选择的混合策 略可以克服这种问题。
c
2
xk
x 2
k
1
化简得 xk1 - xk = c+4b。后一个区间比前一个区间
长4b。
设将类型区间[0,1]分n个小区间时第一个区间长度d, 第二个区间长度必须d + 4b,第三个区间长度必须d + 8b。。。n个区间总长度必须为1。d+(d + 4b)+…+[d + (n-1)·(4b)]= nd+n(n-1)·(2b) =1
第八章 不完全信息动态博弈
本章讨论不完全信息动态博弈,也就是动 态贝叶斯博弈。动态贝叶斯博弈与静态贝叶斯 博弈在许多方面是相似的,差别只是动态贝叶 斯博弈转化成的不是两阶段有同时选择的特殊 不完美信息动态博弈,而是更一般的不完美信 息动态博弈,因此可以直接利用不完美信息动 态博弈的均衡概念进行分析。本章主要介绍信 息传递条件、机制和效率方面的模型。
0
e* ( )
e
完全信息的劳动力市场均衡
8.4 重复信号
签约选手的素质判断问题
尖子:[(0.95t )(0.9 1 0.1 0)] 18 t 1
一般:[(0.95t )(0.51 0.5 0)] 10 t 1
概率
39
(%) 尖子选手
35
获胜次数概率 19
6 4
0 1 2 3 4 5 6 7 8 9 10次 数
8.1.2 类型和海萨尼转换
与静态贝叶斯博弈基本相似,动态贝叶斯博 弈也可以通过海萨尼转换,引进自然对博弈方类 型的选择,转化为完全但不完美信息动态博弈。
经过海萨尼转换以后,动态贝叶斯博弈与一 般不完美信息动态博弈基本相似,可以直接用完 美贝叶斯均衡进行分析。
8.2 声明博弈
8.2.1 声明的信息传递作用 8.2.2 连续型声明博弈
十次比赛试用期
8.5 不完全信息的工会和厂商谈判
1.工会第一回合要求工资w1*
(2 )2 2(4 3 )
2.如果厂商的利润超过
* 1
2 4 3
则厂商接受w1* , 否则拒绝w1*
3.如果第一回合的工资要求被拒绝,工会将对厂商利润的判断
修改为标准分布于[0,
* 1
],第二回合工资w
1 2
* 1
(2)当b0.25时,n*(b)=1,即信息交流完全不可能发生, 因为双方的偏好差距太大;
(3)当b趋向于0时,n*(b)趋向于无穷大,也即信息接近 充分交流,声明方接近能声明自己的真实类型;
(4)只要b不等于0,即双方偏好不完全一致,信息交流 不可能真正完全。
8.3 信号博弈
8.3.1 行为传递的信息和信号机制 8.3.2 信号博弈模型和完美贝叶斯均衡 8.3.3 股权换投资 8.3.4 劳动市场信号博弈
给定任何一个满足n(n-1)·(2b) 1的n,都存在满足 上述等式的d。因此存在分n个区间的部分合并均衡的必 要条件是不等式n(n-1)·(2b) 1必须成立。
从该关于n的一元二次不等式中可解得,部分合并均
衡可以分成的最大区间个数n*(b)必须小于 1 1 2 b /2。
结论
(1)b越小,则信息交流越充分,b越大,则信息交流越 少越困难;
最大化问题
max mj
u
S
[ti
,
m
j
,
a
*
(m
j
)]的解
4.对每个m
j
M,如果存在ti
T使得m*
(ti
)
m
j,则R在对应于m
的信息
j
集处的判断必须符合S的策略和贝叶斯法则。即使不存在ti T使m*(ti ) m j R在m j对应的信息集处的判断也仍要符合S的策略和叶斯法则
8.3.3 股权换投资
8.3.4 劳动市场信号博弈
劳动生产率 信号成本
b
P
劳动生产率
信号成本
P'
a
b
P C d
0
0.5
1 工人素质
0
工人劳的素动质力与劳素动生质产率的信号机制
P'
E
C'
e 0.5 (e+1)/2 1 工人素质
信号机制的存在和作用
斯潘塞劳动市场博弈模型
1自 . 然随机决定一个员工的生产能力,有高低两种
可能,分别记为H和L。并且自然选择生产能力高低
本章分五节
8.1不完全信息动态博弈及其转换 8.2声明博弈 8.3信号博弈 8.4重复信号 8.5不完全信息的工会和厂商谈判
8.1 不完全信息动态博弈及其转换
8.1.1 不完全信息动态博弈问题 8.1.2 类型和海萨尼转换
8.1.1 不完全信息动态博弈问题
古玩市场等各种议价博弈 不完全信息先后选择产量的寡头市场产量博弈 彩礼问题 广告对消费者的影响 学历、成绩在招聘人才、员工中的作用 投保人寿保险前的体检 学生考试前和毕业论文中的诚信承诺
x1 1 x1 1
2 1 2 42 2
1t
x 0.5 2b 1
整理得x :0 b 0.25 1
b 0.25
由于 ,则
。即只有当
U S (t, a) t+b
b时才0.有25可能存在两部分合并均衡,如果 ,则双方偏好相差太大,这种
最低限度的信息传递也不可能存在。
连续型声明博弈的部分合并均衡
不在均衡路径上的声明声明问题
对后一区间[xk,xk)1类型的最佳行为( xk +xk1)/2。两个区间交
界处类型声明方偏好的行为,须在(xk1+ xk )/2和( xk +xk1)/2间
无差异:
x+k b =
1 2
xk 1 2
xk
xk
x 2
k
1
因为(
xk
+
x
k
)/2
1
=
xk -c/2,代入上式,得:
xk
+b =
1 2 xk
1.自然随机决定该企业原有利润是高还是低,已知 p( H ), p( L) 1 p 2.企业自己了解,愿出S比例股权换取这笔投资 3.投资人看到S,但看不到,只知道是高低两种可
能性的概率,然后选择是接受还是拒绝企业的提议 4.如投资人拒绝,则投资人得益为I (1 r),企业得益
为,如投资人接受,则投资人得益S( R),企业 得益为(1 S)( R)
8.3.1 行为传递的信息和信号机制
萨摩亚岛居民的文身;波那佩岛的山药;孔雀 开屏;蛙鸣
信号:经济或其他活动中具有信息传递作用的 行为
信号机制:通过信号传递信息的过程 信号发出方:通过行为传递信息的一方 信号接收方:获得信息的一方 二手车模型中昂贵的承诺
8.3.2 信号博弈模型和完美贝叶斯均衡
越近时,声明方得益越大,反之则越小,即声明方的偏好对称于
点的。
x
x
1
1
因此,x两1 区2 间分界点x1 必须满足(x,1 小1)于2 u
的偏好x ,大于 的都偏好 1
那么 所代表类型的x 声2 明(方x 最1希) 2望的行
1
1
为方行为正好处于 和
的中
点,即: x b
1
x 1
2
x 1
1
2
2
0
x x1
部分合并完美贝叶斯均衡的区间划分和数量
两区间部分合并均衡区间长度不等长,x1 =0.5-2b,前一 个区间的长度是 x1 -0 = 0.5-2b,后一个区间的长度为1-x1 = 0.5+2b,后一个区间长4b。
结论对更多区间的部分合并均衡也成立。n区间,[ xk1,xk )
是之一,长度为c,行为方对该区间类型最优行为(xk1 +xk )/2,
1. 不同类型的声明方必须偏好行为方不同行为 2. 对应声明方不同类型行为方必须偏好不同行为 3. 行为方的偏好必须与声明方具有一致性
离散型声明博弈模型
1.自然抽取声明方的类型ti,抽取的方法是从类型集合T {t1, ,tT }
T
中以概率分布p(t1),, p(tT )随机抽取,其中 p(ti ) 1 i 1
2,1 1,0
1,0 2,1
声明方 类型
t1
t2
2,1 1,0
1,0 0,1
声明方 类型
t1
t2
2,1 1,1
1,0 2,0
能传递信息的声明博弈
不能传递信息(不同类型 声明方偏好相同)
不能传递信息(行为 方对声明方类型无差异)
行为方行为
a1
a2
声明方 类型
t1 2,0 1,1 t2 1,1 2,0
不能传递信息(声明方 与行为方偏好相反)
1 2
( 2 4 3
)
4.如果厂商的利润超过w2*,则接受该工资要求,否则拒绝
树立质量法制观念、提高全员质量意 识。20.11.2020.11.20F riday, November 20, 2020
人生得意须尽欢,莫使金樽空对月。16:51:1016:51: 1016:5111/20/2020 4:51:10 PM
当声明者和接受者利益一致或没有冲突时,声明会使接受 者相信。房客声明不喜欢暖气太足房东会相信;工人提出有 恐高症不适合高空作业雇主会相信;顾客喜欢甜或咸厨师会 相信。工人声明自己高素质雇主并不会轻易相信因为相信。
2X2声明博弈
行为方行为
a1
a2
行为方行为
a1
a2
行为方行为
a1
a2
声明方 类型
t1
t2
8.2.1 声明的信息传递作用
声明:消费者偏好,企业新闻发布会,国家间威胁恐吓。 声明不直接影响事物、利益,但往往影响接受声明者行为, 通过接受声明者行为对利益产生影响。 声明无或几乎无成本,接受者不一定采取有利于声明者的 行为,因为双方利益往往不一致,因此声明的真实性没有保 证。接受者不会轻易相信声明。 声明的影响取决于接受者的理解、判断和反应。
ti
2.给定R的判断p(ti | m j )和S的信号m j,R的行为a*(m j )必须使R的期望得益
最大,即a
*
(m
j
)是最大化问题
max ak
ti
p(ti |m j )uR (ti , m j , ak )的解
3.给定R的策略a*(m j )时,S的选择m*(ti )必须使S的得益最大,即m*(ti )是
相关文档
最新文档