不完全信息动态博弈-精练贝叶斯纳什均衡

合集下载

第五章 不完全信息动态博弈

第五章 不完全信息动态博弈

第五章不完全信息动态博弈5.1 精炼贝叶斯纳什均衡5.1-1 基本概念在完全信息动态博弈的情况下,每个参与人的类型是共同知识(common knowledge),每个参与人都是在已知自己以及其他人类型的情形下按照行动顺序进行选择(做出决策)。

但是,在不完全信息动态博弈(dynamic game of incomplete information)的情况下,每个参与人只知道自己的类型而不知道其他参与人的类型,这样就好像是在博弈的开始阶段,存在一个参与人,名为“自然”,它先选择每个参与人的类型,然后参与人开始行动,参与人的行动有先有后,后行动者可以观察到先行动者的行动,但不能观察到先行动者所属于的类型。

但是,因为参与人的行动是依据参与人所属的类型而作出的,每个参与人的行动都传递着有关自己所属类型的信息,后行动者可以通过先行动者的行动来猜测先行动者的类型或者修正对先行动者所属类型的先验信念(表现为概率分布),然后根据修正后的后验信念选择自己的最优行动。

同样,先行动者会预测到自己的行动将被后行动者所利用,就会设法选择某些特定行动来迷惑后行动者,即选择那些传递对自己最有利的信息、避免传递对自己不利信息的行动。

因此,博弈过程不仅仅是参与人选择行动的过程,而且是参与人不断修正自己信念的过程,比起完全信息动态博弈的情况要更加复杂。

精炼贝叶斯均衡是不完全信息动态博弈均衡的基本均衡概念,它是泽尔腾(Selten)的完全信息动态博弈子博弈精炼纳什均衡和海萨尼(Harsanyi)的不完全信息静态博弈贝叶斯均衡的结合。

精炼贝叶斯均衡要求,给定有关其他其他参与人所属类型的信念,参与人的战略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡:并且,在所有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人的类型的信念。

在不完全信息静态博弈中,我们有一个与参与人的信念相关的概念,用概率(probability)来表示,它在整个博弈的过程中是不变的,可以说是一个坚定的信念;而在不完全信息动态博弈的情况下,该概念就不再适用了,因为参与人的信念是会不断修正的,对于参与人的信念,我们分为两类,一类是先验概率(prior probability),而另外一类是后验概率(posterior probability)。

6-不完全信息动态博弈

6-不完全信息动态博弈

(7, 3)
B 2
(2, 9) A
0.6 N
0.4
B (3, 6)
L
T
R
2019/11/6
魏光兴——重庆交通大学
A (5, 3)
B
2 A
(2, 6) (4, 7)
B (5, 3)
16
7.2 信号博弈
练习2:
(6, 2) A
LF
R
(2, 8)
B 2
(4, 9) A
0.5 N
0.5
B (3, 6)
1
A (4, 4, 4)
L 3
R
2
U
B
D
A
D
(3, 3, 0)
(5, 5, 0) (1, 1, 1)
(2, 2, 2)
2019/11/6
魏光兴——重庆交通大学
6
7.1 精炼贝叶斯纳什均衡
练习
1
L
R
2
B M
U
2
3
(3, 2, 0)
Z (4, 4, 4)
Z Y
(6, 5, 0)
(1, 1, 1)
Y
不同类型的局中人选择相同的行为,发送相同的信号;后验 概率与先验概率相同
准分离均衡Semi-separating Equilibrium
又称杂合均衡Hybrid Equilibrium,某些类型的局中人选择随 机行为发送随机信号,另一些类型的局中人选择特定行为发 送特定信号;部分后验概率等于1,部分后验概率变精确
化简后的信号博弈模型
T1
R
A (2, 1)
0.5 N
(2, 4)
A
0.5 L T2

第4章 不完全信息动态博弈

第4章 不完全信息动态博弈

(M1L D1L )
M1L M1L ( p1L )
M1H M1H ( p1L )
(M1H D1H )
p

pp
~
L m
H pm p
p1L
图4.5垄断限价模型 博弈论与信息经济学 江西财经大学 陶长琪
4.2-1米尔格罗姆-罗伯茨 (Milgrom-Roberts)垄断限价模型
P r ob { |a } P r ob {a }
h

p(a
j 1
K
h
| j ) p( j )
应该指出的是,贝叶斯法则并不是一个技术性法则,而是人们修正信念的唯一合 理方法. 精炼贝叶斯均衡假定参与人是根据贝叶斯法则修正先验概率的.不过,贝叶斯法 则要求 Pr ob i必须以正的概率选择 a h ,否则,后验概率没 {a h } 0,即参与人 {a h } 0 ,我们允许Pr ob{a h } 0 在[0,1]区间取任 有定义.如果 Pr ob 何值,只要所取的值与均衡战略相容.在动态博弈中,Pr ob{ k | a h } 对应的是 非均衡中径上的信息集
博弈论与信息经济学 江西财经大学 陶长琪
4.2-1米尔格罗姆-罗伯茨 (Milgrom-Roberts)垄断限价模型
( SM ) ( M 1H ( p1 ) M 1L ( p1 )) 0 p2005.1.11 赵乐欢制作历经或 10天终于于 日凌晨基本完成,非常感谢 1
H L 刘艳艳同学第四章及第六章,第七章的文档 ! ( p1 ) M 1 ( p1 ) M 1

让我们再一次考虑市场进入的例子:
[u] 在位者 P=4 进入者 进入 不进入 进入
第一阶段: (2,0) (2,0) 第二阶段: (3,1) (7,0)

第4讲:不完全信息动态博弈

第4讲:不完全信息动态博弈
18
作业
1、下图是一个信号传递博弈:自然首先选择参与人1的类型,参与人1知道自 然的选择,参与人2不知道,只知道参与人1属于t1和t2的可能性相等;参与 人1然后选择信号L或R;参与人2最后选择行动U或D,博弈结束,效用向量 如终点结所示。给出找个博弈的所有纯策略分离均衡和混同均衡。
N
t1
1
L
R
t2 L
在所有这些均衡中,低成本在位者限制自己的价格低于垄断价格以阻止进
入者进入。
15
不完全信息重复博弈与声誉
声誉模型涉及不完全信息重复博弈中的合作行为。
•我们已经知道,在完全信息情况下,不论阶段博弈重复多少次,只有重复 的次数是有限的,唯一的均衡是每个参与人在每次博弈中选择单次静态的 均衡策略,从而,有限次重复不可能导致参与人的合作行为。
6
则精炼贝叶斯均衡定义为:
精炼贝叶斯均衡是一个策略组合s*()(s1*(1), ,sn*(n)) 和一个后 验概率组合p(p1, ,pn) ,满足: 1、精炼条件:对于所有的参与人i,在每一个信息集h,
si*(si,i)argmax pi(i |ahi)ui(si,si,i) si
2、贝叶斯法则:pi(i |ahi)是使用贝叶斯法则从先验概率 pi(i |i)观测到的ahi 和最优策略 s*i 得到的。
1
R
2
2
2
2
U
DU
DU
D
U
D
(1,1) (2,0) (2,2) (0,0) (0,0) (0,1) (1,0) (1,1)
19
2、一对夫妇离婚是要分财产。根据法律规定,婚姻期间形成的财产的所有 权各占一半。但因为家庭财产由不同的部分组成,要对财产的价值作一 个客观的估计是很困难的;特别地,由于个人的兴趣和出于对未来生活 的考虑,夫妻双方对不同财产的评价是不同的。因此,二人免不了要对 什么物品归谁所有而发生争执。经过几个回合的谈判,两人同意按以下 规则办事:女方对物品作价(如电视机为3000元,电冰箱为2000元,等 等);如果男方愿意支付女方1/2的价格,该物品归男方所有;否则,女 方必须支付男方1/2的价格,该物品归女方所有。考虑单件物品(如电视 机),我们用vM和vF分别代表该物品对男方和女方的真实价值。假定vM 和vF都是私人信息,但双方都知道vM和vF在区间[2000,3000]上独立、均 匀分布(即分布函数是共同知识),求出精炼贝叶斯纳什均衡。

最新不完全信息动态博弈

最新不完全信息动态博弈

不完全信息动态博弈4 不完全信息动态博弈4.1 精炼贝叶斯均衡概述不完全信息动态博弈就其基本要素来看是不完全信息与博弈的动态性质的一种综合。

在处理不完全信息要素时,通过将某些参与人“类型”的不确定性作为信息不完全性的一种表征,这种方法将继续得以采用,即博弈中参与人面临的信息不完全性(无论它是指何种信息)将完全由某些参与人的“类型”的不确定性加以刻画。

同时,作为动态博弈,“序贯理性”的思想将一直得到贯彻。

我们在不完全信息动态博弈中将信息不完全程度削减到零,则不完全信息动态博弈就自然应退化成一种完全信息动态博弈,其相应的精炼均衡概念就由精炼贝叶斯回到子博弈精炼均衡。

从这种意义上来看,不完全信息动态博弈的精炼均衡概念是子博弈精炼均衡概念的一种推广,正如不完全信息动态博弈应被视作完全信息动态博弈的一种推广一样。

例简单的非完全信息动态博弈L'u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2参与人1的类型t 为个人信息。

参与人2 不知道t ,但知道t 的概率分布。

博弈的时序:(1)参与人1选择行动a 1 ∈A 1; (2)参与人2观察a 1,选择a 2 ∈A 2 博弈的收益: u 1 (a 1, a 2, t ), u 2 (a 1, a 2, t )精炼贝叶斯均衡博弈的纳什均衡是一种“僵持”状态的战略组合,当所有的参与人都选择该战略组合中给出的相应战略时,任何一个参与人都不会有单方面偏离这一选择的动机。

作为动态博弈,一个战略是参与人在其可能进行行动选择的所有信息集上将作何选择的一整套规定或计划,而作为不完全信息博弈,这种规定或计划还是“类型依存”的,即不同类型的参与人将选择不同的战略规定。

因此,一个不完全信息动态博弈的纳什均衡将是指这样的一种类型依存性的战略组合(或战略组合的族),当给定其他参与人的战略时(其他参与人的战略是类型依存的,所以,说给定其他参与人的战略即指给定其他参与人的战略与类型的依存关系),任一参与人在其任何类型下由该组合给出的类型依存战略是其最优的。

博弈论与信息经济学-4.不完全信息动态博弈

博弈论与信息经济学-4.不完全信息动态博弈

I11
L
p
M
I21
R
1-p
1 3
U
2 1
B
0 0
U
0 2
B
0 1
根据局中人2的推断可知,局中人2选 R 的期望支付为 1 p ,选 U
的期望支付为
p 2(1 p) 2 p

L R

A D
I31

U

B
A
D
4 4 4
1 1 1
5 5 0
2 2 2
3 3 0
均衡(L,B,A)并不是一个合理的均衡。因为如果博 弈进入参与人2的信息集,参与人2应该选择U而不 是B。 不可能用子博弈精炼纳什均衡的概念剔除(L,B,A), 但可以使用精炼贝叶斯均衡剔除这个不合理的均衡。
( A, L, L' ) r1( A, L, L' ) r2 ( A, L, L' ) r3 ( A, L, L' )
r3 ( A, L, L' ) {L' , R'}

( A, L, L' ) 为纳什均衡。
{( A, L, L' ), p 0} 对于要求1与3的满足是显然的,现考虑要求2

给定局中人的推断,局中人的策略必须满足序贯理性的要求。即在每一信息
集中,应该行动的局中人(以及局中人随后的策略),对于给定的该局中人 的推断,以及其余局中人随后的策略(其中“随后的策略”是在达到给定的 信息集之后,包括了其后可能发生的每种情况的完全的行动计划)必须是最 优反应。

博弈论第8次课——不完全信息动态博弈

博弈论第8次课——不完全信息动态博弈

市场进入博弈
博弈两个局中人,一个“在位者”,一 个“进入者”。考虑t=1,2两个时期,在 t=1,市场上有一个垄断企业( “在位 者” )在生产,一个潜在的进入者是否进 入;如果“进入者”进入,两个企业进行 Cournot博弈,否则,“在位者”依然是 一垄断者。
市场进入博弈
假设“在位者”有两种类型:高成本、低成 本, “在位者”存在“私人信息”;进入者只 知道“在位者”是高成本的概率为 ,低成本 的概率为 。 1
战略组合(B,L,U)是一NE,没有参与 人愿意单独偏离这一结果 这一组战略及推断也满足要 求l到3(要求3自动满足)。
1 B (2,0,0) F 2
3的信息集不在均衡路径上。 精炼贝叶斯均衡要求:3在非均 衡路径的信息集上的“判断” 也必须与2的均衡战略L吻合。 1-p
L
3
p
R D
(3,3,3) U (0,1,2)
(一) 精炼贝叶斯均衡
李四预测到这一点,即使生性懦弱,也会强迫自己 吃辣椒,以传达对自己有利的信息。 两种结果: ——懦弱李四不吃辣椒,强悍李四吃辣椒且吃的足 够多,使得懦弱李四不敢模仿,张三能够区分李 四类型并选择是否欺负李四。
——两类李四都吃同样多辣椒,张三不能从李四吃 辣椒行为中推出自己的信息,维持对李四的类型 的先验信念{0.8,0.2}
(三) 信号博弈
先行动者可直接告诉后行动者自己类型,但后行动者不会相 信。如果要让后行动者相信,必须做出一种努力(使自己 付出成本),该成本是其他类型的先行动者不能模仿的 ——称成本支付为一种信号。通过该信号,先行动者能够告 诉后行动者自己的真实类型 例,企业金融市场融资,但投资者对真实赢利能力不了解。 真正高赢利能力的企业可以通过向投资者支付较高的权 益份额来区分自己和低赢利能力的企业,从而让投资者识 别自己的真实类型而投资。 另一方面,低赢利能力企业对自己真实赢利能力是清楚 的,不敢模仿高赢利能力企业,只能承诺低权益份额,投 资者不会投资。

博弈论与信息经济学5-不完全信息动态博弈

博弈论与信息经济学5-不完全信息动态博弈

叶斯法则从均衡策略和所观测到的行动得到的. 因此,精炼贝叶斯均衡是一个不动点,满足: ( s )); p p * ( s* ( p )) s s* ( p
博弈论与信息经济学. Copyright © 2015 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。
L 1 M [p]
(1,3)
R 2 B [1-p]
U
U
B
(2,1)
(0,0) (0,2)
(0,1)
U M R (2,1) (0,2)
B (0,0) (0,1)
L
(1,3)
(1,3)
QSC
博弈论与信息经济学. Copyright © 2015 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。
博弈论与信息经济学. Copyright © 2015 ECUST. All rights reserved. 华东理工大学版权所有, 翻印必究。
QSC
Page:8
精炼贝叶斯均衡什均衡策略与均衡信念的结合,即:
* * * 1.给定信念p ( p1 , , pn ), 策略s ( s1 , , sn )是最优的; * * (p 1 , , p n )是使用贝 2.给定策略s* ( s1 , , sn ), 信念p
Page:12
混同均衡满足的条件
混同均衡:不同类型的发送者选择相同的信号,或者 说,没有任何类型选择与其他类型不同的信号,因此, 接收者不修正先验概率。
( m* ))满足 混同均衡(m* ( ), a* (m* );p u1 (m* , a* (m* ), 1 ) u1 (m, a* (m), 1 ), m u1 (m* , a* (m* ), 2 ) u1 (m, a* (m), 2 ), m 此时有 ( k m* ) p ( k ) p

第5章_不完全信息动态博弈

第5章_不完全信息动态博弈
与者 2 必然会选择策略 U。 所以,作为一个动态博弈,博弈路径必然是:参与者 1 选择策
略 L,参与者 2 选择策略 U。 博弈参与者 2 最希望看到的结果是:参与者 1 选择策略 M,从
而博弈结束。在这种情况下参与者 2 可以获得收益 10。但是, 怎样才能让参与者 1 选择策略 M 呢?
完全信息动态博弈中 纳什均衡是完全信息静态博弈的均衡。 子博弈精炼纳什均衡是完全信息动态博弈的均衡。 子博弈精炼纳什均衡是对纳什均衡的一种“精炼”。
不完全信息动态博弈中 贝叶斯纳什均衡是不完全信息静态博弈的均衡。 精炼贝叶斯纳什均衡(Perfect Bayesian Nash Equilibrium) 是不完全信息动态博弈的均衡。 精炼贝叶斯纳什均衡是对贝叶斯纳什均衡的“精炼”。
理性的参与者 1 可以预期到:如果自己不选策略 M,而是选择 策略 L 或者策略 R,那么参与者 2 必然选择策略 U。
在这种序贯理性条件下,参与者 1 会选择策略 L,参与者 1 得 到收益 2,参与者 2 得到收益 3。
如果参与者 1 选择策略 M,那么参与者 1 仅能得到收益 1。 所以先行动参与者 1 不会选择策略 M。 尽管参与者 2 不知道参与者 1 选择了策略 L 还是策略 R,但参
2.不可置信的威胁
参与者 2 如果放出这样的威胁:“如果参与者 1 没有选择策 略 M,而是选择了策略 L 或策略 R,那么参与者 2 必然选择 策略 V”。
参与者 2 的这种威胁如果成立,那么不管参与者 1 选择策略 L 还是策略 R,参与者 1 的收益都只有 0。如果选择策略 M, 参与者 1 可以得到收益 1。
迈克尔 ·斯宾塞(Michael Spence)教授研究了劳动力市 场上的不完全信息、信号传递及均衡问题,为信息经济学的发 展奠定了重要基础。

第四章 不完全信息动态博弈

第四章 不完全信息动态博弈

如果进入者不进入,t=2时期在位者仍然是一个垄断者,不 同价格选择下的利润水平与第一阶段相同。 ---战略空间与支 付函数 我们构造了这些数字使得在完全信息情况下,如果在位者是 高成本,进入者选择进入;如果在位者是低成本,进入者选 择不进入。
市场进入博弈的简化扩展式表述
第一阶段 (2,0)(2,0)(6,0)(6,0)(7,0)(7,0)(6,0) 6,0)(9,0)(9,0)(8,0)(8,0)
(2)当μ ≥0.5,精炼贝叶斯均衡是:低成本的在 位者选择p=4,高成本的在位者选择p=6;当进入者 ~ = μ 4 0 ),进入者选择不进入, 观测到p=4(基于 如果观测到p=6或p=5(基于~ 6 1 μ 5 1 ), μ =, ~ 2 进入者选择进入。 该均衡称为分离均衡。
(2)假定观测到该人干了一件坏事,我们进行其是 好人的概率修正:
如果好人绝不会干坏事,有:
0 * 0.5 Pr obGP | BT 0 0 * 0.5 p * 0.5
(3)假定原来认为一个人100%是好人,但突然发 现他干了一件坏事,如何修正? (4)假定原来认为一个人肯定是一个坏人,突然 发现他干了一件好事,如何修正? 如果这个人是在知道我们认为他是坏人的情况下 干了好事,我们会认为他是坏人的后验概率可以为 [0,1]区间的任何数。 如果我们认为他并不仅仅是为了假装好人,我们对 他的看法不会改变,p是坏人干好事的概率,q是好 人干好事的概率,有
第二阶段
(3,1)(7,0)(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1) (9,0) (5,-1)(9,0)
进入者第一阶段的利润为0;当博弈进入第二阶段后,假如 进入者已经进入 ,古诺均衡产量(价格)是每个企业的最 优选择;如果进入者没进入,单阶段垄断产量(价格)是在 位者的最优选择。

不完全信息动态博弈

不完全信息动态博弈

但是,这种“打斗”行为尽管可以击退进入者,但由于 一段时间的降价经营可能对垄断者带来较大损失。垄断者为 了避免这种损失,可以向外宣布它是低成本的,别的厂商休 想进来与它竞争。但仅凭口头宣布人家是不会相信的,因为 即使垄断者不是低成本的厂商,它也会如此宣布。 一种方法就是,垄断者向外发送一个信号,向外界传 递它真是低成本的信息。它可以长期在一个较低价格水平上 经营。如果它的价格足够低,高成本厂商不敢模仿,行内厂 商会据此判定它确是低成本的。同时,它的价格也不能太低, 以致于较之与进入者进行降价竞争,其损失为小一些。这样, 垄断者才会采取如此策略。潜在的高成本进入者不敢 进入,垄断者得以保持长期的垄断地位。



N

P

1-P●ຫໍສະໝຸດ 进入者 进●进入者 进
不进

不进

在位者 (0,400) 打击
● ●

在位者 打击

(0,300)

(40,50)

(-10,0) (30,80) (-10,100)
海萨尼转换后的市场进入博弈
三、贝叶斯法则

在不完全信息开始之前,“自然”首先行动,选择各参与人 的类型。各参与人除了知道自己的类型以外,对“自然”的 行动都有着一致的信念,称之为先验信念。之后,参与人先 后行动,后行动者能观察到先行动者的行动,但观察不到先 行动者的类型。但是,因为参与人的行动是依赖于其类型的, 每个参与人的行动都传递着有关自己类型的某种信息,后行 动者可以通过观察先行动者的行动来修正对其各种类型判断 的先验信念(概率分布),然后选择自己的最优行动。先行 动者预测到自己的行动将被后行动者所利用,也就会设法传 递对自己有利的信息,避免传递对自己不利的信息。因此, 不完全信息动态博弈不仅是参与人选择行动的过程,更是参 与人不断修正信念的过程。

不完全信息动态博弈

不完全信息动态博弈

4 不完全信息动态博弈4.1 精炼贝叶斯均衡概述不完全信息动态博弈就其基本要素来看是不完全信息与博弈的动态性质的一种综合。

在处理不完全信息要素时,通过将某些参与人“类型”的不确定性作为信息不完全性的一种表征,这种方法将继续得以采用,即博弈中参与人面临的信息不完全性(无论它是指何种信息)将完全由某些参与人的“类型”的不确定性加以刻画。

同时,作为动态博弈,“序贯理性”的思想将一直得到贯彻。

我们在不完全信息动态博弈中将信息不完全程度削减到零,则不完全信息动态博弈就自然应退化成一种完全信息动态博弈,其相应的精炼均衡概念就由精炼贝叶斯回到子博弈精炼均衡。

从这种意义上来看,不完全信息动态博弈的精炼均衡概念是子博弈精炼均衡概念的一种推广,正如不完全信息动态博弈应被视作完全信息动态博弈的一种推广一样。

例简单的非完全信息动态博弈Nt1(p) t2 (1–p)1 1L R L R2 2L R L R L R L Ru1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2参与人1的类型t 为个人信息。

参与人2 不知道t ,但知道t 的概率分布。

博弈的时序:(1)参与人1选择行动a 1 A 1;(2)参与人2观察a 1,选择a 2 A 2博弈的收益: u 1 (a 1, a 2, t ), u 2 (a 1, a 2, t )精炼贝叶斯均衡博弈的纳什均衡是一种“僵持”状态的战略组合,当所有的参与人都选择该战略组合中给出的相应战略时,任何一个参与人都不会有单方面偏离这一选择的动机。

作为动态博弈,一个战略是参与人在其可能进行行动选择的所有信息集上将作何选择的一整套规定或计划,而作为不完全信息博弈,这种规定或计划还是“类型依存”的,即不同类型的参与人将选择不同的战略规定。

因此,一个不完全信息动态博弈的纳什均衡将是指这样的一种类型依存性的战略组合(或战略组合的族),当给定其他参与人的战略时(其他参与人的战略是类型依存的,所以,说给定其他参与人的战略即指给定其他参与人的战略与类型的依存关系),任一参与人在其任何类型下由该组合给出的类型依存战略是其最优的。

讲义7-不完全信息动态博弈(续1)——信号博弈

讲义7-不完全信息动态博弈(续1)——信号博弈

p(tk|mj)≡p(tk)
在K=J=2时的混同均衡
后验概率 p(t1|m1)=p(t1), p(t1|m2)=p(t1); p(t2|m1)=p(t2), p(t2|m2)=p(t2)。 意味着:
2 1 2 1 2 2
(t m)u (m, a, t ) p (t )u (m, a, t ) p (t )u (m, a, t ) p
——此处参与人的最优是指根据修正概率计算的期望支付最优。
其中:m(t)是参与人1的类型依存信号策略,a(m)是参与人2 的行为策略(允许混合策略)。
信号传递博弈的精练Bayes均衡定义
定义: 信号传递博弈的精练Bayes均衡是战略组 合(m*(t),a*(m))和后验概率p(ti|m)的结合, 它满足:
u1(m1, a*(m),t1)=u1(m2, a*(m),t1) u1(m1, a*(m),t2)<u1(m2, a*(m),t2)
p
(t1|m1)=
p (t1 ) 0 p(t2 )
p(t1 )
1
(1 ) p(t1 ) p(t1 ) 2 P (t1|m )= (1 ) p(t ) 1 p(t ) 1 2
在K=J=2时的分离均衡
后验概率 p(t1|m1)=1,p(t1|m2)=0; p(t2|m1)=0,p(t2|m2)=1。 意味着:
(t m)u (m, a, t ) p (t p
2 t 1
(t 2 m)u2 (m, a, t 2 ) m)u2 (m, a, t1 ) p
1 2 1
从而
(t m )u (m , a, t ) u (m , a, t ) p
1 1 2 t 2 2 2 p ( t m ) u ( m , a , t ) u ( m , a, t 2 ) 2 2 t

6. 不完全信息动态博弈资料

6. 不完全信息动态博弈资料

用精炼贝叶斯均衡剔除不可置信威胁(R,R’)
要求1 :每一个参与人的信息集上各节 点有一个推断(概率分布);
要求2:给定参与人的推断,参与人的策 略必须满足序贯理性。
要求1意味着如果博弈的进行达到参与者2 的非单节信息集,则参与者2必须对具体到达 哪一个节(也就是参与者1选择了L还是R)有一个 推断。这样的推断就表示为到达两个节的概率 p和1-p
第六章 不完全信息动态博弈
不完全信息动态博弈(或动态贝叶斯博弈)的基本特征是参与人 的行动是序贯的,有先有后,与完全信息动态博弈相比,其中的 私人信息可能表现在支付函数上,也可能表现在行动的选择上。 前一个表现形成不完全信息,后—个表现形成不完美信息。 象不完全信息静态博弈被转化成完全但不完美信息动态博弈 进行分析一样。所有的不完全信息动态博弈都可以被转换成完全 但不完美信息的动态博弈进行分析。正因为这样,我们把“不完 全信息动态博弈”与“不完美信息动态博弈”混同使用。
精炼贝叶斯纳什均衡四条要求
使均衡概念得到进一步强化,以排除上例中像(R,R’)的子博弈纳什均 衡的方法之一,是附加以下两个要求。 要求1:在每一个信息集上,轮到行动的参与人必须对博弈进行到该 信息集中各个决策节点的可能性大小有一个推断(belief)。对于非单节点 信息集,推断就是在信息集中关于不同决策节点的一个概率分布;对于 单节点的信息集,参与者的推断就是博弈到达此单一决策节点的概率等 于1。(每一个参与人的信息集上有一个概率分布) 要求2:给定参与人的推断,参与人的策略必须满足序贯理性 (sequentially rationally)的。即在每一信息集中,给定轮到行动的参与人 在此信息集中的推断,以及其他参与人的后续策略(指从给定信息集 开始的参与人在后续博弈中的完备的行动计划),该参与人的行动必须 是最优的。(给定概率分布和其他参与人的选择,每个参与人的战略是 最优的)

Chapter 4-不完全信息动态博弈2

Chapter 4-不完全信息动态博弈2

4.1.1精炼贝叶斯均衡
• 精炼贝叶斯均衡(perfect liayesian equilibrium)是贝叶斯均衡、子博弈精炼均 衡和贝叶斯推断的结合。它要求:(1)在每个 信息集上,决策者必须有个定义在属于该 信息集的所有决策结上的个概率分布(信念); (2)给定该信念集上的概率分布和其他参 与人的后续战略,参与人的行动必须是最 优的;(3)每一个参与人根据贝叶斯法则和均 衡战略修正后验概率。
• 1
a (m) arg max p ( | m)u2 (m, a, )
* ~

• 2
~
m ( ) arg max u1 (m, a (m), )
* *
• p ( | m) 是使用贝叶斯法则得到
4.2信号博弈的分离均衡
• 分离均衡(separating equilibrium):不同类 型的发送者(参与人1)以1的概率选择不同的 信号,或者说,没有任何类型选择与其他 类型相同的信号。在分离均衡下,信号准 确地揭示出类型。
4.1.1市场进入博弈
4.1.1市场进入阻挠
• 当且仅当进入者认为在位者是高成本的概率大于 1/2时,选择进入。 • 第二阶段与不完全信息静态博弈不同:进入者会 修正在位者成本函数的先验概率u;在位者会考虑 价格的信息效应。 • 若 u* 1 / 2,贝叶斯均衡:进入者选择不进入;高 成本在位者选择p=6,低成本在位者选择p=5. • 子博弈精炼纳什均衡无法直接用:不完全信息只有 一个子博弈,所有均衡都是子博弈均衡。
si (si ,i ) arg max pi (i | a )ui (si , si ,i )
*
h • (B) pi ( i | a i ) 概率 得到 ~

12第十二章贝叶斯纳什均衡及其精炼

12第十二章贝叶斯纳什均衡及其精炼

第十二章贝叶斯纳什均衡及其精炼前两章讨论的是完全信息条件下的博弈,给出了博弈的基本分析框架。

本章将讨论不完全信息下的博弈行为,包括不完全信息静态博弈和不完全信息动态博弈。

12.1不完全信息博弈与贝叶斯纳什均衡一、不完全信息博弈完全信息博弈指博弈中的参与人对所有其他参与人的支付(偏好)函数有完全的了解,并且支付函数是所有参与人的共同知识(common knowledge)的博弈。

反之,不满足完全信息博弈假设的博弈称为不完全信息博弈。

二、海萨尼(Harsanyi)转换在博弈中,信息不完全使得博弈参与人必须预测其他参与人的类型。

至于“类型”概念,以两个企业博弈的例子说明。

假设参与人1为在位者企业,参与人2为进入者企业。

进入者依据在位者的生产成本高低选择是否进入该行业,高则进,低则不进。

但是进入者不知道在位者的成本是高还是低。

因此,进入者必须预测在位者的成本“类型”,究竟是高成本的还是低成本的。

海萨尼提出通过引入“自然”概念解决这个问题。

即由自然实现行动,确定其他参与人的类型,从而转换成我们已讨论过的扩展式动态博弈结构。

即通过自然选择类型,实现不完全信息向完全信息的转换,我们称之为海萨尼转换。

在本例中,通过自然选择在位者的成本类型,进入者再针对高成本或低成本进行是否进入的博弈决策。

应当指出,通过自然选择类型的划分,不仅是针对支付函数而言的,其包括参与人所拥有的所有个人信息,如战略空间和信息集等等。

通过上述分析可知道,不完全信息意味着,至少有一个参与人拥有多种类型,否则就成为完全信息博弈。

用表示参与人的一个特定类型,表示参i θi i Θ与人所有可能类型的集合,,并假定i i i Θ∈θ取自某个客观的分布函数。

n i i 1}{=θ),,(1n P θθL为简化起见,假定只有参与人本人观察到自i 己的类型,其他人都不能察到。

但依据海萨尼i θi θ公理,我们假定分布函数是所有参与),,(1n P θθL 人的共同知识,就是说,在博弈开始时,所有参与人关于自然行动的信念是相同的。

讲义6-不完全信息动态博弈.讲义

讲义6-不完全信息动态博弈.讲义
管理博弈论
(Management Game Theory)
第六讲 不完全信息动态博弈 主讲人:张成科 博士 广东工业大学经济与贸易学院
zhangck@
第五章 不完全信息动态博弈精练贝叶斯纳什均衡


一 精练贝叶斯纳什均衡
基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡
基本思路图示
在不完全信息动态博弈中,由于信息不完全,故子博弈的概念不能精确细致 地描述动态博弈中的各个阶段,从而就不能剔除那些包含“不合理信念”的 Nash均衡。但是其推理逻辑可用,即“新均衡”不仅在整个博弈上构成Bayes 均衡,而且从每一个信息集开始的“后续博弈”上也构成Bayes均衡。但还不 能剔除“总是认为先验概率不变”这样的不合理行为。而实际上,参与人都 是依据他们的观测信息对自己的先验概率进行修正的-------这需要用精练Bayes 均衡。 给定别人的战略,自己的战略是最优的,即没人愿独自偏离 Nash均衡 在完全信息动态博弈中无法剔除不可置信威胁战略 子博弈精练Nash均衡 不仅是整个博弈的Nash均衡,而且是每个子博弈的 Nash均衡



修正之后的判断称为“后验概率”
贝叶斯法则就是人们根据新的信息从先验概率 得到后验概率的基本方法。
贝叶斯法则


以不完全信息博弈为例说明贝叶斯法则:假定 参与人的类型是独立分布的,参与人i有K个类 型,有H个可能的行动,θk和ah分别代表一个特 定的类型和一个特定的行动。 如果我们观察到i选择了ah,我们要问i属于θk的 后验概率是多少?


二 信号传递博弈及其应用举例
三 博弈论概念简要总结
不完全信息动态博弈引例
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
不完全信息动态博弈-精练贝叶斯纳什均衡

一 精练贝叶斯纳什均衡 基本思路


贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡 二 信号传递博弈及其应用举例 三 博弈论概念简要总结
基本思路-不完全信息动态博弈

类型:自然首先选择参与人的类型,参与人自己知道,其 他参与人不知道。--不完全信息
行动:行动有先有后,后行动者能观测到先行动者的行动, 但不能观测到其类型。--动态博弈 但是,参与人是类型依存型的,每个参与人的行动都 传递有关自己类型的信息,后行动者可以通过观察先行动 者的行动来推断自己的最优行动。先行动者预测到自己的 行动被后行动者利用,就会设法传递对自己最有利的信息。


不完全信息动态博弈过程不仅是参与人选择行动的过程, 而且是参与人不断修正信念的过程。
[x]

T=2,如果进入者已进入,在位 者成本函数为共同知识,若在位 者为高成本,p=5时,每个企业 利润为3,扣除进入成本2,进入 者利润为1。若在位者为低成本, p=4,在位者利润是5,进入者成 本为1,扣除进入成本2,其利润 为-1。
P=6
进入者 进入 不进入 进入 不进入 进入 不进入 进入 不进入 进入
价格
在位者高成本时的利润 在位者低成5
6 9
P=6
7 8
基本思路-不完全信息动态博弈
进入者只有一种类型:进入成本为2,如果进入,生产成本函数与在 位者高成本函数相同。
T=2,如果进入者已进入,在位者成本函数为共同知识,若在位者为 高成本,企业企业成本函数相同,对称库诺特均衡产量下的价格p=5时, 每个企业利润为3,扣除进入成本2,进入者利润为1。若在位者为低成本, 两个企业成本函数不同,非对称库诺特均衡产量下的价格p=4,在位者利润 是5,进入者成本为1,扣除进入成本2,其利润为-1。
价格 在位者高成本时的利润 P=4 2 P=5 6 P=6 7
在位者低成本时的利润
进入者进入 在位者高成本p=5
6
在位者
9
进入者
8
3
1
在位者低成本p=4
5
-1
进入者只有 一种类型:进入成本 为2,如果进入,生 产成本函数与在位者 高成本函数相同。
在位者 P=4 P=5
N 低 [1-x] 在位者 P=6 P=4 P=5
在位者
P=6
P=4
P=5
P=6
进入者
进入 不进入 进入 不进入
不进入
不进入 进入
不进入 进入 进入
不进入
进入
(2,0) (2,0)
(6,0)
(6,0)
(7,0)
(7,0)
(6,0)
(6,0)
(9,0)
(9,0) (8,0)
(8,0)
第一阶段 第二阶段
(3,1) (7,0) (3,1)
高成本在位者不 会选择p=6

问题的核心是:不同的价格如何影响进入者的后验 概率从而影响进入者的进入决策。
基本思路-不完全信息动态博弈

一个非单阶段最优价格会减少现期利润,但如果它能阻止进入者进入,从 而使在位者在第二阶段得到的是垄断利润而不是库诺特均衡利润,如果垄 断利润与库诺特均衡利润的差距足够大,如果在位者有足够的信心选择一 个非单阶段最优价格可能是最优的。 在均衡情况下,在位者究竟选择什么价格,不仅与成本函数有关,而且与 进入者的先验概率x有关。而不关x为多少,单阶段最优垄断价格不构成均 衡。

精练贝叶斯均衡是泽尔腾不完全信息动态博弈子博弈精练 纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。
基本思路-不完全信息动态博弈

成语故事:黔之驴-驴虎博弈
老虎通过不断试探来修正对毛驴的看 法,每一步行动都是给定它的信念下最优 的,毛驴也是如此。最终老虎将毛驴吃掉。
基本思路-不完全信息动态博弈
价格 在位者高成本时的利润 P=4 2 P=5 6 P=6 7


在位者低成本时的利润
6
9
8
进入者只有 一种类型:进入成 本为2,如果进入, 生产成本函数与在 位者高成本函数相 同。
在位者 P=4 P=5
N 低 [1-x]
[x]

T=2,如果进入者已进入,在位者成 本函数为共同知识,若在位者为高成 本,p=5时,每个企业利润为3,扣 除进入成本2,进入者利润为1。若在 位者为低成本,p=4,在位者利润是5, 进入者成本为1,扣除进入成本2,其 利润为-1。
基本思路-不完全信息动态博弈

T=2, 企业的行动选择是一个简单的静态博弈决策问题, 但在第一阶段,情况要复杂得多:
进入者是否进入依赖于它对在位者成本函数的判断:给 定在位者是高成本时,进入者进入的净利润是1,低成本 时进入者的利润是-1,当只当进入者认为在位者是高成 本的概率大于1/2时,进入者才选择进入。 但与静态博弈不同的是,在观测到在位者第一阶段的价 格选择后,进入者可以修正对在位者成本函数的先验概 率x,因为在位者的价格可能包含其成本函数的信息。




市场进入博弈: 参与人:在位者,进入者; T=1,市场上只有一个垄断企业,在位者,一个潜在进入者 考虑是否进入;如果进入者进入,两个企业进行库挪特博弈, 在位者获得垄断利润。 类型:在位和有两种类型,高成本或低成本,进入者在博弈开 始时只知道在位者高成本的概率是x,低成本概率是1-x。称为 先验概率。 对于在位者:
不进入
不进入
进入
(2,0) (2,0)
(6,0)
(6,0)
(7,0)
(7,0)
(6,0)
(6,0)
(9,0)
(9,0) (8,0)
(8,0)
第一阶段 第二阶段
(3,1) (7,0) (3,1) (7,0) (3,1) (7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
(7,0)
(3,1) (7,0)
低成本在位者不 会选择p=5
(5,-1) (9,0) (5,-1)
(9,0) (5,-1)
(9,0)
价格 在位者高成本时的利润
P=4 2
P=5 6
P=6 7
在位者低成本时的利润
6
9
8
基本思路-不完全信息动态博弈

如:低成本的在位者不会选择p=6,因此,如果进 入者观察到在位者选择了p=6,就可以推断在位者一 定是高成本,选择进入是有利可图的。预测到p=6 会招致进入者进入,即使高成本的在位者也可能不 会选择p=6,而招致进入者的进入。相反,低成本在 位者也不会选择p=5,如果p=5会招致进入者进入的 话。
相关文档
最新文档