Lecture 5 不完全信息动态博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.3 声誉模型
5.3.1 “声誉”与连锁店悖论
分离均衡:
• • • •
分离均衡中理智在位者选择原价,因此������ = 0 理智的在位者第一期采用原价的总支付为50 + 50������ 观察到在位者第一期采用低价,进入者认为在位者一定是 疯狂的,因此在第二期会选择不进入,这使得理智在位者 第一期选择低价的总支付为100 + 30������ 分离均衡要求50 + 50������ ≥ 100 + 30������ ,即������ ≤ 0.4
考虑一个两阶段的吓阻进入的博弈,贴现因子为������。为了简
化起见,这里考虑给定进入者在第一期进入之后的博弈。
5.3 声誉模型
5.3.1 “声誉”与连锁店悖论
策略:
•
•
•
信念
•
疯狂的在位者:在第一期和第二期都一定选择低价,因此 博弈中不用考虑其策略 理性的在位者:在第二期必选择原价(若进入者进入), 因此主要考虑的是其在第一期的策略:原价 or 低价 在位者:这里考虑进入者在第一期进入之后的博弈,因此 主要考虑的是进入者在第二期的策略,即观察到在位者第 一期原价后,进入 or 不进;观察到在位者第一期低价后, 进入 or 不进。 进入者在第一期结束之后,第二期决定是否进入之前形成 信念������(进入者为理智的概率)。
发送者������1 选择L(支付为1)优于选择R(支付为0) 发送者������2 选择R(支付为1)的支付低于L(支付为2),从 而无法达成均衡。
5.2 信号博弈
Case 4:分离均衡(R,L)
接受者分别在观察到L和R后形成信念������和������,由于在该情况
下,只有类型������1 (������2 )的发送者选R(L),因此������ = 0, ������ = 1。 要使得均衡成立,需要接受者在给定信念下达到最优选择
者至少得到1的支付,因此选择L不是最优,从而不能达成均衡 。
5.2 信号博弈
Case 3:分离均衡(L,R)
接受者分别在观察到L和R后形成信念������和������,由于在该情况
下,只有类型������1 (������2 )的发送者选L(R),因此������ = 1, ������ = 0。 要使得均衡成立,需要接受者在给定信念下达到最优选择
•
显然当������ ≤ 2/3时,两种类型的发送者选择L会更好
观察到L后,接受者选择������的支付为3∗0.5+4∗0.5=3.5,选择������ 的支付为0∗0.5+1∗0.5=0.5,从而最优选择为������。使得在均衡 路径上类型������1 和������2 的发送者支付分别为1和2。 观察到R后,给定信念������,接受者选择������的支付为������,选择������ 的支付为2(1−������)。若������ ≥ 2/3,接受者的最优选择为������,类 型������1 和������2 的发送者支付分别为2和1;若������ ≤ 2/3,接受者的 最优选择为������ ,类型������1 和������2 的发送者支付分别为0和1
5.2 信号博弈
Case 1:混同于行动L的PBE
接受者分别在观察到L和R后形成信念������和������,由于在该情况
下,发送者都选择L,因此������ = 0.5(没有信念更新)。 要使得均衡成立,需要接受者在给定信念下达到最优选择
•
•
要使得均衡成立,还需要发送者选择L比选择R要好。 混同均衡:
•
•
给定在位者选������ ,进入者(E)的最优选择是������ ,子博弈上得 到支付3,因此在最初会选择In
给定在位者选������ ,进入者(E)的最优选择是������ ,子博弈上得 到支付-2,因此在最初会选择Out
5.1 不完全信息动态博弈
例5.1.2:吓阻进入(2)
由C3,在均衡路径上,信念由进入者的策略决定
������, ������ , ������, ������ ; ������ = 0.5, ������ ≤ 2/3
5.2 信号博弈
Case 2:混同于行动R的PBE
接受者分别在观察到L和R后形成信念������和������,由于在该情况
下,发送者都选择R,因此������ = 0.5(没有信念更新)。 要使得均衡成立,需要接受者在给定信念下达到最优选择
������ < ������时,第一类混同均衡中接讯者观察到啤酒(非均衡路
径)后的信念������ ≥ 0.5是不合理的:类型为弱(������1 )的发讯者均衡 中报酬为B+D高于D(这是传递信号啤酒后的最高报酬),根 据直观准则,信念������ = 0 ,因而这个PBE被剔除了。
5.3 声誉模型
5.2 信号博弈
5.2.1 “啤酒饼干”博弈与“直观准则”
若������ > ������,对类型������1的发讯者来说选择饼干严格由于啤酒,
饼干, 啤酒 , 决斗, 不决斗 ; ������ = 0, ������ = 1
对类型������2 的发讯者来说选择啤酒严格由于饼干,于是存在唯一 的分离均衡
当������ ≤ 0.4时,存在分离均衡
原价, 低价 , 进入, 不进 ; ������ = 0
5.3 声誉模型
5.3.1 “声誉”与连锁店悖论
混同均衡:
• • •
混同均衡中理智在位者选择低价,因此������ = ������ 理智的在位者第一期采用原价的总支付为50 + 50������ 观察到在位者第一期采用低价,进入者认为在位者是理智 的概率为������。此时,其选择不进入的支付为0,选择进入的 支付为������ ∗ 10������ + (1 − ������)(−10������) 。因此若������ ≥ 0.5,进入者 最优选择为进入,从而在位者选择低价的支付为30 + 50������ ;若������ ≤ 0.5,进入者最优选择为不进,从而在位者选择低 价的支付为30 + 100������ 。 混同均衡要求30 + 100������ ≥ 50 + 50������ ,即������ ≥ 0.4
若������ < ������,不存在分离均衡,存在两类混同均衡
饼干, 饼干 , 决斗, 不决斗 ; ������ = 0.1, ������ ≥ 0.5
啤酒, 啤酒 , 决斗, 不决斗 ; ������ ≥ 0.5, ������ = 0.1
5.2 信号博弈
5.2.1 “啤酒饼干”博弈与“直观准则”
要使得均衡成立,还需要发送者������1选择R,������2选择L为最优。 分离均衡:
������, ������ , ������, ������ ; ������ = 0, ������ = 1
5.2 信号博弈
5.2.1 “啤酒饼干”博弈与“直观准则”
5.2 信号博弈
5.2.1 “啤酒饼干”博弈与“直观准则”
第五讲 不完全信息动态博弈
5.1 不完全信息动态博弈
阻碍进入:静态博弈
5.1 不完全信息动态博弈
阻碍进入:静态博弈
5.1 不完全信息动态博弈
阻碍进入:动态博弈
5.1 不完全信息动态博弈
阻碍进入:动态博弈
5.1 不完全信息动态博弈
精炼贝叶斯均衡(Perfect Bayesian Equilibrium,PBE)
直观准则 (Intuitive Criterion):如果信息(m)后的信息集合在非
均衡路径上,而且该信息m对类型������������ 的传讯者而言是均衡被占 优的(equilibrium-dominated),即������������ 在均衡路径的报酬高于������������ 发送 信息m之后的最高报酬,那么接讯者观察到信息m后对类型������������ 的 信念应该为0。
5.1 不完全信息动态博弈
例5.1.1:吓阻进入
5.1 不完全信息动态博弈
例5.1.1:吓阻进入(1)
由C1,在位者(I)形成信念 ������和 1 − ������,分别为强势进入和
弱势进入的概率:
由C2,给定信念,在位者选择合作的期望支付为1 − ������,选 由C3,在均衡路径上,信念由进入者的策略决定p=1 均衡
•
注意到此时,在非均衡路径上(即选择R),类型������1 的发送
观察到R后,接受者选择������的支付为1∗0.5+0∗0.5=0.5,选择������ 的支付为0∗0.5+2∗0.5=1,从而最优选择为������ 。使得在均衡路 径上类型������1 和������2 的发送者支付分别为0和1。
•
• • •
观察到L后,接受者的最优选择为������。使得类型������1 和������2 的发 送者选择L的支付分别为1和2。
观察到R后,接受者的最优选择为������。使得类型������1 和������2 的发 送者选择R支付分别为0和1
要使得均衡成立,还需要发送者������1选择L,������2选择R为最优。
5.2 信号博弈
u
d
(4, 0)
(1,3)
L
[ p]
发送者
R
[q]
u
Baidu Nhomakorabea
(2,1)
t1
自然
0.5
d
[1 q]
(0, 0)
(1, 0)
(2, 4)
u
[1 p]
t2 0.5
发送者
u
(0,1)
d
L
R
d
(1, 2)
5.2 信号博弈
该博弈可能存在的纯策略PBE有。
•
•
•
•
1、混同于行动L的PBE——无论发送者的类型是t1和t2,发 送者的策略都为(L,L) 2、混同于行动R的PBE——无论发送者的类型是t1和t2,发 送者的策略都为(R,R) 3、分离均衡——类型t1的发送者选择L,类型t2发送者选择R, 发送者的策略都为(L,R) 4、分离均衡——类型t1的发送者选择R,类型t2的发送者选择 L,发送者的策略都为(R,L)
5.3.1 “声誉”与连锁店悖论
连锁店悖论:根据子博弈归纳,无论下图(左)的吓阻进入
博弈重复多少次(有限次),均衡中每一个阶段博弈,进入者 都会进入,在位者的也会采用原价。
引入信息不对称:在位者有可能是“疯狂”的(如右图)
理智在位者
疯狂在位者
5.3 声誉模型
5.3.1 “声誉”与连锁店悖论
由C4,在非均衡路径上,信念由进入者的策略决定
•
唯一的均衡PBE为
5.2 信号博弈
信号博弈的一般形式
5.2 信号博弈
信号博弈的一般形式
5.2 信号博弈
信号博弈的均衡
信号传递博弈的所有可能精炼贝叶斯均衡可以划分为三类:
分离均衡、混同均衡和半分离均衡。
• •
•
分离均衡(Separating Equilibrium):不同类型的发送者以1 的概率选择不同的信号,信号准确地揭示出类型。 混同均衡(Pooling Equilibrium):不同类型的发送者选择 相同的信号,接收者不修正先验概率(发送者的选择没有 信息量)。 半分离均衡(Semi-separating Equilibrium):一些类型的发 送者随机地选择信号,另一类的发送者选择特定的信号。
• •
((强势进入,合作);p=1) 求解PBE时,一定要列举出信念
择价格战的支付为-1,因此在位者的最优选择是合作。给定在 位者选择合作,进入者会选择强势进入。
5.1 不完全信息动态博弈
例5.1.2:吓阻进入(2)
5.1 不完全信息动态博弈
例5.1.2:吓阻进入(2)
由C1,在位者(I)形成信念 ������ 和 1 − ������,分别为������和������的概率 由C2,给定信念,在位者(I)的期望支付为
• •
进入者的策略{In,c}决定在位者在均衡路径上的信念为������ = 1 > 1/3,给定该信念,进入者的策略{In,c}与在位者的策 略c互为最优反应,得到WPBE ������������, ������ , ������ ; ������ = 1 进入者的策略{Out,c}使得信念出现在非均衡路径上,此 时任意信念为������ < 1/3,进入者的策略{Out,c}与在位者的 策略f互为最优反应,得到WPBE ������������������,������ , ������ ; ������ < 1/3 第二个均衡非均衡路径上的策略������ 使得信念������ = 1,与������ < 1/3矛盾,因此可以去掉 ������������, ������ , ������ ; ������ = 1
•
• • •
观察到L后,接受者的最优选择为������。使得类型������1 和������2 的发 送者选择L的支付分别为1和2。
观察到R后,接受者的最优选择为������。使得类型������1 和������2 的发 送者选择R支付分别为1和0 发送者������1 选择R(支付为1)与选择R(支付为1)无差异 发送者������2 选择L(支付为2)优于选择R(支付为0)