讲义7-不完全信息动态博弈(续1)——信号博弈分解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

( P2 )a (m) arg max a p
* t * *
(ti | m)u2 (m, a, ti );
(P 1 ) m (t ) arg max m u1 ( m, a , ti ); ( B) p(t | m)是参与人2使用Bayes法则得到的.

精练贝叶斯均衡
ห้องสมุดไป่ตู้
信号传递博弈的所有可能的精练贝叶斯均 衡可以划分为3类:

二 信号传递博弈及其应用举例
精练贝叶斯纳什均衡的定义
定义:精炼贝叶斯均衡是一个战略组合 s*( ) (s1*(1), pn ,满足: 和一个后验概率组合p= p1 (P)对于所有的参与人i,在每一个信息集h, h si ( s i , i ) arg max pi ( i a i )ui ( si , s i , i )
m2
2 [1-q] a1 a2
信号传递博弈实际上是不完全信息情况 下的Stackelberg博弈
信号发出者是领头者(leader),信号接收者是尾随者 (Follower)。 当参与人1发出信号时,他预测到参与人2将根据他发出的信 号修正对自己类型的判断,因而他的问题是如何选择一个 最优的类型依存信号战略m*(tj)? 同样,参与人2知道参与人1选择的是给定类型和考虑信息效 应情况下的最优战略,因此他的问题是使用Bayes法则修 正对参与人1类型的判断,选择自己的最优行动a*(m)。
分离均衡:不同类型的发送者(参与人1)以1的概 率选择不同的信号,或者说,没有任何类型选择与 其他类型相同的信号;在分离均衡下,信号准确地 揭示出类型。 混同均衡:不同类型的发送者选择相同的信号,或 者说,没有任何类型选择与其他类型不同的信号, 因此,接收者不修正先验概率。 准分离均衡:一些类型的发送者随机地选择信号, 另一些类型的发送者选择特定的信号。
(4)双方的得益函数为u1(m,a,t)和u2(m,a,t )。 下图是一个简单的信号传递博弈的展开式表述,这 里K=J=H=2,p=p(t1|m1),q=p(ti|m2)(省略 了得益):
t1
1 N
[p]
t2
[1-p]
1
m1
[P]2 a1 a2
m2
[q] 2 a1 a2
m1
[1-p] 2 a1 a2
si
, sn*(n ))
i
h (B) pi (i a i )是使用贝叶斯法则从先验概率 pi (i i ) 、观测到 * h s 的 a 和最优战略 i () 得到的(在可能情况下)。 i
精练贝叶斯纳什均衡的要点

精练贝叶斯均衡是均衡战略和均衡信念的结合:给定信 * * 是最优的; 念 p ( p1 , , pn ) ,战略 s* (s1 , , sn ) 给定战略 s (s1 , , sn ),信念 p ( p1 , , pn ) 是使用贝 叶斯法则从均衡战略和所观测到的行动得到的。
* * *


求解精炼贝叶斯均衡的过程中,有一点需要注意的是: 在完全信息博弈中,我们习惯用逆向归纳法(backward induction)求解精炼均衡;但是,在不完全信息博弈的 情况下,后验概率与战略是相互依存的关系,两者互相 依赖,这样,如果我们不清楚先行动者的行动选择,我 们就不可能知道后行动者应该如何选择。因此,逆向归 纳发在不完全信息博弈求解中是不适用的,取而代之, 我们必须使用前向法(forward manner)进行贝叶斯修正。
信号传递博弈及其应用举例


信号传递博弈是一种比较简单的但有广泛应用意义的 不完全信息动态博弈。 它是由两阶段市场在位者和进入者博弈衍生出来的一 类特定背景下的博弈,并在许多领域如劳动力市场招 聘者和应聘者博弈、二手车市场博弈等等有广泛应用
在后面的所有 ppt描述中,用 ti 代替了
i
~ ~ 同时,修正后验概率 p, q 用 P和q代替了
μ<1/2时,精练贝叶斯均衡为: 不论是高成本还是低成本,在 位者选择p=5;进入者进入, 当且仅当进入者观察到p=6(基 于(6)=1)。 混同均衡
N
[μ ] 高 低 [1-μ]
μ≥1/2时,精练贝叶斯均衡为: 低成本在位者选择p=4,高成本 在位者选择p=6;进入者选择不 进入,如果观测到p=4;进入者 选择进入,如果观测到p=6或 p=5(基于 (6)=1, (5)≥1/2)。 在位者 p=5 分离均衡 p=6
在位者
p=4 p=5 p=6
在位者
p=4
进入者
进入 不进入 进入 不进入 进入
不进入
不进入 进入
不进入
进入
不进入
进入
(2,0) (2,0)
(6,0)
(6,0)
(7,0)
(7,0)
(6,0)
(6,0)
(9,0)
(9,0) (8,0)
(8,0)
第一阶段 第二阶段
(3,1) (7,0) (3,1) (7,0)
管理博弈论
(Management Game Theory)
第七讲 不完全信息动态博弈(续1)——信号博弈 主讲人:张成科 博士 广东工业大学经济与贸易学院
zhangck@gdut.edu.cn
目录导航


一 精练贝叶斯纳什均衡
基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡
(3,1)
参与人? 博弈顺序? 博弈结果? 市场进入博弈-2阶段不完全信息动态博弈
(7,0) (5,-1) (9,0) (5,-1)
(9,0) (5,-1)
(9,0)
信号博弈模型描述
假设: (1)参与人1的类型为ti∈T={t1,t2,…,tK} 参与人1知道ti,但参与人2不知道,只知道1的类型的先验概 率p(ti), Σp(ti)=1。 (2)参与人1在知道自己的类型后选择发出信号m∈M={m1, m2,…,mJ}。 (3)参与人2观测到参与人1发出的信号(但不是类型) 使用Bayes法则从先验概率p=p(ti)得到后验概率p=p(ti|m), 然后选择行动a∈A={a1,a2,…,aH};
——此处参与人的最优是指根据修正概率计算的期望支付最优。
其中:m(t)是参与人1的类型依存信号策略,a(m)是参与人2 的行为策略(允许混合策略)。
信号传递博弈的精练Bayes均衡定义
定义: 信号传递博弈的精练Bayes均衡是战略组 合(m*(t),a*(m))和后验概率p(ti|m)的结合, 它满足:
相关文档
最新文档