第13章信号博弈和其应用

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

信号条件(2R) ：
• 对M中的每一mj，并在给定对 p(ti mj ) 的推断的条件下，接收者的行动 a*(mj )必
须使接收者的期望效用最大化，即
a*
(m
j
)

arg
Max
ak A
U
R
(m
j
,
ak
)
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
• 相反，接收者在不知道发送者类型的条件下观测到发送者的信号，并选择行动，也就是说接收者的选择处于一个非单决策结的信息集上，因此，需将精炼贝叶斯Nash均衡定义中的条件(1)应用于接收者的信息集。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
All Rights Reserved, 2007, Luo Yunfeng
• 在信号博弈中，发送者发出的信号依赖于自然赋予的类型，因此，先行动的信号发送者的行动，对后行动的信号接收者来说，具有传递信息的作用。同时，这又使得接收者的行动依赖于发送者选择的信号。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
考察信号博弈的一种简单情况的扩展式描
述(不考虑支付)
a1 x3
a2
发送者
m1
t1
m2
x1 p
a1 x5
a2
接受者
自然
接受者
a1
1 p
a1
x4 a2
x2
m1
t2
m2
发送者
x6 a2
Control Science and Engineering, HUST
4) 战略(m2, m2)——如果自然赋予t1，则发送者选择m2，即s(t1)= m2；如果自然赋予t2，则发送者选择m2，即s(t2)=m2。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
• 对于接收者，其信息集为IR({x3,x4}) 和IR({x5,x6})，分别对应于观测到信号m1和m2，行动为a1和a2，因此，接收者的战略s为：
2) 战略(a1, a2)——如果发送者选择m1，则接收者选择a1 ，即s(m1)=a1；如果发送者选择m2 ，则接收者选择a2，即s(m2)= a2；
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
All Rights Reserved, 2007, Luo Yunfeng
• 发送者的信息集为Is(x1)和Is(x2)，分别对应于观测到自然的选择为t1和t2，行动为 m1和m2 ，因此，发送者的战略s为：
s: HS M
• 其中，HS为发送者的信息集集合，即
HS {IS ({x1}), IS ({x2})}
All Rights Reserved, 2007, Luo Yunfeng
• 为了求解信号博弈的精炼贝叶斯Nash均衡，需将精炼贝叶斯Nash均衡定义中的条件(1)～(4)分别施加到信号博弈之上。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
2) 发送者观测到ti，然后从可行的信号集M={m1, m2,…,mJ}中选择一个发送信号mj；
3) 接收者不能观测到ti，但能观测到mj ，他从可行的行动集A={a1,a2,…,aK}中选择一个行动 ak；
4) 双方分别得到收益uS(ti, mj, ak)和uR(ti, mj, ak)。
Control Science and Engineering, HUST
s: HR A
• 其中，HR为接收者的信息集集合，即HR={IR({x3,x4}), IR({x5,x6})}。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
接收者有以下4种纯战略：
1) 战略(a1, a1)——如果发送者选择m1，则接收者选择a1 ，即s(m1)=a1；如果发送者选择m2 ，则接收者选择a1，即s(m2)= a1；
• 1) 由于发送者知道自己的类型，其选择发生于单决策结信息集，因此，精炼贝叶斯Nash均衡定义中的条件(1)在应用于发送者时就无需附加任何条件；
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
2) 战略(m1,m2)——如果自然赋予t1，则发送者选择m1，即s(t1)=m1；如果自然赋予 t2，则发送者选择m2，即s(t2)=m2；
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
3) 战略(m2,m1)——如果自然赋予t1，则发送者选择m2，即s(t1)= m2；如果自然赋予t2，则发送者选择m1，即s(t2)=m1；
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
其具体博弈时序如下：
1) 自然根据特定的概率分布p(ti)，从可行的类型集T={t1,t2,…,tn}中选择发送者类型ti，这里，对 i {1, 2, ，, np}(ti)>0且p(t1)+ …+p(tn)=1 ；
• 2) 给定发送者的信号和接收者的推断，精炼贝叶斯Nash均衡定义中的条件(2)要求接收者选择最优行动，因此，需将精炼贝叶斯Nash均衡定义中的条件(2)施加于接收者的行动。此时，可得到信号条件(2R)。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
All Rights Reserved, 2007, Luo Yunfeng
• 1) 对于第1和第4个战略，由于在不同类型时发送者都发出相同的信号，因此称其为混同(pooling)战略。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
必须对哪些类型可能会发送mj，持有一
个推断。这一推断用概率分布 p(ti mj )表示，
其中对
，ti T
p(ti m且j ) 0
p(ti mj ) 1
ti T
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
• 当精炼贝叶斯Nash均衡定义中的条件(1) 应用于信号博弈接收者的信息集时，可得信号条件(1)。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
信号条件(1)
• 在观测到M中的任何信号mj之后，接收者
All Rights Reserved, 2007, Luo Yunfeng
All Rights Reserved, 2007, Luo Yunfeng
• 信号博弈(signaling games)是一类比较简单而应用相当广泛的不完全信息动态博弈，其基本特征是博弈参与人分为信号发送者(Sender，用S表示)和信号接收者 (Receiver，用R表示)两类，信号发送者先行动，发送一个关于自己类型的信号，信号接收者根据所接收到的信号选择自己的行动。
ConБайду номын сангаасrol Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
发送者有以下4种纯战略：
1) 战略(m1,m1)——如果自然赋予t1，则发送者选择m1，即s(t1)=m1；如果自然赋予 t2，则发送者选择m1，即s(t2)=m1；
• 2) 对于第2和第3个战略，由于在不同类型时发送者发出不同的信号，因此称其为分离(separating)战略，分离战略意味着不同类型的发送者发出不同的信号。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
• 在发送者的4个战略中，根据发送者的类型与发送信号间的相互关系，可将发送者的战略分为两类——混同战略和分离战略。
Control Science and Engineering, HUST
• 在多于两种类型的模型中，还存在部分混同(partially pooling)战略，其中所有属于给定类型集的类型都发送同样的信号，但不同的类型集发送不同的信号。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
第十三章信号博弈及其应用
主要内容：一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈
Control Science and Engineering, HUST
• 与混同战略相似，在多于两种类型的模型中，还存在准分离(semi-separating)战略，其定义与部分混同战略相同。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
• 在信号博弈中还存在与混合战略相类似的战略，称为杂合战略(hybrid strategy)。
接收者有以下4种纯战略：
3) 战略(a2, a1)——如果发送者选择m1，则接收者选择a2 ，即s(m1)=a2；如果发送者选择m2 ，则接收者选择a1，即s(m2)= a1；
4) 战略(a2, a2)——如果发送者选择m1，则接收者选择a2 ，即s(m1)=a2；如果发送者选择m2 ，则接收者选择a2，即s(m2)= a2；
All Rights Reserved, 2007, Luo Yunfeng
信号条件(2S)：
• 对T中的每一ti，在给定接收者战略 a*(mj ) 的条件下，发送者选择的信号 m*(ti ) 必须
使发送者的效用最大化，即
m*
(ti
)

arg
Max
m j M
us
(ti
,
m
j
,
a*
(m
j
))
Control Science and Engineering, HUST
第四部分：不完全信息动态博弈
第十三章信号博弈及其应用
主要内容：一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈
第十三章信号博弈及其应用
主要内容：一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈
Control Science and Engineering, HUST
• 精炼贝叶斯Nash均衡定义中的条件(2) 同样需施加于发送者的选择，但由于发送者的选择发生于单决策结信息集上，发送者拥有完全信息，并且发送者只在博弈的开始时行动，因此，精炼贝叶斯Nash均衡定义中的条件(2)施加于发送者的选择时，必须满足信号条件(2S)。
Control Science and Engineering, HUST