第13章信号博弈和其应用
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信号条件(2R) :
• 对M中的每一mj,并在给定对 p(ti mj ) 的推断的条件下,接收者的行动 a*(mj )必
须使接收者的期望效用最大化,即
a*
(m
j
)
arg
Max
ak A
U
R
(m
j
,
ak
)
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
• 相反,接收者在不知道发送者类型的条 件下观测到发送者的信号,并选择行动, 也就是说接收者的选择处于一个非单决 策结的信息集上,因此,需将精炼贝叶 斯Nash均衡定义中的条件(1)应用于接收 者的信息集。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
All Rights Reserved, 2007, Luo Yunfeng
• 在信号博弈中,发送者发出的信号依赖 于自然赋予的类型,因此,先行动的信 号发送者的行动,对后行动的信号接收 者来说,具有传递信息的作用。同时, 这又使得接收者的行动依赖于发送者选 择的信号。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
考察信号博弈的一种简单情况的扩展式描
述(不考虑支付)
a1 x3
a2
发送者
m1
t1
m2
x1 p
a1 x5
a2
接受者
自然
接受者
a1
1 p
a1
x4 a2
x2
m1
t2
m2
发送者
x6 a2
Control Science and Engineering, HUST
4) 战略(m2, m2)——如果自然赋予t1,则发 送者选择m2,即s(t1)= m2;如果自然赋 予t2,则发送者选择m2,即s(t2)=m2。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
• 对于接收者,其信息集为IR({x3,x4}) 和IR({x5,x6}),分别对应于观测到信 号m1和m2,行动为a1和a2,因此,接 收者的战略s为:
2) 战略(a1, a2)——如果发送者选择m1,则 接收者选择a1 ,即s(m1)=a1;如果发送 者选择m2 ,则接收者选择a2,即s(m2)= a2;
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
All Rights Reserved, 2007, Luo Yunfeng
• 发送者的信息集为Is(x1)和Is(x2),分别对 应于观测到自然的选择为t1和t2,行动为 m1和m2 ,因此,发送者的战略s为:
s: HS M
• 其中,HS为发送者的信息集集合,即
HS {IS ({x1}), IS ({x2})}
All Rights Reserved, 2007, Luo Yunfeng
• 为了求解信号博弈的精炼贝叶斯Nash均 衡,需将精炼贝叶斯Nash均衡定义中的 条件(1)~(4)分别施加到信号博弈之上。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
2) 发送者观测到ti,然后从可行的信号集M={m1, m2,…,mJ}中选择一个发送信号mj;
3) 接收者不能观测到ti,但能观测到mj ,他从 可行的行动集A={a1,a2,…,aK}中选择一个行动 ak;
4) 双方分别得到收益uS(ti, mj, ak)和uR(ti, mj, ak)。
Control Science and Engineering, HUST
s: HR A
• 其中,HR为接收者的信息集集合, 即HR={IR({x3,x4}), IR({x5,x6})}。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
接收者有以下4种纯战略:
1) 战略(a1, a1)——如果发送者选择m1,则 接收者选择a1 ,即s(m1)=a1;如果发送 者选择m2 ,则接收者选择a1,即s(m2)= a1;
• 1) 由于发送者知道自己的类型,其选择 发生于单决策结信息集,因此,精炼贝 叶斯Nash均衡定义中的条件(1)在应用于 发送者时就无需附加任何条件;
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
2) 战略(m1,m2)——如果自然赋予t1,则发 送者选择m1,即s(t1)=m1;如果自然赋予 t2,则发送者选择m2,即s(t2)=m2;
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
3) 战略(m2,m1)——如果自然赋予t1,则发 送者选择m2,即s(t1)= m2;如果自然赋 予t2,则发送者选择m1,即s(t2)=m1;
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
其具体博弈时序如下 :
1) 自然根据特定的概率分布p(ti),从可行的类 型集T={t1,t2,…,tn}中选择发送者类型ti,这里, 对 i {1, 2, ,, np}(ti)>0且p(t1)+ …+p(tn)=1 ;
• 2) 给定发送者的信号和接收者的推断, 精炼贝叶斯Nash均衡定义中的条件(2)要 求接收者选择最优行动,因此,需将精 炼贝叶斯Nash均衡定义中的条件(2)施加 于接收者的行动。此时,可得到信号条 件(2R)。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
All Rights Reserved, 2007, Luo Yunfeng
• 1) 对于第1和第4个战略,由于在不同类 型时发送者都发出相同的信号,因此称 其为混同(pooling)战略。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
必须对哪些类型可能会发送mj,持有一
个推断。这一推断用概率分布 p(ti mj )表示,
其中对
,ti T
p(ti m且j ) 0
p(ti mj ) 1
ti T
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
• 当精炼贝叶斯Nash均衡定义中的条件(1) 应用于信号博弈接收者的信息集时,可 得信号条件(1)。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
信号条件(1)
• 在观测到M中的任何信号mj之后,接收者
All Rights Reserved, 2007, Luo Yunfeng
All Rights Reserved, 2007, Luo Yunfeng
• 信号博弈(signaling games)是一类比较简 单而应用相当广泛的不完全信息动态博 弈,其基本特征是博弈参与人分为信号 发送者(Sender,用S表示)和信号接收者 (Receiver,用R表示)两类,信号发送者 先行动,发送一个关于自己类型的信号, 信号接收者根据所接收到的信号选择自 己的行动。
ConБайду номын сангаасrol Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
发送者有以下4种纯战略:
1) 战略(m1,m1)——如果自然赋予t1,则发 送者选择m1,即s(t1)=m1;如果自然赋予 t2,则发送者选择m1,即s(t2)=m1;
• 2) 对于第2和第3个战略,由于在不同类 型时发送者发出不同的信号,因此称其 为分离(separating)战略,分离战略意味着 不同类型的发送者发出不同的信号。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
• 在发送者的4个战略中,根据发送者的类 型与发送信号间的相互关系,可将发送 者的战略分为两类——混同战略和分离 战略。
Control Science and Engineering, HUST
• 在多于两种类型的模型中,还存在部分 混同(partially pooling)战略,其中所有属 于给定类型集的类型都发送同样的信号, 但不同的类型集发送不同的信号。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
第十三章 信号博弈及其应用
主要内容: 一、信号博弈 二、信号博弈的精炼贝叶斯Nash均衡 三、信号博弈的应用 四、空谈博弈
Control Science and Engineering, HUST
• 与混同战略相似,在多于两种类型的模 型中,还存在准分离(semi-separating)战 略,其定义与部分混同战略相同。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
• 在信号博弈中还存在与混合战略相类似 的战略,称为杂合战略(hybrid strategy)。
接收者有以下4种纯战略:
3) 战略(a2, a1)——如果发送者选择m1,则 接收者选择a2 ,即s(m1)=a2;如果发送 者选择m2 ,则接收者选择a1,即s(m2)= a1;
4) 战略(a2, a2)——如果发送者选择m1,则 接收者选择a2 ,即s(m1)=a2;如果发送 者选择m2 ,则接收者选择a2,即s(m2)= a2;
All Rights Reserved, 2007, Luo Yunfeng
信号条件(2S):
• 对T中的每一ti,在给定接收者战略 a*(mj ) 的条件下,发送者选择的信号 m*(ti ) 必须
使发送者的效用最大化,即
m*
(ti
)
arg
Max
m j M
us
(ti
,
m
j
,
a*
(m
j
))
Control Science and Engineering, HUST
第四部分: 不完全信息动态博弈
第十三章 信号博弈及其应用
主要内容: 一、信号博弈 二、信号博弈的精炼贝叶斯Nash均衡 三、信号博弈的应用 四、空谈博弈
第十三章 信号博弈及其应用
主要内容: 一、信号博弈 二、信号博弈的精炼贝叶斯Nash均衡 三、信号博弈的应用 四、空谈博弈
Control Science and Engineering, HUST
• 精炼贝叶斯Nash均衡定义中的条件(2) 同样需施加于发送者的选择,但由于 发送者的选择发生于单决策结信息集 上,发送者拥有完全信息,并且发送 者只在博弈的开始时行动,因此,精 炼贝叶斯Nash均衡定义中的条件(2)施 加于发送者的选择时,必须满足信号 条件(2S)。
Control Science and Engineering, HUST