贝叶斯博弈与贝叶斯Nash均衡
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
U -4, -4
0, -2
1
D
0, 2
1, 0
• 博弈存在唯一的Nash均衡——(D, U)。
当参与人都为软弱者时
2
U
D
U -4, -4
0, 0
1
D
0, 0
1, 1
• 博弈存在唯一的Nash均衡——(D, D)。
2
U
D
2
U
D
U
1
D
-4, -4 -2, 2
2, -2
U
1
0, 0
D
(1) 参与人都为强硬者
市场需求:
P= a − Q
Q= q1 + q2
进一步假设:
a = 2;
=c1 1,= c2L
3 4
,= c2H
5; 4
p=1 2
企业2:
π 2 = q2 ⋅ (P − c2 )
= q2 ⋅ (a − c2 − q2 − q1)
• 令 a − c2 = t 则 π 2=q2 ⋅ (t − q2 − q1)
(4) 参与人i得到 ui (a1(t1), a2 (t2 ),, an (tn );ti ) 。
贝叶斯博弈中的战略
• 在贝叶斯博弈G =< Γ; (T ); ( p ); ( A (t )); (u (a(t); t )) >中,
i
i
ii
i
i
参与人i的一个战略是从参与人的类型集
Ti到其行动集的一个函数si(ti),它包含了 当自然赋予i的类型为ti时,i将从可行的 行动集Ai(ti)中选择的行动。
U
1
D
2
U
D
-4, -4
2, -2
-2, 2
0, 0
• 博弈存在两个纯战略Nash均衡—— (U, D)和(D,U)。
当参与人1为强硬者参与人2为软弱者时
2
U
D
U -4, -4
2, 0
1
D
-2, 0
0, 1
• 博弈存在唯一的Nash均衡——(U, D)。
当参与人1为软弱者参与人2为强硬者时
2
U
D
• 同样,“软弱”的参与人1也会面临类似 的问题。此时,“斗鸡博弈”就是一个 不完全信息博弈问题。
• 对于不完全信息博弈问题,是不可能应 用前面两部分介绍的方法进行求解的。
• 这是因为给定参与人1为“强硬”的决斗 者,如果对手是“软弱”的,那么博弈 就只存在惟一的Nash均衡(U, D),参与人 1有惟一的最优选择“冲上去”;如果对 手是“强硬”的,则博弈就会出现两个N ash均衡(U,D)和(D,U),参与人1的最优选 择取决于对手的选择。
• 所谓“强硬”的参与人是指那些喜欢争 强好胜、不达目的誓不罢休的决斗者;
• 而“软弱”的参与人是指那些胆小怕事、 遇事希望息事宁人的决斗者。
• 显然,当具有不同性格特征的决斗者相 遇时,所表现出来的博弈情形是不同的。
• 令U表示冲上去;D表示退下去,则每种 情况下博弈情形如下图所示。
当参与人都为强硬者时
• 但由于参与人1不知道对手究竟是“强硬” 的还是“软弱”的,因此,此时的参与 人1就觉得自己似乎是在与两个决斗者进 行决斗,一个是“强硬”的,另一个是 “软弱”的。
• 当一个参与人并不知道在与谁博弈时, 博弈的规则是没有定义的,如何处理不 完全信息?
• Harsanyi提出了Harsanyi转换。
t− i ∈T− i
• 其中,对 ∀t−i , ∈T−i a−i (t−i ) 为给定t-i时由s-i 所确定的其他参与人的行动组合
s−i
(t−i
)
=
(s1
(t1
), ,
si −1 (ti −1 ),
si+1
(ti
+1
),
,
sn
(tn
))
• 在贝叶斯博弈中,对于一个理性的参与
人i,当他只知道自己的类型ti而不知道其 他参与人的类型时,给定其他参与人的
p(t1,…,tn)表示定义在参与人类型组合上 的一个联合分布密度函数,Harsanyi转换 假定:对于一个给定的不完全信息博弈 问题,存在一个参与人关于“自然”选 择的推断p(t1,…,tn),且p(t1,…,tn)为共同知 识。也就是说,Harsanyi转换假定所有参 与人关于“自然”行动的信念(belief)是 相同的,并且为共同知识。
• 用 pi (t−i ti ) 表示参与人i在知道自己类型为ti 的情况下,关于其他参与人类型的推断
(即条件概率),则
p= i (t−i ti )
p= (t−i , ti ) p(ti )
p(t−i , ti )
∑ p(t−i , ti )
t− i ∈T− i
• 其中, p(ti ) 为边缘密度函数。
动组合 (a1∗(t1), a2∗(t2 ),, an∗(tn )) ,其中每个参与人 在给定自己的类型ti和其他参与人的类型相依 行动 a−∗i (t−i ) 的情况下最大化自己的期望效用。
•
也就是,行动组合
(a1∗
(t1),
a2∗
(t2
), ,
an∗
(tn
))
是一个
纯战略贝叶斯Nash均衡,如果对 ∀i∈Γ ,
• 贝叶斯博弈(the static Bayesian game)是关 于不完全信息静态博弈的一种建模方式, 也是不完全信息静态博弈的标准式描述。
贝叶斯博弈的定义
• 贝叶斯博弈包含以下五个要素: (1)参与人集合 Γ ={1, 2,..., n} ; (2)参与人的类型集T1,…,T2; (3)参与人关于其他参与人类型的推断 p1(t−1 t1),
); ( A i
(t i
)); (u i
(a(t); t i
))
>
中,战略组合 s* = (s1*,,sn*)是一个纯战略贝叶斯
Nash均衡,如果对 ∀i∈Γ及 ∀ti ∈Ti, si*(ti ) ,满足
∑ ∈arg si*(ti )
max
ai (ti )∈Ai (ti ) t−i∈T−i
ui (s1*(t1),, si*−1(ti−1),ai (ti ), si*+1(ti+1),, sn*(tn );ti )
• 参与人类型——成本函数。
假设:
• 企业1的成本函数为共同知识: c1(q1)= c1 ⋅ q1
• 企业2的成本函数为私人信息: c2l (q2=) c2L ⋅ q2 c2h (q2=) c2H ⋅ q2
其中,c2L < c2H
• 企业1知道企业2是 c2L 的概率为p,是 c2H 的的概 率是1-p,p和1-p为共同知识。
U
1
D
2
U
D
-4, -4
0, -2
0, 2
1, 0
U
1
D
-4, -4
2, 0
-2, 0
0, 1
(2) 参与人1为强硬者
参与人2为软弱者
2
U
D
-4, -4
0, 0
0, 0
1, 1
(3) 参与人1为软弱者 参与人2为强硬者
(4) 参与人都为软弱者
• 在“斗鸡博弈”中,虽然在博弈开始之 前每位决斗者都了解(知道)自己的性格特 征,但对对手的性格特征往往不甚了解 或了解不全。
• 在Harsanyi转换中规定:参与人关于“自 然”选择的推断为共同知识。
• 也就是说,两个决斗者不仅同时一起看 到了“自然”随机选择参与人2的性格特 征,而且同时一起看到了“自然”以一 定的概率分布随机选择参与人2的性格特 征。
在应用Harsanyi转换时,需要注意以下问题:
• 1) “自然”的选择。在一般的不完全信息 博弈问题中,Harsanyi转换规定“自然” 选择的是参与人的类型(type)。
第三部分: 不完全信息静态博弈
第十章贝叶斯博弈与贝叶斯Nash均衡
主要内容: 一、贝叶斯博弈 二、贝叶斯Nash均衡 三、贝叶斯Nash均衡的应用 四、关于混合战略Nash均衡的一个解释
一、贝叶斯博弈
• 前面两部分我们讨论了完全信息博弈问 题,但在现实生活中我们遇到更多的可 能是不完全信息博弈问题。
pi (t−i
ti )
• 即没有参与人愿意改变自己的战略,即使这种 改变只涉及一种类型下的一个行动。
三、贝叶斯Nash均衡的应用
1.不完全信息古诺模型
• 在Cournot模型中,每一个企业对其他企 业的成本和自己的成本是已知的,因而 信息是完全的。
• 然而在实际中,企业往往很难知道其他 企业的成本。当Cournot模型中至少有一 个企业不知道其他企业的成本时所对应 的模型即为不完全信息的Cournot模型。
• 在这种情况下即使所有的决斗者都看到 了上面的四个战略式博弈 ,但对决斗者 来讲,仍存在着所谓的事前不确定性即 博弈开始之前就不知道的信息。
• 对于“强硬”的参与人1来讲,虽然他看 到了上面的战略式博弈,但他不知道对 手是“强硬”的还是“软弱”的,所以 博弈开始之前他无法确定博弈是根据(1) 还是(2)进行。 这意味着“强硬”的参与 人1面临着事前无法确定的信息。
由∂π 2 = 0,得:
∂q2
q2 (q1,= t)
• 用 vi (ai , s−i;ti )表示给定其他参与人的战
略
s−i
=(s1
(⋅),
,
si−1
(⋅),
si+1
(⋅), ,
sn
(⋅))
,类型为ti的
参与人i选择行动ai时的期望效用,则
∑ vi (ai , s−i ;ti ) =
pi (t−i ti )ui (ai , a−i (t−i );ti )
例如
• 在“新产品开发”博弈中,企业对市场 的需求可能并不清楚;
• 在连锁店博弈中,潜在的进入者可能并 不知道连锁店在市场上的盈利情况,等 等。
• 将这种博弈开始时就存在事前不确定性 的博弈问题是不完全信息博弈问题。
例如:“斗鸡博弈”
• 考察这样的情形:假设参与人可能有这 样的两种性格特征(类型)——“强硬”(用 s表示)或“软弱”(用w表示)。
战略s-i ,他将选择使自己期望效用(支付) 最大化的行动 ai∗(ti ) ,其中
ai∗
(ti
)
∈
arg
源自文库max
ai∈Ai (ti
)
vi
(
ai
,
s−
i
;
ti
)
纯战略贝叶斯Nash均衡
•
贝叶斯博弈
G
=<
Γ; (T i
);
(
p i
); ( A i
(t i
));
(u i
(a(t); t i
))
>
的纯战略贝叶斯Nash均衡是一个类型相依的行
…, pn (t−n tn;) (4)参与人类型相依的行动集A(t1),…, A(tn); (5)参与人类型相依的支付函数 u1(a1(t1), a2(t2),, an (tn );t1)
,…, un (a1(t1), a2 (t2 ),, an (tn );tn ) 。
规定贝叶斯博弈的时间顺序如下:
• 用ti表示参与人i的一个特定的类型,Ti表 示参与人i所有类型的集合(亦称类型空间,
type space),即ti ∈Ti ,t=(t1,…,tn)表示一 个所有参与人的类型组合, t-i=(t1,…,ti1,…,tn)表示除参与人i之外其他参与人的 类型组合。所以,t=(ti, t-i)。
• 2) 参与人关于“自然”选择的推断。用
∑ ai∗
(ti
)
∈
arg
max
ai∈Ai (ti
)
t−
i
∈T−
i
pi (t−i
ti )ui (ai , a−∗i (t−i );ti )
存在性结论
• 定理 一个有限的贝叶斯博弈一定存在贝 叶斯Nash均衡。
贝叶斯Nash均衡定义的另一种表示方式
•
在静态贝叶斯博弈
G
=<
Γ; (T i
);
(
p i
(1) “自然”选择参与人的类型组合t=(t1,…,tn), 其中;
(2) 参与人i观测到“自然”关于自己类型ti的选 择;虽然参与人i观测不到“自然”关于其他 参与人类型t-i的选择,但参与人i具有关于其 他参与人类型的推断 pi (t−i ti ) ;
(3) 参与人同时选择行动,每个参与人i从行动集 Ai(ti)中选择行动ai(ti) ;
“自然”首先行动决定参与人2的性格特征(即选择
的参H选与ar择人sa参2n是与y“i人转强1换不硬知”道的,还但是参“与软人弱2”知的道),。“自然”
N
x0 强硬( p)
1
x1
U
D
2
软弱(1− p)
x2
U
D
2
UD
UD
UD
UD
-4 ,-4
2 ,-2
-2 ,2
0,0
-4 ,-4
2,0
-2 ,0
0,1
• Harsanyi通过引入“虚拟”参与人,将博 弈的起始点由x1(或x2)提前至x0 ,从而将 原博弈中参与人的事前不确定性转变为 博弈开始后的不确定性(即参与人1不知 道“自然”的选择)。这种通过引入“虚 拟”参与人来处理不完全信息博弈问题 的方法亦称Harsanyi转换。
• 为了分析,对“斗鸡博弈”进行简化。
• 假设参与人1是“强硬”的决斗者,参与 人2可能是“强硬”的也可能是“软弱” 的,参与人1不知道但参与人2清楚,而 且这一假设为所有的参与人所知道。
Harsanyi转换
• 对于简化的“斗鸡博弈”,Harsanyi转换 是这样处理的: 在原博弈中引入一个“虚拟”参与 人——“自然”(nature,用N表示),构造 一个参与人为:两个决斗者和“自然” 的三人博弈。