不完全信息博弈和贝叶斯均衡

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三、贝叶斯博弈的战略式描述
• 不完全信息博弈:完全信息博弈在不完 全信息上的拓展,我们又将其称为贝叶 斯博弈;
• 贝叶斯博弈:静态贝叶斯博弈和动态贝 叶斯博弈;
贝叶斯博弈的定义
• 贝叶斯博弈包含以下五个要素: (1) 参与人集合 {1,2,...,n}; (2) 参与人的类型集合T1,…,T2; (3) 参与人关于其他参与人类型的推断p1 (t1 t1 ),
tiTi
• 假设pss=0.2,psw=0.3,pws=0.25,pww=0.25。 • 其中, pss:决斗者1和决斗者2同时强硬的概率;
psw:决斗者1强硬、决斗者2软弱的概率; pws:决斗者1软弱、决斗者2强硬的概率; pww:决斗者1软弱、决斗者2软弱的概率; • 虽然决斗者1不知道决斗者2 的类型,但由于决斗 者1知道自己的类型,因此他可以根据贝叶斯公式 推知决斗者2的类型分布。
v i(a i,s i;ti) p i(t iti)u i(a i,a i(t i);ti) t i T i
其中,对 ti Ti,a i (t i ) 为给定t-i时由s-i 所确定的其他参与人的行动组合
• 高成本情形: (进入,默许)(不进入,斗争)
• 低成本情形: (不进入,斗争)
斗鸡博弈
• 两个所谓的勇士举着长枪,准备从独木 桥的两端冲上桥中央进行决斗。每位勇 士都有两种选择:冲上去(用U表示),或 退下来(用D表示)。若两人都冲上去,则 两败俱伤;若一方上去而另一方退下来, 冲上去者取得胜利(至少心理上是这样 的),退下来的丢了面子;若两人都退下 来,两人都丢面子。
• 当一个参与人并不知道在与谁博弈时,博 弈的规则是无法定义的,如何处理不完全 信息导致的这一问题?
二、海萨尼(Harsanyi)转换
• 为了解决该问题,海萨尼提出了Harsanyi 转换。
• 海萨尼指出,引入虚拟参与人——自然, 由自然先决定参与人的不同类型,将不完 全信息博弈转换为不完美信息博弈。
• 具体而言,这意味着当博弈真正开始的时 候,对到底体现为哪一种博弈形势并不清 楚。
• 对于“强硬”的参与人1来讲,虽然他看 到了上面的战略式博弈,但他不知道对手 是“强硬”的还是“软弱”的,所以博弈 开始之前他无法确定博弈是根据(1)还是(2) 进行。这意味着“强硬”的参与人1面临 着事前无法确定的信息。
“自然”首先行动决定参与人2的性格特征(即选择
参 的H与选ar人 择sa参2n是与y“i人转强1换不硬知”道的,还但是参“与软人弱2”知的道),。“自然”
强硬( p)
x1
U
D
2
N x0
1
参与人2的特征
软 弱(1 p)
x2
U
D
2
U
D
U
D
U
D
UD
-4,-4
2,-2
-2,2
0,0
-4,-4
2,0
-2,0
• 用ti表示参与人i的一个特定的类型,Ti表 示参与人i所有类型的集合(亦称类型空间,
type space),即 ti T i ,t=(t1,…,tn)表示所有 参与人的类型组合, t-i=(t1,…,ti-1,…,tn)表 示除参与人i之外其他参与人的类型组合。
所以,t=(ti, t-i)。
• 为了解释Harsanyi转换的具体含义,我们 对“斗鸡博弈”进行简化。
• 假设参与人1是“强硬”的决斗者,参与 人2可能是“强硬”的也可能是“软弱” 的,参与人1不知道参与人2的类型,但参 与人2知道自己的类型,而且这一假设为 所有的参与人所知道。
Harsanyi转换
• 对于简化的“斗鸡博弈”,Harsanyi转换 是这样处理的:在原博弈中引入一个 “虚拟”的参与人——“自然”(nature, 用N表示),构造一个参与人为两个决斗 者和“自然”的三人博弈。
贝叶斯博弈中的战略
• 在贝叶斯博弈 G { ;(T );(p );(A (t));(u (a (t);t))}
i
i
ii
i
i
中,参与人i的一个战略是从参与人的类
型集Ti到其行动集的一个函数si(ti);
• 它包含了当自然赋予i的类型为ti时,i将 从可行的行动集Ai(ti)中选择的行动。
• 用 vi (ai,si;ti)表示给定其他参与人的战 略 s i ( s 1 ( ) , K ,s i 1 ( ) ,s i 1 ( ) , K ,s n ( ) ) ,类型为ti的 参与人i选择行动ai时的期望效用,则
第三章: 不完全信息静态博弈
主要内容: 一、不完全信息博弈和贝叶斯纳什均衡 二、贝叶斯均衡的应用 三、贝叶斯博弈与混合战略均衡 四、机制设计理论与显示原理
第一节 不完全信息博弈 和贝叶斯均衡
一、贝叶斯博弈 二、海萨尼转换 三、贝叶斯博弈的战略式描述 四、贝叶斯纳什均衡
一、贝叶斯博弈
• 完全信息(complete information):每个参与人 对其他参与人的支付函数有准确的了解;否则, 为不完全信息(incomplete information)。
2
U
D
U -4, -4
0, -2
1
D
0, 2
1, 0
• 博弈存在唯一的Nash均衡——(D, U)。
当参与人都为软弱者时
2
U
D
U -4, -4
0, 0
1
D
0, 0
1, 1
• 博弈存在唯一的Nash均衡——(D, D)。
2
U
D
2
U
D
U
1
D
-4, -4 -2, 2
2, -2
U
1
0, 0
D
(1) 参与人都为强硬者
2
U
D
-4, -4
2, 0
-2, 0
0, 1
(2) 参与人1为强硬者
参与人2为软弱者
2
U
DU -4, -40, -2U -4, -4
0, 0
1
1
D
0, 2
1, 0
D
0, 0
1, 1
(3) 参与人1为软弱者 参与人2为强硬者
(4) 参与人都为软弱者
斗鸡博弈:不完全信息
强硬 U
D
1 软弱
U
D
2
强硬
软弱
• 在企业的新产品开发过程中,企业对市场的需 求可能并不清楚;
• 在连锁店博弈中,潜在的进入者可能并不知道 连锁店在市场上的盈利情况,等等。
• 像这种博弈开始时就存在事前不确定性的 博弈问题是不完全信息博弈问题。
市场进入博弈:不完全信息
• 在位者的成本有两种类型,而进入者并不 知道在位者的成本类型。
x2
U
D
2
U
D
2
U
D
U
D
U
D
UD
-4,-4
2,-2
-2,2
0,0
-4,-4
2,0
-2,0
0,1
如果“自然”选择参与人2的性格特征是“软弱”的, 则意味着参与人1与“软弱”的参与人2进行决斗, 博弈进入决策结x2,其支N付由(2)决定。
强硬( p)
x0
软 弱(1 p)
1
x1
x2
U
D
2
U
D
2
U
D
U
D
• 完美信息(perfect information):在博弈过程的 任何时点每个参与人都能观察并记忆之前各局中 人所选择的行动,否则为不完美信息(imperfect information)。
• 前面两章我们讨论了完全信息博弈问题, 但在现实生活中我们遇到更多的可能是不 完全信息博弈问题。
• 例如:
例如
• 根据贝叶斯规则,“强硬”的决斗者1可以推
知:
决斗者2是“强硬”的概率为 p1(ss)0.20.20.30.4
决斗者2是“软弱”的概率为
0.3 p1(ws)0.20.30.6
• “软弱”的决斗者1可以推知:
决斗者2是“强硬”的概率为 p1(sw)0.250.250.250.5
决斗者2是“软弱”的概率为 p1(ww)0.25 0.25 0.250.5
• 现在考虑这样的情形:假设参与人可能有 这样的两种性格特征(类型)——“强 硬”(用s表示)或“软弱”(用w表示)。
• 所谓“强硬”的参与人是指那些喜欢争强 好胜、不达目的誓不罢休的决斗者;而 “软弱”的参与人是指那些胆小怕事、遇 事希望息事宁人的决斗者。
• 可以想象,当具有不同性格特征的决斗者 相遇时,表现出来的博弈情形将会不同。
…, p n (t n tn ) ; (4) 参与人类型相依的行动集A(t1),…, A(tn); (5) 参与人类型相依的支付函数
,…, 。 u 1 (a 1 ( t1 ) ,a 2 ( t2 ) ,K ,a n ( tn ) ;t1 ) u n ( a 1 ( t1 ) ,a 2 ( t2 ) ,K ,a n ( tn ) ;tn )
1
x1
U
D
2
软 弱(1 p)
x2
U
D
2
U
D
U
D
U
D
UD
-4,-4
2,-2
-2,2
0,0
-4,-4
2,0
-2,0
0,1
如果“自然”选择参与人2的性格特征是“强硬”的,则意味 着参与人1与“强硬”的参与人2进行决斗,博弈进入决策结 x1,其支付由(1)决定;
N
强硬( p)
x0
软 弱(1 p)
1
x1
U
D
UD
-4,-4
2,-2
-2,2
0,0
-4,-4
2,0
-2,0
0,1
• 海萨尼通过引入“虚拟”参与人,将博 弈的起始点由x1或x2提前至x0 ,从而将原 博弈中参与人的事前不确定性转变为博 弈开始后的不确定性。
• 这种通过引入“虚拟”参与人来处理不 完全信息博弈问题的方法称为 Harsanyi 转换。
• 同样,“软弱”的参与人1也会面临类似 的问题。此时,“斗鸡博弈”就是一个不 完全信息博弈问题。
• 从这一例子来看,博弈的参与人均存在两 种不同的类型,即强硬和软弱;
• 由于参与人1不知道对手究竟是“强硬” 的还是“软弱”的,因此,此时参与人1 就好像在与两个决斗者进行决斗,一个是 “强硬”的,另一个是“软弱”的;
当参与人都为强硬者时
2
U
D
U -4, -4
2, -2
1
D
-2, 2
0, 0
• 博弈存在两个纯战略Nash均衡—— (U, D)和(D,U)。
当参与人1为强硬者参与人2为软弱者时
2
U
D
U -4, -4
2, 0
1
D
-2, 0
0, 1
• 博弈存在唯一的Nash均衡——(U, D)。
当参与人1为软弱者参与人2为强硬者时
2
U
D
U
-4, -4
1
D
-2, 2
2, -2 0, 0
• 存在两个纯战略Nash均衡——(U,D)和(D,U), 也就是一个人冲上去,另一个就必须退下来。
• 当一个理性的参与人预测到对方将会冲上去时, 明智的选择就是退下来;而当预测到对方将会选 择退却时,就应该大胆地冲上去。
斗鸡博弈:不完全信息
在位者
高成本情况
低成本情况
默许 斗争 默许 斗争
进 进入 40,50 -10,0 30,80 -10,100
入 者
不进入
0,300
0,300
0,400
0,400
• 显然,在这种情形下,进入者有关在位者 的成本信息是不完全的。
• 当在位者具有不同的成本时,所表现出来 的博弈情形是不同的,对应的均衡也是不 一样的。
2) 参与人关于“自然”选择的推断: • 用p(t1,…,tn)表示定义在参与人类型组合上
的一个联合分布概率函数。
• 用 p i ( t i ti ) 表示参与人i在知道自己类型为ti 的情况下,关于其他参与人类型的推断 (即条件概率),则
pi(ti ti)p(pt(iti,)ti)
p(ti,ti) p(ti,ti)
0,1
在“自然”选择后,参与人1和2再进行“斗鸡博 弈”。
N
强硬( p)
x0
1
x1
U
D
2
U
D
U
D
软 弱(1 p)
x2
U
D
2
U
D
UD
-4,-4
2,-2
-2,2
0,0
-4,-4
2,0
-2,0
0,1
在新构造的三人博弈中,“自然”的支付不必 考虑。参与人1和2的支付由“斗鸡博弈”决定。
N
强硬( p)
x0
U
D
U
D
-4,-4 -2,2 -4,-4 0,2
2,-2 0,0 0,-2 1,0
-4,-4 -2,0 -4,-4
0,0
2,0 0,1 0,0 1,1
• 在“斗鸡博弈”中,虽然在博弈开始之前 每位决斗者都知道自己的性格特征,但对 对手的性格特征往往不甚了解。
• 在这种情况下即使所有的决斗者都看到了 上面的四个战略式博弈 ,但对决斗者来讲, 仍存在着所谓的事前不确定性,即博弈开 始之前就不知道的信息。
• 在Harsanyi转换中规定:参与人关于“自 然”选择的推断为共同知识。
• 也就是说,两个决斗者不仅同时一起看 到了“自然”随机选择参与人2的性格特 征,而且同时一起看到了“自然”以一 定的概率分布随机选择参与人2的性格特 征。
在应用Harsanyi转换时,需要注意以下问题:
1) “自然”的选择。在一般的不完全信息 博弈问题中,Harsanyi转换规定“自然” 选择的是参与人的类型(type)。除了根据 参与人的支付来划分参与人的类型以外, 还可以根据参与人的行动空间,甚至根 据参与人掌握信息的多少(或程度)来划分 参与人的类型。
相关文档
最新文档