不完全信息静态博弈第四章Bayes博弈与Bayes均衡_OK
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(声东,声东)
守东
1, (-1,1)
守西 -1, (1,-1)
(-1,1)
10
搭便车(free-rider)
局中人2 捐款 不捐款
捐款 局中人1
不捐款
0.5,0.5 1, 0.5
0.5 ,1 0,0
• 股票分红 • 教堂捐款 • 欧文的理想,农村合作社 • 按劳分配 • 沉闷的经济学
11
不完全信息下的搭便车问题
( v1
c1v1) Pr obc1v1
c2v2
(1 c1)v1
Pr obv2
c1 c2
v1
(1 c1)
c1 c2
v12
c1
1 2
c2
1 2
bb21
* (v1 ) * (v2 )
v1 v2
Байду номын сангаас
/2 /2
15
当有n个局中人时
• 每个局中人的线性Bayes均衡:bi(vi)=civi
• 固定v1, 应使局中人1 1 的期望盈利达到最大
7
Bayes均衡
• 定 义 : 在 静 态 Bayes 博 弈 G(A1,…,An; T1,…,Tn; p1,…,pn; u1,…,un)中,策略s*=(s1*,…,sn*)是一个 (纯策略)Bayes均衡,当且仅当,对每一个局 中人i和Ti中的每一个类型ti以及局中人i的每一 个其他策略si(ti),成立:
-1,1 1,-1
9
局中人2 击东(1)
声东
局中人2
击西(0) 声东
局中人1 守东 守西
1,-1 -1,1
-1,1 1,-1
• 局中人:局中人1,局中人2
• 行动空间: A1=(守东,守西),A2=(声东) • 类型空间:局中人1是一种类型,T2=(击东,击西) • 信念:P(击东)=1,P(击西)=0
EUi (s*,ti ) EUi (s1(t1),...,si1(ti1), si (ti ), si1(ti1),...,sn (tn),ti )
就是说,无论局中人属何种类型,局中人的策 略一定是关于其他局中人策略行动的最佳反应。
8
习题:声东击西
局中人1 守东 守西
局中人2
击东
击西
1,-1 -1,1
21
高成本p=1/2 N 低成本1-p=1/2
2
2
q2H
1
q2L
q1
q1
(q1(1-q1- q2H),q2H(3/4-q1- q2H)) (q1(1-q1- q2L), q2L(5/4-q1- q2L)) (q2H, q2L)
q1 q1(1-q1- (q2H +q2L)/2), (q2H(3/4-q1- q2H), q2L(5/4-q1- q2L))
q2H 3 / 8 q1 / 2, q2L 5 / 8 q1 / 2, q1 ( 2 q2H q2L ) / 4
q1
1 / 3,
q
H 2
5 / 24,
q 2L
11 /
24
22
Eu1(s1, s2 *(c2 ),c1) Emax(s1(c1),s2 *(c2 )) c1s1
c * max(s1(c1),1) (1 c*) max(s1(c1),0) c1s1
1 c *
c
*
s1(c1) 1 s1(c1) 0
c* 1/ 2
13
拍卖(auction)
• 行动空间:局中人的非负标价bi
有埋伏0.8 N 没有埋伏0.2
诸葛亮
诸葛亮
弹琴
司马懿
弹琴
打
不打
打
不打
(-1,1) (0,0)
(1,-1) (0,0)
(弹琴,弹琴)
打
-0.6, (1,-1)
不打
0, (0,0)
4
在位者 扩展 不扩展
进入 进入者
不进入
-1,2 0,4
1,1 0,3
扩展成本低
在位者 扩展 不扩展
-1,-1 0,0
1,1 0,3
局中人2 捐款 不捐款
局中人1不捐捐款款
1-c1,1-c2 1, 1-c2
1-c1 ,1 0,0
• ci独立地来自区间[0,1] 上的均匀分布
• 行动空间:Ai= [捐款,不捐款]=[1,0]i
• 类型空间: Ti= [0, 1]
• 信念:估价是独立的,ci是区间[0,1]上的均匀分布
• 策略: s1(c1), s2(c2)
扩展成本高
5
Harsanyi转换
高成本p=1/3 N 低成本1-p=2/3
2
2
扩
不扩
1
扩
不扩
进 不进 进
不进 进
不进 进
不进
(-1,-1) (0,0) (1,1) (0,3) (-1,2) (0,4) (1,1) (0,3)
(扩展,扩展) (不扩展,扩展) (扩展,不扩展) (不扩展,不扩展)
进入 -1, (-1,2) -1/3, (1,2) 1/3, (-1,1) 1, (1,1)
• 类型空间:局中人对货物的估价viTi=[0,1]
• 信念:估价是独立的, vi均匀的分布在[0,1]上
• 盈利函数
ui
(vvii
bi bi
)/2
0
bi bj bi bj bi bj
• 策略组合
(b1(v1), b2 (v2 ))
• Experiment: 你的估价vi和出价bi是多少?
14
• 只考虑线性Bayes均衡:b1*(v1)=c1v1, b2*(v2)=c2v2
1
1
c1v1
0
1 v1
0
c2v2 1 v2
• 固定局中人2的bayes均衡策略b2*(v2)=c2v2,对于局中人1 的每一个类型v1,局中人1的bayes均衡策略b1*(v1)=c1v1应 使局中人1的期望盈利达到最大
不打
-1,1 0,0
诸葛亮 没有埋伏(0.2)
弹琴
1,-1 0,0
• 局中人:司马懿,诸葛亮
• 行动空间: A1=(打,不打),A2=(弹琴) • 类型空间:司马懿是一种类型,T2=(有埋伏,没有
埋伏)
• 信念:P(有埋伏)=0.8,P(没有埋伏)=0.2
3
Harsanyi转换 (Harsanyi Transformation,1967-1968)
• 策略组合: (s1(c1), s2(c2))
• 盈利函数:ui(si,sj,ci) =max(s1,s2)-cisi
ij
12
s1*(c1)
1
Bayes均衡(s1*(c1), s2*(c2))
s2*(c2)
1
0 0 c*
1 c1
0 0 c*
1 c2
• 固定局中人2的Bayes均衡策略s2*(c2),局中人1在c1类型 下采取策略s1([1.0])的期望盈利为:
n
( v1 c1v1 ) Pr obc1v1 civi i2
(1 c1
)v1
n i2
Pr obvi
c1 ci
v1
(1 c1 )c1n1
v1n
n
ci
i2
civi
0
1 vi
c1
n 1 n
ci
n 1 n
bi (
vi
)
n
n
1
vi
16
双边拍卖(double auction)
(Chatterjee and Samuelson, 1983)
• 局中人:卖者,买者
• 行动空间:卖者的要价p1,买者的买价p2 • 类型空间:卖者对货物的估价c T1=[0,1], 买者对货物
的估价vT2=[0,1]。 • 信念:估价是独立的, c,v均匀的分布在[0,1]上。
• 盈利函数
u1
p1
2
p2
-
c
0
• 策略组合
p2 p1 p2 p1
u2
v
1
1
( p1 p2 *(v) c)dv 2
( p1 a2 e2v c)dv 2
p21 ( p1 )
( p1 a2 ) / e2
p1*
2 3
c
1 3
(a 2
e2
)
18
线性Bayes均衡:p1*(c)=a1+e1c, p2*(v))= a2+e2v
1 a1+e1c
1
a2+e2v
p2*
0 p1-1(p2*)
第三部分 不完全信息静态博弈
第四章 Bayes博弈与Bayes均衡
1
不完全信息的例子
• 智取威虎山 • 空城计 • 散布谣言 • 陌生人类型 • 沉默是金 • 劳务市场中的雇工类型 • 上市公司类型 • 保险市场中的客户类型 • 拍卖 • 产品的质量类型
2
空城计
诸葛亮
有埋伏(0.8)
弹琴
打 司马懿
p1
2
p2
0
( p1(c), p2 (v))
p2 p1 p2 p1
17
• 考虑线性Bayes均衡:p1*(c)=a1+e1c, p2*(v))= a2+e2v
1 a1+e1c
1
a2+e2v
p1*
0c
c 1
0
p2-1(p1*) 1 v
• 卖者:对于任意的c[0,1], p1*(c)应使下式达到极大
p1*
1 3
(a
2
e2
)
2 3
c
p2*
1 3
a1
2 3
v
p1
* (c)
1 4
2 3
c
p 2
* (v)
1 12
2 3
v
(1,1)
p1*(c)
p2*(v)
0
1 20
习题:不完全信息下的古诺博弈
• 居中人:企业1,企业2 • 行动空间:产量q1,q2 • 盈利函数: ui(q1,q2) =qi(θi-q1-q2) • 类型空间:企业1是一种类型, θ1=1 T2=[高成本型H,低成本型L]=[θ2H=3/4,θ2L=5/4] • 信念:P(θ2H=3/4)=1/2,P(θ2L=5/4)=1/2 • 策略: q1,(q2H,q2L) • 策略组合: (q1,(q2H,q2L))
不进入 0, (0,4)
0, (3,4)
0, (0,3)
0, (3,3) 6
静态Bayes博弈的正则型
• 定义:n人静态Bayes博弈的正则型表示确定了 局 中 人 的 行 动 空 间 A1,…,An, 和 它 们 的 类 型 空 间 T1,…,Tn, 还 有 各 局 中 人 的 盈 利 函 数 u1,…,un。 局中人i的类型ti为局中人i私人所知,它确定了 局中人i的盈利函数ui(a1,…,an; ti)。局中人i的信 念 (belief)pi(t-i/ti) 描述了局中人i在给定自己 的类型ti的条件下关于其他n-1个局中人的可能 类型的不确定性。我们将这个博弈表示为 G(A1,…,An; T1,…,Tn; p1,…,pn; u1,…,un)。
c 1
0
v 1v
• 买者:对于任意的v[0,1], p2*(v)应使下式达到极大
p11(p2 ) (v p1 * (c) p2 )dc (p2 a1)/e1 (v a1 e1c p2 )dc
0
2
0
2
21
p2* 3 v 3 a1
19
p1* a1 e1c
p2* a2 e2v