博弈论 第 五 章 不 完 全 信 息
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
参与人i的策略是类型ti的函数si(ti),即对类型空 间Ti中的每一个类型ti,si(ti)在自然抽取类型ti 时I从可行集Ai所选择的行动。当所有参与人 采取了策略组合s=(s1(t1),…,sn(tn))时,类型 ti的参与人i的条件期望得益为:
Eui ( s, ti )
t i Ti
ti Ti
p(t1 ,... ti 1 , ti , ti 1 ,... tn )
ui ( s1 (t1 ,...si 1 (ti 1 ), si (ti ), si 1 (ti 1 ),...sn (t n ),
t1 ,...ti 1 , ti , ti 1 ,...,t n ) pi (t i | ti )
第五章 不完全信息静态博弈
完全信息博弈的主要特点是“参与人的得益 (或支付)是 “共同知识”(理想模式)。 如果至少有一个参与人不知道(或不确定)其他 参与人的得益函数,信息便成为不完全的。这 类博弈又称为Bayes博弈。
5.1 静 态Bayes 博 弈 和Bayes Nash 均 衡 5.1.1 静态Bayes博弈的例子 例 假定某行业有一个在位者(参与人1)和-个 潜在的进入者(参与人2),1决定是否要建一个 新工厂,2决定是否进入该行业。假定2不知道 1建厂的成本是3还是1,但1自己知道。
0, 如果bi<bj
在这个Bayes博弈中,参与人I的策略应当是类型 vi的函数,记为bi(vi),根据定义,Bayes均衡要 求标价者1的策略b1(v1)是关于标价者2的策 略的最佳反应,反过来,b2(v2)也是关于b1(v1) 的最佳反应。若(b1(v1),b2(v2))是Bayes均衡, 那么对于每一个vi∈Ai=[0,1](i=1,2),bi(vi) 必须满足: 1 max( vi bi ) P{bi b j (v j )} (vi bi ) P{bi bi (v j )} 2
只要有人捐款则各人获益为1,这是共同知识, 至于 捐款多少:c1与c2分别为参与人1和2的 私人信息。但是双方都相信“ci独立地来自 [c,c]上一个连续且严格增加累积分布P(.)‖是 共同知 识,其中c<1<c(因此P(c)=0,P(c)=1)
捐款 不捐款
捐款
1-c1,1-c2
1-c1,1 0, 0
不捐款 1,1-c2
例 拍卖 考虑一次价格密封标价拍卖,两个标价者,记作 i=1,2,对于拍卖的货物,每个标价者i有自己的 估价vi,如果他以价格p获得货物,那么他将获益 vi-p ,现假设v1,v2均是来自[0,1]上均匀分布的独立随 机变量,则可建立博弈模型:
⑴行动空间——参与人i的行动是递送一个(非 负)标价bi,bi∈[0,+∞)。 ⑵类型空洵——参与人i的类型是他对货物的 估价vi,类型空间为Ti=[0,1]。 ⑶信念——估价是独立的, 参与人都相信vi均 匀地分布在[0,1]上 vi-bi 如果bi>bj ⑷ 得益函数ui(b1,b2,v1,v2)= (vi-bi)/2 如果bi=bj
为了简单起见,只考虑纯策略均衡。假定 {s1*(.),s2*(.)}是这个博弈的纯策略Bayes均衡, 因为买者有不买的自由,买者1的参与约束是: (IR) E [ x (s * , s * ) T (s * , s * )] 0, , s
p(ti , ti ) p(ti , ti ) pi (ti | ti ) p(ti ) ti Ti p(ti , ti )
常假设参与人的类型是随机独立的,于是信念: pi(t-i|ti)=p(t-i),这时计算公式为:
pi (ti ) p(t1 ,... ti 1 , ti 1 ,... tn )
定义 在静态Bayes博弈 G(A1,…An,T1,…Tn,p1,… pn)中,策略s*=(s1*,…sn*)是一个(纯策 略)Bayes均衡,当且仅当对每一个参与人i和 Ti中的每一个类型ti,以及 的每一个其他策略 s i ′(ti),总有: Eui(s*,ti)≥Eui(s1*(ti),…si-1*(ti-1),si′(ti), si+1*(ti+1),…sn*(tn),ti)
( 不, 不)
1, (1, 1) 0,(3, 3)
进入者
该博弈有唯一的Nash均衡{不进入,(不建,新建)}
5.1.2 Bayes 均 衡 的若干例子 例 不完全信息下提供公共产品 公共产品的供给产生了著名的搭便车(freerider) 问题。 这里仅考虑一个简单的例子:有 两个参 与人i=1,2,他们同时决定是否向公共部 门捐款, 捐款可用0-1决策来表示,要么捐款 要么不捐 款,设参与人i捐款外ci,则有得益矩 阵:
Harsanyi 转换: 将不完全信息弈 通过引 进虚拟的 参与人“自然”而转换为完全 但不完美信息博弈 的方法称为Harsanyi 转换。
n人静态博弈G{A1,…An;T1,…Tn;p1,…pn;u1,…un} 中,参与人i的得益函数不仅依赖于行动组合 (a1,..a2), 而且依赖于参与人的类型(t1,…tn),为求期望得益, 需要计算信念pi(t-i|ti),设自然按照先验分布pt 抽取向量(t1,…tn)是一个共同知识,当自然向参 与人i展示其类型ti时,i可以由Bayes法则计算信 念: pi(t-i|ti)=p(t-i,ti)/p(ti)=p(tt-i∈T-i i,ti)/ ∑ p(t-i,ti)
P{bi a j c j v j } P{v j
bi a j
}
bi a j
例 双方叫价拍卖 这时潜在的卖者和买者同时开价,卖
者提出要价,买者提出自己的出价,拍卖商然后选择成 交价格p清算市场,所有要价低于p的卖者卖出,所有出 价高于p的买者买入。
现考虑一个买者和一个卖者决定是否交换一单位商品 的情形:设卖者提供该商品的成本是c,该商品对买者 的价值为v,v∈[0,1],买者和卖者同时选择要价和出 价,分别为ps∈[0,1]和pb∈[0,1];如果ps>pb,双方 在p=(ps+pb)/2上成交;如果ps<pb,没有交易发生。 这样,当ps≤pb时卖者的得益仅us=(ps+pb)/2-c, 买者的得益是ub=v-(ps+pb)/2;如果ps>pb没有交 易发生,双方的得益均为0,如果在不完全信息的情况: 这时c和v都分别是双方的私人信息(因而是双方的类 型),假定c和v在[0,1]上均匀分布,P{.}为共同知识。
就是说,无论参与人是属于何种类型,参与人的 策 略一定是关于其他参与人策略的最佳反应。 例在上例中设p=1/3则有策略式:
在位者
( 建, 建)
进 入 –1,(-1, 2) 不进 0, (0, 4)
( 不 , 建)
-1/3, (1, 2) 0, (3, 4)
( 建, 不)
1/3, (-1,-1) 0 ,(0, 3)
Harsanyi 首先给出了一种模拟和处理这一类不 完全信息博弈的方法,他引入了一个虚拟的参 与人“自 然”,―自然”先选择参与人1的类 型(这里是他的成本),形成如下博弈:
高成本 [p]
N
低成本 [1-p]
1 建厂 不建 建厂
1 不建
2
进入 不进 进入
2
2
不进 进入
2
不进 (3,0)
不进 进入
(0,-1)
当参与人的类型是随机独立时: pi(t-i|ti)=pi(t-i)=pi(t1,…ti-1,ti+1,…tn) =∑p(t1,…t i-1,ti+1,…yn) 参与人i的策略是类型ti的函数si(ti),当所有的参 与人采取了策略组合S{s1(t1),…sn(tn)}时, 类型ti的参与人的期望效用为: Eui(si(ti))=∑ui(s-i(t-i),si(ti),ti,t-i)pi(t-i|ti)
2 进入 不进 进入
2 不进
1
建厂
不建
0, -1
2, 1
2, 0
3, 0
1
建厂 3, -1
不建 2, 1
5, 0
3, 0
1高成本时的得益矩阵
Байду номын сангаас
1低成本时的得益矩阵
2的得益取决于1是否建厂, 而不是取决于1的成本, 但1有 一个优势策略:低成本则建厂; 高成本则不建厂。设p1为 2认为1为高成本的先验概率(主观概率): 因为当且仅当 1为低成本时才会建厂,因此,只要 p1>1/2,2就会进入;而 当p1<1/2时,2会选择不进入,因为选择进入的期望利润是: 1×p1+(-1)×(1-p1)=2p1-1≥0 而不进入的期望值为0。
(2,0) (2,1)
(3,0) (3,-1) (5,0) (2,1)
不完全信息意味着至少有一个参与人有 多个类型(否则就成为完全信息博弈),在 上例中,在位者有两个类型,进入者有一个 类型。
在n人静态Bayes博弈 {A1,…An;T1,…tn;p1,…pn;u1,…un}中,参与人 i的得益函数不仅依赖于行动组合(a1,a2,…an), 而且依赖于所有的类型(t1,t2,…tn),故可记 ui(a1,…an;t1,…tn),为求期望得益,需要计算信 念pi(t-i|ti),设自然按照先验分布p(t)抽取类 型向量t=(t1,…tn),这是一个共同知识,当自然 向参与人i展示其类型ti时,参与人 i可以通过 Bayes法则计算信念p(t-i|ti):
卖者的一个选择是使用适当的拍卖机制使自 己的得益最优,问题在于,这样的机制是否存在?
假定卖者为两个买者设计了一个信号博弈,在这个博弈 中,买者的纯策略是发出信号,博弈规则规定如何根据 买者发出的信号决定谁得该商品和支付什么价格。 今σ1和σ2分别是两个买者的策略,s1和s2分别是两者 的实现值,假定机制规定:给定s1和s2,买者i得到商品 的概率为xi(s1,s2) 支付给卖者的价格为Ti(s1,s2),象在一(二)级密封价格 拍卖中si是买者的报价,如果 si>sj,xi(s1,s2)=1,xj(s1,s2)=0,Ti(s1,s2)=si (sj), Tj(s1,s2)=0, i≠j
cj cj 2 (vi bi )(bi a j ) bi (a j vi )bi vi a j 期望得益为: cj cj
这时 利用一阶条件,易知I的最佳反应为bi=(vi+ai)/2, 由于bi必须大于aj,因此若vi<aj的话,必须至少 取bi=aj,明确地用公式:
bi (vi ) vi a j 2 , vi a j ; a j , vi a j
定义n人静态Bayes博弈的策略式表述包括参与人 的行动空间A1,A2,…An和相应类型空间 T1,T2,…Tn,以及它们的信念p1,p2,…pn及各参与 人的得益函数u1,u2,…un。其中参与人的类型ti 为的私人信息,它确定了的 ui(a1,a2,…an;ti):,ti∈Ti,(i=1,2,…n), 的信念 p(t-i|ti)为在给定自己的类型ti的条件下关于其 他n-1个参与人可能类型t-i 的条件概率,我们记 这类博弈为: G={A1,A2,…An;T1,T2,…Tn;p1,p2,…pn;u1,u2,…u n)
我们首先考虑如下一个具体的例子:一个卖者 有一个单位的不可分割的商品要出卖,有两个 潜在的买者i=1,2,每个买者的需求是1或0, 该商品对买者1和买者2的价值分别为θ1和θ2, 假定θ1和θ2是独立的,具有相同的分布函数, 特别地,假定θi只有两个可能的值: θ和θ′,其 中θ<θ′,它们的概率分别为p和p′(p+p′=1), 每个买者i知道自己的评价θi,另外的人不知 道。
不妨设b1(v1)=a1+c1v1和b2(v2)=a2+c2v2由 于vj服从[0,1]上的均匀分布,故bj(vj)服从 [aj,aj+cj]上的均匀分布,由 P{bi=bj(vj)}=0,故对每一个类型vi,一定 有:max(vi-bi)P{bi>bj(vj)},理性地,i的标 价bi应满足aj≤bi≤aj+cj
5.2 机制设计与显示原理 迄今为止,我们只是对给定的博弈问题, 设法寻找它的均衡解。实际生活中,存在着有意 义的实际问题:给定n个参与人,在一系列可能的 结果中给定他们的得益,以及他们有关这些得益 所拥有的私人信息,是否能构造出一个静态 Bayes博弈,使得该博弈的Bayes Nash均衡满 足一定的特殊的性质?
Eui ( s, ti )
t i Ti
ti Ti
p(t1 ,... ti 1 , ti , ti 1 ,... tn )
ui ( s1 (t1 ,...si 1 (ti 1 ), si (ti ), si 1 (ti 1 ),...sn (t n ),
t1 ,...ti 1 , ti , ti 1 ,...,t n ) pi (t i | ti )
第五章 不完全信息静态博弈
完全信息博弈的主要特点是“参与人的得益 (或支付)是 “共同知识”(理想模式)。 如果至少有一个参与人不知道(或不确定)其他 参与人的得益函数,信息便成为不完全的。这 类博弈又称为Bayes博弈。
5.1 静 态Bayes 博 弈 和Bayes Nash 均 衡 5.1.1 静态Bayes博弈的例子 例 假定某行业有一个在位者(参与人1)和-个 潜在的进入者(参与人2),1决定是否要建一个 新工厂,2决定是否进入该行业。假定2不知道 1建厂的成本是3还是1,但1自己知道。
0, 如果bi<bj
在这个Bayes博弈中,参与人I的策略应当是类型 vi的函数,记为bi(vi),根据定义,Bayes均衡要 求标价者1的策略b1(v1)是关于标价者2的策 略的最佳反应,反过来,b2(v2)也是关于b1(v1) 的最佳反应。若(b1(v1),b2(v2))是Bayes均衡, 那么对于每一个vi∈Ai=[0,1](i=1,2),bi(vi) 必须满足: 1 max( vi bi ) P{bi b j (v j )} (vi bi ) P{bi bi (v j )} 2
只要有人捐款则各人获益为1,这是共同知识, 至于 捐款多少:c1与c2分别为参与人1和2的 私人信息。但是双方都相信“ci独立地来自 [c,c]上一个连续且严格增加累积分布P(.)‖是 共同知 识,其中c<1<c(因此P(c)=0,P(c)=1)
捐款 不捐款
捐款
1-c1,1-c2
1-c1,1 0, 0
不捐款 1,1-c2
例 拍卖 考虑一次价格密封标价拍卖,两个标价者,记作 i=1,2,对于拍卖的货物,每个标价者i有自己的 估价vi,如果他以价格p获得货物,那么他将获益 vi-p ,现假设v1,v2均是来自[0,1]上均匀分布的独立随 机变量,则可建立博弈模型:
⑴行动空间——参与人i的行动是递送一个(非 负)标价bi,bi∈[0,+∞)。 ⑵类型空洵——参与人i的类型是他对货物的 估价vi,类型空间为Ti=[0,1]。 ⑶信念——估价是独立的, 参与人都相信vi均 匀地分布在[0,1]上 vi-bi 如果bi>bj ⑷ 得益函数ui(b1,b2,v1,v2)= (vi-bi)/2 如果bi=bj
为了简单起见,只考虑纯策略均衡。假定 {s1*(.),s2*(.)}是这个博弈的纯策略Bayes均衡, 因为买者有不买的自由,买者1的参与约束是: (IR) E [ x (s * , s * ) T (s * , s * )] 0, , s
p(ti , ti ) p(ti , ti ) pi (ti | ti ) p(ti ) ti Ti p(ti , ti )
常假设参与人的类型是随机独立的,于是信念: pi(t-i|ti)=p(t-i),这时计算公式为:
pi (ti ) p(t1 ,... ti 1 , ti 1 ,... tn )
定义 在静态Bayes博弈 G(A1,…An,T1,…Tn,p1,… pn)中,策略s*=(s1*,…sn*)是一个(纯策 略)Bayes均衡,当且仅当对每一个参与人i和 Ti中的每一个类型ti,以及 的每一个其他策略 s i ′(ti),总有: Eui(s*,ti)≥Eui(s1*(ti),…si-1*(ti-1),si′(ti), si+1*(ti+1),…sn*(tn),ti)
( 不, 不)
1, (1, 1) 0,(3, 3)
进入者
该博弈有唯一的Nash均衡{不进入,(不建,新建)}
5.1.2 Bayes 均 衡 的若干例子 例 不完全信息下提供公共产品 公共产品的供给产生了著名的搭便车(freerider) 问题。 这里仅考虑一个简单的例子:有 两个参 与人i=1,2,他们同时决定是否向公共部 门捐款, 捐款可用0-1决策来表示,要么捐款 要么不捐 款,设参与人i捐款外ci,则有得益矩 阵:
Harsanyi 转换: 将不完全信息弈 通过引 进虚拟的 参与人“自然”而转换为完全 但不完美信息博弈 的方法称为Harsanyi 转换。
n人静态博弈G{A1,…An;T1,…Tn;p1,…pn;u1,…un} 中,参与人i的得益函数不仅依赖于行动组合 (a1,..a2), 而且依赖于参与人的类型(t1,…tn),为求期望得益, 需要计算信念pi(t-i|ti),设自然按照先验分布pt 抽取向量(t1,…tn)是一个共同知识,当自然向参 与人i展示其类型ti时,i可以由Bayes法则计算信 念: pi(t-i|ti)=p(t-i,ti)/p(ti)=p(tt-i∈T-i i,ti)/ ∑ p(t-i,ti)
P{bi a j c j v j } P{v j
bi a j
}
bi a j
例 双方叫价拍卖 这时潜在的卖者和买者同时开价,卖
者提出要价,买者提出自己的出价,拍卖商然后选择成 交价格p清算市场,所有要价低于p的卖者卖出,所有出 价高于p的买者买入。
现考虑一个买者和一个卖者决定是否交换一单位商品 的情形:设卖者提供该商品的成本是c,该商品对买者 的价值为v,v∈[0,1],买者和卖者同时选择要价和出 价,分别为ps∈[0,1]和pb∈[0,1];如果ps>pb,双方 在p=(ps+pb)/2上成交;如果ps<pb,没有交易发生。 这样,当ps≤pb时卖者的得益仅us=(ps+pb)/2-c, 买者的得益是ub=v-(ps+pb)/2;如果ps>pb没有交 易发生,双方的得益均为0,如果在不完全信息的情况: 这时c和v都分别是双方的私人信息(因而是双方的类 型),假定c和v在[0,1]上均匀分布,P{.}为共同知识。
就是说,无论参与人是属于何种类型,参与人的 策 略一定是关于其他参与人策略的最佳反应。 例在上例中设p=1/3则有策略式:
在位者
( 建, 建)
进 入 –1,(-1, 2) 不进 0, (0, 4)
( 不 , 建)
-1/3, (1, 2) 0, (3, 4)
( 建, 不)
1/3, (-1,-1) 0 ,(0, 3)
Harsanyi 首先给出了一种模拟和处理这一类不 完全信息博弈的方法,他引入了一个虚拟的参 与人“自 然”,―自然”先选择参与人1的类 型(这里是他的成本),形成如下博弈:
高成本 [p]
N
低成本 [1-p]
1 建厂 不建 建厂
1 不建
2
进入 不进 进入
2
2
不进 进入
2
不进 (3,0)
不进 进入
(0,-1)
当参与人的类型是随机独立时: pi(t-i|ti)=pi(t-i)=pi(t1,…ti-1,ti+1,…tn) =∑p(t1,…t i-1,ti+1,…yn) 参与人i的策略是类型ti的函数si(ti),当所有的参 与人采取了策略组合S{s1(t1),…sn(tn)}时, 类型ti的参与人的期望效用为: Eui(si(ti))=∑ui(s-i(t-i),si(ti),ti,t-i)pi(t-i|ti)
2 进入 不进 进入
2 不进
1
建厂
不建
0, -1
2, 1
2, 0
3, 0
1
建厂 3, -1
不建 2, 1
5, 0
3, 0
1高成本时的得益矩阵
Байду номын сангаас
1低成本时的得益矩阵
2的得益取决于1是否建厂, 而不是取决于1的成本, 但1有 一个优势策略:低成本则建厂; 高成本则不建厂。设p1为 2认为1为高成本的先验概率(主观概率): 因为当且仅当 1为低成本时才会建厂,因此,只要 p1>1/2,2就会进入;而 当p1<1/2时,2会选择不进入,因为选择进入的期望利润是: 1×p1+(-1)×(1-p1)=2p1-1≥0 而不进入的期望值为0。
(2,0) (2,1)
(3,0) (3,-1) (5,0) (2,1)
不完全信息意味着至少有一个参与人有 多个类型(否则就成为完全信息博弈),在 上例中,在位者有两个类型,进入者有一个 类型。
在n人静态Bayes博弈 {A1,…An;T1,…tn;p1,…pn;u1,…un}中,参与人 i的得益函数不仅依赖于行动组合(a1,a2,…an), 而且依赖于所有的类型(t1,t2,…tn),故可记 ui(a1,…an;t1,…tn),为求期望得益,需要计算信 念pi(t-i|ti),设自然按照先验分布p(t)抽取类 型向量t=(t1,…tn),这是一个共同知识,当自然 向参与人i展示其类型ti时,参与人 i可以通过 Bayes法则计算信念p(t-i|ti):
卖者的一个选择是使用适当的拍卖机制使自 己的得益最优,问题在于,这样的机制是否存在?
假定卖者为两个买者设计了一个信号博弈,在这个博弈 中,买者的纯策略是发出信号,博弈规则规定如何根据 买者发出的信号决定谁得该商品和支付什么价格。 今σ1和σ2分别是两个买者的策略,s1和s2分别是两者 的实现值,假定机制规定:给定s1和s2,买者i得到商品 的概率为xi(s1,s2) 支付给卖者的价格为Ti(s1,s2),象在一(二)级密封价格 拍卖中si是买者的报价,如果 si>sj,xi(s1,s2)=1,xj(s1,s2)=0,Ti(s1,s2)=si (sj), Tj(s1,s2)=0, i≠j
cj cj 2 (vi bi )(bi a j ) bi (a j vi )bi vi a j 期望得益为: cj cj
这时 利用一阶条件,易知I的最佳反应为bi=(vi+ai)/2, 由于bi必须大于aj,因此若vi<aj的话,必须至少 取bi=aj,明确地用公式:
bi (vi ) vi a j 2 , vi a j ; a j , vi a j
定义n人静态Bayes博弈的策略式表述包括参与人 的行动空间A1,A2,…An和相应类型空间 T1,T2,…Tn,以及它们的信念p1,p2,…pn及各参与 人的得益函数u1,u2,…un。其中参与人的类型ti 为的私人信息,它确定了的 ui(a1,a2,…an;ti):,ti∈Ti,(i=1,2,…n), 的信念 p(t-i|ti)为在给定自己的类型ti的条件下关于其 他n-1个参与人可能类型t-i 的条件概率,我们记 这类博弈为: G={A1,A2,…An;T1,T2,…Tn;p1,p2,…pn;u1,u2,…u n)
我们首先考虑如下一个具体的例子:一个卖者 有一个单位的不可分割的商品要出卖,有两个 潜在的买者i=1,2,每个买者的需求是1或0, 该商品对买者1和买者2的价值分别为θ1和θ2, 假定θ1和θ2是独立的,具有相同的分布函数, 特别地,假定θi只有两个可能的值: θ和θ′,其 中θ<θ′,它们的概率分别为p和p′(p+p′=1), 每个买者i知道自己的评价θi,另外的人不知 道。
不妨设b1(v1)=a1+c1v1和b2(v2)=a2+c2v2由 于vj服从[0,1]上的均匀分布,故bj(vj)服从 [aj,aj+cj]上的均匀分布,由 P{bi=bj(vj)}=0,故对每一个类型vi,一定 有:max(vi-bi)P{bi>bj(vj)},理性地,i的标 价bi应满足aj≤bi≤aj+cj
5.2 机制设计与显示原理 迄今为止,我们只是对给定的博弈问题, 设法寻找它的均衡解。实际生活中,存在着有意 义的实际问题:给定n个参与人,在一系列可能的 结果中给定他们的得益,以及他们有关这些得益 所拥有的私人信息,是否能构造出一个静态 Bayes博弈,使得该博弈的Bayes Nash均衡满 足一定的特殊的性质?