经济博弈中的动态贝叶斯博弈
第四章、贝叶斯博弈 《经济博弈论基础》PPT课件
b)
(v
b)n1(b)
最优化的一阶条件:
n1(b) (v b)(n 1)n2 (b) d(b) 0 db
vn1db (v b)(n 1)vn2dv 0
(vn1db bdvn1) n 1 dvn 0 n
b*(v) n 1 v n
二、拍卖与招第n价格密封招标
第一价格密封拍卖博弈分析 (1)考虑两个投标人 i=1, 2的情况:
vi——拍卖物品对投标人 i的价值
vi ∈[0,1] 均匀分布 bi≥0 ——投标人 i的出价
bi= bi(vi)严格递增可微函数
第一价格密封拍卖博弈分析
投标人1的期望支付为:
Eu1 (v1 b1) Pr ob(b2 b1) (v b) Pr ob(b2 b)
最优化的一阶条件:
[1 (b)]n1 (b c)(n 1)[1 (b)]n2 d(b) 0 db
均衡情况下, (b) c
(1 c)n1db (b c)(n 1)(1 c)n2 dc 0
第一价格密封招标博弈分析
(1 c)n1db (b c)(n 1)(1 c)n2 d (1 c) 0 (1 c)n1db [b 1 (1 c)](n 1)(1 c)n2 d (1 c) 0
1、拍卖制度与资源配置效率 2、收入等价定理
第四节 混合策略纳什均衡的重新解释
一、混合策略纳什均衡的不完全信息解释 Harsanyi (1973) 证明:完全信息静态博弈中的
混合策略纳什均衡可以解释为不完全信息静态博弈 中贝叶斯纳什均衡的极限。
第四节 混合策略纳什均衡的重新解释
二、混合策略纳什均衡的本质特征不在于局中 人j随机地选择行动,而在于局中人i不能确定局中人j 将选择什么纯策略,这种不确定性可能来自局中人i 不知道局中人j的类型。
经济博弈论3——完全且完美信息动态博弈
本章讨论动态博弈(Dynamic Games),所 有博弈方都对博弈过程和得益完全了解的完全 且完美信息动态博弈。这类博弈也是现实中常 见的基本博弈类型。由于动态博弈中博弈方的 选择、行为有先后次序,因此在表示方法、利 益关系、分析方法和均衡概念等方面,都与静 态博弈有很大区别。本章对动态博弈的概念和 分析方法,特别是子博弈完美均衡和逆推归纳 法作系统介绍,并介绍各种经典的动态博弈模 型。
逆推归纳法事实上就是把多阶段动态博弈化为一系列的 单人博弈,通过对一系列单人博弈的分析,确定各博弈 方在各自选择阶段的选择,最终对动态博弈结果,包括 博弈的路径和各博弈方的得益作出判断,归纳各个博弈 方各阶段的选择则可得到各个博弈方在整个动态博弈中 的策略。 由于逆推归纳法确定的各个博弈方在各阶段的选择,都 是建立在后续阶段各个博弈方理性选择基础上的,因此 自然排除了包含不可信的威胁或承诺的可能性,因此它 得出的结论是比较可靠的,确定的各个博弈方的策略组 合是有稳定性的。
最上方的圆圈表示乙的选择信息集 或称选择节点(node)。 如果乙选择“不借”则博弈结束, 他能保住1万元本钱而甲得不到开矿 的利润;如乙选择“借”则到达甲 的选择信息集,轮到甲进行选择。 三个终端黑点处的数组,表示由各 博弈方各阶段行为依次构成的,到 达这些终端的“路径”所实现的各 博弈方得益。 乙决策的关键是要判断甲的许诺是 否可信。
结论:在一个由都有私心、都更重视自身利益的成员 组成的社会中,完善公正的法律制度不但能保障社会 的公平,而且还能提高社会经济活动的效率,是实现 最有效率的社会分工合作的重要保障。
但是要充分保障社会公平和经济活动的效率,法律制 度必须要满足两方面的要求:一是对人们正当权益的 保护力度足够大;二是对侵害他人利益者有足够的威 慑作用。否则,法律制度的作用就是很有限的甚至完 全无效。
贝叶斯博弈
不完全信息的市场进入博弈参与人:企业1,企业2行动空间:企业1选择建厂或不建厂,企业2 选择进入或不进入行动顺序和信息结构:自然先以概率对(p,1 p)选择企业1 的成本类型(高,低),企业1 观察到自然的选择而企业2 不能观察到自然的选择;然后企业1 和企业2 同时采取其可选的行动。
赢利状况:如下表对于例子的不完全信息博弈,将不完全信息博弈转化为标准形式贝叶斯博弈。
这一方法是Harsanyi(1967-1968)创造的。
企业1选择DB, 企业2选择IN,构成贝叶斯纳什均衡;意思是,企业1当高成本类型时,选择“不建厂”,而当低成本类型时企业1选择“建厂”,企业2选择“进入”与企业1展开竞争。
贝叶斯纳什均衡的结果为:(2.3,0.4),即双方获得的均衡利润。
不完全信息动态博弈(贝叶斯博弈)我们将介绍另一种新的均衡概念——完美贝叶斯均衡,就有了四个均衡概念:完全信息静态博弈中的纳什均衡、完全信息动态博弈中的子博弈完美纳什均衡、不完全信息静态博弈中的贝叶斯纳什均衡以及不完全信息动态博弈中的完美贝叶斯均衡。
表面上看好像对所研究的每一类型的博弈都发明出了一种新的均衡概念,但事实上这些概念是密切相关的。
随我们研究的博弈逐步复杂,我们对均衡概念也逐渐强化,从而可以排除复杂博弈中不合理或没有意义的均衡,而如果我们运用适用于简单博弈的均衡概念就无法区分。
在每一种情况下,较强的均衡概念只在应用于复杂的博弈时才不同于较弱的均衡概念,而对简单的博弈并没有区别。
引入完美贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡,这和子博弈完美纳什均衡强化了纳什均衡是相同的。
正如我们在完全信息动态博弈中加上了子博弈完美的条件,是因为纳什均衡无法包含威胁和承诺都应是可信的这一思想;我们在对非完全信息动态博弈的分析中将集中于完美贝叶斯均衡,是因为贝叶斯纳什均衡也存在同样的不足。
回顾前面讲过的,如果参与者的策略要成为一个子博弈完美纳什均衡,则它们不仅必须是整个博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。
经济博弈论第八章不完全信息动态博弈
克劳馥和索贝尔证明,当b不等于0时,存在一种“部分合并均衡”
的完美贝叶斯均衡。其基本特征是类型空间[0,1]被分成n个区
间[0,
x 1
),[ x 1
,
x 2
),,[ x n1
,1)
,属于同一区间类型的声明方作同样声明,在
不同区间类型的声明方作不同声明。
先对n=2的简单分割进行论证。
这时类型空间分为 [0, x )和[x ,1],属于前一区间的声明方作一个
25
一般选手
21 21 获胜次数概率
12 12
4
4
1
1
0 1 2 3 4 5 6 7 8 9 10 次 数
部分合并完美贝叶斯均衡的区间划分和数量
两区间部分合并均衡区间长度不等长,x1 =0.5-2b,前一 个区间的长度是 x1 -0 = 0.5-2b,后一个区间的长度为1-x1 = 0.5+2b,后一个区间长4b。
结论对更多区间的部分合并均衡也成立。n区间,[ xk 1,xk )
是之一,长度为c,行为方对该区间类型最优行为( + )/2,
8.1.2 类型和海萨尼转换
与静态贝叶斯博弈基本相似,动态贝叶斯博 弈也可以通过海萨尼转换,引进自然对博弈方类 型的选择,转化为完全但不完美信息动态博弈。
经过海萨尼转换以后,动态贝叶斯博弈与一 般不完美信息动态博弈基本相似,可以直接用完 美贝叶斯均衡进行分析。
8.2 声明博弈
8.2.1 声明的信息传递作用 8.2.2 连续型声明博弈
不完全信息+动态博弈=信息传递
本章分五节
8.1不完全信息动态博弈及其转换 8.2声明博弈 8.3信号博弈 8.4不完全信息的工会和厂商谈判
8.1 不完全信息动态博弈及其转换
不完全信息动态博弈-精练贝叶斯纳什均衡
一 精练贝叶斯纳什均衡 基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡 二 信号传递博弈及其应用举例 三 博弈论概念简要总结
基本思路-不完全信息动态博弈
类型:自然首先选择参与人的类型,参与人自己知道,其 他参与人不知道。--不完全信息
行动:行动有先有后,后行动者能观测到先行动者的行动, 但不能观测到其类型。--动态博弈 但是,参与人是类型依存型的,每个参与人的行动都 传递有关自己类型的信息,后行动者可以通过观察先行动 者的行动来推断自己的最优行动。先行动者预测到自己的 行动被后行动者利用,就会设法传递对自己最有利的信息。
不完全信息动态博弈过程不仅是参与人选择行动的过程, 而且是参与人不断修正信念的过程。
[x]
高
T=2,如果进入者已进入,在位 者成本函数为共同知识,若在位 者为高成本,p=5时,每个企业 利润为3,扣除进入成本2,进入 者利润为1。若在位者为低成本, p=4,在位者利润是5,进入者成 本为1,扣除进入成本2,其利润 为-1。
P=6
进入者 进入 不进入 进入 不进入 进入 不进入 进入 不进入 进入
价格
在位者高成本时的利润 在位者低成5
6 9
P=6
7 8
基本思路-不完全信息动态博弈
进入者只有一种类型:进入成本为2,如果进入,生产成本函数与在 位者高成本函数相同。
T=2,如果进入者已进入,在位者成本函数为共同知识,若在位者为 高成本,企业企业成本函数相同,对称库诺特均衡产量下的价格p=5时, 每个企业利润为3,扣除进入成本2,进入者利润为1。若在位者为低成本, 两个企业成本函数不同,非对称库诺特均衡产量下的价格p=4,在位者利润 是5,进入者成本为1,扣除进入成本2,其利润为-1。
经济博弈中的动态贝叶斯博弈
第一节 动态贝叶斯博弈
动态贝叶斯博弈的含义:
动态贝叶斯博弈即不完全信息动态博弈,其含义 是:自然首先选择局中人的类型,局中人自己知道, 其他局中人不知道;自然选择之后,局中人开始行动, 局中人的行动有先有后,后行动者能够观察到先行动 者的行动,但不能观察到先行动者的类型。
第一节 动态贝叶斯博弈
动态贝叶斯博弈的含义:
第二节 完美贝叶斯纳什均衡
策略型博弈
Harsanyi
贝叶斯博弈
(完全信息静态博弈)
(不完全信息静态博弈)
(纳什均衡)
贝叶斯化
(贝叶斯纳什均衡)
Selten 完美化
Selten 完美化
(子博弈)
(后续博弈)
扩展型博弈
动态贝叶斯博弈
(完全信息动态博弈 )
(不完全信息动态博弈)
(子博弈完美纳什均衡) 贝叶斯化 (完美贝叶斯纳什均衡)
1、Milgrom-Roberts (1982)垄断限价模型
现象:垄断企业规定的产品价格一般低于微观经济学定义 的最优垄断价格(即边际收益等于边际成本的价格)。
传统解释:如果价格等于垄断价格,其他企业看到有利可 图,就会进入;相反,如果价格低一些,其他企业看到无利可 图,就不会进入,垄断企业就可以继续保持其垄断地位。
2、局中人1观测到自己的类型θ后发出信号 m M {m1,..., mJ };
3、局中人2观测到1发出的信号m(但不是类型θ),使用 贝叶斯法则从先验概率P=P(θ)得到后验概率 p p( m),然后选 择行动 a A {a1,..., aH } 。
4、支付函数分别为 u1(m, a; ),u2 (m, a; )。
理性囚徒1 (1-p )不坦白 坦白 坦白
经济学博弈论
⒉策略式表述的博弈举例 在掷币游戏中,每个参与人的支付直接用其赢得或输
掉的硬币数量来表示:赢得一枚硬币的支付为1,输掉一 枚硬币的支付为-1。掷币游戏的支付矩阵见表10-3所示。
小孩A
表10-3 掷币游戏
小孩B
正面 反面
正面 反面
1,-1 -1,1
-1,1 1,-1
16 合肥学院 章 蕾
再如下面的斗鸡博弈。试想有两只公鸡遇到一起,每 只公鸡有两个行动选择:一是进攻,一是撤退。如果一只 公鸡撤退,一只公鸡进攻,则进攻的公鸡获得胜利,撤退 的公鸡很丢面子;如果两只公鸡都撤退则打个平手;如果 两只公鸡都进攻,那么两败俱伤。设其支付矩阵见表10-4 所示。
参与人A 合肥学院 章 蕾
U
0,2 1,4
M
3,4
2,3
D
1,1 3,1
2,1 1,0
4,2 23
通过对纳什均衡与占优策略均衡以及重复剔除的占优 均衡的分析,可知它们之间的关系如下:每一个占优策略 均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一 个纳什均衡都是占优策略均衡或重复剔除的占优均衡。
9 合肥学院 章 蕾
③信息是参与人在博弈中的知识,特别是有关其他 参与人(对手)的特征和行动的知识。在囚徒困境模型 中,两囚徒的信息是都知道自己和另一囚徒在选择坦白 和抵赖的不同组合时面对的处罚。
④策略:是参与人在拥有既定信息情况下的行动规 则,它规定参与人在什么时候选择什么行动。一个参与 人的所有可选择的策略的集合就是这个参与人的策略空 间。如果每个参与人选择一个策略,就构成一个策略组 合。
贝叶斯纳什均衡
精炼贝叶斯纳什均衡
12 合肥学院 章 蕾
第二节 完全信息静态博弈
每一个参与人对所有其他参与人(对手)的特征、 策略空间及支付函数有准确的知识,而且博弈的参与人 同时选择行动或虽非同时但后行动者并不知道前行动者 采取了什么具体行动,这种情况下参与人的决策就是完 全信息静态博弈。
博弈论贝叶斯博弈与贝叶斯均衡ppt课件
given
by
Ha
rsanyi, consider the following prob
abilities of occurrence for the fou
rDepaprtmoenst sofiMabthlemeaticsmatch-ups:
Bayesian Nash Equilibrium
Department of Mathematics
不完全信息博弈问题
将博弈开始时就存在事前不确 定性的博弈问题称为不完全信息博弈问 题。
Department of Mathematics
例子:斗鸡博弈
两个所谓的勇士举着长枪,准备从独木桥 的两端冲上桥中央进行决斗。每位勇士都有
两种选择:冲上去(用U表示),或退下来(用D
Department of Mathematics
Example: Scalping Tickets
• For example, consider a scenario in which you and the Cavalier are each scalping tickets for beer money bef ore the UVa-Miami football game
This yields the following payoff matrix an d a single pure strategy Nash equilibriu m:
BS b1, BW b1 BS b1, BW b2 BS b2, BW b1 BS b2, BW b2
AS a1, AW a1 AS a1, AW a2 AS a2, AW a1 AS a2, AW a2
Department of Mathematics
《经济博弈论》期末考试复习题及参考答案
经济博弈论复习题(课程代码262268)一、 名词解释混合战略纳什均衡;子博弈精炼纳什均衡:完全信息动态博弈:不完全信息动态博弈:完 全信息静态博弈:帕累托上策均衡;囚徒困境:纳什均衡:子博弈;完美信息动态博弈;颐 抖手均衡;柠檢原理:完美贝叶斯均衡二、 计算分析题1、 在市场进入模型中,市场需求函数为p=13-Q,进入者和在位者生产的边际成本都为1, 固泄成本为0,潜在进入者的进入成本为4。
博弈时序为:在位者首先决左产量水平;潜在 进入者在观察到在位者的产量水平之后决定是否进入:如果不进入,则博弈结束,如果进入, 则进入者选择产疑水平。
求解以上博弈精炼纳什均衡。
2、 考虑如下扰动的性别战略博弈,其中A 服从[0, 1]的均匀分布,Of£<l 山和匕是独 立的,匕是参与人i 的私人信息。
求出以上博弈所有纯战略贝叶斯均衡。
3、求下列信号传递模型的贝叶斯Nash 均衡(讨论分离均衡和混同均衡)(2.1)(6.2)(3.1)(4J)5、古诺IW 弈:市场反需求函数为P (Q )= a- Q,其中Q = q 】+q2为市场总产豊q :为企 业i (i = l, 2)的产量。
两个企业的总成本都为Ci (qJ = cqi 。
请您思考以下问题: 1)在完全信息静态条件下,这一博弈的纳什均衡是什么?2)假设这一阶段博弈重复无限次。
试问:在什么样的贴现条件下,证产量组合(響,響)是子博弈精炼纳什均衡的?6、考虑一卞工作申请的佔弈。
两个学生同时向两家企业申请工作,每家企业只有一个工作 岗位。
工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个 学生申请,该学生获得工作:如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。
现在假泄每家企业的工资满足:W 1/2<W :<2W 1,则问: a.写出以上博弈的战略式描述b.求出以上博弈的所有纳什均衡7、(差异价格竞争)假立两个寡头企业进行价格竞争,但产品并不完全相同,企业,的市场需求门厂)="-门+匕仏丿=1,2),两家企业的生产成本函数为 g 求两个寡头同 时选择价格时的纳什均衡。
南开大学22春“经济学”《初级博弈论》作业考核题库高频考点版(参考答案)试题号4
南开大学22春“经济学”《初级博弈论》作业考核题库高频考点版(参考答案)一.综合考核(共50题)1.原博弈有唯一纯策略纳什均衡的有限次重复博弈有唯一的子博弈完美纳什均衡,即各博弈方每个阶段都采用原博弈的纳什均衡策略。
()A.正确B.错误参考答案:A2.如果一博弈有两个纯策略纳什均衡,则一定还存在一个混合策略均衡。
()A.正确B.错误参考答案:A3.重复博弈的次数虽然是有限的,但重复的次数或博弈结束的时间却是不确定的重复博弈称为“随机结束的重复博弈”。
()A.正确B.错误参考答案:A4.触发策略所构成的均衡都是子博弈完美纳什均衡。
()A.正确B.错误参考答案:B5.参考答案:A6.无限次重复博弈古诺产量博弈不一定会出现合谋生产垄断产量的现象。
()A.正确B.错误参考答案:A7.因为上策均衡反映了所有博弈方的绝对偏好,因此非常稳定,根据上策均衡可以对博弈结果作出最肯定的预测。
()A.错误B.正确参考答案:B8.如果在声明博弈中,声明方的类型连续分布在某个闭区间上时,分区间的部分合并完美贝叶斯均衡能达到的区间数越多,声明的信息传递作用越强。
()A.错误B.正确参考答案:B9.不完美信息动态博弈中的信息不完美性都是客观因素造成的,而非主观因素造成。
()A.错误B.正确参考答案:A10.参考答案:B11.在动态经济博弈论弈问题中,各个博弈方的选择和博弈的结果,与各个博弈方在各个博弈阶段选择各种行为的可信程度有很大关系。
()A.正确B.错误参考答案:A12.在完全但不完美信息博弈中,若不存在混合策略,并且各博弈方都是主动选择且行为理性的,则不完美信息从本质上说是“假的”。
()A.正确B.错误参考答案:A13.如果一种策略或策略组合是一个ESS,那么进化博弈的动态调整一定会收敛于它。
()A.错误B.正确参考答案:A14.纯策略纳什均衡和混合策略纳什均衡都不一定存在。
()A.正确B.错误参考答案:B15.参考答案:A16.纳什均衡的一致预测性质是指不同博弈方的预测相同、无差异。
贝叶斯博弈
不完全信息的市场进入博弈参与人:企业1,企业2行动空间:企业1选择建厂或不建厂,企业2 选择进入或不进入行动顺序和信息结构:自然先以概率对(p,1 p)选择企业1 的成本类型(高,低),企业1 观察到自然的选择而企业2 不能观察到自然的选择;然后企业1 和企业2 同时采取其可选的行动。
赢利状况:如下表对于例子的不完全信息博弈,将不完全信息博弈转化为标准形式贝叶斯博弈。
这一方法是Harsanyi(1967-1968)创造的。
企业1选择DB, 企业2选择IN,构成贝叶斯纳什均衡;意思是,企业1当高成本类型时,选择“不建厂”,而当低成本类型时企业1选择“建厂”,企业2选择“进入”与企业1展开竞争。
贝叶斯纳什均衡的结果为:(2.3,0.4),即双方获得的均衡利润。
不完全信息动态博弈(贝叶斯博弈)我们将介绍另一种新的均衡概念——完美贝叶斯均衡,就有了四个均衡概念:完全信息静态博弈中的纳什均衡、完全信息动态博弈中的子博弈完美纳什均衡、不完全信息静态博弈中的贝叶斯纳什均衡以及不完全信息动态博弈中的完美贝叶斯均衡。
表面上看好像对所研究的每一类型的博弈都发明出了一种新的均衡概念,但事实上这些概念是密切相关的。
随我们研究的博弈逐步复杂,我们对均衡概念也逐渐强化,从而可以排除复杂博弈中不合理或没有意义的均衡,而如果我们运用适用于简单博弈的均衡概念就无法区分。
在每一种情况下,较强的均衡概念只在应用于复杂的博弈时才不同于较弱的均衡概念,而对简单的博弈并没有区别。
引入完美贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡,这和子博弈完美纳什均衡强化了纳什均衡是相同的。
正如我们在完全信息动态博弈中加上了子博弈完美的条件,是因为纳什均衡无法包含威胁和承诺都应是可信的这一思想;我们在对非完全信息动态博弈的分析中将集中于完美贝叶斯均衡,是因为贝叶斯纳什均衡也存在同样的不足。
回顾前面讲过的,如果参与者的策略要成为一个子博弈完美纳什均衡,则它们不仅必须是整个博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。
博弈论第8次课——不完全信息动态博弈
市场进入博弈
博弈两个局中人,一个“在位者”,一 个“进入者”。考虑t=1,2两个时期,在 t=1,市场上有一个垄断企业( “在位 者” )在生产,一个潜在的进入者是否进 入;如果“进入者”进入,两个企业进行 Cournot博弈,否则,“在位者”依然是 一垄断者。
市场进入博弈
假设“在位者”有两种类型:高成本、低成 本, “在位者”存在“私人信息”;进入者只 知道“在位者”是高成本的概率为 ,低成本 的概率为 。 1
战略组合(B,L,U)是一NE,没有参与 人愿意单独偏离这一结果 这一组战略及推断也满足要 求l到3(要求3自动满足)。
1 B (2,0,0) F 2
3的信息集不在均衡路径上。 精炼贝叶斯均衡要求:3在非均 衡路径的信息集上的“判断” 也必须与2的均衡战略L吻合。 1-p
L
3
p
R D
(3,3,3) U (0,1,2)
(一) 精炼贝叶斯均衡
李四预测到这一点,即使生性懦弱,也会强迫自己 吃辣椒,以传达对自己有利的信息。 两种结果: ——懦弱李四不吃辣椒,强悍李四吃辣椒且吃的足 够多,使得懦弱李四不敢模仿,张三能够区分李 四类型并选择是否欺负李四。
——两类李四都吃同样多辣椒,张三不能从李四吃 辣椒行为中推出自己的信息,维持对李四的类型 的先验信念{0.8,0.2}
(三) 信号博弈
先行动者可直接告诉后行动者自己类型,但后行动者不会相 信。如果要让后行动者相信,必须做出一种努力(使自己 付出成本),该成本是其他类型的先行动者不能模仿的 ——称成本支付为一种信号。通过该信号,先行动者能够告 诉后行动者自己的真实类型 例,企业金融市场融资,但投资者对真实赢利能力不了解。 真正高赢利能力的企业可以通过向投资者支付较高的权 益份额来区分自己和低赢利能力的企业,从而让投资者识 别自己的真实类型而投资。 另一方面,低赢利能力企业对自己真实赢利能力是清楚 的,不敢模仿高赢利能力企业,只能承诺低权益份额,投 资者不会投资。
博弈论基础5-不完全信息动态博弈
QSC QSC QSC
Page: Page:1 1
不完全信息动态博弈
不完全信息动态博弈,也称动态贝叶斯 博弈。动态贝叶斯博弈与静态贝叶斯博 弈在许多方面是相似的,差别只是动态 贝叶斯博弈转化成的不是两阶段有同时 选择的特殊不完美信息动态博弈,而是 更一般的不完美信息动态博弈,因此可 以直接利用不完美信息动态博弈的均衡 概念进行分析。
The foundation of Game Theory
客户1 存款 客户2 存款 不存款 存款 不存款 不存款
博弈论基础 —不完全信息动态博弈
钱世超 Qian Shichao
E-mail: scqian@
提前 客户2 提前
(1,1) (1,1) (1,1)
客户1 到期 到期 提前 到期
博弈论基础 ... Copyright 版权所有, 博弈论基础 Copyright © 2005 ECUST. All rights reserved. 华东理工大学 版权所有, 翻印必究。 博弈论基础 Copyright © © 2005 2005 ECUST. ECUST. All All rights rights reserved. reserved. 华东理工大学 华东理工大学 版权所有, 翻印必究。 翻印必究。 QSC QSC QSC
Page: Page:3 3
不完全信息动态博弈分析的基本思路
“自然”首先选择参与人的类型(参与人自己知 道,其他人不知道,转换成不完美信息动态博弈 参与人按先后顺序行动,后行动者能观察到先行 动者的行动,但观察不到先行动者的确切类型。由 于行动的类型依存性,后行动者可以通过先行动者 的行为推断或修正对先行动者的类型判断(先验信 息),而后确定自己的行为。 先行动者预计自己的行为将被后者利用,因此将 通过选择能传递对自己有利信息的行动 博弈的过程不仅是参与人不断选择行动的过程, 也是参与人不断修正对对手的判断的过程
经济博弈论基第五章动态贝叶斯博弈
s i
i
(B)Pi ( i
a
h i
)
是局中人
i观测到
a
h
和最优策略
i
s
*
i
(
)
后,使
用贝叶斯法则从先验概P率i (i i ) 得到的。
六、不完美信息博弈的完美贝叶斯纳什均衡
例1:完美贝叶斯纳什均衡是{M, U; p=1}
1
L (1, 3)
U
M [p] R [1-p]
2
1、Milgrom-Roberts (1982)垄断限价模型
传统解释的问题:价格作为一种承诺是不可置信的,因 为无论垄断者现在索取什么价格,一旦其他企业进入,垄断者 就会改变价格,因此,靠低价格是不可阻止进入的。
Milgrom-Roberts (1982)提出的解释:垄断限价可能反映 了这样一个事实,即其他企业不知道垄断者的生产成本,垄断 者试图用低价格来告诉其他企业自己是低成本,进入是无利可 图的。
一、KMRW声誉模型
如果下列条件满足,囚徒2将选择X=不坦白: 11p-14≥5p-12 p ≥1/3
即如果囚徒1属于非理性的概率不小于1/3,囚 徒2将在第一阶段选择“不坦白”(合作)。
一、KMRW声誉模型
下面考虑博弈重复三次(T=3)的情况:
给定p≥1/3,如果理性囚徒1和囚徒2在第一阶段都选择 “不坦白”(合作),那么第二、三阶段的均衡路径与前表相 同(X=不坦白),总的均衡路径如下表:
2、博弈顺序
(1)自然首先选择囚徒1的类型,囚徒1知道自己的类型, 囚徒2只知道囚徒1属于理性的概率是1-p,非理性的概率是p;
(2)2个囚徒进行第一阶段的博弈;
(3)观察到第一阶段博弈结果后,进行第二阶段博弈; 观察到第二阶段博弈结果后,进行第三阶段博弈;如此等等。
复旦大学-谢识予-经济博弈论6
模型
好
1
差
1 低价
1
高价
高价
低价
2
2
买
不买
买
不买
( Ph,V Ph)
(0,0) ( P,h VPh ) (0,0) (Pl ,V Pl) (0,0) ( Pl ,W Pl) (0,0)
6.4.2 模型的均衡
市场完全成功的完美贝叶斯均衡 条件: C Ph 均衡策略组合和判断:
市场接近失败
柠檬原理和逆向选择
允许价格变化 消费者支付价格低于期望价值 平均(期望)价值以上商品退出,市场上商品
质量越来越差 消费者愿意支付的价格越来越低
柠檬原理和逆向选择是信息不完全导致的, 对市场效率都是不利的。
6.5 有退款保证的双价二手车交易
原理:用退款
保证提高C ,
或者说卖方
3
3
市场类型归纳
Pg (V P) Pb (W P)
0
市场 部分 成功
市场接 近失败
或 完全失败
市场 完全 成功
P
C
市场 完全 成功
单一价格二手车交易的解
6.4 双价二手车交易
6.4.1 双价二手车交易博弈模型 6.4.1 模型的均衡
6.4.1 双价二手车交易博弈模型
价格不变——价格可变 两种价格、离散价格、连续价格 价格透露的信息 市场的分化、发育,高端、低端市场的形成 本模型可以揭示市场发展和演变的 一些过程和规律,
要求3:在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方 的均衡策略决定
要求4:在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各 博弈方在此处可能有的均衡策略决定
《经济博弈论》复习题参考答案
《经济博弈论》复习题及参考答案一、名词解释1、混合战略纳什均衡如果在博弈的利益表中,无法找到任何一方都可以接受(不一定利益最大化)的方案,也就是没有哪一种组合是在给定对手策略下没有动机改变自己策略的情况。
这时博弈没有纯策略均衡,需要一个“概率表”指导博弈结果。
在博弈G={S1,S2……Sn;U1,U2……Un}中第i个博弈方策略空间为Si={Si1……Sik}则博弈方以概率分布Pi=(Pi……Pik)随机在k个可选策略中选的的策略称为一个混合策略纳什均衡。
2、子博弈精炼纳什均衡对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。
子博弈精练纳什均衡所要求的是参与人应该是序惯理性的。
对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。
3、完全信息动态博弈完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息。
4、不完全信息动态博弈指在动态博弈中,行动有先后次序,博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率,即知道“自然”参与人的不同类型与相应选择之间的关系,但是,参与人并不知道其他的参与人具体属于哪一种类型。
由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。
5、完全信息静态博弈完全信息静态博弈指的是信息对于博弈双方来说是完全公开的情况下,双方在博弈中所决定的决策是同时的或者不同时但在对方做决策前不为对方所知的。
6、囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
si
i
(B)Pi (i ahi )是局中人 i观测到 ahi和最优策略 s*i (•) 后,使 用贝叶斯法则从先验概率 Pi (i i ) 得到的。
六、不完美信息博弈的完美贝叶斯纳什均衡
例1:完美贝叶斯纳什均衡是{M, U; p=1}
1
L (1, 3)
U
M [p] R [1-p]
2
B
U
B
(2,1) (0,0) (0,2)
1、Milgrom-Roberts (1982)垄断限价模型
传统解释的问题:价格作为一种承诺是不可置信的,因 为无论垄断者现在索取什么价格,一旦其他企业进入,垄断者 就会改变价格,因此,靠低价格是不可阻止进入的。
Milgrom-Roberts (1982)提出的解释:垄断限价可能反映 了这样一个事实,即其他企业不知道垄断者的生产成本,垄断 者试图用低价格来告诉其他企业自己是低成本,进入是无利可 图的。
理性囚徒1 (1-p )不坦白 坦白 坦白
囚徒2
不坦白 不坦白 坦白
一、KMRW声誉模型
进一步分析可以证明:
如果囚徒 1 是非理性的概率p≥1/3,对于所有的 T>3,下列策略组合构成一个完美贝叶斯纳什均衡: 理性囚徒1在t=1至t=T-2 阶段一直选择“不坦白”, 然后在t=T-1和t=T阶段选择“坦白”;囚徒2在t=1至 t=T-1阶段选择“不坦白”,然后在 t =T阶段选择 “坦白” 。
第一节 动态贝叶斯博弈
动态贝叶斯博弈的博弈过程不仅是局中人选择 行动的过程,而且是局中人不断修正信念的过程。
第二节 完美贝叶斯纳什均衡
一、基本思路
动态贝叶斯博弈的完美贝叶斯纳什均衡是 Selten的完全信息动态博弈中子博弈完美纳什均衡 和Harsanyi 的不完全信息静态博弈中贝叶斯纳什 均衡的结合。
测到的信号m和局中人 1的最优策略 m*( ) 得到的。
三、完美贝叶斯纳什均衡分类
1、分离均衡:不同类型的发送者选择不同的信号, 信号准确揭示出类型;
2、混同均衡:不同类型的发送者选择相同的信号; 3、准分离均衡:一些类型的发送者随机地选择信 号,另一些类型的发送者选择特定的信号。
四、信号传递博弈的应用
2、博弈顺序
(1)自然首先选择囚徒1的类型,囚徒1知道自己的类型, 囚徒2只知道囚徒1属于理性的概率是1-p,非理性的概率是p;
(2)2个囚徒进行第一阶段的博弈;
(3)观察到第一阶段博弈结果后,进行第二阶段博弈; 观察到第二阶段博弈结果后,进行第三阶段博弈;如此等等。
(4)理性囚徒1和囚徒2的支付是阶段博弈的支付的贴现 值之和(假定贴现因子δ=1)。
第二节 完美贝叶斯纳什均衡
三、完美贝叶斯纳什均衡要求
给定有关其他局中人的类型的信念,局中人的 策略在每一个信息集开始的“后续博弈”(即从本 信息集开始的 博弈剩余部分)上构成贝叶斯纳什均 衡;并且,在所有可能的情况下,局中人使用贝叶 斯法则修正有关其他局中人的类型的信念。
第二节 完美贝叶斯纳什均衡
一、KMRW声誉模型
将任何一个囚徒选择“坦白”的阶段成为非合 作阶段;两个囚徒都选择“不坦白”成为合作阶段。
结论:只要p≥1/3,非合作阶段的总数量等于2, 与T无关。
KMRW定理
在T阶段重复囚徒博弈中,如果每个囚徒都有 p>0 的 概 率 是 非 理 性 的 ( 即 只 选 择 “ 针 锋 相 对 ” 或 “冷酷策略”),如果T足够大,那么存在一个T0<T, 使得下列策略组合构成一个完美贝叶斯纳什均衡:所 有理性囚徒在t<T0 阶段一直选择合作(不坦白),在 t>T0 阶段选择不合作(坦白);并且非合作阶段的数 量(T-T0)只于p有关而与T无关。
t=1 t=2 t=3
非理性囚徒1 (p) 不坦白 不坦白 不坦白
理性囚徒1 (1-p) 不坦白 坦白 坦白
囚徒2
不坦白 不坦白 坦白
一、KMRW声誉模型
分析表明:只要囚徒1是非理性的概率p≥1/3,上 表所示的策略组合就是一个完美贝叶斯纳什均衡:
(导致第一阶段合作)
t=1
t=2 t=3
非理性囚徒1 (p) 不坦白 不坦白 不坦白
第二节 完美贝叶斯纳什均衡
五、完美贝叶斯纳什均衡定义
完美贝叶斯纳什均衡是一个策略组合 s*( ) (s1*(1),..., sn*(n ))
和一个后验概率组合 P (P1,..., Pn ),满足:
(P)对于所有的局中人i,在每个信息集h上,
si*(si ,1) arg max Pi (i ahi ) ui (si , si ;i )
2、局中人1观测到自己的类型θ后发出信号 m M {m1,..., mJ };
3、局中人2观测到1发出的信号m(但不是类型θ),使用 贝叶斯法则从先验概率P=P(θ)得到后验概率 p p( m),然后选 择行动 a A {a1,..., aH } 。
4、支付函数分别为 u1(m, a; ),u2 (m, a; )。
KMRW定理的直观解释
尽管每一个囚徒选择合作时冒者被其他囚徒出卖 的风险(从而可能得到一个较低的现阶段支付),但 如果他选择不合作,就暴露了他是非合作型的,从而 失去了获得长期合作收益的可能(如果对方是合作型 的)。
KMRW定理的直观解释
第四节 重复博弈与声誉模型
在这一结果似乎与人们的直观感觉不一致。 Axelrod(1981)的实验结果表明:即使在有限次 重复博弈中,合作行为也频繁出现。
Kreps、Milgrom、Roberts & Wilson (1982)的声 誉模型通过将不完全信息引入重复博弈解开了这个悖 论。
一、KMRW声誉模型
含义:局中人对其他局中人支付函数或策略空间 的不完全信息对均衡结果有重要影响,只要博弈重复 的次数足够长(没有必要是无限的),合作行为在有 限次重复博弈中会出现。
例如:“坏人”可能在相当长一段时期内表现得 像“好人”一样。
一、KMRW声誉模型 以囚徒困境为例说明KMRW 模型:
1、 要素分析 假定囚徒 1 有两个类型:
四、动态贝叶斯博弈要素分析
1、局中人:n个
2、类 型:局中人 i的类型 i i ,θi是私人信息;
3、先验概率:Pi (i i ) 是类型为θi的局中人 i认为其他局中人属于
i 的先验概率。
4、策略空间(行动组合):
si (i ) Si (i ), ahi
(a1h
,
...,
aih1,
ah i 1
(0,1)
第三节 信号传递博弈
一、信号传递博弈 两个局中人: 1是信号发送者;2是信号接受者 不完全信息: 局中人 1的类型是私人信息; 局中人 2 的类型是公共信息(只有一个类型)
信号传递博弈的顺序
1、自然首先选择局中人1的类型 {1,..., K },1知道θ, 2不知道,只知道1属于θ的先验概率是P=P(θ);
第二节 完美贝叶斯纳什均衡
策略型博弈
Harsanyi
贝叶斯博弈
(完全信息静态博弈)
(不完全信息静态博弈)
(纳什均衡)
贝叶斯化
(贝叶斯纳什均衡)
Selten 完美化
Selten 完美化
(子博弈)
(后续博弈)
扩展型博弈
动态贝叶斯博弈
(完全信息动态博弈 )
(不完全信息动态博弈)
(子博弈完美纳什均衡) 贝叶斯化 (完美贝叶斯纳什均衡)
经济博弈论基础
Economic Game Theory 第二部分
非合作博弈理论
主要内容
第二章 策略型博弈 第三章 扩展型博弈 第四章 贝叶斯博弈 第五章 动态贝叶斯博弈
第五章 动态贝叶斯博弈
——不了解对手,行动有先有后时,如何决策
第一节 动态贝叶斯博弈 第二节 完美贝叶斯纳什均衡 第三节 信号传递博弈 第四节 重复博弈与声誉模型
一、KMRW声誉模型
如果下列条件满足,囚徒2将选择X=不坦白: 11p-14≥5p-12 p ≥1/3
即如果囚徒1属于非理性的概率不小于1/3,囚 徒2将在第一阶段选择“不坦白”(合作)。
一、KMRW声誉模型
下面考虑博弈重复三次(T=3)的情况:
给定p≥1/3,如果理性囚徒1和囚徒2在第一阶段都选择 “不坦白”(合作),那么第二、三阶段的均衡路径与前表相 同(X=不坦白),总的均衡路径如下表:
第一节 动态贝叶斯博弈
动态贝叶斯博弈的含义:
动态贝叶斯博弈即不完全信息动态博弈,其含义 是:自然首先选择局中人的类型,局中人自己知道, 其他局中人不知道;自然选择之后,局中人开始行动, 局中人的行动有先有后,后行动者能够观察到先行动 者的行动,但不能观察到先行动者的类型。
第一节 动态贝叶斯博弈
动态贝叶斯博弈的含义:
1、Milgrom-Roberts (1982)垄断限价模型
现象:垄断企业规定的产品价格一般低于微观经济学定义 的最优垄断价格(即边际收益等于边际成本的价格)。
传统解释:如果价格等于垄断价格,其他企业看到有利可 图,就会进入;相反,如果价格低一些,其他企业看到无利可 图,就不会进入,垄断企业就可以继续保持其垄断地位。
,
...,
anh
)
是在信息集h 上局中人 i观察到的其他n-1个局中人的行动组合,它
是策略组合 si (s1,..., si1, si1,..., sn ) 的一部分。
第二节 完美贝叶斯纳什均衡
四、动态贝叶斯博弈要素分析 5、后验概率: Pi (i ahi是) 局中人 i在信息集h 上观察到 其他 n-1个局中人的行动组合后认为其他 n-1个局中人 属于θ-i 的后验概率; 6、支付函数: ui (si , si;i )是 i的支付函数。
理性的(非合作型的) 非理性的(合作型的,讲义气重信誉的) 假定囚徒 2 只有一个类型:理性的。