第4章 不完全信息动态博弈
博弈论谢识予第四五章参考答案
第四章参考答案2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。
在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。
这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。
3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。
从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次16重复博弈中无法直接运用,因为没有最后一次重复。
因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。
此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。
从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。
例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。
两类重复博弈民间定理的差异也说明了这一点。
最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。
上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。
6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。
这两个纳什均衡的得益都帕累托劣于(B,S)。
一次性博弈中效率较高的(B,S)不可能实现。
不完全信息 动态 斯塔克尔伯格博弈模型
不完全信息动态斯塔克尔伯格博弈模型下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。
文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!本店铺为大家提供各种类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you! In addition, this shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!不完全信息动态斯塔克尔伯格博弈模型1. 引言斯塔克尔伯格博弈模型是一种常见的非合作博弈模型,它描述了市场上的领导者和追随者之间的相互作用。
第4章 不完全信息动态博弈
(M1L D1L )
M1L M1L ( p1L )
M1H M1H ( p1L )
(M1H D1H )
p
pp
~
L m
H pm p
p1L
图4.5垄断限价模型 博弈论与信息经济学 江西财经大学 陶长琪
4.2-1米尔格罗姆-罗伯茨 (Milgrom-Roberts)垄断限价模型
P r ob { |a } P r ob {a }
h
p(a
j 1
K
h
| j ) p( j )
应该指出的是,贝叶斯法则并不是一个技术性法则,而是人们修正信念的唯一合 理方法. 精炼贝叶斯均衡假定参与人是根据贝叶斯法则修正先验概率的.不过,贝叶斯法 则要求 Pr ob i必须以正的概率选择 a h ,否则,后验概率没 {a h } 0,即参与人 {a h } 0 ,我们允许Pr ob{a h } 0 在[0,1]区间取任 有定义.如果 Pr ob 何值,只要所取的值与均衡战略相容.在动态博弈中,Pr ob{ k | a h } 对应的是 非均衡中径上的信息集
博弈论与信息经济学 江西财经大学 陶长琪
4.2-1米尔格罗姆-罗伯茨 (Milgrom-Roberts)垄断限价模型
( SM ) ( M 1H ( p1 ) M 1L ( p1 )) 0 p2005.1.11 赵乐欢制作历经或 10天终于于 日凌晨基本完成,非常感谢 1
H L 刘艳艳同学第四章及第六章,第七章的文档 ! ( p1 ) M 1 ( p1 ) M 1
让我们再一次考虑市场进入的例子:
[u] 在位者 P=4 进入者 进入 不进入 进入
第一阶段: (2,0) (2,0) 第二阶段: (3,1) (7,0)
不完全信息动态博弈
创立目的就是和波音这样已成规模的公司竞争。
波音早于空客成立,所以当欧洲各国抢占市场时,波音早
已在欧洲站稳脚跟。波音公司先进入市场,就可能出现两种情
况——波音公司是一个“无先发优势”的企业,也可能是一个
“有先发优势”的企业。
第5页
2
波音与空客之战
第五章
不完全信息动态博弈
主要内容
第一节
不完全信息动态博弈
第二节
精炼贝叶斯纳什均衡
第三节
信号博弈
第四节
先验信念、策略互动、后验概率
第 2 页
第一节
不完全信息动态博弈
不完全信息动态博弈特点
波音与空客之战
第3页
1
不完全信息动态博弈特点
不完全信息动态博弈:指至少有一方参与者对于博弈的信息不是
完全了解,并且参与者的行动存在先后顺序。和不完全信息静态
由方程 2q1 q2 8 和 q1 2q2 8 可得:
q1=8/3,q2=8/3
在“无先发优势”条件下波音公司利润π(q1)=64/3,空客
公司利润为π(q2)=10/3。
也就是说,在波音公司是“无先发优势”条件下,空客
公司会选择生产,与波音公司竞争。
第 13 页
第二节
精炼贝叶斯纳什均衡
自己肯定选择策略R,所以对这个动态博弈来说,博弈路径必
定是甲选择策略T,乙选择策略R。
第 22 页
3
不可置信的威胁与可置信的威胁
不可置信威胁又称空洞威胁,是完全没有任何威胁作用的威
胁。比如在上述博弈中,乙为了让甲选择策略N,就对甲说,
如果不选择N,乙会选择策略L,局中人甲得益就是0,但甲选
第四部分 不完全信息动态博弈 第六章 信号博弈(signalling games)
a1
[1]
m1
a2 R
a1 [0]
a2
m1
S
t1
N 1- t2
S
m2
[0] a1
a2
R
[1] a1
m2
a2
• 结论:[(m1,m2), (a1,a2), p=1, q=0]是博弈的分离完美Bayes均衡。
厂商的分离均衡纯策略(保修,不保修)
(1,0.5) Y [1] (0,0) N 客户
(-1,-0.5) Y [0]
• SR(1):μ(软弱/热狗)=p;μ(粗暴/热狗)=1-p;μ(软弱/啤酒)=q; μ(粗暴/啤酒)=1-q
• 发送者的纯策略:(热狗,热狗), (热狗,啤酒), (啤酒,热狗), (啤 酒,啤酒)
• 接收者的纯策略:(冲突,冲突), (冲突,不冲突), (不冲突,冲突), (不冲突,不冲突)
1、发送者的分离均衡纯策略(热狗,啤酒)
(ti m j ) 1
t i T
a1 [p] m1 a2
S
m2
[q] a1
t1
a2
R
a1 [1-p]
a2
m1
N 1- t2
S
R
[1-q] a1
m2
a2
条件R2
• 在给定的信念下,局中人的策略必须是序贯理 性的(sequentially rational)。就是说,在每一 个信息集,具行动的局中人所采取的行动(以 及局中人往后的行动)在给定该局中人在该信 息集上的信念与其他局中人以后的策略下必须 是最优的。
1 R (1,3)
L
M
p
2
1-p
A
BA B
(2,1) (0,0) (0,2) (0,1)
第四章 不完全信息动态博弈
~ (2) P 是先验概率 Pi ( i | i ) 的集合,即 P ,Pi Pi ( i | i ) , (P 1 ,, P n) ~ Pi 是第 i 个局中人在其进行行动选择的信息集上所有信念组成的组 ~ 为他在其第 个信息集上的信念;若局中人在信息集 上 合,记 P h h ih ~ ~ h 观察到的行动为 a h ,则记 P P ( | a ,, n 。 ih i i i ) ,i 1
博弈论
任课教师: 南京航空航天大学 经管学院
李帮义 教授
博弈论与信息经济学
——第四章 不完全信息动态博弈
1,信息传递:名牌效应;MBA学位 2,信息修正:黔之驴;约会 3,信息甄别:
目录
本章内容主要包括:
博弈时序与信息效应 不完全信息动态博弈 信号博弈 教育信号传递模型 KMWR声誉模型
博弈时序与信息效应
i
i
(i ), Si (i ) i ,i ) ,我们就可以类似于
i
i
i
i
i
i
i
i
i
i
不完全信息动态博弈
~ ~ 定义 在不完全信息动态博弈 G u1 ,, un , P 中,精炼贝 1 ,, P n , H1 ,, H n
* 叶斯纳什均衡是一个类型依赖的战略组合S ( ) (S1* (1 ),, Si* (i ),, Sn (n )) p 1, p 2 ,, p n ,它满足: 和一个后验概率组合 p * ( | )u ( S ( ), S ( ) , ) (1) S ( ) arg max P
( | ), i 1,, n , 当 i 是类型 i 时,其他 n 1个人是类型 i 的后验概率是 P i i i ( | )u (S ( ), S ( ) , ) 。另外,当 i 是类型 i 因此实际预期效用P i i i i i i i i i i
企业间合作与竞争的博弈模型
企业间合作与竞争的博弈模型第一章引言企业间的合作与竞争是经济活动中常见的一类现象。
企业间合作,可以加强企业之间的联系,形成企业协同效应,提高企业的竞争力,实现共同利益。
而企业间竞争则是企业之间为争夺市场份额和利润而采取的一种行为,它可以促进市场生态的发展和优化。
因此,如何在企业间进行合作与竞争,是当前企业经营和发展面临的重要问题。
本文将从博弈论的角度探讨企业间合作与竞争的博弈模型。
第二章合作的博弈模型企业间的合作,可以通过博弈论模型进行研究。
博弈论是对决策制定者行为和决策的影响进行定量研究的一种数学方法。
下面以纳什博弈为例,解析企业间合作的博弈模型。
2.1 纳什博弈纳什博弈是一种非合作博弈模型,是博弈论中最著名的博弈模型之一。
该博弈模型是基于每个人都做出最优决策的假设,并考虑到其他参与者也会做出最优决策的可能性。
在纳什博弈中,每个人通过考虑其他人可能的行为来选择自己的行为,以达到自己的最优收益。
2.2 合作的纳什均衡在企业间的合作中,纳什博弈中的合作是比较常见的行为。
当多个企业在选择是否进行合作时,会考虑到其他企业是否也会进行合作。
如果有多个企业都选择进行合作,则可以形成一个纳什均衡。
在这种情况下,每个企业对于合作的决策是最优的,因为每个企业的利益可以得到最大化。
2.3 合作的追求问题然而,在企业间的合作中,每个企业都追求自身利益的最大化。
因此,在企业合作时,存在任一企业追求自身利益的情况下,合作可能会被打破。
此时,合作方可能会受到不利的影响,从而导致合作的失败。
企业间的合作可以利用纳什博弈模型进行分析,以确定最佳的合作策略。
第三章竞争的博弈模型企业间的竞争可以通过博弈论模型进行分析。
下面以重复的囚徒困境博弈为例,解析企业间竞争的博弈模型。
3.1 重复的囚徒困境博弈重复的囚徒困境博弈是一种重复博弈模型,也是博弈论中最常见的博弈模型之一。
在重复囚徒困境博弈中,两个企业面临决定是否采取合作或竞争的问题。
博弈论第四章
4 非完全信息动态博弈4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。
参与人2 不知道t,但知道t的概率分布。
博弈的时序:(1)参与人1选择行动a1∈A1;(2)参与人2观察a1,选择a2∈A2博弈的收益:u1(a1, a2, t), u2(a1, a2, t )u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2例:1 RL M 13p 2 1- pL'R'L'R'2 0 0 01 0 1 2标准式表示参与人 2L'R'L2,10,0参与人 1 M0, 20,1R1, 31, 3纯战略纳什均衡: (L,L'), (R,R')均为子博弈精炼纳什均衡(无子博弈)。
但是(R, R')不可信。
排除不可信的纳什均衡:要求1 参与人必须有一个推断(belief).要求2 参与者的战略必须满足序贯理性(sequentially rational).定义: 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下,博弈以正的概率到达该集.要求3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。
例要求3的说明参与人1的类型空间:{ t1,t2,t3,t4 }行动空间:A= { L,R}推断p i: 观察到L后,参与人1的类型是t i的概率。
推断q i: 观察到R后,参与人1的类型是t i的概率。
p1 + p2 + p3 + p4 = 1q1 + q2 + q3 + q4= 1N如果参与人1的战略: t 1选 L ,t 2选 L , t 3选R ,t 4 选R 。
参与人2对p i 与 q i 的推断:p 1 = 3.02.02.0+= 0.4, p 2 = 3.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,例 3个参与人的博弈。
第章不完全信息动态博弈
P( A1
/
B)
P( A1)P(B / A1) P( A1)P(B / A1) P( A2 )P(B /
A2 )
0.4 * 0.00001 0.4*0.00001 0.6*0.00243
0.0027
P( A2
/
B)
P( A2 )P(B / A2 ) P( A1)P(B / A1) P( A2 )P(B
❖ 假设国际市场飞机需求函数为:P = 10 – Q ❖ 其中:Q = q1 + q2。 ❖ 波音公司和空中客车公司的行动存在先后顺序。 ❖ 波音公司先进入市场,空中客车公司后进入市场。 ❖ 波音公司和空中客车公司都明确知道空中客车公司的生产函数。 ❖ 波音公司明确知道自己的生产函数,但空中客车公司不知道波
“无先发优势”的公司。 ❖ 波音公司“有先发优势”时,其成本函数为:C(q1) = q1。 ❖ 波音公司“无先发优势”时,其成本函数为:C(q1) = 2q1。 ❖ 空中客车公司的生产函数没有不确定性。 ❖ 空中客车公司的生产函数为:C(q2) = 2q2。 ❖ 空中客车公司进入市场需要付出一个额外的固定成本。
企业生产过程中“规模经济”(Economy of Scale)特征 越发明显。生产规模越大,企业生产成本越低。 ❖ 规模经济的生产模式催生不完全竞争的市场结构。 ❖ 具有规模经济生产特征的企业越做越大,逐渐在市场中占据一 定垄断地位,进而打破完全竞争的市场结构,产生垄断竞争、 寡头、甚至垄断等不完全竞争的市场结构模式。
❖ 先验概率形成后,根据之后得到信息对先验概率进行修正, 得到后验概率。
❖ 贝叶斯公式是连接先验概率和后验概率的桥梁。
一、贝叶斯公式
❖ 贝叶斯公式(逆概公式):设试验 E 的的样本空间为 Ω。 事件 A1,A2,…,An 构成样本空间 Ω 的一个划分(或构成 一个完备事件组),且 P(Ai) > 0,(i = 1,2,…,n) 则对任意一个事件 B(P(B) > 0),有:
博弈论与信息经济学04PPT课件
• 精炼贝叶斯均衡是贝叶斯均衡、子博弈精 炼纳什均衡和贝叶斯推断的结合。它要求:
1、在每个信息集上,决策者必须有一个定义在属 于该信息集的所有决策结上的一个概率分布(信 念);
2、给定该信息集上的概率分布和其他参与人的 后续战略,参与人的行动必须是最优的;
3、每一个参与人根据贝叶斯法则和均衡战略修 正后验概率。
贝叶斯法则
(6,0) (6,0) (7,0) (3,1) (7,0) (3,1)
(7,0) (6,0) (6,0) (9,0) (9,0) (8,0) (8,0) (7,0) (5,-1) (9,0) (5,-1) (9,Байду номын сангаас) (5,-1) (9,0)
• 在第二阶段, 企业的行动选择是一个简单的 静态博弈决策问题,但在第一阶段,情况 要复杂得多:
P=4
P=5
P=6
2
6
7
6
9
8
• 例如:低成本的在位者不会选择p=6,因 此,如果进入者观察到在位者选择了p=6, 就可以推断在位者一定是高成本,选择 进入是有利可图的。预测到p=6会招致进 入者进入,即使高成本的在位者也可能 不会选择p=6。
• 类似的,如果选择价格p=5会招致进入者 进入,低成本的在位者也不会选择p=5。
对于在位者:
价格 在位者高成本时的利润 在位者低成本时的利润
P=4 P=5
P=6
2
6
7
6
9
8
• 进入者只有一种类型:进入成本为2。如果进入, 生产成本函数与在位者高成本函数相同。在 T=2阶段,如果进入者已进入,在位者成本函 数为共同知识;
决策与博弈论第4章
2021/2/19
2
完美贝叶斯均衡吸取了子博弈完美纳什均衡和贝叶 斯均衡的精华,是贝叶斯均衡、子博弈完美均衡和贝叶 斯推断的结合。
子博弈完美纳什均衡:策略不仅必须是整个博弈的 纳什均衡,还必须是其中每一个子博弈的纳什均衡。
完美贝叶斯均衡:策略不仅必须是整个博弈的贝叶 斯纳什均衡,而且还必须构成每一个后续博弈的贝叶斯 纳什均衡。
第四章 不完全信息动态博弈
4.1.1 基本概念
不完全信息意味着至少有一个参与人拥有私人信息, 通常用类型表示拥有不同私人信息的参与人,类型由 “自然”或“上帝”给定。
博弈顺序: (1)“自然”选择参与人的类型,并 将类型告诉参与人自己,不告诉其他参与人,只将类型 分布告诉其他参与人;(2)参与人开始行动,参与人 的行动有先有后,后行动者能观察到先行动者的行动, 而不能观察到先行动者的类型。
2021/2/19
18
“啤酒和热狗”信号博弈
在啤酒和热狗博弈中,(Q |1, B |2)是发送者的一个分离策略,这里
Q |1 代表在发送者是软弱类型的情况下,选择热狗。如果 b d ,那 么,发送者的策略 (Q |1, B |2)和接收者的策略 (D | Q, N | B)以及后验概率
p 1 和 q 0 是这个博弈的完美贝叶斯均衡。这里 D | Q 代表在发送 者选择热狗的情况下,接收者选择冲突,也可以类似地解释 N | B。
类型,即后验概率 ( | m) 要么为0要么为1。
u1(i , mi , a(mi )) u1(i , mj , a(mj ))
2021/2/19
13
信号博弈的完美贝叶斯均衡
定义
混同均衡(pooling equilibrium)在这种均衡中,不同类型 的发送者选择了相同的信号,换句话说,没有任何类型选择与其 他类型不同的信号。这时,接收者无法从信号中得到新的信息, 也就无法对先验信念进行修正。因此,后验概率( | m) 等于自
信息经济学部分习题解答
p
(3) 企业2先决策
根据逆推归纳法,先求企业1的反应函数
1 2 p a q c0 pa q c
p
代入企业2的利润函数,得
2 q b 2 p q b 2 a c q
再求企业2的反应函数,得
2 2 qba0 qab
解:根据问题的假设可知各企业的利润函数为
i piq ciqaqijn iqjqiciq
其中i=1,…,n。
将利润函数对qi求导并令其为0得:
i
qi
n
a
ji
qj c2qi 0
解得各企业对其他企业产量的反应函数为:
qi a n qj c/2
ji
根据n个企业之间的对称性,可知 q1*q2 *qn * 必然成立。代入上述反应函数可解得:
9
9
8.下表所示博弈重复两次,第二次开始之前第
一次的行动能被双方观察到。假定参与人对未 来收入不贴现。问题:支付向量(4,4)能否作为 子博弈精炼均衡结果在第一阶段出现(假定参与 人只选择纯战略)?如果能,请给出支持这一结 果的战略;如果不能,解释为什么。
L
C
R
T
3,1
0,0
5,0M2,1Fra bibliotek1,2
3,1
2 完全信息动态博弈
1.参与人1(丈夫)和参与人2(妻子)必须独立地决定出门时是否带 伞。他们知道下雨和不下雨的可能性相同(即50:50)。支付函数 如下:如果只有一人带伞,下雨时带伞者的效用为-2.5,不带 伞者(搭便车者)的效用为-3;不下雨时带伞者的效用为-1,不带 伞者的效用为0;如果两人都带伞,下雨时每人的效用为-2,不 下雨时每人的效用为1;如果两人都不带伞,下雨时每人的效 用为-5,不下雨时每人的效用为1。给出以下两种情况下的扩展 式表述(博弈树)和战略式表述:(1)两人出门前都不知道是否会 下雨,并且两人同时决定是否带伞(即每一方在决策时都不知道 对方的决策);(2)两人出门前都不知道是否会下雨,但丈夫先 决策,妻子在观察到丈夫是否带伞后才决定自己是否带伞;(3)
博弈论基础5-不完全信息动态博弈
QSC QSC QSC
Page: Page:1 1
不完全信息动态博弈
不完全信息动态博弈,也称动态贝叶斯 博弈。动态贝叶斯博弈与静态贝叶斯博 弈在许多方面是相似的,差别只是动态 贝叶斯博弈转化成的不是两阶段有同时 选择的特殊不完美信息动态博弈,而是 更一般的不完美信息动态博弈,因此可 以直接利用不完美信息动态博弈的均衡 概念进行分析。
The foundation of Game Theory
客户1 存款 客户2 存款 不存款 存款 不存款 不存款
博弈论基础 —不完全信息动态博弈
钱世超 Qian Shichao
E-mail: scqian@
提前 客户2 提前
(1,1) (1,1) (1,1)
客户1 到期 到期 提前 到期
博弈论基础 ... Copyright 版权所有, 博弈论基础 Copyright © 2005 ECUST. All rights reserved. 华东理工大学 版权所有, 翻印必究。 博弈论基础 Copyright © © 2005 2005 ECUST. ECUST. All All rights rights reserved. reserved. 华东理工大学 华东理工大学 版权所有, 翻印必究。 翻印必究。 QSC QSC QSC
Page: Page:3 3
不完全信息动态博弈分析的基本思路
“自然”首先选择参与人的类型(参与人自己知 道,其他人不知道,转换成不完美信息动态博弈 参与人按先后顺序行动,后行动者能观察到先行 动者的行动,但观察不到先行动者的确切类型。由 于行动的类型依存性,后行动者可以通过先行动者 的行为推断或修正对先行动者的类型判断(先验信 息),而后确定自己的行为。 先行动者预计自己的行为将被后者利用,因此将 通过选择能传递对自己有利信息的行动 博弈的过程不仅是参与人不断选择行动的过程, 也是参与人不断修正对对手的判断的过程
《经济博弈论》复习题参考答案
《经济博弈论》复习题及参考答案一、名词解释1、混合战略纳什均衡如果在博弈的利益表中,无法找到任何一方都可以接受(不一定利益最大化)的方案,也就是没有哪一种组合是在给定对手策略下没有动机改变自己策略的情况。
这时博弈没有纯策略均衡,需要一个“概率表”指导博弈结果。
在博弈G={S1,S2……Sn;U1,U2……Un}中第i个博弈方策略空间为Si={Si1……Sik}则博弈方以概率分布Pi=(Pi……Pik)随机在k个可选策略中选的的策略称为一个混合策略纳什均衡。
2、子博弈精炼纳什均衡对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。
子博弈精练纳什均衡所要求的是参与人应该是序惯理性的。
对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。
3、完全信息动态博弈完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息。
4、不完全信息动态博弈指在动态博弈中,行动有先后次序,博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率,即知道“自然”参与人的不同类型与相应选择之间的关系,但是,参与人并不知道其他的参与人具体属于哪一种类型。
由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。
5、完全信息静态博弈完全信息静态博弈指的是信息对于博弈双方来说是完全公开的情况下,双方在博弈中所决定的决策是同时的或者不同时但在对方做决策前不为对方所知的。
6、囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
精炼贝叶斯均衡
运用子博弈精炼均衡概念的逻辑,将从每一个 信息集开始的博弈的剩余部分称为一个“后续 博弈”(不同于子博弈,因为子博弈必须开始 于单结信息集,并且不能切割信息集), 一个“合理”的均衡要求,给定每一个参与人 有关其他参与人类型的后验信念,参与人的战 略组合在每一个后续博弈上构成贝叶斯均衡。 假定参与人(在所有可能的情况下)根据贝叶斯 法则修正先验信念,并且,每个参与人都假定 其他参与人选择的是均衡战略。
战略空间与支付函数
如果在位者是高成本,两个企业的成本函数相 同,对称库诺特均衡产量下的价格为p=5,每 个企业的利润是3,扣除进入成本2,进入者的 净利润是1; 如果在位者是低成本,两个企业的成本函数不 同,非对称库诺特均衡产量下的价格是p=4, 在位者的利润是5,进入者的利润是1,扣除进 入成本2,进入者的净利润是-1。
精炼贝叶斯均衡
精炼贝叶斯均衡是均衡战略和均衡信念的结 合 , 给 定 信 念 p = ( p1 , … , pn ) , 战 略 组 合
s*=(s*1, …, s*n)是最优的;给定战略s*=(s*1, …, ) s*=(s* s*n),信念p=(p1,…,pn)是使用贝叶斯法则从 均衡战略和所观测到的行动得到的பைடு நூலகம் 在精炼贝叶斯均衡中,后验概率依赖于均衡战 略,均衡战略依赖于后验概率,如果我们不知 道先行动者如何选择,我们就不可能知道后行 动者应该如何选择,必须使用前向法进行贝叶 斯修正。
不完全信息动态博弈 -市场进入阻挠
一个单阶段非最优价格会减少现期利润,但如 果它能阻止进入者进入,从而使在位者在第2 阶段得到垄断利润,而不是库诺特均衡利润, 如果垄断利润与库诺特均衡利润之间的差距足 够大,如果在位者有足够的耐心,选择一个单 阶段非最优价格可能是最优的。 在均衡情况下,在位者的价格选择不仅与其成 本函数有关,而且与进入者的后验概率有关; 不论先验概率µ为多少,单阶段最优垄断价格 不构成一个均衡。
精炼贝叶斯均衡
pi(θ-i|ah-i)是在观测到ah-i的情况下参与人i 认为其他n-1个参与人属于类型θ-i的后验 概率,pi 是所有后验概率的集合(即pi 包 括了参与人i在每一个信息集h上的后验概 率); ui(si, s-i, θi)是i的效用函数。 那么,精炼贝叶斯均衡可以定义如下:
精炼贝叶斯均衡
贝叶斯法则
我们用Prob(θk|ah)代表这个后验概率,即给定 ah的情况下,i属于类型θk的概率。根据条件概 率或乘积概率公式, Prob(θk,ah)≡ p(ah|θk)p(θk) ≡ Prob(θk|ah)Prob(ah) 也就是说,i属于θk并选择ah的联合概率,等于 i属于θk的先验概率乘以θk类型的参与人选择ah 的概率,或等于i选择ah的总概率乘以给定ah情 况下i属于θk的后验概率。
精炼贝叶斯纳什均衡
先行动者预测到自己的行动将被后行动者所利 用,就会设法选择传递对自己最有利的信息, 避免传递对自己不利的信息。因此,博弈过程 不仅是参与人选择行动的过程,而且是参与人 不断修正信念的过程。 精炼贝叶斯均衡要求,给定有关其他参与人类 型的信念,参与人的战略在每一个信息集开始 的“后续博弈”上构成贝叶斯均衡;并且,在 所有可能的情况下,参与人使用贝叶斯法则修 正有关其他参与人类型的信念。
不完全信息动态博弈
在完全信息动态博弈情况下,如果在位者是高 成本,进入者在第2阶段选择进入,如果在位 者是低成本,进入者选择不进入;在位者第1 阶段选择单阶段最优垄断价格。 在不完全信息动态博弈情况下,在博弈进入第 在不完全信息动态博弈情况下 2阶段后,企业的行动选择是一个简单的静态 博弈问题,进入者在第2阶段是否进入依赖于 它对在位者成本函数的判断,当且仅当进入者 认为在位者是高成本的概率大于1/2时,进入 者才会选择进入。
贝叶斯法则
假定i属于类型θk 的先验概率是p(θk)≥0,并且 ΣKp(θk)=1;给定i属于θk,i选择ah的条件概率 为p(ah|θ k),并且Σ Hp(ah|θ k)=1。那么,i选择 ah的边缘概率(全概率)是 Prob(ah)= ΣKp(ah|θk)p(θk) 即参与人i选择行动ah的总概率是每一种类型的 i选择ah的条件概率p(ah|θk)的加权平均,权数 是他属于每种类型的先验概率p(θk)。 现在的问题是:假如我们观测到i选择了ah,i 属于类型θk的后验概率是多少?
精 炼 贝 叶 斯 均 衡 是 一 个 战 略 组 合 , s*( θ )= (s*1(θ 1 ),…,s*n(θ n))和一个后验概率组合 p=(p1,…,pn),满足: (P) 对于所有的参与人i,在每一个信息集h, s*i(θi)∈ argmax Σ pi(θ-i|ah-i)ui(si, s*-i, θi) θ-i si (B) pi(θ -i|ah-i )是使用贝叶斯法则从先验概率 pi(θ-i|θi)、观测到的ah-i和最优战略s*-i(·)得到的 (在可能的情况下)。
战略空间与支付函数
假定进入者只有一个类型:进入成本为2,如 果进入的话,生产成本函数与高成本的在位者 的成本函数相同。 在t=1,在进入者决定是否进入之前,在位者 要决定该时期的价格(或生产量),假定只有三 种可能的价格选择p=4,p=5或p=6。 如果在位者是高成本,对应三种价格选择的利 润分别是:2,6或7;如果在位者是低成本,对 应的利润分别是:6,9或8。
t=1 (2,0) t=2 (3,1)
(2,0) (6,0) (7,0) (3,1)
(6,0) (7,0) (7,0) (6,0) (6,0) (9,0) (9,0) (8,0) (8,0) (7,0) (3,1) (7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
不完全信息动态博弈 -市场进入阻挠
预测到选择p=6会招致进入者进入,即使高成 本的在位者也可能不会选择p=6,尽管p=6是单 阶段的最优垄断价格。 问题的核心是,在位者必须考虑价格选择的信 息效应,不同的价格影响进入者的后验概率, 从而影响进入者的进入决策。 在静态贝叶斯均衡中,参与人的信念是事前给 定的,贝叶斯均衡概念没有规定参与人如何修 正自己的信念,不能用来分析不完全信息动态 博弈的均衡及结果。
精炼贝叶斯均衡
(B)对应的是贝叶斯法则的运用。如果参与人 是多次行动的,修正概率涉及贝叶斯法则的重 复运用。因为战略是一个行动规则,它本身是 不可观测的,参与人i只能根据观测到的行动 组合a-i修正概率,但他假定所观测到的行动是 最优战略s*-i规定的行动。 限制条件“在可能的情况下”来自这样的事实 ,如果a-i 不是均衡战略下的行动,观测到的a-i 是一个零概率事件,此时,贝叶斯法则对后验 概 率 没 有 定 义 , 任 何 的 后 验 概 率 pi( θ -i|ai )∈[0,1]都是允许的,只要它与均衡战略相容 。
战略空间与支付函数
高成本在位者的单阶段最优垄断价格是P=6, 低成本时的单阶段最优垄断价格是P=5(最优垄 断价格总是边际成本的增函数)。 在t=2时期,如果进入者不进入,在位者仍然 是一个垄断者,不同价格选择下的利润水平与 第一阶段相同。 在t=2,如果进入者已经进入,在位者的成本 函数变成共同知识;
市场进入阻挠动态博弈
假定有两个时期,t = 1,2。在t=1时期,市场 上有一个垄断企业(在位者),一个潜在的进入 者考虑是否进入; 如果进入者进入,在t=2时期,两个企业进行库 诺特搏弈,否则,在位者仍然是一个垄断者。 假定在位者有两个可能的类型,高成本或低成 本,进入者在博弈开始时只知道在位者是高成 本的概率是µ,低成本的概率是l-µ,这个概率 分布称为进入者的先验信念。
贝叶斯法则
因此,Prob(θk|ah)≡ p(ah|θk)p(θk)/Prob(ah) ≡ p(ah|θk)p(θk)/ ΣKp(ah|θk)p(θk) 这就是贝叶斯法则 贝叶斯法则。精炼贝叶斯均衡假定参与人是根 贝叶斯法则 据贝叶斯法则修正先验概率的。 贝叶斯法则要求Prob(ah)>0即参与人i必须以正的概率 选择ah,否则,后验概率没有定义。 如果Prob(ah)=0,我们允许Prob(θk|ah)在[0,1]区间取 任何值,只要所取的值与均衡战略相容,即均衡仍然 成立。 在动态博弈中,Prob(ah)=0对应的是非均衡路径上的 信息集。
4.14.1-2 贝叶斯法则
在日常生话中,在任何一个时点上,我们对某 种不确定性事件发生的可能性有一个判断。然 后,我们会根据新的信息来修正这个判断。 统计学上,修正之前的判断称为“先验概率” ,修正之后的判断称为“后验概率"。 贝叶斯法则正是人们根据新的信息从先验概率 得到后验概率的唯一合理方法。 在不完全信息博弈中,我们假定参与人的类型 是独立分布的,参与人i有K个可能的类型,有 H个可能的行动。用θk和ah分别表示一个参与人 的一种特定的类型和一个特定的行动。
精炼贝叶斯均衡
精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼均 衡和贝叶斯推断的结合。它要求: (1)在每一个信息集上,决策者必须有一个定 义在属于该信息集的所有决策结上的一个概率 分布(信念); (2)给定该信息集上的概率分布和其他参与人 的后续战略,参与人的行动必须是最优的; (3)每一个参与人根据贝叶斯法则和均衡战略 修正先验概率。
博弈论
第4章 不完全信息动态博弈 精炼贝叶斯均衡
内容提要
精炼贝叶斯纳什均衡 精炼贝叶斯均衡的再精炼 序贯均衡与颤抖手均衡 适度均衡与稳定均衡 不完全信息重复博弈与声誉模型
4.1 精炼贝叶斯纳什均衡
不完全信息动态博弈
在不完全信息动态博弈中,“自然”首先选择 参与人的类型,参与人自已知道,其他参与人 不知道; 在自然选择之后,参与人开始行动, 在自然选择之后 , 参与人开始行动 , 参与人的 行动有先有后,后行动者能观测到先行动者的 行动有先有后, 行动,但不能观测到先行动者的类型; 行动,但不能观测到先行动者的类型; 但是,因为参与人的行动是类型依存 类型依存的,每个 类型依存 参与人的行动都传递着有关自己类型的某种信 息,后行动者可以通过观察先行动者所选择的 行动来推断其类型或修正对其类型的先验信念概率分布,然后选择自己的最优行动。