信息经济学(博弈论与信息经济学)讲义11不完全信息动态博弈-.

合集下载

博弈论第8次课——不完全信息动态博弈共59页PPT

博弈论第8次课——不完全信息动态博弈共59页PPT
44、卓越的人一大优点是:在不利与艰 难的遭遇里百折不饶。——贝多芬
45、自己的饭量自己知道。——苏联
41、学问是异常珍贵的东西,从任何源泉吸 收都不可耻。——阿卜·日·法拉兹
42、只有在人群中间,才能认识自 己。——德国
43、重复别人所说的话,只需要教育; 而要挑战别人所说的话,则需要头脑。—— 玛丽·佩蒂博恩·普尔
博弈论第8次课——不完全信息动态博 弈
16、人民应该为法律而战斗,就像为 了城墙 而战斗 一样。 ——赫 拉克利 特 17、人类对于不公正的行为加以指责 ,并非 因为他 们愿意 做出这 种行为 ,而是 惟恐自 己会成 为这种 行为的 牺牲者 。—— 柏拉图 18、制定法律法令,就是为、法律是社会的习惯和思想的结晶 。—— 托·伍·威尔逊 20、人们嘴上挂着的法律,其真实含 义是财 富。— —爱献 生

第三章 博弈论与信息经济学 《信息经济学》PPT课件

第三章 博弈论与信息经济学 《信息经济学》PPT课件
特别指出有关博弈得益的知识,是因为博弈的行动或战略的选择都是以参与人
的得益为依据的。
“共同知识”是与信息有关的一个重要概念,是指“所有参与人知道,所有
参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道……” 的知识,是一个群体之间的人们对某个事实“知道”的关系。共同知识”是博弈论 中一个非常强的假设。博弈论通常均假设“参与人是理性的”,“有关博弈的知识” 对所有参与人是共同知识。
信息经济学
27
2024/12/26
3.2 博弈均衡理论
3.2.1 完全信息静态博弈:纳什均衡
例四 斗鸡博弈(chicken game)
这个博弈里也有两个纳什均衡:如果一方进,另一方的最优战略就是退。两人都进或都退都 不是纳什均衡。 斗鸡博弈的一个重要问题是:究竟哪一方退下来,因为退下来虽比两败俱伤好,总归是一件 丢面子的事情。若每一方都寄希望于对方退下阵来,两败俱伤的结局也可能出现。另外,在 混合战略纳什均衡情况下,两败俱伤的事也会出现。
15
2024/12/26
3.1 博弈论的基础知识
3.1.3 博弈的分类 (5)根据各博弈主体选择和行动的先后顺序,博弈可以分为静态博弈和动态博 弈以及重复博弈
静态博弈是指博弈中博弈主体同时行动或虽非同时行动但后行动者并不知道前行 动者采取了什么具体行动的博弈;
动态博弈是指博弈主体的行动有先后顺序,且后行动者能够观察到先行动者所选 择的行动;
博弈论与信息经济
3.1 博弈论的基础知识 3.2 博弈24/12/26
3.1 博弈论的基础知识
“博弈论”译自英文Game Theory。博弈论直译就是“游戏理论”。
游戏是大家非常熟悉的活动,有如下特征: 一般均有两个及两个以上的参与人;都有一定的规则; 游戏总有一个结果;战略的不同选择对应不同的游戏结果。

第六章 不完全信息动态博弈及应用 《博弈论与经济》 PPT课件

第六章  不完全信息动态博弈及应用  《博弈论与经济》 PPT课件

处于均衡路径之外,但推断 p 0 与可能的策略组合( L, L')相矛盾。
▪ 而{( D, L, R'), p 1}满足要求1-4。 ▪ 它满足要求1与3是显然的,现考虑要求2。 ▪ t 3 ,参与人3在I31上选择 L' ,期望支付为2,选择R ',期望支付为3,
故选 R ' ;
▪ t 2 ,参与人2在I21 上选择 L ,期望支付为3,选择 R ,支付为1,故 选 L;
s1*
(1 , 3
2 3
),
s2*
(3 4
,
1) 4

这里不关心 s3*。
▪ 按此均衡,该博弈进入信息集 I31的概率为
123 5 3 34 6
。故 I31 是处
于均衡路径上的信息集。当博弈进入信息集 I31 时,参与人3对于 I31
左节点的推断应为 1/ 3 2 ,右节点的推断为 1/ 2 3 。
后验概率 p( m) 。
▪ 信号要求1表明了信号发送者所发送的信号将会影响信号接收者对于信号发送 者类型的推断。
▪ 信号要求2R 对于信号mM与推断 p( m) ,信号接收者采取行 a* s2*(m) , 最大化他的期望支付,即
▪ a* arg max u2 (m, a; ) p( m)
aA
▪ ( a *为优化问题 max u2(m, a; ) p( m) 的解)。 aA
▪ A {a1, a2 ,, aH } 表示参与人2的行动空间。
▪ (3)对于给定的类型 ,信号mM ,行动 a A ,参与人i获得支
付 ui (m, a; ) , i 1,2 。 ▪ 在信号传递博弈中,信号发送者的策略 s1 是 到 M 上的映

博弈论与信息经济学GameTheoryandInformationEconomics课件

博弈论与信息经济学GameTheoryandInformationEconomics课件
经济学家提炼出信息不对称的概念,挖 出一批“柠檬市场”,并解剖的是一大 贡献;
而提出改造世界的方案,设计出各种在 信息不对称情况下保障市场有效运转的 机制是另一大贡献,甚至认为是更大的 贡献。
一 博弈论与信息经济学
博弈论
给定信息结构,求均 衡结果 均衡理论 方法论导向 实证的
信息经济学
给定信息结构,求契 约安排 契约设计理论 问题导向 规范的
模型
隐藏行动的道德 风险
隐藏信息的道德 风险
逆向选择风险
信号传递和信息 甄别
委托人
地主 股东 住户 公民 社会 雇主 股东 原告/被告 雇主 保险公司
雇主 买方投资
代理人
佃农 经理 房东 政府官员 犯罪 雇员 经理 代理律师 雇员 投保人
工人 卖方
行动、类型或信号
耕作努力 工作努力 房屋修缮 廉洁或贪污 偷盗的次数 任务的难易/工作努力 市场需求/投资决策 赢的概率/办案努力 工作技能 感染爱滋病病毒
险模型

非对称发生在事前(签约前),逆向选择模型;

非对称发生在事后(签约后),道德风险模型。
研究不可观测行动的模型称为隐藏行动模型;
研究不可观测信息的模型称为隐藏信息(或知识)模型
隐藏行动的道德风险
签约时信息是对称的

接受
选择行动
提供合同
努力或不 自然
努力
代理人

委托人
代理人 不接受
某些可 观测的 结果
作为博弈者,最佳策略是最大限度地利 用游戏规则,最大化自己的利益;
作为社会最佳策略,是通过规则使社会 整体福利增加。
第六章 委托-代理理论(I)
一 博弈论与信息经济学 二 信息经济学的分类 三 委托-代理理论的分析思路和框架 四 对称信息下的最优合同

博弈论基础(不完全信息博弈)

博弈论基础(不完全信息博弈)


不完全信息动态博弈 3、举例:市场进入博弈 举例:
炸鸡翅的价格: 炸鸡翅的价格: 1元、3元、5元 元 元 元





不完全信息动态博弈
(1)进入者是否进入取决于对在位者类型的判断 ) (2)进入者将依据在位者的价格选择而修正对在位者类型的判 ) 断 (3)在位者需要考虑价格选择的信息效应,所以,在位者选择 )在位者需要考虑价格选择的信息效应,所以, 什么价格不仅与自身的成本函数有关, 什么价格不仅与自身的成本函数有关,而且与进入者的先 验概率及条件概率有关。 验概率及条件概率有关。 (4)若高成本的先验概率小于 ,则出现混同均衡:在位者不 )若高成本的先验概率小于1/5,则出现混同均衡: 论成本高低,都选择中等价格,进入者只有在观测到高价 论成本高低,都选择中等价格, 格时才选择进入 (5)若高成本的先验概率大于 ,则出现分离均衡:在位者在 )若高成本的先验概率大于1/5,则出现分离均衡: 低成本时,选择低价格,在高成本时,选择高价格, 低成本时,选择低价格,在高成本时,选择高价格,进入 者观测到低价格时选择不进入, 者观测到低价格时选择不进入,观测到中价格或高价格时 才选择进入。( 。(低成本在位者通过低价格显示自己是低成 才选择进入。(低成本在位者通过低价格显示自己是低成 此乃“认证费” 本,此乃“认证费”)
Prob(GT)=P(GT/GP)P(GP)+P(GT/BP)P(BP) ( ) ( ) ( ) ( ) ( )
(4)一个人做了好事是好人的概率
Prob(GP/GT)=P(GT/GP)P(GP)/ Prob(GT) ( ) ( ) ( ) ( )





不完全信息动态博弈

博弈论第8次课——不完全信息动态博弈

博弈论第8次课——不完全信息动态博弈

市场进入博弈
博弈两个局中人,一个“在位者”,一 个“进入者”。考虑t=1,2两个时期,在 t=1,市场上有一个垄断企业( “在位 者” )在生产,一个潜在的进入者是否进 入;如果“进入者”进入,两个企业进行 Cournot博弈,否则,“在位者”依然是 一垄断者。
市场进入博弈
假设“在位者”有两种类型:高成本、低成 本, “在位者”存在“私人信息”;进入者只 知道“在位者”是高成本的概率为 ,低成本 的概率为 。 1
战略组合(B,L,U)是一NE,没有参与 人愿意单独偏离这一结果 这一组战略及推断也满足要 求l到3(要求3自动满足)。
1 B (2,0,0) F 2
3的信息集不在均衡路径上。 精炼贝叶斯均衡要求:3在非均 衡路径的信息集上的“判断” 也必须与2的均衡战略L吻合。 1-p
L
3
p
R D
(3,3,3) U (0,1,2)
(一) 精炼贝叶斯均衡
李四预测到这一点,即使生性懦弱,也会强迫自己 吃辣椒,以传达对自己有利的信息。 两种结果: ——懦弱李四不吃辣椒,强悍李四吃辣椒且吃的足 够多,使得懦弱李四不敢模仿,张三能够区分李 四类型并选择是否欺负李四。
——两类李四都吃同样多辣椒,张三不能从李四吃 辣椒行为中推出自己的信息,维持对李四的类型 的先验信念{0.8,0.2}
(三) 信号博弈
先行动者可直接告诉后行动者自己类型,但后行动者不会相 信。如果要让后行动者相信,必须做出一种努力(使自己 付出成本),该成本是其他类型的先行动者不能模仿的 ——称成本支付为一种信号。通过该信号,先行动者能够告 诉后行动者自己的真实类型 例,企业金融市场融资,但投资者对真实赢利能力不了解。 真正高赢利能力的企业可以通过向投资者支付较高的权 益份额来区分自己和低赢利能力的企业,从而让投资者识 别自己的真实类型而投资。 另一方面,低赢利能力企业对自己真实赢利能力是清楚 的,不敢模仿高赢利能力企业,只能承诺低权益份额,投 资者不会投资。

信息经济学第三章博弈论

信息经济学第三章博弈论
信息经济学第三章博 弈论
目录
• 博弈论基本概念 • 完全信息静态博弈 • 完全信息动态博弈 • 不完全信息静态博弈 • 不完全信息动态博弈 • 博弈论在信息经济学中应用
01
博弈论基本概念
博弈论定义与特点
博弈论是研究决策过程中参与者之间 相互作用和影响的理论。
博弈论的特点包括:参与者之间的相 互影响、策略的选择和收益的分配。
混合策略在静态博弈中应用
混合策略定义
在静态博弈中,参与人选择以一定的概率分布随机选择不同策略的 行为。
应用场景
当参与人无法确定对手的策略选择时,采用混合策略可以增加对手 的不确定性,从而提高自身的期望收益。
示例
在石头、剪刀、布游戏中,每个参与人随机选择出拳的策略就是一 种混合策略的应用。
信号传递机制在静态博弈中作用
如环保税、碳交易制度等。
案例:拍卖、招标等经济活动中的博弈论应用
拍卖中的博弈论
拍卖是一种典型的博弈论应用场景,通过竞价机制实现资源的有效配 置。常见的拍卖方式有英式拍卖、荷兰式拍卖、密封拍卖等。
招标中的博弈论
招标是一种采购方式,通过竞争机制引导供应商提供优质的商品和服务。招标 过程中需要考虑价格、质量、信誉等多个因素,博弈论可以帮助制定有效的招 标策略。
机制设计原理及其在信息经济学中应用
机制设计原理
01
通过设计合理的规则和制度,引导参与者的行为,实现资源的
有效配置和社会福利最大化。
信息经济学中的应用
02
在信息不对称的情况下,通过机制设计实现信息的有效传递和
资源的优化配置,如价格机制、竞争机制等。
激励机制设计
03
通过设计合理的激励机制,引导参与者的行为符合社会目标,

不完全信息动态博弈

不完全信息动态博弈

4 不完全信息动态博弈4.1 精炼贝叶斯均衡概述不完全信息动态博弈就其基本要素来看是不完全信息与博弈的动态性质的一种综合。

在处理不完全信息要素时,通过将某些参与人“类型”的不确定性作为信息不完全性的一种表征,这种方法将继续得以采用,即博弈中参与人面临的信息不完全性(无论它是指何种信息)将完全由某些参与人的“类型”的不确定性加以刻画。

同时,作为动态博弈,“序贯理性”的思想将一直得到贯彻。

我们在不完全信息动态博弈中将信息不完全程度削减到零,则不完全信息动态博弈就自然应退化成一种完全信息动态博弈,其相应的精炼均衡概念就由精炼贝叶斯回到子博弈精炼均衡。

从这种意义上来看,不完全信息动态博弈的精炼均衡概念是子博弈精炼均衡概念的一种推广,正如不完全信息动态博弈应被视作完全信息动态博弈的一种推广一样。

例简单的非完全信息动态博弈u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2参与人1的类型t为个人信息。

参与人2 不知道t ,但知道t 的概率分布。

博弈的时序:(1)参与人1选择行动a 1 ∈A 1;(2)参与人2观察a 1,选择a 2 ∈A 2博弈的收益: u 1 (a 1, a 2, t ), u 2 (a 1, a 2, t )精炼贝叶斯均衡博弈的纳什均衡是一种“僵持”状态的战略组合,当所有的参与人都选择该战略组合中给出的相应战略时,任何一个参与人都不会有单方面偏离这一选择的动机。

作为动态博弈,一个战略是参与人在其可能进行行动选择的所有信息集上将作何选择的一整套规定或计划,而作为不完全信息博弈,这种规定或计划还是“类型依存”的,即不同类型的参与人将选择不同的战略规定。

因此,一个不完全信息动态博弈的纳什均衡将是指这样的一种类型依存性的战略组合(或战略组合的族),当给定其他参与人的战略时(其他参与人的战略是类型依存的,所以,说给定其他参与人的战略即指给定其他参与人的战略与类型的依存关系),任一参与人在其任何类型下由该组合给出的类型依存战略是其最优的。

第四章不完全信息动态博弈

第四章不完全信息动态博弈
对N的选择不知道任何信息,因此,他只知道有假设的先验概率
为 P1(11 | 2 ) P1(12 | 2 ) 0.5 ,局中人2的类型是对称的。
0.5
1 (11 )
N
0.5 1 (12 )
L
R
L
2
h 2
a
ba
ba
R
f ba
首先给出局中人1的类型依
存战略S1* (1) :S1* (11) R , S1* (12 ) L 。 试找出与此战略相对应的
用 表示i,i 1, , n
i 。
n 1
当参与人 i
Pi (的i类|型i ),是i 类1,型, n 时,其他i H i 的i,类i 型1是, 类, n
型组合 的条件概率 Pi (i |i ), i 1,, n,其中

的私人信息,条件概率
是公共信息。每个参与人
选择自己的战略,Si当(然i )这, i 种战1,略是, n类型依赖的,即战略是类型空间上

如果参与人观察到行动 ah ,参与人会利用这一信息,对先验信息 (类型分布)进行修正,实际就是观测到 ah 和 k 的后验分布:
prob k ah
p(ah k ) p(k )
n
p(ah k )p(k )
k 1
博弈时序与信息效应
设 1,2 的先验分布是 1, 2 ;不同类型下,行动(事件)发生的
和一个后验概率组合 p p1, p2, , pn ,它满足:
(1)
Si* (i ) arg max Pi (i
|
i
)ui
(
SБайду номын сангаас
i
(i
),
Si
(i

信息经济学(博弈论与信息经济学)讲义11不完全信息动态博弈-.

信息经济学(博弈论与信息经济学)讲义11不完全信息动态博弈-.

1 1 / 2 1 Pr ob{GP GT } 1 1 / 2 1 1 / 2 2
3、介于上述两种情况之间:好人肯定会干,但坏人可能会干也可能不 会干:p(GT|GP)=1/2 p(GT|BP)=1/2
1 1 / 2 2 Pr ob{GP GT } 1 1 / 2 1 / 2 1 / 2 3
在均衡情况下,在位者究竟选择什么价格,不仅与成 本函数有关,而且与进入者的先验概率x有关。而不关 x为多少,单阶段最优垄断价格不构成均衡。

基本思路-不完全信息动态博弈

在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡 该概念没有规定参与人如何修正自己的信念。但是,如果 进入者可以任意修订自己有关在位者成本函数的信念,上 述不完全信息动态博弈可以有任意均衡。 如假定x<1/2,下列战略组合是一个贝叶斯均衡:不论在 位者选择什么价格,进入者总认为在位者是低成本的概率 为x*<1/2,总是选择不进入;搞成本在位者选择p=6,低成 本在位者选择p=5。 但显然这个均衡是不合理的,因为它包含了一个不可置信 威胁:进入者不会修正对在位者成本函数的信念。
p (a h k ) p ( k ) P r ob{a }
h
P r ob{ k a h }

p (a h k ) p ( k )
h j j p ( a ) p ( ) j 1 k
贝叶斯法则
人:好人(GP),坏人(BP) 事:好事(GT),坏事(BP) 一个好人干好事的概率等于他是好人的概率p(GP)乘以好 人干好事的概率p(GT|GP),加上他是坏人的概率p(BP) 乘以坏人干好事的概率p(GT|BP): Prob{GT}= p(GT|GP)* p(GP)+ p(GT|BP)* p(GT|BP) 假定观测到一个人干了一件好事,那么这个人的是好人的 后验概率是:

讲义6不完全信息动态博弈

讲义6不完全信息动态博弈
与完全信息博弈相比,不完全信息动 态博弈更接近现实生活中的决策环境 ,因为人们往往无法完全掌握其他参 与者的信息。
不完全信息动态博弈的特点
信息不完全
每个参与者在博弈过程中只能观 察到部分信息,无法完全掌握其 他参与者的类型、偏好、策略等 信息。
动态性
不完全信息动态博弈是一个动态 的过程,每个参与者需要根据其 他参与者的行为和反馈来不断调 整自己的策略和信念。
重复性
不完全信息动态博弈往往是一个 重复博弈的过程,参与者在每次 博弈中都需要考虑长期利益和短 期利益的平衡。
不完全信息动态博弈的应用场景
商业竞争
在商业竞争中,企业之间往往存在着信息不对称的情况,不完全信息动态博弈可以用来分析企业之间的竞争策略和合 作模式。
政治选举
在政治选举中,候选人和选民之间存在着信息不对称的情况,不完全信息动态博弈可以用来分析选举结果和选民的行 为模式。
讲义6不完全信息动态博弈
汇报人:文小库 2024-01-06
目录
• 不完全信息动态博弈概述 • 不完全信息动态博弈的基本理
论 • 不完全信息动态博弈的策略与
实例
目录
• 不完全信息动态博弈的扩展与全信息动态博弈概述
不完全信息动态博弈的定义
不完全信息动态博弈是指在博弈过程 中,参与人对其他参与人的类型、偏 好、策略等信息不完全了解,需要不 断通过观察和推断来更新自己的信念 。
金融投资
在金融投资中,投资者和被投资对象之间存在着信息不对称的情况,不完全信息动态博弈可以用来分析 投资者的投资策略和风险控制。
02
不完全信息动态博弈的基本理 论

信息经济学(博弈论与信息经济学)讲义12不完全信息动态博弈-汇总

信息经济学(博弈论与信息经济学)讲义12不完全信息动态博弈-汇总

精练贝叶斯均衡是贝叶斯均衡、子博弈精练均 衡和贝叶斯推断的结合。它要求:
1、在每个信息集上,决策者必须有一个定义在属于该 信息集的所有决策结上的一个概率分布(信念); 2、给定该信息集上的概率分布和其他参与人的后续战 略,参与人的行动必须是最优的; 3、每一个参与人根据贝叶斯法则和均衡战略修正后验 概率。


二 信号传递博弈及其应用举例
三 博弈论概念简要总结
完全信息静态博弈-纳什均衡
占优均衡
请各对每种均 衡举个例子
DSE 重复剔除占优均衡
IEDE 纯战略纳什均衡 PNE 混合战略纳什均衡
MNE
占优战略均衡
案例1-囚徒困境
囚徒A
坦白
囚徒 B
抵赖
坦白
-8,-8Leabharlann 0,-10抵赖-10,0
-1,-1
抵赖是A的严 格劣战略
完全信息动态搏弈 -子博弈精炼纳什均衡

强盗分金
U
1
子博弈精练纳什均衡 ((U,U’),L). U’和L分别是参与人1和 参与人2在非均衡路径上的 选择。 逆向归纳法求解子博弈 精练纳什均衡的过程,实质 上是重复剔除劣战略的过程: 从最后一个决策结依次剔除 每个子博弈的劣战略,最后 生存下来的战略构成精练纳 什均衡。
R3
4,0
3,5
0,4
3,5
5,3
6,6
(R3,C3)是纳什均衡
混合战略纳什均衡

社会福利博弈
救济 政府
流浪汉
寻找工作 2 3, 1 不救济 -1, 0, -1, 0 流浪 3
设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的战略都是给定对方混合战略时的最优战略
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。




第五章 不完全信息动态博弈 - 精 练贝叶斯纳什均衡


一 精练贝叶斯纳什均衡
基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡


二 信号传递博弈及其应用举例
三 博弈论概念简要总结
贝叶斯法则

在日常生活中,当面临不确定时,我们对某事 件发生的可能性有一个判断,然后,会根据新 的信息来修正这个判断。 统计学上,修正之前的判断称为“先验概率”
Pr ob{GP GT}
p(GT GP) p(GP) Pr ob{GT}
贝叶斯法则
假定我们观测到他干了一件坏事,我们相信,好人绝对不会干 坏事,,那么可以肯定他绝对不是一个好人。 0 1 / 2 Pr ob{GP BT} 0 0 1 / 2 p 1 / 2 假定我们原来认为他是个好人,大突然发现他干了一件好事, 我们如何看待呢? p 1 / 2 Pr ob{BP GT} 1 q 0 p 1

问题的核心是:不同的价格如何影响进入者的后验 概率从而影响进入者的进入决策。
基本思路-不完全信息动态博弈

一个非单阶段最优价格会减少现期利润,但如果它能 阻止进入者进入,从而使在位者在第二阶段得到的是 垄断利润而不是库诺特均衡利润,如果垄断利润与库 诺特均衡利润的差距足够大,如果在位者有足够的信 心选择一个非单阶段最优价格可能是最优的。
进入者
进入 不进入 进入 不进入 进入
不进入
不进入 进入
不进入
进入
不进入
进入
(2,0) (2,0)
(6,0)
(6,0)
(7,0)
(7,0)
(6,0)
(6,0)
(9,0)
ቤተ መጻሕፍቲ ባይዱ
(9,0) (8,0)
(8,0)
第一阶段 第二阶段
(3,1) (7,0) (3,1)
高成本在位者不 会选择p=6
(7,0)
(3,1) (7,0)
价格 在位者高成本时的利润 P=4 2 P=5 6 P=6 7
在位者低成本时的利润
6
9
8
基本思路-不完全信息动态博弈
进入者只有一种类型:进入成本为2,如果进入,生产成本 函数与在位者高成本函数相同。
T=2,如果进入者已进入,在位者成本函数为共同知识,若在 位者为高成本,企业企业成本函数相同,对称库诺特均衡产量下 的价格p=5时,每个企业利润为3,扣除进入成本2,进入者利润为 1。若在位者为低成本,两个企业成本函数不同,非对称库诺特均 衡产量下的价格p=4,在位者利润是5,进入者成本为1,扣除进入 成本2,其利润为-1。 价格 P=4 P=5 P=6
价格 P=4 P=5 P=6


在位者高成本时的利润
在位者低成本时的利润
2
6
6
9
7
8
进入者只有一种类型: 进入成本为2,如果进入,生 产成本函数与在位者高成本函 数相同。
N 低 [1-x]
[x]

在位者 P=4 P=5 P=6 P=4
T=2,如果进入者已进入,在 位者成本函数为共同知识,若 在位者为高成本,p=5时,每 个企业利润为3,扣除进入成 本2,进入者利润为1。若在位 者为低成本,p=4,在位者利润 是5,进入者成本为1,扣除进 入成本2,其利润为-1。 在位者 P=5 P=6
基本思路-不完全信息动态博弈

精练贝叶斯均衡是贝叶斯均衡、子博弈精练均 衡和贝叶斯推断的结合。它要求:
1、在每个信息集上,决策者必须有一个定义 在属于该信息集的所有决策结上的一个概率分 布(信念); 2、给定该信息集上的概率分布和其他参与人 的后续战略,参与人的行动必须是最优的; 3、每一个参与人根据贝叶斯法则和均衡战略 修正后验概率。
信息经济学
(Information Economics)
主讲人:张成科 博士 广东工业大学经济管理学院
zhangck@
主要内容简介
第二篇 信息经济学

第六章 委托-代理理论(I) 第七章 第八章 委托-代理理论(II) 逆向选择与信号传递
第五章 不完全信息动态博弈 - 精 练贝叶斯纳什均衡
1 n 1 n * * 给定战略s * ( s1 , , sn ), 信念~ p (~ p1 ,, ~ pn )
修正后的判断称为“后验概率”

贝叶斯法则就是人们根据新的信息从先验概率 得到后验概率的基本方法。
贝叶斯法则


假定参与人的类型是独立分布的,参与人i有K个类型, 有H个可能的行动,өk和ah分别代表一个特定的类型和 一个特定的行动。 如果我们观察到i选择了ah,i属于өk的后验概率是多少?
p (a h k ) p ( k ) P r ob{a }
h
P r ob{ k a h }

p (a h k ) p ( k )
h j j p ( a ) p ( ) j 1 k
贝叶斯法则
人:好人(GP),坏人(BP) 事:好事(GT),坏事(BP) 一个好人干好事的概率等于他是好人的概率p(GP)乘以好 人干好事的概率p(GT|GP),加上他是坏人的概率p(BP) 乘以坏人干好事的概率p(GT|BP): Prob{GT}= p(GT|GP)* p(GP)+ p(GT|BP)* p(GT|BP) 假定观测到一个人干了一件好事,那么这个人的是好人的 后验概率是:
在位者高成本时的利润
在位者低成本时的利润 进入者进入
2
6
在位者
6
9
进入者
7
8
在位者高成本p=5
在位者低成本p=4
3
5
1
-1
进入者只有一种类型: 进入成本为2,如果进入,生 产成本函数与在位者高成本函 数相同。
N 低 [1-x]
[x]

在位者 P=4 P=5 P=6 P=4
T=2,如果进入者已进入,在 位者成本函数为共同知识,若 在位者为高成本,p=5时,每 个企业利润为3,扣除进入成 本2,进入者利润为1。若在位 者为低成本,p=4,在位者利润 是5,进入者成本为1,扣除进 入成本2,其利润为-1。 在位者 P=5 P=6
(9,0) (5,-1)
(9,0)
市场进入博弈-2阶段不完全信息动态博弈
基本思路-不完全信息动态博弈

T=2, 企业的行动选择是一个简单的静态博弈决策问题, 但在第一阶段,情况要复杂得多:
进入者是否进入依赖于它对在位者成本函数的判断:给 定在位者是高成本时,进入者进入的净利润是1,低成本 时进入者的利润是-1,当只当进入者认为在位者是高成 本的概率大于1/2时,进入者才选择进入。 但与静态博弈不同的是,在观测到在位者第一阶段的价 格选择后,进入者可以修正对在位者成本函数的先验概 率x,因为在位者的价格可能包含其成本函数的信息。
1 1 / 2 1 Pr ob{GP GT } 1 1 / 2 1 1 / 2 2
3、介于上述两种情况之间:好人肯定会干,但坏人可能会干也可能不 会干:p(GT|GP)=1/2 p(GT|BP)=1/2
1 1 / 2 2 Pr ob{GP GT } 1 1 / 2 1 / 2 1 / 2 3
在均衡情况下,在位者究竟选择什么价格,不仅与成 本函数有关,而且与进入者的先验概率x有关。而不关 x为多少,单阶段最优垄断价格不构成均衡。

基本思路-不完全信息动态博弈

在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡 该概念没有规定参与人如何修正自己的信念。但是,如果 进入者可以任意修订自己有关在位者成本函数的信念,上 述不完全信息动态博弈可以有任意均衡。 如假定x<1/2,下列战略组合是一个贝叶斯均衡:不论在 位者选择什么价格,进入者总认为在位者是低成本的概率 为x*<1/2,总是选择不进入;搞成本在位者选择p=6,低成 本在位者选择p=5。 但显然这个均衡是不合理的,因为它包含了一个不可置信 威胁:进入者不会修正对在位者成本函数的信念。


不完全信息动态博弈过程不仅是参与人选择行动的过程, 而且是参与人不断修正信念的过程。

精练贝叶斯均衡是泽尔腾不完全信息动态博弈子博弈精练 纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。
基本思路-不完全信息动态博弈

成语故事:黔之驴-驴虎博弈
老虎通过不断试探来修正对毛驴的看 法,每一步行动都是给定它的信念下最优 的,毛驴也是如此。最终老虎将毛驴吃掉。
进入者
进入 不进入 进入 不进入 进入
不进入
不进入 进入
不进入
进入
不进入
进入
(2,0) (2,0)
(6,0)
(6,0)
(7,0)
(7,0)
(6,0)
(6,0)
(9,0)
(9,0) (8,0)
(8,0)
第一阶段 第二阶段
(3,1) (7,0) (3,1) (7,0)
(3,1) (7,0) (5,-1) (9,0) (5,-1)

Pr ob{GP GT}
p(GT GP) p(GP) Pr ob{GT}
Pr ob{GP GT}
p(GT GP) p(GP) Pr ob{GT}
贝叶斯法则
假定我们认为这个人是好人的先验概率是1/2,观测到他干了好 事之后如何修正他的先验概率依赖于他干的好事好到什么程度:
1、是一件非常好的好事,坏人绝对不可能干,则p(GT|GP)=1 p (GT|BP)=0 1 1 / 2 Pr ob{GP GT } 1 1 1 / 2 0 1 / 2 2、这是一个非常一般的好事,好人会干,坏人也会干:p(GT|GP)=1 p(GT|BP)=1
相关文档
最新文档