第三章完全且完美信息动态博弈
博弈论 第 三 章 完全信息动态博弈讲解
房地产开发博弈
开发
A hA(1) 不开发
h表示信息集
N hN(1)
需求大
需求小
N hN(2)
需求大
需求小
B hB(1)
开发
不开发
B hB(2)
B hB(3)
开发
不开发 开发 不开发 开发
B hB(4)
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8) (0,0) (0,1) 单 位:百万元
定 义 一 个 展 开 式 博 弈 的 子 博 弈G 由 一 个 决 策 结x 和 所 有 该 决 策 结 的 后继结T(x)( 包 括终点结0 组 成, 它 满 足 下 列 条 件:⑴x 是 一 个 单 点 信 息 结即h(x)={x};⑵对于所有的 x′∈T(x),如果x″∈h(x′),则x″∈T(x)。
(3)
N
1/3
2/3
1
Y1
z1
1
x1
w1
(2,6) (5,6)
2
2
a2 (9,0)
b2 (0,3)
a2 (9,5)
b2 (0,3)
3.3 子 博 弈 与 子 博 弈 完 美
Nash 均衡在原则上适用所有的博弈,但对于预 测 参与人的行为来说,Nash均衡可能并不是 一个 合理的预测, 如房地产博弈:
A
开发
不开 发
A
开发
不开发
B
B
B
B
开发 不开发 开发 不开发 开发 不开发 开发
不开发
有了信息集的概念, 展开式表示也可以用来表 示静态博弈, 如“囚徒的困境 ”博弈可以表 示为:
1
坦白
2
第三章完全且完美信息动态博弈
第三章完全且完美信息动态博弈在动态博弈中,参与者需要根据对手的行为和策略来调整自己的行动,以便达到最佳的结果。
动态博弈可以分为完全信息动态博弈和不完全信息动态博弈。
完全信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,而不完全信息动态博弈则是指参与者不知道其他参与者的策略和收益函数。
在完全信息动态博弈中,参与者可以通过观察对手的行为来推断出对手的策略和收益函数。
这种博弈可以通过逆向归纳法来求解,即从博弈的阶段开始,逐步向前推导出每个阶段的最佳策略。
逆向归纳法是一种有效的求解完全信息动态博弈的方法,它可以帮助参与者找到最佳策略,从而实现最佳的结果。
然而,在现实世界中,完全信息动态博弈并不常见。
大多数博弈都是不完全信息动态博弈,参与者无法知道其他参与者的策略和收益函数。
在这种情况下,参与者需要通过观察对手的行为和策略来推断出对手的类型和收益函数。
这种博弈可以通过贝叶斯纳什均衡来求解,即参与者根据对手的类型和收益函数来选择自己的策略,以达到最佳的结果。
完全且完美信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,并且参与者能够观察到其他参与者的行为和策略。
这种博弈可以通过逆向归纳法和贝叶斯纳什均衡来求解,从而帮助参与者找到最佳策略,实现最佳的结果。
在完全且完美信息动态博弈中,参与者可以通过观察对手的行为和策略来推断出对手的类型和收益函数,从而调整自己的策略,以实现最佳的结果。
在完全且完美信息动态博弈中,参与者之间的互动是基于透明和预知性的。
每个参与者不仅清楚自己的策略选择和可能的收益,同时也了解其他参与者将如何根据这些信息做出反应。
这种透明度使得参与者能够做出更加精确的决策,因为他们能够预测对手的行动并据此调整自己的策略。
这种博弈的一个关键特点是,参与者之间的信息是对称的。
这意味着没有参与者拥有其他参与者所不知道的信息优势。
这种信息对称性使得博弈变得更加公平,因为它消除了信息不对称带来的不确定性。
第三章 完全信息动态博弈
定义:一个扩展式博弈的子博弈 由一个决策结 定义 一个扩展式博弈的子博弈G由一个决策结 一个扩展式博弈的子博弈 x和所有该决策结的后续结 和所有该决策结的后续结T(x)(包括终点结) 和所有该决策结的后续结 (包括终点结) 组成,它满足下列条件: 组成,它满足下列条件: 是一个单结信息集, (1)x是一个单结信息集,即h(x)={x} ) 是一个单结信息集 (2)对于所有的 1∈T(x), )对于所有的x 如果x" 如果 "∈h(x1),那么 "∈T(x) ,那么x"
(一)纯战略均衡
如果对于任意一个参与人i,si*使ui(si,s*-i)取 得极大值,即
s ∈ arg max u( si , s ), ∀i
* i si ∈Si * −i
那么,战略组合s*是扩展式博弈的一个纳什 均衡。
(二)行为战略均衡
1、“行为战略”(behavior strategies)
A 开发 N 大 1/2 B 小 1/2 不开发 N 大 1/2 B 小 1/2 B
不开发 B 不开发 开发 不开发 开发 开发 开发 不开发 (0, 1) (0, 0) (4, 4) (8, 0) (0, 0) (-3, -3) (1, 0) (0, 8) 图2.1 房地产开发博弈
(一)博弈树的构件 1、结(nodes)
同一信息集的表示法:知道自然的选择,但不知道参与人A的选 择
用数学式表述
– H代表所有信息集的集合; – h代表一个特定的信息集,即h∈H; – h(x)表示包含决策结x的信息集,它表示在x点决策 的参与人i不确定他是处在x,还是处在其它 x ’∈h(x)。如果x’∈h(x),那么x∈h(x ’)。 同一信息集满足下列条件 :
3、等价性定理(Kuhn,1953):
3.2完全且完美信息动态博弈
动态博弈的一个中心问题是“可信性”问题。 所谓可信性是指动态博弈中先行为的 参与人是否该相信后行为的参与人会 采取对自己有利的或不利的行为。因为后行 为方将来会采取对先行为方有利的行为相当 于一种“许诺”,而将来会采取对先行为方 不利的行为相当于一种“威胁”,因此我们 可将可信性分为“许诺的可信性”和 “威胁的可信性”
我们以“开金矿博弈”为例来讨论可信性问题
甲要开采一价值4万元的金矿,缺1万元的资金, 向乙借1万元,许诺采到金子后与乙平分。 乙是否借钱给甲呢?
乙最需要关心的就是甲采到金子后是否会履行诺 言跟自己平分,因为万一甲采到金子后不但不跟 乙平分,而且还赖帐或卷款潜逃,则乙连自己的 本钱都收不回来。关键的是要判断的许诺是否可 信!以自身利益最大化原则,甲必然选择不分! 乙清楚甲的行为准则,最好的选择是不借!对乙 来说,甲的许诺是不可信的! 要想使甲的许诺成为可信的,加上第三阶段,让 乙在甲违约时采用法律手段---“打官司”,乙的利 益受到法律保护,甲的许诺是可信的。乙在第一 阶段选择借,甲在第二阶段选择分。
行动有先后顺序,不同的参与人在不同时
点行动,先行动者的选择影响后行动者的 选择空间,后行动者可以观察到先行动者 做了什么选择。 因此,为了做出最优的行动选择,每个参 与人都必须这样思考问题: 如果我如此选择,对方将如何应对?如果 我是他,我将会如何行动?给定他的应对, 什么是我的最优选择?
动态博弈的有效分析概念,除了要符合纳什
均衡的基本要求以外,还必须满足另一个关 键的要求,那就是它(或者它们)必须能够 排除博弈方策略中不可信的行为设定,也就 是各种不可信的威胁和承诺。 只有满足这样要求的均衡概念在动态博弈分 析中才有真正的稳定性,才能对动态博弈作 出有效的分析和预测。
第三章完全且完美信息动态博弈一
3.1.2 动态博弈(DG)的特征
动态博弈的策略及结果
➢ 策略:各博弈方在整个博弈中轮到选择的每个阶段, 针对前面阶段的各种情况做作相应选择和行为的完 整计划。
➢ 例如:“仿冒企业A在第一阶段选择仿冒,如果第 二阶段B制止,第三阶段就不仿冒,否则第三阶段 继续仿冒” “被仿冒企业B,当第一阶段A仿冒时 第二阶段不制止,第三阶段A继续仿冒时第四阶段 制止”
3.1.2 动态博弈(DG)的特征
动态博弈的策略及结果
➢ 策略组合:由不同博弈方的这种计划组成的组合。 各博弈方的策略组合可能会形成一条联结各个阶 段的路径。
➢ 动态博弈的结果:各个博弈方的策略及策略组合、 实现的博弈路径和各博弈方的得益。
3.1.2 动态博弈(DG)的特征
动态博弈中博弈方地位的非对称性
乙
乙 借 不借
(0,4) (0,0)
(c)
乙
借 不借
甲 (0,0)
分
不分
(2,2) (-1,4)
(b)
借
不借
甲 (0,0)
分
不分
(2,2) 打
乙 不打
(-2,0)
(-1,4)
3.3 子博弈完美纳什均衡分析
一个值得关注的地方
➢ 开金矿博弈中,子博弈完美纳什均衡组合包含 第二、三阶段的选择,而实际上博弈不会进行 到第二、第三阶段,这称为“不在均衡路径上 的选择”
缺乏稳定性的根源在于不能排除“不可信”行为设 定,不能解决相机选择引起的可信性问题。所以需 要引入更强的均衡,除了满足纳什均衡,还要排除 不可信设定。
3.2.3逆推归纳法
逆推归纳法(Backwards Induction)
信息经济学第三章博弈论
目录
• 博弈论基本概念 • 完全信息静态博弈 • 完全信息动态博弈 • 不完全信息静态博弈 • 不完全信息动态博弈 • 博弈论在信息经济学中应用
01
博弈论基本概念
博弈论定义与特点
博弈论是研究决策过程中参与者之间 相互作用和影响的理论。
博弈论的特点包括:参与者之间的相 互影响、策略的选择和收益的分配。
混合策略在静态博弈中应用
混合策略定义
在静态博弈中,参与人选择以一定的概率分布随机选择不同策略的 行为。
应用场景
当参与人无法确定对手的策略选择时,采用混合策略可以增加对手 的不确定性,从而提高自身的期望收益。
示例
在石头、剪刀、布游戏中,每个参与人随机选择出拳的策略就是一 种混合策略的应用。
信号传递机制在静态博弈中作用
如环保税、碳交易制度等。
案例:拍卖、招标等经济活动中的博弈论应用
拍卖中的博弈论
拍卖是一种典型的博弈论应用场景,通过竞价机制实现资源的有效配 置。常见的拍卖方式有英式拍卖、荷兰式拍卖、密封拍卖等。
招标中的博弈论
招标是一种采购方式,通过竞争机制引导供应商提供优质的商品和服务。招标 过程中需要考虑价格、质量、信誉等多个因素,博弈论可以帮助制定有效的招 标策略。
机制设计原理及其在信息经济学中应用
机制设计原理
01
通过设计合理的规则和制度,引导参与者的行为,实现资源的
有效配置和社会福利最大化。
信息经济学中的应用
02
在信息不对称的情况下,通过机制设计实现信息的有效传递和
资源的优化配置,如价格机制、竞争机制等。
激励机制设计
03
通过设计合理的激励机制,引导参与者的行为符合社会目标,
第三章 完全且完美信息动态博弈
(1,0) 不分 乙 不打 (0,4)
(-1,0)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
3.2.2 纳什均衡的问题
不投资 博弈中(不投资-不打, 投资 甲 (1,0) 不分) 不分 分 乙 和(投资-打,分) (2,2) 不打 打 都是纳什均衡。 (0,4) (-1,0) 但后者不可信, 法律保障不足的开金矿博弈 不可能实现或 ——分钱打官司都不可信 稳定。为什么会出现这种情 况呢? 乙
3.1.2 动态博弈的基本特点
一、动态博弈的策略 1、完全信息静态博弈的策略和结果(略) 2、动态博弈的策略特点: 各博弈方的选择和行为 (1)行为有先后之分(2)博弈方要多次选择且 每次选择有内在联系,是不能分割的整体。 注:各博弈方在整个博弈中轮到选择的每个阶段, 针对以及由不同博弈方的这种计划构成的组合。 这种计划就是动态博弈的博弈方的策略
3.3.1 子博弈
定义:由一个动态博弈第一阶段以外的 某阶段开始的后续博弈阶段构成 的,有初始信息集和进行博弈所 需要的全部信息,能够自成一个 博弈的原博弈的一部分,称为原 动态博弈的一个“子博弈”。
注: (1)并不是任何博弈都有子 博弈 (2)博弈本身不是子博弈 (3)必须有一个明确 的初始的信息集
子博弈完美纳什均衡能够排除均衡策略中 不可信的威胁和承诺,因此是真正稳定的。 逆推归纳法是求完美信息动态博弈子博弈 完美纳什均衡的基本方法。
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格(Stackelberg) 模型 3.4.2 讨价还价博弈 3.4.3 委托—代理理论 3.4.4委托—代理理论(续)
乙 投资 甲 分 (2,2) 不分 乙
不投资
经济博弈论(第三章)
第三章完全信息动态博弈上一章介绍了完全信息静态博弈,本章在前面的基础上探讨完全信息动态博弈。
现实社会经济活动的决策大多数是有先后顺序的行为而不是同时选择的行为,而且后行者能够看到先行者的决策内容,在先行者的决策结果之后再定夺自己的策略。
这样的经济行为比比皆是,如商业活动中的讨价还价,拍卖活动中的轮流竞价,资本市场上的收购兼并和反收购兼并都是如此。
依次选择与一次性同时选择有很大的差异,因此这种决策问题构成的博弈也是从时间序列上有别于静态博弈的,我们称之为“动态博弈”(Dynamic Games)。
例如下象棋通常需要两个参与人,我们定义为红方和黑方,红方先走,黑方后走,这是一个典型的完全信息动态博弈。
动态博弈由于添加了时间因素,因而更加贴近现实。
根据博弈方是否相互了解得益情况,可分为“完全信息动态博弈”和“不完全信息动态博弈”,根据是否所有博弈方都对自己选择前的博弈过程完全了解,可分为“完美信息动态博弈”和“不完美信息动态博弈”。
在本章中,我们首先对博弈的扩展式表达给出完整的定义,为动态博弈的分析奠定基础;其次,我们从扩展式表述博弈的纳什均衡分析逐步深入到子博弈精炼纳什均衡,为动态博弈的分析提供可行的方法,接下来介绍两种完全信息动态博弈经典模型;最后,分析具有无穷次的重复博弈,推导出无名氏定理。
3.1 博弈的扩展式表述在动态博弈中,博弈方的行动是有先后次序的,且后行动者在自己行动之前能够观测到先行动者的行动,每个博弈方的一次选择行为常称为一个“阶段”(Stage )。
动态博弈中也可能存在几个博弈方同时选择的情况,这时博弈方的同时选择构成一个阶段。
一个动态博弈至少有两个阶段,因此动态博弈有时也称为“多阶段博弈”(Multistage Games )。
此外,也有把动态博弈称为“序列博弈”(Sequential Games )的,这也是由动态博弈中的次序特征引出来的。
设有一个商人要从A 地向B 地运输一批货物。
exfd经济博弈论3—完全且完美信息动态博弈
动态博弈中博弈方的策略是他们自己预先设定
的,在各个博弈阶段针对各种情况的相应行为 选择的计划。
这些策略实际上并没有强制力,而且实施起来 有一个过程,因此只要符合博弈方自己的利益, 他们完全可以在博弈过程中改变计划。我们称 这种问题为动态博弈中的“相机选择 (Contingent Play)”。
(-1,0) (0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
稳定。为什么会出现这种情
况呢?
其实,该博弈中 (不借-不打,不分)和(借-打,分)都是纳什
均衡。但后者不可信,不可能实现或稳定。
上述纳什均衡不稳定的原因,主要在于如果甲在第二阶段选择了 “不分”而不是“分”,乙策略中设定的第三阶段“打”是不可 信的,不可能真正实施,理由是该行为对乙自身也是不利的,追 求自身利益最大化的乙的理性不允许他这么做。甲只要稍作分析 就可以掌握乙的这个弱点,因此不可能理睬乙策略中的“打”官 司威胁,在第二阶段不会选择“分”。反过来,乙也不会愚蠢到 想靠一个明显不可信的威胁撑腰,冒险将资金借给甲,因此他在 第一阶段也不可能“借”。
第三章 完全且完美信息动态博弈
本章讨论动态博弈(Dynamic Games),所
有博弈方都对博弈过程和得益完全了解的完全 且完美信息动态博弈。这类博弈也是现实中常
见的基本博弈类型。由于动态博弈中博弈方的 选择、行为有先后次序,因此在表示方法、利 益关系、分析方法和均衡概念等方面,都与静 态博弈有很大区别。本章对动态博弈的概念和 分析方法,特别是子博弈完美均衡和逆推归纳 法作系统介绍,并介绍各种经典的动态博弈模 型。
所以,在一个动态博弈中,博弈的结果包括双
方(或多方)采用的策略组合,实现的博弈路 径和各博弈方的得益。
3 完全且完美信息动态博弈 博弈论
3.2 子博弈完美纳什均衡
3.2.1 子博弈
某个动态博弈从其 某个阶段开始的后 续阶段,可以自成 一个博弈。
条件:有初始信息集
和进行博弈所需要的 全部信息。
乙
借
不借
甲
分
(2,2) 打
(1,0) 不分
乙
不打
(1,0)
(0,4)
3.2.2 逆推归纳法
从动态博弈的最后一个阶段或最后一 个子博弈开始,逐步向前倒推以求解 动态博弈的方法。
3 完全且完美信息动态博弈
开金矿
甲欲开采价值4万元的金矿,缺1万资金。甲向 乙借1万,许诺采到金后对半分成。乙是否该借 钱给甲呢?
分析: 乙借不借依赖于甲守不守信 甲为不可信承诺 乙选不借
3 完全且完美信息动态博弈
3.1 动态博弈的表示法和特点 3.2 子博弈完美纳什均衡 3.3 几个经典的动态博弈模型
法律制度应满足两方面的要求
一是对人们正当权益保护力度足够大 二是对侵害他人利益者有足够的震慑
IBM公司的可信威胁
IBM公司曾经对市场公开承诺,对一些刚刚推向市场的新型电脑将在 二、三年后以很低的价格销售。这似乎不可思议,因为既然二、三 年后会降价,许多人就可能推迟购买,这将降低IBM的销量。但实际 上,IBM公司这样做是为了阻止其他电脑公司模仿它的产品。
不开发
子博弈完美开纳发什商均B 衡:
(开发,{不开开发 发,开发不}开)发 开发
(-3,-3)
(1,0) (0,1)
开发商B
不开发 (0,0)
A的策略集合:{开发,不开发} B的策略集合:{{开发,开发},{开发,不开发}
{不开发,开发},{不开发,不开发}}
均衡路径equilibrium path
博弈论-完全且完美信息动态博弈
美国 不犯我 我国
犯人
不犯人
A 注意:支付向 量的顺序与博 弈树上行动顺 序是对应的!
开发
不开发
N
大 小
1/2
N
大
小
1/2 1/2 1/2
B
不开发 开发
B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4 )
(8,0 )
(-3,-3)
(1,0 )
(0,8 )
(0,0 )
(0,1 )
(0,0 )
房地产开发博弈
B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4 )
(8,0 )
(-3,-3)
(1,0 )
(0,8 )
(0,0 )
(0,1 )
(0,0 )
房地产开发博弈
三、策略式转化为扩展式
案例-囚徒困境
囚徒 B 坦白 抵赖
囚徒A 坦白 抵赖
-8,-8 0,-10 -10,0 -1,-1
扩展式表述的要素
参与人集合: i 1, , n 然” ;
,此外,虚拟参与人“自
参与人的行动顺序(the order of moves):谁在什么 时候行动; 参与人的行动空间(action set):在每次行动时,参 与人有些什么选择。 参与人的信息集(information set):每次行动时,参 与人知道些什么; 参与人的支付函数; 外生事件(即自然的选择)的概率分布
(1,5)
(-2,2) (0,10)
(0,10)
垄断者
抵抗
二、博弈树求解方法——逆推归纳法
第3章 博弈论与信息经济学--完全信息动态博弈
二、子博弈精炼纳什均衡
第三,由于不考虑自己选择对别人选择的影响,纳 均衡允许了不可置信威胁的存在。如“市场阻挠博 弈”中,如果进入者者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润, 斗争则将预期的利润化为乌有。所以,斗争是一种 不可置信的威胁,
©&® by H. Q. Feng, CUFE 21/58
二、子博弈精炼纳什均衡
泽尔腾的“子博弈精炼纳什均衡”
一个纳什均衡称为精炼纳什均衡,当且仅当参与 人的战略在每一个子博弈中都构成纳什均衡。
就是说,组成精炼纳什均衡的战略必须在每一个 子博弈中都是最优的。
©&® by H. Q. Feng, CUFE
就是说,如果在位企业摆出一副“你进入我斗争”的 架势,那么进入企业不应该被这种威胁所吓倒。因 为它是不可置信的。但是,纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)便成为 一个纳什均衡。
©&® by H. Q. Feng, CUFE 18/58
子博弈精炼纳什均衡-不可置信威胁
美国普林斯顿大学古尔教授1997年在《经济学透视》里发表文 章,提出一个例子说明威胁的可信性问题: 两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦 的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告 状,我都把你们两个关起来,关起来比没有玩具更可怕。现 在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说: 快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告 诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而 告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你 不会告状,因此哥哥对弟弟的警告置之不理。 的确,如果弟弟是会算计自己利益的理性人,在这样的环境下, 还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可 置信的。
第3章_完全信息动态博弈
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
(2, 0, 2) (2, 2, 0)
(1, 1, 1)
员工 2 只有一个信息集的博弈树
1 H O 2 O 信息集 1 O H 3 O H 3 O H 信息集 2 H O 3 O
2.博弈树的结构 .
(1)博弈树的构造方法 )
首先行动的一方位于博弈树的最上端, 首先行动的一方位于博弈树的最上端,根据动态博弈过程中各方的行 动顺序,博弈数自上至下延展。也有学者习惯自左至右构造博弈树。 动顺序,博弈数自上至下延展。也有学者习惯自左至右构造博弈树。
(0, 20) )
斗争 不进入 默许 潜在进入者 斗争 进入 在位者 默许
二、博弈树
在动态博弈中,由于博弈参与者的行动存在先后顺序, 在动态博弈中,由于博弈参与者的行动存在先后顺序,因 此可以用更形象的方法来表示动态博弈:博弈树( 此可以用更形象的方法来表示动态博弈:博弈树(Game Tree)。 )。 通过支付矩阵的形式表示的博弈通常被称为策略型或正则 型博弈( 型博弈(Normal Form Game)。 )。 通过博弈树表示的博弈通常被称为扩展型博弈 (Extensive Form Game)。 )。
第一节 完全信息动态博弈概述
一、完全信息动态博弈的定义 在完全信息静态博弈中,博弈参与者同时采取行动。 在完全信息静态博弈中,博弈参与者同时采取行动。但 在完全信息动态博弈中,博弈参与者的行动存在先后顺序。 在完全信息动态博弈中,博弈参与者的行动存在先后顺序。 从信息角度上, 从信息角度上,完全信息动态博弈与完全信息静态博弈类 似,博弈参与者对博弈结构、博弈顺序、双方收益等信息 博弈参与者对博弈结构、博弈顺序、 都具备完全了解。 都具备完全了解。
博弈论3-1动态博弈的表示方法和特点
第三章完全且完美信息动态博弈2本章主要讨论完全且完美信息动态博弈。
将对动态博弈的特征、可信性、逆推归纳法,子博弈和子博弈完美纳什均衡,以及一些经典的动态博弈模型进行分析和讨论。
主要内容1.动态博弈的表示法和特点3 2.可信性和逆推归纳法3.子博弈和子博弈完美纳什均衡4.几个经典动态博弈模型5.有同时选择的动态博弈模型6.动态博弈分析的问题和扩展讨论3.1.1 阶段和扩展型表示3.1.2 动态博弈的基本概念43.1 动态博弈的表示法和特点3.1.1阶段和扩展型表示5阶段:动态博弈中一个博弈方的一次行为选择例子:仿冒和反仿冒博弈A不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒BABA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒BABA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒BAB第一阶段第二阶段A不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒BABA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒BAB第三阶段第四阶段8每条路径3.1.2 动态博弈的基本概念策略:在整个博弈中轮到选择的每个阶段,针对前面阶段的各种情况作相应选择的完整计划。
A不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒BABA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒BAB路径一路径二A不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒BABA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒BABA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒BAB路径三路径四路径五。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
参与约束: A B(4e ) e 1
2
当店员风险中性时, e 2 B 符合其最大利益
*
店主选择下限
A B(4e ) e 1
2
代入得益公式得: 4e e 1
2
期望得益为 4e e 1 ,
2
易求得 e 2
**
令 e e 得 B 1 ,再代入参与约束 得 A B(8 ) 5 ,
A 仿冒
B 制止 仿冒 (-2,5) 制止 不仿冒 不制止 (0,10) A 不仿冒
B
不制止 (5,5)
(2,2)
(10,4)
3.1.2 动态博弈的基本特点
策略是在整个博弈中所有选择、行为的计划 结果是上述“计划型”策略的策略组合,构成一条路 径 得益对应每条路径,而不是对应每步选择、行为
3.5.1 标准模型
博弈中有四个博弈方,分别称为博弈方1、博弈方2、博弈方 3和博弈方4 第一阶段是博弈方1和博弈方2的选择阶段,他们同时在各自 的可选策略(行为)集合 A1 和 A2 中分别选择 a1 和 a2 第二阶段是博弈方3和博弈方4的选择阶段,他们在看到博弈 方1和博弈方2的选择 a1 和 a2 以后,同时在各自的可选策 略(行为)集合 A3 和 A4 中分别选择 a3 和 a4 博弈方的得益都取决于所有博弈方的策略 a1, a2 , a3 , a4 即博弈方i的得益是各个博弈方所选择策略的多元函数
(-1,0) 分
(2,2) 甲 借
乙
不借 (1,0)
不分 乙 (0,4)
3.3.2 子博弈完美纳什均衡
定义:如果一个完美信息的动态博弈中,各博弈方策略 构成的一个策略组合满足,在整个动态博弈及它的所 有子博弈中都构成纳什均衡,那么这个策略组合称为 该动态博弈的一个“子博弈完美纳什均衡”。
子博弈完美纳什均衡能够排除均衡策略中不可信的威 胁和承诺,因此是真正稳定的。 逆推归纳法是求完美信息动态博弈子博弈完美纳什均 衡的基本方法。
第三章 完全且完美信息动态博弈
完全且完美动态博弈:所有博弈方都对博弈过程和得 益完全了解的动态博弈。 由于动态博弈中博弈方的选择、行为有先后次序,因 此在表示方法、利益关系、分析方法和均衡概念等方 面,都与静态博弈有很大区别。 动态博弈分析的主要概念和方法:子博弈完美均衡和 逆推归纳法
本章分六节
3.1 动态博弈的表示法和特点 3.2 可信性和纳什均衡的问题
2
拒绝
[R(E)-w(E), w(E)-E] [R(0),0]
[R(S)-w(S), w(S)-S] [R(0),0]
接受:w(E)-E>0
接受:w(S)-S>0
参与约束
委托人的选择
1
1 不委托 委托 不委托
委托
[R(E)-w(E), w(E)-E] [R(0),0] 委托: R(E)-w(E) > R(0) 不委托: R(E)-w(E) < R(0)
根源:纳什均衡本身不能排除博弈方策略中包含的
不可信的行为设定,不能解决动态博弈的相机选择 引起的可信性问题
3.2.3 逆推归纳法
定义:从动态博弈的最后 一个阶段博弈方的行为 开始分析,逐步倒推回 前一个阶段相应博弈方 的行为选择,一直到第 一个阶段的分析方法, 称为“逆推归纳法”。
乙 借 不借 (1,0)
3.3 子博弈和子博弈完美纳什均衡
3.4 几个经典动态博弈模型
3.5 有同时选择的动态博弈模型
3.6 动态博弈分析的问题和扩展讨论
3.1 动态博弈的表示法和特点
3.1.1 阶段和扩展性表示 3.1.2 动态博弈的基本特点
3.1.1 阶段和扩展性表示
阶段:动态博弈中一个博弈方的一次选择行为 例子:仿冒和反仿冒博弈
甲
分 不分
逆推归纳法是动态博弈 分析最重要、基本的方 法。
(2,2)
(0,4)
3.3 子博弈和子博弈完美纳什均衡
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
3.3.1 子博弈
定义:由一个动态博弈第一 阶段以外的某阶段开始的后 续博弈阶段构成,有初始信 息集和进行博弈所需要的全 部信息,能够自成一个博弈 的原博弈的一部分,称为原 动态博弈的一个“子博弈”。
无限回合讨价还价——化归
S1 1000010000 2 S
S S1 1000010000 2 S
10000 S 1
*
10000 10000 S 1
*
3.4.4 委托人—代理人理论
一、委托人——代理人关系
经济活动和社会活动中有很多委托人——代理人关 系,有明显的,也有隐蔽的。工厂和工人、店主和 店员、客户和律师、市民和政府、基金购买者和基 金管理人等都是。 委托人——代理人关系的关键特征:不能直接控制, 监督不完全,信息不完全,利益的相关性 委托人——代理人涉及问题:激励机制设计、机制 设计理论,委托合同设计问题等
3.4 几个经典动态博弈模型
3.4.1 3.4.2 3.4.3 3.4.4
寡占的斯塔克博格模型 劳资博弈 讨价还价博弈 委托人—代理人理论
3.4.1 寡占的斯塔克博格模型
先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而非同时选 择即可。
Q q1 q2 , P P(Q) 8 Q
机会成本
委托人得益:
R w R(e) w[ R(e)]
C(e) +U R, C R(e) 产出 函数
U
代理人得益:w C w[ R(e)] C (e)
参与约束: w[ R(e)] C (e) U 激励相容约束: w[ R((e* )] C (e* ) w[ R(e)] C (e)
激励相容约束
接受: 0.9*[w(20)-E]+0.1*[w(10)-E]>0
委托: 0.9*[20-w(20)]+0.1*[10-w(10)]>0
参与约束
对于委托人来说,就是要根据上述 两个条件,以及 E、S的值,选择 最佳的工资水平w(20)和w(10),或 者它们的差额w(20)-w(10)
五、选择报酬和连续努力水平的 委托人—代理人博弈
四、有不确定性且不可监督的 委托人—代理人博弈
1
委托
不委托
2
接受 拒绝 偷懒
[0,0]
2
努力
[0,0]
低产 (0.9)
只能根据成果付酬,w是 成果函数,而非努力程度 函数。不确定性对代理人 利益、选择有影响。
0
高产 (0.9) 低产 高产 (0.1) (0.1)
[10-w(10), w(10)-E]
* **
求数学期望得 A 8B 5
解得 B 1 A 3 ,
则店主的最优激励工资计算公式是 w 3 R
商店100%的营业利润成为店员的提成,店主向 店员收取3单位承包费(或租金)
3.5 有同时选择的动态博弈模型
3.5.1 3.5.2 3.5.3 3.5.4
标准模型 间接融资和挤兑风险 国际竞争和最优关税 工资奖金制度
[10-w(S), w(10)-S]
[20-w(20), w(20)-E] [20-w(20), w(20)-S]
促使代理人努力的激励相容约束、参与约 束,以及委托人选择委托的条件
努力: 0.9*[w(20)-E]+0.1*[w(10)-E] >0.1*[w(20)-S]+0.9*[w(10-S)]
二、无不确定性的委托人—代理人模型
1
委托 不委托
代理人的选择
激励相容约束:
w(E)-E> w(S)-S w(E)> w(S)+E-S
2
接受
[R(0),0]
拒绝
2
努力 偷懒
[R(0),0]
[R(E)-w(E), w(E)-E] [R(S)-w(S), w(S)-S]
参与约束:
2
接受 拒绝 接受
2
努力
[0,0]
0
高产 (0.9)
低产 (0.1)
0
高产 (0.1)
低产 (0.9)
[10-w(E), w(E)-E]
[10-w(S), w(S)-S] 代理人偷懒:
20-w(E), w(E)-E] [20-w(S), w(S)-S]
委托: 0.1*[20-w(S)]+0.9*[10-w(S)]>0 不委托: 0.1*[20-w(S)]+0.9*[10-w(S)]<0
如果进行到第三个回合,乙必须接受,因 此第三个回合甲的方案具有强制力 谈判时间越久,对双方都不利,因此越早 达成协议越好
分析:第三回合
第三回合甲具有选择权,理性的甲在第二回合肯定不 会接受,并且第三回合自己出价S=10000
分析:第二回合
分析:第一回合
均衡解
三回合讨价还价博弈结果的讨论(S=10000)
动态博弈的非对称性——先后次序决定动态博弈必然 是非对称的。 后选择、行为的博弈方常常更有利,有“后行优势”。
3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
3.2.1 相机选择和策略中的可信性问题
不同版本的开金矿博弈——分钱和打官司的可信性
c1 c2 2
2 u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q1