博弈论 第 三 章 完全信息动态博弈讲解

合集下载

第3讲 完全信息动态博弈

第3讲 完全信息动态博弈
q2 0
最优化的一阶条件意味着: s(q1) (a q1 c) =1 2 2
第3讲 完全信息动态博弈
假定q1 a c。这实际上是库诺特模型中企业2的反应函数,不同的 是,这里,s(q1)是当企业1选择q1时企业2的实际选择,而在库诺 2 特模型中,R2 q1)是企业2对于假设的q1的最优反应。 ( 因为企业1预测到企业2将根据s(q1)选择q 2,企业1在第一阶段的问 2 题是: max 1 = q1,s(q1)=q1 a q1 s(q1) c) ( 2 2
第3讲 完全信息动态博弈
• 这个例子也说明,在博弈中,拥有信息优势可能 使参与人处于劣势,而这在单人决策中是不可能 的。企业2在斯坦克尔伯格博弈中的利润之所以低 于库诺特博弈中的利润,是因为它在决策之前就 知道了企业1的产量。即使企业1先行动,但如果 企业2在决策之前不能观测到企业1的产量,我们 就回到了库诺特均衡,因为此时,企业1的先动优 势就不存在了。
第3讲 完全信息动态博弈
* 1 回忆一下,在上一讲得到的库诺特模型的纳什均衡是q1 =q* = (a c), 2 3 3 比较这两个结果,发现斯坦克尔伯格均衡的总产量 (a c)大于库诺特 4 2 的总产量 (a c)。但是,企业1的斯坦克尔伯格均衡产量大于库诺特 3
均衡产量,而企业2的斯坦克尔伯格均衡产量小于库诺特均衡产量。 因为企业1本来可以选择库诺特均衡产量但它没有选择,说明企业1在斯坦 克尔伯格博弈中的利润大于库诺特博弈中的利润,而总产量上升意味着 总利润下降了从而企业2的利润一定下降了。这就是所谓的“先动优势”。
第3讲 完全信息动态博弈
• 宏观经济政策的动态一致性 宏观经济学上与子博弈精炼纳什均衡相对应的概 念是政府政策的动态一致性(dynamic consistency 或time consistency)。政府政策 的动态一致性指的是,一个政策不仅在制定阶段 应该是最优的(从政府的角度),而且在指定之 后的执行阶段也应该是最优的,假设没有任何新 的信息出现。如果一个政策只是在制定阶段是最 优的,而在执行阶段并不是最优的,这个政策就 是动态不一致的。说它是动态不一致的,是因为

最新博弈论-完全信息动态博弈3

最新博弈论-完全信息动态博弈3

在重复博弈的每个阶段博弈中,参与人可同时 行动,也可不同时行动。在后一情形中,每一 阶段博弈本身就是一个动态博弈。
影响重复博弈均衡结果的主要因素:
博弈的重复次数:参与人可能为了长期利益 而牺牲眼前利益从而选择不同的均衡策略。
信息的完备性:当一个参与人的支付函数不 为其他人所知时,该参与人可能有积极性建立 一个好的声誉以换取长远利益(声誉模型)。
预期
若参与人均有这样的预期,若第一阶段出现合作 (M1,M2),则第二阶段预期的纳什均衡是(R1, R2),若第一阶段出现其他结果,则第二阶段预期 的纳什均衡是(L1,L2)。 考虑策略:参与人1(2)在第一阶段首先选择M1 (M2);在第二阶段,若第一阶段的博弈结果是 (M1,M2),则第二阶段选择合作的纳什均衡策略 R1( R2),否则选择惩罚的纳什均衡策略L1 (L2)。 该策略是一个子博弈精炼纳什均衡。
连锁店悖论
首先考虑第100个市场,在博弈最后阶段,斗争已没有 任何意义,在位者将默许,进入者将选择进入。
再考虑第99个市场,因为不论在位者选择什么行动, 第100个市场的均衡结果不受影响,在位者的最优选择 仍然是默许。
如此一直倒推回去,得到该博弈的唯一的子博弈精炼 纳什均衡是在位者在每一个市场上都选择默许,进入 者在每一个市场上选择进入。
阶段
参 与 人
L1 M1
1 R1
L2 1,1 0,5 0,0
L2 4,4 3,8 3,3
参与人2
M2 5,0 4,4 0,0 参与人2
M2 8,3 7,7 3,3
R2 0,0 0,0 3,3
R2 3,3 3,3 6,6
参与人有动机实施惩罚的例子
L2
M2
R2
P2

完全信息动态博弈模型

完全信息动态博弈模型

完全信息动态博弈模型完全信息动态博弈模型是博弈论中一种重要的博弈模型,它描述了一组参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。

下面将详细介绍完全信息动态博弈模型的相关内容。

一、博弈的参与者:完全信息动态博弈模型中,通常包括两个或多个参与者,每个参与者都可以做出自己的决策和行动。

参与者可以是个人、组织、公司等,他们之间存在着相互竞争和合作的关系。

二、博弈的信息:完全信息动态博弈模型中的参与者拥有完全信息,即每个参与者都能够获得关于其他参与者的决策和行动的完整信息。

通过完全信息,参与者能够准确地评估自己的决策和行动对其他参与者的影响,并作出最优化的决策。

三、博弈的行动和策略:在完全信息动态博弈中,参与者可以选择不同的行动和策略来达到自己的目标。

每个参与者根据自己对其他参与者行动和策略的评估,以及自己的目标和利益,选择最优化的行动和策略。

四、博弈的时间顺序:完全信息动态博弈是一个时间序列上的博弈模型,参与者的决策和行动是有序进行的。

参与者按照一定的时间顺序依次进行决策和行动,每个参与者都会考虑前面参与者的行动和决策对自己的影响,进而作出自己的决策。

五、博弈的结果和收益:完全信息动态博弈模型的结果是参与者的收益和利益。

通过多轮反复的博弈过程,参与者根据自己的决策和行动可以获得不同的结果和收益。

每个参与者的最终目标是通过优化自己的决策和行动,获得最大的收益和利益。

完全信息动态博弈模型是博弈论中一种重要的模型,它能够帮助我们分析和理解多方参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。

通过对博弈的参与者、信息、行动和策略、时间顺序以及结果和收益的分析,可以更好地理解和应用完全信息动态博弈模型。

博弈论——完全信息动态博弈

博弈论——完全信息动态博弈

2 完全信息的动态博弈2.1完全和完美信息的动态博弈动态博弈(dynamic game):参与人在不同的时间选择行动。

完全信息动态博弈指的是各博弈方先后行动,后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合下所有参与人相应的得益都完全了解的博弈静态博弈习惯用战略式(Strategic form representation)表述,动态博弈习惯用扩展式(Extensive form representation)表述。

战略式表述的三要素:参与人集合、每个参与人的战略集合、由战略组合决定的每个参与人的支付。

扩展式表述的要素包括:参与人集合、参与人的行动顺序、参与人的行动空间、参与人的信息集、参与人的支付函数、外生事件(自然的选择)的概率分布。

n人有限战略博弈的扩展式表述用博弈树来表示1(1,2) (0,3)①结:包括决策结和终点结。

决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。

第一个行动选择对应的决策结为“初始结”,用空心圆表示,其它决策结用实心圆表示。

X表示结的集合,x X表示某个特定的结。

z表示终点结,Z表示终点结集合。

表示结之间的顺序关系,x x´表示x在x´之前。

x之前所有结的集合称为x的前列集,x之后所有结的集合称为x的后续集。

以下两种情况不允许:前者违背了传递性和反对称性;后者违背了前列节必须是全排序的。

在以上两个假设之下,每个终点结都完全决定了博弈树的某个路径。

②枝:博弈树上,枝是从一个决策结到其直接后续结的连线,每一个枝代表参与人的一个行动选择。

在每一个枝旁标注该具体行动的代号。

一般地,每个决策结下有多个枝,给出每次行动时参与人的行动空间,即此时有哪些行动可供选择。

③信息集(information sets):博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结集合称为一个信息集。

博弈树上的所有决策结分割成不同的信息集。

每一个信息集是决策结集合的一个子集(信息集是由决策结构成的集合),该子集包括所有满足下列条件的决策结:(1)每一个决策结都是同一个参与人的决策结。

完全信息动态博弈名词解释

完全信息动态博弈名词解释

完全信息动态博弈名词解释完全信息动态博弈是经济学和博弈论的一个重要概念,它是一种自上而下的模型,用来描述多个经济参与者之间的博弈行为。

完全信息动态博弈模型可以用来分析不同参与者之间在时间和空间上进行博弈,以求取共同利益最大化。

它允许模型解决者预测策略,分析每个参与者在某个时间点采取的不同策略所带来的结果,以此来帮助其他参与者制定最佳战略。

完全信息动态博弈的核心概念是状态和行动,也就是描述参与者在每一轮有多少种可能的策略。

它在一定的时间框架内,由描述参与者现在的状态,观察他们如何根据当前状态下每个参与者的行动,以及每个行动产生的结果,来描述某一具体策略下的最终结果。

参与者首先通过观察彼此之间的博弈行为,体会状态和行动,从而确定自己的策略,并计划未来可能出现的状态和行动,从而获得最大的利益。

例如,在一款棋类游戏中,两个对手可以通过对对方进行攻击,或者保护自己的棋子,以及改变棋局,来表明他们的能力。

在这种情况下,两个玩家拥有相同的完全信息,他们可以根据当前的棋局和自己可能采取的每一步棋,确定最优的策略,从而提高自己赢得游戏的几率。

许多实际问题也是基于完全信息动态博弈模型构建的,如政府向公司提出经济问题的解决案,或是在双方同意的情况下进行谈判等。

在这些情况下,参与者不仅需要观察当前的状态和行动,还要考虑未来的可能性,用完全信息动态博弈模型来解决问题,才能更有效地取得共同利益最大化。

完全信息动态博弈是经济学和博弈论研究中一个基本模型,它可以有效的模拟由多个经济参与者之间进行的博弈,利用状态和行动的概念,可以很好的帮助参与者制定最优策略,以达到共同利益最大化的目的。

另外,它也可以用来解决政府和公司之间的实际问题。

完全信息动态博弈是一个对经济学和博弈论有着深远作用的概念,它也被广泛应用于实践。

信息经济学第三章博弈论

信息经济学第三章博弈论
信息经济学第三章博 弈论
目录
• 博弈论基本概念 • 完全信息静态博弈 • 完全信息动态博弈 • 不完全信息静态博弈 • 不完全信息动态博弈 • 博弈论在信息经济学中应用
01
博弈论基本概念
博弈论定义与特点
博弈论是研究决策过程中参与者之间 相互作用和影响的理论。
博弈论的特点包括:参与者之间的相 互影响、策略的选择和收益的分配。
混合策略在静态博弈中应用
混合策略定义
在静态博弈中,参与人选择以一定的概率分布随机选择不同策略的 行为。
应用场景
当参与人无法确定对手的策略选择时,采用混合策略可以增加对手 的不确定性,从而提高自身的期望收益。
示例
在石头、剪刀、布游戏中,每个参与人随机选择出拳的策略就是一 种混合策略的应用。
信号传递机制在静态博弈中作用
如环保税、碳交易制度等。
案例:拍卖、招标等经济活动中的博弈论应用
拍卖中的博弈论
拍卖是一种典型的博弈论应用场景,通过竞价机制实现资源的有效配 置。常见的拍卖方式有英式拍卖、荷兰式拍卖、密封拍卖等。
招标中的博弈论
招标是一种采购方式,通过竞争机制引导供应商提供优质的商品和服务。招标 过程中需要考虑价格、质量、信誉等多个因素,博弈论可以帮助制定有效的招 标策略。
机制设计原理及其在信息经济学中应用
机制设计原理
01
通过设计合理的规则和制度,引导参与者的行为,实现资源的
有效配置和社会福利最大化。
信息经济学中的应用
02
在信息不对称的情况下,通过机制设计实现信息的有效传递和
资源的优化配置,如价格机制、竞争机制等。
激励机制设计
03
通过设计合理的激励机制,引导参与者的行为符合社会目标,

经济博弈论(第三章)

经济博弈论(第三章)

第三章完全信息动态博弈上一章介绍了完全信息静态博弈,本章在前面的基础上探讨完全信息动态博弈。

现实社会经济活动的决策大多数是有先后顺序的行为而不是同时选择的行为,而且后行者能够看到先行者的决策内容,在先行者的决策结果之后再定夺自己的策略。

这样的经济行为比比皆是,如商业活动中的讨价还价,拍卖活动中的轮流竞价,资本市场上的收购兼并和反收购兼并都是如此。

依次选择与一次性同时选择有很大的差异,因此这种决策问题构成的博弈也是从时间序列上有别于静态博弈的,我们称之为“动态博弈”(Dynamic Games)。

例如下象棋通常需要两个参与人,我们定义为红方和黑方,红方先走,黑方后走,这是一个典型的完全信息动态博弈。

动态博弈由于添加了时间因素,因而更加贴近现实。

根据博弈方是否相互了解得益情况,可分为“完全信息动态博弈”和“不完全信息动态博弈”,根据是否所有博弈方都对自己选择前的博弈过程完全了解,可分为“完美信息动态博弈”和“不完美信息动态博弈”。

在本章中,我们首先对博弈的扩展式表达给出完整的定义,为动态博弈的分析奠定基础;其次,我们从扩展式表述博弈的纳什均衡分析逐步深入到子博弈精炼纳什均衡,为动态博弈的分析提供可行的方法,接下来介绍两种完全信息动态博弈经典模型;最后,分析具有无穷次的重复博弈,推导出无名氏定理。

3.1 博弈的扩展式表述在动态博弈中,博弈方的行动是有先后次序的,且后行动者在自己行动之前能够观测到先行动者的行动,每个博弈方的一次选择行为常称为一个“阶段”(Stage )。

动态博弈中也可能存在几个博弈方同时选择的情况,这时博弈方的同时选择构成一个阶段。

一个动态博弈至少有两个阶段,因此动态博弈有时也称为“多阶段博弈”(Multistage Games )。

此外,也有把动态博弈称为“序列博弈”(Sequential Games )的,这也是由动态博弈中的次序特征引出来的。

设有一个商人要从A 地向B 地运输一批货物。

exfd经济博弈论3—完全且完美信息动态博弈

exfd经济博弈论3—完全且完美信息动态博弈

动态博弈中博弈方的策略是他们自己预先设定
的,在各个博弈阶段针对各种情况的相应行为 选择的计划。
这些策略实际上并没有强制力,而且实施起来 有一个过程,因此只要符合博弈方自己的利益, 他们完全可以在博弈过程中改变计划。我们称 这种问题为动态博弈中的“相机选择 (Contingent Play)”。
(-1,0) (0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
稳定。为什么会出现这种情
况呢?
其实,该博弈中 (不借-不打,不分)和(借-打,分)都是纳什
均衡。但后者不可信,不可能实现或稳定。
上述纳什均衡不稳定的原因,主要在于如果甲在第二阶段选择了 “不分”而不是“分”,乙策略中设定的第三阶段“打”是不可 信的,不可能真正实施,理由是该行为对乙自身也是不利的,追 求自身利益最大化的乙的理性不允许他这么做。甲只要稍作分析 就可以掌握乙的这个弱点,因此不可能理睬乙策略中的“打”官 司威胁,在第二阶段不会选择“分”。反过来,乙也不会愚蠢到 想靠一个明显不可信的威胁撑腰,冒险将资金借给甲,因此他在 第一阶段也不可能“借”。
第三章 完全且完美信息动态博弈
本章讨论动态博弈(Dynamic Games),所
有博弈方都对博弈过程和得益完全了解的完全 且完美信息动态博弈。这类博弈也是现实中常
见的基本博弈类型。由于动态博弈中博弈方的 选择、行为有先后次序,因此在表示方法、利 益关系、分析方法和均衡概念等方面,都与静 态博弈有很大区别。本章对动态博弈的概念和 分析方法,特别是子博弈完美均衡和逆推归纳 法作系统介绍,并介绍各种经典的动态博弈模 型。
所以,在一个动态博弈中,博弈的结果包括双
方(或多方)采用的策略组合,实现的博弈路 径和各博弈方的得益。

经典:博弈论-完全信息动态博弈

经典:博弈论-完全信息动态博弈
高需求 低需求 不完全信息情形下的博弈: 需求方的信号 承诺 长协价格从年度定价到季度定价
2、博弈的扩展式表述的要素
博弈的扩展式表述包含以下要素: (1) 参与人集合:i=1,2,…,n。此外,用N代表虚拟
参与人——自然。 (2) 行动顺序:谁在什么时候行动。 (3) 参与人的行动空间: (4) 参与人的信息集: (5) 参与人的策略集: (6) 参与人的支付函数: (7)外生事件的概率分布。
博弈的收益矩阵
(1)高需求
开发 开发商A 不开发
(2)低需求
开发 开发商A 不开发
开发商B
开发
不开发
2, 2
4, 0
0, 4
0, 0
开发商B
开发
不开发
-1, -1
1, 0
0, 1
0, 0
博弈分类
按开发商博弈的先后顺序分: 静态博弈:两个开发商同时决策,或后决策者不
能观察到先行动者的行动。 动态博弈:博弈有先后顺序,且后决策者能观察
完全信息动态博弈图示:N A B
开发 (2,2)
高需求

A
N
低需求
开发 不开发 开发 不开发
不开发 (4,0)
开发 (0,4) B 不开发 (0,0)
开发 (-1,-1) 不开发 (1,0)
开发 (0,1) 不开发 (0,0)
(4)不完全信息动态情形:ANB
开发商A不清楚市场的需求状态,决定是否开发; 开发商B 在观察到市场需求和A的决策后决定是否开发。
到先行动者的行动后再行动。 按开发商是否知道市场需求状态分:
完全信息博弈:若两个开发商都知道市场需求状 态(高需求或低需求)。
不完全信息博弈:由自然决定市场的需求状态, 两开发商不知道。 共同知识:在市场各种可能状态和各开发商不同策 略组合下的得益矩阵是双方的共同知识。

3-序贯博弈(完全动态静态博弈)

3-序贯博弈(完全动态静态博弈)

例4:法律保障约束下的投资分配博弈
A A A 不投资 投资 B 不投资
投资
B 分红 ( 2 ,2 )
E C M N B U A
不投资 B ( 1 ,0 ) 不分 A (2,2) 起诉 不起诉 (1,0) ( 0 ,4 )
投资
(1,0) 不分 A
不分红 (1,0) 分 (0,4)

(2,2) 起诉 (-1,0)
B
不开发 (1 , 0) 开发 (0 , 1)
不开发
B
不开发 (0 , 0)
思考一个问题:
在房地产开发例子中,有几个纳什均衡?
衡,但是后者不可信不稳定。
结论:纳什均衡在动态博弈可能缺乏稳定性,也就是
说,在完全信息静态博弈中稳定的纳什均衡,在动态 博弈中可能是不稳定的,不能作为预测的基础。
根源:纳什均衡本身不能排除博弈方策略中包含的不
枝(branch):每个行动结上可选择的行动
结果与支付:参与人沿着导致某一特定行动序列的树
枝进行所得到最后支付。支付表中的顺序按照行动顺 序排列。
打击 (-5,3) 进入 老企业
新企业
E C M N B U A
不进入 (0,10)
初始结(根):博弈首先开始的点(博弈方)
不打击 (4,5)
不起诉 (0,4)
可信的行为设定,不能解决动态博弈的相机选择引起 的可信性问题
E C M N B U A
(A进入,B不进入)和(A不进入,B进入)都是纳什均
【子博弈与子博弈纳什均衡】
E C M N B U A
借 甲 分 (2,2)
子博弈:由一个动态博

不借 (1,0)
弈第一阶段以外的某阶 段开始的后续博弈阶段 构成的,有初始信息集 和进行博弈所需要的全 部信息,能够自成一个 博弈的原博弈的一部分 ,称为原动态博弈的一 个“子博弈”。

博弈论3 完全且完美信息动态博弈分解

博弈论3 完全且完美信息动态博弈分解
注:逆推归纳法是动态博弈分析最重要、 基本的方法。
3.3 子博弈和子博弈完美纳什均衡
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
3.3.1 子博弈
定义:由一个动态博弈第一阶段以外的 某阶段开始的后续博弈阶段构成 的,有初始信息集和进行博弈所 需要的全部信息,能够自成一个 博弈的原博弈的一部分,称为原 动态博弈的一个“子博弈”。

投资
不投资
分 甲 不分 (1,0)
投资资金。甲希望乙能投资自 (2,2) (0,4) 开金矿博弈
己1亿元资金用于开矿,
并许诺在采到金子后与乙对半分成
➢ 问题:乙是否该将钱投资给甲呢?
二、有法律保障的开金矿博弈II的扩展形
确实可信的威胁——通过法律武器
➢ 确实可信的威胁 ➢ (credible threat)
企业A与企业B对市场的占领有先有后,因 此该 博弈又称为:“先来后到"博弈
市场进入阻挠博弈的扩展形 Cont…
圈B与圈A分别是
企业B与企业A的 决策结或选择节 点 (又称决策信
打进
企业A
息集或选择信息 打击 集), 即两博弈方
各自轮到选择 (-2, 3) 的位置.
企业B 不进 (0, 10)
和平 (5, 5)
注:动态博弈各个博弈方的选择行动有先后次序, 每个博弈方的选择行为会形成依次相连的时间 阶段,因此博弈方的一次选择称为一个“阶 段”。也有可能存在几个博弈方同时选择的情 况,这些博弈方的一次选择也构成一个“阶 段” 。
一个动态博弈至少有两个阶段。因此态博弈又称 为多阶段博弈(Multistage Games)
投资
乙 不投资
是指,博弈的参与人通过

某种行动改

第3章 博弈论与信息经济学--完全信息动态博弈

第3章 博弈论与信息经济学--完全信息动态博弈
©&® by H. Q. Feng, CUFE 17/58
二、子博弈精炼纳什均衡
第三,由于不考虑自己选择对别人选择的影响,纳 均衡允许了不可置信威胁的存在。如“市场阻挠博 弈”中,如果进入者者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润, 斗争则将预期的利润化为乌有。所以,斗争是一种 不可置信的威胁,
©&® by H. Q. Feng, CUFE 21/58
二、子博弈精炼纳什均衡
泽尔腾的“子博弈精炼纳什均衡”
一个纳什均衡称为精炼纳什均衡,当且仅当参与 人的战略在每一个子博弈中都构成纳什均衡。
就是说,组成精炼纳什均衡的战略必须在每一个 子博弈中都是最优的。
©&® by H. Q. Feng, CUFE
就是说,如果在位企业摆出一副“你进入我斗争”的 架势,那么进入企业不应该被这种威胁所吓倒。因 为它是不可置信的。但是,纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)便成为 一个纳什均衡。
©&® by H. Q. Feng, CUFE 18/58
子博弈精炼纳什均衡-不可置信威胁
美国普林斯顿大学古尔教授1997年在《经济学透视》里发表文 章,提出一个例子说明威胁的可信性问题: 两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦 的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告 状,我都把你们两个关起来,关起来比没有玩具更可怕。现 在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说: 快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告 诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而 告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你 不会告状,因此哥哥对弟弟的警告置之不理。 的确,如果弟弟是会算计自己利益的理性人,在这样的环境下, 还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可 置信的。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

房地产开发博弈
开发
A hA(1) 不开发
h表示信息集
N hN(1)
需求大
需求小
N hN(2)
需求大
需求小
B hB(1)
开发
不开发
B hB(2)
B hB(3)
开发
不开发 开发 不开发 开发
B hB(4)
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8) (0,0) (0,1) 单 位:百万元
定 义 一 个 展 开 式 博 弈 的 子 博 弈G 由 一 个 决 策 结x 和 所 有 该 决 策 结 的 后继结T(x)( 包 括终点结0 组 成, 它 满 足 下 列 条 件:⑴x 是 一 个 单 点 信 息 结即h(x)={x};⑵对于所有的 x′∈T(x),如果x″∈h(x′),则x″∈T(x)。
(3)
N
1/3
2/3
1
Y1
z1
1
x1
w1
(2,6) (5,6)
2
2
a2 (9,0)
b2 (0,3)
a2 (9,5)
b2 (0,3)
3.3 子 博 弈 与 子 博 弈 完 美
Nash 均衡在原则上适用所有的博弈,但对于预 测 参与人的行为来说,Nash均衡可能并不是 一个 合理的预测, 如房地产博弈:
A
开发
不开 发
A
开发
不开发
B
B
B
B
开发 不开发 开发 不开发 开发 不开发 开发
不开发
有了信息集的概念, 展开式表示也可以用来表 示静态博弈, 如“囚徒的困境 ”博弈可以表 示为:
1
坦白
2
不坦白
2
坦白
不坦白 坦白
不坦白
(-5,-5)
(0,-8) (-8,0)
(-1,-1)
或者:
2
坦白
不坦白
1
1
坦白
Ff 0,0
0,0
该博弈有唯一的Nash均衡(σ1,σ2)=(1/3(Rr)+2/2(Rf), 2/3(M)+1/3(P)),它与信念体系一起构成序贯均衡。
习题
1.写出下列博弈的策略型表示:
(1)
(2)
1
U
D
U
1 D
2
L
R
2
L
R
(2,1) (0,0) (-1,1) (3,2)
2
2
L
RL
R
(2,1) (0,0) (-1,1) (3,2)
A


B


B


(-3,-3)
(1,0)
的 策 略 式 表 示 为:
(0,1)
(0,0)
参 与 人B
( 开, 开) ( 开, 不) ( 不, 开) ( 不, 不)
开 -3,-3
-3,-3
1,0
1,0
参 与 人A
不 0,1
0,0
0,1
0,0
由 画 线 法 可 得 三 个 纯 策 略Nash 均 衡:
可表示为策略型
参 与 人2
M
P
Rr 0,0
1,-1
注:u1(Rf,M)= 2×1/2+(-1)×1/2=0,5
u2((Rf,M)= -2×1/2+1×1/2=-0.5
Rf 0.5,-0.5
参 与 人1
Fr –0.5,0.5
0,6 1,-1
其中R(r)表示加注;F(f)表 示摊牌;M表示对抗;P表示 放弃。
例房地产博弈 开A
BX


不 B X′


有子博弈Ⅰ:
Bx


和子博弈Ⅱ:
B X′


1
U
D
2
2
L
R
L
R
无(真)子博弈
1
U
D
2
2
L
R
L
R
3
3
3
3
C
DC DC
DC D
参与人2 的信息集不能作为子博 弈的初始结, 否则将导致3的信 息被分割。
3.3.2 子 博 弈 完 美 (精练)动 态 博 弈
定义 展开式博弈的略 组s*=(s1*,…si*,…sn*) 是一个 子博弈完美(精练)Nash均衡, 如果满 足:(1)它 是原博弈的Nash均衡;(2)它在每一 个子博弈上 给出Nash均衡。
如果博弈树的所有信息集都是单结的, 则称该 博弈为完美(perfect)息 博弈。(无虚线连接), 而完全(complete)信息博弈是指得益函数和纯 策略空间均为博弈各方的共同知识。完全信息 可以是完美的也可以是不完美的。
3.2 展开型博弈的策略与均衡
一、 行 为 策 略
在策略型博弈中, 参与人的策略是进行博 弈的计划( 或打算)的详细集合, 而在展 开型博弈中 参与人的策略必须确定在该 参与人的每一个决 策集上 所 采 取 的 行 动,又 结 与 信 息 集 紧 密 相 连, 对 于 参 与 人i,基于信息hi的行动的
(Luce & Raiff)。
参与人i的行为策略bi 定义为:
bi∈×hi∈Hi△(A(hi))
其中△ 表示某集合是的概率分布。
行 为 策 略 的Nash 集 合 是 这 样 一 个 策 略 组 合, 它 使 得 没 有 一 个 参 与 人 可 以 通 过 不 同 的 使 用策 略 而 增 加 自 己 的 得 益。
#Si= Π #(A(hi)) hi∈Hi
展开型博弈中纯策略是由信息集与行动集 定义 的( 与静态博弈不同,静态博弈中采取纯 策略与 采取某行动是一个意思)。
纯策略组合(剖面profile)是由参与人各自 的纯策 略空间中的任一纯策略构成的组
合,在任一纯 策略组合s下,总可以从
初始结开始,沿着博弈树的某条路径

N
[0.5]
红 [0.5]
<1> 1
<1> 1
加注r <1/3>
y2 2 <1/4>
摊牌f
摊牌F
<2/3> <0>
(-1,1) (1,-1)
加注R <1>
x2 2 <3/4>
放弃P
对抗M
放弃P
对抗M
(1,-1)
(-2,2)
(1,-1)
(2,-2)
摊 牌 博 弈 的 策 略 空 间 分 别 为:
S1={(R,F)×(r,f)}={Rr,Rf,Fr,Ff},S2={M,P}
⑷ 当参与人作出他们的行动决策时,他所 观测到 或他所了解到的信息,即他在此时 获得的信息 集合;
⑸ 参与人的得益(支付或效用), 它们是已 知行动的函数;
⑹ 在任何外生事件的概率分布。
例 房地产开发博弈
有两个房地产开发商(分别为参与人1,记为 A和参与人2,记为B) 在某地开发房地产, 但该 地的房地产需求状况是不确定的, 假定该博弈 的行动顺序如下:(1) 开发商1先行动, 选择开 发或不开发;(2)在1决策后,“ 自然”选择需求 的大小;(3)开发商2在 观测到1的决策和市场 的需求后, 再决定开发 或不开发。( 如 下 图)
={(左,左),(左,右),(右,左),(右,右)},其中纯策略 (左,左)表明:当1取“上”时,2取“左”;当1取
“下”时,2取“左”,…… 参与人1有三个信息集H1={hi(i),i=1,2,3},1的纯
策略空间为:S1=A(h1(1))×A(h1(2))×A(h1(3)) ={(上,下)×(A,B)×(C,D)},共8种纯策略。 一般地,参与人I的纯策略空间的纯策略数目为:
(0,0)
上述博弈树给出了有限博弈的几乎所有信息。
博 弈 树 必 须 满 足 下 列 规 则:
(1) 每一个结(node)至多有一个其他结直接位 于 它的前面;
(2) 在博弈中没有一条路径可以使决策集与自身 相连;
(3) 每一个结是唯一初始结的后续结, 即博弈树 必须有初始结;
(4) 每个博弈树“正好”只有一个初始结(多于 一个 可以用“ 自 然”连接。
不坦白
坦白
不坦白
(-5,-5)
(0,-8) (-8,0)
(-1,-1)
注 意: 得 益 向 量 的 次 序 与 参 与 人 决 策 的 顺 序 一 致。
同样地,展开型博弈也可以用策略式来表示, 如
展开型博弈:
1
T
B
2
L
R
2
L
R
(2,2)
(4,0) ((1,0)
可以表示为:
参 与 人2
L
R
T 2,2 4,0
另一种情况就则B知道自然的选择,但不知道A的
选择,这时博弈树如下:
A
开发
不开发
N
N




B
B
B
B
开发
不开发 开发
不开发 开发
不开发 开发
不开发
(-5,-5)
(0,-8) (-3,-3)
(1,0) (0,8) (0,0) (0,1)
(0,0)
上述房地产开发博弈还有另一种表示:
N
大(1/2)
小(1/2)
注意:行为策略是在A(hi)上随机化,而混合策 略则是在Si( 即A(hi) 的乘积 空 间)上的随机化
定 理 (Kuhn,1953) 在完美回忆博弈中,混合 策略与行为策略是等价的。
完美回忆指没有参与人会忘记以前知道的信息。
例 下列展开型博弈不具备完美回忆:
相关文档
最新文档