第三章完全信息动态博弈2

合集下载

第3讲完全信息动态博弈

q2 0
最优化的一阶条件意味着： s（q1）（a q1 c） =1 2 2
第3讲完全信息动态博弈
假定q1 a c。这实际上是库诺特模型中企业2的反应函数，不同的是，这里，s（q1）是当企业1选择q1时企业2的实际选择，而在库诺 2 特模型中，R2 q1）是企业2对于假设的q1的最优反应。（因为企业1预测到企业2将根据s（q1）选择q 2，企业1在第一阶段的问 2 题是： max 1 = q1，s（q1）=q1 a q1 s（q1） c）（ 2 2
第3讲完全信息动态博弈
• 这个例子也说明，在博弈中，拥有信息优势可能使参与人处于劣势，而这在单人决策中是不可能的。企业2在斯坦克尔伯格博弈中的利润之所以低于库诺特博弈中的利润，是因为它在决策之前就知道了企业1的产量。即使企业1先行动，但如果企业2在决策之前不能观测到企业1的产量，我们就回到了库诺特均衡，因为此时，企业1的先动优势就不存在了。
第3讲完全信息动态博弈
* 1 回忆一下，在上一讲得到的库诺特模型的纳什均衡是q1 =q* = （a c）， 2 3 3 比较这两个结果，发现斯坦克尔伯格均衡的总产量（a c）大于库诺特 4 2 的总产量（a c）。但是，企业1的斯坦克尔伯格均衡产量大于库诺特 3
均衡产量，而企业2的斯坦克尔伯格均衡产量小于库诺特均衡产量。因为企业1本来可以选择库诺特均衡产量但它没有选择，说明企业1在斯坦克尔伯格博弈中的利润大于库诺特博弈中的利润，而总产量上升意味着总利润下降了从而企业2的利润一定下降了。这就是所谓的“先动优势”。
第3讲完全信息动态博弈
• 宏观经济政策的动态一致性宏观经济学上与子博弈精炼纳什均衡相对应的概念是政府政策的动态一致性（dynamic consistency 或time consistency）。政府政策的动态一致性指的是，一个政策不仅在制定阶段应该是最优的（从政府的角度），而且在指定之后的执行阶段也应该是最优的，假设没有任何新的信息出现。如果一个政策只是在制定阶段是最优的，而在执行阶段并不是最优的，这个政策就是动态不一致的。说它是动态不一致的，是因为

北京大学博弈论课件第3章-完全信息动态博弈

❖ 路径用线段表示。在线段旁注明相应的策略。 ❖ 在“市场争夺战”博弈中，首先行动的潜在进入者可以采取两种策略：“不进入”
和“进入”。因此，从初始节点处引出两条线段，在两条线段旁分别标识“不进入”和“进入”。 ❖ 当潜在进入者选择结束后，达到在位者的节点。 ❖ 在位者有两个选择：“斗争”和“默许”。 ❖ 因此，从在位者的节点处引出两条线段，在两条线段旁分别标识“斗争”和“默许”。
❖ 博弈树中每个节点都独立构成一个信息集，没有虚线连接两个或多个博弈树节点。 ❖ 求解完全且完美信息动态博弈的重要方法之一是：逆向归纳法。 ❖ 可以通过“海盗分宝博弈”这个生动有趣的故事对“逆向归纳法”进行一个直观
介绍。
一、海盗分宝博弈
❖ 1．海盗分宝博弈的规则 ❖ 五个海盗首先进行抽签，确定决策顺序。 ❖ 五个海盗按照决策顺序依次提出对 100 个金币的分配方案。 ❖ 第一个海盗提出一个分配方案，如超过半数的海盗（包括提出分配方案的海盗）
2021/8/1
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第三章 POWERPOINT TEMPLATE
❖ 在完全信息动态博弈中，博弈参与者的行动存在先后顺序。 ❖ 可以用博弈树表示完全信息动态博弈。 ❖ 可以通过逆向归纳法求解完全信息动态博弈的子博弈精炼纳什
均衡，剔除不可置信的威胁。
第一节完全信息动态博弈概述
❖ 一、完全信息动态博弈的定义在完全信息静态博弈中，博弈参与者同时采取行动。但在完全信息动态博弈中，博弈参与者的行动存在先后顺序。从信息角度上，完全信息动态博弈与完全信息静态博弈类似，博弈参与者对博弈结构、博弈顺序、双方收益等信息都具备完全了解。

第三章信息经济学的研究方法—博弈论

第一节概述-人生处处皆博弈
人生是永不停歇的博弈过程，博弈意略达到合意的结果。
作为博弈者，最佳策略是最大限度地利用游戏规则，最大化自己的利益；
作为社会最佳策略，是通过规则使社会整体福利增加。
一、博弈论的定义
博弈论（game theory，又译为对策论，游戏论）
定义：研究决策主体的行为在直接相互作用时，人们如何进行决策、以及这种决策如何达到均衡。
五、博弈论与信息经济学
博弈论是给定信息结构求均衡结果，它实际上是一种均衡理论，我们最终要找的是一个均衡的结果，博弈论是方法论导向的，它实际上是一种解决问题的方法。它是一个实证的方法。
信息经济学是给定信息结构求契约的安排。它实际上是一种契约设计理论，它是问题导向的。它是一个规范的方法。
石匠的决策与拳击手的决策的区别
一、博弈论的定义
2、理性人假设理性人是指一个很好定义的偏好，在面临给定的约束条件下
最大化自己的偏好。
博弈论说起来有些绕嘴，但理解起来很好理解，那就是每个对弈者在决定采取哪种行动时，不但要根据自身的利益和目的行事，而且要考虑到他的决策行为对其他人可能的影响，通过选择最佳行动计划，来寻求收益或效用的最大化。
（一）囚徒困境
假定：（1）每个局中人都知道博弈规则和博弈结果的支付
矩阵；（2）每个局中人都是理性的（个人理性和个人最优
决策）；（3）不能“串通”
（一）囚徒困境——纳什均衡
囚徒A
坦白
坦白囚徒 B
-8，-8
抵赖 -10，0
抵赖 0，-10 -1，-1
-8大于-10 0大于-1
（坦白，坦白）是纳什均衡
第三章信息经济学的研究方法 ——博弈论

博弈论第三章完全信息动态博弈讲解

房地产开发博弈
开发
A hA(1) 不开发
h表示信息集
N hN(1)
需求大
需求小
N hN(2)
需求大
需求小
B hB(1)
开发
不开发
B hB(2)
B hB(3)
开发
不开发开发不开发开发
B hB(4)
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8) (0,0) (0,1) 单位:百万元
定义一个展开式博弈的子博弈G 由一个决策结x 和所有该决策结的后继结T(x)( 包括终点结0 组成, 它满足下列条件:⑴x 是一个单点信息结即h(x)={x};⑵对于所有的 x′∈T(x),如果x″∈h(x′),则x″∈T(x)。
(3)
N
1/3
2/3
1
Y1
z1
1
x1
w1
(2,6) (5,6)
2
2
a2 (9,0)
b2 (0,3)
a2 (9,5)
b2 (0,3)
3.3 子博弈与子博弈完美
Nash 均衡在原则上适用所有的博弈,但对于预测参与人的行为来说,Nash均衡可能并不是一个合理的预测, 如房地产博弈:
A
开发
不开发
A
开发
不开发
B
B
B
B
开发不开发开发不开发开发不开发开发
不开发
有了信息集的概念, 展开式表示也可以用来表示静态博弈, 如“囚徒的困境 ”博弈可以表示为:
1
坦白
2

第三讲完全信息动态博弈

第三章完全信息动态博弈第一节完全信息动态博弈的扩展式表述动态博弈的根本特征是，参与人的行动有先后顺序，且后行动的参与人在自己行动之前能观测到先行动的参与人的行动，特别是能根据先行动的参与人的行动调整或做出自己的战略选择。

运用战略式表述动态博弈的缺陷表现在：1．看不出行动的先后顺序；2．对于描述2人以上的博弈较不方便。

因此，扩展式表述extensive form representation被用于描述动态博弈。

一、扩展式表述的要素1．参与人集合：i=1,……,n。

此外，用N代表虚拟参与人“自然”。

2．参与人的行动顺序the order of moves：谁在什么时候行动。

3．参与人的行动空间action set：在每次行动时，参与人有些什么选择。

4．参与人的信息集information set：每次行动时，参与人知道些什么。

5．参与人的支付函数：在行动结束之后，每个参与人得到些什么（支付是所有行动的函数）。

6．外生事件（即自然的选择）的概率分布。

如同两人有限博弈的战略表述可以用支付矩阵表示一样，n人有限博弈的扩展式表述可以用博弈树game tree表示。

二、博弈树的基本建筑材料building blocks（4，4）（8，）（-3，-3）1，），8），），1），）图3-1（一）结nodes1．结的分类（1）决策结decision nodes：参与人采取行动的时点。

包括：起点结——initial nodes非起点结——（2）终点结terminal nodes：博弈行动路径的终点。

2．结的顺序关系precedence relation用X表示所有结的集合，x∈X表示某个特定的结。

x≺x"表示“x在x"之前”≺3．前列集the set of predecessors和后续集the set of successors定义P(x)为在x之前的所有结的集合，简称为x的前列集；定义T(x)为x之后的所有结的集合，简称为x的后续集。

经济博弈论_谢识予_2_完全信息动态博弈0.1

单结信息集:只包含一个决策结的信息集完美（Perfect）信息：博弈树的所有信息都是单结的。 ——博弈中没有任何参与人同时行动，且后行动者能观察到先行动者的行动，且所有参与人观察到N的行动）
1 动态博弈的扩展式表述

静态博弈用扩展式表述 A
坦白抵赖坦白
Q:何为完全信息？ B
抵赖
囚徒困境博弈
-3，-3 -4，-3
-3，-3 0，0
1，-2 -4，-3 割耳
1，-2 0，0 (-3,-3) (1，-2) 默认割耳 (-4,-3) (0,0)
三个NE: (不画,{割耳,默认}) (画,{默认，割耳}) (画,{默认，默认})
画小孩不画
父亲
父亲
默认
4 NE的缺陷——不可置信的威胁
换句话说，与抽烟有关决策不是单人在中性环境中的决定，而是一种博弈。“今日卡门”和不同偏好的卡门自己，即“未来卡门”间的博弈。

5 逆向归纳法
继续抽未来的卡门不抽今天的卡门
-1，1
1，-1
0,0 两个“卡门”如何行事？未来卡门如何行事？考虑到未来卡门的未来行动，今日卡门今日如何行事？

2 动态博弈中的策略

博弈树中参与人在结点上所选择的单个行动—— 一步/招 (move)
美中军事博弈

但是，参与人可以制定一个行动计划，将每个决策结上的选择都事先规定好，即使这个决策点实际上不会出美国现。——策略
中国中国
策略：人不犯我、我不犯人；人若犯我、我必犯人
不犯人
(-2,-2) (2,-4) (3,-5) (0,0)
4 NE的缺陷——不可置信的威胁

第三章完全且完美信息动态博弈

第三章完全且完美信息动态博弈在动态博弈中，参与者需要根据对手的行为和策略来调整自己的行动，以便达到最佳的结果。

动态博弈可以分为完全信息动态博弈和不完全信息动态博弈。

完全信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数，而不完全信息动态博弈则是指参与者不知道其他参与者的策略和收益函数。

在完全信息动态博弈中，参与者可以通过观察对手的行为来推断出对手的策略和收益函数。

这种博弈可以通过逆向归纳法来求解，即从博弈的阶段开始，逐步向前推导出每个阶段的最佳策略。

逆向归纳法是一种有效的求解完全信息动态博弈的方法，它可以帮助参与者找到最佳策略，从而实现最佳的结果。

然而，在现实世界中，完全信息动态博弈并不常见。

大多数博弈都是不完全信息动态博弈，参与者无法知道其他参与者的策略和收益函数。

在这种情况下，参与者需要通过观察对手的行为和策略来推断出对手的类型和收益函数。

这种博弈可以通过贝叶斯纳什均衡来求解，即参与者根据对手的类型和收益函数来选择自己的策略，以达到最佳的结果。

完全且完美信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数，并且参与者能够观察到其他参与者的行为和策略。

这种博弈可以通过逆向归纳法和贝叶斯纳什均衡来求解，从而帮助参与者找到最佳策略，实现最佳的结果。

在完全且完美信息动态博弈中，参与者可以通过观察对手的行为和策略来推断出对手的类型和收益函数，从而调整自己的策略，以实现最佳的结果。

在完全且完美信息动态博弈中，参与者之间的互动是基于透明和预知性的。

每个参与者不仅清楚自己的策略选择和可能的收益，同时也了解其他参与者将如何根据这些信息做出反应。

这种透明度使得参与者能够做出更加精确的决策，因为他们能够预测对手的行动并据此调整自己的策略。

这种博弈的一个关键特点是，参与者之间的信息是对称的。

这意味着没有参与者拥有其他参与者所不知道的信息优势。

这种信息对称性使得博弈变得更加公平，因为它消除了信息不对称带来的不确定性。

博弈论前四章笔记整理

博弈论前四章笔记整理第一章：博弈论基础概念。

- 博弈的定义与要素。

- 博弈是指在一定的规则下，多个参与者（至少两个）进行策略选择并得到相应结果（收益）的过程。

- 要素包括参与者（局中人）、策略（每个参与者可选择的行动方案）、收益（每个参与者在不同策略组合下的所得）。

例如在“囚徒困境”中，两个囚犯是参与者，坦白或不坦白是他们的策略，不同策略组合下的刑期长短就是收益。

- 博弈的分类。

- 按参与者数量可分为两人博弈和多人博弈。

- 按策略空间是否有限分为有限博弈和无限博弈。

如猜硬币是有限博弈（正面或反面两种策略），企业的产量竞争（产量可在一定范围内连续取值）可能是无限博弈。

- 按收益情况分为零和博弈（一方的收益就是另一方的损失，总和为零，如赌博）、常和博弈（收益总和为常数）和非零和博弈（收益总和不为零，如企业合作共同开拓市场，双方都可能获利）。

第二章：完全信息静态博弈。

- 策略式表述（标准式表述）- 通常用一个矩阵来表示，行代表一个参与者的策略，列代表另一个参与者的策略，矩阵中的元素是对应的收益组合。

以“性别战”为例，丈夫和妻子选择看电影或看球赛，就可以构建一个2×2的收益矩阵。

- 占优策略均衡。

- 占优策略是指无论其他参与者选择什么策略，该策略都是某个参与者的最优策略。

如果每个参与者都有占优策略，那么由这些占优策略组成的策略组合就是占优策略均衡。

例如在“囚徒困境”中，每个囚徒的占优策略都是坦白，所以（坦白，坦白）是占优策略均衡。

- 纳什均衡。

- 纳什均衡是指在一个策略组合中，每个参与者的策略都是对其他参与者策略的最优反应。

即给定其他参与者的策略，没有参与者有动机单方面改变自己的策略。

与占优策略均衡不同，纳什均衡并不要求每个参与者都有占优策略。

例如在“性别战”中，（看电影，看电影）和（看球赛，看球赛）都是纳什均衡。

第三章：完全信息动态博弈。

- 扩展式表述。

- 包括博弈树的构建，节点表示参与者的决策点，树枝表示可选择的策略，终端节点表示博弈的结果并标有相应的收益。

3.2完全且完美信息动态博弈

动态博弈的一个中心问题是“可信性”问题。所谓可信性是指动态博弈中先行为的参与人是否该相信后行为的参与人会采取对自己有利的或不利的行为。因为后行为方将来会采取对先行为方有利的行为相当于一种“许诺”，而将来会采取对先行为方不利的行为相当于一种“威胁”，因此我们可将可信性分为“许诺的可信性”和 “威胁的可信性”
我们以“开金矿博弈”为例来讨论可信性问题
甲要开采一价值4万元的金矿，缺1万元的资金，向乙借1万元，许诺采到金子后与乙平分。乙是否借钱给甲呢？
乙最需要关心的就是甲采到金子后是否会履行诺言跟自己平分，因为万一甲采到金子后不但不跟乙平分，而且还赖帐或卷款潜逃，则乙连自己的本钱都收不回来。关键的是要判断的许诺是否可信！以自身利益最大化原则，甲必然选择不分！乙清楚甲的行为准则，最好的选择是不借！对乙来说，甲的许诺是不可信的！要想使甲的许诺成为可信的，加上第三阶段，让乙在甲违约时采用法律手段---“打官司”，乙的利益受到法律保护，甲的许诺是可信的。乙在第一阶段选择借，甲在第二阶段选择分。
行动有先后顺序，不同的参与人在不同时
点行动，先行动者的选择影响后行动者的选择空间，后行动者可以观察到先行动者做了什么选择。因此，为了做出最优的行动选择，每个参与人都必须这样思考问题：如果我如此选择，对方将如何应对？如果我是他，我将会如何行动？给定他的应对，什么是我的最优选择？

动态博弈的有效分析概念，除了要符合纳什
均衡的基本要求以外，还必须满足另一个关键的要求，那就是它（或者它们）必须能够排除博弈方策略中不可信的行为设定，也就是各种不可信的威胁和承诺。只有满足这样要求的均衡概念在动态博弈分析中才有真正的稳定性，才能对动态博弈作出有效的分析和预测。

信息经济学第三章博弈论

信息经济学第三章博弈论
目录
• 博弈论基本概念 • 完全信息静态博弈 • 完全信息动态博弈 • 不完全信息静态博弈 • 不完全信息动态博弈 • 博弈论在信息经济学中应用
01
博弈论基本概念
博弈论定义与特点
博弈论是研究决策过程中参与者之间相互作用和影响的理论。
博弈论的特点包括：参与者之间的相互影响、策略的选择和收益的分配。
混合策略在静态博弈中应用
混合策略定义
在静态博弈中，参与人选择以一定的概率分布随机选择不同策略的行为。
应用场景
当参与人无法确定对手的策略选择时，采用混合策略可以增加对手的不确定性，从而提高自身的期望收益。
示例
在石头、剪刀、布游戏中，每个参与人随机选择出拳的策略就是一种混合策略的应用。
信号传递机制在静态博弈中作用
如环保税、碳交易制度等。
案例：拍卖、招标等经济活动中的博弈论应用
拍卖中的博弈论
拍卖是一种典型的博弈论应用场景，通过竞价机制实现资源的有效配置。常见的拍卖方式有英式拍卖、荷兰式拍卖、密封拍卖等。
招标中的博弈论
招标是一种采购方式，通过竞争机制引导供应商提供优质的商品和服务。招标过程中需要考虑价格、质量、信誉等多个因素，博弈论可以帮助制定有效的招标策略。
机制设计原理及其在信息经济学中应用
机制设计原理
01
通过设计合理的规则和制度，引导参与者的行为，实现资源的
有效配置和社会福利最大化。
信息经济学中的应用
02
在信息不对称的情况下，通过机制设计实现信息的有效传递和
资源的优化配置，如价格机制、竞争机制等。
激励机制设计
03
通过设计合理的激励机制，引导参与者的行为符合社会目标，

经济博弈论(第三章)

第三章完全信息动态博弈上一章介绍了完全信息静态博弈，本章在前面的基础上探讨完全信息动态博弈。

现实社会经济活动的决策大多数是有先后顺序的行为而不是同时选择的行为，而且后行者能够看到先行者的决策内容，在先行者的决策结果之后再定夺自己的策略。

这样的经济行为比比皆是，如商业活动中的讨价还价，拍卖活动中的轮流竞价，资本市场上的收购兼并和反收购兼并都是如此。

依次选择与一次性同时选择有很大的差异，因此这种决策问题构成的博弈也是从时间序列上有别于静态博弈的，我们称之为“动态博弈”（Dynamic Games）。

例如下象棋通常需要两个参与人，我们定义为红方和黑方，红方先走，黑方后走，这是一个典型的完全信息动态博弈。

动态博弈由于添加了时间因素，因而更加贴近现实。

根据博弈方是否相互了解得益情况，可分为“完全信息动态博弈”和“不完全信息动态博弈”，根据是否所有博弈方都对自己选择前的博弈过程完全了解，可分为“完美信息动态博弈”和“不完美信息动态博弈”。

在本章中，我们首先对博弈的扩展式表达给出完整的定义，为动态博弈的分析奠定基础；其次，我们从扩展式表述博弈的纳什均衡分析逐步深入到子博弈精炼纳什均衡，为动态博弈的分析提供可行的方法，接下来介绍两种完全信息动态博弈经典模型；最后，分析具有无穷次的重复博弈，推导出无名氏定理。

3.1 博弈的扩展式表述在动态博弈中，博弈方的行动是有先后次序的，且后行动者在自己行动之前能够观测到先行动者的行动，每个博弈方的一次选择行为常称为一个“阶段”（Stage ）。

动态博弈中也可能存在几个博弈方同时选择的情况，这时博弈方的同时选择构成一个阶段。

一个动态博弈至少有两个阶段，因此动态博弈有时也称为“多阶段博弈”（Multistage Games ）。

此外，也有把动态博弈称为“序列博弈”（Sequential Games ）的，这也是由动态博弈中的次序特征引出来的。

设有一个商人要从A 地向B 地运输一批货物。

经典：博弈论-完全信息动态博弈

高需求低需求不完全信息情形下的博弈：需求方的信号承诺长协价格从年度定价到季度定价
2、博弈的扩展式表述的要素
博弈的扩展式表述包含以下要素：（1）参与人集合：i=1，2，…，n。此外，用N代表虚拟
参与人——自然。（2）行动顺序：谁在什么时候行动。（3）参与人的行动空间：（4）参与人的信息集：（5）参与人的策略集：（6）参与人的支付函数：（7）外生事件的概率分布。
博弈的收益矩阵
（1）高需求
开发开发商A 不开发
（2）低需求
开发开发商A 不开发
开发商B
开发
不开发
2, 2
4, 0
0, 4
0, 0
开发商B
开发
不开发
－1, －1
1, 0
0, 1
0, 0
博弈分类
按开发商博弈的先后顺序分：静态博弈：两个开发商同时决策，或后决策者不
能观察到先行动者的行动。动态博弈：博弈有先后顺序，且后决策者能观察
完全信息动态博弈图示：N A B
开发（2,2）
高需求
○
A
N
低需求
开发不开发开发不开发
不开发（4,0）
开发（0,4） B 不开发（0,0）
开发（-1,-1）不开发（1,0）
开发（0,1）不开发（0,0）
（4）不完全信息动态情形：ANB
开发商A不清楚市场的需求状态，决定是否开发；开发商B 在观察到市场需求和A的决策后决定是否开发。
到先行动者的行动后再行动。按开发商是否知道市场需求状态分：
完全信息博弈：若两个开发商都知道市场需求状态（高需求或低需求）。
不完全信息博弈：由自然决定市场的需求状态，两开发商不知道。共同知识：在市场各种可能状态和各开发商不同策略组合下的得益矩阵是双方的共同知识。

第三讲完全信息动态博弈

第15页，本讲稿共23页
在这里，Ｂ选择的策略称为“冷酷策略” （grim strategies）。冷酷策略是指重复博弈中的任何参与人的一次性不合作将引起其他参与人的永远不合作，从而导致所有参与人的收益减少。因此，所有参与人具有维持合作的积极性。我们再来讨论博弈重复次数为有限时的情况。
第16页，本讲稿共23页
第1页，本讲稿共23页
一、子博弈精炼纳什均衡
子博弈精炼纳什均衡的创立者. ——1994年诺贝尔经济学奖获奖者、莱茵哈德·泽尔腾。
泽尔腾则在60年代中期将纳什均衡概念引入动态分析。在1965年发表《需求减少条件下寡头垄断模型的对策论描述》一文，提出了“子博弈精炼纳什均衡” 的概念，又称“子对策完美纳什均衡”。这一研究对纳什均衡进行了第一次改进，选择了更具说服力的均衡点。海萨尼在60年代末把不完全信息引入博弈分析。
第9页，本讲稿共23页
以上的分析，就是子博弈精炼纳什均衡解的过程。策略（Ａ开发，Ｂ不开发）就是上述子博弈精炼纳什均衡解。 ▪ 所谓“子博弈”（sub-game）是指它本身可以作为一个独立的博弈进行分析，它是原博弈的一部分。例如，在表3－1中，每一行或每一列都是整个博弈的一个子博弈。而且，任何博弈本身可被称为自身的一个子博弈。 ▪ 只有当某一策略组合在每一个子博弈（包括原博弈）上都构成一个纳什均衡，这一策略组合才是子博弈精炼纳什均衡解。显然，如果整个博弈是惟一的子博弈，纳什均衡与子博弈精炼纳什均衡是完全相同的。
第18页，本讲稿共23页
三、动态博弈策略行动
在动态博弈中，由于参与人的行动有先后顺序，而参与人行动顺序直接影响博弈的结果。因此，参与人为了使其他参与人的选择对自己有利，往往会主动采取一些行动影响其他参与人对自己行为的预期，从而达到对自己有利的结果。参与人所采取的这些行为称之为“策略行”（strategic move）。

第三章完全信息动态博弈

是指参与人在每一信息集上随机地选
择行动的概率。
一个行为战略规定了对应每一个信息集的行动集合上的概率分布，且不同信息集上的概率分布是独立的。
bi表示参与人i的一个行为战略。
b △ ( A ( h )) i h H i i i
△(A(hi))表示在行动集合A(hi)上的概率分布
2、行为战略纳什均衡：
第三章完全信息动态博弈
Dynamic Games of Complete Information
@ 2009 Zheng Daowen, All Rights Reserved
动态博弈：参与人的行动有先后顺序，且后
行动者在自己行动之前能观测到先行动者的行动。
第一节博弈的扩展式表述
一、博弈的战略式表述与扩展式表述的区别
开始的后续阶段构成的博弈。它必须有一
个初始信息集，且具备进行博弈所需要的
各种信息。
定义：一个扩展式博弈的子博弈G由一个决策结组成，它满足下列条件：（1）x是一个单结信息集，即h(x)={x} （2）对于所有的x1∈T(x), 如果x＂∈h(x1)，那么x＂∈T(x)
x和所有该决策结的后续结T(x)（包括终点结）
厂商 A
开发不开发
-3，-3 0，1
-3，-3 0，0
1，0 0，1
1，0 0，0
相关代号：
si---纯战略，是参与人i相机行动的计划
ui---支付函数。 hk+1---the history at the end of stage k, which is the sequence of actions in the previous periods:
– 分类：决策结(decision nodes)；终点结 (terminal nodes)。 – 特性：

第三章扩展式博弈与完全信息动态博弈ppt课件

严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
1
L
x1
R
2
2
L x2 R
3
L x3 R
3
L x4 R L x5 R L x6 R L x7 R
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
下图表示参与人3选择时，即不知道参与人2的选择，也不知道参与人1的选择的博弈情形。
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
例如
• 在“新产品开发博弈”中，假设企业1先行动，企业2后行动，但企业2行动时不知道企业1的行动。
企业2行动时，只知道博弈要么到达点x2，要么达到点x3 ，但具体在哪一点上，企业2不清楚。也就是说，企业2 只知道自己位于决策结集合{x2, x3 }上，但不知道位于{x2, x3 }中哪一个决策结上。
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
一、扩展式博弈
• 所谓扩展式博弈(extensive form game)是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。
• 试用扩展式博弈对两个企业都知道市场需求，且企业1先决策，企业2观测到企业1的选择后再进行选择的博弈情形即完全信息动态的“新产品开发博弈”进行建模。

第3章博弈论与信息经济学--完全信息动态博弈

©&® by H. Q. Feng, CUFE 17/58
二、子博弈精炼纳什均衡
第三，由于不考虑自己选择对别人选择的影响，纳均衡允许了不可置信威胁的存在。如“市场阻挠博弈”中，如果进入者者真的进入，在位者的最优行动显然是默许而不是斗争，因为默许带来50的利润，斗争则将预期的利润化为乌有。所以，斗争是一种不可置信的威胁，
©&® by H. Q. Feng, CUFE 21/58
二、子博弈精炼纳什均衡
泽尔腾的“子博弈精炼纳什均衡”
一个纳什均衡称为精炼纳什均衡，当且仅当参与人的战略在每一个子博弈中都构成纳什均衡。
就是说，组成精炼纳什均衡的战略必须在每一个子博弈中都是最优的。
©&® by H. Q. Feng, CUFE
就是说，如果在位企业摆出一副“你进入我斗争”的架势，那么进入企业不应该被这种威胁所吓倒。因为它是不可置信的。但是，纳什均衡概念承认了这种不可置信的威胁，所以（不进入，斗争）便成为一个纳什均衡。
©&® by H. Q. Feng, CUFE 18/58
子博弈精炼纳什均衡-不可置信威胁
美国普林斯顿大学古尔教授1997年在《经济学透视》里发表文章，提出一个例子说明威胁的可信性问题：两兄弟老是为玩具吵架，哥哥老是要抢弟弟的玩具，不耐烦的父亲宣布政策：好好去玩，不要吵我，不管你们谁向我告状，我都把你们两个关起来，关起来比没有玩具更可怕。现在，哥哥又把弟弟的玩具抢去玩了，弟弟没有办法，只好说：快把玩具还我，不然我就要去告诉爸爸。哥哥想，你真要告诉爸爸，我是要倒霉的，可是你不告状不过没有玩具玩，而告了状却要被关禁闭，告状会使你的境遇变得更坏，所以你不会告状，因此哥哥对弟弟的警告置之不理。的确，如果弟弟是会算计自己利益的理性人，在这样的环境下，还是不告状的好。可见，弟弟是理性人，他的告状威胁是不可置信的。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

房地产开发博弈收益
B在决策时有不确定性
A
开发
不开发
N
大
1/2
小
1/2
大
1/2
N
小
1/2
B
B
B
B 不开发
不开发
不开发
不开发开发
开发
开发
开发
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
房地产开发博弈
B知道自然的选择; 但不知道A 的选择(或A、 B同时决策)
参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数
A
参与人(A,B,N)
结,初始结
开发
不开发
战略
外生事件的概率分布
N
结,决策结
信息集
B
开发
大
1/2
小
1/2
枝
不开发
B
B
不开发
开发
开发
大
1/2
N
小
1/2
B 不开发
不开发开发
终点结
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
进入者
进入在位者不进入（0，300）
合作（40，50）斗争（-10，0）
不可置信威胁
进入者
进入在位者不进入（0，300）
合作（40，50）斗争（10，0）
可信威胁
3.1 动态博弈的表示法和特点
3.1.1 阶段和扩展性表示 3.1.2 动态博弈的基本特点
3.1.1 阶段和扩展性表示
• 阶段：动态博弈中一个博弈方的一次选择行为 • 例子：仿冒和反仿冒博弈
抵赖坦白坦白
坦白
抵赖
(-8,-8) (0，-10) (-10,0) (-1,-1) (-8,-8) (0，-10) (-10,0) (-1,-1)
囚徒困境博弈的扩展式表述
3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
3.2.1 相机选择和策略中的可信性问题
• 自然总是假定是单结的，因为自然在参与人决策之后行动等价于自然在参与人之前行动但参与人不能观测到自然的行动。
• 不同的博弈树可以代表相同的博弈，但是有一个基本规则：一个参与人在决策之前知道的事情，必须出现在该参与人决策结之前。
囚徒困境博弈的扩展式表述
A
坦白
抵赖
B
坦白
抵赖
B
抵赖
坦白
B
A
A
抵赖
• 那么，根据定义，生活中有些什么动态博弈呢？
复习2：完美信息与不完美信息
• 完美信息的博弈是指在博弈的任何阶段，每个参与者都清楚博弈之前发生的所有行动，也即每个信息集都是一个单元素集合。
• 没有完美信息的博弈具有不完美信息。
复习3：完全信息与不完全信息
• 按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。
A
开发
N
大
1/2
小
1/2
不开发
大
1/2
N
小
1/2
B
B
B
B 不开发
不开发
不开发
不开发开发
开发
ห้องสมุดไป่ตู้
开发
开发
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
房地产开发博弈
博弈扩展式表述
• 只包含一个决策结的信息集称为单结信息集，如果博弈树的所有信息都是单结的，该博弈称为完美信息博弈。
仿冒
A 不仿冒
制止
（-2，5）制止
B 不制止（0，10）仿冒 A 不仿冒 B 不制止（5，5）
（2，2）
（10，4）
3.1.2 动态博弈的基本特点
• 策略是在整个博弈中所有选择、行为的计划
• 结果是上述“计划型”策略的策略组合，构成一条路径
• 收益对应每条路径，而不是对应选择、行为
• 动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。
• 先选择、行为的博弈方有时更有利，有 “先行优势”。
一博弈扩展式表述
博弈的基本构造
结: 包括决策结和终点结两类;决策结是参与人行动的始点,终点结是决策人行动的终点.
✓结满足传递性和非对称性
✓x之前的所有结的集合，称为x的前列集P （x），x之后的所有结的集合称为x的后续集T（x）。
博弈扩展式表述
本章分六节
3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5有同时选择的动态博弈模型 3.6动态博弈分析的问题和扩展讨论
复习1：什么是动态博弈
• 动态博弈(dynamic game)是指参与人的行动有先后顺序，而且行动在后者可以观察到行动在先者的选择，并据此作出相应的选择。
不同版本的开金矿博弈——分钱和打官司的可信性
乙
借
不借
分甲不分（1，0）
（2，2）（0，4）
开金矿博弈
3.2.1 相机选择和策略中的可信性问题
乙
借
不借
甲分
（2，2）打
（1，0）
（1，0）不分乙
不打
（0，4）
有法律保障的开金矿博弈 ——分钱打官司都可信
3.2.1 相机选择和策略中的可信性问题
第三章完全、完美信息动态博弈
本章讨论动态博弈，所有博弈方都对博弈过程和收益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。
• 完全信息博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。
• 如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息，在这种情况下进行的博弈就是不完全信息博弈。
一个动态博弈的例子：产业进入壁垒
借
乙不借
甲分（2，2）
打
（1，0）不分
乙不打
（-1，0）（0，4）
3.2.2 纳什均衡的问题
第三种开金矿博弈中，（不借-不打，不分）和（借 -打，分）都是纳什均衡。但后者不可信，不可能实现或稳定。
• 结论：纳什均衡在动态博弈可能缺乏稳定性，也就是说，在完全信息静态博弈中稳定的纳什均衡，在动态博弈中可能是不稳定的，不能作为预测的基础。
枝: 枝是从一个决策结到它的直接后续结的连线, 每一个枝代表参与人的一个行动选择.
信息集: 每个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结:
✓ 1 每个决策结都是同一个参与人的决策结;
✓ 2 该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结
参与人集合

第三章 完全信息动态博弈2

第3讲 完全信息动态博弈

北京大学博弈论课件第3章-完全信息动态博弈

第三章信息经济学的研究方法—博弈论

博弈论 第 三 章 完全信息动态博弈讲解

第三讲 完全信息动态博弈

经济博弈论_谢识予_2_完全信息动态博弈0.1

第三章完全且完美信息动态博弈

博弈论前四章笔记整理

3.2完全且完美信息动态博弈

信息经济学第三章博弈论

经济博弈论(第三章)

经典：博弈论-完全信息动态博弈

第三讲完全信息动态博弈

第三章 完全信息动态博弈

第三章扩展式博弈与完全信息动态博弈ppt课件

第3章 博弈论与信息经济学--完全信息动态博弈

第三章完全信息动态博弈2

第3讲完全信息动态博弈

博弈论第三章完全信息动态博弈讲解

第三讲完全信息动态博弈

第三章完全信息动态博弈

第3章博弈论与信息经济学--完全信息动态博弈