第三章扩展式博弈与完全信息动态博弈讲义

合集下载

第3讲 完全信息动态博弈

第3讲 完全信息动态博弈
q2 0
最优化的一阶条件意味着: s(q1) (a q1 c) =1 2 2
第3讲 完全信息动态博弈
假定q1 a c。这实际上是库诺特模型中企业2的反应函数,不同的 是,这里,s(q1)是当企业1选择q1时企业2的实际选择,而在库诺 2 特模型中,R2 q1)是企业2对于假设的q1的最优反应。 ( 因为企业1预测到企业2将根据s(q1)选择q 2,企业1在第一阶段的问 2 题是: max 1 = q1,s(q1)=q1 a q1 s(q1) c) ( 2 2
第3讲 完全信息动态博弈
• 这个例子也说明,在博弈中,拥有信息优势可能 使参与人处于劣势,而这在单人决策中是不可能 的。企业2在斯坦克尔伯格博弈中的利润之所以低 于库诺特博弈中的利润,是因为它在决策之前就 知道了企业1的产量。即使企业1先行动,但如果 企业2在决策之前不能观测到企业1的产量,我们 就回到了库诺特均衡,因为此时,企业1的先动优 势就不存在了。
第3讲 完全信息动态博弈
* 1 回忆一下,在上一讲得到的库诺特模型的纳什均衡是q1 =q* = (a c), 2 3 3 比较这两个结果,发现斯坦克尔伯格均衡的总产量 (a c)大于库诺特 4 2 的总产量 (a c)。但是,企业1的斯坦克尔伯格均衡产量大于库诺特 3
均衡产量,而企业2的斯坦克尔伯格均衡产量小于库诺特均衡产量。 因为企业1本来可以选择库诺特均衡产量但它没有选择,说明企业1在斯坦 克尔伯格博弈中的利润大于库诺特博弈中的利润,而总产量上升意味着 总利润下降了从而企业2的利润一定下降了。这就是所谓的“先动优势”。
第3讲 完全信息动态博弈
• 宏观经济政策的动态一致性 宏观经济学上与子博弈精炼纳什均衡相对应的概 念是政府政策的动态一致性(dynamic consistency 或time consistency)。政府政策 的动态一致性指的是,一个政策不仅在制定阶段 应该是最优的(从政府的角度),而且在指定之 后的执行阶段也应该是最优的,假设没有任何新 的信息出现。如果一个政策只是在制定阶段是最 优的,而在执行阶段并不是最优的,这个政策就 是动态不一致的。说它是动态不一致的,是因为

第三章 完全信息动态博弈 ppt课件

第三章 完全信息动态博弈  ppt课件

条路径。但每条路径可由不同的策略组合决定。
例如, (开发,(不开发,开发))决定了
A -> 开发 -> B -> 不开发 -> (1,0)
该路径还可由(开发,(不开发,不开发))决定。
事实上,该问题共有4条路径,8种策略组合。
ppt课件
12
§2 子博弈精炼纳什均衡
对于动态博弈,Nash均衡可能并不是一个合理的预测。 如房地产博弈:
又如,上例中,如果进入者先行动,而在位者在 行动前能准确知道前者的行动,那么在位者的信息 集为 {进入}或{不进入}。 反之,若在位者先行动, 则在位者的信息集为{进入,不进入}。
ppt课件
7
三、 动态博弈的相关概念
(3) • 完美信息(Perfect information):一个局中人在行动
时,对之前博弈进程有准确了解,即每一个信息集只包含 一个值,则称该局中人具有完美信息。 • 如果动态博弈的所有局中人都有完美信息,则称为完美信 息的动态博弈。 • 如果动态博弈中,存在部分局中人具有不完美信息,称为 不完美信息的动态博弈。
思考:若进入者真的进入,在位者的最优行动是“默许”。 所以“斗争”是一种不可置信的威胁(即使在位企业摆出 一副“你进入我就斗争”的架势,进入企业不应被吓到)。 而静态博弈承认这种不可置信的威胁,使(不进入,斗争) 成为一个Nash均衡。
动态博弈解决方案:剔除不可置信的威胁策略
ppt课件
3
扩展阅读:不可置信的威胁策略 引出信息经济学重要的概念—— 承诺行动(Commitment)。
ppt课件
18
三、 逆向归纳法求解子博弈精炼Nash均衡
• 从动态博弈的最后一个阶段局中人的行为开始分析

第三讲完全且完美信息动态博弈a讲义

第三讲完全且完美信息动态博弈a讲义
第三 完全且完美信息动态博弈
本章讨论动态博弈,所有博弈方都对博弈过程和 得益完全了解的完全且完美信息动态博弈。这类博 弈也是现实中常见的基本博弈类型。由于动态博弈 中博弈方的选择、行为有先后次序,因此在表示方 法、利益关系、分析方法和均衡概念等方面,都与 静态博弈有很大区别。本章对动态博弈分析的概念 和方法,特别是子博弈完美均衡和逆推归纳法作系 统介绍,并介绍各种经典的动态博弈模型。
企业、政府与商业环境
博弈论与企业竞争
两个纳什均衡
纳什均衡之一是如果A进入市场,B就威胁选择商战,所以A不进入市场 另一个纳什均衡是A选择进入,B随之选择容纳
容纳 (900,1100)
进入
A
B
商战 (-200,600)
不进入
(0, 3000)
企业、政府与商业环境
博弈论与企业竞争
一个子博弈纳什精炼均衡
可信性:动态博弈中先行为的博弈方是否应该相信后 行为博弈方会采取某种策略或行为。
后行为博弈方将来采取对先行为博弈方有利的行为为 “许诺”,采取对先行方不利的行为为“威胁”。
8
2020/7/31
多阶段博弈
序列博弈
参与者选择策略有时间先后的顺 序,通常采用博弈的扩展形式来 进行分析
例子:进入博弈
形成额外的剩余生产能力可以阻止进入,潜在进入者知道他一旦进入,价格战就必然发生, 因而构成可置信的威胁
形成剩余生产能力的行动在序列博弈中常带有先发制人的意图,因此这种行动被称为事先承 诺博弈
企业、政府与商业环境
博弈论与企业竞争
3.1.1开金矿
条件:甲去开采一价值4万元的金矿,缺1万元,乙恰 好有1万元可以投资。甲向乙借1万元可以可开金矿, 并“许诺”成功后与对半分成。

第三讲 完全信息动态博弈

第三讲  完全信息动态博弈

第三章完全信息动态博弈第一节完全信息动态博弈的扩展式表述动态博弈的根本特征是,参与人的行动有先后顺序,且后行动的参与人在自己行动之前能观测到先行动的参与人的行动,特别是能根据先行动的参与人的行动调整或做出自己的战略选择。

运用战略式表述动态博弈的缺陷表现在:1.看不出行动的先后顺序;2.对于描述2人以上的博弈较不方便。

因此,扩展式表述extensive form representation被用于描述动态博弈。

一、扩展式表述的要素1.参与人集合:i=1,……,n。

此外,用N代表虚拟参与人“自然”。

2.参与人的行动顺序the order of moves:谁在什么时候行动。

3.参与人的行动空间action set:在每次行动时,参与人有些什么选择。

4.参与人的信息集information set:每次行动时,参与人知道些什么。

5.参与人的支付函数:在行动结束之后,每个参与人得到些什么(支付是所有行动的函数)。

6.外生事件(即自然的选择)的概率分布。

如同两人有限博弈的战略表述可以用支付矩阵表示一样,n人有限博弈的扩展式表述可以用博弈树game tree表示。

二、博弈树的基本建筑材料building blocks(4,4)(8,)(-3,-3)1,),8),),1),)图3-1(一)结nodes1.结的分类(1)决策结decision nodes:参与人采取行动的时点。

包括:起点结——initial nodes非起点结——(2)终点结terminal nodes:博弈行动路径的终点。

2.结的顺序关系precedence relation用X表示所有结的集合,x∈X表示某个特定的结。

x≺x"表示“x在x"之前”≺3.前列集the set of predecessors和后续集the set of successors定义P(x)为在x之前的所有结的集合,简称为x的前列集;定义T(x)为x之后的所有结的集合,简称为x的后续集。

第三章扩展型博弈论

第三章扩展型博弈论
假设甲先行动,商铺乙看到对方的选择后再决定是否进货,请求 出子博弈完美纳什均衡?
如果甲先行动,但在博弈开始前商铺主乙有一次行动A的机会, 请利用子博弈完美纳什均衡概念分析下述两种情况下的博弈结果
(1)A:商铺主乙逢人便说自己一定要进货,无论对方如何行 动他都不会改变这个决定;
(2)A:商铺主乙与某个嘲笑他说大话的第三者丙打赌:如果 自己到时不进货,向丙支付1500元;如果自己到时候进货,丙 向他支付100元。并且,乙将这个赌局通知甲。


进 乙
不进 乙
进 乙
不进 乙

不进 进
不 进

不进 进
不 进
(-1000,-1000) (0,1000) (0,0)(-1000,-900)
(0,1100)(0,-1500)
(1000,0)
(1000,-1500)
作业: 阅读“蜈蚣博弈”
拍卖人拿出一张10元钞票,请大家给这张
钞票开价,无底价,竞拍者可无限制的轮 流叫价,每次叫价的增幅以5毛为单位,出 价最高者可以得到这张10元钞票,但出价
即每阶段都选“不坦白”,A总得益贴现为
2 ( 2 ) ( 2 ) 2 .. . 2

1(6) 2 1 1
1 时,A选“不坦白”是最优的,即

1 5
时,A在没有人先选“坦白”时选“不坦白”是最优的,并且A 在之后每阶段都选“不坦白”是最优的选择。


坦白 不坦白
坦白 -6,-6 -1,-8
最高和次高者都要向拍卖人支付出价数目 的费用。
——苏比克拍卖模型
第四节
重复博弈
重复博弈
单次博弈重复进行构成的博弈过程,但博 弈方的行为和博弈结果不一定是单次博弈 的简单重复,其中,单次博弈可称为阶段 博弈

博弈论全套上课课件ch3 完全信息动态博弈

博弈论全套上课课件ch3 完全信息动态博弈
南京农业大学经济管理学院 王艳
16
智猪博弈的扩展式表述?
小猪 按 大猪 按
5,1
等待
4,4 0,0
等待 9,-1
南京农业大学经济管理学院 王艳
17
3、完美记忆博弈game of perfect recall

所有参与人都不会忘记曾经知道过的任何 信息,清楚他们前面所选择的行动。
南京农业大学经济管理学院 王艳
第三章 完全信息动态博弈
主要内容


一、博弈扩展式表述 二、逆向归纳法与子博弈精炼纳什均衡 三、应用举例
南京农业大学经济管理学院 王艳
2
引例- 房地产开发项目
假设有A、B两家开发商
市场需求:可能大,也可能小 投入:1亿
假定市场上有两栋楼出售:
需求大时,每栋售价1.4亿, 需求小时,售价7千万;
支付
6
南京农业大学经济管理学院 王艳
一 、博弈扩展式表述

结: 包括决策结和终点结两类;决策结是参与人行 动的时点,终点结是博弈行动路径的终点. 结满足传递性和非对称性 枝: 枝是从一个决策结到它的直接后续结的连线, 每一个枝代表参与人的一个行动选择. 信息集: 每个信息集是决策结集合的一个子集,该 子集包括所有满足下列条件的决策结:
R L
R
图3.7
南京农业大学经济管理学院 王艳
15
囚徒困境博弈的扩展式表述
A
坦白 抵赖
B
坦白
抵赖
B
抵赖 坦白
B
坦白
A
抵赖 坦白
A
抵赖 坦白 抵赖
(-8,-8)
(0,-10)
(-10,0) (-1,-1)
(-8,-8) (0,-10) (-10,0)

(完整版)完全信息动态博弈.ppt

(完整版)完全信息动态博弈.ppt

(四)参与人在博弈树中的顺序
1、排序的基本原则
一个参与人在决策之前知道的事情必须出现在该 参与人的决策结之前。
2、自然人的排序
– 如果参与人不能观测到虚拟人——自然的行动, 自然的决策结置于该参与人的前后都一样;
– 自然的信息集总是假定为单结。
N
大 1/2 A
小 1/2 A


发开

B
B
开发
不开发 开发 不开发
– 博弈的战略式表述只包括三个要 素
– 扩展式表述包括以下六个方面的 要素
扩展式表述包括以下六个方面的要素:
– 参与人集合:i=1、2、…,n;并且用大写N代表 虚拟的参与人——“自然”;
– 参与人的行动顺序(The order of moves):谁在什么 时候行动;
– 参与人的行动空间(Action set):在每次行动时, 参与人有些什么选择;
A
坦白 抵赖
B
B
坦白
抵赖
抵赖
坦白
(-8, -8) (0,-10) (-10, 0) (-1,-1)
B
坦白 A
抵赖 A
坦白
抵赖
抵赖
坦白
(-8, -8) (0,-10) (-10, 0) (-1,-1)
(五)完美回忆
完美回忆(Perfect recall)是指没有参与人会 忘记自己以前知道的事情,所有参与人都 知道自己以前的选择。
第三章 完全信息动态博弈
Dynamic Games of Complete Information
@ 2009 Zheng Daowen, All Rights Reserved
动态博弈:参与人的行动有先后顺序,且后 行动者在自己行动之前能观测到先行动者 的行动。

博弈论 完全信息动态博弈(1)

博弈论 完全信息动态博弈(1)

完美信息博弈:N → A →B情形
自然先确定市场需求状态:高需求或低 需求;开发商A在观察到市场需求状态后 决定是否开发;开发商B在观察到市场需 求状态和A的决策后再决定是否开发。 开发 开发 高需求 ○ N 低需求 不开发 A 开发 不开发 B (2,2)
不开发 (4,0) 开发 不开发 (0,4) (0,0)
不开发 开发 不开发 开发 不开发
1-p
不开发
完全信息静态博弈的博弈树
开发 开发 高需求 ○ N 低需求 不开发 A 开发 不开发 B (2,2) 不开发 (4,0) 开发 (0,4) 不开发 (0,0) 开发 (-1,-1) 不开发 (1,0) 开发 (0,1) 不开发 (0,0)
不完全信息静态博弈的博弈树
枝的图示
枝是一个从决策结到它 的直接后续结的连线, 代表参与人的一个行动 选择。 枝:不但完整地描述了 每一个决策结参与人的 行动空间,而且给出了 从一个决策结到下一个 决策结的路径。
1 U z1 L z2 P z3 D 2 R 3 Q z4
(3) 信息集
博弈树上所有决策结分割成不同的信息集(记为 h∈H),它是X的一个子集,满足: (1)每一个决策结都是同一参与人的决策结; (2)该参与人知道博弈进入该集合的某个决策结, 但不知道究竟处于哪一个决策结。 记h(x)是X中包含x的信息集,如果x″∈h(x),则满足: (1)x∉P(x″),且x″ ∉P(x); (2)i(x)=i(x″); (3)A(x)=A(x″)。 在此基础上,即可用A(h)表示给定信息集h下的行动 集合。
要素详解
参与人:博弈中的决策主体,有时包括“自然” 作为“虚拟参与人”。 行动:是参与人在博弈的某个时点的决策变量。 行动组合:参与人的行动的有序集。 行动顺序:静态博弈和动态博弈 信息:是参与人有关博弈的知识,如有关“自然” 的选择、其他参与人的特征和行动的知识等。 完全信息(complete information) 完美信息(perfect information) 对称信息(symmetric information) 确定信息(certain information)

经典:博弈论-完全信息动态博弈

经典:博弈论-完全信息动态博弈
高需求 低需求 不完全信息情形下的博弈: 需求方的信号 承诺 长协价格从年度定价到季度定价
2、博弈的扩展式表述的要素
博弈的扩展式表述包含以下要素: (1) 参与人集合:i=1,2,…,n。此外,用N代表虚拟
参与人——自然。 (2) 行动顺序:谁在什么时候行动。 (3) 参与人的行动空间: (4) 参与人的信息集: (5) 参与人的策略集: (6) 参与人的支付函数: (7)外生事件的概率分布。
博弈的收益矩阵
(1)高需求
开发 开发商A 不开发
(2)低需求
开发 开发商A 不开发
开发商B
开发
不开发
2, 2
4, 0
0, 4
0, 0
开发商B
开发
不开发
-1, -1
1, 0
0, 1
0, 0
博弈分类
按开发商博弈的先后顺序分: 静态博弈:两个开发商同时决策,或后决策者不
能观察到先行动者的行动。 动态博弈:博弈有先后顺序,且后决策者能观察
完全信息动态博弈图示:N A B
开发 (2,2)
高需求

A
N
低需求
开发 不开发 开发 不开发
不开发 (4,0)
开发 (0,4) B 不开发 (0,0)
开发 (-1,-1) 不开发 (1,0)
开发 (0,1) 不开发 (0,0)
(4)不完全信息动态情形:ANB
开发商A不清楚市场的需求状态,决定是否开发; 开发商B 在观察到市场需求和A的决策后决定是否开发。
到先行动者的行动后再行动。 按开发商是否知道市场需求状态分:
完全信息博弈:若两个开发商都知道市场需求状 态(高需求或低需求)。
不完全信息博弈:由自然决定市场的需求状态, 两开发商不知道。 共同知识:在市场各种可能状态和各开发商不同策 略组合下的得益矩阵是双方的共同知识。

博弈论 第 三 章 完全信息动态博弈讲解

博弈论 第 三 章  完全信息动态博弈讲解

不坦白
坦白
不坦白
(-5,-5)
(0,-8) (-8,0)
(-1,-1)
注 意: 得 益 向 量 的 次 序 与 参 与 人 决 策 的 顺 序 一 致。
同样地,展开型博弈也可以用策略式来表示, 如
展开型博弈:
1
T
B
2
L
R
2
L
R
(2,2)
(4,0) ((1,0)
可以表示为:
T
参 与 人1
B
参 与 人2
注意:行为策略是在A(hi)上随机化,而混合策 略则是在Si( 即A(hi) 的乘积 空 间)上的随机化
定 理 (Kuhn,1953) 在完美回忆博弈中,混合 策略与行为策略是等价的。
完美回忆指没有参与人会忘记以前知道的信息。
例 下列展开型博弈不具备完美回忆:
A 2
1
B
2
L
R
L
R
1
C
D
1
CD
1
C
D
如果博弈树的所有信息集都是单结的, 则称该 博弈为完美(perfect)息 博弈。(无虚线连接), 而完全(complete)信息博弈是指得益函数和纯 策略空间均为博弈各方的共同知识。完全信息 可以是完美的也可以是不完美的。
3.2 展开型博弈的策略与均衡
一、 行 为 策 略 在策略型博弈中, 参与人的策略是进行博
定 义 一 个 展 开 式 博 弈 的 子 博 弈G 由 一 个 决 策 结x 和 所 有 该 决 策 结 的 后继结T(x)( 包 括终点结0 组 成, 它 满 足 下 列 条 件:⑴x 是 一 个 单 点 信 息 结即h(x)={x}; ⑵对于所有的 x′ ∈T(x), 如果x″ ∈h(x′), 则x″ ∈T(x) 。

博弈论(对策论)扩展-完全且完美信息动态博弈讲义

博弈论(对策论)扩展-完全且完美信息动态博弈讲义
逆推归纳法是动态博弈分析最重要、 基本的方法。
开金矿博弈


不借


不借

乙 不分
(1,0) 分

(2,2)
(0,4)
(2,2) 打
(1,0) 不分 甲
不打
开金矿博弈
(1,0)
(0,4)
有法律保障的开金矿博弈
子博弈和子博弈完美纳什均衡
子博弈
定义:由一个动态博弈 第一阶段以外的某阶段 开始的后续博弈阶段构 成的,有初始信息集和 进行博弈所需要的全部 信息,能够自成一个博 弈的原博弈的一部分, 称为原动态博弈的一个 “子博弈”。
u1 q1P(Q) c1q1 q1[8 (q1 q2)] 2q1 6q1 q1q2 q12
u2 q2P(Q) c2q2 q2[8 (q1 q2)] 2q2 6q2 q1q2 q22
厂商1 厂商2
产量 3单位 1.5单位
得益 4.5 2.25
先行优势
讨价还价博弈
三回合讨价还价
接受:w(E)-E>0
接受:w(S)-S>0
1
委托
不委托
2
接受
[R(0),0] 拒绝
2
努力
[R(0),0] 偷懒
[R(E)-w(E), w(E)-E]
[R(S)-w(S), w(S)-S]
参与约束
代理人的选择
激励相容约束:
w(E)-E> w(S)-S w(E)> w(S)+E-S
委托人的选择
1
甲 借
乙 分
不分
(2,2) 打
甲Leabharlann 不借 (1,0)不打(1,0) (0,4)

第三章 完全信息动态博弈

第三章  完全信息动态博弈

是指参与人在每一信息集上随机地选
择行动的概率 。
一个行为战略规定了对应每一个信息集的行动集 合上的概率分布,且不同信息集上的概率分布 是独立的。
bi表示参与人i的一个行为战略。
b △ ( A ( h )) i h H i i i
△(A(hi))表示在行动集合A(hi)上的概率分布
2、行为战略纳什均衡:
第三章 完全信息动态博弈
Dynamic Games of Complete Information
@ 2009 Zheng Daowen, All Rights Reserved
动态博弈:参与人的行动有先后顺序,且后
行动者在自己行动之前能观测到先行动者 的行动。
第一节 博弈的扩展式表述
一、博弈的战略式表述与扩展式表 述的区别
开始的后续阶段构成的博弈。它必须有一
个初始信息集,且具备进行博弈所需要的
各种信息。
定义:一个扩展式博弈的子博弈G由一个决策结 组成,它满足下列条件: (1)x是一个单结信息集,即h(x)={x} (2)对于所有的x1∈T(x), 如果x"∈h(x1),那么x"∈T(x)
x和所有该决策结的后续结T(x)(包括终点结)
厂 商 A
开发 不开发
-3,-3 0,1
-3,-3 0,0
1,0 0,1
1,0 0,0
相关代号:
si---纯战略,是参与人i相机行动的计划
ui---支付函数。 hk+1---the history at the end of stage k, which is the sequence of actions in the previous periods:
– 分类:决策结(decision nodes);终点结 (terminal nodes)。 – 特性:

第三章扩展式博弈与完全信息动态博弈ppt课件

第三章扩展式博弈与完全信息动态博弈ppt课件

严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
1
L
x1
R
2
2
L x2 R
3
L x3 R
3
L x4 R L x5 R L x6 R L x7 R
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
下图表示参与人3选择时,即不知道参与人2的选 择,也不知道参与人1的选择的博弈情形。
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
例如
• 在“新产品开发博弈”中,假设企业1先行动, 企业2后行动,但企业2行动时不知道企业1的 行动。
企业2行动时,只知道 博弈要么到达点x2,要 么达到点x3 ,但具体在 哪一点上,企业2不清 楚。也就是说,企业2 只知道自己位于决策结 集合{x2, x3 }上,但不知 道位于{x2, x3 }中哪一个 决策结上。
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
一、扩展式博弈
• 所谓扩展式博弈(extensive form game)是 博弈问题的一种规范性描述。与战略式 博弈侧重博弈结果的描述相比,扩展式 博弈更注重对参与人在博弈过程中所遇 到决策问题的序列结构的详细分析。
• 试用扩展式博弈对两个企业都知道市场 需求,且企业1先决策,企业2观测到企 业1的选择后再进行选择的博弈情形即完 全信息动态的“新产品开发博弈”进行 建模。

第3章 博弈论与信息经济学--完全信息动态博弈

第3章 博弈论与信息经济学--完全信息动态博弈
©&® by H. Q. Feng, CUFE 17/58
二、子博弈精炼纳什均衡
第三,由于不考虑自己选择对别人选择的影响,纳 均衡允许了不可置信威胁的存在。如“市场阻挠博 弈”中,如果进入者者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润, 斗争则将预期的利润化为乌有。所以,斗争是一种 不可置信的威胁,
©&® by H. Q. Feng, CUFE 21/58
二、子博弈精炼纳什均衡
泽尔腾的“子博弈精炼纳什均衡”
一个纳什均衡称为精炼纳什均衡,当且仅当参与 人的战略在每一个子博弈中都构成纳什均衡。
就是说,组成精炼纳什均衡的战略必须在每一个 子博弈中都是最优的。
©&® by H. Q. Feng, CUFE
就是说,如果在位企业摆出一副“你进入我斗争”的 架势,那么进入企业不应该被这种威胁所吓倒。因 为它是不可置信的。但是,纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)便成为 一个纳什均衡。
©&® by H. Q. Feng, CUFE 18/58
子博弈精炼纳什均衡-不可置信威胁
美国普林斯顿大学古尔教授1997年在《经济学透视》里发表文 章,提出一个例子说明威胁的可信性问题: 两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦 的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告 状,我都把你们两个关起来,关起来比没有玩具更可怕。现 在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说: 快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告 诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而 告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你 不会告状,因此哥哥对弟弟的警告置之不理。 的确,如果弟弟是会算计自己利益的理性人,在这样的环境下, 还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可 置信的。

第三章完全且完美信息动态博弈

第三章完全且完美信息动态博弈
是一个??????ni1ssss?三逆向归纳法求解子博弈精炼纳什均衡三逆向归纳法求解子博弈精炼纳什均衡对于有限的完全信息动态博弈先行动的博弈方在选择自己的行动时必须先要考虑后行动的博弈方在后面阶段也就是原博弈的子博弈中的选择将是怎样的因此后面阶段或子博弈是动态博弈中首先需要样的因此后面阶段或子博弈是动态博弈中首先需要关注的将这个思路推而广之就得到了我们解析动态博弈的一般方法逆向归纳法
对于有限的完全信息动态博弈,先行动的博弈方 在选择自己的行动时必须先要考虑后行动的博弈方在 后面阶段(也就是原博弈的子博弈)中的选择将是怎 样的,因此后面阶段或子博弈是动态博弈中首先需要 关注的,将这个思路推而广之,就得到了我们解析动 态博弈的一般方法——逆向归纳法。
定义: 逆向归纳法就是从动态博弈的最后一个阶
第三章 完全且完美信息动态博弈
▪ 动态博弈的表示方法; ▪ 可信性和纳什均衡的问题; ▪ 子博弈和子博弈完美纳什均衡; ▪ 几个经典动态博弈模型; ▪ 有同时选择的动态博弈模型; ▪ 动态博弈分析的问题和扩展讨论。
第一节 动态博弈的表示方法和特点
一、动态博弈的阶段和扩展形表示 动态博弈中一个博弈方的一次行为选择称为一 个 “阶段”(Stage)。动态博弈也称为 “序列博 弈”(Sequential Games); 由于扩展形可以反映动态博弈中博弈方的选择 次序和博弈的阶段,因此是表示(阶段数和博弈方 可选行为数量较少的)动态博弈的最佳方法。动态 博弈有时也被称为“扩展形博弈”(Extensive Form Game)。
根据上述假设,不难知道两厂商的得益函数分
别为:
u 1 q 1 [ 8 ( q 1 q 2 ) 2 ] q 1 6 q 1 q 1 q 2 q 1 2

u 2 q 2 [ 8 ( q 1 q 2 ) 2 ] q 2 6 q 2 q 1 q 2 q 2 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息集上)、不知道什么(不知道自己位于
信息集中哪一个决策结上)。
例如
• 在“新产品开发博弈”中,假设企业1先行动, 企业2后行动,但企业2行动时不知道企业1的 行动。
企业2行动时,只知道 博弈要么到达点x2,要 么达到点x3 ,但具体在 哪一点上,企业2不清 楚。也就是说,企业2 只知道自己位于决策结 集合{x2, x3 }上,但不知 道位于{x2, x3 }中哪一个 决策结上。
完全信息动态的“新产品开发博弈”的扩 展式博弈包括以下要素:
(1) 参与人是企业1和2;
(2) 企业1先行动,企业2后行动;
(3) 企业1行动时有两种选择——“开发”和 “不开发”,企业1行动时不知道企业2 的行动;企业2行动时有两种选择—— “开发”和“不开发”,但企业2行动时 已经知道企业1的行动;
下图表示参与人3选择时,知道参与人1的选择, 但不知道参与人2的选择的博弈情形。
1
L
x1
R
2
2
L x2 R
L x3 R
3
3
L x4 R L x5 R L x6 R L x7 R
的选择”这一问题,实际上就等价于
“企业2行动时是否知道自己是在博弈树
中的点x2上还是在点x3上”。
• 为了将“企业2行动时是否知道自己是
在博弈树中的点x2上还是在点x3上”这 一点说清楚,需要引入“信息集”(infor
mation set)的概念。
• 在博弈树中,参与人i的一个信息集(用Ii表示) 是参与人i决策结的一个集合,它满足以下两
• 设X为一决策结集合,用Ii(X)表示参与人 的由决策结集X构成的一个信息集。
• 例如,I2({x2, x3})表示企业2的由决策结集 {x2, x3}构成的信息集,I2({x2})和I2({x3}) 分别表示企业2的由决策结集{x2}和{x3}构 成的信息集。
• 可以在博弈树中将同一信息集中的决策结 用虚线连接起来。
第三章 扩展式博弈与完全信 息动态博弈
主要内容: 一、扩展式博弈 二、扩展式博弈的战略及其Nash均衡 三、两种博弈描述形式的比较
一、扩展式博弈
• 所谓扩展式博弈(extensive form game)是 博弈问题的一种规范性描述。与战略式 博弈侧重博弈结果的描述相比,扩展式 博弈更注重对参与人在博弈过程中所遇 到决策问题的序列结构的详细分析。
动; (3) 每个参与人行动时面临的决策问题,包括参
与人行动时可供他选择的行动方案以及他所 了解的信息; (4) 参与人的支付函数,即博弈结束时每个参与 人得到的博弈结果。
例子: “新产品开发博弈”
• 试用扩展式博弈对两个企业都知道市场 需求,且企业1先决策,企业2观测到企 业1的选择后再进行选择的博弈情形即完 全信息动态的“新产品开发博弈”进行 建模。
• 十分直观的扩展式博弈的描述方 式——博弈树。
• 所谓博弈树就是由结和有向枝构成的 “有向树”。
企有最业“上1开端的发的选”一择和个点(用空心圆 “表不示开),发表”示,博弈的开始 。 分表别示用博标弈有达到 “该开点发时”企和业的 “所不得开,发其”中的, 有支向付枝向表量示中。的 第一个数字表 示企业1的所得, 第二个数字表 示企业2的所 得。
研究博弈问题的具体进程必须弄清楚的两个问题
(1) 每个参与人在什么时候行动(决策); (2) 每个参与人行动时,他所面临决策问题
的结构。这包括参与人行动时可供他选 择的行动方案,以及参与人行动时所了 解的信息。
扩展式博弈的定义:
扩展式博弈包括以下要素: (1) 参与人集合 {1, 2,..., n} ; (2) 参与人的行动顺序,即每个参与人在何时行
(4) 两个企业的支付如下:

对手不开发,获利润800万元
需求大
企业 开发(a):投入2千万元资金需求小对 对对手 手手不 开开开 发发发 ,,, 赔获获 4利0利0润万润3元0200万0万元元
不开发(b):不投入资金,利润为0
• 例子中,用文字描述的方法给出了博弈 问题的扩展式描述。
• 但可以想象,如果我们遇到的是更为复 杂的博弈问题,文字描述可以?
择,即知道企业1选择了“开发”还是
“不开发”,因此,企业2知道博弈是从
x1到了x2还是从x1到了x3。这就意味着当 轮到企业2决策时,他知道自己是在点x2 上还是在点x3上;
• 对于第二种情形,企业2不知道企业1的
选择,即不知道博弈是从x1到了x2还是从 x1到了x3。因此,当轮到企业2决策时, 他不知道自己是在点x2上还是在点x3上。 所以,“企业2行动时是否观测到企业1
问题:
• 如何在博弈树中,将“企业2行动时 是否观测到企业1的选择”这一信息 表示出来?
• 在完全信息动态的“新产品开发博弈” 中,企业2决策时,企业1已经做出选 择。此时,企业2面临的决策情形就 有以下两种:
(1) 企业2知道企业1的选择;
(2) 企业2不知道企业1的选择。
• 对于第一种情形,企业2知道企业1的选
将“企业1”标示在点x
1上,表示博弈开始于 企业1的选择。
决策结
称为博弈树的结(node)
回过来再考察上图中的博弈树,可以得到 这样的信息:
(1) 博弈中的参与人是企业1和企业2; (2) 博弈中企业1先选择,企业2后选择; (3) 企业1选择时有行动“开发”和“不开
发”,企业2选择的行动有“开发”和 “不开发”;
个条件:
(1) Ii中的每个决策结都是参与人i的决策结;
(2) 当博弈到达信息集Ii(即博弈到达Ii中某个决策 结)时,参与人i知道自己是在信息集Ii中的决 策结上,但不知道自己究竟在Ii中哪个决策结 上。
• 因此,参与人i的信息集Ii可以用来描述: 当轮到参与人i行动时,他所了解到的信
息,即他知道什么(知道自己位于哪一个
(4) 博弈中企业的支付。
• 也就是说,除了“企业2行动时是否观测 到企业1的选择”这一点,暂时无法从上 图中知道以外,完全信息动态的“新产 品开发博弈”的扩展式描述所需要的信 息(或要素),都可以从上图中得到。
• 如果还能够直接从博弈树中知道“企业2 行动时是否观测到企业1的选择”,那么 给出博弈树,就意味着给出了完全信息 动态的“新产品开发博弈”的扩展式描 述。
相关文档
最新文档