第一课完全完美信息动态博弈
合集下载
完全完美信息动态博弈
• 子博弈完美纳什均衡本身也是纳什均衡,不过它是比纳什均衡更强 的解。
• 子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因 此是真正稳定的。
• 子博弈是倒着看的,从最小的子博弈开始我们就找稳定策略组合, 直至最开始的节点,那么当然是稳定的了。大家会发展这正是逆推 归纳法。
• 逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。
• 战略空间是连续函数:产量。
(-2,5) 制止
仿冒
A 不仿冒
B 不制止 (5,5)
(2,2)
(10,4)
4.1.2 动态博弈的基本特点
• 策略是在整个博弈中所有选择、行为的计划,不能分割。 • 结果是上述“计划型”策略的策略组合,构成一条路径. • 得益对应每条路径,而不是对应每步选择、行为.
• 动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。先 选择、行为的博弈方常常更有利,有“先行优势”。
动)开始。这里参与者1面临的选择是L’’。那么在第二阶段,参与者2预测 到一旦博弈进入到第三阶段,则参与者1会选择L’’ ,这会使2的收益为0, 从而参与者2在第二阶段的选择为:L‘可得收益1, R“可得收益0,于是 L‘是最优的。
• 这样在第一阶段,参与者1预测到如果博弈进入到第二阶段,2将选择L’, 使参与者1的收益为1,从而参与者1在第一阶段的选择是:L收益为2, R收益 为1,于是L是最优的。
乙
借
不借
甲
分
(2,2) 打
(1,0) 不分
乙
不打
(-1,0)
(0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
• 第一个图中,通过法律手段使乙的利益得到保障,这样乙的完整策略: “第一阶段借,如果第二阶段甲不分,第三阶段打官司。”甲的完整策 略是:“第二阶段分。”这是这个3阶段动态博弈的解。
• 子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因 此是真正稳定的。
• 子博弈是倒着看的,从最小的子博弈开始我们就找稳定策略组合, 直至最开始的节点,那么当然是稳定的了。大家会发展这正是逆推 归纳法。
• 逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。
• 战略空间是连续函数:产量。
(-2,5) 制止
仿冒
A 不仿冒
B 不制止 (5,5)
(2,2)
(10,4)
4.1.2 动态博弈的基本特点
• 策略是在整个博弈中所有选择、行为的计划,不能分割。 • 结果是上述“计划型”策略的策略组合,构成一条路径. • 得益对应每条路径,而不是对应每步选择、行为.
• 动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。先 选择、行为的博弈方常常更有利,有“先行优势”。
动)开始。这里参与者1面临的选择是L’’。那么在第二阶段,参与者2预测 到一旦博弈进入到第三阶段,则参与者1会选择L’’ ,这会使2的收益为0, 从而参与者2在第二阶段的选择为:L‘可得收益1, R“可得收益0,于是 L‘是最优的。
• 这样在第一阶段,参与者1预测到如果博弈进入到第二阶段,2将选择L’, 使参与者1的收益为1,从而参与者1在第一阶段的选择是:L收益为2, R收益 为1,于是L是最优的。
乙
借
不借
甲
分
(2,2) 打
(1,0) 不分
乙
不打
(-1,0)
(0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
• 第一个图中,通过法律手段使乙的利益得到保障,这样乙的完整策略: “第一阶段借,如果第二阶段甲不分,第三阶段打官司。”甲的完整策 略是:“第二阶段分。”这是这个3阶段动态博弈的解。
完全信息动态博弈 ppt课件
泽尔腾引入子博弈精练纳什均衡的概念的 目的是将那些不可置信威胁策略的纳什均 衡从均衡中剔除,从而给出动态博弈的一 个合理的预测结果,简单说,子博弈精练 纳什均衡要求均衡策略的行为规则在每一 个信息集上是最优的。
策略的表述
✓ 策略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
✓ 参与人集合 ✓ 每个参与人的策略集合 ✓ 由策略组合决定的每个参与人的支付
进入者
进入 在位者 不进入(0,300)
合作(40,50) 斗争(-10,0)
不可置信威胁
市场进入阻挠博弈树
信息集
A
参与人(A,B,N)
结,初始结
开发
不开发
策略
B
开发
N
结,决策结
大
1/2
小
1/2
枝
不开发
B
B
不开发
开发
开发
如果市场上只有一栋楼需求大时可卖18亿需求小时可卖11亿博弈策略表述40004000800000800000不开发开发商a开发不开发开发30003000100000100000不开发开发商b开发商a开发不开发开发开发商b需求小的情况需求大的情况博弈的策略式表述由策略组合决定的每个参与人的支付进入者进入不进入0300在位者市场进入阻挠博弈树不可置信威胁合作4050斗争100开发不开发12121212开发不开发开发不开发开发不开发开发不开发4480331008000100参与人abn策略支付房地产开发博弈结决策结结终点结结初始结信息集一博弈扩展式表述博弈的基本构造包括决策结和终点结两类
第三章 完全信息动态博弈
一 博弈扩展式表述 二 子博弈精练纳什均衡 三 应用举例 28页
策略的表述
✓ 策略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
✓ 参与人集合 ✓ 每个参与人的策略集合 ✓ 由策略组合决定的每个参与人的支付
进入者
进入 在位者 不进入(0,300)
合作(40,50) 斗争(-10,0)
不可置信威胁
市场进入阻挠博弈树
信息集
A
参与人(A,B,N)
结,初始结
开发
不开发
策略
B
开发
N
结,决策结
大
1/2
小
1/2
枝
不开发
B
B
不开发
开发
开发
如果市场上只有一栋楼需求大时可卖18亿需求小时可卖11亿博弈策略表述40004000800000800000不开发开发商a开发不开发开发30003000100000100000不开发开发商b开发商a开发不开发开发开发商b需求小的情况需求大的情况博弈的策略式表述由策略组合决定的每个参与人的支付进入者进入不进入0300在位者市场进入阻挠博弈树不可置信威胁合作4050斗争100开发不开发12121212开发不开发开发不开发开发不开发开发不开发4480331008000100参与人abn策略支付房地产开发博弈结决策结结终点结结初始结信息集一博弈扩展式表述博弈的基本构造包括决策结和终点结两类
第三章 完全信息动态博弈
一 博弈扩展式表述 二 子博弈精练纳什均衡 三 应用举例 28页
完全信息动态博弈(子博弈完美的纳什均衡)
乙源自行动 (0,-2,-20)
对抗
强硬
甲
丙
不行动(-2,1,-1)
不对抗
(-1,1,0)
.
例:
2 L
1 R
(200,200) M
S (a,b)
N 1
T
(50,300)
(300,0)
➢ 若 a=100,b=150,SPNE是什么? ➢ 若改变a b的数值,能否使L-N-T成为SPNE? ➢ 什么情况下,2会获得300或更高的支付?
Stage1: 哥哥的方案若能使弟弟获得至少一半冰欺凌,则方案通过;
若不能使弟弟获得至少一半冰欺凌,则弟弟不会接受,而哥哥最 终将一无所获。
均衡路径: 哥哥提出方案为1/2:1/2, 弟弟接受
.
例:要挟诉讼
(要求赔偿S) 指控
B
拒绝
起诉
A
放弃
威胁不可 信
(TX-P-C, -TX-D)
( -C , 0 )
A
不指控
接受
( 0 ,0 ) ( S-C, -S )
若 TX<P 则 A将选择放弃
SPNE:A不指控
.
例:要挟诉讼
威胁可信
拒绝
(要求赔偿S) 指控
B
A
不指控
接受
( 0 ,0 )
起诉
A
(TX-P-C, -TX-D)
放弃
( -P- C , 0 )
(S-P-C,-S)
.
例:要挟诉讼
如果原告将P提前支付,TX-C-P>-C-P, 只要胜诉的可能大于0,原告将起诉。 如果S<TX+D, 被告将接受原告的赔偿请求。 如果TX >P+C , 原告会指控。
对抗
强硬
甲
丙
不行动(-2,1,-1)
不对抗
(-1,1,0)
.
例:
2 L
1 R
(200,200) M
S (a,b)
N 1
T
(50,300)
(300,0)
➢ 若 a=100,b=150,SPNE是什么? ➢ 若改变a b的数值,能否使L-N-T成为SPNE? ➢ 什么情况下,2会获得300或更高的支付?
Stage1: 哥哥的方案若能使弟弟获得至少一半冰欺凌,则方案通过;
若不能使弟弟获得至少一半冰欺凌,则弟弟不会接受,而哥哥最 终将一无所获。
均衡路径: 哥哥提出方案为1/2:1/2, 弟弟接受
.
例:要挟诉讼
(要求赔偿S) 指控
B
拒绝
起诉
A
放弃
威胁不可 信
(TX-P-C, -TX-D)
( -C , 0 )
A
不指控
接受
( 0 ,0 ) ( S-C, -S )
若 TX<P 则 A将选择放弃
SPNE:A不指控
.
例:要挟诉讼
威胁可信
拒绝
(要求赔偿S) 指控
B
A
不指控
接受
( 0 ,0 )
起诉
A
(TX-P-C, -TX-D)
放弃
( -P- C , 0 )
(S-P-C,-S)
.
例:要挟诉讼
如果原告将P提前支付,TX-C-P>-C-P, 只要胜诉的可能大于0,原告将起诉。 如果S<TX+D, 被告将接受原告的赔偿请求。 如果TX >P+C , 原告会指控。
北大课件博弈论与公共政策之完全信息动态博弈
第1讲之例1:囚徒困境
囚徒1
抵赖 招认
囚徒2
抵赖
招认
-1,-1
-9,0
0,-9
-6,-6
? (2)用标准式表述例6中的博弈
三、动态博弈的均衡
? 1、利用标准式表述求纳什均衡
? 2、在博弈树上找纳什均衡
四、子博弈精炼纳什均衡
? 1、可置信的威胁与不可置信的威胁
? 一种威胁所规定的行动在事前看来是最优 的,但事后看并不是参与者的最优选择, 这种威胁就是不可置信的,含有这种威胁 的策略就不是一个合理的策略。
? 甲、乙双方在签订一项合同后,乙方违约。 乙方提出和解,愿意赔偿7万元。甲方如果 上法庭,可望获得10万元赔偿,但要付出2 万元的诉讼费用。
? 甲方应当接受和解还是上法庭?
决策树
逆向归纳法
? 从右往左逐步分析。在这个过程中: ? ① 对于机会结,计算期望收益,并将相应
的值写在该结下面。 ? ② 对于决策结,还是做两件事: ? 第一,在较劣的决策枝上划叉; ? 第二,将对应于最优决策枝的收益写在该
? 结果2:仅得到2万元的修车费赔偿,概率 为30%;
? 结果3:得不到任何赔偿,概率为20%。 ? 甲方应当接受和解还是上法庭?
例4:购买土地
? 某人打算购买土地,现有A、B两块地可以 选择。A、B两块地的售价分别为30万元和 25万元。这两块地看起来差不多,所以买 方起初打算购买价格更便宜的B。但是,买 方进一步了解得知,B可能存在环境问题, 因为该地过去被堆放过大量垃圾,而A不存 在类似问题。如果B被危险垃圾污染,依照 法律规定,买方必须进行无害化处理,成 本为20万元。买方估计,B被危险垃圾污染 的概率为50%。
? ① 始于博弈树中一个单结信息集的决策结, 但不包括博弈的第一个决策结;
完全信息动态博弈最新优质PPT课件
完全信息动态博弈 POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
三人罢工博弈的博弈树
2.三人罢工博弈的策略选择与信息
1
H
O
2 H
3
H
O
O
3
H
O
H
3
H
O
2 O
3
H
O
(6, 6, 6) (3, 3, 8) (3, 8, 3) (0, 2, 2) (8, 3, 3) (2, 0, 2) (2, 2, 0) (1, 1, 1)
员工 2 只有一个信息集的博弈树
1
H
O
3 H
第二节 完全且完美信息动态博弈概述
? 在完全且完美信息动态博弈( Dynamic Game with Perfect and Complete Information )中,每个博弈参与 者均知道在自己之前进行决策的参与者选择的策略和博弈结构。
? 博弈树中每个节点都独立构成一个信息集,没有虚线连接两个或 多个博弈树节点。
? 博弈树的方法不仅能表示动态博弈,还能表示静态博弈。
嫌疑人甲
嫌疑人乙
坦白
坦白
不坦白
不坦白 嫌疑人乙
坦白
不坦白
(5, 5)
(1, 10)
(10, 1)
用博弈树表示囚徒困境
(2, 2)
? 所谓的“博弈先后顺序”,它主要是一个信息的概念,而不 是一个纯时间先后的概念。
三人罢工博弈的博弈树
2.三人罢工博弈的策略选择与信息
1
H
O
2 H
3
H
O
O
3
H
O
H
3
H
O
2 O
3
H
O
(6, 6, 6) (3, 3, 8) (3, 8, 3) (0, 2, 2) (8, 3, 3) (2, 0, 2) (2, 2, 0) (1, 1, 1)
员工 2 只有一个信息集的博弈树
1
H
O
3 H
第二节 完全且完美信息动态博弈概述
? 在完全且完美信息动态博弈( Dynamic Game with Perfect and Complete Information )中,每个博弈参与 者均知道在自己之前进行决策的参与者选择的策略和博弈结构。
? 博弈树中每个节点都独立构成一个信息集,没有虚线连接两个或 多个博弈树节点。
? 博弈树的方法不仅能表示动态博弈,还能表示静态博弈。
嫌疑人甲
嫌疑人乙
坦白
坦白
不坦白
不坦白 嫌疑人乙
坦白
不坦白
(5, 5)
(1, 10)
(10, 1)
用博弈树表示囚徒困境
(2, 2)
? 所谓的“博弈先后顺序”,它主要是一个信息的概念,而不 是一个纯时间先后的概念。
(完整版)完全信息动态博弈.ppt
(四)参与人在博弈树中的顺序
1、排序的基本原则
一个参与人在决策之前知道的事情必须出现在该 参与人的决策结之前。
2、自然人的排序
– 如果参与人不能观测到虚拟人——自然的行动, 自然的决策结置于该参与人的前后都一样;
– 自然的信息集总是假定为单结。
N
大 1/2 A
小 1/2 A
开
不
发开
发
B
B
开发
不开发 开发 不开发
– 博弈的战略式表述只包括三个要 素
– 扩展式表述包括以下六个方面的 要素
扩展式表述包括以下六个方面的要素:
– 参与人集合:i=1、2、…,n;并且用大写N代表 虚拟的参与人——“自然”;
– 参与人的行动顺序(The order of moves):谁在什么 时候行动;
– 参与人的行动空间(Action set):在每次行动时, 参与人有些什么选择;
A
坦白 抵赖
B
B
坦白
抵赖
抵赖
坦白
(-8, -8) (0,-10) (-10, 0) (-1,-1)
B
坦白 A
抵赖 A
坦白
抵赖
抵赖
坦白
(-8, -8) (0,-10) (-10, 0) (-1,-1)
(五)完美回忆
完美回忆(Perfect recall)是指没有参与人会 忘记自己以前知道的事情,所有参与人都 知道自己以前的选择。
第三章 完全信息动态博弈
Dynamic Games of Complete Information
@ 2009 Zheng Daowen, All Rights Reserved
动态博弈:参与人的行动有先后顺序,且后 行动者在自己行动之前能观测到先行动者 的行动。
博弈论完全且完美信息动态博弈.ppt
甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
能否找到子博弈?
好1差
1 不卖
1
卖
卖
不卖
2
(0,0) (0,0)
买 不买
买 不买
(2,1)
(0,0)
(1,-1)
(-1,0)
二手车交易扩展形
结论:
(1)子博弈不能包括原博弈的第一阶段, 即动态博弈本身不会是它自己的子博弈;
(2)子博弈必须有一个明确的初始信息集, 以及必须包含初始阶段之后的所有博弈 阶段,即子博弈不能分割任何信息集或在 有多节点信息集的不完美信息博弈中可 能不存在子博弈。
3.3 子博弈和子博弈完美纳什均衡
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
3.3.1 子博弈
定义:由一个动态博弈 第一阶段以外的某阶段 开始的后续博弈阶段构 成的,有初始信息集和 进行博弈所需要的全部 信息,能够自成一个博 弈的原博弈的一部分, 称为原动态博弈的一个 “子博弈”。
乙 借
第三种开金矿博弈中, (不借-不打,不分)和 (借-打,分)都是纳什均衡。但后者不可信,不 可能实现或稳定。
结论:纳什均衡在动态博弈可能缺乏稳定性,也就 是说,在完全信息静态博弈中稳定的纳什均衡,在 动态博弈中可能是不稳定的,不能作为预测的基础。
根源:纳什均衡本身不能排除博弈方策略中包含的 不可信的行为设定,不能解决动态博弈的相机选择 引起的可信性问题
《博弈论与信息经济学》
第三章
完全且完美信息动态博弈
本章讨论动态博弈,所有博弈方都对博弈 过程和得益完全了解的完全且完美信息动态博 弈。这类博弈也是现实中常见的基本博弈类型。 由于动态博弈中博弈方的选择、行为有先后次 序,因此在表示方法、利益关系、分析方法和 均衡概念等方面,都与静态博弈有很大区别。 本章对动态博弈分析的概念和方法,特别是子 博弈完美均衡和逆推归纳法作系统介绍,并介 绍各种经典的动态博弈模型。
3.2完全且完美信息动态博弈
动态博弈的一个中心问题是“可信性”问题。 所谓可信性是指动态博弈中先行为的 参与人是否该相信后行为的参与人会 采取对自己有利的或不利的行为。因为后行 为方将来会采取对先行为方有利的行为相当 于一种“许诺”,而将来会采取对先行为方 不利的行为相当于一种“威胁”,因此我们 可将可信性分为“许诺的可信性”和 “威胁的可信性”
我们以“开金矿博弈”为例来讨论可信性问题
甲要开采一价值4万元的金矿,缺1万元的资金, 向乙借1万元,许诺采到金子后与乙平分。 乙是否借钱给甲呢?
乙最需要关心的就是甲采到金子后是否会履行诺 言跟自己平分,因为万一甲采到金子后不但不跟 乙平分,而且还赖帐或卷款潜逃,则乙连自己的 本钱都收不回来。关键的是要判断的许诺是否可 信!以自身利益最大化原则,甲必然选择不分! 乙清楚甲的行为准则,最好的选择是不借!对乙 来说,甲的许诺是不可信的! 要想使甲的许诺成为可信的,加上第三阶段,让 乙在甲违约时采用法律手段---“打官司”,乙的利 益受到法律保护,甲的许诺是可信的。乙在第一 阶段选择借,甲在第二阶段选择分。
行动有先后顺序,不同的参与人在不同时
点行动,先行动者的选择影响后行动者的 选择空间,后行动者可以观察到先行动者 做了什么选择。 因此,为了做出最优的行动选择,每个参 与人都必须这样思考问题: 如果我如此选择,对方将如何应对?如果 我是他,我将会如何行动?给定他的应对, 什么是我的最优选择?
动态博弈的有效分析概念,除了要符合纳什
均衡的基本要求以外,还必须满足另一个关 键的要求,那就是它(或者它们)必须能够 排除博弈方策略中不可信的行为设定,也就 是各种不可信的威胁和承诺。 只有满足这样要求的均衡概念在动态博弈分 析中才有真正的稳定性,才能对动态博弈作 出有效的分析和预测。
第三章完全且完美信息动态博弈一
➢ 在某个阶段,可能存在几个博弈方同时选择的情况
3.1.2 动态博弈(DG)的特征
动态博弈的策略及结果
➢ 策略:各博弈方在整个博弈中轮到选择的每个阶段, 针对前面阶段的各种情况做作相应选择和行为的完 整计划。
➢ 例如:“仿冒企业A在第一阶段选择仿冒,如果第 二阶段B制止,第三阶段就不仿冒,否则第三阶段 继续仿冒” “被仿冒企业B,当第一阶段A仿冒时 第二阶段不制止,第三阶段A继续仿冒时第四阶段 制止”
3.1.2 动态博弈(DG)的特征
动态博弈的策略及结果
➢ 策略组合:由不同博弈方的这种计划组成的组合。 各博弈方的策略组合可能会形成一条联结各个阶 段的路径。
➢ 动态博弈的结果:各个博弈方的策略及策略组合、 实现的博弈路径和各博弈方的得益。
3.1.2 动态博弈(DG)的特征
动态博弈中博弈方地位的非对称性
乙
乙 借 不借
(0,4) (0,0)
(c)
乙
借 不借
甲 (0,0)
分
不分
(2,2) (-1,4)
(b)
借
不借
甲 (0,0)
分
不分
(2,2) 打
乙 不打
(-2,0)
(-1,4)
3.3 子博弈完美纳什均衡分析
一个值得关注的地方
➢ 开金矿博弈中,子博弈完美纳什均衡组合包含 第二、三阶段的选择,而实际上博弈不会进行 到第二、第三阶段,这称为“不在均衡路径上 的选择”
缺乏稳定性的根源在于不能排除“不可信”行为设 定,不能解决相机选择引起的可信性问题。所以需 要引入更强的均衡,除了满足纳什均衡,还要排除 不可信设定。
3.2.3逆推归纳法
逆推归纳法(Backwards Induction)
3.1.2 动态博弈(DG)的特征
动态博弈的策略及结果
➢ 策略:各博弈方在整个博弈中轮到选择的每个阶段, 针对前面阶段的各种情况做作相应选择和行为的完 整计划。
➢ 例如:“仿冒企业A在第一阶段选择仿冒,如果第 二阶段B制止,第三阶段就不仿冒,否则第三阶段 继续仿冒” “被仿冒企业B,当第一阶段A仿冒时 第二阶段不制止,第三阶段A继续仿冒时第四阶段 制止”
3.1.2 动态博弈(DG)的特征
动态博弈的策略及结果
➢ 策略组合:由不同博弈方的这种计划组成的组合。 各博弈方的策略组合可能会形成一条联结各个阶 段的路径。
➢ 动态博弈的结果:各个博弈方的策略及策略组合、 实现的博弈路径和各博弈方的得益。
3.1.2 动态博弈(DG)的特征
动态博弈中博弈方地位的非对称性
乙
乙 借 不借
(0,4) (0,0)
(c)
乙
借 不借
甲 (0,0)
分
不分
(2,2) (-1,4)
(b)
借
不借
甲 (0,0)
分
不分
(2,2) 打
乙 不打
(-2,0)
(-1,4)
3.3 子博弈完美纳什均衡分析
一个值得关注的地方
➢ 开金矿博弈中,子博弈完美纳什均衡组合包含 第二、三阶段的选择,而实际上博弈不会进行 到第二、第三阶段,这称为“不在均衡路径上 的选择”
缺乏稳定性的根源在于不能排除“不可信”行为设 定,不能解决相机选择引起的可信性问题。所以需 要引入更强的均衡,除了满足纳什均衡,还要排除 不可信设定。
3.2.3逆推归纳法
逆推归纳法(Backwards Induction)
5、完全且完美信息动态博弈新建
完全且完美信息 动态博弈
马林
一、完全且完美信息动态博弈 完全信息—各个博弈方是否相互了解得益情况。 完全信息—各个博弈方是否相互了解得益情况。 完美信息—所有的博弈方对自己选择前的博弈 完美信息—所有的博弈方对自己选择前的博弈 过程是否完全了解。 过程是否完全了解。 静态博弈— 静态博弈—支付矩阵来表示 动态博弈— 动态博弈—阶段和扩展形来表示
条件:每个海盗都是很聪明的人, 都能很理智的判断得失,而且每个 海盗都是非常贪婪的人,每个人都 想使自己的收益最大化。 问题:第一个海盗能不能活下来, 如果能活下来他应该提出怎样的分 配方案。
1)同意人数≥1/2(98,0,1,0,1) )同意人数≥1/2(98, 2)同意人数>1/2 )同意人数>1/2 不考虑生死,单纯理性(97, 不考虑生死,单纯理性(97,0,1,0,2) 考虑生死(97, 考虑生死(97,0,1,0,2) 或者(97,0,1,2,0) 或者(97,
你满怀兴致买了一张电影票
开场不久你发现影片极度枯燥无聊,你会? A:忍受着看完。 B:退场去做别的事情。 大多数经济学家们认为,如果你是理性的, 那就不该在做决策时考虑沉没成本。
“协和谬误” 协和谬误” 一、20世纪60年代,英国法国政府联合投资 一、20世纪60年代,英国法国政府联合投资 开发大型超音速客机(协和飞机)。 二、优点:机身大、豪华、速度快。 缺点:研究费用巨大、不确定性。 结果:由于政治法律问题,两国政府无 法停止,继续为协和式飞机提供基金。
用过瓢柔、沙宜洗发水吗? 小时候吃过大白免奶糖吗? 金康、全庸的小说你看过吗? 古尢的小说看过没? 古尢的小说看过没? 用过1BM的筆記本 用过1BM的筆記本 有一次在车站买到唐师傅的方便面......... 有一次在车站买到唐师傅的方便面......... 碧雪 雲碧 芳达 都喝过没? 都喝过没? 小说看过有本金庸新著,后来才知道作者叫金庸新! 司口司乐喝过没? 喝過娃娃哈的水沒? 据说贵州的茅合酒也挺出名 都知道洽洽瓜子吧,上次买了包吃完才发现是治治牌瓜子 踢足球,去买了双双星球鞋,回来一看,商标是双星球!
马林
一、完全且完美信息动态博弈 完全信息—各个博弈方是否相互了解得益情况。 完全信息—各个博弈方是否相互了解得益情况。 完美信息—所有的博弈方对自己选择前的博弈 完美信息—所有的博弈方对自己选择前的博弈 过程是否完全了解。 过程是否完全了解。 静态博弈— 静态博弈—支付矩阵来表示 动态博弈— 动态博弈—阶段和扩展形来表示
条件:每个海盗都是很聪明的人, 都能很理智的判断得失,而且每个 海盗都是非常贪婪的人,每个人都 想使自己的收益最大化。 问题:第一个海盗能不能活下来, 如果能活下来他应该提出怎样的分 配方案。
1)同意人数≥1/2(98,0,1,0,1) )同意人数≥1/2(98, 2)同意人数>1/2 )同意人数>1/2 不考虑生死,单纯理性(97, 不考虑生死,单纯理性(97,0,1,0,2) 考虑生死(97, 考虑生死(97,0,1,0,2) 或者(97,0,1,2,0) 或者(97,
你满怀兴致买了一张电影票
开场不久你发现影片极度枯燥无聊,你会? A:忍受着看完。 B:退场去做别的事情。 大多数经济学家们认为,如果你是理性的, 那就不该在做决策时考虑沉没成本。
“协和谬误” 协和谬误” 一、20世纪60年代,英国法国政府联合投资 一、20世纪60年代,英国法国政府联合投资 开发大型超音速客机(协和飞机)。 二、优点:机身大、豪华、速度快。 缺点:研究费用巨大、不确定性。 结果:由于政治法律问题,两国政府无 法停止,继续为协和式飞机提供基金。
用过瓢柔、沙宜洗发水吗? 小时候吃过大白免奶糖吗? 金康、全庸的小说你看过吗? 古尢的小说看过没? 古尢的小说看过没? 用过1BM的筆記本 用过1BM的筆記本 有一次在车站买到唐师傅的方便面......... 有一次在车站买到唐师傅的方便面......... 碧雪 雲碧 芳达 都喝过没? 都喝过没? 小说看过有本金庸新著,后来才知道作者叫金庸新! 司口司乐喝过没? 喝過娃娃哈的水沒? 据说贵州的茅合酒也挺出名 都知道洽洽瓜子吧,上次买了包吃完才发现是治治牌瓜子 踢足球,去买了双双星球鞋,回来一看,商标是双星球!
第三章 完全且完美信息动态博弈
第四节几个经典动态博弈模型
一、寡占的斯塔克伯格(Stackeberg)模型
也称主导产业模型,由德国经济学家斯塔克伯格(H. Von Stackelberg)在20世纪30年代提出。
厂商之间存在着行动次序的区别,产量的决定依据以下次序:领导厂商决定一个产量,跟随厂商可以观察到这个产量,然后ຫໍສະໝຸດ 据领导厂商的产量来决定他自己的产量。
乙选择不借钱。合作失败。
二、纳什均衡的问题
以收益矩阵的方法来分析“开金矿——不良的法律”博弈:
乙有三个“计划策略”:“借——打”、“借——不打”、“不借”
甲有两个“计划策略”:“分”、“不分”
由此构成如下博弈矩阵:
存在纳什均衡(借-打,分)和(不借,不分)。
通过上述分析,可知(借-打,分)并非是一个稳定的均衡。这说明纳什均衡分析在处理动态博弈的时候存在一定的缺陷。
用扩展型表示如下:
分析:逆推归纳法
如果博弈进入第三回合,甲出于利益最大化的考虑,必然自己独吞全部资材。即甲获得 ,乙得零。
乙为了不至于在第三回合中收益为零,因此,他在第二个回合的最优选择是自己所提出的方案确保不被甲所否定,而甲否定乙的方案最高可以获得 (进入第三回合),因此,乙提出的方案应使甲能够获得至少 的份额,即 。乙出于自身利益最大化的考虑,可以令 ,那么自己可以得到 。由此可知,乙如果对甲在第一回合中的分配方案不满意,从而否定之,自己有希望获得 。即,如果在第一回合中,自己的分配额少于 ,那么就应该否定甲。
用扩展型可表示为:
第三阶段:激励相容条件
代理人努力还是偷懒取决于两种选择带给他的收益。若
或
代理人选择努力。此为激励相容条件。
第二阶段:参与约束条件
要想代理人接受,需满足两个条件:
一、寡占的斯塔克伯格(Stackeberg)模型
也称主导产业模型,由德国经济学家斯塔克伯格(H. Von Stackelberg)在20世纪30年代提出。
厂商之间存在着行动次序的区别,产量的决定依据以下次序:领导厂商决定一个产量,跟随厂商可以观察到这个产量,然后ຫໍສະໝຸດ 据领导厂商的产量来决定他自己的产量。
乙选择不借钱。合作失败。
二、纳什均衡的问题
以收益矩阵的方法来分析“开金矿——不良的法律”博弈:
乙有三个“计划策略”:“借——打”、“借——不打”、“不借”
甲有两个“计划策略”:“分”、“不分”
由此构成如下博弈矩阵:
存在纳什均衡(借-打,分)和(不借,不分)。
通过上述分析,可知(借-打,分)并非是一个稳定的均衡。这说明纳什均衡分析在处理动态博弈的时候存在一定的缺陷。
用扩展型表示如下:
分析:逆推归纳法
如果博弈进入第三回合,甲出于利益最大化的考虑,必然自己独吞全部资材。即甲获得 ,乙得零。
乙为了不至于在第三回合中收益为零,因此,他在第二个回合的最优选择是自己所提出的方案确保不被甲所否定,而甲否定乙的方案最高可以获得 (进入第三回合),因此,乙提出的方案应使甲能够获得至少 的份额,即 。乙出于自身利益最大化的考虑,可以令 ,那么自己可以得到 。由此可知,乙如果对甲在第一回合中的分配方案不满意,从而否定之,自己有希望获得 。即,如果在第一回合中,自己的分配额少于 ,那么就应该否定甲。
用扩展型可表示为:
第三阶段:激励相容条件
代理人努力还是偷懒取决于两种选择带给他的收益。若
或
代理人选择努力。此为激励相容条件。
第二阶段:参与约束条件
要想代理人接受,需满足两个条件:
完全且完美信息动态博弈a
第三章 完全且完美信息动态博弈
完全-得益 完美-过程 动态-先后 请考虑以下问题:
第三章 完全且完美信息动态博弈
Catalogue
可信性问题
O1
有同时选择的两阶段动态博弈
子博弈逆推归纳法
单击添加文本
O2
O3
O4
3.1 可信性问题(信息经济学_道德风险问题)
在动态博弈中,由于过程十分重要,类似于对未来过程的了解,它本身依赖于其它博弈方的行为。那么就存在一个对其博弈方所可能采取策略的可信性问题。 可信性:动态博弈中先行为的博弈方是否应该相信后行为博弈方会采取某种策略或行为。 后行为博弈方将来采取对先行为博弈方有利的行为为“许诺”,采取对先行方不利的行为为“威胁”。
(1,0)
借
不借
分
不分
(2,2)
(1,0)
开金矿(信守)-逆推第一步
乙
借
不借
(2,2)
(1,0)
开金矿(信守)-逆推第二步
3.2.2 逆推归纳法
3.2.2 逆推归纳法-分金币
案例:5个海盗抢到了100颗宝石,每一颗都一样的大小和价值连城。他们决定这么分:1.抽签决定自己的号码(1,2,3,4,5)2.首先,由1号提出分配方案,然后大家5人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔进大海喂鲨鱼。3.如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。4.以次类推…… 条件:每个海盗都是很聪明的人,都能很理智的判断得失,从而做出选择 问题:第一个海盗提出怎样的分配方案才能够使自己的收益最大化
1
2
进
不进
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
借
乙 不借
甲 分 (2,2)
打
(1,0) 不分
乙 不打
(-1,0) (0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
• 第一个图中,通过法律手段使乙的利益得到保障,这样乙 的完整策略:“第一阶段借,如果第二阶段甲不分,第三 阶段打官司。”甲的完整策略是:“第二阶段分。”这是 这个3阶段动态博弈的解。
者1的第二次行动)开始。这里参与者1面临的选择是L’’。 那么在第二阶段,参与者2预测到一旦博弈进入到第三阶段, 则参与者1会选择L’’ ,这会使2的收益为0,从而参与者2 在第二阶段的选择为:L‘可得收益1, R“可得收益0,于是 L‘是最优的。
• 这样在第一阶段,参与者1预测到如果博弈进入到第二阶段, 2将选择L’,使参与者1的收益为1,从而参与者1在第一阶 段的选择是:L收益为2, R收益为1,于是L是最优的。
• 逆推归纳法是动态博弈 分析最重要、基本的方 法。
(2,2)
(0,4)
• 一个两阶段动态博弈逆向归纳法的公式化表达: • 当在博弈的第二阶段参与者2行动时,由于其前参与者1已选
择行动a1,他面临的决策间题可用下式表示:
假定对A1中的每一个a2,参与者2的最优化问题只有惟一 解,用R 2(a1)表示,这就是参与者2对参与者1的行动的 反应(或最优反应)。
• 对上面的通过求极值可得: • 已知q1< a-c,在前面我们分析同时行动的古诺博弈中,得出
的R2(q1)和上式完全一致,两者的不同之处在于这里的 R2(q1)是企业2对企业1已观测到的产量的真实反应,而在古 诺的分析中, R2(q1)是企业2对假定的企业1的产量的最优反 应,且企业1的产量选择是和企业2同时作出的。
3.3.1 子博弈
定义:由一个动态博弈第一阶段以外的某阶段开始的
后续博弈阶段构成的,有初始信息集和进行博弈
所需要的全部信息,能够自成一个博弈的原博弈
的一部分,称为原动态博弈的一个“子博弈”乙。
• 首先子博弈不能包含原博
借
弈的第一个阶段,这意味
甲
着动态博弈本身不会是他
分
不分
不借 (1,0)
自己的子博弈。
• 值得注意的是,当两个博弈方按照上述子博弈完美纳什均衡 策略组合行为时,实际上不会进行到博弈的第二、第三阶段, 两个博弈方在第二、二阶段的行为实际上不会发生。我们称 此时第二阶段甲的选择点和第三阶段乙的选择点为“不在均 衡路径上”的,两博弈方的策略在这两个节点的选择称为 “不在均衡路径上的选择”。我们必须强调,子博弈完关纳 什均衡必须对博弈方在所有选择节点处的选择都作出规定, 包括最终不在均衡路径土几的节点,不管是在均衡路径上的 选择还是不在均衡路径。
4.3 子博弈和子博弈完美纳 什均衡
• 由于动态博弈中纳什均衡是不可靠的,不 具备稳定性,因此要发展能排除不可信行 为的新的均衡概念。赛尔腾(1965)提出 了子博弈完美纳什均衡(Subgame Perfect Nash Equilibrium)的概念。
• 要介绍子博弈完美纳什均衡,必须先了解 子博弈的概念。
4.2 可信性和纳什均衡的问题
4.2.1 相机选择和策略中的可信性 问题
• 动态博弈中各个博弈方的策略是自己设定的,在各个博弈 阶段,针对实际情况可以进行随机的选择,这称为“相机 选择”。
• 相机选择的存在使得博弈方的策略的可信性值得怀疑,也
就是说博弈方是否会真正始终按照自己策略所乙设定的方案
行为还是临时改变主意?
• 由于企业1也能够像企业2一样解出企业2的最优反应,企业
1就可以预测到他如选择q1,企业2将根据R2(q1)选择产量。 那么在博弈的第一阶段,企业1的问题就可表示为:
解得:
• 这就是斯塔克尔贝里双头垄断博弈的逆向归纳解。
• 对斯塔科尔贝里双头垄断博弈的逆向归纳解的评价:
• 回顾在古诺博弈的纳什均衡中,每一企业的产量为(a一c)/3, 也就是说,斯塔克尔贝里博弈中逆向归纳解的总产量3(ac)/4,比古诺博弈中纳什均衡的总产量2(a-c)/3要高,从而斯 塔克尔贝里博弈相应的市场出清价格就比较低。不过在斯塔 克尔贝里博弈中,企业1完全可以选择古诺均衡产量(a一 c)/3 ,这时企业2的最优反应同样是古诺均衡的产量,也就 是说在斯塔克尔贝里博弈中,企业1完全可以使利润水平达 到古诺均衡的水平,而却选择了其他产量,
• 博弈的时间顺序如下:
• (1)企业1选择产量q1 >0; • (2)企业2观测到然后选择产量q2 >0 • (3)企业1的收益由下面的利润函数给出:
• 这里P(Q)=a-Q,是市场上的总产品Q=q1+q2时的市场出 清价格,c是生产的边际成本,为一常数(固定成本为0)。
• 为解出这一博弈的逆向归纳解,我们首先计算企业2对企 业1任意产量的最优反应,R2(q1)应满足:
4.4 四个经典的动态博 弈例子
• 1.斯塔克尔贝里双头垄断模型
• 斯塔克尔贝里(1934)提出一个双头垄断的动态模型,其中 一个支配企业(领导者)首先行动,然后从属企业(追随者) 行。比如在美国汽车产业发展史中的某些阶段,通用汽车 就扮演过这种领导者的角色(这一例子把模型直接扩展到 允许不止一个追随企业,如福特、克莱斯勒等等)。根据 斯塔克尔贝里的假定,模型中的企业选择其产量,这一点 和古诺模型是一致的(只不过古诺模型中企业是同时行动 的,不同于这里的序贯行动)。
简单类型的完全且完美信息动态博弈的模式
• 1.参与者1从可行集A1中选择一个行动a1; • 2.参与者2观察到a1之后从可行集A2中选择一个行动a2; • 3.两人的收益分别为u1(a1,a2)和u2(a1,a2); • 完全且完美信息动态博弈的主要特点是: • (1)行动是顺序发生的; • (2)下一步行动选择之前,所有以前的行动都可被观察到; • (3)每一可能的行动组合下参与者的收益都是共同知识。
• 如果1在第一阶段选择了R,则两个参与者都是理性的就不可 能是共同知识,但这时1仍有理由在第一阶段选择R,却不与 2对1的理性假定相矛盾。
• 一种可能是“参与者1是理性的”是共同知识,但“参与者2 是理性的”却不是共同知识:如果1认为2可能不是理性的, 则1就可能在第一阶段选择R,希望2在第二阶段选择R’,从 而给1以机会在第三阶段选择L‘‘。另一种可能是“参与者2是 理性的”是共同知识,但“参与者1是理性的”却不是共同 知识:如果1是理性的,但推测2可能认为1是非理性的。
• 子博弈完美纳什均衡本身也是纳什均衡,不过它是比 纳什均衡更强的解。
• 子博弈完美纳什均衡能够排除均衡策略中不可信的威 胁和承诺,因此是真正稳定的。
• 子博弈是倒着看的,从最小的子博弈开始我们就找稳 定策略组合,直至最开始的节点,那么当然是稳定的 了。大家会发展这正是逆推归纳法。
• 逆推归纳法是求完美信息动态博弈子博弈完美纳什均 衡的基本方法。
• 上述的求解过程求出:参与者1在第一阶段的最优选择是L, 从而博弈结束。
• 但是即使逆向归纳预测博弈将在第一阶段结束,我们论证过 程的重要部分却是考虑如果博弈不在第一阶段结束时可能发 生的情况。
• 比如在第二阶段,当参与者2预测如果博弈进入第三阶段, 则1会选择L’’,这时2假定1是理性的。由于只有在1偏离了博 弈的逆向归纳解,才能轮得到2选择行动,而这时2对1的理 性假定便看似是矛盾的,即如果1在第一阶段选择了R,那么 第二阶段2就不能再假定1是理性的了。但这种理解是不对的。
该子博弃的一个纳了卜均衡,因此根据子博弈完美纳什均衡 的定义判断,这个策略组合不是子博弈完美纳什均衡。这也 是上述纳什均衡策略组合不稳定的根源。
• 策略组合“乙在第一阶段选择‘不借’、如果有第三阶段选 择则选择不打;甲如果有第二阶段选择选‘不分”’,则是了 博弈完美纳什均衡,因为该策略组合的双方策略不但在整个 博弈中构成纳什均衡,而且在两级子博弈中也都构成纳什均 衡。
4.3.3 逆向归纳法背后的理 性假设
• 最后,我们探讨逆向归纳法背后的理性假定。看下面的例子:
• 我们用博弈树表示一个动态博弈,树上每一枝的末端都有两 个收益值,上面代表参与者1的收益,下面代表参与者2的收 益。考虑下面的三步博弈,其中参与者1有两次行动:
• 为计算出这一博弈的逆向归纳解,我们从第三阶段(即参与
B 不制止(0,10) 仿冒 A 不仿冒
制止
B 不制止 (5,5)
(2,2)
(10,4)
4.1.2 动态博弈的基本特点
• 策略是在整个博弈中所有选择、行为的计划,不能分割。 • 结果是上述“计划型”策略的策略组合,构成一条路径. • 得益对应每条路径,而不是对应每步选择、行为.
• 动态博弈的非对称性——先后次序决定动态博弈必然是 非对称的。先选择、行为的博弈方常常更有利,有“先 行优势”。
• 我们将定义子博弈完美纳什均衡为:只有不包含不可置信的 威胁的纳什均衡才是子博弈完美纳什均衡。一个完全且完美 信息动态博弈可能会有多个均衡,但惟一的子博弈完美纳什 均衡就是与逆向归纳解相对应的均衡。正如我们在前面所观 察到的,有些博弈会有多个纳什均衡,但有一个均衡明显占 优,成为博弈的解。
• 比如,上例分钱博弈中,双方的策略组合“乙第一阶段选择 ‘借’,第二阶段选择‘打’;甲第二阶段选择’分”’虽然 是整个博弈的一个纳什均衡,但这个策略组合中乙的策略要 求乙在第三阶段单人博弈构成的子博弈中选择的“打”不是
• 由于参与者1能够和参与者2一样解出2的问题,参与者1可以 预测到参与者2对1每一个可能的行动a1所作出的反应,这样 1在第一阶段要解决的问题可以归结为:
• 假定参与者1的这一最优化问题同样有惟一解,表示为a1*,
我们称
是这一博弈的逆向归纳解。
• 逆向归纳解不含有不可置信的威胁:参与者1预测参与者2 将对1可能选择的任何行动a1做出最优反应,选择行动 R2(a1)。