北京大学博弈论课件第3章_完全信息动态博弈
合集下载
第3讲 完全信息动态博弈
q2 0
最优化的一阶条件意味着: s(q1) (a q1 c) =1 2 2
第3讲 完全信息动态博弈
假定q1 a c。这实际上是库诺特模型中企业2的反应函数,不同的 是,这里,s(q1)是当企业1选择q1时企业2的实际选择,而在库诺 2 特模型中,R2 q1)是企业2对于假设的q1的最优反应。 ( 因为企业1预测到企业2将根据s(q1)选择q 2,企业1在第一阶段的问 2 题是: max 1 = q1,s(q1)=q1 a q1 s(q1) c) ( 2 2
第3讲 完全信息动态博弈
• 这个例子也说明,在博弈中,拥有信息优势可能 使参与人处于劣势,而这在单人决策中是不可能 的。企业2在斯坦克尔伯格博弈中的利润之所以低 于库诺特博弈中的利润,是因为它在决策之前就 知道了企业1的产量。即使企业1先行动,但如果 企业2在决策之前不能观测到企业1的产量,我们 就回到了库诺特均衡,因为此时,企业1的先动优 势就不存在了。
第3讲 完全信息动态博弈
* 1 回忆一下,在上一讲得到的库诺特模型的纳什均衡是q1 =q* = (a c), 2 3 3 比较这两个结果,发现斯坦克尔伯格均衡的总产量 (a c)大于库诺特 4 2 的总产量 (a c)。但是,企业1的斯坦克尔伯格均衡产量大于库诺特 3
均衡产量,而企业2的斯坦克尔伯格均衡产量小于库诺特均衡产量。 因为企业1本来可以选择库诺特均衡产量但它没有选择,说明企业1在斯坦 克尔伯格博弈中的利润大于库诺特博弈中的利润,而总产量上升意味着 总利润下降了从而企业2的利润一定下降了。这就是所谓的“先动优势”。
第3讲 完全信息动态博弈
• 宏观经济政策的动态一致性 宏观经济学上与子博弈精炼纳什均衡相对应的概 念是政府政策的动态一致性(dynamic consistency 或time consistency)。政府政策 的动态一致性指的是,一个政策不仅在制定阶段 应该是最优的(从政府的角度),而且在指定之 后的执行阶段也应该是最优的,假设没有任何新 的信息出现。如果一个政策只是在制定阶段是最 优的,而在执行阶段并不是最优的,这个政策就 是动态不一致的。说它是动态不一致的,是因为
最优化的一阶条件意味着: s(q1) (a q1 c) =1 2 2
第3讲 完全信息动态博弈
假定q1 a c。这实际上是库诺特模型中企业2的反应函数,不同的 是,这里,s(q1)是当企业1选择q1时企业2的实际选择,而在库诺 2 特模型中,R2 q1)是企业2对于假设的q1的最优反应。 ( 因为企业1预测到企业2将根据s(q1)选择q 2,企业1在第一阶段的问 2 题是: max 1 = q1,s(q1)=q1 a q1 s(q1) c) ( 2 2
第3讲 完全信息动态博弈
• 这个例子也说明,在博弈中,拥有信息优势可能 使参与人处于劣势,而这在单人决策中是不可能 的。企业2在斯坦克尔伯格博弈中的利润之所以低 于库诺特博弈中的利润,是因为它在决策之前就 知道了企业1的产量。即使企业1先行动,但如果 企业2在决策之前不能观测到企业1的产量,我们 就回到了库诺特均衡,因为此时,企业1的先动优 势就不存在了。
第3讲 完全信息动态博弈
* 1 回忆一下,在上一讲得到的库诺特模型的纳什均衡是q1 =q* = (a c), 2 3 3 比较这两个结果,发现斯坦克尔伯格均衡的总产量 (a c)大于库诺特 4 2 的总产量 (a c)。但是,企业1的斯坦克尔伯格均衡产量大于库诺特 3
均衡产量,而企业2的斯坦克尔伯格均衡产量小于库诺特均衡产量。 因为企业1本来可以选择库诺特均衡产量但它没有选择,说明企业1在斯坦 克尔伯格博弈中的利润大于库诺特博弈中的利润,而总产量上升意味着 总利润下降了从而企业2的利润一定下降了。这就是所谓的“先动优势”。
第3讲 完全信息动态博弈
• 宏观经济政策的动态一致性 宏观经济学上与子博弈精炼纳什均衡相对应的概 念是政府政策的动态一致性(dynamic consistency 或time consistency)。政府政策 的动态一致性指的是,一个政策不仅在制定阶段 应该是最优的(从政府的角度),而且在指定之 后的执行阶段也应该是最优的,假设没有任何新 的信息出现。如果一个政策只是在制定阶段是最 优的,而在执行阶段并不是最优的,这个政策就 是动态不一致的。说它是动态不一致的,是因为
北京大学博弈论课件第3章-完全信息动态博弈
❖ 路径用线段表示。在线段旁注明相应的策略。 ❖ 在“市场争夺战”博弈中,首先行动的潜在进入者可以采取两种策略:“不进入”
和“进入”。因此,从初始节点处引出两条线段,在两条线段旁分别标识“不进 入”和“进入”。 ❖ 当潜在进入者选择结束后,达到在位者的节点。 ❖ 在位者有两个选择:“斗争”和“默许”。 ❖ 因此,从在位者的节点处引出两条线段,在两条线段旁分别标识“斗争”和“默 许”。
❖ 博弈树中每个节点都独立构成一个信息集,没有虚线连接两个或多个博弈树节点。 ❖ 求解完全且完美信息动态博弈的重要方法之一是:逆向归纳法。 ❖ 可以通过“海盗分宝博弈”这个生动有趣的故事对“逆向归纳法”进行一个直观
介绍。
一、海盗分宝博弈
❖ 1.海盗分宝博弈的规则 ❖ 五个海盗首先进行抽签,确定决策顺序。 ❖ 五个海盗按照决策顺序依次提出对 100 个金币的分配方案。 ❖ 第一个海盗提出一个分配方案,如超过半数的海盗(包括提出分配方案的海盗)
2021/8/1
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第三章 POWERPOINT TEMPLATE
❖ 在完全信息动态博弈中,博弈参与者的行动存在先后顺序。 ❖ 可以用博弈树表示完全信息动态博弈。 ❖ 可以通过逆向归纳法求解完全信息动态博弈的子博弈精炼纳什
均衡,剔除不可置信的威胁。
第一节 完全信息动态博弈概述
❖ 一、完全信息动态博弈的定义 在完全信息静态博弈中,博弈参与者同时采取行动。但在完全信息动 态博弈中,博弈参与者的行动存在先后顺序。从信息角度上,完全信息 动态博弈与完全信息静态博弈类似,博弈参与者对博弈结构、博弈顺序、 双方收益等信息都具备完全了解。
和“进入”。因此,从初始节点处引出两条线段,在两条线段旁分别标识“不进 入”和“进入”。 ❖ 当潜在进入者选择结束后,达到在位者的节点。 ❖ 在位者有两个选择:“斗争”和“默许”。 ❖ 因此,从在位者的节点处引出两条线段,在两条线段旁分别标识“斗争”和“默 许”。
❖ 博弈树中每个节点都独立构成一个信息集,没有虚线连接两个或多个博弈树节点。 ❖ 求解完全且完美信息动态博弈的重要方法之一是:逆向归纳法。 ❖ 可以通过“海盗分宝博弈”这个生动有趣的故事对“逆向归纳法”进行一个直观
介绍。
一、海盗分宝博弈
❖ 1.海盗分宝博弈的规则 ❖ 五个海盗首先进行抽签,确定决策顺序。 ❖ 五个海盗按照决策顺序依次提出对 100 个金币的分配方案。 ❖ 第一个海盗提出一个分配方案,如超过半数的海盗(包括提出分配方案的海盗)
2021/8/1
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第三章 POWERPOINT TEMPLATE
❖ 在完全信息动态博弈中,博弈参与者的行动存在先后顺序。 ❖ 可以用博弈树表示完全信息动态博弈。 ❖ 可以通过逆向归纳法求解完全信息动态博弈的子博弈精炼纳什
均衡,剔除不可置信的威胁。
第一节 完全信息动态博弈概述
❖ 一、完全信息动态博弈的定义 在完全信息静态博弈中,博弈参与者同时采取行动。但在完全信息动 态博弈中,博弈参与者的行动存在先后顺序。从信息角度上,完全信息 动态博弈与完全信息静态博弈类似,博弈参与者对博弈结构、博弈顺序、 双方收益等信息都具备完全了解。
博弈论 第 三 章 完全信息动态博弈讲解
房地产开发博弈
开发
A hA(1) 不开发
h表示信息集
N hN(1)
需求大
需求小
N hN(2)
需求大
需求小
B hB(1)
开发
不开发
B hB(2)
B hB(3)
开发
不开发 开发 不开发 开发
B hB(4)
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8) (0,0) (0,1) 单 位:百万元
定 义 一 个 展 开 式 博 弈 的 子 博 弈G 由 一 个 决 策 结x 和 所 有 该 决 策 结 的 后继结T(x)( 包 括终点结0 组 成, 它 满 足 下 列 条 件:⑴x 是 一 个 单 点 信 息 结即h(x)={x};⑵对于所有的 x′∈T(x),如果x″∈h(x′),则x″∈T(x)。
(3)
N
1/3
2/3
1
Y1
z1
1
x1
w1
(2,6) (5,6)
2
2
a2 (9,0)
b2 (0,3)
a2 (9,5)
b2 (0,3)
3.3 子 博 弈 与 子 博 弈 完 美
Nash 均衡在原则上适用所有的博弈,但对于预 测 参与人的行为来说,Nash均衡可能并不是 一个 合理的预测, 如房地产博弈:
A
开发
不开 发
A
开发
不开发
B
B
B
B
开发 不开发 开发 不开发 开发 不开发 开发
不开发
有了信息集的概念, 展开式表示也可以用来表 示静态博弈, 如“囚徒的困境 ”博弈可以表 示为:
1
坦白
2
第三章 完全信息动态博弈 ppt课件
条路径。但每条路径可由不同的策略组合决定。
例如, (开发,(不开发,开发))决定了
A -> 开发 -> B -> 不开发 -> (1,0)
该路径还可由(开发,(不开发,不开发))决定。
事实上,该问题共有4条路径,8种策略组合。
ppt课件
12
§2 子博弈精炼纳什均衡
对于动态博弈,Nash均衡可能并不是一个合理的预测。 如房地产博弈:
又如,上例中,如果进入者先行动,而在位者在 行动前能准确知道前者的行动,那么在位者的信息 集为 {进入}或{不进入}。 反之,若在位者先行动, 则在位者的信息集为{进入,不进入}。
ppt课件
7
三、 动态博弈的相关概念
(3) • 完美信息(Perfect information):一个局中人在行动
时,对之前博弈进程有准确了解,即每一个信息集只包含 一个值,则称该局中人具有完美信息。 • 如果动态博弈的所有局中人都有完美信息,则称为完美信 息的动态博弈。 • 如果动态博弈中,存在部分局中人具有不完美信息,称为 不完美信息的动态博弈。
思考:若进入者真的进入,在位者的最优行动是“默许”。 所以“斗争”是一种不可置信的威胁(即使在位企业摆出 一副“你进入我就斗争”的架势,进入企业不应被吓到)。 而静态博弈承认这种不可置信的威胁,使(不进入,斗争) 成为一个Nash均衡。
动态博弈解决方案:剔除不可置信的威胁策略
ppt课件
3
扩展阅读:不可置信的威胁策略 引出信息经济学重要的概念—— 承诺行动(Commitment)。
ppt课件
18
三、 逆向归纳法求解子博弈精炼Nash均衡
• 从动态博弈的最后一个阶段局中人的行为开始分析
博弈论第三章.ppt
混合策略的子博弈完美Nash均衡可类似定义。 简单地说: 子博弈完美Nash均衡要求均衡策 略 的行为规则在每一个信息集上都是最优的 (包括均衡路径和非均衡路径)。
定 义 展开型博弈的一个策略组合称为子博弈 完美Nash均衡,如果对于该博弈的每一个子 博弈,该策略组合都是Nash均衡。
如果B在决策时并不知道自然的选择,则有博
弈树:
开发
A
hA
不开发
N
N
大(1/2)
hB B
小(1/2)
B
大(1/2)
B
小(1/2)
B h′B
开发
不开发 开发 不开发 开发 不开发 开发 不开发
另一种情况就则B知道自然的选择,但不知道A的
选择,这时博弈树如下:
A
开发
不开发
N
N
大
小
大
小
B
B
B
B
开发
不开发 开发
开 -3,-3
-3,-3
1,0
1,0
参 与 人A
不 0,1
0,0
0,1
0,0
由 画 线 法 可 得 三 个 纯 策 略Nash 均 衡:
①( 不 开 发,( 开 发, 开 发))
②( 开 发,( 不 开 发, 不 开 发))
③( 开 发,( 不 开 发, 开 发))
但①中B的策略是不合理的,这个威胁是不可置 信的; ②中B的策略(不开发,不开发)也不合理, 因为若A不 开发,B显然应该开发; 只有③是一 个合理的均衡。
的全体记汉A(hi),如果令Hi表示参与人i的信息 集
的集合,则Ai= ∪ A(hi)就是参与人i的所有行
动
hi∈Hi
定 义 展开型博弈的一个策略组合称为子博弈 完美Nash均衡,如果对于该博弈的每一个子 博弈,该策略组合都是Nash均衡。
如果B在决策时并不知道自然的选择,则有博
弈树:
开发
A
hA
不开发
N
N
大(1/2)
hB B
小(1/2)
B
大(1/2)
B
小(1/2)
B h′B
开发
不开发 开发 不开发 开发 不开发 开发 不开发
另一种情况就则B知道自然的选择,但不知道A的
选择,这时博弈树如下:
A
开发
不开发
N
N
大
小
大
小
B
B
B
B
开发
不开发 开发
开 -3,-3
-3,-3
1,0
1,0
参 与 人A
不 0,1
0,0
0,1
0,0
由 画 线 法 可 得 三 个 纯 策 略Nash 均 衡:
①( 不 开 发,( 开 发, 开 发))
②( 开 发,( 不 开 发, 不 开 发))
③( 开 发,( 不 开 发, 开 发))
但①中B的策略是不合理的,这个威胁是不可置 信的; ②中B的策略(不开发,不开发)也不合理, 因为若A不 开发,B显然应该开发; 只有③是一 个合理的均衡。
的全体记汉A(hi),如果令Hi表示参与人i的信息 集
的集合,则Ai= ∪ A(hi)就是参与人i的所有行
动
hi∈Hi
北大课件博弈论与公共政策之完全信息动态博弈
第1讲之例1:囚徒困境
囚徒1
抵赖 招认
囚徒2
抵赖
招认
-1,-1
-9,0
0,-9
-6,-6
? (2)用标准式表述例6中的博弈
三、动态博弈的均衡
? 1、利用标准式表述求纳什均衡
? 2、在博弈树上找纳什均衡
四、子博弈精炼纳什均衡
? 1、可置信的威胁与不可置信的威胁
? 一种威胁所规定的行动在事前看来是最优 的,但事后看并不是参与者的最优选择, 这种威胁就是不可置信的,含有这种威胁 的策略就不是一个合理的策略。
? 甲、乙双方在签订一项合同后,乙方违约。 乙方提出和解,愿意赔偿7万元。甲方如果 上法庭,可望获得10万元赔偿,但要付出2 万元的诉讼费用。
? 甲方应当接受和解还是上法庭?
决策树
逆向归纳法
? 从右往左逐步分析。在这个过程中: ? ① 对于机会结,计算期望收益,并将相应
的值写在该结下面。 ? ② 对于决策结,还是做两件事: ? 第一,在较劣的决策枝上划叉; ? 第二,将对应于最优决策枝的收益写在该
? 结果2:仅得到2万元的修车费赔偿,概率 为30%;
? 结果3:得不到任何赔偿,概率为20%。 ? 甲方应当接受和解还是上法庭?
例4:购买土地
? 某人打算购买土地,现有A、B两块地可以 选择。A、B两块地的售价分别为30万元和 25万元。这两块地看起来差不多,所以买 方起初打算购买价格更便宜的B。但是,买 方进一步了解得知,B可能存在环境问题, 因为该地过去被堆放过大量垃圾,而A不存 在类似问题。如果B被危险垃圾污染,依照 法律规定,买方必须进行无害化处理,成 本为20万元。买方估计,B被危险垃圾污染 的概率为50%。
? ① 始于博弈树中一个单结信息集的决策结, 但不包括博弈的第一个决策结;
博弈论以及应用之3完全且完美信息动态博弈[1].pptx
3.8 空头承诺II
回顾
在前述产品开发博弈中,均衡结果(不开发,(开发,开发)) 就是企业A的空头承诺,是不可置信的。
生活中的空头承诺
学生对老师的承诺
老师,这回让我过吧,以后我会好好学习的 老师,先发表一篇达到毕业要求,以后一定会写核心期刊的
山盟海誓
爱你一万年 海枯石烂
1,0 0,0
纳什均衡
企业A开发B不开发
➢ (开发,(不开发,开发)) ➢ (开发,(不开发,不开发))
企业A 不开发B开发
➢ (不开发,(开发,开发))
2020/3/4
9
3.3 动态博弈中的行为与战略VII
总结:动态博弈的矩阵描述存在的问题
战略空间复杂
后行动者的战略空间随局中人的数量和每一阶段局中人的行 动选择数量而急剧增大
25
3.9 承诺行动IV
绑架与劫持中的承诺行动
对峙中的谈判
拒绝谈判
➢ 历史上拒绝谈判曾是一种高效方法,汉武帝和曹操都用过 ➢ 实际生活中拒绝谈判也是一种重要策略 ➢ 交出控制权是拒绝谈判的一种具体形式
谈判中的承诺
➢ 歹徒的承诺可信吗?
职业歹徒的承诺是可信的,因为他们在树立和维护自己的声誉 非职业歹徒的承诺可能也是可信的,因为他们可能不想罪加一等
先行者:美国 后行者:中国
2020/3/4
4
3.3 动态博弈中的行为与战略II
模型描述
战略空间
美国——先行者
➢ 战略就是行动
中国——后行者
➢ 战略是针对先行者各种可能行动而制定的行动方案,包括 美国犯我,我犯人;美国不犯我,我犯人 美国犯我,我不犯人;美国不犯我,我不犯人 美国犯我,我犯人;美国不犯我,我不犯人 美国犯我,我不犯人;美国不犯我,我犯人
(完整版)完全信息动态博弈.ppt
(四)参与人在博弈树中的顺序
1、排序的基本原则
一个参与人在决策之前知道的事情必须出现在该 参与人的决策结之前。
2、自然人的排序
– 如果参与人不能观测到虚拟人——自然的行动, 自然的决策结置于该参与人的前后都一样;
– 自然的信息集总是假定为单结。
N
大 1/2 A
小 1/2 A
开
不
发开
发
B
B
开发
不开发 开发 不开发
– 博弈的战略式表述只包括三个要 素
– 扩展式表述包括以下六个方面的 要素
扩展式表述包括以下六个方面的要素:
– 参与人集合:i=1、2、…,n;并且用大写N代表 虚拟的参与人——“自然”;
– 参与人的行动顺序(The order of moves):谁在什么 时候行动;
– 参与人的行动空间(Action set):在每次行动时, 参与人有些什么选择;
A
坦白 抵赖
B
B
坦白
抵赖
抵赖
坦白
(-8, -8) (0,-10) (-10, 0) (-1,-1)
B
坦白 A
抵赖 A
坦白
抵赖
抵赖
坦白
(-8, -8) (0,-10) (-10, 0) (-1,-1)
(五)完美回忆
完美回忆(Perfect recall)是指没有参与人会 忘记自己以前知道的事情,所有参与人都 知道自己以前的选择。
第三章 完全信息动态博弈
Dynamic Games of Complete Information
@ 2009 Zheng Daowen, All Rights Reserved
动态博弈:参与人的行动有先后顺序,且后 行动者在自己行动之前能观测到先行动者 的行动。
博弈论与信息经济学--完全信息动态博弈 ppt课件
©&® by H. Q. Feng, CUFE
5/58
一、动态博弈的表述——扩展式
(2)博弈的扩展式表述包括以下要素: 参与人集合:i=1,…,n,此外,N代表虚拟参与人“自然” 参与人的行动顺序:谁在什么时候行动; 参与人的行动空间:在每次行动时,参与人有些什么选择; 参与人的信息集:每次行动时,参与人知道什么; 参与人的支付函数:在行动结束之后,每个参与人得到些什 么(支付是所有行动的函数); 外生条件(即自然的选择)的概率分布。 假定房地产开发博弈的行动顺序如下:开发商A首先行动, 选择开发或不开发;在A决策后,自然选择市场需求的大小; 开发商B在观测到A的决策和市场需求后,决定开发或不开 发。
该博弈的扩展式表述为:
©&® by H. Q. Feng, CUFE
15/58
一、动态博弈的表述——扩展式
进入者
进入
不进入
在位者
斗争 默许
(0,300)
(-10,0)
(40,50)
©&® by H. Q. Feng, CUFE
16/58
二、子博弈精炼纳什均衡
纳什均衡有几个问题:
第一,一个博弈不止一个均衡,事实上,有些 博弈可能有无数个纳什均衡,究竟哪一个更合 理? 纳什均衡假定每一个参与人在选择自己的最优 战略时假定所有其他参与人的战略是给定的, 但是如果参与人的行动有先有后,后行动者的 选择空间依赖于前行动者的选择,先行动者在 选择时不可能不考虑自己的行动对后行动者的 影响。
©&® by H. Q. Feng, CUFE 20/58
二、子博弈精炼纳什均衡
“子博弈”的概念:从每一个行动选择开始至 博弈结束又构成一个博弈,称为“子博弈”。 如在进入者选择进入之后,在位者选择行动 开始就是一个子博弈。 子博弈需满足的条件:
博弈论 第 三 章 完全信息动态博弈PPT文档63页
39、勿问成功的秘诀为何,且尽全力做你应该做的事吧。——美华纳
40、学而不思则罔,思而不学则殆。——孔子
博弈论 第 三 章 完全信息动态博弈
1、战鼓一响,法律无声。——英国 2、任何法律的根本;不,不成文法本 身就是 讲道理 ……法 律,也 ----即 明示道 理。— —爱·科 克
3、法律是最保险的头盔。——爱·科 克 4、一个国家如果纲纪不正,其国风一 定颓败 。—— 塞内加 5、法律不能使人人平等,但是在法律 面前人 人是平 等的。 ——波 洛克
ቤተ መጻሕፍቲ ባይዱ 谢谢!
36、自己的鞋子,自己知道紧在哪里。——西班牙
37、我们唯一不会改正的缺点是软弱。——拉罗什福科
xiexie! 38、我这个人走得很慢,但是我从不后退。——亚伯拉罕·林肯
第三讲完全信息动态博弈
第15页,本讲稿共23页
在这里,B选择的策略称为“冷酷策略” (grim strategies)。冷酷策略是指重复 博弈中的任何参与人的一次性不合作将引 起其他参与人的永远不合作,从而导致所 有参与人的收益减少。因此,所有参与人 具有维持合作的积极性。我们再来讨论博 弈重复次数为有限时的情况。
第16页,本讲稿共23页
第1页,本讲稿共23页
一、子博弈精炼纳什均衡
子博弈精炼纳什均衡的创立者. ——1994年诺贝尔经济 学奖获奖者、莱茵哈德·泽尔腾。
泽尔腾则在60年代中期将纳什均衡概念引入动态 分析。在1965年发表《需求减少条件下寡头垄断模型 的对策论描述》一文,提出了“子博弈精炼纳什均衡” 的概念,又称“子对策完美纳什均衡”。这一研究对纳 什均衡进行了第一次改进,选择了更具说服力的均衡点。 海萨尼在60年代末把不完全信息引入博弈分析。
第9页,本讲稿共23页
以上的分析,就是子博弈精炼纳什均衡解的过程。 策略(A开发,B不开发)就是上述子博弈精炼纳 什均衡解。 ▪ 所谓“子博弈”(sub-game)是指它本身可以作为一 个独立的博弈进行分析,它是原博弈的一部分。例如 ,在表3-1中,每一行或每一列都是整个博弈的一个 子博弈。而且,任何博弈本身可被称为自身的一个子 博弈。 ▪ 只有当某一策略组合在每一个子博弈(包括原博弈 )上都构成一个纳什均衡,这一策略组合才是子博 弈精炼纳什均衡解。显然,如果整个博弈是惟一的 子博弈,纳什均衡与子博弈精炼纳什均衡是完全相 同的。
第18页,本讲稿共23页
三、动态博弈策略行动
在动态博弈中,由于参与人的行动有先后 顺序,而参与人行动顺序直接影响博弈的 结果。因此,参与人为了使其他参与人的 选择对自己有利,往往会主动采取一些行 动影响其他参与人对自己行为的预期,从 而达到对自己有利的结果。参与人所采取 的这些行为称之为“策略行”(strategic move)。
在这里,B选择的策略称为“冷酷策略” (grim strategies)。冷酷策略是指重复 博弈中的任何参与人的一次性不合作将引 起其他参与人的永远不合作,从而导致所 有参与人的收益减少。因此,所有参与人 具有维持合作的积极性。我们再来讨论博 弈重复次数为有限时的情况。
第16页,本讲稿共23页
第1页,本讲稿共23页
一、子博弈精炼纳什均衡
子博弈精炼纳什均衡的创立者. ——1994年诺贝尔经济 学奖获奖者、莱茵哈德·泽尔腾。
泽尔腾则在60年代中期将纳什均衡概念引入动态 分析。在1965年发表《需求减少条件下寡头垄断模型 的对策论描述》一文,提出了“子博弈精炼纳什均衡” 的概念,又称“子对策完美纳什均衡”。这一研究对纳 什均衡进行了第一次改进,选择了更具说服力的均衡点。 海萨尼在60年代末把不完全信息引入博弈分析。
第9页,本讲稿共23页
以上的分析,就是子博弈精炼纳什均衡解的过程。 策略(A开发,B不开发)就是上述子博弈精炼纳 什均衡解。 ▪ 所谓“子博弈”(sub-game)是指它本身可以作为一 个独立的博弈进行分析,它是原博弈的一部分。例如 ,在表3-1中,每一行或每一列都是整个博弈的一个 子博弈。而且,任何博弈本身可被称为自身的一个子 博弈。 ▪ 只有当某一策略组合在每一个子博弈(包括原博弈 )上都构成一个纳什均衡,这一策略组合才是子博 弈精炼纳什均衡解。显然,如果整个博弈是惟一的 子博弈,纳什均衡与子博弈精炼纳什均衡是完全相 同的。
第18页,本讲稿共23页
三、动态博弈策略行动
在动态博弈中,由于参与人的行动有先后 顺序,而参与人行动顺序直接影响博弈的 结果。因此,参与人为了使其他参与人的 选择对自己有利,往往会主动采取一些行 动影响其他参与人对自己行为的预期,从 而达到对自己有利的结果。参与人所采取 的这些行为称之为“策略行”(strategic move)。
第三章扩展式博弈与完全信息动态博弈ppt课件
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
1
L
x1
R
2
2
L x2 R
3
L x3 R
3
L x4 R L x5 R L x6 R L x7 R
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
下图表示参与人3选择时,即不知道参与人2的选 择,也不知道参与人1的选择的博弈情形。
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
例如
• 在“新产品开发博弈”中,假设企业1先行动, 企业2后行动,但企业2行动时不知道企业1的 行动。
企业2行动时,只知道 博弈要么到达点x2,要 么达到点x3 ,但具体在 哪一点上,企业2不清 楚。也就是说,企业2 只知道自己位于决策结 集合{x2, x3 }上,但不知 道位于{x2, x3 }中哪一个 决策结上。
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
一、扩展式博弈
• 所谓扩展式博弈(extensive form game)是 博弈问题的一种规范性描述。与战略式 博弈侧重博弈结果的描述相比,扩展式 博弈更注重对参与人在博弈过程中所遇 到决策问题的序列结构的详细分析。
• 试用扩展式博弈对两个企业都知道市场 需求,且企业1先决策,企业2观测到企 业1的选择后再进行选择的博弈情形即完 全信息动态的“新产品开发博弈”进行 建模。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、博弈树
在动态博弈中,由于博弈参与者的行动存在先后顺序,因
此可以用更形象的方法来表示动态博弈:博弈树(Game
Tree)。
通过支付矩阵的形式表示的博弈通常被称为策略型或正则
型博弈(Normal Form Game)。
通过博弈树表示的博弈通常被称为扩展型博弈
(Extensive Form Game)。
第三章
完全信息动态博弈
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
2013-8-6
(1, 1, 1)
三名员工都只有一个信息集的博弈
四、博弈树与静态博弈
博弈树的方法不仅能表示动态博弈,还能表示静态博弈。
嫌疑人甲 坦白 嫌疑人乙 坦白 (5, 5) 不坦白 (1, 10) 坦白 (10, 1) 不坦白 嫌疑人乙 不坦白 (2, 2)
用博弈树表示囚徒困境
所谓的“博弈先后顺序”,它主要是一个信息的概念,而不 是一个纯时间先后的概念。
那么第三个海盗也将被扔到海里喂鲨鱼。
接下来由第四个海盗提出分配方案。如果超过半数的海盗同意第 四个海盗的分配方案时,那么该方案被通过,博弈结束。
如果第四个海盗提出的分配方案没有得到超过半数海盗的同意, 那么第四个海盗也将被扔到海里喂鲨鱼。 这时就只剩下第五个海盗了,第五个海盗将独吞抢劫来的100个 金币,博弈结束。 在这种分配规则下,第一个海盗将提出怎样的分配方案? 第一个海盗提出的分配方案需要满足两个条件。
1 H O 2 O 3 O H O H 3 O H H O 3 O
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
(2, 0, 2) (2, 2, 0)
(1, 1, 1)
员工 2 只有一个信息集的博弈树
1 H O 2 O 信息集 1 O H 3 O H 3 O H 信息集 2 H O 3 O
1.三人罢工博弈的定义
1 H O 2 O 3 O H O H 3 O H H O 3 O
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
(2, 0, 2) (2, 2, 0)
(1, 1, 1)
三人罢工博弈的博弈树
2.三人罢工博弈的策略选择与信息
点处对应的博弈参与者为潜在进入者。 将潜在进入者标识在博弈树初始节点旁边。
当潜在进入者决策之后,轮到在位者进行决策。
在位者所在的节点称为“后续节点”。在位者位于两个后续节点上。 在位者都有两种策略选择:“斗争”和“默许”。
如果初始节点处的博弈参与者存在 N 种策略,那么就从初始节点
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
动态市场争夺战博弈的扩展型表达方式如图所示
潜在进入者 不进入 在位者 斗争
(0, 20)
进入 在位者
默许
(0, 15)
斗争
(-10, -10)
默许
(5, 5)
“市场争夺战”博弈的扩展型表达形式
1.博弈树的构成要素
(1)博弈参与者
(2)行动顺序:在动态博弈中,博弈参与者的行动存在先后次序。 (3)行动策略空间(Action Set):指博弈参与者可以采取的所 有可能策略。 (4)信息集(Information Set):指博弈参与者在博弈过程中 所知道的信息。 (5)支付函数指博弈参与者采用特定策略与所能得到的收益之间的
(2)博弈树与博弈顺序
博弈树各节点之间存在顺序关系,博弈树由上至下的节点顺序表示各 博弈参与者进行决策的顺序。
参与者 1 S1 S2 参与者 2 T1 T2 参与者 3 (a2, b2, c2) U1 U2 (a4, b4, c4)
(a1, b1, c1)
(a3, b3, c3)
从博弈树的节点可以引出多条线段,但不能从博弈树多个节点共同到达
博弈树下方同一个后续节点。
参与者 1 S1 参与者 2 V1 (a1, b1, c1) V2 参与者 3 U1 (a3, b3, c3) U2 (a4, b4, c4) V1 S2 参与者 2 V2 (a2, b2, c2)
错误的博弈树构造方法
正确的博弈树构造方法
参与者 1 S1 参与者 2 V1 (a1, b1, c1) U1 V2 参与者 3 U2 U1 V1 参与者 3 U2 S2 参与者 2 V2 (a2, b2, c2)
下面三种博弈表达方式所表达的博弈内涵相同
嫌疑人甲 坦白 嫌疑人乙 坦白 (5, 5) 不坦白 (1, 10) 坦白 (10, 1) 不坦白 嫌疑人乙 不坦白 (2, 2)
嫌疑人甲 坦白 (5, 5) 不坦白 (1, 10) 坦白 (10, 1) 坦白 嫌疑人乙 不坦白 嫌疑人甲 不坦白 (2, 2)
POWERPOINT TEMPLATE 金融
在完全信息动态博弈中,博弈参与者的行动存在先 后顺序。 可以用博弈树表示完全信息动态博弈。
可以通过逆向归纳法求解完全信息动态博弈的子博
弈精炼纳什均衡,剔除不可置信的威胁。
第一节 完全信息动态博弈概述
一、完全信息动态博弈的定义 在完全信息静态博弈中,博弈参与者同时采取行动。但 在完全信息动态博弈中,博弈参与者的行动存在先后顺序。 从信息角度上,完全信息动态博弈与完全信息静态博弈类 似,博弈参与者对博弈结构、博弈顺序、双方收益等信息 都具备完全了解。
(a3, b3, c3) (a4, b4, c4) (a5, b5, c5)
(a6, b6, c6)
正确的博弈树构造方法
构造博弈树时只能按照由上至下的路径,而不能存在由下 向上的路径,也不能形成循环路径。 回溯路径唯一性在求解完全信息动态博弈时非常重要。 因为在求解动态博弈均衡时,一个很重要的方法是“逆向 归纳法(Backward Induction)”。 只有首先确保从博弈树任何最终节点向上回溯时路径唯一, 才能确保逆向归纳法的可操作性。
当博弈不再有后续节点时,需要将博弈的收益标识在博弈
树末端。
将博弈参与者的收益放在括号里。
需要注意的是:各博弈参与者的收益需要按照各参与者行
动顺序进行排列。 先行动的博弈参与者的收益写在左边,依次类推,从左到 右,最后行动的博弈参与者的收益写在最右边。 各个博弈参与者的收益之间用逗号分割。
(2, 0, 2) (2, 2, 0)
(1, 1, 1)
员工 3 不知道员工 1 和员工 2 的决策策略
1 H O 2 O 3 O H O H 3 O H H O 3 O
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
(2, 0, 2) (2, 2, 0)
处分出 N 条路径。 路径用线段表示。在线段旁注明相应的策略。 在“市场争夺战”博弈中,首先行动的潜在进入者可以采取两种策 略:“不进入”和“进入”。因此,从初始节点处引出两条线段,
在两条线段旁分别标识“不进入”和“进入”。
当潜在进入者选择结束后,达到在位者的节点。 在位者有两个选择:“斗争”和“默许”。 因此,从在位者的节点处引出两条线段,在两条线段旁分别标识 “斗争”和“默许”。
博弈树中包含若干“节点”,节点用小圆圈表示。
位于博弈树最上端的节点称为“初始节点”。 初始节点用空心小圆圈表示,其他节点均用实心小圆圈表示。 在每个节点处均对应某个博弈参与者,将节点对应的博弈参与者标识在 节点旁边。
例如:在“市场争夺战”博弈中,因为潜在进入者先行动,因此初始节
可以通过“海盗分宝博弈”这个生动有趣的故事对“逆向归纳法”
进行一个直观介绍。
一、海盗分宝博弈
1.海盗分宝博弈的规则 五个海盗首先进行抽签,确定决策顺序。 五个海盗按照决策顺序依次提出对 100 个金币的分配方案。 第一个海盗提出一个分配方案,如超过半数的海盗(包括提出分 配方案的海盗)同意第一个海盗的分配方案,即大于等于 3 名海 盗同意第一个海盗的分配方案时,那么该方案被通过,博弈结束。 如果第一个海盗提出的分配方案没有得到超过半数海盗的同意,
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
员工 3 不知道员工 1 的决策策略
1 H O 2 O 3 O H O H 3 O H H O 3 O
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
嫌疑人甲
坦白 不坦白
嫌疑人乙 坦白 不坦白 (5,5) (1,10) (10,1) (2,2)
第二节 完全且完美信息动态博弈概述
在完全且完美信息动态博弈(Dynamic Game with Perfect and Complete Information)中,每个博弈参与 者均知道在自己之前进行决策的参与者选择的策略和博弈结构。 博弈树中每个节点都独立构成一个信息集,没有虚线连接两个或 多个博弈树节点。 求解完全且完美信息动态博弈的重要方法之一是:逆向归纳法。