博弈论第四章 完全且完美信息动态博弈

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一 博弈扩展式表述
(一)博弈的标准式(或战略式、正则式或 策略式)
女 足球 足球 男 芭蕾 0,0 1,2 2,1 芭蕾 0,0
博弈的标准式(战略式)
开发商B 开发 不开发
开发 不开发 需求小的情况 开发 不开发
4000,4000 0,8000 8000,0 0,0
需求大的情况 开发商A
开发商B

王 P175
什么是“支”?
找出房地产开发博弈的子博弈
A
开发
不开发
B
开发
x
不开发
B
开发
x’
不开发
(-3,-3)
(1,0) (0,1) 房地产开发博弈
(0,0)
A
开发
不开发
x
不开发
开发 开发
x’
B
开发
x
不开发
B
开发
x’
(-3,-3)
(1,0)
(0,1)
(0,0) (-3,-3)
子博弈I
子博弈II
2. 无循环。重要的是在博弈运行中,我们不要 陷入僵局;树枝循原路折回并造成一个循环一定 是不可接受的。


3. 单方向前进。重要的是,对于博弈如何进行 下去不能模棱两可,因此,必定不存在二个或多 个枝导向同一个结。
为保证这三条性质,在前结点上强加下述限 制: 1.结点不能是自身的前结点。 2.前结点的前结点也是前结点:如果结点是 的前结点,依次结点是的前结点,那么也是 的前结点。 3 .前结点可以排序:如果 和 都是 的前结点, 必定是或者是的前结点,或者反过来。 4.必定存在一个共同的前结点:考虑任意两个 结,和,它们之间没有一个是另一个的前结 点。那么,必定存在一个结点 ,它是 和 双 方的前结点。
动态博弈的 战略
动态博弈的战略的表述

战略:参与人在给定信息集的情况下选择行动的规则,它规定参 与人在什么情况下选择什么行动,是参与人的“相机行动方案”。
si 表示第i个参与人的特定战略
Si si 代表第i个参与人所有可选择的 战略集合 如果n个参与人每人选择一个 战略, n维向量s (s1,s2, ,si, ,sn)称为一个战略组合 si 表示第i个人选择的战略
开发
-3000,-3000 0,1000
不开发
1000,0 0,0
开发商A
(二)博弈扩展式表述
博弈的扩展式表述包括四个要素: 参与人集合(Player) 每个参与人的战略集合(Strategy) 博弈的顺序(Order) 由战略组合决定的每个参与人的支付(Payoff)
扩展式表示的一个例子
在静态博弈中,战略和行动是相同的。
作为一种行动规则,战略必须是完备的。
Battle of Sexes if Boy moves first

足球 芭蕾

芭蕾
x
足球

芭蕾
x
足球
(0,0)
(2,1) (1,2)
(0,0)
Battle of Sexes if Boy moves first
男的策略:{足球,芭蕾}
的确,如果弟弟是会算计自己利益的理性人,在这样的环境下,还是不告状的好。可见,弟弟是理性人, 他的告状威胁是不可置信的。

完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965)

考虑下列问题: 一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更合 理? 纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其 他参与人的战略是给定的,但是如果参与人的行动有先有后,后 行动者的选择空间依赖于前行动者的选择,前行动者在选择时不 可能不考虑自己的行动对后行动者的影响。 子博弈完美纳什均衡的一个重要改进是将“合理纳什均衡”与 “不合理纳什均衡”分开。
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ) ( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
Of 8 strategy combination, 3 are Nash
B S
B S B S
B S
B S B S
B S
B S B S
Three Nash equilibria of Battle of Sexes are:


二、子博弈精炼纳什均衡(或子 博弈完美纳什均衡)

一个纳什均衡称为精炼纳什均衡,当只当参与人 的战略在每个子博弈中都构成纳什均衡,也就是 说,组成完美纳什均衡的战略必须在每一个子博 弈中都是最优的。 一个精炼纳什均衡首先必须是一个纳什均衡,但 纳什均衡不一定是精炼纳什均衡。 承诺行动-当事人使自己的威胁战略变得可置信的 行动。
完全且完美信息动态博弈的主要特点
(1)行动是顺序发生的, (2)下一步行动选择之前,所有以前的行动都
可以被观察到,
(3)每个可能的行动组合下局中人的收益是共
同知识。
第三章 完全且完美信息动态博弈

一 博弈扩展式表述 二 子博弈完美纳什均衡 三、用逆向归纳法求-子博弈完美 纳什均衡

四、完全且完美信息的动态博弈 的案例
N

A
开发
不开发
N

1/2


1/2
1/2
1/2
B
不开发 开发
B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8)
(0,0)
(0,1)
(0,0)
房地产开发博弈
Battle of Sexes again if Boy moves first
Girl Ballet Ballet Boy Soccer Soccer Soccer Ballet ( 1, 2) ( -1, -1) ( 0, 0)
(1,0) (0,8)
(0,0)
(0,1)
(0,0)
房地产开发博弈
支付
横向扩展式举例:
进入
进入者
在位者
合作(40,50) 斗争(-10,0)
不进入(0,300)
市场进入阻挠博弈树
扩展型
为了让“树”描绘博弈,其结点和枝需要满足三 条性质:

1.单一的出发点。重要的是知道博弈从何处开 始,所以必须有一个,也只能有一个出发点。
( B, { B, B }),
???
在8个图里找纳什均衡
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ) ( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ) ( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ) ( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 ) ( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
(1,0) (0,1)
(0,0)
子博弈Ⅲ
动态博弈中的子博弈

虚线框出的部分正是博 弈方 2 在 博弈方 1 选择 进时所面临的决策问题, 它本身构成博弈方 2 的 一个单人博弈,我们称 它为原先来后到博弈的 一个“子博弈”。
Game and subgames(子博弈未标完)
子博弈定义
由一个动态博弈第一阶段以外的某个阶段 开始的后续博弈阶段构成,它必须有初 始信息集,具备进行博弈所需要的各种 信息,能够自成一个博弈的原博弈的一 部分,称为原动态博弈的一个“子博 弈”。
第四章 完全且完美信息动态博弈
本章讨论动态博弈,所有博弈方都对博弈过程和 得益完全了解的完全且完美信息动态博弈。这类博弈 也是现实中常见的基本博弈类型。由于动态博弈中博 弈方的选择、行为有先后次序,因此在表示方法、利 益关系、分析方法和均衡概念等方面,都与静态博弈 有很大区别。本章对动态博弈分析的概念和方法,特 别是子博弈完美均衡和逆推归纳法作系统介绍,并介 绍各种经典的动态博弈模型。


子博弈完美纳什均衡

泽尔腾引入子博弈完美纳什均衡的概念的目的是将那 些不可置信威胁战略的纳什均衡从均衡中剔除,从而 给出动态博弈的一个合理的预测结果,简单说,子博 弈完美纳什均衡要求均衡战略的行为规则在每一个信 息集上是最优的。 什么是子博弈,什么是子博弈完美纳什均衡? 有没有更好的方法找到子博弈完美纳什均衡?

子博弈不好找!!! 学完后面的信息集请看P177
信息集
• 为了扩展式表述也可用来表述静态博弈,我们 使用虚线圈。如:
情爱博弈的扩展式表述

足球

芭蕾
足球 芭蕾

芭蕾
x
足球

芭蕾
x’

芭蕾
x
足球

芭蕾
x’
(1,2)
(-1,-1)(0,0)
(2,1)
(1,2)
(-1,-1)(0,0)
(2,1)
不同的纳什均衡可以对应相同的结果

一个动态博弈可能有多个(甚至无穷多个)纳 什均衡,究竟哪个更合理?
子博弈完美纳什均衡-不可置信威胁

美国普林斯顿大学古尔教授在1997年的《经济学透视》里发表文章,提出一个例子说明威胁的可信性问题:

两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具。 不耐烦的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我 告状,我都把你们两个关起来,关起来比没有玩具更可怕。 现在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说: 快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告诉爸 爸,我是要倒霉的,可是你不告状不过没有玩具玩,而告了状却 要被关禁闭,告状会使你的境遇变得更坏,所以你不会告状,因 此哥哥对弟弟的警告置之不理。
B在决策 时不确切地 知道自然的 选择; B的决策 结由4个变 为2个
B
不开发 开发
A
开发
不开发
N
大 小
1/2
N


1/2 1/2 1/2
B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8)
(0,0)
(0,1)
(0,0)
房地产开发博弈
B知道自 然的选择; 但不知道A 的选择(或A、 B同时决策)
参与人集合 参与人行动顺序 参与人的行动空间 参与人的信息集 参与人的支付函数
A
开发
参与人(A,B,N)
结,初始结 不开发
战略 N
外生事件的概率分布
N
大 小
1/2
结,决策结



1/2
1/21/2信息集B不开发 开发B
不开发 开发
B
不开发 开发
B
开发
不开发
,终点结
(4,4)
(8,0) (-3,-3)
( B, { B, B }), ( S, { S, S }), and ( S, { B, S });
Their corresponding outcomes are all:
( Ballet, Ballet ), ( Soccer, Soccer ), and ( Soccer, Soccer ).
( 2, 1)
Represent Battle of Sexes as a simultaneous-move game with a tree Girl Ballet Ballet Boy Soccer Soccer Information sets Soccer Ballet ( 1, 2) ( -1, -1) ( 0, 0)
(-1,-1)(0,0)
(2,1)
3、芭蕾策略:不管他选什么,我都选芭蕾;
可以写成标准式(战略式)
wife
{足球,足球} {足球,芭蕾} {芭蕾, 足球} {芭蕾,足球}
husband
足球
芭蕾
-3, -3
0, 1
-3, -3
0, 0
1, 0
0, 1
标准式(战略式)
1, 0
0, 0
The
strategy combinations.

足球 芭蕾
选择足球;还是选择芭蕾。 女的策略: (足球,芭蕾),(芭蕾,足球)

芭蕾
x
足球

芭蕾
x
足球
(芭蕾,芭蕾),(足球,足球) 1、追随策略:他选择什么,我就选择什么
2、对抗策略:他选择什么,我就偏不选什么
(1,2)
4、足球策略:不管他选什么,我都选足球。 策略即:如果他选择什么,我就怎样行动的相机行动方案。在扩展式博弈里, 参与人是相机行事,即“等待”博弈到达一个自己的信息集(包含一个或多个 决策结后,再采取行动方案。

完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965)

子博弈???
Think of a branch of a tree as a (smaller) tree. If a branch of a tree representing a game does not divide any information set of the game, then it is a subgame of the game.
博弈树始于 局中人1 的一个决策结点,这时1 要从L和R中作出选择,如果局中人1选择L,其后就 到达 局中人2 的一个决策结点,这时,局中人2要 从L′和R′中作出选择。类似地,如果局中人1选择R, 则将到达局中人2的另一个决策结点。 这时局中人2从L′和R′中选择行动。无论局中人2 选择了哪一个,都将到达终结点 (即博弈结束)且两 局中人分别得到相应终点节下面的收益。
相关文档
最新文档