序贯决策博弈相关资料(ppt 26页)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈的三要素
策略是在整个博弈中所有选择、行为的“完整计 划”。什么是计划:“如果对手选A,我将采取 行动X,如果…,我将采取行动…。”在同时决 策博弈中,行动就是策略,但在序贯决策博弈中, 行动是指每一个决策点上局中人的决策变量或行 动的具体抉择。
结果是上述“计划型”策略的策略组合,构成一 条路径。
策略组合
该博弈有八种可能的策略组合: ( {足球},{(上)足球,(下)足球} ) ( {足球},{(上)足球,(下)芭蕾} ) ( {足球},{(上)芭蕾,(下)足球} ) ( {足球},{(上)芭蕾,(下)芭蕾} ) ( {芭蕾},{(上)足球,(下)足球} ) ( {芭蕾},{(上)足球,(下)芭蕾} ) ( {芭蕾},{(上)芭蕾,(下)足球} ) ( {芭蕾},{(上)芭蕾,(下)芭蕾} )
主要内容
1、序贯博弈的定义和表示方法 2、寻找序贯博弈纳什均衡的“虚线排除确
定法” 3、寻找序贯博弈纳什均衡的“倒推法” 4、先动优势和后动优势 5、“倒退法”的缺陷
一、序贯博弈的定义和表示方法
在动态博弈中,参与人的行动有先后顺序, 而且后行动者在自己行动之前能观察到先 行动者的行动。
男●
足球
女 足球
●
芭蕾
芭蕾 ×
女 足球
●
芭蕾
◆ (2,1) × ◆ (0,0) × ◆ (-1,-1)
◆(1,2)
练习
• 开金矿博弈
乙
借
×不借
甲
分
×
(2,2) 打 ×
(1,0) 不分 乙
不打
(1,0)
(0,4)
倒推法的评价
逆推归纳法只能分析明确设定的博弈问题,要求 博弈的结构,包括次序、规则和得益情况等都非 常清楚,并且各个博弈方了解博弈结构,相互知 道对方了解博弈结构。这些可能有脱实际的可能
谁先动?潜在进入者
如何表示该博弈?
进入障碍博弈
进入者 ●
容忍 垄断者
●
进入 抵抗
◆ (1,5) ◆ (-2,2)
不进
垄断者 容忍 ◆ (0,10)
●
抵抗 ◆ (0,4)
二、序贯博弈的纳什均衡
例如:性别战.
足球 男●
芭蕾
女 足球
●
芭蕾
足球
●
芭蕾
◆ (2,1) ◆ (0,0) ◆ (-1,-1) ◆(1,2)
用虚线排除确定法寻找纳什均衡
将以上策略在博弈书中用粗线表示。 将存在单独改变激励的策略用虚线表示。方法如下: (1)找到第二阶段两根粗线所对应的支付。 (2)比较这两个支付前面的数字,如果大的数字所
对应的那条“树枝”是细的,则男方存在单独偏离 的动机,则男方的策略选择“树枝”用虚线表示。 (3)比较这两个后面付前面的数字,其中对应第一 阶段“树枝”是细的那个数字可以不再考虑,因为 男方没选这个方向。它是“虚”的。 (4)因此只在男方选的那个“树丫”上进行比较女 方的支付,如果大的数字对应的“树枝”是细的, 则女方的策略选择“树枝”用虚线表示。(P159)
逆推归纳法是动态博弈分析最重要、基本的方法。 步骤:
从博弈的最后一个阶段开始分析,通过比较最 后一个参与决策的局中人的支付,推断他或她的选 择,从而将他不会选的策略——“枝桠”砍掉,从 而回到上一个阶段,比较该阶段参与决策的局中人 的支付,将他或她不会选的策略砍掉,依此类推…
倒推法:(1)在上面一个枝桠上,由于最后一阶段是女方做决 策,因此比较女方的支付1和0,将0所对应的芭蕾策略砍掉, 没砍掉的打上箭头。(2)在下面一个枝桠上,由于最后一阶段 是女方做决策,因此比较女方的支付-1和2,将-1所对应的足 球策略砍掉,没砍掉的打上箭头。(3)回到第一个阶段,比较 带箭头的两个策略男方的支付(因为此时男方做决策),将支 付将较小的策略砍掉。
虚线排除确定法的缺陷
该方法可以找到纳什均衡,但找不到博弈 的最终结果。
均衡是策略的组合,而结果则是行动的组 合。
因此,我们一般用倒推法(Backwards Induction)来寻找序贯博弈的结果。
ห้องสมุดไป่ตู้
三、寻找序贯博弈的结果——倒推法
从动态博弈的最后一个阶段博弈方的行为开始分析, 逐步倒推回前一个阶段相应博弈方的行为选择,一 直到第一个阶段的分析方法,称为“逆推归纳法”。
扩展式表述博弈
博弈的扩展式表述: 参与人集合;参与人的行动顺序;行动空间;
信息集;支付函数;外生事件(即自然的选择) 的概率分布。 在扩展式表述博弈,参与人是相机行事,即“等 待” 博弈到达自己的信息集(包括一个或多个决 策)后再决定如何行动;在战略式表述博弈,参 与人似乎是在博弈开始之前,就制定出了一个完 全的相机行动计划,即“如果…发生,那么我将 现在…”。
支付对应每条路径,而不是对应每步选择、行为。 支付向量中,数字的排列按局中人的出场顺序出现。
构造博弈战略式表述
在进入障碍博弈中 潜在进入者只有一个信息集,两个可选择
的行动,其行动空间为: SA=(进入,不进入)
垄断者有两个信息集,每个信息集上有两 个可选择的行动,其行动空间为:
(进入,容忍)、 (进入,对抗) 、(不进 入,容忍) 、(不进入,对抗)
第四章 序贯决策博弈
序贯决策博弈:局中人做出策略选 择时知道对手的策略选择。
本章讨论动态博弈,所有博弈方都对博弈
过程和得益完全了解的完全且完美信息动 态博弈。这类博弈也是现实中常见的基本 博弈类型。由于动态博弈中博弈方的选择、 行为有先后次序,因此在表示方法、利益 关系、分析方法和均衡概念等方面,都与 静态博弈有很大区别。本章对动态博弈分 析的概念和方法,特别是子博弈完美均衡 和逆推归纳法作系统介绍,并介绍各种经 典的动态博弈模型。
博弈的扩展式表述——博弈树
它描述了博弈参与人的一个序贯决策过程,从博 弈数的根开始,到末端点结束。
拥有初始决策节点的局中人先做出决策,他的决 策引出博弈树的棱,而棱的末端将是下一个局中 人做出决策,依此类推。
举例
假如某个垄断企业一年可以赚10亿元的利润,假 定别的企业为了进入该行业需要投资4亿元。当新 的企业准备进入时,原有垄断企业有两种决策(1) “容忍”,但利润要变为5亿元。这时新的企业可 以得5亿,减去4亿投资,仍有1亿。(2)“抵 抗”,例如降低价格,企业的利润变为2亿元,且 新的企业也只得2亿,但减去投资,亏损2亿。