第四章__序贯决策
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)“容忍”,但利润要变为5亿元。这时新的 企业可以得5亿,减去4亿投资,仍有1亿。
(2)“抵抗”,例如降低价格,企业的利润变为 2亿元,且新的企业也只得2亿,但减去投资,亏 损2亿。
谁先动?潜在进入者,简称“进入者” 如何表示该博弈? 分析“进入者”和“垄断者”的纯策略。
博弈树
用博弈树来表示序贯博弈。 它描述了博弈参与人的一个序贯决策过程,
假设垄断企业的老板交给你这样的策略: {对抗,容忍},你明白应该如何行动吗?
策略就是一个完整的行动计划,使得你可 以把它交给另外一个人,让他知道如何代 表你去执行这个策略。
什么是计划:“如果对手选A,我将采取行 动X,如果…,我将采取行动…。”
行动与策略
在同时决策博弈中,行动就是策略。 但在序贯决策博弈中,行动是指每一个决
本章讨论动态博弈,所有博弈方都对博弈
过程和得益完全了解的完全且完美信息动 态博弈。这类博弈也是现实中常见的基本 博弈类型。由于动态博弈中博弈方的选择、 行为有先后次序,因此在表示方法、利益 关系、分析方法和均衡概念等方面,都与 静态博弈有很大区别。本章对动态博弈分 析的概念和方法,特别是子博弈完美均衡 和逆推归纳法作系统介绍,并介绍各种经 典的动态博弈模型。
策点上局中人的决策变量或行动的具体抉 择。策略就是一个完整的行动计划。
策略组合
该博弈有八种可能的策略组合: ( {进入},{(上)容忍,(下)容忍} ) ( {进入},{(上)对抗,(下)对抗} ) ( {进入},{(上)对抗,(下)容忍} ) ( {进入},{(上)容忍,(下)对抗} ) ( {不进},{(上)容忍,(下)容忍} ) ( {不进},{(上)对抗,(下)对抗} ) ( {不进},{(上)对抗,(下)容忍} ) ( {不进},{(上)容忍,(下)对抗} )
二、寻找序贯博弈的纳什均衡
例如:如图所示的情侣博弈,分析该博弈 的纳什均衡?
足球 男●
女 足球
●
芭蕾
◆ (2,1) ◆ (0,0)
芭蕾
足球
●
◆ (-1,-1)
芭蕾
◆(1,2)
男方和女方的纯策略
男方有两个纯策略:足球和芭蕾
女方有四个纯策略: 不管你怎样,我总是芭蕾——{芭蕾,芭蕾} 不管你怎样,我总是足球——{足球,足球} 你选择什么,我就选择什么——{足球,芭蕾} 你选择什么,我就不选择什么——{芭蕾,足球}
第四章 序贯决策博弈
实验 : 枪手博弈1
三个快枪手相互之间的仇恨到了不可 调和的地步。这天他们三在街上不期而遇, 每个人的手都握住了枪把,一场生死决斗 马上就要开始……
已知这三个人中甲枪法精准,十发八 中;乙的枪法也不错,十发六中,丙的枪 法拙劣,十发四中。假如三个人同时开枪, 决一死战,一枪后谁最后活下来的机会大 一些?
实 验 : 枪手博弈2
假设现在三个枪手决定轮流开枪,谁活下 来的机会大一些?
实验:海盗分宝
五个海盗抢到100颗宝石,他们决定按如下方 法来分配:先抽签决定顺序(1,2,3,4,5); 然后先由1号提出分配方案,其余的人进行 表决,当且仅当半数和超过半数的人同意 时,则按1号所提方案分配,否则将1号扔进 大海喂鲨鱼,当1号方案被否决,则由2号提 出分配方案,其余的人进行表决,以此类 推,假定这些海盗都是理性人,问第一个 海盗应提出怎样的分配方案才能获得通过 并使自己的收益最大?
“进入者” 的有两个纯策略:进入和不进 入
“垄断者”的有四个纯策略: 不管你怎样,我总是容忍——{容忍,容忍} 不管你怎样,我总是对抗——{对抗,对抗} 你进我对抗,你不进我忍——{对抗,容忍} 你进我忍,你不进我对抗——{容忍,对抗}
注:花括号第一项表示垄断者在上决策节点b,即进入者 选择进入时他要选择的行动,第二项表示垄断者在下决策 节点c,即进入者选择不进入时他要选择的行动。
主要内容
1、序贯博弈的定义和表示方法 2、寻找序贯博弈纳什均衡的“箭头排除确
定法”(旧版教材上称为虚线排除确定法) 3、寻找序贯博弈纳什均衡的“倒推法” 4、先动优势和后动优势 5、“倒推法”的缺陷
一、序贯博弈的定义和表示方法
假如某个垄断企业一年可以赚10亿元的利润,假 定别的企业为了进入该行业需要投资4亿元。当新 的企业准备进入时,原有垄断企业有两种决策
从博弈数的根开始,到末端点结束。 拥有初始决策节点的局中人先做出决策,
他的决策引出博弈树的棱,而棱的末端将 是下一个局中人做出决策,依此类推。
进入障碍博弈
进入者 ●
a
进入 不进
容忍 垄断者
●
b
抵抗
◆ (1,5) ◆ (-2,2)
垄断者 容忍 ◆ (0,10)
●
c
抵抗 ◆ (0,4)
“进入者”和“垄断者”的纯策 略
支付
进入者纯策略与垄断者的“计划型”策略 形成策略组合,构成一条路径。
支付对应每条路径,而不是对应每步选择、 行为。
支付向量中,数字的排列按局中人的出场 顺序出现。(进入者,垄断者)
八种策略组合对应的支付
( {进入},{(上)容忍,(下)容忍} )——(1,5) ( {进入},{(上)对抗,(下)对抗} )——(-2,2) ( {进入},{(上)对抗,(下)容忍} )——(-2,2) ( {进入},{(上)容忍,(下)对抗} )——(1,5) ( {不进},{(上)容忍,(下)容忍} )——(0,10) ( {不进},{(上)对抗,(下)对抗} )——(0,4) ( {不进},{(上)对抗,(下)容忍} )——(0,10) ( {不进},{(上)容忍,(下)对抗} )——(0,4)
wk.baidu.com
八种策略组合,纳什均衡在哪
该博弈有八种可能的策略组合: ( {足球},{(上)足球,(下)足球} ) ( {足球},{(上)足球,(下)芭蕾} ) ( {足球},{(上)芭蕾,(下)足球} ) ( {足球},{(上)芭蕾,(下)芭蕾} ) ( {芭蕾},{(上)足球,(下)足球} ) ( {芭蕾},{(上)足球,(下)芭蕾} ) ( {芭蕾},{(上)芭蕾,(下)足球} ) ( {芭蕾},{(上)芭蕾,(下)芭蕾} )
(2)“抵抗”,例如降低价格,企业的利润变为 2亿元,且新的企业也只得2亿,但减去投资,亏 损2亿。
谁先动?潜在进入者,简称“进入者” 如何表示该博弈? 分析“进入者”和“垄断者”的纯策略。
博弈树
用博弈树来表示序贯博弈。 它描述了博弈参与人的一个序贯决策过程,
假设垄断企业的老板交给你这样的策略: {对抗,容忍},你明白应该如何行动吗?
策略就是一个完整的行动计划,使得你可 以把它交给另外一个人,让他知道如何代 表你去执行这个策略。
什么是计划:“如果对手选A,我将采取行 动X,如果…,我将采取行动…。”
行动与策略
在同时决策博弈中,行动就是策略。 但在序贯决策博弈中,行动是指每一个决
本章讨论动态博弈,所有博弈方都对博弈
过程和得益完全了解的完全且完美信息动 态博弈。这类博弈也是现实中常见的基本 博弈类型。由于动态博弈中博弈方的选择、 行为有先后次序,因此在表示方法、利益 关系、分析方法和均衡概念等方面,都与 静态博弈有很大区别。本章对动态博弈分 析的概念和方法,特别是子博弈完美均衡 和逆推归纳法作系统介绍,并介绍各种经 典的动态博弈模型。
策点上局中人的决策变量或行动的具体抉 择。策略就是一个完整的行动计划。
策略组合
该博弈有八种可能的策略组合: ( {进入},{(上)容忍,(下)容忍} ) ( {进入},{(上)对抗,(下)对抗} ) ( {进入},{(上)对抗,(下)容忍} ) ( {进入},{(上)容忍,(下)对抗} ) ( {不进},{(上)容忍,(下)容忍} ) ( {不进},{(上)对抗,(下)对抗} ) ( {不进},{(上)对抗,(下)容忍} ) ( {不进},{(上)容忍,(下)对抗} )
二、寻找序贯博弈的纳什均衡
例如:如图所示的情侣博弈,分析该博弈 的纳什均衡?
足球 男●
女 足球
●
芭蕾
◆ (2,1) ◆ (0,0)
芭蕾
足球
●
◆ (-1,-1)
芭蕾
◆(1,2)
男方和女方的纯策略
男方有两个纯策略:足球和芭蕾
女方有四个纯策略: 不管你怎样,我总是芭蕾——{芭蕾,芭蕾} 不管你怎样,我总是足球——{足球,足球} 你选择什么,我就选择什么——{足球,芭蕾} 你选择什么,我就不选择什么——{芭蕾,足球}
第四章 序贯决策博弈
实验 : 枪手博弈1
三个快枪手相互之间的仇恨到了不可 调和的地步。这天他们三在街上不期而遇, 每个人的手都握住了枪把,一场生死决斗 马上就要开始……
已知这三个人中甲枪法精准,十发八 中;乙的枪法也不错,十发六中,丙的枪 法拙劣,十发四中。假如三个人同时开枪, 决一死战,一枪后谁最后活下来的机会大 一些?
实 验 : 枪手博弈2
假设现在三个枪手决定轮流开枪,谁活下 来的机会大一些?
实验:海盗分宝
五个海盗抢到100颗宝石,他们决定按如下方 法来分配:先抽签决定顺序(1,2,3,4,5); 然后先由1号提出分配方案,其余的人进行 表决,当且仅当半数和超过半数的人同意 时,则按1号所提方案分配,否则将1号扔进 大海喂鲨鱼,当1号方案被否决,则由2号提 出分配方案,其余的人进行表决,以此类 推,假定这些海盗都是理性人,问第一个 海盗应提出怎样的分配方案才能获得通过 并使自己的收益最大?
“进入者” 的有两个纯策略:进入和不进 入
“垄断者”的有四个纯策略: 不管你怎样,我总是容忍——{容忍,容忍} 不管你怎样,我总是对抗——{对抗,对抗} 你进我对抗,你不进我忍——{对抗,容忍} 你进我忍,你不进我对抗——{容忍,对抗}
注:花括号第一项表示垄断者在上决策节点b,即进入者 选择进入时他要选择的行动,第二项表示垄断者在下决策 节点c,即进入者选择不进入时他要选择的行动。
主要内容
1、序贯博弈的定义和表示方法 2、寻找序贯博弈纳什均衡的“箭头排除确
定法”(旧版教材上称为虚线排除确定法) 3、寻找序贯博弈纳什均衡的“倒推法” 4、先动优势和后动优势 5、“倒推法”的缺陷
一、序贯博弈的定义和表示方法
假如某个垄断企业一年可以赚10亿元的利润,假 定别的企业为了进入该行业需要投资4亿元。当新 的企业准备进入时,原有垄断企业有两种决策
从博弈数的根开始,到末端点结束。 拥有初始决策节点的局中人先做出决策,
他的决策引出博弈树的棱,而棱的末端将 是下一个局中人做出决策,依此类推。
进入障碍博弈
进入者 ●
a
进入 不进
容忍 垄断者
●
b
抵抗
◆ (1,5) ◆ (-2,2)
垄断者 容忍 ◆ (0,10)
●
c
抵抗 ◆ (0,4)
“进入者”和“垄断者”的纯策 略
支付
进入者纯策略与垄断者的“计划型”策略 形成策略组合,构成一条路径。
支付对应每条路径,而不是对应每步选择、 行为。
支付向量中,数字的排列按局中人的出场 顺序出现。(进入者,垄断者)
八种策略组合对应的支付
( {进入},{(上)容忍,(下)容忍} )——(1,5) ( {进入},{(上)对抗,(下)对抗} )——(-2,2) ( {进入},{(上)对抗,(下)容忍} )——(-2,2) ( {进入},{(上)容忍,(下)对抗} )——(1,5) ( {不进},{(上)容忍,(下)容忍} )——(0,10) ( {不进},{(上)对抗,(下)对抗} )——(0,4) ( {不进},{(上)对抗,(下)容忍} )——(0,10) ( {不进},{(上)容忍,(下)对抗} )——(0,4)
wk.baidu.com
八种策略组合,纳什均衡在哪
该博弈有八种可能的策略组合: ( {足球},{(上)足球,(下)足球} ) ( {足球},{(上)足球,(下)芭蕾} ) ( {足球},{(上)芭蕾,(下)足球} ) ( {足球},{(上)芭蕾,(下)芭蕾} ) ( {芭蕾},{(上)足球,(下)足球} ) ( {芭蕾},{(上)足球,(下)芭蕾} ) ( {芭蕾},{(上)芭蕾,(下)足球} ) ( {芭蕾},{(上)芭蕾,(下)芭蕾} )