第三章 完全信息动态搏弈-子博弈精炼纳什均衡(博弈论与信息经济学-中科院, 张玲玲)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(不开发,{开发,开发})决定 了路径:?
wenku.baidu.com开发
开发商A
不开发
{开发,开发}
-3, -3 0, 1
开发商B
{开发,不开发} {不开发, 开发} {不开发,不开发}
-3, -3 1, 0 1, 0 0, 0 0, 1 0, 0
战略式 {开发,(开发,不开发)}
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
房地产开发博弈 支付
一 博弈扩展式表述
博弈的基本构造 结: 包括决策结和终点结两类;决策结是参与人行动的始点,终点结
是决策人行动的终点. ✓ 结满足传递性和非对称性 ✓ x之前的所有结的集合,称为x的前列集P(x),x之后的所有结
的集合称为x的后续集T(x)。 枝: 枝是从一个决策结到它的直接后续结的连线,每一个枝代表参
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的战略式表述
一 博弈扩展式表述
博弈的扩展式表述包括三个要素:
✓ 参与人集合 ✓ 每个参与人的战略集合 ✓ 由战略组合决定的每个参与人的支付
进入者
进入 在位者 不进入(0,300)
合作(40,50) 斗争(-10,0)
若A先行动,B在知道A的行动后行动, 则A有一个信息集,两个可选择的行动, 战略空间为:(开发,不开发);
A
开发
不开发
B有两个信息集,四个可选择的行动,B 有四个纯战略:
✓ 开发策略:不论A开发不开发,我开发;
Bx
不开发
开发
B
开发

x’ ✓
不开发

追随策略:A开发我开发,A不开发我不开发; 对抗策略:A开发我不开发,A不开发我开发; 不开发策略不论A开发不开发我不开发,
(2,1) 3、芭蕾策略:不管他选什么,我都选芭蕾; 4、足球策略:不管他选什么,我都选足球。
策略即:如果他选择什么,我就怎样行动的相机行动方案。在扩展式博弈里,
参与人是相机行事,即“等待”博弈到达一个自己的信息集(包含一个或多个 决策结后,再采取行动方案。
扩展式表述博弈的纳什均衡
什么是参与人 的战略?
主要内容简介
第二篇 信息经济学
第六章 委托-代理理论(I) 第七章 委托-代理理论(II) 第八章 逆向选择与信号传递
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
一 博弈扩展式表述 二 子博弈精练纳什均衡 三 应用举例
博弈的战略表述
案例- 房地产开发项目-假设有A、B两家开发商
市场需求:可能大,也可能小
完全信息静态 博弈的特点?
占优均衡 DSE
重复剔除占优均衡 IEDE
纯战略纳什均衡 PNE
混合战略纳什均衡 MNE
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)
考虑下列问题:
✓ 一个博弈可能有多个(甚至无穷多个)纳什均衡,究 竟哪个更合理?
✓ 纳什均衡假定每一个参与人在选择自己的最优战略时 假定所有其他参与人的战略是给定的,但是如果参与 人的行动有先有后,后行动者的选择空间依赖于前行 动者的选择,前行动者在选择时不可能不考虑自己的 行动对后行动者的影响。
不开发

1/2
N

1/2
B
B
B
B 不开发
不开发
不开发
不开发 开发
开发
开发
开发
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
房地产开发博弈
一 博弈扩展式表述
只包含一个决策结的信息集称为单结信息集, 如果博弈树的所有信息都是单结的,该博弈称 为完美信息博弈。
博弈论与信息经济学
(Game Theory and Information Economics )
主要内容简介
第一章 概述-人生处处皆博弈
第一篇 非合作博弈理论
第二章 完全信息静态信息博弈-纳什均衡 第三章 完全信息动态搏弈-子博弈精炼纳什均衡 第四章 不完全信息静态博弈-贝叶斯纳什均衡 第五章 不完全信息动态博弈-精练贝叶斯纳什均衡
坦白
抵赖
(-8,-8) (0,-10) (-10,0) (-1,-1) (-8,-8) (0,-10) (-10,0) (-1,-1)
囚徒困境博弈的扩展式表述
智猪博弈的扩展式表述?
案例2-智猪博弈
小猪
大猪
按 等待
按 5,1 9,-1
等待 4,4 0,0
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
子博弈精炼纳什均衡-不可置信威胁
美国普林斯顿大学古尔教授在1997年的《经济学透视》 里发表文章,提出一个例子说明威胁的可信性问题:
两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦的父亲宣 布政策:好好去玩,不要吵我,不管你们谁向我告状,我都把你们两 个关起来,关起来比没有玩具更可怕。现在,哥哥又把弟弟的玩具抢 去玩了,弟弟没有办法,只好说:快把玩具还我,不然我就要去告诉 爸爸。各个想,你真要告诉爸爸,我是要倒霉的,可是你不告状不过 没有玩具玩,而告了状却要被关禁闭,告状会使你的境遇变得更坏,
✓ 子博弈精练纳什均衡的一个重要改进是将“合理纳什 均衡”与“不合理纳什均衡”分开。
完全信息动态博弈-子博弈精练纳什均衡 (举例)泽尔腾(1965)
行动
进入者
进入 在位者 不进入(0,300)
合作(40,50)
斗争(-10,0)
不可置信威胁
市场进入阻挠博弈树 特点:剔除博弈中包含的不可置信威胁。
支付函数
一个精练纳什均衡首先必须是一个纳什均 衡,但纳什均衡不一定是精练纳什均衡。
承诺行动-当事人使自己的威胁战略变得可 置信的行动。
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)
泽尔腾引入子博弈精练纳什均衡的概念的 目的是将那些不可置信威胁战略的纳什均 衡从均衡中剔除,从而给出动态博弈的一 个合理的预测结果,简单说,子博弈精练 纳什均衡要求均衡战略的行为规则在每一 个信息集上是最优的。
博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
海萨尼(1967-1968)
动态
完全信息动态博弈 子博弈精练纳什均衡
泽尔腾(1965)
不完全信息动态博弈 精练贝叶斯纳什均衡
泽尔腾(1965) Kreps 和Wilson(1982) Fudenberg 和Tirole(1991)
与人的一个行动选择. 信息集: 每个信息集是决策结集合的一个子集,该子集包括所有满
足下列条件的决策结: ✓ 1 每个决策结都是同一个参与人的决策结; ✓ 2 该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟
处于哪一个决策结.
B在决策 时不确切地 知道自然的 选择;
B的决策 结由4个变 为2个
si表示第 i个参与人的特定战略
Si si代表第 i个参与人所有可选战择略的集合
如果n个参与人每人选择战一略个, n维向量 s (s1,s2, ,si, ,sn)称为一个战略组合 si表示第 i个人选择的战略
在静态博弈中,战略和行动是相同的。
作为一种行动规则,战略必须是完备的。
扩展式表述博弈的纳什均衡
➢纳什均衡与均衡结果:
存在三个纯战略纳什均衡:
(不开发,(开发,开发)), (开发,(不开发,开发), (开发,(不开发,不开发))
两个均衡结果:
(开发,不开发)
(不开发,开发)
注意:均衡不同于均衡结果
开发
开发商A
不开发
{开发,开发}
-3, -3 0, 1
开发商B
{开发,不开发} {不开发, 开发} {不开发,不开发}
简写为:
(-3,-3)
(1,0) (0,1)
(0,0)
(开发,开发),(开发,不开发), (不开发,开发),(不开发,不开 发),括号内的第一个元素对应A选择 “开发”时B的选择,第二个元素对应A 选择“不开发”时B的选择。
扩展式 A
开发
不开发
Bx
不开发
开发
B x’
不开发 开发
(-3,-3) (1,0) (0,1) (0,0)
投入:1亿
❖假定市场上有两栋楼出售: ✓需求大时,每栋售价1.4亿, ✓需求小时,售价7千万; ❖如果市场上只有一栋楼 ✓需求大时,可卖1.8亿 ✓需求小时,可卖1.1亿
博弈战略表述
需求大的情况
开发商B 开发 不开发
开发商A
开发 4000,4000 不开发 0,8000
8000,0 0,0
需求小的情况 开发商A
A
开发
N

1/2

1/2
不开发

1/2
N

1/2
B
B
B
B 不开发
不开发
不开发
不开发 开发
开发
开发
开发
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
房地产开发博弈
B知道自 然的选择; 但不知道A 的选择(或A、 B同时决策)
A
开发
N

1/2

1/2
一 博弈扩展式表述 二 子博弈精练纳什均衡
• 扩展式表述博弈的纳什均衡 • 子博弈精练纳什均衡 • 用逆向归纳法求子搏弈精练纳什均衡 • 承诺行动与子搏弈精练纳什均衡 • 逆向归纳法与子搏弈精练纳什均衡的存在问题
三 应用举例
博弈的划分
博弈的划分: 从参与人行动的先后顺序:静态博弈和动态博弈
自然总是假定是单结的,因为自然在参与人决 策之后行动等价于自然在参与人之前行动但参 与人不能观测到自然的行动。
不同的博弈树可以代表相同的博弈,但是有一 个基本规则:一个参与人在决策之前知道的事 情,必须出现在该参与人决策结之前。
囚徒困境博弈的扩展式表述
A
坦白
抵赖
B
坦白
抵赖
B
抵赖
坦白
B
A
A
抵赖
抵赖 坦白 坦白
o什么是动态博弈? 男
足球
芭蕾
男的策略:{足球,芭蕾} 选择足球; 还是选择芭蕾。 女的策略:
女x
足球
芭蕾

芭蕾
x’
足球
(足球,芭蕾),(芭蕾,足球) (芭蕾,芭蕾),(足球,足球) 1、追随策略:他选择什么,我就选择什么 2、对抗策略:他选择什么,我就偏不选什么
(1,2) (-1,-1)(0,0)
❖ 静态博弈:参与人同时选择行动或非同时行动但 后行动者并不知道前行动者采取了什么具体行动;
❖ 动态博弈:参与人行动有先后顺序,且后行动者 能够观察先行动者选择的行动。
博弈的划分
参与人对其他参与人(对手)的特征、战略空 间及支付函数的知识:完全信息博弈和不完全 信息博弈。
❖ 完全信息:每一个参与人对所有其他参与人的 (对手)的特征、战略空间及支付函数有准确 的 知识,否则为不完全信息。
-3, -3 1, 0 1, 0 0, 0 0, 1 0, 0
战略式 {开发,(开发,不开发)}
扩展式 A
开发
不开发
Bx
不开发
开发
B x’
不开发 开发
(-3,-3) (1,0) (0,1) (0,0)
➢路径
在扩展式博弈中,所有n个参与人 的一个纯战略组合决定了博弈树 上的一个路径。
(开发,{不开发,开发})决定 了博弈的路径为A—开发—B—不 开发--(1,0)
承诺行动-破釜沉舟-背水一战
❖给定进入者进入,剔除(进入,斗争),(进入,默许) 是唯一的子博弈精练纳什均衡-举例(结婚-反对)
二 子博弈精练纳什均衡
一个纳什均衡称为精练纳什均衡,当只当 参与人的战略在每个子博弈中都构成纳什 均衡,也就是说,组成精练纳什均衡的战 略必须在每一个子博弈中都是最优的。
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
一 博弈扩展式表述 二 子博弈精练纳什均衡
• 扩展式表述博弈的纳什均衡 • 子博弈精练纳什均衡 • 用逆向归纳法求子搏弈精练纳什均衡 • 承诺行动与子搏弈精练纳什均衡 • 逆向归纳法与子搏弈精练纳什均衡的存在问题
三 应用举例
战略的表述
✓ 战略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
不可置信威胁
市场进入阻挠博弈树
参与人集合
参与人行动顺序 参与人的行动空间 参与人的信息集 参与人的支付函数
A
参与人(A,B,N)
结,初始结
开发
不开发
战略
外生事件的概率分布
N
结,决策结
N
信息集
B
开发

1/2

1/2

不开发
B
B
不开发
开发
开发

1/2
不开发

1/2
B 不开发
开发
,终点结
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
一 博弈扩展式表述 二 子博弈精练纳什均衡
• 扩展式表述博弈的纳什均衡 • 子博弈精练纳什均衡 • 用逆向归纳法求子搏弈精练纳什均衡 • 承诺行动与子搏弈精练纳什均衡 • 逆向归纳法与子搏弈精练纳什均衡的存在问题
三 应用举例
子博弈精炼纳什均衡
泽尔腾引入子博弈精练纳什均衡的概念 的目的是将那些不可置信威胁战略的纳 什均衡从均衡中剔除,从而给出动态博 弈的一个合理的预测结果,简单说,子 博弈精练纳什均衡要求均衡战略的行为 规则在每一个信息集上是最优的。
相关文档
最新文档