完全信息动态博弈

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

子博弈完美纳什均衡
一个纳什均衡称为完美纳什均衡,当只当参与 人的战略在每个子博弈中都构成纳什均衡,也 就是说,组成完美纳什均衡的战略必须在每一 个子博弈中都是最优的。 一个完美纳什均衡首先必须是一个纳什均衡, 但纳什均衡不一定是完美纳什均衡。 承诺行动-当事人使自己的威胁战略变得可置信 的行动。
战略集合
L L n 维向量 s = s1, s 2, , s i, , s n)称为一个战略组合 (
在静态博弈中,战略和行动是相同的。 在静态博弈中,战略和行动是相同的。 作为一种行动规则,战略必须是完备的。 作为一种行动规则,战略必须是完备的。
性别战博弈的扩展式表述

足球 芭蕾 足球

芭蕾

芭蕾
x
足球

芭蕾
x’

芭蕾
x来自百度文库
足球

芭蕾
x’
(1,2)
(-1,-1)(0,0)
(2,1)
(1,2)
(-1,-1)(0,0)
(2,1)
扩展式表述博弈的战略
男的策略:{足球,芭蕾}

足球 芭蕾
选择足球;还是选择芭蕾。 女的策略: (足球,芭蕾),(芭蕾,足球) (芭蕾,芭蕾),(足球,足球)
足球

芭蕾
x
足球
什么是参与人 的战略? 的战略? A
开发 不开发
B
开发
x
不开发
B
开发
x’
不开发
简写为: 简写为: (开发,开发),(开发,不开发), 开发,开发),(开发,不开发), ),(开发 不开发,开发),(不开发, ),(不开发 (不开发,开发),(不开发,不开 ),括号内的第一个元素对应A选择 发), “开发”时B的选择,第二个元素对应A 选择“不开发”时B的选择。
不开 开 (1,0) (0,8)
(8,0)
(-3,-3)
B知道自 然的选择; 但不知道A 信息集:房地产博弈III 的选择(或A、 B同时决策)
A 开发 N1 大 B1 开发 (4,4) 小 B2 不开发 开 (8,0) (-3,-3) 不开 开 (1,0) (0,8) 大 B3 不开 开 (0,0) (0,1) 不开发 N2 小 B4 不开 (0,0)


结, 终点结
(4,4)
(0,1)
(0,0)
房地产开发博弈
支付
B在决策 时不确切地 信息集:房地产博弈II 知道自然的 选择;
A
B的决策 结由4个变 为2个
大 B1 开发 (4,4)
开发 N1 小 B2 不开发 开
不开发 N2 大 B3 不开 开 (0,0) (0,1) 小 B4 不开 (0,0)
参与人1 丈夫)和参与人2 妻子) 参与人1(丈夫)和参与人2(妻子)必须独立决定出门时是否 带伞。他们知道下雨和不下雨的可能性均为50% 支付函数为: 50%, 带伞。他们知道下雨和不下雨的可能性均为50%,支付函数为: 如果只有一人带伞,下雨时带伞者的效用为-2.5, 如果只有一人带伞,下雨时带伞者的效用为-2.5,不带伞者的 效用为不下雨时带伞的效用为-1,不带的效用为 不带的效用为0 效用为-3;不下雨时带伞的效用为-1,不带的效用为0;如两人 都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1;给 不下雨时每人的效用为1; 都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1;给 出下列四种情况下的扩展式及战略式表述: 出下列四种情况下的扩展式及战略式表述: (1)两人出门前都不知道是否会下雨; (1)两人出门前都不知道是否会下雨;并且两人同时决定是否带 两人出门前都不知道是否会下雨 即每一方在决策时都不知道对方的决策); 伞(即每一方在决策时都不知道对方的决策); (2)两人在出门前都不知道是否会下雨,但丈夫先决策, (2)两人在出门前都不知道是否会下雨,但丈夫先决策,妻子观 两人在出门前都不知道是否会下雨 察到丈夫是否带伞后才决定自己是否带伞; 察到丈夫是否带伞后才决定自己是否带伞; (3)丈夫出门前知道是否会下雨,但妻子不知道,但丈夫先决策, (3)丈夫出门前知道是否会下雨,但妻子不知道,但丈夫先决策, 丈夫出门前知道是否会下雨 妻子后决策; 妻子后决策; (4),同(3),但妻子先决策,丈夫后决策. (4),同(3),但妻子先决策,丈夫后决策. 但妻子先决策
2.3 完全信息动态博弈
本节内容: 本节内容: 一 博弈扩展式表述 二 子博弈完美纳什均衡 三 应用举例
博弈的战略表述
案例- 房地产开发项目-假设有A、B两家开发商
市场需求:可能大,也可能小 投入:1亿
假定市场上有两栋楼出售: 假定市场上有两栋楼出售: 1.4亿 需求大时,每栋售价1.4 需求大时,每栋售价1.4亿, 需求小时,售价7千万; 需求小时,售价7千万; 如果市场上只有一栋楼 1.8亿 需求大时,可卖1.8 需求大时,可卖1.8亿 需求小时,可卖1.1 1.1亿 需求小时,可卖1.1亿
囚徒困境博弈的扩展式表述
A
坦白 抵赖 坦白
B
抵赖
B
抵赖 坦白
B
坦白
A
抵赖 坦白
A
抵赖 坦白 抵赖
(-8,-8)
(0,-10)
(-10,0) (-1,-1) (-8,-8) (0,-10) (-10,0)
(-1,-1)
囚徒困境博弈的扩展式表述
智猪博弈的扩展式表述?
案例2-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 0,0
B
开发
x
不开发
B
开发
x’
不开发
(-3,-3)
(1,0) (0,1)
(0,0)
开发商B 开发商B
{开发,开发} {开发,不开发} {不开发, 开发} {不开发,不开发} 开发 不开发
-3, -3 0, 1
-3, -3 0, 0
1, 0 0, 1
1, 0 0, 0
开发商A 开发商A
战略式
课堂练习: 课堂练习:
博弈的扩展式表述
扩展式表述所“扩展” 扩展式表述所“扩展”的主要是参与人的战略空间 战略式表述简单地给出参与人有些什么战略可以选择, 战略式表述简单地给出参与人有些什么战略可以选择, 每个战略的动态描述 动态 而扩展式表述要给出每个战略的动态描述:谁在什么 时候行动, 时候行动,每次行动时有些什么具体行动方案可供选 择,以及知道些什么 此时的战略:如果你这样, 此时的战略:如果你这样,我将怎样
动态博弈的战略的表述
战略:参与人在给定信息集的情况下选择行动的规则, 战略:参与人在给定信息集的情况下选择行动的规则,它规定 参与人在什么情况下选择什么行动,是参与人的“相机行动方 参与人在什么情况下选择什么行动,是参与人的“ 案”。
s i 表示第 i 个参与人的特定战略 如果 n 个参与人每人选择一个 s i 表示第 i 个人选择的战略 S i = {s i }代表第 i 个参与人所有可选择的 战略,
博弈战略表述
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 开发商A 不开发 开发商B 开发 不开发
4000, 4000,4000 0,8000 8000, 8000,0 0,0
开发商B 开发 不开发
-3000,-3000 3000, 0,1000 1000, 1000,0 0,0
博弈的战略式表述
式博弈里,参与人是相机行事,即“等待”博弈到达一个自己的 式博弈里,参与人是相机行事, 等待” 信息集(包含一个或多个决策结)后,再采取行动方案。 信息集(包含一个或多个决策结 后 再采取行动方案。
扩展式表述博弈的纳什均衡
若A先行动,B在知道A的行动后行动,则 A有一个信息集,两个可选择的行动,战 略空间为:(开发,不开发); :(开发,不开发) :(开发 B有两个信息集,四个可选择的行动,B 有四个纯战略: 开发策略:不论A开发不开发,我开发; 开发策略:不论A开发不开发,我开发; 追随策略: 开发我开发, 不开发我不开发; 追随策略:A开发我开发,A不开发我不开发; 对抗策略:A开发我不开发,A不开发我开发; 对抗策略: 开发我不开发, 不开发我开发; 不开发策略不论A开发不开发我不开发, 不开发策略不论A开发不开发我不开发,
完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965) 泽尔腾(1965)
考虑下列问题: 考虑下列问题: 一个博弈可能有多个(甚至无穷多个)纳什均衡, 一个博弈可能有多个(甚至无穷多个)纳什均衡,究 竟哪个更合理? 竟哪个更合理? 纳什均衡假定每一个参与人在选择自己的最优战略时 纳什均衡假定每一个参与人在选择自己的最优战略时 假定所有其他参与人的战略是给定的, 假定所有其他参与人的战略是给定的,但是如果参与 人的行动有先有后, 人的行动有先有后,后行动者的选择空间依赖于前行 动者的选择, 动者的选择,前行动者在选择时不可能不考虑自己的 行动对后行动者的影响。 行动对后行动者的影响。 子博弈完美纳什均衡的一个重要改进是将“ 子博弈完美纳什均衡的一个重要改进是将“合理纳什 均衡” 不合理纳什均衡”分开。 均衡”与“不合理纳什均衡”分开。
完全信息动态博弈-子博弈完美纳什均衡(举例)泽尔 腾(1965)
行动 合作(40,50) 进入
进入者
在位者
斗争(-10,0)
不可置信威胁
不进入(0,300) 市场进入阻挠博弈树 特点:剔除博弈中包含的不可置信威胁。 承诺行动-破釜沉舟-背水一战 给定进入者进入,剔除(进入,斗争),(进入,默许) 是唯一的子博弈完美纳什均衡 支付函数
(-3,-3)
(1,0) (0,1)
(0,0)
扩展式 A
开发 不开发
路径
在扩展式博弈中,所有n 在扩展式博弈中,所有n个参与人 的一个纯战略组合决定了博弈树 上的一个路径。 上的一个路径。 (开发,{不开发,开发})决定 开发, 不开发,开发} 了博弈的路径为A—开发 B—不 了博弈的路径为A 开发—B 不 开发 开发---( 开发--(1,0) (不开发,{开发,开发})决定 不开发, 开发,开发} 了路径:? 了路径:?

芭蕾
x
1、追随策略:他选择什么,我就选择什么 2、对抗策略:他选择什么,我就偏不选什么 3、芭蕾策略:不管他选什么,我都选芭蕾;
(1,2)
(-1,-1)(0,0)
(2,1)
4、足球策略:不管他选什么,我都选足球。
策略即 如果他选择什么,我就怎样行动的相机行动方案。 策略即:如果他选择什么,我就怎样行动的相机行动方案。在扩展
结,初始结 不开发
战略
N
大 小
包括决策结和终点结两类; 结: 包括决策结和终点结两类;决策结 是参与人行动的始点,终点结是决策人 是参与人行动的始点,N 结,决策结 行动的终点. 行动的终点.
信息集
B
开发
结满足传递性和非对称性 1/2 1/2 枝: 枝是从一个决策结到它的直接后 之前的所有结的集合,称为x x之前的所有结的集合,称为x的前列 枝 P(x),,每一个枝代表参与人的一x 续结的连线,之后的所有结的集合称为x 续结的连线x之后的所有结的集合称为 ),x 集 信息集: 信息集: 每个信息集是决策结集合的 个行动选择.x)。 B 不开发 后续集T 的后续集T( B 一个子集, 一个子集,该子集包括所有满足下列条 B 件的决策结: 件的决策结: 不开发 不开发 开发 不开发 1 每个决策结都是同一个参与人的决 开发 开发 策结; 策结; 1/2 2 该参与人知道博弈进入该集合的某 (8,0) 个决策结,但不知道自己究竟处于哪一 个决策结,(-3,-3) (1,0) (0,8) (0,0) 个决策结. 个决策结.
信息集:房地产博弈IV
N 大 B1 开 A1 开发 (4,4) 不开发 开 (8,0) (0,8) 不开 A2 开 A3 不开 开 (1,0) (0,1) 小 B2 不开 A4 不开 (0,0)
不开 开 (0,0) (-3,-3)
博弈扩展式表述
只包含一个决策结的信息集称为单结信息集, 只包含一个决策结的信息集称为单结信息集,如果 单结信息集 博弈树的所有信息都是单结的, 博弈树的所有信息都是单结的,该博弈称为完美信 息博弈。 息博弈。 自然总是假定是单结的,因为自然在参与人决策之 自然总是假定是单结的, 后行动等价于自然在参与人之前行动但参与人不能 观测到自然的行动。 观测到自然的行动。 不同的博弈树可以代表相同的博弈, 不同的博弈树可以代表相同的博弈,但是有一个基 本规则:一个参与人在决策之前知道的事情, 本规则:一个参与人在决策之前知道的事情,必须 出现在该参与人决策结之前。 出现在该参与人决策结之前。
博弈的扩展式表述
要素: 要素:
参与人集合 参与人的行动顺序 参与人的行动空间 参与人的信息集 参与人的支付函数 外生事件( 自然”的选择) 外生事件(即“自然”的选择)的概率分布
参与人集合 参与人行动顺序 参与人的行动空间 参与人的信息集 参与人的支付函数 外生事件的概率分布
A
开发
参与人(A,B,N)
相关文档
最新文档