北京大学博弈论课件完全信息动态博弈

合集下载

博弈论 完全信息动态博弈.ppt

博弈论 完全信息动态博弈.ppt

4、工会、雇主与中央银行的经济博弈
考虑工资、物价、就业的宏观经济模型:
• 中央银行:选择货币供应量,在其效用函 数中关注通货膨胀率与就业水平;
• 企业:选择就业数量,使企业利润最大化 (受工人的工资影响);
• 就业者:要求工资水平,使自身福利最大 化(受通货膨胀率影响)。
• 由于劳动合同和工资刚性,博弈顺序为:
• 企业1首先选择产量q1,企业2观察到企业1的产量 后选择自己的产量q2,令: P(Q)=a-q1-q2代表逆需求函数 Ci(qi)=cqi代表成本函数 则第i企业的利润函数为:
i(q1,q2)=qiP(q1+q2)-Ci(qi)
企业1 q1
企业2 q2
市场
i=1,2
P(Q)
企业利润:
i(q1,q2)
• 若T=1,在T=1时,参与人1出价,如果他提出 x1=1,参与人2只能接受。
两阶段博弈(T=2)
• 若T=2,在T=2时,参与人2出价,如果他提 出x2=0,参与人1只能接受;
• 由于参与人2在T=2时的1单位支付相当于在 t=1时δ2单位,如果参与人在t=1时出价1-x1≥δ2, 则参与人2会接受。
承诺价值
• 在该博弈中,拥有信息优势反而使参与人处 于劣势,企业1称为领导者,企业2称为随从。
• 现在考察完全信息静态情形下:如果企业1 承 信诺呢?(威协)生产q1*=(a-c)/2,企业2是否会相
• 若 优 信企选企业择业将21选的是择威qq1胁*2=*,=3((唯aa--一cc))//的48, ,纳则 因什此 此均时企衡企业是业2不1会的相最 q1*=q2*=(a-c)/3。
企业1 q1
企业2 q2
市场
P(Q)

北大课件博弈论与公共政策之完全信息动态博弈

北大课件博弈论与公共政策之完全信息动态博弈

第1讲之例1:囚徒困境
囚徒1
抵赖 招认
囚徒2
抵赖
招认
-1,-1
-9,0
0,-9
-6,-6
? (2)用标准式表述例6中的博弈
三、动态博弈的均衡
? 1、利用标准式表述求纳什均衡
? 2、在博弈树上找纳什均衡
四、子博弈精炼纳什均衡
? 1、可置信的威胁与不可置信的威胁
? 一种威胁所规定的行动在事前看来是最优 的,但事后看并不是参与者的最优选择, 这种威胁就是不可置信的,含有这种威胁 的策略就不是一个合理的策略。
? 甲、乙双方在签订一项合同后,乙方违约。 乙方提出和解,愿意赔偿7万元。甲方如果 上法庭,可望获得10万元赔偿,但要付出2 万元的诉讼费用。
? 甲方应当接受和解还是上法庭?
决策树
逆向归纳法
? 从右往左逐步分析。在这个过程中: ? ① 对于机会结,计算期望收益,并将相应
的值写在该结下面。 ? ② 对于决策结,还是做两件事: ? 第一,在较劣的决策枝上划叉; ? 第二,将对应于最优决策枝的收益写在该
? 结果2:仅得到2万元的修车费赔偿,概率 为30%;
? 结果3:得不到任何赔偿,概率为20%。 ? 甲方应当接受和解还是上法庭?
例4:购买土地
? 某人打算购买土地,现有A、B两块地可以 选择。A、B两块地的售价分别为30万元和 25万元。这两块地看起来差不多,所以买 方起初打算购买价格更便宜的B。但是,买 方进一步了解得知,B可能存在环境问题, 因为该地过去被堆放过大量垃圾,而A不存 在类似问题。如果B被危险垃圾污染,依照 法律规定,买方必须进行无害化处理,成 本为20万元。买方估计,B被危险垃圾污染 的概率为50%。
? ① 始于博弈树中一个单结信息集的决策结, 但不包括博弈的第一个决策结;

博弈论以及应用之3完全且完美信息动态博弈[1].pptx

博弈论以及应用之3完全且完美信息动态博弈[1].pptx

3.8 空头承诺II
回顾
在前述产品开发博弈中,均衡结果(不开发,(开发,开发)) 就是企业A的空头承诺,是不可置信的。
生活中的空头承诺
学生对老师的承诺
老师,这回让我过吧,以后我会好好学习的 老师,先发表一篇达到毕业要求,以后一定会写核心期刊的
山盟海誓
爱你一万年 海枯石烂
1,0 0,0
纳什均衡
企业A开发B不开发
➢ (开发,(不开发,开发)) ➢ (开发,(不开发,不开发))
企业A 不开发B开发
➢ (不开发,(开发,开发))
2020/3/4
9
3.3 动态博弈中的行为与战略VII
总结:动态博弈的矩阵描述存在的问题
战略空间复杂
后行动者的战略空间随局中人的数量和每一阶段局中人的行 动选择数量而急剧增大
25
3.9 承诺行动IV
绑架与劫持中的承诺行动
对峙中的谈判
拒绝谈判
➢ 历史上拒绝谈判曾是一种高效方法,汉武帝和曹操都用过 ➢ 实际生活中拒绝谈判也是一种重要策略 ➢ 交出控制权是拒绝谈判的一种具体形式
谈判中的承诺
➢ 歹徒的承诺可信吗?
职业歹徒的承诺是可信的,因为他们在树立和维护自己的声誉 非职业歹徒的承诺可能也是可信的,因为他们可能不想罪加一等
先行者:美国 后行者:中国
2020/3/4
4
3.3 动态博弈中的行为与战略II
模型描述
战略空间
美国——先行者
➢ 战略就是行动
中国——后行者
➢ 战略是针对先行者各种可能行动而制定的行动方案,包括 美国犯我,我犯人;美国不犯我,我犯人 美国犯我,我不犯人;美国不犯我,我不犯人 美国犯我,我犯人;美国不犯我,我不犯人 美国犯我,我不犯人;美国不犯我,我犯人

(完整版)完全信息动态博弈.ppt

(完整版)完全信息动态博弈.ppt

(四)参与人在博弈树中的顺序
1、排序的基本原则
一个参与人在决策之前知道的事情必须出现在该 参与人的决策结之前。
2、自然人的排序
– 如果参与人不能观测到虚拟人——自然的行动, 自然的决策结置于该参与人的前后都一样;
– 自然的信息集总是假定为单结。
N
大 1/2 A
小 1/2 A


发开

B
B
开发
不开发 开发 不开发
– 博弈的战略式表述只包括三个要 素
– 扩展式表述包括以下六个方面的 要素
扩展式表述包括以下六个方面的要素:
– 参与人集合:i=1、2、…,n;并且用大写N代表 虚拟的参与人——“自然”;
– 参与人的行动顺序(The order of moves):谁在什么 时候行动;
– 参与人的行动空间(Action set):在每次行动时, 参与人有些什么选择;
A
坦白 抵赖
B
B
坦白
抵赖
抵赖
坦白
(-8, -8) (0,-10) (-10, 0) (-1,-1)
B
坦白 A
抵赖 A
坦白
抵赖
抵赖
坦白
(-8, -8) (0,-10) (-10, 0) (-1,-1)
(五)完美回忆
完美回忆(Perfect recall)是指没有参与人会 忘记自己以前知道的事情,所有参与人都 知道自己以前的选择。
第三章 完全信息动态博弈
Dynamic Games of Complete Information
@ 2009 Zheng Daowen, All Rights Reserved
动态博弈:参与人的行动有先后顺序,且后 行动者在自己行动之前能观测到先行动者 的行动。

博弈论与信息经济学--完全信息动态博弈 ppt课件

博弈论与信息经济学--完全信息动态博弈  ppt课件

©&® by H. Q. Feng, CUFE
5/58
一、动态博弈的表述——扩展式
(2)博弈的扩展式表述包括以下要素: 参与人集合:i=1,…,n,此外,N代表虚拟参与人“自然” 参与人的行动顺序:谁在什么时候行动; 参与人的行动空间:在每次行动时,参与人有些什么选择; 参与人的信息集:每次行动时,参与人知道什么; 参与人的支付函数:在行动结束之后,每个参与人得到些什 么(支付是所有行动的函数); 外生条件(即自然的选择)的概率分布。 假定房地产开发博弈的行动顺序如下:开发商A首先行动, 选择开发或不开发;在A决策后,自然选择市场需求的大小; 开发商B在观测到A的决策和市场需求后,决定开发或不开 发。
该博弈的扩展式表述为:
©&® by H. Q. Feng, CUFE
15/58
一、动态博弈的表述——扩展式
进入者
进入
不进入
在位者
斗争 默许
(0,300)
(-10,0)
(40,50)
©&® by H. Q. Feng, CUFE
16/58
二、子博弈精炼纳什均衡
纳什均衡有几个问题:
第一,一个博弈不止一个均衡,事实上,有些 博弈可能有无数个纳什均衡,究竟哪一个更合 理? 纳什均衡假定每一个参与人在选择自己的最优 战略时假定所有其他参与人的战略是给定的, 但是如果参与人的行动有先有后,后行动者的 选择空间依赖于前行动者的选择,先行动者在 选择时不可能不考虑自己的行动对后行动者的 影响。
©&® by H. Q. Feng, CUFE 20/58
二、子博弈精炼纳什均衡
“子博弈”的概念:从每一个行动选择开始至 博弈结束又构成一个博弈,称为“子博弈”。 如在进入者选择进入之后,在位者选择行动 开始就是一个子博弈。 子博弈需满足的条件:

博弈论完全且完美信息动态博弈.ppt

博弈论完全且完美信息动态博弈.ppt

甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
能否找到子博弈?
好1差
1 不卖
1


不卖
2
(0,0) (0,0)
买 不买
买 不买
(2,1)
(0,0)
(1,-1)
(-1,0)
二手车交易扩展形
结论:
(1)子博弈不能包括原博弈的第一阶段, 即动态博弈本身不会是它自己的子博弈;
(2)子博弈必须有一个明确的初始信息集, 以及必须包含初始阶段之后的所有博弈 阶段,即子博弈不能分割任何信息集或在 有多节点信息集的不完美信息博弈中可 能不存在子博弈。
3.3 子博弈和子博弈完美纳什均衡
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
3.3.1 子博弈
定义:由一个动态博弈 第一阶段以外的某阶段 开始的后续博弈阶段构 成的,有初始信息集和 进行博弈所需要的全部 信息,能够自成一个博 弈的原博弈的一部分, 称为原动态博弈的一个 “子博弈”。
乙 借
第三种开金矿博弈中, (不借-不打,不分)和 (借-打,分)都是纳什均衡。但后者不可信,不 可能实现或稳定。
结论:纳什均衡在动态博弈可能缺乏稳定性,也就 是说,在完全信息静态博弈中稳定的纳什均衡,在 动态博弈中可能是不稳定的,不能作为预测的基础。
根源:纳什均衡本身不能排除博弈方策略中包含的 不可信的行为设定,不能解决动态博弈的相机选择 引起的可信性问题
《博弈论与信息经济学》
第三章
完全且完美信息动态博弈
本章讨论动态博弈,所有博弈方都对博弈 过程和得益完全了解的完全且完美信息动态博 弈。这类博弈也是现实中常见的基本博弈类型。 由于动态博弈中博弈方的选择、行为有先后次 序,因此在表示方法、利益关系、分析方法和 均衡概念等方面,都与静态博弈有很大区别。 本章对动态博弈分析的概念和方法,特别是子 博弈完美均衡和逆推归纳法作系统介绍,并介 绍各种经典的动态博弈模型。

lec4_完全信息动态博弈——博弈论课件

lec4_完全信息动态博弈——博弈论课件


息集上的概率分布是独立的。
——
完 全 信 息 动
通 出 择 ( A(俗现hAA((i(,地hh2ii(()我说1))2…将,));…以行)如)”为Δ果的。战(概h略Ai((率可h2i)(分以出布1表现)选述,)择)为我的将“概以如率Δ果分h布i(选1)



行为战略

弈 论
纯战略可以理解为行为战略的一个特例,这

里概率分布是退化分布。
——
义 可以仿造纯战略形式给出行为战略意义下纳
什均衡的定义。这里从略。
完 全 信
可 与用 人σ i在i表信示息行集为hi战选略择,行动σaii(的a概i|率hi。)表示参
的“相机选择”问题。


❖在战略式表述博弈中,参与人似乎是博弈
态 博
开始之前就制定出了一个完全的相机选择,

即“如果……发生,我将选择……”。
动态博弈的策略式表述


论 从扩展式表述构造战
讲 义
略式表述
——
❖假定开发商A先决策,
A

开发商B观测到A的
开发
不开发

选择后决策。

B
B
息 动 态
❖那么博弈的扩展式表 述如图2-8表述。

博弈树



❖信息集:是决策结集合的一个子集。


➢每个决策结都是同一个参与人的决策结。
——
➢该参与人知道博弈进入该集合的某个决策结,

但不知道自己究竟出于哪一个决策结(若该信
全 信
息集有两个或两个以上元素)。

完全信息动态博弈-PPT

完全信息动态博弈-PPT

(1) 开发商A先行动, 选择开发或不开发;(2) 开发商B在
观测到A得决策后, 再决定开发或不开发。博弈树如下
图。
A


B
B




(-3,-3)
(1,0) (0,1)
(0,0)
注:所有n个局中人得一个纯策略组合决定了博弈树上得一条 路径。但每条路径可由不同得策略组合决定。
例如, (开发,(不开发,开发))决定了 A -> 开发 -> B -> 不开发 -> (1,0)
进 入 进入 者 不进入
在位者
默许
斗争
5,5 1,10
-2,3 1,10
承诺行动使 不可ቤተ መጻሕፍቲ ባይዱ信威胁可信威胁,否则,当事人将为自 己得“失信”付出成本。
例如,该例中,在位者与某第三者打赌,如果进入者进入后她 不斗争,她就付给后者3,这时,斗争成为可置信得威胁。因为 如果进入后,选择默许,收益更小。注意:有了这个赌,进入者 就不敢进入了,实际上,在位者无需支付赌注。
开 (-3,-3)
A

BI


B

(1,0) (0,1)

不 (0,0)
房地产开发中,子博弈I与Ⅱ属于单人博弈,子博弈I中,B得最优 选择就是不开发,子博弈Ⅱ中,B得最优选择就是开发,因此: (1)(不开发, (开发,开发))在子博弈I上不构成Nash均衡; (2)(开发,(不开发,不开发))在子博弈Ⅱ上不构成Nash均衡; (3)(开发,(不开发,开发))在所有子博弈上都构成Nash均衡, 就是子博弈精炼Nash均衡。
Max π1(q1,s2(q1))=q1(a-q1-s2(q1)-c)

第二章完全信息动态博弈篇三精品PPT课件

第二章完全信息动态博弈篇三精品PPT课件

如此重复直到初始结。每一步都得到对应于子博弈的一个 纳什均衡,并且根据定义,该纳什均衡一定是该子博弈的 子博弈的纳什均衡,这个过程的最后一步得到整个博弈的 纳什均衡
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)
用逆向归纳法求 子博弈精练纳什 均衡
对于有限完 美信息博弈,逆 向归纳法求解子 博弈精练纳什均 衡是一个最简便 的方法。
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)
子博弈:是原博弈的一部分,它本身也可以作为一个独立的 博弈进行分析:
(1)子博弈必须从一个单结信息点开始:只有决策者在原 博弈中确切地知道博弈进入一个特定的决策结时,该决策结 才能作为一个子博弈的初始结。如果信息集包含两个以上的 决策结,则这两个都不可以作为子博弈的初始结(见下页)。
子博弈精练纳什均衡
泽尔腾引入子博弈精练纳什均衡的概念的目的 是将那些不可置信威胁战略的纳什均衡从均衡 中剔除,从而给出动态博弈的一个合理的预测 结果,简单说,子博弈精练纳什均衡要求均衡 战略的行为规则在每一个信息集上是最优的。
什么是子博弈,什么是子博弈精练纳什均衡? 有没有更好的方法找到子博弈精练纳什均衡?
参与人X的信息集不能开始一个子博弈, 否则的话,参与人B的信息将被切割。
完全信息动态博弈-子博弈精练纳什均衡
泽尔腾(1965)
A
x
x’
开发
不开发
开发 不开发
开发 不开发
Bx
B
不开发
开发
开发
x’
不开发
(-3,-3) (1,0) (0,1) (0,0)
子博弈I
A
子博弈II
坦白
抵赖
(-3,-3) (1,0) (0,1) 房地产开发博弈

博弈论 第 三 章 完全信息动态博弈PPT文档63页

博弈论 第 三 章 完全信息动态博弈PPT文档63页

39、勿问成功的秘诀为何,且尽全力做你应该做的事吧。——美华纳
40、学而不思则罔,思而不学则殆。——孔子
博弈论 第 三 章 完全信息动态博弈
1、战鼓一响,法律无声。——英国 2、任何法律的根本;不,不成文法本 身就是 讲道理 ……法 律,也 ----即 明示道 理。— —爱·科 克
3、法律是最保险的头盔。——爱·科 克 4、一个国家如果纲纪不正,其国风一 定颓败 。—— 塞内加 5、法律不能使人人平等,但是在法律 面前人 人是平 等的。 ——波 洛克
ቤተ መጻሕፍቲ ባይዱ 谢谢!
36、自己的鞋子,自己知道紧在哪里。——西班牙
37、我们唯一不会改正的缺点是软弱。——拉罗什福科
xiexie! 38、我这个人走得很慢,但是我从不后退。——亚伯拉罕·林肯

第三章扩展式博弈与完全信息动态博弈ppt课件

第三章扩展式博弈与完全信息动态博弈ppt课件

严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
1
L
x1
R
2
2
L x2 R
3
L x3 R
3
L x4 R L x5 R L x6 R L x7 R
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
下图表示参与人3选择时,即不知道参与人2的选 择,也不知道参与人1的选择的博弈情形。
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
例如
• 在“新产品开发博弈”中,假设企业1先行动, 企业2后行动,但企业2行动时不知道企业1的 行动。
企业2行动时,只知道 博弈要么到达点x2,要 么达到点x3 ,但具体在 哪一点上,企业2不清 楚。也就是说,企业2 只知道自己位于决策结 集合{x2, x3 }上,但不知 道位于{x2, x3 }中哪一个 决策结上。
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
一、扩展式博弈
• 所谓扩展式博弈(extensive form game)是 博弈问题的一种规范性描述。与战略式 博弈侧重博弈结果的描述相比,扩展式 博弈更注重对参与人在博弈过程中所遇 到决策问题的序列结构的详细分析。
• 试用扩展式博弈对两个企业都知道市场 需求,且企业1先决策,企业2观测到企 业1的选择后再进行选择的博弈情形即完 全信息动态的“新产品开发博弈”进行 建模。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈树下方同一个后续节点。
参与者 1 S1 参与者 2 V1 (a1, b1, c1) V2 参与者 3 U1 (a3, b3, c3) U2 (a4, b4, c4) V1 S2 参与者 2 V2 (a2, b2, c2)
错误的博弈树构造方法
正确的博弈树构造方法
参与者 1 S1 参与者 2 V1 (a1, b1, c1) U1 V2 参与者 3 U2 U1 V1 参与者 3 U2 S2 参与者 2 V2 (a2, b2, c2)
博弈树中包含若干“节点”,节点用小圆圈表示。
位于博弈树最上端的节点称为“初始节点”。 初始节点用空心小圆圈表示,其他节点均用实心小圆圈表示。 在每个节点处均对应某个博弈参与者,将节点对应的博弈参与者标识在 节点旁边。
例如:在“市场争夺战”博弈中,因为潜在进入者先行动,因此初始节
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
员工 3 不知道员工 1 的决策策略
1 H O 2 O 3 O H O H 3 O H H O 3 O
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
(2, 0, 2) (2, 2, 0)
(1, 1, 1)
员工 3 不能观察到员工 2 的决策策略
1 H O 2 O 信息集 1 3 O H O H 3 O 信息集 2 (2, 0, 2) (2, 2, 0) (1, 1, 1) H H O 3 O
正确的博弈树构造方法
参与者 1 S1 (a1, b1, c1) T1 (a2, b2, c2) S1 (a3, b3, c3) S2 参与者 2 T2 参与者 1 S2 (a4, b4, c4)
正确的博弈树构造方法
错误的博弈树构造方法
参与者 1 S1 (a1, b1, c1) S2
参与者 2
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
(2)博弈树与博弈顺序

博弈树各节点之间存在顺序关系,博弈树由上至下的节点顺序表示各 博弈参与者进行决策的顺序。
参与者 1 S1 S2 参与者 2 T1 T2 参与者 3 (a2, b2, c2) U1 U2 (a4, b4, c4)
(a1, b1, c1)
(a3, b3, c3)
从博弈树的节点可以引出多条线段,但不能从博弈树多个节点共同到达
分配给第三个海盗 100个金币,第四个海 盗0个金币,第五个海盗0个金币。
分配给自己 98个金币,第三个海盗 0个金 币,第四个海盗 1个金币、第5个海盗 1个 金币。
倒数第四轮
海盗2
第一个海盗将提出怎样的分配方案?此分配方案在保证能得到超
过半数海盗同意的前提下应最大化第一个海盗的利益。

第一,保证超过半数的海盗同意第一个海盗的分配方案。 第二:第一个海盗最大化自己能分到的金币。
如果直接从第一个海盗的决策策略入手,此问题相对复杂。 不妨从第五个海盗入手,然后按照从后向前的顺序依次逆向考察
海盗的策略选择。
2.求解海盗分宝博弈的均衡
通过逆向归纳法推导出的财宝分配方案
轮次 最后一轮 倒数第二轮 倒数第三轮 分配方案提出者 海盗5 海盗4 海盗3 分配方案 自己独吞全部100个金币 任何分配方案都得不到通过
当博弈不再有后续节点时,需要将博弈的收益标识在博弈
树末端。
将博弈参与者的收益放在括号里。
需要注意的是:各博弈参与者的收益需要按照各参与者行
动顺序进行排列。 先行动的博弈参与者的收益写在左边,依次类推,从左到 右,最后行动的博弈参与者的收益写在最右边。 各个博弈参与者的收益之间用逗号分割。
点处对应的博弈参与者为潜在进入者。 将潜在进入者标识在博弈树初始节点旁边。
当潜在进入者决策之后,轮到在位者进行决策。
在位者所在的节点称为“后续节点”。在位者位于两个后续节点上。 在位者都有两种策略选择:“斗争”和“默许”。
如果初始节点处的博弈参与者存在 N 种策略,那么就从初始节点
动态市场争夺战博弈的扩展型表达方式如图所示
潜在进入者 不进入 在位者 斗争
(0, 20)
进入 在位者
默许
(0, 15)
斗争
(-10, -10)
默许
(5, 5)
“市场争夺战”博弈的扩展型表达形式
1.博弈树的构成要素
(1)博弈参与者
(2)行动顺序:在动态博弈中,博弈参与者的行动存在先后次序。 (3)行动策略空间(Action Set):指博弈参与者可以采取的所 有可能策略。 (4)信息集(Information Set):指博弈参与者在博弈过程中 所知道的信息。 (5)支付函数指博弈参与者采用特定策略与所能得到的收益之间的
(2, 0, 2) (2, 2, 0)
(1, 1, 1)
员工 3 不知道员工 1 和员工 2 的决策策略
1 H O 2 O 3 O H O H 3 O H H O 3 O
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
(2, 0, 2) (2, 2, 0)
那么第三个海盗也将被扔到海里喂鲨鱼。
接下来由第四个海盗提出分配方案。如果超过半数的海盗同意第 四个海盗的分配方案时,那么该方案被通过,博弈结束。
如果第四个海盗提出的分配方案没有得到超过半数海盗的同意, 那么第四个海盗也将被扔到海里喂鲨鱼。 这时就只剩下第五个海盗了,第五个海盗将独吞抢劫来的100个 金币,博弈结束。 在这种分配规则下,第一个海盗将提出怎样的分配方案? 第一个海盗提出的分配方案需要满足两个条件。
可以通过“海盗分宝博弈”这个生动有趣的故事对“逆向归纳法”
进行一个直观介绍。
一、海盗分宝博弈
1.海盗分宝博弈的规则 五个海盗首先进行抽签,确定决策顺序。 五个海盗按照决策顺序依次提出对 100 个金币的分配方案。 第一个海盗提出一个分配方案,如超过半数的海盗(包括提出分 配方案的海盗)同意第一个海盗的分配方案,即大于等于 3 名海 盗同意第一个海盗的分配方案时,那么该方案被通过,博弈结束。 如果第一个海盗提出的分配方案没有得到超过半数海盗的同意,
第二节 完全且完美信息动态博弈概述
在完全且完美信息动态博弈(Dynamic Game with Perfect and Complete Information)中,每个博弈参与 者均知道在自己之前进行决策的参与者选择的策略和博弈结构。 博弈树中每个节点都独立构成一个信息集,没有虚线连接两个或 多个博弈树节点。 求解完全且完美信息动态博弈的重要方法之一是:逆向归纳法。
1.三人罢工博弈的定义
1 H O 2 O 3 O H O H 3 O H H O 3 O
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
(2, 0, 2) (2, 2, 0)
(1, 1, 1)
三人罢工博弈的博弈树
2.三人罢工博弈的策略选择与信息
第三章
完全信息动态博弈
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
1/15/2019
(1, 1, 1)
三名员工都只有一个信息集的博弈
四、博弈树与静态博弈
博弈树的方法不仅能表示动态博弈,还能表示静态博弈。
嫌疑人甲 坦白 嫌疑人乙 坦白 (5, 5) 不坦白 (1, 10) 坦白 (10, 1) 不坦白 嫌疑人乙 不坦白 (2, 2)
用博弈树表示囚徒困境
所谓的“博弈先后顺序”,它主要是一个信息的概念,而不 是一个Hale Waihona Puke 时间先后的概念。二、博弈树
在动态博弈中,由于博弈参与者的行动存在先后顺序,因
此可以用更形象的方法来表示动态博弈:博弈树(Game
Tree)。
通过支付矩阵的形式表示的博弈通常被称为策略型或正则
型博弈(Normal Form Game)。
通过博弈树表示的博弈通常被称为扩展型博弈
(Extensive Form Game)。
POWERPOINT 金融 TEMPLATE
在完全信息动态博弈中,博弈参与者的行动存在先 后顺序。 可以用博弈树表示完全信息动态博弈。
可以通过逆向归纳法求解完全信息动态博弈的子博
弈精炼纳什均衡,剔除不可置信的威胁。
第一节 完全信息动态博弈概述
一、完全信息动态博弈的定义 在完全信息静态博弈中,博弈参与者同时采取行动。但 在完全信息动态博弈中,博弈参与者的行动存在先后顺序。 从信息角度上,完全信息动态博弈与完全信息静态博弈类 似,博弈参与者对博弈结构、博弈顺序、双方收益等信息 都具备完全了解。
(a3, b3, c3) (a4, b4, c4) (a5, b5, c5)
(a6, b6, c6)
正确的博弈树构造方法
构造博弈树时只能按照由上至下的路径,而不能存在由下 向上的路径,也不能形成循环路径。 回溯路径唯一性在求解完全信息动态博弈时非常重要。 因为在求解动态博弈均衡时,一个很重要的方法是“逆向 归纳法(Backward Induction)”。 只有首先确保从博弈树任何最终节点向上回溯时路径唯一, 才能确保逆向归纳法的可操作性。
相关文档
最新文档