(完整版)完全信息动态博弈.ppt
合集下载
博弈论 完全信息动态博弈.ppt
4、工会、雇主与中央银行的经济博弈
考虑工资、物价、就业的宏观经济模型:
• 中央银行:选择货币供应量,在其效用函 数中关注通货膨胀率与就业水平;
• 企业:选择就业数量,使企业利润最大化 (受工人的工资影响);
• 就业者:要求工资水平,使自身福利最大 化(受通货膨胀率影响)。
• 由于劳动合同和工资刚性,博弈顺序为:
• 企业1首先选择产量q1,企业2观察到企业1的产量 后选择自己的产量q2,令: P(Q)=a-q1-q2代表逆需求函数 Ci(qi)=cqi代表成本函数 则第i企业的利润函数为:
i(q1,q2)=qiP(q1+q2)-Ci(qi)
企业1 q1
企业2 q2
市场
i=1,2
P(Q)
企业利润:
i(q1,q2)
• 若T=1,在T=1时,参与人1出价,如果他提出 x1=1,参与人2只能接受。
两阶段博弈(T=2)
• 若T=2,在T=2时,参与人2出价,如果他提 出x2=0,参与人1只能接受;
• 由于参与人2在T=2时的1单位支付相当于在 t=1时δ2单位,如果参与人在t=1时出价1-x1≥δ2, 则参与人2会接受。
承诺价值
• 在该博弈中,拥有信息优势反而使参与人处 于劣势,企业1称为领导者,企业2称为随从。
• 现在考察完全信息静态情形下:如果企业1 承 信诺呢?(威协)生产q1*=(a-c)/2,企业2是否会相
• 若 优 信企选企业择业将21选的是择威qq1胁*2=*,=3((唯aa--一cc))//的48, ,纳则 因什此 此均时企衡企业是业2不1会的相最 q1*=q2*=(a-c)/3。
企业1 q1
企业2 q2
市场
P(Q)
完全信息动态博弈 ppt课件
泽尔腾引入子博弈精练纳什均衡的概念的 目的是将那些不可置信威胁策略的纳什均 衡从均衡中剔除,从而给出动态博弈的一 个合理的预测结果,简单说,子博弈精练 纳什均衡要求均衡策略的行为规则在每一 个信息集上是最优的。
策略的表述
✓ 策略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
✓ 参与人集合 ✓ 每个参与人的策略集合 ✓ 由策略组合决定的每个参与人的支付
进入者
进入 在位者 不进入(0,300)
合作(40,50) 斗争(-10,0)
不可置信威胁
市场进入阻挠博弈树
信息集
A
参与人(A,B,N)
结,初始结
开发
不开发
策略
B
开发
N
结,决策结
大
1/2
小
1/2
枝
不开发
B
B
不开发
开发
开发
如果市场上只有一栋楼需求大时可卖18亿需求小时可卖11亿博弈策略表述40004000800000800000不开发开发商a开发不开发开发30003000100000100000不开发开发商b开发商a开发不开发开发开发商b需求小的情况需求大的情况博弈的策略式表述由策略组合决定的每个参与人的支付进入者进入不进入0300在位者市场进入阻挠博弈树不可置信威胁合作4050斗争100开发不开发12121212开发不开发开发不开发开发不开发开发不开发4480331008000100参与人abn策略支付房地产开发博弈结决策结结终点结结初始结信息集一博弈扩展式表述博弈的基本构造包括决策结和终点结两类
第三章 完全信息动态博弈
一 博弈扩展式表述 二 子博弈精练纳什均衡 三 应用举例 28页
策略的表述
✓ 策略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
✓ 参与人集合 ✓ 每个参与人的策略集合 ✓ 由策略组合决定的每个参与人的支付
进入者
进入 在位者 不进入(0,300)
合作(40,50) 斗争(-10,0)
不可置信威胁
市场进入阻挠博弈树
信息集
A
参与人(A,B,N)
结,初始结
开发
不开发
策略
B
开发
N
结,决策结
大
1/2
小
1/2
枝
不开发
B
B
不开发
开发
开发
如果市场上只有一栋楼需求大时可卖18亿需求小时可卖11亿博弈策略表述40004000800000800000不开发开发商a开发不开发开发30003000100000100000不开发开发商b开发商a开发不开发开发开发商b需求小的情况需求大的情况博弈的策略式表述由策略组合决定的每个参与人的支付进入者进入不进入0300在位者市场进入阻挠博弈树不可置信威胁合作4050斗争100开发不开发12121212开发不开发开发不开发开发不开发开发不开发4480331008000100参与人abn策略支付房地产开发博弈结决策结结终点结结初始结信息集一博弈扩展式表述博弈的基本构造包括决策结和终点结两类
第三章 完全信息动态博弈
一 博弈扩展式表述 二 子博弈精练纳什均衡 三 应用举例 28页
博弈论第三章.ppt
混合策略的子博弈完美Nash均衡可类似定义。 简单地说: 子博弈完美Nash均衡要求均衡策 略 的行为规则在每一个信息集上都是最优的 (包括均衡路径和非均衡路径)。
定 义 展开型博弈的一个策略组合称为子博弈 完美Nash均衡,如果对于该博弈的每一个子 博弈,该策略组合都是Nash均衡。
如果B在决策时并不知道自然的选择,则有博
弈树:
开发
A
hA
不开发
N
N
大(1/2)
hB B
小(1/2)
B
大(1/2)
B
小(1/2)
B h′B
开发
不开发 开发 不开发 开发 不开发 开发 不开发
另一种情况就则B知道自然的选择,但不知道A的
选择,这时博弈树如下:
A
开发
不开发
N
N
大
小
大
小
B
B
B
B
开发
不开发 开发
开 -3,-3
-3,-3
1,0
1,0
参 与 人A
不 0,1
0,0
0,1
0,0
由 画 线 法 可 得 三 个 纯 策 略Nash 均 衡:
①( 不 开 发,( 开 发, 开 发))
②( 开 发,( 不 开 发, 不 开 发))
③( 开 发,( 不 开 发, 开 发))
但①中B的策略是不合理的,这个威胁是不可置 信的; ②中B的策略(不开发,不开发)也不合理, 因为若A不 开发,B显然应该开发; 只有③是一 个合理的均衡。
的全体记汉A(hi),如果令Hi表示参与人i的信息 集
的集合,则Ai= ∪ A(hi)就是参与人i的所有行
动
hi∈Hi
定 义 展开型博弈的一个策略组合称为子博弈 完美Nash均衡,如果对于该博弈的每一个子 博弈,该策略组合都是Nash均衡。
如果B在决策时并不知道自然的选择,则有博
弈树:
开发
A
hA
不开发
N
N
大(1/2)
hB B
小(1/2)
B
大(1/2)
B
小(1/2)
B h′B
开发
不开发 开发 不开发 开发 不开发 开发 不开发
另一种情况就则B知道自然的选择,但不知道A的
选择,这时博弈树如下:
A
开发
不开发
N
N
大
小
大
小
B
B
B
B
开发
不开发 开发
开 -3,-3
-3,-3
1,0
1,0
参 与 人A
不 0,1
0,0
0,1
0,0
由 画 线 法 可 得 三 个 纯 策 略Nash 均 衡:
①( 不 开 发,( 开 发, 开 发))
②( 开 发,( 不 开 发, 不 开 发))
③( 开 发,( 不 开 发, 开 发))
但①中B的策略是不合理的,这个威胁是不可置 信的; ②中B的策略(不开发,不开发)也不合理, 因为若A不 开发,B显然应该开发; 只有③是一 个合理的均衡。
的全体记汉A(hi),如果令Hi表示参与人i的信息 集
的集合,则Ai= ∪ A(hi)就是参与人i的所有行
动
hi∈Hi
08 完全信息动态博弈(子博弈完美的纳什均衡)PPT课件
承诺和威胁都是不可信的!
思考:
如何能使承诺和威胁变得可信?
增加撤销承诺或威胁所要受到的损失 让对方知道 “破釜沉舟” “穷寇莫追”
“破釜沉舟”
《孙子兵法·九地》:“焚舟破釜,若驱群羊而往, 驱而来,莫知所之。”
《史记·项羽本纪》: “项羽乃悉引兵渡河, 皆沉船,破釜甑,烧 庐舍,持三日粮,以 示士卒必死,无一还 心。”
子博弈 Sub-game
原博弈中的一部分(次级博弈)
L
B1
U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
如何寻找均衡?
L
B1 U
R
A
D
L B2
R
( 22,99 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
NE:(U , L)&(D , R)
逆推
backward induction
泽尔腾1965年发表《需求减少条件下寡头 垄断模型的对策论描述》一文,提出了“子 博弈精炼纳什均衡”的概念,又称“子对策 完美纳什均衡”。
• 莱茵哈德·泽尔腾 Reinhard Selten ,子博弈精 炼纳什均均衡的创立者。
• 1994年因在“非合作博
弈理论中开创性的均衡分 析”方面的杰出贡献而荣 获诺贝尔经济学奖。
例:动态游戏 - 博弈树
假设:A 先行动,B 后行动Leabharlann LB1U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
博弈树 game tree
结点 node 枝 branch 信息集 information set
思考:
如何能使承诺和威胁变得可信?
增加撤销承诺或威胁所要受到的损失 让对方知道 “破釜沉舟” “穷寇莫追”
“破釜沉舟”
《孙子兵法·九地》:“焚舟破釜,若驱群羊而往, 驱而来,莫知所之。”
《史记·项羽本纪》: “项羽乃悉引兵渡河, 皆沉船,破釜甑,烧 庐舍,持三日粮,以 示士卒必死,无一还 心。”
子博弈 Sub-game
原博弈中的一部分(次级博弈)
L
B1
U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
如何寻找均衡?
L
B1 U
R
A
D
L B2
R
( 22,99 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
NE:(U , L)&(D , R)
逆推
backward induction
泽尔腾1965年发表《需求减少条件下寡头 垄断模型的对策论描述》一文,提出了“子 博弈精炼纳什均衡”的概念,又称“子对策 完美纳什均衡”。
• 莱茵哈德·泽尔腾 Reinhard Selten ,子博弈精 炼纳什均均衡的创立者。
• 1994年因在“非合作博
弈理论中开创性的均衡分 析”方面的杰出贡献而荣 获诺贝尔经济学奖。
例:动态游戏 - 博弈树
假设:A 先行动,B 后行动Leabharlann LB1U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
博弈树 game tree
结点 node 枝 branch 信息集 information set
完全信息动态博弈最新优质PPT课件
完全信息动态博弈 POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
三人罢工博弈的博弈树
2.三人罢工博弈的策略选择与信息
1
H
O
2 H
3
H
O
O
3
H
O
H
3
H
O
2 O
3
H
O
(6, 6, 6) (3, 3, 8) (3, 8, 3) (0, 2, 2) (8, 3, 3) (2, 0, 2) (2, 2, 0) (1, 1, 1)
员工 2 只有一个信息集的博弈树
1
H
O
3 H
第二节 完全且完美信息动态博弈概述
? 在完全且完美信息动态博弈( Dynamic Game with Perfect and Complete Information )中,每个博弈参与 者均知道在自己之前进行决策的参与者选择的策略和博弈结构。
? 博弈树中每个节点都独立构成一个信息集,没有虚线连接两个或 多个博弈树节点。
? 博弈树的方法不仅能表示动态博弈,还能表示静态博弈。
嫌疑人甲
嫌疑人乙
坦白
坦白
不坦白
不坦白 嫌疑人乙
坦白
不坦白
(5, 5)
(1, 10)
(10, 1)
用博弈树表示囚徒困境
(2, 2)
? 所谓的“博弈先后顺序”,它主要是一个信息的概念,而不 是一个纯时间先后的概念。
三人罢工博弈的博弈树
2.三人罢工博弈的策略选择与信息
1
H
O
2 H
3
H
O
O
3
H
O
H
3
H
O
2 O
3
H
O
(6, 6, 6) (3, 3, 8) (3, 8, 3) (0, 2, 2) (8, 3, 3) (2, 0, 2) (2, 2, 0) (1, 1, 1)
员工 2 只有一个信息集的博弈树
1
H
O
3 H
第二节 完全且完美信息动态博弈概述
? 在完全且完美信息动态博弈( Dynamic Game with Perfect and Complete Information )中,每个博弈参与 者均知道在自己之前进行决策的参与者选择的策略和博弈结构。
? 博弈树中每个节点都独立构成一个信息集,没有虚线连接两个或 多个博弈树节点。
? 博弈树的方法不仅能表示动态博弈,还能表示静态博弈。
嫌疑人甲
嫌疑人乙
坦白
坦白
不坦白
不坦白 嫌疑人乙
坦白
不坦白
(5, 5)
(1, 10)
(10, 1)
用博弈树表示囚徒困境
(2, 2)
? 所谓的“博弈先后顺序”,它主要是一个信息的概念,而不 是一个纯时间先后的概念。
博弈论与信息经济学--完全信息动态博弈 ppt课件
©&® by H. Q. Feng, CUFE
5/58
一、动态博弈的表述——扩展式
(2)博弈的扩展式表述包括以下要素: 参与人集合:i=1,…,n,此外,N代表虚拟参与人“自然” 参与人的行动顺序:谁在什么时候行动; 参与人的行动空间:在每次行动时,参与人有些什么选择; 参与人的信息集:每次行动时,参与人知道什么; 参与人的支付函数:在行动结束之后,每个参与人得到些什 么(支付是所有行动的函数); 外生条件(即自然的选择)的概率分布。 假定房地产开发博弈的行动顺序如下:开发商A首先行动, 选择开发或不开发;在A决策后,自然选择市场需求的大小; 开发商B在观测到A的决策和市场需求后,决定开发或不开 发。
该博弈的扩展式表述为:
©&® by H. Q. Feng, CUFE
15/58
一、动态博弈的表述——扩展式
进入者
进入
不进入
在位者
斗争 默许
(0,300)
(-10,0)
(40,50)
©&® by H. Q. Feng, CUFE
16/58
二、子博弈精炼纳什均衡
纳什均衡有几个问题:
第一,一个博弈不止一个均衡,事实上,有些 博弈可能有无数个纳什均衡,究竟哪一个更合 理? 纳什均衡假定每一个参与人在选择自己的最优 战略时假定所有其他参与人的战略是给定的, 但是如果参与人的行动有先有后,后行动者的 选择空间依赖于前行动者的选择,先行动者在 选择时不可能不考虑自己的行动对后行动者的 影响。
©&® by H. Q. Feng, CUFE 20/58
二、子博弈精炼纳什均衡
“子博弈”的概念:从每一个行动选择开始至 博弈结束又构成一个博弈,称为“子博弈”。 如在进入者选择进入之后,在位者选择行动 开始就是一个子博弈。 子博弈需满足的条件:
完全信息动态博弈-PPT
(1) 开发商A先行动, 选择开发或不开发;(2) 开发商B在
观测到A得决策后, 再决定开发或不开发。博弈树如下
图。
A
开
不
B
B
开
不
开
不
(-3,-3)
(1,0) (0,1)
(0,0)
注:所有n个局中人得一个纯策略组合决定了博弈树上得一条 路径。但每条路径可由不同得策略组合决定。
例如, (开发,(不开发,开发))决定了 A -> 开发 -> B -> 不开发 -> (1,0)
进 入 进入 者 不进入
在位者
默许
斗争
5,5 1,10
-2,3 1,10
承诺行动使 不可ቤተ መጻሕፍቲ ባይዱ信威胁可信威胁,否则,当事人将为自 己得“失信”付出成本。
例如,该例中,在位者与某第三者打赌,如果进入者进入后她 不斗争,她就付给后者3,这时,斗争成为可置信得威胁。因为 如果进入后,选择默许,收益更小。注意:有了这个赌,进入者 就不敢进入了,实际上,在位者无需支付赌注。
开 (-3,-3)
A
开
BI
不
不
B
开
(1,0) (0,1)
Ⅱ
不 (0,0)
房地产开发中,子博弈I与Ⅱ属于单人博弈,子博弈I中,B得最优 选择就是不开发,子博弈Ⅱ中,B得最优选择就是开发,因此: (1)(不开发, (开发,开发))在子博弈I上不构成Nash均衡; (2)(开发,(不开发,不开发))在子博弈Ⅱ上不构成Nash均衡; (3)(开发,(不开发,开发))在所有子博弈上都构成Nash均衡, 就是子博弈精炼Nash均衡。
Max π1(q1,s2(q1))=q1(a-q1-s2(q1)-c)
第二章完全信息动态博弈篇三精品PPT课件
如此重复直到初始结。每一步都得到对应于子博弈的一个 纳什均衡,并且根据定义,该纳什均衡一定是该子博弈的 子博弈的纳什均衡,这个过程的最后一步得到整个博弈的 纳什均衡
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)
用逆向归纳法求 子博弈精练纳什 均衡
对于有限完 美信息博弈,逆 向归纳法求解子 博弈精练纳什均 衡是一个最简便 的方法。
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)
子博弈:是原博弈的一部分,它本身也可以作为一个独立的 博弈进行分析:
(1)子博弈必须从一个单结信息点开始:只有决策者在原 博弈中确切地知道博弈进入一个特定的决策结时,该决策结 才能作为一个子博弈的初始结。如果信息集包含两个以上的 决策结,则这两个都不可以作为子博弈的初始结(见下页)。
子博弈精练纳什均衡
泽尔腾引入子博弈精练纳什均衡的概念的目的 是将那些不可置信威胁战略的纳什均衡从均衡 中剔除,从而给出动态博弈的一个合理的预测 结果,简单说,子博弈精练纳什均衡要求均衡 战略的行为规则在每一个信息集上是最优的。
什么是子博弈,什么是子博弈精练纳什均衡? 有没有更好的方法找到子博弈精练纳什均衡?
参与人X的信息集不能开始一个子博弈, 否则的话,参与人B的信息将被切割。
完全信息动态博弈-子博弈精练纳什均衡
泽尔腾(1965)
A
x
x’
开发
不开发
开发 不开发
开发 不开发
Bx
B
不开发
开发
开发
x’
不开发
(-3,-3) (1,0) (0,1) (0,0)
子博弈I
A
子博弈II
坦白
抵赖
(-3,-3) (1,0) (0,1) 房地产开发博弈
第三章扩展式博弈与完全信息动态博弈ppt课件
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
1
L
x1
R
2
2
L x2 R
3
L x3 R
3
L x4 R L x5 R L x6 R L x7 R
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
下图表示参与人3选择时,即不知道参与人2的选 择,也不知道参与人1的选择的博弈情形。
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
例如
• 在“新产品开发博弈”中,假设企业1先行动, 企业2后行动,但企业2行动时不知道企业1的 行动。
企业2行动时,只知道 博弈要么到达点x2,要 么达到点x3 ,但具体在 哪一点上,企业2不清 楚。也就是说,企业2 只知道自己位于决策结 集合{x2, x3 }上,但不知 道位于{x2, x3 }中哪一个 决策结上。
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
一、扩展式博弈
• 所谓扩展式博弈(extensive form game)是 博弈问题的一种规范性描述。与战略式 博弈侧重博弈结果的描述相比,扩展式 博弈更注重对参与人在博弈过程中所遇 到决策问题的序列结构的详细分析。
• 试用扩展式博弈对两个企业都知道市场 需求,且企业1先决策,企业2观测到企 业1的选择后再进行选择的博弈情形即完 全信息动态的“新产品开发博弈”进行 建模。
博弈论(完全信息动态博弈)精品PPT课件
第二章 完全信息动态 博弈
§2.0 引入
例 强盗分赃问题
§2.1 博弈的标准形和展开形(p35)
一、标准形 例 :分级协调(ranked coodination)
P35,B2.1
领导-随从博弈(p1先行动)
P37-B2.2
二、展开形和博弈树
策略
P37-38 结
后续结 前续结
路径
起始结 终点结 枝
p38Βιβλιοθήκη §2.2 信息集P41— T2.4
二、信息集的性质 三、信息集的分割 四、共同知识
§2.3 信息分类
P46—B2.4
完美 确定
对称 完全
P47—T2.5
§2.4 海萨尼转换
领导-随从博弈III
P51—T2.6
P52—T2.7
类型 世界状态 海萨尼教义
P55—B2.5 概率--边际概率--条件概率--先验概率--后验概率
谢谢大家
荣幸这一路,与你同行
It'S An Honor To Walk With You All The Way
演讲人:XXXXXX 时 间:XX年XX月XX日
p57
P60—T2.9
Png赔偿 博弈
对方和解
(0,0)
(0,0) 对方奉陪
(s,-s) (w-p,-w-D) (0,0) (s,-s) (-p,-D)
(0,0)
结束语
当你尽了自己的最大努力时,失败也是伟大的, 所以不要放弃,坚持就是正确的。
When You Do Your Best, Failure Is Great, So Don'T Give Up, Stick To The End
§2.0 引入
例 强盗分赃问题
§2.1 博弈的标准形和展开形(p35)
一、标准形 例 :分级协调(ranked coodination)
P35,B2.1
领导-随从博弈(p1先行动)
P37-B2.2
二、展开形和博弈树
策略
P37-38 结
后续结 前续结
路径
起始结 终点结 枝
p38Βιβλιοθήκη §2.2 信息集P41— T2.4
二、信息集的性质 三、信息集的分割 四、共同知识
§2.3 信息分类
P46—B2.4
完美 确定
对称 完全
P47—T2.5
§2.4 海萨尼转换
领导-随从博弈III
P51—T2.6
P52—T2.7
类型 世界状态 海萨尼教义
P55—B2.5 概率--边际概率--条件概率--先验概率--后验概率
谢谢大家
荣幸这一路,与你同行
It'S An Honor To Walk With You All The Way
演讲人:XXXXXX 时 间:XX年XX月XX日
p57
P60—T2.9
Png赔偿 博弈
对方和解
(0,0)
(0,0) 对方奉陪
(s,-s) (w-p,-w-D) (0,0) (s,-s) (-p,-D)
(0,0)
结束语
当你尽了自己的最大努力时,失败也是伟大的, 所以不要放弃,坚持就是正确的。
When You Do Your Best, Failure Is Great, So Don'T Give Up, Stick To The End
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(四)参与人在博弈树中的顺序
1、排序的基本原则
一个参与人在决策之前知道的事情必须出现在该 参与人的决策结之前。
2、自然人的排序
– 如果参与人不能观测到虚拟人——自然的行动, 自然的决策结置于该参与人的前后都一样;
– 自然的信息集总是假定为单结。
N
大 1/2 A
小 1/2 A
开
不
发开
发
B
B
开发
不开发 开发 不开发
– 博弈的战略式表述只包括三个要 素
– 扩展式表述包括以下六个方面的 要素
扩展式表述包括以下六个方面的要素:
– 参与人集合:i=1、2、…,n;并且用大写N代表 虚拟的参与人——“自然”;
– 参与人的行动顺序(The order of moves):谁在什么 时候行动;
– 参与人的行动空间(Action set):在每次行动时, 参与人有些什么选择;
A
坦白 抵赖
B
B
坦白
抵赖
抵赖
坦白
(-8, -8) (0,-10) (-10, 0) (-1,-1)
B
坦白 A
抵赖 A
坦白
抵赖
抵赖
坦白
(-8, -8) (0,-10) (-10, 0) (-1,-1)
(五)完美回忆
完美回忆(Perfect recall)是指没有参与人会 忘记自己以前知道的事情,所有参与人都 知道自己以前的选择。
第三章 完全信息动态博弈
Dynamic Games of Complete Information
@ 2009 Zheng Daowen, All Rights Reserved
动态博弈:参与人的行动有先后顺序,且后 行动者在自己行动之前能观测到先行动者 的行动。
第一节 博弈的扩展式表述
一、博弈的战略式表述与扩展式表 述的区别
– 同一信息集,同一参与人; – 在同一信息集合中,参与人不知道自己究
竟处于哪个决策结。
单结信息集(singletons)和多结信息集。
(二)同一信息集的表示方法
– 用博弈树来表述 – 用数学式表述
A
开发
不开发
大 1/2
N
小 1/2
N
大 1/2
小 1/2
B
B
B
B
开发 不开发 开发 不开发 开发 不开发 (4, 4) (8, 0) (-3, -3) (1, 0) (0, 8) (0, 0)
– 参与人的信息集(Information set):每次行动时, 参与人知道些什么;
– 参与人的支付函数:在行动结束后,每个参与人 得到些什么;
– 外生事件(即自然的选择)发生的概率。
二、博弈树
假定在某个城市,有两家房地产商A、B,各 自准备开发一栋同等规模的写字楼,需要 投资都是1亿元。市场调查表明:如果两栋 楼同时出售,市场需求大时,每栋售价1.4 亿;需求较小时,每栋售价7千万。如果市 场上只有一栋楼出售,需求较大时,售价 为1.8亿,需求小时,售价为1.1亿。
Player i’s information set at any particular point of the game is the set of different nodes in the game tree that he knows might be the actual node, but between which he cannot distinguish by direct observation.
– 特性:
• 传递性(transitive):x1<x2,x2<x3; →x1<x3。 • 不对称性(asymmetric): x1<x2; x2≮x1。 • 半序的(partial order)或局部有序的。
x
x′
x″
– 前列集(the set of predecessors)
• 用P(x)表示
同一信息集的表示法:知道自然的选择,但不知道参与人A的选 择
用数学式表述
– H代表所有信息集的集合; – h代表一个特定的信息集,即h∈H; – h(x)表示包含决策结x的信息集,它表示在x点决策
的参与人i不确定他是处在x,还是处在其它 x ’∈h(x)。如果x’∈h(x),那么x∈h(x ’)。
A
开
大
小 1/2
1/2
B
B
B
开发
不开发
B 开发
开发 不开发
(4, 4) (8, 0) (-3, -3) (1, 0) (0, 8)
不开发 不开发 开发
(0, 1) (0, 0) (0, 0)
图2.1 房地产开发博弈
(一)博弈树的构件
1、结(nodes)
– 分类:决策结(decision nodes);终点结 (terminal nodes)。
开 发
不开发
B
B
开发 不开发开发 不开发
(4, 4) (8, 0)
(0, 8) (0, 0) (-3, -3) (1, 0) (0, 1) (0, 0)
N
大 1/2
小 1/2
B
不
开开
发发
A
A
B 开 不开发 发
A
A
开发
不开发 开发
不开发 开发 不开发
不开发 开发
(4, 4) (8, 0) (0, 8) (0, 0) (-3, -3) (1, 0) (0, 1) (0, 0)
– 后续集(the set of successors)
• 用T(x)表示
2、枝(branches)
– 枝是从一个决策结到它的直接后续结的 连线;
– 每一枝代表参与人的一个行动选择; – 可选择的行动集合A(x)和该结点的直接
后续集合 t(x)之间存在一一对应关系 。
3、信息集(information sets)
同一信息集满足下列条件 :
(1) x P(x), 且x P(x)
(2) i(x) i(x)
(3) A(x) A(x)
(三)完美信息动态博弈
完美信息博弈(Game of perfect information)
– 是指所有信息集都为单结的博弈, 完美信息博弈意味着在博弈中没有任何两个人同
时行动,并且所有后行动者能确切地知道前行 动者选择了什么行动,所有参与人都能观测到 自然的选择或行动。
开发 (0, 1)
不开发 (0, 0)
同一信息集的表示法:知道参与人A的选择, 但不知道自然的选择
A
开发 不开发
开发
N
大小
1/2
1/2
N
大 1/2
小 1/2
B B
B B
开发 不开发
不开发 开发 不开发 开发
不开发
(4, 4) (8, 0) (-3, -3) (1, 0) (0, 8) (0, 0) (0, 1) (0, 0)