完全信息动态博弈 ppt课件

合集下载

博弈论 完全信息动态博弈.ppt

博弈论 完全信息动态博弈.ppt

4、工会、雇主与中央银行的经济博弈
考虑工资、物价、就业的宏观经济模型:
• 中央银行:选择货币供应量,在其效用函 数中关注通货膨胀率与就业水平;
• 企业:选择就业数量,使企业利润最大化 (受工人的工资影响);
• 就业者:要求工资水平,使自身福利最大 化(受通货膨胀率影响)。
• 由于劳动合同和工资刚性,博弈顺序为:
• 企业1首先选择产量q1,企业2观察到企业1的产量 后选择自己的产量q2,令: P(Q)=a-q1-q2代表逆需求函数 Ci(qi)=cqi代表成本函数 则第i企业的利润函数为:
i(q1,q2)=qiP(q1+q2)-Ci(qi)
企业1 q1
企业2 q2
市场
i=1,2
P(Q)
企业利润:
i(q1,q2)
• 若T=1,在T=1时,参与人1出价,如果他提出 x1=1,参与人2只能接受。
两阶段博弈(T=2)
• 若T=2,在T=2时,参与人2出价,如果他提 出x2=0,参与人1只能接受;
• 由于参与人2在T=2时的1单位支付相当于在 t=1时δ2单位,如果参与人在t=1时出价1-x1≥δ2, 则参与人2会接受。
承诺价值
• 在该博弈中,拥有信息优势反而使参与人处 于劣势,企业1称为领导者,企业2称为随从。
• 现在考察完全信息静态情形下:如果企业1 承 信诺呢?(威协)生产q1*=(a-c)/2,企业2是否会相
• 若 优 信企选企业择业将21选的是择威qq1胁*2=*,=3((唯aa--一cc))//的48, ,纳则 因什此 此均时企衡企业是业2不1会的相最 q1*=q2*=(a-c)/3。
企业1 q1
企业2 q2
市场
P(Q)

完全信息动态博弈 ppt课件

完全信息动态博弈 ppt课件
泽尔腾引入子博弈精练纳什均衡的概念的 目的是将那些不可置信威胁策略的纳什均 衡从均衡中剔除,从而给出动态博弈的一 个合理的预测结果,简单说,子博弈精练 纳什均衡要求均衡策略的行为规则在每一 个信息集上是最优的。
策略的表述
✓ 策略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
✓ 参与人集合 ✓ 每个参与人的策略集合 ✓ 由策略组合决定的每个参与人的支付
进入者
进入 在位者 不进入(0,300)
合作(40,50) 斗争(-10,0)
不可置信威胁
市场进入阻挠博弈树
信息集
A
参与人(A,B,N)
结,初始结
开发
不开发
策略
B
开发
N
结,决策结

1/2

1/2

不开发
B
B
不开发
开发
开发
如果市场上只有一栋楼需求大时可卖18亿需求小时可卖11亿博弈策略表述40004000800000800000不开发开发商a开发不开发开发30003000100000100000不开发开发商b开发商a开发不开发开发开发商b需求小的情况需求大的情况博弈的策略式表述由策略组合决定的每个参与人的支付进入者进入不进入0300在位者市场进入阻挠博弈树不可置信威胁合作4050斗争100开发不开发12121212开发不开发开发不开发开发不开发开发不开发4480331008000100参与人abn策略支付房地产开发博弈结决策结结终点结结初始结信息集一博弈扩展式表述博弈的基本构造包括决策结和终点结两类
第三章 完全信息动态博弈
一 博弈扩展式表述 二 子博弈精练纳什均衡 三 应用举例 28页

08 完全信息动态博弈(子博弈完美的纳什均衡)PPT课件

08 完全信息动态博弈(子博弈完美的纳什均衡)PPT课件
承诺和威胁都是不可信的!
思考:
如何能使承诺和威胁变得可信?
增加撤销承诺或威胁所要受到的损失 让对方知道 “破釜沉舟” “穷寇莫追”
“破釜沉舟”
《孙子兵法·九地》:“焚舟破釜,若驱群羊而往, 驱而来,莫知所之。”
《史记·项羽本纪》: “项羽乃悉引兵渡河, 皆沉船,破釜甑,烧 庐舍,持三日粮,以 示士卒必死,无一还 心。”
子博弈 Sub-game
原博弈中的一部分(次级博弈)
L
B1
U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
如何寻找均衡?
L
B1 U
R
A
D
L B2
R
( 22,99 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
NE:(U , L)&(D , R)
逆推
backward induction
泽尔腾1965年发表《需求减少条件下寡头 垄断模型的对策论描述》一文,提出了“子 博弈精炼纳什均衡”的概念,又称“子对策 完美纳什均衡”。
• 莱茵哈德·泽尔腾 Reinhard Selten ,子博弈精 炼纳什均均衡的创立者。
• 1994年因在“非合作博
弈理论中开创性的均衡分 析”方面的杰出贡献而荣 获诺贝尔经济学奖。
例:动态游戏 - 博弈树
假设:A 先行动,B 后行动Leabharlann LB1U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
博弈树 game tree
结点 node 枝 branch 信息集 information set

完全信息动态博弈最新优质PPT课件

完全信息动态博弈最新优质PPT课件
完全信息动态博弈 POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
三人罢工博弈的博弈树
2.三人罢工博弈的策略选择与信息
1
H
O
2 H
3
H
O
O
3
H
O
H
3
H
O
2 O
3
H
O
(6, 6, 6) (3, 3, 8) (3, 8, 3) (0, 2, 2) (8, 3, 3) (2, 0, 2) (2, 2, 0) (1, 1, 1)
员工 2 只有一个信息集的博弈树
1
H
O
3 H
第二节 完全且完美信息动态博弈概述
? 在完全且完美信息动态博弈( Dynamic Game with Perfect and Complete Information )中,每个博弈参与 者均知道在自己之前进行决策的参与者选择的策略和博弈结构。
? 博弈树中每个节点都独立构成一个信息集,没有虚线连接两个或 多个博弈树节点。
? 博弈树的方法不仅能表示动态博弈,还能表示静态博弈。
嫌疑人甲
嫌疑人乙
坦白
坦白
不坦白
不坦白 嫌疑人乙
坦白
不坦白
(5, 5)
(1, 10)
(10, 1)
用博弈树表示囚徒困境
(2, 2)
? 所谓的“博弈先后顺序”,它主要是一个信息的概念,而不 是一个纯时间先后的概念。

博弈论与信息经济学--完全信息动态博弈 ppt课件

博弈论与信息经济学--完全信息动态博弈  ppt课件

©&® by H. Q. Feng, CUFE
5/58
一、动态博弈的表述——扩展式
(2)博弈的扩展式表述包括以下要素: 参与人集合:i=1,…,n,此外,N代表虚拟参与人“自然” 参与人的行动顺序:谁在什么时候行动; 参与人的行动空间:在每次行动时,参与人有些什么选择; 参与人的信息集:每次行动时,参与人知道什么; 参与人的支付函数:在行动结束之后,每个参与人得到些什 么(支付是所有行动的函数); 外生条件(即自然的选择)的概率分布。 假定房地产开发博弈的行动顺序如下:开发商A首先行动, 选择开发或不开发;在A决策后,自然选择市场需求的大小; 开发商B在观测到A的决策和市场需求后,决定开发或不开 发。
该博弈的扩展式表述为:
©&® by H. Q. Feng, CUFE
15/58
一、动态博弈的表述——扩展式
进入者
进入
不进入
在位者
斗争 默许
(0,300)
(-10,0)
(40,50)
©&® by H. Q. Feng, CUFE
16/58
二、子博弈精炼纳什均衡
纳什均衡有几个问题:
第一,一个博弈不止一个均衡,事实上,有些 博弈可能有无数个纳什均衡,究竟哪一个更合 理? 纳什均衡假定每一个参与人在选择自己的最优 战略时假定所有其他参与人的战略是给定的, 但是如果参与人的行动有先有后,后行动者的 选择空间依赖于前行动者的选择,先行动者在 选择时不可能不考虑自己的行动对后行动者的 影响。
©&® by H. Q. Feng, CUFE 20/58
二、子博弈精炼纳什均衡
“子博弈”的概念:从每一个行动选择开始至 博弈结束又构成一个博弈,称为“子博弈”。 如在进入者选择进入之后,在位者选择行动 开始就是一个子博弈。 子博弈需满足的条件:

完全信息动态博弈-PPT

完全信息动态博弈-PPT

(1) 开发商A先行动, 选择开发或不开发;(2) 开发商B在
观测到A得决策后, 再决定开发或不开发。博弈树如下
图。
A


B
B




(-3,-3)
(1,0) (0,1)
(0,0)
注:所有n个局中人得一个纯策略组合决定了博弈树上得一条 路径。但每条路径可由不同得策略组合决定。
例如, (开发,(不开发,开发))决定了 A -> 开发 -> B -> 不开发 -> (1,0)
进 入 进入 者 不进入
在位者
默许
斗争
5,5 1,10
-2,3 1,10
承诺行动使 不可ቤተ መጻሕፍቲ ባይዱ信威胁可信威胁,否则,当事人将为自 己得“失信”付出成本。
例如,该例中,在位者与某第三者打赌,如果进入者进入后她 不斗争,她就付给后者3,这时,斗争成为可置信得威胁。因为 如果进入后,选择默许,收益更小。注意:有了这个赌,进入者 就不敢进入了,实际上,在位者无需支付赌注。
开 (-3,-3)
A

BI


B

(1,0) (0,1)

不 (0,0)
房地产开发中,子博弈I与Ⅱ属于单人博弈,子博弈I中,B得最优 选择就是不开发,子博弈Ⅱ中,B得最优选择就是开发,因此: (1)(不开发, (开发,开发))在子博弈I上不构成Nash均衡; (2)(开发,(不开发,不开发))在子博弈Ⅱ上不构成Nash均衡; (3)(开发,(不开发,开发))在所有子博弈上都构成Nash均衡, 就是子博弈精炼Nash均衡。
Max π1(q1,s2(q1))=q1(a-q1-s2(q1)-c)

第二章完全信息动态博弈篇三精品PPT课件

第二章完全信息动态博弈篇三精品PPT课件

如此重复直到初始结。每一步都得到对应于子博弈的一个 纳什均衡,并且根据定义,该纳什均衡一定是该子博弈的 子博弈的纳什均衡,这个过程的最后一步得到整个博弈的 纳什均衡
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)
用逆向归纳法求 子博弈精练纳什 均衡
对于有限完 美信息博弈,逆 向归纳法求解子 博弈精练纳什均 衡是一个最简便 的方法。
完全信息动态博弈-子博弈精练纳什均衡 泽尔腾(1965)
子博弈:是原博弈的一部分,它本身也可以作为一个独立的 博弈进行分析:
(1)子博弈必须从一个单结信息点开始:只有决策者在原 博弈中确切地知道博弈进入一个特定的决策结时,该决策结 才能作为一个子博弈的初始结。如果信息集包含两个以上的 决策结,则这两个都不可以作为子博弈的初始结(见下页)。
子博弈精练纳什均衡
泽尔腾引入子博弈精练纳什均衡的概念的目的 是将那些不可置信威胁战略的纳什均衡从均衡 中剔除,从而给出动态博弈的一个合理的预测 结果,简单说,子博弈精练纳什均衡要求均衡 战略的行为规则在每一个信息集上是最优的。
什么是子博弈,什么是子博弈精练纳什均衡? 有没有更好的方法找到子博弈精练纳什均衡?
参与人X的信息集不能开始一个子博弈, 否则的话,参与人B的信息将被切割。
完全信息动态博弈-子博弈精练纳什均衡
泽尔腾(1965)
A
x
x’
开发
不开发
开发 不开发
开发 不开发
Bx
B
不开发
开发
开发
x’
不开发
(-3,-3) (1,0) (0,1) (0,0)
子博弈I
A
子博弈II
坦白
抵赖
(-3,-3) (1,0) (0,1) 房地产开发博弈

第三章扩展式博弈与完全信息动态博弈ppt课件

第三章扩展式博弈与完全信息动态博弈ppt课件

严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
1
L
x1
R
2
2
L x2 R
3
L x3 R
3
L x4 R L x5 R L x6 R L x7 R
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
下图表示参与人3选择时,即不知道参与人2的选 择,也不知道参与人1的选择的博弈情形。
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
例如
• 在“新产品开发博弈”中,假设企业1先行动, 企业2后行动,但企业2行动时不知道企业1的 行动。
企业2行动时,只知道 博弈要么到达点x2,要 么达到点x3 ,但具体在 哪一点上,企业2不清 楚。也就是说,企业2 只知道自己位于决策结 集合{x2, x3 }上,但不知 道位于{x2, x3 }中哪一个 决策结上。
严格 执行 突 发事 件 上 报制 度、校 外活动报批 制 度等相 关规章 制度。 做到及 时发现、 制止 、汇报并处理 各 类违纪行 为或 突发事 件。
一、扩展式博弈
• 所谓扩展式博弈(extensive form game)是 博弈问题的一种规范性描述。与战略式 博弈侧重博弈结果的描述相比,扩展式 博弈更注重对参与人在博弈过程中所遇 到决策问题的序列结构的详细分析。
• 试用扩展式博弈对两个企业都知道市场 需求,且企业1先决策,企业2观测到企 业1的选择后再进行选择的博弈情形即完 全信息动态的“新产品开发博弈”进行 建模。

博弈论(完全信息动态博弈)精品PPT课件

博弈论(完全信息动态博弈)精品PPT课件
第二章 完全信息动态 博弈
§2.0 引入
例 强盗分赃问题
§2.1 博弈的标准形和展开形(p35)
一、标准形 例 :分级协调(ranked coodination)
P35,B2.1
领导-随从博弈(p1先行动)
P37-B2.2
二、展开形和博弈树
策略
P37-38 结
后续结 前续结
路径
起始结 终点结 枝
p38Βιβλιοθήκη §2.2 信息集P41— T2.4
二、信息集的性质 三、信息集的分割 四、共同知识
§2.3 信息分类
P46—B2.4
完美 确定
对称 完全
P47—T2.5
§2.4 海萨尼转换
领导-随从博弈III
P51—T2.6
P52—T2.7
类型 世界状态 海萨尼教义
P55—B2.5 概率--边际概率--条件概率--先验概率--后验概率
谢谢大家
荣幸这一路,与你同行
It'S An Honor To Walk With You All The Way
演讲人:XXXXXX 时 间:XX年XX月XX日
p57
P60—T2.9
Png赔偿 博弈
对方和解
(0,0)
(0,0) 对方奉陪
(s,-s) (w-p,-w-D) (0,0) (s,-s) (-p,-D)
(0,0)
结束语
当你尽了自己的最大努力时,失败也是伟大的, 所以不要放弃,坚持就是正确的。
When You Do Your Best, Failure Is Great, So Don'T Give Up, Stick To The End
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 完全信息动态博弈
一 博弈扩展式表述 二 子博弈精练纳什均衡 三 应用举例 28页
博弈的策略表述
案例- 房地产开发项目-假设有A、B两家开发商
市场需求:可能大,也可能小
投入:1亿
❖假定市场上有两栋楼出售: ✓需求大时,每栋售价1.4亿, ✓需求小时,售价7千万; ❖如果市场上只有一栋楼 ✓需求大时,可卖1.8亿 ✓需求小时,可卖1.1亿
信息集:H1={h1};行动空间:A(h1)={左,右} 纯策略空间:S1=A(h1)={左,右} • 局中人2
信息集:H2={h2};行动空间:A(h2)={A,B} 纯策略空间:S2=A(h2)={A,B} • 纯策略组合
S= {{左, A},{左,B},{右,A},{右,B}}
扩展式博弈的策略式表示
h1 1 左 h12 2
右 2 h22
A
BC
D
h1 1 左 2 h2

2 h2
A
BA
B
(3,1) (5,6)(4,2) (2,7) (3,1) (5,6)(4,2) (2,7)
h1

h12

h22
A (2, 0)
B
C
(1, 1) (0, 0.5)
D h21
E
F
(3, 1)
(2, 2)
h1
左 h12
纯策略空间:S2=A(h12)A(h22)={(A,C),(A,D),(B,C),(B,D)}
h1 1 左 h12 2
右 2 h22
A
BC
D
(3,1) (5,6)(4,2) (2,7)
纯策略组合
S={{左, (A,C)},{左, (A,D)},{左, (B,C)},{左, (B,D)}, {右, (A,C)},{右, (A,D)},{右, (B,C)},{右, (B,D)}}
A
开发
N

1/2

1/2
不开发

1/2
N

1/2
B
B
B
B 不开发
不开发
不开发
不开发 开发
开发
开发
开发
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
房地产开发博弈
B知道自 然的选择; 但不知道A 的选择(或A、 B同时决策)
A
开发
N

1/2

1/2
不开发

1/2
N

1/2
B
B
B
B 不开发
不开发
不开发
不开发 开发
开发
开发
开发
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
房地产开发博弈
一 博弈扩展式表述
只包含一个决策结的信息集称为单结信 息集,如果博弈树的所有信息集都是单 结的,该博弈称为完美信息博弈。
2、扩展式博弈的策略式表示
h1 1 左 h12 2
A
B
右 2 h22
C
D
(3,1) (5,6)(4,2) (2,7)
(A,C) (A,D) (B,C) (B,D)
左 3,1
3,1
5,6
5,6
右 4,2
2,7
4,2
2,7
h1 1 左
2 h2
右 2 h2
A
BA
B
(3,1) (5,6)(4,2) (2,7) 局中人1

1


2
2
A (3,1)
B
C
D
(5,6) (4,2) (2,7)
2. 博弈树规则
(1) 每一个结至多有一个其他结直接位于 它的前面。
(2) 在博弈树中没有一条路径可以使决策 结与自身相连。
(3) 博弈树必须有初始结 (4) 每个博弈树只有一个初始结
3、完美信息与不完美信息
定义:假如一个局中人在轮到他行动时知道自 己处于博弈树的那个结上,我们称该局中人有 完美信息。 博弈中的每一个局中人都具有完美信息,则称 该博弈有完美信息。 如果局中人在不知道另外的局中人前面行动的 情况下必须行动,则称该局中人具有不完美信 息。 倘若至少有一个局中人具有不完美信息,则称 该博弈具有不完美信息。
A h21
B h21
右 h22
C a
b
c
d cd
(1,2) (0,3) (3,1) (-1,4) (2,1) (0,0) (-1,1) (3,2)
二、扩展式博弈的策略与均衡
1. 概念 信息集
Hi={hi: hi是局中人i的信息集} 行动空间
A(hi): 局中人i基于信息集hi的行动全体 Ai= hiHiA(hi):局中人i的所有行动的集合
与人的一个行动选择. 信息集: 每个信息集是决策结集合的一个子集,该子集包括所有满
足下列条件的决策结: ✓ 1 每个决策结都是同一个参与人的决策结; ✓ 2 该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟
处于哪一个决策结.
B在决策 时不确切地 知道自然的 选择;
B的决策 结由4个变 为2个
博弈策略表述
需求大的情况
开发商B 开发 不开发
开发商A
开发 4000,4000 不开发 0,8000
8000,0 0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的策略式表述
一 博弈扩展式表述
博弈的扩展式表述包括三个要素:

1/2
N

1/2
B 不开发
不开发 开发
,终点结
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
房地产开发博弈 支付
一 博弈扩展式表述
博弈的基本构造 结: 包括决策结和终点结两类;决策结是参与人行动的始点,终点结
是决策人行动的终点. 枝: 枝是从一个决策结到它的直接后续结的连线,每一个枝代表参
✓ 参与人集合 ✓ 每个参与人的策略集合 ✓ 由策略组合决定的每个参与人的支付
进入者
进入 在位者 不进入(0,300)
合作(40,50) 斗争(-10,0)
不可置信威胁
市场进入阻挠博弈树
信息集
A
参与人(A,B,N)
结,初始结
开发
不开发
策略
B
开发
N
结,决策结

1/2

1/2

不开发
B
B
不开发
开发
开发
纯策略空间
局中人i的一个纯策略 si:HiAi ( hiHi, si (hi) A(hi)) Si={si: si是局中人i的一个纯策略} Si= hiHiA(hi)
纯策略组合
S=Si
h1 1 左 h12 2
右 2 h22
A
BC D
(3,1) (5,6)(4,2) (2,7) 局中人1 信息集:H1={h1};行动空间:A(h1)={左,右} 纯策略空间:S1=A(h1)={左,右} • 局中人2 信息集:H2={h12,h22};行动空间:A(h12)={A,B}; A(h22)={C,D}
相关文档
最新文档