序贯决策博弈
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
B
●
A
●
B
●
◆ 该虚线罩住的不是信
息集。
◆ ◆
其必须满足:同集同
注,即从各个决策点
◆ 出发的策略选择数目 相同,名称也相同。
◆
单点集和非单点集
我们把不被扁椭圆虚线罩住的每个决策节点也给以信 息集的地位,称为单点集。
因此,每一个决策位置都是一个信息集,只有单点集 和非单点集之分。
非单
点集
B
●
局中人不能是别人对方“已经”做出的行动或决策,就等于同时行动或决策。 此时,我们用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个
信息集。
即局中人知道博弈已经进行到他的这个信息集,但不知道博弈究竟进行到这个信息集中的哪个
决策节点。
信息集
妻子虽然知道博弈已经进行到她的信息集,但不知道
这里的银行挤提博弈在一个很重要的方面不同于第1章 中讨论的囚徒困境:虽然两个博弈都存在一个对整个社 会是低效率的纳什均衡;但在囚徒困境中这一均衡是惟 一的(并且是参与者的严格占优战略),而在这里还同时 存在另一个有效率的均衡。从而,这一模型并不能预侧 何时会发生对银行的挤提,但的确显示出挤提会作为一 个均衡结果而出现。
由于不存在贴现,我们可以直接带入日期1的博弈矩阵 表示式。
由于r<D(并且由此可得2r-D< r),这一由两阶段博弈 变形得到的单阶段博弈存在两个纯战略纳什均衡:(1)两 个投资者都提款,最终收益情况为(r , r); 两个投资者都 不提款,最终收益为(R,R)。从而,最初的两阶段银行 挤提博弈就有2个子博弈精炼解。
2r-D. C、两个在到期后提,各得R D、两个都不提,等到投资项目结束,都得到R E、如果一个人在期满后提取,另一人不动则分别得:
2R-D,D。 如下图所示:
我们使用逆向归纳法分析问题
从日期2开始先考虑日期2的标准式博弈,由于明显的 R>D,也就是说2R-D>R。我们可以得到这个博弈的纳 什均衡(R,R)。
hi
1 3
(a
第一节 博弈的正规型表示与展开型表示
一、如何将博弈的展开型形式转化为正规型表示
进入
容忍 垄断者
●
b
抵抗
◆ (1,5) ◆ (-2,2)
进入者 ●
a
不进
垄断者 容忍 ◆ (0,10)
●
c
案例:“进入障碍”博弈
抵抗 ◆ (0,4)
“进入障碍”的矩阵表达
垄断者
{容忍,容忍} {抵抗,抵抗} {抵抗,容忍} {容忍,抵抗}
如果一个序贯博弈的每个信息集都是一个单点集,那么 该序贯博弈就是完美信息博弈,否则他就是不完美信息 博弈。
信息集举例
情爱博弈的扩展式表述
男
足球
芭蕾
女x
足球
芭蕾
女 x’
芭蕾
(1,2) (-1,-1)(0,0) (2,1)
女
足球
芭蕾
男x
足球
芭蕾
男 x’
芭蕾
(1,2) (-1,-1)(0,0) (2,1)
由于πi (ti,tj,hi,ei,hj*,ej*)可表示为: 企业I 在市场i的利润 + 在市场j的利润 即πi(ti, tj, hi,ei, hj, ej)=
[a-(hi+ej)]hi + [a-(hj+ei)]ei-c(hi+ei)-tjei
也即πi(ti, tj, hi,ei, hj, ej)=
hi*须满足: max hi [a - (hi+ej*) - c],
hi≧0
ei*必须满足:max ei [a - (ei+hj*) –c ] - tjei
ei≧0
企业的收益为其利润πi: πi(ti, tj, hi,ei, hj, ej)= [a-(hi+ej)]hi + [a-(hj+ei)]ei-c(hi+ei)-tjei
A
开发
不开发
N
大
1/2
小
1/2
大
1/2
N
小
1/2
B
B
B
B 不开发
不开发
不开发
不开发 开发
开发
开发
开发
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
房地产开发博弈
B知道自 然的选择; 但不知道A 的选择(或A、 B同时决策)
A
开发
N
大
1/2
小
1/2
企业的收益为其利润πi: πi(ti, tj, hi,ei, hj, ej)= [a-(hi+ej)]hi + [a-(hj+ei)]ei-c(hi+ei)-tjei
ei*必须满足:maxei[a-(ei+hj*)-c]-tjei ei≧0
企业的收益为其利润πi: πi(ti, tj, hi,ei, hj, ej)= [a-(hi+ej)]hi + [a-(hj+ei)]ei-c(hi+ei)-tjei
不开发
大
1/2
N
小
1/2
B
B
B
B 不开发
不开发
不开发
不开发 开发
开发
开发
开发
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
房地产开发博弈
银行挤兑博弈案例
案例情况: 两个投资者每人存入银行一笔存款D,银行已将这些存
款投入一个长期项目。如果在该项目到期前银行被迫对
制止
(-2,5) 制止
A 仿冒
B
仿冒 B
不制止 A
不制止
不仿冒 (0,10)
不仿冒 (5,5)
(2,2)
(10,4)
注意
同时,即使是同一个人在同一时点进行决策,也不一 定构成一个信息集,他还必须满足:在每一个决策点 他的行动选择集合必须是相同的。因为局中人在做行 动选择时并不知道自己位于哪个决策点,因此,他不 可能做出不同的行动选择。
hi*须满足: maxhi[a-(hi+ej*)-c],
hi≧0
且ei*必须满足:maxei[a-(ei+hj*)-c]-tjei
ei≧0
解得
hi*=(a-ej*-c)/2 ei*=(a-hj*-c-tj)/2
hi
1 3
(a
c
ti )
ei
1 3
(a
c
2t
j
)
同理,若政府给定关税税率t1和t2,则第二 个企业j将选择产量(hj*, ej*),即
序贯决策博弈
第一部分 同时博弈与序贯博弈
主要内容
本章主要介绍: 1、如何用正规型表示和展开型表示来表述 同
一个博弈。 2、博弈论中的两个重要概念:信息集和不完
美信息。 3、考察包含同时决策行动和序贯决策行动的
复合型博弈(混合博弈)的纳什均衡。
第一节 博弈的正规型表示与展开型表示 第二节 同时决策与序贯决策的混合博弈 第三节 树形博弈的子博弈 第四节 子博弈精炼纳什均衡 第五节 完美博弈的库恩定理 第六节 动态博弈的运用
银行挤兑(1)
王则柯“银行挤兑的成因和预防”
对两客客户来户说在,抽同回一存银款的行日各期也存有有两1种0:0一元是,在银银行行投将资 项这目2到0期0之元前投,称资日于期一1;个一是长在期到期项之目后。,称如日果期2在。项 假目定到如果期两前客户银在行日要期1抽要求回抽资回金资金,则则各得只70能元;收如回果只 有户1一只4个能0元客得户到;在剩但日余期的如14果要0元抽到。回期资金后则再该客收户回得投100资元,,另则一可客 如收果回等到本日息期22两8客0元户同。时要收回资金,则各得140元;如
A● B
●
◆
单点
集
◆
● ◆
◆
◆
完美信息博弈和不完美信息博弈
当博弈走到一个单点集的信息集时,面临决策的局中人 对于博弈迄今的历史清清楚楚,他清楚了博弈具体走到 了他的这个决策节点而不是别的决策点。我们把这种历 史清楚的博弈称为完美信息博弈。
但是当博弈走到一个非单点集的信息集时,面临决策的 局中人对于博弈迄今的历史是不清楚的,他不清楚博弈 具体走到了他的这个信息集里面的那个决策点。我们把 这种历史不清楚的博弈称为不完美信息博弈。
[a-(hi+ej)]hi -chi + [a-(hj+ei)]ei-cei-tjei
企业i在市场的最优化问题就可拆为一对问 题,在每个市场分别求解
企业的收益为其利润πi: πi(ti, tj, hi,ei, hj, ej)= [a-(hi+ej)]hi -chi + [a-(hj+ei)]ei-cei-tjei
果到日期2还只有一方要求收回资金,则要求收回资金一方 得180元,另一方得100元;如果到日期2没有客户要求收回 资金,则银行还是分给他们各140元。
银行挤兑(3)
日期1
周瑜
诸葛亮 抽回
抽回 不抽回 70,70 100,40
不抽回 40,100 140,140
前一种结果可以解释为对银行的一次挤提。如果投资 者1相信投资者2将在日期1提款、则投资者1的最优反 应也是去提款,即使他们等到日期2再去提款的话两人 的福利都会提高。
一个企业制造产品供给本国(h1,h2)及出口 (e1,e2);
博弈的时间顺序如下:
(1)政府同时选择关税税率t1和t2; (2)企业观察到关税税率,并同时选择其提供
国内消费和出口的产量(h1, e1)和(h2, e2);
企业的收益为其利润πi: πi(ti, tj, hi,ei, hj, ej)= [a-(hi+ej)]hi + [a-(hj+ei)]ei-c(hi+ei)-tjei
考虑两个完全相同的国家(i=1,2),
政府负责确定关税税率(t1,t2); 企业制造产品供给本国(h1,h2)及出口(e1,e2);
Biblioteka Baidu市场1:
Q1=h1+e2
考虑两个完全相同的国家(i=1,2),
政府负责确定关税税率(t1,t2); 企业制造产品供给本国(h1,h2)及出口(e1,e2);
企业i在市场的最优 化问题就可拆为一对 问题,在每个市场分 别求解
企业的收益为其利润πi:
πi(ti, tj, hi,ei, hj, ej)= [a-(hi+ej)]hi -chi +
[a-(hj+ei)]ei-cei-tjei
hi*须满足: max hi[a-(hi+ej*)-c], hi≧0
进 入 进 入 者不 进 入
1,5 0,10
-2,2 0,4
-2,2 0,10
1,5 0,4
二、如何将正规型的博弈转化为展开型
比前面简单,尤其是序贯博弈,但如果是同时博弈,如 何表示?
信息集
案例:情侣博弈
丈夫
足球
芭蕾
妻
足球
子 芭蕾
2, 1 0, 0
0, 0 1, 2
夫妻之争
信息集
根据同时博弈的定义,每个局中人决策时不知道别人的策略,即每个局中人在做自己的行动选择时,并不知道自己处在哪个决策节点上。例如妻子在选芭蕾时,并 不知道丈夫选的是芭蕾还是足球。
投资者变现,共可收回2r,这里D>r>D/2。不过,如果 银行允许投资项目到期,则项目共可取得2R,这里R>D。 有两个时间,投资者可以从银行提款:在银行的投资项目 到期之前或者在到期之后。为使分析简化,假设不存在 贴现。
两个投资者的提款日期可以有如下可能:
A、两个都提前,都得到r B、一个提前提取另一个不动,则第一人得D,另一人得
两个市场:
Qi=hi+ej
考虑两个完全相同的国家(i=1,2),
政府负责确定关税税率(t1,t2); 企业制造产品供给本国(h1,h2)及出口(e1,e2);
两个市场:
Qi=hi+ej, pi(Qi)=aQi
考虑两个完全相同的国家(i=1,2),每 个国家有
一个政府负责确定关税税率(t1,t2);
进行到信息集中的那个决策点,即她不知道丈夫会选 什么,因此是同时博弈。
足球 丈夫 ●
芭蕾
妻子 足球
●
芭蕾
妻子 足球
●
芭蕾
◆ (2,1) ◆ (0,0) ◆ (-1,-1) ◆(1,2)
注意
一个信息集罩住的必须是同一个局中人的决策点。 必须是同一个局中人在同一个时点的决策节点。
这两个 虚线罩 住的都 不是信 息集。
考虑两个完全相同的国家(i=1,2),
一个政府负责确定关税税率(t1,t2);
企业1制造产品h1供给本国,及出口e1;
考虑两个完全相同的国家(i=1,2),
一个政府负责确定关税税率(t1,t2);
企业1制造产品h1供给本国,及出口e1; 企业制造产品供给本国(h1,h2)及出口(e1,e2);
经典案例之 关税竞争
在国际争端中,关税与贸易争端最为激烈。 由于贸易能增进双方的福利,而关税是阻 碍贸易自由的最大障碍。
在早期,政府自由选择关税税率时将如何 决策?
考虑两个完全相同的国家(i=1,2),
考虑两个完全相同的国家(i=1,2),
政府负责确定关税税率(t1,t2);