宏观经济学分析方法系列:(课堂放映版、11硕已讲)动态规划的Bellman原理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
=================
=================
附录:
宏观经济学分析方法:动态规划的Bellman原理
(10、11硕已讲,精细订正版)
二、一个简化的例子
欲对Bellman原理有一个快速的理解,这里通过一个简化的例子,以勾勒出动态规划方法所特有的向后追溯(backward recursion,逆向递归,逆向归纳)的特征。
假定:
(1)典型个人生存两个时期,他可以在两个时点上,即1
t
=
0、上做决策(3=t时,他就死亡了);他被赋予一定量的初始资源0
W。
)0(>
(2)理想化的资本市场上存在两种资产1。一种是无风险的1所谓理想化资本市场如上一章中的要求,即无交易成本、
GAGGAGAGGAFFFFAFAF
现金或者债券,它的价格在任何时刻都没有变化,始终为1;另一种是有风险的股票,它的价格过程假定由以下二项树描绘(参见下图)。
制度限制、操纵行为等。
GAGGAGAGGAFFFFAFAF
GAGGAGAGGAFFFFAFAF
简单地说,它表示在每一时点上,股票价格要么以 9/4的概率上涨一倍,要么以 )9/41(-的概率下跌一半。
用)0(w 和)1(w 表示该投资者在10、时刻上,投资于风险资产(股票)上的财富分额。
(3)投资者的非资本收入为 0,效用函数具有以下特定形式: x x u =)(
(4)为了简化求解,假定投资者不进行任何消费,这样最优决策的惟一目标就是最大化他来自最终财富的期望效用。
至此,最优化问题就可以简化为:
⎣⎦
)2(..)2(max )1(),0(>W t s W E w w
我们的任务就是找到最优的投资决策变量(最优控制)
图 股票价格运动的二项树模型
100 1
)0(w和)1(w,使以上最优化问题得以解决。
可以尝试采用“向前”推导的方法,即从0 t时刻开始,事先决定一个策略
GAGGAGAGGAFFFFAFAF
GAGGAGAGGAFFFFAFAF
)0(w ,但它是不是最优还不清楚,根据)0(w 我们仅仅能够
知道1=t 时刻的期望财富水平的函数表达式,
但是最大化这个函数得到的“最优的”
)0(w ,并不一定是最优决策过程)]1(),0([w w 的必然组成部分,除非可以明确地知道在所有不同情况状态下的)1(w ,并且它是惟一的。因此,向前推导的方法是行不通的。
换一种思路,我们可以试着从倒数第一期,即1-T 期开始。
这就是说,我们必须获得 1=t 时期,股票价格在200=p 或者
50=p 两种情况下的最优投资比例,而这是一个单期静态优化问题。一旦获得了1=t 时的相应结果)1(w 和)1(W ,就可以按照同
样的手续,进一步推导0=t 时刻的最优投资比例,
从而一层层地逐步解决问题。
具体求解如下:
第一步:1=t 时刻
假定此时的财富)1(W 为任意一正数(它是由上一期0=t 时的最优决策所产生的)。投资到股票上的财富比例为)1(w ,则投向无风险资产上的就是)1(1w -。我们来计算最后的2
=t
GAGGAGAGGAFFFFAFAF
时刻,积累的财富的期望效用是多少。
先考虑当股票价格200=p 时的情形,根据二项树模型: )
1()]1([)1()1()2/1(1951)1(94)1()]1(1[)1()1()2/1(9
5)1()]1(1[)1()1(294]200)2([W w f W w w W w W w W w W w p W E =⎥⎦
⎤⎢⎣⎡-++=-++-+==
GAGGAGAGGAFFFFAFAF
为了找到最优投资比例)1(w ,只要对)]1([w f 求导,并令一阶导数于0就可以了,容易得到:
19/13)1(=w 和383/19)]1([=w f
再考察当股票价格50=p 时的情形 , 我们发现仍旧可以使用上式 。 因为 )1()]1(1[)1()1((2W w W w -+依然表示股票价格上涨一倍的情况下,投资在两种资产上,给投资者带来的期末财富的期望效用;而)1()]1(1[)1()1((2/1W w W w -+则
是投资机会相对较差即下跌 一半时,
期末财富的期望效用水平。因此最优解还是19/13)1(=w ,因此这个最优投资比例决策独立于1时刻股票价格和财富的绝对水平。
第二步:0=t 时刻
根据上面的推理,我们只要知道1时刻的财富水平)1(W ,就可以知道最终财富的期望效用水平是多少,而1时期的财富水平)1(W ,也是由同第一步类似的决策过程所决定的, 即:
GAGGAGAGGAFFFFAFAF
[][]
)
0()]0([)]1([)0()0()2/1(1951)0(94)]1([)0()]0(1[)0()0()2/1(95)0()]0(1[)0()0(294)]1([)1()]1([)2(W w f w f W w w w f W w W w W w W w w f W E w f W E =⎭
⎬⎫⎩⎨⎧⎥⎦⎤⎢⎣⎡-++=⎭
⎬⎫⎩⎨⎧-++-+==
同样对)]0(
f求导数,并令一阶导数等于0,得到最优化
[w
条件19
w,因此动态最优投资决策方案就是:
)0(=
13
/
)1(=
w
)0(=
w,19/13
13
19
/
尽管实际的问题要比这个简单的例子复杂得多,但从上述求解过程中,仍然可以归纳出最优个人消费(投资)决策的动态规划解法的最显著特征,即它是向后追溯的。而这正是贝尔曼最优化原理的体现。
三、一般情形
现在考察多期(多阶段)离散时间情况下,个人最优消费/投资决策问题的标准建模方法和它的一般解法。
假定:
(1)有限生命
GAGGAGAGGAFFFFAFAF