第13章 状态空间模型和卡尔曼滤波(第三版)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
超参数(hyperparameters)。超参数确定了模型的随机性质,在
ct 和 dt 中出现的参数仅影响确定性的可观测变量和状态的期望值。 在状态空间模型中可以引入外生变量作为解释变量,也可以引入
yt 的延迟变量,这些都可以放到 dt 中去。如果 ct 或 dt 是未知参数
的一个线性函数,这些未知参数也可以作为状态变量或者超参数 的一部分元素。
ut H t Ω var 0 ε t
0 Qt
6
当 k 1 时,变为单变量模型,量测方程可以写为
yt Z t αt d t ut
var( ut ) 2
t 1, 2 , , T
(13.1.5)
Biblioteka Baidu
其中:Zt 表示 1m 矩阵,t 表示 m1状态向量, ut 是方差为 2 的 扰动项。
0 的线性组合,所以模型是线性的。
9
例13.1 一阶移动平均模型MA(1)
yt t t 1 ,
可以写成状态空间形式 量测方程: 状态方程:
t 1, 2 , , T
(13.1.9)
其中:E(t )=0,var(t)= 2,cov(t , t-s)=0, 通过定义状态向量 t =( yt ,t )
式,并估计参数值。在计量经济学文献中,状态空间模型被用来估 计不可观测的时间变量:理性预期,测量误差,长期收入,不可观
测因素(趋势和循环要素)。状态空间模型在经济计量学领域其他
方面的大量应用请参见 Harvey(1989)和 Hamilton(1994) 。
1
在一般的统计模型中出现的变量都是可以观测到的,这些模 型以反映过去经济变动的时间序列数据为基础,利用回归分析或 时间序列分析等方法估计参数,进而预测未来的值。状态空间模 型的特点是提出了“状态”这一概念。
13
例13.3
变参数模型
通常的回归模型可用下式表示,即 :
yt xt β ut ,
t 1, 2 , , T
其中:yt 是因变量,xt 是m1的解释变量向量, 是待估计的m1未知
参数向量,ut 是扰动项。这种回归方程式所估计的参数在样本期间内 是固定的,可以采用普通最小二乘法 (OLS) 、工具变量法等计量经济
yt Z tαt d t ut
式中 Zt* = Zt B-1 。
(13.1.13)
11
例13.2 二阶自回归模型AR(2)
yt 1 yt 1 2 yt 2 ut ,
形式( k=1, m=2 )是
t 1, 2 , , T
(13.1.14)
其中:E(ut) = 0,var(ut) = 2,cov(ut , ut-s) = 0, 考虑两个可能的状态空间
这一点很容易验证。
考虑通过定义一个任意的非奇异矩阵 B,得到t*=Bt ,为新 的状态向量。用 B 矩阵左乘状态方程(13.1.3),得到
αt Tt αt1 ct Rt ε t
式中 Tt* = BTt B-1,ct*= Bct ,Rt*= BRt 。相应的量测方程是
(13.1.12)
t
(13.1.17)
12
系统矩阵 Zt ,Ht ,Tt ,Rt ,Qt 可以依赖于一个未知参数的
集合。状态空间模型的一个主要的任务就是估计这些参数,在例
13.1的MA(1)模型中的参数 { , 2} 和例13.2的AR(2)模型中的参数 {1, 2, 2} 是未知的,这些参数将通过 向量表示,并被称为
16
以下设 YT 表示在 t = T 时刻所有可利用的信息的信息集合,即 YT = { yT , yT-1 , … , y1 } 。状态向量的估计问题根据信息的多少分为3 种类型: (1) 当 t > T 时,超出样本的观测区间,是对未来状态的估计问 题,称为预测(prediction);
(2) 当 t = T 时,估计观测区间的最终时点,即对现在状态的估
型),扰动向量 ut , t 假定为相互独立的,且服从均值为0,方差为 2和
协方差矩阵为 Q 的正态分布。
15
13.2 卡尔曼滤波 (Kalman Filtering )
当一个模型被表示成状态空间形式就可以对其应用一些重要的 算法求解。这些算法的核心是 Kalman滤波。Kalman滤波是在时刻 t 基于所有可得到的信息计算状态向量的最理想的递推过程。在某些 工程问题中,状态向量的当前值具有重要影响 (例如,它可以表示火 箭在空间的坐标)。Kalman滤波的主要作用是:当扰动项和初始状态 向量服从正态分布时,能够通过预测误差分解计算似然函数,从而 可以对模型中的所有未知参数进行估计,并且当新的观测值一旦得 到,就可以利用Kalman滤波连续地修正状态向量的估计。
矩阵,即
at
Pt
t 1
E (αt Yt 1 )
var( αt Yt 1 )
t 1
在本节假定系统矩阵 Zt , Ht , Tt , Rt 和 Qt 是已知的,设初始
状态向量 0 的均值和误差协方差矩阵的初值为 a0 和 P0,并假定
a0 和 P0 也是已知的。
第十三章 状态空间模型和卡尔曼滤波
上世纪60年代初,由于工程控制领域的需要,产生了卡尔曼滤
波 (Kalman Filtering)。进入70年代初,人们明确提出了状态空间
模型的标准形式,并开始将其应用到经济领域。80年代以后,状态 空间模型已成为一种有力的建模工具。许多时间序列模型,包括典
型的线性回归模型和 ARIMA模型都能作为特例写成状态空间的形
yt (1 , 0)αt
(13.1.15)
yt 1 αt y 2 t 1 2
换一种形式
1 1 αt 1 ut 0 0
(13.1.16)
yt (1 , 0)αt
yt 1 2 1 α 0 ut 1 0 αt 1 y t 1
(13.1.2)
5
一般地, t 的元素是不可观测的,然而可表示成一阶马尔可夫 (Markov) 过 程 。 下 面 定 义 转 移 方 程 (transition equation) 或 称 状 态 方 程 (state equation)为
αt Tt αt 1 ct Rt εt ,
7
若使上述的状态空间模型成立,还需要满足下面两个假定: (1) 初始状态向量 0 的均值为 a0,协方差矩阵为 P0,即
E (α0 ) a 0
始状态 0 也不相关,即
var( α0 ) P0
(13.1.6)
(2) 在所有的时间区间上,扰动项 ut 和 t 相互独立,而且它们和初
E (ut ε s) 0
且
s, t 1, 2 , , T
(13.1.7)
) 0 , E (ut α0
) 0 E (ε t α 0
t 1, 2 , , T
(13.1.8)
8
量测方程中的矩阵 Zt , dt , Ht 与转移方程中的矩阵Tt , ct , Rt , Qt 统称为系统矩阵。如不特殊指出,它们都被假定为非随机的。 因此,尽管它们能随时间改变,但是都是可以预先确定的。对于 任一时刻 t,yt 能够被表示为当前的和过去的 ut 和 t 及初始向量
计问题,称为滤波(filtering); (3) 当 t < T 时,是基于利用现在为止的观测值对过去状态的估 计问题,称为平滑(smoothing)。
17
进一步,假定 att-1 和 Ptt-1 分别表示以利用到 t-1 为止的信
息集合 Yt-1 为条件的状态向量 t 的条件均值和条件误差协方差
分析动态系统。
3
利用状态空间形式表示动态系统主要有两个优点: 第一,状态空间模型将不可观测的变量 (状态变量 )并入可观测 模型并与其一起得到估计结果; 其次,状态空间模型是利用强有效的递归算法——卡尔曼滤波
来估计的。卡尔曼滤波可以用来估计单变量和多变量的ARMA模型、
MIMIC(多指标和多因果)模型、马尔可夫转换模型以及变参数模 型。
而实际上,无论是工程控制问题中出现的某些状态(如导弹
轨迹的控制问题)还是经济系统所存在的某些状态都是一种不可 观测的变量,正是这种观测不到的变量反映了系统所具有的真实
状态,所以被称为状态向量。这种含有不可观测变量的模型被称
为UC模型(Unobservable Component Model)。
2
UC模型通过通常的回归方程式来估计是不可能的,必须利用状
yt (1, 0) t
0 1 1 t 0 0 t 1 t
(13.1.10) (13.1.11)
这种形式的特点是不存在量测方程噪声。
10
对于任何特殊的统计模型,状态向量t 的定义是由结构确定的。
它的元素一般包含具有实际解释意义的成分,例如趋势或季节要素。 状态空间模型的目标是,所建立的状态向量t 包含了系统在时刻 t 的所有有关信息,同时又使用尽可能少的元素。所以如果状态空间 模 型 的 状 态 向 量 具 有 最 小 维 数 , 则 称 为 最 小 实 现 (Minimal Realization)。对一个好的状态空间模型,最小实现是一个基本准则。 然而对于任一特殊问题的状态空间模型的表示形式却不是惟一的,
t 1, 2, , T
(13.1.3)
其中:Tt 表示 mm 矩阵,称为状态矩阵,ct 表示 m1 向量,Rt 表示 mg
矩阵,t 表示 g1 向量,是均值为0,协方差矩阵为 Qt 的连续的不相关扰
动项,即
E (ε t ) 0
var( εt ) Qt
(13.1.4)
量测方程和状态方程的扰动项的协方差矩阵用 表示
yt Zt αt d t ut ,
t 1, 2, , T
(13.1.1)
其中:T 表示样本长度,Zt 表示 km 矩阵,称为量测矩阵,dt 表示 k1 向量,ut 表示 k1 向量,是均值为0,协方差矩阵为 Ht 的不相关扰动项, 即
E (ut ) 0
var( ut ) H t
yt xt βt ztγ ut
0 2 0 , ~ N , 0 0 Q
状态方程: βt βt 1 εt
(u t , εt )
t 1, 2 , , T
其中xt 是具有随机系数 t 的解释变量的集合,zt 是有固定系数 的解释 变量集合,随机系数向量 t 是对应于(13.1.1)中的状态向量,称为可变参 数。变参数 t 是不可观测变量,必须利用可观测变量 yt 和 xt 来估计。假 定变参数 t 的变动服从于 AR(1) 模型(也可以简单地扩展为 AR(p) 模
模型的常用方法进行估计。
14
实际上近年来,我国由于经济改革、各种各样的外界冲击和政策变
化等因素的影响,经济结构正在逐渐发生变化,而用固定参数模型表现 不出来这种经济结构的变化,因此,需要考虑采用变参数模型 (Timevarying Parameter Model)。下面利用状态空间模型来构造变参数模型。 量测方程:
4
13.1 状态空间模型的定义
在本节中,我们仅就如何定义并预测一个线性状态空间模型做以 简要的讨论。状态空间模型一般应用于多变量时间序列。设 yt 是包含 k
个经济变量的 k1 维可观测向量。这些变量与 m1 维向量 t 有关,t
被称为状态向量。定义“量测方程” (measurement equation) 或称“信 号方程”(signal equation)为
态空间模型来求解。状态空间模型建立了可观测变量和系统内部状
态之间的关系,从而可以通过估计各种不同的状态向量达到分析和 观测的目的。
EViews状态空间对象对单方程或多方程动态系统提供了一个直
接的、易于使用的界面来建立、估计及分析方程结果。它提供了大 量的建立、平滑、滤波及预测工具,帮助我们利用状态空间形式来