状态空间模型和卡尔曼滤波
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
yt Zt t dt t , t 1, , T
(11.1.1)
式中 T 表示样本长度,Zt 是 k m 矩阵,dt 是 k 1向量,t 是 k 1
向量,是均值为0,协方差矩阵为 Ht 的连续的不相关扰动项,即
E( t )0,
var( t )Ht
(11.1.2)
一般地, t 的元素是不可观测的,然而可表示成一阶马尔可夫
在本节假定系统矩阵 Zt , Ht , Tt , Rt 和 Qt 是已知的,设初始状态
向量 0 的均值和误差协方差矩阵的初值为 a0 和 P0 ,并假定 a0 和 P0 也
是已知的。
考虑状态空间模型(11.1.1)、(11.1.3),设 at-1 表示基于信息集合YT-1
的 t -1 的估计量, Pt –1 表示估计误差的 m m 协方差矩阵,即
在上一节讨论利用Kalman滤波递推公式求状态向量的估计量时, 假定状态空间模型的系统矩阵Zt , Ht , Tt , Rt 和 Qt是已知的。但实际上
系统矩阵是依赖于一个未知参数的集合,这些未知参数用向量 表示,
并被称为超参数。本节对于状态空间模型的量测方程(11.1.1)和转移方 程(11.1.3)中含有未知参数的情况,介绍超参数的估计方法。
预测误差
vt yt ~yt t1 Zt ( t a t t1 ) t ,
(11.2.23)
被称为新息(Innovations),因为它代表了最后观测的新信息。从更新 方程(11.2.4)中可以看出,新息 vt 对修正状态向量的估计量起到了关键 的作用。
在正态假定下,根据 ~yt t 1 是最小均方误差意义下的最优估计
yt
Zt
t
dt
t
式中Z*t = Zt B -1 。
(11.1.13)
[例 2] 二阶自回归模型AR(2)
yt 1yt1 2 yt2 t , t 1, , T
考虑两个可能的状态空间形式 ( k = 1 , m = 2 ) 是
yt (1, 0)t
t
2
yt yt 1
12
1 0
t
1
10
t
换一种形式
§11.1 状态空间模型
一、状态空间模型的定义
状态空间模型(State Space Model)一般应用于多变量时间序列。设 yt是包含 k 个经济变量的 k 1 维可观测向量。这些变量与 m 1 维向量
t 有关, t 被称为状态向量。定义量测方程(Measurement Equation)为
在一般的统计模型中出现的变量都是可以观测到的,这些模型以反映 过去经济变动的时间序列数据为基础,利用回归或时间序列分析等方法估 计参数,进而预测未来的值。状态空间模型的特点是提出了“状态”这一 概念。实际上,无论是工程控制问题中出现的某些状态(如导弹轨迹)还 是经济系统所存在的某些状态都是一种不可观测的变量,正是这种观测不 到的变量反映了系统所具有的真实状态,所以被称为状态向量。这种含有 不可观测变量的模型被称为UC模型(Unobservable Component Model), UC模型通过通常的回归方程式来估计是不可能的,必须利用状态空间模型 来求解。状态空间模型建立了可观测变量和系统内部状态之间的关系,从 而可以通过估计各种不同的状态向量达到分析和观测的目的。
二、可变参数模型的状态空间表示
通常的回归模型可用下式表示,即
yt xt t
(11.1.18)
式中 yt 是因变量,xt 是 1 m 的解释变量向量, 是待估计的未知参 数向量,t 是扰动项。这种回归方程式的估计方法一般是使用普通最小二乘
法(OLS)、工具变量法等计量经济模型的常用方法。但是不管用其中的哪一 种方法,所估计的参数在样本期间内都是固定的。
yt
(1 ,
0
)
t
t
yt yt 1
11
2
0
t 1
1
0t1
(11.1.14) (11.1.15) (11.1.16)
(11.1.17)
系统矩阵 Zt ,Ht ,Tt ,Rt ,Qt 依赖于一个未知参数的集合。状态 空间模型的一个主要的任务就是估计这些参数,如在例题中的MA 和AR 模型的参数。为了和模型中的其它参数,如 ct 或 dt 相区别,这些参数被 称为超参数(Hyperparameters)。超参数确定了模型的随机性质,而在 ct 和 dt 中出现的参数仅影响确定性的可观测变量和状态的期望值。
§11.2 卡尔曼滤波
当一个模型被表示成状态空间形式 (State Space Form ,缩写为 SSF) 就可以对之应用一些重要的算法来求解。这些算法的核心是 Kalman滤波。Kalman滤波是在时刻 t 基于所有可得到的信息计算状态 向量的最理想的递推过程。Kalman滤波的主要作用是,当扰动项和初始 状态向量服从正态分布时,能够通过预测误差分解来计算似然函数,从 而可以对模型中的所有未知参数进行估计,并且当新的观测值一旦得到, 就可以利用Kalman滤波连续地修正状态向量的估计。
xt,dt = 0 。在(11.1.20)式中假定参数 t 的变动服从于AR(1) 模型(也可以
简单地扩展为 AR(p) 模型)。与(11.1.3)相对应,Tt = ,ct = 0, Rt= Im 。
根据(11.1.21)式 t 和 t 是相互独立的,且服从均值为0,方差为 2 和协方
差矩阵为 Q 的正态分布。
a t a t t1 Pt t1Zt Ft1 ( yt Zt a t t1 d t )
和
Pt Pt t 1 Pt t1Zt Ft1Zt Pt t 1
其中
Ft Zt Pt t1Zt Ht,
t 1, , T
上述的(11.2.2)—(11.2.6)一起构成Kalman滤波的公式。
(11.2.4) (11.2.5) (11.2.6)
Pt1 E[( t1 a t1 )( t1 a t1 )]
(11.2.1)
当给定 at-1 和Pt –1 时, t 的条件分布的均值由下式给定,即
a t t 1 Tt a t 1 ct
(11.2.2)
在11.3节中将要证明在扰动项和初始状态向量服从正态分布的假设
下, t 的条件分布的均值 atᅵt-1 是在最小均方误差意义下的一个最优估
E( t )0 ,
var( t )Qt
(11.1.4)
若使上述的状态空间模型成立,还需要满足下面两个假定:
(1) 初始状态向量 0 的均值为a 0 ,协方差矩阵为P0 ,即
E( 0 )a 0 ,
var( 0 ) P0
(11.1.6)
(2) 在所有的时间区间上,扰动项 t 和 t 是相互独立的,而且它 们和初始状态 0 也不相关,即
计量。估计误差的协方差矩阵是
Pt t1 Tt Pt 1TtRt Qt Rt ,
t1, ,T
方程(11.2.2)、(11.2.3)叫预测方程(Prediction Equations)。
(11.2.3)
一旦得到新的观测值 yt ,就能够修正 t 的估计 atᅵt-1 ,更新方程
(Updating Equations)是
1
t
这种形式的特点是不存在量测方程噪声。
(11.1.9) (11.1.10) (11.1.11)
对于任何特殊的统计模型, t 的定义是由结构确定的。它的元
素一般包含具有实际解释意义的成分,例如趋势或季节要素。状态空
间模型的目标是,所建立的状态向量 t 包含了系统在时刻 t 的所有有
关信息,同时又使用尽可能少的元素。所以如果状态空间模型的状态 向量具有最小维数,则称为最小实现 (Minimal Realization)。对一个 好的状态空间模型,最小实现是一个基本准则。
然而,对于任一特殊问题的状态空间模型的表示形式却不是惟一 的,这一点很容易验证。考虑通过定义一个任意的非奇异矩阵 B ,得
到新的状态向量 *t = Bt 。用矩阵 B 左乘转移方程(11.1.3),得到
t
Tt
t 1
ct
Rt
t
(11.1.12)
式中 T*t = BTt B -1,c*t = Bct ,R*t = BRt 。相应的量测方程是
E( t s )0 s, t 1, , T
且
(11.1.7)
E( t 0 )0
E( t 0 )0 t 1, , T (11.1.8)
量测方程中的矩阵 Zt , dt , Ht 与转移方程中的矩阵 Tt , ct , Rt , Qt 统称为系统矩阵。如不特殊指出,它们都被假定为非随机的。因此,尽 管它们能随时间改变,但是都是可以预先确定的。对于任一时刻 t, yt
能够被表示为当前的和过去的 t 和 t 及初始向量 0 的线性组合,所以
模型是线性的。
[例1] 一阶移动平均模型 MA(1)
yt t t1 , t 1, , T
通过定义状态向量 t = (yt , t ) 可以写成状态空间形式
yt (1,0)t , t 1, , T
t
0 0
1 0
t
1
(3) 当 t < T 时,是基于利用现在为止的观测值对过去状态的估计问 题,称为光滑(Smoothing)。
进一步,假定 atᅵt-1 和 Ptᅵt-1 分别表示以利用到 t – 1 为止的信息集
合 YT-1 为条件的状态向量 t 的条件均值和条件误差协方差矩阵,即
at t1 E(t YT 1) Pt t1 var(t YT 1)
近年来,我国由于经济改革、各种各样的外界冲击和政策变化等因素 的影响,经济结构正在逐渐发生变化,而用以往的OLS等固定参数模型表 现不出来这种经济结构的变化,因此,需要考虑采用可变参数模型(Timevarying Parameter Model)。下面利用状态空间模型来构造可变参数模型。
量测方程:
Kalman滤波的初值可以按 a0 和 P0 或 a1ᅵ0 和 P1ᅵ0 来指定。这样每 当得到一个观测值时,Kalman滤波提供了状态向量的最优估计。当所有 的T个观测值都已处理,Kalman滤波基于信息集合YT ,产生当前状态向量 和下一时间期间状态向量的最优估计。这个估计包含了产生未来状态向量 的最优预测所需的所有信息。
§11.3.1 极大似然估计和预测误差分解
量,可以推断 vt 的均值是零向量。进一步地,从(11.2.23)式容易看出
var(vt )Ft
(11.2.24)
式中 Ft 由(11.2.6)式给定。在不同的时间区间,新息 vt 是不相关的,
即
E (vt vs ) 0 ,
t s , t, s 1, , T (11.2.25)
§11.3 状态空间模型超参数的估计
设YT表示在时刻 T 所有可利用信息的集合,即 YT = { yT , yT-1 , … , y1 } 。状态向量的估计问题根据信息的多少分为三种类型:
(1) 当 t > T 时,超出样本的观测区间,是对未来状态的估计问题, 称为预测(Prediction);
(2) 当 t = T 时,估计观测区间的最终时点,即对现在状态的估计问 题,称为滤波(Filtering);
yt xt t t
转移方程:
t t1 t
(11.1.19) (11.1.20)
(t ,~t )
N
0 0
,
0
2
Q
,
t 1, ,T
(11.1.21)
在(11.1.19)式中,可变参数 t 是不可观测变量,必须利用可观测变量
yt和 xt 来估计。t 对应于(11.1.1)中的状态向量 t ,与(11.1.1)相对应,Zt=
第11章 状态空间模型和卡尔曼滤波
20世纪60年代初,由于工程控制领域的需要,产生了卡尔曼滤波 (Kalman Filtering)算法。进入70年代,人们明确提出了状态空间模型的 标准形式,并开始将其应用到经济领域。80年代以后,状态空间模型已 成为一种有力的建模工具。计量经济学领域中的诸多问题,如可变参数 模型、时间序列分析模型、季节调整模型、景气指数的建立、不可观测 变量的估计等都能转化为状态空间模型的形式,从而可以利用卡尔曼滤 波来得出相应的估计及进行预测。
(Markov) 过程。下面定义转移方程 (Transition Equation) 为
t Tt t1 ct Rt t , t 1, , T
(11.1.3)
式中 Tt 是 m m 矩阵, ct 是 m 1 向量, Rt 是 m g 矩阵,t 是g
1向量,是均值为0,协方差矩阵为 Qt 的连续的不相关扰动项,即