平稳时序模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章 平稳时序模型
本章主要内容
1.平稳序列的概念;
2.线性记忆系统和ARMA 模型的记忆特征 3.基本分析工具
4.平稳ARMA 模型的自相关函数; 5.平稳ARMA 模型的偏自相关函数; 6.平稳ARMA 模型的优选方法。

第一节 ARMA 模型的定义
定义2.1 满足如下条件的序列称为严平稳序列 有,正整数,正整数τ∀∈∀∀T t t t m m ,,,,21L : )
,,,(),,,(21,21,2121m t t t m t t t x x x F x x x F
m m
L L L L τττ+++=定义2.2 满足如下条件的序列称为宽平稳序列 T
t s k k s t t s k k s t T
t EX T
t EX t t
∈−+∀−+=∈∀=∈∀∞<且,为常数,,,),(),()3,)2,)12γγμμ 定义2.3 满足如下条件的序列称为平稳高斯序列: 1)是正态分布;
t Z 2)对任意的,概率密度函数m t t t k ,,,,21L ),,,(21m t t t z z z L ρ和),,,(21k t k t k t m z z z +++L ρ是相同的。

严平稳与宽平稳的关系 一般关系
\ 严平稳条件比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能
推出宽平稳成立,而宽平稳序列不能反推严平稳成立
特例
\ 不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列
\ 当序列服从多元正态分布时,宽平稳可以推出严平稳
平稳时间序列的统计性质
正确理解这个定义的确切含义和性质,从定义可知:密度函数不依赖于时间的起点,所有的都有相同的均值和相同的方差,如果的二阶矩存在,则的协方差只与时间间隔有关。

t Z }{t Z }{t Z
第二节 ARMA 模型的记忆特性
2.1 线性记忆系统;
例1:假设某人犯有高血压,且正在服用一种特殊的药来控制血压水平,记{是指标序列,即
}t x
⎩⎨⎧=其他时服药如果在,
0,1t x t 我们能认为是系统得激励或输入,记{}t x {}t y 是系统的响应或输出变量,假设在时刻时服用了药,可能有如下几种不同的响应。

3=t
t x
3=t
(a) t=3
t
y
这三种响应能分别用下列模型表示:
(a) t t x y 0ψ= (b) 11−=t t x y ψ (c) 110−+=t t t x x y ψψ
更一般的形式是:
L L ++++=−−j t j t t t x x x y ψψψ110 (2.1) 这个系统是线性记忆系统,其中j ψ叫第j 步的记忆系数,记忆系数的集合
),,,,(10L L j ψψψ叫记忆函数,表达式(2.1)叫做线性传递函数模型。

当然,在实践中不一定正好是指标变量,在不同的时刻可以有不同的值。

例2:假设广告{对销售量}t x {}t y 的动态影响能够用下列模型表示:
210.25.0−−++=t t t t x x x y
这里,记忆函数为{}
1,0.2,5.0 若在时刻3、5、6、9分别做了1、2、1、1个单位的广告,则{如下所示:
}t x
则{对各时间的广告的响应为 }t y 1 2 3
4
5
6 7 8 9 10 11 12 13 3 0.5 2.0 1.0 5
1.0 4.0
2.0 6 0.5 2.0 1.0
9
0.5 2.0 1.0 总 0.0 0.0 0.5 2.0 2.0
4.5
4.0
1.0
0.5
2.0 1.0
总的响应用图形表示为:
非常清楚,(2.1)式所示的线性动态模型的输出序列{}t y 的行为依赖于: * 输入序列{}t x
* 记忆函数),,,,(10L L j ψψψ
2.2 时间序列的记忆模式
对于平稳的时间序列,从原理上可以用如下记忆模式表示:
L L ++++=−−−j t j t t t a a a Z ψψη11
(2.2) 其中是独立同分布的白噪声序列,是不可观测的序列,是外界随机的冲击;是可观测的序列,}{t a }{t Z η是它的均衡水平。

例:假设表示某户人家在第个月的花费,正常水平为t Z t η。

在第个月,家庭受到颇大的正的振动的冲击(例如说两个婚礼邀请和一些牙科账单),导致他们的花费实质性的增长,为了弥补超支,在接下来的几个月家庭的花费会低于正常水平t t a η。

对于这个家庭来说,记忆系数),,,,(10L L j ψψψ将是负的,且逐渐接近于0。

虽然线性动态关系(2.2)式很普遍,且能表示许多真实的状况,但当有很多非0的记忆系数j ψ时,实际处理起来就变得很困难。

这是因为数据量经常是有限的,随着参数的增加,估价问题就变得越来越突出。

解决的一个方法就是按照少数几个基本参数来表示记忆系数j ψ。

例如:j j φψ=,模型(2.2)就变成
(2.2a) L L ++++=−−−j t j t t t a a a Z φφη1在这种情况,虽然记忆能够持续相当长的周期,但所有系数是一个参数的函数。

正是基于吝啬考虑,20世纪20年代,Yule,然后是Slutsky,发明了对平稳序列非常有用的吝啬模型。

* 滑动平均模型MA(Moving Average Models) * 自回归模型AR(Autoregressive Models)
2.3 MA(滑动平均)模型的记忆特征
MA(1)
1−−=−t t t a a Z θη (2.3)
按照普通的线性动态模型,则有θψ−=1,0=j ψ,。

因此随机震动的记忆是短的,冲击系统以后只持续一个周期。

1>j 通过改变(2.3)的下标t 为1+t ,我们可得到
t t t a a Z θη−=−++11 (2.4)
从(2.3)和(2.4),我们可知,当振动在时刻t 冲击系统的时刻,它以总量影响现在的观察值和以总量t a t a t Z t a θ影响接下来的观测,但对其它更远的观察就不会产生影响了。

记忆函数简单地是1+t Z ),1(θ−.
很容易证明对任意θ,MA(1)模型是平稳的,但为了可逆性,我们限制1≤θ。

MA(2)
2211−−−−=−t t t t a a a Z θθη (2.5)
它的记忆持续2个周期,它的记忆函数是),,1(21θθ−−
更一般的是阶数为的滑动平均模型,MA(q)
q q t q t t t a a a Z −−−−−=−θθηL 11 (2.6)
这里它的记忆持续期,它的记忆函数是q ),,,1(1q θθ−−L
2.4 AR(自回归)模型的记忆特性
AR(1)模型的记忆函数
在实际中,如果阶数很高,我们就有许多参数需要估计。

在某些情况下,
q
j θ用彼此相关的函数表示能够使长记忆模型简化。

例如,在(2.6)中假设记忆系数是指数递减的,即,则模型变成:
j j φθ=− (2.7) q t q t t t a a a Z −−+++=−φφηL 1若1<φ,则随着q 的增大,记忆将逐渐消失。

现在这一模型能够用下面的不同形式表示。

如前一样,记η−=t t Z z ,对于足够大的q,有: L L ++++=−−j t j t t t a a a z φφ1 )(1211L L ++++=−−−−−j t j t t t a a a z φφφφ两式两边相减,可以得到:
t t t a z z =−−1φ (2.8) 若把η−=t t Z z 代入上式,则模型(2.8)可写成:
t t t a Z C Z ++=−1φ
其中ηφ)1(−=C ,这就是线性回归模型,这一模型叫一阶自回归模型,记为AR(1)。

这是因为,我们可以认为对它自己的过去值的回归。

参数t Z 1−t Z φ叫自回归系数。

AR(1)模型它有指数衰减的记忆系数
),,,1(32L φφφ 所以,自回归模型和一般的滑动平均模型之间没有本质的区别;但是低阶的MA 模型和低阶的AR 模型间就有重要的区别,对低阶的MA 模型,记忆系数持续几期以后就截尾了,但对低阶的AR 模型,它是逐渐递减的。

AR(2)模型的记忆函数
t t t t a z z z =−−−−2211φφ,其中η−=t t Z z
或t t t t a C Z Z Z +=−−−−2211φφ,其中ηφφ)1(21−−=C (2.10)
这种情况下,是与它的滞后两期的值和作回归。

t Z 1−t Z 2−t Z
根据(2.10)式,我们也可以用(2.2)所示的线性记忆系统来表示AR(2),其中j
ψ将是1φ和2φ的函数,为了明白其中原因,从(2.10)式,我们有:
t t t t a z z z ++=−−2211φφ 132211−−−−++=t t t t a z z z φφ
用二式的代替一式的右边的,我们有:
1−t z 1−t z (2.13) t t t t t a a z z z ++++=−−−11321222
1)(φφφφφ由于不会对和产生影响,那么就有1−t a 2−t z 3−t z φψ=1。

现在242312−−−−++=t t t t a z z z φφ,我们可以用同样的方式删除(2.13)式右边的,且发现2−t z )(22
12φφψ+=,等等。

虽然这个过程可以持续,但是表达式将越来越复杂。

AR(p)模型的长记忆特性
更一般的情形是阶为p 的自回归模型AR(p):
t p t p t t a z z z =−−−−−φφL 11,其中η−=t t Z z
或t p t p t t a C Z Z Z +=−−−−−φφL 11,其中ηφφ)1(1p C −−−=L (2.14) 在这中情况下,是与它的滞后p 期的值,,…, 作回归。

同样,我们能够用(2.2)式的线性记忆形式来表示这一模型。

t Z 1−t Z 2−t Z p t Z −
2.5. ARMA(自回归滑动平均)模型的记忆特性
ARMA(p,q)模型结合了AR(p)和MA(q)模型的特性,它的形式如下:
q t q t t p t p t t a a a C Z Z Z −−−−−−−+=−−−θθφφL L 1111
(2.15) 其中ηφφ)1(1p C −−−=L 。

下面,我们考虑简单的特殊情形ARMA(1,1)模型
11−−−+=−t t t t a a C Z Z θφ (2.16) 我们同样可以把它写成形如(2.2)式所示的线性记忆系统,为了弄明白这一点,按η−=t t Z z ,我们有:
11−−−=−t t t t a a z z θφor t t t t a a z z +−=−−11θφ 因此,有:
t t t t a a z z +−=−−11θφ 1221−−−−+−=t t t t a a z z θφ
用二式的代替一式的右边的,我们有: 1−t z 1−t z t t t t t t a a a a z z +−+−=−−−−1122][θθφφ
t t t t a a a z +−+−=−−−1222)(θφφθφ因此)(1θφψ−=。

按这种方式处理,我们最后得到:
(2.17) L L +−++−+−+=−−−−j t j t t t t a a a a z 121)()()(φθφφθφθφ对于0=θ,这个记忆形式变成AR(1)模型形式,因此ARMA(1,1)模型提供了比AR(1)模型更广泛的一类模型。

第三节 基本分析工具
差分运算 延迟算子 线性差分方程
3.1 差分运算
一阶差分
1−−=∇t t t x x x
阶差分
p
111−−−∇−∇=∇t p t p t p x x x
步差分
k k t t k x x −−=∇
3.2 延迟算子
延迟算子类似于一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻,记B 为延迟算子,有
1,≥∀=−p x B x t p p t
延迟算子的性质
10=B
为任意常数c x c x B c x c B t t t ,)()(1−⋅=⋅=⋅ 11)(−−±=±t t t t y x y x B
n t t n x x B −=
i
n
i i n n n
B C B ∑=−=−0)1()1(,其中)!
(!!
i n i n C i n
−=
用延迟算子表示差分运算 阶差分
p i t p
i i p p t p
t p
x C x B x −=∑−=−=∇0
)1()1(
步差分
k t k k t t k x B x x )1(−=−=∇−
3.3 线性差分方程
线性差分方程
)(2211t h z a z a z a z p t p t t t =++++−−−L
齐次线性差分方程
02211=++++−−−p t p t t t z a z a z a z L
齐次线性差分方程的解
特征方程对应的根称为特征根,记作:
02211=++++−−p p p p a a a L λλλp λλλ,,,21L ,那么齐次线性差分方程对应的同解为:
\
不相等实数根场合
t p p t t
t c c c z λλλ+++=L 2211
\ 有相等实根场合
t p p t d d t d d t c c t c t c c z λλλ++++++=++−L L 111121)(
\ 复根场合
t p p t it it t t c c e c e c r z λλϖϖ++++=−L 3321)(
非齐次线性差分方程的解 非齐次线性差分方程的特解
使得非齐次线性差分方程成立的任意一个解t z ′′
)(2211t h z a z a z a z p t p t t t =′′++′′+′′+′′−−−L
非齐次线性差分方程的通解是齐次线性差分方程的通解和非齐次线性差分方程的特解之和
t z t t t z z z ′′+′=
第四节 ARMA 模型的自相关函数
3.1 自协方差、自相关函数、样本自相关函数
定义:自协方差
))((),cov(ηηγ−−==−−k t t k t t k Z Z E Z Z 其中,η是平稳序列的均值。

}{t Z 定义:自相关系数 )
)(())((),cov(),cov(0ηηηηγγρ−−−−===
−−t t k t t t t k t t k k Z Z E Z Z E Z Z Z Z k ρ叫做k 步的自相关系数,自相关系数的集合},,,,{21L L k ρρρ叫做自相关函数。

定义:样本自相关函数
设是观察到的时间序列数据,对固定的k ,记
},,,{21T Z Z Z L ∑∑=−=+−−−=T
t t
k
T t k t t
k Z
Z Z Z Z
1
2
1
()
)((ˆρ
则k ρ
ˆ叫做滞后步的样本自相关系数,样本自相关系数的集合k },ˆ,,ˆ,ˆ{21L L k ρρρ叫做样本自相关函数。

例:序列为13,8,15,4,4,12,11,7,14,12
2
2221)1012()1014()108()1013()
1012()1014()1015()108()108()1013(ˆ−+−++−+−−×−++−×−+−×−=L L ρ
188.0144
27
−=−=
22222)1012()1014()108()1013()
1012()107()1014()108()1015()1013(ˆ−+−++−+−−×−++−×−+−×−=L L ρ
201.0144
29
−=−=
自相关系数的性质
规范性
对称性 非负定性
3.2 MA(滑动平均)模型的自相关函数特征
MA 模型的定义
具有如下结构的模型称为q 阶滑动平均模型,简记为MA(q)
q t q t t t a a a Z −−−−−=−θθηL 11
0≠q θ
, , 0)(=t a E 2
)(a t a Var σ=)(0)(t s a a E s t ≠=
特别当0=η时,称为中心化MA(q)模型
引进延迟算子,中心化MA(q)模型又可以简记为: t q t a B z )(Θ=
其中,为移动平均系数多项式 )1()(221q q q B B B B θθθ−−−−=ΘL MA 模型的统计性质 常数均值
ηθθθη=−−−−+=−−−)
(q t q t t t t a a a a E EZ L 2211
常数方差
2221
2211)1()
()(a
q
q t q t t t t a a a a Var Z Var σ
θθθθθμ+++=−−−−+=−−−L L
自协方差函数q 阶截尾
⎪⎪

⎪⎪⎨⎧>≤≤+−=+++=∑−=+q k q k k a
k q i i k i k a q k ,01 ,)(0 ,)1(2
12
221σθθθσθθγL
自相关系数q 阶截尾
⎪⎪⎪⎩
⎪⎪⎪⎨⎧>≤≤++++−==∑−=+q k q k k q
k
q i i
k i k k ,01 ,10 ,12
211θθθθθρL MA(1)模型的自相关函数
⎪⎪⎩⎪⎪⎨⎧≥=+−==2
, 01, 10, 1211k k k k θθ
ρ
MA(2)模型的自相关函数

⎪⎪⎩⎪⎪⎪⎨
⎧≥=++−=+++−==3
, 02, 11, 10, 1222
1222
21211k k k k k θθθθθθθθρ 例:考察如下MA 模型的相关性质
2
1211
116
25
45)4(2516
54)3(5.0)2(2)1(−−−−−−+−=+−=−=−=t t t t t t t t t t t t t t x x x x εεεεεεεεεε
MA 模型的自相关系数截尾
12)1(−−=t t t x εε 15.0)2(−−=t t t x εε
MA 模型的可逆性
MA 模型自相关系数的不唯一性
下例中不同的MA 模型具有完全相同的自相关系数
2
1211
11625
45)4(251654)3(5.0)2(2)1(−−−−−−+−=↔+−=−=↔−=t t t t t t t t t t t t t t x x x x εεεεεεεεεε
可逆的定义
若一个MA 模型能够表示称为收敛的AR 模型形式,那么该MA 模型称为可逆MA 模型。

可逆概念的重要性:一个自相关系数列唯一对应一个可逆MA 模型。

MA 模型的可逆条件
MA(q)模型的特征多项式特征根都在单位圆内:0)()(2211=−−−−=Θ−−q q q q q x x x x θθθL 1<i λ
等价条件是移动平滑系数多项式的根都在单位圆外:
0)1()(221=−−−−=Θq q q B B B B θθθL 11
>i
λ
3.3 AR(自回归)模型的自相关函数特性
AR 模型的定义
具有如下结构的模型称为p 阶自回归模型,简记为AR(p)
⎪⎪⎩⎪⎪
⎨⎧<∀=≠===≠+=+++−−−−t s a EZ t s a a E a Var a E a C Z Z Z Z t
s s t a t t p t p t p t t t ,0,0)(,)(0)(0
2
2211σφφφφ,L 特别当0=C 时,称为中心化AR(p)模型
AR(p)序列中心化变换 称为的中心化序列 ,令 t z t Z p
C
φφη−−−=
L 11
η−=t t Z z
引进延迟算子,中心化AR(p)模型又可以简记为: t t p a z B =Φ)(
其中,为自回归系数多项式 )1()(221p q p B B B B φφφ−−−−=ΦL
AR 模型的平稳条件
AR(p)模型的特征多项式特征根都在单位圆内:0)()(2211=−−−−=Φ−−p p p p p x x x x φφφL 1<i λ
等价条件是移动平滑系数多项式的根
都在单位圆外:
0)1()(221=−−−−=Φp p p B B B B φφφL 11
>i
λ
例:考察如下四个模型的平稳性
(1) t t t x x ε=−−18.0 (2) t t t x x ε=+−11.1
(3) t t t t x x x ε=+−−−215.0 (4) t t t t x x x ε=−−−−215.0
解:
(1)8.01=λ (2) Green 函数定义 AR 模型的传递形式
j
t j j j p i j t j i i p i j t
j i i p i t i i
t t a G a k a B k B k B a z −∞
=∞==−=∞
==∑∑∑∑∑∑∧==−=Φ=0
01
10
1)(1)(λλελ
8.01
=λ其中系数 称为Green 函数(实际就是我们讲的记忆函数)。

L L ,,,,21j G G G
平稳AR 模型的自相关函数 AR(1)
我们首先考虑平稳的AR(1)模型t t t a z z =−−1φ的ACF。

把模型写成记忆函数形式,我们有:
L L +++++=−−−j t j t t t t a a a a z φφφ221 L L +++++=−−−−−−132211j t j t t t t a a a a z φφφ
L L +++++=−−−−−−j t j t t t t a a a a z 242322φφφ这表明和是相关的,从第一个表达式,我们有的方差为:
t z k t z −),2,1(L =k t z 2
2
4
2
2021)1(φσφφσγσ−=+++==a
a
z
L
为了求k ρ,我们采取两边乘再求期望,即 k t z − t t t a z z =−−1φ
t k t t t k t a Ez z z Ez −−−=−)(1φ
1=k 时,001=−φγγ 2=k 时,012=−φγγ 任意时,k 01=−−k k φγγ 所以有:
0γφγk k =所以: ,k k φρ=),2,1(L =k
我们可以看出,AR(1)模型的自相关系数呈指数形式衰减。

AR(2)
下面我们来推导AR(2)模型的自相关函数。

t t t t a z z z =−−−−2211φφ
两边乘再求期望,有:
k t z − t k t t t t k t a z z z z Ez −−−−=−−)(2211φφ
时,
0=k 2
22110a σγφγφγ=−−1=k 时, 012011=−−γφγφγ 2=k 时, 002112=−−γφγφγ 2>k 时,02211=−−−−k k k γφγφγ
由此,我们有:
2111φφρ−=,2
21221φφφρ−+=
2211−−+=k k k ρφρφρ
因此,根据差分方程的解,我们可以得到:
k k k A A 2211λλρ+=
其中和是两个常数,1A 2A 1λ和2λ是模型的特征方程的两个特征根。

它们的模都小于1。

当1λ和2λ为实数时,k ρ是两个指数函数的组合,当1λ和2λ为复数时,k ρ呈衰减的正弦波。

所有情况,k ρ都是拖尾到0。

3.4. ARMA(自回归滑动平均)模型的自相关函数特征。

ARMA 模型的定义
具有如下结构的模型称为自回归移动平均模型,简记为
⎪⎪⎩⎪⎪
⎨⎧<∀=≠===≠≠−−−+=−−−−−−−t s a EZ t s a a E a Var a E a a a C Z Z Z t
s s t a t t q p q t q t t p t p t t ,0,0)(,)(0)(0
02
1111σθφθθφφ,,L L 特别当 时,称为中心化ARMA(p,q)模型 0=C 引进延迟算子,中心化ARMA(p,q)模型又可以简记为 引进延迟算子,中心化AR(p)模型又可以简记为: t q t p a B z B )()(Θ=Φ
其中,p 阶自回归系数多项式为:, )1()(221p q p B B B B φφφ−−−−=ΦL q 阶移动平均系数多项式为:
)1()(221q q q B B B B θθθ−−−−=ΘL
平稳条件与可逆条件
ARMA(p,q)模型的平稳条件:P
阶自回归系数多项式
的根都在单位圆外;即ARMA(p,q)模型的平稳性完全由其自回归部分的平稳性决定
)1()(221p q p B B B B φφφ−−−−=ΦL
ARMA(p,q)模型的可逆条件:q 阶移动平均系数多项式
的根都在单位圆外,即ARMA(p,q)模型的可逆性完全由其移动平均部分的可逆性决定。

)1()(221q q q B B B B θθθ−−−−=ΘL
ARMA(1,1)的自相关函数
11−−−=−t t t t a a z z θφ
11−−−−−−−+=t k t t k t t k t t k t a Ez a Ez z z E z Ez θφ 11−−−−−+=t k t t k t k k a Ez a Ez θφγγ
当时,0=k 110−−+=t t t t a Ez a Ez θφγγ 而
2a
t t a Ez σ=
2
211111)()()()(a t t t t t t t a E a a E a z E a Ez σθφθφ−=−+=−−−−−∴ ①
2210)(a a σθφθσφγγ−−+=当时,,并将其代入①有:
1=k 201a θσφγγ−= 222020)(a a a σθφθσφθσγφγ−−+−= 即: 22
20121a
σφ
φθ
θγ−−+=
从而:
2
2
2011)1)((a a σφ
φθθφθσφγγ−−−=
−= 2≥k 时,1−=k k φγγ
∴ ⎪⎩⎪⎨⎧≥=−+−−=−2
,21))(1(1121k k k ρφρφθθθφφθρ
这样,我们可以看出它的自相关函数也是呈指数形式衰减的。

5. 利用样本自相关函数尝试识别模型
利用AR、MA、ARMA 模型自相关函数的特征,即MA 模型的自相关函数的截尾性,AR 和ARMA 模型自相关函数的拖尾性对模型进行识别。

第五节 平稳ARMA 模型的偏自相关函数
5.1 偏自相关函数 定义:偏自相关函数
t Z 和的偏自相关是剔除变量的影响之后的相关程度,即
k t Z +121,,,−+++k t t t Z Z Z L ),,,,cov(121−++++k t t t k t t Z Z Z Z Z L
如果有
k t t kk k t k k t k k t e z z z z +−+−++++++=φφφL 2211 (2.3) 其中:η−=t t Z z ,那么kk φ就叫做滞后步的偏自相关系数。

k 若(2.3)式两边同乘上后再取期望,就有:
j k t z −+ k j kk j k j k j −−−+++=γφγφγφγL 2211 (2.4) (2.3)式两边同除上0γ后,就有:
k j kk j k j k j −−−+++=ρφρφρφρL 2211 这样就有:
⎪⎪
⎩⎪⎪⎨
⎧+++=+++=+++=−−−−0
22112
021********ρφρφρφρρφρφρφρρφρφρφρkk k k k k k k kk k k k kk k k L M L L 这样,利用线性代数里的Cramer 法则,就可以求出
21
1
01
102
120
1
110
ρρρρρρρρρρρρρρρρρρφL
M
M
M
M
L L L M M M
M
L L −−−−−=
k k k k k
k k kk (2.5)
偏自相关系数的集合},,{2211L φφ叫做偏自相关函数。

5.2 AR 模型偏自相关函数 对于阶的AR 模型,
p t p t p t t a z z z =−−−−−φφL 11 有
(2.6)
⎩⎨⎧>==p k p
k p kk ,0,φφ 5.3 样本偏自相关函数
有很多的方法可以估计样本偏自相关系数kk φ
方法一:先估计样本自相关函数},ˆ,,ˆ,ˆ{21L L k ρρρ,再利用(2.5)式计算; kk φˆ方法二:运用线性最下二乘法,用递增的AR 模型来拟合数据,对于拟合的AR(p)
模型,我们有。

p
pp φφ=ˆ 例:拟合t t t a Z C Z ++=−11φ,1φ的估计就是1阶样本偏自相关系数; 11
ˆφ
拟合t t t t a Z Z C Z +++=−−2211φφ,2φ的估计就是2阶样本偏自相关系数。

22ˆφ 5.4. 用样本偏自相关函数识别模型
对于AR(p)模型,当时,对足够大的n ,有
p k >n Var kk 1)ˆ(≈φ,n
d s kk 1)ˆ.(.≈φ 我们可以利用它来判断kk φ是否等于0,并利用AR 模型偏自相关函数的截尾性来识别AR 模型。

总结:ARMA 模型相关性特征 模型 自相关系数 偏自相关系数 AR(P) 拖尾 P 阶截尾 MA(q) q 阶截尾 拖尾 ARMA(p,q) 拖尾
拖尾
例6.1美国科罗拉多州某一加油站连续57天的OVERSHORT 序列
序列自相关图
序列偏自相关图
拟合模型识别
自相关图显示除了延迟1阶的自相关系数在2倍标准差范围之外,其它阶数的自相关系数都在2倍标准差范围内波动。

根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。

同时,可以认为该序列自相关系数1阶截尾偏自相关系数显示出典型非截尾的性质。

综合该序列自相关系数和偏自相关系数的性质,为拟合模型定阶为MA(1)
第6节 模型的估计、检验、优选与预测 6.1 估计
最小二乘估计,最大自然估计,条件最小二乘估计,无条件最小二乘估计等。

6.2 诊断检验
1 白噪声序列简介 白噪声序列的定义
白噪声序列也称为纯随机序列,它满足如下两条性质:
T
s t s
t s
t s t T
t EX t ∈∀⎩⎨⎧≠==∈∀=,,,0,),()2(,)1(2σγμ
例:标准正态白噪声序列时序图
白噪声序列的性质
纯随机性:0=k ρ,各序列值之间没有任何相关关系,即为 “没有记忆”
的序列。

方差齐性:,根据马尔可夫定理,只有方差齐性假定成立时,用
最小二乘法得到的未知参数估计值才是准确的、有效的。

2)(σ=t Z D
2. 模型的显著性检验 目的
\ 检验模型的有效性(对信息的提取是否充分)
检验对象
\ 残差序列
判定原则
\ 一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列
\ 反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效
假设条件
原假设:残差序列为白噪声序列
0120,1m H m ρρρ====∀≥L :
备择假设:残差序列为非白噪声序列
m k m H k ≤≥∀≠,:至少存在某个1,01ρ 检验统计量
利用拟合的模型计算出的残差序列对模型进行检验,利用残差序列的样本自相关函数进行检验,利用Box—Ljung 的Q 统计量,即
}ˆ{t a
}ˆ{t a )(~)ˆ(ˆ)1(21
2q p m k
n a n n Q m
k t k −−−+=∑
=χρ
进行检验。

例:检验1950年——1998年北京市城乡居民定期储蓄比例序列拟合模型的显著性,残差白噪声序列检验结果为:
延迟阶数
LB 统计量
P 值 检验结论 6 5.83 0.322912 10.28 0.505018 11.38
0.8361
拟合模型显著有效
3. 参数的显著性检验 目的
\ 检验每一个未知参数是否显著非零。

删除不显著参数使模型结构最精简
假设条件
m j H H j j ≤≤∀≠↔
=10
:0
:10ββ
检验统计量
)(~)
~(ˆm n t Q a m
n T jj j
j −−−=βββ
6.3 模型的优化 问题提出
当一个拟合模型通过了检验,说明在一定的置信水平下,该模型能有效地拟合
观察值序列的波动,但这种有效模型并不是唯一的。

优化的目的
选择相对最优模型 1)AIC 准则,即最小化:
N n n n AIC a /2)(ˆln )(2+=σ其中是参数的个数,是数据的个数。

n N 2)BIC 准则,即最小化:
N N
n
n n BIC a ln )(ˆln )(2+=σ
其中是参数的个数,是数据的个数。

n N 6.4 预测
任何模型从形式上都可以写成: AR 形式
t t t t a Z Z c Z ++++=−−L 2211ππ
和MA 形式 L ++++=−−2211t t t t
a a a c Z ψψ
以ARIMA(1,0,0)为例
t t t
a Z c Z ++=−1φ
我们记在时刻T 对的向前步的预测为。

l T Z +l )(ˆl Z T
则,由于是一个均值为0的随机冲击,因此最好的预测就是简单的0了,这就得出向前1步的预测为:
1+T a T
T Z c Z φ+=)1(ˆ 由于
212+++++=T T T a Z c Z φ 在时刻T ,和都是未知的,最好的预测就是:
1+T Z 2+T a )1(ˆ)2(ˆT
T Z c Z φ+=按这种方式处理,我们有
)1(ˆ)(ˆ−+=l Z c l Z T
T φ下面,我们来考虑在时刻T 作预测时所引起的误差,我们记
)(ˆ)(l Z Z l e T
l T T −=+对,我们有:
1=l t T T a Z c Z ++=+φ1
T
T Z c Z φ+=)1(ˆ所以
1)1(+=T T a e 对,我们有:
2=l 212+++++=T T T a Z c Z φ )1(ˆ
)2(ˆT T Z c Z φ+=所以 212)1()
2(++++=+=T T T T T a a a e e φφ 同理,我们有 l T T T a e l e ++−=)11()

11
1+−−+++++=T l l T l T a a a φφL 思考
1) 考虑AR(2)模型
t t t y a a y ε++=−220
其中12<a 。

求,,,,,t t y E 2−t t y E 1−2+t t y E ),(1−t t y y Cov ),(2−t t y y Cov 11φ,22φ 2) 考虑2阶方程
t t t t y y a y ε+−+=−−210125.075.0
a. 找出齐次方程,讨论脉冲响应函数的形状;
b. 找出保障序列{}t y 平稳的初始条件; C. 给定b 中的条件,推导{的自相关函数。

}t y。

相关文档
最新文档