第五章 时间序列的模型识别
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章时间序列的模型识别
前面四章我们讨论了时间序列的平稳性问题、可逆性问题,关于线性平稳时间序列模型,引入了自相关系数和偏自相关系数,由此得到ARMA(p, q)统计特性。从本章开始,我们将运用数据开始进行时间序列的建模工作,其工作流程如下:
图5.1 建立时间序列模型流程图
在ARMA(p,q)的建模过程中,对于阶数(p,q)的确定,是建模中比较重要的步骤,也是比较困难的。需要说明的是,模型的识别和估计过程必然会交叉,所以,我们可以先估计一个比我们希望找到的阶数更高的模型,然后决定哪些方面可能被简化。在这里我们使用估计过程去完成一部分模型识别,但是这样得到的模型识别必然是不精确的,而且在模型识别阶段对于有关问题没有精确的公式可以利用,初步识别可以我们提供有关模型类型的试探性的考虑。
对于线性平稳时间序列模型来说,模型的识别问题就是确定ARMA(p,q)过程的阶数,从而判定模型的具体类别,为我们下一步进行模型的参数估计做准备。所采用的基本方法主要是依据样本的自相关系数(ACF)和偏自相关系数(PACF)初步判定其阶数,如果利用这种方法无法明确判定模型的类别,就需要借助诸如AIC、BIC 等信息准则。我们分别给出几种定阶方法,它们分别是(1)利用时间序列的相关特性,这是识别模型的基本理论依据。如果样本的自相关系数(ACF)在滞后q+1阶时突然截断,即在q处截尾,那么我们可以判定该序列为MA(q)序列。同样的道理,如果样本的偏自相关系数(PACF)在p处截尾,那么我们可以判定该序列为AR(p)序列。如果ACF和PACF 都不截尾,只是按指数衰减为零,则应判定该序列为ARMA(p,q)序列,此时阶次尚需作进一步的判断;(2)利用数理统计方法检验高阶模型新增加的参数是否近似为零,根据模型参数的置信区间是否含零来确定模型阶次,检验模型残差的相关特性等;(3)利用信息准则,确定一个与模型阶数有关
的准则函数,既考虑模型对原始观测值的接近程度,又考虑模型中所含待定参数的个数,最终选取使该函数达到最小值的阶数,常用的该类准则有AIC 、BIC 、FPE 等。实际应用中,往往是几种方法交叉使用,然后选择最为合适的阶数(p,q )作为待建模型的阶数。
§5.1 自相关和偏自相关系数法
在平稳时间序列分析中,最关键的过程就是利用数据去识别和建模,根据第三章讨论的内容,一个比较直观的方法,就是通过观察自相关系数(ACF )和偏自相关系数(PACF )可以对拟合模型有一个初步的识别,这是因为从理论上说,平稳AR 、MA 和ARMA 模型的ACF 和PACF 有如下特性:
模型(序列) AR(p ) MA(q ) ARMA(p,q ) 自相关系数(ACF ) 拖尾 q 阶截尾 拖尾 偏自相关系数(PACF ) p 阶截尾 拖尾 拖尾 但是,在实际中ACF 和PACF 是未知的,对于给定的时间序列观测值12,,
,T x x x ,我们
需要使用样本的自相关系数{}ˆk ρ和偏自相关系数{}
ˆkk
φ对其进行估计。然而由于{}ˆk ρ和{}ˆkk
φ均是随机变量,对于相应的模型不可能具有严格的“截尾性”,只能呈现出在某步之后
围绕零值上、下波动,因此,我们需要借助{}ˆk ρ
和{}ˆkk
φ的“截尾性”来判断{}k ρ和{}kk
φ的截尾性,进而由此可以给出模型的初步识别。首先,我们需要给出样本的自相关系数{}ˆk ρ和偏自相关系数{}
ˆkk
φ的定义。 设平稳时间序列{}t X 的一个样本1,
,T x x 。则样本自协方差系数定义为
()()11ˆ,11
ˆˆ,11
T k
k j j k j k k x x x x k T T k T γγγ-+=-=--≤≤-=≤≤-∑ (5.1)
其中1
1T
j j x x T ==∑为样本均值,则样本自协方差系数{}ˆk γ
是{}t X 的自协方差系数{}k γ的估计。样本自相关系数定义为
0ˆˆˆ,1k k k T ρ
γ=≤- (5.2)
是{}t X 的自相关系数{}k ρ的估计。
作为{}t X 的自协方差系数{}k γ的估计,根据数理统计知识,样本自协方差系数还可以写为
()()1
1ˆ,11ˆˆ,11
T k
k j j k j k k x x x x k T T k k T γγγ-+=-=--≤≤--=≤≤-∑
(5.3)
在上述两种估计中,当样本容量T 很大,而k 的绝对值较小时,上述两种估计值相差不大,其中由(5.1)定义的第一种估计值的绝对值较小。根据前面章节的讨论,因为AR(p ),MA(q )或者ARMA(,p q )模型的自协方差系数{}k γ都是以负指数阶收敛到零,所以在对平稳时间序列的数据拟合AR(p ),MA(q )或者ARMA(,p q )模型时,希望实际计算的样本自
协方差系数{}ˆk γ
能以很快的速度收敛。因此,我们一般选择由(5.1)定义的第一种估计值作为{}k γ的点估计。
根据第三章偏自相关系数的计算,利用样本自相关系数{}ˆk ρ的值,定义样本偏自相关系数{}
ˆkk
φ如下: ˆˆ,1,2,
,ˆk kk D k T
D
φ==
(5.4)
其中
111112121212ˆˆˆˆ1
1
ˆˆˆˆ1
1
ˆˆ,ˆˆˆˆˆ1
k k k
k k k k k D
D ρρ
ρρ
ρ
ρρ
ρρρρ
ρρ
------=
=
关于样本的自相关系数{}ˆk ρ
的统计性质,我们将在下一章给予讨论。 Quenouille 证明,{}
ˆkk
φ也满足Bartlett 公式,即当样本容量T 充分大时, ()ˆ~0,1kk
N T φ (5.5)
这样根据正态分布的性质,我们有
ˆ
68.3%kk
P φ⎧≤=⎨⎩ (5.6) ˆ
95.5%kk
P φ⎧≤=⎨⎩
(5.7) 这样,关于偏自相关系数{}kk φ的截尾性的判断,转化为利用上述性质(5.6)或者(5.7),
可以判断{}
ˆkk
φ的截尾性。具体方法为对于每一个p >0,考查1,1p p φ++,2,2p p φ++,…,,p M p M φ++