第七讲 时间序列分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七讲 时间序列分析
时间序列模型包含丰富的内容,在经济预测中得到广泛的应用。这里我们仅对几类常用的、采用回归分析方法估计参数的线性时间序列模型作一个介绍,为进一步专门学习与应用时间序列分析模型建立一个基础。时间序列分析模型分确定模型和随机模型两大类。
1、 确定性时间序列分析模型
对于一个时间序列
T y y y ,...,21
确定性模型主要有以下几种:
(1) 滑动(移动)平均模型
y ^t = (y t +y t-1+……+y t-s+1)/S
其中S 为某个确定的数。滑动(移动)平均模型能在一定程度上削弱干扰,从而更好地显示序列的趋势性变化。还可以类似构建二次滑动平均模型。
(2) 加权滑动平均模型
y ^tw = (α0y t +α1y t-1+……+αs-1y t-s+1)/S
其中为加权因子,满足(Σαi )/S=1。加权滑动平均模型除了能削弱干扰,显示序列的趋势性变化以外,通过加权因子的选取,使趋势预测更加准确。
(3) 指数平滑模型
y ^t = αy t-1+(1-α)y ^t-1
其中α称为平滑常数,0<α<1,预测值为前期实际值和预测值的加权和。通常以预测的残差平方和最小为选择α的准则。可以类似构建二次或三次指数滑动模型。
2、随机时间序列分析模型
时间序列是基于假定需要观测的序列T y y y ,...,21是由某个随机过程生成的,即假定序列的每一个数值都是从一个概率分布中随机得到的。完全确定时间序列的概率分布函数一般是不可能的。通常情况下可以构造一个简单的时间序列模型,以便解释它的随机性。模型的实用性依赖于模型贴切地体现真实的概率分布以及反映序列的真实随机行为的程度。模型不必与序列的过去实际行为完全一致,因为序列和模型都是随机的,只要模型能够刻划序列的随机特征。
随机时间序列分析模型主要分为三种,自回归模型(AR )、滑动平均模型(MA )和自 回归滑动平均模型(ARMA )。自回归模型(AR )和滑动平均模型(MA )是自回归滑动平均模型(ARMA )的特款。
(1) 自回归模型
若时间序列y t 为它的前期值和随机项的线性函数,即可以表为
y t =φ1y t-1+φ2y t-2+……+φp y t-p +μt
则称该时间序列y t 为p 阶自回归模型。
(2) 滑动平均模型
若时间序列y t 为它的当期随机项和前期随机项的的线性函数,即可以表为
y t =μt -θ1μt-1-θ2μt-2-……-θq μt-q
则称该时间序列y t 为q 阶滑动平均序列。
(3) 自回归滑动平均模型
若时间序列y t 可以表为
y t =φ1y t-1+φ2y t-2+……+φp y t-p +μt -θ1μt-1-θ2μt-2-……-θq μt-q
则称该时间序列y t 为(p,q )阶自回归滑动平均序列。
为了进行模型识别和参数估计,需要对模型给予一些假设:
其一,随机项μt 服从0均值、方差为σμ2的正态分布,且相互独立的白噪声序列。 其二,随机项μt 和y t-1、y t-2、……、y t-p 不相关。
关于这几类模型的研究是时间系列分析的重点,主要包括模型的平稳性、模型的识别和模型的估计。
3、 随机时间序列分析模型的识别
时间序列的自相关函数:对一个随机过程进行完全的描述通常是不可能的(即完全地确定它的概率分布), 而自相关函数是极其有用的,因为它可以为建造模型部分地刻划随机过程,它说明在序列T y 的邻近数据点之间存在多大程度的相关。定义滞后期为k 的自相关系数为()()[]()[]()[]()k
t t y y k t t y k t y t y k t y t k y y Cov y E y E y y E ++++=----=σσμμμμρ,22 对于平稳过程,方程分母中的第t 期的方差等于第t+k 期的方差,因此分母刚好就是随机过程的方差。于是()()
[]2y y k t y t k y y E σμμρ--=+ (1)。
注意到方程的分子是t y 和k t y +的协方差0γγρk k =
。因此,10=ρ对任何随机过程都成立。
假设随机过程是
t t y ε= (2)
。 其中t ε是均值为0的独立同分布随机变量。则从方程(1)很容易得到:10=ρ且对于k >0,00=ρ成立。方程(2)所描述的过程被称为白噪声(white noise ),没有模型能比
0ˆ=+l T y
,任意l >0,更好地预测白噪声。因此,如果对所有的k >0,序列的自相关函数为0或近似为0,则没有必要利用模型来预测该序列。
当然,公式(1)给出的自相关函数是纯理论性的,因为对它所刻划的随机过程,通常只有有限个观测值。因此在实际应用中,需要估计自相关函数,即所谓样本自相关函数
()()()∑∑=-=+---=T t t k
T t k t t k y y
y
y y y 12
1ˆρ 从定义可容易看出,理论自相关函数和估计自相关函数是对称的,即正时间位移的相关系数与负时间位移的相关系数是一样的,所以
k k ρρ-=
因此,在以k 为横坐标、k ρ为纵坐标刻划自相关函数图时,只须刻划k 为正值的情形。
确定样本自相关函数某一数值k ρ
ˆ是否足够接近于0是非常有用的,因为它可用以检验对应的自相关函数k ρ的真实值是否为0的假设。检验所有k>0的自相关函数的数值k ρ都为0的假设也是很有用的(如果检验通过,则随机过程就是白噪声)。幸运的是,简单的统计检验可用来检验上述的假设。
为了检验自相关函数的某个数值k ρ是否为0,可应用Bartlett 的结果。他证明了如果时间序列由白噪声过程生成,则(对所有的k>0)样本自相关系数近似地服从均值为0,标准差为T
1(T 为序列观测值的个数)的正态分布。因此,如果某时间序列由100个数据点构成,则每个自相关系数的标准误差都为0.1。因此,如果某个自相关系数大于0.2,就有95%的把握认为真正的相关系数不为0。
为了检验所有k>0的自相关系数都为0的联合假设,可采用Box 和Pierce 的Q 统计量。Box 和Pierce 证明,统计量
∑==K
k k T Q 12ˆρ
近似地服从自由度为k的2
χ分布。因此,如果计算出的Q 值大于显著性的水平为,比如,5%的临界值,则有95%的把握确信实际自相关系数K t ρρ,...,不全为0。实际上,人们