时间序列分析教学提纲

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.1时间序列定义:

时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列.

构成要素:现象所属的时间,反映现象发展水平的指标数值.要素一:时间t;要素二:指标数值。

1.2时间序列的成分:

一个时间序列中往往由几种成分组成,通常假定是四种独立的成分——趋势T、循环C、季节S和不规则I。

T 趋势通常是长期因素影响的结果,如人口总量的变化、方法的变化等。

C任何时间间隔超过一年的,环绕趋势线的上、下波动,都可归结为时间序列的循环成分。S许多时间序列往往显示出在一年内有规则的运动,这通常由季节因素引起,因此称为季节成分。目前,可以称之为“季节性的周期”,年或者季节或者月份。

I时间序列的不规则成分是剩余的因素,它用来说明在分离了趋势、循环和季节成分后,时间序列值的偏差。不规则成分是由那些影响时间序列的短期的、不可预期的和不重复出现的因素引起的。它是随机的、无法预测的。

四个组成部分与观测值的关系可以用乘法模型或者加法模型或者综合。

1.3预测方法的选择与评估

方法P216

三种预测方法:移动平均法、加权移动平均法和指数平滑法。因为每一种方法的都是要“消除”由时间序列的不规则成分所引起的随机波动,所以它们被称为平滑方法。平滑方法对稳定的时间序列——即没有明显的趋势、循环和季节影响的时间序列——是合适的,这时平滑方法很适应时间序列的水平变化。但当有明显的趋势、循环和季节变差时,平滑方法将不能很好地起作用。

移动平均法使用时间序列中最近几个时期数据值的平均数作为下一个时期的预测值。移动平均数的计算公式如下:

指数平滑法模型:

式中Ft+1——t+1期时间序列的预测值;

Yt——t期时间序列的实际值;

Ft——t期时间序列的预测值;

α——平滑常数(0≤α≤1)。

均方误差是常用的(MSE)

标准误差定义为各测量值误差的平方和的平均值的平方根。

设n个测量值的误差为ε1、ε2……εn,则这组测量值的标准误差σ等于:

数理统计中均方误差是指参数估计值与参数真值之差平方的期望值,记为MSE。MSE是衡量“平均误差”的一种较方便的方法,MSE可以评价数据的变化程度,MSE的值越小,说明预测模型描述实验数据具有更好的精确度。与此相对应的,还有均方根误差RMSE、平均绝对百分误差等等。

时间序列平稳性的定义

假定某个时间序列由某一随机过程(stochastic process)生成,即假定时间序列{Xt}(t=1, 2, …)的每一个数值都是从一个概率分布中随机得到的。如果经由该随机过程所生成的时间序列满足下列条件:

均值E(Xt)=m是与时间t 无关的常数;

方差Var(Xt)=s^2是与时间t 无关的常数;

协方差Cov(Xt,Xt+k)=gk 是只与时期间隔k有关,与时间t 无关的常数;

则称经由该随机过程而生成的时间序列是(弱)平稳的(stationary)。该随机过程便是一个平稳的随机过程(stationary stochastic process)。

例如,白噪声(white noise)过程就是平稳的:

Xt=ut ,ut~IIN(0,s^2)

因为它的均值为常数零;方差为常数s^2;所有时间间隔的协方差均为零。

但随机游走(random walk)过程是非平稳的:

Xt=Xt-1+ut ,ut~IIN(0,s^2),

因为尽管其均值为常数E(Xt)=E(Xt-1),但其方差Var(Xt)=ts^2非常数。

不过,若令DXt=Xt-Xt-1,则随机游走过程的一阶差分(first difference)是平稳的:DXt=Xt-Xt-1=ut ,ut~IIN(0,s^2)

一般地,在经济系统中,一个非平稳的时间序列通常均可通过差分变换的方法转换成为平稳序列。

指数平滑法有几种不同形式:一次指数平滑法针对没有趋势和季节性的序列,二次指数平滑法针对有趋势但没有季节性的序列。术语“Holt-Winters法”有时特指三次指数平滑法。

所有的指数平滑法都要更新上一时间步长的计算结果,并使用当前时间步长的数据中包含的新信息。它们通过“混合”新信息和旧信息来实现,而相关的新旧信息的权重由一个可调整的拌和参数来控制。各种方法的不同之处在于它们跟踪的量的个数和对应的拌和参数的个数。一次指数平滑法的递推关系特别简单:

其中,是时间步长i上经过平滑后的值,是这个时间步长上的实际(未平滑的)数据。你可以看到是怎么由原始数据和上一时间步长的平滑值混合而成的。拌和参数可以是0和1之间的任意值,它控制着新旧信息之间的平衡:当接近1时,我们就只保留当前数据点(即完全没有对序列进行平滑);当接近0时,我们就只保留前面的平滑值(也就是说整个曲线都是平的)。

为何这个方法被称为“指数”平滑法?要找出答案,展开它的递推关系式即可知道:

从这里可以看出,在指数平滑法中,所有先前的观测值都对当前平滑值产生了影响,但它们所起的作用随着参数的幂的增大而逐渐减小。那些相对较早的观测值所起的作用相对较小,这也就是指数变动形态所表现出来的特性。从某种程度上来说,指数平滑法就像是拥有

无限记忆且权值呈指数级递减的移动平均法。(同时也要注意到所有权值的和,

等于1,因为当q<1 时,几何序列。参见附录B的几何序列方面的信息。)

一次指数平滑所得的计算结果可以在数据集范围之外进行扩展,因此也就可以用来进行预测。预测也非常简单:

其中,是最后一个已经算出来的值。也就是说,一次指数平滑法得出的预测在任何时候都是一条直线。

刚刚描述的一次指数平滑法适用于没有总体趋势的时间序列。如果用来处理有总体趋势的序列,平滑值将往往滞后于原始数据,除非的值接近1,但这样一来就会造成不够平滑。

二次指数平滑法保留了趋势的详细信息,从而改正了这个缺点。换句话说,我们保留并更新两个量的状态:平滑后的信号和平滑后的趋势。它有两个等式和两个拌合参数:

我们先看看第二个等式。这个等式描述了平滑后的趋势。当前趋势的未平滑“值”是当前平滑值和上一个平滑值的差;也就是说,当前趋势告诉我们在上一个时间步长里平滑信号改变

相关文档
最新文档