10.1 SPSS时间序列分析教案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS
SALES
SPSS
时间序列的分解
一个时间序列可能由趋势、季节、循环和随机成分组成,因此: 如果要想对一个时间序列本身进行较深入的研究,要把序列的这 些成分分解出来、或者把它们过虑掉。
如果要进行预测,则最好把模型中的与趋势、季节、循环等成分
有关的参数估计出来。 时间序列的分解,通过计算机统计软件,可以很轻而易举地得到 该序列的趋势、季节和误差成分。 spss分解步骤:分析→预测→季节性分解
k 0
这里的系数为几何级数。因此称之为“几何平滑”比使人不解的 “指数平滑”似乎更有道理。 根据数据,可以得到这些模型参数的估计以及对未来的预测。
◇如果要对比较复杂的纯粹时间序列进行细致的分析,指数平 滑往往是无法满足要求的;而若想对有独立变量的时间序列进 行预测,指数平滑更是无能为力。下面介绍高精度的ARIMA模 型。 SPSS
SPSS
时间序列的图形化观察及预处理
时间序列的图形化及检验目的 通过图形化观察和检验能够把握时间序列的诸 多特征,如时间序列的发展趋势是上升还是下降, 还是没有规律的上下波动;时间序列的变化的周期 性特点;时间序列波动幅度的变化规律;时间序列 中是否存在异常点,时间序列不同时间点上数据的 关系等。
和预测时,就不象对纯粹的满足平稳条件的ARMA模型那么简单了。
一般的ARIMA模型有多个参数,没有季节成分的可以记为ARIMA(p,d,q) ,如果没有必要利用差分来消除趋势或循环成分时,差分阶数d=0,模型为 ARIMA(p,0,q),即ARMA(p, q)。 在 有 已 知 的 固 定 周 期 s 时 , 模 型 多 了 4 个 参 数 , 可 记 为 ARIMA(p,d,q)(P,D,Q)s。(如果是每年的月数据则s=12,其它周期依 此类推,如每月的周数据s=4等) 这里增加的除了周期s已知之外,还有描述季节本身的模型识别问题。其中,
SPSS
SPSS统计软件
时间序列分析
横截面数据时间序列数据 人们对统计数据往往可以根据其特点从两个方面来切入 ,以简化分析过程。 一个是研究所谓横截面(cross section)数据,也就 是对大体上和时间无关的不同对象的观测值组成的数据 另一个称为时间序列(time series),也就是由对象 在不同时间的观测值形成的数据。 前面讨论的模型多是和横截面数据有关。这里将讨论时 间序列的分析。我们将不讨论更加复杂的包含这两方面
SPSS
时间序列的图形化观察工具
· 序列图(Sequence) 一个平稳的时间序列在水平方向平稳发展,在垂直方向
的波动性保持稳定,非平稳性的表现形式多种多样,主要特 征有:趋势性、异方差性、波动性、周期性、季节性、以及 这些特征的交错混杂等。 序列图还可用于对序列异常值的探索,以及体现序列的 “簇集性”,异常值是那些由于外界因素的干扰而导致的与 序列的正常数值范围偏差巨大的数据点。“簇集性”是指数 据在一段时间内具有相似的水平。在不同的水平间跳跃性变
SPSS
ARIMA模型基础:ARMA模型 自回归和移动平均模型也即 ARMA( p,q ) 模型,是 AR (p)模型和MA(q)模型的组合:
yt=φ1yt-1+φ2yt-2+…+φpyt-p + εt-θ1εt-1-θ2εt-2-…-θqεt-q
ARMA(p,0)模型就是AR (p)模型,而ARMA(0,q)模型就是 MA(q)模型。这个一般模型有p+q个参数要估计,看起来 很繁琐,但利用计算机软件则是常规运算,并不复杂。
序列平稳。
上面引进了一些必要的术语和概念。下面就如何识别模型进行说 明。 要想拟合ARIMA模型,必须先把它利用差分变成ARMA(p,q)模型 ,并确定是否平稳,然后确定参数p,q。
SPSS
ARIMA (p,d,q)(P,D,Q)s模型
在对含有季节、趋势和循环等成分的时间序列进行 ARIMA 模型的拟合研究
SPSS
时间序列模型理论基础: 指数平滑
如果不仅满足于分解现有的时间序列,想要对未来进行预测,就 需要建立模型。这里先介绍比较简单的指数平滑(exponential smoothing)。 指数平滑只能用于纯粹时间序列的情况,而不能用于含有独立变 量时间序列的因果关系的研究。 指数平滑的原理为:当利用过去观测值的加权平均来预测未来的 观测值时(这个过程称为平滑),离得越近的观测值要给以更多 的权。 而“指数”意味着:依已有观测值“老”的程度,其权数按指数 速度递减。 以简单的没有趋势和没有季节成分的纯粹时间序列为例,指数平 滑在数学上是一个几何级数。
jenkins模型、博克思-詹金斯法。
ARIMA 方法是时间序列短期预测中一种常用而有效的方法, 它是用变量Yt 自 身的滞后项以及随机误差项来解释该变量, ARIMA 方法能够在对数据模式未知
的情况下找到适合数据所考察的模型, 因而在预测方面得到了广泛应用。它的具
体形式可表达成ARIMA (p , d , q) , 其中p 表示自回归过程阶数; d 表示差 分的阶数; q 表示移动平均过程的阶数。如果时间序列数据是非平稳的, 则需要 对其进行d 阶差分, 使其平稳化, 然后对平稳化后的序列用ARIMA 建模。
SPSS
从下图可以看出。总的趋势是增长的,但增长并不是单调上升的 ;有涨有落。但这种升降不是杂乱无章的,和季节或月份的周期 有关系。当然,除了增长的趋势和季节影响之外,还有些无规律 的随机因素的作用。
Leabharlann Baidu
时间序列的组成部分
120
100
80
60
40
20
D ate
02 20 P 2 SE 20 0 N 01 JA 20 AY 0 M 20 0 P 0 SE 20 0 N 99 JA 19 AY 8 M 19 9 P 8 SE 19 9 N 97 JA 19 AY 6 M 19 9 P 6 SE 19 9 N 95 JA 19 AY 4 M 19 9 P 4 SE 19 9 N 93 JA 19 AY 2 M 19 9 P 2 SE 19 9 N 91 JA 19 AY 0 M 19 9 P 0 SE 19 9 N JA
讨论时间定义的操作步骤。
SPSS的时间定义功能用来将数据编辑窗口中的一个或
多个变量指定为时间序列变量,并给它们赋予相应的时间标
志,具体操作步骤是: (1)选择菜单:数据→定义日期,出现窗口:
SPSS
(2)个案框提供了多种时间形式,可根据数据的实际情况 选择与其匹配的时间格式和参数。
◇至此,完成了SPSS的时间定义操作。SPSS将在当前数据编辑窗口中 自动生成标志时间的变量。同时,在输出窗口中将输出一个简要的日志, 说明时间标志变量及其格式和包含的周期等。
注:spss中ARIMA 建模方法会自动进行差分和平滑处理,但不处理异常值。
SPSS
时间序列模型: SARIMA 模型
在对含有季节、趋势和循环等成分的时间序列进行 ARIMA模型
的拟合研究和预测时,模型需要增加 4 个参数,增加后可记为
ARIMA(p,d,q)(P,D,Q)s。(在有已知的固定周期s时,如果
SPSS
时间序列分析的一般步骤 : 数据的准备阶段 数据的观察及预处理阶段 数据分析和建模阶段 模型的评价阶段 模型的实施阶段(预测)
SPSS
数据准备
SPSS的数据准备包括数据文件的建立、时间定义和数
据期间的指定。其中数据文件的建立与一般SPSS数据文件
的建立方法相同,每一个变量将对应一个时间序列数据,且 不必建立标志时间的变量。具体操作这里不再赘述,仅重点
ARIMA模型基础:AR模型
AR 模型也称自回归模型。假定时间序列用X1, X2, …, Xt表示 ,则一个纯粹的AR (p)模型意味着变量的一个观测值由其以前 的p个观测值的线性组合加上随机误差项zt (该误差是独立无关 的)而得:
yt=φ1yt-1+φ2yt-2+……+φpyt-p+zt
这看上去象自己对自己回归一样,所以称为自回归模型;它牵涉到
P、Q为季节性的自回归和移动平均阶数,D为季节差分的阶数,s为季节周
期。
SPSS
时间序列模型:ARIMA (p,d,q) 模型
ARIMA 模型基本原理:
ARIMA模型理论 基础.doc
ARIMA模型全称为自回归移动平均模型(Autoregressive Integrated
Moving Average Model,简记ARIMA),是由博克思(Box)和詹金斯 (Jenkins)于70年代初提出的一著名时间序列预测方法,所以又称为box-
过去p个观测值(相关的观测值间隔最多为p个).
SPSS
ARIMA模型基础:MA模型 MA 模型也称移动平均模型,一个纯粹的MA (q)模型 意味着变量的一个观测值的误差由目前的和先前的 q个 随机误差的线性的组合而得:
zt=εt-θ1εt-1-θ2εt-2-……-θqεt-q
由于右边系数的和不为1(q 甚至不一定是正数),因此 叫做“移动平均”不如叫做“移动线性组合”更确切。
化,而非平缓性变化。
SPSS
时间序列的图形化观察工具
◇自相关函数图和偏自相关函数图(ACF&PACF) 所谓自相关是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性 (即数据与其前k个数据的相关性),对自相关的测度往往采用自协方差函数和自相关函 数。白噪声序列(平稳序列)的各阶自相关函数和偏自相关函数值在理论上均为0(即数 据与其前面的数据无相关性)。而实际当中序列多少会有一些相关性,但一般会落在置信 区间内,同时没有明显的变化规律。对于平稳的时间序列,理想情形是自相关函数在一定 的条件下服从正态分布,当样本量n很大时,一般在自相关ACF图形中其值介于两条虚线 之间的概率为95%;如果存在明显不在这两条直线之内的情况,说明序列存在 k阶自相关 (适合用ARIMA模型),如果在r处之后,全部落入这个范围,说明序列中的数据与其自 身的前r个数据有相关性,即k=r,序列表现出MA(r)的移动平均特性,pacf类似。 Spss操作:分析→预测→ 自相关 ◇互相关图 对两个互相对应的时间序列进行相关性分析的实用图形工具。互相关图是依据互相关函
SPSS
ARIMA模型基础:差分
差分是什么意思呢?差分可以是每一个观测值减去其前面的一个
观测值,即Xt-Xt-1。这样,
如果时间序列有一个斜率不变的趋势,经过这样的差分之后,该 趋势就会被消除。一般而言,一次差分可以将序列中的线性趋势 去掉,二次差分可以将序列中的抛物线趋势去掉。 对于复杂情况,可能要进行多次差分,才能够使得变换后的时间
是每年的月数据则s=12,其它周期依此类推,如每月的周数据
s=4等)
这里增加的除了周期s已知之外,还有描述季节本身的模型识别 问题。其中,P 、 Q为季节性的自回归和移动平均阶数,D 为季 节差分的阶数,s为季节周期。
SPSS
时间序列模型:带自变量的ARIMA模型
时间序列模型还可增加自 变量来提高预测的准确性 (有的情况下)。但应注 意:使用专家建模器时, 只有在自变量与因变量之 间具有统计显著性关系时 才会包括自变量。如果选 择ARIMA模型,“变量” 选项卡上指定的所有自变 量都包括在该模型中,这 点与使用专家建模器相反 。添加方法如右图所示。
SPSS
时间序列模型理论基础: 指数平滑
这时,如果用 Yt表示在 t时间的平滑后的数据(或预测值),而 用X1, X2, …, Xt表示原始的时间序列。那么指数平滑模型为:
Yt X t (1 )Yt 1, (0 1)
或者,等价地:
Yt (1 ) k X t k
的数据。
SPSS
时间序列和回归 时间序列分析也是一种回归。 回归分析的目的是建立因变量和自变量之间关系的模型 ;并且可以用自变量来对因变量进行预测。通常线性回 归分析因变量的观测值假定是互相独立并且有同样分布 而时间序列的最大特点是观测值并不独立。时间序列的 一个目的是用变量过去的观测值来预测同一变量的未来 值。 即时间序列的因变量为变量未来的可能值,而用来预测 的自变量中就包含该变量的一系列历史观测值。 当然时间序列的自变量也可能包含随着时间度量的独立 变量。
SPSS
ARIMA模型基础:平稳性和可逆性问题
ARMA( p,q ) 模型有意义则要求时间序列满足平稳性和可逆 性的条件. 这意味着序列均值不随着时间增加或减少,序列的方差不随时 间变化等。 一个实际的时间序列是否满足这些条件是无法在数学上验证的 ,但模型可以近似地从后面要介绍的时间序列的自相关函数和 偏相关函数图来识别。 一般人们所关注的的有趋势、季节和循环成分的时间序列都不 是平稳的。这时就需要对时间序列进行差分来消除这些使序列 不平稳的成分,而使其变成平稳的时间序列,并估计 ARMA 模型. 估计之后再转变该模型,使之适应于差分之前的序列得到的模 型称为ARIMA模型。