时间序列(ARIMA)案例超详细讲解

合集下载

AR,MA,ARIMA模型介绍及案例分析

AR,MA,ARIMA模型介绍及案例分析

BOX -JENKINS 预测法1(1)()AR p 模型(Auto regression Model )——自回归模型p 阶自回归模型:y t =c +∅1y t−1+∅2y t−2+⋯+∅p y t−p +e t式中,y t 为时间序列第t 时刻的观察值,即为因变量或称被解释变量;y t−1,y t−2,⋯,y t−p 为时序y t 的滞后序列,这里作为自变量或称为解释变量;e t 是随机误差项;c ,∅1,∅2,⋯,∅p 为待估的自回归参数。

(2)()MA q 模型(Moving Average Model )——移动平均模型q 阶移动平均模型:1122t t t t q t q y e e e e μθθθ---=+----式中,μ为时间序列的平均数,但当{}t y 序列在0上下变动时,显然μ=0,可删除此项;t e ,1t e -,2t e -,…,t q e -为模型在第t 期,第1t -期,…,第t q -期的误差;1θ,2θ,…,q θ为待估的移动平均参数。

(3)(,)ARMA p q 模型——自回归移动平均模型(Auto regression Moving Average Model )模型的形式为:11221122t t t p t p t t t q t q y c y y y e e e e φφφθθθ------=+++++----显然,(,)ARMA p q 模型为自回归模型和移动平均模型的混合模型。

当q =0,时,退化为纯自回归模型()AR p ;当p =0时,退化为移动平均模型()MA q 。

2 改进的ARMA 模型(1)(,,)ARIMA p d q 模型这里的d 是对原时序进行逐期差分的阶数,差分的目的是为了让某些非平稳(具有一定趋势的)序列变换为平稳的,通常来说d 的取值一般为0,1,2。

对于具有趋势性非平稳时序,不能直接建立ARMA 模型,只能对经过平稳化处理,而后对新的平稳时序建立(,)ARMA p q 模型。

ARIMA模型原理以及代码实现案例

ARIMA模型原理以及代码实现案例

ARIMA模型原理以及代码实现案例⼀、时间序列分析北京每年每个⽉旅客的⼈数,上海飞往北京每年的游客⼈数等类似这种顾客数、访问量、股价等都是时间序列数据。

这些数据会随着时间变化⽽变化。

时间序列数据的特点是数据会随时间的变化⽽变化。

随机过程的特征值有均值、⽅差、协⽅差等。

如果随机过程的特征随时间变化⽽变化,那么数据是⾮平稳的,相反,如果随机过程的特征随时间变化⽽不变化,则此过程是平稳的。

如图所⽰:⾮平稳时间序列分析时,若导致⾮平稳的原因是确定的,可以⽤的⽅法主要有趋势拟合模型、季节调整模型、移动平均、指数平滑等。

若导致⾮平稳的原因是随机的,⽅法主要有ARIMA,以及⾃回归条件异⽅差模型等。

⼆、ARIMA1、简介ARIMA通常⽤于需求预测和规划中。

可以⽤来对付随机过程的特征随着时间变化⽽⾮固定。

并且导致时间序列⾮平稳的原因是随机⽽⾮确定的。

不过,如果从⼀个⾮平稳的时间序列开始,⾸先需要做差分,直到得到⼀个平稳的序列。

模型的思想就是从历史的数据中学习到随时间变化的模式,学到了就⽤这个规律去预测未来。

ARIMA(p,d,q)d是差分的步长(差分的阶数指的是进⾏多少次差分。

⽐如步长为n的⼀阶差分diff(x) = f(x) - f(x - n),⽽⼆阶步长为n的差分: diff(x) = f(x) - f(x-n), diff(x-n) = f(x-n) - f(x - n - n), diff⼆阶差分(x - n) = diff(x) - diff(x-n)),⽤来得到平稳序列p为相应的⾃回归项q是移动平均项数2、⾃回归模型AR⾃回归模型描述当前值与历史值之间的关系,⽤变量⾃⾝的历史时间数据对⾃⾝进⾏预测。

⾃回归模型必须满⾜平稳性。

⾃回归模型需要先确定⼀个阶数p,表⽰⽤⼏期的历史值来预测当前值。

p阶⾃回归模型可以表⽰为:y t是当前值,u是常数项,p是阶数,r是⾃相关系数,e是误差AR的限制:⾃回归模型是⾃⾝的数据进⾏预测必须具有平稳性必须具有相关性如果⾃相关系数⼩⾬0.5,则不宜采⽤⾃回归只适⽤于预测与⾃⾝前期相关的现象3、移动平均模型MA移动平均模型关注的⾃回归模型中的误差项的累加,q阶⾃回归过程的公式定义如下:移动平均模型能有效地消除预测中的随机波动4、⾃回归移动平均模型ARMA⾃回归模型AR和移动平均模型MA模型相结合,我们就得到了⾃回归移动平均模型ARMA(p,q),计算公式如下:5、p、q的确定 (1) (2)结合最终的预测误差来确定p、q的阶数,在相同的预测误差情况下,根据奥斯卡姆剃⼑准则,模型越⼩越好。

Python时间序列处理之ARIMA模型的使用讲解

Python时间序列处理之ARIMA模型的使用讲解

Python时间序列处理之ARIMA模型的使⽤讲解ARIMA模型ARIMA模型的全称是⾃回归移动平均模型,是⽤来预测时间序列的⼀种常⽤的统计模型,⼀般记作ARIMA(p,d,q)。

ARIMA的适应情况ARIMA模型相对来说⽐较简单易⽤。

在应⽤ARIMA模型时,要保证以下⼏点:时间序列数据是相对稳定的,总体基本不存在⼀定的上升或者下降趋势,如果不稳定可以通过差分的⽅式来使其变稳定。

⾮线性关系处理不好,只能处理线性关系判断时序数据稳定基本判断⽅法:稳定的数据,总体上是没有上升和下降的趋势的,是没有周期性的,⽅差趋向于⼀个稳定的值。

ARIMA数学表达ARIMA(p,d,q),其中p是数据本⾝的滞后数,是AR模型即⾃回归模型中的参数。

d是时间序列数据需要⼏次差分才能得到稳定的数据。

q是预测误差的滞后数,是MA模型即滑动平均模型中的参数。

a) p参数与AR模型AR模型描述的是当前值与历史值之间的关系,滞后p阶的AR模型可以表⽰为:其中u是常数,et代表误差。

b) q参数与MA模型MA模型描述的是当前值与⾃回归部分的误差累计的关系,滞后q阶的MA模型可以表⽰为:其中u是常数,et代表误差。

c) d参数与差分⼀阶差分:⼆阶差分:d) ARIMA = AR+MAARIMA模型使⽤步骤获取时间序列数据观测数据是否为平稳的,否则进⾏差分,化为平稳的时序数据,确定d通过观察⾃相关系数ACF与偏⾃相关系数PACF确定q和p得到p,d,q后使⽤ARIMA(p,d,q)进⾏训练预测Python调⽤ARIMA#差分处理diff_series = diff_series.diff(1)#⼀阶diff_series2 = diff_series.diff(1)#⼆阶#ACF与PACF#从scipy导⼊包from scipy import statsimport statsmodels.api as sm#画出acf和pacfsm.graphics.tsa.plot_acf(diff_series)sm.graphics.tsa.plot_pacf(diff_series)#arima模型from statsmodels.tsa.arima_model import ARIMAmodel = ARIMA(train_data,order=(p,d,q),freq='')#freq是频率,根据数据填写arima = model.fit()#训练print(arima)pred = arima.predict(start='',end='')#预测总结以上就是这篇⽂章的全部内容了,希望本⽂的内容对⼤家的学习或者⼯作具有⼀定的参考学习价值,谢谢⼤家对的⽀持。

AR,MA,ARIMA模型介绍及案例分析

AR,MA,ARIMA模型介绍及案例分析

BOX-JENKINS 预测法1 适用于平稳时序的三种基本模型(1)()AR p 模型(Auto regression Model )——自回归模型p 阶自回归模型:式中,为时间序列第时刻的观察值,即为因变量或称被解释变量;,为时序的滞后序列,这里作为自变量或称为解释变量;是随机误差项;,,,为待估的自回归参数。

(2)()MA q 模型(Moving Average Model )——移动平均模型q 阶移动平均模型:式中,μ为时间序列的平均数,但当{}t y 序列在0上下变动时,显然μ=0,可删除此项;t e ,1t e -,2t e -,…,t q e -为模型在第t 期,第1t -期,…,第t q -期的误差;1θ,2θ,…,q θ为待估的移动平均参数。

(3)(,)ARMA p q 模型——自回归移动平均模型(Auto regression Moving Average Model )模型的形式为:显然,(,)ARMA p q 模型为自回归模型和移动平均模型的混合模型。

当q =0,时,退化为纯自回归模型()AR p ;当p =0时,退化为移动平均模型()MA q 。

2 改进的ARMA 模型(1)(,,)ARIMA p d q 模型这里的d 是对原时序进行逐期差分的阶数,差分的目的是为了让某些非平稳(具有一定趋势的)序列变换为平稳的,通常来说d 的取值一般为0,1,2。

对于具有趋势性非平稳时序,不能直接建立ARMA 模型,只能对经过平稳化处理,而后对新的平稳时序建立(,)ARMA p q 模型。

这里的平文化处理可以是差分处理,也可以是对数变换,也可以是两者相结合,先对数变换再进行差分处理。

(2)(,,)(,,)s ARIMA p d q P D Q 模型对于具有季节性的非平稳时序(如冰箱的销售量,羽绒服的销售量),也同样需要进行季节差分,从而得到平稳时序。

这里的D 即为进行季节差分的阶数;,P Q 分别是季节性自回归阶数和季节性移动平均阶数;S 为季节周期的长度,如时序为月度数据,则S =12,时序为季度数据,则S =4。

ARMAARIMA模型介绍及案例分析

ARMAARIMA模型介绍及案例分析

ARMAARIMA模型介绍及案例分析AR、MA和ARIMA是时间序列分析中常见的模型,用于分析和预测时间序列数据的特征和趋势。

下面将对这三种模型进行介绍,并提供一个案例分析来展示它们的应用。

自回归模型(AR)是一种基于过去的观测值来预测未来观测值的模型。

它基于一个假设:未来的观测值可以由过去的观测值的线性组合来表示。

AR模型的一般形式可以表示为:y_t=c+ϕ_1*y_(t-1)+ϕ_2*y_(t-2)+...+ϕ_p*y_(t-p)+ε_t其中,y_t表示时间t的观测值,c是常数项,ϕ_1至ϕ_p是自回归系数,p是自回归阶数,ε_t是误差项。

AR模型的关键是确定自回归阶数p和自回归系数ϕ。

移动平均模型(MA)是一种基于过去的误差项来预测未来观测值的模型。

它基于一个假设:未来的观测值的误差项可以由过去的误差项的线性组合来表示。

MA模型的一般形式可以表示为:y_t=c+ε_t+θ_1*ε_(t-1)+θ_2*ε_(t-2)+...+θ_q*ε_(t-q)其中,y_t表示时间t的观测值,c是常数项,ε_t是误差项,θ_1至θ_q是移动平均系数,q是移动平均阶数。

MA模型的关键是确定移动平均阶数q和移动平均系数θ。

自回归移动平均模型(ARIMA)结合了AR和MA模型的特点,同时考虑了时间序列数据的趋势性。

ARIMA模型一般形式可以表示为:y_t=c+ϕ_1*y_(t-1)+ϕ_2*y_(t-2)+...+ϕ_p*y_(t-p)+ε_t+θ_1*ε_(t-1)+θ_2*ε_(t-2)+...+θ_q*ε_(t-q)其中,y_t表示时间t的观测值,c是常数项,ϕ_1至ϕ_p是自回归系数,p是自回归阶数,ε_t是误差项,θ_1至θ_q是移动平均系数,q是移动平均阶数。

ARIMA模型的关键是确定自回归阶数p、移动平均阶数q和相关系数ϕ和θ。

下面举一个电力消耗预测的案例来展示AR、MA和ARIMA模型的应用:假设有一段时间内的电力消耗数据,我们想要用AR、MA和ARIMA模型来预测未来一段时间内的电力消耗。

时间序列分析课件-07-ARIMA模型、疏系数模型、季节模型

时间序列分析课件-07-ARIMA模型、疏系数模型、季节模型
• 假设序列如下
xt 0 1t at
• 考察一阶差分后序列和二阶差分序列 的平稳性与方差
比较
• 一阶差分
– 平稳
xt xt xt1
1 at at1 – 方差小
• 二阶差分(过差分)
– 平稳
2 xt xt xt1 at 2at1 at2
– 方差大
Var(xt ) Var(at at1)
• 参数估计
(1 0.44746 B 0.28132 B4 )(1 B)(1 B4 )xt t
模型检验
残差白噪声检验
参数显著性检验
延迟 阶数
2统 计量
P值
待估 t 统
参数 计量
P值
6
2.09 0.7191 1
12 10.99 0.3584 4
5.48 <0.0001 -3.41 <0.0001
2 2
Var(2xt ) Var(at 2at1 at2 )
6 2
ARIMA模型
• ARIMA模型结构 • ARIMA模型性质 • ARIMA模型建模 • ARIMA模型预测 • 疏系数模型 • 季节模型
ARIMA模型结构
• 使用场合
– 差分平稳序列拟合
• 模型结构
( B) d
E( t )
Tt 0 1 xtm l xtlm
• 简单/复杂季节模型 • X-11 • etc
• AR • MA • ARMA • WN • etc
3.考虑残差
获 得 观 察 值 序
Y
Y
平稳性 检验
白噪声 检验
分 析

N
束 N

差分 运算
拟合
ARMA 模型

时间序列建模案例ARIMA(1,1,1)

时间序列建模案例ARIMA(1,1,1)

们可以观察到1978年~2006年我国GDP(现价,生产法)具有明显的上升趋势。

在ADF检验时选择含有常数项和时间趋势项,由SIC 准则确定滞后阶数(p=4)。

GDP序列的ADF检验如下:
检验结果显示,GDP序列以较大的P值,即100%的概率接受原假设,即存在单位根的结论。

将GDP序列做1阶差分,然后对ΔGDP进行ADF检验
检验结果显示,ΔGDP序列仍接受存在单位根的结论。

其他检验方法
的结果也接受原假设,ΔGDP序列存在单位根,是非平稳的。

再对ΔGDP序列做差分,则Δ2GDP的ADF检验(选择不含常数项和趋势项,)如下:
检验结果显示,二阶差分序列Δ2GDP在1%的显著性水平下拒绝原假设,接受不存在单位根的结论,因此可以确定GDP序列是2阶单整序列,即GDP ~I (2)。

GDP序列是2阶单整序列,即GDP ~I (2)。

但是检验得到GDP的对数序列ln(GDP)是1阶单整序列,所以本例建立Δln(GDP)序列的ARIMA模型。

首先观察Δln(GDP)序列的相关图
图5.10Δl n(G D P)序列的相关图
Δln(GDP)序列的自相关系数和偏自相关系数都在1阶截尾,则取模型的阶数p =1 和q =1,建立ARIMA(1,1,1) 模型(时间期间:1978~2004年,2005和2006年实际数据不参加建模,留作检验):
图5.11Δl n(G D P)序列的A R I M A(1,1,1)模型残差的相关图从图5.11的相关图中可以看出模型的残差不存在序列相关,并且模型的各项统计量也很好。

图5.12是这个模型的拟合和预测(静态)的结果,其中2005年和2006年为预测结果。

时间序列模型案例分析

时间序列模型案例分析

时间序列模型案例分析时间序列模型案例分析: 新冠疫情趋势预测背景:新冠疫情自2020年开始全球流行,给世界各国的医疗体系和经济造成了巨大冲击。

为了有效应对疫情,政府和医疗机构需要准确预测疫情未来的趋势,并做出相应的决策和应对措施。

数据:本案例使用了每天的新增确诊病例数作为时间序列数据。

数据包括了从疫情开始到某一时间点的每天新增病例数,以及历史病例数、疫情防控政策等其他相关因素。

目标:利用时间序列模型预测未来疫情的趋势,帮助政府和医疗机构制定合理的防控策略。

方法:我们采用了ARIMA模型(自回归移动平均模型)进行疫情趋势预测。

ARIMA模型是一种广泛应用于时间序列分析的经典模型,可对时间序列数据进行模拟和预测。

步骤:1. 数据预处理: 首先,我们进行了数据清洗和转换,确保数据的准确性和一致性。

我们还对数据进行了平稳性检验,如果数据不平稳,则需要进行差分操作。

2. 模型选择: 然后,我们选择了合适的ARIMA模型。

模型选择的关键是要找到合适的参数p、d和q,它们分别代表了自回归阶数、差分阶数和移动平均阶数。

3. 参数估计和模型拟合: 我们使用最大似然估计方法来估计模型的参数,并对模型进行拟合。

拟合后,我们对模型进行残差分析,以检验模型的拟合效果。

4. 模型评估和预测: 接下来,我们使用已有的数据来评估模型的预测效果。

我们将模型的预测结果与实际数据进行比较,并计算误差指标,如均方根误差(RMSE)和平均绝对误差(MAE)。

最后,我们使用拟合好的模型来进行未来疫情的趋势预测。

结果与讨论:经过模型拟合和评估,我们得到了一个较为准确的ARIMA模型来预测未来疫情的趋势。

根据模型的预测结果,政府和医疗机构可以制定对应的防控策略,以应对疫情的发展。

结论:时间序列模型在新冠疫情趋势预测中发挥了重要作用。

通过对历史疫情数据的分析和建模,我们可以预测未来疫情的走势,并相应地采取措施。

然而,需要注意的是,时间序列模型是一种基于过去数据的预测方法,其预测精度可能受到多种因素的影响。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

想象一下,你的任务是:根据已有的历史时间数据,预测未来的趋势走向。

作为一个数据分析师,你会把这类问题归类为什么?当然是时间序列建模。

从预测一个产品的销售量到估计每天产品的用户数量,时间序列预测是任何数据分析师都应该知道的核心技能之一。

常用的时间序列模型有很多种,在本文中主要研究ARIMA模型,也是实际案例中最常用的模型,这种模型主要针对平稳非白噪声序列数据。

时间序列概念时间序列是按照一定的时间间隔排列的一组数据,其时间间隔可以是任意的时间单位,如小时、日、周月等。

通过对这些时间序列的分析,从中发现和揭示现象发展变化的规律,并将这些知识和信息用于预测。

比如销售量是上升还是下降,是否可以通过现有的数据预测未来一年的销售额是多少等。

1 ARIMA(差分自回归移动平均模型)简介模型的一般形式如下式所示:1.1 适用条件●数据序列是平稳的,这意味着均值和方差不应随时间而变化。

通过对数变换或差分可以使序列平稳。

●输入的数据必须是单变量序列,因为ARIMA利用过去的数值来预测未来的数值。

1.2 分量解释●AR(自回归项)、I(差分项)和MA(移动平均项):●AR项是指用于预测下一个值的过去值。

AR项由ARIMA中的参数p定义。

p值是由PACF图确定的。

●MA项定义了预测未来值时过去预测误差的数目。

ARIMA中的参数q代表MA项。

ACF图用于识别正确的q值●差分顺序规定了对序列执行差分操作的次数,对数据进行差分操作的目的是使之保持平稳。

ADF可以用来确定序列是否是平稳的,并有助于识别d值。

1.3 模型基本步骤1.31 序列平稳化检验,确定d值对序列绘图,进行ADF 检验,观察序列是否平稳(一般为不平稳);对于非平稳时间序列要先进行d 阶差分,转化为平稳时间序列1.32 确定p值和q值(1)p 值可从偏自相关系数(PACF)图的最大滞后点来大致判断,q 值可从自相关系数(ACF)图的最大滞后点来大致判断(2)遍历搜索AIC和BIC最小的参数组合1.33 拟合ARIMA模型(p,d,q)1.34 预测未来的值2 案例介绍及操作基于1985-2021年某杂志的销售量,预测某商品的未来五年的销售量。

2.1 序列平稳化检验,确定d值平稳性概念假定某个时间序列是由一系列随机过程生成的,即假定时间序列的每一个数值都是从一个概率分布中随机得到,如果满足下列条件:●均值u是与时间t无关的常数;●方差是与时间t无关的常数;●协方差rk是只与时间间隔K有关,与时间t无关的常数则称改随机时间序列是平稳的,而该随机过程是平稳随机过程。

ADF思路白噪声的过程是:对于白噪声序列,基本是在均值附近较为平均的随机震荡。

它满足正态分布,均值与方差都是与时间t无关的函数,它满足平稳性要求。

随机游走的过程是:对于随机游走,可以看到比白噪声平滑很多,并且呈现出一些“趋势性”的感觉。

它的均值为0,方差与时间t有关,他不满足平稳性要求。

而随机游走的一阶差分是平稳的:如果一个时间序列是非平稳的,它常常可以通过取差分的方法而形成平稳序列。

ADF 大致的思想就是基于随机游走的,对Xt回归,如果发现p=1,说明序列满足随机游走,就是非平稳的。

下图是通过spsspro软件生成:如何确定该序列是否平稳呢?(1)临界值检验临界值1%、5%、10%不同程度拒绝原假设的统计值和假设检验值t 进行比较,t同时小于1%、5%、10%即说明非常好地拒绝该假设(2)显著性检验p<0.05本数据中,原序列的ADF 假设检验值t为1.814,大于三个level的统计值,所以是非平稳的。

而一阶差分序列的ADF 假设检验值t为-3.156,小于三个level的统计值,再来看显著性p的值为0.023<0.05,所以是平稳的。

经过二阶差分,与一阶差分相比,只是在显著性程度上扩大了,因此对于该序列,采用一阶差分比较合适。

一般情况下,采用一阶、二阶差分就可以使序列变得平稳。

所以差分阶数d=12.2 确定p值和q值2.21 绘制ACF 、PACF图先来介绍几个概念:拖尾和截尾拖尾,顾名思义,就是序列缓慢衰减,“尾巴”慢慢拖着滑下来,或者震荡衰减而截尾则是突然截断了,像个悬崖,指序列从某个时点变得非常小专业点来说呢,就是:如果样本自相关系数和样本偏自相关系数在最初的阶明显大于2倍标准差(下图虚线),而后几乎95%的系数都落在2倍标准差的范围内,且非零系数衰减为小值波动的过程非常突然,通常视为k阶截尾。

如果有超过5%的样本相关系数大于2倍标准差,或者非零系数衰减为小值波动的过程比较缓慢或连续,通常视为拖尾。

自相关系数(ACF)自相关系数度量的是同一事件在两个不同时期之间的相关程度,形象的讲就是度量自己过去的行为对自己现在的影响。

在这里可以通过自相关系数(ACF)图的最大滞后点来大致判断q 值。

偏自相关系数(PACF)计算某一个要素对另一个要素的影响或相关程度时,把其他要素的影响视为常数,即暂不考虑其他要素的影响,而单独研究那两个要素之间的相互关系的密切程度时,称为偏相关。

在这里可以通过偏自相关系数(PACF)图的最大滞后点来大致判断p 值。

下图是通过spsspro软件生成:差分数据自相关图(ACF)差分数据偏自相关图(PACF)从上图可以看到:趋势序列ACF 有1 阶截尾,PACF 有1 阶截尾尾。

因此可以选p=1,q=1。

通过拖尾和截尾对模型定阶,具有很强的主观性。

2.22 AIC、BIC准则AIC 准则全称是最小化信息量准则其中L 表示模型的极大似然函数,K 表示模型参数个数。

当样本容量很大时,采用BIC贝叶斯信息准则其中n 表示样本容量。

通过比较不同差分阶数的AIC、BIC的值,取两者最小值p、q从评价准则的结果看:p = 0,q = 1 时,两者值最小,AIC为251.973,BIC为256.724。

2.3 拟合ARIMA模型(p,d,q)由上述步骤,我们已知d=1,p=0,q=1,故拟合模型为ARIMA(0,1,1)采用多元线性回归,得到y(t)=4.996+0.671*ε(t-1)2.4 预测使用该公式,得到未来五年的杂志销量分别为285.097、290.093、295.089、300.085、305.081。

3 案例工具实现3.1使用工具SPSSPRO—>【预测模型—>时间序列分析(ARIMA)】3.11 案例操作Step1:新建分析;Step2:上传数据;Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;step4:选择【时间序列分析(ARIMA)】;step5:查看对应的数据数据格式,【时间序列分析(ARIMA)】要求输入1个时间序列数据定量变量。

step6:选择向后预测的期数。

step7:点击【开始分析】,完成全部操作。

3.12 分析结果解读以下生成的结果来源于SPSSPRO软件的分析结果导出,SPSSPRO输出的结果中会给出智能解读结果,直接查看智能分析:输出结果1:ADF 检验表图表说明:该序列检验的结果显示,基于字段年度销量:在差分为0 阶时,显著性P 值为0.998,水平上不要呈现显著性,不能拒绝原假设,该序列为不平稳的时间序列。

在差分为1 阶时,显著性P 值为0.023,水平上呈现显著性,拒绝原假设,该序列为平稳的时间序列。

在差分为2 阶时,显著性P 值为0.000,水平上呈现显著性,拒绝原假设,该序列为平稳的时间序列。

(注意:在理论上,足够多的差分运算可以充分提取原时间序列中的非平稳确定性信息。

但进行差分运算需要注意的是,差分运算的阶数不是越多越好。

差分是对信息的提取、加工的过程,每次差分都会有信息的损失,所以差分的阶数需要适当,以免过度差分。

)输出结果2:最佳差分序列图图表说明:由于一阶差分后序列进行单位根检验的P 值小于0.05,说明一阶差分后序列是平稳数据,上图展示了原始数据1 阶差分后的时序图。

输出结果3:最终差分数据自相关图(ACF)图表说明:由自相关图可知,一阶自相关系数很明显地大于2 倍标准差范围,自一阶自相关系数后,其余自相关系数都在2 倍标准差范围以内,我们可以判断自相关图为截尾。

输出结果4:最终差分数据偏自相关图(PACF)图表说明:由偏自相关图可知,一阶偏自相关系数很明显地大于2 倍标准差范围,自一阶偏自相关系数后,其余自相关系数都在2 倍标准差范围以内,我们可以判断偏自相关图为截尾。

输出结果5:模型参数表图表说明:由于通过自相关分析和偏自相关分析来判断ARIMA 的参数存在人为主观性,SPSSPRO 基于AIC 信息准则自动寻找最优参数,模型结果为ARIMA 模型(0,1,1)检验表,基于字段:年度销量,从Q 统计量结果分析可以得到:Q6 在水平上不呈现显著性,不能拒绝模型的残差为白噪声序列的假设,同时模型的拟合优度R2 为0.981,模型表现优秀,模型基本满足要求。

(注意:一般来说,只检验前6 期和前12 延迟的Q 统计量(即Q6 和Q12)就可得出残差是否是随机序列的结论。

这是因为平稳序列通常具有短期相关性,如果一个短期延迟序列值之间不存在显著的相关关系,通常延迟之间就更不会存在显著的相关关系。

)输出结果6:模型残差自相关图(ACF)图表说明:上图展示了模型的残差自相关图,(ACF)若相关系数均在虚线(2 倍标准差)内,自回归模型(AR)残差为白噪声序列,时间序列要求模型残差为白噪声序列。

很明显,残差的自相关系数均在虚线内。

输出结果7:模型残差偏自相关图(PACF)图表说明:上图展示了模型的残差偏自相关图(PACF),若相关系数均在虚线内,滑动平均模型(MA)残差为白噪声序列,时间序列要求模型残差为白噪声序列。

很明显,残差的大部分偏自相关系数均在虚线内,即便第9 阶与第14 阶超过了2 倍标准差,这可能是由于偶然因素引起的。

输出结果8:模型检验表图表说明:基于字段年度销量,SPSSPRO 基于AIC 信息准则自动寻找最优参数,模型结果为ARIMA 模型(0,1,1)检验表且基于1 差分数据,模型公式如下:y(t)=4.996+0.671*ε(t-1)输出结果9:时间序列图图表说明:上图表示了该时间序列模型的原始数据图、模型拟合值、模型预测值。

从图可知,拟合序列趋势与真实序列趋势有着极大的相似性,说明拟合效果较好。

输出结果10:时间序列预测表图表说明:上表显示了时间序列模型最近5 期数据预测情况。

4 结论ARIMA 是用于单变量时间序列数据预测的最广泛使用方法之一,模型十分简单,只需要内生变量而不需要借助其他外生变量,但是,采用ARIMA模型预测时序,数据必须是稳定的,如果不稳定的数据,是无法捕捉到规律的。

比如股票数据用ARIMA无法预测的原因就是股票数据是非稳定的,常常受政策和新闻的影响而波动。

相关文档
最新文档