SAS分析非平稳时间序列
SAS系统和数据分析非平稳序列的随机分析
第四十二课 非平稳序列的随机分析20世纪70年代,G. P. Box 和G. M. Jenkins 发表了专著《时间序列分析:预测和控制》,对平稳时间序列数据,提出了自回归滑动平均模型ARIMA ,以及一整套的建模、估计、检验和控制方法。
使时间序列分析广泛地运用成为可能。
为了纪念Box 和Jenkins 对时间序列发展的特殊贡献,现在人们也常把ARIMA 模型称为Box-Jenkins 模型。
当我们拟合一个时间序列时,先通过差分法或适当的变换使非平稳序列化成为平稳序列,我们再要考虑的是参数化和记忆特征的有效性,用这种参数方法拟合序列为某种特定的结构,只用很少量的参数,使参数的有效估计成为可能。
相对于一个序列的过去值,可用传统的Box 和Jenkins 方法建模。
实际上,Box-Jenkins 模型主要是运用于单变量、同方差场合的线性模型。
随着对时间序列应用的深入研究,发现还存在着许多局限性。
所以近20年来,统计学家纷纷转向多变量、异方差和非线性场合的时间序列分析方法的研究,并取得突破性的进展,其中Engle 和Granger 一起获得2003年诺贝尔经济学奖。
在异方差场合,Robert F.Engle 在1982年提出了自回归条件异方差ARCH 模型,以及在ARCH 模型上衍生出的一系列拓展模型。
在多变量场合,70年代末,G. E. P. Box 教授和刁锦寰教授在处理洛山矶的环境数据时,提出了干预分析和异常值检验方法。
1987年,C.Granger 提出了协整(co-integration )理论,在多变量时间序列建模过程中“变量是平稳的”不再是必须条件了,而只要求它们的某种组合是平稳的。
非线性时间序列分析也有重大发展,汤家豪教授等在1980年左右提出了利用分段线性化构造门限自回归模型。
一、 ARIMA 模型随着对时间序列分析方法的深入研究,人们发现非平稳序列的确定性因素分解方法(如季节模型、趋势模型、移动平均、指数平滑等)存在一些问题,它只能提取显著的确定性信息,对随机性信息浪费严重,同时也无法对确定性因素之间的关系进行分析。
基于SAS的非平稳时间序列分析及实证研究
份指数之和要等于 12.
4) 用时间序列{Xt}的每个观察值除以相 应的季节指数, 消除时间序列的季节影响, 得到时间序列的非季节影响序列{Tt}, 即:Tt = Xt / St.
5) 利用消除季节影响的线性趋势预测 值建立回归模型: Tt = a + bt, 进行回归分析 和白噪声检验.
6) 进行预测与季节调整. 在预报中, 通常假定 It = 1, 从而预报公式为X赞 t = St Tt.
预测. 与公司 2009 年度前三个季度的实际销售数据进行 对 比 , 拟 合 效 果 令 人 满 意 , 证 明 该
方法实用有效.
关键词: 时间序列; SAS; 非平稳时间序列; 季节指数趋势法
中图分类号: F 830.9
文献标识码: A
0引言
在自然现象和经济现象中, 人们为了探索某些事物或系统的运行规律, 需要观测所 要研究的某种现象, 从而得到一定顺序的数据资料, 通过分析这些数据资料, 对事物或 系统的未来发展进行预测或控制, 这种方法称为时间序列分析. 从数学意义上讲, 对 某一过程中的某一变量或一组变量 X(t)进行观察测量, 在一系列时刻 t1, t2, …, tN(t1 < t2 < … < tN)得到的有序数据集合 X(t1), X(t2), …, X(tN), 称为时间序列[1]. 时间序列分析 作为数理统计的一个分支, 是一种利用具有 “时间特性”的观测数据, 根据研究对象的特 征, 发掘内在规律, 建立动态模型, 并对之进行模式识别、 参数估计, 然后以此为依 据, 对未来的行为进行科学的预测和控制的统计方法, 在工程技术、 经济管理、 气象 学、 地球物理学等方面有着广泛的应用. 面对实际问题, 当数据很多时, 如果没有计算 机程序, 人们很难完成工作. SAS 作为国际上最流行的统计分析系统, 在统计分析领域 具有最权威的统计分析能力[2]. 本文利用 SAS 系统对电脑零售业时间序列数据进行建模.
第六章 非平稳时间序列分析
第六章非平稳时间序列分析前几章讨论的都是平稳时间序列,然而在实际应用中,特别是在经济和商业中出现的时间序列大多是非平稳的,如非常数均值的时间序列,非常数方差的时间序列,或者二者皆有。
第一节非平稳性的检验该方法即是利用时间序列资料图,观察趋势性或周期性。
如果序列存在着明显的趋势或周期变化,则表明该序列可能是非平稳时间序列。
这种方法直观简单,但主观性较强。
一个零均值平稳时间序列的自相关和偏自相关函数,要么拖尾,要么截尾。
如果零值化的时序既不拖尾,也不截尾,而是呈现出缓慢衰减或者周期性衰减,则认为可能存在趋势或周期性,应视为非平稳。
该方法是首先对序列拟合一个恰当的模型,再针对该模型计算其对应特征方程的特征根。
如果它的所有特征根均在单位圆之外,则该序列平稳;否则非平稳。
该方法可以检验序列是否存在单调趋势。
原理:将序列分成几段,计算每一段的均值或方差,组成新的序列。
若原序列无明显趋势变化则均值(或方差)序列的逆序总数不应过大或过小,过大说明原序列有上升的趋势,过小说明序列有下降趋势。
原理:在原序列与趋势变化的原假设下,原序列的每个值与序列均值对比后的符号序列的游程不应过小或过多。
过小或过多均表示原序列存在某种趋势。
1、DF 统计量的分布特征给出三个自回归模型前面所述的单变量模型只含有一阶的滞后,当模型中含有更高阶滞后项时,有类似的分析结论。
此时对β是否等于1的检验称为ADF 检验。
(2)根据不同的模型选用DF 或ADF 统计量,每个统计量均有三种情况选择:含截距项、含截距项和趋势项以及不含截距项和趋势项。
(3)DF (ADF )检验采用的是最小二乘估计。
(4)DF (ADF )检验是左侧单边检验。
当DF (ADF )<临界值时,拒绝H0 ,即序列为平稳的;当DF (ADF )>临界值时接受H0 ,即序列为非平稳的。
第二节平稳化方法本节介绍三种常用的平稳化方法:差分、季节差分以及对数变换与差分结合运用。
SAS分析非平稳时间序列
运用SAS对谷物产量进行分析—、摘要利用SAS软件(程序见附录)判断谷物产量数据为平稳序列且为非白噪声序列,然后先后通过模型的识别、参数的估计、模型的优化、残差白噪声检验,确定AR(1)模型拟合时间序列显著有效。
由于时间序列之间的相关关系,且历史数据对未来数据有一定的影响,对未来5期的谷物生产量进行预测。
二、理论准备首先判断序列的随机性和平稳性。
通过随机性检验,判断该序列是否为白噪声序列,如果是白噪声序列,就认为该随机事件没有包含任何值得提取的有用信息,我们就应该终止分析。
通过平稳性检验,序列可以分为平稳序列和非平稳序列。
如果序列平稳,通过相关计算进行模型拟合,并利用过去行为对将来行为进行预测,达到预测效果。
如果序列为非平稳,再确定模型为非平稳序列中四大类模型中的哪种种模型或者几种模型对序列的综合影响,通过把序列转化为平稳序列,再进一步分析。
三、数据选取本实验采用某地区连续74年的谷物产量(单位:千吨),如下所示:0.97 0.45 1.61 1.26 1.371.43 1.321.23 0.84 0.89 1.18 1.33 1.21 0.98 0.91 0.61 1.23 0.97 1.10 0.74 0.80 0.810.80 0.600.59 0.63 0.87 0.36 0.81 0.91 0.77 0.96 0.93 0.95 0.65 0.98 0.70 0.86 1.320.88 0.680.78 1.25 0.79 1.19 0.69 0.92 0.86 0.86 0.85 0.90 0.54 0.32 1.40 1.14 0.690.91 0.680.57 0.94 0.35 0.39 0.45 0.99 0.84 0.62 0.85 0.730.66 0.76 0.63 0.32 0.170.46四、数据进行平稳性与纯随机性的检验与判别(一)序列的纯随机性检验tutocorrelation Check for Uhite NoiseTo Chi-Fr)Lag Square OF ChiSq ........ ......... ........... A utocorrelations ....................629川 6 t.lltl 0.3630.26t 0.227 9.21! 0.20?图1序列延迟6阶LB检验结果序列纯随机性检验结果显示延迟6阶LB检验统计量的P值小于1%勺显著性水平0.0001,说明序列之间蕴含着很强的相关信息,即该序列是非随机性序列,为非白噪声。
应用sas分析时间序列的平稳性以及如何建模
一、判断时间序列的平稳性
由上述时序图得,该时间序列图没有明显的周期性,基本可以视为平稳序列,进一步用自相关图可以得出,在置后四介都基本趋于两倍的标准差范围内,所以改时间序列为一个平稳的时间序列;从白噪声检验结果可知P值远小于0.0001,可判断这是一个非白噪声时间序列;综上可得该时间序列图为一个平稳的非白噪声时间序列。
二、模型的识别
由上述模型识别的结果可知,该模型为MA(4);则可建立模型为:
11223344t t t t t t x μεθεθεθεθε----=+----
三、参数估计及检验
0.62317
经上参数估计及检验的得该模型MA(4)为:234(10.917840.8320.598060.62t t x B B B B ε=++++。
SAS学习系列39.时间序列分析Ⅲ—ARIMA模型
39. 时间序列分析Ⅱ—-ARIMA 模型随着对时间序列分析方法的深入研究,人们发现非平稳序列的确定性因素分解方法(如季节模型、趋势模型、移动平均、指数平滑等)只能提取显著的确定性信息,对随机性信息浪费严重,同时也无法对确定性因素之间的关系进行分析。
而非平稳序列随机分析的发展就是为了弥补确定性因素分解方法的不足。
时间序列数据分析的第一步都是要通过有效手段提取序列中所蕴藏的确定性信息。
Box 和Jenkins 使用大量的案例分析证明差分方法是一种非常简便有效的确定性信息的提取方法。
而Gramer 分解定理则在理论上保证了适当阶数的差分一定可以充分提取确定性信息。
(一)ARMA 模型即自回归移动平均移动模型,是最常用的拟合平稳时间序列的模型,分为三类:AR 模型、MA 模型和ARMA 模型。
一、AR(p )模型——p 阶自回归模型 1。
模型:011t t p t p t x x x φφφε--=+++其中,0p φ≠,随机干扰序列εt 为0均值、2εσ方差的白噪声序列(()0t s E εε=, t ≠s ),且当期的干扰与过去的序列值无关,即E (x t εt )=0.由于是平稳序列,可推得均值011pφμφφ=---. 若00φ=,称为中心化的AR (p )模型,对于非中心化的平稳时间序列,可以令01(1)p φμφφ=---,*t t x x μ=-转化为中心化。
记B 为延迟算子,1()p p p B I B B φφΦ=---称为p 阶自回归多项式,则AR (p )模型可表示为:()p t t B x εΦ=.2. 格林函数用来描述系统记忆扰动程度的函数,反映了影响效应衰减的快慢程度(回到平衡位置的速度),G j 表示扰动εt —j 对系统现在行为影响的权数。
例如,AR(1)模型(一阶非齐次差分方程),1, 0,1,2,j j G j φ==模型解为0t j t j j x G ε∞-==∑.3。
基于SAS的非平稳时间序列分析及实证研究
基于SAS的非平稳时间序列分析及实证研究
刘佳;赵慧文;刘光荣
【期刊名称】《汕头大学学报(自然科学版)》
【年(卷),期】2010(025)001
【摘要】采用季节指数趋势法,对具有季节变动的非平稳时间序列(以某电脑公司的实际季度销售记录为例),利用统计分析系统SAS进行分析,并对该公司2009年的销售情况进行了预测.与公司2009年度前三个季度的实际销售数据进行对比,拟合效果令人满意,证明该方法实用有效.
【总页数】6页(P48-53)
【作者】刘佳;赵慧文;刘光荣
【作者单位】空军工程大学理学院,陕西,西安,710051;空军工程大学理学院,陕西,西安,710051;空军工程大学理学院,陕西,西安,710051
【正文语种】中文
【中图分类】F830.9
【相关文献】
1.基于混合门单元的非平稳时间序列预测 [J], 刘颉羲; 陈松灿
2.基于非平稳时间序列的日现金流预测 [J], 胡日成; 金翔; 王冬法; 王麦静; 吴潇然; 张荣茂
3.基于非平稳时间序列的VAR模型实证分析 [J], 刘玉娇;吕玉华
4.基于EMD-LS的非平稳时间序列多重分形去趋势波动分析方法 [J], 罗远兴;李志红;梁兴;李超;胡凤城
5.基于AISAS模型对微信校园码实际使用效果的实证研究——以江苏大学为例 [J], 金雪玉;莫金铃
因版权原因,仅展示原文概要,查看原文内容请购买。
非平稳时间序列
Tt a bct
-
Tt eabct
-
Tt
1 a bct
-
变换后模型 Tt a bt ct2
Tt a bt - - -
参数估计方法
线性最小二乘估计
线性最小二乘估计
迭代法 迭代法 迭代法
X-11过程
简介
X-11过程是美国国情调查局编制的时间序列季节调 整过程。它的基本原理就是时间序列的确定性因 素分解方法。
a0 an1
an1i ai
a0ai an1ian1
i 0,1,2,, n 2
依次类推,直到只剩下三个元素
当且仅当满足下面三个条件时,序列才是平稳的。
(1) 1 2 3 n 1
(2) 1 2 3 (1)nn 1
该法始于上世纪二三十年代,那时不存在合适的分析 模型;在历史数据基础上只能有效表达一段有限长度 时间序列的发展变化规律,一旦加入更多数据,模型 就不具有很好的解释性。由于以上原因,在X-11过程 中普遍采用移动平均的方法:用多次短期中心移动平 均消除随机波动,用周期移动平均消除趋势,用交易 周期移动平均消除交易日影响。在整个过程中总共要 用到11次移动平均,所以称为X-11过程。
例:判断上面序列的平稳性 解:N1=6,N2=4,r=8,
显著性水平=0.05,查表得rL=2,rU=9, 所以用游程检验法判断该序列是平稳的。
二、非平稳序列的确定性分析
1、确定性因素分解 ①传统的因素分解
长期趋势 循环波动 季节性变化 随机波动
②现在的因素分解
长期趋势波动 季节性变化 随机波动
时间序列分析SAS 非平稳序列2 消费量
时序图显示差分后该序列已无显著趋势或周期,随机波动比较平稳。故对差分序列拟合 ARIMA 模型。 写命令行: proc arima;
identify var=status(1,4) minic p=(0:10)q=(0:10);
观察差分序列的自相关图。
∇ 4∇xt 的自相关图如下:
自相关图显示序列有很强的短期相关性,所以可认为 1 阶 4 步差分后序列平稳。 再联系偏自相关图:
输出原序列图如下:
status 10000
9000
8000
7000
6000
5000
4000
3000
2000
1000
0 60Q1 62Q1 64Q1 66Q1 68Q1 70Q1 72Q1 74Q1 76Q1 78Q1 80Q1 82Q1 84Q1 t 86Q1 88Q1 90Q1 92Q1 94Q1 96Q1 98Q1 00Q1 02Q1 04Q1 06Q1 08Q1 10Q1
输出的参数估计结果如下。
参数估计及检验结果显示截距项,MA2 及 MA3 参数均不显著。故尝试拟合疏系数模型 MA(1,4) 。 改写命令行为: estimate q=(1,4) noint;
forecast lead=5 id=t out=results;
输出的参数估计结果如下:
检验结果均显著。再观察残差白噪声检验结果:
时间序列分析sas非平稳序列2消费量sas时间序列分析sas时间序列sas时间序列预测sas做时间序列分析yxsas时间序列回归时间序列平稳性检验平稳时间序列非平稳时间序列时间序列平稳性
美国 1960 年第一季度到 2008 年第四季度每季度接待的外国游客消费量序列 朱洵
编写命令行如下:
SAS讲义-第四十一课非平稳序列的确定性分析
第四十一课 非平稳序列的确定性分析在实际情况中,绝大部分序列都是非平稳的,因而对非平稳序列的分析更普遍、更重要,相应地各种分析方法也更多。
通常,把非平稳时间序列的分析方法分为:确定性时间序列分析和随机性时间序列分析两大类。
所谓非平稳确定性时间序列是指在自然界中由确定性因素导致的非平稳时间序列,通常这种非平稳的时间序列显示出非常明显的规律性,比如有显著的趋势或有固定的变化周期,这种规律性信息一般比较容易提取。
所谓非平稳随机性时间序列是指由随机因素导致的的非平稳时间序列,通常这种随机波动非常难以确定和分析。
传统的时间序列分析方法通常都把分析的重点放在确定性信息的提取上,而忽视对随机信息的提取。
通常将序列简单地假定为t t t x εμ+=,如果t ε是均值为零的白噪声序列,那么就可以采用确定性分析方法。
一、 时间序列的平滑技术有些时间序列具有非常显著的趋势,有时我们分析的目的就是要找到序列中的这种趋势,并利用这种趋势对序列的发展作出合理的预测。
对趋势进行分析和预测常用方法有:● 趋势拟合法——把时间作为自变量,相应的序列观察值作为因变量,建立序列值随时间变化的回归模型的方法。
根据序列所表现出的线性或非线性特征,我们的拟合方法又可以具体分为线性拟合和曲线拟合。
● 平滑法——利用修匀技术,消弱短期随机波动对序列的影响,使序列平滑化,从而显示出变化的规律。
根据所用的平滑技术的不同,又可具体分为移动平均法和指数平滑法。
1. 滑动平均与加权滑动平均法一般说来,已知序列值为t x x x x ,,,,321 ,欲预测1+t x 的值,则其预测值为:Nx x x xN t t t t 111ˆ+--++++=(41.1)这种均值随t 的变化而变化,称它为滑动平均值。
这里N 称为滑动平均的时段长。
滑动平均的目的主要是平滑数据,消除一些干扰,使趋势变化显示出来,从而可以用于趋势预测。
在计算滑动平均值时,若对各序列值不作同等看待,而是对每个序列值乘上一个加权因子,然后再作平均,则称此为加权滑动平均,称下述预测值Nx x x xNt N t t tw ---+++=ααα 2211ˆ(41.2)为加权滑动平均拟合值,α1,α2,…,αN 为加权因子,满足11=∑=NNi iα例如,当N =3时,α1 =1.5, α2 =1,α3 =0.5,有35.05.1ˆ321---++=t t t tw x x x x滑动平均值与所选的时段长短有关,时段长时的滑动平均值比时段短时的滑动平均值的反应速度慢,这是对于干扰的敏感性降低的结果。
SAS学习系列37.时间序列分析报告Ⅰ—平稳性及纯随机性检验
37. 时间序列分析Ⅰ—平稳性及纯随机性检验(一)基本概念一、什么是时间序列?为了研究某一事件的规律,依据时间发生的顺序将事件在多个时刻的数值记录下来,就构成了一个时间序列。
对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的发展趋势就是时间序列分析。
例如,国家或地区的年度财政收入,股票市场的每日波动,气象变化,工厂按小时观测的产量等等。
注:随温度、高度等变化而变化的离散序列,也可以看作时间序列。
二、时间序列的特点(1)顺序性;(2)随机性;(3)前后时刻(不一定相邻)的依存性;(4)整体呈趋势性和周期性。
三、时间序列的分类按研究对象的数目:一元时间序列、多元时间序列;按序列统计特性:平稳时间序列、非平稳时间序列;按分布规律:高斯时间序列、非高斯时间序列。
四、研究方法1. 平稳时间序列分析;2. 非平稳时间序列分析(确定性分析、随机性分析)。
五、其它任何时间序列经过合理的函数变换后都可以被认为是由下列三部分叠加而成:(1)趋势项部分;(2)周期项部分;(3)随机项部分(随机信号、随机噪声)图1. 四种趋势:线性、二次、指数增长、S型例如,手机销售的月记录按年增长(趋势项);按季节周期波动(周期项);随机信号和随机噪声。
时间序列分析的主要任务就是:上面三部分分解出来,是研究平稳随机过程的变化规律,建立特定的ARIMA 模型(要求大体平稳、可能含有周期但不能有规则性的线性指数等类型趋势项)。
六、方法性工具1. 差分运算 (1)k 步差分间隔k 期的观察值之差:Δk =x t -x t-k (2)p 阶差分Δx t =x t -x t-1称为一阶差分;1110(1)ppp p i i t t t p t p i i x x x C x ---+-=∆=∆-∆=-∑称为p 阶差分;SAS 函数实现:diff n (x ) 2. 延迟算子延迟算子作用于时间序列,时间刻度减小1个单位(序列左移一位): B x t =x t-1, ……, B p x t =x t-p .SAS 函数实现:lag n (x )用延迟算子表示k 步差分和p 阶差分为:Δk =x t -x t-k =(1-B k ) x t0()(1)pppp i t p t i i x I B C x -=∆=-=-∑(二)平稳时间序列一、概念平稳时间序列按限制条件的严格程度,分为严平稳时间序列:序列所有的统计性质都不会随着时间的推移而发生变化;宽平稳时间序列:序列的主要性质近似稳定,即统计性质只要保证序列的二阶矩平稳,即对任意的时间t ,s ,k ,序列X t 满足:二、平稳时间序列的统计性质(1)均值为常数;(2)自协方差只依赖于时间跨度; 若定义自协方差函数为γ(t ,s ) = E(X t -μt )( X s -μs )则可由二元函数简化为一元函数γ(t -s ),得延迟k 自协方差函数:γ(k )= γ(t ,t +k )由此易知平稳时间序列必具有常数方差:D(X t )= E(X t -μt )2=γ(t ,t )= γ(0)时间序列自相关函数:(,)t s ρ=延迟k 自相关函数:()()(0)k k γργ===基本性质: (1)ρ(0)=1;(2)ρ(-k)= ρ(k);(3)自相关阵为对称负定阵;(4)非唯一性。
第28章如何用SAS实现时间序列分析
第28章如何⽤SAS实现时间序列分析第28章如何⽤SAS实现时间序列分析所谓时间序列,就是将某⼀指标在不同时间上的不同数值,按照时间先后次序排列⽽成的数列,这种数列由于受到各种偶然因素的影响,往往表现出某种随机性,彼此之间存在统计上的依赖关系。
因此,可以通过对时间序列的研究来认识所研究系统的结构特征(如波动的周期、振幅、趋势的种类),揭⽰其运⾏规律,进⽽⽤以预测、控制未来⾏为,修正和重新设计系统。
时间序列分析是⼀种重要的现代统计学⽅法,主要有确定性时间序列分析和随机时间序列分析⽅法。
另外,在实际问题中会遇到这样的情况,⼀个时间序列⽬前的表现,不仅受过去⾏为的影响,⽽且与另⼀个时间序列相关。
某地区经济增长的情况,不仅与过去有关,还受到投资、政策等因素的影响,进⾏多个因素对结果变量的影响要进⾏多重时间序列分析。
28.1求和⾃回归滑动平均模型(integratedautoregressivemovingaver agemodel,ARIMA)原理概述在SAS软件中,采⽤ARIMA过程进⾏分析和预测等间隔的时间序列。
ARIMA过程提供了⼀个综合的⼯具包来进⾏模型的识别、参数估计及预测。
ARIMA模型通过其⾃⾝的过去值、过去误差、其他时间序列的当前值和过去值的线性组合来预测响应时间序列。
其中,差分具有强⼤的确定性信息提取能⼒,许多⾮平稳序列差分后会显⽰出平稳序列的性质,称该⾮平稳序列为差分平稳序列。
对该种序列常⽤的⽅法就是本章介绍的齐次⾮平稳序列,简记为ARIMA(p,d,q)模型。
ARIMA(p,d,q)模型的结构为:对d阶齐次⾮平稳序列⽽⾔,{}是⼀个平稳序列,设其适合ARIMA(p,q)模型,即或表达为其ARIMA模型的构建由3个阶段组成:(1)模型的识别阶段:在识别阶段,可通过identify语句识别差分数、计算⾃相关、偏⾃相关、逆相关、互相关系数。
还可进⾏平稳性检验和模型阶数的识别。
另外,还可同时写多个identify语句,⽤以寻找模型的适合形式。
非平稳时间序列分析(汇编)
非平稳时间序列分析1、首先画出时序图如下:t从时序图中看出有明显的递增趋势,而该序列是一直递增,不随季节波动,所以认为该序列不存在季节特征。
故对原序列做一阶差分,画出一阶差分后的时序图如下:difx140 130 120 110 100 90 80 70 60 50 40 30 20 10 0 -10从中可以看到一阶差分后序列仍然带有明显的增长趋势,再做二阶差分:80 - 70 - 60 - 50 - 40 - 30 - 20 - 10 - 0 - -10 - -20 - -30 - -40 - -50 --60 - -70 - -80 - -90 - -100 - -110 -做完二阶差分可以看到,数据的趋势已经消除,接下来对二阶差分后的序列进行19451950dif2x90 - 1945195519601965197019751980198519901995200019501955196019651970197519801985199019952000*检验:AutocorrelationsLag Covariance Correlation -1 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 1 Std Error0 577.333 1.00000 | |********************| 01 -209.345 -.36261 | *******| . | 0.0712472 -52.915660 -.09166 | .**| . | 0.0800693 9.139195 0.01583 | . | . | 0.0806004 15.375892 0.02663 . |* . | 0.0806155 -59.441547 -.10296 .**| . | 0.0806606 -23.834489 -.04128 | . *| . | 0.0813247 100.285 0.17370 | . |*** | 0.0814318 -146.329 -.25346 | *****| . | 0.0832909 52.228658 0.09047 | . |**. | 0.08711810 21.008575 0.03639 | . |* . | 0.08759311 134.018 0.23213 | . |***** | 0.08767012 -181.531 -.31443 | ******| . | 0.09073613 23.268470 0.04030 | . |* . | 0.09610814 71.112195 0.12317 | . |** . | 0.09619415 -105.621 -.18295 | ****| . | 0.09699116 37.591996 0.06511 . |* . | 0.09872717 23.031506 0.03989 | . |* . | 0.09894518 45.654745 0.07908 | . |** . | 0.09902719 -101.320 -.17550 | ****| . | 0.09934720 127.607 0.22103 | . |**** | 0.10090821 -61.519663 -.10656 | . **| . | 0.10333722 35.825317 0.06205 | . |* . | 0.10389323 -93.627333 -.16217 | .***| . | 0.10408124 55.451208 0.09605 | . |** . |从其自相关图中可以看出二阶差分后的序列自相关系数很快衰减为零,且都在两倍标准差范围之内,所以认为平稳,白噪声检验结果:Autocorrelation Check for White NoiseTo Chi- Pr >Lag Square DF ChiSq------------------- Autocorrelations -------------------6 30.70 6 <.0001 -0.363 -0.092 0.016 0.027 -0.103 -0.04112 84.54 12 <.0001 0.174 -0.253 0.090 0.036 0.232 -0.31418 97.98 18 <.0001 0.040 0.123 -0.183 0.065 0.040 0.07924 126.99 24 <.0001 -0.175 0.221 -0.107 0.062 -0.162 0.096P 值都小于 0.05 ,认为不是白噪声。
非平稳时间序列实验报告
实验报告----时间序列分析08经济统计I60814030王思瑶一、实验简介针对我国1978~2002年中国支出法GDP(单位:亿元)进行非平稳性检验、平稳化方法、模型建立及预测,从而掌握对非平稳时间序列的分析。
数据如下:二、非平稳性检验进行非平稳性检验,先用两种方法检验零均值化GDP的平稳性:1、自相关、偏自相关函数检验法Date: 06/09/11 Time: 22:00Sample: 1978 2002Included observations: 25Autocorrelation Partial Correlation AC PAC Q-Stat Prob. |****** | . |****** | 1 0.727 0.727 14.877 0.000. |**** | . | . | 2 0.530 0.001 23.111 0.000. |*** | . | . | 3 0.365 -0.044 27.199 0.000. |**. | . | . | 4 0.240 -0.022 29.055 0.000. |* . | . | . | 5 0.178 0.048 30.129 0.000. |* . | . | . | 6 0.159 0.057 31.022 0.000. |* . | . | . | 7 0.148 0.020 31.838 0.000. |* . | . | . | 8 0.136 0.006 32.572 0.000. |* . | . | . | 9 0.119 -0.001 33.165 0.000. |* . | . | . | 10 0.091 -0.014 33.540 0.000. | . | . | . | 11 0.057 -0.022 33.699 0.000. | . | . | . | 12 0.020 -0.031 33.719 0.001从上图可以看出:自相关函数是拖尾的,偏自相关函数是截尾的,但自相关函数是缓慢衰减的,这说明序列存在一定的非平稳性。
SAS学习系列38. 时间序列分析Ⅱ—非平稳时间序列的确定性分析
38. 非平稳时间序列的确定性分析实际中大多数时间序列是非平稳的,对非平稳时间序列的分析方法主要有两类:确定性分析和随机性分析。
确定性分析——提取非平稳时间序列明显的规律性(长期趋势、季节性变化、周期性),目的是:①克服其它因素影响,单纯测度出单一确定因素对序列的影响;②推断各种确定性因素彼此之间相互作用关系及它们对序列的综合影响。
随机性分析——分析非平稳时间序列由随机因素导致的随机波动性。
(一)趋势分析有的时间序列具有明显的长期趋势,趋势分析就是要找出并利用这种趋势对序列发展做出合理预测。
1. 趋势拟合法即把时间作为自变量,相应的序列观察值作为因变量,建立序列值随时间变化的回归模型。
分为线性拟合和非线性拟合。
2. 平滑法利用修匀技术,消弱短期随机波动对序列的影响,使序列平滑化,从而显示出长期趋势变化的规律。
(1)移动平均、加权移动平均已知序列值x1, …, x t-1, 预测x t的值为12ˆt t t n t x x x x n---+++= 称为n 期移动平均值,n 的选取带有一定的经验性,n 过长或过短,各有利弊,也可以根据均方误差来选取。
一般最新数据更能反映序列变化的趋势。
因此,要突出新数据的作用,可采用加权移动平均法:1122ˆt t n t n tw x x x xn ωωω---+++= 其中,111ni i n ω==∑. (2)二次移动平均对应线性趋势,移动平均拟合值有滞后性,可以采用二次移动平均加以改进:对移动平均值再做一次移动平均。
(3)指数平滑法指数平滑法是一种对过去观察值加权平均的特殊形式,观测值时间越远,其权数呈指数下降。
一次指数平滑法可用于对时间序列进行修匀,以消除随机波动。
预测公式为:1ˆˆ(1)t t t sx s αα-=+- 其中α∈(0, 1)为平滑常数,ˆt s 为第t 期平滑预测值,初始预测值0ˆs(通常取最初几个实测数据的均值)。
一般来说,时间序列有较大的随机波动时,宜选择较大的α值,以便能较快跟上近期的变化;也可以利用预测误差选择。
平稳性和非平稳时间序列分析
β1 + β 3 Xt 如果我们作下列变换 ecmt = Yt − 1− β2 α = β2 − 1 ,那么模型变为:
,
∆Yt = β 0 + β1∆X t + αecmt −1 + ε t
误差修正模型的自动调整机制类似于适应性预 期模型。如果误差修正项的系数 α 在统计上 是显著的,它将告诉我们 Y 在一个时期里的失 衡,有多大一个比例部分可在下一期得到纠正。 或者更应该说“失衡”对下一期 水平变化的 Y 影响的大小)。
16
具有协积性的非平稳序列各自的非平稳 趋势和波动有相互抵消的作用,因此虽 然非平稳本身有导致回归分析失效的影 响,但如果模型中的几个非平稳时间序 列具有协积性,回归分析仍然可以是有 效的,不需要担心非平稳性会造成问题。
17
(二)以两变量线性回归 Yt = β 0 + β1 X t + ε t 为例。 因为 ε t = Yt − β 0 − β1 X t,因此{ ε t }平稳就 是{ Yt − β 0 − β1 X t } { }平稳,这就意味着要 么 Yt 和 X t 本身都是平稳的,要么 Yt 和 X t 都是同阶单积并有协积关系。这两种 情况下模型的回归分析都是有效的。因 此只要误差序列{ ε t }平稳该模型就是有 效的。
13
对于经过差分变换仍然非平稳的时间序列,还可 以对差分序列再作差分变换,也就是对原序列 作两次差分变换。 如果两次差分变换得到的二次差分序列是平稳 的,则二次差分序列可用于计量分析。 如果二次差分序列仍然是非平稳的,还可以进 行三次差分,并根据三次差分序列的平稳性分 别处理。
14
依次类推,一个非平稳时间序列可以在 进行了d次差分才变为平稳序列。这种经 过d次差分才平稳的时间序列,称为d阶 “单积”(Integrated)的,并记为) 。 Integrated I (d
SAS学习系列39 时间序列分析Ⅲ—ARIMA模型
39. 时间序列分析Ⅱ——ARIMA 模型随着对时间序列分析方法的深入研究,人们发现非平稳序列的确定性因素分解方法(如季节模型、趋势模型、移动平均、指数平滑等)只能提取显著的确定性信息,对随机性信息浪费严重,同时也无法对确定性因素之间的关系进行分析。
而非平稳序列随机分析的发展就是为了弥补确定性因素分解方法的不足。
时间序列数据分析的第一步都是要通过有效手段提取序列中所蕴藏的确定性信息。
Box 和Jenkins 使用大量的案例分析证明差分方法是一种非常简便有效的确定性信息的提取方法。
而Gramer 分解定理则在理论上保证了适当阶数的差分一定可以充分提取确定性信息。
(一)ARMA 模型即自回归移动平均移动模型,是最常用的拟合平稳时间序列的模型,分为三类:AR 模型、MA 模型和ARMA 模型。
一、AR(p )模型——p 阶自回归模型 1. 模型:011t t p t p t x x x φφφε--=+++其中,0p φ≠,随机干扰序列εt 为0均值、2εσ方差的白噪声序列(()0t s E εε=, t ≠s ),且当期的干扰与过去的序列值无关,即E(x t εt )=0.由于是平稳序列,可推得均值011pφμφφ=---. 若00φ=,称为中心化的AR (p )模型,对于非中心化的平稳时间序列,可以令01(1)p φμφφ=---,*t t x x μ=-转化为中心化。
记B 为延迟算子,1()p p p B I B B φφΦ=---称为p 阶自回归多项式,则AR (p )模型可表示为:()p t t B x εΦ=.2. 格林函数用来描述系统记忆扰动程度的函数,反映了影响效应衰减的快慢程度(回到平衡位置的速度),G j 表示扰动εt -j 对系统现在行为影响的权数。
例如,AR(1)模型(一阶非齐次差分方程),1, 0,1,2,j j G j φ==模型解为0t j t j j x G ε∞-==∑.3. 模型的方差对于AR(1)模型,2221()()1t jt j j Var x G Var εσεφ∞-===-∑. 4. 模型的自协方差对中心化的平稳模型,可推得自协方差函数的递推公式:用格林函数显示表示:200()()i j t j t k j j kj i j j k G G E GG γεεσ∞∞∞---+=====∑∑∑对于AR(1)模型,21121()(0)1k k k εσγφγφφ==- 5. 模型的自相关函数 递推公式:对于AR(1)模型,11()(0)k k k ρφρφ==.平稳AR(p )模型的自相关函数有两个显著的性质: (1)拖尾性指自相关函数ρ(k)始终有非零取值,不会在k 大于某个常数之后就恒等于零;(2)负指数衰减随着时间的推移,自相关函数ρ(k)会迅速衰减,且以负指数k iλ(其中i λ为自相关函数差分方程的特征根)的速度在减小。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
运用SAS对谷物产量进行分析
一、摘要
利用SAS软件(程序见附录)判断谷物产量数据为平稳序列且为非白噪声序列,然后先后通过模型的识别、参数的估计、模型的优化、残差白噪声检验,确定AR(1)模型拟合时间序列显著有效。
由于时间序列之间的相关关系,且历史数据对未来数据有一定的影响,对未来5期的谷物生产量进行预测。
二、理论准备
首先判断序列的随机性和平稳性。
通过随机性检验,判断该序列是否为白噪声序列,如果是白噪声序列,就认为该随机事件没有包含任何值得提取的有用信息,我们就应该终止分析。
通过平稳性检验,序列可以分为平稳序列和非平稳序列。
如果序列平稳,通过相关计算进行模型拟合,并利用过去行为对将来行为进行预测,达到预测效果。
如果序列为非平稳,再确定模型为非平稳序列中四大类模型中的哪种种模型或者几种模型对序列的综合影响,通过把序列转化为平稳序列,再进一步分析。
三、数据选取
本实验采用某地区连续74年的谷物产量(单位:千吨),如下所示:
0.97 0.45 1.61 1.26 1.37 1.43 1.32 1.23 0.84 0.89 1.18 1.33 1.21 0.98 0.91 0.61 1.23 0.97 1.10 0.74 0.80 0.81 0.80 0.60 0.59 0.63 0.87 0.36 0.81 0.91 0.77 0.96 0.93 0.95 0.65 0.98 0.70 0.86 1.32 0.88 0.68 0.78 1.25 0.79 1.19 0.69 0.92 0.86 0.86 0.85 0.90 0.54 0.32 1.40 1.14 0.69 0.91 0.68 0.57 0.94 0.35 0.39 0.45 0.99 0.84 0.62 0.85 0.73
0.66 0.76 0.63 0.32 0.17 0.46
四、数据进行平稳性与纯随机性的检验与判别
(一)序列的纯随机性检验
图1序列延迟6阶LB检验结果
序列纯随机性检验结果显示延迟6阶LB检验统计量的P值小于1%的显著性水平0.0001,说明序列之间蕴含着很强的相关信息,即该序列是非随机性序列,为非白噪声。
(二)模型的平稳性检验——ADF检验
绘制该序列时序图:
图2序列时序图
该时序图显示该地区谷物产量在0.8千吨左右,波动比较平稳,但存在略微趋势。
运用单位根检验序列的平稳性。
序列时序图得到如下图:
图3 ADF检验图
ADF检验结果表示,单位根统计量ADF=-2.682929,在5%的显著性水平下,接受γ=0的原假设,即认为该序列非平稳且带有趋势。
为此对序列进行一阶差分(Y t=▽X t=X t-X t1 ),画出Y t的时序图如下
由时序图可以看出经过一阶差分后的序列平稳。
进一步对差分后的序列进行单位根检验,如图:
图4 一阶差分后的ADF检验图
从图中可以看出,在5%的显著性水平下,拒绝γ=0的假设,即通过一阶差分后,序列基于平稳。
下面便对一阶差分序列Y t进行分析。
五、模型的识别
令Y t=▽X t=X t-X t1
画出差分序列的自相关图和偏自相关图如下:
图5 样本自相关图
样本自相关图显示除了延迟一阶自相关系数在二倍标准差范围以外,其他阶数的自相关系数都在2倍标准差范围内波动。
根据自相关系数的这一特点可以初步判断该序列具有短期相关性,进一步确定序列平稳。
同时,可以认为该序列的自相关系数1阶截尾。
图6 样本偏自相关图
样本偏自相关图显示除了延迟1、2、3阶的偏自相关系数显著大于2倍标准差之外,其他的偏自相关系数都在2倍标准差范围内作小值随机波动,所以该偏自相关系数可认为3阶截尾。
为了模型定阶的准确性,下面采用BIC准则,对模型进行判断。
根据BIC准则,我们知道在所有通过检验的模型中使得BIC函数达到最小的模型为相对最优模型。
为此运用SAS输出所有自相关延迟阶数小于等于10,移动平均延迟阶数小于等于5的所有ARMA(p,q)模型的BIC信息量,如下图所示:
图7 ARMA(p,q)模型的BIC信息量
图表显示一阶差分序列Y t的BIC信息量最小的是MA(1)模型。
BIC统计量值为-2.8997。
可得该模型为MA(1)模型。
六、模型的参数估计
由BIC准则确定,该模型为MA( 1) 模型,运用SAS的ESTIMATE命令输出未知参数估计结果,如下图所示:
图8 模型参数估计
参数显著性结果显示常数项的参数t统计量的P值均大于0.05,即参数不显著。
然后通过更改命令,去掉常数项,得到的未知参数估计结果,如下图所示:
图9未知参数估计结果
此时参数显著性结果显示参数t统计量的P值小于0.05,即参数显著。
七、模型残差的白噪声检验
ESTIMATE命令输出的残差白噪声检验图如下所示:
图10残差白噪声检验
残差白噪声检验显示延迟6阶,延迟12阶,延迟18阶,延迟24阶LB检验统计量的P值均显著大于0.05,说明模型的残差为白噪声序列,即该MA(1)模型显著有效。
八、模型的确定
(一)、ESTIMATE命令输出的序列拟合统计量的值如下图所示:
图11 序列拟合统计量
这部分输出的五个统计量的值,由上到下分别是方差估计值、标准差估值、AIC信息量、SBC信息量及残差个数。
(二)、ESTIMATE命令输出的序列模型如下所示:
图12序列模型
由图中Factor 1 显示得出该序列的模型为:Y t=(1-0.79567B)εt,该式
也可写为:Y t=εt-0.79567ε1-t且δε2=0.267456 。
所以可以得出X t序列模型为ARIMA(0,1,1),即(1-B)X t=εt-0.79567ε1-t
且δε2=0.267456 。
九、模型的预测
运用SAS,对往后五期(即第75、76、77、78、79年)的谷物产量进行预测,得到以下结果:
从该输出结果显示第75、76、77、78、79年的预测值分别为0.5183、0.5183、0.5183、0.5183、0.5183。
在图表第四、第五列为预测值在95%置信度的置信上限和置信下限。
同时,得到预测图如下所示:
图14往后五期预测图
十、结论
(1)序列纯随机性检验结果显示序列是非随机性序列,为非白噪声,经一阶差分为平稳时间序列。
(2)样本自相关图显示差分后的序列自相关系数1阶截尾,样本偏自相关图显示偏自相关系数可认为3阶截尾。
(3)采用BIC准则判断模型为MA(1)模型。
(4)残差白噪声检验显示MA(1)模型显著有效。
附件
模型绘制时序图、平稳性与随机性检验、识别
data example;
input status@@;
difx=dif(status);
time=_n_;
cards;
0.97 0.45 1.61 1.26 1.37 1.43 1.32 1.23 0.84 0.89 1.18 1.33 1.21 0.98 0.91 0.61 1.23 0.97 1.10 0.74 0.80 0.81 0.80 0.60 0.59 0.63 0.87 0.36 0.81 0.91 0.77 0.96 0.93 0.95 0.65 0.98 0.70 0.86 1.32 0.88 0.68 0.78 1.25 0.79 1.19 0.69 0.92 0.86 0.86 0.85 0.90 0.54 0.32 1.40 1.14 0.69 0.91 0.68 0.57 0.94 0.35 0.39 0.45 0.99 0.84 0.62 0.85 0.73 0.66 0.76 0.63 0.32 0.17 0.46 ;
proc gplot;
plot status*time difx*time;
symbol v=star c=blue i=join;
run;
proc arima;
identify var=status(1,0) minic p=(0:10)q=(0:5);
run;
模型的参数估计
estimate q=1;
run;
estimate q=1 noint;
run;
模型序列的预测
forecast lead=5 id=time out=results;
run;
模型序列的预测图
proc gplot data=results;
plot status*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay; symbol1 c=black I=none v=star;
symbol2 c=red I=join v=none;
symbol3 c=green I=join v=none l=32;
run;
忽略此处..。