时间序列分析讲义 下
(整理)时间序列分析讲义__第01章_差分方程.
第一章 差分方程差分方程是连续时间情形下微分方程的特例。
差分方程及其求解是时间序列方法的基础,也是分析时间序列动态属性的基本方法。
经济时间序列或者金融时间序列方法主要处理具有随机项的差分方程的求解问题,因此,确定性差分方程理论是我们首先需要了解的重要内容。
§1.1 一阶差分方程假设利用变量t y 表示随着时间变量t 变化的某种事件的属性或者结构,则t y 便是在时间t 可以观测到的数据。
假设t y 受到前期取值1-t y 和其他外生变量t w 的影响,并满足下述方程:t t t w y y ++=-110φφ (1.1)在上述方程当中,由于t y 仅线性地依赖前一个时间间隔自身的取值1-t y ,因此称具有这种结构的方程为一阶线性差分方程。
如果变量t w 是确定性变量,则此方程是确定性差分方程;如果变量t w 是随机变量,则此方程是随机差分方程。
在下面的分析中,我们假设t w 是确定性变量。
例1.1 货币需求函数 假设实际货币余额、实际收入、银行储蓄利率和商业票据利率的对数变量分别表示为t m 、t I 、bt r 和ct r ,则可以估计出美国货币需求函数为:ct bt t t t r r I m m 019.0045.019.072.027.01--++=-上述方程便是关于t m 的一阶线性差分方程。
可以通过此方程的求解和结构分析,判断其他外生变量变化对货币需求的动态影响。
1.1.1 差分方程求解:递归替代法差分方程求解就是将方程变量表示为外生变量及其初值的函数形式,可以通过以前的数据计算出方程变量的当前值。
由于方程结构对于每一个时间点都是成立的,因此可以将(1.1)表示为多个方程:0=t :01100w y y ++=-φφ 1=t :10101w y y ++=φφt t =:t t t w y y ++=-110φφ依次进行叠代可以得到:1011211010110101)()1()(w w y w w y y ++++=++++=--φφφφφφφφ0111122113121102)1(w w w y y φφφφφφφ++++++=-i ti i t t i it w y y ∑∑=-=++=011110φφφφ (1.2)上述表达式(1.2)便是差分方程(1.1)的解,可以通过代入方程进行验证。
精选时间序列分析时间序列讲解讲义
§1.2 平稳序列
一· 平稳序列
定义 如果时间序列 {X t} {X t : t N满}足
(1) 对任何的
t
N,
EX
2 t
(2) 对任何的 t N , EX t
(3) 对任何的 t, s N , E[( X t )( X s )] ts
就称是 X平t 稳时间序列,简称时间序列。称实数 为 的{自 t协} 方差X函t 数。
a则j 称 是绝对可{a和j}的。
j
对于绝对可和的实数列
,{a{定Xj}{义tX}零t}均值白噪声 的无穷{滑t动} 和
如下 X t a j t j ,t ,Z则 是{X平t}稳序列。下面说明 是
j
{X t}
平稳序列。
由 Schwarz不等式得到
E[ a jt j ] a j E t j a j
j0
k
q
0, k q
{ X t }平稳
第三十七页,共74页。
例:X t t 0.36 * t1 0.85 * t2 , t ~ WN (0,22 )
第三十八页,共74页。
概率极限定理:
定理 (单调收敛定理) 如果非负随机变量序列单调不减: 0 1 2
lim 则当 n ,a时s ,有 E
{St }
3. 随机项估计即为
方法一:分段趋势法
1 趋势项(年平均)
第五页,共74页。
减去趋势项后,所得数据 {Xt Tˆt}
第六页,共74页。
2、季节项 {Sˆt}
第七页,共74页。
3.随机项的估计 Rˆt xt Tˆt Sˆt ,t 1,2,,24.
第八页,共74页。
方法二:回归直线法
当 0, 2 称1为标准白噪声。
时间序列分析讲义
– 在SAS系统中有一个专门进行计量经济与时间序列分析 的模块:SAS/ETS。SAS/ETS编程语言简洁,输出功能强 大,分析结果精确,是进行时间序列分析与预测的理 想的软件
– 由于SAS系统具有全球一流的数据仓库功能,因此在进 行海量数据的时间序列分析时它具有其它统计软件无 可比拟的优势
例2.3自相关图
时间序列分析讲义
例2.4时序图
时间序列分析讲义
例2.4 自相关图
时间序列分析讲义
例2.5时序图
时间序列分析讲义
例2.5自相关图
时间序列分析讲义
• 例2.3时序为非平稳的,有趋势; • 例2.4时序非平稳性,有趋势 • 例2.5时序是一个平稳的
时间序列分析讲义
非平稳性序列的平稳化
时间序列分析讲义
2020/11/16
时间序列分析讲义
第一章 时间序列分析基本概 念
时间序列分析讲义
第一章 时间序列分析基本概念
1.1 时间序列的定义
• 随机序列:按时间顺序排列的一组随机变量
• 观察值序列:随机序列的 个有序观察值,称之为 序列长度为 的观察值序列
• 随机序列和观察值序列的关系
– 观察值序列是随机序列的一个实现 – 我们研究的目的是想揭示随机时序的性质 – 实现的手段都是通过观察值序列的性质进行推断
满足下列条件的随机序列称为白噪声序列,也称 为纯随机序列:
注1:白噪声序列也是平稳时间序列中的特例. 注2:由于白噪声序列不同时刻的值相互独立,那么 这样的序列数值不能对于将来进行推断与预测,所以 白噪声是不能建立模型的。 时序图1.3符合白噪声序列特征
时间序列分析讲义
若满足时间序列满足: 称该时间序列是周期为T的时间序列.
时间序列分析法讲义
2004
(4) 1451604 1494570 1478651 1577307 6002132
季别累计
(5) 5277839 5503950 5333203 5724816 21839808
季别平均 季节指数
(6) 1319460 1375988 1333301 1431204 1364988
(7) 0.9666 1.0081 0.9768 1.0485 4.0000
97
8
20 -1 503 - 1
07
50
3
20 0 526 0 0 08
20 1 559 55 1
09
9
解:设t表示年次,y表示年发电量,则方成为:y=a+bt
a y 2677 535.4
n5
b ty 278 27.8 t 2 10
y=535.4+27.8t
当t=3时,y=618.8
指数平滑法是生产预测中常用的一种方法。 也用于中短期经济发展趋势预测,
(1) 一次指数平滑法(单重指数平滑法)
X t1
S (1) t
X t
(1
)S
(1) t 1
一次指数平滑法的初值的确定有几种方法
(A) 取第一期的实际值为初值(数据资料较多);S0(1) X1 (B) 取最初几期的平均值为初值(数据资料较少)。
2、指数的分类 (1)个体指数:反映某一具体经济现象动态变动的相
对数
(2)综合指数:反映全部经济现象动态变动的相对数
(3)数量指标指数:它是表明经济活动结果数量 多少的指数。
(4)质量指标指数:它是表明经济工作质量好坏 的指数。
(5)定基指数:它是指各个指数都是以某一个固 定时期为基期而进行计算的一系列指数。
时间序列分析课件讲义
3.5E+09 3.0E+09 2.5E+09 2.0E+09 1.5E+09 1.0E+09
5.0E+08 99:01 99:07 00:01 00:07 01:01 01:07 02:01 02:07
Y
8
单变量时间序列分析
趋势模型
确定型趋势模型
平滑模型 季节模型
水平模型
加法模型
9
乘法模型
ARMA模型 ARIMA模型 (G)ARCH类模型
42
(2)ADF检验 DF检验只对存在一阶自相关的序列适用。 ADF检验 适用于存在高阶滞后相关的序列。 y = y t 1 + t
表述为
y t = y t 1 + t
t
存在高阶滞后相关的序列,经过处理可以表述为 y t = y t 1 + 1yt 1+ 2yt 2 + ....... + p1yt p1 + t 上式中,检验假设为
34
特别地,若 其中,{ t }为独立同分布,且E( t ) = 0,
D( t )
2 = <
yt= y t 1+ t
t = 1,2,......
,则{
(random waik process) 。可以看出,随机游动过程是 单位根过程的一个特例。
yt }为一随机游动过程
(2) 季节差分
3. 随机性
23
(四)ARMA模型及其改进 1. 自回归模型 AR(p) 模型的一般形式
( B) yt
=
et
AR (p) 序列的自相关和偏自相关 rk :拖尾性 k :截尾性
时间序列分析课件讲义
3.5E+09 3.0E+09 2.5E+09 2.0E+09 1.5E+09 1.0E+09
5.0E+08 99:01 99:07 00:01 00:07 01:01 01:07 02:01 02:07
Y
8
单变量时间序列分析
趋势模型
确定型趋势模型
平滑模型 季节模型
水平模型
加法模型
9
乘法模型
ARMA模型 ARIMA模型 (G)ARCH类模型
yt 可以用既往的 et 有限加权和表出 et 可以用既往的 yt 无限加权和表出
26
相关函数
平稳与可逆
若一个序列可以用无限阶的自回归模型逼近,即逆 函数存在,称为具有可逆性,也就是可逆的。
27
3. 自回归移动平均混合模型 ARMA( p, q ) 模型的一般形式 ARMA (p , q) 序列 的自相关和偏自相关 4. 改进的ARMA模型 ARIMA( p , d , q ) s ) ARIMA (P,D,Q ARIMA(p,d,q) (P,D,Q ) s
例:我国商品零售量指数
15
(三)模型分析与评价
1. 检验 各种不同模型有不同的检验 关键——模型已提取所有信息 2. 对历史数据拟合的分析 直观判断法 图、表 误差分析法 MAPE 3. 对未来趋势反映的分析 近期趋势的反映 直观判断 误差分析 试预测 预测结果的可能性分析
16
二、ARMA模型
(一)模型的引进
多元线性回归 自回归 移动平均模型 简单平均:序列平稳 围绕均值波动
FT 1 = Y =
FT 2
=
Y
=
y1 y2 ... yT T y1 y2 ... yT yT 1 T
时间序列分析PPT授课课件
2.3 181 323.625 5.1 324 432.125 7.3 390 525.500
2.4 753 341.750 5.2 224 426.000 7.4 978 542.750
3.1 269 357.875 5.3 284 417.000 8.1 483
20232./23/23 214 374.875 5.4 822 427.000 8.2 320
2.乘法模型(时间序列的变化在每周期有与趋 势相同的比例时适用)
假定四种变动因素之间存在着交互作用 y=T×S × C × R
同样可简化为: y=T×S × R y=T×S
2022/3/23
5
第二节 长期趋势的测定
一.数学模型法
设时间序列的数据为(ti,yi)
设直线趋势方程为:
yt a bt
1.4 733 283.699 2.584 3.4 860 363.819 2.364
2.1 224 293.714 0.763 4.1 345 373.834 0.923
2.2 114 303.729 0.375 4.2 203 383.849 0.529
2.3 181 313.744 0.577 4.3 233 393.864 0.592
(2)求周期每一点的算术平均数(或几何平均数)得 到一个周期的季节因子
(3)对季节因子进行修正
若为季度数据,则S1+S2+S3+S4=4;
若为月度数据,则S1+S2+ …+S12=12。
2022/3/23
19
第三节 季节变动的测定
(资料见例1)
年.
季 度
销售 额Y
趋势值T
季节因子 Y/T
专题1时间序列分析课件
第7章 时间序列分析 7.2 时间序列的水平分析
时间序列的水平指标
1.发展水平
2.平均发展水平 序时平均数
逐期增长量
3.增长水平
累计增长量
平均增长量
第7章 时间序列分析 7.2 时间序列的水平分析
7.2.1 发展水平
7.3.4 平均增长速度
平均增长速度=平均发展速度-1
年份 (年)
2000 2001
符号
商品销 累计增 逐期增 售总额 长量 长量 (万) (万) (万)
定基 发展 速度 (%)
环比 发展 速度 (%)
定基 增长 速度 (%)
环比 增长 速度 (%)
增长1% 绝对值 (万)
a0 400 —
—
—
—
——
(2)相对序列的序时平均数
(1)绝对序列的序时平均数
1)根据时期序列计算序时平均数
a
1 n
(a1
a2
an )
例:某企业一月份产值为125万元,二月份产值为 130万元,三月份产值为135万元,则按上式计算 第一季度平均月产值为:
a 1 (125 130 135) 130(万元) 3
2)根据时点序列计算序时平均数 ①由连续间隔相等的时点序列资料计算序时平均数
7.4.2 长期趋势的测定
1、测定长期趋势的意义与目的 测定长期趋势就是用一定的方法对时间序列进行修匀,以 消除序列中季节变动、循环波动和不规则变动等因素的影 响,以显示出现象变动的基本趋势,作为预测的依据。 (1)反映现象发展变化的趋向,掌握现象变化的规律,为经 营决策和制定长远规划提供依据; (2)为统计预测提供必要的条件; (3)将长期趋势从时间序列中分离出来,更好地测定和分析 其余因素的变动。
时间序列分析讲义(2)
(3) 最大似然估计法(MLE )首先大家打开教材第43页看,我们纠正教材中的错误。
它说: “对于一组相互独立的随机变量),,2,1(,T t tx =,当得到一个样本),,,(21T x x x 时,似然函数可表示为∏===T t t x f x f x f x f T x x x L 1)()2()2()1(),,2,1(γγγγγ 式中),,,(21k γγγγ =是一组未知参数”。
我们知道时间序列一般不是独立的,而是相依的离散时间随机过程。
因此,得到的样本),,,(21T x x x 不可能是相互独立的,似然函数绝不是以上概率密度乘积的形式。
所以,教材中这一段是错误的。
似然函数在估计理论中有着根本的重要性的一个原因是因为“似然原理”。
这个原理说:已知假定的模型是正确的,数据非得告诉我们的关于参数的全部包含在似然函数中,数据的所有其他方面是不切题的。
实际上,一般的ARMA 过程(含AR 、MA 过程)参数的最大似 然估计计算过程很复杂。
至少有三种方法写出精确的似然函数:向后预报法、递推预报法、状态空间与卡尔曼(Kalman )滤波法。
我们讲只对递推预报法最简要介绍,从而为引出模型选择的AIC 、BIC 信息准则铺平道路。
我们先以最简单的因果的AR(1)过程的MLE 为例,说明MLE 的主要思想。
考虑因果的AR(1)过程,满足模型tu t X t X +-+=110φφ, ),0(~2σN IID t u , 且11<φ。
则均值为 )(110t X E =-=φφμ。
我们以),1,(2σφμ为三个未知参数,而)11(0φμφ-=不作独立的未知参数。
模型中心化为 tu t X t X +--=-)1(1μφμ。
设已得到了样本值),,,(21T x x x 。
则关于参数),1,(2σφμ的似然函数为 )2,1,;1()2,1,;12()2,1,;2,,2,11()2,1,;1,,1(),,2,1;2,1,(σφμσφμσφμσφμσφμx f x x f T x x x T x f T x x T x f Tx x x L ⨯---= 联合概率密度在样本值),,,(21T x x x 处的值写为条件概率密度和最后一个无条件概率密度的乘积。
时间序列析课件资料
803 896 1070 1331 1781 2311 2726 2944 3094
时间序列的分类时间序列Fra bibliotek绝对数序列 相对数序列 平均数序列
时期序列 时点序列
时间序列的分类
1. 绝对数时间序列
一系列绝对数按时间顺序排列而成 时间序列中最基本的表现形式 反映现象在不同时间上所达到的绝对水平 分为时期序列和时点序列
2. 再进行对比,即得相对数或平均数序列的 序时平均数
3. 基本公式为:
Y a b
相对数序列的序时平均数
(计算方法与实例)
【例4.3】已知1994~1998年我国的国内生产总值及构 成数据如表4-3。计算1994~1998年间我国第三产业国 内生产总值占全部国内生产总值的平均比重
表4- 3 我国国内生产总值及其构成数据
年份
1994 1995 1996 1997 1998
国内生产总值(亿元)
46759.4 58478.1 67884.6 74772.4 79552.8
其中∶第三产业(亿元) 14930.0 17947.2 20427.5 24033.3 26104.3
比重(%)
31.9 30.7 30.1 32.1 32.8
平均发展速度
R n
Yi 4 120.2% 113.8% 117.7% 108.6% Yi1
4 26104.3 114.99% 14930.0
平均增长率
G R 1 114.99% 1 14.99%
平均发展速度—几何平均法
1. 从最初水平Y0出发,每期按平均发展速度发 展,经过n期后将达到最末期水平Yn, ;按平 均发展速度推算的最后一期的数值与最后一 期的实际观察值一致。
时间序列分析讲义 第02章 滞后算子
第二章 滞后算子及其性质滞后算子是对时间序列进行动态线性运算的主要工具,利用滞后算子可以使得一些非线性运算非常简洁。
§2.1 基本概念时间序列是以观测值发生的时期作为标记的数据集合。
一般情况下,我们是从某个特定的时间开始采集数据,直到另一个固定的时间为止,我们可以将获得的数据表示为:),,,(21T y y y如果能够从更早的时间开始观测,或者观测到更晚的时期,那么上面的数据区间可以进一步扩充。
相对而言,上述数据只是一个数据的片段,整个数据序列可以表示为:+∞=-∞==t t t T y y y y }{),,,,,,(21例2.1 几种代表性的时间序列(1) 时间趋势本身也可以构成一个时间序列,此时:t y t =;(2) 另一种特殊的时间序列是常数时间序列,即:c y t =,c 是常数,这种时间的取值不受时间的影响;(3) 在随机分析中常用的一种时间序列是高斯白噪声过程,表示为:t t y ε=,+∞=-∞=t t t }{ε是一个独立随机变量序列,每个随机变量都服从),0(2σN 分布。
时间序列之间也可以进行转换,类似于使用函数关系进行转换。
它是将输入时间序列转换为输出时间序列。
例2.2 几种代表性的时间序列转换(1) 假设t x 是一个时间序列,假设转换关系为:t t x y β=,这种算子是将一个时间序列的每一个时期的值乘以常数转换为一个新的时间序列。
(2) 假设t x 和t w 是两个时间序列,算子转换方式为:t t t w x y +=,此算子是将两个时间序列求和。
定义2.1 如果算子运算是将一个时间序列的前一期值转化为当期值,则称此算子为滞后算子,记做L 。
即对任意时间序列t x ,滞后算子满足:1)(-≡t t x x L (1)类似地,可以定义高阶滞后算子,例如二阶滞后算子记为2L ,对任意时间序列t x ,二阶滞后算子满足:22)]([)(-=≡t t t x x L L x L (2)一般地,对于任意正整数k ,有:k t t k x x L -=)( (3)命题2.1 滞后算子运算满足线性性质: (1) )()(t t x L x L ββ= (2) )()()(t t t t w L x L w x L +=+证明:(1) 利用滞后算子性质,可以得到:)()(1t t t x L x x L βββ==-(2) )()()(11t t t t t t w L x L w x w x L +=+=+-- End 由于滞后算子具有上述运算性质和乘法的交换性质,因此可以定义滞后算子多项式,它的作用是通过它对时间序列的作用获得一个新的时间序列,并且揭示这两个时间序列之间的关系。
时间序列分析基本知识讲解
时间序列分析基本知识讲解时间序列分析是指对一系列按时间顺序排列的数据进行统计分析和预测的方法。
它是统计学中的一个重要分支,在许多领域中都有广泛的应用,例如经济学、金融学、气象学等。
在时间序列分析中,我们通常假设观察到的数据是由内部的趋势、季节性和随机性构成的。
首先要介绍的概念是时间序列。
时间序列是按时间顺序记录的一组数据点,其中每个数据点代表某个变量在特定时间点的观测值。
每个数据点可以是连续的时间单位,如小时、天、月或年,也可以是离散的时间单位,如季度或年度。
时间序列数据通常包含趋势、季节性和随机成分。
趋势是时间序列长期上升或下降的的总体倾向,它可以是线性的,也可以是非线性的。
季节性是周期性出现在时间序列中的模式,它在一年中的特定时间段内循环出现,如一年中的季节、月份或周几。
随机成分是不可预测的随机波动,可能是由于外部因素或不可预见的事件引起的。
时间序列分析的目标通常有三个:描述、检验和预测。
描述的目标是对时间序列的特征进行统计分析,通过计算均值、方差、自相关系数等指标来揭示数据的规律和模式。
检验的目标是验证时间序列数据是否满足一定的假设条件,例如平稳性、白噪声等。
预测的目标是基于已有的时间序列数据来预测未来的值。
预测方法可以是单变量的,只使用时间序列自身的历史数据来进行预测;也可以是多变量的,将其他相关变量的信息纳入预测模型。
在时间序列分析中,有一些重要的概念和方法需要掌握。
首先是平稳性。
平稳性是指时间序列的均值、方差和自相关结构在时间上的不变性。
平稳性是许多时间序列模型的基本假设,它能够简化模型的建立和推断。
其次是自相关性。
自相关性是指时间序列中的观测值之间的相关性。
自相关结构可以通过自相关函数(ACF)和偏自相关函数(PACF)来描述,其中ACF表示不同时滞的自相关系数,PACF表示在剔除之前的滞后时其他滞后效应后,特定滞后的自相关系数。
另外,还有移动平均、自回归过程和ARMA模型等重要的方法和模型。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
时间
价格
1
101
2 2 4 5
82
66
35
31 7
我们可以运行如下程序:
data example ; input price@@; t=_n_; cards; 101 82 66 35 31 7 ; run;
可以在数据库WORK看见数据集example数据集中有两 个变量t和price。
我们没有输入时间变量的数据,但“t=_n_”命令 自动给时间变量赋值 。
第三章 SAS-ARIMA模型过程简介 ARIMA模型过程有三个阶段:
模型识别与定阶 参数估计与模型诊断 预测
SAS是通过IDENGTIFY、 Estimate及forecast三个语句来实 现这三个阶段的。
3.1 模型识别
模型的识别可以通过IDENGTIFY语句实现 。
第二章提到,SAS的ARIMA过程中的IDENGTIFY 语句,不仅可以实现白噪声和平稳性的检验,还 可以实现序列模型的识别。
可以在数据库WORK看见数据集ex1_2数据集中有两个 变量t和price。
format t monyy.指定时间的输出格式 此处monyy.指定时间的输出格式为月-年。
3、 外部数据的读取
1.2 数据的处理 1、序列变换
data example1_3;input price@@; t=intnx('month','1jan2005'd,_n_-1); logp=log(price); format t monyy.; cards; 3.41 3.45 3.42 3.53 3.45 ; run;
方法2
data example1_1;input price@@; cards; 3.41 3.45 3.42 3.53 3.45 ; run;
说明:
(1)这2种方法都可以创建一个名叫example的临时 数据集,保存在数据库WORK中,本次开机可调用,关 机后数据不保存。 SAS提供了两个通用数据库:临时数据库WORK 和永 久数据库SASUSER。 SAS数据命名采用二级制:数 据库名.数据集名。
;
run;
格式2 Data 数据集名;
input 变量名1 变量名2@@;
cards; 数据
;
run;
例1-1 录入数据 3.41 3.45 3.41;input price;
cards; 3.41 3.45 3.42 3.53 3.45 ; run;
各参数均显著,均值不显著(其对应的P值0.9968大于 0.05)。
可以在数据库WORK看见数据集ex1_3数据集中有3 个变量。
2、子集
data example1_4;set example1_3; keep t logp; where t>='01mar2005'd; proc print data=example1_4;run;
可以在数据库WORK看见数据集example1_4:
3、缺失值插值
data example1_5;input price@@; t=intnx('month','1jan2005'd,_n_-1); format t date.;cards; 3.41 3.45 . 3.53 3.45 ; proc expand data=example1_5 out=example1_6;id t; proc print data=example1_5 ; proc print data=example1_6;run;
以数据集example3_1为例来说明SAS序列模 型的识别的语句。
例3.1
data example3_1; input x@@; time=_n_; cards; 0.30 -0.45 0.36 0.00 0.17 0.45 2.15 4.42 3.48 2.99 1.74 2.40 0.11 0.96 0.21 -0.10 -1.27 -1.45 -1.19 -1.47 -1.34 -1.02 -0.27 0.14 -0.07 0.10 -0.15 -0.36 -0.50 -1.93 -1.49 -2.35 -2.18 -0.39 -0.52 -2.24 -3.46 -3.97 -4.60 -3.09 -2.19 -1.21 0.78 0.88 2.07 1.44 1.50 0.29 -0.36 -0.97 -0.30 -0.28 0.80 0.91 1.95 1.77 1.80 0.56 -0.11 0.10 -0.56 -1.34 -2.47 0.07 -0.69 -1.96 0.04 1.59 0.20 0.39 1.06 -0.39 -0.16 2.07 1.35 1.46 1.50 0.94 -0.08 -0.66 -0.21 -0.77 -0.52 0.05 ;
序列偏相关图
序列白噪声检验
分析: 白噪声检验显示该序列不是白噪声,可以建模;自 相关和偏相关函数都较快趋于零,判别为平稳过程; 注意到自相关函数在3步之后小于2倍标准差,认为自 相关函数在3步截尾,偏相关函数6步还未进入2倍标准 差,看做拖尾,所以初步判别模型为MA(3)
3.2 参数估计与诊断
可以在数据库WORK看见数据集example1_4:
“proc print data=example1_5 ;” 是查看语句,可以在输出窗口看到两个数据集。
第二章 SAS-时间序列预处理 2.1 时间序列图形 SAS时间序列作图的程序语句格式为: PROC GPLOT 数据集名 表明要对该数据集中的数据做图。
平稳性检验的目的是确定该时序可不可以直接建 模,平稳序列(非白噪声)可以直接建模,非白噪 声非平稳(非白噪声)序列需要先做差分处理,然 后建模。
SAS的ARIMA过程中的IDENGTIFY语句,提供了白 噪声检验的结果,同时提供了醒目的自相关、偏相 关函数图,可以帮助判 别平稳性。
事实上,通过IDENGTIFY语句,还可以实现序列 模型的识别,这个在下一章详细介绍。
等间隔的年份时间数据可以利用间隔函数输入: 例1-2 录入下表中的数据:
我们可以运行如下程序:
data example1_2 ;input price@@; t=intnx('month','1jan2005'd,_n_-1); format t monyy.; cards; 101 82 66 35 31 7 ; run;
(2)input语句中加@@,则录入可以按行录入, SAS按行读取数据;否则SAS按列读取数据。
注1:也可以建立自己的永久数据库。
注2:把录入数据的程序文件以.SAS文件形式保存下来, 这样数据也得到保存。启动文件,即产生临时数据集。
2、 等间隔时间数据的录入
SAS提供了命令或函数,可以更具需要自动产生等间隔的时间数据。 例 录入下表中的数据:
proc gplot data= example3_1; plot x*time=1; symbol1 c=red,i=join,v=star; run; proc arima data=example3_1; identify var=x ; run;
本例IDENGTIFY得到的信息:
序列自相关图
拟合MA(3): estimate q=3; run;
三、系数相关阵 四、残差相关检验(白噪声) 五、拟合模型形式
一般,我们通过参数估计看参数是否通过显著性检验; 通过残差相关检验(白噪声)看模型是否通过显著性 检验,检验通过的模型,写出具体的形式。
本例拟合MA(3) 的模型参数估计结果:
均值不显著,其他参数均显著。 注:若模型通过检验,还需要建立均值为0的优化模型。
例2.2
data example2_2; input fred@@; year=intnx('year','1jan1970'd,_n_-1); format year year4.; cards; 97 154 137.7 149 164 157 188 204 179 210 202 218 209 204 211 206 214 217 210 217 219 211 233 316 221 239 215 228 219 239 224 234 227 298 332 245 357 301 389 ; proc arima data= example2_2; identify var=fred; run;
下面看模型检验:
本例拟合MA(3),得到模型的残差的白噪声检验结 果:
滞后6步检验的P值0.0010<0.05,认为残差不是白噪声。 所以该模型没有通过检验。
那么如何寻找该序列的适合模型呢?
时间序列还提供了利用最佳判别准则来选择模型的方法。 最佳判别准则有AIC准则,BIC准则、SBC准则,都是基于 估计误差和模型简洁2性的准则,以值小的为佳。
我们用利用AIC准则最佳判别准则来选择模型。
在IDENTIFY中添加MINIC语句,即可求得模型的BIC 值。
再拟合MA(4)模型: estimate q=4; run;
本例拟合MA(4) 的白噪声检验结果:
白噪声检验统计量的所有P值都大于0.05, 说明残 差序列为白噪声。模型检验通过。
本例拟合MA(4) 的模型参数估计结果:
若命名中没有数据库名,则默认为临时数据库WORK 。
若改为如下的程序:
data sassuser.example1_1; input price@@; cards; 3.41 3.45 3.42 3.53 3.45 ; run;
就创建了一个名叫 example1_1的永久数据集,保 存在永久数据库SASUSER中,关机后数据保存。
时间序列分析讲义(下)
前面,我们已经介绍了时间序列建模的基本原理、 方法和步骤。