时间序列分析讲义(下)
时间序列分析讲义
– 在SAS系统中有一个专门进行计量经济与时间序列分析 的模块:SAS/ETS。SAS/ETS编程语言简洁,输出功能强 大,分析结果精确,是进行时间序列分析与预测的理 想的软件
– 由于SAS系统具有全球一流的数据仓库功能,因此在进 行海量数据的时间序列分析时它具有其它统计软件无 可比拟的优势
例2.3自相关图
时间序列分析讲义
例2.4时序图
时间序列分析讲义
例2.4 自相关图
时间序列分析讲义
例2.5时序图
时间序列分析讲义
例2.5自相关图
时间序列分析讲义
• 例2.3时序为非平稳的,有趋势; • 例2.4时序非平稳性,有趋势 • 例2.5时序是一个平稳的
时间序列分析讲义
非平稳性序列的平稳化
时间序列分析讲义
2020/11/16
时间序列分析讲义
第一章 时间序列分析基本概 念
时间序列分析讲义
第一章 时间序列分析基本概念
1.1 时间序列的定义
• 随机序列:按时间顺序排列的一组随机变量
• 观察值序列:随机序列的 个有序观察值,称之为 序列长度为 的观察值序列
• 随机序列和观察值序列的关系
– 观察值序列是随机序列的一个实现 – 我们研究的目的是想揭示随机时序的性质 – 实现的手段都是通过观察值序列的性质进行推断
满足下列条件的随机序列称为白噪声序列,也称 为纯随机序列:
注1:白噪声序列也是平稳时间序列中的特例. 注2:由于白噪声序列不同时刻的值相互独立,那么 这样的序列数值不能对于将来进行推断与预测,所以 白噪声是不能建立模型的。 时序图1.3符合白噪声序列特征
时间序列分析讲义
若满足时间序列满足: 称该时间序列是周期为T的时间序列.
时间序列分析法讲义
2004
(4) 1451604 1494570 1478651 1577307 6002132
季别累计
(5) 5277839 5503950 5333203 5724816 21839808
季别平均 季节指数
(6) 1319460 1375988 1333301 1431204 1364988
(7) 0.9666 1.0081 0.9768 1.0485 4.0000
97
8
20 -1 503 - 1
07
50
3
20 0 526 0 0 08
20 1 559 55 1
09
9
解:设t表示年次,y表示年发电量,则方成为:y=a+bt
a y 2677 535.4
n5
b ty 278 27.8 t 2 10
y=535.4+27.8t
当t=3时,y=618.8
指数平滑法是生产预测中常用的一种方法。 也用于中短期经济发展趋势预测,
(1) 一次指数平滑法(单重指数平滑法)
X t1
S (1) t
X t
(1
)S
(1) t 1
一次指数平滑法的初值的确定有几种方法
(A) 取第一期的实际值为初值(数据资料较多);S0(1) X1 (B) 取最初几期的平均值为初值(数据资料较少)。
2、指数的分类 (1)个体指数:反映某一具体经济现象动态变动的相
对数
(2)综合指数:反映全部经济现象动态变动的相对数
(3)数量指标指数:它是表明经济活动结果数量 多少的指数。
(4)质量指标指数:它是表明经济工作质量好坏 的指数。
(5)定基指数:它是指各个指数都是以某一个固 定时期为基期而进行计算的一系列指数。
时间序列分析课件讲义
3.5E+09 3.0E+09 2.5E+09 2.0E+09 1.5E+09 1.0E+09
5.0E+08 99:01 99:07 00:01 00:07 01:01 01:07 02:01 02:07
Y
8
单变量时间序列分析
趋势模型
确定型趋势模型
平滑模型 季节模型
水平模型
加法模型
9
乘法模型
ARMA模型 ARIMA模型 (G)ARCH类模型
42
(2)ADF检验 DF检验只对存在一阶自相关的序列适用。 ADF检验 适用于存在高阶滞后相关的序列。 y = y t 1 + t
表述为
y t = y t 1 + t
t
存在高阶滞后相关的序列,经过处理可以表述为 y t = y t 1 + 1yt 1+ 2yt 2 + ....... + p1yt p1 + t 上式中,检验假设为
34
特别地,若 其中,{ t }为独立同分布,且E( t ) = 0,
D( t )
2 = <
yt= y t 1+ t
t = 1,2,......
,则{
(random waik process) 。可以看出,随机游动过程是 单位根过程的一个特例。
yt }为一随机游动过程
(2) 季节差分
3. 随机性
23
(四)ARMA模型及其改进 1. 自回归模型 AR(p) 模型的一般形式
( B) yt
=
et
AR (p) 序列的自相关和偏自相关 rk :拖尾性 k :截尾性
《时间序列分析》讲义
第1章 差分方程和滞后算子第一节 差分方程一.一阶差分方程假定t 期的y (输出变量)和另一个变量w (输入变量)和前一期的y 之间存在如下动态方程:1t t y y w φ-=+ (1)则此方程为一阶线性差分方程,这里假定w 为一个确定性的数值序列。
差分方程就是关于一个变量与它的前期值之间关系的表达式。
一阶差分方程的典型应用为美国货币需求函数:10.270.720.190.0450.019t t t bt ct m m I r r -=++--0.270.190.0450.019t t bt ct w I r r =+--其中t m 为货币量,t I 为真实收入,bt r 为银行账户利率,ct r 为商业票据利率。
1)用递归替代法解差分方程 根据方程(1),可以得到0101012121012t t ty y w y y w y y w ty y w φφφφ--=+=+=+=+ (2) 如果我们知道1t =-期的初始值1y -和w 的各期值,则可以通过动态系统得到任何一个时期的值。
即11101....t t t t t y y w w w φφφ+--=++++ (3)这个过程称为差分方程的递归解法。
2)动态乘子:对于方程(3),如果0w 随1y -变动,而1,...,t w w 都与1y -无关,则0w 对t y 得影响为:0tt y w φ∂=∂或t j j ty w φ+∂=∂ (4) 方程(4)称为动态系统的乘子,或脉冲响应函数(即暂时性影响)。
动态乘子依赖于j ,即输入t w 的扰动和输出t j y +的观察值之间的时间间隔。
对于方程(1),当01φ<<时,动态乘子按几何方式衰减到零;当10φ-<<,动态乘子振荡衰减到零;1φ>,动态乘子指数增加;1φ<-,动态乘子发散性振荡。
因此,1φ<,动态系统稳定,即给定t w 的变化的后果将逐渐消失。
时间序列分析教材(PPT 109页)
11244 11429 11518 12607 13351 15974
490.83
27.5 17921
545.46
29.2 20749
648.30
29.0 35418
第三章 时间序列分析
三、时间序列的编制原则
(一)总体范围应该一致 (二)统计指标的经济内容应该一致 (三)统计指标的计算方法、计算价格和计量单
表1:某种股票1999年各统计时点的收盘价
统计时点 1月1日 3月1日 7月1日 10月1日 12月31日
作用: 反映社会经济现象发展变化的过程和特点,研
究社会经济现象发展变化的趋势和规律以及对未来 状态进行预测的重要依据
第三章 时间序列分析
表3-2 某市社会劳动者、国内生产总值、社会劳动生产率时间序列
年份
1995 1996 1997 1998 1999
2000
2001
2002
2003
社会劳动者 (万人)
2003 771.62 648.30
第三产业增加 值比重 (%)
社会劳动生产 率(元/人)
21.1 11244
21.5 22.1 23.6 25.1 11429 11518 12607 13351
26.0 15974
27.5 17921
29.2 20749
29.0 35418
第三章 时间序列分析
(三)平均数时间序列
位应该保持前后一致 (四)时间序列的时间跨度应力求一致
第三章 时间序列分析
第二节 时间序列的指标分析法
时间序列的指标分析法包括水平指标分析 法与速度指标分析法。
水平指标主要包括平均发展水平和增长量; 速度指标主要包括平均发展速度与平均增 长速度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可以在数据库WORK看见数据集ex1_2数据集中有两个 变量t和price。
format t monyy.指定时间的输出格式 此处monyy.指定时间的输出格式为月-年。
3、 外部数据的读取
1.2 数据的处理 1、序列变换
data example1_3;input price@@; t=intnx('month','1jan2005'd,_n_-1); logp=log(price); format t monyy.; cards; 3.41 3.45 3.42 3.53 3.45 ; run;
时间序列分析讲义(下)
前面,我们已经介绍了时间序列建模的基本原理、 方法和步骤。
本讲我们重点介绍SAS分析时间序列的一些重要命 令,及不同类型时间序列的SAS处理。
时间序列建模步骤流程:
计
算
样
本
时
相
间
关
序
系
列
数
图
偏
相
关
系
数
模型 识别
参数 估计
N
模型
检验
序 列 Y预 测
一个时间序列模型的建立,可能要经过多次的识别-评估 的反复,希望同学们能够熟练地应用SAS建立时序模型。
各参数均显著,均值不显著(其对应的P值0.9968大于 0.05)。
若命名中没有数据库名,则默认为临时数据库WORK 。
若改为如下的程序:
data sassuser.example1_1; input price@@; cards; 3.41 3.45 3.42 3.53 3.45 ; run;
就创建了一个名叫 example1_1的永久数据集,保 存在永久数据库SASUSER中,关机后数据保存。
平稳性检验的目的是确定该时序可不可以直接建 模,平稳序列(非白噪声)可以直接建模,非白噪 声非平稳(非白噪声)序列需要先做差分处理,然 后建模。
SAS的ARIMA过程中的IDENGTIFY语句,提供了白 噪声检验的结果,同时提供了醒目的自相关、偏相 关函数图,可以帮助判 别平稳性。
事实上,通过IDENGTIFY语句,还可以实现序列 模型的识别,这个在下一章详细介绍。
时序图在SAS分析中的作用:
时序图,直观观察序列的平稳性; 拟合效果图,直观地看到预测的效果。
例2.1 以下表
data example2_1; input price1 price2; time=intnx('month','01jul2004'd,_n_-1); format time date.;cards; 12.85 15.21 13.29 14.23 12.42 14.69 15.21 16.27 14.23 16.75 13.56 15.33 ; run; proc gplot data=example2_1; plot price1*time=1 price2*time=2/overlay; symbol1 c=black v=star i=join;symbol2 c=red v=circle i=spline; run;
run;
格式2 Data 数据集名;
input 变量名1 变量名2@@;
cards; 数据
;
run;
例1-1 录入数据 3.41 3.45 3.42 3.53 3.45 方法1 data example1_1;input price;
cards; 3.41 3.45 3.42 3.53 3.45 ; run;
等间隔的年份时间数据可以利用间隔函数输入: 例1-2 录入下表中的数据:
我们可以运行如下程序:
data example1_2 ;input price@@; t=intnx('month','1jan2005'd,_n_-1); format t monyy.; cards; 101 82 66 35 31 7 ; run;
可以在数据库WORK看见数据集example1_4:
“proc print data=example1_5 ;” 是查看语句,可以在输出窗口看到两个数据集。
第二章 SAS-时间序列预处理 2.1 时间序列图形
SAS时间序列作图的程序语句格式为: PROC GPLOT 数据集名
表明要对该数据集中的数据做图。
我们用利用AIC准则最佳判别准则来选择模型。
在IDENTIFY中添加MINIC语句,即可求得模型的BIC 值。
再拟合MA(4)模型: estimate q=4; run;
本例拟合MA(4) 的白噪声检验结果:
白噪声检验统计量的所有P值都大于0.05, 说明残 差序列为白噪声。模型检验通过。
本例拟合MA(4) 的模型参数估计结果:
序列偏相关图
序列白噪声检验
分析: 白噪声检验显示该序列不是白噪声,可以建模;自 相关和偏相关函数都较快趋于零,判别为平稳过程; 注意到自相关函数在3步之后小于2倍标准差,认为自 相关函数在3步截尾,偏相关函数6步还未进入2倍标准 差,看做拖尾,所以初步判别模型为MA(3)
3.2 参数估计与诊断
目录
第一章 SAS-时间序列数据 第二章 SAS-时间序列预处理 第三章 SAS-ARIMA模型过程简介
第四章 实例-ARIMA的几种类型及SAS处理
第一章 SAS-时间序列数据
1.1 创建数据数据
1、数据直接录入
格式1
Data 数据集名; input 变量名1 变量名2 ;
cards; 数据
;
(2)input语句中加@@,则录入可以按行录入, SAS按行读取数据;否则SAS按列读取数据。
注1:也可以建立自己的永久数据库。
注2:把录入数据的程序文件以.SAS文件形式保存下来, 这样数据也得到保存。启动文件,即产生临时数据集。
2、 等间隔时间数据的录入
SAS提供了命令或函数,可以更具需要自动产生等间隔的时间数据。 例 录入下表中的数据:
可以在数据库WORK看见数据集ex1_3数据集中有3 个变量。
2、子集
data example1_4;set example1_3; keep t logp; where t>='01mar2005'd; proc print data=example1_4;run;
可以在数据库WORK看见数据集example1_4:
proc gplot data= example3_1; plot x*time=1; symbol1 c=red,i=join,v=star; run; proc arima data=example3_1; idenIDENGTIFY得到的信息:
序列自相关图
描述性统计量
自相关函数图
偏相关函数图
自相关和偏相关函数都能较快地进入2倍标准差内,认 为序列平稳.
检验统计量的P值<0.001,序列不是白噪声,可以建模.
注: IDENGTIFY给出的五条消息中,一般利用自相关、偏相 关信息判别序列平稳性,利用白噪声检验信息判断序 列的纯随机性。
下一章可以看到IDENGTIFY给出的自相关和偏相关信 息还可用于模型识别、定阶。
拟合MA(3): estimate q=3; run;
三、系数相关阵 四、残差相关检验(白噪声) 五、拟合模型形式
一般,我们通过参数估计看参数是否通过显著性检验; 通过残差相关检验(白噪声)看模型是否通过显著性 检验,检验通过的模型,写出具体的形式。
本例拟合MA(3) 的模型参数估计结果:
均值不显著,其他参数均显著。 注:若模型通过检验,还需要建立均值为0的优化模型。
下面看模型检验:
本例拟合MA(3),得到模型的残差的白噪声检验结 果:
滞后6步检验的P值0.0010<0.05,认为残差不是白噪声。 所以该模型没有通过检验。
那么如何寻找该序列的适合模型呢?
时间序列还提供了利用最佳判别准则来选择模型的方法。 最佳判别准则有AIC准则,BIC准则、SBC准则,都是基于 估计误差和模型简洁2性的准则,以值小的为佳。
以数据集example3_1为例来说明SAS序列模 型的识别的语句。
例3.1
data example3_1; input x@@; time=_n_; cards; 0.30 -0.45 0.36 0.00 0.17 0.45 2.15 4.42 3.48 2.99 1.74 2.40 0.11 0.96 0.21 -0.10 -1.27 -1.45 -1.19 -1.47 -1.34 -1.02 -0.27 0.14 -0.07 0.10 -0.15 -0.36 -0.50 -1.93 -1.49 -2.35 -2.18 -0.39 -0.52 -2.24 -3.46 -3.97 -4.60 -3.09 -2.19 -1.21 0.78 0.88 2.07 1.44 1.50 0.29 -0.36 -0.97 -0.30 -0.28 0.80 0.91 1.95 1.77 1.80 0.56 -0.11 0.10 -0.56 -1.34 -2.47 0.07 -0.69 -1.96 0.04 1.59 0.20 0.39 1.06 -0.39 -0.16 2.07 1.35 1.46 1.50 0.94 -0.08 -0.66 -0.21 -0.77 -0.52 0.05 ;
方法2
data example1_1;input price@@; cards; 3.41 3.45 3.42 3.53 3.45 ; run;
说明:
(1)这2种方法都可以创建一个名叫example的临时 数据集,保存在数据库WORK中,本次开机可调用,关 机后数据不保存。 SAS提供了两个通用数据库:临时数据库WORK 和永 久数据库SASUSER。 SAS数据命名采用二级制:数 据库名.数据集名。