R语言 非平稳序列的随机分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

差分后序列自相关图与偏自相关图
除了1阶和4阶偏自相关系数显著大于2倍标准差之外,其他 阶数基本都在2倍标准差内波动。
所以尝试拟合疏系数模型AR(1,4)
模型拟合

预测
101
102
103
104
105
106
100
99
100 102 104 106 108 110 96 98
2000年1月 2000年8月 2001年3月 2001年10月 2002年5月 2002年12月 2003年7月 2004年2月
1、简单季节模型

简单季节模型是指序列中的季节效应和其它效应之间是加 法关系
xt S t Tt I t

简单季节模型通过简单的趋势差分、季节差分之后序列即
可转化为平稳,它的模型结构通常如下
( B ) D xt t ( B)
d
例:拟合1962—1991年德国工人季度失业率序列
2000年1月 2000年3月 2000年5月 2000年7月 2000年9月 2000年11月 2001年1月 2001年3月 2001年5月 2001年7月 2001年9月 2001年11月 2002年1月 2002年3月 2002年5月 2002年7月 2002年9月 2002年11月 2003年1月 2003年3月 2003年5月 2003年7月 2003年9月 2003年11月 2004年1月 2004年3月 2004年5月 2004年7月 2004年9月 2004年11月 2005年1月 2005年3月 2005年5月 2005年7月 2005年9月 2005年11月
例续:对中国农业实际国民收入指数序列 做为期10年的预测
(二)疏系数模型

ARIMA(p,d,q)模型是指d阶差分后自相关最高阶数为p,移 动平均最高阶数为q的模型,通常它包含p+q个独立的未知 系数: 1 ,, p ,1 ,, q 如果该模型中有部分自相关系数 j ,1 j p 或部分移动平
98 cpi
1月 6月 2月
2004年9月 2005年4月
2005年11月
2006年6月 2007年1月 2007年8月 2008年3月 2008年10月
2、乘积季节模型
2009年5月
2009年12月 2010年7月 2011年2月 2011年9月 2012年4月 2012年11月 2013年6月 2014年1月 2014年8月 2015年3月 2015年10月
预测值
xt l ( t l 1 t l 1 l 1 t 1 ) ( l t l 1 t 1 )
et (l )
ˆ t (l ) x
E[et (l )] 0 Var[et (l )] (1 )
2 1 2 l 1 2
第五讲 非平稳序列的随机分析
本讲内容
第一部分 ARIMA模型
• 一、差分运算 • 二、ARIMA模型
第二部分 残差自回归( Auto-Regressive )模型 第三部分 异方差
• 一、异方差的性质 • 二、方差齐性变换 • 三、条件异方差模型
本讲内容
第一部分 ARIMA模型
• 一、差分运算 • 二、ARIMA模型

模型结构
xt xt 1 t 2 E ( ) 0 , Var ( ) t t , E ( t s ) 0, s t Ex 0, s t s t

模型产生典故
Karl Pearson(1905)在《自然》杂志上提问:假如有个醉汉醉

计算预测值
ˆ t (1) 1.8xt 0.8 xt 1 0.6 t 5.46 x ˆ t (2) 1.8 x ˆ t (1) 0.8xt 5.59 x ˆ t (3) 1.8x ˆ t (2) 0.8 x ˆ t (1) 5.69 x
计算置信区间

Green函数值
比较

一阶差分
xt xt xt 1 1 at at 1

二阶差分(过差分)
2 xt xt xt 1 at 2at 1 at 2
平稳
平稳
方差小
Var (xt ) Var (at at 1 ) 2 2
方差大
Var(2 xt ) Var(at 2at 1 at 2 ) 6 2
一阶差分序列时序图
一阶差分序列自相关图
一阶差分后序列白噪声检验 延迟阶数 6 12 18
2统计量
P值 0.0178 0.1060 0.1344
15.33 18.33 24.66
拟合ARMA模型

偏自相关图
建模

课后问题

用R拟合以下三个模型的区别,三个模型的表达式分别是 什么形式?

差分平稳

对原序列作一阶差分消除趋势,再作4步差分消除季节效 应的影响,差分后序列的时序图如下
白噪声检验
延迟阶数
2 统计量
43.84
51.71
P值
6
12
<0.0001
<0.0001
18
54.48
<0.0001
差分后序列自相关图
差分后序列仍有一定季节效应,延迟4阶后,自相关系数有一个反弹。 延迟1阶到3阶,延迟4阶到7阶衰减非常迅速,故该序列具有短期相关性。
1 1.8 0.6 1.2 2 1.8 1 0.8 1.36

方差
Var[e(3)] (1 ) 4.2896
2 1 2 2 2

95%置信区间
ˆt (3) 1.96 Var (e(3)) , x ˆt (3) 1.96 Var (e(3)) ) (x (1.63,9.75)
自相关图
偏自相关图
建模



150000
200000
250000
100000
50000
2、乘积季节模型
1、简单季节模型
0
(三)季节模型
国内生产总值_当季值(亿元)
2000年第1季度 2000年第3季度 2001年第1季度 2001年第3季度 2002年第1季度 2002年第3季度 2003年第1季度 2003年第3季度 2004年第1季度 2004年第3季度 2005年第1季度 2005年第3季度 2006年第1季度 2006年第3季度 2007年第1季度 2007年第3季度 2008年第1季度 2008年第3季度 2009年第1季度 2009年第3季度 2010年第1季度 2010年第3季度 2011年第1季度 2011年第3季度 2012年第1季度 2012年第3季度 2013年第1季度 2013年第3季度 2014年第1季度 2014年第3季度 2015年第1季度 2015年第3季度 2016年第1季度 2016年第3季度 2017年第1季度 2017年第3季度
arima(x,order=c(1,1,0)) arima(diff(x),order=c(1,0,0))

arima(x,order=c(1,1,0),xreg=1:length(x))
ARIMA模型预测

原则
最小均方误差预测原理

Green函数递推公式
1 1 1 2 1 1 2 2 j 1 j 1 p d j p d j
例:

已知ARIMA(1,1,1)模型为

(1 0.8B)(1 B) xt (1 0.6B) t
xt 1 4.5
xt 5.3
t 0.8 2 1


xt 3 的95%的置信区间
预测值

等价形式
(1 1.8B 0.8B 2 ) xt (1 0.6B) t xt 1.8xt 1 0.8xt 2 t 0.6 t 1
二、ARIMA模型

(一)ARIMA模型介绍 (二)疏系数模型 (三)季节模型
ARIMA模型结构

使用场合:差分平稳序列拟合 模型结构
( B) d xt ( B) t 2 E ( ) 0 , Var ( ) t t , E ( t s ) 0, s t Ex 0, s t s t

对于蕴含着固定周期的序列进行步长为周期长度的差分运 算,通常可以较好地提取周期信息

12步差分

1阶-12步差分
过差分

足够多次的差分运算可以充分地提取原序列中的非平稳确 定性信息

但过度的差分会造成有用信息的浪费
例:

假设序列如下
xt 0 1t at

考察一阶差分后序列和二阶差分序列的平稳性与方差
差分方式的选择
• 序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳

原序列时序图

差分后序列时序图

序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可 以提取出曲线趋势的影响
差分后序列时序图

一阶差分

二阶差分
例:差分运算提取1995年1月—2000年12月平均每 头奶牛的月产奶量序列中的确定性信息
2、乘积季节模型

使用场合
• 序列的季节效应、长期趋势效应和随机波动之间有着复杂 地相互关联性,简单的季节模型不能充分地提取其中的相 关关系。
例:拟合1948-1981年美国女性月度失业率序列

1、检验序列平稳性
差分平稳

一阶、12步差分: x.dif=diff(diff(x),12) plot(x.dif)
第二部分 残差自回归( Auto-Regressive )模型 第三部分 异方差
• 一、异方差的性质 • 二、方差齐性变换 • 三、条件异方差模型
Cramer分解定理(1961)

任何一个时间序列 {xt }都可以分解为两部分的叠加:其中 一部分是由多项式决定的确定性趋势成分,另一部分是平 稳的零均值误差成分,即
ARIMA 模型族

d=0 ARIMA(p,d,q)=ARMA(p,q) p=0 ARIMA(p,d,q)=IMA(d,q)


q=0
ARIMA(p,d,q)=ARI(p,d) d=1,P=q=0 ARIMA(p,d,q)=random walk model
源自文库
随机游走模型( random walk)
xt t t
j t j j 0 d
( B)at
随机性影响
确定性影响
差分运算的实质

Cramer分解定理在理论上保证了适当阶数的差分一定可以 充分提取确定性信息

差分方法是一种非常简便、有效的确定性信息提取方法 差分运算的实质是使用自回归的方式提取确定性信息
i d xt (1 B) d xt (1) i C d xt i i 0 d
差分后序列自相关图与偏自相关图
延迟12阶(偏)自相关系数显著大于2倍标准差,差分后序列蕴含显著季
节效应。延迟1、2阶(偏)自相关系数大于2倍标准差。
简单季节模型拟合结果

尝试拟合: ARIMA((1,12),(1,12),0)模型
x.fit=arima(x,order=c(12,1,0),seasonal=list(order=c(0,1,0),period=12),t ransform.par=F,fixed=c(NA,0,0, 0,0, 0,0, 0,0, 0,0,NA))

滑系数 k ,1 k q 为零,即原模型中有部分系数省缺了,
那么该模型称为疏系数模型。
疏系数模型类型

如果只是自相关部分有省缺系数,那么该疏系数模型可以
(( p1 ,, pm ), d , q) 简记为 ARIMA
p1 ,, pm 为非零自相关系数的阶数

如果只是移动平滑部分有省缺系数,那么该疏系数模型可
( p, d , (q1 ,, qn )) 以简记为 ARIMA
q1 ,, qn 为非零移动平均系数的阶数

如果自相关和移动平滑部分都有省缺,可以简记为
ARIMA (( p1 ,, pm ), d , (q1 ,, qn ))
例:对1917年-1975年美国23岁妇女每万人生育 率序列建模
得非常严重,完全丧失方向感,把他放在荒郊野外,一段时
间之后再去找他,在什么地方找到他的概率最大呢?
ARIMA模型的性质

ARIMA(0,1,0)时序图
ARIMA模型建模步骤
获 得 观 察 值 序 列
平稳性 检验 N 差分 运算
Y
白噪声 检验 N 拟合 ARMA 模型
Y
分 析 结 束
例:对1952-1988年中国农业实际国民收入指数序 列建模
相关文档
最新文档