第三讲 ARMA模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
c 1 2 0.5 = 3.414和 0 = =1 2 1- 1- 5 1- 1-0.5
但是,发现模拟数据的均值和方差与理论上的均值 和方差不等。但是,n越大越接近,为什么?
26
程序为: smpl @first @first:选取序列的第一个值 series x=1:令第一个值为1 smpl @first+1 @last:选取第二个值到最后一个值 series x=1+0.5^0.5*x(-1)+0.5*nrnd: 令第二个值到最后一个值为服从正态分布的随机数,
动态乘数定义为:
y t +j t = j
当 j=0时,也叫影响乘数。 脉冲响应函数:由动态乘数的定义,对应每一个时间 跨度 j,有一个对应的动态乘数,那么如果将不同时间跨度 j 的动态乘数按 j 从小到大的顺序摆放一起,形成一个路径, 就成为脉冲响应函数。应用很广! 例如,可用之刻画通货膨胀或经济产出等在受到一个 正向或负向的货币政策冲击后形成的动态路径和持续时间 情况。
( 1- L)-1 1 L 2 L2
上式成立条件:|α|<1
(2)
5
(一)ARMA模型的引进
AR:Yt 0 1Yt 1 kYt k t
0 可以不写) 注意:如果假设均值为零, 如果序列在其均值附近波动: Y
t
Y1 Y2 ... YT 可用 FT Y 来预测 FT 1 , T
下面分别是α=0.9和α=0.5(经过大约8期就降至0)时 AR(1)过程的自相关函数图。
29
假定AR(1)为:yt c 0.9yt 1 t
j (-0.9) , j=0,1,2, 相应的自相关函数为 j
其自相关图为:
30
以下四个图描述了AR(1)在α取0、0.6、0.9和1的情况:
23
yt c yt 1 t 例如:AR(1):
(1)
yt c (c yt 2 t -1) t = c c 2 yt 2 t t -1 =(1+ + 2 + + n )c+ n +1yt n -1 t t -1 + 2 t -2 + + n t -n
4
三、高阶差分方程 高阶差分方程是学习AR(p)的基础。
p阶差分方程一般式:
yt 1yt 1 2 yt 2
+ p yt p t
滞后期增加,就复杂化。因为每个滞后项系数都会影 响差分方程所刻画的序列变量的动态特征。尤其是在求解 高阶差分方程和脉冲响应分析等问题,仅从原始方程入手 很困难和繁琐。需矩阵知识,把高阶化为一阶来处理。 滞后算子的一个重要而常用的性质(L是算子)
35
以下是常见的AR和MA模型的ACF和PACF的表现形式:
图 9.2.2 ACF 模型 1: ARMA(p,q)模型的 ACF 与 PACF 理论模式 PACF
X t 0.7 X t 1 t
0.8
0.8
ACF1
0.6
0.6
PACF 1
0.4
0.4
0.2
0.2
0.0 1 2 3 4 5 6 7 8
可以想象,如果按一定规则的数据 生成过程生成足够多的观测序列(比如 1万次或10万次),然后再求样本均值, 应该可以得到较高精度的结果,从而尽 量捕捉真实过程的特性。
该思想与计量经济学的另一重要概 念不谋而合,即蒙特卡洛模拟。
27
(2)AR (p) 序列的自相关和偏自相关:
●φk截尾性:AR(p)为p阶截尾。
0.0 1 2 3 4 5 6 7 8
36
模型 2:
0.6 0.4 0.2 0.0
X t 0.7 X t 1 t
0.0 ACF2 -0.2 PACF2
-0.4 -0.2 -0.4 -0.6 -0.8 1 2 3 4 5 6 7 8 -0.8 1 2 3 4 5 6 7 8 -0.6
)2Fra Baidu bibliotek
2 = 1- 2
可见,只要|α|<1,则yt方差保持恒定不变。
25
为了对AR(1)的均值和方差有更感性的认识,可模拟 AR(1)数据生成过程,使用的AR(1)过程为
yt 1 0.5 yt t , t ~N (0, 2 ), 2 =0.5
分别生成两组观测值,容量n=30和n=1000,二序列 (模拟图如下)均值和方差分别为:
yt +j j +1yt 1 jt j -1t +1 +
+t +j -1 +t +j
2
二、动态乘数与脉冲响应函数
yt yt 1 t
(1)
动态乘数:在方程(1)中,一般假设 t 是服从某种 分布的随机扰动项,在实践中,需要知道 t 对 yt 的动态 影响路径怎样。
300 200 100 0 -100 -200 -300 80 82 84 86 88 90 92 94 96 98
可见,即去除了趋势也去除了季节。
21
再看sy的自相关图,如下:
22
注意: (1)很多递增序列,如GDP,一阶差分难平稳。可先取对数再差分。 (2)用自相关函数可判断序列完全随机。
(三)ARMA模型及其改进
例4:季度数据文件:1979:1~1999:2,调入book8中1个数据y。 同样,输入序列名y,滞后期取20。可得自相关图:
可见:自相关程度缓慢减弱。而偏自相关相邻两项相关程度很高。
14
例5:建月度文件:1972:01~1982:12,调入book18 的y(汗衫背心零售 量),滞后期36。自相关图为: 从自相关函数看: 12、24、36很大,即相 同月份有很强季节性,无明 显趋势。 从偏自相关函数看, k=1时一样,k=2时“自”和 “偏”自相关差距很大。
16
例6:建季度文件:1979:1-1999:2,导入book8的y。 第一:看图 Y
9,000 8,000 7,000 6,000 5,000 4,000 3,000 2,000 1,000 0 80 82 84 86 88 90 92 94 96 98
可见,趋势很强。
下面从自相关图也可得出此结论。
3
累计脉冲响应函数:
y t +j t
+
y t +j t +1
+
y t +j t +2
+
+
y t +j t +j
= j + j -1 + j -2 +
+ +1
以此衡量随机扰动因素如果出现永久性变化后,即 t,t +1, ,t +j 都变化一个单位,对yt 造成的影响和冲击。 练习:建立年度(1951~1983)数据文件,导入book1 中数据x。利用Eviews创建一个程序,尝试生成不同的yt序 列,还可尝试绘制出脉冲响应函数图: smpl @first @first series x=0 smpl @first+1 @last series x=0.7*x(-1)+0.8*nrnd(正态分布) 该程序是用一阶差分方程生成一个x序列,初始值设定 为0,扰动项设定为服从均值为0,标准差为0.8的正态分布。
第三讲
ARMA模型
1
预备知识
差分方程:滞后算子与动态模型
一、一阶差分方程 例如:
yt yt 1 t
(1)
一个差分方程——指将一个变量的当期值定义为它的 前一期和一个档期的随机扰动因素的函数。 求解差分方程——就是想要得到以随机扰动项 t 表示 的 yt 表达式,方法是不断迭代。 一般地,一阶差分方程可以写为:
n =0,则上式变为: 在|α|<1条件下,则有 lim n
c yt t t -1 + 2 t -2 + 1-
即无穷阶移动平均过程,即MA(∞)。 即当|α|<1时,AR(1)中的yt可写成扰动项的和。
实际上,在一般条件都满足的情况下,|α|<1是AR(1)平 稳的充要条件。
3
2
1 55 60 65 70 75 80 85 90 95
12
(1)数据量不大时,如70或80数据,取M=[n/4]。 (2)数据量较大时,如300个数据,可取M=[n/10]。 (3)数据量很大时,如成千上万,可取M=根号n 此例有45个数据,最大滞后期取12即可。可得相关图如下:
从偏自相关函数来看,相邻两项的相关性很强(指的是滞后一期)。 13 而自相关函数则不同。
10
偏自相关函数的定义: 设{zt}为零均值平稳序列, zt+1 , zt+2,…, zt+k-1对zt 和 zt+k 的线性估计为:
ˆt 1zt 1 2 zt 2 k 1zt k 1 z ˆt k 1zt 1 2 zt 2 k 1zt k 1 z
20
注意:用自相关研究时间序列季节性时,得先消除趋势性。 对于季节性,也可采用差分,此时叫季节差分。 对于季度数据,就用genr sy=y-y(-4),对月度数据,就用genr iy=yy(-12) 第三,对逐期差分后的数据iy再做一阶季节差分 输入:genr sy=iy-iy(-4), SY 先看sy的图形: 400
模型 3:
0.0
X t t 0.7 t 1
15
下面从自相关和偏相关来研究序列特性: (二)时序特性分析 1. 平稳性分析 (1)平稳时序定义与特点 描述性定义:序列的统计特征不随时间而变化,均值恒 为常数;自相关系数只与时间间隔有关,与时间起始点无关。 平稳序列自相关的特点:自相关系数在k较小值时就迅速 趋于零。 (2)消除趋势方法 若其非平稳是趋势,可逐期差分或短期差分(也叫短差)。
31
α =1时,序列似乎有永远偏离均值的态势。
32
再看一下AR(2)的几种情况:
33
34
注意:AR(1)和AR(2)的自相关函数不太一样, AR(1)的自相关函数 绝对值一定单调递减,而AR(2)的则依赖于α1和α2的大小,不一定总是单 调递减的(如下图)。 但是,对平稳AR过程,无论各回归系数如何变化,总趋势是:自相 关函数绝对值总体趋势是逐渐衰减到0。
6
7
8
注意:平稳指弱平稳,即方差、均值不随时间变化,这样yt永远不会 “过分”偏离其均值水平。换言之,平稳序列表现出一种向均值水平恢复 的特征,在金融时序分析中常称为“均值回复”,英文是mean reverting, 许多文献却译为“均值反转”,使读者一头雾水!
9
具体讲: 偏自相关函数(PACF)用来考察扣除zt 和zt+k之间zt+1 , zt+2,… zt+k-1影响 之后的zt 和zt+k之间的相关性。
用φkk表示偏自相关函数,则:
ˆt ), ( zt k z ˆt k )] cov[(zt z kk ˆt ) var(zt k z ˆt k ) var(zt z
11
例3:建文件:1952到1996(年度),调入book12的y。 第一步:看图。y的时序图:
Y
6
5
4
偏相关截 尾
由AR(1)的稳定性知||<1,当k时,呈指数形衰减。 该现象叫拖尾或称AR(1)有无穷记忆(infinite memory)。 注意:<0时,呈振荡衰减状。
自相关 拖尾
28
(3)一阶自回归系数α的影响
例如: yt c 0.9yt 1 t
其自相关函数为
k =0.9k , k =0,1,2,
24
c , (即Eyt ) ,则有 如果令: = 1-
yt - t t -1 + 2 t -2 +
yt的方差为
0 =E (yt - ) 2 E ( t t -1 + 2 t -2 +
=E ( t ) 2 2 E ( t -1 ) 2 + 4 E ( t -2 ) 2 + =(1+ 2 + 4 + ) 2
17
趋势看自相
18
第二,做差分 输入:genr iy=y-y(-1),序列图:
IY
1,600
1,200
800
400
0
-400
-800 80 82 84 86 88 90 92 94 96 98
可见,无趋势但有季节性,还可从iy自相关图可见。如下:
19
4,8,12等地方,有 季节性,
易见,趋势基本消除,但有明显季节性。月度数据类似。
但是,发现模拟数据的均值和方差与理论上的均值 和方差不等。但是,n越大越接近,为什么?
26
程序为: smpl @first @first:选取序列的第一个值 series x=1:令第一个值为1 smpl @first+1 @last:选取第二个值到最后一个值 series x=1+0.5^0.5*x(-1)+0.5*nrnd: 令第二个值到最后一个值为服从正态分布的随机数,
动态乘数定义为:
y t +j t = j
当 j=0时,也叫影响乘数。 脉冲响应函数:由动态乘数的定义,对应每一个时间 跨度 j,有一个对应的动态乘数,那么如果将不同时间跨度 j 的动态乘数按 j 从小到大的顺序摆放一起,形成一个路径, 就成为脉冲响应函数。应用很广! 例如,可用之刻画通货膨胀或经济产出等在受到一个 正向或负向的货币政策冲击后形成的动态路径和持续时间 情况。
( 1- L)-1 1 L 2 L2
上式成立条件:|α|<1
(2)
5
(一)ARMA模型的引进
AR:Yt 0 1Yt 1 kYt k t
0 可以不写) 注意:如果假设均值为零, 如果序列在其均值附近波动: Y
t
Y1 Y2 ... YT 可用 FT Y 来预测 FT 1 , T
下面分别是α=0.9和α=0.5(经过大约8期就降至0)时 AR(1)过程的自相关函数图。
29
假定AR(1)为:yt c 0.9yt 1 t
j (-0.9) , j=0,1,2, 相应的自相关函数为 j
其自相关图为:
30
以下四个图描述了AR(1)在α取0、0.6、0.9和1的情况:
23
yt c yt 1 t 例如:AR(1):
(1)
yt c (c yt 2 t -1) t = c c 2 yt 2 t t -1 =(1+ + 2 + + n )c+ n +1yt n -1 t t -1 + 2 t -2 + + n t -n
4
三、高阶差分方程 高阶差分方程是学习AR(p)的基础。
p阶差分方程一般式:
yt 1yt 1 2 yt 2
+ p yt p t
滞后期增加,就复杂化。因为每个滞后项系数都会影 响差分方程所刻画的序列变量的动态特征。尤其是在求解 高阶差分方程和脉冲响应分析等问题,仅从原始方程入手 很困难和繁琐。需矩阵知识,把高阶化为一阶来处理。 滞后算子的一个重要而常用的性质(L是算子)
35
以下是常见的AR和MA模型的ACF和PACF的表现形式:
图 9.2.2 ACF 模型 1: ARMA(p,q)模型的 ACF 与 PACF 理论模式 PACF
X t 0.7 X t 1 t
0.8
0.8
ACF1
0.6
0.6
PACF 1
0.4
0.4
0.2
0.2
0.0 1 2 3 4 5 6 7 8
可以想象,如果按一定规则的数据 生成过程生成足够多的观测序列(比如 1万次或10万次),然后再求样本均值, 应该可以得到较高精度的结果,从而尽 量捕捉真实过程的特性。
该思想与计量经济学的另一重要概 念不谋而合,即蒙特卡洛模拟。
27
(2)AR (p) 序列的自相关和偏自相关:
●φk截尾性:AR(p)为p阶截尾。
0.0 1 2 3 4 5 6 7 8
36
模型 2:
0.6 0.4 0.2 0.0
X t 0.7 X t 1 t
0.0 ACF2 -0.2 PACF2
-0.4 -0.2 -0.4 -0.6 -0.8 1 2 3 4 5 6 7 8 -0.8 1 2 3 4 5 6 7 8 -0.6
)2Fra Baidu bibliotek
2 = 1- 2
可见,只要|α|<1,则yt方差保持恒定不变。
25
为了对AR(1)的均值和方差有更感性的认识,可模拟 AR(1)数据生成过程,使用的AR(1)过程为
yt 1 0.5 yt t , t ~N (0, 2 ), 2 =0.5
分别生成两组观测值,容量n=30和n=1000,二序列 (模拟图如下)均值和方差分别为:
yt +j j +1yt 1 jt j -1t +1 +
+t +j -1 +t +j
2
二、动态乘数与脉冲响应函数
yt yt 1 t
(1)
动态乘数:在方程(1)中,一般假设 t 是服从某种 分布的随机扰动项,在实践中,需要知道 t 对 yt 的动态 影响路径怎样。
300 200 100 0 -100 -200 -300 80 82 84 86 88 90 92 94 96 98
可见,即去除了趋势也去除了季节。
21
再看sy的自相关图,如下:
22
注意: (1)很多递增序列,如GDP,一阶差分难平稳。可先取对数再差分。 (2)用自相关函数可判断序列完全随机。
(三)ARMA模型及其改进
例4:季度数据文件:1979:1~1999:2,调入book8中1个数据y。 同样,输入序列名y,滞后期取20。可得自相关图:
可见:自相关程度缓慢减弱。而偏自相关相邻两项相关程度很高。
14
例5:建月度文件:1972:01~1982:12,调入book18 的y(汗衫背心零售 量),滞后期36。自相关图为: 从自相关函数看: 12、24、36很大,即相 同月份有很强季节性,无明 显趋势。 从偏自相关函数看, k=1时一样,k=2时“自”和 “偏”自相关差距很大。
16
例6:建季度文件:1979:1-1999:2,导入book8的y。 第一:看图 Y
9,000 8,000 7,000 6,000 5,000 4,000 3,000 2,000 1,000 0 80 82 84 86 88 90 92 94 96 98
可见,趋势很强。
下面从自相关图也可得出此结论。
3
累计脉冲响应函数:
y t +j t
+
y t +j t +1
+
y t +j t +2
+
+
y t +j t +j
= j + j -1 + j -2 +
+ +1
以此衡量随机扰动因素如果出现永久性变化后,即 t,t +1, ,t +j 都变化一个单位,对yt 造成的影响和冲击。 练习:建立年度(1951~1983)数据文件,导入book1 中数据x。利用Eviews创建一个程序,尝试生成不同的yt序 列,还可尝试绘制出脉冲响应函数图: smpl @first @first series x=0 smpl @first+1 @last series x=0.7*x(-1)+0.8*nrnd(正态分布) 该程序是用一阶差分方程生成一个x序列,初始值设定 为0,扰动项设定为服从均值为0,标准差为0.8的正态分布。
第三讲
ARMA模型
1
预备知识
差分方程:滞后算子与动态模型
一、一阶差分方程 例如:
yt yt 1 t
(1)
一个差分方程——指将一个变量的当期值定义为它的 前一期和一个档期的随机扰动因素的函数。 求解差分方程——就是想要得到以随机扰动项 t 表示 的 yt 表达式,方法是不断迭代。 一般地,一阶差分方程可以写为:
n =0,则上式变为: 在|α|<1条件下,则有 lim n
c yt t t -1 + 2 t -2 + 1-
即无穷阶移动平均过程,即MA(∞)。 即当|α|<1时,AR(1)中的yt可写成扰动项的和。
实际上,在一般条件都满足的情况下,|α|<1是AR(1)平 稳的充要条件。
3
2
1 55 60 65 70 75 80 85 90 95
12
(1)数据量不大时,如70或80数据,取M=[n/4]。 (2)数据量较大时,如300个数据,可取M=[n/10]。 (3)数据量很大时,如成千上万,可取M=根号n 此例有45个数据,最大滞后期取12即可。可得相关图如下:
从偏自相关函数来看,相邻两项的相关性很强(指的是滞后一期)。 13 而自相关函数则不同。
10
偏自相关函数的定义: 设{zt}为零均值平稳序列, zt+1 , zt+2,…, zt+k-1对zt 和 zt+k 的线性估计为:
ˆt 1zt 1 2 zt 2 k 1zt k 1 z ˆt k 1zt 1 2 zt 2 k 1zt k 1 z
20
注意:用自相关研究时间序列季节性时,得先消除趋势性。 对于季节性,也可采用差分,此时叫季节差分。 对于季度数据,就用genr sy=y-y(-4),对月度数据,就用genr iy=yy(-12) 第三,对逐期差分后的数据iy再做一阶季节差分 输入:genr sy=iy-iy(-4), SY 先看sy的图形: 400
模型 3:
0.0
X t t 0.7 t 1
15
下面从自相关和偏相关来研究序列特性: (二)时序特性分析 1. 平稳性分析 (1)平稳时序定义与特点 描述性定义:序列的统计特征不随时间而变化,均值恒 为常数;自相关系数只与时间间隔有关,与时间起始点无关。 平稳序列自相关的特点:自相关系数在k较小值时就迅速 趋于零。 (2)消除趋势方法 若其非平稳是趋势,可逐期差分或短期差分(也叫短差)。
31
α =1时,序列似乎有永远偏离均值的态势。
32
再看一下AR(2)的几种情况:
33
34
注意:AR(1)和AR(2)的自相关函数不太一样, AR(1)的自相关函数 绝对值一定单调递减,而AR(2)的则依赖于α1和α2的大小,不一定总是单 调递减的(如下图)。 但是,对平稳AR过程,无论各回归系数如何变化,总趋势是:自相 关函数绝对值总体趋势是逐渐衰减到0。
6
7
8
注意:平稳指弱平稳,即方差、均值不随时间变化,这样yt永远不会 “过分”偏离其均值水平。换言之,平稳序列表现出一种向均值水平恢复 的特征,在金融时序分析中常称为“均值回复”,英文是mean reverting, 许多文献却译为“均值反转”,使读者一头雾水!
9
具体讲: 偏自相关函数(PACF)用来考察扣除zt 和zt+k之间zt+1 , zt+2,… zt+k-1影响 之后的zt 和zt+k之间的相关性。
用φkk表示偏自相关函数,则:
ˆt ), ( zt k z ˆt k )] cov[(zt z kk ˆt ) var(zt k z ˆt k ) var(zt z
11
例3:建文件:1952到1996(年度),调入book12的y。 第一步:看图。y的时序图:
Y
6
5
4
偏相关截 尾
由AR(1)的稳定性知||<1,当k时,呈指数形衰减。 该现象叫拖尾或称AR(1)有无穷记忆(infinite memory)。 注意:<0时,呈振荡衰减状。
自相关 拖尾
28
(3)一阶自回归系数α的影响
例如: yt c 0.9yt 1 t
其自相关函数为
k =0.9k , k =0,1,2,
24
c , (即Eyt ) ,则有 如果令: = 1-
yt - t t -1 + 2 t -2 +
yt的方差为
0 =E (yt - ) 2 E ( t t -1 + 2 t -2 +
=E ( t ) 2 2 E ( t -1 ) 2 + 4 E ( t -2 ) 2 + =(1+ 2 + 4 + ) 2
17
趋势看自相
18
第二,做差分 输入:genr iy=y-y(-1),序列图:
IY
1,600
1,200
800
400
0
-400
-800 80 82 84 86 88 90 92 94 96 98
可见,无趋势但有季节性,还可从iy自相关图可见。如下:
19
4,8,12等地方,有 季节性,
易见,趋势基本消除,但有明显季节性。月度数据类似。