长记忆时间序列模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
长记忆时间序列模型及应用
王明进 博士 北京大学光华管理学院 商务统计与经济计量系 教授 金融风险管理中心 主任 2010年 2010年6月
主要内容
ARMA模型的回顾; 长记忆的概念; 长记忆的检验方法; ARFIMA模型; 一些应用;
1. ARMA模型的回顾 模型的回顾
时间序列研究的主要任务
描述时间序列中的动态(Dynamic)关联 性,用于理解其变化的规律或对其进行 预测; 自相关性(autocorrelation)的刻画
平稳解谱密度函数的性质
f (ω ) = 1 − e
iw −2 d
⋅ f * (ω )
= [4sin 2 (ω / 2)]− d ⋅ f * (ω ), −π ≤ ω ≤ π, d ∈ ( −1/ 2,1 / 2);
所以,
f (ω ) ~ G ⋅ ω −2 d , as ω → 0 +
记忆参数d取不同值时 记忆参数 取不同值时
T
1/ 2
重新标度极差统计量的性质
对于短期关联过程,
Q T = O p (T
1/ 2
)
对于长记忆过程,
Q T = O p (T H )
其中H = d + 1/ 2 称为Hurst指数
R/S 分析
在log Q T 对 logT 的散点图上,短期记忆 过程的点应分布在斜率1/2的直线附件, 长记忆过程的点对应的直线斜率大于1/2. 根据回归方法得到对Hurst指数的估计。
, as ω → 0 +
基于自相关函数和基于谱函数的定义是 等价的。
短程关联和长程关联* 短程关联和长程关联
强相合过程(strong mixing)被称为短程 关联(short range dependency)过程 (Rosenblatt 1956); 不满足强相合性的过程称为长程关联 (long range dependency)过程(Lo 1991, Guegan 2005) 长记忆过程属于这里的长程关联过程。
σ = 0.1849
AIC = 3743.20, BIC = 3761.46
2
ARMA(1,1)残差的 残差的Box-Ljung检验 残差的 检验
Stat Q(10) Q(20) Q(50) Q(100) 31.4554 43.5701 69.4818 138.1016 p-Value 0.0003 0.0017 0.0355 0.0070
对对数全距序列的R/S分析 分析 对对数全距序列的
7.5 7 6.5 6 5.5 5 4.5 4 3.5 3 4 5 6 7 8 9
对应的斜率估 计为0.8987, 计为 , 因此d 因此 的估计 为0.3987
R/S分析方法的不足 分析方法的不足
R/S分析方法其实对时间序列当中的短程 记忆比较敏感,模拟结果显示,即便对 于自回归系数为0.3的AR(1)过程,经R/S 方法得到的Hurst指数也有近乎一半的情 形超过1/2. (Davies & Harte, 1987; Lo 1991)
3. 长记忆的检验
重新标度极差统计量
重新标度极差(rescaled-range)统计量
Q T = RT / sT
其中
RT = max ∑ ( yt − y T ) − min ∑ ( yt − y T )
1≤ k ≤T t =1 1≤ k ≤T t =1 k k
1 2 sT = ∑ ( yt − y T ) T t =1
上证指数日全距序列 (1997.01.03-2010.06.18)
0 .12 0 .1
0 .08
0 .06
0 .04
0 .02
0 1997
1999
2002
2005
2007
2010
取对数之后的全距序列
-2 -2.5
-3
-3.5
-4
-4.5 -5
-5.5
-6 1997
1999
2002
2005
2007
2010
单位根检验的结果
Range ADF-t(10) ADF-t(20) PP-t PN-t KPSS -8.5557*** -5.8614*** -30.9954*** -5.4938*** 3.9385*** lnRange -7.3599*** -5.4457*** -27.875*** -5.0333*** 4.6528***
ARMA模型的可逆性条件 模型的可逆性条件
如果 Θ( z ) ≠ 0, for | z |≤ 1 ,那么ARMA模型 能够唯一地表达成如下的无穷阶自回归 模型的形式
+∞ Φ( B) at = ( yt − µ ) ≡ ∑ π j ( yt − j − µ ) Θ( B ) j =0
ARMA模型的自相关特征 模型的自相关特征
Φ ( B )(1 − B ) ( yt − µ ) = Θ( B )at
d
或者 Θ( B ) d (1 − B ) ( yt − µ ) = ut ≡ at Φ( B) 称之为I(d)过程,记为 yt ~ ARFIMA( p, d , q)
分数次差分算子
(1 − B ) d =
π jB j ∑
j =0
t
Φ p −1 ( B )(1 − B ) yt = Θq ( B )at , Φ p −1 ( z ) ≠ 0, for | z |≤ 1
单位根的检验
Augmented Dickey-Fuller(ADF)检验(Said & Dickey 1981); Phillips-Perron(PP) Phillips-Perron(PP)检验(Phillips & Perron (Phillips 1988); Perron-Ng (PN)检验(Perron & Ng 1996); Kwitkowski-Phillips-Schmidt-Shin(KPSS)检 验 (Kwitkowski et al. 1992);
yt − µ = (1 − B ) − d ut
其中
∑ψ u
k =0
∞
k t −k
Γ( k + d ) ~ c ⋅ k d −1 ψk = Γ( d ) Γ( k + 1)
平稳解的自相关函数特征
对于平稳的情况,自相关函数满足
ρ k~ c⋅k
2 d −1
, d ≠0
显然自相关函数呈双曲(hyperbolic)律 递减(Sowell 1992; Chung 1994)
∞
其中
( −d )(1 − d )L ( j − 1 − d ) j −1− d π 0 = 1, π j = = π j −1 ⋅ j! j Γ( j − d ) πj = ~ c ⋅ j −1−d Γ( −d ) Γ( j + 1)
当
d > −1/ 2
时该过程可逆。
平稳解的存在性
当 d < 1/ 2 时,该过程存在着平稳解,能够 写成
当 0 < d < 1/ 2 时对应的是二阶平稳的长记忆过 程,谱密度函数在0点奇异; 当 −1/ 2 < d < 0 时对应的过程称为反持续(antipersistent)过程,谱密度函数在0点处等于0; 当 时,对应的是短记忆ARMA过程, 谱密度函数在0点处为正数; d =0 当 时,对应的过程非平稳,方差无 d ≥ 1/ 2 穷大,包含了单位根过程。
残差的R/S分析 对ARMA(1,1)残差的 分析 残差的
V-stat q=14 NeweyNewey-West (1994) Andrew(1991) 2.4786 2.1661 2.2072 p-Value 0.0002 0.0030 0.0022
4. ARFIMA模型 模型
模型的形式
分数次整合ARMA模型
−π
f (ω ) cos(ωk )d ω ,
k = 0, ±1, ±2, L
如果自协方差函数绝对可加,
1 f (ω ) = 2π
k =−∞
∑Re
k
∞
− iωk
,wenku.baidu.com
1 f (0) = 2π
k =−∞
∑R
∞
k
<∞
ARMA模型的谱密度函数 模型的谱密度函数
σ Θ( e ) f (ω ) = ⋅ , iω 2π Φ ( e )
修正的R/S统计量 统计量 修正的
k k 1 QT = min max ∑ ( y j − y T ) − 1≤k ≤T ∑ ( y j − y T ) ; 1≤ k ≤T σ T ( q) j =1 j =1
T 1 T 2 q 2 σ ( q) = ∑ ( yt − y T ) + ∑ ω j ( q) ∑ ( yt − y T )( yt − j − y T ) T t =1 T j =1 t = j +1
任何一个平稳的ARMA模型的自相关函数 都是呈指数递减的,即
ρk ~ c ⋅ e
∞
−α k
, as k → ∞
因此自相关函数绝对可和,
k =−∞
∑ |ρ
k
| < +∞
平稳过程的谱函数 平稳过程的谱函数
谱密度函数是定义在 [−π ,π ] 上的偶函数且 满足 π π iωk
Rk = ∫
−π
f (ω )e d ω = ∫
* 2 a iω 2
−π ≤ ω ≤ π;
于是
σ Θ(1) f (0) = ⋅ >0 2π Φ (1)
* 2 a 2
ARMA模型的估计 模型的估计
条件极大似然估计; 极大似然估计; 最小二乘估计;
单位根过程
称为单位 如果 Φ (1) = 0 ,那么 { y } 称为单位 过程,此时为非平稳过程。 根过程,此时为非平稳过程。 比如如下的I(1)过程: 过程: 比如如下的 过程
对长记忆性的判断
对于长记忆过程
T
−1/ 2
QT ∞ →
p
因此利用该统计量可以对长记忆过程进 行单边的检验。
对数全距序列的修正的R/S分析 分析 对数全距序列的修正的
V-stat q=14 NeweyNewey-West (1994) Andrew(1991) 4.2672 6.6049 3.4653 p-Value 0.0000 0.0000 0.0000
2 T
$ $ ≡ γ 0 + 2∑ ω j ( q)γ j
j =1
q
修正的R/S统计量的渐近分布 统计量的渐近分布 修正的
对于短期过程
T −1/ 2 ⋅ QT ⇒ V
其中V是定义在[0,1] 上的布朗桥的全距
E(V ) = π / 2 ≈ 1.25 Std(V ) = π (π − 3) / 6 ≈ 0.27
2. 长记忆的概念
基于自相关函数的定义
如果存在常数 0 < d < 1/ 2 ,使得
ρ k ~ c ⋅ k 2 d −1 ,
as k → ∞
此时自相关函数不再绝对可和,
lim ∑ | ρ j |= ∞
n →∞ j =− n n
基于谱函数的定义
如果存在常数
0 < d < 1/ 2
−2 d
,使得
f (ω ) ~ G ⋅ ω
Rk = cov( yt , yt + k ), k = 0, ±1, ±2,L
ρ k = co rr( yt , yt +k ), k = 0, ±1, ±2,L
ARMA模型的形式 模型的形式
ARMA(p,q)模型
Φ ( B )( yt − µ ) = Θ( B )at Φ ( B ) = 1 − ϕ1B − L − ϕ p B p , Θ( B ) = 1 + θ1B + L + θ q B q ,
估计的谱密度函数
0.2 0 .18 0 .16 0 .14 0 .12 0.1 0 .08 0 .06 0 .04 0 .02 0 0.5 1 1 .5 2 2.5 3 3.5
估计的ARMA模型 模型 估计的
经过模型选择阶数得到
(1 − 0.9623B )( yt + 4.0875) = (1 − 0.7248B )at
自相关函数图形
(a ) R a n ge
0 .6 0 .5 0 .4 0 .3 0 .2 0 .1 0 - 0 .1 0 1 00 2 00 3 00 4 00 500 600 700 800
(b ) Lo g R a n ge
0 .6 0 .5 0 .4 0 .3 0 .2 0 .1 0 - 0 .1 0 1 00 2 00 3 00 4 00 500 600 700 800
其中{a } 是白噪声
t
E ( at ) = 0, E ( at as ) = 0,
E ( at2 ) = σ 2 , for t ≠ s
ARMA模型的平稳性条件 模型的平稳性条件
如果 Φ ( z ) ≠ 0, for | z |≤ 1 ,那么ARMA模型定义 了唯一的二阶平稳解
+∞ Θ( B ) yt = µ + at ≡ µ + ∑ψ j at − j Φ( B) j =0
王明进 博士 北京大学光华管理学院 商务统计与经济计量系 教授 金融风险管理中心 主任 2010年 2010年6月
主要内容
ARMA模型的回顾; 长记忆的概念; 长记忆的检验方法; ARFIMA模型; 一些应用;
1. ARMA模型的回顾 模型的回顾
时间序列研究的主要任务
描述时间序列中的动态(Dynamic)关联 性,用于理解其变化的规律或对其进行 预测; 自相关性(autocorrelation)的刻画
平稳解谱密度函数的性质
f (ω ) = 1 − e
iw −2 d
⋅ f * (ω )
= [4sin 2 (ω / 2)]− d ⋅ f * (ω ), −π ≤ ω ≤ π, d ∈ ( −1/ 2,1 / 2);
所以,
f (ω ) ~ G ⋅ ω −2 d , as ω → 0 +
记忆参数d取不同值时 记忆参数 取不同值时
T
1/ 2
重新标度极差统计量的性质
对于短期关联过程,
Q T = O p (T
1/ 2
)
对于长记忆过程,
Q T = O p (T H )
其中H = d + 1/ 2 称为Hurst指数
R/S 分析
在log Q T 对 logT 的散点图上,短期记忆 过程的点应分布在斜率1/2的直线附件, 长记忆过程的点对应的直线斜率大于1/2. 根据回归方法得到对Hurst指数的估计。
, as ω → 0 +
基于自相关函数和基于谱函数的定义是 等价的。
短程关联和长程关联* 短程关联和长程关联
强相合过程(strong mixing)被称为短程 关联(short range dependency)过程 (Rosenblatt 1956); 不满足强相合性的过程称为长程关联 (long range dependency)过程(Lo 1991, Guegan 2005) 长记忆过程属于这里的长程关联过程。
σ = 0.1849
AIC = 3743.20, BIC = 3761.46
2
ARMA(1,1)残差的 残差的Box-Ljung检验 残差的 检验
Stat Q(10) Q(20) Q(50) Q(100) 31.4554 43.5701 69.4818 138.1016 p-Value 0.0003 0.0017 0.0355 0.0070
对对数全距序列的R/S分析 分析 对对数全距序列的
7.5 7 6.5 6 5.5 5 4.5 4 3.5 3 4 5 6 7 8 9
对应的斜率估 计为0.8987, 计为 , 因此d 因此 的估计 为0.3987
R/S分析方法的不足 分析方法的不足
R/S分析方法其实对时间序列当中的短程 记忆比较敏感,模拟结果显示,即便对 于自回归系数为0.3的AR(1)过程,经R/S 方法得到的Hurst指数也有近乎一半的情 形超过1/2. (Davies & Harte, 1987; Lo 1991)
3. 长记忆的检验
重新标度极差统计量
重新标度极差(rescaled-range)统计量
Q T = RT / sT
其中
RT = max ∑ ( yt − y T ) − min ∑ ( yt − y T )
1≤ k ≤T t =1 1≤ k ≤T t =1 k k
1 2 sT = ∑ ( yt − y T ) T t =1
上证指数日全距序列 (1997.01.03-2010.06.18)
0 .12 0 .1
0 .08
0 .06
0 .04
0 .02
0 1997
1999
2002
2005
2007
2010
取对数之后的全距序列
-2 -2.5
-3
-3.5
-4
-4.5 -5
-5.5
-6 1997
1999
2002
2005
2007
2010
单位根检验的结果
Range ADF-t(10) ADF-t(20) PP-t PN-t KPSS -8.5557*** -5.8614*** -30.9954*** -5.4938*** 3.9385*** lnRange -7.3599*** -5.4457*** -27.875*** -5.0333*** 4.6528***
ARMA模型的可逆性条件 模型的可逆性条件
如果 Θ( z ) ≠ 0, for | z |≤ 1 ,那么ARMA模型 能够唯一地表达成如下的无穷阶自回归 模型的形式
+∞ Φ( B) at = ( yt − µ ) ≡ ∑ π j ( yt − j − µ ) Θ( B ) j =0
ARMA模型的自相关特征 模型的自相关特征
Φ ( B )(1 − B ) ( yt − µ ) = Θ( B )at
d
或者 Θ( B ) d (1 − B ) ( yt − µ ) = ut ≡ at Φ( B) 称之为I(d)过程,记为 yt ~ ARFIMA( p, d , q)
分数次差分算子
(1 − B ) d =
π jB j ∑
j =0
t
Φ p −1 ( B )(1 − B ) yt = Θq ( B )at , Φ p −1 ( z ) ≠ 0, for | z |≤ 1
单位根的检验
Augmented Dickey-Fuller(ADF)检验(Said & Dickey 1981); Phillips-Perron(PP) Phillips-Perron(PP)检验(Phillips & Perron (Phillips 1988); Perron-Ng (PN)检验(Perron & Ng 1996); Kwitkowski-Phillips-Schmidt-Shin(KPSS)检 验 (Kwitkowski et al. 1992);
yt − µ = (1 − B ) − d ut
其中
∑ψ u
k =0
∞
k t −k
Γ( k + d ) ~ c ⋅ k d −1 ψk = Γ( d ) Γ( k + 1)
平稳解的自相关函数特征
对于平稳的情况,自相关函数满足
ρ k~ c⋅k
2 d −1
, d ≠0
显然自相关函数呈双曲(hyperbolic)律 递减(Sowell 1992; Chung 1994)
∞
其中
( −d )(1 − d )L ( j − 1 − d ) j −1− d π 0 = 1, π j = = π j −1 ⋅ j! j Γ( j − d ) πj = ~ c ⋅ j −1−d Γ( −d ) Γ( j + 1)
当
d > −1/ 2
时该过程可逆。
平稳解的存在性
当 d < 1/ 2 时,该过程存在着平稳解,能够 写成
当 0 < d < 1/ 2 时对应的是二阶平稳的长记忆过 程,谱密度函数在0点奇异; 当 −1/ 2 < d < 0 时对应的过程称为反持续(antipersistent)过程,谱密度函数在0点处等于0; 当 时,对应的是短记忆ARMA过程, 谱密度函数在0点处为正数; d =0 当 时,对应的过程非平稳,方差无 d ≥ 1/ 2 穷大,包含了单位根过程。
残差的R/S分析 对ARMA(1,1)残差的 分析 残差的
V-stat q=14 NeweyNewey-West (1994) Andrew(1991) 2.4786 2.1661 2.2072 p-Value 0.0002 0.0030 0.0022
4. ARFIMA模型 模型
模型的形式
分数次整合ARMA模型
−π
f (ω ) cos(ωk )d ω ,
k = 0, ±1, ±2, L
如果自协方差函数绝对可加,
1 f (ω ) = 2π
k =−∞
∑Re
k
∞
− iωk
,wenku.baidu.com
1 f (0) = 2π
k =−∞
∑R
∞
k
<∞
ARMA模型的谱密度函数 模型的谱密度函数
σ Θ( e ) f (ω ) = ⋅ , iω 2π Φ ( e )
修正的R/S统计量 统计量 修正的
k k 1 QT = min max ∑ ( y j − y T ) − 1≤k ≤T ∑ ( y j − y T ) ; 1≤ k ≤T σ T ( q) j =1 j =1
T 1 T 2 q 2 σ ( q) = ∑ ( yt − y T ) + ∑ ω j ( q) ∑ ( yt − y T )( yt − j − y T ) T t =1 T j =1 t = j +1
任何一个平稳的ARMA模型的自相关函数 都是呈指数递减的,即
ρk ~ c ⋅ e
∞
−α k
, as k → ∞
因此自相关函数绝对可和,
k =−∞
∑ |ρ
k
| < +∞
平稳过程的谱函数 平稳过程的谱函数
谱密度函数是定义在 [−π ,π ] 上的偶函数且 满足 π π iωk
Rk = ∫
−π
f (ω )e d ω = ∫
* 2 a iω 2
−π ≤ ω ≤ π;
于是
σ Θ(1) f (0) = ⋅ >0 2π Φ (1)
* 2 a 2
ARMA模型的估计 模型的估计
条件极大似然估计; 极大似然估计; 最小二乘估计;
单位根过程
称为单位 如果 Φ (1) = 0 ,那么 { y } 称为单位 过程,此时为非平稳过程。 根过程,此时为非平稳过程。 比如如下的I(1)过程: 过程: 比如如下的 过程
对长记忆性的判断
对于长记忆过程
T
−1/ 2
QT ∞ →
p
因此利用该统计量可以对长记忆过程进 行单边的检验。
对数全距序列的修正的R/S分析 分析 对数全距序列的修正的
V-stat q=14 NeweyNewey-West (1994) Andrew(1991) 4.2672 6.6049 3.4653 p-Value 0.0000 0.0000 0.0000
2 T
$ $ ≡ γ 0 + 2∑ ω j ( q)γ j
j =1
q
修正的R/S统计量的渐近分布 统计量的渐近分布 修正的
对于短期过程
T −1/ 2 ⋅ QT ⇒ V
其中V是定义在[0,1] 上的布朗桥的全距
E(V ) = π / 2 ≈ 1.25 Std(V ) = π (π − 3) / 6 ≈ 0.27
2. 长记忆的概念
基于自相关函数的定义
如果存在常数 0 < d < 1/ 2 ,使得
ρ k ~ c ⋅ k 2 d −1 ,
as k → ∞
此时自相关函数不再绝对可和,
lim ∑ | ρ j |= ∞
n →∞ j =− n n
基于谱函数的定义
如果存在常数
0 < d < 1/ 2
−2 d
,使得
f (ω ) ~ G ⋅ ω
Rk = cov( yt , yt + k ), k = 0, ±1, ±2,L
ρ k = co rr( yt , yt +k ), k = 0, ±1, ±2,L
ARMA模型的形式 模型的形式
ARMA(p,q)模型
Φ ( B )( yt − µ ) = Θ( B )at Φ ( B ) = 1 − ϕ1B − L − ϕ p B p , Θ( B ) = 1 + θ1B + L + θ q B q ,
估计的谱密度函数
0.2 0 .18 0 .16 0 .14 0 .12 0.1 0 .08 0 .06 0 .04 0 .02 0 0.5 1 1 .5 2 2.5 3 3.5
估计的ARMA模型 模型 估计的
经过模型选择阶数得到
(1 − 0.9623B )( yt + 4.0875) = (1 − 0.7248B )at
自相关函数图形
(a ) R a n ge
0 .6 0 .5 0 .4 0 .3 0 .2 0 .1 0 - 0 .1 0 1 00 2 00 3 00 4 00 500 600 700 800
(b ) Lo g R a n ge
0 .6 0 .5 0 .4 0 .3 0 .2 0 .1 0 - 0 .1 0 1 00 2 00 3 00 4 00 500 600 700 800
其中{a } 是白噪声
t
E ( at ) = 0, E ( at as ) = 0,
E ( at2 ) = σ 2 , for t ≠ s
ARMA模型的平稳性条件 模型的平稳性条件
如果 Φ ( z ) ≠ 0, for | z |≤ 1 ,那么ARMA模型定义 了唯一的二阶平稳解
+∞ Θ( B ) yt = µ + at ≡ µ + ∑ψ j at − j Φ( B) j =0