序列相关性
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i i
2、解析法
(1)回归检验法
~ 为被解释变量, 以e 以各种可能的相关量, 2 ~ ~ ~ e e e 诸如以 i 1 、 i 2 、 i 等为解释变量,建立各 种方程: ~ e ~ e i=2, „,n i i 1 i ~ e ~ e ~ e i 1 i 1 2 i 2 i i=3,„,n „
序列相关性 Serial Correlation
一、序列相关性 二、序列相关性的后果 三、序列相关性的检验 四、具有序列相关性模型的估计 五、案例
普通最小二乘法(OLS)要求计量模型 的随机误差项相互独立或序列不相关。
如果模型的随机误差项违背了互相独立 的基本假设的情况,称为序列相关性。
一、序列相关性
i=1,2,„,n i=2,„,n (2.5.10)
~ y (y e i i i ) 0ls
• 然后,通过分析这些“近似估计量”之间的相 关性,以达到判断随机误差项是否具有序列相关 性的目的。
2、图示法
~ 可以作为 的估计,因此如果 由于残差 e i ~ e 存在序列相关, 必然会由残差项 i 反映出来, ~ e 因此可利用 i 的变化图形来判断随机项的序 列相关性。
i 1
n n n
n
(2.5.6)
当n
~2 , e ~2 , e ~2 较大时, e i i 1 i
i 2 i 2 i 1
大致相等, 则(2.5.6)可以化简为:
D.W . 2(1
~e ~ e
i2 n
n
i i 1
~2 e i
i 1
) 2(1 )
式中,
~e ~ e i i 1
i
对各方程估计并进行显著性检验,如果存在某 一种函数形式,使得方程显著成立,则说明原模 型存在序列相关性。
• 具体应用时需要反复试算。
• 回归检验法的优点是:
一旦确定了模型存在序列相关性,也就同时 知道了相关的形式; 它适用于任何类型的序列相关性问题的检验。
(2)杜宾-瓦森(Durbin-Watson)检验法
1 2
1
1
2I
• 于是,可以用OLS法估计模型(2.5.8),得
* * 1 * * (X X ) X Y
1 1 1 1 1 (X D D X) X D D Y
(2.5.9)
( X Ω1 X ) 1 X Ω1 Y
• 这就是原模型(2.5.7)的广义最小二乘估计量(GLS estimators),是无偏的、有效的估计量。
在其他假设仍成立的条件下,序列相关即意味着 E ( i j ) 0 或
1 T E ( NN ) E n
1
12 1 n n E 2 n n 1
(4)回归含有截距项; (5)没有缺落数据。
Yi=0+1X1i+kXki+Yi-1+i
• D.W.统计量
Durbin 和 Watson 假设: H : 0 , 即 i 不存在一阶自回归; H 1 : 0 , 即 i 存在一阶自回归 并构如下造统计量:
0
D. W .
~ 源自文库 ~ (e
i 2 i
n
2 ) i 1
~2 e i
i 1
n
(2.5.5)
• 该统计量的分布与出现在给定样本中的X值有 复杂的关系,因此其精确的分布很难得到。 • 但是,Durbin和Watson成功地导出了临界值的 下限dL和上限dU ,且这些上下限只与样本的容 量n和解释变量的个数k有关,而与解释变量X 的取值无关。
• 可行的广义最小二乘法(FGLS, Feasible Generalized Least Squares)
文献中常见的术语
如果能够找到一种方法,求得到Ω的估计量, 使得GLS能够实现,都称为FGLS 前面提出的方法,就是FGLS
2、一阶差分法
一阶差分法是将原模型
Yi 0 1 X i i
•设 =DD’ 用D-1左乘(2.5.7)两边,得到一个新的模型: D-1 Y=D-1 XB+D-1 N (2.5.8) 即 Y*=X*B+N* 该模型具有同方差性和随机误差项互相独立性。
E ( ) E (D D
* *
1
1
1
)
D E ( )D D 1 2 WD 1 D DD D
四、具有序列相关性模型的估计
• 如果模型被检验证明存在序列相关性, 则需要发展新的方法估计模型。 • 最常用的方法是广义最小二乘法(GLS: Generalized least squares)、一阶差分 法(First-Order Difference)和广义差分 法(Generalized Difference)。
2
I
(2.5.1)
如果仅存在
E ( i i 1 ) 0
i=1,2,„,n-1
(2.5.2)
称为 一阶序列相关 ,或 自相关 ( autocorrelation )。 这是最常见的一种序列相关问题。 自相关往往可写成如下形式:
t t 1 t
1 1
(2.5.3)
•注意: ( 1 )从判断准则看到,存在一个不能确定的 D.W.值区域,这是这种检验方法的一大缺陷。 (2)D.W.检验虽然只能检验一阶自相关,但在 实际计量经济学问题中,一阶自相关是出现最多 的一类序列相关; ( 3 )经验表明,如果不存在一阶自相关,一般 也不存在高阶序列相关。 所以在实际应用中,对于序列相关问题一般只 进行D.W.检验。
(2)设定偏误:模型中遗漏了显著的变量
例如:如果对牛肉需求的正确模型应为
Yt=0+1X1t+2X2t+3X3t+t 其中:Y=牛肉需求量,X1=牛肉价格,X2=消费者收入, X3=猪肉价格。 如果模型设定为: Yt= 0+1X1t+2X2t+vt 那么该式中的随机误差项实际上是:vt= 3X3t+t, 于是在猪肉价格影响牛肉消费量的情况下,这种模 型设定的偏误往往导致随机项中有一个重要的系统性 影响因素,使其呈序列相关性。
•
如何得到矩阵?
仍然是对原模型 (2.5.7) 首先采用普通最小二乘 法,得到随机误差项的近似估计量,以此构成矩 阵的估计量 ,即
~2 e 1 ~ ~ e2 e1 ~ ~ en e1
~e ~ e ~e ~ e 1 2 1 n 2 ~ ~ ~ e2 e2 en 2 ~ ~ ~ en e2 en
i2 n
~2 ~e ~ e e i i i 1
i 1 i2
n
n
~2 e i
i2
n
为一阶自相关模型
t t 1 t
的参数估计,
1 1
如果存在完全一阶正相关,即 =1, 则 D.W. 0 如果存在完全一阶负相关,即 = -1, 则 D.W. 4 如果完全不相关,即 =0, 则 D.W.2
例如,农产品供给对价格的反映本身存在一个 滞后期: 供给t= 0+1价格t-1+t 意味着,农民由于在年度t的过量生产(使该期价 格下降)很可能导致在年度t+1时削减产量,因此 不能期望随机干扰项是随机的,往往产生一种蛛 网模式。
(5)数据的“编造” 例如,季度数据来自月度数据的简单平均,这 种平均的计算减弱了每月数据的波动而引进了数 据中的匀滑性,这种匀滑性本身就能使干扰项中 出现系统性的因素,从而出现序列相关。 还有就是两个时间点之间的“内插”技术往往 导致随机项的序列相关性。
二、序列相关性的后果
1、参数估计量非有效 • OLS参数估计量仍具无偏性
• OLS估计量不具有有效性 • 在大样本情况下,参数估计量仍然不具有渐近有 效性,这就是说参数估计量不具有一致性
2、变量的显著性检验失去意义
在关于变量的显著性检验中,当存在序列相关 时,参数的OLS估计量的方差增大,标准差也增 大,因此实际的 t 统计量变小,从而接受原假设 i=0的可能性增大, 检验就失去意义。 采用其它检验也是如此。
E ( 12 ) E ( 1 n ) 12 E ( 1 n ) 2 E ( ) E ( 2 ) E ( ) n 1 n n 1 n 2 E ( 1 n ) 2 Ω E ( ) 2 n 1
• D-W检验是杜宾(J.Durbin)和瓦森(G.S. Watson) 于1951年提出的一种检验序列自相关的方法。 • 该方法的假定条件是:
(1)解释变量 X非随机;
(2)随机误差项i为一阶自回归形式: i=i-1+i ( 3 )回归模型中不应含有滞后应变量作为解释变 量,即不应出现下列形式:
• 检验步骤 ①计算该统计量的值, ②根据样本容量n和解释变量数目k查D.W.分 布表,得到临界值dL和dU, ③按照下列准则考察计算得到的D.W.值,以判 断模型的自相关状态。
若
0<D.W.<d l
dl du du <D.W.<
则存在正自相关 不能确定 无自相关 不能确定 存在负自相关
<D.W.<4 - d u
1、广义最小二乘法
• 对于模型 Y=XB+N (2.5.7) 如果存在序列相关,同时存在异方差,即有
E ( ) 0 Cov ( ) E ( ) 2 w1 w12 w w2 21 w n1 w n 2 w1n w2 n wn
其 中 : 被 称 为 自 协 方 差 系 数 ( coefficient of autocovariance )或 一阶自相关系数 ( first-order coefficient of autocorrelation)。
2、序列相关产生的原因
(1)惯性 大多数经济时间数据都有一个明显的特点,就是 它的惯性。 GDP、价格指数、生产、就业与失业等时间序列都 呈周期性,如周期中的复苏阶段,大多数经济序列均 呈上升势,序列在每一时刻的值都高于前一时刻的值, 似乎有一种内在的动力驱使这一势头继续下去,直至 某些情况(如利率或课税的升高)出现才把它拖慢下 来。
3、模型的预测失效
区间预测与参数估计量的方差有关,在方差有 偏误的情况下,使得预测估计不准确,预测精度 降低。所以,当模型出现序列相关性时,它的预 测功能失效。
三、序列相关性的检验
1、基本思路
• 序列相关性检验方法有多种,但基本思路是相 同的。 • 首先采用普通最小二乘法估计模型,以求得随 机误差项的“近似估计量”:
(3)设定偏误:不正确的函数形式
例如:如果边际成本模型应为: Yt= 0+1Xt+2Xt2+t 其中:Y=边际成本,X=产出。 但建模时设立了如下模型: Yt= 0+1Xt+vt 因此,由于vt= 2Xt2+t, ,包含了产出的平方对随机 项的系统性影响,随机项也呈现序列相关性。
(4)蛛网现象
4 - d u <D.W.<4 - d l 4 - d l <D.W.<4
• 可以看出,当D.W.值在2左右时,模型不存在
一阶自相关。
证明:展开 D.W.统计量:
D. W . ~ e
i 2 n 2 i
~ 2 2 e ~e ~ e i 1 i i 1
i 2 i 2
n
n
~2 e i
1、序列相关的概念
对于模型
Yi 0 1 X 1i 2 X 2 i k X ki i
i=1,2,„,n
随机误差项互不相关的基本假设表现为:
Cov ( i , j ) 0
i≠j,i,j=1,2,„,n
如果对于不同的样本点,随机误差项之间不再是 不相关的,而是存在某种相关性,则认为出现了序 列相关性。
2、解析法
(1)回归检验法
~ 为被解释变量, 以e 以各种可能的相关量, 2 ~ ~ ~ e e e 诸如以 i 1 、 i 2 、 i 等为解释变量,建立各 种方程: ~ e ~ e i=2, „,n i i 1 i ~ e ~ e ~ e i 1 i 1 2 i 2 i i=3,„,n „
序列相关性 Serial Correlation
一、序列相关性 二、序列相关性的后果 三、序列相关性的检验 四、具有序列相关性模型的估计 五、案例
普通最小二乘法(OLS)要求计量模型 的随机误差项相互独立或序列不相关。
如果模型的随机误差项违背了互相独立 的基本假设的情况,称为序列相关性。
一、序列相关性
i=1,2,„,n i=2,„,n (2.5.10)
~ y (y e i i i ) 0ls
• 然后,通过分析这些“近似估计量”之间的相 关性,以达到判断随机误差项是否具有序列相关 性的目的。
2、图示法
~ 可以作为 的估计,因此如果 由于残差 e i ~ e 存在序列相关, 必然会由残差项 i 反映出来, ~ e 因此可利用 i 的变化图形来判断随机项的序 列相关性。
i 1
n n n
n
(2.5.6)
当n
~2 , e ~2 , e ~2 较大时, e i i 1 i
i 2 i 2 i 1
大致相等, 则(2.5.6)可以化简为:
D.W . 2(1
~e ~ e
i2 n
n
i i 1
~2 e i
i 1
) 2(1 )
式中,
~e ~ e i i 1
i
对各方程估计并进行显著性检验,如果存在某 一种函数形式,使得方程显著成立,则说明原模 型存在序列相关性。
• 具体应用时需要反复试算。
• 回归检验法的优点是:
一旦确定了模型存在序列相关性,也就同时 知道了相关的形式; 它适用于任何类型的序列相关性问题的检验。
(2)杜宾-瓦森(Durbin-Watson)检验法
1 2
1
1
2I
• 于是,可以用OLS法估计模型(2.5.8),得
* * 1 * * (X X ) X Y
1 1 1 1 1 (X D D X) X D D Y
(2.5.9)
( X Ω1 X ) 1 X Ω1 Y
• 这就是原模型(2.5.7)的广义最小二乘估计量(GLS estimators),是无偏的、有效的估计量。
在其他假设仍成立的条件下,序列相关即意味着 E ( i j ) 0 或
1 T E ( NN ) E n
1
12 1 n n E 2 n n 1
(4)回归含有截距项; (5)没有缺落数据。
Yi=0+1X1i+kXki+Yi-1+i
• D.W.统计量
Durbin 和 Watson 假设: H : 0 , 即 i 不存在一阶自回归; H 1 : 0 , 即 i 存在一阶自回归 并构如下造统计量:
0
D. W .
~ 源自文库 ~ (e
i 2 i
n
2 ) i 1
~2 e i
i 1
n
(2.5.5)
• 该统计量的分布与出现在给定样本中的X值有 复杂的关系,因此其精确的分布很难得到。 • 但是,Durbin和Watson成功地导出了临界值的 下限dL和上限dU ,且这些上下限只与样本的容 量n和解释变量的个数k有关,而与解释变量X 的取值无关。
• 可行的广义最小二乘法(FGLS, Feasible Generalized Least Squares)
文献中常见的术语
如果能够找到一种方法,求得到Ω的估计量, 使得GLS能够实现,都称为FGLS 前面提出的方法,就是FGLS
2、一阶差分法
一阶差分法是将原模型
Yi 0 1 X i i
•设 =DD’ 用D-1左乘(2.5.7)两边,得到一个新的模型: D-1 Y=D-1 XB+D-1 N (2.5.8) 即 Y*=X*B+N* 该模型具有同方差性和随机误差项互相独立性。
E ( ) E (D D
* *
1
1
1
)
D E ( )D D 1 2 WD 1 D DD D
四、具有序列相关性模型的估计
• 如果模型被检验证明存在序列相关性, 则需要发展新的方法估计模型。 • 最常用的方法是广义最小二乘法(GLS: Generalized least squares)、一阶差分 法(First-Order Difference)和广义差分 法(Generalized Difference)。
2
I
(2.5.1)
如果仅存在
E ( i i 1 ) 0
i=1,2,„,n-1
(2.5.2)
称为 一阶序列相关 ,或 自相关 ( autocorrelation )。 这是最常见的一种序列相关问题。 自相关往往可写成如下形式:
t t 1 t
1 1
(2.5.3)
•注意: ( 1 )从判断准则看到,存在一个不能确定的 D.W.值区域,这是这种检验方法的一大缺陷。 (2)D.W.检验虽然只能检验一阶自相关,但在 实际计量经济学问题中,一阶自相关是出现最多 的一类序列相关; ( 3 )经验表明,如果不存在一阶自相关,一般 也不存在高阶序列相关。 所以在实际应用中,对于序列相关问题一般只 进行D.W.检验。
(2)设定偏误:模型中遗漏了显著的变量
例如:如果对牛肉需求的正确模型应为
Yt=0+1X1t+2X2t+3X3t+t 其中:Y=牛肉需求量,X1=牛肉价格,X2=消费者收入, X3=猪肉价格。 如果模型设定为: Yt= 0+1X1t+2X2t+vt 那么该式中的随机误差项实际上是:vt= 3X3t+t, 于是在猪肉价格影响牛肉消费量的情况下,这种模 型设定的偏误往往导致随机项中有一个重要的系统性 影响因素,使其呈序列相关性。
•
如何得到矩阵?
仍然是对原模型 (2.5.7) 首先采用普通最小二乘 法,得到随机误差项的近似估计量,以此构成矩 阵的估计量 ,即
~2 e 1 ~ ~ e2 e1 ~ ~ en e1
~e ~ e ~e ~ e 1 2 1 n 2 ~ ~ ~ e2 e2 en 2 ~ ~ ~ en e2 en
i2 n
~2 ~e ~ e e i i i 1
i 1 i2
n
n
~2 e i
i2
n
为一阶自相关模型
t t 1 t
的参数估计,
1 1
如果存在完全一阶正相关,即 =1, 则 D.W. 0 如果存在完全一阶负相关,即 = -1, 则 D.W. 4 如果完全不相关,即 =0, 则 D.W.2
例如,农产品供给对价格的反映本身存在一个 滞后期: 供给t= 0+1价格t-1+t 意味着,农民由于在年度t的过量生产(使该期价 格下降)很可能导致在年度t+1时削减产量,因此 不能期望随机干扰项是随机的,往往产生一种蛛 网模式。
(5)数据的“编造” 例如,季度数据来自月度数据的简单平均,这 种平均的计算减弱了每月数据的波动而引进了数 据中的匀滑性,这种匀滑性本身就能使干扰项中 出现系统性的因素,从而出现序列相关。 还有就是两个时间点之间的“内插”技术往往 导致随机项的序列相关性。
二、序列相关性的后果
1、参数估计量非有效 • OLS参数估计量仍具无偏性
• OLS估计量不具有有效性 • 在大样本情况下,参数估计量仍然不具有渐近有 效性,这就是说参数估计量不具有一致性
2、变量的显著性检验失去意义
在关于变量的显著性检验中,当存在序列相关 时,参数的OLS估计量的方差增大,标准差也增 大,因此实际的 t 统计量变小,从而接受原假设 i=0的可能性增大, 检验就失去意义。 采用其它检验也是如此。
E ( 12 ) E ( 1 n ) 12 E ( 1 n ) 2 E ( ) E ( 2 ) E ( ) n 1 n n 1 n 2 E ( 1 n ) 2 Ω E ( ) 2 n 1
• D-W检验是杜宾(J.Durbin)和瓦森(G.S. Watson) 于1951年提出的一种检验序列自相关的方法。 • 该方法的假定条件是:
(1)解释变量 X非随机;
(2)随机误差项i为一阶自回归形式: i=i-1+i ( 3 )回归模型中不应含有滞后应变量作为解释变 量,即不应出现下列形式:
• 检验步骤 ①计算该统计量的值, ②根据样本容量n和解释变量数目k查D.W.分 布表,得到临界值dL和dU, ③按照下列准则考察计算得到的D.W.值,以判 断模型的自相关状态。
若
0<D.W.<d l
dl du du <D.W.<
则存在正自相关 不能确定 无自相关 不能确定 存在负自相关
<D.W.<4 - d u
1、广义最小二乘法
• 对于模型 Y=XB+N (2.5.7) 如果存在序列相关,同时存在异方差,即有
E ( ) 0 Cov ( ) E ( ) 2 w1 w12 w w2 21 w n1 w n 2 w1n w2 n wn
其 中 : 被 称 为 自 协 方 差 系 数 ( coefficient of autocovariance )或 一阶自相关系数 ( first-order coefficient of autocorrelation)。
2、序列相关产生的原因
(1)惯性 大多数经济时间数据都有一个明显的特点,就是 它的惯性。 GDP、价格指数、生产、就业与失业等时间序列都 呈周期性,如周期中的复苏阶段,大多数经济序列均 呈上升势,序列在每一时刻的值都高于前一时刻的值, 似乎有一种内在的动力驱使这一势头继续下去,直至 某些情况(如利率或课税的升高)出现才把它拖慢下 来。
3、模型的预测失效
区间预测与参数估计量的方差有关,在方差有 偏误的情况下,使得预测估计不准确,预测精度 降低。所以,当模型出现序列相关性时,它的预 测功能失效。
三、序列相关性的检验
1、基本思路
• 序列相关性检验方法有多种,但基本思路是相 同的。 • 首先采用普通最小二乘法估计模型,以求得随 机误差项的“近似估计量”:
(3)设定偏误:不正确的函数形式
例如:如果边际成本模型应为: Yt= 0+1Xt+2Xt2+t 其中:Y=边际成本,X=产出。 但建模时设立了如下模型: Yt= 0+1Xt+vt 因此,由于vt= 2Xt2+t, ,包含了产出的平方对随机 项的系统性影响,随机项也呈现序列相关性。
(4)蛛网现象
4 - d u <D.W.<4 - d l 4 - d l <D.W.<4
• 可以看出,当D.W.值在2左右时,模型不存在
一阶自相关。
证明:展开 D.W.统计量:
D. W . ~ e
i 2 n 2 i
~ 2 2 e ~e ~ e i 1 i i 1
i 2 i 2
n
n
~2 e i
1、序列相关的概念
对于模型
Yi 0 1 X 1i 2 X 2 i k X ki i
i=1,2,„,n
随机误差项互不相关的基本假设表现为:
Cov ( i , j ) 0
i≠j,i,j=1,2,„,n
如果对于不同的样本点,随机误差项之间不再是 不相关的,而是存在某种相关性,则认为出现了序 列相关性。