第七章 序列相关性
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i i1 i , 1 1
其中 称为自协方差系数或一阶自回归系数,
(7-4)
i是满足以下标准OLS假定的随机干扰项: E(i ) 0, Var(i ) 2 , Cov(i ,is ) 0(s 0)
由于序列相关性经常出现在以时间序列数据为样本的模型中,因此, 本节下面将代表不同样本点的下表i用t 表示。
2.模型设定的偏误
定义:
指所设定的模型“不正确”,主要表现在模型中丢掉了重要的解释
变量或模型函数形式有偏误。
例1:(丢掉了重要的解释变量)
本来应该估计的模型为
Yt 0 1X1t 1X 2t 3 X3t t
但在进行回归时,却把模型设定为如下形式:
(7-5)
Yt = β0 + β1 X1t + β2 X 2t + νt
n
(et et 1)2
DW t 2 n
et 2
t 1
杜宾—沃森证明该统计量的分布与出现在给定样本中的X值有复杂的关系,
其准确的抽样或概率分布很难得到;
因为D.W.值要从et中算出,而 et 又依赖于给定的X的值。
因此D-W检验不同于t、F或 χ 2检验,它没有唯一的临界值可以导出拒绝或
第二节 序列相关性的影响
如果我们在干扰中通过假定Cov(t , t j ) E(t t j ) 0
引进序列相关,但保留经典模型的全部其他假定,对OLS 估计量及其方差来说会出现什么情况呢?
1.参数估计量非有效 2.随机误差项方差估计量是有偏的
3.拟合优度检验R2统计量和方程显著性检验F统计量无效
若 0 D.W . dL ,则存在正自相关; 若 dL D.W . dU ,则不确定; 若 dU D.W . 4 dU ,则无自相关; 若 4 dU D.W . 4 dL ,则不确定; 若 4 dL D.W . 4 ,则存在负自相关。
(3)随机干扰。项 t 为一阶自回归形式:t t1 t
(4)回归模型中不应把滞后应变量作为解释变量之一,即不应出现如下形式模型:
Yt 0 1X1t 2 X 2t L k X kt Yt1 t
(5)没有缺失数据。
杜宾—沃森针对原假设 H0 : 0,即 t 不存在一阶自相关,构造如下统计量:
接受原假设。但他们成功导出了临界值的上限 dU 和下限 dL,且这些上下限只与
样本容量n和解释变量的个数有关,而与解释变量的取值无关。
因此,在运用D-W检验时,只须计算该统计量的值,再根据样本容量n
和解释变量数目k查D.W.分布表,得到临界值 dL 和 dU ,然后按下列准则考察
计算得到的D.W.值,以判断模型的自相关状态:
相比,可以看出前者等于后者加上另一与自相关系数 和各期X
的样本协方差有关的项。
2.随机误差项方差估计量是有偏的
在存在干扰项序列相关的情况下,随机误差方差的OLS估计量偏离
了真实的随机误差项的方差 2。
以一元回归模型为例,在经 典假设情况下,干扰项的 OLS方差估计量
n
et2
ˆ 2 t1
由于在序列相关时OLS对随机误差方差估计有偏,结果基于 OLS残差平方和计算出来的拟合优度检验统计量R2也失去意义, 相应的方程显著性检验统计量F统计量也无效。
4.变量的显著性检验t 检验统计量和相应的参数置
信区间估计失去意义
用OLS法估计序列相关的模型得到的随机误差项的方差不仅是 有偏的,而且这一偏误也将传递到用OLS方法得到的参数估计 量的方差中来,从而使得建立在OLS参数估计量方差基础上的 变量显著性检验失去意义。
(7-11)
即同方差和相互独立性条件。而且在大样本情况下,参数估计量虽然 具有一致性,但仍然不具有渐近有效性。
为了具体说明这一点,我们回到简单的一元回归模型
Yi 0 1X i i
(7-12)
为方便我们不妨假定干扰项为(7-4)所示的一阶序列相关:
t t1 t
(7-13)
计量经济学
—理论·方法·EViews应用
郭存芝 杜延军 李春吉 编著
电子教案
第七章 序列相关性
◆ 学习目的
通过本章的学习,你可以知道什么是序列相关性,序列 相关性产生的原因是什么,序列相关性导致什么样的后果, 怎样检验和处理具有序列相关性的模型。
◆ 基本要求
1)掌握序列相关性的概念、序列相关性的后果和检验方法; 2)了解广义最小二乘法和广义差分法原理; 3)能运用广义差分法和广义最小二乘法估计线性回归模型。
例2:(模型函数形式有偏误)
在成本—产出研究中,如果真实的边际成本的模型为:
Yt
=
β0
+
β1 X t
+
β2
X
2 t
+
μt
(7-7)
其中Y代表边际成本,X代表产出。
但是如果建模时设立了如下回归模型:
Yt 0 1 X t vt
(7-8)
2.模型设定的偏误
例2:(模型函数形式有偏误)
但是如果建模时设立了如下回归模型:
t 1
n
xt2
2
t 1
n2
xt xt2
t 1 n
… n1
xt2
t 1
n1
xt
xn
t 1
n
xt2
t 1
式中Var
(
ˆ1
)
为一阶序列相关时
AR1
ˆ1的方差。
把该式与没有干扰项自相关情形的通常公式
(7-15)
2
Var ( ˆ1 )
x
2 t
(7-16)
必然会由残差项 et 反映出来,因此可以利用 et 的变化来判断随机干扰项的序列
相关性,如图7-1所示。
二、回归检验法
以 et为解释变量,以各种可能的相关变量,诸, 如et1, et2 等为解释变量,
建立各种方程:
etet1t (t2,...,n)
(7-20)
et1et12et2t (t3,...,n) (7-21)
4.蛛网现象
例如:
假定某农产品的供给模型为:
St 0 1Pt-1 t
(7-10)
假设t时期的价格Pt低于t-1时期的价格Pt-1,农民就很可能决定在时 期t+1生产比t时期更少的东西。显然在这种情形中,农民由于在年 度t的过量生产很可能在年度t+1消减他们的产量。诸如此类的现象, 就不能期望干扰μt是随机,从而出现蛛网式的序列相关。
5.数据的编造 新生成的数据与原数据间就有了内在的联系,表现出序列相关性。
例如:
季度数据来自月度数据的简单平均,这种平均的计算减 弱了每月数据的波动而引进了数据中的匀滑性,这种匀滑性 本身就能使随机干扰项中出现系统性的因素,从而出现序列 相关性。
利用数据的内插或外推技术构造的数据也会呈现某种系统性的模式。 一般经验表明,对于采用时间序列数据做样本的计量经济学模型, 由于在不同样本点上解释变量意外的其他因素在时间上的连续性, 带来了他们对被解释变量的影响的连续性,所以往往存在序列相关性。
(7-6)
2.模型设定的偏误
例1:(丢掉了重要的解释变量)
如果(7-5)式是正确的模型,那做(7-6)式的回归就 相当于令
vt 3 X 3t t
于是误差项v将表现出一种系统性模式,从而形成了自相关。
2.模型设定的偏误
定义:
指所设定的模型“不正确”,主要表现在模型中丢掉了重要的解释
变量或模型函数形式有偏误。
二、序列相关的原因
1.经济数据序列惯性 2.模型设定的偏误 3.滞后效应 4.蛛网现象 5.数据的编造
1.经济数据序列惯性
比如:
GDP、价格指数、消费等时间序列数据通常表现为周期循环。当经 济衰退的谷底开始复苏时,大多数经济序列开始上升,在上升期间,序 列在每一时刻的值都高于前一时刻的值。看来有一种内在的动力驱使这 一势头继续下去,直至某些情况出现(如利率或税收提高)才把它拖慢 下来。 因此,在涉及时间序列的回归中,相继的观测值很可能是相互依赖的。
以一元回归模型为例,
Yi 0 1X i i
2
Var ( ˆ1 )
x
2 t
即使随机误差的方差 2没有被低估,通常OLS参数估计量的方差式(7-16)
也是存在一阶序列相关时参数估计量方差的偏误估计量。
5.模型的预测失效
被解释变量预测值区间与模型参数和随机误差的估计量的方差有关。 在存在序列相关时OLS估计的随机误差项方差有偏,参数估计量方
n2
是真实的 2的无偏估计,即有E(ˆ 2 ) 。2 但若随机误差项存在一阶序列相关
则可以证明:
E(ˆ 2 ) 2 n [2 /(1 )] 2r
n2
n
xt xt1
r 式中
t2
n 为X的相继观测值之间的样本相关系数。
xt2
t1
3.拟合优度检验R2统计量和方程显著性检验F统计量无效
(7-1)
在其他假设仍然成立的条件下,随机干扰项序列相关意味着
如果仅存在
Cov( i, j) E( i j) 0
E(ii1) 0, i 1, 2,..., n
(7-2) (7-3)
则称为一阶序列相关或自相关(简写为AR(1)),这是常见的一种序列相关问题。
自相关往往可以写成如下形式:
对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方 程显著成立,则说明原模型存在序列相关性。
优点:
一旦确定了模型存在序列相关性,也就同时知道了相关的形式,而且它 适用于任何类型的序列相关性问题的检验。
三、杜宾—沃森检验
D-W检验是杜宾(J.Durbin)和沃森(G.S.Watson)于1951年提出 的一种检验序列自相关的方法。虽然该方法很常用,但它有一些基本假定: (1)回归含有截距项。 (2)解释变量X是非随机的,或者在重复抽样中被固定的。
差非有效,这样回归模型的被解释变量的预测值及预测区间就不准确, 预测精度降低。
所以,当模型出现序列相关时,它的预测功能失效。
第三节 序列相关性的检验
序列相关性的检验方法有多种,如冯诺曼比检验法、回归检验法、D.W.检验法等。
不同的检验方法的共同思路:
首先采用普通最小二乘法估计模型,以得到随机干扰项的近似估
第七章 序列相关性
◆序列相关性及其产生原因 ◆ 序列相关性的影响 ◆序列相关性的检验 ◆序列相关的补救 ◆案例分析
第一节 序列相关性及其产生原因
—、序列相关性的含义
对于多元线性回归模型
Yi 0 1X1i 2 X 2i L k X ki i i 1, 2,L , n
Ct 0 1Yt 2Ct1 t
(7-9)
其中,C是消费,Y是收入。
类似(7-9)式的回归模型被称为自回归模型
注意:
由于心理上、技术上以及制度上的原因,消费者不会轻易改变其消费 习惯,如果我们忽视(7-9)式中的滞后消费对当前消费的影响,那所带来 的误差项就会体现出一种系统性的模式。
Yt 0 1 X t vt
(7-8)
因此在(7-8)中,vt 2Xt2 t 它包含了产出的平方对随机 干扰项的系统性影响,随机干扰项呈现序列相关性。
3.滞后效应
考虑一个消费支出对收入进行回归的时间序列模型,人们常常发 现当期的消费支出除了依赖其他当期收入外,还依赖前期的消费支出, 即回归模型为:
4.变量的显著性检验t检验统计量和相应的参数置信区间估计失去意义
5.模型的预测失效
1.参数估计量非有效
根据OLS估计中关于参数估计量的无偏性和有效性的证明过程 可以看出,当计量经济学模型出现序列相关性时,其OLS参数估计 量仍然具有线性无偏性,但不具有有效性。因为在有效性证明中我 们利用了
E() 2I
对于干扰项为一阶序列相关的一元回归模型采用OLS估计,如以前
一样,β1的OLS估计量为:
ˆ1
xt yt xt2
Hale Waihona Puke Baidu
(7-14)
但给定干扰项为一阶序列相关时,1 的方差估计量现在为:
Var(ˆ1)AR1
2
xt2
2 2
xt2
n1
xt xt1
计量,我们用 et 表示近似估计量:
et Yt Ytols
(7-19)
然后通过分析这些近似估计量之间的相关性以达到判断随机干扰 项是否具有序列相关性的目的。
序列相关性的检验方法
一、图示法 二、回归检验法 三、杜宾—沃森检验 四、拉格朗日乘子检验
一、图示法 由于残差et 可以作为随机误差t的估计,因此,如果 t 存在序列相关性,
其中 称为自协方差系数或一阶自回归系数,
(7-4)
i是满足以下标准OLS假定的随机干扰项: E(i ) 0, Var(i ) 2 , Cov(i ,is ) 0(s 0)
由于序列相关性经常出现在以时间序列数据为样本的模型中,因此, 本节下面将代表不同样本点的下表i用t 表示。
2.模型设定的偏误
定义:
指所设定的模型“不正确”,主要表现在模型中丢掉了重要的解释
变量或模型函数形式有偏误。
例1:(丢掉了重要的解释变量)
本来应该估计的模型为
Yt 0 1X1t 1X 2t 3 X3t t
但在进行回归时,却把模型设定为如下形式:
(7-5)
Yt = β0 + β1 X1t + β2 X 2t + νt
n
(et et 1)2
DW t 2 n
et 2
t 1
杜宾—沃森证明该统计量的分布与出现在给定样本中的X值有复杂的关系,
其准确的抽样或概率分布很难得到;
因为D.W.值要从et中算出,而 et 又依赖于给定的X的值。
因此D-W检验不同于t、F或 χ 2检验,它没有唯一的临界值可以导出拒绝或
第二节 序列相关性的影响
如果我们在干扰中通过假定Cov(t , t j ) E(t t j ) 0
引进序列相关,但保留经典模型的全部其他假定,对OLS 估计量及其方差来说会出现什么情况呢?
1.参数估计量非有效 2.随机误差项方差估计量是有偏的
3.拟合优度检验R2统计量和方程显著性检验F统计量无效
若 0 D.W . dL ,则存在正自相关; 若 dL D.W . dU ,则不确定; 若 dU D.W . 4 dU ,则无自相关; 若 4 dU D.W . 4 dL ,则不确定; 若 4 dL D.W . 4 ,则存在负自相关。
(3)随机干扰。项 t 为一阶自回归形式:t t1 t
(4)回归模型中不应把滞后应变量作为解释变量之一,即不应出现如下形式模型:
Yt 0 1X1t 2 X 2t L k X kt Yt1 t
(5)没有缺失数据。
杜宾—沃森针对原假设 H0 : 0,即 t 不存在一阶自相关,构造如下统计量:
接受原假设。但他们成功导出了临界值的上限 dU 和下限 dL,且这些上下限只与
样本容量n和解释变量的个数有关,而与解释变量的取值无关。
因此,在运用D-W检验时,只须计算该统计量的值,再根据样本容量n
和解释变量数目k查D.W.分布表,得到临界值 dL 和 dU ,然后按下列准则考察
计算得到的D.W.值,以判断模型的自相关状态:
相比,可以看出前者等于后者加上另一与自相关系数 和各期X
的样本协方差有关的项。
2.随机误差项方差估计量是有偏的
在存在干扰项序列相关的情况下,随机误差方差的OLS估计量偏离
了真实的随机误差项的方差 2。
以一元回归模型为例,在经 典假设情况下,干扰项的 OLS方差估计量
n
et2
ˆ 2 t1
由于在序列相关时OLS对随机误差方差估计有偏,结果基于 OLS残差平方和计算出来的拟合优度检验统计量R2也失去意义, 相应的方程显著性检验统计量F统计量也无效。
4.变量的显著性检验t 检验统计量和相应的参数置
信区间估计失去意义
用OLS法估计序列相关的模型得到的随机误差项的方差不仅是 有偏的,而且这一偏误也将传递到用OLS方法得到的参数估计 量的方差中来,从而使得建立在OLS参数估计量方差基础上的 变量显著性检验失去意义。
(7-11)
即同方差和相互独立性条件。而且在大样本情况下,参数估计量虽然 具有一致性,但仍然不具有渐近有效性。
为了具体说明这一点,我们回到简单的一元回归模型
Yi 0 1X i i
(7-12)
为方便我们不妨假定干扰项为(7-4)所示的一阶序列相关:
t t1 t
(7-13)
计量经济学
—理论·方法·EViews应用
郭存芝 杜延军 李春吉 编著
电子教案
第七章 序列相关性
◆ 学习目的
通过本章的学习,你可以知道什么是序列相关性,序列 相关性产生的原因是什么,序列相关性导致什么样的后果, 怎样检验和处理具有序列相关性的模型。
◆ 基本要求
1)掌握序列相关性的概念、序列相关性的后果和检验方法; 2)了解广义最小二乘法和广义差分法原理; 3)能运用广义差分法和广义最小二乘法估计线性回归模型。
例2:(模型函数形式有偏误)
在成本—产出研究中,如果真实的边际成本的模型为:
Yt
=
β0
+
β1 X t
+
β2
X
2 t
+
μt
(7-7)
其中Y代表边际成本,X代表产出。
但是如果建模时设立了如下回归模型:
Yt 0 1 X t vt
(7-8)
2.模型设定的偏误
例2:(模型函数形式有偏误)
但是如果建模时设立了如下回归模型:
t 1
n
xt2
2
t 1
n2
xt xt2
t 1 n
… n1
xt2
t 1
n1
xt
xn
t 1
n
xt2
t 1
式中Var
(
ˆ1
)
为一阶序列相关时
AR1
ˆ1的方差。
把该式与没有干扰项自相关情形的通常公式
(7-15)
2
Var ( ˆ1 )
x
2 t
(7-16)
必然会由残差项 et 反映出来,因此可以利用 et 的变化来判断随机干扰项的序列
相关性,如图7-1所示。
二、回归检验法
以 et为解释变量,以各种可能的相关变量,诸, 如et1, et2 等为解释变量,
建立各种方程:
etet1t (t2,...,n)
(7-20)
et1et12et2t (t3,...,n) (7-21)
4.蛛网现象
例如:
假定某农产品的供给模型为:
St 0 1Pt-1 t
(7-10)
假设t时期的价格Pt低于t-1时期的价格Pt-1,农民就很可能决定在时 期t+1生产比t时期更少的东西。显然在这种情形中,农民由于在年 度t的过量生产很可能在年度t+1消减他们的产量。诸如此类的现象, 就不能期望干扰μt是随机,从而出现蛛网式的序列相关。
5.数据的编造 新生成的数据与原数据间就有了内在的联系,表现出序列相关性。
例如:
季度数据来自月度数据的简单平均,这种平均的计算减 弱了每月数据的波动而引进了数据中的匀滑性,这种匀滑性 本身就能使随机干扰项中出现系统性的因素,从而出现序列 相关性。
利用数据的内插或外推技术构造的数据也会呈现某种系统性的模式。 一般经验表明,对于采用时间序列数据做样本的计量经济学模型, 由于在不同样本点上解释变量意外的其他因素在时间上的连续性, 带来了他们对被解释变量的影响的连续性,所以往往存在序列相关性。
(7-6)
2.模型设定的偏误
例1:(丢掉了重要的解释变量)
如果(7-5)式是正确的模型,那做(7-6)式的回归就 相当于令
vt 3 X 3t t
于是误差项v将表现出一种系统性模式,从而形成了自相关。
2.模型设定的偏误
定义:
指所设定的模型“不正确”,主要表现在模型中丢掉了重要的解释
变量或模型函数形式有偏误。
二、序列相关的原因
1.经济数据序列惯性 2.模型设定的偏误 3.滞后效应 4.蛛网现象 5.数据的编造
1.经济数据序列惯性
比如:
GDP、价格指数、消费等时间序列数据通常表现为周期循环。当经 济衰退的谷底开始复苏时,大多数经济序列开始上升,在上升期间,序 列在每一时刻的值都高于前一时刻的值。看来有一种内在的动力驱使这 一势头继续下去,直至某些情况出现(如利率或税收提高)才把它拖慢 下来。 因此,在涉及时间序列的回归中,相继的观测值很可能是相互依赖的。
以一元回归模型为例,
Yi 0 1X i i
2
Var ( ˆ1 )
x
2 t
即使随机误差的方差 2没有被低估,通常OLS参数估计量的方差式(7-16)
也是存在一阶序列相关时参数估计量方差的偏误估计量。
5.模型的预测失效
被解释变量预测值区间与模型参数和随机误差的估计量的方差有关。 在存在序列相关时OLS估计的随机误差项方差有偏,参数估计量方
n2
是真实的 2的无偏估计,即有E(ˆ 2 ) 。2 但若随机误差项存在一阶序列相关
则可以证明:
E(ˆ 2 ) 2 n [2 /(1 )] 2r
n2
n
xt xt1
r 式中
t2
n 为X的相继观测值之间的样本相关系数。
xt2
t1
3.拟合优度检验R2统计量和方程显著性检验F统计量无效
(7-1)
在其他假设仍然成立的条件下,随机干扰项序列相关意味着
如果仅存在
Cov( i, j) E( i j) 0
E(ii1) 0, i 1, 2,..., n
(7-2) (7-3)
则称为一阶序列相关或自相关(简写为AR(1)),这是常见的一种序列相关问题。
自相关往往可以写成如下形式:
对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方 程显著成立,则说明原模型存在序列相关性。
优点:
一旦确定了模型存在序列相关性,也就同时知道了相关的形式,而且它 适用于任何类型的序列相关性问题的检验。
三、杜宾—沃森检验
D-W检验是杜宾(J.Durbin)和沃森(G.S.Watson)于1951年提出 的一种检验序列自相关的方法。虽然该方法很常用,但它有一些基本假定: (1)回归含有截距项。 (2)解释变量X是非随机的,或者在重复抽样中被固定的。
差非有效,这样回归模型的被解释变量的预测值及预测区间就不准确, 预测精度降低。
所以,当模型出现序列相关时,它的预测功能失效。
第三节 序列相关性的检验
序列相关性的检验方法有多种,如冯诺曼比检验法、回归检验法、D.W.检验法等。
不同的检验方法的共同思路:
首先采用普通最小二乘法估计模型,以得到随机干扰项的近似估
第七章 序列相关性
◆序列相关性及其产生原因 ◆ 序列相关性的影响 ◆序列相关性的检验 ◆序列相关的补救 ◆案例分析
第一节 序列相关性及其产生原因
—、序列相关性的含义
对于多元线性回归模型
Yi 0 1X1i 2 X 2i L k X ki i i 1, 2,L , n
Ct 0 1Yt 2Ct1 t
(7-9)
其中,C是消费,Y是收入。
类似(7-9)式的回归模型被称为自回归模型
注意:
由于心理上、技术上以及制度上的原因,消费者不会轻易改变其消费 习惯,如果我们忽视(7-9)式中的滞后消费对当前消费的影响,那所带来 的误差项就会体现出一种系统性的模式。
Yt 0 1 X t vt
(7-8)
因此在(7-8)中,vt 2Xt2 t 它包含了产出的平方对随机 干扰项的系统性影响,随机干扰项呈现序列相关性。
3.滞后效应
考虑一个消费支出对收入进行回归的时间序列模型,人们常常发 现当期的消费支出除了依赖其他当期收入外,还依赖前期的消费支出, 即回归模型为:
4.变量的显著性检验t检验统计量和相应的参数置信区间估计失去意义
5.模型的预测失效
1.参数估计量非有效
根据OLS估计中关于参数估计量的无偏性和有效性的证明过程 可以看出,当计量经济学模型出现序列相关性时,其OLS参数估计 量仍然具有线性无偏性,但不具有有效性。因为在有效性证明中我 们利用了
E() 2I
对于干扰项为一阶序列相关的一元回归模型采用OLS估计,如以前
一样,β1的OLS估计量为:
ˆ1
xt yt xt2
Hale Waihona Puke Baidu
(7-14)
但给定干扰项为一阶序列相关时,1 的方差估计量现在为:
Var(ˆ1)AR1
2
xt2
2 2
xt2
n1
xt xt1
计量,我们用 et 表示近似估计量:
et Yt Ytols
(7-19)
然后通过分析这些近似估计量之间的相关性以达到判断随机干扰 项是否具有序列相关性的目的。
序列相关性的检验方法
一、图示法 二、回归检验法 三、杜宾—沃森检验 四、拉格朗日乘子检验
一、图示法 由于残差et 可以作为随机误差t的估计,因此,如果 t 存在序列相关性,