自相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自相关往往可写成如下形式:
i=i-1+i
-1<<1
其中:被称为自协方差系数(coefficient of autocovariance)或一阶自相关系数(first-order coefficient of autocorrelation)
i是满足以下标准OLS假定的随机干扰项:
E ( i ) 0 , var( i ) 2 , cov( i , i s ) 0 s0
第一步,变换差分模型为下列形式:
ˆ ˆ ˆ ˆ Yi 1Yi 1 l Yi l 0 (1 1 l ) 1 ( X i 1 X i 1 l X i l ) i
i 1 l,2 l,, n
进行OLS估计,得各Yj(j=i-1, i-2, …,i-l)前的系数 1,2, , l的估计值
i=1i-1+2i-2+Li-L+i
关于迭代的次数,可根据具体的问题来定。
一般是事先给出一个精度,当相邻两次 1,2, ,L的估计值之差小于这一精度时,迭 代终止。
实践中,有时只要迭代两次,就可得到 较满意的结果。两次迭代过程也被称为科克 伦—奥科特两步法。
(2)杜宾(durbin)两步法 该方法仍是先估计1,2,,l,再对差分模型 进行估计。
ee ~~
t 2 n t
n
t 1
~2 et
t 1
) 2(1 )
D.W . 2(1
ee ~~
t 2 n t
n
t 1
~2 et
t 1
) 2(1 )
这里,
~~ et et 1
t 2 n
~ et 2
t 1
n
~~ et et 1
~ ~ et et 1 t
~ ~ ~ et 1et 1 2 et 2 t
……
如果存在某一种函数形式,使得方程显著成 立,则说明原模型存在自相关。
回归检验法的优点是:(1)能够确定序列 相关的形式,(2)适用于任何类型自相关问题 的检验。
D-W 检验 是杜 宾 (J.Durbin )和 瓦 尔森 (G.S. Watson)于1951年提出的一种检验序列自 相关的方法。该方法的假定条件是:
不能确定 存在负自相关
不 能 确 定
正 相 关
负 相 关
0
dL
dU
2
4-dU 4-dL
证明: 展开D.W.统计量:
D.W . ~ e
t 2 n 2 t
~ ~~ et 21 2 et et 1
t 2 t 2
n
n
(*)
~ et 2
t 1
n
D.W . 2(1
所谓模型设定偏误(Specification error)是指 所设定的模型“不正确”。主要表现在模型中丢掉 了重要的解释变量或模型函数形式有偏误。 例如,本来应该估计的模型为
Yt=0+1X1t+ 2X2t + 3X3t + t
但在模型设定中做了下述回归: Yt=0+1X1t+ 1X2t + vt 因此, vt=3X3t + t,如果X3确实影响Y,则出 现自相关。
ˆ ˆ ˆ 第二步,将估计的 1 , 2 , , l 代入差分模型
Yi 1Yi 1 l Yi l 0 (1 1 l ) 1 ( X i 1 X i 1 l X i l ) i
i 1 l ,2 l , , n
Yt Yt 1 0 (1 ) 1 ( X1t X1t 1 ) k ( X kt X kt 1 ) t
t 2,3,, n
Y 1 2 (Y1 )
* 1
X1 1 2 ( X1 )
*
即运用了GLS法,但第一次观测值被排除了。 不过可以使用课本上P254的Prais-Winsten变 换得到第一次观测值。
广义差分法是将原模型变换为满足OLS法的 差分模型,再进行OLS估计。 如果原模型
Yi 0 1 X 1i 2 X 2i k X ki i
存在
t 1t 1 2 t 2 l t l t
可以将原模型变换为:
还有就是两个时间点之间的“内插”技术往 往导致随机项的自相关。
二、自相关的后果
计量经济学模型一旦出现自相关,如果仍采 用OLS法估计模型参数,会产生下列不良后果:
1.
参数估计量非有效
因为,在有效性证明中利用了同方差性和互 相独立性条件。 而且,在大样本情况下,参数估计量虽然具 有一致性,但仍然不具有渐近有效性。
如果对于不同的样本点,随机误差项之间 不再是不相关的,而是存在某种相关性,则认 为出现了自相关(Serial Correlation)。
在其他假设仍成立的条件下,序列相关即意味着
E ( i j ) 0
如果仅存在
E(i i+1)0 i=1,2, …,n
称为一阶自相关,或自相关(autocorrelation)
Yt 1Yt 1 lYt l 0 (1 1 l ) 1( X1t 1X1t 1 l X1t l ) k ( Xkt 1Xkt1 l Xktl ) t
该模型为广义差分模型,不存在序列相关 问题。可进行OLS估计。 广义差分法就是广义最小二乘法(GLS)的 一种,但是此法却损失了部分样本观测值。 如:一阶自相关的情况下,广义差分是估计
D.W .
ቤተ መጻሕፍቲ ባይዱ
~ ~ ( et et 1 ) 2
t 2
n
et 2 ~
t 1
n
该统计量的分布与出现在给定样本中的X值 有复杂的关系,因此其精确的分布很难得到。 但是,他们成功地导出了临界值的下限dL和 上限dU ,且这些上下限只与样本的容量n和解释变 量的个数k有关,而与解释变量X的取值无关。
(1)解释变量X非随机;
(2)随机误差项i为一阶自回归形式: i=i-1+i
(3)回归模型中不应含有滞后应变量作为解释 变量,即不应出现下列形式: Yi=0+1X1i+kXki+Yi-1+i (4)回归含有截距项 D.W. 统计量: 针对原假设:H0: =0, 构如下造统计量:
D.W检验步骤: (1)计算DW值 (2)给定,由n和k的大小查DW分布表,得临 界值dL和dU (3)比较、判断 若 0<D.W.<dL dL<D.W.<dU dU <D.W.<4-dU 存在正自相关 不能确定 无自相关
4-dU <D.W.<4- dL 4-dL <D.W.<4
不 能 确 定 无自相关
t 2
n
~ et 2
t 2
n
为一阶自回归模型 i=i-1+i 的参数估计。 如果存在完全一阶正相关,即=1,则 D.W. 0 完全一阶负相关,即= -1, 则 D.W. 4 完全不相关, 即=0,则 D.W.2
四、序列相关的补救
如果模型被检验证明存在自相关,则需要 发展新的方法估计模型。 最常用的方法是广义差分法(Generalized Difference)。
在变量的显著性检验中,统计量是建立在参 数方差正确估计基础之上的,这只有当随机误差 项具有同方差性和互相独立性时才能成立。
其他检验也是如此。
区间预测与参数估计量的方差有关,在方差有 偏误的情况下,使得预测估计不准确,预测精度降 低。 所以,当模型出现自相关时,它的预测功能失 效。
基本思路: 自相关检验方法有多种,但基本思路相同:
以双变量回归模型和 AR(1)为例。 Yt 1 2 X t ut ut ut 1 t Yt 1 2 X t ut (1)
Yt 1 1 2 X t 1 ut 1 ( 2) (1) (2) : 若已知:Yt Yt 1 (1 ) 1 2 ( X t X t 1 ) (ut ut 1 )
首先,采用OLS法估计原模型
Yi=0+1Xi+i
得到的的“近似估计值”,并以之作为观 测值使用OLS法估计下式
i=1i-1+2i-2+Li-L+i
得到 1 , 2 , , l ,作为随机误差项的相关系 数 , , , 的第一次估计值。
1 2 l
利用D W统计量d 2(1 )求出 = -d / 2, 1 然后再用前面所讲的广义差分法对模型进行估计。
(2)从OLS残差中估计:
et et 1 vt
^
科克伦-奥科特(Cochrane-Orcutt)迭
代法
杜宾(durbin)两步法
(1)科克伦-奥科特迭代法 以一元线性模型为例:
ˆ ˆ ˆ ˆ Yi 1Yi1 l Yil 0 (1 1 l ) 1 ( X i 1 X i1 l X i l ) i
i 1 l,2 l,, n
求出i新的“近拟估计值”, 并以之作为样本 观测值,再次估计:
一、自相关概念 二、实际经济问题中的自相关 三、自相关的后果 四、自相关的检验 五、案例
一、自相关(序列相关)概念
对于模型
Yi=0+1X1i+2X2i+…+kXki+i i=1,2, …,n
随机项互不相关的基本假设表现为 Cov(i , j)=0 ij, i,j=1,2, …,n
又如:如果真实的边际成本回归模型应为: Yt= 0+1Xt+2Xt2+t 其中:Y=边际成本,X=产出。 但建模时设立了如下模型: Yt= 0+1Xt+vt 因此,由于vt= 2Xt2+t, ,包含了产出的平方对随 机项的系统性影响,随机项也呈现自相关。
在实际经济问题中,有些数据是通过已知 数据生成的。 因此,新生成的数据与原数据间就有了内在 的联系,表现出自相关。 例如:季度数据来自月度数据的简单平均,这种 平均的计算减弱了每月数据的波动性,从而使随机 干扰项出现序列相关。
ˆ ˆ 采用 OLS 法估计,得到参数 0 (1 1 l ), 1 的
ˆ* ˆ 0 , 1* 。 估计量,记为
于是:
ˆ ˆ* ˆ ˆ 0 0 (1 1 l ) ,
ˆ ˆ 1 1*
由于随机项的序列相关往往是在模型设定中 遗漏了重要的解释变量或对模型的函数形式设 定有误,这种情形可称为虚假自相关(false autocorrelation) ,应在模型设定中排除。
对(3)运用OLS 估计,得到 (1 ) 1和 2的估计值,进而算出
(3)
1, 2
应用广义最小二乘法或广义差分法,必须已知随机误差项的
相关系数1, 2, … , L 。
实际上,人们并不知道它们的具体数值,所以必须首先对它
们进行估计。
简单的方法有:(1)由DW-d统计量中估计
首先, 采用 OLS 法估计模型, 以求得随机误差项的 “近似估计量” ei 表示: ,用~
~ ˆ ei Yi (Yi ) 0ls
然后,通过分析这些“近似估计量”之间的 相关性,以判断随机误差项是否具有自相关。
~ ~ et 为被解释变量, et 1 、 以 以各种可能的相关量, 诸如以 ~ ~ et 2 、et 2 等为解释变量,建立各种方程:
由于自相关经常出现在以时间序列为样本 的模型中,因此,本节将用下标t代表i。
1.经济变量固有的惯性
大多数经济时间数据都有一个明显的特点:惯 性,表现在时间序列不同时间的前后关联上。 例如,绝对收入假设下居民总消费函数模型:
Ct=0+1Yt+t t=1,2,…,n
由于消费习惯的影响被包含在随机误差项中,则 可能出现自相关(往往是正相关 )。