计量经济学:自相关
计量经济学讲义—— 线性回归模型的自相关问题
10.5 自相关的诊断-Durbin-Watson d检验法
Durbin-Watson d统计量可以用来诊断回归模型的自相关
n
d =
∑
t=2
( e t − e t −1 ) 2
n
∑
样本容量为n-1。
t =1
e t2
(10.3)
Durbin-Watson d检验量是诊断自相关常用的检验 工具,必须掌握。
10.2 自相关产生的原因
1. 经济时间序列的惯性(inertia)或迟缓性(sluggishness)特征。 2. 模型适定误差。有些自相关并不是由于连续观察值之间相 关产生的,而是因为回归模型不是适定性的“好”模型。 “不好模型”有多种原因。 3. 蛛网现象(the cobweb phenomenon)。一个变量对另一个变 量的反映不是同步的,时滞一定的时间。商品供给对价格 的反映: St = B1 + B2*Pt-1 + ut (10.2)
∑
t=2 n
e t e t −1 e t2
ˆ ,− 1 ≤ ρ ≤ 1
(10.5)
∑
t =1
如果d接近0,则存在正相关;d接近4,则存在负相关;d 接近2,表示不存在相关。
10.5 自相关的诊断-Durbin-Watson d检验法
d 统计量诊断自相关需要一定的假设条件,不是任意可用的: 1. 回归模型包括一个截距项。因此,d统计量无法判断通过原 点的回归模型的自相关问题。 2. 变量X是非随机变量,即在重复抽样中变量X的值是固定不 变的。 3. 扰动项ui的生成机制是:
4. 数据处理。在做季节因素的调整时,经常要做移动平均。 移动平均的处理可以消除季节波动的影响,但带来新的问 题则是产生了自相关。
计量经济学第六章自相关
计量经济学第六章自相关自相关是计量经济学中一种重要的现象,它指的是一个变量与其自己在过去时间点上的相关性。
自相关在实证研究中十分常见,对经济学家来说,了解和掌握自相关性质是至关重要的。
1. 引言自相关作为计量经济学的一项基础概念,是经济学研究中不可或缺的一个重要方法。
自相关性的存在通常会引起回归结果的偏误,而忽略自相关性可能导致估计不准确的结果。
因此,探讨自相关性的性质和应对方法是计量经济学的重点之一。
2. 自相关的定义和表示自相关是指一个变量与其自身在过去时间点上的相关性。
假设我们有一个时间序列数据集,其中变量yt表示一个时间点上的观测值,t表示时间索引。
自相关系数可以通过计算观测值yt与其在过去某一时间点上的观测值yt-k(k为时间滞后期数)的相关性来得到。
数学上,自相关系数可以用公式表示为:ρ(k) = Cov(yt, yt-k) / (σ(yt) * σ(yt-k))其中,ρ(k)表示第k期的自相关系数,Cov表示协方差,σ表示标准差。
3. 自相关性的性质自相关性具有以下几个性质:3.1 一阶自相关性一阶自相关性是指变量值yt与前一期的观测值yt-1之间的相关性。
一阶自相关系数ρ(1)通常用来检验时间序列数据是否存在自相关性。
若ρ(1)大于零且显著,则表明存在正的一阶自相关性;若ρ(1)小于零且显著,则表明存在负的一阶自相关性。
3.2 高阶自相关性除了一阶自相关性,时间序列数据还可能存在高阶自相关性。
高阶自相关性是指变量值yt与过去第k期的观测值yt-k之间的相关性。
通过计算不同滞后期的自相关系数ρ(k),可以了解数据在不同时间跨度上的自相关性情况。
3.3 异方差自相关性异方差自相关性是指时间序列数据中的方差不仅与自身相关,还与过去观测值的相关性有关。
异方差自相关性可能导致在回归分析中的标准误差失效,从而产生无效的回归结果。
因此,在处理存在异方差自相关性的数据时要采取合适的修正方法。
4. 自相关性的检验方法在实证研究中,经济学家通常使用多种方法来检验数据中的自相关性,常用的方法包括:4.1 Durbin-Watson检验Durbin-Watson检验是一种常用的检验自相关性的方法,其基本思想是通过检验误差项的相关性来判断自相关是否存在。
南开大学计量经济学第6章自相关
经济模型中最常见的是一阶自回归形式。
T
ut ut1
依据 OLS 公式,模型 ut = 1 ut -1 + vt 中1 的估计公式是
aˆ1
=
t=2 T
。
ut12
t=2
若把 ut, u t-1 看作两个变量,则它们的相关系数是 ˆ =
T
ut ut1
t=2
。
T
T
ut 2
u t 1 2
(2)样本容量T
21 1.22 1.42 1.13 1.54 1.03 1.67 0.93 1.81 0.83 1.96
22 1.24 1.43 1.15 1.54 1.05 1.66 0.96 1.80 0.86 1.94 (3)原回归模型中解 23 1.26 1.44 1.17 1.54 1.08 1.66 0.99 1.79 0.90 1.92 释变量个数k(不包括
《Econometrics》 《计量经济学》
攸频
nkeconometrics126 南开大学经济学院数量经济研究所
第六章 自相关
Autocorrelation
§6.1 基本概念、类型及来源 §6.2 自相关的后果 §6.3 自相关的检验(DW检验、LM检验) §6.4 自相关的修正(GLS) §6.5 案例
同理,Cov(ut, ut - s) = s Var(ut)
自相关的表现形式
§6.1.3 自相关的来源
(1)惯性 大多数经济时间数据都有一个明显的特点,即
具有惯性。 如:经济周期
棘轮效应
(2)设定偏误:模型中遗漏了显著的变量
例如:如果对羊肉需求的正确模型应为
Yt=b0+b1X1t+b2X2t+b3X3t+ut
PPT-第8章-自相关-计量经济学及Stata应用
p
QBP n
ˆ
2 j
d
2(
p)
j1
(8.7)
经改进的“Ljung-Box Q 统计量”(Ljung and Box, 1979)为
p ˆ2
QLB
n(n
2)
j1
n
j
j
d 2 ( p)
(8.8)
13
这两种 Q 统计量在大样本下等价,但 Ljung-Box Q 统计量的小 样本性质更好,为 Stata 所采用。
则待估参数多达(n 1),随样本容量n 同步增长,也将导致估计量 不一致。
而且,对n1的估计将很不准确,因为只有一对数据(e1, en )可用 于此估计;类似地,对n2 的估计也不准确,因为只有两对数据
(e1, en1)、(e2 , en )可用于估计;以此类推。
正确的做法是,包括足够多阶数的自相关系数,并让此阶数 p随 着样本容量n 而增长。
n t 2
et2
2
n t 2
et et 1
tn1et2
e n 2
t2 t1
(8.9)
2 2
n t 2
ete
t 1
tn1et2
2(1
ˆ1)
其中, ˆ1为残差的一阶自相关系数。
15
当d 2时, ˆ1 0,无一阶自相关; 当d 0时, ˆ1 1,存在一阶正自相关; 当d 4时, ˆ1 1,存在一阶负自相关。
DW 检验的另一缺点是,其 d 统计量的分布还依赖于数据矩阵 X ,无法制表,须使用其上限分布dU 与下限分布dL (dL d dU )来 间接检验。
即便如此,仍存在“无结论区域”。 DW 统计量的本质就是残差的一阶自相关系数,没有太多信息。
第七章自相关(计量经济学)
3、广义差分法
如果原模型存在:
i 1i1 2 i2 l il i
可以将原模型变换为:
(2.5.11)
Yi 1Yi1 lYil 0 (1 1 l ) 1 ( X i 1 X i1 l X il ) i
(2.5.8)
即
Y*=X*B+N*
该模型具有同方差性和随机误差项互相独立性。
E(** ) E(D1 D1 )
D 1E ( )D 1
D 1 2 WD 1 D 1 2DDD 1 2I
• 于是,可以用OLS法估计模型(2.5.8),得
(X* X* ) 1 X* Y*
(XD 1D 1X) 1 XD 1D 1Y (XΩ1X) 1 XΩ1Y
第七章自相关(计量经济 学)
2021年7月30日星期五
普通最小二乘法(OLS)要求计量模型 的随机误差项相互独立或序列不相关。
如果模型的随机误差项违背了互相独 立的基本假设的情况,称为自相关性。
一、自相关性
1、自相关的概念
对于模型
Yi 0 1 X 1i 2 X 2i k X ki i
e~i 2
大致相等,则(2.5.6)可以化简为:
i2
i2
i 1
n e~i e~i1
D.W . 2(1 i2
) 2(1 )
n e~i2
i 1
式中,
n e~i e~i1 n e~i2 n e~i e~i1
i2
i 1
i2
为一阶自相关模型
n e~i2
i2
t t1 t
1 1
的参数估计,
1
计量经济学第六章-自相关资料
1、时间顺序图—将残差对时间描点
e
e
a
t
b
t
• 如a图所示,扰动项为锯齿型,et随时间变化频繁 地改变符号,表明存在负自相关。
• 如b图所示,扰动项为循环型,et随时间变化不频 繁地改变符号,而是几个正之后跟着几个负的,
几个负之后跟着几个正的,表明存在正自相关。
2、绘制残差et, et-1的图形
• 自相关按形式可分为两类。 • (1)一阶自回归形式
• 当误差项ut只与其滞后一期值有关时,即
ut f (ut1) vt
• 称ut具有一阶自回归形式。
• (2) 高阶自回归形式
• 当误差项ut的本期值不仅与其前一期值有关,而且
与其前若干期的值都有关系时,即
ut f (ut1, t2 ,) vt
• 模型设定偏误: 若所用的数学模型与变量间的真实关系不一致, 误差项常表现出自相关。比如平均成本与产量呈抛 物线关系,当用线性回归模型拟合时,误差项必存 在自相关。
• 回归模型中略去了带有自相关的重要解释变量。 若丢掉了应该列入模型的带有自相关的重要解释变量 ,那么它的影响必然归并到误差项ut中,从而使误差 项呈现自相关。当然略去多个带有自相关的解释变量 ,也许因互相抵消并不使误差项呈现自相关。
=
u2 (xt x)2
当 ut 为一阶自回归形式时
Var ( ˆ1) =
u2 (xt x)2
+2 u 2
ts
(xt (
x)(xs x) s-t (xt x)2 )2
3、参数显著性t检验失效
低估了2,也低估了bi的方差和标准差,等于
夸大了T值,使t检验失去意义
4、降低预测可信度度
参数估计值不具有最小方差性,使预测区间的可信度降低。 所以用依据普通最小二乘法得到的回归方程去预测,预测是无效的。
计量经济学:自相关
Yt = 1 + 2 X 2t + 3 X 3t + ut
而建立模型时,模型设定为: Yt = 1 + 2 X 2t + ut 则 X 3t 对 Y 的影响便归入随机误差项 ut 中,由 t 于 ut 在不同观测点上是相关的,这就造成了 在不同观测点是相关的,呈现出系统模式,此 时 ut 是自相关的。
St 1 2 P t 1 ut
6-12
原因5-模型设定偏误
如果模型中省略了某些重要的解释变量或者模型 函数形式不正确,都会产生系统误差,这种误差 存在于随机误差项中,从而带来了自相关。由于 该现象是由于设定失误造成的自相关,因此,也 称其为虚假自相关。
6-13
例如,应该用两个解释变量,即:
6-14
模型形式设定偏误也会导致自相关现象。如将 形成本曲线设定为线性成本曲线,则必定会导致
自相关。由设定偏误产生的自相关是一种虚假自
相关,可通过改变模型设定予以消除。
自相关关系主要存在于时间序列数据中,但是在
横截面数据中,也可能会出现自相关,通常称其
为空间自相关(Spatial auto correlation)。
体回归模型(PRF)的随机项为 如果自相关形式为 其中 为自相关系数, v 为经典误差项,即 t
E(vt ) 0 , Var(vt ) , Cov(vt , vt+s ) 0 , s 0
2
u1 , u2 ,..., un,
ut = ut -1 + vt
- 1< < 1
6-9
原因2- 经济活动的滞后效应
滞后效应是指某一指标对另一指标的影响不仅 限于当期而是延续若干期。由此带来变量的自 相关。 例如,居民当期可支配收入的增加,不会使居 民的消费水平在当期就达到应有水平,而是要 经过若干期才能达到。因为人的消费观念的改 变客观上存在自适应期。
计量经济学 第六章 自相关性
第六章自相关性6.1 自相关性:6.1.1. 非自相关假定由第2章知回归模型的假定条件之一是,Cov(u i, u j) = E(u i u j) = 0, (i, j∈T, i≠j), (6.1)即误差项u t的取值在时间上是相互无关的。
称误差项u t非自相关。
如果Cov (u i,u j ) ≠ 0, (i≠j)则称误差项u t存在自相关。
自相关又称序列相关。
原指一随机变量在时间上与其滞后项之间的相关。
这里主要是指回归模型中随机误差项u t与其滞后项的相关关系。
自相关也是相关关系的一种。
6.1.2.一阶自相关自相关按形式可分为两类。
(1)一阶自回归形式当误差项u t只与其滞后一期值有关时,即u t = f (u t - 1) + v t称u t具有一阶自回归形式。
(2) 高阶自回归形式当误差项u t的本期值不仅与其前一期值有关,而且与其前若干期的值都有关系时,即u t = f (u t– 1, u t– 2 , …u t– p ) + v t则称u t具有P阶自回归形式。
通常假定误差项的自相关是线性的。
因计量经济模型中自相关的最常见形式是一阶自回归形式,所以下面重点讨论误差项的线性一阶自回归形式,即u t = α1 u t -1 + v t(6.2)其中α1是自回归系数,v t 是随机误差项。
v t 满足通常假设E(v t) = 0, t = 1, 2 …,T,Var(v t) = σv2, t = 1, 2 …,T,Cov(v i , v j ) = 0, i ≠ j , i , j = 1, 2 …, T , Cov(u t -1, v t ) = 0, t = 1, 2 …, T ,依据普通最小二乘法公式,模型(6.2)中 α1 的估计公式是,1ˆa= ∑∑=-=-Tt t Tt t t u u u 22121(1ˆβ=∑---2)())((x x x x y y t t t ) (6.3)其中T 是样本容量。
计量经济学-第12章 自相关
但我们拟合了以下模型:
边际成本 i
1
2
产出 i
vi
于是有:
vi
产出2
3
i
ui
(12.1.4) (12.1.5)
由于函数形式的错误使用,残差将反映出自相关性质
蛛网现象(Cobweb phenomenon)
供给对价格的反应要滞后一个时期
供给 t
1
价格
2
t 1
ut
(12.1.6)
t期产量太多,则t期价格下降,从而t+1期产量减少
滞后效应
在消费支出对收入的时间序列回归中,当期消费还 会受到前期消费水平的影响:
消费 t
1
2收入t
3消费t1
ut
(12.1.7)
这种带有因变量的滞后值的回归也叫自回归“编造”
从月度数据计算得出季度数据,会减小波动,引进 匀滑作用,使扰动项出现系统性模式
并获得具有BLUE性质的估计量
— —这种方法即GLS
未知
一次差分法:因为 落在-1到+1之间,
当 = +1时,广义差分方程(12.6.5)便化为一阶差
分方程:
或:
Yt Yt1 2 ( X t X t1 ) (ut ut1 )
2 ( X t X t1 ) t
xt2
xt2
n
xt2
t 1
n
xt2
t 1
n t 1
xt2
对照:没有自相关情形:
(12.2.5) (12.2.6)
var( 2 )
计量经济学第六章自相关
计量经济学第六章自相关在计量经济学的学习中,自相关是一个重要且颇具挑战性的概念。
自相关,简单来说,就是指在时间序列或横截面数据中,观测值之间存在的某种相关性。
想象一下,我们在研究某个经济变量随时间的变化情况,比如一家公司的销售额。
如果在不同的时间段,销售额的变化不是相互独立的,而是存在一定的关联,这就可能出现了自相关现象。
自相关产生的原因多种多样。
其中一个常见的原因是经济变量的惯性。
例如,消费者的消费习惯往往具有一定的延续性,不会突然发生巨大的改变。
这就导致消费数据在不同时期可能存在相关性。
另一个可能的原因是模型设定的不准确。
如果我们在构建计量经济模型时,遗漏了某些重要的解释变量,那么残差项就可能包含这些被遗漏变量的影响,从而导致自相关。
自相关的存在会给我们的计量经济分析带来一系列问题。
首先,它会影响参数估计的有效性。
在存在自相关的情况下,传统的最小二乘法(OLS)估计得到的参数估计值不再是最优的,估计的方差也会被低估,这可能导致我们对参数的显著性做出错误的判断。
其次,自相关会使我们对模型的假设检验失效。
假设检验是基于一定的统计分布进行的,如果存在自相关,这些分布就不再适用,从而导致检验结果的不可靠。
那么,如何检测自相关呢?常用的方法有图形法、杜宾瓦特森(DurbinWatson)检验等。
图形法是通过绘制残差的序列图来直观地观察是否存在自相关。
如果残差呈现出某种周期性或趋势性,那么就可能存在自相关。
杜宾瓦特森检验则是一种基于统计量的检验方法。
它通过计算一个特定的统计量,并与临界值进行比较来判断是否存在自相关。
如果经过检测发现存在自相关,我们就需要采取相应的方法来处理。
一种常见的方法是广义最小二乘法(GLS)。
GLS通过对原模型进行变换,使得变换后的模型不存在自相关,从而得到更有效的参数估计。
另外,还可以使用一阶差分法。
这种方法将原变量的一阶差分作为新的变量进行回归分析,从而消除可能存在的自相关。
庞皓《计量经济学》笔记和课后习题详解(自相关)【圣才出品】
第6章 自相关6.1 复习笔记考点一:什么是自相关 ★★★1.自相关的概念自相关又称序列相关,是指总体回归模型的随机误差项u i 之间存在相关关系的一种现象。
在古典假定中假设随机误差项是无自相关的,即:Cov (u i ,u j )=E (u i u j )=0(i ≠j )。
如果该假定不能满足,就称u i 与u j 存在自相关,即不同观测点上的误差项彼此相关。
自相关系数可用来表示自相关的程度。
随机误差项u t 与滞后一期的u t -1的自相关系数ρ的计算公式为:1nt t u uρ-=∑式中u t -1是u t 滞后一期的随机误差项,因此上式计算的自相关系数ρ称为一阶自相关系数。
自相关系数ρ的取值范围为-1≤ρ≤1。
如果ρ<0,则u t 与u t -1间存在负相关关系;如果ρ>0,则u t 与u t -1间存在正相关关系;如果ρ=0,则u t 与u t -1不相关。
2.自相关产生的原因(见表6-1)表6-1 自相关产生的原因自相关关系主要存在于时间序列数据中,但是在横截面数据中也可能会出现,通常称横截面数据中出现的自相关为空间自相关。
多数经济时间序列在较长时间内都表现为上升或下降的趋势,因此大多表现为正自相关。
但就自相关本身而言,既有正相关也有负相关。
3.自相关的表现形式(1)一阶自相关随机误差项的一阶自相关形式为:u t=ρu t-1+v t(-1<ρ<1)。
其中,ρ为自相关系数;v t为满足古典假定的误差项,即E(v t)=0,Var(v t)=σ2,Cov(v t,v t+s)=0,s ≠0。
一阶自回归形式记为AR(1),相应的式中的ρ称为一阶自相关系数。
(2)m阶自相关如果一阶自相关中的随机误差项v t是不满足古典假定的误差项,即v t中包含有u t的成分,如包含有u t-2,…,u t-m的影响,则需将u t-2,…,u t-m包含在回归模型中,即:u t=ρ1u t -1+ρ2u t -2+…+ρm u t -m +v t 。
计量经济学(第六章自相关)
Econometrics 2003
1
本节主要内容
1. 自相关的定义和产生原因; 2. 自相关的影响; 3. 自相关的检验; 4. 自相关的补救;
Econometrics 2003
2
6.1 自相关的定义、类型、产生原因
自相关(autocorrelation)定义: 在古典线性回归模型中,我们假定随机扰动项序 列的各项之间不相关。如果这一假定不满足,则 称之为自相关。即用符号表示为:
Econometrics 2003
6
二、设定偏误1:应含而未含变量的情形
例如, 如果真实的回归方程的形式为:
Yt 1 2 X 2t 3 X 3t X 4t 4 ut
其中,因变量表示牛肉需求量,解释变量分别为 牛肉价格、消费者收入和猪肉价格。但是在做回
归时用的是:Yt 1 2 X 2t 3 X 3t vt 则,随机扰动项会出现系统模式:vt X 4t 4 ut
有方差最小性;
2
2. 一般地,残差方差被严重低估( 2 )
3. 参数显著性检验失效;
4. 区间估计和预测区间的精度降低。
Econometrics 2003
11
自相关的后果的例证
以扰动项一阶自相关和双变量回归模型为例:
由ˆ2 2
xt ut xt2
, 显 然 有E ( ˆ2
)
。
2
而 var(ˆ2 ) E(ˆ2 2 )2 E
16
6.2.2对模型检验的影响
考虑自相关时的检 验
对模型检验的影响
忽视自相关时的
检验
Econometrics 2003
17
考虑自相关时的检验
计量经济学 张晓桐版 第六章 自相关
Yt = 0 + 1 X1 t + 2 X2 t + … + k Xk t + ut 考虑误差项为 n 阶自回归形式 ut = 1 ut-1 + … + n ut - n + vt H0: 1 = 2 = …= n = 0
ˆ = 1 - DW = 1 - 0.60 = 0.70
2
2
对原变量做广义差分变换。令
GDYt = Yt - 0.70 Yt -1 GDXt = Xt - 0.70 Xt – 1 以 GDYt, GDXt,(1979 ~ 2000 年),为样本再次回归,得 GDYt = 45.2489 + 0.6782 GDXt
2
0
-2
-4
-6 -6
X(-1)
-4
-2
0
2
4
6
d. 负自相关序列散点图
4 U
2
0
-2
-4 -4
U (-1)
-2
0
2
4
f 非自相关序列散点图
6.2自相关的来源与后果
自相关的来源: 1.模型的数学形式不妥。
2. 惯性。大多数经济时间序列都存在自相关。 3. 回归模型中略去了带有自相关的重要解释变量。
只有当以上两种引起自相关的原因都排除后,才能认为误差 项ut 真正存在自相关。
在这种情况下,解决办法是变换原回归模型,使变换后模型 的随机误差项消除自相关。这种估计方法称作广义最小二乘法。
6.4 自相关的解决方法
Yt = 0 + 1 X1 t + 2 X2 t+ … + k X k t + ut (t = 1, 2, …, T ) 其中ut具有一阶自回归形式ut = ut-1 + vt 其中vt 满足通常的假定条件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
所以在实际应用中,对于序列相关问题一般只进行D.W.检验。
3、LM检验(或BG检验)
• 此方法不仅适用于一阶自相关检验,也适用于高阶自相关的检验。 • 检验步骤: 1、用OLS对回归模型进行,得到残差序列et;
1、经济变量固有的惯性 大多数经济时间序列数据都有一个明显的特点——惯性,表现为 滞后值对本期值具有影响。
例如:GDP、价格指数、生产、就业与失业等时间序列都呈周期性,如周期 中的复苏阶段,大多数经济序列均呈上升势,序列在每一时刻的值都高于前 一时刻的值,似乎有一种内在的动力驱使这一势头继续下去,直至某些情况 (如利率或课税的升高)出现才把它拖慢下来。
证明:由于 DW
e
t 2
T
t
e t 1
2 t T
2
e
t 1
T
e e
t 2 2 t t 2 T T
T
T
2 t 1
2 e t e t 1
t 2 2 t
T
e
t 1 t 2 2 t 1
T
若样本容量足够大,有 则 e e
t 2 2 t
et2
3、数据的“加工整理”
在实际经济问题中,有些数据是通过已知数据生成的。因此,新生
成的数据与原数据间就有了内在的联系,从而表现出序列相关性。
例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每 月数据的波动而引进了数据中的平滑性,这种平滑性本身就能使干扰项 中出现系统性的因素,从而出现序列相关。 还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。
t 1
因此有 DW
2 e
t 2
T
2 t 1
2 e t e t 1
t 2 T 2 t
T
e
t 2
T e e t t 1 21 ˆ 2 1 t 2T et2 t 2
2、德宾-沃森(Durbin-Watson)检验法
计量经济学基础
自相关
主要内容
第一节、非自相关的定义 第二节、自相关的来源与后果 第三节、自相关的检验 第四节、自相关的修正
第一节 非自相关假定
一、自相关的概念:
对于总体线性回归模型: Yi=0+1X1i+2X2i+…+kXki+ui 随机误差项互不相关的基本假设表现为 Cov(ui , uj)=0 ij, i,j=1,2, …,T 如果对于不同的样本点,随机误差项之间存在着某种相关性,则 认为出现了序列相关性,也就是存在着自相关。即, Cov(ui , uj)≠0 ij, i,j=1,2, …,T i=1,2, …,T
2、德宾-沃森(Durbin-Watson)检验法
3)、进行DW检验
①计算D.W.统计量的值, ②根据样本容量n和解释变量数目k查D.W.分布表,得到临界值 dL和dU,
③按照下列准则考察计算得到的D.W.值,以判断随机误差项是
否存在一阶自相关。
DW检验准则
0 DW dL
d L DW dU
二、自相关的分类
根据最小二乘原理和相关系数的定义,可以得到:
ˆ1
u u
t 2 T t t 2
T
t 1
2 u t 1
ˆ
u u
t 2 t 2 u t t 2 T
T
t 1
2 u t 1 t 2
T
1
即在大样本条件下,一阶自回归系数等于该二个变量的相关系数。 由此,误差项的一阶线性自回归形式可写为:
一般经验
一般经验告诉我们,对于采用时间序列数据的计量经济模型,由 于不同样本点上随机误差项在时间上是连续的,因此它们对被解 释变量的影响也存在连续性,所以往往会存在序列相关性。
需要注意的是:在截面数据中也可能产生序列相关性(截面数据
中的序列相关常称为空间相关)。例如在研究家庭收入与消费的 关系中,家庭之间的消费攀比就可能产生空间相关现象。
第一节 非自相关假定
由于 Cov(Yi , Y j ) Cov uv(Yi , Y j ) Cov ui , u j 0
即因变量Yi的取值会对Yj的取值产生影响。
二、自相关的分类
1、按自相关表现形式分类
(1)如果误差项只与其滞后一期的值相关,则称误差项存在着 一阶自相关。即:
2、德宾-沃森(Durbin-Watson)检验法
1)、提出检验假设
H 0 : 0,即随机误差项不存在 一阶序列相关 H1 : 0,即随机误差项存在一 阶序列相关
2 e e t t 1 t 2 2 e t t 1 T T
2)、构造统计量
DW
该统计量的分布与出现在给定样本中的X值有复杂的关系,因此 其精确的分布很难得到。 但是,Durbin和Watson成功地导出了临界值的下限dL和上限dU , 且这些上下限只与样本的容量n和解释变量的个数k有关,而与 解释变量X的取值无关。
第四节 自相关的解决方法
只有当上两种引起自相关的原因都消除以后,才能认为随机 误差项“真正”存在自相关,此时需要对原模型进行变换,使 变换以后的模型的的随机误差项自相关得以消除,进而利用普 通最小二乘法估计回归参数 最常用的方法是广义最小二乘法(GLS: Generalized least squares),这种方法是对原模型进行适当变换以消除误差项的 自相关,进而利用OLS来估计回归参数,相应的回归参数估计 结果称为广义最小二乘估计量。
ut f ut 1 vt , t 1,2,
,T
(2)如果误差项与其滞后若干期(大于1期)的值相关,则误差 项存在着高阶自相关。即 :
ut f ut 1 , ut 2,
v , t 1, 2,
t
,T
二、自相关的分类
计量经济学中最常见的自相关形式为一阶线性自回归形式,即: ut=α1 ut-1 +vt 其中α1称为自回归系数; vt是满足标准的OLS假定的随机误差项:
第二节 自相关的来源与后果
二、自相关存在的后果
1、参数的OLS估计量仍然具有无偏性和线性性 2、参数的OLS估计量不再具有最小方差性。当存在正自相关性时, OLS估计会低估参数估计量的真实方差; 这就意味着在变量的显著性检验中,当存在正序列相关时,由 OLS估计得到的参数方差可能低于真实方差,从而导致t统计量值变 大,拒绝原假设i=0的可能性增加,因此t检验失去意义;同时,参 数的区间估计也不再准确。 3、可能低估随机误差项ui的方差,从而导致模型预测失效
回归检验法的优点是:(1)能够确定序列相关的形式,(2)适 用于任何类型序列相关性问题的检验。缺点是计算量大。
第四节 自相关的解决方法
如果随机误差项被检验证明存在序列相关性,首先应分析产生自
相关的原因,如果是由于模型设定偏误,则应修改模型的数学形式。
怎样查明自相关是由模型设定偏误引起的?一种方法是用残差et 对解释变量进行较高次幂回归,然后对新残差作DW检验,如果此
时自相关消失,则说明模型设定存在偏误。
第四节 自相关的解决方法
如果模型产生自相关的原因是模型中省略了重要解释变量, 则解决方法就是找出被省略了的解释变量,将其作为解释变量 列入模型。
怎样查明此种自相关?一种方法是用残差et对那些可能影响被 解释变量而未被列入模型的解释变量进行回归,并作显著性 检验,从而确定该解释变量的重要性。
该方法的适用条件是:
(1)解释变量 X非随机,或者在重复抽样中被固定; (2)随机误差项ui为一阶自回归形式: ui=ui-1+i
(3)回归模型中不应含有滞后被解释变量作为解释变量,即不
应出现下列形式:Yi=0+1X1i+kXki+Yi-1+ui (4)回归含有截距项; (5)没有缺失数据。
4 - d L DW 4
用坐标图更直观表示DW检验准则:
f (DW)
正 自 相 关
dL
不 能 确 定
dU
无 自 相 关
2
4 dU
不 能 确 定
4 dL
负 自 相 关 4
DW
2、德宾-沃森(Durbin-Watson)检验法
容易证明,当D.W.值在2左右时,模型不存在一阶自相关。
2、模型设定的偏误
所谓模型设定偏误(Specification error)是指所设定的模型“不 正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形 式有偏误。 例如,本来应该估计的模型为: Yt=0+1X1t+ 2X2t + 3X3t + ut 但在模型设定中做了下述回归: Yt=0+1X1t+ 1X2t + vt 因此, vt=3X3t + ut,如果X3确实影响Y,则随机误差项中有一个 重要的系统性影响因素,使其呈序列相关性。
3、LM检验(或BG检验)
LM nR 2 ~ 2 p 3、构造LM统计量:
2 2 4、查 分布表,求得临界值: p
近似
2 若LM nR2 p ,则拒绝原假设,说明随机误差
存在序列相关性,反之不能拒绝原假设。
4、回归检验法
1、用原始样本数据进行OLS回归,得到残差序列{et} 2、以et为被解释变量,以各种可能的相关量,如et-1、et-2 、 (et-1 )2等为解释变量,进行多种形式的辅助回归:
第三节 自相关的检验
• 基本思路 序列相关性检验方法有多种,但基本思路和步骤是相同的。 首先采用普通最小二乘法估计模型,以求得随机误差项ui的“近 似估计量”: