计量经济学课件:第六章-自相关性
计量经济学自相关性课件
t (b)
et 1
如图(b)所示,扰动项的估计值呈锯齿状,随时间 逐次改变符号,表明存在负相关。
二、D-W检验
(一) 假定条件
1、假定变量X是非随机的; 2、随机误差项为一阶自回归形式,即
ut ut 1 t (且误差项 t 满足古典假定 );
3、无滞后的内生变量作为解释变量; 4、截距项不为零; 5、无缺损数据
ts
注:自相关多出现在时间序列数据中。
二、自相关性产生的原因
1、经济变量惯性的作用 由于经济发展存在一定的趋势(自相关性主要产生于时间序列),形成惯性,所 以许多经济变量前后期总是相互关联的,即期的变量受以前各期的影响。这样,
在建立回归模型时,随机扰动项将会序列相关。
例如:当年的投资规模与前一年、甚至前几年的投资有关; 当期家庭消费水平在很大程度受上期消费水平的制约; 企业第 t 期的产量与第 t-1、t-2、--- 期密切相关。 2、滞后效应
Yt 0 1 X 1t 2 X 2t 3Yt 1 t Yt 0 1 X 1t 2 X 2t t
则随机干扰项很可能有自相关。
3、随机偶然因素的干扰
战争、自然灾害等偶然(随机)因素的干扰造成的影响,常常要延续若干时期,反 映在模型中就是干扰项有序列相关。
将残差对时间描点。
如图(a)所示,扰动项的估计值呈循环形,并不频繁地改变符号, 而是相继若干个正的以后跟着几个负的。表明存在正自相关。
et
. . . . . . . . . . .
et
.
. . .. . . . . .. .
.
. .
.
.
. . .
t
et 1
第六章 自相关 《计量经济学》PPT课件
[(
1
ˆ
)
1
xt
ut
]2
(1 ˆ1)2 xt2 2(1 ˆ1) xt ut ut2
(6.2.11)
其中 xt ut xt ut (1 ˆ1) xt2
u
2 t
ut ut
ut2
1 n
ut ut
t t
(1
1 n
)
u
2 t
2 n
ut
t t
ut
所以
2 t
(1
ˆ 1 )2
xt2
第六章 自相关 【本章要点】(1)自相关的概念,自相关强度的 量度—自相关系数,了解经济现象中自相关产生 的原因;(2)自相关性对模型参数估计的影响; (3)检验自相关性的主要方法;(4)消除自相 关影响的方法。 §6.1 自相关 一、自相关的概念
如果经典回归的基本假定4遭到破坏,则
COV(ut ,us)=E(ut us)≠0 , t≠s , t,s=1,2, …,n,即u的取值与 它的前一期或前几期的取值相关,则称u存在序列相关 或自相关。 自相关有正自相关和负自相关之分,对随机项的时间 序列u1,u2,…,un,…,当ut > 0时,随后的若干个随机项 ut+1,u t+2,…都有大于0的倾向,当ut < 0时,随后若干个 随机项都有小于0的倾向,我们说u具有正相关性;而 负自相关则意味着两个相继的随机项ut和ut+1具有正负 号相反的倾向。在经济数据中,常见的是正自相关现象。
(4)根据样本容量n,自变量个数和显著水平0.05 (或0.01)从D-W检验临界值表中查出dL和du。 (5)将d 的现实值与临界值进行比较: ①若d < dL,则否定H0,即u存在一阶线性正自相关; ②若d > 4- dL,则否定H0,即u存在一阶线性负自相关; ③若du< d < 4- du,则不否定 H0,即u不存在(一阶)线 性自相关;
计量经济学第六章自相关
计量经济学第六章自相关自相关是计量经济学中一种重要的现象,它指的是一个变量与其自己在过去时间点上的相关性。
自相关在实证研究中十分常见,对经济学家来说,了解和掌握自相关性质是至关重要的。
1. 引言自相关作为计量经济学的一项基础概念,是经济学研究中不可或缺的一个重要方法。
自相关性的存在通常会引起回归结果的偏误,而忽略自相关性可能导致估计不准确的结果。
因此,探讨自相关性的性质和应对方法是计量经济学的重点之一。
2. 自相关的定义和表示自相关是指一个变量与其自身在过去时间点上的相关性。
假设我们有一个时间序列数据集,其中变量yt表示一个时间点上的观测值,t表示时间索引。
自相关系数可以通过计算观测值yt与其在过去某一时间点上的观测值yt-k(k为时间滞后期数)的相关性来得到。
数学上,自相关系数可以用公式表示为:ρ(k) = Cov(yt, yt-k) / (σ(yt) * σ(yt-k))其中,ρ(k)表示第k期的自相关系数,Cov表示协方差,σ表示标准差。
3. 自相关性的性质自相关性具有以下几个性质:3.1 一阶自相关性一阶自相关性是指变量值yt与前一期的观测值yt-1之间的相关性。
一阶自相关系数ρ(1)通常用来检验时间序列数据是否存在自相关性。
若ρ(1)大于零且显著,则表明存在正的一阶自相关性;若ρ(1)小于零且显著,则表明存在负的一阶自相关性。
3.2 高阶自相关性除了一阶自相关性,时间序列数据还可能存在高阶自相关性。
高阶自相关性是指变量值yt与过去第k期的观测值yt-k之间的相关性。
通过计算不同滞后期的自相关系数ρ(k),可以了解数据在不同时间跨度上的自相关性情况。
3.3 异方差自相关性异方差自相关性是指时间序列数据中的方差不仅与自身相关,还与过去观测值的相关性有关。
异方差自相关性可能导致在回归分析中的标准误差失效,从而产生无效的回归结果。
因此,在处理存在异方差自相关性的数据时要采取合适的修正方法。
4. 自相关性的检验方法在实证研究中,经济学家通常使用多种方法来检验数据中的自相关性,常用的方法包括:4.1 Durbin-Watson检验Durbin-Watson检验是一种常用的检验自相关性的方法,其基本思想是通过检验误差项的相关性来判断自相关是否存在。
南开大学计量经济学第6章自相关
经济模型中最常见的是一阶自回归形式。
T
ut ut1
依据 OLS 公式,模型 ut = 1 ut -1 + vt 中1 的估计公式是
aˆ1
=
t=2 T
。
ut12
t=2
若把 ut, u t-1 看作两个变量,则它们的相关系数是 ˆ =
T
ut ut1
t=2
。
T
T
ut 2
u t 1 2
(2)样本容量T
21 1.22 1.42 1.13 1.54 1.03 1.67 0.93 1.81 0.83 1.96
22 1.24 1.43 1.15 1.54 1.05 1.66 0.96 1.80 0.86 1.94 (3)原回归模型中解 23 1.26 1.44 1.17 1.54 1.08 1.66 0.99 1.79 0.90 1.92 释变量个数k(不包括
《Econometrics》 《计量经济学》
攸频
nkeconometrics126 南开大学经济学院数量经济研究所
第六章 自相关
Autocorrelation
§6.1 基本概念、类型及来源 §6.2 自相关的后果 §6.3 自相关的检验(DW检验、LM检验) §6.4 自相关的修正(GLS) §6.5 案例
同理,Cov(ut, ut - s) = s Var(ut)
自相关的表现形式
§6.1.3 自相关的来源
(1)惯性 大多数经济时间数据都有一个明显的特点,即
具有惯性。 如:经济周期
棘轮效应
(2)设定偏误:模型中遗漏了显著的变量
例如:如果对羊肉需求的正确模型应为
Yt=b0+b1X1t+b2X2t+b3X3t+ut
计量经济学课件-第六章 自相关
2
n t =1
2 u
2 x t
(1+ 2
x x
t =1 n t =1
n -1
t t +1
2 x t
+ 2
2 t =1
x x
n t =1
n -2
t t +2
2 x t
+ ... + 2
n -1
x1 xn
2 x t t =1 n
)
29
当存在自相关时,普通最小二乘估计量不再是最佳线 性无估计量,即它在线性无偏估计量中不是方差最小 的。在实际经济系统中,通常存在正的自相关,
即 >0 ,同时 X 序列自身也呈正相关,因此前式中
右边括号内的值通常大于0。因此,在有自相关的条
ˆ的 件下,仍然使用普通最小二乘法将低估估计量 2 ˆ) 。 方差 Var( 2
2 2 i
ˆ e (n - k ) 也将低估真实的 。
2
30
三、对模型检验的影响
考虑自相关时 的检验
25
以此类推,可得 :
k 2 v k Cov(ut , ut-k ) = Var(ut-k ) = 1- 2
这些协方差分别称为随机误差项 ut 的一阶自协
方差、二阶自协方差和 k 阶自协方差
26
二、对参数估计的影响
在有自相关的条件下,仍然使用普通最小二乘法 ˆ 的方差 Var( ˆ) 将低估估计量
由于现期的随机误差项 不相关,即有 E(vt ut-k ) 0 。因此,可得随机误差
项 ut 与其以前各期 ut -k的协方差分别为:
v2 Cov(ut , ut-1 ) E(ut ut-1 ) 2 1-
第五讲-多重共线性、异方差、自相关
表 4.3.3 中国粮食生产与相关投入资料
农业化肥施 粮食播种面 受灾面积 农业机械总
用量 X 1
(万公斤)
积X 2
(千公顷)
X3
(公顷)
动力X 4
(万千瓦)
1659.8
114047 16209.3
18022
1739.8
11288பைடு நூலகம் 15264.0
19497
1775.8
108845 22705.3
20913
0.9752 1.53
t值
0.85
19.6 3.35 -3.57
Y=f(X1,X2,X3,X4) -13056 6.17 0.42 -0.17 -0.09
0.9775 1.80
t值
-0.97 9.61 3.57 -3.09 -1.55
Y=f(X1,X3,X4,X5) -12690 5.22 0.40 -0.20
含义:解释变量的样本向量近似线性相关。
多重共线性来源:
(1)解释变量x受到同一个因素的影响; 例如:政治事件对很多变量都产生影响,这些变量同时上升 或同时下降。
(2)解释变量x自己的当期和滞后期;
(3)错误设定。
二、多重共线性的后果
1、完全共线性下参数估计量不存在
Y X
的OLS估计量为: βˆ (XX) 1 XY
1、检验多重共线性是否存在
(1)对两个解释变量的模型,采用简单相关系数法 求出X1与X2的简单相关系数r,若|r|接近1,则说
明两变量存在较强的多重共线性。
(2)对多个解释变量的模型,采用综合统计检验法
若 在OLS法下:R2与F值较大,但t检验值较小, 说明各解释变量对Y的联合线性作用显著,但各解 释变量间存在共线性而使得它们对Y的独立作用不 能分辨,故t检验不显著。
第六章 自相关 《计量经济学》PPT课件
由于解释变量之一是被解释变量的滞后值,称为自 回归模型。人们的消费习惯不会轻易改变,从而 对模型产生自相关性。
(3)模型设定偏误(specification error)。
一是应含而未含变量(excluded variable)设定偏 误;二是不正确的函数形式。例
Yi
1
2 X 2i
3
X
2 2i
ui
• 同时,可以推出下列结论
•
E(ut ) mE(vtm ) 0
m0
(6.1.14)
•
Var(ut
)
m0
2 mVar (vt
m
)
1
2 v
2
(6.1.15)
三、自相关产生的原因
(1)惯性(inertia)。
大多数经济时间序列都一个明显的特点,就是它的 惯性或黏滞。例如,GDP、价格指数、就业等时 间序列都呈现出一定的周期性。这种“内在的动 力”惯性往往产生序列自相关。
E ( ˆ2
)
E
(
xt yt xt2
)
E(2
xtut xt2
)
•
2
xt E(ut ) xt2
2
(6.2.5)
• 即参数 2的OLS估计量为无偏估计量。
在随机干扰项不满足无自相关条件时,得到OLS估 计量的方差为:
Var(ˆ2
)
E(ˆ2
2
)
E(
xtut xt2
)2
1 ( xt2 )2
下,经济变量也是正相关,式子(6.2.6)括号内的数值是 大于0的。也就是说,仍使用式子(6.2.3)作为参数估计 量的方差将会低估真实的方差。
• 当随机干扰项不存在自相关时, 2 的无偏估计为:
计量经济学 第六章 自相关
5
3、模型设定不当
(1)数学模型设定不当 比如我们在非线性回归模型中介绍的产品总成本Y和产量X 的回归模型为:
Yt b0 b1 X t b2 X b3 X t
2 t 3 t
但如果用线性模型来替代
Yt b0 b1 X t t
2 3
那么随机误差项
vt b2 X t b3 X t t
若d 0.562, 则0 d d L , 存在一阶正自相关
若d 3.521, 则4 d L d 4, 存在一阶负自相关
若d 2, 则dU d 4 dU , 不存在一阶自相关 若d 1.267, 则d L d dU , 无法确定模型中是否存在一阶自相关 若d 2.980, 则4 dU d 4 d L , 无法确定模型中是否存在一阶自相关
无自相关 区域
负自相关区域 正自相 关区域
0
dL
dU
2
4 dU
4 dL 4
17
例题6.1
在给定的显著性水平=0.05条件下,n 10, k 1
查表得下限值d L 0.879, 上限值dU 1.320 又可以计算得4 dU 2.68, 上限值4 d L 3.121
2 2
若nR ( p ), 拒绝原假设,原模型存在自相关
2 2
若nR ( p), 接受原假设,原模型不存在自相关
2 2
拒绝域
接受域
( p )
2
nR
2
( p )
2
nR
2
22
6.4 自相关的修正
• 自相关修正的基本原理:通过差分变换,对原始数据进行 修正。自相关修正主要有三种方法。 • 1、广义差分法
计量经济学 第六章 自相关性
第六章自相关性6.1 自相关性:6.1.1. 非自相关假定由第2章知回归模型的假定条件之一是,Cov(u i, u j) = E(u i u j) = 0, (i, j∈T, i≠j), (6.1)即误差项u t的取值在时间上是相互无关的。
称误差项u t非自相关。
如果Cov (u i,u j ) ≠ 0, (i≠j)则称误差项u t存在自相关。
自相关又称序列相关。
原指一随机变量在时间上与其滞后项之间的相关。
这里主要是指回归模型中随机误差项u t与其滞后项的相关关系。
自相关也是相关关系的一种。
6.1.2.一阶自相关自相关按形式可分为两类。
(1)一阶自回归形式当误差项u t只与其滞后一期值有关时,即u t = f (u t - 1) + v t称u t具有一阶自回归形式。
(2) 高阶自回归形式当误差项u t的本期值不仅与其前一期值有关,而且与其前若干期的值都有关系时,即u t = f (u t– 1, u t– 2 , …u t– p ) + v t则称u t具有P阶自回归形式。
通常假定误差项的自相关是线性的。
因计量经济模型中自相关的最常见形式是一阶自回归形式,所以下面重点讨论误差项的线性一阶自回归形式,即u t = α1 u t -1 + v t(6.2)其中α1是自回归系数,v t 是随机误差项。
v t 满足通常假设E(v t) = 0, t = 1, 2 …,T,Var(v t) = σv2, t = 1, 2 …,T,Cov(v i , v j ) = 0, i ≠ j , i , j = 1, 2 …, T , Cov(u t -1, v t ) = 0, t = 1, 2 …, T ,依据普通最小二乘法公式,模型(6.2)中 α1 的估计公式是,1ˆa= ∑∑=-=-Tt t Tt t t u u u 22121(1ˆβ=∑---2)())((x x x x y y t t t ) (6.3)其中T 是样本容量。
计量经济学 自相关PPT课件
et 2 ≈
et
2 1
≈
et 2
t2
t2
t 1
T
T
2
et
2 1
2
et et1
T
et et1
所以 DW 可以近似表示为, DW≈ t2
t2
T
et
2 1
= 2 (1 - t2
) = 2 (1 - ˆ )
T
et
2 1
t2
t2
第6页/共23页
6.3 自相关检验
DW= 2 (1 - ˆ )
的取值范围是 [-1, 1],所以DW统计量的取值范围是 [0, 4]。
H0: = 0 (ut 不存在自相关)。H1: 0 (ut 存在一阶自相关) 用残差值 et 计算统计量 DW。
DW =
T
(et et1 ) 2
t2
=
T
et 2
t 1
T
T
T
et 2
et
2 1
2
et et1
t2
t2
t2
T
et 2
t 1
(第2版167页) (第3版142页)
T
T
T
因为在样本容量充分大条件下有
(第2版177页) (第3版151页)
1. 用 DW 统计量的值计算。
ˆ = 1 -(DW / 2)
2. 直接拟合估计。
第12页/共23页
6.6 案例分析
(第2版177页) (第3版152页)
例6.1 天津市城镇居民人均消费与人均可支配收入的关系。
天津市城镇居民人均消费性支出(CONSUM),人均可支配收入(INCOME)关
LM(BG)自相关检验辅助回归式估计结果是
《计量经济学》第六章自相关
但若有人说此估计结果有可能是虚假的,t统计量和F统计 量被虚假地夸大了,因此所得结果是不可信的。为什么呢?
第六章 自相关
本章讨论四个问题: ●自相关的概念和产生的原因 ●自相关的后果 ●自相关的检验方法
●自相关的补救方法
第一节 自相关的概念
一、什么是自相关
一般概念: 自相关是指同一随机变量以时间和空间为顺 序的观测值序列各部分之间的相关关系,也称序列相关。 计量经济学中的概念:特指随机扰动项逐次观测值相互之 间的相关关系。
经济变量与前几个时期的数值往往有关,如本期消费常与 前期消费有关
(2)经济行为本身的滞后性
如本期消费还依赖于前期收入,而前期收入未纳入模型
(3)设定偏倚
如省略重要解释变量、不正确的函数形式可引起自相关
(4)数据的加工引起自相关
如数据修匀平滑, 用内插和外推取得数据
(5)扰动项自身特性引起自相关(真实自相关)
●一阶自回归形式较为简单
●在实际计量分析中处理一阶自回归形式常能取得较好
效果
一阶自回归形式自相关的性质
对于
ut ut 1 t 可以证明: ut ( ut 2 t 1 ) t
( ut 3 t 2 ) t 1 t
ˆ
t 2 n t t 1 2 t 1
回顾:一元回归
ˆ 2
xi yi x
2 i
u
t 2
t 2
t t 1 n
u u
1
在样本容量大时有
2 2 u u t t1
(注意: ui u j 0) (回归系数公式)(相关系数公式)
一般关系: ut ut 1 t 期望为
06- 自相关性.
3、DW检验的缺陷
我们当然期望有一张能够给出相应的 n 、 k 和 α 值下各 种DW临界值的表(就象t检验,F检验一样),使得我们可以 按常规假设检验那样根据临界值作出判断。 DW统计量的分布依赖于解释变量的具体观测值。因此不 象t、F检验那样,有一张能够给出DW临界值的表。为解决这 一问题,德宾和沃森证明, DW 统计量的真实分布位于两个 极限分布之间,这两个分布分别称为下分布和上分布。 德宾和沃森据此导出了一个下界dL和一个上界du来检验自 相关,dL和du仅依赖于的数目n、解释变量k,以及显著性水 平α ,而不依赖于解释变量所取的值。 无结论区的存在是DW法的最大缺陷。
一个观测值。具体补法为:
(3、广义差分变换同样可以推广应用到多元线性回归模型
中。
(4、广义差分变换还可以推广到高阶自相关的模型中。 (5、如果广义变换后,模型还存在自相关性,可以继续使 用广义差分变换,直到自相关性消除为止。
25
2018/12/15
5.4.2、自相关系数的估计 1、直接ρ =1。注意广义变换后的模型是没有常数项的(截 距项)
29
2018/12/15
年份 1989 1990 1991 1992 1993
国内生产总值 GDP 16992.3 18667.8 21781.5 26923.5 35333.9
进口总额 IM 2199.9 2574.3 3398.7 4443.3 5986.2
年份 1998 1999 2000 2001 2002
2018/12/15
Durbin两步估计法
27
2018/12/15
28
2018/12/15
5.5
案例分析——中国商品进口模型
对进口国来说,其经济发展水平决定商品进口情况。根据我
计量经济学第六章自相关
计量经济学第六章自相关在计量经济学的学习中,自相关是一个重要且颇具挑战性的概念。
自相关,简单来说,就是指在时间序列或横截面数据中,观测值之间存在的某种相关性。
想象一下,我们在研究某个经济变量随时间的变化情况,比如一家公司的销售额。
如果在不同的时间段,销售额的变化不是相互独立的,而是存在一定的关联,这就可能出现了自相关现象。
自相关产生的原因多种多样。
其中一个常见的原因是经济变量的惯性。
例如,消费者的消费习惯往往具有一定的延续性,不会突然发生巨大的改变。
这就导致消费数据在不同时期可能存在相关性。
另一个可能的原因是模型设定的不准确。
如果我们在构建计量经济模型时,遗漏了某些重要的解释变量,那么残差项就可能包含这些被遗漏变量的影响,从而导致自相关。
自相关的存在会给我们的计量经济分析带来一系列问题。
首先,它会影响参数估计的有效性。
在存在自相关的情况下,传统的最小二乘法(OLS)估计得到的参数估计值不再是最优的,估计的方差也会被低估,这可能导致我们对参数的显著性做出错误的判断。
其次,自相关会使我们对模型的假设检验失效。
假设检验是基于一定的统计分布进行的,如果存在自相关,这些分布就不再适用,从而导致检验结果的不可靠。
那么,如何检测自相关呢?常用的方法有图形法、杜宾瓦特森(DurbinWatson)检验等。
图形法是通过绘制残差的序列图来直观地观察是否存在自相关。
如果残差呈现出某种周期性或趋势性,那么就可能存在自相关。
杜宾瓦特森检验则是一种基于统计量的检验方法。
它通过计算一个特定的统计量,并与临界值进行比较来判断是否存在自相关。
如果经过检测发现存在自相关,我们就需要采取相应的方法来处理。
一种常见的方法是广义最小二乘法(GLS)。
GLS通过对原模型进行变换,使得变换后的模型不存在自相关,从而得到更有效的参数估计。
另外,还可以使用一阶差分法。
这种方法将原变量的一阶差分作为新的变量进行回归分析,从而消除可能存在的自相关。
计量经济学课件:第六章-自相关性
第六章 自相关性本章教学要求:本章是违背古典假定情况下线性回归描写的参数估计的又一问题。
通过本章的学习应达到:掌握自相关的基本概念,产生自相关的背景;自相关出现对模型影响的后果;诊断自相关存在的方法和修正自相关的方法。
能够运用本章的知识独立解决模型中的自相关问题。
经过第四、五、六章的学习,要求自行选择一个实际经济问题,建立模型,并判断和解决上述可能存在的问题。
第一节 自相关性的概念一、一个例子研究中国城镇居民消费函数,其中选取了两个变量,城镇家庭商品性支出(现价)和城镇家庭可支配收入(现价),分别记为CSJTZC 和CSJTSR ,时间从1978年到1997年,n=20。
但为了剔除物价的影响,分别对CSJTZC 和CSJTSR 除以物价(用CPI 表示),这里CPI 为城镇居民消费物价指数(以1990年为100%),经过扣除价格因素以后,记CPICSJTSRX CPICSJTZCY ==即如下表回归以后得到的残差为Dependent Variable: YMethod: Least SquaresDate: 10/27/04 Time: 09:39Sample: 1978 1997Included observations: 20Std. Error t-Statistic Prob.Variable CoefficientC-103.369278.80739-1.3116690.2061X0.9235510.01603357.603880.00003939.341 R-squared0.994605Mean dependentvarAdjusted R-squared0.994305S.D. dependent var2124.467S.E. of regression160.3247Akaike info criterion13.08692Sum squared resid462671.9Schwarz criterion13.18649Log likelihood -128.8692 F-statistic 3318.207 Durbin-Watson stat1.208037 Prob(F-statistic)0.000000二、什么是自相关性在引出自相关性的概念之前,根据建立中国城镇居民储蓄函数,经用最小二乘法估计出参数后,得到残差序列,由此画出残差图(残差序列自身的关系),从图形上看存在t e 对1 t e 的线性关系,残差的这种现象说明了什么?下面给出序列自相关的定义。
计量经济学第六章-自相关
et et 1 ˆ • 定义 ρ 2 为样本的一阶自相关系数,作为 et
ˆ) 的估计量。则有, DW 2(1
• 因为-1 1,所以,0 能检出
正自相关 0
无自相关
负自相关
dL
dU
2
4- dU
4- dL
4
依据显著水平、变量个数(k)和样本大小(n) 一般要求样本容量至少为 15。
自相关也可能出现在横截面数据中,但主要出现在时 间序列数据中。
二、一阶自回归
线性回归模型 Yt=bo + b1Xt + ut 若 ut 的取值只与它的前一期取值有关,即 ut = f (ut-1 ) 则称为一阶自相关 经典经济计量学对自相关的分析仅限于一阶自 回归形式: ut = ut-1 +εt 为自相关系数 > 0 为正自相关 || 1 < 0 为负自相关
…
(3) 对上述各种拟合形式进行显著性检验,从而确定误差项 ut 存在哪一种形式的自相关。 回归检验法的优点是, (1)适合于任何形式的自相关检验, ( 2)若结论是存在自相关, 则同时能提供出自相关的具体形式与参数的估计值。缺点是计算量大。
四、偏相关系数检验 高阶自相关的形式为:
t 1t 1 2 t 2 p t p vt
这表明 ut 不存在 p 阶自相关。
LM 检验的步骤: 1、用 OLS 估计上述模型 2、得到的残差建立辅助回归式
et 1et 1 2 et 2 p et p vt
3、构造 LM 统计量,
LM p nR2 ~ 2 p
其中 n 表示原模型的样本容量。R 为辅助回归的可决系数。 其中 p 自回归阶数。 判别规则是,若 LM 2(p),接受 H0;若 LM > 2(p),拒绝 H0;
计量经济学(第六章自相关)
Econometrics 2003
1
本节主要内容
1. 自相关的定义和产生原因; 2. 自相关的影响; 3. 自相关的检验; 4. 自相关的补救;
Econometrics 2003
2
6.1 自相关的定义、类型、产生原因
自相关(autocorrelation)定义: 在古典线性回归模型中,我们假定随机扰动项序 列的各项之间不相关。如果这一假定不满足,则 称之为自相关。即用符号表示为:
Econometrics 2003
6
二、设定偏误1:应含而未含变量的情形
例如, 如果真实的回归方程的形式为:
Yt 1 2 X 2t 3 X 3t X 4t 4 ut
其中,因变量表示牛肉需求量,解释变量分别为 牛肉价格、消费者收入和猪肉价格。但是在做回
归时用的是:Yt 1 2 X 2t 3 X 3t vt 则,随机扰动项会出现系统模式:vt X 4t 4 ut
有方差最小性;
2
2. 一般地,残差方差被严重低估( 2 )
3. 参数显著性检验失效;
4. 区间估计和预测区间的精度降低。
Econometrics 2003
11
自相关的后果的例证
以扰动项一阶自相关和双变量回归模型为例:
由ˆ2 2
xt ut xt2
, 显 然 有E ( ˆ2
)
。
2
而 var(ˆ2 ) E(ˆ2 2 )2 E
16
6.2.2对模型检验的影响
考虑自相关时的检 验
对模型检验的影响
忽视自相关时的
检验
Econometrics 2003
17
考虑自相关时的检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 自相关性本章教学要求:本章是违背古典假定情况下线性回归描写的参数估计的又一问题。
通过本章的学习应达到:掌握自相关的基本概念,产生自相关的背景;自相关出现对模型影响的后果;诊断自相关存在的方法和修正自相关的方法。
能够运用本章的知识独立解决模型中的自相关问题。
经过第四、五、六章的学习,要求自行选择一个实际经济问题,建立模型,并判断和解决上述可能存在的问题。
第一节 自相关性的概念一、一个例子研究中国城镇居民消费函数,其中选取了两个变量,城镇家庭商品性支出(现价)和城镇家庭可支配收入(现价),分别记为CSJTZC 和CSJTSR ,时间从1978年到1997年,n=20。
但为了剔除物价的影响,分别对CSJTZC 和CSJTSR 除以物价(用CPI 表示),这里CPI 为城镇居民消费物价指数(以1990年为100%),经过扣除价格因素以后,记CPICSJTSRX CPICSJTZCY ==即如下表回归以后得到的残差为Dependent Variable: YMethod: Least SquaresDate: 10/27/04 Time: 09:39Sample: 1978 1997Included observations: 20Std. Error t-Statistic Prob.Variable CoefficientC-103.369278.80739-1.3116690.2061X0.9235510.01603357.603880.00003939.341 R-squared0.994605Mean dependentvarAdjusted R-squared0.994305S.D. dependent var2124.467S.E. of regression160.3247Akaike info criterion13.08692Sum squared resid462671.9Schwarz criterion13.18649Log likelihood -128.8692 F-statistic 3318.207 Durbin-Watson stat1.208037 Prob(F-statistic)0.000000二、什么是自相关性在引出自相关性的概念之前,根据建立中国城镇居民储蓄函数,经用最小二乘法估计出参数后,得到残差序列,由此画出残差图(残差序列自身的关系),从图形上看存在t e 对1 t e 的线性关系,残差的这种现象说明了什么?下面给出序列自相关的定义。
1、如果模型中的随机误差项i u ,满足以下关系式 s t u u Cov s t ≠≠,0),( 则随机误差项i u 之间存在自相关性。
2、一阶线性自相关。
在s t u u Cov s t ≠≠,0),(中,如果1s t =-,则 ,0),(1≠-t t u u Cov并且t u 与1-t u 之间为线性关系,即t t t u u ερ+=-1,其中t ε满足古典假定,即ρεεσεεε,,0)(,)(,0)(22s t E E E s t t t ≠===<1。
将t u 与1-t u 的这种线性关系称为一阶线性自相关(或一阶线性自回归),简称一阶自相关(或一阶自回归)。
3、一阶线性自回归的数学性质。
设一元线性模型为t t t u X Y ++=21ββ并且,t t t u u ερ+=-1,其中t ε满足ρεεσεεε,,0)(,)(,0)(22s t E E E s t t t ≠===<1。
设总体一阶序列自相关系数为 )var()var(),cov(11--=t t t t u u u u ρ按照样本相关系数计算公式,样本序列自相关系数为ˆe eρ=另一方面,对一阶线性自回归t t t u u ερ+=-1,求参数ρ的最小二乘估计,即12212ˆnt t t nt t e eeρ-=-='=∑∑在大样本下,有ˆˆρρ'≈。
因此,通常可用ˆρ'表示ρˆ。
t u 的数学特性:(1)0)(=t u E 事实上,.,,,)1(1211r t r t r t t t t t t t u u u u u u -+------+=+=+=ερερερΛ将递推关系逐一代入,并注意当0→r 时,0→-r t r u ρ,则∑∞=------------=++++===+++=++=++=+=0332211232122121)()(r rt r t t t t t t t t t t t t t t t t t u u u u u ερερερρεεερεερρερερεερρερΛΛ0()()()()0,(()0)rrr t t r t r t r t r r r E u E E E E ρερερεε∞∞∞---========∑∑∑(2)2221)var(σρσε=-=t u[]2222221112222211222()()()()(2)()()()(()0)()1t t t t t t t t t t t t t t t t Var u E u E u E u E u E u u E u E Var u E u Var u εερερρεερερσεσσρ-----=-==+=++=+=+===-在t ε满足22()0,(),()0,,t t t s E E E t s εεεσεε===≠t ε服从正态分布,且ρ<1。
有23123231232222322223()()()()()()(1)1t t t t t t t t t Var u Var Var Var Var Var εεεεεεερερερεερερερεσρσρσρσσσρρρρ------=++++=++++=++++=++++=-L L LL LL L(3)2),cov(σρs s t t u u =-按照协方差的定义,可类似推出上述结果。
三、自相关产生的原因1、经济变量大多存在惯性的作用。
如经济变量随时间运动往往存在趋势的作用,使得变量在变化中具有惯性特征。
2、许多经济变量具有滞后性的表现。
3、一些随机偶然因素的干扰或影响。
4、设定偏倚。
与异方差性情况类似。
5、蛛网现象模型。
这是农产品与农产品价格所固有的一种关系,即当期农产品的产出量与前期的农产品价格有关,用公式表示为)(1-=t s t p f Q 6、时间序列更易产生自相关性。
第二节 自相关性的后果从统计意义上讲,并参考异方差性的情况,自相关性对模型的影响主要有以下几方面。
一、在自相关存在的前提下,参数估计的统计特性 1、参数估计仍是无偏的。
设线性回归模型为t t t u X Y ++=21ββ其样本回归函数中参数的最小二乘估计分别为21ˆ,ˆββ,有 11)ˆ(ββ=E 22)ˆ(ββ=E其证明可参见在第五章中异方差存在的条件下,参数估计仍是无偏的。
2、参数估计不再具有方差最小性。
在自相关下,由第五章异方差对参数估计影响的说明,有[]()∑∑∑∑∑∑∑∑∑∑∑∑∑∑=+=+=⎪⎪⎪⎭⎫ ⎝⎛+=⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫ ⎝⎛-+=-=-=≠=≠=≠222222222222222222222222222*2)ˆ()()(2)()(2)()(2ˆ)ˆ(ˆ)ˆ(iiji j i j i i i j i ji j i j i i i i j i j i j i j i i i i i i i i i xVar x u u E x x x x u u E x x u E x x u u x x u x E x u x E x u x E E E E Var σβσβββββββ在无自相关下,有比较上述两式,可以很明显看到,如果随机误差序列存在正的自相关,则)ˆ(*2βVar >)ˆ(2βVar 。
三、2ˆσ严重低估了2σ。
四、参数的显著性检验失效。
五、预测精度降低。
需要注意的问题,比较多重共线性与异方差、自相关在预测应用中有不同的情况。
如果模型中存在多重共线性,但变量符合经济意义,并且线性结构保持不变,则这个时候可以利用模型进行预测;如果模型中存在的是异方差和自相关问题,则不能利用模型进行预测(为什么?)。
第三节 自相关的检验一、图示法。
1、利用t e 对1-t e 的散点图进行判断。
(1)当散点大部分落在一、三象限时,则表明随机误差存在正自相关。
(2)当散点大部分落在二、四象限时,则表明随机误差存在负自相关。
2、利用t e 对时间t 的折线图进行判断。
(1)当t e 随t 逐次而变动时,t e 开始为正,随后几个也为正;t e 出现负值,随后几个也出现负值,则随机误差存在正自相关。
(2)当t e 随t 逐次而变动时,t e 不断地改变符号,则随机误差存在负自相关。
二、D-W 检验法该方法为Durbin J 和Watson G S (1951)基于残差序列t e 与1-t e 之间的相关系数ρˆ提出检验ρ的D-W 统计量。
1、D-W 检验的适用条件。
(1) 解释变量非随机。
(2)t u ~t t t u u ερ+=-1,且t ε满足基本假定。
(3)线性回归模型不存在如下形式 t t t t u Y X Y +++=-1321βββ如果出现这种情况,应用Durbin-H 检验,将在第七章介绍。
2、D-W 统计量的构成。
(1)提出假设:0:;0:10≠=ρρH H(2)构造D-W 检验统计量,记为d ,即∑∑--=-≈211ˆ),ˆ1(2t t t eee d ρρ其中。
推导过程见教科书。
3、运用D-W 检验判断一阶自相关的区域。
(1)当0ˆ=ρ时,d=2,则t u 无一阶自相关。
(2)当1ˆ=ρ时,d=0,则t u 有完全一阶正自相关。
(3)当1ˆ-=ρ时,d=4,则t u 有完全一阶负自相关。
(4)通常情况下,当ρˆ<1时,有0<d <4。
当d 落在0到4范围内时,有如下判断区域:当0<d <d L 时,存在一阶正自相关; 当d L <d <d U 时,不能判定存在自相关; 当d U <d <4-d U 时,不存在一阶自相关; 当4-d U <d <4-d L 时,不能判定存在自相关; 当4-d L <d <4时,存在一阶负自相关。
4、运用D-W 检验应注意的问题。
(1)由教科书上的图形可知,在d=2的附近,有一个较大的无自相关区域,所以通常当d 在2的左右时,可以不用查表就判断出随机误差不存在自相关。
(2)D-W 检验存在不能判定区域,这时可以用扩大样本容量或改用其它检验方法(如D-W 检验的修正方法,参见教材第167页)。
(3)要求样本容量至少为15,否则很难对自相关的存在作出准确判断。