第十章 自相关
合集下载
自相关2

自相关的最简单模式为:
ut = ρut-1 + Vt,
t=1,2,…,n.
其中ρ称为自相关系数(-1≤ρ≤1),这 种扰动项的自相关称为一阶自相关,即扰 动项仅与其前一期的值有关。我们有: ρ>0 正自相关
ρ<0 ρ=0
负自相关 无自相关
在一阶自相关模式中,假定Vt具有以下性质: E(Vt) = 0 , E(Vt² = σ 2 = 常数, ) E(ViVj)=0, i≠j, Vt服从正态分布。 在计量经济学中,具备上述性质的量称为白噪 声(White noise),表示为 Vt= White noise
自相关意味着 Cov(ui , uj) = E(uiuj) ≠0, 回顾协方差的含义?
i≠j
COV(X,Y)=E[(X-E(X))(Y-E(Y))]。 协方差是描述X和Y相关程度的量,在 同一量纲之下有一定的作用,但同样 的两个量采用不同的量纲使它们的协 方差在数值上表现出很大的差异。
自相关的一般形式
三、自相关的检验
基本思路: 自相关检验方法有多种,但基本思 路相同:首先,采用OLS估计模型,以 求得随机扰动项的估计量残差ei
然后,通过分析残差的相关性, 以判断随机误差项是否具有自相关。
1.图示检验法 2. 杜宾—瓦尔森检验法
up
1.图示检验法
(1)绘制et,et-1的散点图。如果大部分落 在第I、III象限,表明e存在正的序列相关; 如果大部分落在第II、IV象限,表明e存在 负的序列相关。
第一节 第二节 第三节 第四节 小结
什么是自相关 自相关的后果 自相关的检验 自相关的补救
一、自相关概念
对于模型
Yi=1+2X2i+3X3i+…+kXki+i i=1,2, …,n
eviews-4.自相关解析

三、序列相关性的后果
计量经济学模型一旦出现序列相关性,如果仍采用OLS 法估计模型参数,则OLS估计量仍然是线性无偏估计量, 但是会产生下列不良后果:
1、参数估计量非有效
因为,在有效性证明中利用了 E(UU’)=2I 即同方差性和无序列相关假设。
证明:
ˆ k t t 1 1
ˆ ) E[ ˆ E( ˆ )]2 E( ˆ )2 var( 1 1 1 1 1
~ Y (Yˆ )ˆ e e i Yi (iY0ls)
t t
t ols
然后,通过分析这些“近似估计量”之间的相 关性,以判断随机误差项是否具有序列相关性。
自相关的检验方法
检验自相关的方法也可以分为两种:一种是图示 法,另一种是检验方法。
(一)图示法
由于回归残差 e 可以作为随机项 u t 的估计量, ut t 的性质可以从 e 的性质中反映出来。我们可以通 t 过观察残差是否存在自相关来判断随机项是否存 在自相关。
ts
经济变量以正相关居多, 所以此项多为正数
ˆ ˆ) var( ) var( 1 1
2、变量的显著性检验失去意义
在变量的显著性检验中,统计量是建立在参 数方差正确估计基础之上的,这只有当随机误差 项具有同方差性和无序列相关时才能成立。
如果存在序列相关,参数估计量的方差 出现偏误(偏大或偏小),t检验就失 去意义。其他检验也是如此。
称ut具有一阶自回归形式。 比如:
ut 1ut 1 vt
满足经典假设
由于序列相关性经常出现在以时间序列为样本的模型中, 因此,本节用下标t代表i。
ut 1ut 1 vt
ˆ1
u u
自相关分析

i=1i-1+2i-2+Li-L+i
关于迭代的次数,可根据具体的问题来定。
一般是事先给出一个精度,当相邻两次 1,2, ,L的估计值之差小于这一精度时,迭 代终止。
实践中,有时只要迭代两次,就可得到 较满意的结果。两次迭代过程也被称为科克 伦—奥科特两步法。
(2)杜宾(durbin)两步法 该方法仍是先估计1,2,,l,再对差分模型 进行估计。
D.W检验步骤: (1)计算DW值 (2)给定,由n和k的大小查DW分布表,得临 界值dL和dU (3)比较、判断 若 0<D.W.<dL dL<D.W.<dU dU <D.W.<4-dU 存在正自相关 不能确定 无自相关
4-dU <D.W.<4- dL 4-dL <D.W.<4
不 能 确 定 无自相关
对(3)运用OLS 估计,得到 (1 ) 1和 2的估计值,进而算出
(3)
1, 2
应用广义最小二乘法或广义差分法,必须已知随机误差项的
相关系数1, 2, … , L 。
实际上,人们并不知道它们的具体数值,所以必须首先对它
们进行估计。
简单的方法有:(1)由DW-d统计量中估计
ˆ ˆ ˆ ˆ Yi 1Yi1 l Yil 0 (1 1 l ) 1 ( X i 1 X i1 l X i l ) i
i 1 l,2 l,, n
求出i新的“近拟估计值”, 并以之作为样本 观测值,再次估计:
ˆ ˆ ˆ 第二步,将估计的 1 , 2 , , l 代入差分模型
Yi 1Yi 1 l Yi l 0 (1 1 l ) 1 ( X i 1 X i 1 l X i l ) i
自相关

2
,无自相关 E(vt vs ) 0 (t s)
17
的假定。
性质一 r= 性质二 E (ut ) 0 性质三 Var (ut ) 2 2
1
^
表明,在 为一阶自回归的相关形式时,随机误差 t 是零均值、同方差的误差项。 2
性质四Cov (ut , ut 1) 12 2 2 Cov(ut , ut 2) 12 性质五
n
t t -1
et2
)
30
由 DW 2(1 ) ˆ ˆ 可得DW 值与 的对应关系如表所示。
ˆ
-1 (-1,0) 0 (0,1) 1
DW
4 (2,4) 2 (0,2) 0
31
由上述讨论可知DW的取值范围为:
0≤DW≤4
根据样本容量n 和解释变量的数目 k (不包括常数项)查DW
u
ut依然
ˆ ˆˆ t ( SE ()
以此类推,可得 :
k 2 k Cov(ut , ut -k ) = Var(ut -k ) = 1- 2
这些协方差分别称为随机误差项 t的一阶自协 方差、二阶自协方差和 k 阶自协方差
u
19
二、对参数估计的影响
对于一元线性回归模型,当 t 满足各项古典误差 ˆ 时,普通最小二乘估计量 2的方差为:
1. 图示法
二、DW检验法
DW 检验是J.Durbin(杜宾)和G.S.Watson(沃特森)于 1951年提出的一种适用于小样本的检验方法。DW
检验只能用于检验随机误差项具有一阶自回归形式
的自相关问题。这种检验方法是建立经济计量模型
中最常用的方法,一般的计算机软件都可以计算出
第十章 随机过程及其统计描述

9
例4:设某城市的120急救中心电话台迟早会接到用户的呼叫。 以X (t )表示时间间隔 ( 0, t ]内接到的呼叫次数, 它是一个随机变量,且对于不同的t ≥ 0,X (t )是不同 的随机变量,于是 { X (t ), t ≥ 0} 是一随机过程,且它的 状态空间是 {0,1, 2,L} .
−1 出现H X (1) Vcosω t , t ∈ ( −∞, +∞ ),V 在[0,1]上均匀分布 求在t = 0, π , 3π , π , π 时X (t )的密度函数。 4ω 4ω ω 2ω 解:对给定的t , 若cosω t ≠ 0, 记a = cosω t, 则X (t ) = aV 的密度函数为: 1 0 < x <1 a f X ( x; t ) = fV x ⋅ 1 = a a a 其他 0 1 0 < x < 1 a = cosω ⋅ 0 = 1 于是 f X ( x;0 ) = 0 其他 2 π = 2 0< x< 2 π = 2 , f X x; a = cosω ⋅ 4ω 4ω 2 0 其他 2 3π = − 2 , f x; 3π = 2 − 2 < x < 0 a = cosω ⋅ X 4ω 4ω 2 0 其他 π = 1 − 1 < x < 0 π = −1, f X x; a = cosω ⋅ ω 其他 ω 0
12
§2 随机过程的统计描述
(一) 随机过程的分布函数族
设随机过程{ X (t), t ∈T} , 对每一固定的t ∈T,
分布函数 两种描述 数字特征
{FX (x,t),t ∈T} 称为一维分布函数族
FX (x, t) = P{ X (t) ≤ x},x ∈R,称为随机过程{ X (t), t ∈T}的一维分布函数
10--章自相关

二、参数估计值不一定再有最小方差
( X X )u ˆ ( X X )
* 2 2 2
是随机误差项存在自相关条件下,计算出的 的估计量
2
( X X )u ˆ Var ( ) E ( ) ( X X )
* 2 2 2 2
2
( X X )u E( ) E (c u ) ( X X )
利用最小二乘法可得
自相关性的后果
Yt 1 2 X t ut
一、参数估计量是无偏的
( X X )(Y Y ) xi y i xi (Yi Y ) xiYi (xi )(Yi ) ˆ 2 2 2 ( X X ) xi xi xi nxi2
2 2
xi 2 Yi CiYi Ci ( 1 2 X i ui ) xi 1 Ci 2Ci X i Ci ui 2 Ci ui
注:
C 0 ;
i
Ci X i 1;
E(ui ) 0
12
ˆ ) C E(u ) E( 2 2 i i 2
Yt 0 1 X 1t 2 X 2t 3Yt 1 t Yt 0 1 X 1t 2 X 2t t
则随机干扰项很可能有自相关。
7
3、随机偶然因素的干扰 战争、自然灾害等偶然(随机)因素的干扰造成的 影响,常常要延续若干时期,反 映在模型中就是干扰项 有序列相关。
2 2
2
t
t
E (C u 2 C C u u )
2 2 t t t s t s t s
2 C C E (u u ) ( X X )
2 2
第10章自相关

et的分布
t
• 如果et(t=1,2,…,n)随着t 的变化逐次有规律地变化, 呈现锯齿形或循环形状的变化,就可断言et 存在 相关,表明存在着序列相关;如果et 随着t的变化 逐次变化并不断地改变符号,那么随机误差项ut 存在负的序列相关
et
t
et的分布
• 如果et 随着t 的变化逐次变化并不频繁地改变符号, 而是幾个正的et 後面跟着幾个负的,则表明随机 误差项存在ut 正的序列相关
产生自相关的原因1:惯性
• 大多数经济时间序列的一个显著特徵就是惯性 (inertia)或者说是迟缓性(sluggishness)。 • 时间序列,例如国民生产总值、就业、货币供给、 价格指数等等,都呈现周期或循环(在经济活动 中重複發生或者自我维持波动)。当经济恢復开 始时,由萧条的底部开始,大多数的经济序列向 上移动。在向上移动的过程中,序列某一时点的 值会大於其前期值。这裏有一種“动力”存在, 继续向上,直到某些事件發生(例如税收的增加 或者利率的提高或者两者同时增加)才使序列移 动减慢下来。 • 在涉及时间系列数据的回归方程中,连续的观察 值之间很可能是相关的。
产生自相关的原因4:数据处理 Data manipulation
• 在实证分析中,通常原始数据是要经过加工的。例如,在 季度数据的时间序列回归中,数据通常是通过月度数据推 导而来的,即将3个月的数据简单加总并除以3。这样平均 的结果,消除了月度数据的波动性,而这種“平滑”过程 本身就可能导致扰动项的系统模式,从而引入自相关。
本章讨论问题
• 本章将深入讨论以下问题:
– (1) 自相关有什么性质? – (2) 自相关的理论与实际结果是什么? – (3) 由於非自相关假设与不可观察的扰动项ui有关,那么, 如何判断在给定情况下存在自相关?简言之,在实际中, 如何诊断自相关? – (4) 如果發现自相关的後果比较严重,如何採取措施加 以补救?
t
• 如果et(t=1,2,…,n)随着t 的变化逐次有规律地变化, 呈现锯齿形或循环形状的变化,就可断言et 存在 相关,表明存在着序列相关;如果et 随着t的变化 逐次变化并不断地改变符号,那么随机误差项ut 存在负的序列相关
et
t
et的分布
• 如果et 随着t 的变化逐次变化并不频繁地改变符号, 而是幾个正的et 後面跟着幾个负的,则表明随机 误差项存在ut 正的序列相关
产生自相关的原因1:惯性
• 大多数经济时间序列的一个显著特徵就是惯性 (inertia)或者说是迟缓性(sluggishness)。 • 时间序列,例如国民生产总值、就业、货币供给、 价格指数等等,都呈现周期或循环(在经济活动 中重複發生或者自我维持波动)。当经济恢復开 始时,由萧条的底部开始,大多数的经济序列向 上移动。在向上移动的过程中,序列某一时点的 值会大於其前期值。这裏有一種“动力”存在, 继续向上,直到某些事件發生(例如税收的增加 或者利率的提高或者两者同时增加)才使序列移 动减慢下来。 • 在涉及时间系列数据的回归方程中,连续的观察 值之间很可能是相关的。
产生自相关的原因4:数据处理 Data manipulation
• 在实证分析中,通常原始数据是要经过加工的。例如,在 季度数据的时间序列回归中,数据通常是通过月度数据推 导而来的,即将3个月的数据简单加总并除以3。这样平均 的结果,消除了月度数据的波动性,而这種“平滑”过程 本身就可能导致扰动项的系统模式,从而引入自相关。
本章讨论问题
• 本章将深入讨论以下问题:
– (1) 自相关有什么性质? – (2) 自相关的理论与实际结果是什么? – (3) 由於非自相关假设与不可观察的扰动项ui有关,那么, 如何判断在给定情况下存在自相关?简言之,在实际中, 如何诊断自相关? – (4) 如果發现自相关的後果比较严重,如何採取措施加 以补救?
第十章自相关

建立模型: Y t=B 1+B 2X t+ut
Y t -真实工资,X -t 生产率
39
模型的建立、估计与检验
据表10-1的数据使用普通最小二乘法估计消费模 型得: Y ˆt= 1 0 6 .7 5 2 8 + 0 .5 9 9 8 X t
R 2 = 0 . 9 7 8 8 , F = 7 8 6 . 0 5 4 8 , d f = 1 7 , D W = 0 . 7 7 0 6
计量经济学
第六章
自相关
第六章 自相关
本章讨论四个问题:
●什么是自相关 ●自相关的后果 ●自相关的检验 ●自相关性补救措施
第一节 什么是自相关
本节基本内容:
●什么是自相关 ●自相关产生的原因
第一节 什么是自相关
一、自相关的概念
自相关(auto correlation),又称序列相关( serial correlation) 是指总体回归模型的随机误差项之间存在相关 关系。
系数。
5
u t=1 u t-1+2 u t-2+ v t
称为二阶自相关,
1 为一阶自相关系数
2 为二阶自相关系数 此式称为二阶自回归模式,记为 AR(2)
6
一般地,若模型为: u t= 1 u t - 1 + 2 u t - 2 + . . .+ m u t - m + v t
则称此式为 m 阶自回归模式,记为 AR(m)。
两式相减,可得:
Y t - Y t - 1 = B 1 ( 1 - ) + B 2 ( X t - X t - 1 ) + u t - u t - 1
式中, ut -ut-1 =vt 是经典误差项。因此,模
Y t -真实工资,X -t 生产率
39
模型的建立、估计与检验
据表10-1的数据使用普通最小二乘法估计消费模 型得: Y ˆt= 1 0 6 .7 5 2 8 + 0 .5 9 9 8 X t
R 2 = 0 . 9 7 8 8 , F = 7 8 6 . 0 5 4 8 , d f = 1 7 , D W = 0 . 7 7 0 6
计量经济学
第六章
自相关
第六章 自相关
本章讨论四个问题:
●什么是自相关 ●自相关的后果 ●自相关的检验 ●自相关性补救措施
第一节 什么是自相关
本节基本内容:
●什么是自相关 ●自相关产生的原因
第一节 什么是自相关
一、自相关的概念
自相关(auto correlation),又称序列相关( serial correlation) 是指总体回归模型的随机误差项之间存在相关 关系。
系数。
5
u t=1 u t-1+2 u t-2+ v t
称为二阶自相关,
1 为一阶自相关系数
2 为二阶自相关系数 此式称为二阶自回归模式,记为 AR(2)
6
一般地,若模型为: u t= 1 u t - 1 + 2 u t - 2 + . . .+ m u t - m + v t
则称此式为 m 阶自回归模式,记为 AR(m)。
两式相减,可得:
Y t - Y t - 1 = B 1 ( 1 - ) + B 2 ( X t - X t - 1 ) + u t - u t - 1
式中, ut -ut-1 =vt 是经典误差项。因此,模
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Y t = B 1 + B 2 X t + B 3Y t −1 + u t
四、自相关的补救措施
为了讨论尽可能简单,仍以双变量模型为例
Yt = B1 + B 2 X
t
+ ut
(5 )
并假设随机误差项服从AR(1)过程: u t = ρ u t −1 + v t 0 ≤ ρ ≤1 其中,v满足OLS假定。 假定 ρ 是已知的。可以通过一个变换将原模型变为不存在 自相关的模型(广义差分法),过程如下: 首先将式(5)写成滞后一期的形式
应用德宾-沃森统计量时,模型必须满足一些条件,如下: (1)回归模型包括一个截距项。 (2)变量X是非随机变量,即在重复抽样中变量X的值是固定的。 (3)扰动项 u t 的生成机制是
ρ 其中, 为自相关系数。
u t = ρ u t −1 + v t
−1≤ ρ ≤ 1
(3 )
(4)解释变量中不包含应变量的滞后值。换言之,该检验对 下面的模型不适用:
三、自相关的诊断
由于不知道随机误差项,所以针对自相关的诊断,都是根据 从标准OLS估计法得到的残差来作出判断。 例子:美国商业部门真实工资与生产率的关系(1959-2002), 数据如下表。
微观经济理论表明真实工资与劳动生产率正相关——在其它条件不变的 情况下。根据该理论建立如下模型:
Y
t
=
B
1
+ B
t =1
e t2
≈ 2 1 −
e t e t −1 ∑2 t= = 2 (1 − ρ ) ˆ n ∑2 e t2− 1 t=
n
u t = ρ u t −1 + v t
很多软件都给出了德宾-沃森统计量。比如工资-生产率一例的D-W统计量 为0.2136。
ˆ ρ 值
Y t −1 = B 1 + B 2 X
t −1
+ u t −1 + ρ u t −1
(6 )
将式(6)两边同乘以 ρ ,得到:
ρ Y t −1 = ρ B 1 + ρ B 2 X
t −1
(7 )
把式(6)与式(7)相减得到
( Y t − ρ Y t − 1 ) = B 1 (1 − ρ ) + B 2 ( X
自相关分为正自相关(a)和负自相关(b)
2.自相关产生的原因 (1)惯性 大多数经济时间序列具有显著的惯性或者说迟缓性特征。比 如说国内生产总值、就业、货币供给等时间序列都呈现出周 期性。所以,在涉及时间序列数据的回归方程中,连续的观 察值之间有可能是相互依赖或相关的。 (2)模型设定误差 忽略了必要的解释变量或者使用了错误的函数形式也有可能 导致自相关。 (3)蛛网现象 在许多诸如农产品供给的现象中呈现出了所谓的蛛网现象, 即供给对价格的反应滞后了一期,因为供给决策的实现需要 一定的时间。因此,农户今年的计划要受去年价格的影响。
第十章
自相关
上海立信会计学院
包括如下内容: 1.自相关的性质 2.自相关的理论与实际结果是什么? 3.如何判断自相关的存在? 4.自相关的补救措施
一、自相关的性质
1.自相关的定义 假如随机误差项之间存在如下关系,那么模型就产 生了自相关问题。
C ov ( u i , u j ) = E ( u i u j ) ≠ 0 i≠ j
自相关问题通常与时间序列数据有关。 下面几个图给出了自相关和无自相关的几种类型。 纵轴同时给出了 ui(总体扰动项)或相应的 ei(残 差),由于无法观察到前者,因而只能通过后者推 断前者的行为。
图a到d表明u中存在明显自相关,而图e则表明u不存在系统 模式,这也是无自相关假设的几何解释。
自相关的模式
(4)数据处理 在数据的处理过程中也会导致自相关的产生。比如在从月度 数据获得季度数据的过程中。
二、自相关的后果
自相关会产生以下后果: 1.最小二乘估计量仍然是线性和无偏估计量。 2.但最小二乘估计量不再是有效的。 3.OLS估计量的方差是有偏的,因此通常所用的t检验和F检 验是不可靠的。 ˆ 4.计算得到的误差方差 σ 2 = RSS / d . f . ,是真实误差方差的 有偏估计量。 5.通常计算的预测方差和标准误也是无效的。
ρ 统计理论表明,尽管对小样本而言,ˆ 是真实ρ 的有偏估计量,但是随 着样本容量的增加,这个偏差会逐渐消失。
谢谢大家!!!!
1 2 3 简言之, ≤ d 0
ˆ ρ =-1(完全负相关)
d值
d=4 d=2 d=0
ˆ ρ =0 (无自相关) ˆ ρ =1 (完全正相关)
≤4
根据以上讨论可以看出:如果计算的d值接近于零,则表明存在着正 的自相关;如果接近于4,则表明存在着负的自相关;d值越接近于2, 则说明越倾向于无自相关。 德宾-沃森检验的步骤如下: (1)进行OLS估计得到残差 (2)根据式(2)计算d值 (3)根据样本容量及解释变量的个数,从D-W表中查到临界的 d L和dU 。 (4)按照下表中给出的规则进行判定。
针对以上例子,讨论两种对自相关进行检验的方法。 1.图形法
即通过对OLS残差的直观观察来判断误差项中是否存在自相关。以上例为 例,将残差对时间作图,如下: 回 归 方 程 ( ) 的 残 差 图 一
从上图可以看出,残差并不是随机分布,而是呈现出明显 的变动模式。为了进一步确认我们的判断,做 ei 对 ei −1 的图形,结果如下:
上图表明存在着正的自相关:大多数残差都分布在第一象限 和第三象限。 2.德宾-沃森d检验 假设: H 0 : ρ = 0 ut 不存在自相关 H1 : ρ ≠ 0 ut 存在自相关 德宾-沃森d统计量定义为:
d =
∑
n
2
t=2
( e t − e t −1 )
∑
n
其中,ρ 为如下一阶自回归的自回归系数
t
− ρ X
t −1
) + vt
(8 )
由于式中的残差项 vt 满足标准的OLS假定,所以变换后的模 型无序列相关,如果把式(8)写成
Y
* t
= B
* 1
+ B
2
X
* t
+ v
t
那么对上式采用OLS法,得到的估计量具有BLUE性质。对变 换后的模型使用OLS得到的估计量称为广义最小二乘(GLS)估 计量。 可以预期,在一般情况下 ρ 是未知的,所以不能根据以上讨 论直接运用广义最小二乘法,而必须对 ρ 进行估计。一般有 三种方法。 1.直接令 ρ =1 2.从德宾-沃森d统计量中估计 ρ
结论
如果
正自相关 无法判断 无自相关 无法判断 负自相关
0 < d < dL d L ≤ d ≤ dU dU < d < 4 − dU 4 − dU ≤ d ≤ 4 − d L 4 − dL < d < 4
德宾-沃森d检验的判定规则
比如工资与生产率一例。d=0.2136。根据D-W表,对于 d n=45,k=1,在5%显著性水平下,L = 1.475 和 dU = 1.566 。由于0.2136远低于1.475,所以得到结论,在工资-生 产率回归方程中的残差存在正的自相关。
当ρ不知道时,如何估计 ρ
根据对德宾-沃森检验的讨论可知,
ˆ d ≈ 2 (1 − ρ )
变换后得到:
ρˆ ≈ 1 −
d 2
3.从OLS残差中估计 ρ 回归一阶自回归过程: u t = ρ u t −1 + v t
ˆ ρ 可以作为 ρ 的估计量。
0 ≤ ρ ≤1
由于 u 无法直接观察得到,因此可以用相应的残差 e 代替, 并进行如下回归: ˆ e t = ρ e t −1 + v t
2
X
t
+ u
t
(1 )
利用下表数据回归结果如下:
真实工资生产率 = 29.5749 + 0.7005 × 所有工人的小时产出
se= (1.4605) (0.0171) t= (20.2496) (40.9181) r = 0.97W统计量
美国商业部门真实工资指数和劳动生产率
四、自相关的补救措施
为了讨论尽可能简单,仍以双变量模型为例
Yt = B1 + B 2 X
t
+ ut
(5 )
并假设随机误差项服从AR(1)过程: u t = ρ u t −1 + v t 0 ≤ ρ ≤1 其中,v满足OLS假定。 假定 ρ 是已知的。可以通过一个变换将原模型变为不存在 自相关的模型(广义差分法),过程如下: 首先将式(5)写成滞后一期的形式
应用德宾-沃森统计量时,模型必须满足一些条件,如下: (1)回归模型包括一个截距项。 (2)变量X是非随机变量,即在重复抽样中变量X的值是固定的。 (3)扰动项 u t 的生成机制是
ρ 其中, 为自相关系数。
u t = ρ u t −1 + v t
−1≤ ρ ≤ 1
(3 )
(4)解释变量中不包含应变量的滞后值。换言之,该检验对 下面的模型不适用:
三、自相关的诊断
由于不知道随机误差项,所以针对自相关的诊断,都是根据 从标准OLS估计法得到的残差来作出判断。 例子:美国商业部门真实工资与生产率的关系(1959-2002), 数据如下表。
微观经济理论表明真实工资与劳动生产率正相关——在其它条件不变的 情况下。根据该理论建立如下模型:
Y
t
=
B
1
+ B
t =1
e t2
≈ 2 1 −
e t e t −1 ∑2 t= = 2 (1 − ρ ) ˆ n ∑2 e t2− 1 t=
n
u t = ρ u t −1 + v t
很多软件都给出了德宾-沃森统计量。比如工资-生产率一例的D-W统计量 为0.2136。
ˆ ρ 值
Y t −1 = B 1 + B 2 X
t −1
+ u t −1 + ρ u t −1
(6 )
将式(6)两边同乘以 ρ ,得到:
ρ Y t −1 = ρ B 1 + ρ B 2 X
t −1
(7 )
把式(6)与式(7)相减得到
( Y t − ρ Y t − 1 ) = B 1 (1 − ρ ) + B 2 ( X
自相关分为正自相关(a)和负自相关(b)
2.自相关产生的原因 (1)惯性 大多数经济时间序列具有显著的惯性或者说迟缓性特征。比 如说国内生产总值、就业、货币供给等时间序列都呈现出周 期性。所以,在涉及时间序列数据的回归方程中,连续的观 察值之间有可能是相互依赖或相关的。 (2)模型设定误差 忽略了必要的解释变量或者使用了错误的函数形式也有可能 导致自相关。 (3)蛛网现象 在许多诸如农产品供给的现象中呈现出了所谓的蛛网现象, 即供给对价格的反应滞后了一期,因为供给决策的实现需要 一定的时间。因此,农户今年的计划要受去年价格的影响。
第十章
自相关
上海立信会计学院
包括如下内容: 1.自相关的性质 2.自相关的理论与实际结果是什么? 3.如何判断自相关的存在? 4.自相关的补救措施
一、自相关的性质
1.自相关的定义 假如随机误差项之间存在如下关系,那么模型就产 生了自相关问题。
C ov ( u i , u j ) = E ( u i u j ) ≠ 0 i≠ j
自相关问题通常与时间序列数据有关。 下面几个图给出了自相关和无自相关的几种类型。 纵轴同时给出了 ui(总体扰动项)或相应的 ei(残 差),由于无法观察到前者,因而只能通过后者推 断前者的行为。
图a到d表明u中存在明显自相关,而图e则表明u不存在系统 模式,这也是无自相关假设的几何解释。
自相关的模式
(4)数据处理 在数据的处理过程中也会导致自相关的产生。比如在从月度 数据获得季度数据的过程中。
二、自相关的后果
自相关会产生以下后果: 1.最小二乘估计量仍然是线性和无偏估计量。 2.但最小二乘估计量不再是有效的。 3.OLS估计量的方差是有偏的,因此通常所用的t检验和F检 验是不可靠的。 ˆ 4.计算得到的误差方差 σ 2 = RSS / d . f . ,是真实误差方差的 有偏估计量。 5.通常计算的预测方差和标准误也是无效的。
ρ 统计理论表明,尽管对小样本而言,ˆ 是真实ρ 的有偏估计量,但是随 着样本容量的增加,这个偏差会逐渐消失。
谢谢大家!!!!
1 2 3 简言之, ≤ d 0
ˆ ρ =-1(完全负相关)
d值
d=4 d=2 d=0
ˆ ρ =0 (无自相关) ˆ ρ =1 (完全正相关)
≤4
根据以上讨论可以看出:如果计算的d值接近于零,则表明存在着正 的自相关;如果接近于4,则表明存在着负的自相关;d值越接近于2, 则说明越倾向于无自相关。 德宾-沃森检验的步骤如下: (1)进行OLS估计得到残差 (2)根据式(2)计算d值 (3)根据样本容量及解释变量的个数,从D-W表中查到临界的 d L和dU 。 (4)按照下表中给出的规则进行判定。
针对以上例子,讨论两种对自相关进行检验的方法。 1.图形法
即通过对OLS残差的直观观察来判断误差项中是否存在自相关。以上例为 例,将残差对时间作图,如下: 回 归 方 程 ( ) 的 残 差 图 一
从上图可以看出,残差并不是随机分布,而是呈现出明显 的变动模式。为了进一步确认我们的判断,做 ei 对 ei −1 的图形,结果如下:
上图表明存在着正的自相关:大多数残差都分布在第一象限 和第三象限。 2.德宾-沃森d检验 假设: H 0 : ρ = 0 ut 不存在自相关 H1 : ρ ≠ 0 ut 存在自相关 德宾-沃森d统计量定义为:
d =
∑
n
2
t=2
( e t − e t −1 )
∑
n
其中,ρ 为如下一阶自回归的自回归系数
t
− ρ X
t −1
) + vt
(8 )
由于式中的残差项 vt 满足标准的OLS假定,所以变换后的模 型无序列相关,如果把式(8)写成
Y
* t
= B
* 1
+ B
2
X
* t
+ v
t
那么对上式采用OLS法,得到的估计量具有BLUE性质。对变 换后的模型使用OLS得到的估计量称为广义最小二乘(GLS)估 计量。 可以预期,在一般情况下 ρ 是未知的,所以不能根据以上讨 论直接运用广义最小二乘法,而必须对 ρ 进行估计。一般有 三种方法。 1.直接令 ρ =1 2.从德宾-沃森d统计量中估计 ρ
结论
如果
正自相关 无法判断 无自相关 无法判断 负自相关
0 < d < dL d L ≤ d ≤ dU dU < d < 4 − dU 4 − dU ≤ d ≤ 4 − d L 4 − dL < d < 4
德宾-沃森d检验的判定规则
比如工资与生产率一例。d=0.2136。根据D-W表,对于 d n=45,k=1,在5%显著性水平下,L = 1.475 和 dU = 1.566 。由于0.2136远低于1.475,所以得到结论,在工资-生 产率回归方程中的残差存在正的自相关。
当ρ不知道时,如何估计 ρ
根据对德宾-沃森检验的讨论可知,
ˆ d ≈ 2 (1 − ρ )
变换后得到:
ρˆ ≈ 1 −
d 2
3.从OLS残差中估计 ρ 回归一阶自回归过程: u t = ρ u t −1 + v t
ˆ ρ 可以作为 ρ 的估计量。
0 ≤ ρ ≤1
由于 u 无法直接观察得到,因此可以用相应的残差 e 代替, 并进行如下回归: ˆ e t = ρ e t −1 + v t
2
X
t
+ u
t
(1 )
利用下表数据回归结果如下:
真实工资生产率 = 29.5749 + 0.7005 × 所有工人的小时产出
se= (1.4605) (0.0171) t= (20.2496) (40.9181) r = 0.97W统计量
美国商业部门真实工资指数和劳动生产率