第十章 自相关
自相关2

自相关的最简单模式为:
ut = ρut-1 + Vt,
t=1,2,…,n.
其中ρ称为自相关系数(-1≤ρ≤1),这 种扰动项的自相关称为一阶自相关,即扰 动项仅与其前一期的值有关。我们有: ρ>0 正自相关
ρ<0 ρ=0
负自相关 无自相关
在一阶自相关模式中,假定Vt具有以下性质: E(Vt) = 0 , E(Vt² = σ 2 = 常数, ) E(ViVj)=0, i≠j, Vt服从正态分布。 在计量经济学中,具备上述性质的量称为白噪 声(White noise),表示为 Vt= White noise
自相关意味着 Cov(ui , uj) = E(uiuj) ≠0, 回顾协方差的含义?
i≠j
COV(X,Y)=E[(X-E(X))(Y-E(Y))]。 协方差是描述X和Y相关程度的量,在 同一量纲之下有一定的作用,但同样 的两个量采用不同的量纲使它们的协 方差在数值上表现出很大的差异。
自相关的一般形式
三、自相关的检验
基本思路: 自相关检验方法有多种,但基本思 路相同:首先,采用OLS估计模型,以 求得随机扰动项的估计量残差ei
然后,通过分析残差的相关性, 以判断随机误差项是否具有自相关。
1.图示检验法 2. 杜宾—瓦尔森检验法
up
1.图示检验法
(1)绘制et,et-1的散点图。如果大部分落 在第I、III象限,表明e存在正的序列相关; 如果大部分落在第II、IV象限,表明e存在 负的序列相关。
第一节 第二节 第三节 第四节 小结
什么是自相关 自相关的后果 自相关的检验 自相关的补救
一、自相关概念
对于模型
Yi=1+2X2i+3X3i+…+kXki+i i=1,2, …,n
eviews-4.自相关解析

三、序列相关性的后果
计量经济学模型一旦出现序列相关性,如果仍采用OLS 法估计模型参数,则OLS估计量仍然是线性无偏估计量, 但是会产生下列不良后果:
1、参数估计量非有效
因为,在有效性证明中利用了 E(UU’)=2I 即同方差性和无序列相关假设。
证明:
ˆ k t t 1 1
ˆ ) E[ ˆ E( ˆ )]2 E( ˆ )2 var( 1 1 1 1 1
~ Y (Yˆ )ˆ e e i Yi (iY0ls)
t t
t ols
然后,通过分析这些“近似估计量”之间的相 关性,以判断随机误差项是否具有序列相关性。
自相关的检验方法
检验自相关的方法也可以分为两种:一种是图示 法,另一种是检验方法。
(一)图示法
由于回归残差 e 可以作为随机项 u t 的估计量, ut t 的性质可以从 e 的性质中反映出来。我们可以通 t 过观察残差是否存在自相关来判断随机项是否存 在自相关。
ts
经济变量以正相关居多, 所以此项多为正数
ˆ ˆ) var( ) var( 1 1
2、变量的显著性检验失去意义
在变量的显著性检验中,统计量是建立在参 数方差正确估计基础之上的,这只有当随机误差 项具有同方差性和无序列相关时才能成立。
如果存在序列相关,参数估计量的方差 出现偏误(偏大或偏小),t检验就失 去意义。其他检验也是如此。
称ut具有一阶自回归形式。 比如:
ut 1ut 1 vt
满足经典假设
由于序列相关性经常出现在以时间序列为样本的模型中, 因此,本节用下标t代表i。
ut 1ut 1 vt
ˆ1
u u
自相关分析

i=1i-1+2i-2+Li-L+i
关于迭代的次数,可根据具体的问题来定。
一般是事先给出一个精度,当相邻两次 1,2, ,L的估计值之差小于这一精度时,迭 代终止。
实践中,有时只要迭代两次,就可得到 较满意的结果。两次迭代过程也被称为科克 伦—奥科特两步法。
(2)杜宾(durbin)两步法 该方法仍是先估计1,2,,l,再对差分模型 进行估计。
D.W检验步骤: (1)计算DW值 (2)给定,由n和k的大小查DW分布表,得临 界值dL和dU (3)比较、判断 若 0<D.W.<dL dL<D.W.<dU dU <D.W.<4-dU 存在正自相关 不能确定 无自相关
4-dU <D.W.<4- dL 4-dL <D.W.<4
不 能 确 定 无自相关
对(3)运用OLS 估计,得到 (1 ) 1和 2的估计值,进而算出
(3)
1, 2
应用广义最小二乘法或广义差分法,必须已知随机误差项的
相关系数1, 2, … , L 。
实际上,人们并不知道它们的具体数值,所以必须首先对它
们进行估计。
简单的方法有:(1)由DW-d统计量中估计
ˆ ˆ ˆ ˆ Yi 1Yi1 l Yil 0 (1 1 l ) 1 ( X i 1 X i1 l X i l ) i
i 1 l,2 l,, n
求出i新的“近拟估计值”, 并以之作为样本 观测值,再次估计:
ˆ ˆ ˆ 第二步,将估计的 1 , 2 , , l 代入差分模型
Yi 1Yi 1 l Yi l 0 (1 1 l ) 1 ( X i 1 X i 1 l X i l ) i
自相关

2
,无自相关 E(vt vs ) 0 (t s)
17
的假定。
性质一 r= 性质二 E (ut ) 0 性质三 Var (ut ) 2 2
1
^
表明,在 为一阶自回归的相关形式时,随机误差 t 是零均值、同方差的误差项。 2
性质四Cov (ut , ut 1) 12 2 2 Cov(ut , ut 2) 12 性质五
n
t t -1
et2
)
30
由 DW 2(1 ) ˆ ˆ 可得DW 值与 的对应关系如表所示。
ˆ
-1 (-1,0) 0 (0,1) 1
DW
4 (2,4) 2 (0,2) 0
31
由上述讨论可知DW的取值范围为:
0≤DW≤4
根据样本容量n 和解释变量的数目 k (不包括常数项)查DW
u
ut依然
ˆ ˆˆ t ( SE ()
以此类推,可得 :
k 2 k Cov(ut , ut -k ) = Var(ut -k ) = 1- 2
这些协方差分别称为随机误差项 t的一阶自协 方差、二阶自协方差和 k 阶自协方差
u
19
二、对参数估计的影响
对于一元线性回归模型,当 t 满足各项古典误差 ˆ 时,普通最小二乘估计量 2的方差为:
1. 图示法
二、DW检验法
DW 检验是J.Durbin(杜宾)和G.S.Watson(沃特森)于 1951年提出的一种适用于小样本的检验方法。DW
检验只能用于检验随机误差项具有一阶自回归形式
的自相关问题。这种检验方法是建立经济计量模型
中最常用的方法,一般的计算机软件都可以计算出
第十章 随机过程及其统计描述

9
例4:设某城市的120急救中心电话台迟早会接到用户的呼叫。 以X (t )表示时间间隔 ( 0, t ]内接到的呼叫次数, 它是一个随机变量,且对于不同的t ≥ 0,X (t )是不同 的随机变量,于是 { X (t ), t ≥ 0} 是一随机过程,且它的 状态空间是 {0,1, 2,L} .
−1 出现H X (1) Vcosω t , t ∈ ( −∞, +∞ ),V 在[0,1]上均匀分布 求在t = 0, π , 3π , π , π 时X (t )的密度函数。 4ω 4ω ω 2ω 解:对给定的t , 若cosω t ≠ 0, 记a = cosω t, 则X (t ) = aV 的密度函数为: 1 0 < x <1 a f X ( x; t ) = fV x ⋅ 1 = a a a 其他 0 1 0 < x < 1 a = cosω ⋅ 0 = 1 于是 f X ( x;0 ) = 0 其他 2 π = 2 0< x< 2 π = 2 , f X x; a = cosω ⋅ 4ω 4ω 2 0 其他 2 3π = − 2 , f x; 3π = 2 − 2 < x < 0 a = cosω ⋅ X 4ω 4ω 2 0 其他 π = 1 − 1 < x < 0 π = −1, f X x; a = cosω ⋅ ω 其他 ω 0
12
§2 随机过程的统计描述
(一) 随机过程的分布函数族
设随机过程{ X (t), t ∈T} , 对每一固定的t ∈T,
分布函数 两种描述 数字特征
{FX (x,t),t ∈T} 称为一维分布函数族
FX (x, t) = P{ X (t) ≤ x},x ∈R,称为随机过程{ X (t), t ∈T}的一维分布函数
10--章自相关

二、参数估计值不一定再有最小方差
( X X )u ˆ ( X X )
* 2 2 2
是随机误差项存在自相关条件下,计算出的 的估计量
2
( X X )u ˆ Var ( ) E ( ) ( X X )
* 2 2 2 2
2
( X X )u E( ) E (c u ) ( X X )
利用最小二乘法可得
自相关性的后果
Yt 1 2 X t ut
一、参数估计量是无偏的
( X X )(Y Y ) xi y i xi (Yi Y ) xiYi (xi )(Yi ) ˆ 2 2 2 ( X X ) xi xi xi nxi2
2 2
xi 2 Yi CiYi Ci ( 1 2 X i ui ) xi 1 Ci 2Ci X i Ci ui 2 Ci ui
注:
C 0 ;
i
Ci X i 1;
E(ui ) 0
12
ˆ ) C E(u ) E( 2 2 i i 2
Yt 0 1 X 1t 2 X 2t 3Yt 1 t Yt 0 1 X 1t 2 X 2t t
则随机干扰项很可能有自相关。
7
3、随机偶然因素的干扰 战争、自然灾害等偶然(随机)因素的干扰造成的 影响,常常要延续若干时期,反 映在模型中就是干扰项 有序列相关。
2 2
2
t
t
E (C u 2 C C u u )
2 2 t t t s t s t s
2 C C E (u u ) ( X X )
2 2
第10章自相关

t
• 如果et(t=1,2,…,n)随着t 的变化逐次有规律地变化, 呈现锯齿形或循环形状的变化,就可断言et 存在 相关,表明存在着序列相关;如果et 随着t的变化 逐次变化并不断地改变符号,那么随机误差项ut 存在负的序列相关
et
t
et的分布
• 如果et 随着t 的变化逐次变化并不频繁地改变符号, 而是幾个正的et 後面跟着幾个负的,则表明随机 误差项存在ut 正的序列相关
产生自相关的原因1:惯性
• 大多数经济时间序列的一个显著特徵就是惯性 (inertia)或者说是迟缓性(sluggishness)。 • 时间序列,例如国民生产总值、就业、货币供给、 价格指数等等,都呈现周期或循环(在经济活动 中重複發生或者自我维持波动)。当经济恢復开 始时,由萧条的底部开始,大多数的经济序列向 上移动。在向上移动的过程中,序列某一时点的 值会大於其前期值。这裏有一種“动力”存在, 继续向上,直到某些事件發生(例如税收的增加 或者利率的提高或者两者同时增加)才使序列移 动减慢下来。 • 在涉及时间系列数据的回归方程中,连续的观察 值之间很可能是相关的。
产生自相关的原因4:数据处理 Data manipulation
• 在实证分析中,通常原始数据是要经过加工的。例如,在 季度数据的时间序列回归中,数据通常是通过月度数据推 导而来的,即将3个月的数据简单加总并除以3。这样平均 的结果,消除了月度数据的波动性,而这種“平滑”过程 本身就可能导致扰动项的系统模式,从而引入自相关。
本章讨论问题
• 本章将深入讨论以下问题:
– (1) 自相关有什么性质? – (2) 自相关的理论与实际结果是什么? – (3) 由於非自相关假设与不可观察的扰动项ui有关,那么, 如何判断在给定情况下存在自相关?简言之,在实际中, 如何诊断自相关? – (4) 如果發现自相关的後果比较严重,如何採取措施加 以补救?
第十章自相关

Y t -真实工资,X -t 生产率
39
模型的建立、估计与检验
据表10-1的数据使用普通最小二乘法估计消费模 型得: Y ˆt= 1 0 6 .7 5 2 8 + 0 .5 9 9 8 X t
R 2 = 0 . 9 7 8 8 , F = 7 8 6 . 0 5 4 8 , d f = 1 7 , D W = 0 . 7 7 0 6
计量经济学
第六章
自相关
第六章 自相关
本章讨论四个问题:
●什么是自相关 ●自相关的后果 ●自相关的检验 ●自相关性补救措施
第一节 什么是自相关
本节基本内容:
●什么是自相关 ●自相关产生的原因
第一节 什么是自相关
一、自相关的概念
自相关(auto correlation),又称序列相关( serial correlation) 是指总体回归模型的随机误差项之间存在相关 关系。
系数。
5
u t=1 u t-1+2 u t-2+ v t
称为二阶自相关,
1 为一阶自相关系数
2 为二阶自相关系数 此式称为二阶自回归模式,记为 AR(2)
6
一般地,若模型为: u t= 1 u t - 1 + 2 u t - 2 + . . .+ m u t - m + v t
则称此式为 m 阶自回归模式,记为 AR(m)。
两式相减,可得:
Y t - Y t - 1 = B 1 ( 1 - ) + B 2 ( X t - X t - 1 ) + u t - u t - 1
式中, ut -ut-1 =vt 是经典误差项。因此,模
第10章 自相关

经济与工商管理学院 应用经济系 康继军
计量经济学
3.设定偏误:不正确的函数形式
例如:如果边际成本模型应为: Yt= 0+1Xt+2Xt2+t 其中:Y=边际成本,X=产出。 但建模时设立了如下模型: Yt= 0+1Xt+vt 因此,由于vt= 2Xt2+t, ,包含了产出的平方对随机项的系 统性影响,随机项也呈现序列相关性。
例如:如果对牛肉需求的正确模型应为 Yt=0+1X1t+2X2t+3X3t+t
计量经济学
其中:Y=牛肉需求量,X1=牛肉价格,X2=消费者收入,X3= 猪肉价格。 如果模型设定为: Yt= 0+1X1t+2X2t+vt 那么该式中的随机误差项实际上是:vt= 3X3t+t, 于是在猪肉价格影响牛肉消费量的情况下,这种模型设定 的偏误往往导致随机项中有一个重要的系统性影响因素,使其 呈序列相关性。
28 24 20 16 12 8 4 X 0 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Y YF1 YF2
图 10-2 当用直线拟合数据时,误差项会呈现正自相关
经济与工商管理学院 应用经济系 康继军
10.2自相关的来源与后果
计量经济学
2. 惯性 大多数经济时间数据都有一个明显的特点,就是它的惯性。 GDP、价格指数、生产、就业与失业等时间序列都呈周期性,如周期中 的复苏阶段,大多数经济序列均呈上升势,序列在每一时刻的值都高于前 一时刻的值,似乎有一种内在的动力驱使这一势头继续下去,直至某些情 况(如利率或课税的升高)出现才把它拖慢下来。
(10-1)
其中a1是自回归系数,vt是上式的随机误差项。vt通常满足假设:
自相关 量化 -回复

自相关量化-回复什么是自相关,以及在量化领域中的应用。
在量化金融领域,自相关是一种统计概念,用于分析时间序列数据中的相关性。
它衡量了一个随机变量与其自身在不同时间点上的相关性。
自相关在金融市场研究和交易策略开发中具有重要的作用。
本文将一步一步回答以下问题:什么是自相关?为什么自相关对量化金融有用?自相关如何计算和解释?自相关的局限性是什么?以及自相关如何应用于量化金融策略中。
第一部分:什么是自相关?自相关是指一个时间序列数据与其自身在不同时间点上的相关性。
它衡量了时间序列数据是否在不同时期上表现出相似的波动。
自相关的概念来自于时间序列分析,在统计学中被广泛应用。
在金融领域中,时间序列数据可以是股票价格、指数收益率、交易额等。
自相关可以帮助我们了解某一时间序列数据如何受到自身过去的波动的影响,以及当前数据是否与历史数据存在一定的关联性。
第二部分:自相关对量化金融的意义何在?自相关在量化金融中扮演着重要的角色。
通过分析时间序列数据的自相关性,我们可以发现一些重要的信息,比如周期性变动、趋势和季节性等。
这些信息可以为我们构建交易策略、风险管理和模型预测提供参考。
在量化金融中,我们通常使用自相关系数来衡量自相关性。
自相关系数的取值范围在-1和1之间。
自相关系数为1表示一个完全正相关,即当前数据与过去数据完全相同;自相关系数为-1表示一个完全负相关,即当前数据与过去数据完全相反;自相关系数为0表示没有任何相关性。
第三部分:自相关如何计算和解释?计算自相关系数的最简单方法是使用皮尔逊相关系数。
皮尔逊相关系数通过计算协方差和标准差的比值来度量两个变量之间的线性相关性。
考虑一个时间序列数据X,包含N个观测值。
首先,我们计算数据的平均值μ和标准差σ。
然后,我们将时间序列数据与其滞后的时间序列数据进行协方差的计算。
这将得到一系列自相关系数,表示不同滞后期之间的相关性水平。
解释自相关系数时需要注意以下几点:首先,如果自相关系数大于0.8或小于-0.8,则可以认为存在较强的自相关性,而如果自相关系数接近于0,则说明数据之间几乎没有相关性。
自相关函数和互相关函数计算和作图的整理

自相关函数和相互关函数计算和作图的整理1. 首先说说自相关和相互关的概念。
--[转版友gghhjj]-------------------------------------------------------------------------------------这个是信号分析里的概念,他们分别表示的是两个时间序列之间和同一个时间序列在任意两个不同时刻的取值之间的相关程度,即相互关函数是描述随机信号 x(t),y(t)在任意两个不同时刻t1,t2的取值之间的相关程度,自相关函数是描述随机信号x(t)在任意两个不同时刻t1,t2的取值之间的相关程度。
------------------------------------------------------------------------------------------------------------------------------------------------[转版友hustyoung]-----------------------------------------------------------------------------------自相关函数是描述随机信号X(t)在任意两个不同时刻t1,t2的取值之间的相关程度;相互关函数给出了在频域内两个信号是否相关的一个推断指标,把两测点之间信号的互谱与各自的自谱联系了起来。
它能用来确定输出信号有多大程度来自输入信号,对修正测量中接入噪声源而产生的误差非常有效。
----------------------------------------------------------------------------------------------------------------------------------------------事实上,在图象处理中,自相关和相互关函数的定义如下:设原函数是f(t),则自相关函数定义为R(u)=f(t)*f(-t),其中*表示卷积;设两个函数分别是f(t)和g(t),则相互关函数定义为R(u)=f(t)*g(-t),它反映的是两个函数在不同的相对位置上相互匹配的程度。
第10章-自相关:如果误差项相关会有什么后果

第10章 自相关:如果误差项相关会有什么后果本章主要讲授如下内容:10.1 自相关的性质 10.2 自相关的后果 10.3 自相关的诊断 10.4 自相关的补救措施10.1 自相关的性质1.定义对于模型:t kt k t t t X B X B X B B Y μ+++++= 33221如果随机误差项的各期值之间存在着相关关系,即0)(),cov(≠=j i j i E μμμμ,j i ≠,k j i ,,2,1, =这时,称随机误差项之间存在自相关(autocorrelation )或序列相关(serial correlation )。
最常见的类型是随机误差项之间存在一阶自相关,即0)(),cov(11≠=--t t t t E μμμμ或t t t νρμμ+=-1其中,ρ是μt 与μt-1的相关系数,νt 是满足经典假设的随机误差项。
自相关的一般形式可以表示成t p t p t t t νμρμρμρμ++++=--- 2211称之为p 阶自回归形式,或模型存在p 阶自相关。
2.判断由于我们无法观察到误差项μt ,只能通过残差项e t 来判断μt 的行为。
如果残差项e t 随时间呈现有规律的变化,则表示残差项e t 存在自相关。
否则,不存在自相关。
如图10-1所示。
3.类型主要有正的自相关和负的自相关两类,如图10-2所示。
4.自相关产生的原因(1)经济变量的惯性作用 如GDP 、就业、货币供给、价格指数等时间序列都呈现出周期性。
(2)经济行为的滞后性 如投资对其后若干年内经济的影响等。
(3)一些随机因素的干扰或影响 如战争、自然灾害、错误政策的后果、金融危机等随机因素,不仅对当期经济造成影响,而且对以后若干时期的经济产生影响,反映在模型中即容易形成随机误差序列的自相关。
(4)模型设定误差 如果模型中遗漏了重要的变量,或选择了不正确的函数形式,则得到的残差会出现自相关。
(5)数据的“编造” 在实证分析中,有些数据是通过已知数据生成的,如对原始数据进行内插或平滑处理等。
自相关函数与偏自相关函数

自相关函数与偏自相关函数上一节介绍了随机过程的几种模型。
实际中单凭对时间序列的观察很难确定其属于哪一种模型,而自相关函数和偏自相关函数是分析随机过程和识别模型的有力工具。
1、自相关函数定义在给出自相关函数定义之前先介绍自协方差函数概念。
由第一节知随机过程{t x }中的每一个元素t x ,t = 1, 2, … 都是随机变量。
对于平稳的随机过程,其期望为常数,用μ表示,即()t E x μ=,1,2,t=随机过程的取值将以 μ 为中心上下变动。
平稳随机过程的方差也是一个常量2()t xVar x σ=,1,2,t=2x σ用来度量随机过程取值对其均值μ的离散程度。
相隔k 期的两个随机变量t x 与t k x -的协方差即滞后k 期的自协方差,定义为:(,)[()()]k t t k t t k Cov x x E x x γμμ--==--自协方差序列:k γ,0,1,2,k=称为随机过程{t x }的自协方差函数。
当k = 0 时,20()t x Var x γσ==。
自相关系数定义:k ρ=因为对于一个平稳过程有:2()()t t k x Var x Var x σ-==所以220(,)t t k k kk x x Cov x x γγρσσγ-===,当 k = 0 时,有01ρ=。
以滞后期k 为变量的自相关系数列k ρ(0,1,2,k =)称为自相关函数。
因为k k ρρ-=,即(,)t k t Cov x x -= (,)t t k Cov x x +,自相关函数是零对称的,所以实际研究中只给出自相关函数的正半部分即可。
2、自回归过程的自相关函数 (1)平稳AR(1)过程的自相关函数 AR(1) 过程:11t t t x x u φ-=+,|φ1| < 1。
已知()0t E x =(why?)。
用t k x -同乘上式两侧t x t k x -11t t k t t k x x u x φ---=+上式两侧同取期望:k γ11k φγ-=其中()0t t k E u x -=(why?)(由于x t = u t + φ1 u t -1 + φ12u t -2 +… ,所以x t-k = u t-k + φ1u t-k-1 + φ12 u t-k-2 +…,而u t 是白噪音与其t - k 期及以前各项都不相关)。
金融学《自相关》课件

●一阶自回归形式较为简单 ●在实际计量分析中处理一阶自回归形式常能取得较好
效果
一阶自回归形式自相关的性质
对于 ut ut1 t 可以证明:
ut (ut2 t1) t
2 (ut3 t2 ) t1 t
3(ut4
第三节 自相关的检验
一、图解法
用样本回归剩余 et 代替ut,绘制以 et 为纵坐标,以 et1
或时间顺序 t 为横坐标的坐标图,观测是否存在自相关,
如
横坐标为 t
et
et
•
•
• •• •
• •
• •
•• ••
•• ••
•
•• •
•
•
••
•
t
••• •
••
• ••
••
• •
•
•
et 1
••
et
•
•
2 u,在
少数情况下也有可能高估 ˆ2* 的真实方差,但对OLS估计量
方差的估计也是有偏的。
真实方差 :
n1 n1
Var(ˆ2)
2 u
k xt xtk
[1 2 t1 k1
]
xt2
xt2
用 ei2 还会低估 ut 的真实方差,因为证明见教材p160(6.20)
E( ei2) 2[(n 2) (2
t 3 )
2 t2
t 1
t
t t1 2t2 3t3
u t
t t1 2t2 3t3
一般关系: ut ut1 t ktk
期望为
k 0
E(ut ) k E(tk ) 0
第十章 误差项自相关与异方差.

机动 目录 上页 下页 返回 结束
j
j
j
2. 最小二乘估计量的方差估计是有偏的。
用来估计随机项的方差会严重低估真实的方差,进 而低估回归参数的方差公式和标准差,从而过高估计t统 计量的值,夸大所估计参数的显著性,对本来不重要的 解释变量可能误认为重要而被保留。这时通常的回归系 统显著性的t 检验将失去意义。类似地,由于误差项自 2 相关,参数的OLSE是无效的,使得F检验和 检验不 可靠。
2018年10月11日
山东财经大学统计学院计量经济教研室
第16页
机动 目录 上页 下页 返回 结束
第二节 误差项自相关的检验
随机误差项自相关问题的实质在于随机误差项 u t 序 列的前后数据具有相关性。但真实的 u t 是无法观测的, 与横截面数据的异方差分析类似,由于残差 et 可看作 u t 的估计值,我们可以利用从OLS法中得到的样本残差序列 et 来判断误差项是否自相关问题。 下面介绍几种常用的自相关检验方法。 一、图示检验法 根据给定的样本数据,应用普通最小二乘法回归后, 求出残差 et (t=1, 2, …,n) 。然后可采用两种绘图方法。
如果被解释变量不同时期的取值是相关联的,也就是现 期的取值受上期或上几期取值的影响,即存在自相关。由 于被解释变量与随机项有相同的分布,被解释变量的自相 关必然意味着随机项的自相关。
2018年10月11日 山东财经大学统计学院计量经济教研室 第12页
机动 目录 上页 下页 返回 结束
(五)误差项本身存在自相关
误差项不存在自相关(序列相关)的假定在这种情况 下经常被发现是不合理的。在截面数据中,由于通常假定 搜集的数据是在相同时间对某一总体中的个体进行随机抽 样获得的,所以没有理由认为不同观测值之间存在内在的 相关关系。因而误差项自相关问题主要存在于时间序列数 据中。 截面数据中存在的异方差问题在时间序列数据中也有 可能存在,而且还有某些特殊性。
第九章 自相关

第九章 自相关基本概念(1)序列相关性 (2)差分法 (3)广义最小二乘法 (4)D.W .检验 (5)游程检验 (6)杜宾——瓦特森检验的前提假设练习题1、判断题:(1)当存在序列相关时,OLS 估计量是有偏的并且也是无效的;(2)消除序列相关的一阶差分变换假定自相关系数ρ必须等于1;(3)当模型存在高阶自相关时,可用杜宾——瓦特森检验法进行自相关检验。
(4)当模型的解释变量包括内生滞后变量时,杜宾——瓦特森检验法不适用。
(5)D-W 值在0和4之间,数值越小说明正相关的程度越大,数值越大说明负相关的程度越大。
(6)假设模型存在一阶自相关,其他条件都满足,则仍用OLS 法估计参数,得到的估计量仍是无偏的,不再是有效的,显著性检验失效,预测失效。
(7)在杜宾——瓦特森检验法中,我们假定误差项的方差为同方差。
(8)用一阶差分法消除自相关时,我们假定自相关系数等于-1。
2、什么是一阶自相关和高阶自相关?3、在存在AR(1)自相关的情形下,什么估计方法能够产生BLUE 估计量?简述这个方法的具体步骤。
4、在存在AR(1)的情形下,估计自相关参数ρ有哪些不同的方法? 什么是序列相关性?5、举例说明经济现象中序列相关性的存在。
6、检验序列相关性的方法思路是什么?7、DW 检验的局限性主要有哪些?8、假设Y为内生变量,X为外生变量,以下各组方程中哪些方程可以用Durbin —Watson 方法检验一阶自相关:(1)1t t t Y X αμ=+(2)111t t t t Y X X αβμ-=++(3)11t t t Y Y βμ-=+(4)1111t t t t Y Y X βαμ--=++ (5)01111t t t t Y XX αβαμ--=+++9、利用游程检验以下情形中的自相关样本数 +号数 -号数 游程数 自相关18 11 7 2 30 15 15 24 38 20 18 6 15 8 7 4 1055110、试述用杜宾——瓦特森d 检验法检验一阶自相关的过程?如果模型:t t t u X B B Y ++=21中检验出存在一阶自相关,并得到自相关系数的估计值ρˆ,你如何估计参数?11、证明:()ˆ21d ρ≈-12、下表给出了美国1958-1969期间每小时收入指数的年变化率(Y )和失业率(X )。
自相关

t=2 n
et2 ∑
t =1
n
et2 + ∑et2-1 - 2∑et et -1 ∑ DW =
t =2 t =2 t =2 n 2 t
n
n
n
(由∑ et2 ≈
t =2
n
et2-1 ≈ ∑
t =2
n
et2) ∑
t =1
n
∑e
t =1
∑ et et -1 ≈ 2 1- t =2n 2 ∑ et t =1 =( -ρ) 21 ˆ
广义差分法是一种借助于差分变换对估计进行修正的 理论方法,在具体是现实时通常借助科克伦-奥克特( 理论方法,在具体是现实时通常借助科克伦-奥克特( 科克伦 Cochrane-Orcutt)迭代法。 - )迭代法。 在 Eview软件包下 , 采用科克伦 奥科特 ( Cochrane软件包下, 奥科特( 软件包下 采用科克伦-奥科特 Orcutt) 迭代法实现广义差分估计十分简单 , 只需在进 ) 迭代法实现广义差分估计十分简单, 行普通最小二乘估计时,在解释变量中引入 在解释变量中引入AR(1) 、 行普通最小二乘估计时 在解释变量中引入 ( AR(2)、…,即可。 ( ,即可。
4、数据的处理
在实际经济问题中,有些数据是通过已知数据 在实际经济问题中, 生成的。 生成的。 因此,新生成的数据与原数据间就有了内在的 因此, 联系,表现出序列相关性。 联系,表现出序列相关性。 例如:季度数据来自月度数据的简单平均, 例如:季度数据来自月度数据的简单平均,这 来自月度数据的简单平均 种平均的计算减弱了每月数据的波动性, 种平均的计算减弱了每月数据的波动性,从而使 随机干扰项出现序列相关。 随机干扰项出现序列相关。 还有就是两个时间点之间的“插值” 还有就是两个时间点之间的“插值”技术往往 导致随机项的序列相关性。 导致随机项的序列相关性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
四、自相关的补救措施
为了讨论尽可能简单,仍以双变量模型为例
Yt = B1 + B 2 X
t
+ ut
(5 )
并假设随机误差项服从AR(1)过程: u t = ρ u t −1 + v t 0 ≤ ρ ≤1 其中,v满足OLS假定。 假定 ρ 是已知的。可以通过一个变换将原模型变为不存在 自相关的模型(广义差分法),过程如下: 首先将式(5)写成滞后一期的形式
应用德宾-沃森统计量时,模型必须满足一些条件,如下: (1)回归模型包括一个截距项。 (2)变量X是非随机变量,即在重复抽样中变量X的值是固定的。 (3)扰动项 u t 的生成机制是
ρ 其中, 为自相关系数。
u t = ρ u t −1 + v t
−1≤ ρ ≤ 1
(3 )
(4)解释变量中不包含应变量的滞后值。换言之,该检验对 下面的模型不适用:
三、自相关的诊断
由于不知道随机误差项,所以针对自相关的诊断,都是根据 从标准OLS估计法得到的残差来作出判断。 例子:美国商业部门真实工资与生产率的关系(1959-2002), 数据如下表。
微观经济理论表明真实工资与劳动生产率正相关——在其它条件不变的 情况下。根据该理论建立如下模型:
Y
t
=
B
1
+ B
t =1
e t2
≈ 2 1 −
e t e t −1 ∑2 t= = 2 (1 − ρ ) ˆ n ∑2 e t2− 1 t=
n
u t = ρ u t −1 + v t
很多软件都给出了德宾-沃森统计量。比如工资-生产率一例的D-W统计量 为0.2136。
ˆ ρ 值
Y t −1 = B 1 + B 2 X
t −1
+ u t −1 + ρ u t −1
(6 )
将式(6)两边同乘以 ρ ,得到:
ρ Y t −1 = ρ B 1 + ρ B 2 X
t −1
(7 )
把式(6)与式(7)相减得到
( Y t − ρ Y t − 1 ) = B 1 (1 − ρ ) + B 2 ( X
自相关分为正自相关(a)和负自相关(b)
2.自相关产生的原因 (1)惯性 大多数经济时间序列具有显著的惯性或者说迟缓性特征。比 如说国内生产总值、就业、货币供给等时间序列都呈现出周 期性。所以,在涉及时间序列数据的回归方程中,连续的观 察值之间有可能是相互依赖或相关的。 (2)模型设定误差 忽略了必要的解释变量或者使用了错误的函数形式也有可能 导致自相关。 (3)蛛网现象 在许多诸如农产品供给的现象中呈现出了所谓的蛛网现象, 即供给对价格的反应滞后了一期,因为供给决策的实现需要 一定的时间。因此,农户今年的计划要受去年价格的影响。
第十章
自相关
上海立信会计学院
包括如下内容: 1.自相关的性质 2.自相关的理论与实际结果是什么? 3.如何判断自相关的存在? 4.自相关的补救措施
一、自相关的性质
1.自相关的定义 假如随机误差项之间存在如下关系,那么模型就产 生了自相关问题。
C ov ( u i , u j ) = E ( u i u j ) ≠ 0 i≠ j
自相关问题通常与时间序列数据有关。 下面几个图给出了自相关和无自相关的几种类型。 纵轴同时给出了 ui(总体扰动项)或相应的 ei(残 差),由于无法观察到前者,因而只能通过后者推 断前者的行为。
图a到d表明u中存在明显自相关,而图e则表明u不存在系统 模式,这也是无自相关假设的几何解释。
自相关的模式
(4)数据处理 在数据的处理过程中也会导致自相关的产生。比如在从月度 数据获得季度数据的过程中。
二、自相关的后果
自相关会产生以下后果: 1.最小二乘估计量仍然是线性和无偏估计量。 2.但最小二乘估计量不再是有效的。 3.OLS估计量的方差是有偏的,因此通常所用的t检验和F检 验是不可靠的。 ˆ 4.计算得到的误差方差 σ 2 = RSS / d . f . ,是真实误差方差的 有偏估计量。 5.通常计算的预测方差和标准误也是无效的。
ρ 统计理论表明,尽管对小样本而言,ˆ 是真实ρ 的有偏估计量,但是随 着样本容量的增加,这个偏差会逐渐消失。
谢谢大家!!!!
1 2 3 简言之, ≤ d 0
ˆ ρ =-1(完全负相关)
d值
d=4 d=2 d=0
ˆ ρ =0 (无自相关) ˆ ρ =1 (完全正相关)
≤4
根据以上讨论可以看出:如果计算的d值接近于零,则表明存在着正 的自相关;如果接近于4,则表明存在着负的自相关;d值越接近于2, 则说明越倾向于无自相关。 德宾-沃森检验的步骤如下: (1)进行OLS估计得到残差 (2)根据式(2)计算d值 (3)根据样本容量及解释变量的个数,从D-W表中查到临界的 d L和dU 。 (4)按照下表中给出的规则进行判定。
针对以上例子,讨论两种对自相关进行检验的方法。 1.图形法
即通过对OLS残差的直观观察来判断误差项中是否存在自相关。以上例为 例,将残差对时间作图,如下: 回 归 方 程 ( ) 的 残 差 图 一
从上图可以看出,残差并不是随机分布,而是呈现出明显 的变动模式。为了进一步确认我们的判断,做 ei 对 ei −1 的图形,结果如下:
上图表明存在着正的自相关:大多数残差都分布在第一象限 和第三象限。 2.德宾-沃森d检验 假设: H 0 : ρ = 0 ut 不存在自相关 H1 : ρ ≠ 0 ut 存在自相关 德宾-沃森d统计量定义为:
d =
∑
n
2
t=2
( e t − e t −1 )
∑
n
其中,ρ 为如下一阶自回归的自回归系数
t
− ρ X
t −1
) + vt
(8 )
由于式中的残差项 vt 满足标准的OLS假定,所以变换后的模 型无序列相关,如果把式(8)写成
Y
* t
= B
* 1
+ B
2
X
* t
+ v
t
那么对上式采用OLS法,得到的估计量具有BLUE性质。对变 换后的模型使用OLS得到的估计量称为广义最小二乘(GLS)估 计量。 可以预期,在一般情况下 ρ 是未知的,所以不能根据以上讨 论直接运用广义最小二乘法,而必须对 ρ 进行估计。一般有 三种方法。 1.直接令 ρ =1 2.从德宾-沃森d统计量中估计 ρ
结论
如果
正自相关 无法判断 无自相关 无法判断 负自相关
0 < d < dL d L ≤ d ≤ dU dU < d < 4 − dU 4 − dU ≤ d ≤ 4 − d L 4 − dL < d < 4
德宾-沃森d检验的判定规则
比如工资与生产率一例。d=0.2136。根据D-W表,对于 d n=45,k=1,在5%显著性水平下,L = 1.475 和 dU = 1.566 。由于0.2136远低于1.475,所以得到结论,在工资-生 产率回归方程中的残差存在正的自相关。
当ρ不知道时,如何估计 ρ
根据对德宾-沃森检验的讨论可知,
ˆ d ≈ 2 (1 − ρ )
变换后得到:
ρˆ ≈ 1 −
d 2
3.从OLS残差中估计 ρ 回归一阶自回归过程: u t = ρ u t −1 + v t
ˆ ρ 可以作为 ρ 的估计量。
0 ≤ ρ ≤1
由于 u 无法直接观察得到,因此可以用相应的残差 e 代替, 并进行如下回归: ˆ e t = ρ e t −1 + v t
2
X
t
+ u
t
(1 )
利用下表数据回归结果如下:
真实工资生产率 = 29.5749 + 0.7005 × 所有工人的小时产出
se= (1.4605) (0.0171) t= (20.2496) (40.9181) r = 0.97W统计量
美国商业部门真实工资指数和劳动生产率