自相关2
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自相关的最简单模式为:
ut = ρut-1 + Vt,
t=1,2,…,n.
其中ρ称为自相关系数(-1≤ρ≤1),这 种扰动项的自相关称为一阶自相关,即扰 动项仅与其前一期的值有关。我们有: ρ>0 正自相关
ρ<0 ρ=0
负自相关 无自相关
在一阶自相关模式中,假定Vt具有以下性质: E(Vt) = 0 , E(Vt² = σ 2 = 常数, ) E(ViVj)=0, i≠j, Vt服从正态分布。 在计量经济学中,具备上述性质的量称为白噪 声(White noise),表示为 Vt= White noise
自相关意味着 Cov(ui , uj) = E(uiuj) ≠0, 回顾协方差的含义?
i≠j
COV(X,Y)=E[(X-E(X))(Y-E(Y))]。 协方差是描述X和Y相关程度的量,在 同一量纲之下有一定的作用,但同样 的两个量采用不同的量纲使它们的协 方差在数值上表现出很大的差异。
自相关的一般形式
三、自相关的检验
基本思路: 自相关检验方法有多种,但基本思 路相同:首先,采用OLS估计模型,以 求得随机扰动项的估计量残差ei
然后,通过分析残差的相关性, 以判断随机误差项是否具有自相关。
1.图示检验法 2. 杜宾—瓦尔森检验法
up
1.图示检验法
(1)绘制et,et-1的散点图。如果大部分落 在第I、III象限,表明e存在正的序列相关; 如果大部分落在第II、IV象限,表明e存在 负的序列相关。
第一节 第二节 第三节 第四节 小结
什么是自相关 自相关的后果 自相关的检验 自相关的补救
一、自相关概念
对于模型
Yi=1+2X2i+3X3i+…+kXki+i i=1,2, …,n
如果对于不同的样本点,随机误 差项之间不再是不相关的,而是存在 某种相关性,则认为出现了自相关 (Serial Correlation)。
Yt Yt Yt 1 * X t X t X t 1
*
广义差分变换 广义差分模型
Yt b1 (1 ) b2 X vt
* * t
满足经典假设
怎样估计?
2.随机误差项相关系数的估计( 未知)
应用广义差分法,必须已知随机误差 项的相关系数
1, 2, … , L 。 实际上,人们并不知道它们的具体数 值,所以必须首先对它们进行估计。
et et
. . .. .. .. .. . .... ... .... ... ... ..
et-1
et-1
课后习题6.1
误差项存在正序列相关
up
2. 杜宾—瓦尔森检验法
D-W检验是杜宾(J.Durbin)和瓦尔森 (G.S. Watson)于1951年提出的一种检验 序列自相关的方法。该方法的假定条件是: (1)解释变量X非随机; (2)随机误差项i为一阶自回归形式: i=i-1+Vi
例如绝对收入假设下居民总消费函数模型:
Ct=1+2Yt+t
t=1,2,…,n
由于消费习惯的影响被包含在随机误差 项中,则可能出现自相关(往往是正相 关 )。
再比如一个工厂的产量,由于某种外部偶 然因素的影响(如某种原材料的供应出了 问题),该厂某周产量低于正常水平,那 么,随后的一周或几周中,由于这种影响 的存在或延续,产量也很可能低于正常水 平(即扰动项为负)。 不难看出,观测的周期越长,这种延期影 响的严重性就越小,因此,年度数据比起 季度数据来,序列相关成为一个问题可能 性要小。
又如:如果真实的边际成本回归模型应为: Yt= 1+2Xt+3Xt2+t 其中:Y=边际成本,X=产出。 但建模时设立了如下模型: Yt= 1+2Xt+vt 因此,由于vt= 2Xt2+t, ,包含了产出的平 方对随机项的系统性影响,随机项也呈现自 相关。
图形
造成扰动项自相关的原因还有:数 据处理与加工、蛛网现象等。
•GENR Y1=Y-0.737286Y(-1)
•GENR X1=X-0.737286X(-1) LS Y1 C X1
up
n 35, k 1, DW 2.115464 取 0.05,d L 1.402, dU 1.519, dU d 4 dU =2.481,无序列相关
up
四. 序列自相关的修正
1. 广义差分法
广义差分法是将原模型变换为 满足OLS法的差分模型,再进行OLS估 计。
up
Yt b1 b2 X t t
滞后一期并乘以
t t 1 vtFra bibliotekYt 1 b1 b2 X t 1 t 1
两式相减
Yt Yt 1 b1 (1 ) b2 ( X t X t 1 ) vt
应含而未含变量的情形
例如,如果真实的回归方程形式为,
Yt 1 2 X 2t 3 X 3t 4 X 4t ut
其中,解释变量表示牛肉需求量,解释变 量分别为牛肉价格、消费者收入和猪肉价 格。 但是在作回归时用的是, Yt 1 2 X 2t 3 X 3t vt vt 4 X 4t ut 那么,随机扰动项就会出现系统性模式, 从而造成自相关。
蛛网现象 是微观经济学中研究商品市场运 行规律用的一个名词,它表示某种商品的供 给量受前一期价格影响而表现出来的某种规 律性,即呈蛛网状收敛或发散于供需的均衡 点。由于规律性的作用,使得所用回归模型 的误差项不再是随机的了,而产生了某种自 相关。
三、自相关的后果
up
当一个线性回归模型的随机误差项存在自 相关时,就违背了线性回归方程的古典假定, 如果仍然用普通最小二乘法估计参数,将会 产生严重后果。 1.最小二乘估计量存在偏差 2.最小二乘估计量仍然是线性和无偏的,不具 有最小方差性。 3.T检验不再可靠
up
(2)由DW-d统计量中估计
利用D W 统计量d 2(1 )求出 = -d / 2, 1
然后再用前面所讲的广义差分法对模型进行估计。
适用于大样本
例题 6.1
d=0.523428
1 d / 2 1 0.523428 / 2 0.737286
思 考
DW检验的局限性主要有哪些?
DW检验的局限性
1.DW检验有一个无法确定的区域,一旦DW值落在 这个区域内就无法判断。这时,只能增大样本容 量或其它方法。 2.不适合于随机项具有高阶序列相关及其它形式 (如非线性等)的检验。 3.对于滞后因变量作为解释变量的模型,该检验 失效。 4.不适用于联立方程组中各方程的自相关检验。
2(1 )
Up
该统计量的分布与出现在给定样 本中的X值有复杂的关系,因此其精确 的分布很难得到。
但是,他们成功地导出了临界值的 下限dL和上限dU ,且这些上下限只与 样本的容量n和解释变量的个数k’有关, 而与解释变量X的取值无关。
D.W检验步骤: (1)计算DW值 (2)给定,由n和k’的大小查DW分 布表,得临界值dL和dU (3)比较、判断
例题6.1
d=0.5234。从D - W表中可以看到,对于 n= 36,k’= 1,在5%的显著水平下: dL= 1.411和dU= 1.525。由于0.5234远 低于下临界值1.411,根据判定规则,我 们可以得出结论:在进口支出回归方程的 残差中存在着正的自相关。根据图形检验 我们可以得出同样的结论。
2 2 in1 (ei ) 2 in1 (ei ) 2 2in 2 ei ei 1 e1 en in1ei2 2 2 2in 2 ei ei 1 e1 en 2 n 2 n 2 i 1ei i 1ei 2 2 e1 en 2 2 n 2 i 1ei
* X 1t X 1t X 1t 1
...... X
* kt
X kt X kt 1
* * 1t * kt
对模型Yt 1 X k X et 进行OLS估计即可
注意:使用一阶差分法时不含截距项
EVIEWS操作
LS D(Y) D(X)
习题 6.1
n 36, k 1, DW 0.523428 取 0.05,d L 1.411, dU 1.525, dw d L,存在正序列相关
同样,因变量观测值之间如果 存在相关性,则随机扰动项之间也 就存在相关性。
Yi X i ui
可得到
cov( i , Yj ) cov( i , u j ) Y u
2.模型设定的偏误
所谓模型设定偏误(Specification error)是指所设定的模型“不正确”。 主要表现在模型中丢掉了重要的解释变 量或模型函数形式有偏误。
简单的方法 (1)一阶差分法 (2)由DW统计量中估计
复杂的方法
(1)科克伦-奥科特(CochraneOrcutt)迭代法 (2) 杜宾(durbin)两步法
up
(1)根据事前信息或经验来估计
广泛采用=1,即一阶差分法
这个假定对许多时序数据成立 误差项之间是完全相关
若 1,则 Yt * Yt Yt 1
估计方程为
Y1 = -3.686640 + 0.948644*X1 (1-ρ)b0= -3.686640, b1=0.948644
结
论
原模型的估计方程为 Y = -9.428745 + 0.935866*X
直接估计所得方程 Y = -14.086522 + 0.948644*X
up
(3)迭代法
以一元线性模型为例:
若 0<D.W.<dL dL<D.W.<dU dU<D.W.<4-dU 存在正自相关 不能确定 无自相关
4-dU <D.W.<4- dL 4-dL <D.W.<4
不 能 确 定
不能确定 存在负自相关
不 能 确 定
正 相 关
无自相关
负 相 关
0
dL
dU
2
4-dU 4-dL
当D.W.值在2左右时,模型不存在 一阶自相关。注:在Eviews的回归 结果中已经自动计算出来了
d 1 2
0 d 2 4
ˆ 1 ˆ 0 ˆ 1
序列正相关 无序列自相关 序列负相关
d
n i 2
(ei ei 1 ) in1ei2
2
d 1 证明过程 2
in 2 (ei ) 2 in 2 (ei 1 ) 2 2in 2 ei ei 1 in1ei2
首先,采用OLS法估计原模型
Yi=1+2Xi+i
得到的的“近似估计值”et,并以之 作为观测值使用OLS法估计下式 ei=1ei-1+2ei-2+Lei-L+i
得到 1 , 2 ,, l ,作为随机误差项的相关系 数 , , , 的第一次估计值。
(3)回归模型中不应含有滞后应变量作 为解释变量,即不应出现下列形式: Yi=1+2X2i+kXki+Yi-1+i
(4)回归含有截距项
(5)数据序列无缺失项
针对原假设:H0: =0, 构如下造统计量:
D-W统计量
d (et et 1 ) 2
t 2 n
e
t 1
n
2
t
第六章
自相关
回顾6项基本假定
(1) E(ui)=0 (随机项均值为零) (2)解释变量间不相关(无多重共线性)
(3)Var(ui)=2
(同方差)
(4)Cov(ui, uj)=0(随机项无自相关) (5)Cov(X, ui)=0(随机项与X不相关) (6)随机扰动项服从正态分布。
一阶自回归 t t 1 vt
up
vt
为随机变量且满足经典假设
:自相关系数
>0,正自相关 <0,负自相关
大多数的经济模型仅探讨一阶自相关。
二、自相关产生的原因
1.经济变量固有的惯性
大多数经济时间数据都有一个明显的 特点:惯性,表现在时间序列不同时间的前 后关联上。
在时间序列数据的情况下,随机冲击 (扰动)的影响往往持续不止一个时期。 例如,地震、洪水、罢工或战争等将在 发生期的后续若干期中影响经济运行。