自相关
第10章 自相关
Yt 1 2 X2t 3 X3t 4 X4t ut
▪ 其中:被解释变量 Y — 牛肉需求量
解释变量
X2—牛肉价格 X3—消费者收入 X4—猪肉价格
▪ 若作回归时用的是:
Yt 1 2 X2t 3 X3t vt
vt 4 X4t ut
10
3、蛛网现象(Cobweb phenomenon)
▪ 如果仅存在
E(ui ui1 ) 0
▪ 称为一阶自相关。
i 1,2, n
14
一阶自回归模式AR(1) (autoregressive)
如果误差项存在一阶自相关:
ut ut1 t 1 1
✓ 其中~N(0,2), Cov(i,j) = 0,ij ✓ 记作ui服从AR(1)。
一阶序列相关系数
AR(1) 模型
ut ut1 t
Yt1 1 2 X 2(t1) k X k(t1) ut1
Yt Yt1 1(1 ) 2 ( X 2t X 2(t1) ) k ( X kt X k(t1) ) ut ut1
Y
* t
1(1
)
2 X *t
k X *t
t
uˆt uˆt1 t
▪ 这种数据加工方式减弱了每月数据的波动而引进数 据的匀滑性。
▪ 用季度数据描绘的图形要比用月度数据看来匀滑得 多。这种匀滑性本身可能使扰动项中出现自相关。
▪ 其他常用的数据加工方法:内插法或外推法。 ▪ 用这些方法加工得到的数据都会给数据带来原始
数据没有的系统性,这种系统性可能会造成误差自 相关。
44
自相关的修正(的估计)
用不同方法估计出的值会有差异 一、 =1:一阶差分方法 ▪ 假定误差项之间完全正相关 ▪ Yt = α+βXt+ut ut = ut-1 + t ▪ Yt - Yt-1= β (Xt-Xt-1)+t
第六章 自相关性
10
原因4-蛛网现象
蛛网现象是微观经济学中的一个概念。它表 示某种商品的供给量受前一期价格影响而表现出 来的某种规律性,即呈蛛网状收敛或发散于供需 的均衡点。
xt xs xt2 xs2
0
若为负自相关,则E(ut us) < 0,而回归模型中的解
释变量在不同时期通常也负相关,从而
kt ks
xt xs xt2 xs2
0
总之,一般有
ts
kt
ks
E
(
ut
us
)
0
19
从而
Var(ˆ2 )
2
xt2
即如果仍用不存在自相关时的OLS估计参数的方差, 将会低估存在自相关时参数估计值的真实方差。
13
自相关主要存在于时间序列数据中,但是在 横截面数据中,也可能会出现自相关,通常称其 为空间自相关(Spatial auto correlation)。
14Βιβλιοθήκη 第二节 自相关的后果一、对参数估计式统计特性的影响 (1)如果随机误差项具有自相关性,当我们
仍用OLS进行参数估计时,估计式仍具有线性性和 无偏性。
E(ˆ1) E(Y ˆ2 X ) E(Y ) XE(ˆ2 )
(1 2 X ) X2 1
推导也仅用到零均值假定,表明无偏性也成立。
17
(2)不再具有最小方差性。
Var(ˆ2 ) E[ˆ2 E(ˆ2 )]2 E(ˆ2 2 )2
E(kt ut
)2
自相关
6.3 自相关检验
(3)LM检验(亦称BG检验)法
(第2版169页) (第3版145页)
LM 统计量既可检验一阶自相关,也可检验高阶自相关。
LM 检验是通过一个辅助回归式完成的,具体步骤如下。
Yt = 0 + 1 X1 t + 2 X2 t + … + k Xk t + ut 考虑误差项为 n 阶自回归形式 ut = 1 ut-1 + … + n ut - n + vt H0: 1 = 2 = …= n = 0
T
T
ut 2
u
t
2 1
t2
t2
t2
t2
把这种关系代入上式得
T
ut ut1
ˆ t2
T
aˆ1
u
t
2 1
t2
对于总体参数有 = a1,回归模型中误差项 ut 的
一阶自回归形式可表示为, ut = ut-1 版教材第136页)
ˆ = 1 -(DW / 2)
2. 直接拟合估计。
6.6 案例分析
(第2版177页) (第3版152页)
例6.1 天津市城镇居民人均消费与人均可支配收入的关系。
改革开放以来,天津市城镇居民人均消费性支出(CONSUM),人 均可支配收入(INCOME)以及消费价格定基指数(PRICE)数据 (1978~2000年)见表6.2。现在研究人均消费与人均可支配收入的关系。
怎样查明自相关是由于略去重要解释变量引起的?一种方法 是用残差et对那些可能影响被解释变量,但又未单列入模型的 解释变量回归,并作显著性检验。
只有当以上两种引起自相关的原因都排除后,才能认为误差 项ut 真正存在自相关。
第5章自相关性-精品文档
2 1n 2 n1
2 2
Ω I
自相关性的分类
如果仅存在 E(t t-1)0
Y X u t 0 1 t t
t=1,2, …,n
称为一阶自相关,或自相关(autocorrelation) 自相关往往可写成如下一阶自回归形式:
二阶自相关系数
如果式中的随机误差项
v t 不是经典误差项,即
t-2
其中包含有 u t 的成份,如包含有 u t 2 则需将 u 显含在回归模型中,即为
u u + u + v t= 1 t 1 2 t 2 t
其中, 1 为一阶自相关系数, 2 为二阶自相关系
数,v t 是经典误差项。此式称为二阶自回归模式,
t
v
E ( u 0 。 vt 的假定,与 ut-s不相关,即 tv t s)
可得出如下结论:
Cov ( u ( u [( u v u t ,u t 1) E tu t 1) E t 1 t) t 1]
2 E ( u u v t 1 t 1 t) 2 E ( u ( u v t 1)E t 1 t) 2
一阶自回归形式的性质
对于一元线性回归模型:
Y = + X + u 1 2
假定随机误差项 u 存在一阶自相关:
u u v t = t1+ t
其中, u t 为现期随机误差, u t - 1 为前期随机误差。 是经典误差项,满足零均值 E(vt ) = 0 ,同方 2 ,无自相关 差 V E ( v v ) 0( t s ) a r(v )= t s t v
二、自相关性的原因
1、经济变量固有的惯性
自相关通俗理解
自相关通俗理解
一、什么是自相关
自相关(Autocorrelation),又称为自相关函数,是描述一个时间序列在不同时间滞后之间的相关性的统计量,它主要用于分析连续数据点之间的关系,以便弄清数据的结构、关系,以及建立数据模型,常用于统计分析中。
二、自相关的用例
自相关用于分析数据在不同时间点之间的相关性,常用于预测经济走势、电力系统的震荡、疾病模型预测,用于测验样本的随机性以及多元回归分析中的多重共线性检验等。
三、自相关的计算
自相关是由特定的自相关函数(ACF)和偏自相关函数(PACF)来计算的,自相关函数用于表示任意时刻与某一时刻之前的滞后时间的相关性,偏自相关函数用于表示任意时刻与某一时刻之前的滞后时间之间的非线性相关性。
四、自相关的应用
1. 用于预测:自相关技术可以用来预测未来趋势、潜在的变化点。
通过分析不同时间点之间的自相关性,可以推断出未来发展的方向,给出未来的预测结果,为企业决策提供参考依据。
2. 用于模型建立:自相关技术可以用来研究不同时间点之间的联系,分析数据的结构和关系,建立有效的模型,以确保模型能够更好地拟合和预测数据。
3. 用于风险控制:自相关技术可以用来识别时间序列可能存在的超出正态分布以外的特殊变异,从而可以避免风险,提高企业的财务效益。
自相关——精选推荐
第六章 自相关一、什么是自相关及其来源 二、自相关的后果三、自相关的检验 四、自相关的修正五、应用实例6.1自相关的概念及其来源例如:研究中国工业总产值指数(Y )和国有企业工业总产值指数(X )的关系,利用1977年至1997年的历史资料,运用OLS 方法得到如下模型。
2ˆ0.0568 1.0628(37.8666)(0.3502)(0.0015)(3.0348)0.32650.37679.2099t t Y X t R DW F =+====给定显著性水平a=0.05,自由度为19,查t 分布表得0.025(19) 2.093t =。
以模型的计算结果t=3.0348,且0.025(19)t t >,表明t X 对t Y 的影响比较显著,但可决系数并不理想。
这种情况下,随机扰动项之间有可能存在序列自相关。
一、自相关的概念自相关(auto correlation )又称序列相关(serial correlation ),是指总体回归模型的随机误差项i u 之间存在的相关关系。
更一般的,自相关是指某一随机变量在时间上与其滞后项之间的相关。
经典回归模型中,曾假定随机误差项无自相关,即i u 在不同观测点之间是不相关的。
(,)(,)0()i j i j Cov u u E u u i j ==≠如果该假设不成立,就称i u 与j u 存在自相关,即不同观测点上的误差项彼此相关。
二、自相关产生的原因 1)经济系统的惯性。
自相关现象大多出现在时间序列数据中,其本期值往往受滞后值影响,突出特征就是惯性和低灵敏度。
例如:居民总消费函数模型01(1,2,,)t t tC Y u t n ββ=++=总消费受收入(t Y )的影响,事实上消费也受消费习惯的影响。
把消费习惯并列随机扰动项中,就可能出现序列相关性。
2)经济行为的滞后性例如,基础设施的建设需要一定的建设周期,那么产出效益的发挥有一定滞后时间。
第六章 自相关
其中, , 为误差项,且满足所有经典假定,即 满足下列条件:
(1)零期望 ;
(2)同方差 常数;
(3)无序列相关 ( );
(4)与 不相关
则称为 为一阶线性自相关,也称 为一阶自回归。
3.在 满足一阶自回归的形式下,关于 的特点
常数
可见当 时,且 = + ,即在 满足一阶自回归的形式时, 满足零期望假定,满足同方差假定,但不满足 的无自相关的假定。
其次,Durbin和Watson根据样本容量 ,解释变量的个数 ,显著水平 ,确定统
计量 的上限临界值 和下限临界值 。这样,对于原假定 ,确定判断一阶自回归的
区域:
当 时,表明存在一阶正相关,且相关程度随着 接近0而逐渐增强;
当 或 时,表明不能确定存在自相关,此时D-W检验失效;
当 时,表明不存在一阶自相关;
另一种,可以绘制 与时间 的二维坐标图,如图(c),(d)所示,图(c)为循环型。 不是频繁改变符号,而是连续几个正值之后跟着几个负值,表明存在正相关。图(d)为锯齿型。 随时间变化逐次改变符号,说明存在负相关。
二、D-W检验
D-W检验是J.Durbin G.S.Watson于1951年提出的,是检验序列相关常用的方法。
第二节自相关的后果
一、存在自相关时OLS估计的性质
1. , 仍然为线性估计量。
2. , 仍是 , 的无偏估计。
3.参数估计值不再是方差最小的。
二、自相关性的后果
1.参数OLS估计的方差增大。
2.参数的显著性 检验失效。
3.区间估计和预测精度下降。
第三节自相关的检验
一、图示法
一般有两种方法:一种,计算 与 ,然后绘制 与 的坐标图,若 与 的图形存在系统反映,则可以判断随机项 可能存在自相关,如图6.2所示,近似认为图(a)为正相关,图(b)为负相关。
第五讲 自相关
第五讲、自相关1、自相关的概念:古典线性回归中假设扰动项u i中不存在自相关,即E(u i u j)=0, i≠j这表明任一观察值的扰动项不受其他观察值的扰动项的影响。
但是如果存在E(u i u j) ≠0, i≠j表明存在自相关问题。
自相关通常与时间序列数据有关,但截面数据中也可能产生自相关的问题(空间相关),例如,某一家庭消费支出的增加可能影响不愿比别人逊色的另一家庭消费支出的影响。
图a-d表明扰动项u存在可辨别的模式(可能存在自相关),而图e则表明不存在系统模式(可能不存在自相关)。
2、导致自相关的因素:(1)在涉及时间序列数据的回归方程中,大多数经济时间序列数据的一个显著特征是“惯性”或“延迟性”。
如GDP、就业、货币供给等时间序列都呈现周期性,连续的观察值之间很可能存在相互依赖或是相关的。
(2)模型设定错误:应该包括在模型中的重要变量未包括进模型(过低设定)或模型选择了错误的函数形式,这时残差会呈现出系统模式。
(3)蛛网现象:即解释变量是时间滞后变量,即具有时间滞后效应。
如农产品供给模型中价格对供给的影响存在蛛网现象(滞后效应)。
这种情况下的扰动项不是随机的。
(4)数据加工:在实证研究中,通常原数据是要经过加工的。
例如季度数据的时间序列回归中,数据通常是由月度数据按季相加再平均得到,而这种“平滑”过程的本身可能导致扰动项的系统模式,从而产生自相关。
3、自相关的后果:(1)虽然最小二乘估计仍然是线性和无偏的,但不是有效的,即最小二乘估计量(OLS)不是最优线性无偏估计量(BLUE)。
(2)OLS估计量的方差是有偏的,计算OLS估计量的方差或标准差的公式可能严重低估真实的方差或标准差,从而导致常用的t检验和F检验是不可靠的。
(3)通常计算的R2也是不可靠的。
4、自相关的诊断自相关的诊断存在异方差诊断中的类似问题,即ui是无法观察的,而且也不知道其产生机制:我们通过OLS估计,仅仅得到的是ei,通过对ei的讨论来“了解”自相关是否存在。
计量经济学-第12章 自相关
但我们拟合了以下模型:
边际成本 i
1
2
产出 i
vi
于是有:
vi
产出2
3
i
ui
(12.1.4) (12.1.5)
由于函数形式的错误使用,残差将反映出自相关性质
蛛网现象(Cobweb phenomenon)
供给对价格的反应要滞后一个时期
供给 t
1
价格
2
t 1
ut
(12.1.6)
t期产量太多,则t期价格下降,从而t+1期产量减少
滞后效应
在消费支出对收入的时间序列回归中,当期消费还 会受到前期消费水平的影响:
消费 t
1
2收入t
3消费t1
ut
(12.1.7)
这种带有因变量的滞后值的回归也叫自回归“编造”
从月度数据计算得出季度数据,会减小波动,引进 匀滑作用,使扰动项出现系统性模式
并获得具有BLUE性质的估计量
— —这种方法即GLS
未知
一次差分法:因为 落在-1到+1之间,
当 = +1时,广义差分方程(12.6.5)便化为一阶差
分方程:
或:
Yt Yt1 2 ( X t X t1 ) (ut ut1 )
2 ( X t X t1 ) t
xt2
xt2
n
xt2
t 1
n
xt2
t 1
n t 1
xt2
对照:没有自相关情形:
(12.2.5) (12.2.6)
var( 2 )
7.自相关
(3) ( 4)
Econometrics 2014
一、 已知
一、当已知
* 将 (3)改为:Yt * 1* 2 X t* t
(5)
ˆ *和 ˆ* 可以用OLS估计,得到系数估计值 : 1 2 从而得到(1)的系数估计值: ˆ* ˆ 1 ; ˆ ˆ* 1 2 2 1 这种估计方法称为 广义差分法
t 2 n t t 1
n
t 1
2 ˆ t
)
ˆ 定义
ˆ ˆ
t 2 n t t 1
n
t 1
2 ˆ t
为样本的一阶自相关系数,作为的估计量。
Econometrics 2014
§4 自相关的检验
ˆ) 则又,d 2(1 1 1, 所以, 0d 4
Econometrics 2014
5、一阶自回归AR(1)扰动项的特性
1 2 var( ) n1 3 3
Econometrics 2014
1
n 1
7.2 自相关的来源
Econometrics 2014
一、惯性
大多数时间序列都有一 个明显的特点,就是它 的惯性。 众所周知,GNP、价格指数、生产、就 业和失业等时间 序列都呈现循环。相继 的观测值可能是相互依 赖的。 由cov(a bX , c dY ) bd cov(X , Y ) 又Yi X i ui 可知cov( Yi , Y j ) cov(ui , u j ) 因变量观测值之间若存 在相关性,则随机扰动 项之间也就 存在相关性。
06- 自相关性.
3、DW检验的缺陷
我们当然期望有一张能够给出相应的 n 、 k 和 α 值下各 种DW临界值的表(就象t检验,F检验一样),使得我们可以 按常规假设检验那样根据临界值作出判断。 DW统计量的分布依赖于解释变量的具体观测值。因此不 象t、F检验那样,有一张能够给出DW临界值的表。为解决这 一问题,德宾和沃森证明, DW 统计量的真实分布位于两个 极限分布之间,这两个分布分别称为下分布和上分布。 德宾和沃森据此导出了一个下界dL和一个上界du来检验自 相关,dL和du仅依赖于的数目n、解释变量k,以及显著性水 平α ,而不依赖于解释变量所取的值。 无结论区的存在是DW法的最大缺陷。
一个观测值。具体补法为:
(3、广义差分变换同样可以推广应用到多元线性回归模型
中。
(4、广义差分变换还可以推广到高阶自相关的模型中。 (5、如果广义变换后,模型还存在自相关性,可以继续使 用广义差分变换,直到自相关性消除为止。
25
2018/12/15
5.4.2、自相关系数的估计 1、直接ρ =1。注意广义变换后的模型是没有常数项的(截 距项)
29
2018/12/15
年份 1989 1990 1991 1992 1993
国内生产总值 GDP 16992.3 18667.8 21781.5 26923.5 35333.9
进口总额 IM 2199.9 2574.3 3398.7 4443.3 5986.2
年份 1998 1999 2000 2001 2002
2018/12/15
Durbin两步估计法
27
2018/12/15
28
2018/12/15
5.5
案例分析——中国商品进口模型
对进口国来说,其经济发展水平决定商品进口情况。根据我
第六章 自相关性
原因4-蛛网现象
蛛网现象是微观经济学中的一个概念。它表 示某种商品的供给量受前一期价格影响而表现出 来的某种规律性,即呈蛛网状收敛或发散于供需 的均衡点。 许多农产品的供给呈现为蛛网现象,供给对 价格的反应要滞后一段时间,因为供给需要经过 一定的时间才能实现。如果本期的价格低于上一 期的价格,农民就会减少本期的生产量。如此则 形成蛛网现象。
2 2 t 2 t ts
k t2 E ( ut2 ) 2 k t k s E ( ut us )
本章讨论四个问题:
●什么是自相关 ●自相关的后果 ●自相关的检验 ●自相关性的补救
1
第一节
什么是自相关
一、自相关的概念
由于自相关性较多地表现在时间序列中,所以 考虑模型: Yt 1 2 X 2t k X kt ut 如果随机误差项的各期值之间存在相关关系,即
Cov( ut , us ) E[ut E( ut )][us E( us )] E( ut us ) 0 ( t s)
Cov( ut , ut 1 ) Var( ut ) Var( ut 1 )
当r<0时,则ut与ut-1为负自相关;当r>0时,正自 相关;当r 0时,不相关。
一阶自相关可表示为 ut rut 1 v t
其中vt为满足古典假定的误差项。
3
一阶自相关 ut rut 1 v t 也称一阶自回归形式的自相关。 设 ut ut 1 vt , 则 ut ut 1 ut21 ut 1v t , 于是 E ( ut ut 1 ) E ( u ) E ( ut 1v t ) E ( u )
8
原因3-数据处理造成的相关
因为某些原因需对缺陷或缺失数据进行了 修整和内插处理,在这样的数据序列中可能产 生自相关。 例如,将月度数据调整为季度数据,由于 采用了加合处理,修匀了月度数据的波动,使 季度数据具有平滑性,这种平滑性产生自相关。 对缺失的历史资料,采用特定统计方法进行内 插处理,使得数据前后期相关,产生了自相关。
第六章自相关
ρ k xt xt + k 的符号难以断定,用 的符号难以断定, ∑∑
t =1 k =1
σ u2
xi2 ∑
也可能高估OLS估计 估计 也可能高估
量的真实方差,但对OLS估计量方差的估计也是有偏的。 量的真实方差,但对 估计量方差的估计也是有偏的。 估计量方差的估计也是有偏的
真实方差 :
2σ u2 ˆ Var ( β 2 ) = +[ 2 xt xt2 ∑ ∑
3 2
=⋯
ut = ρ ut −1 + ε t = ∑ ρ k ε t −k 一般关系: 一般关系:
k =0 ∞
期望
E (ut ) = ∑ ρ k E (ε t −k ) = 0
k =0
∞
方差
σ = Var (ut ) = Var (∑ ρ ε t − k ) =∑ ρ 2 kVar (ε t − k )
i≠ j 2 2 i
ˆ Var ( β 2 ) =
xi2 E (ui2 ) ∑ (∑ x )
2 2 i
=
σ2
xi2 ∑
在异方差但无自相关 异方差但无自相关时 异方差但无自相关
[ E (u ) = σ , E (ui u j ) = 0]
2 i 2 i
ˆ Var ( β 2 ) =
xi2 E (ui2 ) ∑ (∑ x )
2 u k t =0 t =0
∞
∞
σ ε2 = σ ε2 (1 + ρ 2 + ρ 4 + ⋯) = 1− ρ 2
证明) 协方差(P162证明 证明 k = 1时 类推可得
σ ε2 2 Cov (ut , ut −1 ) = ρ (σ ε2 + ρ 2σ ε2 + ρ 4σ ε2 + ⋯) = ρ = ρσ u 1− ρ2
自相关
2、德宾(Durbin)两步法
Yt 0 1X t ut , ut ut1 t
第一步,先对模型进行广义差分变换
Yt Yt1 (1 )0 1 ( X t X t1 ) ut ut1 (1)
Yt (1 )0 Yt1 1 X t 1 X t1 ut ut1 (2)
(1) 回归模型中不管有多少个X变量或多少个Y的滞后变 量,计算h只需要考虑滞后Yt-1系数估计的方差。
(2)nVar(b)如果超过1,不能用h统计量进行检验;
(3)由于h检验是针对大样本的,把它用在小样本上不能 认为是十分合理的。
四、消除自相关和估计模型
如果经检验确认模型的残差项存在自相关,就要根据 产生自相关的原因采用相应的补救措施。对于真正的自相 关,采用方法:
对模型(2)进行OLS估计得 的估计值。
第二步,利用 对模型(1)进行OLS 估计,得到β的估计
值。或对原模型进行GLS变换,消除自相关。
3、GLS变换
Yt X t ut , ut ut1 t
1 0 0 0
1 2
0
0
0
E(ut u t-1) E(ut u t1)
r0
E(ut
ut)
2 u
r1 E(u t u t-1) E(u t u t1)
r2 E(u t u t-2 ) E(u t u t2 )
rs E(u t u t-s ) E(u t u ts )
(2) 自相关系数
2、自相关的后果
1)自相关存在的情况下,估计量的实际方差Var(b)一般会 变大;自相关存在却未加以考虑,得到的估计量的方差一
自相关
t=2 n
et2 ∑
t =1
n
et2 + ∑et2-1 - 2∑et et -1 ∑ DW =
t =2 t =2 t =2 n 2 t
n
n
n
(由∑ et2 ≈
t =2
n
et2-1 ≈ ∑
t =2
n
et2) ∑
t =1
n
∑e
t =1
∑ et et -1 ≈ 2 1- t =2n 2 ∑ et t =1 =( -ρ) 21 ˆ
广义差分法是一种借助于差分变换对估计进行修正的 理论方法,在具体是现实时通常借助科克伦-奥克特( 理论方法,在具体是现实时通常借助科克伦-奥克特( 科克伦 Cochrane-Orcutt)迭代法。 - )迭代法。 在 Eview软件包下 , 采用科克伦 奥科特 ( Cochrane软件包下, 奥科特( 软件包下 采用科克伦-奥科特 Orcutt) 迭代法实现广义差分估计十分简单 , 只需在进 ) 迭代法实现广义差分估计十分简单, 行普通最小二乘估计时,在解释变量中引入 在解释变量中引入AR(1) 、 行普通最小二乘估计时 在解释变量中引入 ( AR(2)、…,即可。 ( ,即可。
4、数据的处理
在实际经济问题中,有些数据是通过已知数据 在实际经济问题中, 生成的。 生成的。 因此,新生成的数据与原数据间就有了内在的 因此, 联系,表现出序列相关性。 联系,表现出序列相关性。 例如:季度数据来自月度数据的简单平均, 例如:季度数据来自月度数据的简单平均,这 来自月度数据的简单平均 种平均的计算减弱了每月数据的波动性, 种平均的计算减弱了每月数据的波动性,从而使 随机干扰项出现序列相关。 随机干扰项出现序列相关。 还有就是两个时间点之间的“插值” 还有就是两个时间点之间的“插值”技术往往 导致随机项的序列相关性。 导致随机项的序列相关性。
第八章 自相关课件
2、用 对原模型进行差分变换得:
Yt * = Yt p Yt-1 Xt * = Xt pXt-1
得 Yt * = ao + b1 Xt * + Vt 用OLS法来求得参数估计值 a^o 和 b^1
b^o = a^o / (1 p^ )
此外求得估计值还有其它方法:
第五节 广义最小二乘法
1 、当模型存在自相关和异方差时, OLS参数 估计值的优良性质将不存在。
第四节 案例:中国商品进口模型
经济理论指出, 商品进口主要由进口国的经 济发展水平,以及商品进口价格指数与国内价格 指数对比因素决定的。
由于无法取得中国商品进口价格指数,我们 主要研究中国商品进口与国内生产总值的关系。
(下表)。
1. 通过OLS法建立如下中国商品进口方程:
(2.32) (20.12)
取 =5% ,DW>du=1.66(样本容量:22)
表明:广义差分模型已不存在序列相关性。 可以验证: 仅采用1阶广义差分,变换后的模
型仍存在1阶自相关性;
采用3阶广义差分,变换后的模型不再有自相 关性,但AR[3]的系数的t值不显著。
表明: 存在正自相关;但ět-3的参数不显著,说 明不存在3阶序列相关性。
3、运用广义差分法进行自相关的处理
(1)采用杜宾两步法估计p 第一步,估计模型
(1.76) (6.64) (- 1.76)
(5.88) (-5. 19)
第二步,作差分变换:
(5.30)
则M*关于GDP* 的OLS估计结果为:
{ }ii 1 因此随机项方差不全相同, 2、随机项存在自相关
矩阵 的非主对角线元素不全为 0,即
2 i
2
{ }ij
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)杜宾(durbin)两步法 该方法仍是先估计1,2,,l,再对差分模型 进行估计。
第一步,变换差分模型为下列形式:
ˆ1 ˆ l ) 1 ( X i ˆ1 X i1 ˆ l X il ) i Yi 1Yi1 l Yil 0 (1
不能确定 存在负自相关
不 能 确 定
正 相 关
负 相 关
0
dL
dU
2
4-dU 4-dL
当D.W.值在2左右时,模型不存在一阶自相关。 注:在Eviews的回归结果中已经自动计算出来了
证明: 展开D.W.统计量:
D.W . ~ e
t 2 n 2 t n n
~ e
t 2 n
2 t 1
~ e ~ e t t 1 t
~ e ~ e ~ e t 1 t 1 2 t 2 t
……
如果存在某一种函数形式,使得方程显著成 立,则说明原模型存在自相关。
回归检验法的优点是:(1)能够确定序列 相关的形式,(2)适用于任何类型自相关问题 的检验。
3. 杜宾—瓦尔森(Durbin-Watson)检验法 D-W 检 验 是 杜 宾 ( J.Durbin ) 和 瓦 尔 森 (G.S. Watson)于1951年提出的一种检验序列自相 关的方法。该方法的假定条件是:
其他检验也是如此。
3. 模型的预测失效 区间预测与参数估计量的方差有关,在方差有 偏误的情况下,使得预测估计不准确,预测精度降低。 所以,当模型出现自相关时,它的预测功能失 效。
三、自相关的检验
基本思路: 自相关检验方法有多种,但基本思路相同:
首先, 采用 OLS 法估计模型, 以求得随机误差项的
该模型为广义差分模型,不存在序列相关 问题。可进行OLS估计。 注意:
广义差分法就是广义最小二乘法(GLS)的 一种,但是此法却损失了部分样本观测值。 如:一阶自相关的情况下,广义差分是估计
Yt Yt 1 0 (1 ) 1 ( X1t X1t 1) k ( X kt X kt 1) t
2
t
这里,
~e ~ e t t 1
t 2 n
~2 e t
t 1
n
~e ~ e t t 1
t 2
n
~2 e t
t 2
n
为一阶自回归模型 i=i-1+i 的参数估计。 如果存在完全一阶正相关,即=1,则 D.W. 0 完全一阶负相关,即= -1, 则 D.W. 4 完全不相关, 即=0,则 D.W.2
E ( i ) 0 ,
var( i ) 2 ,
cov( i , i s ) 0
s0
由于自相关经常出现在以时间序列为样本 的模型中,因此,本节将用下标t代表i。
二、实际经济问题中的自相关
1.经济变量固有的惯性
大多数经济时间数据都有一个明显的特点:惯 性,表现在时间序列不同时间的前后关联上。 例如,绝对收入假设下居民总消费函数模型:
3. 数据的“编造” 在实际经济问题中,有些数据是通过已知 数据生成的。 因此,新生成的数据与原数据间就有了内在 的联系,表现出自相关。
例如:季度数据来自月度数据的简单平均,这种 平均的计算减弱了每月数据的波动性,从而使随机干 扰项出现序列相关。
还有就是两个时间点之间的“内插”技术往 往导致随机项的自相关。
如果对于不同的样本点,随机误差项之间 不再是不相关的,而是存在某种相关性,则认 为出现了自相关(Serial Correlation)。
在其他假设仍成立的条件下,序列相关即意味着 E ( i j ) 0
如果仅存在
E(i i+1)0 i=1,2, …,n
称为一阶自相关,或自相关(autocorrelation)
(2)从OLS残差中估计:
et et 1 vt
^
较为复杂的方法
科克伦-奥科特(Cochrane-Orcutt)迭代
法
杜宾(durbin)两步法
(1)科克伦-奥科特迭代法 以一元线性模型为例:
首先,采用OLS法估计原模型
Yi=0+1Xi+i
得到的的“近似估计值”,并以之作为观 测值使用OLS法估计下式
(3)
2.
随机误差项相关系数的估计( 未知)
应用广义最小二乘法或广义差分法,必须已知随机误差项的 相关系数1, 2, … , L 。 实际上,人们并不知道它们的具体数值,所以必须首先对它 们进行估计。
简单的方法有:(1)由DW-d统计量中估计
利用D W统计量d 2(1 )求出 = 1 -d / 2, 然后再用前面所讲的广 义差分法对模型进行估 计。
Yt=0+1X1t+ 2X2t + 3X3t + t
但在模型设定中做了下述回归: Yt=0+1X1t+ 1X2t + vt 因此, vt=3X3t + t,如果X3确实影响Y,则出 现自相关。
又如:如果真实的边际成本回归模型应为: Yt= 0+1Xt+2Xt2+t 其中:Y=边际成本,X=产出。 但建模时设立了如下模型: Yt= 0+1Xt+vt 因此,由于vt= 2Xt2+t, ,包含了产出的平方对随 机项的系统性影响,随机项也呈现自相关。
二、自相关的后果
计量经济学模型一旦出现自相关,如果仍采 用OLS法估计模型参数,会产生下列不良后果:
1.
参数估计量非有效
因为,在有效性证明中利用了同方差性和互 相独立性条件。 而且,在大样本情况下,参数估计量虽然具 有一致性,但仍然不具有渐近有效性。
2. 变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参 数方差正确估计基础之上的,这只有当随机误差 项具有同方差性和互相独立性时才能成立。
i=1i-1+2i-2+Li-L+i
1 , 2 , , l ,作为随机误差项的相关系 得到 数 , , , 的第一次估计值。
1 2 l
ˆ1 ˆ l ) 1 ( X i ˆ1 X i1 ˆ l X il ) i Yi 1Yi1 l Yil 0 (1
Ct=0+1Yt+t t=1,2,…,n
由于消费习惯的影响被包含在随机误差项中,则 可能出现自相关(往往是正相关 )。
2.模型设定的偏误 所谓模型设定偏误(Specification error)是指 所设定的模型“不正确”。主要表现在模型中丢掉 了重要的解释变量或模型函数形式有偏误。 例如,本来应该估计的模型为
自相关往往可写成如下形式:
i=i-1+i
-1<<1
其中:被称为自协方差系数(coefficient of autocovariance )或 一阶自相关系数 ( first-order coefficient of autocorrelation)
i是满足以下标准OLS假定的随机干扰项:
Yi 0 1 X 1i 2 X 2i k X ki i
存在
t 1t 1 2t 2 l t l t
可以将原模型变换为:
Yt 1Yt 1 lYt l 0 (1 1 l ) 1( X1t 1X1t 1 l X1t l ) k ( Xkt 1Xkt1 l Xktl ) t
i 1 l ,2 l ,, n
进行OLS估计,得各Yj(j=i-1, i-2, …,i-l)前的系数 1,2, , l的估计值
ˆ1 , ˆ 2 ,, ˆ l 代入差分模型 第二步,将估计的
Yi 1Yi 1 l Yi l 0 (1 1 l ) 1 ( X i 1 X i 1 l X i l ) i
i 1 l ,2 l ,, n
求出i新的“近拟估计值”, 并以之作为样本 观测值,再次估计:
i=1i-1+2i-2+Li-L+i
类似地,可进行第三次、第四次迭代。 关于迭代的次数,可根据具体的问题来 定。 一般是事先给出一个精度,当相邻两次 1,2, ,L的估计值之差小于这一精度时, 迭代终止。 实践中,有时只要迭代两次,就可得到 较满意的结果。两次迭代过程也被称为科克 伦—奥科特两步法。
(1)解释变量X非随机;
(2)随机误差项i为一阶自回归形式: i=i-1+i
(3)回归模型中不应含有滞后应变量作为解释 变量,即不应出现下列形式: Yi=0+1X1i+kXki+Yi-1+i
(4)回归含有截距项
D.W. 统计量: 针对原假设:H0: =0, 构如下造统计量:
t 2,3,, n
即运用了GLS法,但第一次观测值被排除了。 不过可以使用课本上P254的Prais-Winsten变 换得到第一次观测值。
Y 1 2 (Y1 )
* 1
X 1 2 ( X1 )
* 1
广义差分法( 已知)的具体运用
以双变量回归模型和 AR(1)为例。 Yt 1 2 X t ut ut ut 1 t Yt 1 2 X t ut (1)
D.W检验步骤: (1)计算DW值 (2)给定,由n和k的大小查DW分布表,得临 界值dL和dU (3)比较、判断 若 0<D.W.<dL dL<D.W.<dU dU <D.W.<4-dU 存在正自相关 不能确定 无自相关
4-dU <D.W.<4- dL 4-dL <D.W.<4