第10章-自相关:如果误差项相关会有什么后果
自相关(中级计量经济学总结(四川大学,杨可扬)
自相关(wooldridge, Gujarati 12章)一,自相关的概念自相关:当误差项协方差不为零。
即,对某些观察值 i 和 m,cov(,)0 i m u u ¹ ,i m¹ 二,自相关的后果自相关不影响无偏性和一致性。
但是自相关使得 OLS 不再是 BLUE, 且 t,F 检验不再有效。
只要满足平稳性和弱相依性的条件则 Rsquared 仍然是一致的。
三,自相关的侦测1, 图表法用残差对时间做图,或者用残差对滞后一期的残差作图。
2, 直接对r 进行 t 检验假设自变量是严格外生的,且扰动项是 AR(1),即,1 u u e t t tr =+ - 那么我们只需要对 r 进行一个 t 检验就可以了。
备择假设既可以是 0 : 0 H r ¹ 也可以是, 0: 0 H r > 当然在这里还可以采用异方差稳健的统计量。
我们还可以放松严格外生的假定,并且可以考虑高阶的自回归:01111 ˆ ˆ ˆ t t k tk t k t ku x x u u b b b r r -- =+++++ …… ……+我们只需要对残差的K 个滞后值进行 F 检验就可以了。
注意: tk x 中可以包括因变量的滞后 值。
其实利用上面回归所得 Rsquared 我们还可以进行 BG 检验:2ˆ() u LM n q R =- 2q LM c : 对于 LM 统计量的计算各种书上略有差异。
上面的公式来自 Wooldridge ,其中 q 表示残差滞后的期数。
在 EVIEWS5 中所用的 LM 统计量的计算是 2 ˆ uLM nR = 。
3,DW 检验有上面的检验之后,已经不用再搞什么 DW 检验了。
但是它仍然被广泛使用,所以有必要 了解。
重点要注意它的局限性。
(1) 1ˆ ˆ 2(1)1 2d d r r »-» 也即, - r ££££ 既然-11,那么0d 4。
自相关性
2、一般会低估OLS估计的标准误差 (P87)
3、t检验的可靠性降低
• 若模型存在自相关性,直接用 ^ OLS估计,参数的真实 方差可能被低估。 b
t
ˆ (b) S
^
• 参数的显著性检验,由于分母变小,所以 t 统计量不 正常的偏大,模型的显著性检验失效(检验将不能给 出有效的结论)
4、降低模型的预测精度
3、数据处理造成的相关
• 在实际经济问题中,有些数据是通过已知数据生 成的。 因此,新生成的数据与原数据间就有了内 在的联系,表现出序列相关性。
• 例如:季度数据来自月度数据的简单平均,这种 平均的计算减弱了每月数据的波动性,从而使随 机干扰项出现序列相关。
4、蛛网现象
蛛网现象是微观经济学中的一个概念。它表 示某种商品的供给量受前一期价格影响而表现出 来的某种规律性,即呈蛛网状收敛或发散于供需 的均衡点。 如下例(呈蛛网状收敛)
1、经济系统的惯性
• 大多数经济时间数据都有一个明显的特点:惯性, 表现在时间序列不同时间的前后关联上 • 例如:当年的投资规模与前一年、甚至前几年的 投资有关; • 当期家庭消费水平在很大程度受上期消费 水平的制约; • 企业第 i 期的产量与第 i-1、i-2、--- 期 密切相关。
2、经济活动的滞后效应
ui ui 1 i
其中:
为随机误差项的自相关 系数 ( 1)
自协方差系数
ε是满足以下标准的OLS假定的随机干扰项:
Var ( i )
2
Cov( i , i j ) 0
i j
Байду номын сангаас
自相关产生的原因
自 相 关 产 生 的 原 因
经济系统的惯性
第10讲 如果误差项相关会有什么结果
如何估计rou
从durbin – watson d中估计rou
d ˆ ρ ≈ 1− 2
Copyright © 2008 by Sun Jianjun. All Rights Reserved.
Institute of Securities and Investments of Hainan University
由于式1414本质上是一个非线性回归模型因为同时要对beta与rou进行估计故eviews采用marquardtnonlinearleastsquaresalgorithm方法估计书上的所有补救方法均是求出rou的估计后的ols方法
Institute of Securities and Investments of Hainan University
Copyright © 2008 by Sun Jianjun. All Rights Reserved.
Institute of Securities and Investments of Hainan University
Yt − ρYt −1 = β1 (1 − ρ ) + β 2 ( X t − ρ X t −1 ) + υt
Copyright © 2008 by Sun Jianjun. All Rights Reserved.
Institute of Securities and Investments of Hainan University
讲授完毕 欢迎指正 谢谢
海南大学 证券与投资研究所 孙建军 博士
Copyright © 2008 by Sun Jianjun. All Rights Reserved.
Durbin-Watson d statistic
第十一章自相关
第四种检验方法 拉格朗日乘数检验
拉格朗日乘数(Lagrange multiplier)检验克服 了DW检验的缺陷,适合于高阶序列相关以及模型 中存在滞后被解释变量的情形。
它是由布劳殊(Breusch)与戈弗雷(Godfrey) 于1978年提出的,也被称为GB检验。
对于模型
Yt 0 1 X1 t 2 X 2t L k X kt u t
RESID(-1)
1-25
Residuals et against et-1 from the regression
第二种检验方法 回归检验法
以 e~uˆtt 为被解释变量,以各种可能的相关量,诸如以uˆte~1t1 、
uˆe~tt22 、ue~ˆt22 等为解释变量,建立各种方程:
ue~ˆt e~uˆtt11 t uˆe~t 1e~uˆtt11 uˆ2e~tt22 t
第十一章 自相关:误差项相关的后果
chapter eleven
Autocorrelation: What Happens if Error Terms are Correlated?
Yu Zhen
The Economic School of Jilin University
回顾
异方差问题
OLS估计非有效
1-36
大于1时无效
D.W.扩展:Durbin h统计量
一个例子:Durbin h统计量的运用 当前消费Ct 是季度滞后消费Ct-1和当前可支配收
入YDt的函数,T=147,最小二乘估计方程如下(括 号内是标准误差):
2.79大于显著性水平为0.05的正态分布的临 1-37 界值,拒绝原假设,存在序列相关性!
1-16
实际经济问题中序列相关性存在的原因
自相关如果误差项相关会有什么结果
1、图示法
2-13
德宾—沃森检验法的假设条件(或前提条件) 回归模型包括截距项 解释变量X为非随机变量 模型只能检验一阶自相关 解释变量中不能包含被解释变量的滞后值
2-14
10.3 自相关的诊断
德宾-沃森 d 检验
德宾-沃森检验步骤如下: 进行OLS回归并获得残差 ei。
2-18
10.5 如2-20
10.5 如何估计
2-21
10.6 校正OLS标准误的大样本方法:纽维—韦斯 特(Newey-West)方法
利用Eviews6,得到回归结果如下:
2-22
10.6 校正OLS标准误的大样本方法:纽维—韦斯 特(Newey-West)方法
第10章 自相关:如果误差项相关
会有什么结果?
McGraw-Hill/Irwin
Copyright © 2006 The McGraw-Hill Companies, Inc. All rights reserved.
自相关的含义
按时间或空间排列(时间序列或截面数据) 的观察值之间的相关关系——本教科书
利用Eviews6,得到回归结果如下:
2-23
2-5
2、模型设定的偏误
所谓模型设定偏误(Specification error)是指 所设定的模型“不正确”。主要表现在模型中丢掉 了重要的解释变量或模型函数形式有偏误。
例如,本来应该估计的模型为
Yt=0+1X1t+ 2X2t + 3X3t + Ut
但在模型设定中做了下述回归:
Yt=0+1X1t+ 1X2t + vt 因此, vt=3X3t + t,如果X3确实影响Y,则出 现序列相关。
第十章 自相关
7
二、自相关产生的原因
自 相 关 产 生 的 原 因
经济系统的惯性 经济活动的滞后效应 数据处理造成的相关 蛛网现象
模型设定偏误
蛛网现象
蛛网现象是微观经济学中的 一个概念。它表示某种商品 的供给量受前一期价格影响 而表现出来的某种规律性, 即呈蛛网状收敛或发散于供 需的均衡点。 许多农产品的供给呈现为 蛛网现象,如果 t 时期 的价格 Pt 低于上一期的 价格 P t -1 ,农民就会减少 时期 t 1 的生产量。如 此则形成蛛网现象。
系数。
5
ut = 1ut -1 + 2ut -2 + vt
称为二阶自相关,
1 为一阶自相关系数
2 为二阶自相关系数
此式称为二阶自回归模式,记为 AR(2)
6
一般地,若模型为:
ut = 1ut -1 + 2ut -2 +...+ mut-m + vt
则称此式为 m阶自回归模式,记为 AR(m)。 在经济计量分析中,通常采用一阶自回归形式, 即假定自回归形式为一阶自回归 AR(1)。
●只适用于有常数项的回归模型并且解释变量中不能含
滞后的被解释变量
三、h检验法
德宾(Durbin)于1970年提出用h检验来 检验含滞后因变量的模型的自相关情况 模型:Yt = B1 + B2 X t + B3Yt 1 +ut 原假设:H0 : 0
检验统计量: h n 1 nVar ( B3 ) (近似)
h N (0,1)
第四节 自相关的补救
一、广义差分法
1、对于 已知的情形 采用广义差分法解决。
假定是一阶自相关,即 ut u t 1 vt
计量经济学重点
计量经济学重点第一章经济计量学的特征及研究范围1、经济计量学的定义P11经济计量学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学;2经济计量学运用数理统计学分析经济数据,对构建于数理经济学基础之上的模型进行实证分析,并得出数值结果;2、学习计量经济学的目的计量经济学与其它学科的区别P1-P21计量经济学与经济理论经济理论:提出的命题和假说,多以定性描述为主计量经济学:依据观测或试验,对大多数经济理论给出经验解释,进行数值估计2计量经济学与数理经济学数理经济学:主要是用数学形式或方程或模型描述经济理论计量经济学:采用数理经济学家提出的数学模型,把这些数学模型转换成可以用于经验验证的形式3计量经济学与经济统计学经济统计学:涉及经济数据的收集、处理、绘图、制表计量经济学:运用数据验证结论3、进行经济计量的分析步骤P2-P31建立一个理论假说2收集数据3设定数学模型4设立统计或经济计量模型5估计经济计量模型参数6核查模型的适用性:模型设定检验7检验源自模型的假设8利用模型进行预测4、用于实证分析的三类数据P3-P41时间序列数据:按时间跨度收集到的定性数据、定量数据;2截面数据:一个或多个变量在某一时点上的数据集合;3合并数据:包括时间序列数据和截面数据;一类特殊的合并数据—面板数据纵向数据、微观面板数据:同一个横截面单位的跨期调查数据第二章线性回归的基本思想:双变量模型1、回归分析P18用于研究一个变量称为被解释变量或应变量与另一个或多个变量称为解释变量或自变量之间的关系2、回归分析的目的P18-P191根据自变量的取值,估计应变量的均值;2检验建立在经济理论基础上的假设;3根据样本外自变量的取值,预测应变量的均值;4可同时进行上述各项分析;3、总体回归函数PRFP19-P221概念:反映了被解释变量的均值同一个或多个解释变量之间的关系2表达式:①确定/非随机总体回归函数:EY|Xi =B1+B2XiB1:截距;B2:斜率从总体上表明了单个Y同解释变量和随机干扰项之间的关系②随机/统计总体回归函数:Yi =B1+B2Xi+μiμi:随机扰动项随机误差项、噪声B1+B2Xi:系统/确定性部分μi:非系统/随机部分4、随机误差项P221定义:代表了与被解释变量Y有关但未被纳入模型变量的影响;每一个随机误差项对于Y的影响是非常小的,且是随机的;随机误差项的均值为02性质①误差项代表了未纳入模型变量的影响;②反映人类行为的内在随机性;③代表了度量误差;④反映了模型的次要因素,使得模型描述尽可能简单;5、样本回归函数P22-P251概念:是总体回归函数的近似2表达式①确定/非随机样本回归函数:i =b1+b2Xib 1:截距;b2:斜率②随机/统计样本回归函数:Yi =b1+b2Xi+eiei :残差项残差,ei= Yi-iB1+B2Xi:系统/确定性部分μ:非系统/随机部分6、条件期望与非条件期望1EY|Xi条件期望:在解释变量X给定条件下Y的条件期望,可以通过X给定条件下的条件概率分布得到;2非条件期望:在不考虑其他随机变量取值情况时,某个随机变量的期望值;它可以通过该随机变量的非条件分布或边缘分布得到;6、线性回归模型回归参数为线性B的模型7、回归系数/回归参数线性回归模型中的B参数8、回归系数的估计量bs说明了如何通过样本数据来估计回归系数Bs,计算出的回归系数的值称为样本回归估计值9、随机总体回归函数与随机样本回归函数的关系1随机样本回归函数:从所抽取样本的角度说明了被解释变量Yi 同解释变量Xi及残差ei之间的关系;2随机总体回归函数:从总体的角度说明了被解释变量Yi 同解释变量Xi及随机误差项μ之间的关系;10、关于线性回归的两种解释P25-P261变量线性:应变量的条件均值是自变量的线性函数此解释下的非线性回归:EY= B1+B2Xi2;EY= B1+B2×1/Xi2参数线性:应变量的条件均值是参数B的线性函数此解释下的非线性回归:EY= B1+B22Xi线性回归在教材中指的是参数线性的回归11、多元线性回归的表达式P261确定/非随机总体回归函数:EX=B1+B2X2i+B3X3i+B4X4i2随机/统计总体回归函数:Yi = B1+B2X2i+B3X3i+B4X4i+μi12、最小二乘法OLS法P26-P281最小二乘以残差被解释变量的实际值同拟合值之间的差平方和最小的原则对回归模型中的系数进行估计的方法;1表达式2重要性质①用OLS法得出的样本回归线经过样本均值点:;②残差的均值总为0;③对残值与解释变量的积求和,其值为0,即这两个变量不相关:④对残差与i 估计的Yi的积求和,其值为0,即第三章双变量模型:假设检验1、古典线性回归模型的假设P41-P441回归模型是参数线性的,但不一定是变量线性的:Yi =B1+B2Xi+μi2解释变量X与扰动误差项μ不相关3给定Xi ,扰动项的期望或均值为0:Eμ| Xi=04μi 的方差为常数,或同方差:varμi=σ2每个Y值以相同的方差分布在其均值周围,非这种情况为异方差5无自相关假定:两个误差项之间不相关,covμi ,μj=06回归模型是正确假定的:实证分析的模型不存在设定偏差或设定误差2、OLS估计量运用最小二乘法计算出的总体回归参数的估计量3、普通最小二乘估计量的方差与标准误P44-P461的方差与标准误①方差:②标准误:2的方差与标准误①方差:②标准差:3的计算公式n-2为自由度:独立观察值的个数4:回归标准误,常用于度量估计回归线的拟合优度,值越小,Y的回归值越接近根据回归模型得到的估计值4、OLS估计量的性质P461b1和b2是线性估计量:它们是随机变量Y的线性函数2b1和b2是无偏估计量:Eb1=B1,Eb2=B23Eσ^2=σ^2:误差方差的OLS估计量是无偏的4b 1和b 2是有效估计量:varb 1小于B 1的任意一个线性无偏估计量的方差,varb 2小于B 2的任意一个线性无偏估计量的方差 5、OLS 估计量的抽样分布或概率分布P47-P481新加的假设:在总体回归函数Yi=B 1+B 2X i +μi 中,误差项μi 服从均值为0,方差为σ^2的正态分布:μi ~N0,σ^2 2OLS 估计量服从的分布情况:b 1~NB 1,σ2b1 b 2~NB 2,σ2b26、假设检验P48-P53 1使用公式近似2方法①置信区间法②显着性检验法:对统计假设的检验过程 3几个相关检验①t 检验法:基于t 分布的统计假设检验过程 ②双边检验:备择假设是双边假设的检验 ③单边检验:备择假设是单边假设的检验 7、判定系数r 2P53-P56 1重要公式:TSS=ESS+RSS①总平方和TSS=:真实Y 值围绕其均值的总变异;②解释平方和ESS=:估计的Y值围绕其均值=的变异,也称为回归平方和由解释变量解释的部分③残差平方和RSS=:Y变异未被解释的部分2r2判定系数的定义:度量回归线的拟合程度回归模型对Y变异的解释比例/百分比3r2的性质①非负性②0≤r2≤14r2的计算公式5r的计算公式8、同方差性方差相同9、异方差性方差不同10、BLUE最佳线性无偏估计量,即该估计量是无偏估计量,且在所有的无偏估计量中方差最小11、统计显着拒绝零假设的简称第四章多元回归:估计与假设检验1、三变量线性回归模型EYi =B1+B2Xt+ B3X3tY i =B1+B2X2t+ B3X3t+μi2、偏回归系数B2,B3:1B2:在X3保持不变的情况下,X2单位变动引起Y均值EY的变动量2B3:在X2保持不变的情况下,X3单位变动引起Y均值EY的变动量3、多元线性回归模型的若干假定P73-P74 1回归模型是参数线性的,并且是正确设定的2X2,X3与扰动误差项μ不相关①X2,X3非随机:自动满足②X2,X3随机:必须独立同分布于误差项μ3误差项的期望或均值为0:Eμi=04同方差假定:varμi=σ25误差项μi ,μi无自相关:两个误差项之间不相关,covμi,μji≠j6解释变量X2和X3之间不存在完全共线性,即两个解释变量之间无严格的线性关系X2不能表示为另一变量X3的线性函数7随机误差μ服从均值为0,同方差为σ^2的正态分布:μi~N0,σ2 4、多重共线性问题1完全共线性:解释变量之间存在的精确的线性关系2完全多重共线性:解释变量之间存在着多个精确的线性关系5、多元回归函数的估计P74-P756、OLS估计量的方差与标准误P75-P761b1的方差与标准误2b1的方差与标准误3b3的方差与标准误7、多元判定系数P76-P778、多元回归的假设检验P78 方法类似于第三章9、检验联合假设P80-P811联合假设:H0:B2=B3=0H:R2=0多元回归的总体显着性检验2三变量回归模型的方差分析表2F分布公式10、F与R2之间的重要关系P82-P83 1关系式2R2形式的方差分析表11、设定误差P84会导致模型中遗漏相关变量12、校正判定系数P84-P851作用衡量了解释变量能解释的离差占被解释变量总离差的比例2公式3性质①如果k>1,则≤R2,即随着模型中解释变量个数的增加,校正判定系数越来越小于非校正判定系数②虽然未校正判定系数R2总为正,但校正判定系数可能为负13、受限最小二乘法P86-P871受限模型:B2=B3=02非受限模型:包含了所有相关变量3受限最小二乘法:对受限模型用OLS估计参数4非受限最小二乘法:对非受限模型用OLS估计参数5判定对模型施加限制是否有效的F分布公式14、显着性检验1单个多元回归系数的显着性检验①提出零假设和备择假设;②选择适当的显着性水平;③在零假设为真的情况下,计算t统计量;④将t统计量的绝对值|t|同相应自由度和显着性水平下的临界值相比较;⑤如果t统计量大于临界值,则拒绝零假设;该步骤中务必要使用合适的单边或双边检验;2所有偏斜率系数的显着性检验①零假设:H0:B2=B3=...=Bk=0,即所有的偏回归系数均为0;②备择假设:至少一个偏回归系数不为0;③运用方差分析和F检验;④如果F统计量的值大于相应显着性水平下的临界值,拒绝零假设,否则接受;⑤3在1和2中可以不事先选择好显着性水平,只需得到相应统计量的p值,如果p 值足够小,我们就可以拒绝零假设;第五章回归模型的函数形式1、不同的函数形式P121模型形式斜率强性线性双对数对数—线性线性—对数倒数逆对数2、多元对数线性回归模型P104-P1073、线性趋势模型P1104、多项式回归模型P116-P1175、过原点的回归P1186、标准化变量的回归P120第六章虚拟变量回归模型1、虚拟变量P133-P134因变量受到一些定性变量的影响,这类定性变量称为虚拟变量,用D表示虚拟变量,虚拟变量的取值通常为0和12、虚拟变量陷阱P136引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多重共线,即通常说的虚拟变量陷阱3、虚拟变量回归模型的类型包含一个定量变量、一个定性变量的回归模型1只影响截距加法模型2只影响斜率乘法模型3同时影响截距与斜率混合模型4、交互效应P142:交互作用虚拟变量5、分类变量和定性变量这类变量的取值不是一般的数据数值变量或定量变量,它们通常代表所研究的对象是否具有的某种特征;6、方差分析模型ANOVA解释变量仅包含定型变量或虚拟变量的回归模型;7、协方差分析模型ANOCVA回归模型中的解释变量有些是线性的,有些是定量的;8、差别截距虚拟变量包含此变量的模型能够分辨被解释变量的均值在不同类别之间是否相同; 9、差别斜率虚拟变量包含此变量的模型能够分辨不同类别之间被解释变量均值变化率的变化范围第七章模型选择:标准与检验1、好的模型具有的性质P164-P1651简约性:模型应尽可能简单;2可识别性:每个参数只有一个估计值;3拟合优度:用模型中所包含的解释变量尽可能地解释应变量的变化;4理论一致性:构建模型时,必须有一定的理论基础;5预测能力:选择理论预测与实践吻合的模型;2、产生设定误差的原因1研究者对所研究问题的相关理论了解不深2研究者没有关注本领域前期的研究成果3研究者在研究中缺乏相关数据4数据测量时的误差3、设定误差的类型P1651遗漏相关变量:“过低拟合”模型P165-P168实际模型:估计模型:后果:①如果遗漏变量X3与模型中的变量X2相关,则a1和a2是有偏的;也就是说,其均值或期望值与真实值不一致;②a1和a2也是不一致的,即无论样本容量有多大,偏差也不会消失;③如果X2和X3不相关,则b32为零,即a2是无偏的,同时也是一致的;④根据两变量模型得到的误差方差是真实误差方差σ2的有偏估计量;⑤此外,通常估计的a2的方差是真实估计量方差的有偏估计量;即使等于零,这一方差仍然是有偏的;⑥通常的置信区间和假设检验过程不再可靠;置信区间将会变宽,因此可能会“更频繁地”接受零假设:系数的真实值为零;2包括不相关变量:“过度拟合”模型P168-169正确模型:错误模型:后果:①过度拟合模型的估计量是无偏的也是一致的;②从过度拟合方程得到的σ2的估计量是正确的;③建立在t检验和F检验基础上的标准的置信区间和假设检验仍然是有效的;④从过度拟合模型中估计的a是无效的——其方差比真实模型中估计的b的方差大;因此,建立在a的标准误上的置信区间比建立在b的标准误上的置信区间宽,尽管前者的假设检验是有效的;总之,从过度拟合模型中得到的OLS估计量是线性无偏估计量,但不是最优先性无偏估计量;3不正确的函数形式P170-171如果选了错误的函数形式,则估计的系数可能是真实系数的有偏估计量;4度量误差①应变量中度量误差对回归结果的影响i. OLS估计量是无偏的;ii. OLS估计量的方差也是无偏的;iii. 估计量的估计方差比没有度量误差时的大,因为应变量中的误差加入到了误差项中;②解释变量的度量误差对回归结果的影响i. OLS估计量是有偏的;ii. OLS估计量也是不一致的;③解决方法:如果解释变量中存在度量误差,建议使用工具变量或替代变量;4、设定误差的诊断1诊断非相关变量P172-P1742对遗漏变量和不正确函数形式的检验P174-P175①判定系数R2和校正后的R2;②估计的t值;③与先验预期相比,估计系数的符号;3在线性和对数线性模型之间选择:MWD检验P175-P176:线性模型:Y是X的线性函数①设定如下假设;HH:对数线性模型:lnY是X或lnX的线性函数1②估计线性模型,得到Y的估计值③估计线性对数模型,得到lnY的估计值④求⑤做Y对X和的回归,如果根据t检验的系数是统计显着的,则拒绝H0⑥求⑦做lnY对X或lnX和的回归,如果的系数是统计显着的,则拒绝H14回归误差设定检验:RESETP177-P178①根据模型估计出Y值;②把的高次幂,,等纳入模型以获取残差和之间的系统关系;由于上图表明残差和估计的Y值之间可能存在曲线关系,因而考虑如下模型③令从以上模型中得到的为,从前一个方程得到的为,然后利用如下F检验判别从以上方程中增加的是否是统计显着的;④如果在所选的显着水平下计算的F值是统计显着的,则认为原始模型是错误设定的;第八章多重共线性:解释变量相关会有什么后果1、完全多重共线性P183-P185回归模型的某个解释变量可以写成其他解释变量的线性组合;设X2可以写成其他某些解释变量的线性组合,即:X 2=a3X3+a4X4…+akXk至少有一个ai≠0,i= 2,3,…k称存在完全多重共线性2、高度多重共线性P185-P187X2与其他解释变量高度共线性,即可以近似写成其他解释变量的线性组合X 2=a3X3+a4X4…+akXk+i至少有一个ai ≠0,i= 2, 3,…k, vi是随机误差项;3、产生多重共线的原因1时间序列解释变量受同一因素影响经济发展、政治事件、偶然事件、时间趋势经济变量的共同趋势2模型设立:解释变量中含有当期和滞后变量4、多重共线性的理论后果P187-P188OLS估计量仍然是最优无偏估计量1在近似共线性的情形下,OLS估计量仍然是无偏的;2近似共线性并未破坏OLS估计量的最小方差性;3即使在总体回归方程中变量X之间不是线性相关的,但在某个样本中,X变量之间可能线性相关;5、多重共线性的实际后果P188-P1891OLS估计量的方差和标准误较大;2置信区间变宽;3t值不显着;4R2值较高;5OLS估计量及其标准误对数据的微小变化非常敏感6回归系数符号有误;7难以评估各个解释变量对回归平方和ESS或者R2的贡献6、多重共线性的诊断P189-P1921观察回归结果R2较高,F很大,但t值显着的不多;多重共线性的经典特征R2较高,F检验拒绝零假设,但各变量的t检验表明,没有或少有变量系数是统计显着的;2简单相关系数法解释变量两两高度相关;变量相关系数比如超过,则可能存在较为严重的共线性;这一标准并不总是可靠,相关系数较低时,也有可能存在共线性3检查偏相关系数不一定可行4判定系数法辅助回归某个解释变量对其余的解释变量进行回归如果判定系数很大,F检验显着,即X与其他解释变量存在多重共线i5方差膨胀因子7、多重共线性的补救P195-P1981从模型中删除引起共线性的变量①找出引起多重共线性的解释变量,将它排除出去最为简单的克服多重共线性问题的方法;②逐步回归法i. 逐步引入如果拟合优度变化显着—新引入的变量是一个独立解释变量;选择解释变量的原则:a. 调整的R2增加,每个∣t∣增加,则保留引入变量;b. 调整的R2下降,每个∣t∣变化不大,则删除引入变量;ii. 逐步剔除①排除变量时应该注意:i. 由实际经济分析确定变量的相对重要性,删除不太重要的变量;ii. 如果删除变量不当,会导致模型设定误差;2获取额外的数据或新的样本3重新考虑模型4先验信息5变量变换将原模型变换为差分模型可有效消除存在于原模型中的多重共线性一般,增量之间的线性关系远比总量之间的线性关系弱得多; 第九章异方差:如果误差方差不是常数会有什么后果1、异方差的定义随机误差项ui 的方差随着解释变量Xi的变化而变化,即:2、异方差的性质P205-P208OLS估计仍是线性无偏,但不具最小方差1线性性2无偏性3方差式1不具有最小方差,式2具有最小方差3、异方差性的后果P209-P210经典模型假定下,OLS估计量是最优线性无偏估计量BLUE;去掉同方差假定:1OLS估计量仍是线性的;2OLS估计量仍是无偏的;3OLS估计量不再具有最小方差性,即不再是最优有效估计量;4OLS估计量的方差通常是有偏的;5偏差的产生是由于,即不再是真实σ2的无偏估计量;6建立在t分布和F分布之上的置信区间和假设检验是不可靠的,如果沿用传统的检验方法,可能得出错误的结论;4、异方差的检验1图形检验P211-P212e2对一个或多个解释变量或Y的拟合值作图; 2帕克检验Park TestP212-P214假定误差方差与解释变量相关形式:步骤:①做OLS估计求平方,取对数②对ei③做辅助回归④检验零假设:B=023格莱泽检验Glejser TestP214假定误差方差与解释变量相关形式:步骤:①做OLS估计②对e求绝对值i③做辅助回归方程=0④检验零假设:B24怀特检验White TestP215-P216和交叉乘积呈线性关系假定误差方差与X、X2步骤:①OLS估计得残差②做辅助回归③检验统计量5、异方差的修正1加权最小二乘法WLSWeighted Least SquaresP217-P222①方差已知原模型:加权后的模型:误差项的方差为:1加权的权数:②方差未知成比例:i. 误差方差与Xi模型变换:ii. 误差方差与Xi2成比例:模型变换:2怀特异方差校正的标准误P222-P223①如果存在异方差,则对于通过OLS得到的估计量不能进行t检验和F检验;②怀特估计方法③大样本情形下回归标准差和回归系数的一致估计量,可以进行t检验和F检验;第十章自相关:如果误差项相关会有什么结果1、自相关的定义P233按时间或空间顺序排列的观察值之间存在的相关关系;2、自相关的性质P233-P2341若古典线性回归模型中误差项ui不存在自相关Covui,uj=Eui,uj=0,i≠j2若误差项之间存在着依赖关系—ui存在自相关Covui,uj=Eui,uj≠0,i≠j3、产生自相关的原因P235-P2361惯性2设定偏误①模型中遗漏了重要变量;②模型选择了错误的函数形式;i. 从不正确的模型中得到的残差会呈现自相关;ii. 检验是否由于模型设定错误而导致残差自相关的方法:3蛛网现象4数据的加工①在用到季度数据的时间序列回归中,这些数据通常来自于每月数据;这种数据加工方式减弱了每月数据的波动而引进数据的匀滑性;②用季度数据描绘的图形要比用月度数据看来匀滑得多;这种匀滑性本身可能使扰动项中出现自相关;③内插法或外推法:用这些方法加工得到的数据都会给数据带来原始数据没有的系统性,这种系统性可能会造成误差自相关;4、自相关的后果P236-P2371OLS估计得到的仍为线性、无偏估计;2OLS估计不再具有有效性;3OLS估计量的方差有偏:低估了估计量的标准差;4通常所用的t检验和F检验是不可靠的;5计算得到的误差方差是真实σ2的无偏估计量,并且很有可能低估了真实的σ2;6通常计算的R2不能测度真实的R27通常计算的预测方差和标准误也是无效的5、自相关的诊断1图形法—时序图P237-P239①误差u并不频繁地改变符号,而是几个正之后跟着几个负,几个负之后跟着t几个正,则呈正自相关;②扰动项的估计值呈循环型,而是相继若干个正的以后跟着几个负的,表明存在正自相关;③扰动项的估计值呈锯齿型一个正接一个负,随时间逐次改变符号,表明存在负自相关;2检验P239-P242①定义值d值近似1 =-1完全负相关d=42 =0无自相关d=23 =1完全正相关d=0②DW检验的判断准则6、自相关的修正ρ的估计主要方法1ρ=1:一阶差分方法P244假定误差项之间完全正相关 Y t = α+βX t +u tu t = u t-1+tY t - Y t-1= βX t -X t-1+t2从DW 统计量中估计ρP244-P245 3从OLS 残差e t 中估计Cochrane-OrcuttP245-P246①e t = e t-1+t②利用OLS 残差,得的估计量 ③迭代,得的收敛值。
古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-自相关:如果误差项相关会有什么结果(圣才出品
量对其滞后一期的回归。
(2)德宾-沃森 d 统计量的定义
n
( ) et − et−1 2
d = t=2 n
et 2
t =1
5 / 28
(10-3)
圣才电子书 十万种考研考证电子书、题库视频学习平台
即残差递差的平方和与残差平方和的比值。注意:在计算 d 统计量分子时,其样本容量
1 / 28
圣才电子书 十万种考研考证电子书、题库视频学习平台
图 10-1 自相关的模式 3.自相关产生的原因 (1)惯性 大多数经济时间序列的一个显著特征就是惯性或者说是迟滞性,即各经济变量的观测值 在时间前后存在着关联性。因此,在涉及时间序列数据的回归方程中,连续的观察值之间很 可能是互相依赖或是相关的。 (2)模型设定误差 不正确的模型设定是指本应纳入模型的重要变量未纳入模型或是模型选择了错误的函 数形式,如果发生这样的模型设定误差,得到的残差则会呈现出系统模式。一个简单的检验 方法是将遗漏变量纳入模型,判定残差是否仍然呈现系统模式。如果不存在系统模式,则序
可见,自相关的后果与异方差相似,也是严重的。因此,与异方差情形相同,在实际应 用中必须确定是否存在自相关问题。
三、自相关的诊断 1.图形法 与异方差情形相同,通过直接观察 OLS 残差 e 来判断误差项 u 中是否存在自相关。有 多种不同的残差图形的检验方法。 (1)残差 e 对时间的散点图 可以用残差对时间作图,如果随着时间的变化,残差呈现出某种有规律的趋势,则可能 存在着自相关。图 10-2 是回归的残差关于时间的时序图,从图可以看出:残差 e 并不是随 机分布的,而是呈现出明显的变动模式——开始是正的,接着变成负的,然后是正的,再然 后是负的,最后又是正的。图形展示了这样一种趋势:残差的递差之间正相关,表明序列存 在着正的自相关。
自相关——精选推荐
第六章 自相关一、什么是自相关及其来源 二、自相关的后果三、自相关的检验 四、自相关的修正五、应用实例6.1自相关的概念及其来源例如:研究中国工业总产值指数(Y )和国有企业工业总产值指数(X )的关系,利用1977年至1997年的历史资料,运用OLS 方法得到如下模型。
2ˆ0.0568 1.0628(37.8666)(0.3502)(0.0015)(3.0348)0.32650.37679.2099t t Y X t R DW F =+====给定显著性水平a=0.05,自由度为19,查t 分布表得0.025(19) 2.093t =。
以模型的计算结果t=3.0348,且0.025(19)t t >,表明t X 对t Y 的影响比较显著,但可决系数并不理想。
这种情况下,随机扰动项之间有可能存在序列自相关。
一、自相关的概念自相关(auto correlation )又称序列相关(serial correlation ),是指总体回归模型的随机误差项i u 之间存在的相关关系。
更一般的,自相关是指某一随机变量在时间上与其滞后项之间的相关。
经典回归模型中,曾假定随机误差项无自相关,即i u 在不同观测点之间是不相关的。
(,)(,)0()i j i j Cov u u E u u i j ==≠如果该假设不成立,就称i u 与j u 存在自相关,即不同观测点上的误差项彼此相关。
二、自相关产生的原因 1)经济系统的惯性。
自相关现象大多出现在时间序列数据中,其本期值往往受滞后值影响,突出特征就是惯性和低灵敏度。
例如:居民总消费函数模型01(1,2,,)t t tC Y u t n ββ=++=总消费受收入(t Y )的影响,事实上消费也受消费习惯的影响。
把消费习惯并列随机扰动项中,就可能出现序列相关性。
2)经济行为的滞后性例如,基础设施的建设需要一定的建设周期,那么产出效益的发挥有一定滞后时间。
第10章 线性回归模型的自相关问题
O dL
20
dU
4-dU -dL
4
安徽大学经济学院
计量经济学讲义
10.5 自相关的诊断-Durbin-Watson d检验法
Durbin-Watson d检验:判定规则 零假设 无正自相关 无正自相关 无正或负自相关 无负自相关 无负自相关 判断 拒绝 无法判断 接受 无法判断 拒绝 如果(条件) 如果(条件) 0<d<dL dL<=d<=dU dU<d<4-dU 4-dU<=d<=4-dL 4-dL<d<4
10.5 自相关的诊断-Durbin-Watson d检验法
d 统计量诊断自相关需要一定的假设条件,不是任意可用的: 1. 回归模型包括一个截距项。因此,d统计量无法判断通过原 点的回归模型的自相关问题。 2. 变量X是非随机变量,即在重复抽样中变量X的值是固定不 变的。 3. 扰动项ui的生成机制是:
+ u t −1
t −1
ρ Y t −1 = ρ B 1 + ρ B 2 X
+ ρ u t −1
Y t − ρ Y t −1 = B1 (1 − ρ ) + B 2 ( X t − ρ X t −1 ) + v t (10.11)
23
安徽大学经济学院
计量经济学讲义
10.6 自相关问题的解决-广义最小二乘法
4. 数据处理。在做季节因素的调整时,经常要做移动平均。 移动平均的处理可以消除季节波动的影响,但带来新的问 题则是产生了自相关。
3
安徽大学经济学院
计量经济学讲义
10.3 自相关产生的后果
1. 最小二乘估计量仍然是线性的和无偏的。 2. 最小二乘估计量不是有效的,即OLS估计量的方差不是最小 的,估计量不是最优线性无偏估计量(BLUE)。 3. OLS估计量的方差是有偏的。用来计算方差和OLS估计量标 准误的公式会严重的低估真实的方差和标准误,从而导致t值 变大,使得某个系数表面上显著不为零,但事实却相反。 4. t检验和F检验不是可信的。 5. 计算得到的误差方差σ2=RSS/d.f.(残差平方和/自由度) 是真实σ2的有偏估计量,并且很可能低估了真实的σ2。 6. 计算的R2也不能真实的反映实际R2。 7. 计算的预测方差和标准误差通常是无效的。
第10章习题参考答案
第十章误差项自相关与异方差习题参考答案1. 由于自相关和异方差都是对随机误差项球形假定cov(μ)=σμ2I的违背,因此对OLS回归的影响是基本相同。
具体而言,虽然随机误差项自相关不会影响OLSE的线性、无偏性和一致性,但是会导致OLSE不再具备有效性,并造成统计推断不可靠以及因变量的预测精度降低。
2.(1)错误。
自相关系数为1的准(广义)差分变换相当于一阶差分变换。
(2)错误。
当模型的误差项自相关时,OLS估计量是无偏的和无效的。
(3)正确。
当d L<DW<d U时,处于检验盲区,无法确定是否存在自相关。
(4)正确。
被排除的应该包含在模型中自变量带来的系统性误差被并入随机误差项中,此时系统误差的自相关性表现为误差项的自相关。
显著的LM统计量也意味着随机误差项在不同时期取值之间存在相关性。
因此,从回归模型中排除一个(或多个)应含的自变量可能导致LM统计量显著。
(5)错误。
两个模型有不同的因变量,不可以直接比较两个模型的拟合优度。
3.(1)样本容量T=21,自变量个数k=3,按照显著性水平0.05,查DW临界值表可知,d L=1.026,d U=1.669。
由于d=0.81< d L,所以存在一阶正自相关问题。
(2)样本容量T=15,自变量个数k=2,按照显著性水平0.05,查DW临界值表可知,d L=0.946,d U=1.543。
由于4-d L<d=3.48<4,所以存在一阶负自相关问题。
(3)样本容量T=30,自变量个数k=5,按照显著性水平0.05,查DW临界值表可知,d L=1.071,d U=1.883。
由于d L<d=1.56<d U,所以无法确定是否存在自相关问题。
(4)样本容量T=35,自变量个数k=4,按照显著性水平0.05,查DW临界值表可知,d L=1.222,d U =1.726。
由于4- d U<d=2.64<4-d L,所以无法确定是否存在自相关问题。
第10章-自相关:如果误差项相关会有什么后果
第10章 自相关:如果误差项相关会有什么后果本章主要讲授如下内容:10.1 自相关的性质 10.2 自相关的后果 10.3 自相关的诊断 10.4 自相关的补救措施10.1 自相关的性质1.定义对于模型:t kt k t t t X B X B X B B Y μ+++++= 33221如果随机误差项的各期值之间存在着相关关系,即0)(),cov(≠=j i j i E μμμμ,j i ≠,k j i ,,2,1, =这时,称随机误差项之间存在自相关(autocorrelation )或序列相关(serial correlation )。
最常见的类型是随机误差项之间存在一阶自相关,即0)(),cov(11≠=--t t t t E μμμμ或t t t νρμμ+=-1其中,ρ是μt 与μt-1的相关系数,νt 是满足经典假设的随机误差项。
自相关的一般形式可以表示成t p t p t t t νμρμρμρμ++++=--- 2211称之为p 阶自回归形式,或模型存在p 阶自相关。
2.判断由于我们无法观察到误差项μt ,只能通过残差项e t 来判断μt 的行为。
如果残差项e t 随时间呈现有规律的变化,则表示残差项e t 存在自相关。
否则,不存在自相关。
如图10-1所示。
3.类型主要有正的自相关和负的自相关两类,如图10-2所示。
4.自相关产生的原因(1)经济变量的惯性作用 如GDP 、就业、货币供给、价格指数等时间序列都呈现出周期性。
(2)经济行为的滞后性 如投资对其后若干年内经济的影响等。
(3)一些随机因素的干扰或影响 如战争、自然灾害、错误政策的后果、金融危机等随机因素,不仅对当期经济造成影响,而且对以后若干时期的经济产生影响,反映在模型中即容易形成随机误差序列的自相关。
(4)模型设定误差 如果模型中遗漏了重要的变量,或选择了不正确的函数形式,则得到的残差会出现自相关。
(5)数据的“编造” 在实证分析中,有些数据是通过已知数据生成的,如对原始数据进行内插或平滑处理等。
计量经济学第12章笔记
计量经济学第12章笔记第12章⾃相关:误差项相关会怎么样?⼀、⾃相关的性质0)(≠j i u u E (⾃相关与序列相关的区别,延特纳把⼀给定序列同它滞后若⼲期的序列的滞后相关称为⾃相关,⽽把不同时间序列之间的相关称为序列相关,本书中两个定义视为相同)注意:⾃相关不仅限于当期与过去误差项之间的关系,还包括当期与过去误差⽅差之间的关系⾃相关的原因:1.惯性:GDP 、价格指数、⽣产、就业等时间序列数据呈现出⼀定的周期性2.设定偏误:应含⽽未含的情形3.设定偏误:不准确的函数形式4.蛛⽹现象:供给对价格的反映要滞后⼀期5.滞后效应:t t ttu tion con incometion con +++=-1321sup sup βββ(⾃回归模型)6.数据的操作:数据变换(⼀阶差分形式)7.⾮平稳性⼆、⾃相关的后果在t t tu X Y ++=21ββ,假定tt t u u ερ+=-1(马尔科夫⼀阶⾃回归AR (1))0)(=t E ε,2)(εσε=t VAR ,0),cov(=+s t t εε,注意:具有以上性质的误差项t ε称为⽩噪⾳误差项221)var(ρσε-=t u ,221),cov(ρσρε-=+ss t t u u ,ss t tu ucor ρ=+),(,斜率系数2β的OLS估计量∑∑=22?ii ixy x β的⽅差为∑=222)?var(ix σβ,在AR (1)模式下]2221[)?var(21122221222∑∑∑∑∑∑---+++=tnn tt ttt ttARIxx x xx x xx x xρρρσβ⾃相关出现时的BLUE (最优线性⽆偏估计)C x x y y x x n t t t n t t t t t GLS +---=∑∑=-=--2212112)())((?ρρρβ,Dx x n t t t GLS +-=∑=-22122)(?var ρσβ出现⾃相关时使⽤OLS 的后果 1、考虑到⾃相关的OLS 估计量尽管OLS 估计量是线性⽆偏的,但为了构造置信区间并检验假设,要⽤GLS ⽽不是OLS 2、忽略⾃相关的OLS 估计(1)残差⽅差2?σ很可能低估了真实的2σ,结果⾼估了2R(2)即使没有低估,)?var(2β也可能低估了(⼀阶)⾃相关情形下的⽅差ARI)?var(2β,虽然ARI)?var(2β较GLS2varβ低效,因此通常的t 或F 检验都不再可靠三、⾃相关的侦查1、图解法(标准化残差对时间的散点图,即期残差与滞后残差的散点图)2、游程检验游程个数渐进服从正态分布,12)(21+=NN N R E ,1)1()2(2)var(22121+--=N N N N N N N R ,其中1N 为残差为正的总个数3、德宾-沃森d 检验∑∑==--=n t t n t t t uu ud 12221?)??(注意:(1)回归中含有截距项(2)解释变量X 是⾮随机的(3)⼲扰项t u 是按⼀阶⾃回归模式⽣成(4)t u 服从正态分布(5)不适合⾃回归模型(6)没有缺失数据 d 的值介于0到4之间,)?1(2)1(2?)??(122112221ρ-=-≈-=∑∑∑∑==-==-nt t nt t t n t t n t t t uu u uu ud 1、0:,0:10>=ρρH H ,若u d d <,则在α⽔平上拒绝0H ,即存在统计显著上的正相关 2、0:,0:10<=ρρH H ,若u d d <-4,则在α⽔平上拒绝0H ,即存在统计显著上的负相关 3、0:,0:10≠=ρρH H ,若ud d <-4或u d d<,则在α2⽔平上拒绝0H ,即存在统计显著上的正或负相关当样本容量很⼤时,)1,0(~)21(N d n -4、布罗施-⼽弗雷检验(BG 检验)允许⾮随机回归元,如回归⼦的滞后值;⾼阶⾃回归模式令在t t tu X Y ++=21ββ,假定t p t p t t t u u u u ερρρ++++=--- 1211该检验过程如下:(1)使⽤OLS 估计模型,得到残差记为t u ? 。
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(自相关:误差项相关会怎么样?)【圣才出品】
第 12 章 自相关:误差项相关会怎么样? 12.1 复习笔记
考点一:自相关问题癿性质 ★★★ 1.定义 自相关定义为“按时间(如在时间序列数据中)戒空间(如在横截面数据中)排序癿观 测序列各成员乊间癿相关”。若存在自相关,则用符号表示为:E(uiuj)≠0(i≠j)。 2.可能模式 自相关和无自相关癿一些可能模式,如图 12-1 所示。图 12-1(a)到图 12-1(d)中, 残差项随着时间发化表现出明显癿觃律性,本期癿残差和上期癿残差存在一定癿关联性。而 图 12-1(e)则没有明显癿关联,是非自相关模式。
4.自相关出现时癿 BLUE
利用双发量模型幵假定 AR(1)过程,可以证明 β2 癿 BLUE 估计量由下式给出:
ˆ2GLS
n t2
xt xt1
yt yt1 C
n t2
xt xt1
2
其中 C 是一校正因子,在实际中可以忽略。注意下标从 t=2 发到 t=n。从而斱差是:
var ˆ2GLS
2.德宾-沃森d 检验 (1)d 统计量癿一些基本假定 ①回弻含有截距项;
斱差不相关系数和跨度期数 s 相关。
斱程表明,在 AR(1)模式下,ut 癿斱差仍是同斱差癿,但 ut 丌仁不其过去一期癿值
相关,而丏不过去几期癿值也相关。若 ρ=1,上述斱差和协斱差都没有定义。若|ρ|<1,
斱程中给出癿 AR(1)过程是平稳癿,此时残差项癿均值和斱差丌发,协斱差癿值将随着
两个误差癿时间间隑越进而越小。
3.AR(1)模式癿估计结果
回到双发量回弻模型:Yt=β1+β2Xt+ut。在 AR(1)模式下,估计量癿斱差为:
var ˆ2 AR1
计量经济学题库(超完整版)及解答76025
四、简答题(每小题5分)1.简述计量经济学与经济学、统计学、数理统计学学科间的关系。
2.计量经济模型有哪些应用?3.简述建立与应用计量经济模型的主要步骤。
4.对计量经济模型的检验应从几个方面入手?5.计量经济学应用的数据是怎样进行分类的? 6.在计量经济模型中,为什么会存在随机误差项?7.古典线性回归模型的基本假定是什么? 8.总体回归模型与样本回归模型的区别与联系。
9.试述回归分析与相关分析的联系和区别。
10.在满足古典假定条件下,一元线性回归模型的普通最小二乘估计量有哪些统计性质? 11.简述BLUE 的含义。
12.对于多元线性回归模型,为什么在进行了总体显著性F 检验之后,还要对每个回归系数进行是否为0的t 检验?13.给定二元回归模型:01122t t t t y b b x b x u =+++,请叙述模型的古典假定。
14.在多元线性回归分析中,为什么用修正的决定系数衡量估计模型对样本观测值的拟合优度?15.修正的决定系数2R 及其作用。
16.常见的非线性回归模型有几种情况?17.观察下列方程并判断其变量是否呈线性,系数是否呈线性,或都是或都不是。
①t t t u x b b y ++=310 ②t t t u x b b y ++=log 10③ t t t u x b b y ++=log log 10 ④t t t u x b b y +=)/(1018. 观察下列方程并判断其变量是否呈线性,系数是否呈线性,或都是或都不是。
①t t t u x b b y ++=log 10 ②t t t u x b b b y ++=)(210③ t t t u x b b y +=)/(10 ④t b t t u x b y +-+=)1(11019.什么是异方差性?试举例说明经济现象中的异方差性。
20.产生异方差性的原因及异方差性对模型的OLS 估计有何影响。
21.检验异方差性的方法有哪些?22.异方差性的解决方法有哪些? 23.什么是加权最小二乘法?它的基本思想是什么?24.样本分段法(即戈德菲尔特——匡特检验)检验异方差性的基本原理及其使用条件。
自相关
t=2 n
et2 ∑
t =1
n
et2 + ∑et2-1 - 2∑et et -1 ∑ DW =
t =2 t =2 t =2 n 2 t
n
n
n
(由∑ et2 ≈
t =2
n
et2-1 ≈ ∑
t =2
n
et2) ∑
t =1
n
∑e
t =1
∑ et et -1 ≈ 2 1- t =2n 2 ∑ et t =1 =( -ρ) 21 ˆ
广义差分法是一种借助于差分变换对估计进行修正的 理论方法,在具体是现实时通常借助科克伦-奥克特( 理论方法,在具体是现实时通常借助科克伦-奥克特( 科克伦 Cochrane-Orcutt)迭代法。 - )迭代法。 在 Eview软件包下 , 采用科克伦 奥科特 ( Cochrane软件包下, 奥科特( 软件包下 采用科克伦-奥科特 Orcutt) 迭代法实现广义差分估计十分简单 , 只需在进 ) 迭代法实现广义差分估计十分简单, 行普通最小二乘估计时,在解释变量中引入 在解释变量中引入AR(1) 、 行普通最小二乘估计时 在解释变量中引入 ( AR(2)、…,即可。 ( ,即可。
4、数据的处理
在实际经济问题中,有些数据是通过已知数据 在实际经济问题中, 生成的。 生成的。 因此,新生成的数据与原数据间就有了内在的 因此, 联系,表现出序列相关性。 联系,表现出序列相关性。 例如:季度数据来自月度数据的简单平均, 例如:季度数据来自月度数据的简单平均,这 来自月度数据的简单平均 种平均的计算减弱了每月数据的波动性, 种平均的计算减弱了每月数据的波动性,从而使 随机干扰项出现序列相关。 随机干扰项出现序列相关。 还有就是两个时间点之间的“插值” 还有就是两个时间点之间的“插值”技术往往 导致随机项的序列相关性。 导致随机项的序列相关性。
2012-第10章自相关
et
t
et
t
10-19
10.3 自相关的诊断—图示法
图形法:
图10-3 回归方程(10.4)的残差
10-20
10.3 自相关的诊断——图示法
(b)绘制
et , et 1 的散点图
首先利用OLS回归后,求出残差 e1 , e2 , , et 1 , et 。
绘出(e1 , e2 ), (e2 , e3 ), , (et 1 , et )的散点图。
10-3
10.1 自相关的性质
通常假定误差项的自相关是线性的。 因计量经济模型中 自相关的最常见形式是一阶自回归形式, 所以下面重点讨论 误差项的线性一阶自回归形式,即 (10.2) 其中 1 是自回归系数,vt 是随机误差项。vt 满足通常假设 E(vt ) = 0, t = 1, 2 …, T, Var(vt) = v2, t = 1, 2 …, T, Cov(vi, vj ) = 0, i j, i, j = 1, 2 …, T, Cov(ut-1 , vt ) = 0, t = 1, 2 …, T,
e. 负自相关的序列图
f. 负自相关的散点图
图 10.1 时间序列及其自相关散点图
注意:(1)经济问题中的自相关主要表现为正自相关; 。 (2)自相关多发生于时间序列数据中。 10-7
10.1 自相关的性质---产生自相关的原因
(1)经济变量的惯性——时间序列变量的自相关导致干扰项的自 相关 (2)应进入模型的变量未被引入模型,能引起自相关 (3)回归模型的的形式设定存在错误 (4)蛛网现象:应变量对自变量的反应滞后 (5)滞后效应:应变量受其前几期取值的影响 (6)数据“编造”。数据的加工过程(如季度数据)或推算过 程(根据某种 假定获得未调查数据)引起自相关 (7)随机项自身可能存在“真正自相关”性(偶然性冲击对变 量的长期影响) 自相关主要出现在时间序列数据中。横截面数据中也可能存 在自相关(spatial autocorrelation, 空间自相关)。这种自相关 可能来自样本观测值的排序依据——逻辑的或经济的排列的理由。
10 模型假设违背:自相关
自相关产生的原因
原因1-经济系统的惯性 自相关现象大多出现在时间序列数据中,而经 济系统的经济行为都具有时间上的惯性。
如GDP、价格、就业等经济指标都会随经济系 统的周期而波动。例如,在经济高涨时期,较 高的经济增长率会持续一段时间,而在经济衰 退期,较高的失业率也会持续一段时间,这种 现象就会表现为经济指标的自相关现象。
方差最小的。在实际经济系统中,通常存在正的
自相关,即 >0 ,同时 X 序列自身也呈正相关, 因此上式右边括号内的值通常大于0。因此,在 有自相关的条件下,仍然使用普通最小二乘法将
ˆ ˆ 低估估计量 2的方差 Var(2 ) 。 ˆ 2 ei2 (n - k ) 将低估真实的 2 。
St 1 2 P1 ut t
11
原因5-模型设定偏误
模型设定偏误的两种情况: 忽略了某些本应包含在模型中的重要解释变量 模型函数形式不正确
这两种情况都会产生系统误差,这种误差存在 于随机误差项中,从而带来了自相关。 由于该现象是由于设定失误造成的自相关,因 此,也称其为虚假自相关。
2
n t =1
2 u
xt2
(1+ 2
x x
t =1 n t =1
n -1
t t +1
xt2
+ 2
2 t =1
Hale Waihona Puke x xn t =1
n -2
t t +2
xt2
+ ... + 2
n -1
x1 xn xt2
t =1 n
)
28
当存在自相关时,普通最小二乘估计量不再是最 佳线性无估计量,即它在线性无偏估计量中不是
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第10章 自相关:如果误差项相关会有什么后果本章主要讲授如下内容:10.1 自相关的性质 10.2 自相关的后果 10.3 自相关的诊断 10.4 自相关的补救措施10.1 自相关的性质1.定义对于模型:t kt k t t t X B X B X B B Y μ+++++=Λ33221如果随机误差项的各期值之间存在着相关关系,即0)(),cov(≠=j i j i E μμμμ,j i ≠,k j i ,,2,1,Λ=这时,称随机误差项之间存在自相关(autocorrelation )或序列相关(serial correlation )。
最常见的类型是随机误差项之间存在一阶自相关,即0)(),cov(11≠=--t t t t E μμμμ或t t t νρμμ+=-1其中,ρ是μt 与μt-1的相关系数,νt 是满足经典假设的随机误差项。
自相关的一般形式可以表示成t p t p t t t νμρμρμρμ++++=---Λ2211称之为p 阶自回归形式,或模型存在p 阶自相关。
2.判断由于我们无法观察到误差项μt ,只能通过残差项e t 来判断μt 的行为。
如果残差项e t 随时间呈现有规律的变化,则表示残差项e t 存在自相关。
否则,不存在自相关。
如图10-1所示。
3.类型主要有正的自相关和负的自相关两类,如图10-2所示。
4.自相关产生的原因(1)经济变量的惯性作用 如GDP 、就业、货币供给、价格指数等时间序列都呈现出周期性。
(2)经济行为的滞后性 如投资对其后若干年内经济的影响等。
(3)一些随机因素的干扰或影响 如战争、自然灾害、错误政策的后果、金融危机等随机因素,不仅对当期经济造成影响,而且对以后若干时期的经济产生影响,反映在模型中即容易形成随机误差序列的自相关。
(4)模型设定误差 如果模型中遗漏了重要的变量,或选择了不正确的函数形式,则得到的残差会出现自相关。
(5)数据的“编造” 在实证分析中,有些数据是通过已知数据生成的,如对原始数据进行内插或平滑处理等。
如季度数据往往通过月度数据推导而来,这种平滑过程本身可能导致误差项的系统模式,从而引入了自相关。
10.2 自相关的后果1.参数估计量仍然是线性的、无偏的,但非有效。
2.OLS 估计量的被估方差是有偏的且会被低估,因而会使相应的t 值变大。
3.模型的t 和F 统计检验失效。
4.用通常公式(../ˆ22f d ei∑=σ)计算的随机误差项的方差是实际值的有偏估计,且一般会被低估。
因为在存在自相关的情况下,可以推导出:]2)22()2[()(212222122∑∑∑∑∑∑∑-+++++--=ini n ii iii ii XX X XX X XX X n e E ρρρσΛ5.通常计算的R 2不是其真实值的准确估计,比实际的要大。
6.区间估计与预测区间的精度降低。
10.3 自相关的诊断1.图示法(1)以时间t 为横轴,以残差e t 为纵轴进行作图,如果e t 随时间的变化呈现有规律的变化,则e t 存在自相关。
如图10-3所示。
(2)绘制e t 与e t-1散点图,如果图形出现系统反映,则误差项e t 可能存在自相关。
如图10-4所示。
2.回归检验法以e t 作为被解释变量,以各种可能的相关量,如e t-1、e t-2、e t 2等为解释变量,建立各种方程:t t t e e νρ+=-1 t t t e e νρ+=-21t t t e e νρ+=-1t t t t e e e νρρ++=--2211对方程进行估计并进行显著性检验,如果存在某一种函数形式,则说明原模型存在自相关。
回归检验法的优点是,一旦确定了模型存在序列相关,也就知道了序列相关的形式。
3.德宾—沃森检验(Durbin-Watson test )(1)检验的假设条件①解释变量X 为非随机;②随机误差项μt 为一阶自相关形式; ③解释变量中不含有因变量的滞后值; ④回归模型含有截距项。
(2)德宾—沃森统计量)1(2)(..12221ρ-≈-=∑∑==-nt tnt t t ee eW D ,其中∑∑==-=nt tnt t t eee 1221ρ(3)检验自相关性因为ρ的值介于-1和1之间,所以0≤D.W.≤4,而且: ①D.W.=0(ρ=1),即存在正自相关性; ②D.W.=4(ρ=-1),即存在负自相关性; ③D.W.=2(ρ=0),即不存在自相关性。
因此,当D.W.的值显著地接近于0或4时,则存在自相关性;而接近于2时,则不存在(一阶)自相关。
在具体检验时,只须计算德宾—沃森统计量的值,再根据样本容量n 和解释变量数目k 查D.W.分布表,得到临界值d L 和d U ,然后按照下列准则考察D.W.值,以判断模型的自相关状态:D.W.检验的不足之处是,如果D.W.值落入无法判定的区域,那么就不能对自相关做出判断。
4.拉格朗日乘数检验(Lagrange Multiplicator Test, LM Test )它由布劳殊(Breusch )和戈弗雷(Godfrey )于1978年提出,也被称为GB 检验。
对于模型:t kt k t t t X B X B X B B Y μ+++++=Λ33221如果随机误差项μt 存在p 阶自相关:t p t p t t t νμρμρμρμ++++=---Λ2211这里,νt 是满足经典假设的随机误差项。
LM 检验的零假设H 0是: H 0:021====p ρρρΛ即不存在任何阶数的自相关。
LM 检验包含如下步骤:(1)用OLS 法估计原模型,并得到残差序列e t ;(2)利用e t 对原模型中的解释变量X 2t 、X 3t 、…、X kt 和第一步所估计的残差滞后值e t-1、e t-2、…、0 d L d U 2 4-d U 4-d L 4e t-p 做回归,即做如下回归:t p t p t t kt k t t t X a X a X a a e νμρμρμρ+++++++++=---ΛΛ221133221并从这个辅助回归中得到R 2。
注意,此回归中只有(n-p )次观察值。
(3)布劳殊和戈弗雷证明,若样本容量很大则:22~)(pR p n χ- 若22)(p R p n χ>-,则拒绝零假设,此时至少有一个ρi 显著地不为0,即存在自相关性。
利用EViews 软件可以直接进行检验:“View ”→“Residual ”→“Serial Correlation LM Test ”,屏幕将输出辅助回归模型的有关信息,包括nR 2及其临界概率值。
但LM 检验中,需要人为确定滞后期的长度。
实际应用中,一般是从低阶的p n =1开始,若未能得到显著的检验结果,可以认为不存在自相关性。
10.4 自相关的补救措施1.广义差分法设线性回归模型t t t X B B Y μ++=21 (10-1)并假设误差项存在一阶自相关,即服从AR(1)过程:t t t νρμμ+=-1,11≤≤-ρ式中,ν满足OLS 假定。
将模型(10-1)滞后一期,得:11211---++=t t t X B B Y μ (10-2)(10-2)式两边同乘以ρ,得到:11211---++=t t t X B B Y ρμρρρ (10-3)将式(10-1)与式(10-3)相减,得到:t t t t t X X B B Y Y νρρρ+-+-=---)()1()(1211令1*--=t t t Y Y Y ρ,1*--=t t t X X X ρ,)1(1*1ρ-=B B ,得到:t t t X B B Y ν++=*2*1* (10-4)式(10-4)满足OLS 假定。
对变换后的模型使用OLS 得到的估计量,称为广义最小二乘(generalized least squares, GLS )估计量。
在上述差分变换中,由于第一个样本观察值不存在前置期,因而失去一个观察值。
为了避免丢失这个观察值,可对Y 和X 的第一个观察值做如下变换:21*11ρ-=Y Y 21*11ρ-=X X这一变换称为普莱斯—温斯特变换(Prais-Winsten Transformation )。
在实践中,如果样本容量足够大,则无须进行这种变换。
2.如何估计ρ(1)取ρ=1,即一阶差分法在应用计量经济学中,广泛采用ρ=1,即误差项之间是完全正自相关,这对有些经济时间序列来说是正确的。
这时,广义差分方程就变为一阶差分方程:t t t X B Y ν+∆=∆2注意:一阶差分方程中没有截距。
(2)从德宾—沃森统计量D.W.中估计ρ在大样本情况下,利用D.W.统计量与ρ之间的关系式)1(2..ρ-≈W D ,求出ρ的近似估计值:2..1ˆW D -=ρ对于小样本,泰尔(Theil H.)建议使用下述近似公式:2222)1()1()2/..1(ˆ+-++-=k n k W D n ρ其中k 为解释变量的个数。
当n →∞时,2/..1ˆW D -=ρ。
(3)从OLS 残差e t 中估计ρ对于一阶自回归过程:t t t νρμμ+=-1由于u 无法直接观察得到,因此可以使用相应的样本误差e t 代替,并进行如下回归:t t t e e νρ+=-1ˆ 式中,ρˆ是ρ的估计量。
统计理论表明,尽管对小样本而言,ρˆ是ρ的有偏估计量,但是随着样本容量的增加,这个偏差会逐渐消失。
(4)德宾两步法根据前面的广义差分变换模型:t t t t t X X B B Y Y νρρρ+-+-=---)()1()(1211整理得:t t t t t X B X B Y B Y νρρρ+-++-=--12211)1(令)1(11ρ-=B A ,22B A =,23B A ρ-=,得:t t t t t X A X A Y A Y νρ++++=--13211用OLS 法估计上述方程,变量Y t-1的回归系数恰好为ρ。
3.广义差分法的EViews软件实现过程(1)初步确定自相关的类型具体步骤为:①利用OLS法估计模型,系统将同时计算残差序列(Resid);②判断自相关性的类型。
“Ident Resid”或在“Equation”窗口中依次单击“View”→“Residual Test”→“Correlogram-Q-Statistics”,根据e t和e t-s(s=1,2,…,p)的偏相关系数,初步确定自相关的类型。
(2)广义差分法估计模型在OLS估计的原模型中,加上AR项作为解释变量,系统将自动使用广义差分法来估计模型。
如为一阶自相关,加上AR(1);如为高阶自相关,则加上AR(2)、AR(3)…EViews软件将使用迭代估计法估计模型,并输出ρ的估计值及其标准差、t统计值等,根据AR 项的t检验值是否显著,可以进一步确定自相关性的具体形式。