第四讲异方差和自相关学习资料
第4讲异方差与自相关解析
三、实验操作指导
这就是实验模型。显然模型将一个非线性模型转化成了线性 模型,在运用计量经济学进行模型研究时,将非线性模型 化为线性模型来简化分析一直是计量经济学的指导准则。
2.打开文件,进行回归
(1)打开文件命令 use c:\data\nerlove,clear 或者直接从菜单栏中“file”选择“open”找到需要打开的数据 文件nerlove
通过绘制残差图可以直观地观察到是否存在异方 差,但是观察残差图的方法标准较为模糊,会遇 到模型残差图很难判断的情形。所以只采用残差 图的方式判定模型的方差形式是不够严谨的,必 须配合下面几种正规的检验方法才有信服力。 (2)怀特检验法 根据本章节介绍的该方法的原理,Stata可以直接 得到检验结果。对模型基本回归结束后,需要在 命令窗口输入如下命令:
3.异方差检验 对模型进行回归并不是本章的知识,然而回归是一个基础, 即做异方差检验之前必须做回归,下面将会详细介绍异方 差检验的基本方法。 (1)残差图观察法 做完模型的基本回归后,运用Stata绘制残差图来观察异 方差是否存在。 在命令窗口中输入如下两个命令中的任意一个即可 rvfplot (residual-versus-fitted plot) rvpplot varname (residual-versus-predictor plot) 第一个命令语句的作用是绘制默认形式的残差图,第二个 命令语句的作用是绘制残差与某个解释变量的散点图, varname可以换做认为合理的解释变量。
二、实验内容和数据来源 数据来自Nerlove 1963年的一篇文章,数据内容是美国1955 年145家电力企业的横截面数据,变量主要有TC(企业总 成本)、Q(产量)、PL(工资率)、PF(燃料价格)及 PK(资本租赁价格)。完整的数据在本书附带光盘里的 data文件夹的“nerlove.dta”工作文件夹中。 根据cobb-douglas生产函数:,在企业追求成本最小化的 的合理假设下,可证明其成本函数也为cobb-douglas函数, 可显示如下: 本实验中,运用nerlove数据分析各个解释变量对总成本 TC的影响,并运用多种方法检验是否存在异方差,如果 存在异方差则对模型进行合理的修正,最终得到一个效果 较好的模型。
第4讲 异方差与自相关
对于如何修正模型中存在的自相关问题,要做好两个工作:一是自相 关的检验——准确地对所建立的模型进行检验,从而确定自相关是否 存在;二是自相关的处理——若发现模型存在自相关,要进行合理地 修正模型重新进行估计。
若解释变量满足严格外生性的假定,那么FGLS的估计效 果是比较准确的。而若解释变量不满足“严格外生”仅仅 满足“前定解释变量”的条件,则FGLS的估计效果是可 能不一致的,而OLS估计量是一致的。 (4)修改模型 这个方法是认为模型自相关的产生可能是因为模型设定有 误,通过修改模型达到消除自相关的目的。当然这个不是 本章实验的重点,但对于计量经济学建立模型确实很重要。
通过绘制残差图可以直观地观察到是否存在异方 差,但是观察残差图的方法标准较为模糊,会遇 到模型残差图很难判断的情形。所以只采用残差 图的方式判定模型的方差形式是不够严谨的,必 须配合下面几种正规的检验方法才有信服力。 (2)怀特检验法 根据本章节介绍的该方法的原理,Stata可以直接 得到检验结果。对模型基本回归结束后,需要在 命令窗口输入如下命令:
实验内容和实验数据 根据某统计资料,得到英国政府1952-1995年间每 月短期利率和长期利率的数据ukrates.dta。实验 据此来考察英国政府如何根据长期利率(r20) 的变化来调整短期利率(rs)。完整的数据在本 书附带光盘data文件夹下“ukrates.dta”工作文件 中。 利用ukrates 数据,运用计量经济学建立模型来研 究两利率之间的关系,并检验模型是否存在自相 关问题,然后在Stata中对模型存在的自相关问题 进行处理。
(二) 异方差的处理方法
(1)稳健标准差加OLS法 只要样本容量足够大,在模型出现异方差的情况 下,使用稳健标准差时参数估计、假设检验等均 可正常进行,即可以很大程度上消除异方差带来 的副作用。
异方差与自相关问题
a
与 b 。 a 与 b 的线性相关系数,称为
q
z
的等级相关系数 。
(ai a )(bi b ) rs (ai a ) 2 (bi b ) 2
6 (ai bi ) 2 rs 1 n(n 2 1)
§5.2
等级相关检验
异方差问题
(a) 完成模型的OLS估计,获取残差数据
X 11 f ( X j1 ) X 12 f ( X j2 ) X 1n f ( X jn )
X k1 f ( X j1 ) X k2 f ( X j2 ) X kn f ( X jn )
~ Y
Y f (X j )
~ Xi
Xi f (X j )
1 1 1
X 11 X 12 X 1n
Y1 X k 1 f ( X j1 ) Y2 X k2 f ( X j2 ) Y n X kn f ( X jn )
1 f ( X j1 ) 1 f ( X j2 ) 1 f ( X jn )
第五章
异方差与自相关问题
除了本章讨论所涉及的同方差性与不自相关性以外,
关于线性回归模型的其它假定在本章中都成立。 ——广义最小平方估计; ——异方差模型及其估计; ——自相关模型及其估计; ——异方差模型、自相关模型的预测。
§5.1
广义最小平方法
同方差且不自相关
cov(U ) 2 I cov(U ) 2
ei ;
(b) 选择可能与异方差有关的解释变量 rs ( j ),计算变量 X j与变
量
e 的等级相关系数
(c) 计算统计量
自相关和异方差处理顺序
自相关和异方差处理顺序引言自相关和异方差是时间序列分析中常见的两种问题,它们影响了模型的准确性和可靠性。
在进行时间序列建模时,需要处理这些问题,以确保模型的有效性。
本文将深入探讨自相关和异方差处理的顺序,并讨论不同处理顺序的影响。
什么是自相关和异方差自相关自相关是指时间序列中当前观测值与之前观测值之间的相关性。
它衡量的是时间序列中各个观测值之间的依赖关系。
自相关可以用自相关函数(ACF)图来表示,通过观察ACF图,可以判断时间序列是否存在自相关。
异方差异方差是指时间序列中方差不稳定的特征。
在时间序列中,方差可能随着时间的推移发生变化,这会导致模型的拟合不准确。
异方差可以用方差函数(VCF)图来表示,通过观察VCF图,可以判断时间序列是否存在异方差。
自相关和异方差处理的重要性自相关和异方差对时间序列建模的准确性和可靠性有重要影响,它们需要被处理以获得可靠的模型结果。
•自相关的存在会导致参数估计不准确,预测结果失真。
如果存在自相关,模型会无法捕捉到序列的真实动态,导致预测结果不准确。
•异方差使得模型的残差不符合正态分布,违背了建模的基本假设。
这会使得模型的显著性检验和置信区间估计不可靠,影响模型的有效性。
因此,为了获得可靠的模型结果,需要对自相关和异方差进行处理。
自相关和异方差处理顺序的影响自相关和异方差的处理顺序会对最终的模型结果产生影响。
不同的处理顺序可能导致不同的模型结构和参数估计。
先处理自相关后处理异方差如果先处理自相关再处理异方差,可能会导致如下影响:1.自相关处理可能会改变时间序列的动态特征。
当我们去除自相关时,可能会削弱序列中的一些重要信息,导致模型无法准确捕捉到序列的动态变化。
2.异方差处理可能会影响自相关的结构。
当我们对残差进行异方差处理时,可能会改变残差序列的结构,从而使得自相关的估计失真。
先处理异方差后处理自相关如果先处理异方差再处理自相关,可能会产生如下影响:1.异方差处理可能改变原始序列的动态特征。
统计分析与方法-第七章 回归分析2-异方差与自相关
居民收收
绝对值
Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N
1.000 . 31 .686** .000 31
**. Correlation is significant at the 0.01 level (2-tailed).
残差可以看做是误差项的估计值, ˆ ˆ 残差: ei = yi − yi = yi − β 0 − β1 xi ˆ
ε i = yi − β 0 − β1 xi 误差项: 比较两个表达式可以正确区分残差与误差 项的异同。
回归模型满足基本假设的残差图
残差在e=0附近随机变化
残差中存在异方差
Y和x之时呈非线性关系 或y存在自相关
i
cov(ε i , ε j ) =
σ 2,i = j
0, i ≠ j
但在建立实际问题的回归模型时,经常存 在与此假设相违背的情况,一种是计量经 济建模中常说的异方差性,
异方差性和自相关性
即:
var(ε i ) ≠ var(ε j ), 当i = j时
另一种是自相关性,即:
cov(ε i , ε j ) ≠ 0, 当i ≠ j时
Model Summaryb Model 1 R .955a R Square .912 Adjusted R Square .909 Std. Error of the Estimate 247.62337
a. Predictors: (Constant), 居民收收 b. Dependent Variable: 储储
注册资本
.721** .002 15 .432 .108 15 1.000 . 15
异方差性、自相关以及广义最小二乘(GLS)
(6)
其中C的各列是Ω的特征向量经过正交化而得到,即CC’=I,而且Ω的特征根被放在对角矩阵 中。令 是对角元素为 的对角矩阵,并令 ,于是 。另外,令 ,因此
用P’前乘(1)中的模型可得
或
(7)
的方差是
因此,这个变换后的模型就是一个我们熟悉的古典回归模型。由于Ω已知,所以,
三)可行的最小二乘估计(FGLS)
上一节的结果是基于Ω必须是已知的条件基础上的。如果Ω含有必须估计的未知参数,则GLS是不可行的。但在无约束的情况下, 中有n(n+1)/2个附加参数。这对于用n个观测值来估计这么多的参数是不现实的。只有当模型中需要估计的参数较少时,即模型中Ω某种结构要简化,才可以找到求解的方法。
异方差性、自相关以及广义最小二乘(GLS、FGLS)
蒋岳祥
(浙江大学经济学院)
一、古典模型中的b的非线性函数的分布及其检验
二、异方差性和自相关(非球形扰动)
1、问题的提出
2、广义最小二乘(GLS)
3、可行广义最小二乘(FGLS)
三、异方差不含自相关的检验(怀特检验)
一、古典模型中的b的非线性函数的分布及其检验
对于假设检验,我们可以把所有结果应用到变换后的模型(7)中。为了检验J个线性约束Rβ=q,相应的统计量是
,
其中残差向量是
而
有约束的GLS残差 ,基于
(11)
总之,对于古典模型的所有结果,包括通常的推断过程,都适用于(7)中的模型。
应该注意的是:在广义回归模型中没有R2的准确对等物。不同的统计量有不同的意义,但使用它们时一定要谨慎。
可行的最小二乘估计(FGLS)
具有代表性的问题涉及到一小组参数 ,满足 。例如, 只有一个未知数 ,其常见的表达形式是
异方差与自相关
第六章异方差与自相关第一节异方差与自相关的定义一、例子例1,研究我国制造业利润函数,选取销售收入作为解释变量,数据为1998年的食品年制造业、饮料制造业等28个截面数据(即n=28)。
数据如下表,其中Y表示制造业利润函数,X表示销售收入(单位为亿元)。
Y对X的散点图为从散点图可以看出,在线性的基础上,有的点分散幅度较小,有的点分散幅度较大。
因此,这种分散幅度的大小不一致,可以认为是由于销售收入的影响,使得制造业利润偏离均值的程度发生了变化,而这种偏离均值的程度大小不同是一种什么现象?如何定义?下面给出制造业利润对销售收入的回归估计。
模型的书写格式为2ˆ12.03350.1044(0.6165)(12.3666)0.8547,..84191.34,152.9322213.4639,146.4905Y YX R S E F Y s =+=====通过变量的散点图、参数估计、残差图,可以看出尽管表面上模型的估计效果还不错,但随机误差(残差)可能存在一种系统性的表现。
例2,研究中国城镇居民消费函数,其中选取了两个变量,城镇家庭商品性支出(现价)和城镇家庭可支配收入(现价),分别记为CSJTZC 和CSJTSR ,时间从1978年到1997年,n=20。
但为了剔除物价的影响,分别对CSJTZC 和CSJTSR 除以物价(用CPI 表示),这里CPI 为城镇居民消费物价指数(以1990年为100%),经过扣除价格因素以后,记CPICSJTSRX CPICSJTZCY ==即如下表回归以后得到的残差为Dependent Variable: Y Method: Least Squares Date: 10/27/04 Time: 09:39 Sample: 1978 1997 Included observations: 20Variable Coefficient Std. Error t-Statistic Prob. C -103.3692 78.80739 -1.311669 0.2061 X0.9235510.01603357.603880.0000 R-squared0.994605 Mean dependent var 3939.341 Adjusted R-squared 0.994305 S.D. dependent var 2124.467 S.E. of regression 160.3247 Akaike info criterion 13.08692 Sum squared resid 462671.9 Schwarz criterion 13.18649 Log likelihood -128.8692 F-statistic 3318.207 Durbin-Watson stat1.208037 Prob(F-statistic)0.000000通过残差图可以看出,残差有随时间的系统性表现。
异方差与自相关
七、 异方差与自相关一、背景我们讨论如果古典假定中的同方差和无自相关假定不能得到满足,会引起什么样的估计问题呢?另一方面,如何发现问题,也就是发现和检验异方差以及自相关的存在性也是一个重要的方面,这个部分就是就这个问题进行讨论。
二、知识要点1、引起异方差的原因及其对参数估计的影响2、异方差的检验(发现异方差)3、异方差问题的解决办法4、引起自相关的原因及其对参数估计的影响5、自相关的检验(发现自相关)6、自相关问题的解决办法 (时间序列部分讲解) 三、要点细纲1、引起异方差的原因及其对参数估计的影响原因:引起异方差的众多原因中,我们讨论两个主要的原因,一是模型的设定偏误,主要指的是遗漏变量的影响。
这样,遗漏的变量就进入了模型的残差项中。
当省略的变量与回归方程中的变量有相关关系的时候,不仅会引起内生性问题,还会引起异方差。
二是截面数据中总体各单位的差异。
后果:异方差对参数估计的影响主要是对参数估计有效性的影响。
在存在异方差的情况下,OLS 方法得到的参数估计仍然是无偏的,但是已经不具备最小方差性质。
一般而言,异方差会引起真实方差的低估,从而夸大参数估计的显著性,即是参数估计的t 统计量偏大,使得本应该被接受的原假设被错误的拒绝。
2、异方差的检验 (1)图示检验法由于异方差通常被认为是由于残差的大小随自变量的大小而变化,因此,可以通过散点图的方式来简单的判断是否存在异方差。
具体的做法是,以回归的残差的平方2i e 为纵坐标,回归式中的某个解释变量i x 为横坐标,画散点图。
如果散点图表现出一定的趋势,则可以判断存在异方差。
(2)Goldfeld-Quandt 检验Goldfeld-Quandt 检验又称为样本分段法、集团法,由Goldfeld 和Quandt 1965年提出。
这种检验的思想是以引起异方差的解释变量的大小为顺序,去掉中间若干个值,从而把整个样本分为两个子样本。
用两个子样本分别进行回归,并计算残差平方和。
异方差、自相关、多重共线性比较(计量经济学)
基本思想:
由OLS法得到残差e,取e的绝对值,然后将此绝对值对某个解释变量X回归,根部回归模型的显著性和拟合优度来判断是否存在异方差。
操作步骤:
1.根据样本数据建立回归模型,并求残差序列e.
2.用残差绝对值对X进行回归,由于|e|与X的真实函数形式并不知道,可用各种函数形式去试验,从中选择最佳形式。
2.quick/equation estimation输入“e2 c e2(-1) e2(-2) e2(-3) e2(-4) e2(-5) e2(-6)”
3.view/residual diagnostics/heteroskedasticity tests,选择arch。
2.Quick/graph,在series list对话框中输入“e(-1) e”,选择scatter’,得到e(-1)与e的散点图。
方法二:1.用OLS估计Resid→e。
2.Quick/graph,在series list对话框中输入“e”,得到e随时间t的变化图示。
操作思想
操作步骤
适用性
软件操作
实际检验中可逐次向更高阶检验,并结合辅助回归中滞后项参数的显著性去帮助判断自相关的阶数。
ห้องสมุดไป่ตู้DW检验
操作思想:
DW与ρ的关系:DW≈2(1-ρ)
ρ的取值范围0≤DW≤4.
根据样
本容量n和解释变量的数目k'(不包括常数项),查DW分布表,可得临界值dl和du,
DW取值范围
自相关状态
[0,dl]
正自相关
(dl,du]
5.判断。给定显著性水平α,查F分布表,得临界值。 > ,拒绝 ,反之不拒绝 。
适用性:
该方法得到的F分布是近似的,而且只是对异方差是否存在进行判断,在多个解释变量的情况下,对判断是哪一个变量引起异方差还存在局限。此检验方法也可将样本分为多个组,从中任选两个组进行检验。
异方差与自相关
1.5 假定条件的不成立用OLS 法得到的估计模型通过统计检验后,还要检验摸型是否满足假定条件。
由1.3 节知,只有模型的4个假定条件都满足时,用OLS 法得到的估计量才具有最佳线性无偏特性。
当一个或多个假定条件不成立时,OLS 估计量将丧失上述特性。
本节讨论当假定条件不成立时,对参数估计带来的影响以及相应的补救措施。
以下讨论都是在某一个假定条件被违反,而其他假定条件都成立的情况下进行。
分为5个步骤。
(1)回顾假定条件。
(2)假定条件不成立对模型参数估计带来的影响。
(3)定性分析假定条件是否成立。
(4)假定条件是否成立的检验(定量判断)。
(5)假定条件不成立时的补救措施。
1.5.1 同方差假定-224681012050100150200XY图5.1 同方差情形 图5.2 同方差情形模型的假定条件⑴ 给出V ar(u ) 是一个对角矩阵, Var(u ) = E(u u ' ) = σ 2I = σ 21011⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦(5.1) 且u 的方差协方差矩阵主对角线上的元素都是常数且相等,即每一误差项的方差都是有限的相同值(同方差假定);且非主对角线上的元素为零(非自相关假定),当这个假定不成立时,Var(u ) 不再是一个纯量对角矩阵。
Var(u ) = σ 2 Ω = σ 211220..00...0 00...TT σσσ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦≠σ 2 I (5.2)当误差向量u 的方差协方差矩阵主对角线上的元素不相等时,称该随机误差系列存在异方差,即误差向量u 中的元素u t 取自不同的分布总体。
非主对角线上的元素表示误差项之间的协方差值。
比如 Ω 中的 σi j 与σ 2的乘积 ,(i ≠ j )表示与第i 组和第j 组观测值相对应的u i 与 u j 的协方差。
若 Ω 非主对角线上的部分或全部元素都不为零,误差项就是自相关的。
本节讨论异方差。
下一节讨论自相关问题。
【总结】计量经济学异方差性、多重共线性、自相关的联系与区别知识总结
《计量经济学》中多重共线性、异方差性、自相关三者之间的联系与区别首先我们先来回顾一下经典线性回归模型的基本假设:1、为什么会出现异方差性我们可以从一下两方面来分析:第一,因为随即误差项包括了测量误差和模型中被省略的一些因素对因变量的影响;第二,来自不同抽样单元的因变量观察值之间可能差别很大。
因此,异方差性多出现在截面样本之中。
至于时间序列,则由于因变量观察值来自不同时期的同一样本单元,通常因变量的不同观察值之间的差别不是很大,所以异方差性一般不明显。
含义及影响:y=X β+ε,var(εi )var(εj ), ij ,E(ε)=0,或者记为212200['|]0000n E X σεεσσ⎛⎫⎪=Ω= ⎪ ⎪⎝⎭即违背假设3。
用OLS 估计,所得b 是无偏的,但不是有效的。
111(')'(')'()(')'b X X X y X X X X X X X βεβε---==+=+由于E(ε)=0,所以有E(b )=β。
即满足无偏性。
但是,b 的方差为1111121var(|)[()()'][(')''(')|] (')'['|](') (')'()(')b X E b b E X X X X X X X X X X E X X X X X X X X X X ββεεεεσ------=--===Ω其中212200['|]0000n E X σεεσσ⎛⎫⎪=Ω= ⎪ ⎪⎝⎭2、自相关产生的原因:(1)、经济数据的固有的惯性带来的相关 (2)、模型设定误差带来的相关 (3)、数据的加工带来的相关 含义及影响:cov(,)0,i j i j εε≠≠影响:和异方差一样,系数的ls 估计是无偏的,但不是有效的。
D -W 检验(Durbin -Watson )221212222121212222112112122211221122121()()()2()()222222(1)n i i i n i i n n n i i i i i i i n i i n n n i i i i i i i n n i i n i i i nn n i i i i nn i ie e d e e e e e e e e e e e e e e e e e e e e e e ρρ=-===-=-====-==-===∑-=∑∑+∑-∑=∑∑+∑-∑--=∑∑+=--∑∑+=--∑≈-其中2121n i i i n i ie e e ρ=-=∑=∑是样本一阶自相关函数。
第4章 异方差.ppt
Y X
同方差假设为:D(i ) 2 , i 1, 2,L n ,如果出现
D(i
)
2 i
,
i 1, 2,L
n
即对不同的样本点,随机误差项的方差不再
是常数,而是各不相同,则认为出现了异方差。
信息系刘康泽
同方差性
密度
y
x
0 1xi
信息系刘康泽
6
Y
4
2
0
0
10
1 0 L 0
0 L
2 L
LL
0
L
0
0
L
n
令 DDT
用D-1左乘 Y X ,得
1
0
D
L
0
0L
2 L
LL 0L
0
0
L
n
D1Y D1 X D1
Y* X* *
20
30
X
信息系刘康泽
异方差性
密度
y
x
0 1xi
信息系刘康泽
300
Y
200
100
0 0
5000
10000
15000
20000
X
信息系刘康泽
6
4
2
0
-2
-4
-6
-8
200
400
600
800
1000
1200
1400
信息系刘康泽
第二节 异方差的后果
当出现异方差而又使用普通的最小二乘法,则会出现如下后果:
自相关和异方差处理顺序
自相关和异方差处理顺序在统计学和计量经济学中,自相关和异方差是两个常见的问题,需要进行相应的处理才能保证模型的准确性和可靠性。
本文将以人类的视角,采用准确的中文进行描述,详细介绍自相关和异方差的处理顺序及其重要性。
一、自相关处理自相关是指时间序列数据中观测值之间存在的相关性。
当序列中的观测值之间存在一定的相关性时,会导致统计模型的参数估计不准确,假设检验无效,预测结果不可靠。
因此,需要进行自相关的处理。
自相关处理的一种常见方法是使用自相关函数(ACF)和偏自相关函数(PACF)进行分析。
ACF表示观测值与不同滞后期的观测值之间的相关性,PACF表示观测值与滞后期观测值之间的相关性,探究观测值之间的相关性结构。
在进行自相关处理时,可以采取以下步骤:1. 绘制时间序列图,观察序列的趋势和波动性。
2. 进行序列的平稳性检验,确保序列满足平稳性的要求。
3. 绘制ACF和PACF图,分析观测值之间的相关性结构。
4. 根据ACF和PACF的图形特征,选择合适的自回归移动平均模型(ARMA模型)。
5. 估计模型参数,进行模型拟合。
6. 检验模型的残差序列是否存在自相关,如果存在,则返回第3步,重新选择模型。
通过以上步骤,可以有效地处理自相关问题,提高模型的准确性和可靠性。
二、异方差处理异方差是指随着自变量的变化,因变量的方差也发生变化。
当存在异方差时,会导致模型的参数估计不准确,假设检验无效,预测结果不可靠。
因此,需要进行异方差的处理。
异方差处理的一种常见方法是使用加权最小二乘法(Weighted Least Squares, WLS)。
WLS是一种在回归分析中常用的方法,通过对误差项进行加权,降低异方差对回归结果的影响。
在进行异方差处理时,可以采取以下步骤:1. 绘制残差图,观察残差的分布特征。
2. 进行异方差检验,判断是否存在异方差。
3. 如果存在异方差,可以使用加权最小二乘法进行回归估计。
4. 根据异方差的特点,选择合适的加权函数,对误差项进行加权。
自相关异方差多重共线性
也就是说,DW值越接近于2,u的自相关 性越小;DW值越接近于零,u正自相关程度 越高;DW值越接近于4,u负自相关程度越 高。
• c.DW统计量的使用
⑴ 当DW<dL时, 拒绝原假设H0:ρ=0;接受备 择假设H1:ρ≠0,u存在一阶正自相关。 ⑵ 当DW>(4- dL)时,拒绝原假设 H0:ρ=0 ;接 受备择假设H1:ρ≠0,u存在一阶负自相关。 ⑶ 当dU<DW<(4-dU)时,接受原假设H0:ρ=0, 不存在自相关。 ⑷ 当dL<DW<dU 或 (4-dU)<DW<(4-dL)时, 则这种检验没有结果,即u是否存在自相关, 不能确定。
t
对于原假设
H0 : 1 2
p 0
(不存在p阶自相关)。BG检验步骤如下: 1. 用OLS估计样本回归方程,求出残差et 。 2. 作辅助回归,并计算回归方程的R2。
et 0 1x1t k xkt 1ut 1 2ut 2 put p vt
得:
ˆ xt 1 , (t 2, xt* xt
,T )
yt* a0 1 xt* vt
ˆ ˆ0 , a 1
应用OLS,求得a0, 1的估计值 到: ˆ0 a ˆ
0
ˆ 1
,进而得
杜宾二步法存在两个问题: 一、所得参数估计值的精度依赖于的估计值的精确 度;
E(v|ut-1)=0, Var(v|ut-1)=σ2, Cov(vt ,vt+s)=0 s≠0
• 检验随机误差项是否具有AR(1)形式的思路:
首先,通过构造样本回归方程,计算出残差et ; 然后,计算自回归系数ρ的OLS估计值 :
(e e )(e ˆ (e e
计量经济学异方差精品PPT资料
• 一般经验,对于采用截面数据作样本的 计量经济学问题,由于不同样本点上解
释变量以外的其他因素的差异较大,所 以往往存在异方差。
二、异方差性的后果 Consequences of Using OLS in the
Presence of Heteroskedasticity
V ar(i)E(i2)e ~ i2 最 好 在 大 样 本 条 件 下 (使 2用 .4 .7)
即 用 e ~ i2来 表 示 随 机 误 差 项 的 方 差 。
从而可进一步考察其与X的相关性及其具体的形式。
( 2 1 ) X - e ~ i 2 的 散 点 图 进 行 判 断
看是否形成一斜率为零的直线
问题在于如何获得随机误差项 (从总体带来的)的方差
• 问题在于如何获得随机误差项 (从总体带 WLS估计的Eviews软件的实现
以案例1为例:由于不知ei与Xi之间具体的函数关系。
i
来的)的方差 从而可进一步考察其与X的相关性及其具体的形式。
White1980年提出。 假设6:随机项满足正态分布
一般的处理方法:
2 任 意 选 择 c 个 中 间 观 测 值 略 去 . 经 验 表 明 , 略 去 数 目 c 的 大 小 , 大 约 相 当 于
样 本 观 测 值 个 数 的 1 .剩 下 的 n c 个 观 测 值 平 均 分 成 两 组 , 每 组 观 测 值 的 个 数 为 n c.
4
2
(3)对每个子样本分别进行OLS,并分别计算各自的残差平方和。
E
X
X
1
X
X
X
X
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Step4:构造得分统计量Score=nR2服从自由度为k 的卡方分布。查表检验整个方程的显著性。
注意:在第3步中,方便起见也可以用被解释变量的 拟合值作为解释变量。
3。BP 检验:做完回归后,使用命令: estat hettest ,normal(使用拟合值y )
estat hettest,rhs (使用方程右边的解释变量,而 不是y )
后两种现在已经基本不用。
1。画图:散点图和残差图。
1。残差图: rvfplot (residual-versus-fitted plot) rvpplot varname (residual-versuspredictor plot) 作图命令一定要在回归完成之后进行
Rvfplot, yline(0)
FGLS的步骤
(1) 对原方程用OLS进行估计,得到残差项
的估计û i , (2) 计算ln(û i2) (3) 用ln(û 2)对所有独立的解释变量进行回 归,然后得到拟合值 ĝi (4) 计算ĥi = exp(ĝi) (5) 用1/ ĥi 作为s gen lnu2=ln(u^2) reg lnu2 x1 x2… predict g,xb gen h=exp(g) gen invvar=1/h reg y x1 x2…[aweight=invvar] 使用FGLS方法对nerlove.dta的方程重新进 行估计。
检查是否具有异方差。 2。reg weight length mpg 检查是否具有异方差。 3。use production,clear
reg lny lnk lnl 检查是否具有异方差
4。use nerlove,clear reg lntc lnq lnpl lnpf lnpk 检验是否具有异方差
2 1
0
. 0
0 .. 0
2 2
...
0
.
...
.
0
...
2 n
一般截面数据容易产生异方差 而时间序列数据容易产生自相关
异方差的检验
1。残差图 2。怀特检验 3。Breusch-Pagan(BP)检验 4。 G-Q 检验 (Goldfeld-Quandt,1965) 5。 Szroeter's 秩检验(Szreter,1978)
2。怀特检验:
2。怀特检验命令: 做完回归后,使用命令: estat imtest, white
Breusch and Pagan 检验
根据异方差检验的基本思路,Breusch and Pagan(1979)和Cook and Weisberg (1983)
主要异思方路差:的用变量ei2作/a回vg归(。ei2) 对一系列可能导致
12
1n
n
n
1
n2
va1r)( co1 v ,(n) 2 0 2I
con v,(1) van r)( 0 2
此时可得:
Var(b) =σ2 (X'X)-1 不管是异方差还是自相关,都是无偏的、非 有效(一致)的。
误差项存在异方差:Var(u)主对角线上的元 素不相等 。
reg wage ttl_exp race age industry hours, r
2。广义最小二乘法(GLS)、加权最小二乘法 (WLS)以及可行广义最小二乘法(FGLS)。
广义最小二乘法是对原模型加权,使之变成一个新 的不存在异方差性的模型,然后采用普通最小二乘 法估计其参数。 加权最小二乘法就是对加了权重的残差平方和实施 OLS法:
对较小的残差平方ei2赋予较大的权数, 对较大的残差平方ei2赋予较小的权数。
其含义为 Var(b) =σ2 (X'X)-1(X'ΩX) (X'X)-1 通过加权使得Ω=I 因此,GLS和WLS要求Ω已知。
WLS方法
例如:假设我们知道异方差是由变量lnq引 起的,故对lnq实行WLS加权处理。 use nerlove,clear reg lntc lnq lnpl lnpf lnpk predict e1,res gen e2=e1^2 gen lne2=ln(e2) reg lne2 lnq,noc
最初的BP 检验假设扰动项服从正态分布,有一定局
限性。Koenker(1981)将此假定放松为iid,在
实际中较多采用,其命令为:
estat hettest, iid
estat hettest, rhs iid
1.sysuse auto,clear reg price weight length mpg
异方差和自相关
对于经典计量模型,我们的基本假设有:
假设 对于解释变量的所有观测值,随机误差项 有相同的方差。
V(a i)rE (i2)2 i 1,2,...n
V a r ( U ) E [ U E ( U ) ] [ U E ( U ) ] ' E ( U U ')
E(μμ)E 1
1
n
E
predict lne2f,xb gen e2f=exp(lne2f) reg lntc lnq lnpl lnpf lnpk [aw=1/e2f]
GLS和WLS的一个缺点是假设扰动项的 协方差矩阵为已知。这常常是一个不现 实的假定。因此,现代计量经济学多使 用“可行广义最小二乘法”(FGLS)。
e i2 /a v g ( e i2 ) a 0 a 1 X 1 a 2 X 2 ... a k X k u i
H0: a1=a2=...=0 (不存在) H1: a1,a2...不全为0 (存在)
Step1:估计原方程,提取残差,并求其平方ei2。 Step2:计算残差平方和的均值avg(ei2) 。 Step3:估计方程,被解释变量为ei2/avg(ei2) ,
异方差的处理
1。使用“异方差稳健标准差”(robust standard error):这是最简单,也是目前比较 流行的方法。只要样本容量较大,即使在异方差 的情况下,只要使用稳健标准差,则所有参数估 计、假设检验均可照常进行。
sysuse nlsw88, clear
reg wage ttl_exp race age industry hours