异方差习题及自相关1

合集下载

异方差练习题参考解答

异方差练习题参考解答

异方差练习题参考解答练习题1.设消费函数为i i i i u X X Y +++=33221βββ式中,i Y 为消费支出;i X 2为个人可支配收入;i X 3为个人的流动资产;i u 为随机误差项,并且222)(,0)(ii i X u Var u E σ==(其中2σ为常数)。

试回答以下问题: (1)选用适当的变换修正异方差,要求写出变换过程;(2)写出修正异方差后的参数估计量的表达式。

2.由表中给出消费Y 与收入X 的数据,试根据所给数据资料完成以下问题:(1)估计回归模型u X Y ++=21ββ中的未知参数1β和2β,并写出样本回归模型的书写格式; (2)试用Goldfeld-Quandt 法和White 法检验模型的异方差性; (3)选用合适的方法修正异方差。

Y X Y X Y X 5580 152 220 95 140 65 100 144 210 108 145 70 85 175 245 113 150 80 110 180 260 110 160 79 120 135 190 125 165 84 115 140 205 115 180 98 130 178 265 130 185 95 140 191 270 135 190 90 125 137 230 120 200 75 90 189 250 140 205 74 105 55 80 140 210 110 160 70 85 152 220 113 150 75 90 140 225 125 165 65 100 137 230 108 145 74 105 145 240 115 180 80 110 175 245 140 225 84 115 189 250 120 200 79 120 180 260 145 240 90 125 178 265 130185981301912703.表中的数据是美国1988研究与开发(R &D )支出费用(Y )与不同部门产品销售量(X ).试根据资料建立一个回归模型,运用Glejser 方法和White 方法检验异方差,由此决定异方差的表现形式并选用适当方法加以修正。

异方差与自相关问题

异方差与自相关问题

a
与 b 。 a 与 b 的线性相关系数,称为
q
z
的等级相关系数 。
(ai a )(bi b ) rs (ai a ) 2 (bi b ) 2
6 (ai bi ) 2 rs 1 n(n 2 1)
§5.2
等级相关检验
异方差问题
(a) 完成模型的OLS估计,获取残差数据
X 11 f ( X j1 ) X 12 f ( X j2 ) X 1n f ( X jn )

X k1 f ( X j1 ) X k2 f ( X j2 ) X kn f ( X jn )
~ Y
Y f (X j )
~ Xi
Xi f (X j )
1 1 1
X 11 X 12 X 1n

Y1 X k 1 f ( X j1 ) Y2 X k2 f ( X j2 ) Y n X kn f ( X jn )
1 f ( X j1 ) 1 f ( X j2 ) 1 f ( X jn )
第五章
异方差与自相关问题
除了本章讨论所涉及的同方差性与不自相关性以外,
关于线性回归模型的其它假定在本章中都成立。 ——广义最小平方估计; ——异方差模型及其估计; ——自相关模型及其估计; ——异方差模型、自相关模型的预测。
§5.1
广义最小平方法
同方差且不自相关
cov(U ) 2 I cov(U ) 2
ei ;
(b) 选择可能与异方差有关的解释变量 rs ( j ),计算变量 X j与变

e 的等级相关系数
(c) 计算统计量

异方差性自相关性和多重共线性思考与练习

异方差性自相关性和多重共线性思考与练习

第二章异方差性、自相关性和多重共线性思考与练习参考答案2.1参考答案答:随机误差项方差随观察单位而变的现象为异方差。

影响:(1)尽管OLS估计仍无偏,但起方差不再有效(即最小方差性不具备),且模型误差项方差估计有偏.(2)t检验、F 检验失效,从而对参数、模型整体的显著性判断不可靠.(3)预测精度低,模型的应用失效.2.2参考答案答:G---Q检验原理:(1)假定随机误差项方差σ2t 与某一解释变量Xti成正(负)相关;(2)对样本观察值按Xi升序排列后去除中间的部分样本值;(3)分别以剩下的两部分样本值为子样,利用OLS法计算各自的方差估计值;(4)以两子样的方差估计值构造F统计量,判断两子样的方差是否差异显著。

若显著,则存在异方差;否则反之。

White检验原理:通过构造辅助回归模型e2t =β+tipiix∑=1β+tjpjitiijxx∑=1,β来判断零假设H0:①E(Ut)=2σ(t=1,2,3……N) ,并且②模型设定Y=XB+U正确若检验显著,则否定零假设,从而认为存在异方差或者模型设定错误;若检验不显著,则接受零假设。

White、Park和Glecses检验均使用辅助回归模型来探测住回归方程系数显著性检验来探测异方差性。

其间区别在于:Park和Glecses检验是通过辅助回归方程系数显著性来探测异方差;而White检验则是通过辅助回归方程整体显著性来检验探测主回归模型是否存在异方差性或者设定误差。

2.3参考答案答:WLS发实质上为模型变换法.考虑回归模型Y t =b 0+b 1x t +U t ,假设其存在异方差性并且Var(U t )=2t σ=K 2其中K 为常数,对远模型使用权数为W t =1/)/(t x t 的WLS 法进行估计时,实质上是对原模型作了变换,变换后的形式为:)(t tx f Y =)(0t x f b +)(1t tx f x b +)(t tx f v经过转换后,模型的异方差性被清除了。

异方差练习题

异方差练习题

异方差练习题在统计学中,方差是用来衡量一组数据的离散程度的统计量。

如果我们要比较两组数据的方差是否相等,就需要进行异方差检验。

本文将介绍一些异方差检验的练习题,帮助读者巩固对于异方差的理解和应用。

题目一:某研究人员想要比较两种不同药物在治疗头痛方面的效果。

为此,他随机选取了两组患者,第一组患者接受药物A的治疗,第二组患者接受药物B的治疗。

研究人员在治疗结束后,记录了患者的头痛缓解时间(单位:分钟)如下:药物A: 40, 45, 50, 55, 60药物B: 20, 25, 30, 35, 40请用适当的统计方法检验这两组数据的方差是否相等,并给出相应的结论。

解答一:为了比较这两组数据的方差是否相等,我们可以使用F检验。

F检验的零假设是两组数据的方差相等。

首先,我们计算两组数据的方差。

对于药物A组的数据,方差为:方差A = ((40-50)^2 + (45-50)^2 + (50-50)^2 + (55-50)^2 + (60-50)^2) / (n-1) = 62.5对于药物B组的数据,方差为:方差B = ((20-30)^2 + (25-30)^2 + (30-30)^2 + (35-30)^2 + (40-30)^2) / (n-1) = 62.5其中n为每组的样本数,这里为5。

然后,我们计算F统计量:F = 方差A / 方差B = 62.5 / 62.5 = 1接下来,我们需要根据自由度来查找F分布表中的临界值。

在这个例子中,自由度为4和4(n-1),显著性水平选择为α = 0.05。

根据F分布表可以查到,当自由度为4和4,显著性水平为0.05时,临界值为2.866。

由于计算得到的F统计量(1)小于临界值(2.866),因此我们无法拒绝零假设,即两组数据的方差相等。

结论:根据F检验结果,我们无法拒绝两组数据的方差相等的零假设。

题目二:某市场调研公司想要研究某产品在不同年龄段消费者中的满意度是否存在差异。

异方差练习题参考解答

异方差练习题参考解答

异方差练习题参考解答练习题1.设消费函数为i i i i u X X Y +++=33221βββ式中,i Y 为消费支出;i X 2为个人可支配收入;i X 3为个人的流动资产;i u 为随机误差项,并且222)(,0)(i i i X u Var u E σ==(其中2σ为常数)。

试回答以下问题:(1)选用适当的变换修正异方差,要求写出变换过程;(2)写出修正异方差后的参数估计量的表达式。

2.由表中给出消费Y 与收入X 的数据,试根据所给数据资料完成以下问题: (1)估计回归模型u X Y ++=21ββ中的未知参数1β和2β,并写出样本回归模型的书写格式;(2)试用Goldfeld-Quandt 法和White 法检验模型的异方差性; (3)选用合适的方法修正异方差。

Y X Y X Y X 55 80 152 220 95 140 65 100 144 210 108 145 70 85 175 245 113 150 80 110 180 260 110 160 79 120 135 190 125 165 84 115 140 205 115 180 98 130 178 265 130 185 95 140 191 270 135 190 90 125 137 230 120 200 75 90 189 250 140 205 74 105 55 80 140 210 110 160 70 85 152 220 113 150 75 90 140 225 125 165 65 100 137 230 108 145 74 105 145 240 115 180 80 110 175 245 140 225 84 115 189 250 120 200 79 120 180 260 14524090125178265130185981301912703.表中的数据是美国1988研究与开发(R&D)支出费用(Y)与不同部门产品销售量(X)。

异方差性习题及答案

异方差性习题及答案

异⽅差性习题及答案异⽅差性⼀、单项选择1.Goldfeld-Quandt ⽅法⽤于检验()A.异⽅差性B.⾃相关性C.随机解释变量D.多重共线性2.在异⽅差性情况下,常⽤的估计⽅法是()A.⼀阶差分法B.⼴义差分法C.⼯具变量法D.加权最⼩⼆乘法3.White 检验⽅法主要⽤于检验()A.异⽅差性B.⾃相关性C.随机解释变量D.多重共线性4.Glejser 检验⽅法主要⽤于检验()A.异⽅差性B.⾃相关性C.随机解释变量D.多重共线性5.下列哪种⽅法不是检验异⽅差的⽅法()A.⼽德菲尔特——匡特检验B.怀特检验C.⼽⾥瑟检验D.⽅差膨胀因⼦检验6.当存在异⽅差现象时,估计模型参数的适当⽅法是()A.加权最⼩⼆乘法B.⼯具变量法C.⼴义差分法D.使⽤⾮样本先验信息7.加权最⼩⼆乘法克服异⽅差的主要原理是通过赋予不同观测点以不同的权数,从⽽提⾼估计精度,即()A.重视⼤误差的作⽤,轻视⼩误差的作⽤B.重视⼩误差的作⽤,轻视⼤误差的作⽤C.重视⼩误差和⼤误差的作⽤D.轻视⼩误差和⼤误差的作⽤8.如果⼽⾥瑟检验表明,普通最⼩⼆乘估计结果的残差i e 与i x 有显著的形式i i i v x e +=28715.0的相关关系(i v满⾜线性模型的全部经典假设),则⽤加权最⼩⼆乘法估计模型参数时,权数应为() A. i x B. 21i x C. i x 1 D. i x 19.如果⼽德菲尔特——匡特检验显著,则认为什么问题是严重的()A.异⽅差问题B.序列相关问题C.多重共线性问题D.设定误差问题10.设回归模型为i i i u bx y +=,其中i i x u Var 2)(σ=,则b 的最有效估计量为() A. ∑∑=2?x xy b B. 2 2)(?∑∑∑∑∑--=x x n y x xy n b C. x y b =? D. ∑=x y n b 1?⼆、多项选择1.下列计量经济分析中那些很可能存在异⽅差问题()A.⽤横截⾯数据建⽴家庭消费⽀出对家庭收⼊⽔平的回归模型B.⽤横截⾯数据建⽴产出对劳动和资本的回归模型C.以凯恩斯的有效需求理论为基础构造宏观计量经济模型D.以国民经济核算帐户为基础构造宏观计量经济模型E.以30年的时序数据建⽴某种商品的市场供需模型2.在异⽅差条件下普通最⼩⼆乘法具有如下性质()A 、线性B 、⽆偏性C 、最⼩⽅差性D 、精确性E 、有效性3.异⽅差性将导致A 、普通最⼩⼆乘法估计量有偏和⾮⼀致B 、普通最⼩⼆乘法估计量⾮有效C 、普通最⼩⼆乘法估计量的⽅差的估计量有偏D 、建⽴在普通最⼩⼆乘法估计基础上的假设检验失效E 、建⽴在普通最⼩⼆乘法估计基础上的预测区间变宽4.下列哪些⽅法可⽤于异⽅差性的检验()A 、DW 检验B 、⽅差膨胀因⼦检验法C 、判定系数增量贡献法D 、样本分段⽐较法E 、残差回归检验法5.当模型存在异⽅差现象进,加权最⼩⼆乘估计量具备()A 、线性B 、⽆偏性C 、有效性D 、⼀致性E 、精确性6.下列说法正确的有()A 、当异⽅差出现时,最⼩⼆乘估计是有偏的和不具有最⼩⽅差特性B 、当异⽅差出现时,常⽤的t 和F 检验失效C 、异⽅差情况下,通常的OLS 估计⼀定⾼估了估计量的标准差D 、如果OLS 回归的残差表现出系统性,则说明数据中不存在异⽅差性E 、如果回归模型中遗漏⼀个重要变量,则OLS 残差必定表现出明显的趋势三、名词解释1.异⽅差性2.格德菲尔特-匡特检验3.怀特检验4.⼽⾥瑟检验和帕克检验四、简答题1.什么是异⽅差性?试举例说明经济现象中的异⽅差性。

异方差与自相关

异方差与自相关

七、 异方差与自相关一、背景我们讨论如果古典假定中的同方差和无自相关假定不能得到满足,会引起什么样的估计问题呢?另一方面,如何发现问题,也就是发现和检验异方差以及自相关的存在性也是一个重要的方面,这个部分就是就这个问题进行讨论。

二、知识要点1、引起异方差的原因及其对参数估计的影响2、异方差的检验(发现异方差)3、异方差问题的解决办法4、引起自相关的原因及其对参数估计的影响5、自相关的检验(发现自相关)6、自相关问题的解决办法 (时间序列部分讲解) 三、要点细纲1、引起异方差的原因及其对参数估计的影响原因:引起异方差的众多原因中,我们讨论两个主要的原因,一是模型的设定偏误,主要指的是遗漏变量的影响。

这样,遗漏的变量就进入了模型的残差项中。

当省略的变量与回归方程中的变量有相关关系的时候,不仅会引起内生性问题,还会引起异方差。

二是截面数据中总体各单位的差异。

后果:异方差对参数估计的影响主要是对参数估计有效性的影响。

在存在异方差的情况下,OLS 方法得到的参数估计仍然是无偏的,但是已经不具备最小方差性质。

一般而言,异方差会引起真实方差的低估,从而夸大参数估计的显著性,即是参数估计的t 统计量偏大,使得本应该被接受的原假设被错误的拒绝。

2、异方差的检验 (1)图示检验法由于异方差通常被认为是由于残差的大小随自变量的大小而变化,因此,可以通过散点图的方式来简单的判断是否存在异方差。

具体的做法是,以回归的残差的平方2i e 为纵坐标,回归式中的某个解释变量i x 为横坐标,画散点图。

如果散点图表现出一定的趋势,则可以判断存在异方差。

(2)Goldfeld-Quandt 检验Goldfeld-Quandt 检验又称为样本分段法、集团法,由Goldfeld 和Quandt 1965年提出。

这种检验的思想是以引起异方差的解释变量的大小为顺序,去掉中间若干个值,从而把整个样本分为两个子样本。

用两个子样本分别进行回归,并计算残差平方和。

异方差性习题与答案

异方差性习题与答案

第五章 异方差性习题与答案1、产生异方差的后果是什么?2、下列哪种情况是异方差性造成的结果? (1)OLS 估计量是有偏的(2)通常的t 检验不再服从t 分布。

(3)OLS 估计量不再具有最佳线性无偏性。

3、已知模型:i i i i u X X Y +++=22110βββ式中,i Y 为某公司在第i 个地区的销售额;i X 1为该地区的总收入;i X 2为该公司在该地区投入的广告费用(i=0,1,2……,50)。

(1)由于不同地区人口规模i P 可能影响着该公司在该地区的销售,因此有理由怀疑随机误差项u i 是异方差的。

假设i σ依赖于总体i P 的容量,逐步描述你如何对此进行检验。

需说明:A 、零假设和备择假设;B 、要进行的回归;C 、要计算的检验统计值及它的分布(包括自由度);D 、接受或拒绝零假设的标准。

(2)假设i i P σσ=。

逐步描述如何求得BLUE 并给出理论依据。

4、下表数据给出按学位和年龄划分的经济学家的中位数工薪: 表1 经济学家的工资表年 龄 中位数工薪(以千美元计算) 硕士 博士 25-29 8.0 8.8 30-34 9.2 9.6 35-39 11.0 11.0 40-44 12.8 12.5 45-49 14.2 13.6 50-54 14.7 14.3 55-59 14.5 15.0 60-64 13.5 15.0 65-6912.015.0(1)有硕士学位和有博士学位经济学家的中位数工薪的方差相等么? (2)如果相等,你会怎样检验两组平均中位数工薪相等的假设?(3)在年龄35至5岁之间的经济学家,有硕士学位的比有博士学位的赚更多的钱,那么你会怎样解释这一发现?5、为了解美国工作妇女是否受到歧视,可以用美国统计局的“当前人口调查”中的截面数据,研究男女工资有没有差别。

这项多元回归分析研究所用到的变量有: W —雇员的工资率(美元/小时) 1表示雇员为女性, 0表示女性意外的雇员。

eviews异方差、自相关检验与解决办法

eviews异方差、自相关检验与解决办法

eviews异方差、自相关检验与解决办法一、异方差检验:1.相关图检验法LS Y C X 对模型进行参数估计GENR E=RESID 求出残差序列GENR E2=E^2 求出残差的平方序列SORT X 对解释变量X排序SCAT X E2 画出残差平方与解释变量X的相关图2.戈德菲尔德——匡特检验已知样本容量n=26,去掉中间6个样本点(即约n/4),形成两个样本容量均为10的子样本。

SORT X 将样本数据关于X排序SMPL 1 10 确定子样本1LS Y C X 求出子样本1的回归平方和RSS1SMPL 17 26 确定子样本2LS Y C X 求出子样本2的回归平方和RSS2计算F统计量并做出判断。

解决办法3.加权最小二乘法LS Y C X 最小二乘法估计,得到残差序列GRNR E1=ABS(RESID) 生成残差绝对值序列LS(W=1/E1) Y C X 以E1为权数进行加权最小二成估计二、自相关1.图示法检验LS Y C X 最小二乘法估计,得到残差序列GENR E=RESID 生成残差序列SCAT E(-1) E et—et-1的散点图PLOT E 还可绘制et的趋势图2.广义差分法LS Y C X AR(1) AR(2)首先,你要对广义差分法熟悉,不是了解,如果你是外行,我奉劝你还是用eviews来做就行了,其实我想老师要你用spss无非是想看你是否掌握广义差分,好了,废话不多说了。

接着,使用spss16来解决自相关。

第一步,输入变量,做线性回归,注意在Liner Regression 中的Statistics中勾上DW,在save中勾Standardized,查看结果,显然肯定是有自相关的(看dw值)。

第二步,做滞后一期的残差,直接COPY数据(别告诉我不会啊),然后将残差和滞后一期的残差做回归,记下它们之间的B指(就是斜率)。

第三步,再做滞后一期的X1和Y1,即自变量和因变量的滞后一期的值,也是直接COPY。

第10章习题参考答案

第10章习题参考答案

第十章误差项自相关与异方差习题参考答案1. 由于自相关和异方差都是对随机误差项球形假定cov(μ)=σμ2I的违背,因此对OLS回归的影响是基本相同。

具体而言,虽然随机误差项自相关不会影响OLSE的线性、无偏性和一致性,但是会导致OLSE不再具备有效性,并造成统计推断不可靠以及因变量的预测精度降低。

2.(1)错误。

自相关系数为1的准(广义)差分变换相当于一阶差分变换。

(2)错误。

当模型的误差项自相关时,OLS估计量是无偏的和无效的。

(3)正确。

当d L<DW<d U时,处于检验盲区,无法确定是否存在自相关。

(4)正确。

被排除的应该包含在模型中自变量带来的系统性误差被并入随机误差项中,此时系统误差的自相关性表现为误差项的自相关。

显著的LM统计量也意味着随机误差项在不同时期取值之间存在相关性。

因此,从回归模型中排除一个(或多个)应含的自变量可能导致LM统计量显著。

(5)错误。

两个模型有不同的因变量,不可以直接比较两个模型的拟合优度。

3.(1)样本容量T=21,自变量个数k=3,按照显著性水平0.05,查DW临界值表可知,d L=1.026,d U=1.669。

由于d=0.81< d L,所以存在一阶正自相关问题。

(2)样本容量T=15,自变量个数k=2,按照显著性水平0.05,查DW临界值表可知,d L=0.946,d U=1.543。

由于4-d L<d=3.48<4,所以存在一阶负自相关问题。

(3)样本容量T=30,自变量个数k=5,按照显著性水平0.05,查DW临界值表可知,d L=1.071,d U=1.883。

由于d L<d=1.56<d U,所以无法确定是否存在自相关问题。

(4)样本容量T=35,自变量个数k=4,按照显著性水平0.05,查DW临界值表可知,d L=1.222,d U =1.726。

由于4- d U<d=2.64<4-d L,所以无法确定是否存在自相关问题。

计量经济学第五章异方差性参考答案讲解

计量经济学第五章异方差性参考答案讲解

计量经济学第五章异⽅差性参考答案讲解第五章异⽅差性课后题参考答案 5.1(1)因为22()i i f X X =,所以取221iiW X =,⽤2i W 乘给定模型两端,得 312322221i i ii i i i Y X u X X X X βββ=+++ 上述模型的随机误差项的⽅差为⼀固定常数,即22221()()i i i iu Var Var u X X σ==(2)根据加权最⼩⼆乘法,可得修正异⽅差后的参数估计式为***12233Y X X βββ=-- ()()()()()()()***2****22232322322*2*2**2223223?i i i i i i i i i i i i i i i i i iW y x W x W y x W x x W x W x W x x β-=-∑∑∑∑∑∑∑()()()()()()()***2****23222222332*2*2**2223223?ii ii i i iii i i ii i i i i iW y x W x W y x W x x Wx W x W x x β-=-∑∑∑∑∑∑∑其中22232***23222,,iii i i i iiiW XW X W Y X X Y WWW ===∑∑∑∑∑∑******222333i i i i i x X X x X X y Y Y=-=-=- 5.2 (1)2222211111 ln()ln()ln(1)1 u ln()1Y X Y X Yu u X X X u ββββββββββ--==+≈=-∴=+ [ln()]0 ()[ln()1][ln()]11E u E E u E u µ=∴=+=+=⼜(2)[ln()]ln ln 0 1 ()11i i iiP P i i i i P P i i E P E µµµµµµµ===?====∑∏∏∑∏∏不能推导出所以E 1µ()=时,不⼀定有E 0µ(ln )= (3)对⽅程进⾏差分得:1)i i βµµ--i i-12i i-1lnY -lnY =(lnX -X )+(ln ln则有:1)]0i i µµ--=E[(ln ln5.3(1)该模型样本回归估计式的书写形式为:Y = 11.44213599 + 0.6267829962*X (3.629253) (0.019872)t= 3.152752 31.5409720.944911R =20.943961R = S.E.=9.158900 DW=1.597946 F=994.8326(2)⾸先,⽤Goldfeld-Quandt 法进⾏检验。

异方差与序列自相关的作业

异方差与序列自相关的作业
,以时间为横轴,问哪幅图显示的是序列正自相关?(此题不做) 2. 用 1992-2012 年的年度 GDP 对货币供给量(M)和财政支出(E)进行回归: GDP = ������0 + ������1 ∗ ������ + ������2 ∗ ������ (1)得到 DW 值为 3.65,请判断是否存在序列自相关问题? (2)如果存在,请问在现有的已知条件下,如何消除序列自相关?为什么?(写出 步骤与过程) (3)如果已知如下回归方程: ������������������������ = 1250 + 0.712 ∗ ������������ + 0.627 ∗ ������������−1 − 0.911 ∗ ������������������������−1 则第 2 问中消除自相关的过程可以有什么样的替代措施?
异方差作业
1. 某回归方程为:Y = ������0 + ������1 ∗ ������ + ������。使用截面数据进行回归,结果如下: Y = 250.67 + 0.83 ∗ ������ t = 3.45 (2.24) ������ 2 = 0.89 Glezser test 的结果如下: ������ ∗ ������ 2 = 25.65; ������������������������ ������ℎ������������������������������������������ = 0.032 (1) 请判断上述回归是否存在异方差?为什么? (2) 如果已知如下三个辅助回归: e = 0.03 ∗ ������ 1.05 ,其中的 e 表示原始回归的残差。 e = 0.12 ∗ ������ 2 1.05 e = 3.53 ∗ X 2.38 请问,为了消除原始回归方程的异方差,你会怎么做? (3) 如果已知如下回归: Ln ������ 2 = 25.38 + 0.62 ∗ ������������(������) t = 4.12 (3.24) 请问,为了消除原始回归方程的异方差,你会怎么做?

多重共线性 异方差 序列自相关 思考题

多重共线性 异方差 序列自相关 思考题

A.异方差性
B.自相关性
C.随机解释变量
D.多重共线性
42、逐步回归法既检验又修正了____
A.异方差性
B.自相关性
C.随机解释变量
D.多重共线性
43、在下列产生异方差的原因中,不正确的是____
A.设定误差
B.截面数据
C.样本数据的观测误差
D.解释变量的共线性
44、在下列产生序列自相关的原因中,不正确的是____
C. Durbin 两步法
D. 移动平均法
35、违背零均值假定的原因是____
A.变量没有出现异常值
B.变量出现了异常值
C.变量为正常波动
D.变量取值恒定不变
36、对违背零均值的情况可采用引入虚拟变量的方法,这时会对____产生影响
A.斜率系数
B.截距项
C.解释变量
D.模型的结构
37、在下列多重共线性产生的原因中,不正确的是____
B.yt−1 = β1 + β 2 xt−1 + ut−1 D.yt − ρyt−1 = β1 (1 − ρ ) + β 2 (xt − ρxt−1 ) + ut − ρut−1
21、在 DW 检验中要求有假定条件,在下列条件中不正确的是____
A.解释变量为非随机的
B.随机误差项为一阶自回归形式
C.线性回归模型中不应含有滞后内生变量为解释变量 D.线性回归模型为一元回归形式
A.经济本变量大多存在共同变化趋势
B.模型中大量采用滞后变量
C.由于认识上的局限使得选择变量不当
D.解释变量与随机误差项相关
38、多重共线性的程度越____,参数估计值越____
A.严重 能确定

多重共线性-异方差-自相关习题

多重共线性-异方差-自相关习题

第4章 多重共线性一 单项选择题1. 在线性回归模型中,若解释变量X1和X2的观测值成比例, 既有X1=kX2,其中K 为非零常数,则表明模型中存在A. 异方差B.多重共线性C.序列相关D.随机解释变量2. 对于模型i i i i u X X Y +++=22110βββ,与15.012=r 时,估计量1ˆβ的方差VAR 1ˆβ将是原来的 A. 1倍 B.1.023倍 C.1.96倍 D.2倍3. 如果方差膨胀因子VIF=15,则认为( )问题是严重的A. 异方差问题B.序列相关C.多重共线性D.解释变量与随即项的相关性4. 一般多重共线性下参数估计量A. 不存在B.有无穷多解C. 唯一D. 非有效5. 完全多重共线性下参数估计量A. 不存在B.有无穷多解C. 唯一D. 非有效6. 下列方法中,可克服多重共线性的是A. 差分法B. 加权最小二乘法C.工具变量法D.广义最小二乘法二 多选1. 多重共线性产生的主要原因是A. 经济变量之间往往存在同方向变化的趋势B. 经济变量之间往往存在密切的关联度C.在模型中采用滞后变量也容易产生多重共线性D.在建模过程中由于解释变量选择不当,引起变量之间的多重共线性E.以上都不正确2.检验多重共线性严重性的方法有A.等级相关系数B.方差膨胀因子C.工具变量法D.判定系数检验法E.逐步回归法3.当模型解释变量间存在高度的多重共线性时A.各个解释变量对被解释变量的影响将难于精确鉴别B.部分解释变量与随机干扰项之间将高度相关C.估计量的精确度大幅下降D.模型的随机误差项也将序列相关4.多重共线性解决方法有A.保留重要的解释变量,去掉次要的或可替代的解释变量B.利用先验信息改变参数的约束形式C.变换模型的形式D.综合使用时间数据与截面数据E.逐步回归法以及增加样本容量三、判断题1.当用于检验方程显著性的F统计量与检验单个系数显著性的T统计量结果矛盾时,可以认为出现了严重的多重共线性2.当存在严重的多重共线性时,普通最小二乘法往往会低估参数估计量的方差。

放宽基本假定的模型--异方差课本试验及练习讲解

放宽基本假定的模型--异方差课本试验及练习讲解

一、异方差性1.中国农村居民人均消费支出主要由人均纯收入来决定。

农村人均纯收入除从事农业经营的收入外,还包括从事其他产业的经营性收入以及工资性收入、财产收入和转移支出收入等。

为了考察从事农业经营的收入和其他收入对中国农村居民消费支出增长的影响,可使用如下双对数模型:ln Y = p +0ln X + 0 ln X + u其中丫表示农村家庭人均消费支出,X 1表示从事农业经营的收入,X2表示其他收入。

表4.1.1列出了中国2001年各地区农村居民家庭人均纯收入及消费支出的相关数据。

表4.1.1中国2001年各地区农村居民家庭人均纯收入与消费支出从事农业从事农业地区人均消费经营的收其他收入地区支出丫入X1 X2人均消费经营的收其他收入支出丫入X1 X2北京3552.1 579.1 4446.4 湖北2703.36 1242.9 2526.9天津2050.9 1314.6 2633.1 湖南1550.62 1068.8 875.6 河北1429.8 928.8 1674.8 广东1357.43 1386.7 839.8山西1221.6 609.8 1346.2 广西1475.16 883.2 1088 内蒙古1554.6 1492.8 480.5 海南1497.52 919.3 1067.7辽宁1786.3 1254.3 1303.6 重庆1098.39 764 647.8 吉林1661.7 1634.6 547.6 四川1336.25 889.4 644.3 黑龙江1604.5 1684.1 596.2 贵州1123.71 589.6 814.4 上海4753.2 652.5 5218.4 云南1331.03 614.8 876 江苏2374.7 1177.6 2607.2 西藏1127.37 621.6 887 浙江3479.2 985.8 3596.6 陕西1330.45 803.8 753.5 安徽1412.4 1013.1 1006.9 甘肃1388.79 859.6 963.4 福建2503.1 1053 2327.7 青海1350.23 1300.1 410.3 江西1720 1027.8 1203.8 宁夏2703.36 1242.9 2526.9山东河南1905 1293 1511.6 新疆1375.6 1083.8 1014.11550.62 1068.8 875.6用OLS 法进行估计,结果如下:Dependent Variable: LOG(Y) Method: Least SquaresDate: 07/03/08 Time: 16:31 Sample: 1 31Included observations: 31VariableCoefficient Std. Error t-Statistic Prob. C 1.602528 0.860978 1.861288 0.0732 LOG(X1) 0.325416 0.103769 3.135955 0.0040 LOG(X2)0.5070780.04859910.43385□ ,□□00R-squared□796506 Mean dependent var 7.448704 Adjusted R-squared □781971 S.D. dependent var 0.364648 S.E. of regression 0.170267 Akaike info criterion -0.611128 Sum squared resid 0.811747 Schwarz criterion -0.472355Log likelihood12,47249 F-statistic54,79806 Durbin-Watson stat1.964720Prob(F-statistic)0.000000对应的表达式为:In Y = 1.603 + 0.325ln X 1 + 0.507ln X 2(1.86) (3.14) (10.43)R 2 = 0.7965, R = 0.78, RSS = 0.8117不同地区农村人均消费支出的差别主要来源于非农经营收入及其他收入的差 别,因此,如果存在异方差性,则可能是X 2引起的。

异方差、自相关检验及修正

异方差、自相关检验及修正

异方差、自相关的检验与修正实验目的:通过对模型的检验掌握异方差性问题和自相关问题的检验方法及修正的原理,以及相关的Eviews 操作方法。

模型设定:εβββ+++=23121i i i X X YYi----人均消费支出X1--从事农业经营的纯收入X2--其他来源的纯收入 中国内地2006年各地区农村居民家庭人均纯收入与消费支出 单位:元 城市 y x1 x2 城市 y x1 x2 北京 5724.5 958.3 7317.2 湖北 2732.5 1934.6 1484.8 天津 3341.1 1738.9 4489 湖南 3013.3 1342.6 2047 河北 2495.3 1607.1 2194.7 广东 3886 1313.9 3765.9 山西 2253.3 1188.2 1992.7 广西 2413.9 1596.9 1173.6 内蒙古 2772 2560.8 781.1 海南 2232.2 2213.2 1042.3 辽宁 3066.9 2026.1 2064.3 重庆 2205.2 1234.1 1639.7 吉林 2700.7 2623.2 1017.9 四川 2395 1405 1597.4 黑龙江 2618.2 2622.9 929.5 贵州 1627.1 961.4 1023.2 上海 8006 532 8606.7 云南 2195.6 1570.3 680.2 江苏 4135.2 1497.9 4315.3 西藏 2002.2 1399.1 1035.9 浙江 6057.2 1403.1 5931.7 陕西 2181 1070.4 1189.8 安徽 2420.9 1472.8 1496.3 甘肃 1855.5 1167.9 966.2 福建 3591.4 1691.4 3143.4 青海 2179 1274.3 1084.1 江西 2676.6 1609.2 1850.3 宁夏 2247 1535.7 1224.4 山东 3143.8 1948.2 2420.1 新疆 2032.4 2267.4 469.9 河南 2229.3 1844.6 1416.4 数据来源:《中国农村住户调查年鉴(2007)》、《中国统计年鉴(2007)》参数估计:估计结果如下:2709030.01402097.01402.728X X Y ++=Λ(2.218) (2.438) (16.999) 922173.02=R D.W.=1.4289 F=165.8853 SE=395.2538实验步骤:一、检查模型是否存在异方差1.图形分析检验(1)散点相关图分析分别做出X1和Y 、X2和Y 的散点相关图,观察相关图可以看出,随着X1、X2的增加,Y 也增加,但离散程度逐步扩大,尤其表现在X1和Y .这说明变量之间可能存在递增的异方差性。

第五讲 异方差和自相关.

第五讲 异方差和自相关.

3。BP 检验:做完回归后,使用命令: estat hettest ,normal(使用拟合值yˆ ) estat hettest,rhs (使用方程右边的解释变量,而 不是yˆ ) 最初的BP 检验假设扰动项服从正态分布,有一定局 限性。Koenker(1981)将此假定放松为iid,在 实际中较多采用,其命令为: estat hettest, iid estat hettest, rhs iid
可行广义最小二乘法(FGLS):广义差分法: CO-PW方法Cochrane-Orcutt(1949) 估计 (舍弃第一期观察值) Prais-Winsten(1954) 估计(对第一期观察值 进行处理 sqrt(1-rho^2)*y1)
Cochrane-Orcutt(1949) 估计(舍弃第一期观察 值) prais D.rs LD.r20,corc prais D.rs LD.r20,rho(dw) corc Prais-Winsten(1954) 估计(对第一期观察值进行 处理 sqrt(1-rho^2)*y1) prais D.rs LD.r20 prais D.rs LD.r20,rho(dw) 时间序列一般样本不会太大,因此不要轻易舍弃。
2 2
H0: a1=a2=...=0 (不存在) H1: a1,a2...不全为0 (存在)
Step1:估计原方程,提取残差,并求其平方ei2。 Step2:计算残差平方和的均值avg(ei2) 。
Step3:估计方程,被解释变量为ei2/avg(ei2) , 解释变量依然为原解释变量。 Step4:构造统计量Score=0.5*RSS服从自由度为 k的卡方分布。查表检验整个方程的显著性。 注意:在第3步中,方便起见也可以用被解释变量的 拟合值作为解释变量。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

DW检验:过去曾一度流行。但只能检验一阶自相 关且要求扰动项服从严格外生性假设。不实用。
使用OLS+异方差自相关稳健的标准差:仍然使用 OLS来估计回归系数,但使用“异方差自相关稳健的 标准差”(Heteroskedasticity and Autocorrelation Consistent Standard Error,简记HAC).这种方法被称为 Newey-West估计法,它只改变标准差的估计值,并 不改变回归系数的估计值。
内插值或季节调整时,则从理论上可判断存在自相关。
统计局提供的某些数据可能已经事先经过了这些人为 处理。
设定误差:如果模型设定中遗漏了某个自相关的解 释变量,并被纳入到了扰动项中,则会引起扰动项 的自相关。
画图:可以将残差et与之后残差et-1画成散点图, 也可以画自相关与偏相关图,显示各阶样本自相关 系数。
1下列关于扰动项协方差矩阵的假设,不存在异方 差的是( )
A B C D
1, 2,3
VAR(i
)
4,
5,
6
7,8,9
1, 0, 0
VAR(i
)
0,
5,
0
0, 0,9
1, 0,1
VAR(i
)
0,1,
0
0, 0,1
0.3, 0, 0
VAR(i
)
0,
0.3,
0
0, 0, 0.3
项用0来代替,以保持样本容量仍为n,使用统计量
这是stata默认的方法
Box-Pierce Q检验:定义残差的各阶样本自相关系 数为
用这个自相关系数平方和的n倍作为统计变量。 经过改进的Ljuang-Box Q统计量为
这两种Q统计量在大样本下是等价的,但LjuangBox Q 统计量的小样本性质更好,故为Stata所采用。
辅由助于回使归用的了样滞本后容残量差仅值为ent--pp,,损使失用了统p计个量样本值,故
如果超过临界值,则拒绝无自相关的假
设,这个检验被称为Breusch-Godfrey检验
(Breusch,1978;Godfrey,1978)。Davidson and
Mackinnon(1993)建议把残差向量e中因滞后而缺失的
.05 .1
0
-.05 -.1
-.1
-.05
0
.05
.1
rel1
Residuals
Fitted values
BG检验:考虑扰动项的p阶自回归过程:
检验原假设
。由于扰动项不可观测,
故用残差et来代替。并引入所有解释变量(为了消除
扰动项与不同期的解释变量相关的情况即不满足严
格外生性的情况),考虑以下辅助回归:
阵外,还必须要满足严格外生性假设,仅仅满足前 定解释变量会导致FGLS不一致。
修改模型法:许多情况下,存在自相关的深层原因
是模型本身的设定有误,比如遗漏了自相关的解释
变量。例如真实模型为
如果错误
地被估计为
则会导致扰动项vt自
相关
滞后算子与差分算子:L.滞后一阶。L2.滞后两 阶……D.X=Xt-Xt-1,D2.X=Xt-Xt-2 自相关与偏相关图:ac; pac BG检验:estat bgodfrey 默认p=1
4 下列散点图中最不可能存在异方差的是( )
1
4
A
2
B
.5
Residuals
0
Residuals
0
-2
-4
-.52Βιβλιοθήκη 2.533.5
4
Fitted values
0
5
10
15
20
25
recent unemp duration
2000 4000 6000
2000 4000 6000
Residuals
Residuals
准差分法(quasi differences):原模型为 滞后一期后方程两边同时乘以ρ得到 两式相减 新扰动项服从球型扰动假设
实际软件运行中通过迭代得到最终结果,即不断重 复估计ρ与β直到,这最近一次两者的估计值和上一 次的估计值差距足够小。
应用FGLS的前提:应用FGLS解决自相问题比解决 异方差问题更不稳健,除了要求准确估计协方差矩
以全班同学为样本,聚类变量可以是哪些?
使用可行广义最小二乘法(FGLS):与处理异方差
异一样,可以用FGLS估计模型,前提是要确切估计
扰动项的方差形式,并且为了FGLS可行,必须做简
化假设,在自相关的问题里,我们一般假设存在一
阶自相关
,很容易计算,
在这种假设条件下,扰动项的协方差矩阵为
所以只要估计一个参数就能应用FGLS了。
estat bgodfrey,lags(p) 可以看自相关与偏 相关图确定滞后阶数
estat bgodfrey ,nomiss0 不添加0
Ljuang-Box Q检验:wntestq res(使用stata提供 的默 认滞后期)
wntestq el,lags(p)
DW检验:estat dwatson HAC稳健标准差:newey y x1 x2 x3,lag(p) reg y x1 x2 x3,cluster(state)聚类稳健标准差 处理一阶自相关的FGLS: prais y x1 x2 x3(默认为 PW估计法);prais y x1 x2,corc(使用CO估计法)
C
-4000 -2000
0
D
2000
4000
6000
8000
Fitted values
10000
12000
-4000 -2000
0
10
20
30
40
Mileage (mpg)
5 某人用150个样本数据,研究产量、劳动力成本、 燃料价格对总成本的影响,如果用怀特检验来检验 异方差的存在性,则应该用的统计量为( )
何为自相关:违反球型扰动假设的另一情形是自相
关。如果i≠j,
,即扰动项的协方差矩阵非
主对角线元素不全为0,则称存在“自相关”
(autocorrelation)或“序列相关”(serial
correlation)
自相关的后果:
OLS仍然无偏且一致
OLS估计量依然服从渐进正态分布
OLS估计量方差VAR(b|X)的表达式不再是
2 下列关于异方差表述正确的是( )
A 单纯的异方差问题对系数估计的一致性没有影响
B 单纯的异方差问题对系数估计的有效性没有影响
C 存在异方差的情况下t检验与F检验仍是准确的
D异方差普遍存在于时间序列数据中
3 下列样本数据最不可能产生异方差的是( ) A 全国所有企业的年产值数据 B 不同班级的平均分数据 C 成人与少年的身高数据 D 3岁幼儿的牙齿数量
A. F(3,146) B. t(146) C 2(9) D F(3,147)
6 某人分别用怀特检验和BP检验来验证异方差的 存在性,其结果如下所示,则说法正确的是( )
A 怀特检验显示不存在异方差 B BP检验显示存在异方差 C 异方差可能是由于解释变量而产生的 D 异方差可能由解释变量的交互项产生
转换之后的模型为:
用OLS估计这个转换后的方程模型,即为“PraisWinsten估计法”(Prais and Winsten,1954,简记为 PW)。如果为了计算方便而将第一个方程删去,则称 为“Cochrane-Orcutt估计法”( Cochrane and Orcutt,1949,简记为CO)。
7 某人的计量模型检验存在异方差,并且测算出扰 动项的协方差矩阵的估计值为一对角矩阵V(X),则下 列说法正确的是( )
A 如果用FWLS进行估计权重为V(X)-1 B 最有效的估计是OLS+稳健标准差 C 如果用FWLS进行估计,权重为V(X) D 样本容量较小时可以直接用OLS估计得到一致估 计值
,因此t检
验与F检验失效
高斯马尔科夫订立不再成立,即OLS不再是BLUE。
由于自相关的存在,使得根据样 本数据估计的回归线上下摆动幅 度增大,导致参数估计变得不准
确。
时间序列数据:由于经济活动通常具有某种连续性
或持久性,自相关现象在时间序列中比较常见。相邻 两年的GDP增长率、通货膨胀率。 截面数据中的自相关:一般来说,截面数据不容易 出现自相关,但相邻的观测单位之间也可能存在”溢出 效应”,这种自相关也称为“空间自相关”(spatial autocorrelation).比如相邻的省份、国家之间的经济活 动互相影响;相邻地区的产业产量受类似的天气变化 影响;同一社区的房价…… 对数据的人为处理:如果数据中包含移动平均数,
在使用Newey-West估计法时需要指定自相关阶数, 一般建议取p=n1/4或p=0.75n1/3 为什么不能继续用异方差稳健标准差进行估计?
因为推导异方差稳健标准差的过程中,引入了扰动 不相关的假设即gi=xi*εi为鞅差分序列的假定。
使用OLS+聚类稳健的标准差:如果样本观测值可 以分为不同聚类(cluster),在同一聚类内的观测值 互相相关,而不同聚类之间的观测值不相关,这种 样本称为聚类样本(cluster sample).例如 Nerlove(1963)的例子中,同一个州的电力企业可以 作为一个聚类,此时州(state)被称为聚类变量 (cluster variable)。如果将观测值按聚类的归属顺序 排列,则扰动项的协方差矩阵为块对角,此时,仍 然可以用OLS来估计系数,但需要用聚类稳健的标准 差(Cluster robust standard error)。在处理面板数 据的时候经常用到聚类稳健的标准差。
相关文档
最新文档