(完整版)多重共线性检验与修正.doc

合集下载

多重共线性的检验与修正

多重共线性的检验与修正

多重共线性的检验与修正【实验目的】掌握多重共线性的检验方法和补救措施。

【实验要求】选择习题4.7,运用EViews 软件进行解答。

【实验内容】一、 利用EViews 软件,输入654321,X X X X X X Y ,,,,, 等数据,采用这些数据对模型进行OLS 回归,结果如下表所示由此可见,该模型2R =0.9810,2R =0.9677可决系数很高,F 检验值73.8081,明显显著,但是当228.2)818()(025.02/=-=-t k n t α,不仅所有解释变量系数t 检验不显著,而且654321X X X X X X ,,,,,系数符号与预期相反,这表明它们之间很可能存在严重多重共线性;二、计算各解释变量的相关系数,的相关系数矩阵如下由相关系数矩阵可以看出,各解释变量相互之间相关系数较高,证实确实存在严重的多重共线性。

三、修正多重共线性采用逐步回归的办法,去检验和解决多重共线性问题。

分别做lny对lnxi(i=1……7)的一元回归,结果如下表:其中,加入lnx1的方程修正拟合度最大,以lnx1为基础,顺次加入其它变量逐步回归,结果如下表:这里说明:对于两个解释变量标准T 分布为:1312318302502.)(t )(n t .α/=-=-,加入各解释变量后,要么2R 下降,要么ln i X (i=1……7)参数的T 检验不显著,这说明765432,X X X X X X ,,,,引起严重多重共线性,应予以剔除。

最后,修正后的回归结果为:1ln 2359.01631.9ˆln X Y t+= T= (73.1914) (19.7895)2R =0.9607 2R =0.9583 F=391.6234 DW=0.5038 这说明,在其他因素不变的情况下,当国民总收入增加e 单位,能源消费标准煤总量增加2359.0e单位。

此案例存在问题是样本容量过小,其可靠性受到影响,如果增大样本容量,效果会好一些; 【练习解答】1) 所建立的对数线性多元回归模型为1ln 2359.01631.9ˆln X Y t+= 2) 会,从表中的解释变量比如“国民总收入”与“GDP ”的本身意义,我们知道这两个变量之间存在很大的联系;3)存在多重共线性,通过逐步回归方法:①简单线性回归分析,找出基本解释变量②逐步进行二次,三次回归分析,直到出现回归系数不显著或者变量系数符号与预期不相符,以及修正拟合度不高的情况,即可认为该解释变量会引起严重多重共线性,应予以剔除,最后得出所需要的回归模型。

(完整word版)多重共线性问题的几种解决方法

(完整word版)多重共线性问题的几种解决方法

多重共线性问题的几种解决方法在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,X k中的任何一个都不能是其他解释变量的线性组合。

如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。

多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。

这里,我们总结了8个处理多重共线性问题的可用方法,大家在遇到多重共线性问题时可作参考:1、保留重要解释变量,去掉次要或可替代解释变量2、用相对数变量替代绝对数变量3、差分法4、逐步回归分析5、主成份分析6、偏最小二乘回归7、岭回归8、增加样本容量这次我们主要研究逐步回归分析方法是如何处理多重共线性问题的。

逐步回归分析方法的基本思想是通过相关系数r、拟合优度R2和标准误差三个方面综合判断一系列回归方程的优劣,从而得到最优回归方程。

具体方法分为两步:第一步,先将被解释变量y对每个解释变量作简单回归:对每一个回归方程进行统计检验分析(相关系数r、拟合优度R2和标准误差),并结合经济理论分析选出最优回归方程,也称为基本回归方程。

第二步,将其他解释变量逐一引入到基本回归方程中,建立一系列回归方程,根据每个新加的解释变量的标准差和复相关系数来考察其对每个回归系数的影响,一般根据如下标准进行分类判别:1.如果新引进的解释变量使R2得到提高,而其他参数回归系数在统计上和经济理论上仍然合理,则认为这个新引入的变量对回归模型是有利的,可以作为解释变量予以保留。

2。

如果新引进的解释变量对R2改进不明显,对其他回归系数也没有多大影响,则不必保留在回归模型中。

3.如果新引进的解释变量不仅改变了R2,而且对其他回归系数的数值或符号具有明显影响,则认为该解释变量为不利变量,引进后会使回归模型出现多重共线性问题。

不利变量未必是多余的,如果它可能对被解释变量是不可缺少的,则不能简单舍弃,而是应研究改善模型的形式,寻找更符合实际的模型,重新进行估计.如果通过检验证明回归模型存在明显线性相关的两个解释变量中的其中一个可以被另一个很好地解释,则可略去其中对被解释变量影响较小的那个变量,模型中保留影响较大的那个变量。

6-多重共线性

6-多重共线性

举例
HOUSING = α 1 + α 2 INTRATE t + α 3 POPt + u1t A:
HOUSING = β 1 + β 2 INTRATEt + β 3GNPt + u 2 t B:
HOUSING = γ 1 + γ 2 INTRATE t + γ 3 POPt + γ 4GNPt + u1t C:
完全多重共线性 近似多重共线性
λ1 X 1i + λ2 X 2i = 0 λ1 X 1i + λ2 X 2i + vi = 0
矩阵形式
在线性回归模型中,对X的基本假定是:
rank ( X ) = k (k < n)
即 X ′X ≠ 0 ,亦即矩阵中各列向量之间是线 性无关的,如果这一假定不满足, rank ( X ) < k 或 X ′X = 0 ,则称模型存在多重共线性。
ln Yt = b0 + b1 ln X 1t + b2 X 2t + b3 X 3t + ε t
销量 出厂价格 市场价格 市场总供应量 高度相关
X 1t ln Yt = b0 + b1 ln + b2 X 3t + ε t X 2t
相对价格
6. 数据中心化
Yi = b0 + b1 X i + b2 X i2 + L + bk X ik + ε i
6
多重共线性
主要内容
多重共线性的概念 产生多重共线性的原因 多重共线性的结果 多重共线性的检验 多重共线性的修正方法
一. 多重共线性的概念

多重共线性的判断与修正

多重共线性的判断与修正

多重共线性的判断与修正一、多重共线性的判断1. 综合统计检验法LS Y C X1 X2 对模型进行OLS, 得到参数估计表(1) 当2,R F 很大,而回归系数的t 检验值小于临界值时,可判定该模型存在多重共线性。

(2) 当完全共线性存在时,模型的OLS 无法进行,Eviews 会提示:矩阵的逆(1()T X X -)不存在。

2. 简单相关系数检验法LS Y C X1 X2 对模型进行OLS, 得到参数估计表中的2R .点击:Quick/Group Statistics/Correlation在对话框中输入:X1 X2 , 点击OK, 即可得到简单相关系数矩阵检验:若存在 i j x x r 接近于1, 或 22,i j x x r R >,则说明,i j x x 之间存在着严重的相关性。

3. 辅助回归法(方差扩大因子法)设 121112...(1)(1)...j j k Xj X X X j X j Xk V ααααα-+=+++-+++++ (j ) LS Xj X1 X2…Xk 对(j) 进行OLS, 得到参数估计表检验:若表中 (2,1)F F k n k α>--+, 则可确定存在多重共线性。

或者(方差扩大因子法):计算211j jVIF R =-, (2j R 为以上方程的可决系数), 若10j VIF ≥, 则可确定存在多重共线性。

4. 逐步回归法1) 首先计算被解释变量对每个解释变量的回归方程,得到基本回归方程:LS Y C Xi OLS ,得到基本回归方程(i), i = 1,2,…,k2) 从这些基本回归方程中选出最合理的方程, 即,2R 取值最大,且t 检验显著。

比方说,0j Y Xj ββ=+3) 在这个选出的方程中增加新的解释变量, 再进行OLS 分析:LS Y C Xj Xi ( i= 1,2,…,j-1, j+1,…k)判断: 如果新加入的解释变量对2R 改进最大, 且每个系数又是t 统计显著,则保留这个新的解释变量。

多重共线性检验与修正

多重共线性检验与修正

多重共线性检验与修正数据来源:《中国统计年鉴2014》12-10、4-3、12-4、12-5、12-8、Eviews操作:1、基本操作:(1)录入数据:命令:data y l m f a ir(y代表粮食产量,l代表第一产业劳动力数量,m代表农业机械总动力,f代表化肥施用量,a代表农作物总播种面积,ir为有效灌溉面积/农作总播种面积得出的灌溉率)(2)做线性回归:命令:LS y c l m f a ir2、检验多重共线性(1)方差膨胀因子判断法在生成的线性回归eq01中,view—coefficient diagnostics—variance inflation factors看生成表格中的Centered VIF,发现L、M、F、A、IR的方差膨胀因子都很大,说明存在严重多重共线性。

(eg:L的Centered VIF指以L为因变量,M、A、F、IR为自变量所做出的辅助回归的判定系数R²,然后1/1-R²得出的值。

)(由课本内容可知,当完全不共线性时,VIF=1;完全共线性时,VIF=正无穷)(2)相关系数矩阵判断法命令:cor l m f a ir这个是通过看各个解释变量之间的相关系数来判断是否存在多重共线性的。

可以看到大多数解释变量之间两两相关系数都大于0.9。

相关系数极大说明解释变量之间存在很高的相关性,因而也就很可能存在共线性。

3、修正多重共线性(1)逐步回归排除引起共线性的变量①菜单栏操作在生成的线性回归eq01中,Estimate—Method—STEPLS接下来会出现两个框框,上面的框框是固定住不做逐步回归的变量,一般设定为y和c下面的框框是需要进行逐步回归选择是否剔除的变量,这里填入l m f a ir 然后出来一个新的表格,这个表格已经自动选择了可以保留的变量l a f,剔除了m ir②命令栏操作命令:STEPLS y c @ l m f a ir这条命令其实和菜单栏操作的意思一样,stepls代表采用逐步回归方法,@前的y、c代表固定不做逐步回归的变量,@后的l、m、f、a、ir代表要做逐步回归的变量出来的结果和菜单栏操作的结果是一样的。

多重共线性和自相关的检验和解决

多重共线性和自相关的检验和解决

《计量经济学》课程实训项目报告项目名称多重共线性和自相关的检验及解决方法实训日期2012.11.23 实训人53 班级统计1005 学号1004100508 指导教师张维群应用软件SPSS 实训地点实验楼314实训目的1.多重共线性和自相关的检验及解决方法的软件操作能力训练2.验证多重共线性和自相关的检验及解决方法的理论,并加深理解。

实训内容1.根据自己在网上寻找到的感兴趣的数据,用膨胀因子法和相关系数法对其进行是否存在多重共线性的检验;运用图示法和D-W法对数据是否存在自相关进行检验。

2.若检验出有多重共线性,则用逐步回归法剔除对因变量影响不大的解释变量;若检验出存在自相关,则用广义差分法建立新的模型进行解决。

实训数据资料说明1.问题:我国GDP的增长率与第一产业增长率、第二产业增长率、第三产业增长率用最小二乘法回归时的模型是否存在多重共线性和自相关。

若存在,先解决多重共线性再解决自相关并重新估计。

2.指标有哪些?自变量有x1:第一产业增长率,x2:第二产业增长率,x3:第三产业增长率。

因变量是y:GDP的增长率。

3.数据来源什么地方?数据是从网上查找的,数据包括从1981—2010年我国的GDP增长率、第一产业增长率、第二产业增长率和第三产业增长率,为时间序列数据,样本量为30。

实训结果与简要分析首先对原始数据进行用普通最小二乘法进行大致的拟合,并选择Linear Regression-Statistics-Collinearity diagnostics,即用膨胀因子法对原模型进行多重共线性检验,结果如下:Model SummaryModel R R Square Adjusted R Square Std. Error of the Estimate1 .982a.965 .961 .55883表1A N OVA bModel Sum of Squares df Mean Square F Sig.1 Regression 224.079 3 74.693 239.176 .000aResidual 8.120 26 .312T otal 232.199 29表2Coefficients aModel1(Constant) 第一产业增长率第二产业增长率第三产业增长率Unstandardized Coeff icients B .690 .187 .456 .287Std. Error .400 .047 .030 .042 Standardized Coeff icients Beta .169 .742 .344t 1.727 3.971 15.045 6.837 Sig. .096 .001 .000 .000 Collinearity Statistics T olerance .740 .553 .531VIF 1.351 1.809 1.883表3由表1可知模型的可决系数R^=0.965>0.8,可见其拟合程度较好。

计量经济学实验四-多重共线性的检验与修正

计量经济学实验四-多重共线性的检验与修正

《计量经济学》实验报告四开课实验室:财经科学实验室年月日班级:学号:姓名:实验项目名称:多重共线性的检验与修正成绩:实验性质:验证性□综合性□设计性指导教师签字:【实验目的】掌握多重共线性的检验与修正方法并能运用Eviews软件进行实现【实验要求】能根据OLS的估计结果判断是否存在多重共线性,熟悉逐步回归法修正模型的基本操作步骤,读懂各项上机榆出结果的含义并能进行分析【实验软件】 Eviews 软件【实验内容】根据给定的案例数据按实验要求进行操作【实验方案与进度】实验:设蔬菜销售量Y与人口(X1)、价格(X2)、粮食(X3)、收入(X4)、副食(X5)Dependent Variable: Y Method: Least Squares Date: 06/03/13 Time: 16:48 Sample: 1978 1996 Included observations: 19Variable Coefficient Std. Error t-Statistic Prob. C -1.530260 6.006901 -0.254750 0.8032 X1 0.014649 0.002923 5.012107 0.0003 X2 -0.702775 0.254521 -2.761169 0.0172 X3 0.060321 0.027575 2.187545 0.0492 X4 0.119825 0.036991 3.239290 0.0071 X5 0.018081 0.026022 0.694816 0.5004 X60.0922660.0542651.7003020.1148 R-squared0.986169 Mean dependent var 9.091579 Adjusted R-squared 0.979254 S.D. dependent var 1.717935 S.E. of regression 0.247442 Akaike info criterion 0.322027 Sum squared resid 0.734730 Schwarz criterion 0.669979 Log likelihood 3.940740 F-statistic 142.6067 Durbin-Watson stat2.292164 Prob(F-statistic)0.000000123456-1.5300.0150.7030.0600.120.0180.092t t t t t t t t Y X X X X X X u =+-+++++(2)方程线性显著性检验由(1)表中的数据可知F 统计量的值为142.6067,查表得0.05(6,12)F =3,显然142.6067>0.05(6,12)F =3,说明方程具有线性显著性。

多重共线性验证及修正

多重共线性验证及修正

论文选读:中国货币需求的因素分析钟瑜王桢黄琦珍内容摘要:本文以宏观货币需求理论为基础,引入收入和利率两个解释变量,利用计量经济学的方法,分析货币需求与这两者的关系.从中国的实际情况出发,在利用年度数据分析的基础上,又引入九十年代中期到目前为止的季度数据着重分析利率对货币需求的影响,从而将经济理论和中国现实情况结合进行分析.关键字:货币需求利率一经济理论阐述凯恩斯在传统的货币数量论和现金余额说的基础上,考虑了货币的交易职能和货币的价值贮藏职能,提出了自己的货币需求理论。

他认为人们之所以持有货币是处于三个动机:交易动机,预防动机和投机动机,从而相应地形成了货币的交易需求,预防需求和投机需求。

随着经济的发展,交易与收入和支出往往在时间上不一致,人们为了应付日常的购买而持有一定量的货币即构成了货币的交易需求。

而人们为了应付一些意外开支而持有的货币即为货币的预防需求。

这两种需求都来源于货币的交易媒介职能。

在影响交易动机和预防动机的众多因素中,货币收入起着决定作用,并且收入与货币的交易需求和预防需求成正方向变化。

而货币的投机需求则是为了应付有价证券市场上价格的变化,从而获利。

这一货币需求来源于货币的价值贮藏职能。

人们总是根据对利率变动的预期持有一定量的货币,以在有利时机购买债券进行投机获利,因而,货币的投机需求与利率成反方向变化。

凯恩斯根据对人们持有货币的心理动机的分析,将货币需求分为两个部分:货币的交易需求和预防需求L1(Y)和货币的投机需求L2(r), 从而提出了他的货币需求函数:L=L1(Y)+L2(r),其中,L代表对货币的需求,Y代表收入,r代表利率.在凯恩斯的货币需求理论的基础上,后凯恩斯主义对其进行了发展。

美国经济学家汉森将商品市场和货币市场结合起来建立了IS-LM模型,认为货币的交易需求不仅受到收入的影响,而且受到利率的影响。

这是由于利率的变化会影响投资,进而影响收入,最终影响对货币的交易需求。

实验四-多重共线性模型的检验和处理

实验四-多重共线性模型的检验和处理

实验报告课程名称:计量经济学实验项目:实验四多重共线性模型的检验和处理实验类型:综合性□设计性□验证性 专业班别:11本国贸五班姓名:学号:实验课室:厚德楼A207指导教师:实验日期:2014/5/20广东商学院华商学院教务处制一、实验项目训练方案小组合作:是□否 小组成员:无实验目的:掌握多重共线性模型的检验和处理方法:实验场地及仪器、设备和材料实验室:普通配置的计算机,Eviews软件及常用办公软件。

实验训练内容(包括实验原理和操作步骤):【实验原理】多重共线性的检验:直观判断法(R2值、t值检验)、简单相关系数检验法、方差扩大因子法(辅助回归检验)多重共线性的处理:先验信息法、变量变换法、逐步回归法【实验步骤】(一)多重共线性的检验1.直观判断法(R2值、t值检验)根据广东数据(见附件1),先分别建立以下模型:【模型1】财政收入CS对第一产业产值GDP1、第二产业产值GDP2和第三产业产值GDP3的多元线性回归模型;(请对得到的图表进行处理,以上在一页内)【模型2】固定资产投资TZG对固定资产折旧ZJ、营业盈余YY和财政支出CZ的多元线性回归模型。

观察模型结果,初步判断模型自变量之间是否存在多重共线性问题。

【模型1】从上图可以得到,估计方程的判定系数R 2很高,但三个参数t检验值两个不显著,有一个较显著,其中一个参数估计值还是负的,不符合经济理论。

所以,出现了严重的多重共线性。

【模型2】1】从上图可以得到,估计方程的判定系数R 2很高,方程显著性F检验也显著,但只有两个参数显著性t检验比较显著,这与很高的判定系数不相称,出现了严重的多重共线性。

2.简单相关系数检验法分别计算【模型1】和【模型2】的自变量的简单相关系数。

【模型1】【模型2】(请对得到的图表进行处理,以上在一页内)根据计算的简单相关系数,判断模型是否存在多重共线性。

【模型1】可看出三个解释变量GDP1 、GDP2和GDP3之间高度相关,存在严重的多重共线性。

(完整版)多重共线性检验与修正

(完整版)多重共线性检验与修正

问题:选取粮食生产为例,由经济学理论和实际可以知道,影响粮食生产y的因素有:农业化肥施用量x1,粮食播种面积x2,成灾面积x3,农业机械总动力x4,农业劳动力x5,由此建立以下方程:y=β0+β1x1+β2x2+β3x3+β4x4+β5x5,相关数据如下:解:1、检验多重共线性(1)在命令栏中输入:ls y c x1 x2 x3 x4 x5,则有;可以看到,可决系数R2和F值都很高,二自变量x1到x5的t值均较小,并且x4和x5的t检验不显著,说明方程很可能存在多重共线性。

(2)对自变量做相关性分析:将x1——x5作为组打开,view——covariance analysis——correlation,结果如下:可以看到x1和x4的相关系数为0.96,非常高,说明原模型存在多重共线性2、多重共线性的修正 (1)逐步回归法第一步:首先确定一个基准的解释变量,即从x1,x2,x3,x4,x5中选择解释y 的最好的一个建立基准模型。

分别用x1,x2,x3,x4,x5对y 求回归,结果如下:在基准模型的基础上,逐步将x2,x3等加入到模型中, 加入x2,结果:从上面5个输出结果可以知道,y 对x1的可决系数R2=0.89(最高),因此选择第一个方程作为基准回归模型。

即: Y = 30867.31062 + 4.576114592* x1再加入x3,结果:再加入x4,结果:拟合优度R2=0.961395,显著提高;并且参数符号符合经济常识,且均显著。

所以将模型修改为:Y= -44174.52+ 4.576460*x1+ 0.672680*x2拟合优度R2=0.984174,显著提高;并且参数符号符合经济常识(成灾面积越大,粮食产量越低),且均显著。

所以将模型修改为:Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3拟合优度R2=0.987158,虽然比上一次拟合提高了;但是变量x4的系数为-0.091271,符号不符合经济常识(农业机械总动力越高,粮食产量越高),并且x4的t检验不显著。

计量经济学多重共线性的检验及修正

计量经济学多重共线性的检验及修正

经济计量分析实验报告一、实验项目多重共线性的检验及修正二、实验日期三、实验目的对于国内旅游总花费的有关影响因素建立多元线性回归模型,对变量进行多重共线性的检验及修正。

四、实验内容建立模型,对模型进行参数估计,对样本回归函数进行统计检验,以判定估计的可靠程度,包括拟合优度检验、方程总体线性的显着性检验、变量的显着性检验,以及参数的置信区间估计。

检验变量是否具有多重共线性并修正。

五、实验步骤1、建立模型。

以国内旅游总花费Y作为被解释变量,以年底总人口表示人口增长水平,以旅行社数量表示旅行社的发展情况,以城市公共交通运营数表示城市公共交通运行状况,以城乡居民储蓄存款年末增加值表示城乡居民储蓄存款增长水平。

2、模型设定为:Y—国内旅游总花费(亿元)其中:tX—年底总人口(万人)t1X—旅行社数量(个)t2X—城市公共交通运营数(辆)t3X—城乡居民储蓄存款年末增加值(亿元)t43、对模型进行检验。

4、对变量进行检验,作相关系数矩阵,并逐步对模型进行修正。

六、实验结果1、初步模型及存在的问题多元线性回归模型估计结果如下:SE=(26581.73) (0.230790) (0.108223) (0.013834) (0.020502)t =(3.051494) (-3.120046) (1.403805) ( 3.854988) (0.038020)R2=0.969693 R2=0.957571 F=79.98987模型检验: (1)拟合优度检验:可决系数R 2=0.969693较高,修正的可决系数R 2=0.957571也较高,表明模型拟合较好。

(2)方程总体线性的显着性检验(F):针对043210====H ββββ:,取α=0.05,查自由度为k=4和n-k-1=10的临界值F α(4,10)。

由于F =79.98987 >F α(4,10)=3.48,p 值<0.05,应拒绝0H ,说明回归方程整体显着。

多重共线性的检验与修正10页word

多重共线性的检验与修正10页word

附件二:实验报告格式(首页)山东轻工业学院实验报告成绩课程名称计量经济学指导教师实验日期 2019-5-25 院(系)商学院专业班级实验地点二机房学生姓名学号同组人无实验项目名称多重共线性的检验与修正一、实验目的和要求掌握Eviews软件的操作和多重共线性的检验与修正二、实验原理Eviews软件的操作和多重共线性的检验修正方法三、主要仪器设备、试剂或材料Eviews软件,计算机四、实验方法与步骤(1)准备工作:建立工作文件,并输入数据:CREATE EX-7-1 A 1974 1981;TATA Y X1 X2 X3 X4 X5 ;(2)OLS估计:LS Y C X1 X2 X3 X4 X5;(3)计算简单相关系数COR X1 X2 X3 X4 X5 ;(4)多重共线性的解决LS Y C X1;LS Y C X2;LS Y C X3;LS Y C X4;LS Y C X5;LS Y C X1 X3;LS Y C X1 X3 X2;LS Y C X1 X3 X4;LS Y C X1 X3 X5;五、实验数据记录、处理及结果分析(1)建立工作组,输入以下数据:98.45 560.20 153.20 6.53 1.23 1.89100.70 603.11 190.00 9.12 1.30 2.03102.80 668.05 240.30 8.10 1.80 2.71133.95 715.47 301.12 10.10 2.09 3.00140.13 724.27 361.00 10.93 2.39 3.29143.11 736.13 420.00 11.85 3.90 5.24146.15 748.91 491.76 12.28 5.13 6.83144.60 760.32 501.00 13.50 5.47 8.36148.94 774.92 529.20 15.29 6.09 10.07158.55 785.30 552.72 18.10 7.97 12.57169.68 795.50 771.16 19.61 10.18 15.12162.14 804.80 811.80 17.22 11.79 18.25170.09 814.94 988.43 18.60 11.54 20.59178.69 828.73 1094.65 23.53 11.68 23.37(2)OLS估计Dependent Variable: YMethod: Least SquaresDate: 05/25/13 Time: 11:10Sample: 1974 1987Included observations: 14Variable Coefficient Std. Error t-Statistic Prob.C -3.496563 30.00659 -0.116526 0.9101X1 0.125330 0.059139 2.119245 0.0669X2 0.073667 0.037877 1.944897 0.0877X3 2.677589 1.257293 2.129646 0.0658X4 3.453448 2.450850 1.409082 0.1965X5 -4.491117 2.214862 -2.027719 0.0771R-squared 0.970442 Mean dependent var 142.7129Adjusted R-squared 0.951968 S.D. dependent var 26.09805S.E. of regression 5.719686 Akaike info criterion 6.623232Sum squared resid 261.7185 Schwarz criterion 6.897114Log likelihood -40.36262 F-statistic 52.53086Durbin-Watson stat 1.972755 Prob(F-statistic) 0.000007用Eviews进行最小二乘估计得,Yˆ=-3.497+0.125X1+0.074X2+2.678X3+3.453X4-4.491X5(-0.1) (2.1) (1.9) (2.1) (1.4) (-2.0)R2=0.970, 2R=0.952, DW=1.97, F=52.53其中括号内的数字是t值。

4-2多重共线性的检验和补救措施

4-2多重共线性的检验和补救措施
4-2
多重共线性的检验和补救措施
一、多重共线性的检验
1. 相关系数检验法
● 只有两个解释变量时:用二者相关系数判断。 ● 两个以上解释变量时:可用两两变量的相关系数。 ● 一般地,如果每两个解释变量的相关系数大于0.8,表明存在着较严 重的多重共线性。 ● 简单相关系数只是多重共线性的充分条件,不是必要条件。 ● 在有多个解释变量时,较低的相关系数也可能存在较严重多重共线性。
4.逐步回归法
● 例2:比率变换

=+
+
+
● 财政收入( 税收总额(
),财政支出( )
+ ),国内生产总值(
),
● 将总量指标变为相对指标,建立模型:

=+
+
+
4.逐步回归法
● 逐步回归既是判断是否存在多重共线性的方法,也是解决多重共线 性的方法。 ● 逐步回归法的具体步骤如下: ● 先用被解释变量对每一个解释变量做简单回归,得到每一个回归方程的
● 经验表明,当VIF≥10,说明该解释变量与其余解释变量之间有严重的 多重共线性。
4.逐步回归检测法
● 基本思想:将变量逐个的引入模型,每引入一个解释变量后,都要观 察可决系数的变化,进行F检验,并对已经选入的解释变量逐个进行t 检验。
如果引入新变量后,可决系数显著改善,并且原来的解释变量的显著性 不变化,说明新变量是独立解释变量。KtKt3 Nhomakorabea变换模型形式
● 对存在多重共线性的变量,进行对数变换、一阶差分变换、比率变换等, 有时可减轻多重共线性的影响。
● 例1:对于时间序列数据可采用差分法降低多重共线性。
=+
+

多重共线性进行检验和补救

多重共线性进行检验和补救

实验报告课程名称:实验项目名称:单方程线性回归模型中多重共线性的检验与补救院(系):专业班级:姓名:学号:实验地点:实验日期:年月日实验目的:掌握利用EViews软件对模型中存在的多重共线性进行检验和补救。

实验内容:1、多重共线性的检验1)简单相关系数法2)综合统计检验法3)观察个别偏回归系数估计值的符号4)Klein法则5)辅助回归法2、多重共线性的补救措施—逐步回归法实验方法、步骤和结果:一、建立工作文件并完成数据输入1、File---new---workfile2、Quick---Empty Group ----paste3、将ser01重命名为yser01重命名为x2ser01重命名为x3ser01重命名为x4ser01重命名为x5ser01重命名为x6二、作变量线性回归模型Quick---Estimate Equation三、多重共线性的检验(1)综合统计检验法由以上估计结果可知:F=282.6908,R^2=0.992278,X3=-0.733214,即F值较大与R^2的值较高,而系数估计值X3很小,故可知模型存在多重共线性。

(2)观察个别偏回归系数估计值的符号检验系数估计值,X3代表城镇居民人均旅游支出,X5代表公路里程数(万公里)X3 X5的符号应为正号,而由上图可知X3 X5的符号为负不合理,所以也可判断模型具有多重共线性。

(3)简单相关系数法1、将X2 X3 X4 X5 X6合并:open---as group2、点击上图的Wiew----correlations----common sample,得到以下相关系数矩阵:例如上图X2 5=0.962528, X26=0.952085, X36=0.910568均.>0.9,X32=0.857534 X34=0.864466, X35=0.847218, 均>0.8,大多数相关系数大于0.8,故可得:解释变量间存在严重的多重共线性。

计量经济学实验五 多重共线性的检验与修正 完成版

计量经济学实验五 多重共线性的检验与修正 完成版

习题CPI 。

资料来源:《中国统计年鉴》,中国统计出版社2000年、2004年。

请考虑下列模型:i t t t u CPI GDP Y ++=ln ln ln 321βββ+ (1)利用表中数据估计此模型的参数。

解:ln 3.6489 1.796ln 1.2075ln t t t Y GDP CPI =--+t= (-11.32) (9.93) (-3.415)20.988770.6.0.1124R F S E ===(2)你认为数据中有多重共线性吗?多重共线性的检验 1)综合统计检验法若 在OLS 法下:R 2与F 值较大,但t 检验值较小,则可能存在多重共线性。

2)简单相关系数检验在Eviews 软件命令窗口中键入:COR GDP CPI或在包含所有解释变量的数组窗口中点击View\Correlations ,其结果如图所示。

由相关系数矩阵可以看出,解释变量之间的相关系数均为0.93以上,即解释变量之间是高度相关的。

GDP CPI GDP 1.000000 0.941303 CPI 0.9413031.0000003)判定系数检验法当解释变量多余两个且变量之间呈现出较复杂的相关关系时,可以通过建立辅助回归模型来检验多重共线性。

在Eviews 软件命令窗口中键入:LS GDP C CPI得到相应的回归结果,分析方程对应的F 值和T 值,来检验这些变量间是否相关以及相关联程度。

对应的回归结果如下图所示。

上述回归方程的F 检验值非常显著,方程回归系数的T 检验值表明:GDP 与CPI 的T 检验值较大,变量之间相关。

(3)进行以下回归:i t t i t t i t t v CPI C C GDP v CPI B B Y v GDP A A Y 321221121ln ln ln ln ln ln ++=+=+=++根据这些回归你能对数据中多重共线性的性质说些什么?解:进行ls 检验,得到如下的三个结果:ln 3.745 1.187ln t t Y GDP =-+t= (-9.143) (30.6594)20.981939.999.0.1434R F S E ===ln 3.39 2.254ln t t Y CPI =-+t= (-4.064) (14.63)20.922213.93.0.2918R F S E ===ln 0.1439 1.9273ln t t GDP CPI =+t= (0.334) (24.21)20.97586.337.0.15R F S E ===数据中多重共线性的性质:单个解释变量也可以解释被解释变量,但是本题的两个解释变量之间的相关性较大,若在同一个线性方程中使用就会造成多重共线性。

多重共线性、异方差及自相关的检验和修正

多重共线性、异方差及自相关的检验和修正

计量经济学实验报告多重共线性、异方差及自相关的检验和修正——以财政收入模型为例经济学 1班一、引言财政收入是一国政府实现政府职能的基本保障,对国民经济的运行及社会的发展起着非凡的作用。

首先,它是一个国家各项收入得以实现的物质保证。

一个国家财政收入规模的大小通常是衡量其经济实力的重要标志。

其次,财政收入是国家对经济实行宏观调控的重要经济杠杆。

财政收入的增长情况关系着一个国家的经济的发展和社会的进步。

因此,研究财政收入的增长显得尤为重要。

二、数据及模型说明研究财政收入的影响因素离不开一些基本的经济变量。

回归变量的选择是建立回归模型的一个极为重要的问题。

如果遗漏了某些重要变量,回归方程的效果肯定不会好;而考虑过多的变量,不仅计算量增大许多,而且得到的回归方程稳定性也很差,直接影响到回归方程的应用。

通过经济理论对财政收入的解释以及对实践的观察,对财政收入影响的因素主要有农业增加值、工业增加值、建筑业增加值、总人口数、最终消费、受灾面积等等。

全部数据均来源于中华人民共和国国家统计局网站/具体数据见附录一。

为分析被解释变量财政收入(Y)和解释变量农业增加值(X1)、工业增加值(X2)、建筑业增加值(X3)、总人口(X4)、最终消费(X5)、受灾面积(X6)的关系。

作如下线性图(图1)。

图1可以看出Y、X1、X2、X3、X5基本都呈逐年增长的趋势,仅增长速率有所变动,而X4和X6在多数年份呈现水平波动,可能这两个自变量和因变量间不一定是线性关系。

可以初步建立回归模型如下:Y=α+β1*X1+β2*X2+β3*X3+β4*X4 +β5*X5+β6*X6 +U i 其中,U i为随机干扰项。

三、模型的检验及验证(一)多重共线性检验及修正利用Eviews5.0,做Y对X1、X2、X3、X4、X5和X6的回归,Eviews的最小二乘估计的回归结果如下表(表1)所示:表1Dependent Variable: YMethod: Least SquaresDate: 11/16/13 Time: 20:54Sample: 1990 2011Included observations: 22Variable Coefficient Std. Error t-Statistic Prob.C 145188.0 26652.27 5.447488 0.0001X1 -0.972478 0.222703 -4.366701 0.0006X2 0.210089 0.068192 3.080851 0.0076X3 -0.100412 0.569465 -0.176327 0.8624X4 -1.268320 0.247725 -5.119870 0.0001X5 0.600205 0.130089 4.613794 0.0003X6 -0.007430 0.044233 -0.167964 0.8689R-squared 0.999306 Mean dependent var 27186.86Adjusted R-squared 0.999029 S.D. dependent var 28848.33S.E. of regression 899.0866 Akaike info criterion 16.69401Sum squared resid 12125351 Schwarz criterion 17.04116Log likelihood -176.6341 F-statistic 3600.848Durbin-Watson stat 1.825260 Prob(F-statistic) 0.000000 由上表的回归结果可见,,该模型可决系数R2=0.9993很高,F检验值3601,明显显著。

多重共线性的识别与补救

多重共线性的识别与补救
S.E. of regression
3.215617
Akaike info criterion
5.417240
Sum squared resid
72.38134
Schwarz criterion
5.508016
Log likelihood
-24.08620
F-statistic
801.6108
Durbin-Watson stat
Log likelihood
-34.22191
F-statistic
234.3827
Durbin-Watson stat
0.468380
Prob(F-statistic)
0.000000
结合经济意义和统计检验选出拟合效果最好的一元线性回归方程。经分析在四个一元线性回归模型中食品需求量Y对可支配收入x1的线性关系强,拟合程度好,即
-24.29012
F-statistic
1758.713
Durbin-Watson stat
2.627059
Prob(F-statistic)
0.000000
Ls y c x2
Dependent Variable: Y
Method: Least Squares
Date: 12/06/10 Time: 09:34
收集到1995——2004年食品需求函数有关统计资料。
针对该问题,检验模型是否存在多重共线性。若存在,给出消除多重共线性的方法并重新对模型进行估计。
实验
步骤
1、启动Eviews3.1
2、建立新工作文档,输入时间范围数据1995——2004
3、单击file→import调入数据

多重共线性的判定与修正

多重共线性的判定与修正

图7.3
整理回归结果为
Foodt=334.1926-0.1013 Int+0.4651 Ext(7.1)
(1.92)(-1.25)(4.38)R2=0.88,F=102,T=31
估计式(7.1)中FOOD与IN的回归系数是负的,且不能通 过显著性检验。由散点图7.2知,food与IN是正相关的,显然 回归结果与事实不符、与经济理论不符。原因是EX和IN之间 的多重共线性(高度相关)所致。从表7.3偏相关系数矩阵可 以看出变量之间的偏相关系数都大于可决系数0.88。按克莱茵 判别准则可以判断出模型存在严重的多重共线性。
X1
X2
X3
X4
1985 28.49 739.1 2.51 43.72 94.24
1986 34.71 899.6 2.64 36.98 96.28
1987 42.29 1002.2 2.77 47.18 98.22
1988 60.42 1181.4 2.87 64.47 99.96
1989 73.12 1375.7 2.95 58.35 101.43
表7.3
Байду номын сангаас
FOOD
EX
IN
FOOD 1.000000 0.934576 0.893226
EX 0.934576 1.000000 0.975103 IN 0.893226 0.975103 1.000000
另外,如果用food只对IN回归,回归系数是正的,见图 7.4。与上述二元回归结果中的IN的回归系数相比,符号都是 反的。这也说明上述二元回归结果中存在多重共线性。
“城镇居民家庭人均可支配收入”、“城镇总人口数”和“轿车 产量”可以直接从统计年鉴上获得。“公路交通完善程度”用全 国公路里程度量,也可以从统计年鉴上获得。由于国产轿车价 格与进口轿车价格差距较大,而且轿车种类很多,做分种类的 轿车销售价格与销售量统计非常困难,所以因素“轿车价格”暂 且略去不用。定义变量名如下:

多重共线性、异方差、自相关的检测与模型修正

多重共线性、异方差、自相关的检测与模型修正

多重共线性、异方差、自相关的检测与模型修正从《国家统计数据库》找到了自1978—2008年我国人均居民消费、人均国内生产总值、居民消费价格指数、前期人均居民消费、城镇居民人均可支配收入以及农村居民人均纯收入的官方数据。

以此来分析我国人均消费的影响因素以及它们具体是如何对消费产生影响的。

1978—2008年我国人均消费及其影响因素相关数据城镇居民农村居民人均居民人均国内居民消费前期人均年份人均可支人均纯收消费生产总值价格指数居民消费配收入入343 134 1978 184 381 100.7 165405 160 1979 208 419 101.9 184477 191 1980 238 463 107.5 208501 223 1981 264 492 102.5 238535 270 1982 288 528 102 264564 310 1983 316 583 102 288652 355 1984 361 695 102.7 316739 398 1985 446 858 109.3 361901 424 1986 497 963 106.5 4461002 463 1987 565 1112 107.3 4971180 545 1988 714 1366 111.8 5651373 602 1989 788 1519 118 7141510 686 1990 833 1644 103.1 7881701 709 1991 932 1893 103.4 8332027 784 1992 1116 2311 106.4 9322577 922 1993 1393 2998 114.7 11163496 1221 1994 1833 4044 124.1 13934283 1578 1995 2355 5046 117.1 18334839 1926 1996 2789 5846 108.3 23555160 2090 1997 3002 6420 102.8 27895425 2162 1998 3159 6796 99.2 30025854 2210 1999 3346 7159 98.6 31596280 2253 2000 3631 7858 100.4 33466859 2366 2001 3886 8622 100.7 36317703 2476 2002 4143 9398 99.2 38868472 2622 2003 4474 10542 101.2 41439422 2936 2004 5031 12336 103.9 447410493 3255 2005 5572 14053 101.8 503111759 3587 2006 6263 16165 101.5 557213786 4140 2007 7255 19524 104.8 626315781 4761 2008 8348 23648 105.9 7255来自《国家统计数据库》设定如下形式的计量经济模型1:=++++ Y,X,,,X,Xi33i24124其中,Y为人均居民消费 , X2为人均国内生产总值 , X3为居民消费价格指数 , X4为前期人均消费。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

问题:
选取粮食生产为例,由经济学理论和实际可以知道,影响粮食生产y 的因素有:农业化肥施
用量x1,粮食播种面积x2,成灾面积x3,农业机械总动力x4,农业劳动力x5,由此建立以下方程: y=β0+β1x1+β2x2+β3x3+β4x4+β5x5,相关数据如下:
解: 1、检验多重共线性
(1)在命令栏中输入: ls y c x1 x2 x3 x4 x5,则有;
可以看到,可决系数R2 和 F 值都
很高,二自变量x1 到 x5 的 t 值
均较小,并且x4 和 x5 的 t 检验
不显著,说明方程很可能存在多
重共线性。

(2)对自变量做相关性分析:
将x1—— x5 作为组打开, view —— covariance analysis—— correlation ,结果如下:
可以看到x1 和 x4 的相关系数
为 0.96,非常高,说明原模型
存在多重共线性
2、多重共线性的修正
(1)逐步回归法
第一步:首先确定一个基准的解释变量,即从 x1, x2, x3, x4, x5 中选择解释 y 的最好的一个建
立基准模型。

分别用 x1, x2, x3, x4, x5 对 y 求回归,结果如下:
从上面 5 个输出结果可以知道,y 对 x1
的可决系数R2=0.89(最高),因此选择
第一个方程作为基准回归模型。

即:
Y = 30867.31062 + 4.576114592* x1
在基准模型的基础上,逐步将x2, x3 等加入到模型中,
加入 x2,结果:
拟合优度R2=0.961395 ,显著提高;
并且参数符号符合经济常识,且均显著。

所以将模型修改为:
Y= -44174.52+ 4.576460*x1+ 0.672680*x2
再加入 x3,结果:
拟合优度R2=0.984174 ,显著提高;
并且参数符号符合经济常识(成灾面积越大,粮食产
量越低),且均显著。

所以将模型修改为:
Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3 再加入 x4,结果:
拟合优度R2=0.987158 ,虽然比上一次拟
合提高了;
但是变量x4 的系数为 -0.091271 ,符号不
符合经济常识(农业机械总动力越高,
粮食产量越高),并且 x4 的 t 检验不显著。

因此应该从模型中剔除x4。

再加入 x5,结果:
拟合优度 R2=0.984466 ,有一定的提高;
并且参数符号符合经济常识,但是变量x5 的 t 检
验值为 0.493866 ,小于临界值,不显著,因此应该
剔除,常数 C 的 t 检验值为 -1.095407 ,也不显著,
应该剔除。

Ls y x1 x2 x3
综上所述,
Y=5.361203*x3+0.308763*x2-0.241639*x3。

相关文档
最新文档