多重共线性检验与修正
计量经济学实验五 多重共线性的检验与修正 完成版
![计量经济学实验五 多重共线性的检验与修正 完成版](https://img.taocdn.com/s3/m/de80a7c9bb4cf7ec4afed0c5.png)
习题1.下表给出了中国商品进口额Y 、国内生产总值GDP 、消费者价格指数CPI 。
年份 商品进口额 (亿元)国内生产总值(亿元)居民消费价格指数(1985=100)1985 1257.8 8964.4 1001986 1498.3 10202.2 106.5 1987 1614.2 11962.5 114.3 1988 2055.1 14928.3 135.8 1989 2199.9 16909.2 160.2 1990 2574.3 18547.9 165.2 1991 3398.7 21617.8 170.8 1992 4443.3 26638.1 181.7 1993 5986.2 34634.4 208.4 1994 9960.1 46759.4 258.6 1995 11048.1 58478.1 302.8 1996 11557.4 67884.6 327.9 1997 11806.5 74462.6 337.1 1998 11626.1 78345.2 334.4 1999 13736.4 82067.5 329.7 2000 18638.8 89468.1 331.0 2001 20159.2 97314.8 333.3 2002 24430.3 105172.3 330.6 200334195.6117251.9334.6资料来源:《中国统计年鉴》,中国统计出版社2000年、2004年。
请考虑下列模型:i t t t u CPI GDP Y ++=ln ln ln 321βββ+ (1)利用表中数据估计此模型的参数。
解:ln 3.6489 1.796ln 1.2075ln t t t Y GDP CPI =--+t= (-11.32) (9.93) (-3.415)20.988770.6.0.1124R F S E ===(2)你认为数据中有多重共线性吗?多重共线性的检验 1)综合统计检验法若 在OLS 法下:R 2与F 值较大,但t 检验值较小,则可能存在多重共线性。
第四章 多重共线性
![第四章 多重共线性](https://img.taocdn.com/s3/m/178b54639b6648d7c1c74667.png)
2
( x2 i x3 i ) 2 x [1 2 x3 i
2 2i
2
2 2 x2 i (1 r23 )
ˆ Var( 3 ) 同样可得
2
2 2 x3 i (1 r23 )
ˆ ˆ Cov( 2 , 3 )
r23 2
2 2 2 (1 r23 ) x2 i x3 i
1 X X 21 X 31
1 X 22 X 32
1 X 2n X 3n
nX 3 X 2 i X 3 i 2 X 3 i
X 2 i
2 X 2 i X 2 i X 3 i
X 3 i n nX 2 2 X 2 i X 3 i nX 2 X 2 i 2 X 3 i nX 3 X 2 i X 3 i
其中vi为随机变量,则称解释变量X2、X3、 …、 Xk 之间存在着不完全的多重共线性。 注意:解释变量之间不存在线性关系,并非不存在 非线性关系,当解释变量之间存在非线性关 系时,并不违反古典假定。
5
二、产生多重共线性的背景
多重共线性产生的经济背景主要有几种情形:
1.经济变量之间具有相同的变化趋势。
10
n X X nX 2 nX 3 n 0
nX 2 X
2 2i
nX 3 X 2 i X 3 i
2 X 3 i
X 2 i X 3 i nX 2
2 2 X 2 i nX 2
X 2 i x2 i X 2 X 3 i x3 i X 3
nX 3
X 2 i X 3 i nX 2 X 3
这里r23是X2,X3的相关系数。
16
EViews计量经济学实验报告-多重共线性的诊断与修正
![EViews计量经济学实验报告-多重共线性的诊断与修正](https://img.taocdn.com/s3/m/9db9eef59e314332396893c9.png)
时间 地点 实验题目 多重共线性的诊断与修正一、实验目的与要求:要求目的:1、对多元线性回归模型的多重共线性的诊断;2、对多元线性回归模型的多重共线性的修正。
二、实验内容根据书上第四章引子“农业的发展反而会减少财政收入”,1978-2007年的财政收入,农业增加值,工业增加值,建筑业增加值等数据,运用EV 软件,做回归分析,判断是否存在多重共线性,以及修正。
三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等)(一)模型设定及其估计经分析,影响财政收入的主要因素,除了农业增加值,工业增加值,建筑业增加值以外,还可能与总人口等因素有关。
研究“农业的发展反而会减少财政收入”这个问题。
设定如下形式的计量经济模型:i Y =1β+2β2X +3β3X +4β4X +5β5X +6β6X +7β7X +i μ其中,i Y 为财政收入CS/亿元;2X 为农业增加值NZ/亿元;3X 为工业增加值GZ/亿元;4X 为建筑业增加值JZZ/亿元;5X 为总人口TPOP/万人;6X 为最终消费CUM/亿元;7X 为受灾面积SZM/千公顷。
图1: 1978~2007年财政收入及其影响因素数据年份财政收入CS/亿元 农业增加值NZ/亿元 工业增加值GZ/亿元 建筑业增加值JZZ/亿元总人口TPOP/万人最终消费CUM/亿元受灾面积SZM/千公顷 1978 1132.3 1027.5 1607 138.2 96259 2239.1 50790 1979 1146.4 1270.2 1769.7 143.8 97542 2633.7 39370 1980 1159.9 1371.6 1996.5 195.5 98705 3007.9 44526 1981 1175.8 1559.5 2048.4 207.1 100072 3361.5 39790 1982 1212.3 1777.4 2162.3 220.7 101654 3714.8 33130 1983 1367 1978.4 2375.6 270.6 103008 4126.4 34710 1984 1642.9 2316.1 2789 316.7 104357 4846.3 31890 1985 2004.8 2564.4 3448.7 417.9 105851 5986.3 44365 1986 2122 2788.7 3967 525.7 107507 6821.8 47140 1987 2199.4 3233 4585.8 665.8 109300 7804.6 42090 1988 2357.2 3865.4 5777.2 810 111026 9839.5 50870 1989 2664.9 4265.9 6484 794 112704 11164.2 46991 1990 2937.1 5062 6858 859.4 114333 12090.5 38474 1991 3149.48 5342.2 8087.1 1015.1 115823 14091.9 55472 1992 3483.37 5866.6 10284.5 1415 117171 17203.3 51333 1993 4348.95 6963.8 14188 2266.5 118517 21899.9 48829 19945218.1 9572.7 19480.7 2964.7 11985029242.2550431995 6242.2 12135.8 24950.6 3728.8 121121 36748.2 45821 1996 7407.99 14015.4 29447.6 4387.4 122389 43919.5 46989 1997 8651.14 14441.9 32921.4 4621.6 123626 48140.6 53429 1998 9875.95 14817.6 34018.4 4985.8 124761 51588.2 50145 1999 11444.08 14770 35861.5 5172.1 125786 55636.9 49981 2000 13395.23 14944.7 40036 5522.3 126743 61516 54688 2001 16386.04 15781.3 43580.6 5931.7 127627 66878.3 52215 2002 18903.64 16537 47431.3 6465.5 128453 71691.2 47119 2003 21715.25 17381.7 54945.5 7490.8 129227 77449.5 54506 2004 26396.47 21412.7 65210 8694.3 129988 87032.9 37106 2005 31649.29 22420 76912.9 10133.8 130756 96918.1 38818 2006 38760.2 24040 91310.9 11851.1 131448 110595.3 41091 2007 51321.78 28095 107367.2 14014.1 132129 128444.6 48992利用EV 软件,生成i Y 、2X 、3X 、4X 、5X 、6X 、7X 等数据,采用这些数据对模型进行OLS 回归。
多重共线性检验与修正
![多重共线性检验与修正](https://img.taocdn.com/s3/m/e35fe9f3b8f67c1cfad6b8d5.png)
多重共线性检验与修正数据来源:《中国统计年鉴2014》12-10、4-3、12-4、12-5、12-8、Eviews操作:1、基本操作:(1)录入数据:命令:data y l m f a ir(y代表粮食产量,l代表第一产业劳动力数量,m代表农业机械总动力,f代表化肥施用量,a代表农作物总播种面积,ir为有效灌溉面积/农作总播种面积得出的灌溉率)(2)做线性回归:命令:LS y c l m f a ir2、检验多重共线性(1)方差膨胀因子判断法在生成的线性回归eq01中,view—coefficient diagnostics—variance inflation factors看生成表格中的Centered VIF,发现L、M、F、A、IR的方差膨胀因子都很大,说明存在严重多重共线性。
(eg:L的Centered VIF指以L为因变量,M、A、F、IR为自变量所做出的辅助回归的判定系数R²,然后1/1-R²得出的值。
)(由课本内容可知,当完全不共线性时,VIF=1;完全共线性时,VIF=正无穷)(2)相关系数矩阵判断法命令:cor l m f a ir这个是通过看各个解释变量之间的相关系数来判断是否存在多重共线性的。
可以看到大多数解释变量之间两两相关系数都大于0.9。
相关系数极大说明解释变量之间存在很高的相关性,因而也就很可能存在共线性。
3、修正多重共线性(1)逐步回归排除引起共线性的变量①菜单栏操作在生成的线性回归eq01中,Estimate—Method—STEPLS接下来会出现两个框框,上面的框框是固定住不做逐步回归的变量,一般设定为y和c下面的框框是需要进行逐步回归选择是否剔除的变量,这里填入l m f a ir 然后出来一个新的表格,这个表格已经自动选择了可以保留的变量l a f,剔除了m ir②命令栏操作命令:STEPLS y c @ l m f a ir这条命令其实和菜单栏操作的意思一样,stepls代表采用逐步回归方法,@前的y、c代表固定不做逐步回归的变量,@后的l、m、f、a、ir代表要做逐步回归的变量出来的结果和菜单栏操作的结果是一样的。
关于多重共线性模型的检验和处理的方法
![关于多重共线性模型的检验和处理的方法](https://img.taocdn.com/s3/m/c71460a60029bd64783e2ccf.png)
计量经济学实验报告题目:关于多重共线性模型的检验和处理方法姓名:张飞飞学号:2008163050专业:工商管理指导教师:崔海燕实验时间: 2010-12-22二○一○年十二月二十五日关于多重共线性模型的检验和处理的方法一、实验目的:掌握多重共线性模型检验和处理的方法二、实验原理:判定系数检验法、逐步回归法、解释变量、相关系数检验三、实验步骤:1.创建一个新的工作文件:打开Eviews软件,点击File下的New File,创建一个新的工作文件,选择Annual,在Start Date栏中输入1983,在End date栏中输入2000,点击OK,点击保存,完成创建新的工作文件。
2.输入数据:点击Quick下的Empty Group,导入中国粮食生产函数模型的具体数据,命名被解释变量为Y,解释变量为X1、X2、X3、X4、X5,其中:Y表示粮食产量;X1表示农业化肥施用量;X2表示粮食播种面积;X3表示成灾面积;X4表示农业机械总动力;X5表示农业劳动力.点击Name保存数据,命名为Group01。
3.采用普通最小二乘法估计模型参数:点击Quick下的Estimate Equation,输入方程y c x1 x2 x3 x4 x5.点击OK,生成EQ1. 如下表所示:从结果可以看出:R-squared的值为0.982798,拟合优度比较高(一般为0.9以上),F-statistic 的值为137.1164,也比较大,说明模型上存在多重共线性,但无法看出变量之间的关系。
4.进行多重共线性检验:主要运用综合统计检验和采用解释变量之间的相关系数进行检验。
由综合统计检验法(步骤3),可以看出存在多重共线性,继而进行解释变量之间的相关下系数检验。
点击Quick下的Groupstatistics,选择Correlations,打开Series List界面,输入X1 X2 X3 X3 X4 X5,点击OK,生成Group02,结果如下图:从结果可以看出:X1和X4之间的相关系数为0.960278,最接近1,说明X1和X4之间存在高度相关性。
第五 多重共线性(共54张PPT)
![第五 多重共线性(共54张PPT)](https://img.taocdn.com/s3/m/633d62cbafaad1f34693daef5ef7ba0d4b736d42.png)
▪ 但是应注意:
▪ 如果研究的目的仅在于预测被解释变量Y,而各个解释变量X之间的 多重共线性关系的性质在未来将继续保持,这时虽然无法精确估计 个别的回归系数,但可估计这些系数的某些线性组合,因此多重共 线性可能并不是严重问题。
第三节 多重共线性的检验
多重共线性检验的任务是:
1)检验多重共线性是否存在;
4、变量的显著性检验失去意义
存在多重共线性时
参数估计值的方差与标准差变大
容易使通过样本计算的t值小于临界值, 误导作出参数为0的推断
可能将重要的解释变量排除在模型之外
5、模型的预测功能失效
▪ 变大的方差容易使区间预测的“区间”变大,使预测
失去意义。
▪其次,由于参数估计量的方差变大,因而对样本值的 反映十分敏感,即当样本观测值稍有变化时,模型参数 就有很大差异,致使模型难以应用。
2)估计多重共线性的范围,即判断哪些变量之间存在
共线性。
一、 检验多重共线性是否存在
1.简单相关系数检验法
利用解释变量之间的线性相关程度去判断是否存在严重多重 共线性的一种简便方法。
一般而言,如果每两个解释变量的简单相关系数比较高,如 大于0.8,则可认为存在着较严重的多重共线性。
注意 较高的简单相关系数只是多重共线性存在的充分条件, 而不是必要条件。特别是在多于两个解释变量的回归模型中, 有时较低的简单相关系数也可能存在多重共线性。因此并不 能简单地依据相关系数进行多重共线性的准确判断。
如果拟合优度变化显著,则说明新引入的变量是一个独立的解释 变量;
如果拟合优度变化很不显著,则说明新引入的变量不是一个独立 的解释变量,它可以用其他变量的线性组合代替,也就是说它与其 他变量之间存在多重共线性。
计量经济学实验五-多重共线性的检验与修正
![计量经济学实验五-多重共线性的检验与修正](https://img.taocdn.com/s3/m/3469b6f2700abb68a982fb7f.png)
多重共线性的检验与修正【实验目的】掌握多重共线性的检验与修正方法并能运用Eviews软件进行实现【实验要求】能根据OLS的估计结果判断是否存在多重共线性,熟悉逐步回归法修正模型的基本操作步骤,读懂各项上机榆出结果的含义并能进行分析【实验软件】 Eviews 软件【实验内容】根据给定的案例数据按实验要求进行操作【实验方案与进度】实验:设某地区蔬菜销售量Y与人口(X1)、价格(X2)、粮食价格(X3)、收入(X4)、副食价格(X5)和储蓄(X6)等资料如下:obs Y X1 X2 X3 X4 X5 X6 1988 7.450 425.5 8.12 17.5 17.80 185.85 21.68 1989 7.605 422.3 8.32 22.9 19.51 185.35 21.08 1990 7.855 418.0 8.36 23.7 18.93 185.10 21.03 1991 7.805 419.2 8.20 21.1 19.05 184.80 20.73 1992 6.900 384.2 8.86 23.3 19.57 184.60 21.93 1993 7.470 372.5 7.70 19.1 19.95 184.25 22.49 1994 7.385 372.9 8.46 18.2 20.89 181.35 23.26 1995 7.225 380.8 8.88 22.2 23.27 179.30 24.39 1996 8.130 401.7 9.00 27.6 26.06 178.10 25.04 1997 8.720 406.5 8.80 28.8 28.55 176.25 25.53 1998 9.145 410.5 9.26 27.8 30.12 174.35 26.64 1999 10.105 447.0 8.62 24.4 32.78 174.25 27.53 2000 10.170 452.8 8.44 24.1 32.21 179.35 28.12 2001 10.540 467.1 9.66 27.8 33.57 173.85 31.35 2002 10.635 495.2 9.68 19.5 34.86 179.50 34.58 2003 10.455 500.0 11.32 25.4 36.60 166.85 41.78 2004 10.995 525.0 12.30 28.4 40.35 158.25 42.85 2005 12.380 550.0 12.88 35.4 45.00 155.00 46.75 2006 11.770 561.0 14.02 34.8 49.87 141.05 49.21 要求:(1)将Y关于其他变量线性回归Dependent Variable: YMethod: Least SquaresDate: 06/03/13 Time: 16:48Sample: 1988 2006Included observations: 19Variable Coefficient Std. Error t-Statistic Prob.C -1.530260 6.006901 -0.254750 0.8032 X1 0.014649 0.002923 5.012107 0.0003 X2 -0.702775 0.254521 -2.761169 0.0172 X3 0.060321 0.027575 2.187545 0.0492 X4 0.119825 0.036991 3.239290 0.0071 X5 0.018081 0.026022 0.694816 0.5004 X60.0922660.0542651.7003020.1148 R-squared0.986169 Mean dependent var 9.091579 Adjusted R-squared 0.979254 S.D. dependent var 1.717935 S.E. of regression 0.247442 Akaike info criterion 0.322027 Sum squared resid 0.734730 Schwarz criterion 0.669979 Log likelihood 3.940740 F-statistic 142.6067 Durbin-Watson stat2.292164 Prob(F-statistic)0.000000123456-1.5300.0150.7030.0600.120.0180.092t t t t t t t t Y X X X X X X u =+-+++++ (2)经济意义检验:与预期符号相符 (3)方程线性显著性检验由(1)表中的数据可知F 统计量的值为142.6067,查表得0.05(6,1F =3,显然142.6067>0.05(6,12)F =3,说明方程具有线性显著性。
多重共线性和自相关的检验和解决
![多重共线性和自相关的检验和解决](https://img.taocdn.com/s3/m/5336fa15c281e53a5802ff75.png)
《计量经济学》课程实训项目报告项目名称多重共线性和自相关的检验及解决方法实训日期2012.11.23 实训人53 班级统计1005 学号1004100508 指导教师张维群应用软件SPSS 实训地点实验楼314实训目的1.多重共线性和自相关的检验及解决方法的软件操作能力训练2.验证多重共线性和自相关的检验及解决方法的理论,并加深理解。
实训内容1.根据自己在网上寻找到的感兴趣的数据,用膨胀因子法和相关系数法对其进行是否存在多重共线性的检验;运用图示法和D-W法对数据是否存在自相关进行检验。
2.若检验出有多重共线性,则用逐步回归法剔除对因变量影响不大的解释变量;若检验出存在自相关,则用广义差分法建立新的模型进行解决。
实训数据资料说明1.问题:我国GDP的增长率与第一产业增长率、第二产业增长率、第三产业增长率用最小二乘法回归时的模型是否存在多重共线性和自相关。
若存在,先解决多重共线性再解决自相关并重新估计。
2.指标有哪些?自变量有x1:第一产业增长率,x2:第二产业增长率,x3:第三产业增长率。
因变量是y:GDP的增长率。
3.数据来源什么地方?数据是从网上查找的,数据包括从1981—2010年我国的GDP增长率、第一产业增长率、第二产业增长率和第三产业增长率,为时间序列数据,样本量为30。
实训结果与简要分析首先对原始数据进行用普通最小二乘法进行大致的拟合,并选择Linear Regression-Statistics-Collinearity diagnostics,即用膨胀因子法对原模型进行多重共线性检验,结果如下:Model SummaryModel R R Square Adjusted R Square Std. Error of the Estimate1 .982a.965 .961 .55883表1A N OVA bModel Sum of Squares df Mean Square F Sig.1 Regression 224.079 3 74.693 239.176 .000aResidual 8.120 26 .312T otal 232.199 29表2Coefficients aModel1(Constant) 第一产业增长率第二产业增长率第三产业增长率Unstandardized Coeff icients B .690 .187 .456 .287Std. Error .400 .047 .030 .042 Standardized Coeff icients Beta .169 .742 .344t 1.727 3.971 15.045 6.837 Sig. .096 .001 .000 .000 Collinearity Statistics T olerance .740 .553 .531VIF 1.351 1.809 1.883表3由表1可知模型的可决系数R^=0.965>0.8,可见其拟合程度较好。
计量经济学第四章 多重共线性
![计量经济学第四章 多重共线性](https://img.taocdn.com/s3/m/8c413ec46294dd88d0d26bc7.png)
x2i
3 2
x3i
x3i
参数的估计值为:
ˆ2
x32i x2i yi x2i x3i x3i yi
(
x22i )(
x32i ) (
x2i
x 3i
)2
x32i
2
x3i yi x32i 2 2
x32i x32i
x2i x3i x22i
x2i x3i
ˆ1 Y ˆ2 X 2 ˆ3 X 3
ˆ2
x32i x2i yi x2i x3i x3i yi ( x22i )( x32i ) ( x2i x3i )2
ˆ3
x22i x3i yi x2i x3i x2i yi •
(
x22i )(
x32i ) (
x2i
x 3i
)
2
x2i yi x3i yi
x2i x3i x32i
4.2多重共线性的后果
如果X1和X2完全线性相关,则存在非0的λ使得:
1 2 X 2i 3 X 3i 0
则有:
1 2 X 2 3 X 3 0
2 X 2i X 2 3 X3i X3 0
X 2i X3i X 2iYi
X
2 3i
X
3iYi
VAR
COV
(βˆ )
2
(XX)1
2
N X 2i
X 3i
X2i
X
2 2i
X 2i X 3i
计量经济第六章多重共线性
![计量经济第六章多重共线性](https://img.taocdn.com/s3/m/754f3f9ad4d8d15abe234e6d.png)
• 2、数据采集的范围有限,或采集 的样本量小于模型的自变量个数。
• 如在罕见疾病的研究过程中,由于病 情罕见、病因又相当复杂,而只能在 少数的患者身上采集大量的变量信息。
3、模型中采用滞后变量
在计量经济模型中,往往需要引入 滞后变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相 关性。
up
三、方差膨胀因子法
• 自变量间的共线性程度越大时,VIF值也随之 增大。所以也可利用方差膨胀因子来检验 多重共线性问题。 • 一般来说,当VIF >10时,表明 涉及的两个 变量存在高度线性相关,模型存在不完全 多重共线性。
P111 【经典实例】
• 计算得到的方差膨胀因子值分别为
VIF1 =10000,VIF2 =10000,VIF3 =9.6525,VIF4 =11.5875
2 2 2 1
同理易得
ˆ ) Var( 2
• EVIEWS遇到完全多重共线性时,会 显示 • Near singular matrix,无法进行估 计
2、不完全多重共线性下的后果
(1)估计量的方差增大 2 2 x 2 ˆ) 由于 Var ( 1 2 x12x2 (x1 x2 )2
• 可以看出,除了 VIF3 10 ,其余的方 差膨胀因子值均大于10,表明模型中 存在较严重的多重共线性问题。
up
第三节 多重共线性的修正 一、改变模型的形式 二、删除自变量 三、减少参数估计量的方差 四、其它方法 习题
up
• 一、改变模型的形式
• (一)变换模型的函数形式
• 例如将线性回归模型转化为对数模 型或者多项式模型。 • (二)改变模型的自变量的形式
多重共线性的检验与处理
![多重共线性的检验与处理](https://img.taocdn.com/s3/m/66a5667901f69e31433294ae.png)
实验名称:多重共线性的检验与处理实验时间:2011.12.10实验要求:主要是学习多重共线性的检验与处理,主要是研究解释变量与其余解释变量之间有严重多重共线性的模型,分析变量之间的相关系数。
通过具体案例建立模型,然后估计参数,求出相关的数据。
再对模型进行检验,看数据之间是否存在多重共线性。
最后利用所求出的模型来进行修正。
实验内容:实例:我国钢材供应量分析通过分析我国改革开放以来(1978-1997)钢材供应量的历史资料,可以建立一个单一方程模型。
根据理论及对现实情况的认识,影响我国钢材供应量 Y(万吨)的主要因素有:原油产量X1(万吨),生铁产量X2(万吨),原煤产量X3(万吨),电力产量X4(亿千瓦小时),固定资产投资X5(亿元),国内生产总值X6(亿元),铁路运输量X7(万吨)。
(一)建立我国钢材供应量的计量经济模型:(二)估计模型参数,结果为:Dependent Variable: YMethod: Least SquaresDate: 11/02/09 Time: 16:09Sample: 1978 1997Included observations: 20Variable Coefficient Std. Error t-Statistic Prob.C 139.2362 718.2493 0.193855 0.8495X1 -0.051954 0.090753 -0.572483 0.5776X2 0.127532 0.132466 0.962751 0.3547X3 -24.29427 97.48792 -0.249203 0.8074X4 0.863283 0.186798 4.621475 0.0006X5 0.330914 0.105592 3.133889 0.0086X6 -0.070015 0.025490 -2.746755 0.0177X7 0.002305 0.019087 0.120780 0.9059R-squared 0.999222 Mean dependent var 5153.350Adjusted R-squared 0.998768 S.D. dependent var 2511.950S.E. of regression 88.17626 Akaike info criterion 12.08573Sum squared resid 93300.63 Schwarz criterion 12.48402Log likelihood -112.8573 F-statistic 2201.081Durbin-Watson stat 1.703427 Prob(F-statistic) 0.000000由此可见,该模型可绝系数很高,F检验值2201.081,明显显著。
计量经济学:多重共线性
![计量经济学:多重共线性](https://img.taocdn.com/s3/m/a54e6c5bf242336c1eb95e8b.png)
影响比较大的,略去影响较小的。
元线性回归模型并进行OLS估计,拟合优度最大且接近1时,说明
这个变量与其他所有解释变量间存在共线性。
第三节 多重共线性的检验
辅助回归法中的方差膨胀因子:
对 于 多 元 线 性 回 归 模: 型Yi 0 1 X 1i ... k X ki ui 为 判 断 诸 自 变 量 间 是存 否在 多 重 共 线 性 , 进如 行下 辅 助 回 归 : X ji 0 1 X 1i ... j 1,i X j 1,i j 1,i X j 1,i ... k X ki v i , j 1,2,...,k 若 上 述 辅 助 回 归 的 可系 决数 为 R2 X j的 方 差 膨 胀 因 子 为 : j, 则 定 义 自 变 量 1 VIF j 1 R2 j
第一节 多重共线性的概念
若有c0+c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n。其中: ci不全为0,则称
解释变量间存在完全多重共线性
若存在:c0+c1X1i+c2X2i+…+ckXki≈0 i=1,2,…,n。 其中:ci不全为0,
则称为解释变量间存在近似多重共线性。
完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,
第二节 多重共线性的来源与后果
4、参数估计值不稳定,经济含义不合理
样本观测值稍有变动、增加或减少解释变量等都会使参数估计值发生较大变 化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响。
5、模型的预测功能失效
较大的方差容易使预测区间变大,从而使预测失去意义
注意:只要模型满足经典假设,则在近似多重共线性情况下,OLS估计量仍 然满足无偏性、线性性和有效性。但此时,无偏性并不意味着对某一给定样 本,其参数估计值就等于真实值。有效性也不意味着参数估计量的方差一定 很小。
修正Frish多重共线性的检验步骤
![修正Frish多重共线性的检验步骤](https://img.taocdn.com/s3/m/3bcc2cae988fcc22bcd126fff705cc1754275f63.png)
修正Frish多重共线性的检验步骤设定计量经济模型的时候,为了全面反映各方面因素的影响,总是在理论和实践认识的基础上,尽量选取被解释变量的所有影响因素。
这样在同时考虑多个影响因素的情况下,很可能产生多重共线性问题。
因此,为了解决这一矛盾,剔除变量时应该全面、慎重考虑,根据解释变量的特点采用较为合适的方式。
一、剔除引起共线性的变量根据经济理论和实际经验设定计量经济模型时,容易考虑过多的解释变量,其中,有些可能是无显著影响的次要变量,还有一些变量的影响可以用模型中的其他变量来代替。
所以在估计模型之前,找出引起多重共线性的变量,将它剔除出去,是最有效的克服多重共线性问题的方法。
二、变换模型的形式对原模型进行适当的变换,也可以消除或削弱原模型中解释变量之间的相关关系。
具体有三种变换方式:一是变换模型的函数形式;二是变换模型的变量形式;三是改变变量的统计指标。
三、综合使用时序数据与横截面数据如果能同时获得变量的时序数据和横截面数据,则先利用某类数据估计出模型中的部分参数,再利用另一类数据估计模型的其余参数。
四、逐步回归分析法建立计量经济模型的时候,一般是将解释变量全部引入模型,然后再根据统计检验和定性分析从中逐个剔除次要的或产生多重共线性的变量,选择变量是一个“由多到少”的过程。
而逐步回归选取变量时,是一个“由少到多”的过程,即从所有解释变量中间先选择影响最为显著的变量建立模型,然后再将模型之外的变量逐个引入模型;每引入一个变量,就对模型中的所有变量进行一次显著性检验,并从中剔除不显著的变量;逐步引入——剔除——引入,直到模型之外所有变量均不显著时为止。
许多统计分析软件都有逐步回归程序,但根据计算机软件自动挑选的模型往往统计检验合理,经济意义并不理想。
因此,实际应用中一般是依据逐步回归的原理,结合主观分析来筛选变量。
五、增加样本容量由于多重共线性是一个样本特性,如果理论上解释变量之间不存在多重共线性,则可以通过收集更多的观测值增加样本容量,来避免或减弱多重共线性。
实验四-多重共线性模型的检验和处理
![实验四-多重共线性模型的检验和处理](https://img.taocdn.com/s3/m/4b792ac61a37f111f1855b91.png)
实验报告课程名称:计量经济学实验项目:实验四多重共线性模型的检验和处理实验类型:综合性□设计性□验证性 专业班别:11本国贸五班姓名:学号:实验课室:厚德楼A207指导教师:实验日期:2014/5/20广东商学院华商学院教务处制一、实验项目训练方案小组合作:是□否 小组成员:无实验目的:掌握多重共线性模型的检验和处理方法:实验场地及仪器、设备和材料实验室:普通配置的计算机,Eviews软件及常用办公软件。
实验训练内容(包括实验原理和操作步骤):【实验原理】多重共线性的检验:直观判断法(R2值、t值检验)、简单相关系数检验法、方差扩大因子法(辅助回归检验)多重共线性的处理:先验信息法、变量变换法、逐步回归法【实验步骤】(一)多重共线性的检验1.直观判断法(R2值、t值检验)根据广东数据(见附件1),先分别建立以下模型:【模型1】财政收入CS对第一产业产值GDP1、第二产业产值GDP2和第三产业产值GDP3的多元线性回归模型;(请对得到的图表进行处理,以上在一页内)【模型2】固定资产投资TZG对固定资产折旧ZJ、营业盈余YY和财政支出CZ的多元线性回归模型。
观察模型结果,初步判断模型自变量之间是否存在多重共线性问题。
【模型1】从上图可以得到,估计方程的判定系数R 2很高,但三个参数t检验值两个不显著,有一个较显著,其中一个参数估计值还是负的,不符合经济理论。
所以,出现了严重的多重共线性。
【模型2】1】从上图可以得到,估计方程的判定系数R 2很高,方程显著性F检验也显著,但只有两个参数显著性t检验比较显著,这与很高的判定系数不相称,出现了严重的多重共线性。
2.简单相关系数检验法分别计算【模型1】和【模型2】的自变量的简单相关系数。
【模型1】【模型2】(请对得到的图表进行处理,以上在一页内)根据计算的简单相关系数,判断模型是否存在多重共线性。
【模型1】可看出三个解释变量GDP1 、GDP2和GDP3之间高度相关,存在严重的多重共线性。
4-2多重共线性的检验和补救措施
![4-2多重共线性的检验和补救措施](https://img.taocdn.com/s3/m/4895c822ef06eff9aef8941ea76e58fafab04539.png)
多重共线性的检验和补救措施
一、多重共线性的检验
1. 相关系数检验法
● 只有两个解释变量时:用二者相关系数判断。 ● 两个以上解释变量时:可用两两变量的相关系数。 ● 一般地,如果每两个解释变量的相关系数大于0.8,表明存在着较严 重的多重共线性。 ● 简单相关系数只是多重共线性的充分条件,不是必要条件。 ● 在有多个解释变量时,较低的相关系数也可能存在较严重多重共线性。
4.逐步回归法
● 例2:比率变换
●
=+
+
+
● 财政收入( 税收总额(
),财政支出( )
+ ),国内生产总值(
),
● 将总量指标变为相对指标,建立模型:
●
=+
+
+
4.逐步回归法
● 逐步回归既是判断是否存在多重共线性的方法,也是解决多重共线 性的方法。 ● 逐步回归法的具体步骤如下: ● 先用被解释变量对每一个解释变量做简单回归,得到每一个回归方程的
● 经验表明,当VIF≥10,说明该解释变量与其余解释变量之间有严重的 多重共线性。
4.逐步回归检测法
● 基本思想:将变量逐个的引入模型,每引入一个解释变量后,都要观 察可决系数的变化,进行F检验,并对已经选入的解释变量逐个进行t 检验。
如果引入新变量后,可决系数显著改善,并且原来的解释变量的显著性 不变化,说明新变量是独立解释变量。KtKt3 Nhomakorabea变换模型形式
● 对存在多重共线性的变量,进行对数变换、一阶差分变换、比率变换等, 有时可减轻多重共线性的影响。
● 例1:对于时间序列数据可采用差分法降低多重共线性。
=+
+
实验五__多重共线性检验参考案例共16页word资料
![实验五__多重共线性检验参考案例共16页word资料](https://img.taocdn.com/s3/m/d9e556a80c22590103029d54.png)
实验五 多重共线性检验实验时间: 姓名:学号: 成绩:【实验目的】1、掌握多元线性回归模型的估计、检验和预测;2、掌握多重共线性问题的检验方法3、掌握多重共线性问题的修正方法 【实验内容】1、数据的读取和编辑;2、多元回归模型的估计、检验、预测;3、多重共线性问题的检验4、多重共线性问题的修正 【实验背景】为了评价报账最低工资(负收入税)政策的可行性,兰德公司进行了一项研究,以评价劳动供给(平均工作小时数)对小时工资提高的反应,词研究中的数据取自6000户男户主收入低于15000美元的一个国民样本,这些数据分成39个人口组,并放在表1中,由于4个人口组中的某些变量确实,所以只给出了35个组的数据,用于分析的各个变量的定义如下:Y 表示该年度平均工作小时数;X1表示平均小时工资(美元);X2表示配偶平均收入(美元);X3表示其他家庭成员的平均收入(美元);X4表示年均非劳动收入(美元);X5表示平均家庭资产拥有量;X6表示被调查者的平均年龄;X7表示平均赡养人数;X8表示平均受教育年限。
μ为随机干扰项,考虑一下回归模型:μβββββββββ+++++++++=87654321876543210X X X X X X X X Y(1) 将该年度平均工作小时数Y 对X 进行回归,并对模型进行简单分析; (2) 计算各变量之间的相关系数矩阵,利用相关系数法分析变量间是否具有多重共线性;(3) 利用逐步回归方法检验并修正回归模型,最后再对模型进行经济意义检验、统计检验。
表5观测组Y X1 X2 X3 X4 X5 X6 X7 X81 2157 2.905 1121 291 380 7250 38.5 2.34 10.52 2174 2.97 1128 301 398 7744 39.3 2.335 10.53 2062 2.35 1214 326 185 3068 40.1 2.851 8.94 2111 2.511 1203 49 117 1632 22.4 1.159 11.55 2134 2.791 1013 594 730 12710 57.7 1.229 8.86 2185 3.04 1135 287 382 776 38.6 2.602 10.77 2210 3.222 1100 295 474 9338 39 2.187 1128 2105 2.495 1180 310 255 4730 39.9 2.616 9.39 2267 2.838 1298 252 431 8317 38.9 2.024 11.110 2205 2.356 885 264 373 6489 38.8 2.662 9.511 2121 2.922 1251 328 312 5907 39.8 2.287 10.312 2109 2.499 1207 347 271 5069 39.7 3.193 8.913 2108 2.796 1036 300 259 4614 38.2 2.4 9.214 2047 2.453 1213 397 139 1987 40.3 2.545 9.115 2174 3.582 1141 414 498 10239 40 2.064 11.716 2067 2.909 1805 290 239 4439 39.1 2.301 10.517 2159 2.511 1075 289 308 5621 39.3 2.486 9.518 2257 2.516 1093 176 392 7293 37.9 2.042 10.119 1985 1.423 553 381 146 1866 40.6 3.833 6.620 2184 3.636 1091 291 560 11240 39.1 2.328 11.621 2084 2.983 1327 331 296 5653 39.8 2.208 10.222 2051 2.573 1197 279 172 2806 40 2.362 9.123 2127 3.263 1226 314 408 8042 39.5 2.259 10.824 2102 3.234 1188 414 352 7557 39.8 2.019 10.725 2098 2.28 973 364 272 4400 40.6 2.661 8.426 2042 2.304 1085 328 140 1739 41.8 2.444 8.227 2181 2.912 1072 304 383 9340 39 2.337 10.228 2186 3.015 1122 30 352 7292 37.2 2.046 10.929 2188 3.01 990 366 374 7325 38.4 2.847 10.630 2077 1.901 350 209 95 1370 37.4 4.158 8.231 2196 3.009 947 294 342 6888 37.5 3.047 10.632 2093 1.899 342 311 120 1425 37.5 4.512 8.133 2173 2.959 1116 296 387 7625 39.2 2.342 10.534 2179 2.959 1116 296 387 7625 39.2 2.342 10.535 2200 2.98 1126 204 393 7885 39.2 2.341 10.6 【实验过程】一、利用Eviews软件建立年度平均工作小时数y的回归模型。
多重共线性的后果四、多重共线性的检验五、克服多重共线
![多重共线性的后果四、多重共线性的检验五、克服多重共线](https://img.taocdn.com/s3/m/4deba030453610661ed9f4ed.png)
多重共线性
一、多重共线性的概念 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验 五、克服多重共线性的方法 六、案例
问题的提出
• 在前述基本假定下OLS估计具有BLUE的优良性。 • 然而实际问题中,这些基本假定往往不能满足, 使OLS方法失效不再具有BLUE特性。 • 估计参数时,必须检验基本假定是否满足,并针 对基本假定不满足的情况,采取相应的补救措施 或者新的方法。 • 检验基本假定是否满足的检验称为计量经济学检 验
在矩阵表示的线性回归模型 Y=X+ 中,完全共线性指:秩(X)<k+1,即
1 1 X 1 X 11 X 12 X 1n X 21 X 22 X 2n X k1 X k2 X kn
中,至少有一列向量可由其他列向量(不包括第 一列)线性表出。 如:X2= X1,则X2对Y的作用可由X1代替。
具体可进一步对上述回归方程作F检验: 构造如下F统计量
Fj R2 j . /( k 2) (1 R ) /(n k 1)
2 j.
~ F (k 2, n k 1)
式中:Rj•2为第j个解释变量对其他解释变量的回 归方程的决定系数,
若存在较强的共线性,则Rj•2较大且接近 于1,这时(1- Rj•2 )较小,从而Fj的值较大。 因此,给定显著性水平,计算F值,并与 相应的临界值比较,来判定是否存在相关性。
– 时间序列数据经常出现序列相关
• 5、随机扰动项方差不等于常数=>异方差
– 截面数据时,经常出现异方差
解决问题的思路
• • • • 1、定义违反各个基本假定的基本概念 2、违反基本假定的原因、背景 3、诊断基本假定的违反 4、违反基本假定的补救措施(修正)
《计量经济学》第四章 多重共线性
![《计量经济学》第四章 多重共线性](https://img.taocdn.com/s3/m/794131f8910ef12d2af9e7cf.png)
σ2
R j 2 = X j 对其余 k − 2 个解释变量进行回归的 R 2 σ2 ˆ 还可写成 var( β j ) = VIF j 2
∑x
j
VIF的倒数被称为容许度(TOL j) 的倒数被称为容许度( 的倒数被称为容许度
TOL j = 1 = 1− Rj2 VIFj
采用普通最小二乘法得到以下估计结果
3
财政收入模型的EViews估计结果 财政收入模型的EViews估计结果 EViews
Variable 农业增加值NZ 农业增加值 工业增加值GZ 工业增加值 建筑业增加值JZZ 建筑业增加值 总人口TPOP 总人口 最终消费CUM 最终消费 受灾面积SZM 受灾面积 截距项 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient -1.535090 0.898788 -1.527089 0.151160 0.101514 -0.036836 -11793.34 0.995015 0.993441 481.5380 4405699. -193.4165 1.873809 Std. Error 0.129778 0.245466 1.206242 0.033759 0.105329 0.018460 3191.096 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) t-Statistic -11.82861 3.661558 -1.265989 4.477646 0.963783 -1.995382 -3.695704 Prob. 0.0000 0.0017 0.2208 0.0003 0.3473 0.0605 0.0015 5897.824 5945.854 15.41665 15.75537 632.0999 0.000000 4
自-实验五多重共线性检验参考案例
![自-实验五多重共线性检验参考案例](https://img.taocdn.com/s3/m/8c5617f7c281e53a5802fff7.png)
282186 3.015 1122 30 352 7292 37.22.04610.9292188 3.01 990 366374 732538.4 2.847 10.6 3020771.901350209 95 137037.44.158 8.2 31 2196 3.009 947 294 342688837.5 3.047 10.632 2093 1.899 342 311 1201425 37.5 4.5128.133 2173 2.959 1116 296 3877625 39.2 2.342 10.534 2179 2.9591116296 387 762539.2 2.342 10.535 2200 2.98 1126 204 393 7885 39.2 2.34110.6【实验过程】一、利用Eviews软件建立年度平均工作小时数y的回归模型。
(一)首先创建Workfile(命令窗口输入Create U,再输入35个样本观测值),其次输入数据Y,X1,X2,X3,X4,X5,X6,X7,X8(命令窗口Data Y X1X 2X3 X4 X5 X6 X7 X8)将上述表格中的数据复制粘贴到数据窗口中。
(二)进行OLS回归命令窗口输入命令LSY C X1X2X3 X4 X5 X6X7 X8从表中可以看到,模型可能存在多重共线性。
因为拟合优度较高,F统计量对应的P值小于1%,说明回归方程是显著地,回归系数X3,X4,X6,X7在10%的水平下显著,其他回归系数的t统计量对应的P值大于0.1,是不显著变量,说明解释变量可能存在多重共线性。
二、多重共线性的检验1、简单相关系数法这种方法只适用于只有两个解释变量的情况。
当这两个解释变量相关系数的绝对值很大时,认为这两个解释变量存在共线性。
操作:Quick → Group statistics→Correlations→对话框→x1 x2 x3 x4 x5 x6x7 x8→ok,得到关于上述8个变量之间的相关系数矩阵。
多重共线性的检验与修正10页word
![多重共线性的检验与修正10页word](https://img.taocdn.com/s3/m/d7323a8c7c1cfad6185fa750.png)
附件二:实验报告格式(首页)山东轻工业学院实验报告成绩课程名称计量经济学指导教师实验日期 2019-5-25 院(系)商学院专业班级实验地点二机房学生姓名学号同组人无实验项目名称多重共线性的检验与修正一、实验目的和要求掌握Eviews软件的操作和多重共线性的检验与修正二、实验原理Eviews软件的操作和多重共线性的检验修正方法三、主要仪器设备、试剂或材料Eviews软件,计算机四、实验方法与步骤(1)准备工作:建立工作文件,并输入数据:CREATE EX-7-1 A 1974 1981;TATA Y X1 X2 X3 X4 X5 ;(2)OLS估计:LS Y C X1 X2 X3 X4 X5;(3)计算简单相关系数COR X1 X2 X3 X4 X5 ;(4)多重共线性的解决LS Y C X1;LS Y C X2;LS Y C X3;LS Y C X4;LS Y C X5;LS Y C X1 X3;LS Y C X1 X3 X2;LS Y C X1 X3 X4;LS Y C X1 X3 X5;五、实验数据记录、处理及结果分析(1)建立工作组,输入以下数据:98.45 560.20 153.20 6.53 1.23 1.89100.70 603.11 190.00 9.12 1.30 2.03102.80 668.05 240.30 8.10 1.80 2.71133.95 715.47 301.12 10.10 2.09 3.00140.13 724.27 361.00 10.93 2.39 3.29143.11 736.13 420.00 11.85 3.90 5.24146.15 748.91 491.76 12.28 5.13 6.83144.60 760.32 501.00 13.50 5.47 8.36148.94 774.92 529.20 15.29 6.09 10.07158.55 785.30 552.72 18.10 7.97 12.57169.68 795.50 771.16 19.61 10.18 15.12162.14 804.80 811.80 17.22 11.79 18.25170.09 814.94 988.43 18.60 11.54 20.59178.69 828.73 1094.65 23.53 11.68 23.37(2)OLS估计Dependent Variable: YMethod: Least SquaresDate: 05/25/13 Time: 11:10Sample: 1974 1987Included observations: 14Variable Coefficient Std. Error t-Statistic Prob.C -3.496563 30.00659 -0.116526 0.9101X1 0.125330 0.059139 2.119245 0.0669X2 0.073667 0.037877 1.944897 0.0877X3 2.677589 1.257293 2.129646 0.0658X4 3.453448 2.450850 1.409082 0.1965X5 -4.491117 2.214862 -2.027719 0.0771R-squared 0.970442 Mean dependent var 142.7129Adjusted R-squared 0.951968 S.D. dependent var 26.09805S.E. of regression 5.719686 Akaike info criterion 6.623232Sum squared resid 261.7185 Schwarz criterion 6.897114Log likelihood -40.36262 F-statistic 52.53086Durbin-Watson stat 1.972755 Prob(F-statistic) 0.000007用Eviews进行最小二乘估计得,Yˆ=-3.497+0.125X1+0.074X2+2.678X3+3.453X4-4.491X5(-0.1) (2.1) (1.9) (2.1) (1.4) (-2.0)R2=0.970, 2R=0.952, DW=1.97, F=52.53其中括号内的数字是t值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
问题:
选取粮食生产为例,由经济学理论和实际可以知道,影响粮食生产y的因素有:农业化
肥施用量x1,粮食播种面积x2,成灾面积x3,农业机械总动力x4,农业劳动力x5,由此建
立以下方程:y=β0+β1x1+β2x2+β3x3+β4x4+β5x5,相关数据如下:
解:1、检验多重共线性
(1)在命令栏中输入:ls y c x1 x2 x3 x4 x5,则有;
可以看到,可决系数R2和F值都
很高,二自变量x1到x5的t值
均较小,并且x4和x5的t检验
不显著,说明方程很可能存在多
重共线性。
(2)对自变量做相关性分析:
将x1——x5作为组打开,view——covariance analysis——correlation,结果如下:
可以看到x1和x4的相关系数
为0.96,非常高,说明原模型
存在多重共线性
2、多重共线性的修正
(1)逐步回归法
第一步:首先确定一个基准的解释变量,即从x1,x2,x3,x4,x5中选择解释y的最好的一个建立基准模型。
分别用x1,x2,x3,x4,x5对y求回归,结果如下:
从上面5个输出结果可以知道,y对x1
的可决系数R2=0.89(最高),因此选择
第一个方程作为基准回归模型。
即:
Y = 30867.31062 + 4.576114592* x1
在基准模型的基础上,逐步将x2,x3等加入到模型中,
加入x2,结果:
再加入x3,结果:再加入x4,结果:
拟合优度R2=0.961395,显著提高;
并且参数符号符合经济常识,且均显著。
所以将模型修改为:
Y= -44174.52+ 4.576460*x1+ 0.672680*x2
拟合优度R2=0.984174,显著提高;
并且参数符号符合经济常识(成灾面积越大,粮食产量越低),且均显著。
所以将模型修改为:
Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3
拟合优度R2=0.987158,虽然比上一次拟
合提高了;
但是变量x4的系数为-0.091271,符号不
符合经济常识(农业机械总动力越高,
粮食产量越高),并且x4的t检验不显著。
因此应该从模型中剔除x4。
再加入x5,结果:
拟合优度R2=0.984466,有一定的提高;
并且参数符号符合经济常识,但是变量x5的t检
验值为0.493866,小于临界值,不显著,因此应该
剔除,常数C的t检验值为-1.095407,也不显著,
应该剔除。
Ls y x1 x2 x3
综上所述,
Y=5.361203*x3+0.308763*x2-0.241639*x3。