多重共线性 多重共线性实验案例与独立实验问题

合集下载

实验二__多元线性回归模型和多重共线性范文

实验二__多元线性回归模型和多重共线性范文

实验二__多元线性回归模型和多重共线性范文多元线性回归是一种常用的统计分析方法,用于研究多个自变量与一个因变量之间的关系。

在进行多元线性回归分析时,一个重要的问题是多重共线性。

多重共线性是指多个自变量之间存在高度相关性,这会导致回归模型的不稳定性,参数估计的不准确性,以及对自变量的解释能力下降等问题。

在进行多元线性回归分析之前,首先需要对自变量之间的相关性进行检验。

常用的方法有相关系数、方差膨胀因子(VIF)等。

相关系数用于衡量两个变量之间的线性关系,其值介于-1和1之间,接近于1表示高度正相关,接近于-1表示高度负相关。

VIF用于衡量一个自变量与其他自变量之间的相关性,其值大于1且越接近于1,表示相关性越强。

如果发现多个自变量之间存在高度相关性,即相关系数接近于1或VIF接近于1,就需采取措施来解决多重共线性问题。

一种常用的方法是通过增加样本量来消除多重共线性。

增加样本量可以提高模型的稳定性,减小参数估计的方差。

但是,增加样本量并不能彻底解决多重共线性问题,只能部分缓解。

另一种常用的方法是通过变量选择来解决多重共线性问题。

变量选择可以将高度相关的自变量从模型中剔除,保留与因变量高度相关的自变量。

常用的变量选择方法包括前向选择、逐步回归和岭回归等。

这些方法都是根据一定的准则逐步筛选变量,直到得到最佳模型为止。

在变量选择中,需要注意在变量剔除的过程中,要确保剩余变量之间的相关性尽可能小,以提高模型的稳定性和准确性。

此外,还可以通过变换变量来解决多重共线性问题。

变换变量可以通过对自变量进行平方项、交互项等操作,以减小相关性。

变换变量的方法需要根据实际情况来选择,具体操作可以参考相关的统计学方法教材。

总之,多元线性回归模型在实际应用中经常遇到多重共线性问题。

通过检验自变量之间的相关性,选择合适的变量和适当的变量变换方法,可以有效解决多重共线性问题,提高模型的稳定性和准确性。

在具体的研究中,应根据实际情况选择适合的方法来解决多重共线性问题,以确保回归分析结果的可靠性和有效性。

多重共线性实验报告

多重共线性实验报告

【实验名称】:多重共线性的检验方法和处理【实验目的】:掌握多重共线性的原理【实验原理】:综合统计检验法、相关系数矩阵检验法、逐步回归法【实验步骤】:一、创建一个新的工作文件:二、输入样本数据:三、用普通最小二乘法估计模型:由于解释变量个数较多,并且解释变量之间可能存在相关性,为了降低这种相关性以减弱序列相关性对模型的影响,我们先对各个解释变量和被解释变量取对数:即在Eviews软件的命令框执行:genr lnY=log(Y),genr lnX1=log(X1),genr lnX2=log (X2)……genr lnX5=log(X5)我们设粮食生产函数为:LnY=β0+β1lnX1+β2lnX2+β3lnX3+β4lnX4+β5lnX5+μ用运普通最小二乘法估计:下表给出了采用Eviews软件对表一的数据进行回归分析的统计结果:Dependent Variable: LNYMethod: Least SquaresDate: 12/19/13 Time: 10:05Sample: 1983 2007C -4.173174 1.923624 -2.169434 0.0429LNX1 0.381145 0.050242 7.586182 0.0000 LNX2 1.222289 0.135179 9.042030 0.0000 LNX3 -0.081110 0.015304 -5.300024 0.0000 LNX4 -0.047229 0.044767 -1.054980 0.3047R-squared 0.981597 Mean dependent var 10.70905 Adjusted R-squared 0.976753 S.D. dependent var 0.093396 S.E. of regression 0.014240 Akaike info criterion -5.459968 Sum squared resid 0.003853 Schwarz criterion -5.167438 Log likelihood 74.24960 F-statistic 202.6826 Durbin-Watson stat 1.791427 Prob(F-statistic) 0.000000根据上表估计出的参数,可以得到如下普通最小二乘法估计模型:lnY=‐4.17+0.381lnX1+1.222lnX2‐0.081lnX3‐0.047lnX4‐0.101lnX5四、模型检验:1、数学检验:由于R2为0.9816接近于一,且F=202.68>F0.05(5,9)=2.74,故认为粮食产量和上述解释变量之间的总体线性关系显著;但是就X4,X5来说,其t检验的参数较小,尚不能通过t检验,因此怀疑模型中存在多重共线性。

实验报告3 多重共线性

实验报告3 多重共线性

E V I E W S操作实验题目:多重共线性实验类型:基本操作实验目的:掌握利用Eviews进行多元线性回归;存在多重共线性的基础上掌握逐步回归法的基本操作;及方差扩大因子的计算方法。

实验内容:(按要求完成下面题目)4.6 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。

为此,收集了中国能源消费总量Y (万吨标准煤)、国内生产总值(亿元)X1(代表经济发展水平)、国民总收入(亿元)X2(代表收入水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2002年期间的统计要求:(1)建立对数线性多元回归模型(2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?(3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。

实验步骤:一、设定模型Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+β7X7+u二、估计参数1、各解释变量的相关系数矩阵:X1 X2 X3 X4 X5 X6 X7X1 1.000000 0.9999780.9996710.9988680.9918430.9934890.722545X2 0.999978 1.000000.9997280.9989480.9912510.992990.725681X3 0.999671 0.9997281.000000.9989830.9909460.9921480.732289X4 0.998868 0.9989480.9989831.000000.9878390.9888740.737354X5 0.991843 0.9912510.9909460.9878391.000000.9988290.682852X6 0.993489 0.99299 0.9921480.9888740.9988291.000000.680992X7 0.722545 0.7256810.7322890.7373540.6828520.6809921.00000可以看出,各解释变量之间的相关系数较高,证明存在多重共线性。

统计学第五次实验-多重共线性实验报告

统计学第五次实验-多重共线性实验报告

多重共线性实验报告实验内容:影响粮食生产的主要因素有农作物播种面积,农用化肥施用量、农业机械总动力、农业灾害成灾面积、有效灌溉面积。

根据下列相关数据,建立中国粮食生产函数。

实验目的:估计农作物播种面积,农用化肥施用量、农业机械总动力、农业灾害成灾面积、有效灌溉面积对粮食产量的多重共线性,建立方程并对方程进行检验。

实验数据:粮食产量(万吨)农作物播种面积(千公顷)农用化肥施用量(万吨)农业机械总动力(万千瓦)农业灾害成灾面积(千公顷)有效灌溉面积(千公顷)1984 40730.5 144221.3 1739.8 19497.19 15607 44453 1985 37910.8 143625.9 1775.8 20912.51 22705.333 44035.9 1986 39151.2 144204 1930.6 22950.00 23656 44225.8 1987 40297.7 144956.5 1999.3 24836.00 20392.667 44403 1988 39408.1 144868.9 2141.5 26575.00 24502.667 44375.9 1989 40754.9 146553.9 2357.1 28067.00 24449 44917.2 1990 44624.3 148362.3 2590.3 28707.70 17819 47403.1 1991 43529.3 149585.8 2805.1 29388.60 27814 47822.1 1992 44265.8 149007.1 2930.2 30308.40 25859 48590.1 1993 45648.8 147740.7 3151.9 31816.60 23133 48727.9 1994 44510.1 148240.6 3317.9 33802.50 31383 48759.1 1995 46661.8 149879.3 3593.7 36118.05 22267 49281.2 1996 50453.5 152380.6 3827.9 38546.90 21233 50381.4 1997 49417.1 153969.2 3980.7 42015.60 30309 51238.5 1998 51229.53 155705.7 4083.7 45207.71 25181 52295.6 1999 50838.58 156372.8 4124.32 48996.12 26731 53158.41 2000 46217.52 156299.85 4146.412 52573.61 34374 53820.33 2001 45263.67 155707.86 4253.763 55172.10 31793 54249.391 2002 45705.75 154635.51 4339.39 57929.85 27318.9 54354.8 2003 43069.53 152414.96 4411.56 60386.54 32516.3 54014.23实验过程:1.做出散点图,打开eviews,并把1984年到2003年全国粮食产量及相关值的数据输入表中,建立y和x1,x2,x3,x4,x5。

实验五多重共线性检验参考案例

实验五多重共线性检验参考案例

实验五 多重共线性‎检验实验时间: 姓名:学号: 成绩:【实验目的】1、掌握多元线‎性回归模型‎的估计、检验和预测‎;2、掌握多重共‎线性问题的‎检验方法3、掌握多重共‎线性问题的‎修正方法 【实验内容】1、数据的读取‎和编辑;2、多元回归模‎型的估计、检验、预测;3、多重共线性‎问题的检验‎4、多重共线性‎问题的修正‎ 【实验背景】为了评价报‎账最低工资‎(负收入税)政策的可行‎性,兰德公司进‎行了一项研‎究,以评价劳动‎供给(平均工作小‎时数)对小时工资‎提高的反应‎,词研究中的‎数据取自6‎000户男‎户主收入低‎于1500‎0美元的一‎个国民样本‎,这些数据分‎成39个人‎口组,并放在表1‎中,由于4个人‎口组中的某‎些变量确实‎,所以只给出‎了35个组‎的数据,用于分析的‎各个变量的‎定义如下:Y 表示该年‎度平均工作‎小时数;X1表示平‎均小时工资‎(美元);X2表示配‎偶平均收入‎(美元);X3表示其‎他家庭成员‎的平均收入‎(美元);X4表示年‎均非劳动收‎入(美元);X5表示平‎均家庭资产‎拥有量;X6表示被‎调查者的平‎均年龄;X7表示平‎均赡养人数‎;X 8表示平‎均受教育年‎限。

μ为随机干扰‎项,考虑一下回‎归模型:μβββββββββ+++++++++=87654321876543210X X X X X X X X Y (1) 将该年度平‎均工作小时‎数Y 对X 进‎行回归,并对模型进‎行简单分析‎; (2) 计算各变量‎之间的相关‎系数矩阵,利用相关系‎数法分析变‎量间是否具‎有多重共线‎性;(3) 利用逐步回‎归方法检验‎并修正回归‎模型,最后再对模‎型进行经济‎意义检验、统计检验。

表5观测组Y X1 X2 X3 X4 X5 X6 X7 X81 2157 2.905 1121 291 380 7250 38.5 2.34 10.52 2174 2.97 1128 301 398 7744 39.3 2.335 10.53 2062 2.35 1214 326 185 3068 40.1 2.851 8.94 2111 2.511 1203 49 117 1632 22.4 1.159 11.55 2134 2.791 1013 594 730 12710‎57.7 1.229 8.86 2185 3.04 1135 287 382 776 38.6 2.602 10.77 2210 3.222 1100 295 474 9338 39 2.187 1128 2105 2.495 1180 310 255 4730 39.9 2.616 9.39 2267 2.838 1298 252 431 8317 38.9 2.024 11.110 2205 2.356 885 264 373 6489 38.8 2.662 9.511 2121 2.922 1251 328 312 5907 39.8 2.287 10.312 2109 2.499 1207 347 271 5069 39.7 3.193 8.913 2108 2.796 1036 300 259 4614 38.2 2.4 9.214 2047 2.453 1213 397 139 1987 40.3 2.545 9.115 2174 3.582 1141 414 498 10239‎40 2.064 11.716 2067 2.909 1805 290 239 4439 39.1 2.301 10.517 2159 2.511 1075 289 308 5621 39.3 2.486 9.518 2257 2.516 1093 176 392 7293 37.9 2.042 10.119 1985 1.423 553 381 146 1866 40.6 3.833 6.620 2184 3.636 1091 291 560 11240‎39.1 2.328 11.621 2084 2.983 1327 331 296 5653 39.8 2.208 10.222 2051 2.573 1197 279 172 2806 40 2.362 9.123 2127 3.263 1226 314 408 8042 39.5 2.259 10.824 2102 3.234 1188 414 352 7557 39.8 2.019 10.725 2098 2.28 973 364 272 4400 40.6 2.661 8.426 2042 2.304 1085 328 140 1739 41.8 2.444 8.227 2181 2.912 1072 304 383 9340 39 2.337 10.228 2186 3.015 1122 30 352 7292 37.2 2.046 10.929 2188 3.01 990 366 374 7325 38.4 2.847 10.630 2077 1.901 350 209 95 1370 37.4 4.158 8.231 2196 3.009 947 294 342 6888 37.5 3.047 10.632 2093 1.899 342 311 120 1425 37.5 4.512 8.133 2173 2.959 1116 296 387 7625 39.2 2.342 10.534 2179 2.959 1116 296 387 7625 39.2 2.342 10.535 2200 2.98 1126 204 393 7885 39.2 2.341 10.6 【实验过程】一、利用Evi‎e ws软件‎建立年度平‎均工作小时‎数y的回归‎模型。

多重共线性案例分析实验报告

多重共线性案例分析实验报告

《多重共线性案例分析》实验报告表2由此可见,该模型,可决系数很高,F 检验值173.3525,明显显著。

但是当时,不仅、系数的t 检验不显著,而且系数的符号与预期的相反,这表明很可能存在严重的多重共线性。

9954.02=R 9897.02=R 05.0=α776.2)610()(025.02=-=-t k n t α2X 6X 6X②.计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵表3由关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性相。

4.消除多重共线性①采用逐步回归的办法,去检验和解决多重共线性问题。

分别作Y 对X2、X3、X4、X5、X6的一元回归 如下图所示变量 X2 X3 X4 X5 X6 参数估计值0.08429.0523 11.6673 34.3324 2014.146 t 统计量8.665913.1598 5.1967 6.4675 8.74870.90370.95580.77150.83940.9054表4 按的大小排序为:X3、X6、X2、X5、X4。

以X3为基础,顺次加入其他变量逐步回归。

首先加入X6回归结果为:t=(2.9086) (0.46214)2R 2R 631784.285850632.7639.4109ˆX X Y t ++-=957152.02=R1995 1375.7 62900 464.0 61.5 115.70 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.60 1998 2391.2 69450 607.0 197.0 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.80 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200.0 180.98 7.30表1:1994年—2003年中国游旅收入及相关数据表2:OLS 回归表3:关系数矩阵变量 X2 X3 X4 X5 X6 参数估计值0.08429.0523 11.6673 34.3324 2014.146 t 统计量8.665913.1598 5.1967 6.4675 8.74870.90370.95580.77150.83940.9054表4:Y 对X2、X3、X4、X5、X6的一元回归六、实验结果及分析1. 在参数估计模型和关系数矩阵中, ,可决系数很高,F 检验值173.3525,明显显著。

计量经济学多重共线性实验报告

计量经济学多重共线性实验报告

计量经济学实验报告一、实验目的:1、熟悉和掌握Eviews在多重共线性模型中的应用,如何判断和解决多重共线性问题。

2、加深对课程理论知识的理解和应用。

二、实验问题:农村居民各种不同类型的收入对消费支出影响(2006年)农村居民收入(Y)主要来源于4项:即农业经营收入(X1)、工资性收入(X2)、财产性收入(X3)及转移性收入(X4)。

(1)利用线性模型或双对数模型进行分析。

(2)回归模型中存在多重共线性吗?三、实验数据:由老师提供(本实验报告截取从北京到新疆共31组数据)四、实验步骤:1、建立新的工作文件,输入数据,分别保存为Y(农村居民收入),X1(农业经营收入)、X2(工资性收入)、X3(财产性收入)、及X4(转移性收入)。

2、建立线性模型:Y = a1*X1 + a2*X2 +a3*X3 + a4*X4 + u得到方程:Y = 0.6268809567*X1 + 0.481134931*X2 - 0.255544644*X3 + 2.683018467*X4 + 479.30109493、分析由图中数据可以看出,在最小二乘法下,模型的R平方和F值较大,表明模型中各解释变量对Y的联合线性作用显著;但是X3(财产性收入)的系数是负的,这不符合经济学意义,财产性收入应当与消费支出正相关,故怀疑模型存在多重共线性。

4、检验:计算解释变量之间的简单相关系数:在“quick”菜单中选“group statistics”项中的“correlation”命令。

在出现“serieslist”对话框时,直接输入X1,X2,X3,X4出现如下结果从表中可以看出,解释变量X1、X3、X4之间存在高度线性相关。

4、修正第一步:运用OLS方法逐一求Y对各个解释变量的回归。

(1)Y = 0.8997862236*X1 + 1541.033294t值 15.32947 12.29913prob.值 0.0000 0.0000R2=0.890148 F=234.9925(2)Y = 0.2487123305*X2 + 2505.747921t值 0.527219 2.676297prob.值 0.6021 0.0121R2= 0.009494 F=0.277960(3)Y = 8.049228785*X3 + 1943.170851t值 9.28666 11.56389prob.值 0.0000 0.0000R2=0.748356 F= 86.24206(4)Y = 5.928884198*X4 + 1631.299987t值 9.212266 8.434353prob.值 0.0000 0.0000R2= 0.745314 F=84.86584结合经济意义和统计检验结果分析,在4个一元回归模型中消费支出Y对X1工资性收入线性关系最强,拟合程度较好,与经验相符,因此选(1)为初始的回归模型。

第6章(多重共线性)-案例

第6章(多重共线性)-案例

3.基础解系及其求法 基础解系及其求法
3.1. 基础解系 3.1.2. 基础解系的求法
x1 = − b1, r +1k1 L − b 1 n k n− r x = −b k L − b k 2 ,r +1 1 2n n− r 2 L L L L L L L xr = − br ,r +1k1 L − br n k n− r x r +1 = k 1 k2 xr + 2 = L LLLLL x = k n− r n
在进行经济计量分析时,如果模型地设定出现失误, 在进行经济计量分析时,如果模型地设定出现失误,则容易导 致完全共线性 例如:设定居民消费对工资收入 工资收入S和非劳动收入N及总收入T 例如:设定居民消费对工资收入 和非劳动收入 及总收入 的回 归模型为
C = β 0 + β 1 S + β 2 N + β 3T + ε
§6.1 多重共线性的定义
从数学意义上解释变量之间存在共线性, 从数学意义上解释变量之间存在共线性,就是对于变 量x1,x2,…,xk,如果存在不全为零的数λ1,λ2,…, , 如果存在不全为零的数λ , 使得下式成立: λk,使得下式成立: λ1x1+λ2x2+…+λkxk=0 +λ (*) 则称变量x 则称变量x1,x2,…,xk之间存在一种完全的共线性。 , 在计量经济学中, 在计量经济学中,一个具有两个以上解释变量的线性 回归模型里,如果解释变量之间存在式( 那样的关系, 回归模型里,如果解释变量之间存在式(*)那样的关系, 则称这些解释变量之间存在完全的多重共线性。
设解释变量矩阵为: 设解释变量矩阵为:
1 x 11 1 x 21 X= M M 1 x n1 x 12 x 22 M x n2 L x 1k L x 2k M L x nk

计量经济学实验六 多重共线性

计量经济学实验六 多重共线性

计量经济学实验报告学院:信管学院专业:实验编号:实验六实验题目:多重共线性姓名:学号:指导老师:实验六多重共线性【实验目的】掌握多重共线性的检验及处理方法【实验内容】建立并检验我国钢材产量预测模型【实验步骤】数据来源:国家统计局→国家统计年鉴2012数据(/tjsj/ndsj/2012/indexch.htm)→1、工业(各地区工业产品产量Y/X1/X2)2、固定资产投资(全社会固定资产投资X3)3、国民经济核算(国内生产总值X4)4、运输和邮电(货运量X5)【例1】表1是1995-2011年我国钢材产量(万吨)、生铁产量(万吨)、发电量(亿千瓦时)、固定资产投资(亿元)、国内生产总值(亿元)、铁路运输量(万吨)的统计资料。

一、检验多重共线性⒈相关系数检验利用相关系数可以分析解释变量之间的两两相关情况。

在Eviews软件中可以直接计算相关系数矩阵。

本例中,在Eviews软件命令窗口中键入:COR Y X1 X2 X3 X4 X5或在包含所有解释变量的数组窗口中点击View\Correlations,其结果如图1所示。

由相关系数矩阵可以看出,解释变量之间的相关系数均为0.95以上,即解释变量之间时高度相关的。

图1 解释变量相关系数矩阵⒉辅助回归方程检验当解释变量多余两个且变量之间呈现出较复杂的相关关系时,可以通过建立辅助回归模型来检验多重共线性。

本例中,在Eviews软件命令窗口中键入:LS X1 C X2 X3 X4 X5LS X2 C X1 X3 X4 X5LS X3 C X1 X2 X4 X5LS X4 C X1 X2 X3 X5LS X5 C X1 X2 X3 X4对应的回归结果如图2-6所示。

图2图3图4图5图6上述每个回归方程的F检验值都非常显著,方程回归系数的T检验值表明:X1与X5、X2与X3、X3与X5、X4与X5、X5与X1、X3、X4的T检验值较小,这些变量之间可能不相关或相关程度较小。

多重共线性实训报告

多重共线性实训报告

一、实训背景多重共线性是指回归模型中存在两个或两个以上的自变量高度相关,导致回归系数估计不准确、显著性检验失效等问题。

为了解决多重共线性问题,我们进行了一次多重共线性实训,通过实际操作,了解和掌握多重共线性的检验方法和解决策略。

二、实训目的1. 理解多重共线性的概念和产生原因;2. 掌握多重共线性的检验方法;3. 学习解决多重共线性的策略;4. 培养实际操作能力和问题解决能力。

三、实训内容1. 数据收集与整理本次实训选用某地区居民消费支出数据作为研究对象,数据包括居民收入、教育支出、医疗支出、娱乐支出等变量。

2. 数据分析(1)多重共线性检验采用方差膨胀因子(VIF)和条件指数(CI)对数据进行多重共线性检验。

VIF值越大,表示多重共线性程度越高;CI值越小,表示多重共线性程度越低。

(2)解决多重共线性策略针对检验出的多重共线性问题,采取以下策略进行解决:1)剔除高度相关的变量:通过VIF和CI筛选出高度相关的变量,并将其剔除。

2)主成分分析(PCA):将高度相关的变量通过主成分分析转换为低维变量,降低多重共线性。

3)岭回归:在回归模型中引入岭参数,对回归系数进行惩罚,降低多重共线性。

四、实训过程1. 数据导入与预处理首先,将数据导入统计软件(如SPSS、R等),然后进行数据清洗,包括处理缺失值、异常值等。

2. 多重共线性检验(1)计算VIF和CI通过软件中的相关系数矩阵,计算每个变量的VIF和CI值。

(2)筛选出高度相关的变量根据VIF和CI值,筛选出高度相关的变量。

3. 解决多重共线性问题(1)剔除高度相关的变量根据筛选结果,将高度相关的变量从模型中剔除。

(2)主成分分析对剩余变量进行主成分分析,将高度相关的变量转换为低维变量。

(3)岭回归在回归模型中引入岭参数,对回归系数进行惩罚。

4. 结果分析通过上述处理,多重共线性问题得到有效解决。

对比处理前后的回归系数,发现回归系数估计更加准确,显著性检验更加有效。

实验三 多重共线性

实验三  多重共线性

【实验步骤】 (1) 建立线性回归模型并检验多重共线性 1.建立模型 利用数据分别建立散点图
首先建立一个多元线性回归模型
2.检验多重共线性 进一步选择 Covariance Analysis 的 Correlation,得到变量之间的相关系数矩阵。
由图可得,粮食生产与上述解释变量间总体线性关系显著。但由于其中 X4,X5 前参数估计值未能通过 t 检验,而且符号的经济意义也不合理,故认为解释变量 间存在多重共线性。 (2) 用逐步回归法克服多重共线性 1. 找出最简单的回归形式
计量经济学实验三多重共线性
金融工程 1 班吴卉雨 20141363015 【实验目的】 掌握多重共线性问题出现的来源、后果、检验及修正的原理,以及相关的 Eviews 操作方法。 【实验内容】 练习检查和克服模型的多重共线性的操作方法。 实验题目和内容: 以教材 P140 例 4.3.1 的数据为基础,练习多重共线性的检验与解决。 数据
X 。 分别使用量影响较大,与经验相符合,因此选其为初 始的回归模型。 2.逐步回归 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。 第一步:在初始模型中引入 X 2 ,模型拟合优度提高,参数符号合理,且变量通 过了 t 检验,D.W.检验值落在上界以上,表明不存在 1 阶序列相关性;
第二步,引入 X 3 ,拟合优度再次提高,且参数符号合理,变量也通过 t 检验,
只是 D.W.值落入了无法判断的区域,且由 LM 检验知道仍不存在 1 阶自相关性
第三步,引入 X 4 ,修正的拟合优度有所下降,且 X 4 参数未能通过 t 检验;
第四步,去掉 X4,引入 X5,拟合优度有所提高,但 X5 参数未通过 t 检验,且参 数符号与经济意义不同

实验报告三(多重共线性)

实验报告三(多重共线性)

实验三多重共线性一、研究的目的要求一直以来,钢铁一直是衡量一个国家经济实力的一个标志。

近年来,随着经济的不断发展。

我国钢铁产量及供应量也在不断提升。

为了确定影响中国钢铁供应量的主要因素,需要建立计量分析模型,分析影响我国钢铁供应量的主要因素。

二、模型设定为了全面反映影响我国钢铁供应量的主要因素,选取了我国1986-2005年我国钢材供应量的具体数据,选择“钢材供应量(万吨)Y”作为被解释变量,“原油产量(万吨)X2”、“生铁产量(万吨)X3”、“原煤产量(万吨)X4”、“电力产量(亿千瓦小时)X5”、“固定资产投资(亿元)X6”、“国内生产总值(亿元)X7”、和“铁路运输量(万吨)X8”作为解释变量。

收集的数据如下:利用EViews软件,生成Y t、X2、X3、X4、X5、X6、X7、X8等的数据,采用这些对模型进行OLS回归,结果如下图所示:由此可见,该模型R2=0.997857,修正的可决系数为0.996606,可决系数高,F检验值为798.0921,明显显著。

但是当α= 0.05时,t a/2(n-k)=t0.025(20-9)=2.201,不仅X2、X4、X6、X7、X8 的系数t检验不显著,而且X2、X4、X7系数的符号与预期相反,这表明很可能存在严重的多重共线性。

计算各解释变量的相关系数,选择X2、X3、X4、X5、X6、X7、X8的数据,点“view/correlation”得相关系数矩阵,如下图:由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实确实存在严重的多重共线性。

三、修正多重共线性采用逐步回归的办法,去检验和解决多重共线性问题。

分别作Y对X2、X3、X4、X5、X6、X7、X8一元回归,结果如下图所示:其中,X5的方程修正的可决系数最大,以X5为基础,顺次加入其他变量逐步回归。

结果如下图:加入新变量的回归结果经比较,加入X3的方程的修正的可决系数为0.997005,改进最大,而且各参数的t检验显著,选择保留X3,再加入其他新变量逐步回归,结果如下图所示:加入新变量的回归结果经比较,无论加入哪一个变量,修正的可决系数均没有有所提高,反而下降,且新加入的参数的t检验不显著,并为负值不合理。

多重共线性检验实训报告

多重共线性检验实训报告

一、实训背景在计量经济学和统计分析中,多重共线性是指模型中的多个自变量之间存在高度的相关性。

这种相关性会导致回归系数估计的不稳定,影响模型的预测能力和解释力。

因此,对多重共线性进行检验和修正对于确保模型的准确性和可靠性至关重要。

本实训旨在通过实际操作,学习如何使用SPSS软件进行多重共线性检验,并探讨相应的修正方法。

二、实训目的1. 理解多重共线性的概念及其对模型的影响。

2. 掌握使用SPSS软件进行多重共线性检验的方法。

3. 学习识别多重共线性的存在,并掌握相应的修正方法。

4. 提高对计量经济学模型诊断和修正的实际操作能力。

三、实训内容1. 数据准备本实训使用的数据集为某城市房价与多个影响因素的相关数据,包括房价(被解释变量)和收入、教育水平、交通便利性、周边设施等(解释变量)。

2. SPSS软件操作(1)数据导入首先,将数据集导入SPSS软件。

在SPSS界面中,点击“文件”菜单,选择“打开”,找到数据文件并导入。

(2)多重共线性检验导入数据后,进行以下操作:a. 点击“分析”菜单,选择“回归”,再选择“线性”。

b. 将被解释变量拖入“因变量”框,将解释变量拖入“自变量”框。

c. 点击“统计”菜单,选择“共线性诊断”。

d. 点击“继续”,然后点击“确定”。

(3)结果分析SPSS会自动计算并显示多重共线性的检验结果,主要包括方差膨胀因子(VIF)和容忍度(Tolerance)。

3. 结果分析(1)方差膨胀因子(VIF)VIF用于衡量变量之间相关性的程度。

一般来说,VIF值大于10表示存在多重共线性问题。

本实训中,我们发现收入、教育水平和交通便利性三个变量的VIF值均大于10,说明这三个变量之间存在严重的多重共线性。

(2)容忍度(Tolerance)容忍度是VIF的倒数,用于衡量变量之间独立性的程度。

一般来说,容忍度值小于0.1表示存在多重共线性问题。

本实训中,我们发现收入、教育水平和交通便利性的容忍度值均小于0.1,进一步证实了这三个变量之间存在多重共线性。

多重共线性的检验和解决的实验报告1

多重共线性的检验和解决的实验报告1

多重共线性的检验和解决的实验报告1
实验三报告
⼀、实验⽬的:
1.掌握多重共线性的识别⽅法
2.能针对具体问题提出解决多重共线性问题的措施
⼆、实验步骤:
1 相关系数法检验多重共线性
( 1 )点击Eviews6.reg注册然后点击Eviews6.exe
(2) 在file —new —workfile 在start date 和end date 输⼊1960、1982点击确定
(3) 在proc中找到import输⼊Excel 表并在弹出的对话框中输⼊Y X2 X3 X4
X5 X6 检查数据输⼊是否正确
(4)在Eviews 编辑框中输⼊ls Y C X1 X2 X3 X4 进⾏回归,结果如下t值
检验不符合。

说明解释变量之间很可能存在多重共线性。

2 画图法检验是否存在多重共线性:
在quick 中点击Graph在弹出的对话框中输⼊X1 Y 、X2 Y、X3 Y X4 Y点击确定,分别选择scatter 选择带回归线,分别可以看出各⾃变量与Y之间的线性关系,也说明解释变量之间可能存在多重共线性。

综合以上两种检验说明解释变量之间存在多重共线性。

3多重共线性的补救措施(逐步回归法):
(1)分别对四个⾃变量进⾏回归,选拟合优度最⼤的X1作为基本⽅程即Y=-12.45554+0.117845X1,采⽤逐步回归法分别对其进⾏回归
通过以上实验得到i i i x x x 321i 1856.38818.11036.05926.127y
+-+-= Y-X1-X2(留,可决系数升⾼,符号正确)-X3(留,可决系数升⾼,符号正确)
-X4(删,可决系数升⾼,X4的系数不显著)。

实验五__多重共线性检验参考案例共16页word资料

实验五__多重共线性检验参考案例共16页word资料

实验五 多重共线性检验实验时间: 姓名:学号: 成绩:【实验目的】1、掌握多元线性回归模型的估计、检验和预测;2、掌握多重共线性问题的检验方法3、掌握多重共线性问题的修正方法 【实验内容】1、数据的读取和编辑;2、多元回归模型的估计、检验、预测;3、多重共线性问题的检验4、多重共线性问题的修正 【实验背景】为了评价报账最低工资(负收入税)政策的可行性,兰德公司进行了一项研究,以评价劳动供给(平均工作小时数)对小时工资提高的反应,词研究中的数据取自6000户男户主收入低于15000美元的一个国民样本,这些数据分成39个人口组,并放在表1中,由于4个人口组中的某些变量确实,所以只给出了35个组的数据,用于分析的各个变量的定义如下:Y 表示该年度平均工作小时数;X1表示平均小时工资(美元);X2表示配偶平均收入(美元);X3表示其他家庭成员的平均收入(美元);X4表示年均非劳动收入(美元);X5表示平均家庭资产拥有量;X6表示被调查者的平均年龄;X7表示平均赡养人数;X8表示平均受教育年限。

μ为随机干扰项,考虑一下回归模型:μβββββββββ+++++++++=87654321876543210X X X X X X X X Y(1) 将该年度平均工作小时数Y 对X 进行回归,并对模型进行简单分析; (2) 计算各变量之间的相关系数矩阵,利用相关系数法分析变量间是否具有多重共线性;(3) 利用逐步回归方法检验并修正回归模型,最后再对模型进行经济意义检验、统计检验。

表5观测组Y X1 X2 X3 X4 X5 X6 X7 X81 2157 2.905 1121 291 380 7250 38.5 2.34 10.52 2174 2.97 1128 301 398 7744 39.3 2.335 10.53 2062 2.35 1214 326 185 3068 40.1 2.851 8.94 2111 2.511 1203 49 117 1632 22.4 1.159 11.55 2134 2.791 1013 594 730 12710 57.7 1.229 8.86 2185 3.04 1135 287 382 776 38.6 2.602 10.77 2210 3.222 1100 295 474 9338 39 2.187 1128 2105 2.495 1180 310 255 4730 39.9 2.616 9.39 2267 2.838 1298 252 431 8317 38.9 2.024 11.110 2205 2.356 885 264 373 6489 38.8 2.662 9.511 2121 2.922 1251 328 312 5907 39.8 2.287 10.312 2109 2.499 1207 347 271 5069 39.7 3.193 8.913 2108 2.796 1036 300 259 4614 38.2 2.4 9.214 2047 2.453 1213 397 139 1987 40.3 2.545 9.115 2174 3.582 1141 414 498 10239 40 2.064 11.716 2067 2.909 1805 290 239 4439 39.1 2.301 10.517 2159 2.511 1075 289 308 5621 39.3 2.486 9.518 2257 2.516 1093 176 392 7293 37.9 2.042 10.119 1985 1.423 553 381 146 1866 40.6 3.833 6.620 2184 3.636 1091 291 560 11240 39.1 2.328 11.621 2084 2.983 1327 331 296 5653 39.8 2.208 10.222 2051 2.573 1197 279 172 2806 40 2.362 9.123 2127 3.263 1226 314 408 8042 39.5 2.259 10.824 2102 3.234 1188 414 352 7557 39.8 2.019 10.725 2098 2.28 973 364 272 4400 40.6 2.661 8.426 2042 2.304 1085 328 140 1739 41.8 2.444 8.227 2181 2.912 1072 304 383 9340 39 2.337 10.228 2186 3.015 1122 30 352 7292 37.2 2.046 10.929 2188 3.01 990 366 374 7325 38.4 2.847 10.630 2077 1.901 350 209 95 1370 37.4 4.158 8.231 2196 3.009 947 294 342 6888 37.5 3.047 10.632 2093 1.899 342 311 120 1425 37.5 4.512 8.133 2173 2.959 1116 296 387 7625 39.2 2.342 10.534 2179 2.959 1116 296 387 7625 39.2 2.342 10.535 2200 2.98 1126 204 393 7885 39.2 2.341 10.6 【实验过程】一、利用Eviews软件建立年度平均工作小时数y的回归模型。

实验五__多重共线性检验参考案例

实验五__多重共线性检验参考案例

实验五__多重共线性检验参考案例多重共线性检验是用来检验自变量之间是否存在高度相关性的一种方法。

在回归分析中,如果自变量之间存在高度相关性,会导致回归方程中的相关系数估计值不稳定,难以准确地解释自变量对因变量的影响。

因此,进行多重共线性检验是非常重要的。

下面将以一个案例来说明如何进行多重共线性检验。

假设我们想研究一些城市的房价与以下自变量相关性的影响:房屋面积、房间数量、距离市中心的距离。

我们采集了100个样本,并进行了回归分析。

首先,我们可以查看自变量之间的相关系数矩阵,以判断是否存在高度相关性。

下面是自变量之间的相关系数矩阵:房屋面积房间数量距离市中心的距离房屋面积10.80.2房间数量0.810.1距离市中心的距离0.20.11从相关系数矩阵可以看出,房屋面积和房间数量之间存在高度相关性,相关系数为0.8、这可能意味着两个自变量提供了类似的信息,在回归分析中可能会造成多重共线性的问题。

接下来,我们可以计算自变量的方差膨胀因子(VIF)来进一步检验多重共线性。

VIF是用来度量自变量之间相关度的指标,VIF值越大,说明自变量之间的共线性越强。

计算VIF的公式如下:VIF_i=1/(1-R_i^2)其中,VIF_i表示自变量i的VIF值,R_i^2表示通过其他自变量对自变量i进行回归分析得到的决定系数。

下面是计算三个自变量的VIF值:VIF_房屋面积=1/(1-0.8^2)=1.67VIF_房间数量=1/(1-0.8^2)=1.67VIF_距离市中心的距离=1/(1-0.1^2)=1.01从计算结果可以看出,三个自变量的VIF值都在可接受的范围内,说明它们之间并不存在严重的多重共线性问题。

最后,我们可以绘制自变量对因变量的散点图,以观察它们之间的关系。

如果自变量之间存在高度相关性,会导致散点图中观测点呈现出一种线性的形态。

综上所述,通过相关系数矩阵、VIF值以及散点图的分析,我们可以得出结论:在这个案例中,房屋面积、房间数量和距离市中心的距离之间不存在严重的多重共线性问题,可以继续进行回归分析。

多重共线性实验报告

多重共线性实验报告

多重共线性实验报告多重共线性实验报告导言多重共线性是统计学中一个重要的问题,它指的是自变量之间存在高度相关性,从而导致回归模型的不稳定性和不可靠性。

本实验旨在通过构建多重共线性模型,探讨其对回归分析结果的影响,并提出相应的解决方案。

实验设计本实验采用了一个虚拟数据集,包含了10个自变量和一个因变量。

首先,我们通过计算自变量之间的相关系数矩阵,判断是否存在多重共线性。

然后,我们构建了一个多重共线性模型,并对其进行回归分析。

最后,我们比较了多重共线性模型和无多重共线性模型的结果,以及采取不同解决方案对结果的影响。

多重共线性检验通过计算自变量之间的相关系数矩阵,我们发现其中存在一些高度相关的自变量。

例如,自变量A和自变量B之间的相关系数为0.8,自变量C和自变量D之间的相关系数为0.7。

这些高度相关的自变量可能会导致多重共线性问题。

多重共线性模型为了模拟多重共线性的情况,我们构建了一个多重共线性模型。

该模型包含了自变量A、B、C和D,并假设它们之间存在高度相关性。

我们使用最小二乘法进行回归分析,并得到了模型的回归系数和显著性检验结果。

多重共线性模型的结果通过对多重共线性模型进行回归分析,我们发现自变量A和自变量B的回归系数都显著为0,而自变量C和自变量D的回归系数都显著为1。

这表明多重共线性模型无法准确估计自变量的影响。

此外,模型的显著性检验结果也不可靠,因为多重共线性导致了回归系数的不稳定性。

解决方案一:剔除相关性较高的自变量为了解决多重共线性问题,我们可以考虑剔除相关性较高的自变量。

在本实验中,我们选择剔除自变量B和自变量D,因为它们与其他自变量的相关系数较高。

重新进行回归分析后,我们发现模型的回归系数和显著性检验结果都变得更加稳定和可靠。

解决方案二:主成分分析另一个常用的解决多重共线性问题的方法是主成分分析。

主成分分析可以将原始自变量转换为一组无关的主成分,从而降低自变量之间的相关性。

在本实验中,我们对自变量进行主成分分析,并选择前两个主成分进行回归分析。

实验报告多重共线性

实验报告多重共线性

西南科技大学Southwest University of Science and Technology 经济管理学院计量经济学实验报告——多元线性回归的检验专业班级:国贸0903姓名:王鑫学号: 20092438任课教师:龙林成绩:简单线性回归模型的处理实验目的:掌握多元回归参数的估计和检验的处理方法。

实验要求:学会建立模型,估计模型中的未知参数等。

试验用软件:Eviews实验原理:线性回归模型的最小二乘估计、回归系数的估计和检验。

实验内容:1、实验用样本数据:运用Eviews软件,建立1990—2001年中国国内生产总值X和深圳市收入Y的回归模型,做简单线性回归分析,并对回归结果进行检验。

以研究我国国内生产总值对深圳市收入的影响。

年份地方预算内财政收入Y(亿元)国内生产总值(GDP)X(亿元)1990 21.7037 171.6665 1991 27.3291 236.6630 1992 42.9599 317.3194 1993 67.2507 449.2889 1994 74.3992 615.1933 1995 88.0174 795.6950 1996 131.7490 950.0446 1997 144.7709 1130.0133 1998 164.9067 1289.0190 1999 184.7908 1436.0267 2000 225.0212 1665.4652 2001 265.6532 1954.6539经过简单的回归分析后得出表EQ1:Dependent Variable: YMethod: Least SquaresDate: 11/28/11 Time: 18:31Sample: 1990 2001Included observations: 12Variable CoefficientStd. Error t-Statistic Prob.C -3.611151 4.161790 -0.867692 0.4059X 0.134582 0.003867 34.80013 0.0000 R-squared 0.991810 Mean dependent var 119.8793 Adjusted R-squared 0.990991 S.D. dependent var 79.36124S.E. of regression 7.532484 Akaike infocriterion 7.027338Sum squared resid 567.3831 Schwarz criterion 7.108156Log likelihood -40.16403 F-statistic 1211.049Durbin-Watson stat 2.051640 Prob(F-statistic) 0.00000其中拟合优度为:0.991810有很强的线性关系。

多重共线性回归分析及其实验报告

多重共线性回归分析及其实验报告

实验报告实验题目:多重共线性的研究指导老师:学生一:学生二:实验时间:2011 年10 月多重线性回归分析及其实验报告实验目的:为了更好地了解财政收入构成,需要定量地分析影响财政收入的因素模型设定及其估计:经分析,影响财政收入的主要因素,农业增加值X1,工业增加值X2,建筑业增加值X3,总人口X4,受灾面积X5.为此设定了如下形式的计量经济模型:丫= 1 + 2 X1+ 3 X2+ 4 X3+ 5 X4+ 6 X5+U0其中,丫为财政收入(元),X1农业增加值(元),X2为工业增加值(元),X3为建筑业增加值(元),X4为总人口(万人),X5为受灾面积(千公顷)为估计模型参数,收集佃78~2007年财政收入及其影响因素数据,如图:1978~2007年财政收入及其影响因素数据年份财政收入CS/亿元农业增加值NZ/亿元工业增加值GZ/亿元建筑业增加值JZZ/亿元总人口TPOP万人受火面积SZM千公顷1978 1132.3 1027.5 1607 138.2 96259 50790 1979 1146.6 1270.2 1769.7 143.8 97542 39370 1980 1159.9 1371.4 1996.5 195.5 98705 44526 1981 1175.8 1559.5 2048.5 207.1 100072 39790 1982 1212.3 1777.4 2162.3 220.7 101654 33130 1983 1367 1978.5 2375.8 270.6 103008 34710 1984 1642.5 2316.1 2789 316.7 104357 31890 1985 2004.6 2564.3 3448.5 417.9 105851 44365 1986 2122 2788.7 3987.5 525.7 107507 47170 1987 2199.4 3233 4565.9 665.8 109300 42090 1988 2357.6 3865.4 5062 810 111026 50870 1989 2664.5 5062 8087.3 794 112704 46991 1990 2937.4 5342.3 10284.5 859.4 114333 384741991 3149.48 5866.8 14188 1015.1 115823 55472 1992 3483.48 6963.6 19480.5 1415 117171 513331993 4348.95 9572.7 19480.4 2266.5 118517 48829 1994 5218.1 12315.7 24950.7 2964.7 119850 55043 1995 6242.2 14015.8 29447.6 3728.8 121121 45821 1996 7407.99 14441.8 32921.4 4387.4 122389 46898 1997 8615.14 14917.6 34018.4 4985.8 123626 53429 1998 9875.95 14944.5 40036 5172.1 124761 59145 1999 11444.08 15871.8 43580.6 5522.3 125786 499812000 13395.23 16537 47431.6 5913.7 126743 54688 2001 16386.04 17381.8 54945.5 6465.5 127627 52215 2002 18903.64 21412.7 65210 7490.8 128453 47119 2003 21715.25 22420 76912.6 8694.3 129227 54506 2004 26396.47 21224 87632.4 8967.8 129988 37106 2005 31649.29 22420 89834.5 10133.8 130756 388182006 38760.2 24040.9 91310.9 11851.1 131448 41091 2007 51321.45 28095 107367.2 14014.1 132129 48992利用Eviews软件,生成Y、X1、X2、X3、X4、X5等数据,采用这些数据进行OLS回归,结果如下Depe ndent Variable: YMethod: Least SquaresDate: 10/24/11 Time: 22:49Sample: 1978 2007In cluded observati ons: 30Variable Coefficie nt Std. Error t-Statistic Prob.C -6734.394 11259.37 -0.598115 0.5554X1 -1.678611 0.328371 -5.111937 0.0000X2 0.071078 0.081171 0.875666 0.3899X3 5.699199 0.745591 7.643870 0.0000X4 0.101481 0.114244 0.888277 0.3832X5 -0.010922 0.057578 -0.189691 0.8511 R-squared 0.983660 Mean depe ndent var 10047.83Adjusted R-squared 0.980255 S.D. dependent var 12585.61S.E. of regressi on 1768.473 Akaike info criteri on 17.97048Sum squared resid 75059958 Schwarz criteri on 18.25072Log likelihood -263.5572 F-statistic 288.9512Durb in -Watson stat 0.898668 Prob(F-statistic) 0.000000由此可见,该模型R2 =0.983660, R2=0.980255可决系数很高,F检验值为288.9512,明显显著。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验五 多重共线性模型的检验与处理(1)
一、研究的目的要求
近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。

中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。

改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。

为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。

二、模型设定及其估计
经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。

为此,考虑的影响因素主要有国内旅游人数2X ,城镇居民人均旅游支出3X ,农村居民人均旅游支出4X ,并以公路里程5X 和铁路里程6X 作为相关基础设
施的代表。

为此设定了如下对数形式的计量经济模型: 23456123456t t t t t t t Y X X X X X u ββββββ=++++++
其中 :t Y ——第t 年全国旅游收入
2X ——国内旅游人数 (万人)
3X ——城镇居民人均旅游支出 (元) 4X ——农村居民人均旅游支出 (元)
5X ——公路里程(万公里) 6X ——铁路里程(万公里)
为估计模型参数,收集旅游事业发展最快的1994—2003年的统计数据,如表4.2所示:
利用Eviews 软件,输入Y 、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS 回归,结果如表4.3:
表4.3
由此可见,该模型9954.02=R ,9897.02
=R 可决系数很高,F 检验值173.3525,明
显显著。

但是当05.0=α时776
.2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检
验不显著,而且6X 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。

计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵(如表4.4):
表4.4
由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。

三、消除多重共线性
采用逐步回归的办法,去检验和解决多重共线性问题。

分别作Y 对X2、X3、X4、X5、X6的一元回归,结果如表4.5所示:
表4.5
按2
R 的大小排序为:X3、X6、X2、X5、X4。

以X3为基础,顺次加入其他变量逐步回归。

首先加入X6回归结果为:
631784.285850632.7639.4109ˆX X Y t ++-=
t=(2.9086) (0.46214) 957152.02
=R
当取05.0=α时,365
.2)310()(025.02
=-=-t k n t
α,X6参数的t 检验不显著,予以剔除,
加入X2回归得
23029761.0194241.6393.3326ˆX X Y t ++-=
t=(4.2839) (2.1512) 973418.02
=R
X2参数的t 检验不显著,予以剔除,加入X5回归得
5390789.10736535.6972.3059ˆX X Y t ++-=
t=(6.6446) (2.6584) 978028.02
=R
X3、X5参数的t 检验显著,保留X5,再加入X4回归得
453221965.362909.13215884.4161.2441ˆX X X Y t +++-=
t=(3.944983) (4.692961) (3.06767)
991445.02=R 987186.02=R F=231.7935 DW=1.952587
当取05.0=α时,447
.2)410()(025.02=-=-t k n t α,X3、X4、X5系数的t 检验都显著,
这是最后消除多重共线性的结果。

这说明,在其他因素不变的情况下,当城镇居民人均旅游支出
3X 和农村居民人均旅游支出
4X 分别增长1元时,国内旅游收入t Y 将分别增长4.21亿元和3.22亿元。

在其他因素不变
的情况下,作为旅游设施的代表,公路里程5X 每增加1万公里时, 国内旅游收入t Y 将增长
13.63亿元。

实验五 多重共线性模型的检验与处理(2)
(学生进行独立训练的问题)
【实验目的及要求】
熟悉多重共线性检验的基本操作。

【实施环境】1、电脑1人一台。

2、Eviews3.1学生版 【实验目的】
掌握多重共线性的检验及处理方法 【实验内容】
建立并检验我国钢材产量预测模型 【实验方案设计和步骤】
表1是1978-1997年我国钢材产量(万吨)、生铁产量(万吨)、发电量(亿千瓦时)、固定。

相关文档
最新文档