多重共线性处理经典例题

合集下载

多重共线性示例

多重共线性示例

解决多重共线性实例天津市1974-1987年与粮食销售量有关的影响因素如下表。

建立粮食销售量模型。

年份 Y2X 3X 4X 5X 6X 1974 98.45 560.20 153.20 6.53 1.23 1.89 1975 100.70 603.11 190.00 9.12 1.30 2.03 … … … … … … … 1987 178.69 828.73 1094.67 23.53 11.68 23.37天津统计年鉴(1988)其中:Y 是粮食销售量(万吨);2X 常住人口(万人); 3X 人均收入(元); 4X 肉类销售量(万吨); 5X 蛋类销售量(万吨); 6X 鱼虾销售量(万吨); 一、初步模型及存在的问题多元线性回归模型估计结果如下:65432491445336782073670125305003X X X X X Y......ˆ-++++-=(2.119)(1.945)(2.130)(1.409)(-2.028) 970402.=R 5352.=F7205.ˆ=σ9731.=DW 方程中可决系数2R 和F 统计量很大,但t 统计量较小。

临界值30626140250.)(t .=-,所有参数估计值都不能通过显著性检验。

这是存在多重共线性的典型特征。

如果利用相关系数检验法,可以得到各解释变量之间的相关系数分别为8666023.=r 8823024.=r 8524025.=r 8213026.=r 9459034.=r 9648035.=r 9825036.=r 9405045.=r 9484046.=r 9820056.=r 可见任何两个解释变量之间都有很强的正线性相关关系。

因此样本存在严重的多重共线性。

二、模型的修正由以上结果表明,任何一个解释变量与被解释变量之间的关系都是显著的。

从经济意义角度来看,人口数和人均收入应该构成影响粮食销售量的主要因素,因此建模时常住人口数X和人均收入3X应作为基本解释2变量予以保留。

多重共线性习题及答案

多重共线性习题及答案

多重共线性一、单项选择题1、当模型存在严重的多重共线性时,OLS估计量将不具备()A、线性B、无偏性C、有效性D、一致性2、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF()A、大于B、小于C、大于5D、小于53、模型中引入实际上与解释变量有关的变量,会导致参数的OLS估计量方差()A、增大B、减小C、有偏D、非有效4、对于模型y t=b0+b1x1t+b2x2t+u t,与r12=0相比,r12=0.5时,估计量的方差将是原来的()A、1倍B、1.33倍C、1.8倍D、2倍5、如果方差膨胀因子VIF=10,则什么问题是严重的()A、异方差问题B、序列相关问题C、多重共线性问题D、解释变量与随机项的相关性6、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( )A 异方差B 序列相关C 多重共线性D 高拟合优度7、存在严重的多重共线性时,参数估计的标准差()A、变大B、变小C、无法估计D、无穷大8、完全多重共线性时,下列判断不正确的是()A、参数无法估计B、只能估计参数的线性组合C、模型的拟合程度不能判断D、可以计算模型的拟合程度二、多项选择题1、下列哪些回归分析中很可能出现多重共线性问题()A、资本投入与劳动投入两个变量同时作为生产函数的解释变量B、消费作被解释变量,收入作解释变量的消费函数C、本期收入和前期收入同时作为消费的解释变量的消费函数D、商品价格、地区、消费风俗同时作为解释变量的需求函数E、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型2、当模型中解释变量间存在高度的多重共线性时()A、各个解释变量对被解释变量的影响将难以精确鉴别B、部分解释变量与随机误差项之间将高度相关C、估计量的精度将大幅度下降D、估计对于样本容量的变动将十分敏感E、模型的随机误差项也将序列相关3、下述统计量可以用来检验多重共线性的严重性()A、相关系数B、DW值C、方差膨胀因子D、特征值E、自相关系数4、多重共线性产生的原因主要有()A、经济变量之间往往存在同方向的变化趋势B、经济变量之间往往存在着密切的关联C、在模型中采用滞后变量也容易产生多重共线性D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性E、以上都正确5、多重共线性的解决方法主要有()A、保留重要的解释变量,去掉次要的或替代的解释变量B、利用先验信息改变参数的约束形式C、变换模型的形式D、综合使用时序数据与截面数据E、逐步回归法以及增加样本容量6、关于多重共线性,判断错误的有()A、解释变量两两不相关,则不存在多重共线性B、所有的t检验都不显著,则说明模型总体是不显著的C、有多重共线性的计量经济模型没有应用的意义D、存在严重的多重共线性的模型不能用于结构分析7、模型存在完全多重共线性时,下列判断正确的是()A、参数无法估计B、只能估计参数的线性组合C、模型的判定系数为0D、模型的判定系数为1三、简述1、什么是多重共线性?产生多重共线性的原因是什么?2、什么是完全多重共线性?什么是不完全多重共线性?3、完全多重共线性对OLS估计量的影响有哪些?4、不完全多重共线性对OLS估计量的影响有哪些?5、从哪些症状中可以判断可能存在多重共线性?6、什么是方差膨胀因子检验法?四、判断(1)如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。

实验五多重共线性检验参考案例

实验五多重共线性检验参考案例

实验五 多重共线性‎检验实验时间: 姓名:学号: 成绩:【实验目的】1、掌握多元线‎性回归模型‎的估计、检验和预测‎;2、掌握多重共‎线性问题的‎检验方法3、掌握多重共‎线性问题的‎修正方法 【实验内容】1、数据的读取‎和编辑;2、多元回归模‎型的估计、检验、预测;3、多重共线性‎问题的检验‎4、多重共线性‎问题的修正‎ 【实验背景】为了评价报‎账最低工资‎(负收入税)政策的可行‎性,兰德公司进‎行了一项研‎究,以评价劳动‎供给(平均工作小‎时数)对小时工资‎提高的反应‎,词研究中的‎数据取自6‎000户男‎户主收入低‎于1500‎0美元的一‎个国民样本‎,这些数据分‎成39个人‎口组,并放在表1‎中,由于4个人‎口组中的某‎些变量确实‎,所以只给出‎了35个组‎的数据,用于分析的‎各个变量的‎定义如下:Y 表示该年‎度平均工作‎小时数;X1表示平‎均小时工资‎(美元);X2表示配‎偶平均收入‎(美元);X3表示其‎他家庭成员‎的平均收入‎(美元);X4表示年‎均非劳动收‎入(美元);X5表示平‎均家庭资产‎拥有量;X6表示被‎调查者的平‎均年龄;X7表示平‎均赡养人数‎;X 8表示平‎均受教育年‎限。

μ为随机干扰‎项,考虑一下回‎归模型:μβββββββββ+++++++++=87654321876543210X X X X X X X X Y (1) 将该年度平‎均工作小时‎数Y 对X 进‎行回归,并对模型进‎行简单分析‎; (2) 计算各变量‎之间的相关‎系数矩阵,利用相关系‎数法分析变‎量间是否具‎有多重共线‎性;(3) 利用逐步回‎归方法检验‎并修正回归‎模型,最后再对模‎型进行经济‎意义检验、统计检验。

表5观测组Y X1 X2 X3 X4 X5 X6 X7 X81 2157 2.905 1121 291 380 7250 38.5 2.34 10.52 2174 2.97 1128 301 398 7744 39.3 2.335 10.53 2062 2.35 1214 326 185 3068 40.1 2.851 8.94 2111 2.511 1203 49 117 1632 22.4 1.159 11.55 2134 2.791 1013 594 730 12710‎57.7 1.229 8.86 2185 3.04 1135 287 382 776 38.6 2.602 10.77 2210 3.222 1100 295 474 9338 39 2.187 1128 2105 2.495 1180 310 255 4730 39.9 2.616 9.39 2267 2.838 1298 252 431 8317 38.9 2.024 11.110 2205 2.356 885 264 373 6489 38.8 2.662 9.511 2121 2.922 1251 328 312 5907 39.8 2.287 10.312 2109 2.499 1207 347 271 5069 39.7 3.193 8.913 2108 2.796 1036 300 259 4614 38.2 2.4 9.214 2047 2.453 1213 397 139 1987 40.3 2.545 9.115 2174 3.582 1141 414 498 10239‎40 2.064 11.716 2067 2.909 1805 290 239 4439 39.1 2.301 10.517 2159 2.511 1075 289 308 5621 39.3 2.486 9.518 2257 2.516 1093 176 392 7293 37.9 2.042 10.119 1985 1.423 553 381 146 1866 40.6 3.833 6.620 2184 3.636 1091 291 560 11240‎39.1 2.328 11.621 2084 2.983 1327 331 296 5653 39.8 2.208 10.222 2051 2.573 1197 279 172 2806 40 2.362 9.123 2127 3.263 1226 314 408 8042 39.5 2.259 10.824 2102 3.234 1188 414 352 7557 39.8 2.019 10.725 2098 2.28 973 364 272 4400 40.6 2.661 8.426 2042 2.304 1085 328 140 1739 41.8 2.444 8.227 2181 2.912 1072 304 383 9340 39 2.337 10.228 2186 3.015 1122 30 352 7292 37.2 2.046 10.929 2188 3.01 990 366 374 7325 38.4 2.847 10.630 2077 1.901 350 209 95 1370 37.4 4.158 8.231 2196 3.009 947 294 342 6888 37.5 3.047 10.632 2093 1.899 342 311 120 1425 37.5 4.512 8.133 2173 2.959 1116 296 387 7625 39.2 2.342 10.534 2179 2.959 1116 296 387 7625 39.2 2.342 10.535 2200 2.98 1126 204 393 7885 39.2 2.341 10.6 【实验过程】一、利用Evi‎e ws软件‎建立年度平‎均工作小时‎数y的回归‎模型。

多重共线性-例题

多重共线性-例题

2.多重共线性的经济解释(1)经济变量在时间上有共同变化的趋势。

如在经济上升时期,收入、消费、就业率等都增长,当经济收缩期,收入、消费、就业率等又都下降。

当这些变量同时进入模型后就会带来多重共线性问题。

0.E+001.E+112.E+113.E+114.E+11808284868890929496980002GDPCONS0.E+001.E+112.E+113.E+114.E+110.0E+005.0E+101.0E+111.5E+112.0E+112.5E+11CONSGDP of HongKong(2)解释变量与其滞后变量同作解释变量。

0.E+001.E+112.E+113.E+114.E+11808284868890929496980002GDP0.E+001.E+112.E+113.E+114.E+110.E+001.E+112.E+113.E+114.E+11GDP(-1)GDP3.多重共线性的后果(1)当 | r x i x j | = 1,X 为降秩矩阵,则 (X 'X ) -1不存在,βˆ= (X 'X )-1 X 'Y 不可计算。

(2)若 | r x i x j | ≠1,即使 | r x i x j | →1,βˆ仍具有无偏性。

E(βˆ) = E[(X 'X )-1 X 'Y ] = E[(X 'X ) -1X '(X β + u )] = β + (X 'X )-1X ' E(u ) = β. (3)当 | r x i x j | →1时,X 'X 接近降秩矩阵,即 | X 'X | →0,V ar(βˆ) = σ 2 (X 'X )-1变得很大。

所以βˆ丧失有效性。

以二解释变量线性模型为例,当r x i x j = 0.8时,Var(βˆ)为r x i x j = 0时的Var(βˆ)的2.78倍。

第6章(多重共线性)-案例

第6章(多重共线性)-案例

3.基础解系及其求法 基础解系及其求法
3.1. 基础解系 3.1.2. 基础解系的求法
x1 = − b1, r +1k1 L − b 1 n k n− r x = −b k L − b k 2 ,r +1 1 2n n− r 2 L L L L L L L xr = − br ,r +1k1 L − br n k n− r x r +1 = k 1 k2 xr + 2 = L LLLLL x = k n− r n
在进行经济计量分析时,如果模型地设定出现失误, 在进行经济计量分析时,如果模型地设定出现失误,则容易导 致完全共线性 例如:设定居民消费对工资收入 工资收入S和非劳动收入N及总收入T 例如:设定居民消费对工资收入 和非劳动收入 及总收入 的回 归模型为
C = β 0 + β 1 S + β 2 N + β 3T + ε
§6.1 多重共线性的定义
从数学意义上解释变量之间存在共线性, 从数学意义上解释变量之间存在共线性,就是对于变 量x1,x2,…,xk,如果存在不全为零的数λ1,λ2,…, , 如果存在不全为零的数λ , 使得下式成立: λk,使得下式成立: λ1x1+λ2x2+…+λkxk=0 +λ (*) 则称变量x 则称变量x1,x2,…,xk之间存在一种完全的共线性。 , 在计量经济学中, 在计量经济学中,一个具有两个以上解释变量的线性 回归模型里,如果解释变量之间存在式( 那样的关系, 回归模型里,如果解释变量之间存在式(*)那样的关系, 则称这些解释变量之间存在完全的多重共线性。
设解释变量矩阵为: 设解释变量矩阵为:
1 x 11 1 x 21 X= M M 1 x n1 x 12 x 22 M x n2 L x 1k L x 2k M L x nk

第5章习题(共线性)

第5章习题(共线性)

第5章 多重共线性1、所谓不完全多重共线性是指存在不全为零的数kλλλ,,,21 ,有( )是随机误差项式中v e v x x x .D e v x x x .C x x x .B v x x x .A k x x k k xk k k k k k ⎰∑=++++=++++=+++=++++ 122112212211221100λλλλλλλλλλλλ2、设21,x x 为解释变量,则完全多重共线性是( ).(021.0.021.22121121=+=++==+x x ex D v v x x C ex B x x A 为随机误差项)3.设线性回归模型为ii i i u x x y +++=33221βββ,下列表明变量之间具有完全多重共线性的是( )(其中v 为随机误差项)000.0000.0020.0020.321321321321=+*+*+*=*+*+*=+*++*=*++*v x x x D x x x C v x x x B x x x A4.设线性回归模型为ii i i u x x y +++=33221βββ,下列表明变量之间具有不完全多重共线性的是( )(其中v 为随机误差项)000.0000.0020.0020.321321321321=+*+*+*=*+*+*=+*++*=*++*v x x x D x x x C v x x x B x x x A5.如果模型中的解释变量存在完全的多重共线性,参数的最小二乘估计量是( )A .无偏的 B. 有偏的 C. 不确定 D. 确定的 6.下列说法不正确的是( )A.多重共线性产生的原因有模型中大量采用滞后变量B.多重共线性是样本现象C.检验多重共线性的方法有DW 检验法D.修正多重共线性的方法有增加样本容量7.在线性回归模型中,若解释变量1x 和2x 的观测值成比例,即有i2i 1kxx =,其中k 为非零常数,则表明模型中存在( )A. 异方差B. 多重共线性C. 序列自相关D. 设定误差 8.多重共线性是一种( )A .样本现象 B.随机误差现象 C .被解释变量现象 D.总体现象 9.逐步回归法既检验又修正了( )A .异方差性 B.自相关性 C .随机解释变量 D.多重共线性 二、多项选择1、设线性回归模型为ii i i u x x y +++=33221βββ,下列表明变量之间具有多重共线性的是( )(其中v 为随机误差项)31.031.0000.0000.0020.0020.3232321321321321=++=+=+*+*+*=*+*+*=+*++*=*++*v x x F x x E v x x x D x x x C v x x x B x x x A2.下列说法正确的是( )A. 多重共线性分为完全和不完全B. 多重共线性是一种样本现象C. 在共线性程度不严重的时候可进行预测分析D. 多重共线性的存在是难以避免的 3.能够检验多重共线性的方法有( )A.简单相关系数矩阵法B. DW 检验法C. 逐步回归法D.ARCH 检验法E.辅助回归法(又待定系数法)F. t 检验与F 检验综合判断法 4.能够修正多重共线性的方法有( )A.增加样本容量B. 数据的结合C.变换模型的函数形式D.逐步回归法E.差分模型 三、判断(见习题集)四、计算分析:在研究生产函数时,得到如下两个模型估计式:(1)LnL LnK Q Ln 893.0887.004.5ˆ++-=se=(1.40)(0.087)(0.137)21,878.02==n R(2)LnL LnK t QLn 285.1460.00272.057.8ˆ+++-=se=(2.99)(0.0204)(0.333)(0.324)21,889.02==n R其中,Q=产量,K=资本,L=劳动时间(技术指标),n=样本容量。

第四章多重共线性实例

第四章多重共线性实例

表 4.3.3 中国粮食生产与相关投入资料
农业化肥施 粮食播种面 受灾面积 农业机械总
用量 X 1
(万公斤)
积X 2
(千公顷)
X3
(公顷)
动力X 4
(万千瓦)
1659.8
114047 16209.3
18022
1739.8
112884 15264.0
19497
1775.8
108845 22705.3
20913
Yˆ 28259.19 2.240X5
(-1.04) (2.66) R2=0.3064 F=7.07 DW=0.36
• 可见,应选第1个式子为初始的回归模型。
4、逐步回归
将其他解释变量分别导入上述初始回归模型,寻 找最佳回归方程。
C
X1 X2 X3
X4
X5
R2
DW
Y=f(X1)
30868 4.23
0.8852 1.56
t值
25.58 11.49
Y=f(X1,X2)
-43871 4.65 0.67
0.9558 2.01
t值
-3.02 18.47 5.16
Y=f(X1,X2,X3)
-11978 5.26 0.41 -0.19
0.9752 1.53
t值
0.85
19.6 3.35 -3.57
Y=f(X1,X2,X3,X4) -13056 6.17 0.42 -0.17 -0.09
1930.6
110933 23656.0
22950
1999.3
111268 20392.7
24836
2141.5
110123 23944.7

多重共线性处理经典例题

多重共线性处理经典例题

理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。

为此,收集了中国能源消费总量Y (万吨标准煤)、国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2007年期间的统计数据,具体如表4.2所示。

表4.12 1985~2007年统计数据资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。

要求:1)建立对数多元线性回归模型,分析回归结果。

2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。

参考解答:(1)建立对数线性多元回归模型,引入全部变量建立对数线性多元回归模型如下:生成: lny=log(y), 同样方法生成: lnx1,lnx2,lnx3,lnx4,lnx5,lnx6,lnx7.作全部变量对数线性多元回归,结果为:从修正的可决系数和F统计量可以看出,全部变量对数线性多元回归整体对样本拟合很好,,各变量联合起来对能源消费影响显著。

可是其中的lnX3、lnX4、lnX6对lnY影响不显著,而且lnX2、lnX5的参数为负值,在经济意义上不合理。

所以这样的回归结果并不理想。

(2) 预料此回归模型会遇到多重共线性问题, 因为国民总收入与GDP本来就是一对关联指标;而工业增加值、建筑业增加值、交通运输邮电业增加值则是GDP的组成部分。

这两组指标必定存在高度相关。

解释变量国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等很可能线性相关,计算相关系数如下:可以看出lnx1与lnx2、lnx3、lnx4、lnx5、lnx6之间高度相关,许多相关系数高于0.900以上。

七多重共线性及其处理

七多重共线性及其处理

第七章 多重共线性及其处理一、简答题1. 什么是变量之间的多重共线性?2. 什么是完全多重共线性? 什么是不完全多重共线性?3. 多重共线性在多元线性回归模型中普遍存在的主要原因有哪些?4. 多重共线性可能造成哪些不利后果?5. 多重共线性的检验有哪些适当的方法?6. 多重共线性的修正方法有哪些?二、计算题分析题1. 某地区供水部门利用最近20年的用水年度数据得出如下估计模型:12345ˆ326.90.3050.3630.00517.87 1.123Y X X X X X =-++--- (-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)93.02=RF=38.9式中, ——用水总量(百万立方米), ——住户总数(千户), ——总人口(千人),3x ——人均收入(元),4x ——价格(元/100立方米),5x ——降雨量(毫米)。

(1)根据经济理论和直觉,请计回归系数的符号是什么(不包括常量), 为什么? 观察符号与你的直觉相符吗?(2)在10%的显著性水平下, 请进行变量的t 检验与方程的F-检验。

T 检验与F 检验结果有相矛盾的现象吗?(3)你认为估计值是(1)有偏的;(2)无效的;(3)不一致的吗? 详细阐述理由。

2. 下表是某地区1995年~2004年食品需求量 、可支配收入 、食品类价格指数 、 物价总指数3X 和流动资产拥有量4X 的数据资料。

食品需求函数有关统计资料问题:(1)检验变量间的多重共线性。

(2)利用 法, 建立适当的回归方程。

第四部分 习题答案 一、简答题1. 多重共线性指两个或多个解释变量之间不再彼此独立, 而是出现了相关性。

2.完全多重共线性指:在有多个解释变量模型中, 其中一个变量可以表示为其他多个变量的完全线性函数, 即 , 其中至少有一个 , 与等式右边线性组合的相关系数为1, 则这种情况被称为完全多重共线性。

在此情况下, 不能估计解释变量各自对被解释变量的影响。

第四章 多重共线性练习

第四章 多重共线性练习

练 习
基本概念
(1)多重共线性(2)完全多重共线性(3)不完全多重共线性; 练习题1、什么是变量之间的多重共线性?举例说明。

2、判断题:(1)存在完全多重共线性时,模型参数无法估计;(2)存在多重共线性时,一定会使参数估计值的方差增大,从而造成估计效率的损失;
3、完全多重共线性和不完全多重共线性之间的区别是什么?
4、产生多重共线性的经济背景是什么?
5、多重共线性的危害是什么?为什么会造成这些危害?检验多重共线性的方法思路是什么?有哪些克服方法?
6、考虑下列一组数据
Y
-10 -8 -6 -4 -2 0 2 4 6 8 10 2X 1 2 3 4 5 6 7 8 9 10 11 3X
1
3
5
7
9
11
13
15
17
19
21
现在我们进行如下的回归分析:
12233i i Y X X u βββ=+++
请回答如下问题:
你能估计出该模型的参数吗?为什么? 7、将下列函数用适当的方法消除多重共线性: (1)消费函数为
012C W P u
βββ=+++
其中C 、W 、P 分别表示消费、工资收入和非工资收入,W 和P 可能高度相关,但研究表明1
2
2ββ=。

(2)需求函数为
0123s Q Y P P u
ββββ=++++
其中Q 、Y 、P 和s
P 分别为需求量、收入水平、该商品价格水平及其替代品价格水平,P 和s
P 可能高度相关。

计量经济学题库第7章多重共线性

计量经济学题库第7章多重共线性

第7章 多重共线性习 题一、单项选择题1.如果回归模型中解释变量之间存在完全的多重共线性,则最小二乘估计量( )A.不确定,方差无限大B.确定,方差无限大C.不确定,方差最小D.确定,方差最小2.多元线性回归模型中,发现各参数估计量的t 值都不显著,但模型的F 值确很显著,这说明模型存在( )A .多重共线性B .异方差C .自相关D .设定偏误 3.逐步回归法既检验又修正了( )A .异方差性 B.自相关性 C .随机解释变量 D.多重共线性4.如果模型中的解释变量存在完全的多重共线性,参数的最小二乘估计量是( )A .无偏的 B. 有偏的 C. 不确定 D. 确定的 5.设线性回归模型为,下列表明变量之间具有完全多重共线性的是( )A .B .C .D .其中v 为随机误差项6.简单相关系数矩阵方法主要用于检验( )A .异方差性 B.自相关性 C .随机解释变量 D.多重共线性 7.设为解释变量,则完全多重共线性是( )8.下列说法不正确的是( )A. 多重共线性产生的原因有模型中大量采用滞后变量,)(22很大或R R 01122i i i iY X X u βββ=+++1202*0*0i i X X ++=1202*0*0i i X X v +++=1200*0*0i i X X ++=1200*0*0i i X X v +++=21,x x 221211211.0.021.0(.02x x A x x B x e C x x v v D x e +==++=+=为随机误差项)B. 多重共线性是样本现象C. 检验多重共线性的方法有DW检验法D. 修正多重共线性的方法有增加样本容量二、多项选择题1.能够检验多重共线性的方法有()A. 简单相关系数矩阵法B. t检验与F检验综合判断法C. DW检验法D. ARCH检验法E. White 检验2.如果模型中解释变量之间存在共线性,则会引起如下后果()A. 参数估计值确定B. 参数估计值不确定C. 参数估计值的方差趋于无限大D. 参数的经济意义不正确E. DW统计量落在了不能判定的区域3.能够检验多重共线性的方法有()A. 简单相关系数矩阵法B. DW检验法C. t检验与F检验综合判断法D. ARCH检验法E. 辅助回归法(又待定系数法)三、判断题1.多重共线性问题是随机扰动项违背古典假定引起的。

多重共线性案例

多重共线性案例

多重共线性案例:变量Y,X1,X2,X3,X4,X5的数据年Y X1X2X3X4X51974 98.45 560.2 153.20 6.53 1.23 1.891975 100.70 603.11 190.00 9.12 1.30 2.031976 102.80 668.05 240.30 8.10 1.80 2.711977 133.95 715.47 301.12 10.10 2.09 3.001978 140.13 724.27 361.00 10.93 2.39 3.291979 143.11 736.13 420.00 11.85 3.90 5.241980 146.15 748.91 491.76 12.28 5.13 6.831981 144.60 760.32 501.00 13.50 5.47 8.361982 148.94 774.92 529.20 15.29 6.09 10.071983 158.55 785.30 552.72 18.10 7.97 12.571984 169.68 795.50 771.16 19.61 10.18 15.121985 162.14 804.80 811.80 17.22 11.79 18.251986 170.09 814.94 988.43 18.60 11.54 20.591987 178.69 828.73 1094.65 23.53 11.68 23.37资料来源:《天津统计年鉴》1988.用1974-1987年数据建立天津市粮食需求模型如下,Y = -3.49 + 0.13 X1 + 0.07 X2 + 2.67 X3 + 3.44 X4– 4.49 X5(-0.11) (2.12) (1.95) (2.13) (1.41) (-2.03)R2 = 0.97, F = 52.59, T = 14, t0.05(8) = 2.31, (1974-1987)其中Y:粮食销售量(万吨/ 年),X1:市常住人口数(万人),X2:人均收入(元/ 年),X3:肉销售量(万吨/ 年),X4:蛋销售量(万吨/ 年),X5:鱼虾销售量(万吨/ 年)。

多重共线性试题及答案

多重共线性试题及答案

第四章 多重共线性一、单项选择题1、完全的多重共线性是指解释变量的数据矩阵的秩( B )(A )大于k+1 (B )小于k+1 (C )等于k+1 (D )等于k+12、当模型存在严重的多重共线性时,OLS 估计量将不具备( D )(A )线性 (B )无偏性 (C )有效性 (D )一致性3、如果每两个解释变量的简单相关系数比较高,大于( D )时则可认为存在着较严重的多重共线性。

(A )0.5 (B )0.6 (C )0.7 (D )0.84、方差扩大因子VIF j 可用来度量多重共线性的严重程度,经验表明,VIF j ( A )时,说明解释变量与其余解释变量间有严重的多重共线性。

(A )大于5 (B )大于1 (C )小于1 (D )大于105、对于模型01122i i i i y x x u βββ=+++,与r 23等于0相比,当r 23等于0.5时,3ˆβ的方差将是原来的(C ) (A )2倍 (B )1.5倍 (C )1.33倍 (D )1.25倍6、无多重共线性是指数据矩阵的秩( D )(A )小于k (B )等于k (C )大于k (D )等于k+17、无多重共线性假定是假定各解释变量之间不存在( A )(A )线性关系 (B )非线性关系 (C )自相关 (D )异方差8、经济变量之间具有共同变化的趋势时,由其构建的计量经济模型易产生( C )(A )异方差 (B )自相关(C )多重共线性 (D )序列相关9、完全多重共线性产生的后果包括参数估计量的方差( C )(A )增大 (B )减小(C )无穷大 (D )无穷小10、不完全多重共线性产生的后果包括参数估计量的方差( A )(A )增大 (B )减小(C )无穷大 (D )无穷小11、不完全多重共线性下,对参数区间估计时,置信区间趋于( A )(A )变大 (B )变小(C )不变 (D )难以估计12、较高的简单相关系数是多重共线性存在的( B )(A )必要条件 (B )充分条件(C )充要条件 (D )并非条件13、方差扩大因子VIF j 是由辅助回归的可决系数R j 2计算而得,R j 2越大,方差扩大因子VIF j 就( A )(A )越大 (B )越小(C )不变 (D )无关14、解释变量间的多重共线性越弱,方差扩大因子VIF j 就越接近于( A )(A )1 (B )2(C )0 (D )1015、多重共线性是一个(D )(A )样本特性 (B )总体特性(C )模型特性 (D )以上皆不对二、多项选择题1、多重共线性包括(ABCD )(A )完全的多重共线性 (B )不完全的多重共线性(C )解释变量间精确的线性关系(D )解释变量间近似的线性关系(E )非线性关系2、多重共线性产生的经济背景主要由( ABD )(A )经济变量之间具有共同变化趋势 (B )模型中包含滞后变量(C )采用截面数据 (D )样本数据自身的原因3、多重共线性检验的方法包括( ABCD )(A )简单相关系数检验法 (B )方差扩大因子法(C )直观判断法 (D )逐步回归法(E )DW 检验法4、修正多重共线性的经验方法包括(ABCDE )(A )剔除变量法 (B )增大样本容量(C )变换模型形式 (D )截面数据与时间序列数据并用(E )变量变换5、严重的多重共线性常常会出现下列情形(ABCD )(A )适用OLS 得到的回归参数估计值不稳定(B )回归系数的方差增大(C )回归方程高度显著的情况下,有些回归系数通不过显著性检验(D )回归系数的正负号得不到合理的经济解释三、名词解释(每题4分)1、多重共线性2、完全的多重共线性3、辅助回归4、方差扩大因子VIF j5、逐步回归法6、不完全的多重共线性四、简答题(每题5分)1、多重共线性的实质是什么?2、为什么会出现多重共线性?3、多重共线性对回归参数的估计有何影响?4、判断是否存在多重共线性的方法有那些?5、针对多重共线性采取的补救措施有那些?6、具有严重多重共线性的回归方程能否用来进行预测?五、辨析题1、在高度多重共线性的情形中,要评价一个或多个偏回归系数的单个显著性是不可能的。

多重共线性案例分析

多重共线性案例分析

ln Y = 2.1898 + 0.3426ln X1 − 0.5046ln X 2 + 0.1485ln X3 + 0.0911ln X 4 se = ( 0.1557) ( 0.0833) ( 0.1109 ) ( 0.0997 ) ( 0.1007 ) (1.49 ) ( 0.90 ) ( −4.55) t = (14.06 ) ( 4.11)
ln Y = 2.1255 + 0.4059 ln X 1 − 0.4388ln X 2 + 0.1067 ln X 3 ( 0.0878) ( 0.0833) se = ( 0.1379 ) ( 0.0448) t = (15.4153) ( 9.0625) ( −5.2660 ) (1.2142 ) ( 0.0000 ) ( 0.2395) ( 0.0000 ) p值 = ( 0.0000 )
回归元之间的相关系数均大于0.8, 回归元之间的相关系数均大于 ,表明多重共线性是 严重的
(3)辅助回归
① ln( X 1 ) = 0.9461 − 0.8324 ln( X 2 ) + 0.9483ln( X 3 ) + 1.0176 ln( X 4 )
R 2 = 0.9846
R 2 = 0.9822 F = 406.0592 p值 = 0.0000 R 2 = 0.9428 F = 104.41
14.06283 0.0007 0.0002 0.1535 0.3776
0.0000
R-squared 0.982313 Adjusted R-squared 0.978383 S.E. of regression 0.027591 Sum squared resid 0.013703 Log likelihood 52.75935 F-statistic 249.9282 Prob(F-statistic) 0.000000

多重共线性习题(附答案)

多重共线性习题(附答案)

多重共线性一、单项选择题1、当模型存在严重的多重共线性时,OLS估计量将不具备()A、线性B、无偏性C、有效性D、一致性2、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF()A、大于B、小于C、大于5D、小于53、模型中引入实际上与解释变量有关的变量,会导致参数的OLS估计量方差()A、增大B、减小C、有偏D、非有效4、对于模型y t=b0+b1x1t+b2x2t +u t,与r12=0相比,r12=0.5时,估计量的方差将是原来的()A、1倍B、1.33倍C、1.8倍D、2倍5、如果方差膨胀因子VIF=10,则什么问题是严重的()A、异方差问题B、序列相关问题C、多重共线性问题D、解释变量与随机项的相关性6、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( )A 异方差B 序列相关C 多重共线性D 高拟合优度7、存在严重的多重共线性时,参数估计的标准差()A、变大B、变小C、无法估计D、无穷大8、完全多重共线性时,下列判断不正确的是()A、参数无法估计B、只能估计参数的线性组合C、模型的拟合程度不能判断D、可以计算模型的拟合程度二、多项选择题1、下列哪些回归分析中很可能出现多重共线性问题()A、资本投入与劳动投入两个变量同时作为生产函数的解释变量B、消费作被解释变量,收入作解释变量的消费函数C、本期收入和前期收入同时作为消费的解释变量的消费函数D、商品价格、地区、消费风俗同时作为解释变量的需求函数E、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型2、当模型中解释变量间存在高度的多重共线性时()A、各个解释变量对被解释变量的影响将难以精确鉴别B、部分解释变量与随机误差项之间将高度相关C、估计量的精度将大幅度下降D、估计对于样本容量的变动将十分敏感E、模型的随机误差项也将序列相关3、下述统计量可以用来检验多重共线性的严重性()A、相关系数B、DW值C、方差膨胀因子D、特征值E、自相关系数4、多重共线性产生的原因主要有()A、经济变量之间往往存在同方向的变化趋势B、经济变量之间往往存在着密切的关联C、在模型中采用滞后变量也容易产生多重共线性D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性E、以上都正确5、多重共线性的解决方法主要有()A、保留重要的解释变量,去掉次要的或替代的解释变量B、利用先验信息改变参数的约束形式C、变换模型的形式D、综合使用时序数据与截面数据E、逐步回归法以及增加样本容量6、关于多重共线性,判断错误的有()A、解释变量两两不相关,则不存在多重共线性B、所有的t检验都不显著,则说明模型总体是不显著的C、有多重共线性的计量经济模型没有应用的意义D、存在严重的多重共线性的模型不能用于结构分析7、模型存在完全多重共线性时,下列判断正确的是()A、参数无法估计B、只能估计参数的线性组合C、模型的判定系数为0D、模型的判定系数为1三、简述1、什么是多重共线性?产生多重共线性的原因是什么?2、什么是完全多重共线性?什么是不完全多重共线性?3、完全多重共线性对OLS估计量的影响有哪些?4、不完全多重共线性对OLS估计量的影响有哪些?5、从哪些症状中可以判断可能存在多重共线性?6、什么是方差膨胀因子检验法?四、判断(1)如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。

第5章多重共线性的情形及其处理

第5章多重共线性的情形及其处理
一、方差扩大因子法 对自变量做中心标准化,则X*′X*=(rij)为自变量的相关阵。

C=(cij)=(X*′X*)-1 称其主对角线元素VIFj=cjj为自变量xj的方差扩大因子(Variance Inflation Factor,简记为VIF)。根据OLS性质3可知,
var(ˆ j ) cjj 2 / Ljj , j 1,, p
外,除非我们修改容忍度的默认值。
§5.2 多重共线性的诊断
以下用SPSS软件诊断例3.2中国民航客运量一例中的多重共线性问题。
Coeffi ci entsa
Unst andardized Coef f icients
Std.
B
Error
(C onstant ) 450. 909 178. 078
X1
每个数值平方后再除以特征值,然后再把每列数据 除以列数据之和,使得每列数据之和为1,这样就 得到了输出结果6.2的方差比。
再次强调的是线性回归分析共线性诊断中设计 阵X包含代表常数项的一列1,而因子分析模块中 给出的特征向量是对标准化的设计阵给出的,两者 之间有一些差异。
三、 等级相关系数法 (Spearman Rank Correlation )
根据矩阵行列式的性质,矩阵的行列式等于其 特征根的连乘积。因而,当行列式|X′X|≈0时, 矩 阵X′X至少有一个特征根近似为零。反之可以证明, 当矩阵X′X至少有一个特征根近似为零时,X 的列 向量间必存在复共线性,证明如下:
记X =(X0 ,X1,…,Xp),其中 Xi为X 的列向量, X0 =(1,1,…,1)′是元素全为1的n维列向量。 λ是矩阵X′X的一个近似为零的特征根,λ≈0 c=(c0,c1, …,cp)′是对应于特征根λ的单位特征向量,则

多重共线性分析案例

多重共线性分析案例

多重共线性分析案例例用1974-1987年数据建立天津市粮食需求模型如下:表1 变量y,x1,x2,x3,x4,x5的数据年y x1x2x3x4x51974 98.45 560.2 153.20 6.53 1.23 1.891975 100.70 603.11 190.00 9.12 1.30 2.031976 102.80 668.05 240.30 8.10 1.80 2.711977 133.95 715.47 301.12 10.10 2.09 3.001978 140.13 724.27 361.00 10.93 2.39 3.291979 143.11 736.13 420.00 11.85 3.90 5.241980 146.15 748.91 491.76 12.28 5.13 6.831981 144.60 760.32 501.00 13.50 5.47 8.361982 148.94 774.92 529.20 15.29 6.09 10.071983 158.55 785.30 552.72 18.10 7.97 12.571984 169.68 795.50 771.16 19.61 10.18 15.121985 162.14 804.80 811.80 17.22 11.79 18.251986 170.09 814.94 988.43 18.60 11.54 20.591987 178.69 828.73 1094.65 23.53 11.68 23.37资料来源:《天津统计年鉴》1988.设回归模型:Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+ε利用spss统计软件进行线性回归(点选Statistics选项框中Collinearity共线性诊断选项),设显著性水平0.05,输出结果如下:从回归方程的P检验结果看出Sig=0,整体通过显著性检验。

从输出结果看,在0.05的显著性水平下,βi的t统计量单独对因变量y都无显著性影响(P 值都大于0.05)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。

为此,收集了中国能源消费总量Y (万吨标准煤)、国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2007年期间的统计数据,具体如表4.2所示。

表4.12 1985~2007年统计数据
资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。

要求:
1)建立对数多元线性回归模型,分析回归结果。

2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?
3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。

参考解答:
(1)建立对数线性多元回归模型,引入全部变量建立对数线性多元回归模型如下:
生成: lny=log(y), 同样方法生成: lnx1,lnx2,lnx3,lnx4,lnx5,lnx6,lnx7.
作全部变量对数线性多元回归,结果为:
从修正的可决系数和F统计量可以看出,全部变量对数线性多元回归整体对样本拟合很好,,各变量联合起来对能源消费影响显著。

可是其中的lnX3、lnX4、lnX6对lnY影响不显著,而且lnX2、lnX5的参数为负值,在经济意义上不合理。

所以这样的回归结果并不理想。

(2) 预料此回归模型会遇到多重共线性问题, 因为国民总收入与GDP本来就是一对关联指标;而工业增加值、建筑业增加值、交通运输邮电业增加值则是GDP的组成部分。

这两组指标必定存在高度相关。

解释变量国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等很可能线性相关,计算相关系数如下:
可以看出lnx1与lnx2、lnx3、lnx4、lnx5、lnx6之间高度相关,许多相关系数高于0.900以上。

如果决定用表中全部变量作为解释变量,很可能会出现严重多重共线性问题。

(3)因为存在多重共线性,解决方法如下:
A :修正理论假设,在高度相关的变量中选择相关程度最高的变量进行回归建立模型:而对变量取对数后,能源消费总量的对数与人均生活电力消费的对数相关程度最高,可建立这两者之间的回归模型。


22ln 9.9320.421ln 6
(0.116) (0.026)
0.926 0.922 261.551
y x R R F =+===
B :进行逐步回归,直至模型符合需要研究的问题,具有实际的经济意义和统计意义。

采用逐步回归的办法,去检验和解决多重共线性问题。

分别作ln Y 对
1234567ln ,ln ,ln ,ln ,ln ,ln ,ln X X X X X X X 的一元回归,结果如下:
一元回归结果:
其中加入lnX6的方程调整的可决系数最大, 以lnX6为基础, 顺次加入其他变量逐步回归。

结果如下表:
经比较,新加入lnX5的方程调整可决系数改进最大, 各参数的t检验也都显著,但是lnX5参数的符号与经济意义不符合。

若再加入其他变量后的逐步回归,若剔除不显著的变量和无经济意义的变量后, 仍为第一步所建只包含lnX6的一元回归模型。

如果需要建立多元线性回归模型,则需寻找新的变量或改变模型形式。

例如, 不取对数作全部变量多元线性回归,结果为:
可以看出还是有严重多重共线性。

作逐步回归:
变量X1 X2 X3 X4 X5 X6 X7
参数估计值0.7333 0.7353 1.6655 13.1909 10.8980 678.0058 19332.30 t 统计量26.4698 25.3627 18.0257 25.9636 13.5147 22.4229 4.7024 2
R0.9709 0.9684 0.9393 0.9697 0.8969 0.9599 0.5129 2
R0.9695 0.9669 0.9364 0.9683 0.8920 0.9580 0.4897 X1 X2 X3 X4 X5 X6 X7 2
R
X1,X2 6.6399
(0.0022)-5.9308
(0.0054)
0.9785
X1,X3 0.5512
(0.0000) 0.4349
(0.0821)
0.9726
X1,X4 0.5040
(0.3356) 4.1326
(0.6580)
0.9683
X1,X5 1.0516
(0.0000) -5.0269
(0.013)
0.9766
X1,X6 1.0075
(0.0088) -255.80
(0.438)
0.9690
X1,X7 0.7499
(0.0000) -813.44
(0.5988)
0.9684
可以发现加入X2、X5、X6、X7后参数的符号不合理,加入X4后并不显著。

只有加入X3后修正的可决系数有所提高,而且参数符号的经济意义合理, X3参数估计值的p值为0.0821,在10%的显著性水平下是显著的。

所以相对较为合理的模型估计结果可以为:。

相关文档
最新文档