第四章-多重共线性-答案(1)

合集下载

计量经济学第四章多重共线性

计量经济学第四章多重共线性

R-squared
0.989654
Adjusted R-squared 0.986955 S.E. of regression 1437.448 Sum squared resid 47523916 Log likelihood -256.7013 Durbin-Watson stat 1.654140
4
(二)不完全的多重共线性
实际中,常见的情形是解释变量之间存在不 完全的多重共线性。
对于解释变量 X 2 , X 3, X k,存在不全为0的数
1
,

2
,
,使得
k
1 2X2 3X3 ...k Xk u 0
5
(三)解释变量的关系小节
可能表现为三种情形: r为相关系数 (1) rxixj 0 ,解释变量间毫无线性关系。这时多元
Var(ˆ2 )
9
二、不完全多重共线性产生的后果
1、参数估计值的方差增大
Var( βˆ 2 ) = σ 2
1 x22i (1-
r223 )
=
σ2
1
x22i (1 - r223 )
当 r23增大时,
^
Var( 2)
也增大
10
方差膨胀因子 (Variance Inflation Factor)
17 17
2、交叉相关系数(Cross correlation)
相关系数计算的是两组样本的同期相关程 度,交叉相关则可以表示不同期之间的相关 程度。
Eviews操作: Group窗口的view/cross correlation/输入 滞后期设定/ 输出结果阅读:看是否超出2倍标准差线
18
2倍 标准 差线
1、参数估计值有很大的偶然性。 2、参数显著性检验未通过。 3、经济意义检验未通过。 4、相关系数大。

多重共线性习题及答案

多重共线性习题及答案

多重共线性一、单项选择题1、当模型存在严重的多重共线性时,OLS估计量将不具备()A、线性B、无偏性C、有效性D、一致性2、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF()A、大于B、小于C、大于5D、小于53、模型中引入实际上与解释变量有关的变量,会导致参数的OLS估计量方差()A、增大B、减小C、有偏D、非有效4、对于模型y t=b0+b1x1t+b2x2t+u t,与r12=0相比,r12=0.5时,估计量的方差将是原来的()A、1倍B、1.33倍C、1.8倍D、2倍5、如果方差膨胀因子VIF=10,则什么问题是严重的()A、异方差问题B、序列相关问题C、多重共线性问题D、解释变量与随机项的相关性6、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( )A 异方差B 序列相关C 多重共线性D 高拟合优度7、存在严重的多重共线性时,参数估计的标准差()A、变大B、变小C、无法估计D、无穷大8、完全多重共线性时,下列判断不正确的是()A、参数无法估计B、只能估计参数的线性组合C、模型的拟合程度不能判断D、可以计算模型的拟合程度二、多项选择题1、下列哪些回归分析中很可能出现多重共线性问题()A、资本投入与劳动投入两个变量同时作为生产函数的解释变量B、消费作被解释变量,收入作解释变量的消费函数C、本期收入和前期收入同时作为消费的解释变量的消费函数D、商品价格、地区、消费风俗同时作为解释变量的需求函数E、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型2、当模型中解释变量间存在高度的多重共线性时()A、各个解释变量对被解释变量的影响将难以精确鉴别B、部分解释变量与随机误差项之间将高度相关C、估计量的精度将大幅度下降D、估计对于样本容量的变动将十分敏感E、模型的随机误差项也将序列相关3、下述统计量可以用来检验多重共线性的严重性()A、相关系数B、DW值C、方差膨胀因子D、特征值E、自相关系数4、多重共线性产生的原因主要有()A、经济变量之间往往存在同方向的变化趋势B、经济变量之间往往存在着密切的关联C、在模型中采用滞后变量也容易产生多重共线性D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性E、以上都正确5、多重共线性的解决方法主要有()A、保留重要的解释变量,去掉次要的或替代的解释变量B、利用先验信息改变参数的约束形式C、变换模型的形式D、综合使用时序数据与截面数据E、逐步回归法以及增加样本容量6、关于多重共线性,判断错误的有()A、解释变量两两不相关,则不存在多重共线性B、所有的t检验都不显著,则说明模型总体是不显著的C、有多重共线性的计量经济模型没有应用的意义D、存在严重的多重共线性的模型不能用于结构分析7、模型存在完全多重共线性时,下列判断正确的是()A、参数无法估计B、只能估计参数的线性组合C、模型的判定系数为0D、模型的判定系数为1三、简述1、什么是多重共线性?产生多重共线性的原因是什么?2、什么是完全多重共线性?什么是不完全多重共线性?3、完全多重共线性对OLS估计量的影响有哪些?4、不完全多重共线性对OLS估计量的影响有哪些?5、从哪些症状中可以判断可能存在多重共线性?6、什么是方差膨胀因子检验法?四、判断(1)如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。

《计量经济学》第四章精选题及答案

《计量经济学》第四章精选题及答案

《计量经济学》第四章精选题及答案第四章:多重共线性二、简答题1、导致多重共线性的原因有哪些?2、多重共线性为什么会使得模型的预测功能失效?3、如何利用辅回归模型来检验多重共线性?4、判断以下说法正确、错误,还是不确定?并简要陈述你的理由。

(1)尽管存在完全的多重共线性,OLS估计量还是最优线性无偏估计量(BLUE)。

(2)在高度多重共线性的情况下,要评价一个或者多个偏回归系数的个别显著性是不可能的。

(3)如果某一辅回归显示出较高的2R值,则必然会i存在高度的多重共线性。

(4)变量之间的相关系数较高是存在多重共线性的充分必要条件。

(5)如果回归的目的仅仅是为了预测,则变量之间存在多重共线性是无害的。

5、考虑下面的一组数据:Y -10 -8 -6 -4 -2 0 2 4 6 8 10X 1 2 3 4 5 6 7 8 9 10 11 2X 1 3 5 7 9 11 13 15 17 19 21 3如果我们用模型:12233i i i Y X X βββ=++来对以上数据进行拟合回归。

(1) 我们能得到这3个估计量吗?并说明理由。

(2) 如果不能,那么我们能否估计得到这些参数的线性组合?可以的话,写出必要的计算过程。

6、考虑以下模型:231234i i i i i Y X X X ββββμ=++++ 由于2X 和3X 是X 的函数,那么它们之间存在多重共线性。

这种说法对吗?为什么?7、在涉及时间序列数据的回归分析中,如果回归模型不仅含有解释变量的当前值,同时还含有它们的滞后值,我们把这类模型称为分布滞后模型(distributed-lag model )。

我们考虑以下模型:12313233i t t t t tY X X X X βββββμ---=+++++ 其中Y ——消费,X ——收入,t ——时间。

该模型表示当期的消费是其现期的收入及其滞后三期的收入的线性函数。

(1) 在这一类模型中是否会存在多重共线性?为什么?(2) 如果存在多重共线性的话,应该如何解决这个问题?8、设想在模型12233i i i i Y X X βββμ=+++ 中,2X 和3X 之间的相关系数23r 为零。

庞皓《计量经济学》(第4版)章节题库-第4章 多重共线性【圣才出品】

庞皓《计量经济学》(第4版)章节题库-第4章 多重共线性【圣才出品】

第4章 多重共线性一、选择题1.下列哪项回归分析中很可能出现多重共线性问题?( )A.“资本投入”“劳动投入”两个变量同时作为生产函数的解释变量B.“消费”作为被解释变量,“收入”作解释变量的消费函数C.“本期收入”和“前期收入”同时作为“消费”的解释变量的消费函数D.“每亩施肥量”“每亩施肥量的平方”同时作为“小麦亩产”的解释变量的模型【答案】C【解析】产生多重共线性的主要原因有:①经济变量相关的共同趋势;②模型设定不谨慎;③样本资料的限制。

C项中“本期收入”和“前期收入”两个解释变量之间很可能存在线性相关性,导致模型中很可能会出现多重共线性问题。

2.在线性回归模型Y i=β0+β1X i1+β2X i2+β3X i3+u i中,如果X3i=2X1i+3X2i,则表明模型中存在( )。

A.异方差B.多重共线性C.序列相关D.设定误差【答案】B【解析】当存在不全为0的c i使c i X i1+c2X i2+…+c k X ik=0(i=1,2,…,n),即某一个解释变量可以用其他解释变量的线性组合表示,则称为解释变量间存在完全共线性,模型的回归系数估计值不存在。

本题中,存在c i 不等于0,使得X 3i -2X 1i -3X 2i =0,因此模型存在完全多重共线性。

3.对于模型Y i =β0+β1X 1i +β2X 2i +μi ,与r 12=0相比,当r 12=0.5时,估计量Error!1的方差Var (1)将是原来的( )倍。

A .1.00B .1.33C .1.45D .2.00【答案】B【解析】在二元线性回归模型中,()221211ˆ1i Var r X σβ=⋅-∑多重共线性使参数估计量的方差增大,方差膨胀因子为VIF (1)=1/(1-r 2),所以当r 12=0.5时,方差将是原来的1/(1-r 122)=1/(1-0.52)=1.33倍。

4.下列各项中,不属于解决多重共线性的方法的是( )。

计量经济学 第四章 多重共线性-

计量经济学 第四章 多重共线性-

多重共线性产生的经济背景主要有几种情形:
1. 经济变量之间具有共同变化趋势。 2. 模型中包含滞后变量。 3. 利用截面数据建立模型也可能出现多重共线性。 4. 样本数据自身的原因。
11
Econom
etrics 第二节 多重共线性产生的后果
本节基本内容: ● 完全多重共线性产生的后果 ● 不完全多重共线性产生的后果
说明存在完全的多重共线性。
8
不完全的多重共线性 Econom
etrics
实际中,常见的情形是解释变量之间存在不完
全的多重共线性。
对于解释变量 ,使得
,存在不全为0的数
其中, 为随机变量。这表明解释变量 只是一种近似的线性关系。
9
Econom etrics
回归模型中解释变量的关系
可能表现为三种情形:
(1)
,解释变量间毫无线性关系,变量间相
互正交。这时已不需要作多元回归,每个参数 j都可 以通过Y 对 Xj 的一元回归来估计。
(2)
,解释变量间完全共线性。此时模型参
数将无法确定。
(3)
,解释变量间存在一定程度的线性关
系。实际中常遇到的情形。
10
Econom etrics
二、产生多重共线性的背景
18
Econom etrics
二、方差扩大(膨胀)因子法
统计上可以证明,解释变量 的方差可表示为
的参数估计式
其中的
是变量 的方差扩大因子
(Variance Inflation Factor),即
其中
是多个解释变量辅助回归的可决系数
19
Econom etrics
经验规则
● 方差膨胀因子越大,表明解释变量之间的多重共 性越严重。反过来,方差膨胀因子越接近于1, 多重共线性越弱。

第四章 多重共线性

第四章  多重共线性
2 X2 3 X3 k Xk 0;或秩(XX)=k,得XX可逆
6.正态性,即 ui ~ N (0,。2 )
Yi 1 2 Xi ui E(Yi ) 1 2 Xi E(ui ) 1 2 Xi c (1 c) 2 Xi
不完全多重共线性的矩阵描述:
设矩阵
1 X 21
X 1 X 22

1 X 2n
Xk1
X
k
2


X kn

不完全多重共线性就是:X ' X 0
即 Rank(X ) k
表明在向量矩阵X中,没有一个列 向量可以由其余的列向量精确线性表 出。
2 X 2 3 X3 k X k 0
3. 在模型中采用大量的滞后变量也容易产生多重共 线性。这是因为滞后变量从经济性质上看与原来的变 量无区别,只是时间上有所不同,从经济意义上这些 变量之间的关联度比较紧密。
例如:在研究消费函数时,作为影响消费行为的
因素,我们不仅要考虑在模型中引入当期的可支配收
入,同时还可能引入以往各期的可支配收入。如果记
对于假定(1)的违反,假设一元线性回归方程, 这时会对截距 1 的估计产生影响,而对 2 的估 计没有影响,详细内容可见第八章;
对于假定(6)的违反,即 ui 不服从正态分布, 这时最小二乘估计仍然是最佳线性无偏估计,并 且在大样本的情况下,随机误差 ui 是渐进服从 正态分布的。
对于违反假定2、3、4、5,我们将在第四 章到第六章以及第八章分布讨论。
以上各种情况只是在建模过程中对多重共线性产 生原因的总结。在建模时对于不同的问题,需要运用 经济学的原理和具体的经济状况加以认真分析,以判 断模型中解释变量是否存在共线性。

第四章 多重共线性练习

第四章 多重共线性练习

练 习
基本概念
(1)多重共线性(2)完全多重共线性(3)不完全多重共线性; 练习题1、什么是变量之间的多重共线性?举例说明。

2、判断题:(1)存在完全多重共线性时,模型参数无法估计;(2)存在多重共线性时,一定会使参数估计值的方差增大,从而造成估计效率的损失;
3、完全多重共线性和不完全多重共线性之间的区别是什么?
4、产生多重共线性的经济背景是什么?
5、多重共线性的危害是什么?为什么会造成这些危害?检验多重共线性的方法思路是什么?有哪些克服方法?
6、考虑下列一组数据
Y
-10 -8 -6 -4 -2 0 2 4 6 8 10 2X 1 2 3 4 5 6 7 8 9 10 11 3X
1
3
5
7
9
11
13
15
17
19
21
现在我们进行如下的回归分析:
12233i i Y X X u βββ=+++
请回答如下问题:
你能估计出该模型的参数吗?为什么? 7、将下列函数用适当的方法消除多重共线性: (1)消费函数为
012C W P u
βββ=+++
其中C 、W 、P 分别表示消费、工资收入和非工资收入,W 和P 可能高度相关,但研究表明1
2
2ββ=。

(2)需求函数为
0123s Q Y P P u
ββββ=++++
其中Q 、Y 、P 和s
P 分别为需求量、收入水平、该商品价格水平及其替代品价格水平,P 和s
P 可能高度相关。

计量经济学第二版 第四章答案

计量经济学第二版  第四章答案

4.1 (1) 存在3322ˆˆˆˆβγβα==且。

因为()()()()()()()23223223232322ˆ∑∑∑∑∑∑∑--=iiiii iiii i i x x x xx x x y x x y β当32X X 与之间的相关系数为零时,离差形式的032=∑i i x x有()()()()222223222322ˆˆαβ===∑∑∑∑∑∑iiiiiiiixxy x x x x y 同理有:33ˆˆβγ= (2) 111ˆˆˆβαγ会等于或的某个线性组合 因为 12233ˆˆˆY X X βββ=--,且122ˆˆY X αα=-,133ˆˆY X γγ=- 由于3322ˆˆˆˆβγβα==且,则 11222222ˆˆˆˆˆY Y X Y XX αααββ-=-=-= 11333333ˆˆˆˆˆY Y X Y XX γγγββ-=-=-= 则 1112233231123ˆˆˆˆˆˆˆY Y Y X X Y X X Y X X αγβββαγ--=--=--=+- (3) 存在()()()()3322ˆvar ˆvar ˆvar ˆvar γβαβ==且。

因为()()∑-=22322221ˆvar r x iσβ当023=r 时,()()()22222232222ˆvar 1ˆvar ασσβ==-=∑∑iixr x 同理,有()()33ˆvar ˆvar γβ=4.3(1)建立中国商品进口额为Y 与国内生产总值x1、居民消费价格指数x2得回归模型123l n l n 1l n2t t ti Y X X uβββ=+++ 估计模型参数,结果为Dependent Variable: LNY Method: Least Squares Date: 05/16/12 Time: 19:15 Sample: 1985 2007 Included observations: 23C -3.060149 0.337427 -9.069059 0.0000 LNX1 1.656674 0.092206 17.96703 0.0000 LNX2-1.0570530.214647-4.9246180.0001R-squared0.992218 Mean dependent var 9.155303 Adjusted R-squared 0.991440 S.D. dependent var 1.276500 S.E. of regression 0.118100 Akaike info criterion -1.313463 Sum squared resid 0.278952 Schwarz criterion -1.165355 Log likelihood 18.10482 F-statistic 1275.093 Durbin-Watson stat0.745639 Prob(F-statistic)0.000000093.1275F 991.0 992.0(-4.925) (17.967) (-9.069) 2ln 0571.11ln 6567.10601.3ˆln 22===-+-=RRx x Y t (2))数据中有多重共线性,居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且其简单相关系数呈现正向变动。

计量经济学4答案

计量经济学4答案

计量经济学4答案第四章多重共线性一、单项选择题1、完全的多重共线性是指解释变量的数据矩阵的秩(B)(A)大于k+1(B)小于k+1(C)等于k+1(D)等于k+12、当模型存在严重的多重共线性时,OLS估计量将不具备(D)(A)线性(B)无偏性(C)有效性(D)一致性3、如果每两个解释变量的简单相关系数比较高,大于(D)时则可认为存在着较严重的多重共线性。

(A)0.5(B)0.6(C)0.7(D)0.84、方差扩大因子VIFj可用来度量多重共线性的严重程度,经验表明,VIFj(A)时,说明解释变量与其余解释变量间有严重的多重共线性。

(A)小于5(B)大于1(C)小于1(D)大于10的方差将是原来的(C)5、对于模型yi01某1i2某2iui,与r23等于0相比,当r23等于0.5时,3(A)2倍(B)1.5倍(C)1.33倍(D)1.25倍6、无多重共线性是指数据矩阵的秩(D)(A)小于k(B)等于k(C)大于k(D)等于k+17、无多重共线性假定是假定各解释变量之间不存在(A)(A)线性关系(B)非线性关系(C)自相关(D)异方差8、经济变量之间具有共同变化的趋势时,由其构建的计量经济模型易产生(C)(A)异方差(B)自相关(C)多重共线性(D)序列相关9、完全多重共线性产生的后果包括参数估计量的方差(C)(A)增大(B)减小(C)无穷大(D)无穷小10、不完全多重共线性产生的后果包括参数估计量的方差(A)(A)增大(B)减小(C)无穷大(D)无穷小11、不完全多重共线性下,对参数区间估计时,置信区间趋于(A)(A)变大(B)变小(C)不变(D)难以估计12、较高的简单相关系数是多重共线性存在的(B)(A)必要条件(B)充分条件(C)充要条件(D)并非条件13、方差扩大因子VIFj是由辅助回归的可决系数Rj2计算而得,Rj2越大,方差扩大因子VIFj就(A)(A)越大(B)越小(C)不变(D)无关14、解释变量间的多重共线性越弱,方差扩大因子VIFj就越接近于(A)(A)1(B)2(C)0(D)1015、多重共线性是一个(D)(A)样本特性(B)总体特性(C)模型特性(D)以上皆不对二、多项选择题1、多重共线性包括(ABCD)(A)完全的多重共线性(B)不完全的多重共线性(C)解释变量间精确的线性关系(D)解释变量间近似的线性关系(E)非线性关系2、多重共线性产生的经济背景主要由(ABD)(A)经济变量之间具有共同变化趋势(B)模型中包含滞后变量(C)采用截面数据(D)样本数据自身的原因3、多重共线性检验的方法包括(ABCD)(A)简单相关系数检验法(B)方差扩大因子法(C)直观判断法(D)逐步回归法(E)DW检验法4、修正多重共线性的经验方法包括(ABCDE)(A)剔除变量法(B)增大样本容量(C)变换模型形式(D)截面数据与时间序列数据并用(E)变量变换5、严重的多重共线性常常会出现下列情形(ABCD)(A)适用OLS得到的回归参数估计值不稳定(B)回归系数的方差增大(C)回归方程高度显著的情况下,有些回归系数通不过显著性检验(D)回归系数的正负号得不到合理的经济解释三、名词解释(每题4分)1、多重共线性2、完全的多重共线性3、辅助回归4、方差扩大因子VIFj5、逐步回归法6、不完全的多重共线性四、简答题(每题5分)1、多重共线性的实质是什么?2、为什么会出现多重共线性?3、多重共线性对回归参数的估计有何影响?4、判断是否存在多重共线性的方法有那些?5、针对多重共线性采取的补救措施有那些?6、具有严重多重共线性的回归方程能否用来进行预测?五、辨析题1、在高度多重共线性的情形中,要评价一个或多个偏回归系数的单个显著性是不可能的。

第四章练习题及参考解答(第四版)计量经济学

第四章练习题及参考解答(第四版)计量经济学

第四章练习题及参考解答4.1 假设在模型i i i i u X X Y +++=33221βββ中,32X X 与之间的相关系数为零,有人建议你分别进行如下回归:1221i i i Y X u αα=++ 1332i i i Y X u γγ=++(1) 是否存在3322ˆˆˆˆβγβα==且?为什么? (2) 1ˆβ会等于1ˆα或1ˆγ或者两者的某个线性组合吗? (3) 是否有()()22ˆˆVar Var βα=且()()33ˆˆVar Var βγ=?【练习题4.1参考解答】(1) 存在2233ˆˆˆˆαβγβ==且 。

因为 ()()()()()()()22332322222323ˆi iii ii iiii iy x x y x x xx x x x β-=-∑∑∑∑∑∑∑当23X X 与 之间的相关系数为零时,离差形式的230i ixx =∑有 ()()()()223222222223ˆˆi i i i i iiiy x x y x xx x βα===∑∑∑∑∑∑ 同理有: 33ˆˆγβ= (2)会的。

(3) 存在 ()()()()2233ˆˆˆˆvar var var var βαβγ==且 因为 ()()2222223ˆvar 1ix r σβ=-∑当 230r = 时, ()()()22222222223ˆˆvar var 1iix x r σσβα===-∑∑ 同理,有 ()()33ˆˆvar var βγ=4.2 表4.4给出了1995—2016年中国商品进口额Y 、国内生产总值GDP 、居民消费价格指数CPI 的数据。

表4.4 中国商品进口额、国内生产总值、居民消费价格指数资料来源:《中国统计年鉴2017》考虑建立模型: i t t t u CPI GDP Y ++=ln ln ln 321βββ+ (1)利用表中数据估计此模型的参数。

(2)你认为数据中有多重共线性吗?(3)进行以下回归:121ln ln t t i Y A A GDP v =++ 122ln ln t t i Y B B CPI v =++ 123ln ln t t i GDP C C CPI v =++ 根据这些回归你能对多重共线性的性质有什么认识?(4)假设经检验数据有多重共线性,但模型中32ˆˆββ和在5%水平上显著,并且F 检验也显著,你对此模型的应用有何建议?【练习题4.2参考解答】建立模型: i t t t u CPI GDP Y ++=ln ln ln 321βββ+ (1)利用表中数据估计此模型的参数。

第四章 多重共线性

第四章 多重共线性

三、产生的后果
• 概括地讲,其后果是参数估计量失去应有含义;方差增大, t检验失效;预测结论不准确。 具体地讲, • 由于参数估计量的方差增大,使得估计量的精度大大降低, 因而不能正确地判断各解释变量对被解释变量影响大小,即 参数估计量经济含义不合理(参数不反映各自与被解释变量
之间的结构关系,而是反映对被解释变量的共同影响)
(二)多重共线性的类型
如果多元线性回归模型中,存在两个或多个解释变量之 间存在严格的线性关系,则称为完全(exact)多重共 线性,如前例。 有时解释变量之间存在近似的、而不是严格的线性关系, 则称为近似(near)多重共线性。前者是由于模型引进 变量不当引起,后果是回归分析完全失效;而后者既与 变量选择有关,也与数据存在共同趋势有关,但更多的 是与数据有关。其后果是参数无法唯一确定(即参数估
计不稳定);错误的结论(即数据较小变化引起参数估 计量较大变化);参数估计量方差增大;参数估计量符 号与实际结果相反。
二、多重共线性产生的原因
• 1.截面数据(或面板数据)建立的回归模型,选择的 经济变量往往从经济上存在密切关联。 • 如:以截面数据建立的生产函数,从投入要素看 (劳动力、资金),都与企业生产规模密切相关。 则各要素间存在较强的相关性;又如,农业生产过 程中,土地面积与施肥量存在密切联系,即面积越 大,施肥量越多。 • 2.许多经济变量在随时间变化过程中,往往存在共同 的变化趋势,则经济变量间易产生多重共线性。 如:经济增长 、收入增长、商品销售增长、物价提 高、货币发行增多、储蓄增加
1、相关系数检验
• 确定相关系数的方法:(比较简单) COR 解释变量名称 如:COR x1 x2 x3 • 以相关系数的大小确定解释变量之间是否相关

4 多重共线性

4 多重共线性

2 λ (∑ yx2 )(∑ x2 ) − λ (∑ yx2 )(∑ x2 x2 ) 0 = = 2 2 0 λ (∑ x2 )(∑ x2 2 ) − λ 2 (∑ x2 2 ) 2
2 (∑ yλ x2 )(∑ x2 ) − (∑ yx2 )(∑ x2 λ x2 ) ˆ β3 = 2 (∑ x2 )(∑ (λ x2 ) 2 ) − (∑ x2 λ x2 ) 2
第二节 多重共线性产生的后果
▲完全多重共线性下的后果 ▲不完全多重共线性下的后果 一、完全多重共线性下的后果 1、参数估计值不确定 在完全多重共线性下,解释变量 X i 满足:
λ2 X 2 + λ3 X 3 + " + λk X k = 0
其中 λi 不全为零。则对应解释变量的矩阵 X ,有 X ' X = 0 ,或者
∑ (λ x )
2
2
σ
2
∑x =
0
2 2
σ2 = ∞
表明在解释变量之间存在完全共线性时, 参数估计值的方差会无限变
完全
二、多重共线性的定义
不完全
1、完全的多重共线性(线性相关的方法描述) : 对于变量 X 2 , X 3 ," , X k ,如果存在不全为零的数 λ2 , λ3 ," , λk ,使得 下式成立:
2
λ2 X 2 + λ3 X 3 + " + λk X k = 0
(4.1)
则称变量
X 2 , X 3 ," , X k 之间存在一种完全的多重共线性。
第四章 多重共线性
在现实经济问题中,古典假定不一定能满足,这就是所谓的古典 假定的违反。 古典假定: 1.零均值,即 E (ui ) = 0 ; 2.同方差,即 Var (ui ) = σ 2 ; 3.无自相关,即 Cov(ui , u j ) = 0, i ≠ j ; 4.解释变量非随机性,即 Cov(ui , X i ) = 0 ; 5. 无 多 重 共 线 性 , 即 不 存 在 一 组 不 全 为 零 的 数 λ2、λ3 " λk , 使

第四章 多重共线性 思考题

第四章    多重共线性    思考题

第四章 多重共线性 思考题4.1 多重共线性的实质是什么 ? 为什么会出现多重共线性 ?4.2 多重共线性对回归参数的估计有何影响 ?4.3 多重共线性的典型表现是什么 ? 判断是否存在多重共线性的方法有哪些 ?4.4 针对出现多重共线性的不同情形 , 能采取的补救措施有哪些 ?4.5 在涉及相关的宏观经济总量指标如 GDP 、货币供应量、物价总水平、国民总收入、就业人数等时间序列的数据中一般都会怀疑有多重共线性 , 为什么 ?4.6 多重共线性的产生与样本容量的个数n 、解释变量的个数k 是有无关系 ?4.7 具有严重多重共线性的回归方程能否用来进行预测 ?4.8 岭回归法的基本思想是什么 , 它对降低共线性有何作用 ?4.9 以下陈述是否正确 ? 请判断并说明理由。

1) 在高度多重共线性的情形中 , 要评价一个或多个偏回归系数的单个显著性是不可能的。

2) 尽管有完全的多重共线性 ,OLS 估计量仍然是BLUE 。

3) 如果有某一辅助回归显示出高的2j R 值,则高度共线性的存在是肯定无疑的。

4) 变量的两两高度相关并不表示高度多重共线性。

5) 如果其他条件不变 ,VIF 越高 ,OLS 估计量的方差越大。

6) 如果在多元回归中,根据通常的t 检验,全部偏回归系数分别都是统计上不显著的 ,你就不会得到一个高的2R 值。

7) 在 Y 对2X 和3X 的回归中 , 假如3X 的值很少变化 ,这就会使Var(3ˆβ)增大 , 在极端的情形下 , 如果全部3X 值都相同 ,Var(3ˆβ)将是无穷大。

8) 如果分析的目的仅仅是预测 , 则多重共线性是无害的。

练习题4.1 假设在模型12233i i i i Y X X u βββ=+++中 ,2X 与3X 之间的相关系数为零 , 于是有人建议你进行以下回归。

1221i i i Y X u αα=++1332i i i Y X u γγ=++是否存在2ˆα=2ˆβ且3ˆγ=3ˆβ?为什么 ? 2) 1ˆβ会等于1ˆα或1ˆγ或两者的某个线性组合吗 ? 3) 是否有Var(2ˆβ)且Var(2ˆα)且Var (3ˆβ)=Var(3ˆγ)?4.2 在决定一个回归模型的 " 最优 " 解释变量集时人们常用逐步回归的方法,在逐步回归中既可采取每次引进一个解释变量的程序 ( 逐步向前回归 ), 也可以先把所有可能的解释变 量都放在一个多元回归中 , 然后逐一地将它们剔除 ( 逐步向后回归 ) 。

计量经济学 第二版 第4章 多重共线性

计量经济学 第二版 第4章 多重共线性

另一个与VIF等价的指标是“容许度”(Tolerance),其 定义为:
TOLi (1 Ri2 ) 1 VIFi
显然,0≤TOL≤1;当xi与其它解释变量高度相关时, TOL→0。因此,一般当TOL<0.1时,认为模型存在较严 数判断

剔除变量一定要慎重!!若剔除重要的解释 变量,则 会引起: ①模型的经济意义不合理; ②是否使模型产生异方差性或自相关性; ③若剔除不当,可能会产生模型设定误差,造 成参数估计严重有偏
2、间接剔除重要的解释变量 ⑴利用附加信息 生产函数 Y AL K e ,L与K通常高度相关
已知附加信息: α +β =1 则
1
(规模报酬不变)
K Y AL K AL( ) 或 L

Y K A( ) L L
记 y=Y/L , k=K/L 则C-D生产函数可以表示成: y=Akβ ˆ ˆ ˆ 利用OLS法估计 A, ,进而得到 1 ˆ
(2)变换模型的形式 一是变换模型的形式: 双对数变换 例如生产函数(消除等量级的影响) 多项式模型变换、半对数模型变换
ˆ r 为x 、x b 2 的方差为: 2 12 1
ˆD(
可以证明, b ˆ 1
2
的相关系数
2 12
1 D( ˆ )= . b1 ( X X )2 1 r
1i 1
b2
( X 2 i X 2 )
2 )=
. 2
1 2 1 r12
式中第二项因子称为方差膨胀因子记成VIF

从方差膨胀因子看出,OLS估计量的方差随 着多重共线性的出现而“膨胀”起来。当 X , X 1 2 高度相关时(即 r两解释的相关系数趋向于 12 1),VIF趋向于正无穷大。因而,随着多重共线性 严重程度的加大,OLS估计量的方差将成倍地增长, 直至趋于无穷大。 当模型存在完全多重共线性时参数估计值的 方差无穷大

多重共线性习题及答案

多重共线性习题及答案

多重共线性一、单项选择题1、当模型存在严重的多重共线性时,OLS估计量将不具备()A、线性B、无偏fC、有效fD一致性2、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF()A大于B、小于C、大于5D、小于53、模型中引入实际上与解释变量有关的变量,会导致参数的OLS估计量方差()A、增大B、减小C、有偏D、非有效4、对于模型y t=b0+b i X it+b2X2t+u t,与r i2=0相比,r i2=0.5时,估计量的方差将是原来的()A1倍B、1.33倍C、1.8倍D、2倍5、如果方差膨胀因子VIF=10,则什么问题是严重的()A异方差问题B、序列相关问题C多重共线,f问题D解释变量与随机项的相关性6、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在()A异方差B序列相关C多重共线性D高拟合优度7、存在严重的多重共线性时,参数估计的标准差()A变大日变小C无法彳t计H无穷大8、完全多重共线性时,下列判断不正确的是()A、参数无法估计B、只能估计参数的线性组合C模型的拟合程度不能判断口可以计算模型的拟合程度二、多项选择题1、下列哪些回归分析中很可能出现多重共线性问题()A、资本投入与劳动投入两个变量同时作为生产函数的解释变量日消费作被解释变量,收入作解释变量的消费函数C本期收入和前期收入同时作为消费的解释变量的消费函数D商品价格、地区、消费风俗同时作为解释变量的需求函数E、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型2、当模型中解释变量间存在高度的多重共线性时()A、各个解释变量对被解释变量的影响将难以精确鉴别日部分解释变量与随机误差项之间将高度相关C估计量的精度将大幅度下降D估计对于样本容量的变动将十分敏感E、模型的随机误差项也将序列相关3、下述统计量可以用来检验多重共线性的严重性()A相关系数B、DW值C、方差膨胀因子H特征值E、自相关系数4、多重共线性产生的原因主要有()A、经济变量之间往往存在同方向的变化趋势日经济变量之间往往存在着密切的关联C在模型中采用滞后变量也容易产生多重共线性D在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性E、以上都正确5、多重共线性的解决方法主要有()A、保留重要的解释变量,去掉次要的或替代的解释变量日利用先验信息改变参数的约束形式C变换模型的形式D综合使用时序数据与截面数据E、逐步回归法以及增加样本容量6、关于多重共线性,判断错误的有()A、解释变量两两不相关,则不存在多重共线性日所有的t检验都不显著,则说明模型总体是不显著的C有多重共线性的计量经济模型没有应用的意义D存在严重的多重共线性的模型不能用于结构分析7、模型存在完全多重共线性时,下列判断正确的是()A、参数无法估计日只能估计参数白^线性组合C模型的判定系数为0D、模型的判定系数为1三、简述1、什么是多重共线性?产生多重共线性的原因是什么?2、什么是完全多重共线性?什么是不完全多重共线性?3、完全多重共线性对OLS估计量的影响有哪些?4、不完全多重共线性对OLS估计量的影响有哪些?5、从哪些症状中可以判断可能存在多重共线性?6、什么是方差膨胀因子检验法?四、判断(1)如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

)第四章 多重共线性一、判断题1、多重共线性是一种随机误差现象。

(F )2、多重共线性是总体的特征。

(F )3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t 值会趋于变大。

(F )4、尽管有不完全的多重共线性,OLS 估计量仍然是最优线性无偏估计量。

(T )5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。

(T )6、变量的两两高度相关并不表示高度多重共线性。

(F )-7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。

(T )8、在多元回归中,根据通常的t 检验,每个参数都是统计上不显著的,你就不会得到一个高的2R 值。

(F )9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。

( F )10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。

(T ) 11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。

(T )12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。

(F )13、多重共线性的存在会降低OLS 估计的方差。

(F )14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。

(T ) :15、解释变量和随机误差项相关,是产生多重共线性的原因。

(F )16、对于模型i ni n i 110i u X X Y ++++=βββ ,n 1i ,, =;如果132X X X -=,模型必然存在解释变量的多重共线性问题。

(T )17、多重共线性问题是随机扰动项违背古典假定引起的。

(F ) 18、存在多重共线性时,模型参数无法估计。

(F )二、单项选择题1、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,既有12i i X kX =,其中k 为 非零常数,则表明模型中存在 ( B ) A 、异方差 B 、多重共线性'C 、序列相关D 、随机解释变量2、 在多元线性回归模型中,若某个解释变量对其余解释变量的可决系数接近1,则表明模型中存在 ( C ) A 、异方差性 B 、序列相关 C 、多重共线性 D 、拟合优度低3、对于模型i i 22i 110i u X X Y +++=βββ,与0r 12=相比,当50r 12.=时,估计量1βˆ的方差()1βˆvar 将是原来的 ( B ) A 、 1 倍 B 、 倍 C 、 倍 D 、 2 倍 4、如果方差膨胀因子VIF =10,则认为什么问题是严重的( C )A 、异方差问题B 、序列相关问题!C 、多重共线性问题D 、 解释变量与随机项的相关性5、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF ( C )。

A 、大于1B 、小于1C 、大于10D 、小于10 6、模型中引入实际上与解释变量有关的变量,会导致参数的OLS 估计量方差( A ) A 、增大 B 、减小 C 、有偏 D 、非有效 7、存在严重的多重共线性时,参数估计的标准差( A )。

A 、变大B 、变小C 、无穷大D 、无法估计 8、完全多重共线性时,下列判断不正确的是( D )。

;A 、参数无法估计B 、只能估计参数的线性组合C 、模型的拟合程度不能判断D 、可以计算模型的拟合程度9、模型中引入一个无关的解释变量( C )A 、对模型参数估计量的性质不产生任何影响B 、导致普通最小二乘估计量有偏C 、导致普通最小二乘估计量精度下降;D 、导致普通最小二乘估计量有偏,同时精度下降三、多项选择题1、关于多重共线性的影响,下面哪些正确:( ABCD )A、增大回归系数的标准差B、难以区分单个自变量的影响C、t检验倾向于不显著D、回归参数估计值不稳定2、下列哪些回归分析中很可能出现多重共线性问题( ACE )。

A、资本投入与劳动投入两个变量同时作为生产函数的解释变量.B、消费作被解释变量,收入作解释变量的消费函数C、本期收入和前期收入同时作为消费的解释变量的消费函数D、商品价格、地区、消费风俗同时作为解释变量的需求函数E、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型3、当模型中解释变量间存在高度的多重共线性时( ACD )。

A、各个解释变量对被解释变量的影响将难以精确鉴别B、部分解释变量与随机误差项之间将高度相关C、估计量的精度将大幅度下降【D、估计对于样本容量的变动将十分敏感E、模型的随机误差项也将序列相关4、下述统计量可以用来检验多重共线性的严重性( ACD )。

A、相关系数B、DW值C、方差膨胀因子D、特征值E、自相关系数5、多重共线性产生的原因主要有(ABCDE )。

A、经济变量之间往往存在同方向的变化趋势B、经济变量之间往往存在着密切的关联C、在模型中采用滞后变量也容易产生多重共线性—D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性E、以上都正确6、多重共线性的解决方法主要有( ABCDE )。

A、保留重要的解释变量,去掉次要的或替代的解释变量B、利用先验信息改变参数的约束形式C、变换模型的形式D、综合使用时序数据与截面数据E、逐步回归法以及增加样本容量^7、关于多重共线性,判断错误的有( ABC )。

A、解释变量两两不相关,则不存在多重共线性B、所有的t检验都不显著,则说明模型总体是不显著的C 、有多重共线性的计量经济模型没有应用的意义D 、存在严重的多重共线性的模型不能用于结构分析 8、模型存在完全多重共线性时,下列判断正确的是( AB )。

A 、参数无法估计B 、只能估计参数的线性组合C 、模型的可决系数为0D 、模型的可决系数为1。

9、下列判断正确的有( ABC )。

A 、在严重多重共线性下,OLS 估计量仍是最佳线性无偏估计量。

B 、多重共线性问题的实质是样本现象,因此可以通过增加样本信息得到改善。

C 、虽然多重共线性下很难精确区分各个解释变量的单独影响,但可据此模型进行预测。

D 、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。

10、检测多重共线性的方法有( AC )。

A 、 简单相关系数检测法B 、 样本分段比较法C 、 方差膨胀因子检测法D 、 可决系数增量贡献法—E 、 工具变量法四、简答题1、什么是多重共线性产生多重共线性的原因是什么答:多重共线性是指解释变量之间存在完全或近似的线性关系。

产生多重共线性主要有下述原因:(1)经济变量之间具有共同变化趋势(2)模型中包含滞后变量(3)利用截面数据建立模型(4)样本数据的自身原因,例如抽样仅限于总体中解释变量取值的一个有限范围。

2、什么是完全多重共线性什么是不完全多重共线性答:完全多重共线:对于解释变量k 32X X X 1,,,, ,如果存在不全为0的数k 21λλλ,,, ,使得()n 21i 0X X X ki k i 33i 221,,, ==++++λλλλ&则称解释变量k 32X X X 1,,,, 之间存在着完全的多重共线性。

不完全多重共线性:对于解释变量k 32X X X 1,,,, ,如果存在不全为0的数k 21λλλ,,, ,使得()n 21i 0v X X X i ki k i 33i 221,,, ==+++++λλλλ式中,i v 为随机变量,则称解释变量k 32X X X 1,,,, 之间存在着不完全的多重共线性。

3、完全多重共线性对OLS 估计量的影响有哪些 答:(1)参数的估计值不确定,不能独立分辨各个解释变量对被解释变量的影响。

(2)参数估计值的方差无穷大。

4、不完全多重共线性对OLS 估计量的影响有哪些答:(1)回归的参数估计值很不稳定,普通最小二乘估计不精确。

(2)参数估计值的方差与协方差增大。

(3)对参数区间估计时,置信区间趋于变大。

(4)严重多重共线性时,假设检验容易作出错误的判断,t 检验可能倾向于不显著,甚至可能回归系数的正负号得不到合理的经济解释。

~5、从哪些症状中可以判断可能存在多重共线性答:(1)模型总体性检验F 值和R 2值都很高,但各回归系数估计量的方差很大,t 值很低,系数不能通过显著性检验。

(2)回归系数值难以置信或符号错误。

(3)参数估计值对删除或增加少量观测值,以及删除一个不显著的解释变量非常敏感。

6、什么是方差膨胀因子检验法答:所谓方差膨胀因子是存在多重共线性时回归系数估计量的方差与无多重共线性时回归系数估计量的方差对比而得出的比值系数。

若1VIF j =时,认为原模型不存在“多重共线性问题”;若1VIF j >时,则认为原模型存在“多重共线性问题”;若10VIF j ≥时,则模型的“多重共线性问题”的程度是很严重的,而且是非常有害的。

五、计算题1、考虑下表中的数据)Y -10 -8 -6 -4 -2 0 >24 6 8 10 X 1 1 2 .34 5 6 7 8 9 10 |11X 2 135 7911.1315171921假设你做Y 对X 1和X 2的多元回归,你能估计模型的参数吗为什么 答:不能。

因为X 1和X 2存在完全的多重共线性,即X 2=2 X 1-1,或X 1=(X 2+1)。

2、!3、下表给出了以美元计算的每周消费支出(Y ),每周收入(X 1)和财富(X 2)的假想数据。

2252140 220 2201 155 240 2435 150] 2602686(1)作Y 对X 1和X 2的OLS (2)直观地判断这一回归方程中是否存在多重共线性为什么 (3)分别作Y 对X 1和X 2的回归,这些回归结果表明了什么 (4)作X 2对X 1的回归。

这一回归结果表明了什么 答:"(1)21X 0350X 872033724Y ...ˆ-+=T R 2=(2)可能存在多重共线性。

因为财富的系数解释是随着财富的增加,消费支出的金额在减少,这与经济理论不相符。

而且,财富的系数不显著。

因此可能是由于多重共线性引起的。

(3)1X 509045524Y ..ˆ+=T R 2=$2X 048045226Y ..ˆ+=T R 2=回归结果表明两个解释变量对消费支出的影响都是显著的,并且解释能力较强。

(4)12X 373103643X ..ˆ+-=T R 2=回归结果表明每周的收入与财富是高度线性相关的,二者同时作为解释变量会产生严重的多重共线性。

4、%5、某地区供水部门利用最近15年的用水年度数据得出如下估计模型:rain 1231price 8717pcy 0050pop 3630house 30509326water ......---++-=t=938F 930R 2.,.==其中,water-用水总量(百万立方米),house-住户总数(千户),pop-总人口(千人),pcy-人均收入(元),price-价格(元/100 立方米),rain-降水量(毫米)。

相关文档
最新文档