第五章 答案.doc

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第5章 多重共线性

习题:

1. 什么是共线性?什么是多重共线性?

答:共线性是指回归模型中的各个解释变量之间不存在线性关系。“多重共线性”一词常常用来表示解释变量之间具有较高的共线性程度,但又不是完全共线性的情形。

2. 在k 变量的模型中有k 个正规方程用以估计k 个未知系数。假定X k 是其余X 变量的一个完

全线性组合,你怎样说明在这种情形中不可能估计这k 个回归系数?

答:当一个变量是另一些变量的线性函数时,在这k 正规个方程中,实际只有k-1个有效方程,利用线性代数的知识我们可以知道k-1个方程是无法准确估计k 个未知数的。

3. 一般来说,如何判断模型中是否存在严重的多重共线性问题?

答:(1)2R 较高但t 值显著的系数不多。(2)解释变量两两高度相关。(3)观察每个解释

变量对其它剩余解释变量的回归方程,这样的回归称为辅助回归。如果某个辅助回归方程的拟合优度显著不为零(即整体显著:F 检验),则存在多重共线性。(4)使用方差膨胀因子判断。克莱因经验法则(Klein ’s rule of thumb )

如果某个解释变量还有一些诸如偏相关系数(partial correlation coefficient )、本征值(eigenvalues )或病态指数(condition index )等其他方法可用于诊断多重共线性的程度。对其余解释变量的辅助回归的拟合优度大于因变量Y 对所有解释变量作回归所得到的拟合优

度2R ,则可能存在比较严重的多重共线性。

4. 什么是方差膨胀因子(VIF ),它有什么作用? 答:22322222323ˆvar()()()()i i i i i x x x x x βσ⎡⎤=⋅⎢⎥-⎣⎦

∑∑∑∑ 即 222222222323222231ˆvar()1()()1i i i i i i x r x x x x x σσβ⎡⎤⎢⎥⎢⎥==⋅⎢⎥⎛⎫-⎢⎥- ⎪⎢⎥⎝⎭⎣⎦

∑∑∑∑∑ (5.7)

其中23r 是解释变量2X 和3X 的(样本)相关系数,介于1-与1+之间。223r 正好是2X 对3X 回归的拟合优度(也是3X 对2X 回归的拟合优度)。1 称22311VIF r =-

为方差膨胀因子。于是

22

22ˆvar()i VIF x σβ=⋅∑ (5.8)

与此相类似, 2323ˆvar()i VIF x σβ=⋅∑

于是我们可以用VIF 作为一种测定多重共线性的手段,当检测到较大的VIF 时,就有可能存在多重共线性问题。

5. 在一个关于某城市用水量的分析中,估计出了如下的方程(15n =):

2326.90.3050.3630.005 ( 1.7) (0.9) (1.4) (0.6) 17.87 1.123 0.93 38.9 ( 1.2) watc house pop pci t prwat rain R F =-++-=----==- (0.8) -

其中,watc=总用水量,house=总的房屋套数,pop=总人口, pci=人均年收入, prwat=水价, rain=年降雨量,括号内的数值是t 统计量。

(1)根据经济理论或直觉,你认为每个回归系数的符号应该是什么,为什么?估计出来的

系数的符号与你的推测一致吗?

(2)每个系数的t 统计值都不显著,但是F 统计值是显著的,导致这种矛盾的原因是什么?

(3)这些估计量是有偏的、无效的或者不一致的吗?

答:(1)house 的系数应该是正的,因为房屋越多,住户也就越多,用户量也会增加。模型中和推测的一致;pop 的系数也应该是正的,因为人越多,用水量肯定也越多,模型中和推测一致。Pci 的系数应该是正的,因为当人的收入多时,也就不会珍惜使用每一滴水来减少花费,模型中和推测不一致;prwat 的系数应该是负的,因为当水价上升时,对于那些在意

1 见第2章习题2.8。

水价格的人们将会降低对水的使用,从而水的用量降低,模型中和推测一致;rain 的系数应该是负的,因为当降水量增加时,用水量必然要减少了,这是由于水量相比较于以前增加了,模型中和推测一致。

(2)导致这种矛盾的原因是多重共线性的存在。

(3)如果保持自变量取值不变且有足够多的样本,利用这些样本计算得到OLS 估计值的平均值将“接近于”真实的参数值,所以说这些估计量是无偏的。而且多重共线性没有破坏OLS 估计量的最小方差性,但最小的方差也可能比较大。较大的方差容易导致本该显著的系数不能通过显著性检验。所以这些估计量是有效的,只是最小方差变大了。但是这些估计量将是不一致的,因为多重共线性将会带来的后果致使模型估计不准确,也就不能依概率收敛于总体的真值。

6. 考虑下面的数据集:

Y -10 -8 -6 -5 -2 0

2 4 6 8 10 2X 1 2

3 4 5 6 7 8 9 10 11 3X 1 3 5 7 9 11 13 15 17 19 21

假设你想做Y 对2X 和3X 的回归,

(1)你能估计模型参数吗?为什么?

(2)如果不能,你能估计那些参数或参数的组合?

答:(1)不能。分析数据可以看出,32

21X X =-,即存在完全共线性的关系。 (2)可以估计出Y 和2X 、Y 和3X 、2X 和3X 系数的组合。

7. 判断以下陈述的正误,并给出理由。

(1)尽管存在多重共线性,OLS 估计量仍然是具有BLUE 性质的。

(2)在高度多重共线性的情形下,要评价一个或多个偏回归系数的个别显著性是不可能的。

(3)如果有某一辅助回归显示出高的2R 值,则模型中肯定存在较严重的多重共线性问题。

(4)变量的两两高度相关并不表示高度的多重共线性。

(5)如果分析的目的仅仅是预测,则多重共线性是无害的。

(6)其它条件不变,VIF 越高,相应的OLS 估计量的方差越大。

(7)在多元回归中,如果根据t 检验,全部的偏回归系数个别来说都是不显著的,那么就

不可能得到一个较高的2R 。

相关文档
最新文档