第七章 多重共线性及其处理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 多重共线性及其处理
一、简答题
1.什么是变量之间的多重共线性?
2.什么是完全多重共线性?什么是不完全多重共线性?
3.多重共线性在多元线性回归模型中普遍存在的主要原因有哪些? 4.多重共线性可能造成哪些不利后果? 5.多重共线性的检验有哪些适当的方法? 6.多重共线性的修正方法有哪些?
二、计算题分析题
1.某地区供水部门利用最近20年的用水年度数据得出如下估计模型:
12345
ˆ326.90.3050.3630.00517.87 1.123Y X X X X X =-++--- (-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)
93.02=R
F=38.9
式中,y ——用水总量(百万立方米),1x ——住户总数(千户),2x ——总人口(千人),
3x ——人均收入(元),4x ——价格(元/100立方米),5x ——降雨量(毫米)。
(1)根据经济理论和直觉,请计回归系数的符号是什么(不包括常量),为什么?观察符
号与你的直觉相符吗?
(2)在10%的显著性水平下,请进行变量的t 检验与方程的F-检验。T 检验与F 检验结果有相矛盾的现象吗?
(3)你认为估计值是(1)有偏的;(2)无效的;(3)不一致的吗?详细阐述理由。 2.下表是某地区1995年~2004年食品需求量Y 、可支配收入1X 、食品类价格指数2X 、 物价总指数3X 和流动资产拥有量4X 的数据资料。
食品需求函数有关统计资料
问题:
(1)检验变量间的多重共线性。
(2)利用Frish 法,建立适当的回归方程。
第四部分 习题答案 一、简答题
1.多重共线性指两个或多个解释变量之间不再彼此独立,而是出现了相关性。
2.完全多重共线性指:在有多个解释变量模型中,其中一个变量可以表示为其他多个变量的完全线性函数,即k k X B X B X B X ++=33221,其中至少有一个
),,3,2(,0k i B i =≠,1X 与等式右边线性组合的相关系数为1,则这种情况被称为完全
多重共线性。在此情况下,不能估计解释变量各自对被解释变量的影响。
不完全多重共线性指:在实际经济活动中,多个解释变量之间存在多重共线性问题,但与等式右边线性组合的相关系数不为1。 3.多重共线性产生的原因
多元线性回归模型产生多重共线性的原因很多,主要有:
(1)经济变量的内在联系。这是产生多重共线性的根本原因; (2)解释变量中含有滞后变量; (3)经济变量变化趋势的“共向性”。 4.多重共线性会产生以下问题:
(1)增大了OLS 估计量的方差;
(2)难以区分每个解释变量的单独影响; (3)回归模型缺乏稳定性; (4)t 检验的可靠性降低。
5.在应用多元回归模型中,人们总结了许多检验多重共线性的方法。
(1)系数判定法
(2)用解释变量之间所构成的回归方程的决定系数2R 进行判别 (3)逐步回归判别法
以Y 为被解释变量逐个引入解释变量,构成回归模型,进行参数估计,根据决定系数的变化决定新引入的变量是否能够加入模型之中。首先将Y 对所有的解释变量分别作回归,得到所有的模型,取决定系数最大的模型中的解释变量加入模型,作为第一个引入模型的变量;其次,将Y 再对剩余的解释变量分别加入模型,进行二元回归,再次,取决定系数最大的解释变量加入模型;依次做下去,直到模型的决定系数不再改善为止。
(4)方差膨胀因子VIF 判别法
对于多元线性回归模型,ˆi β
的方差可以表示成 ()
()
()
VIF X X
r X X
Var i i
i i
i
i
.1
11
.ˆ2
2
2
2
∑∑-=--=σβ
一般当V I F >10时(此时2i r >0.9),认为模型存在较严重的多重共 线性。
(5)修正的Frish 判别法
该方法不仅可以对多重共线性进行判别,同时也是处理多重共线性问题的一种有效方法。其步骤为:第一,用被解释变量分别对每个解释变量进行线性回归,根据经济理论和统计检验从中选择一个最合适的回归模型作为基本回归模型,通常选取决定系数2R 最大的回
归模型。第二,在基本回归模型中逐个增加其他解释变量,重新进行线性回归,如果新增加的这个解释变量提高了回归模型的决定系数2R,并且回归模型中的其他参数统计上仍然显著,就在模型中保留该解释变量;如果新增加的解释变量没有显著提高回归模型的拟合优度,则不在模型中保留该解释变量;如果新增加的解释变量提高了回归模型的决定系数,并且回归模型中某些参数的数值或符号等受到显著的影响,说明模型中存在多重共线性,对该解释变量同与之相关的其他解释变量进行比较,在模型中保留对被解释变量影响较大的,剔除影响较小的。
6.多重共线性的解决方法有:
(1)剔除引起共线性的变量;
在估计模型之前,找出引起多重共线性的变量,将它剔除出去,是最有效的克服多重共线性问题的方法。
(2)变换模型的形式
对原模型进行适当的变换,也可以消除或削弱原模型中解释变量之间的相关关系。具体有三种变换方式:一是变换模型的函数形式;二是变换模型的变量形式;三是改变变量的统计指标。
(3)综合使用时序数据与横截面数据
如果能同时获得变量的时序数据和横截面数据,则先利用某类数据估计出模型中的部分参数,再利用另一类数据估计模型的其余参数。
(4)逐步回归分析法
逐步回归选取变量时,是一个“由少到多”的过程,即从所有解释变量中间先选择影响最为显著的变量建立模型,然后再将模型之外的变量逐个引入模型;每引入一个变量,就对模型中的所有变量进行一次显著性检验,并从中剔除不显著的变量;逐步引入—剔除—引入,直到模型之外所有变量均不显著时为止。