最新多重共线性的解决之法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多重共线性的解决之
法
第七章多重共线性
教学目的及要求:
1、重点理解多重共线性在经济现象中的表现及产生的原因和后果
2、掌握检验和处理多重共线性问题的方法
3、学会灵活运用Eviews软件解决多重共线性的实际问题。
第一节多重共线性的产生及后果
一、多重共线性的含义
1、含义
在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,X k中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。
2、类型
多重共线性包含完全多重共线性和不完全多重共线性两种类型。
(1)完全多重共线性
完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。
如对于多元线性回归模型
i ki k i i i X X X Y μββββ+++++= 22110 (7-
1)
存在不全为零的数k λλλ,,,21 ,使得下式成立:
0X X X 2211=+++ki k i i λλλ (7-2)
则可以说解释变量k X ,,X ,X 21 之间存在完全的线性相关关系,即存在完全多重共线性。
从矩阵形式来看,就是0'=X X , 即1)(- (2)不完全多重共线性 不完全多重共线性是指线性回归模型中解释变量间存在不严格的线性关系,即近似线性关系。 如对于多元线性回归模型(7-1)存在不全为零的数k λλλ,,,21 ,使得下式成 立: 0X X X 2211=++++i ki k i i u λλλ (7-3) 其中i u 为随机误差项,则可以说解释变量k X ,,X ,X 21 之间存在不完全多重共线性。随机误差项表明上述线性关系是一种近似的关系式,大体上反映了解释变量间的相关程度。 完全多重共线性与完全非线性都是极端情况,一般说来,统计数据中多个解释变量之间多少都存在一定程度的相关性,对多重共线性程度强弱的判断和解决方法是本章讨论的重点。 二、多重共线性产生的原因 多重共线性在经济现象中具有普遍性,其产生的原因很多,一般较常见的有以下几种情况。 (一)经济变量间具有相同方向的变化趋势 在同一经济发展阶段,一些因素的变化往往同时影响若干经济变量向相同方向变化,从而引起多重共线性。如在经济上升时期,投资、收入、消费、储蓄等经济指标都趋向增长,这些经济变量在引入同一线性回归模型并作为解释变量时,往往存在较严重的多重共线性。 (二)经济变量间存在较密切关系 由于组成经济系统的各要素之间是相互影响相互制约的,因而在数量关系上也会存在一定联系。如耕地面积与施肥量都会对粮食总产量有一定影响,同时,二者本身存在密切关系。 (三)采用滞后变量作为解释变量较易产生多重共线性 一般滞后变量与当期变量在经济意义上关联度比较密切,往往会产生多重共线性。如在研究消费规律时,解释变量因素不但要考虑当期收入,还要考虑以往各期收入,而当期收入与滞后收入间存在多重共线性的可能很大。 (四)数据收集范围过窄,有时会造成变量间存在多重共线性问题。 三、多重共线性产生的后果 由前述可知,多重共线性分完全多重共线性和不完全多重共线性两种情况,两种情况都会对模型进行最小二乘估计都会产生严重后果。 (一)完全多重共线性 产生的后果 以二元线性回归模型为例, i i i i u +++=22110X X Y βββ (7-4) 以离差形式表示,假设其中Y Y i i -=y ,111x X X i i -=,222x X X i i -=, i i X X 21λ=,常数0≠λ,则,i i x x 21λ= ,1β的最小二乘估计量为 () ∑∑∑∑∑∑∑--= 2 2122212211221 ˆi i i i i i i i i i i x x x x y x x x y x x β 00)x ()x (y x x y x x 2 222222222 2222=--=∑∑∑∑∑∑i i i i i i i i λλλλ (7-5) 同理得到: 0ˆ2 =β (7-6) 可见参数估计值1ˆβ和2 ˆβ无法确定。 再考察参数估计量的方差,由前面章节可知: () () 2u 2 2i 1i 22i 2 1i 22i 1 x x x x x ˆvar σβ∑∑∑∑-= (7-7) 将i i 21x x λ=代入上式,则 2 2222222222^ )x ()x (x )1var(∑∑∑-=i i i u λλσβ (7-8) =∞ 说明此种情况下1 ˆβ方差为无穷大。 同理可以证明2 ˆβ的方差在完全共线性下也为无穷大。 以上分析表明,在完全多重共线性条件下,普通最小二乘法估计的参数值不能确定,并且估计值的方差为无穷大。 (二)不完全多重共线性产生的后果 假设上述二元线性回归模型中解释变量i X 1与i X 2的关系为 i i i v X X +=21λ (7-9) 其中i v 为随机项,满足0)(=i v E ,∑=02i i v X ,代入1ˆβ估计表达得: ∑∑∑∑∑∑∑+-++-+=2 2222222222221^ ])x (x [)x ]()x ([)]x (x )[x ()x )](x (y [^ i i i i i i i i i i i i i i i v v v y v λλλλβ = ∑∑2y i i i v v (7-10) 由于∑≠02i v ,因而1ˆβ是可确定估计的,但是其数值依赖i v 的数值,而i v 的数值随样本的变化有较大变化,所以1 ˆβ估计值是很不稳定的。 同理可以证明2 ˆβ也是可估计的,且数值具有不稳定性。 考察估计量的方差: 由(7-1)式可知λ是i X 1、i X 2的相关系数,因此 22 11212222 12 212 x x )x x (r r r i i i i == ∑∑∑λ (7-11) 参数估计量的方差可表达为: ()∑∑∑-∑=2 ) 2x 1x (22x 21x 2 2x 2 ˆvar i i i i i μσβ