第四章第三节 多重共线性的检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三节 多重共线性的检验
在上一节我们看到,如果解释变量之间存在较强 的共线性,对模型的影响是严重的。怎样知道模 型中存在多重共线性呢?
检验多重共线性的方法: 1. 简单相关系数矩阵法 2. 变量显著性与方程显著性的综合判断 3. 辅助回归
一、简单线性相关系数矩阵法
根据简单相关系数公式,计算线性回归模型中k-1
X 6
0.8519 1
X4 0.9632 0.8435
1
X5 0.4569 0.5494 0.5830
1
X6
0.8925 0.9569 0.9248 0.5438
1
从矩阵表中可
以看出
X
2与X
3,X
与
2
X
4,X
2与X
6,X
3与X
,
4
X 3与X 6,X 4与X 6 之 间的相关系数都较 大,说明它们之间 很有可能存在共线 性。
三、辅助回归(很少用)
解释变量之间存在多重共线性可以看作是一个解 释变量对其余解释变量的近似线性表出。
找出这种线性表达式,可以将每个X i 对其余 X 进行回归,得到k-1个回归方程,并逐个计算可决 系数 R2 ,记为 Ri2 ,再根据第三章F统计量与 R2 的关系式:
Fi
(1
Ri2 /(k 2) Ri2 ) /(n k
rkk
由上式,可以判断解释变量之间是否存在共线性。
例如:由第二节关于农业总产值线性回归模型 的例子,我们计算出解释变量农业劳动力 X 2 ,
灌溉面积 X3 ,化肥施用量 X 4 ,户均固定资 产 X5 ,农机动力 X 6 的简单相关系数矩阵为:
X2 X3
X 2 1
X
3
X X
4 5
1)
~
F (k
2,
n
k
1)
(1) 如果 Ri2 接近1, Fi 显著地大于临界值,则 X i 与其余 X 有可能存在共线性。
(2) 如果样本容量大,当 Ri2 接近于1时,可以 有把握地说解释变量之间存在共线性。
个解释变量两两相关的简单相关系数,得到如下简
单相关系数矩阵 A :
X2 X3 X4 Xk
在group栏, 点view/correlations
来自百度文库
X 2 r22 r23 r24 r2k
X3
r32
r33
r34
r3k
X k rk 2
rk 3
rk 4
注意:
(1)计算任意两个解释变量之间的简单相关系数, 实际隐含着其他变量变化的相关影响,因此, 其值的大小并不一定是真实相关程度的反映。
(2)相关系数究竟多大才算是严重的共线性,也无 统一的量化标准,对此只能凭借经验加以判断。
(3)该方法的局限性主要在于相关系数只能测度 两个解释变量之间线性相关的程度,而不能测 度三个或更多解释变量之间的线性相关程度。
二、变量显著性与方程显著性的综合 判断
如果修正可决系数很大,且F值显著地大于给定显 著性水平下的临界值,而变量对应的偏回归系数的 t值不显著,则说明该模型存在共线性。
可决系数值和F值大反映了模型中各解释变量联合 对Y的影响力显著,而t值小于临界值恰好反映了由 于解释变量共线性的作用,使得不能分解出各个解 释变量对Y的独立影响。
在上一节我们看到,如果解释变量之间存在较强 的共线性,对模型的影响是严重的。怎样知道模 型中存在多重共线性呢?
检验多重共线性的方法: 1. 简单相关系数矩阵法 2. 变量显著性与方程显著性的综合判断 3. 辅助回归
一、简单线性相关系数矩阵法
根据简单相关系数公式,计算线性回归模型中k-1
X 6
0.8519 1
X4 0.9632 0.8435
1
X5 0.4569 0.5494 0.5830
1
X6
0.8925 0.9569 0.9248 0.5438
1
从矩阵表中可
以看出
X
2与X
3,X
与
2
X
4,X
2与X
6,X
3与X
,
4
X 3与X 6,X 4与X 6 之 间的相关系数都较 大,说明它们之间 很有可能存在共线 性。
三、辅助回归(很少用)
解释变量之间存在多重共线性可以看作是一个解 释变量对其余解释变量的近似线性表出。
找出这种线性表达式,可以将每个X i 对其余 X 进行回归,得到k-1个回归方程,并逐个计算可决 系数 R2 ,记为 Ri2 ,再根据第三章F统计量与 R2 的关系式:
Fi
(1
Ri2 /(k 2) Ri2 ) /(n k
rkk
由上式,可以判断解释变量之间是否存在共线性。
例如:由第二节关于农业总产值线性回归模型 的例子,我们计算出解释变量农业劳动力 X 2 ,
灌溉面积 X3 ,化肥施用量 X 4 ,户均固定资 产 X5 ,农机动力 X 6 的简单相关系数矩阵为:
X2 X3
X 2 1
X
3
X X
4 5
1)
~
F (k
2,
n
k
1)
(1) 如果 Ri2 接近1, Fi 显著地大于临界值,则 X i 与其余 X 有可能存在共线性。
(2) 如果样本容量大,当 Ri2 接近于1时,可以 有把握地说解释变量之间存在共线性。
个解释变量两两相关的简单相关系数,得到如下简
单相关系数矩阵 A :
X2 X3 X4 Xk
在group栏, 点view/correlations
来自百度文库
X 2 r22 r23 r24 r2k
X3
r32
r33
r34
r3k
X k rk 2
rk 3
rk 4
注意:
(1)计算任意两个解释变量之间的简单相关系数, 实际隐含着其他变量变化的相关影响,因此, 其值的大小并不一定是真实相关程度的反映。
(2)相关系数究竟多大才算是严重的共线性,也无 统一的量化标准,对此只能凭借经验加以判断。
(3)该方法的局限性主要在于相关系数只能测度 两个解释变量之间线性相关的程度,而不能测 度三个或更多解释变量之间的线性相关程度。
二、变量显著性与方程显著性的综合 判断
如果修正可决系数很大,且F值显著地大于给定显 著性水平下的临界值,而变量对应的偏回归系数的 t值不显著,则说明该模型存在共线性。
可决系数值和F值大反映了模型中各解释变量联合 对Y的影响力显著,而t值小于临界值恰好反映了由 于解释变量共线性的作用,使得不能分解出各个解 释变量对Y的独立影响。