多重共线性的判断与修正
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多重共线性的判断与修正
一、多重共线性的判断
1. 综合统计检验法
LS Y C X1 X2 对模型进行OLS, 得到参数估计表
(1) 当2,R F 很大,而回归系数的t 检验值小于临界值时,可判定该模型存在多重共线性。
(2) 当完全共线性存在时,模型的OLS 无法进行,Eviews 会提示:矩阵的逆(1()T X X -)不
存在。
2. 简单相关系数检验法
LS Y C X1 X2 对模型进行OLS, 得到参数估计表中的2R .
点击:Quick/Group Statistics/Correlation
在对话框中输入:X1 X2 , 点击OK, 即可得到简单相关系数矩阵
检验:若存在 i j x x r 接近于1, 或 22,i j
x x r R >,则说明,i j x x 之间存在着严重的相关性。
3. 辅助回归法(方差扩大因子法)
设 121112...(1)(1)...j j k Xj X X X j X j Xk V ααααα-+=+++-+++++ (j ) LS Xj X1 X2…Xk 对(j) 进行OLS, 得到参数估计表
检验:若表中 (2,1)F F k n k α>--+, 则可确定存在多重共线性。
或者(方差扩大因子法):计算211j j
VIF R =-, (2j R 为以上方程的可决系数), 若10j VIF ≥, 则可确定存在多重共线性。
4. 逐步回归法
1) 首先计算被解释变量对每个解释变量的回归方程,得到基本回归方程:
LS Y C Xi OLS ,得到基本回归方程(i), i = 1,2,…,k
2) 从这些基本回归方程中选出最合理的方程, 即,2
R 取值最大,且t 检验显著。比方说,0j Y Xj ββ=+
3) 在这个选出的方程中增加新的解释变量, 再进行OLS 分析:
LS Y C Xj Xi ( i= 1,2,…,j-1, j+1,…k)
判断: 如果新加入的解释变量对2
R 改进最大, 且每个系数又是t 统计显著,则保留这个新的解释变量。转4)
如果新加入的解释变量不仅使2R 变小, 且t 统计不显著,以至于使某些系数达到不能
接受的程度,则可断言这个新的解释变量与原来的解释变量之间存在线性相关关系。(不保留这解释变量)转4)
4) LS C Xj Xi Xt (t={1,2,…,k}-{j,i})
……
依次循环下去。经逐步筛选,使得最后留在模型中的解释变量既是重要的,又没有严重的多重共线性。
5. 特征值与病态指数
1)T X X 有多少个特征值近似为零,就有多少个多重线性关系。
2) 病态指数j CI = , j = 1,2,…,k 其中m λ为的最大特征根。
当010CI <<, 没有多重线性关系。当10100CI ≤<则有较强的多重线性关系。当100CI ≥则有严重的多重线性关系。
二、多重共线性的修正
1. 删除不重要的解除变量(p.114)。
2. 增加样本容量(p.114)
3. 模型变换法
1)将变量对数化后,求对数回归模型
原模型 Y = C + C1*X1 + C2*X2 + u
改为: LnY = C + C1*LnX1 + C2*LnX2 + u
GENR LNY=LOG(Y)
GENR LNX1=LOG(X1)
GENR LNX2=LOG(X2)
LS LNY C LNX1 LNX2
2)差分法
对于线性回归模型:
Y i =β0+β1X 1i +β2X 2i +…+βk X ki +μi i =1,2, …,n (I) 令1t t Y Y --,得到
1111(1)222(1)(1)1()()...()t t t t t t k kt k t t t Y Y X X X X X X βββμμ------=-+-++-+- (II)
对(II)进行OLS 分析, 称为一阶差分法。其Eviews 命令为:
GENR DY=Y-Y(-1) 生成DY
GENR DX1=X1-X1(-1) 生成DX1
GENR DX2=X2-X2(-1) 生成DX2
……
GENR DXk=Xk-Xk(-1) 生成DXk
LS DY C DX1 DX2…DXk 对差分后的方程进行最小二乘法
4. 利用非样本先验信息(p.115)
5. 截面数据与时间序列数据相结合使用(p.115)
例如设定的模型为:
123LnY LnP LnI u βββ=+++
一般地,价格P 和收入I 有高度共线性的趋势。如果拥有收入I 的截面数据,可估计收入的
弹性3
β', 令*3Y LnY LnI β'=-,则原模型可写为: *12Y LnP u ββ=++.
6. 变量变换(p.116)
7.逐步回归法(同上面的:4. 逐步回归法4))