线性回归问题与非线性回归分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
部分自变量呈高度相关,也就是说,这些变量被用来解释因 变量时导致所提供的信息出现“重叠”。例如、模型中如果
有多个自变量有共同的上升趋势,它们之间很可能有高度的
相关关系导致共线性。
实际经济问题中的多重共线性
(1)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济 变量(收入、消费、投资、价格)都趋于增长; 衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动 力投入往往出现高度相关情况,大企业二者都大, 小企业都小。
Variance Proportions MOB PMG POP .00 .00 .00 .00 .13 .00 .00 .61 .00 .26 .01 .08 .74 .25 .92
GNP .00 .00 .01 .81 .18
a. Dependent Variable: QMG


从条件指数可以看到,最大的条件数为162.804,说明自变 量间存在严重的共线性。 如果有某几个自变量的方差比例值在某一行同时较大(接 近1),则这几个自变量间就存在共线性。
2.条件指数
m ki , i 0,1, 2, p i
条件指数(condition index)可以用来判断多重共线性是否存在 以及多重共线性的严重程度,通常认为:
0 k 10, 没有多重共线性 10 k 100, 存在较强的多重共线性 k 100,存在严重的多重共线性
3.方差扩大因子法
与特征根法比较,方差扩大因子法可以较准确地说明哪些变量 与其他变量有严重的共线性,严重程度如何


例3.2 承接例3.1,用方差扩大因子法检验 多重共线性检验SPSS 除PMG外,其他变量都与别的变量存在程度不同的 共线性问题,其中MOB的共线性最严重。
Coefficientsa Unstandardized Coefficients B Std. Error 2E+007 3E+007 1.419 .267 -3E+007 5027085 -59.875 198.552 -30540.9 9557.981 Standardized Coefficients Beta 2.484 -.415 -.071 -1.099 Collinearity Statistics Tolerance VIF .005 .180 .018 .008 218.079 5.548 55.074 118.205
例3.1 根据例2.1计算特征值及条件指数 多重共线性检验SPSS
• 打开[Linear Regression: Statistics]子对话框,选择 [Collinearity diagnostics(共线性诊断)],单击[Continue]返 回主对话框并单击[OK]按钮。这样SPSS 便可输出所有检 查多重共线性的指标。
如果某两个或多个解释变量之间出现了相关性, 则称为多重共线性(Multicollinearity)。
如果存在 c1X1i+c2X2i+…+ckXki=0
i =1,2,…,n
其中Baidu Nhomakorabea ci 不全为0,则称为解释变量间存在完全共线性。
多重共线性在实际的多元线性回归分析尤其是涉及经济变里
的模型中很常见。即在决定一个因变量的多个自变量中,有

3.差分法
时间序列数据、线性模型:将原模型 变换为差分模型: Yi =1X1i+2 X2i ++k Xki+ i 可以相对有效地消除原模型中的多 重共线性。
一般讲,增量之间的线性关系远比总量 之间的线性关系弱得多。
例如:
Year 1980 GDP NA CONS 2976
中国GDP与居民消费C的总量与增量数据 CONS/GDP NA ΔGDP NA ΔCONS NA ΔCONS / ΔGDP NA
第3章 线性回归问题与非线性回 归分析
3.1 线性回归的常见问题

3.1.1 多重共线性 3.1.2 异方差性 3.1.3 自相关性
3.1.1 多重共线性 1.概念
对于模型 Yi 0 1 X 1i 2 X 2i k X ki i
i=1,2,…,n 其基本假设之一是解释变量之间不存在完 全共线性。
a Collinearity Diagnostics
Model 1
Dimension 1 2 3 4 5
Eig envalue 4.797 .175 .027 .001 .000
Condition Index 1.000 5.240 13.250 88.903 162.804
(Constant) .00 .00 .01 .08 .92
注意: 剩余解释变量参数的经济含义和数值都发生了变化。

例2.1 删去POP,再进行回归
2.增大样本容量
由于多重共线性是一样本特征,故有可能 在关于同样变量的另一样本中共线性没有第一个 样本那么严重。一般认为:解释变量之间的相关 程度与样本容量成反比,即样本容量越小,相关 程度越高;样本容量越大,相关程度越小。因此, 收集更多观测值,增加样本容量,就可以避免或 减轻多重共线性的危害。 在实践中,当我们所选的变量个数接近样 本容量时,自变量间就容易产生共线性。所以, 我们在运用回归分析研究经济问题时,要尽可能 使样本容量远大于自变量个数。
(2)滞后变量的引入
在经济计量模型中,往往需要引入滞后经济变量来反 映真实的经济关系。 例如,消费=f(当期收入, 前期收入)
显然,两期收入间有较强的线性相关性。
(3)样本资料的限制
由于完全符合理论模型所要求的样本数据较难收集,特 定样本可能存在某种程度的多重共线性 一般经验:
诊断方法

1.一些经验方法
Model 1
t .979 5.315 -5.569 -.302 -3.195
(Constant) MOB PMG POP GNP
Sig . .335 .000 .000 .765 .003
a. Dependent Variable: QMG
克服多重共线性的方法
1.排除引起共线性的变量


找出引起多重共线性的解释变量,将它排除出去, 是最为有效的克服多重共线性问题的方法。
相关文档
最新文档