计量经济学 第七章 多重共线性 PPT
第七章多重共线性精品课件
2i
bk xki ui
进行估计时,将 Xj从模型中排除,并不引起拟合优度 减少许多,那么,这个被排除在模型之外的解释变量 与留在模型中的解释变量多重共线,排除是应当的。
第三节、 多重共线性的的处理
一、剔除引起共线性的解释变量(这是最重要的方法, 保留在模型中变量的经济意义不再仅仅是自身的作用, 也包含了与其共线并被排除变量的作用。)
2
I n)
二、多重共线性的概念
考虑模型中只有两个解释变量的情况,此时 模型可以表示为:
Y b0 b1 X1 b2 X 2 u
若存在不全为0的常数 1 , 2 ,使下列关 系式成立:
1 X1 2 X 2 0
则称自变量 X 1 , X 2 存在完全的线性关系。
此时两者之间的相关系数为1。实际中完全多 重共线的情况并不多见,一般出现不同程度的 近似多重共线,即有以下关系成立:
第七章、多重共线性
本章内容
第一节、 多重共线性的概 念、产生的原因及其后果 第二节 、多重共线性的检 验 第三节、 多重共线性的的 处理 约瑟夫· 斯蒂格利茨 第四节 多重共线性的案例 2001年诺贝尔奖 分析
获得者
第一节、 多重共线性的概念、产生的原因 及其后果 一、单方程计量经济模型回顾 1、模型形式:
ji 0 1
1i
ˆ j 1 x j 1i ˆ j 1 x j 1i ˆ k xki
如果判定系数很大,F检验显著,则Xj可用其他解释变 量的线性组合表出,即 Xj 与其他解释变量多重共线。 应将Xj从解释变量中排除。 (2)或者,在对原模型
y b b x b x
四、多重共线性的影响
1、对于完全共线,由于矩阵逆不存在,所以参数的 OLS估计失效。
计量经济学:多重共线性
影响比较大的,略去影响较小的。
元线性回归模型并进行OLS估计,拟合优度最大且接近1时,说明
这个变量与其他所有解释变量间存在共线性。
第三节 多重共线性的检验
辅助回归法中的方差膨胀因子:
对 于 多 元 线 性 回 归 模: 型Yi 0 1 X 1i ... k X ki ui 为 判 断 诸 自 变 量 间 是存 否在 多 重 共 线 性 , 进如 行下 辅 助 回 归 : X ji 0 1 X 1i ... j 1,i X j 1,i j 1,i X j 1,i ... k X ki v i , j 1,2,...,k 若 上 述 辅 助 回 归 的 可系 决数 为 R2 X j的 方 差 膨 胀 因 子 为 : j, 则 定 义 自 变 量 1 VIF j 1 R2 j
第一节 多重共线性的概念
若有c0+c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n。其中: ci不全为0,则称
解释变量间存在完全多重共线性
若存在:c0+c1X1i+c2X2i+…+ckXki≈0 i=1,2,…,n。 其中:ci不全为0,
则称为解释变量间存在近似多重共线性。
完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,
第二节 多重共线性的来源与后果
4、参数估计值不稳定,经济含义不合理
样本观测值稍有变动、增加或减少解释变量等都会使参数估计值发生较大变 化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响。
5、模型的预测功能失效
较大的方差容易使预测区间变大,从而使预测失去意义
注意:只要模型满足经典假设,则在近似多重共线性情况下,OLS估计量仍 然满足无偏性、线性性和有效性。但此时,无偏性并不意味着对某一给定样 本,其参数估计值就等于真实值。有效性也不意味着参数估计量的方差一定 很小。
第七章多重共线性
-1.535090
0.898788 -1.527089 0.151160 0.101514 -0.036836 -11793.34 0.995015 0.993441 481.5380 4405699. -193.4165 1.873809
0.129778
0.245466 1.206242 0.033759 0.105329 0.018460 3191.096
●可决系数为0.995,校正的可决系数为0.993,模型拟合很 好。模型对财政收入的解释程度高达99.5%。 ●F统计量为632.10,说明0.05水平下回归方程整体上显著。 ◆t 检验结果表明,除了工农业增加值和总人口以外,其 他因素对财政收入的影响均不显著,与预想不符合!
◆农业增加值和建筑业增加值的回归系数是负数,
多重共线性——指解释变量间的线性关系,既包括完全的线性 关系,又包括不完全的线性关系
15
回归模型中解释变量的关系
可能表现为三种情形: (1) rxi x j 0 ,解释变量间毫无线性关系,变量间相
互正交。这时已不需要作多元回归,每个参数j都可 以通过Y 对 Xj 的一元回归来估计。
(2) rxi x j 1 ,解释变量间完全共线性。此时模型参 数将无法确定。 (3) 0<rxi x j < 1 ,解释变量间存在一定程度的线性关 系。实际中常遇到的情形。
分析:
样本回归方程的 R 2 较大,F检验也十分显著 但是所有参数的 t 统计量均小于临界值(不显著) X4、X5的参数为正,而X6的参数为负,如何解释?
为什么也出现这种结果?事不过三,其中必有规律性 12 !
一、多重共线性
本章讨论四个问题:
●多重共线性的实质与产生的原因 ●多重共线性的后果 ●多重共线性的检测(判断)方法
经济计量学第七讲多重共线性PPT资料(正式版)
第四节 多重共线性的侦察(2)
二、侦察多重共线性的规则
(一)R2值高而显著的t比率少
(二)回归元之间有高度的两两相关 Ø它只是充分条件而不是必要条件
(三)检查偏相关 Ø偏相关系数不能保证对多重共线性提供 一 个准确的指南。
第四节 多重共线性的侦察(3)
二、侦察多重共线性的规则 (四)辅助回归 做每个解释变量对其他剩余变量 的回归并计算相应的R2值。其中的每 一个回归都被称为是从属或者辅助回 归。
2
j
j
第五节 多重共线性的补救措施
如果存在不完全的多重共线性,
TOj L(1R2 j)1/VIjF
第五节 多重共线性的补救措施
一、先验信息 二、横截面与时间序列数据并用 三、剔除变量与设定偏误 四、变量代换 五、补充新数据 六、在多项式回归中降低共线性 七、拯救多重共线性的其他方法
谢谢观看
(一)完全多重共线性情形
Y = ^1 + ^2X2 + ^3X3 + ^u
^2
(yx2)(x32) - (yx3)(x2x3)
= (x22)(x32) - (x2x3)2
如果 x3 = x2,
^2
=
(yx2)(2x22) - (yx2)(x2x2) (x22)(2 x22) - 2(x2x2)2
=
0 0
经济计量学第七讲多重 共线性
第七讲 多重共线性
第一节 多重共线性的性质 第二节 出现多重共线性时的估计问题 第三节 多重共线性的后果 第四节 多重共线性的侦察 第五节 多重共线性的补救措施
第一节 多重共线性的性质
一、多重共线性的概念 二、多重共线性的来源
一、多重共线性的概念
Y i 1 2 X 2 i 3 X 3 i k X k i u i
计量经济学ppt课件(完整版)
在进行模型选择与比较时,需要注意避免过拟合和欠拟合问题,以及确保模型的稳定性和可靠性。此外 ,还需要关注模型的异方差性、共线性等问题,以确保模型的准确性和有效性。
04
时间序列分析及应用
时间序列基本概念及性质
01
时间序列定义
按时间顺序排列的一组数据,反映 现象随时间变化的发展过程。
时间序列类型
03
广义线性模型与非线性模型
广义线性模型介绍
定义
广义线性模型是一类用于描述响 应变量与一组预测变量之间关系 的统计模型,其特点在于响应变 量的期望值通过一个连接函数与 预测变量的线性组合相关联。
连接函数
连接函数是广义线性模型中一个 关键组成部分,它将响应变量的 期望值与预测变量的线性组合连 接起来。常见的连接函数包括恒 等连接、对数连接、逆连接等。
模型的统计性质
深入探讨多元线性回归模型的统计性质,包括无偏性、有效性和一致性等,并解释这些 性质在多元回归分析中的重要性。
多重共线性问题
详细讲解多重共线性的概念、产生原因、后果以及诊断和处理方法,如逐步回归、岭回 归等。
回归模型检验与诊断
模型的拟合优度 介绍衡量模型拟合优度的指标, 如可决系数、调整可决系数等, 并解释这些指标在实际应用中的 意义。
微观计量经济学在因果推断和政策评 估方面发挥着重要作用。目前,研究 者们关注于如何运用实验设计、工具 变量、双重差分等方法识别和处理内 生性问题,以更准确地估计因果关系 和评估政策效果。
高维数据处理与机器 学习
随着大数据时代的到来,高维数据处 理成为微观计量经济学面临的新挑战 。目前,研究者们正在探索如何将机 器学习等先进的数据分析技术应用于 微观计量经济学中,以处理高维数据 和挖掘更多的有用信息。
计量经济学 第七章 多重共线性
第七章 多重共线性“多重共线性”一词由R. Frisch 1934年提出,它原指模型的解释变量间存在线性关系。
7.1多重共线性及产生的原因 7.1.1.非多重共线性假定111211212221121111k k T T Tk x x xx xx X x x x ---=如果rk (X 'X ) = rk (X ) < k 或`0X X =称解释变量是完全共线性相关。
在实际经济问题中,完全多重共线性和完全无多重共线性两种极端情况都是极少的,大多数情况是解释变量存在不完全的多重共线性,或者近似的多重共线性,可一表示为:1122110k k x x x u λλλ--++++= 7.1.2.多重共线性的经济解释(1)经济变量在时间上有共同变化的趋势。
如在经济上升时期,收入、消费、就业率等都增长,当经济收缩期,收入、消费、就业率等又都下降。
当这些变量同时进入模型后就会带来多重共线性问题。
0.E+001.E+112.E+113.E+114.E+11808284868890929496980002GDPCONS0.E +001.E +112.E +113.E +114.E +110.0E +005.0E +101.0E +111.5E +112.0E +112.5E +11C O N SG D P o f H o n g K o n g(2)解释变量与其滞后变量同作解释变量。
滞后变量与原因变量在经济意义上没有本质区别,只是时间上的差异,原因变量与解释变量有相关关系,滞后变量也会有相关关系。
(见下图) (3)解释变量之间往往存在密切的关联度。
对同一经济现象的解释变量,往往存在密切的相关关系,如生产函数,资本大,需投入的劳动力也应趆多。
0.E+001.E+112.E+113.E+114.E+11GDP0.E+001.E+112.E+113.E+114.E+110.E+001.E+112.E+113.E+114.E+11GDP(-1)GDP7.2.多重共线性的后果(1) 当 `0X X =,X 为降秩矩阵,则 (X 'X ) -1不存在,βˆ= (X 'X )-1 X 'Y 不可计算。
《多重共线性》课件
诊断方法比较
检验统计量
检验统计量提供量化指标,可以 明确指出多重共线性的程度,但 其依赖于样本数据,稳定性相对
较差。
图形化诊断
图形化诊断直观易理解,但可能存 在主观性,并且难以量化多重共线 性的程度。
综合运用
在实际应用中,应综合运用多种方 法进行多重共线性的诊断,以确保 诊断结果的准确性和可靠性。
Condition Index
Condition Index是诊断多重共线性的另一种统计量,当某些Condition Index值特别 大时,可能存在多重共线性问题。
图形化诊断
散点图
通过绘制自变量间的散点图,可以直 观地观察到是否存在线性关系,从而 初步判断是否存在多重共线性问题。
相关系数矩阵
通过绘制相关系数矩阵,可以观察到 自变量间的相关系数,当某两个自变 量的相关系数接近1或-1时,可能存 在多重共线性问题。
多重共线性的影响
参数估计值不稳定
01
模型中的参数估计值会随着样本的微小变化而发生较大的变化
,导致模型预测的不稳定性。
模型预测精度降低
02
由于参数估计值的不准确,会导致模型的预测精度降低,预测
结果的可信度下降。
模型解释性差
03
由于解释变量之间的高度相关关系,使得模型难以解释各个解
释变量对因变量的影响程度,降低了模型的解释性。
多重共线性PPT课件
目 录
• 多重共线性的定义 • 多重共线性的成因 • 多重共线性的诊断 • 多重共线性的处理 • 案例分析
01
多重共线性的定义
什么是多重共线性
1
共线性是指解释变量之间存在高度相关性的现象 。
2
在多元线性回归模型中,如果解释变量之间存在 高度相关关系,会导致模型估计的参数不准确, 甚至出现完全错误的结论。
计量经济学第7章1 多重共线性7.1 课件
(7.1.2)
则可以说解释变量 X1, X 2,..., X k 之间存在完全的 线性相关关系,即存在完全多重共线性。
从矩阵形式来看,就是 X X 0 ,即
rank(X ) k 1
观测值矩阵是降秩的,表明在矩阵X中至少有一个列
向量可以由其他列向量线性表示。
②不完全多重共线性
指线性回归模型中解释变量间存在不严格的线 性关系,即近似线性关系。 如对于模型(7.1.1)存在不全为零的数,1, 2,, k 使得下式成立:
(3)参数估计量经济含义不合理
如果模型中两个解释变量具有线性相关性, 如 X1和X 2 ,那么它们中的一个变量可以由另一个 变量表征。这时,X1 和X 2 前的参数并不反映各自 与被解释变量之间的结构关系,而是反映它们对 被解释变量的共同影响,所以各自的参数已经失 去了应有的经济含义,结果却是负的。经验告诉 我们,在多元线性回归模型的估计中,如果出现 参数估计量的经济意义明显不可理的情况,应该 首先怀疑是否存在多重共线性。
③差分法
Yt 0 1 X1t 2 X 2t ut
模型中解释变量X1t与X2t间存在多重共线性, X1t与X2t都是 时间序列资料,对于t-1期
Yt1 0 X 1 1,t1 2 X 2,t1 ut1
Yt Yt1 1( X1t X1,t1) 2 ( X 2t X 2,t1) ut ut1
1X1i 2 X 2i ... k X ki ui 0
其中 ui 为随机干扰项,则可以说解释变量 X1, X2,..., Xk 之间存在不完全多重共线性。随机干扰项表明上述 线性关系是一种近似的关系式。
完全多重共线性与完全非线性都是极端情况,一般 说来,统计数据中多个解释变量之间多少都存在一 定程度的相关性,对多重共线性程度强弱的判断和 解决方法是本章讨论的重点。
第七章 多重共线性 《计量经济学》PPT课件
二、不作处理
1.当所有参数估计量都显著或者t值皆远大于2时,对
多重共线性可不作处理。
2.当因变量对所有自变量回归的拟合优度R2值大于缺
任何一个自变量对其余自变量回归的拟合优度值
R
2 j
时,对多重共线性可不作处理。
3.如果样本回归方程仅用于预测的目的,那么只 要存在于给定样本中的共线现象在预测期保持不 变,多重共性就不会影响预测结果,因此多重共 线性可不作处理。 4.如果多重共线性并不严重影响参数估计值,以 至于我们感到不需要改进它时,多重共线性可不 作处理。
则它所对应的解释变量xj与其它解释变量中的一个或 几个之间高度相关,足以引起解释变量之间的多重
共线性。
三、利用缺某一个解释变量的拟合优度检验
设有线性回归模型
y f (x1, x2 ,, xk ,u)
其中共有k个解释变量,其拟合优度为 R2。为检验
多重共线,依次建立缺一个解释变量的回归方程:
y f 1(x2 , x3,, xk) y f 2 (x1, x3 ,, xk) y f j (x1, x2 ,, x j1, x j1,, xk) y f k (x1, x2 ,, xk1)
r12 1
r1k r2k
rk1 rk 2 rkk rk1 rk 2 1
(7.3.6)
其中
rij
xi x j xi2 x2j
(i , j =1,2,…,k) (7.3.7)
因为 rij r ji ,所以,相关系数矩阵(7.3.6)是
对称矩阵。 r jj =1,所以在相关系数矩阵中只须
(7.3.4)
再依次求出相应的拟合优度
R12
,
R22
,,
R
07-多重共线性
LnY = b0 +b1(X1/X2) + b3X3+ut 从而克服了X1与X2的多重共线性。
(第2版第194页) (第3版第166页)
7.5 多重共线性的克服方法
5.6 把数据中心化 把数据中心化有时也是 克服多重共线性的有效方法。 例如多项式回归模型
7.5 多重共线性的克服方法
5.1 直接合并解释变量
当模型中存在多重共线性时,在不失去实际意义的前提下,可以把有关的解释变量 直接合并,从而降低或消除多重共线性。
如果研究的目的是预测全国货运量,那么可以把重工业总产值和轻工业总产值合并 为工业总产值,甚至还可以与农业总产值合并,变为工农业总产值。解释变量变成 了一个,自然消除了多重共线性。
S 22s 2 l2S112 - l2S112
=
S 22s 2 0
从而使 Var( bˆ1 ) 变为无穷大。同理 Var( bˆ2 ) 也变为无穷大。不难推证,以上结论对
多元回归模型也适用。
7.3 多重共线性的后果
2 近似共线性对参数估计的影响 当解释变量间存在 近似共线性时,仍以二元线性回归模型 yt = b0+ b1 xt1 + b2 xt2 + ut
程如下
yˆt = 14.6119 - 5.8515 xt1 + 3.9752 xt2 +5.3225 xt3
(-2.20)
( 2.46) ( 1.98) R2 = 0.87, F= 17.9, T=12, (1975-1986)
三个解释变量 xt1,xt2,xt3 的简单相关系数如下:
第七章 多重共线性 《计量经济学》PPT课件
7.4 对多重共线性现象的侦察
多重共线性表现为解释变量之间具有相关关系,所以用于多重共 线性的检验方法主要是统计方法。
1、相关系数法 (1)对两个解释变量的模型,采用简单相关系数法 求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较
强的多重共线性。经验表明,当r的值大于或等于0.8时,说明存在多 重共线性。
中,至少有一列向量可由其他列向量(不包括第一列)线性表出。如 X2=kX1,则X2对Y的作用可由X1代替。
2
注意:
完全多重共线性的情况在经济学中并不多见,一般出现的是在一 定程度上的共线性,即不完全的多重共线性。
二、不完全多重共线性
如果存在 c1X1i+c2X2i+…+ckXki+vi=0 i=1,2,…,n
当存在不完全多重共线性时,从上面已经知道,参数的OLS估计量方差 较大,其标准误也就较大,从而使得参数估计量的精度较低。
8
3.参数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性,例如 X2= X1 ,这时,X1和
X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它 们对被解释变量的共同影响。1、2已经失去了应有的经济含义,于是经常 表现出似乎反常的现象:例如1本来应该是正的,结果恰是负的。
7.1 多重共线性的概念
1.多重共线性的概念 对于模型
Yi=0+1X1i+2X2i++kXki+i
i=1,2,…,n 其基本假设之一是解释变量是互相独立的。 如果某两个或多个解释变量之间出现了相关性,则称为多重 共线性(Multicollinearity)。
1
一、完全多重共线性
多重共线性PPT文档54页
6、最大的骄傲于最大的自卑都表示心灵的最软弱无力。——斯宾诺莎 7、自知之明是最难得的知识。——西班牙 8、勇气通往天堂,怯懦通往地狱。——塞内加 9、有时候读书是一种巧妙地避开思考的方法。——赫尔普斯 10、阅读一切好书如同和过去最杰出的人谈话。——笛卡儿
多重 。 27、自信是人格的核心。
28、目标的坚定是性格中最必要的力 量泉源 之一, 也是成 功的利 器之一 。没有 它,天 才也会 在矛盾 无定的 迷径中 ,徒劳 无功。- -查士 德斐尔 爵士。 29、困难就是机遇。--温斯顿.丘吉 尔。 30、我奋斗,所以我快乐。--格林斯 潘。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
y = 74.648 + 4.893 x3 (9.0) (8.7) R2 = 0.86, F = 75.4, T = 14, (1974-1987)
y = 108.865 + 5.740 x4 (18.3) (6.8) R2 = 0.80, F = 46.8, T = 14, (1974-1987)
7.3 多重共线性的后果
(1)当 rxi xj =1,X 为降秩矩阵,则(X 'X) -1 不存在, ˆ = (X 'X)-1X'Y 不可计算。
(2)若 rxi xj 1,即使 rxi xj 1, ˆ 仍具有无偏性。
E( ˆ )=E[(X 'X)-1X 'Y]=E[(X 'X)-1X '(X+u)]= + (X 'X)-1X ' E(u) =.
7.6 案例分析(3例)
例7.1:天津市粮食需求模型(1974-1987)
y:粮食销售量(万吨 / 年),x1:市常住人口数(万人), x2:人均收入(元 / 年),x3:肉销售量(万吨 / 年), x4:蛋销售量(万吨 / 年),x5:鱼虾销售量(万吨 / 年)。
180 170 Y
160
150
140
4
一次模拟结果,x1 与 x2 高度相关,x1 与 x3 不相关
因为 r(x1, x2) > 0.96, ˆ1 分布的方差变大(红线)。因为 r(x1, x3) = 0, ˆ1 分布的方差很小(蓝线)。
7.4 多重共线性的检验
(1)初步观察。当模型的拟合优度(R 2)很高,F 值很高,而每个回
归参数估计值的方差 Var(j) 又非常大(即 t 值很低)时,说明
(3)当 rxi xj 1 时,X 'X 接近降秩矩阵,即 X 'X 0, Var( ˆ )= 2 (X 'X)-1 变得很大。所以 ˆ 丧失有效性。 80 Var( ˆ )
以二元线性回归模型, Yt = 0 +1Xt1 + 2Xt2 + ut,为例,60
40
Var ( 1- ( x1x2 ) 2
因此我们关心的不是有无多重共线性,而是多重共线性的程度。 随着共线性程度的加强,对参数估计值的准确性、稳定性带来影响。
7.2 多重共线性的经济解释
(1)经济变量在时间上有共同变化的趋势。如在经济上升时期,收入、消费、就业率 等都增长,当经济收缩期,收入、消费、就业率等又都下降。当这些变量同时进入模型 后就会带来多重共线性问题。
第7章 多重共线性
7.1 非多重共线性假定 7.2 多重共线性的经济解释 7.3 多重共线性的后果 7.4 多重共线性的检验 7.5 多重共线性的克服方法 7.6 案例分析(3 例)
7.1 非多重共线性假定
rk (X 'X ) = rk (X ) = k+1
Y(T1) = X[T (k+1)] [(k+1)1] + u(T1)
5.4 利用解释变量之间的关系
如果解释变量之间存在多重共线性,那么可以利用它们之间的关系,引入附加方程, 从而将单方程模型转化为联立方程模型,克服多重共线性。
5.5 变换模型形式 通过变换模型形式克服多重共线性。例如某产品销量Y取决于其出厂价格X1,市场 价格X2,和市场供应量X3。模型为
LnY = 0 +1X1+ 2X2+ 3X3+ut 通常,X1与X2是高度相关的,如果研究的目的是预测销售量Y,则可以用相对价格 X1/ X2代替X1与X2对销售量Y的影响,
5.2 利用已知信息合并解释变量
通过经济理论及对实际问题的深刻理解,对发生多重共线性的解释变量引入附加条 件从而减弱或消除多重共线性。
比如有二元回归模型 yt = 0+ 1 xt1 + 2 xt2 + ut x1与x2间存在多重共线性。如果能给出1与2的某种关系,2 = 1其中 为常数。
yt = 0+ 1 xt1 + 1 xt2 + ut = 0 + 1 (xt1 + xt2) + ut 令 xt = xt1 + xt2 得yt = 0+ 1 xt + ut
模拟模型:Y = 0.4+1.2 x1+ 0.8 x2 + u,r(x1, x2) > 0.96。红色曲线为模拟1万次结果。
模拟模型:Y = 0.4+1.2 x1+ 0.8 x3 + u,r(x1, x3) = 0。蓝色曲线为模拟1万次结果。
5
B1F1
B1F2
4
3
2
1
0
-2
-1
0
1
2
3
真值1 = 1.2
LnYt = LnKt + LnLt + (1- ) LnCt + ut
整理后,Ln ( Yt Ct
)
=
Ln
Kt
+
Ln
(
Lt Ct
) + ut
变成了一元线性回归模型,自然消除了多重共线性。
7.5 多重共线性的克服方法
5.3 增加样本容量或重新抽取样本
这种方法主要适用于那些由测量误差而引起的多重共线性。当重新抽取样本时,克 服了测量误差,自然也消除了多重共线性。有时,增加样本容量也可以减弱多重共 线性的程度。
①若新变量的引入改进了R2,且回归参数的t检验在统计上也是显著的, 则该变量在模型中予以保留。
②若新变量的引入未能改进R2,且对其他回归参数估计值的t检验也未带 来什么影响,则认为该变量是多余的,应该舍弃。
③若新变量的引入未能改进R2,且显著地影响了其他回归参数估计值的 符号与数值,同时本身的回归参数也通不过t检验,这说明出现了严重的 多重共线性。舍弃该变量。
LnY = 0 +1(X1/X2) + 3X3+ut 从而克服了X1与X2的多重共线性。
7.5 多重共线性的克服方法
5.6 把数据中心化 把数据中心化有时也是克服多重共线性的有效方法。 例如多项式回归模型
yt = 0 +1 xt + 2 xt2 + 3 xt3 + ut
中,变量之间常存在多重共线性。 可以把解释变量先中心化(各自减自己的均值), 然后建立多元回归模型
(2)解释变量与其滞后变量同作解释变量。
4.E+11 3.E+11
GDP
4.E+11
GDP
3.E+11
2.E+11
2.E+11
1.E+11
0.E+00 80 82 84 86 88 90 92 94 96 98 00 02
1.E+11
0.E+00 0.E+00
1.E+11
2.E+11
GDP(-1) 3.E+11 4.E+11
y = -3.497 + 0.125 x1 + 0.074 x2 + 2.678 x3 + 3.453 x4 – 4.491 x5
(-0.1) (2.1)
(1.9)
(2.1)
(1.4)
(-2.0)
R2 = 0.97, F = 52.59, DW = 1.97, t0.05(8) = 2.31, T = 14, (1974-1987)
解释变量不是完全线性相关的或接近完全线性相关的。
xtixtj 1, xtixtj 不近似等于 1。
就模型中解释变量的关系而言,有三种可能。 (1) xtixtj = 0,解释变量间相关系数等于 0。(少见)
(2) xtixtj = 1,解释变量间完全相关。(少见)
(3)0 < xtixtj < 1,解释变量间存在一定程度的线性相关。(常见)
4.E+11 3.E+11
GDP
CONS
4.E+11
GDP of HongKong
3.E+11
2.E+11
2.E+11
1.E+11
1.E+11
0.E+00 80 82 84 86 88 90 92 94 96 98 00 02
0.E+00
CONS
0.0E+ 00 5.0E+ 10 1.0E+ 11 1.5E+ 11 2.0E+ 11 2.5E+ 11
R2 = 0.97,而每个回归参数的 t 检验在统计上都不显著,这说明模型中存 在严重的多重共线性。
7.6 案例分析(3例)
把解释变量换成对数形式建模还是存在多重共线性。
y = -134.248 + 0.013x1 + 33.611Lnx2 + 34.363Lnx3 + 27.280Lnx4 – 34.906Lnx5
解释变量间可能存在多重共线性。
(2)Klein 判别法。计算多重可决系数 R2 及解释变量间的简单相关系 数 rxi xj。若有某个 rxi xj > R2,则 xi,xj 间的多重共线性是有害的。
(3)回归参数估计值的符号不符合经济理论。 (4)增加或减少解释变量个数时,回归参数估计值变化很大。
90 68
X3 10 12 14 16 18 20 22 24
180 170 Y
160
150
140
130