计量经济学-多重共线性
计量经济学:多重共线性
计量经济学:多重共线性多重共线性52=.53085123 第四章专门讨论古典假定中⽆多重共线性假定被违反的情况,主要内容包括多重共线性的实质和产⽣的原因、多重共线性产⽣的后果、多重共线性的检测⽅法及⽆多重共线性假定违反后的处置⽅法。
第⼀节什么是多重共线性⼀、多重共线性的含义第三章讨论多元线性回归模型的估计时,强调了假定⽆多重共线性,即假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性⽆关。
在计量经济学中所谓的多重共线性(Multi-Collinearity),不仅包括解释变量之间精确的线性关系,还包括解释变量之间近似的线性关系。
从数学意义上去说明多重共线性,就是对于解释变量k X 、、X X 32,如果存在不全为0的数k λλλ,2,1 ,能使得n ,2, ,1i 033221 ==++++ki k i i X X X λλλλ ( 4.1 )则称解释变量k X X X ,,,32 之间存在着完全的多重共线性。
⽤矩阵表⽰,解释变量的数据矩阵为X=213112232223111k k nnkn X X X X X X X X X ??(4.2)当Rank(X )在实际经济问题中,完全的多重共线性并不多见。
常见的情形是解释变量k X X X ,,,32 之间存在不完全的多重共线性。
所谓不完全的多重共线性,是指对于解释变量k X 、、X X 32,存在不全为0的数k λλλ,2,1 ,使得n ,2, ,1i 033221 ==+++++i ki k i i u X X X λλλλ(4.3)其中,i u 为随机变量。
这表明解释变量k X 、、X X 32只是⼀种近似的线性关系。
如果k 个解释变量之间不存在完全或不完全的线性关系,则称⽆多重共线性。
若⽤矩阵4表⽰,这时X 为满秩矩阵,即Rank(X )=k 。
需要强调,解释变量之间不存在线性关系,并⾮不存在⾮线性关系,当解释变量存在⾮线性关系时,并不违反⽆多重共线性假定。
计量经济学第四章多重共线性
R-squared
0.989654
Adjusted R-squared 0.986955 S.E. of regression 1437.448 Sum squared resid 47523916 Log likelihood -256.7013 Durbin-Watson stat 1.654140
4
(二)不完全的多重共线性
实际中,常见的情形是解释变量之间存在不 完全的多重共线性。
对于解释变量 X 2 , X 3, X k,存在不全为0的数
1
,
2
,
,使得
k
1 2X2 3X3 ...k Xk u 0
5
(三)解释变量的关系小节
可能表现为三种情形: r为相关系数 (1) rxixj 0 ,解释变量间毫无线性关系。这时多元
Var(ˆ2 )
9
二、不完全多重共线性产生的后果
1、参数估计值的方差增大
Var( βˆ 2 ) = σ 2
1 x22i (1-
r223 )
=
σ2
1
x22i (1 - r223 )
当 r23增大时,
^
Var( 2)
也增大
10
方差膨胀因子 (Variance Inflation Factor)
17 17
2、交叉相关系数(Cross correlation)
相关系数计算的是两组样本的同期相关程 度,交叉相关则可以表示不同期之间的相关 程度。
Eviews操作: Group窗口的view/cross correlation/输入 滞后期设定/ 输出结果阅读:看是否超出2倍标准差线
18
2倍 标准 差线
1、参数估计值有很大的偶然性。 2、参数显著性检验未通过。 3、经济意义检验未通过。 4、相关系数大。
计量经济学实验报告四---多重共线性
计量经济学实验报告四
[实验名称] 多重共线性
[实验目的] 用Eviews 软件检验模型的多重共线性.
[实验内容] (1)根据表列出的家庭消费支出Y与可支配收入X1和个人财富X2的统计数据,在Eviews软件下,OLS的估计结果为
所以模型为Yˆ=245.52+0.57X1-0.0058X2
(3.53)(0.79)(-0.08)
R2=0.962 F=88.845 D.W.=2.708
由拟合优度知,收入和财富一起解释了消费支出的96%.然而两者的t检验都在5%的显著性水平下是不显著的.不仅如此,财富变量的符号也与经济理论不相符合.但从F的检验值看,对收入与财富的参数同时为零的假设显然是拒绝的.因此,显著的F检验值与不显著t检验值,说明了收入与财富存在较高的相关性,使得无法分辨二者各自对消费的影响.只作消费支出关于收入的一元回归模型.如下
所以模型为Yˆ=244.55+0.509X1
(3.813)(14.24)
R2=0.962 F=202.87 D.W.=2.68
我们将上面模型与之相比,新引入的变量并没有带来拟合优度的显著变化,所以该引入的变量不是一个独立的解释变量.因此应该只作消费支出关于收入或财富的一元回归模型来对二元模型进行修正.。
计量经济学(第四章多重共线性)
06
总结与展望
研究结论总结
多重共线性现象普遍存在于经济数据中,对计量 经济学模型的估计和解释产生了重要影响。
通过使用多种诊断方法,如相关系数矩阵、方差膨 胀因子(VIF)和条件指数(CI),可以有效地识别 多重共线性问题。
在存在多重共线性的情况下,普通最小二乘法 (OLS)估计量虽然仍然是无偏的,但其方差可能 变得很大,导致估计结果不稳定。
主成分分析法的优点
可以消除多重共线性的影响,同 时降低自变量的维度,简化模型。
岭回归法
岭回归法的基本思想
通过在损失函数中加入L2正则化项(即所有自变量的平方和),使得回归系数的估计更加稳定, 从而消除多重共线性的影响。
岭回归法的步骤
首先确定正则化参数λ的值,然后求解包含L2正则化项的损失函数最小化问题,得到岭回归系数的估 计值。
逐步回归法的优点
可以自动选择重要的自变量,同时消除多重共线性的影响。
主成分分析法
主成分分析法的基本思想
通过正交变换将原始自变量转换 为互不相关的主成分,然后选择 少数几个主成分进行回归分析。
主成分分析法的步骤
首先对原始自变量进行标准化处理, 然后计算相关系数矩阵并进行特征值 分解,得到主成分及其对应的特征向 量。最后,选择少数几个主成分作为 新的自变量进行回归分析。
岭回归法的优点
可以有效地处理多重共线性问题,同时避免过拟合现象的发生。此外,岭回归法还可以提供对所 有自变量的系数进行压缩估计的功能,使得模型更加简洁易懂。
05
实证研究与结果分
析
数据来源及预处理
数据来源
本研究采用的数据集来自于公开的统 计数据库,涵盖了多个经济指标和影 响因素的观测值。
数据预处理
计量经济学 第四章 多重共线性-
多重共线性产生的经济背景主要有几种情形:
1. 经济变量之间具有共同变化趋势。 2. 模型中包含滞后变量。 3. 利用截面数据建立模型也可能出现多重共线性。 4. 样本数据自身的原因。
11
Econom
etrics 第二节 多重共线性产生的后果
本节基本内容: ● 完全多重共线性产生的后果 ● 不完全多重共线性产生的后果
说明存在完全的多重共线性。
8
不完全的多重共线性 Econom
etrics
实际中,常见的情形是解释变量之间存在不完
全的多重共线性。
对于解释变量 ,使得
,存在不全为0的数
其中, 为随机变量。这表明解释变量 只是一种近似的线性关系。
9
Econom etrics
回归模型中解释变量的关系
可能表现为三种情形:
(1)
,解释变量间毫无线性关系,变量间相
互正交。这时已不需要作多元回归,每个参数 j都可 以通过Y 对 Xj 的一元回归来估计。
(2)
,解释变量间完全共线性。此时模型参
数将无法确定。
(3)
,解释变量间存在一定程度的线性关
系。实际中常遇到的情形。
10
Econom etrics
二、产生多重共线性的背景
18
Econom etrics
二、方差扩大(膨胀)因子法
统计上可以证明,解释变量 的方差可表示为
的参数估计式
其中的
是变量 的方差扩大因子
(Variance Inflation Factor),即
其中
是多个解释变量辅助回归的可决系数
19
Econom etrics
经验规则
● 方差膨胀因子越大,表明解释变量之间的多重共 性越严重。反过来,方差膨胀因子越接近于1, 多重共线性越弱。
计量经济学第四章 多重共线性
x2i
3 2
x3i
x3i
参数的估计值为:
ˆ2
x32i x2i yi x2i x3i x3i yi
(
x22i )(
x32i ) (
x2i
x 3i
)2
x32i
2
x3i yi x32i 2 2
x32i x32i
x2i x3i x22i
x2i x3i
ˆ1 Y ˆ2 X 2 ˆ3 X 3
ˆ2
x32i x2i yi x2i x3i x3i yi ( x22i )( x32i ) ( x2i x3i )2
ˆ3
x22i x3i yi x2i x3i x2i yi •
(
x22i )(
x32i ) (
x2i
x 3i
)
2
x2i yi x3i yi
x2i x3i x32i
4.2多重共线性的后果
如果X1和X2完全线性相关,则存在非0的λ使得:
1 2 X 2i 3 X 3i 0
则有:
1 2 X 2 3 X 3 0
2 X 2i X 2 3 X3i X3 0
X 2i X3i X 2iYi
X
2 3i
X
3iYi
VAR
COV
(βˆ )
2
(XX)1
2
N X 2i
X 3i
X2i
X
2 2i
X 2i X 3i
计量经济第六章多重共线性
• 2、数据采集的范围有限,或采集 的样本量小于模型的自变量个数。
• 如在罕见疾病的研究过程中,由于病 情罕见、病因又相当复杂,而只能在 少数的患者身上采集大量的变量信息。
3、模型中采用滞后变量
在计量经济模型中,往往需要引入 滞后变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相 关性。
up
三、方差膨胀因子法
• 自变量间的共线性程度越大时,VIF值也随之 增大。所以也可利用方差膨胀因子来检验 多重共线性问题。 • 一般来说,当VIF >10时,表明 涉及的两个 变量存在高度线性相关,模型存在不完全 多重共线性。
P111 【经典实例】
• 计算得到的方差膨胀因子值分别为
VIF1 =10000,VIF2 =10000,VIF3 =9.6525,VIF4 =11.5875
2 2 2 1
同理易得
ˆ ) Var( 2
• EVIEWS遇到完全多重共线性时,会 显示 • Near singular matrix,无法进行估 计
2、不完全多重共线性下的后果
(1)估计量的方差增大 2 2 x 2 ˆ) 由于 Var ( 1 2 x12x2 (x1 x2 )2
• 可以看出,除了 VIF3 10 ,其余的方 差膨胀因子值均大于10,表明模型中 存在较严重的多重共线性问题。
up
第三节 多重共线性的修正 一、改变模型的形式 二、删除自变量 三、减少参数估计量的方差 四、其它方法 习题
up
• 一、改变模型的形式
• (一)变换模型的函数形式
• 例如将线性回归模型转化为对数模 型或者多项式模型。 • (二)改变模型的自变量的形式
计量经济学之多重共线性
计量经济学之多重共线性引言多重共线性是计量经济学中一个重要的概念,在经济学研究中扮演着重要的角色。
在本文中,我们将深入探讨多重共线性的概念、原因和影响,并介绍一些常见的解决方案和应对方法。
什么是多重共线性?多重共线性是指在回归分析中,自变量之间存在高度相关性的情况。
具体来说,多重共线性指的是自变量之间线性相关性较高,可能导致回归分析的结果不准确或难以解释。
多重共线性的原因多重共线性的产生有多种原因,以下是一些常见的原因:1.样本选择偏倚:当样本中存在特定的特征或者数据的选择方式导致一些变量的相关性增强。
2.变量的定义重复:有些变量可能在定义上重复,导致它们之间存在高度相关性。
3.缺少重要变量:当回归模型中存在遗漏的重要变量时,其他变量可能会代替这些遗漏的变量,导致多重共线性。
4.数据测量误差:测量误差也可能导致自变量之间存在高度相关性。
多重共线性的影响多重共线性可能会对回归模型产生一系列的问题和影响:1.估计系数不准确:多重共线性会导致回归系数的估计不准确,使得对自变量的解释变得困难。
2.系数符号相反:多重共线性可能导致估计系数的符号与理论预期相反。
3.误差项的方差增加:多重共线性会导致误差项的方差增加,从而降低了模型的精确度。
4.解释力度减弱:多重共线性会降低模型的解释力度,使得我们难以解释模型的结果。
解决多重共线性的方法针对多重共线性问题,我们可以采取以下方法来解决:1.增大样本量:增大样本量可以降低变量之间的相关性,从而减轻多重共线性的影响。
2.删除相关变量:通过检验变量之间的相关性,删除相关性较高的变量,可以减轻多重共线性的程度。
3.主成分分析:主成分分析是一种降维的方法,可以将相关性较高的变量合并为一个主成分,从而避免了多重共线性的问题。
4.增加惩罚项:在回归模型中增加惩罚项,如岭回归或lasso回归,可以减轻多重共线性的影响。
5.使用时间序列数据:对于存在多重共线性的房地产数据等时间序列数据,可以使用时间序列模型来避免多重共线性的问题。
计量经济学:多重共线性
影响比较大的,略去影响较小的。
元线性回归模型并进行OLS估计,拟合优度最大且接近1时,说明
这个变量与其他所有解释变量间存在共线性。
第三节 多重共线性的检验
辅助回归法中的方差膨胀因子:
对 于 多 元 线 性 回 归 模: 型Yi 0 1 X 1i ... k X ki ui 为 判 断 诸 自 变 量 间 是存 否在 多 重 共 线 性 , 进如 行下 辅 助 回 归 : X ji 0 1 X 1i ... j 1,i X j 1,i j 1,i X j 1,i ... k X ki v i , j 1,2,...,k 若 上 述 辅 助 回 归 的 可系 决数 为 R2 X j的 方 差 膨 胀 因 子 为 : j, 则 定 义 自 变 量 1 VIF j 1 R2 j
第一节 多重共线性的概念
若有c0+c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n。其中: ci不全为0,则称
解释变量间存在完全多重共线性
若存在:c0+c1X1i+c2X2i+…+ckXki≈0 i=1,2,…,n。 其中:ci不全为0,
则称为解释变量间存在近似多重共线性。
完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,
第二节 多重共线性的来源与后果
4、参数估计值不稳定,经济含义不合理
样本观测值稍有变动、增加或减少解释变量等都会使参数估计值发生较大变 化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响。
5、模型的预测功能失效
较大的方差容易使预测区间变大,从而使预测失去意义
注意:只要模型满足经典假设,则在近似多重共线性情况下,OLS估计量仍 然满足无偏性、线性性和有效性。但此时,无偏性并不意味着对某一给定样 本,其参数估计值就等于真实值。有效性也不意味着参数估计量的方差一定 很小。
(整理)计量经济学-参考答案
(整理)计量经济学-参考答案⼀、解释概念:1、多重共线性:是指在多元线性回归模型中,解释变量之间存在的线性关系。
2、SRF:就是样本回归函数。
即是将样本应变量的条件均值表⽰为解释变量的某种函数。
3、解释变量的边际贡献:在回归模型中新加⼊⼀个解释变量所引起的回归平⽅和或者拟合优度的增加值。
4、⼀阶偏相关系数:反映⼀个经济变量与某个经济变量的线性相关程度时,剔除另⼀个变量对它们的影响的真实相关程度的指标。
5、最⼩⽅差准则:在模型参数估计时,应当选择其抽样分布具有最⼩⽅差的估计式,该原则就是最佳性准则,或者称为最⼩⽅差准则。
6、OLS:普通最⼩⼆乘估计。
是利⽤残差平⽅和为最⼩来求解回归模型参数的参数估计⽅法。
7、偏相关系数:反映⼀个经济变量与某个经济变量的线性相关程度时,剔除其它变量(部分或者全部变量)对它们的影响的真实相关程度的指标。
8、WLS:加权最⼩⼆乘法。
是指估计回归⽅程参数时,按照残差平⽅加权求和最⼩的原则进⾏的估计⽅法。
9、U t⾃相关:即回归模型中随机误差项逐项值之间的相关。
即Cov(U t,U s)≠0 t ≠s。
10、⼆阶偏相关系数:反映⼀个经济变量与某个经济变量的线性相关程度时,剔除另两个变量对它们的影响的真实相关程度的指标。
11、技术⽅程式:根据⽣产技术关系建⽴的计量经济模型。
13、零阶偏相关系数:反映⼀个经济变量与某个经济变量的线性相关程度时,不剔除任何变量对它们的影响的相关程度的指标。
也就是简单相关系数。
14、经验加权法:是根据实际经济问题的特点及经验判断,对滞后经济变量赋予⼀定的权数,利⽤这些权数构成各滞后变量的线性组合,以形成新的变量,再⽤最⼩⼆乘法进⾏参数估计的有限分布滞后模型的修正估计⽅法。
15、虚拟变量:在计量经济学中,我们把取值为0和1 的⼈⼯变量称为虚拟变量,⽤字母D表⽰。
(或称为属性变量、双值变量、类型变量、定性变量、⼆元型变量)16、不完全多重共线性:是指在多元线性回归模型中,解释变量之间存在的近似的线性关系。
计量经济学 第3章 多重共线性
剔除P值大的自变量
和前面的回归结果比较,收入弹性增 大了,但是价格弹性的绝对值却下降 了。不过需要注意的是,简化了的模 型的系数估计是有偏的
程序(gretl)
• • • • • • • • • • • open E:\data\data31.xls setobs 1 1962 --time-series ly=log(y) lx1=log(x1) lx2=log(x2) lx3=log(x3) lx4=log(x4) model1 <- ols ly 0 lx1 lx2 lx3 lx4 corr lx1 lx2 lx3 lx4 vif model2 <- ols ly 0 lx1 lx2
程序(EViews)
• • • • • • • • • • • • wfopen E:\data\data31.xls @freq A 1962 genr ly=log(y) genr lx1=log(x1) genr lx2=log(x2) genr lx3=log(x3) genr lx4=log(x4) equation eq1.ls ly c lx1 lx2 lx3 lx4 freeze eq1.results cor lx1 lx2 lx3 lx4 eq1.varinf equation eq2.ls ly c lx1 lx2 freeze eq2.results
第3章 多重共线性
学习目标 案例简介 案例分析 问题探讨与思考 练习
学习目标
• 理解多重共线性定义及存在多重共线性所带来的影响 • 掌握如何辨别模型中是否存在多重共线性现象 • 能够对多重共线性加以处理
案例简介
通过对人均鸡肉消费量和人均实际可支配收入、鸡肉的实际零售价格、猪肉的实际零售价格 及牛肉的实际零售价格之间的关系进行分析,以验证鸡肉的需求价格弹性及相关的交叉弹性 等。
计量经济学 第七章 多重共线性
第七章 多重共线性“多重共线性”一词由R. Frisch 1934年提出,它原指模型的解释变量间存在线性关系。
7.1多重共线性及产生的原因 7.1.1.非多重共线性假定111211212221121111k k T T Tk x x xx xx X x x x ---=如果rk (X 'X ) = rk (X ) < k 或`0X X =称解释变量是完全共线性相关。
在实际经济问题中,完全多重共线性和完全无多重共线性两种极端情况都是极少的,大多数情况是解释变量存在不完全的多重共线性,或者近似的多重共线性,可一表示为:1122110k k x x x u λλλ--++++= 7.1.2.多重共线性的经济解释(1)经济变量在时间上有共同变化的趋势。
如在经济上升时期,收入、消费、就业率等都增长,当经济收缩期,收入、消费、就业率等又都下降。
当这些变量同时进入模型后就会带来多重共线性问题。
0.E+001.E+112.E+113.E+114.E+11808284868890929496980002GDPCONS0.E +001.E +112.E +113.E +114.E +110.0E +005.0E +101.0E +111.5E +112.0E +112.5E +11C O N SG D P o f H o n g K o n g(2)解释变量与其滞后变量同作解释变量。
滞后变量与原因变量在经济意义上没有本质区别,只是时间上的差异,原因变量与解释变量有相关关系,滞后变量也会有相关关系。
(见下图) (3)解释变量之间往往存在密切的关联度。
对同一经济现象的解释变量,往往存在密切的相关关系,如生产函数,资本大,需投入的劳动力也应趆多。
0.E+001.E+112.E+113.E+114.E+11GDP0.E+001.E+112.E+113.E+114.E+110.E+001.E+112.E+113.E+114.E+11GDP(-1)GDP7.2.多重共线性的后果(1) 当 `0X X =,X 为降秩矩阵,则 (X 'X ) -1不存在,βˆ= (X 'X )-1 X 'Y 不可计算。
第七章 多重共线性 《计量经济学》PPT课件
二、不作处理
1.当所有参数估计量都显著或者t值皆远大于2时,对
多重共线性可不作处理。
2.当因变量对所有自变量回归的拟合优度R2值大于缺
任何一个自变量对其余自变量回归的拟合优度值
R
2 j
时,对多重共线性可不作处理。
3.如果样本回归方程仅用于预测的目的,那么只 要存在于给定样本中的共线现象在预测期保持不 变,多重共性就不会影响预测结果,因此多重共 线性可不作处理。 4.如果多重共线性并不严重影响参数估计值,以 至于我们感到不需要改进它时,多重共线性可不 作处理。
则它所对应的解释变量xj与其它解释变量中的一个或 几个之间高度相关,足以引起解释变量之间的多重
共线性。
三、利用缺某一个解释变量的拟合优度检验
设有线性回归模型
y f (x1, x2 ,, xk ,u)
其中共有k个解释变量,其拟合优度为 R2。为检验
多重共线,依次建立缺一个解释变量的回归方程:
y f 1(x2 , x3,, xk) y f 2 (x1, x3 ,, xk) y f j (x1, x2 ,, x j1, x j1,, xk) y f k (x1, x2 ,, xk1)
r12 1
r1k r2k
rk1 rk 2 rkk rk1 rk 2 1
(7.3.6)
其中
rij
xi x j xi2 x2j
(i , j =1,2,…,k) (7.3.7)
因为 rij r ji ,所以,相关系数矩阵(7.3.6)是
对称矩阵。 r jj =1,所以在相关系数矩阵中只须
(7.3.4)
再依次求出相应的拟合优度
R12
,
R22
,,
R
计量经济学多重共线性的分析
检验多重共线性
➢ 检验简单相关系数
进一步选择Covariance Analysis的Correlation,得到变 量之间的偏相关系数矩阵,观察偏相关系数。
可以发现,Y与X1、X2、X3的相关系数都在0.9以上 ,但输出结果中,解释变量X1、X3的回归系数却无 法通过显著性检验。认为解释变量之间存在多重共 线性。
➢ 收集整理实验数据 ➢ 建立线性回归模型 ➢ 检验多重共线性 ➢ 用逐步回归法克服多重共线性
收集整理实验数据
1978年至2011年我国税收收入与国民生产总值情况
(来源于中国统计年鉴)
建立线性回归模型
➢ 用普通最小二乘法估计模型
利用实验数据分别建立Y关于X1、X2、X3的散点图 (SCAT Xi Y)
建立线性回归模型
➢ 用普通最小二乘法估计模型
利用实验数据分别建立Y关于X1、X2、X3的散点图 (SCAT Xi Y)
根据散点图可以看出Y与 X1、X2、X3都呈现正 的线性相关,
建立线性回归模型
➢ 建立一个多元线性回归模型
输出结果,只有X2的系数通过显著性检验, 其他没有通过,而F值很大,通过了显著性 检验,判断模型存在多重共线性。
用逐步回归法克服多重共线性
➢ 找出最简单的回归形式
Y=24023.76+4.1804X1 (5.887) (36.5072) R2=0.977979
D.W.=0.1937
Y=-1592.676+2.6322X2 (-1.1194) (116.4316) R2=0.997792 D.W.=0.6285
用逐步回归法克服多重共线性
➢ 逐步回归
第一步,引入变量X1
用逐步回归法克服多重共线性
计量经济学试题计量经济学中的多重共线性问题与解决方法
计量经济学试题计量经济学中的多重共线性问题与解决方法计量经济学试题-多重共线性问题与解决方法在计量经济学中,多重共线性是一个重要的问题。
它指的是当两个或多个自变量之间存在高度相关性时,会导致模型估计的结果不准确或者不可靠。
多重共线性问题在经济学研究中经常出现,因此探索解决方法是非常必要的。
一、多重共线性问题的原因多重共线性问题通常由于样本中的自变量之间存在强烈的线性相关性而引发。
例如,当一个自变量可以通过其他自变量的线性组合来表示时,就会出现多重共线性问题。
这种情况下,模型估计的结果会变得不稳定,标准误差会变得很大,使得对自变量的解释变得困难。
二、多重共线性问题的影响多重共线性问题对计量经济模型的影响是多方面的。
首先,它会导致模型估计结果的不稳定性。
当自变量之间存在高度相关性时,即使是微小的样本误差也会导致模型估计结果的显著变化。
其次,多重共线性问题会导致标准误差的上升,使得参数的显著性检验变得困难。
最后,多重共线性问题还会导致模型解释力的下降,使得对自变量对因变量的影响进行准确的解释变得困难。
三、解决多重共线性问题的方法1. 删除变量:当发现自变量之间存在高度相关性时,一种解决方法是删除其中一个变量。
如果某个自变量可以用其他变量线性表示,就可以考虑将其删除。
然而,删除变量的过程需要谨慎,以免造成结果的失真。
2. 采用主成分分析:主成分分析是一种常用的处理多重共线性问题的方法。
它通过对自变量进行线性组合,生成新的主成分变量,从而消除原始自变量之间的相关性。
通过采用主成分分析,可以得到一组无关的自变量,从而解决多重共线性问题。
3. 利用岭回归:岭回归是一种通过增加正则化项来减小模型参数估计标准误差的方法。
通过岭回归,可以有效地解决多重共线性问题。
岭回归对相关自变量的系数进行惩罚,从而减小系数估计的方差。
这种方法可以提高模型的准确性和稳定性。
4. 使用其他估计方法:在实际应用中,还可以采用其他估计方法来解决多重共线性问题。
计量经济学基础--多重共线性 ppt课件
PPT课件
2
设 rij 表示解释变量和的线性相关系数,则有:
1)当 rij 0 时,解释变量 X i 和 X j 之间不 存在线性相关性。
2)当 rij 1 时,解释变量 X i 和 X j 之间存 在完全的线性相关性。
3)当0 rij 1 时,解释变量 X i 和 X j 之间存在
PPT课件
20
解:多元线性回归模型的估计结果如下:
PPT课件
21
由回归结果看,X2、X4的系数为负,与我们的预期相反; 此外所有的t值都比较小,这些现象表明,模型中非常可能 存在多重共线性。 计算所有解释变量的相关系数,结果如下:
15
(3)方差膨胀因子法
选定一个解释变量作为被解释变量(比如 X j ),做
其与其余解释变的回归,得到回归的可决系
数
R
2 j
,则可以证明
Xj
对应的OLS估计量X j 的方差
为:
Var(ˆ j )
2
1
x
2 ji
1
R
2 j
2
VIF
x
2 ji
1
其中
VIF
1
R
2 j
为变量
对应的OLS估计量的方差
④OLS估计结果中可决系数 R2 、F检验统计 量的值非常高。
PPT课件
14
(2)相关系数判断法
当某些解释变量之间的相关系数较高时, 我们就有理由相信模型中存在较严重的多重共 线性,相关系数越高,我们推断的理由越充分。 一般来说,当相关系数的值超过0.8时,我们就 可以认为模型中存在多重共线性。
PPT课件
PPT课件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( x, y )
X1
2、综合统计检验法 若 R2,F 均很大,而各t值均偏小,则可以认
为存在多重共线性 3、用 F 检验确定哪些解释变量是多重共线的
对每个解释变量 Xj 作它与其它解释变量的 回归,并计算样本决定系数 R2
若F >Fa(临界值,则认为Xj与X1,…, Xj-1 , Xj+1 ,…, Xk,多重共线显著
二、改变解释变量形式
1、采用相对数量 如对于需求函数
Q = b0 + b1Y + b2P0 + b3P1 + u 商品价格P0 和替代商品价格P1 可能高度线性相 关,可将模型改为如下形式:
Q = a0 + a1Y + a3(P0 /P1) + u
2、采用增量型变量 如对于消费函数
Ct = b0 + b1Yt + b2Yt-1 + u 本期收入Yt 和上期收入Yt-1 可能高度线性相关 ,可将模型改为如下形式:
rank(X)= k + 1
如果此假定不成立,则称解释变量Xi之间存在 多重共线性,至少有一列向量可由其它列向量线性 表示。如
X2 = X1
X2与 X1的相关系数为1,解释变量X2 对因变量Y 的 作用可由X1 完全替代。
二、产生多重共线性的原因
1、经济变量之间的相互依存关系 如替代品价格之间会存在多重共线性
Ct = a0 + a1Yt + a2△Yt + u
△ Yt = Yt Yt-1
3、改变解释变量样本信息 (1)改变样本 (2)增加样本容量
样本容量 n 增加,x2 增大,var(b^1 )的值会
降低,抵消方差增大的影响。
三、利用已知信息进行参数约束修正
如对于 C—D 生产函数的对数形式
lnY = lnA + a lnL+ b lnk + u
2、时间趋势影响 经济繁荣和经济衰退
时间序列样本建立线性模型时,往往存在多重共线。
3、样本资料方面的原因 样本资料推算数据往往存在多重共线性
4、滞后变量的引入 同一变量的前后期之值可能是高度线性相关的
5、虚拟变量设置不合理 6、变量设置过多
多重共性的原因 原因
变量设定: 虚变量设计错误、
滞后变量引入 设置过多变量
)
2
如果 X 1与 X 2存在完全多重共线性, 设 X 1 X 2
得 x1 x2
bˆ1
(
x2
y )(
x
2 2
)
(
x2
y)(
x 22
)
2
(
x
2 2
)(
x
2 2
)
2
(
x
2 2
)
2
0 0
一、完全多重共线性的影响
Y X B U Y X B ˆ
对上述方程两边同乘观察值距阵 X 的转置距阵 X'
(X' Y) (X' X)Bˆ Bˆ (X' X)-1 X' Y
得x1 x2
Var(bˆ1)
u2 ( x22) 2 ( x22)2 2 ( x22)2
当存在多重共线性时,利用OLS 无法估计参数, 即参数估计值是不确定的,且估计值的方差无穷大。
二、不完全多重共线性的影响
1、可以估计参数,但参数估计不稳定 2、参数估计量的方差增大,使参数估计量
的精度降低。不能正确判断各解释变量 对被解释变量的贡献。 3、由于参数估计量的方差和标准差增大,
变量自身存在问题: 总体数据:时间趋势相同、
变量存在内在关系; 样本数据:样本不具代表性
6
第二节 多重共线性的后果
一、完全多重共线性的影响
1、无法估计模型参数
yi = b1 x1+ b2 x2
bˆ1
(
x1 y)( x22 ) ( x2 y )( x1x2 )
(
x12
)(
x
2 2
)
(
x1 x2
• 完全共线性:∣X’X∣=0,(X’X)-1不存在,R23=1; • 例:
1 1 2
X
1
1 1
2 3 4
4
6 8
4 10 20
X ' X 10 30 60 0
20 60 120
2、模型参数估计方差无穷大
Var(bˆ1)
(
( x22) x12)( x22) (
x1x2 )2
u2
如果X1与X2存在完全多重共线性,设X1 X2
回顾:
• 什么函数可以描述产量与其总成本关系 ?
• 如果要计算两个变量之间的弹性应用什 么函数形式?
• 如何计算科技进步贡献率?用什么函数 ?如何计算?
1
第六章 多 重 共 线 性
在实践中,关于线性回归的基本假定不能全部满足, 出现基本假定违背。主要包括:
(1)随机项序列不是同方差,而是异方差的; (2)随机项序列相关,即存在自相关; (3)解释变量与随机项相关; (4)解释变量之间线性相关,存在多重共线性。
多重共线性是对第(4)个基本假定的违反,导致 OLS估计量失去优良性。
第一节 多重共线性的概念 第二节 多重共线性的后果 第三节 多重共线性的检验 第四节 多重共线性的修正方法 第五节 案例
3
第一节 多重共线性的概念
一、多重共线性的定义
多重共线性是指解释变量 Xi 之间存在完全的或 近似的线性关系。在线性模型中,解释变量的 观察值距阵X(包括常数项)其秩等于模型中的解释 变量的个数加一
资金和劳动之间可能高度线性相关,如假定规
模报酬不变,施加约束条件 a + b = 1可将模型改
为如下形式:
ln(Y/K) = lnA + a ln (L /K) + u b = 1 a
四、 逐步回归法
• 逐步回归法分为逐个剔除法与逐个引入法
• “逐步”指的是在使用回归分析方法建立模型时
,一次只能剔除(减少)一个解释变量或者一次只 能引入(增加)一个解释变量。进行一次剔除或引 入称为“一步”,这样逐步的进行下去,直到最 后得到模型达到“最优”——模型中无不显著解 释变量。
4、用 t 检验来找出哪些解释变量是造成多 重共线的原因(对自变量两两回归)
若T >Ta,即Xj与Xi是引起多重共线的原因。
2
第四节 多重共线性的修正方法
一、删除不重要的变量
1、将证实为多重共线性原因的变量删除 2、由实际经济分析确定变量的相对重要性,删除不 太重要的变量 3、变量删除不当,会产生模型设计偏倚
在对参数进行显著性检验性t 检验时,
增大了接受零假设的可能性。 4、若作区间预测也将降低预测的精度。
第三节 多重共线性的检验
1、简单相关系数法
解释变量组的相关矩阵中解释变量间的简单相
关系数的绝对值甚至大于被解释变量与解释变量
之间的简单相关系数的绝对值
cor X1 X2
X3
几何度量
X2
r xiyi xi2 yi2