计量经济学多重共线性
计量经济学:多重共线性
计量经济学:多重共线性多重共线性52=.53085123 第四章专门讨论古典假定中⽆多重共线性假定被违反的情况,主要内容包括多重共线性的实质和产⽣的原因、多重共线性产⽣的后果、多重共线性的检测⽅法及⽆多重共线性假定违反后的处置⽅法。
第⼀节什么是多重共线性⼀、多重共线性的含义第三章讨论多元线性回归模型的估计时,强调了假定⽆多重共线性,即假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性⽆关。
在计量经济学中所谓的多重共线性(Multi-Collinearity),不仅包括解释变量之间精确的线性关系,还包括解释变量之间近似的线性关系。
从数学意义上去说明多重共线性,就是对于解释变量k X 、、X X 32,如果存在不全为0的数k λλλ,2,1 ,能使得n ,2, ,1i 033221 ==++++ki k i i X X X λλλλ ( 4.1 )则称解释变量k X X X ,,,32 之间存在着完全的多重共线性。
⽤矩阵表⽰,解释变量的数据矩阵为X=213112232223111k k nnkn X X X X X X X X X ??(4.2)当Rank(X )在实际经济问题中,完全的多重共线性并不多见。
常见的情形是解释变量k X X X ,,,32 之间存在不完全的多重共线性。
所谓不完全的多重共线性,是指对于解释变量k X 、、X X 32,存在不全为0的数k λλλ,2,1 ,使得n ,2, ,1i 033221 ==+++++i ki k i i u X X X λλλλ(4.3)其中,i u 为随机变量。
这表明解释变量k X 、、X X 32只是⼀种近似的线性关系。
如果k 个解释变量之间不存在完全或不完全的线性关系,则称⽆多重共线性。
若⽤矩阵4表⽰,这时X 为满秩矩阵,即Rank(X )=k 。
需要强调,解释变量之间不存在线性关系,并⾮不存在⾮线性关系,当解释变量存在⾮线性关系时,并不违反⽆多重共线性假定。
计量经济学第四章多重共线性
R-squared
0.989654
Adjusted R-squared 0.986955 S.E. of regression 1437.448 Sum squared resid 47523916 Log likelihood -256.7013 Durbin-Watson stat 1.654140
4
(二)不完全的多重共线性
实际中,常见的情形是解释变量之间存在不 完全的多重共线性。
对于解释变量 X 2 , X 3, X k,存在不全为0的数
1
,
2
,
,使得
k
1 2X2 3X3 ...k Xk u 0
5
(三)解释变量的关系小节
可能表现为三种情形: r为相关系数 (1) rxixj 0 ,解释变量间毫无线性关系。这时多元
Var(ˆ2 )
9
二、不完全多重共线性产生的后果
1、参数估计值的方差增大
Var( βˆ 2 ) = σ 2
1 x22i (1-
r223 )
=
σ2
1
x22i (1 - r223 )
当 r23增大时,
^
Var( 2)
也增大
10
方差膨胀因子 (Variance Inflation Factor)
17 17
2、交叉相关系数(Cross correlation)
相关系数计算的是两组样本的同期相关程 度,交叉相关则可以表示不同期之间的相关 程度。
Eviews操作: Group窗口的view/cross correlation/输入 滞后期设定/ 输出结果阅读:看是否超出2倍标准差线
18
2倍 标准 差线
1、参数估计值有很大的偶然性。 2、参数显著性检验未通过。 3、经济意义检验未通过。 4、相关系数大。
计量经济学实验报告四---多重共线性
计量经济学实验报告四
[实验名称] 多重共线性
[实验目的] 用Eviews 软件检验模型的多重共线性.
[实验内容] (1)根据表列出的家庭消费支出Y与可支配收入X1和个人财富X2的统计数据,在Eviews软件下,OLS的估计结果为
所以模型为Yˆ=245.52+0.57X1-0.0058X2
(3.53)(0.79)(-0.08)
R2=0.962 F=88.845 D.W.=2.708
由拟合优度知,收入和财富一起解释了消费支出的96%.然而两者的t检验都在5%的显著性水平下是不显著的.不仅如此,财富变量的符号也与经济理论不相符合.但从F的检验值看,对收入与财富的参数同时为零的假设显然是拒绝的.因此,显著的F检验值与不显著t检验值,说明了收入与财富存在较高的相关性,使得无法分辨二者各自对消费的影响.只作消费支出关于收入的一元回归模型.如下
所以模型为Yˆ=244.55+0.509X1
(3.813)(14.24)
R2=0.962 F=202.87 D.W.=2.68
我们将上面模型与之相比,新引入的变量并没有带来拟合优度的显著变化,所以该引入的变量不是一个独立的解释变量.因此应该只作消费支出关于收入或财富的一元回归模型来对二元模型进行修正.。
计量经济学ch10 多重共线性与微数缺测性
Ch10 多重共线性与微数缺测性10.1 多重共线性对于多元回归模型⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡+⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡n k kn n nk k n u u u X X X X X XX X X Y Y Y M M L M O M M ML L M 212132232221312121111βββ (10.1)(1)完全多重共线性如果变量之间存在精确的线性关系,即存在不全为0 的,,...,1,k i i =λ使得011=++k k X X λλL (10.2)称为完全多重共线性。
含义:一个解释变量与其他的解释变量的线性组合的相关系数为1或-1,可以由其他的解释变量线性表示,该解释变量的变化信息是完全重复的。
后果:完全多重共线性:OLS 估计的方差为无穷大。
(2)非完全多重共线性解释变量之间可以表示为011=+++i ki k i v X X λλL其中:i ν为随机误差项。
含义:一个解释变量与其他的解释变量的线性组合相关,相关系数据对值小于1,其他的解释变量包含了该解释变量的部分变化信息。
例如:假定只有21,λλ不为0,于是有:i i i v X X )/()/(211212λλλλ−−= (10.3)(10.3)表明,X 2不是X 1的一个完全共线性变量,而还取决于随机误差。
后果:非完全多重共线性: 有确定的估计结果,但方差和标准差较大,即估计量精确度较低。
多重共线的来源:1. 数据采集方法。
如对变量的数据采集限制在某个范围;2. 模型或总体受到约束。
如收入和财富对消费的影响;3. 模型设定。
如多项式模型;4. 样本容量较小,采样范围较小;5. 时间趋势。
10.2 完全共线性的估计问题任何估计方法都无法得到参数的确定估计值。
原因:Y X X X ')'(ˆ1−=β(10.4) 12)'()ˆvar(−=X X σβ因为XX X X X X ')'()'(*1=−,其中的分母为0,所以估计的方差为无穷大。
计量经济学(第四章多重共线性)
06
总结与展望
研究结论总结
多重共线性现象普遍存在于经济数据中,对计量 经济学模型的估计和解释产生了重要影响。
通过使用多种诊断方法,如相关系数矩阵、方差膨 胀因子(VIF)和条件指数(CI),可以有效地识别 多重共线性问题。
在存在多重共线性的情况下,普通最小二乘法 (OLS)估计量虽然仍然是无偏的,但其方差可能 变得很大,导致估计结果不稳定。
主成分分析法的优点
可以消除多重共线性的影响,同 时降低自变量的维度,简化模型。
岭回归法
岭回归法的基本思想
通过在损失函数中加入L2正则化项(即所有自变量的平方和),使得回归系数的估计更加稳定, 从而消除多重共线性的影响。
岭回归法的步骤
首先确定正则化参数λ的值,然后求解包含L2正则化项的损失函数最小化问题,得到岭回归系数的估 计值。
逐步回归法的优点
可以自动选择重要的自变量,同时消除多重共线性的影响。
主成分分析法
主成分分析法的基本思想
通过正交变换将原始自变量转换 为互不相关的主成分,然后选择 少数几个主成分进行回归分析。
主成分分析法的步骤
首先对原始自变量进行标准化处理, 然后计算相关系数矩阵并进行特征值 分解,得到主成分及其对应的特征向 量。最后,选择少数几个主成分作为 新的自变量进行回归分析。
岭回归法的优点
可以有效地处理多重共线性问题,同时避免过拟合现象的发生。此外,岭回归法还可以提供对所 有自变量的系数进行压缩估计的功能,使得模型更加简洁易懂。
05
实证研究与结果分
析
数据来源及预处理
数据来源
本研究采用的数据集来自于公开的统 计数据库,涵盖了多个经济指标和影 响因素的观测值。
数据预处理
计量经济学第三节 多重共线性
第三节多重共线性
假定六:解释变量之间不是完全线性相关的。
目的与要求:1.多重共线性的概念?
2.多重共线性产生的主要原因是什么?
3.多重共线性会导致什么后果?
4.多重共线性的检验方法 5.多重共线性的解决方法
一、多重共线性的概念
对于模型 Yi=0+1X1i+2X2i++kXki+i i=1,2,…,n 其基本假设之一是解释变量是互相独立的。 如果某两个或多个解释变量之间出现了完全 的线性相关性或接近线性相关,则称该模型出现 了多重共线性。
如投资函数 :
t
It 0 1X 可以变换成 It X
t / 0
2X
t 1
u
:
/ 1
t
X
t 1
t
/ 2
X
t
u
X
X
(2).进行变换,采用相对量作为解释变量
例如,某产品的销售量Y 取决于其出厂价格X1、
市场价格X2和市场总供应量X3。设定模型为
消选取相关性最强的
变量建立一元回归模型
在一元回归模型中引入第二个变量, 选择要求:模
型中每个解释变量影响显著,参数符号正确,校正的
~ 判定系数值 R 2 有所提高.
在选取的二元回归模型中以同样方式引入第三个变
量……
(四).增加样本观测值。
ln y 0 1 ln x 1 2 ln x 2 3 ln x 3 u
由于X1、X2、X3高度相关,我们可以用X1 /X2代替X1、 X2对y的影响。模型变为:
ln y
/ 0
/ 1
计量经济学习题第6章多重共线性
计量经济学习题第6章多重共线性第6章多重共线性⼀、单项选择题1、当模型存在严重的多重共线性时,OLS估计量将不具备()A、线性B、⽆偏性C、有效性D、⼀致性2、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF()A、⼤于B、⼩于C、⼤于5D、⼩于53、模型中引⼊实际上与解释变量有关的变量,会导致参数的OLS估计量⽅差()A、增⼤B、减⼩C、有偏D、⾮有效4、对于模型y t=b0+b1x1t+b2x2t+u t,与r12=0相⽐,r12=0.5时,估计量的⽅差将是原来的()A、1倍B、1.33倍C、1.8倍D、2倍5、如果⽅差膨胀因⼦VIF=10,则什么问题是严重的()A、异⽅差问题B、序列相关问题C、多重共线性问题D、解释变量与随机项的相关性6、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( )A 异⽅差B 序列相关C 多重共线性D ⾼拟合优度7、存在严重的多重共线性时,参数估计的标准差()A、变⼤B、变⼩C、⽆法估计D、⽆穷⼤8、完全多重共线性时,下列判断不正确的是()A、参数⽆法估计B、只能估计参数的线性组合C、模型的拟合程度不能判断D、可以计算模型的拟合程度⼆、多项选择题1、下列哪些回归分析中很可能出现多重共线性问题()A、资本投⼊与劳动投⼊两个变量同时作为⽣产函数的解释变量B、消费作被解释变量,收⼊作解释变量的消费函数C、本期收⼊和前期收⼊同时作为消费的解释变量的消费函数D、商品价格、地区、消费风俗同时作为解释变量的需求函数E、每亩施肥量、每亩施肥量的平⽅同时作为⼩麦亩产的解释变量的模型2、当模型中解释变量间存在⾼度的多重共线性时()A、各个解释变量对被解释变量的影响将难以精确鉴别B、部分解释变量与随机误差项之间将⾼度相关C、估计量的精度将⼤幅度下降D、估计对于样本容量的变动将⼗分敏感E、模型的随机误差项也将序列相关3、下述统计量可以⽤来检验多重共线性的严重性()A、相关系数B、DW值C、⽅差膨胀因⼦D、特征值E、⾃相关系数4、多重共线性产⽣的原因主要有()A、经济变量之间往往存在同⽅向的变化趋势B、经济变量之间往往存在着密切的关联C、在模型中采⽤滞后变量也容易产⽣多重共线性D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性E、以上都正确5、多重共线性的解决⽅法主要有()A、保留重要的解释变量,去掉次要的或替代的解释变量B、利⽤先验信息改变参数的约束形式C、变换模型的形式D、综合使⽤时序数据与截⾯数据E、逐步回归法以及增加样本容量6、关于多重共线性,判断错误的有()A、解释变量两两不相关,则不存在多重共线性B、所有的t检验都不显著,则说明模型总体是不显著的C、有多重共线性的计量经济模型没有应⽤的意义D、存在严重的多重共线性的模型不能⽤于结构分析7、模型存在完全多重共线性时,下列判断正确的是()A、参数⽆法估计B、只能估计参数的线性组合C、模型的判定系数为0D、模型的判定系数为1三、简述1、什么是多重共线性?产⽣多重共线性的原因是什么?2、什么是完全多重共线性?什么是不完全多重共线性?3、完全多重共线性对OLS估计量的影响有哪些?4、不完全多重共线性对OLS估计量的影响有哪些?5、从哪些症状中可以判断可能存在多重共线性?6、什么是⽅差膨胀因⼦检验法?四、判断(1)如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。
计量经济学第四章 多重共线性
x2i
3 2
x3i
x3i
参数的估计值为:
ˆ2
x32i x2i yi x2i x3i x3i yi
(
x22i )(
x32i ) (
x2i
x 3i
)2
x32i
2
x3i yi x32i 2 2
x32i x32i
x2i x3i x22i
x2i x3i
ˆ1 Y ˆ2 X 2 ˆ3 X 3
ˆ2
x32i x2i yi x2i x3i x3i yi ( x22i )( x32i ) ( x2i x3i )2
ˆ3
x22i x3i yi x2i x3i x2i yi •
(
x22i )(
x32i ) (
x2i
x 3i
)
2
x2i yi x3i yi
x2i x3i x32i
4.2多重共线性的后果
如果X1和X2完全线性相关,则存在非0的λ使得:
1 2 X 2i 3 X 3i 0
则有:
1 2 X 2 3 X 3 0
2 X 2i X 2 3 X3i X3 0
X 2i X3i X 2iYi
X
2 3i
X
3iYi
VAR
COV
(βˆ )
2
(XX)1
2
N X 2i
X 3i
X2i
X
2 2i
X 2i X 3i
计量经济学多重共线性
四、克服多重共线性的方法
如果模型被检验证明存在多重共线性,则需要 发展新的方法估计模型,最常用的方法有三类。 1、第一类方法:排除引起共线性的变量
找出引起多重共线性的解释变量,将它排除出 去。
以逐步回归法得到最广泛的应用。
•
注意:
这时,剩余解释变量参数的经济含义和数值都 发生了变化。
2、第二类方法:差分法
——如果解释变量Xi与其他变量相关,那 么就会减小T统计值。为什么?
图示
存在多重共线性时 参数估计值的方差与标准差变大
容易使通过样本计算的t值小于临界值, 误导作出参数为0的推断
思考:从这个“仪器”(统计量)来看, 我们通过作哪些工作,可以减少线性相 关带来的影响?
我们可以做如下工作: ——想办法使模型更精确。即使得被 解释变量更多的很解释,或说使σ 2的 估计值更小(为何?)。
0 1 0.5 2 例表 0.8 0.9 5 10 方差膨胀因子表 0.95 0.96 0.97 20 25 33 0.98 50 0.99 100 0.999 1000
相关系数平方 方差膨胀因子
此表有何特点?随相关系数 平方增大,方差膨胀因子如 何变化?
四、多重共线性的检验
多重共线性表现为解释变量之间具有相关关系,
截面数据样本:问题不那么严重,但多重共线 性仍然是存在的。
二.多重共线性的后果 1.数据的微小变化可能导致参数估计值的大幅 波动 2.尽管系数具有联合显著性,而且回归的R2相 当高,但系数显著性水平会很低 3.系数有何能出现“错误”的符号或不合理的 大小 4.不会影响参数估计的无偏与一致性,但会影 响有效性。
六、案例——中国粮食生产函数
根据理论和经验分析,影响粮食生产(Y)的 主要因素有: 农业化肥施用量(X1);粮食播种面积(X2) 成灾面积(X3); 农业机械总动力(X4); 农业劳动力(X5) 已知中国粮食生产的相关数据,建立中国粮食 生产函数: Y=0+1 X1 +2 X2 +3 X3 +4 X4 +4 X5 +
计量经济第六章多重共线性
• 2、数据采集的范围有限,或采集 的样本量小于模型的自变量个数。
• 如在罕见疾病的研究过程中,由于病 情罕见、病因又相当复杂,而只能在 少数的患者身上采集大量的变量信息。
3、模型中采用滞后变量
在计量经济模型中,往往需要引入 滞后变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相 关性。
up
三、方差膨胀因子法
• 自变量间的共线性程度越大时,VIF值也随之 增大。所以也可利用方差膨胀因子来检验 多重共线性问题。 • 一般来说,当VIF >10时,表明 涉及的两个 变量存在高度线性相关,模型存在不完全 多重共线性。
P111 【经典实例】
• 计算得到的方差膨胀因子值分别为
VIF1 =10000,VIF2 =10000,VIF3 =9.6525,VIF4 =11.5875
2 2 2 1
同理易得
ˆ ) Var( 2
• EVIEWS遇到完全多重共线性时,会 显示 • Near singular matrix,无法进行估 计
2、不完全多重共线性下的后果
(1)估计量的方差增大 2 2 x 2 ˆ) 由于 Var ( 1 2 x12x2 (x1 x2 )2
• 可以看出,除了 VIF3 10 ,其余的方 差膨胀因子值均大于10,表明模型中 存在较严重的多重共线性问题。
up
第三节 多重共线性的修正 一、改变模型的形式 二、删除自变量 三、减少参数估计量的方差 四、其它方法 习题
up
• 一、改变模型的形式
• (一)变换模型的函数形式
• 例如将线性回归模型转化为对数模 型或者多项式模型。 • (二)改变模型的自变量的形式
计量经济学之多重共线性
计量经济学之多重共线性引言多重共线性是计量经济学中一个重要的概念,在经济学研究中扮演着重要的角色。
在本文中,我们将深入探讨多重共线性的概念、原因和影响,并介绍一些常见的解决方案和应对方法。
什么是多重共线性?多重共线性是指在回归分析中,自变量之间存在高度相关性的情况。
具体来说,多重共线性指的是自变量之间线性相关性较高,可能导致回归分析的结果不准确或难以解释。
多重共线性的原因多重共线性的产生有多种原因,以下是一些常见的原因:1.样本选择偏倚:当样本中存在特定的特征或者数据的选择方式导致一些变量的相关性增强。
2.变量的定义重复:有些变量可能在定义上重复,导致它们之间存在高度相关性。
3.缺少重要变量:当回归模型中存在遗漏的重要变量时,其他变量可能会代替这些遗漏的变量,导致多重共线性。
4.数据测量误差:测量误差也可能导致自变量之间存在高度相关性。
多重共线性的影响多重共线性可能会对回归模型产生一系列的问题和影响:1.估计系数不准确:多重共线性会导致回归系数的估计不准确,使得对自变量的解释变得困难。
2.系数符号相反:多重共线性可能导致估计系数的符号与理论预期相反。
3.误差项的方差增加:多重共线性会导致误差项的方差增加,从而降低了模型的精确度。
4.解释力度减弱:多重共线性会降低模型的解释力度,使得我们难以解释模型的结果。
解决多重共线性的方法针对多重共线性问题,我们可以采取以下方法来解决:1.增大样本量:增大样本量可以降低变量之间的相关性,从而减轻多重共线性的影响。
2.删除相关变量:通过检验变量之间的相关性,删除相关性较高的变量,可以减轻多重共线性的程度。
3.主成分分析:主成分分析是一种降维的方法,可以将相关性较高的变量合并为一个主成分,从而避免了多重共线性的问题。
4.增加惩罚项:在回归模型中增加惩罚项,如岭回归或lasso回归,可以减轻多重共线性的影响。
5.使用时间序列数据:对于存在多重共线性的房地产数据等时间序列数据,可以使用时间序列模型来避免多重共线性的问题。
计量经济学:多重共线性
影响比较大的,略去影响较小的。
元线性回归模型并进行OLS估计,拟合优度最大且接近1时,说明
这个变量与其他所有解释变量间存在共线性。
第三节 多重共线性的检验
辅助回归法中的方差膨胀因子:
对 于 多 元 线 性 回 归 模: 型Yi 0 1 X 1i ... k X ki ui 为 判 断 诸 自 变 量 间 是存 否在 多 重 共 线 性 , 进如 行下 辅 助 回 归 : X ji 0 1 X 1i ... j 1,i X j 1,i j 1,i X j 1,i ... k X ki v i , j 1,2,...,k 若 上 述 辅 助 回 归 的 可系 决数 为 R2 X j的 方 差 膨 胀 因 子 为 : j, 则 定 义 自 变 量 1 VIF j 1 R2 j
第一节 多重共线性的概念
若有c0+c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n。其中: ci不全为0,则称
解释变量间存在完全多重共线性
若存在:c0+c1X1i+c2X2i+…+ckXki≈0 i=1,2,…,n。 其中:ci不全为0,
则称为解释变量间存在近似多重共线性。
完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,
第二节 多重共线性的来源与后果
4、参数估计值不稳定,经济含义不合理
样本观测值稍有变动、增加或减少解释变量等都会使参数估计值发生较大变 化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响。
5、模型的预测功能失效
较大的方差容易使预测区间变大,从而使预测失去意义
注意:只要模型满足经典假设,则在近似多重共线性情况下,OLS估计量仍 然满足无偏性、线性性和有效性。但此时,无偏性并不意味着对某一给定样 本,其参数估计值就等于真实值。有效性也不意味着参数估计量的方差一定 很小。
计量经济学 第3章 多重共线性
剔除P值大的自变量
和前面的回归结果比较,收入弹性增 大了,但是价格弹性的绝对值却下降 了。不过需要注意的是,简化了的模 型的系数估计是有偏的
程序(gretl)
• • • • • • • • • • • open E:\data\data31.xls setobs 1 1962 --time-series ly=log(y) lx1=log(x1) lx2=log(x2) lx3=log(x3) lx4=log(x4) model1 <- ols ly 0 lx1 lx2 lx3 lx4 corr lx1 lx2 lx3 lx4 vif model2 <- ols ly 0 lx1 lx2
程序(EViews)
• • • • • • • • • • • • wfopen E:\data\data31.xls @freq A 1962 genr ly=log(y) genr lx1=log(x1) genr lx2=log(x2) genr lx3=log(x3) genr lx4=log(x4) equation eq1.ls ly c lx1 lx2 lx3 lx4 freeze eq1.results cor lx1 lx2 lx3 lx4 eq1.varinf equation eq2.ls ly c lx1 lx2 freeze eq2.results
第3章 多重共线性
学习目标 案例简介 案例分析 问题探讨与思考 练习
学习目标
• 理解多重共线性定义及存在多重共线性所带来的影响 • 掌握如何辨别模型中是否存在多重共线性现象 • 能够对多重共线性加以处理
案例简介
通过对人均鸡肉消费量和人均实际可支配收入、鸡肉的实际零售价格、猪肉的实际零售价格 及牛肉的实际零售价格之间的关系进行分析,以验证鸡肉的需求价格弹性及相关的交叉弹性 等。
计量经济学 第七章 多重共线性
第七章 多重共线性“多重共线性”一词由R. Frisch 1934年提出,它原指模型的解释变量间存在线性关系。
7.1多重共线性及产生的原因 7.1.1.非多重共线性假定111211212221121111k k T T Tk x x xx xx X x x x ---=如果rk (X 'X ) = rk (X ) < k 或`0X X =称解释变量是完全共线性相关。
在实际经济问题中,完全多重共线性和完全无多重共线性两种极端情况都是极少的,大多数情况是解释变量存在不完全的多重共线性,或者近似的多重共线性,可一表示为:1122110k k x x x u λλλ--++++= 7.1.2.多重共线性的经济解释(1)经济变量在时间上有共同变化的趋势。
如在经济上升时期,收入、消费、就业率等都增长,当经济收缩期,收入、消费、就业率等又都下降。
当这些变量同时进入模型后就会带来多重共线性问题。
0.E+001.E+112.E+113.E+114.E+11808284868890929496980002GDPCONS0.E +001.E +112.E +113.E +114.E +110.0E +005.0E +101.0E +111.5E +112.0E +112.5E +11C O N SG D P o f H o n g K o n g(2)解释变量与其滞后变量同作解释变量。
滞后变量与原因变量在经济意义上没有本质区别,只是时间上的差异,原因变量与解释变量有相关关系,滞后变量也会有相关关系。
(见下图) (3)解释变量之间往往存在密切的关联度。
对同一经济现象的解释变量,往往存在密切的相关关系,如生产函数,资本大,需投入的劳动力也应趆多。
0.E+001.E+112.E+113.E+114.E+11GDP0.E+001.E+112.E+113.E+114.E+110.E+001.E+112.E+113.E+114.E+11GDP(-1)GDP7.2.多重共线性的后果(1) 当 `0X X =,X 为降秩矩阵,则 (X 'X ) -1不存在,βˆ= (X 'X )-1 X 'Y 不可计算。
计量经济学多重共线性的分析
检验多重共线性
➢ 检验简单相关系数
进一步选择Covariance Analysis的Correlation,得到变 量之间的偏相关系数矩阵,观察偏相关系数。
可以发现,Y与X1、X2、X3的相关系数都在0.9以上 ,但输出结果中,解释变量X1、X3的回归系数却无 法通过显著性检验。认为解释变量之间存在多重共 线性。
➢ 收集整理实验数据 ➢ 建立线性回归模型 ➢ 检验多重共线性 ➢ 用逐步回归法克服多重共线性
收集整理实验数据
1978年至2011年我国税收收入与国民生产总值情况
(来源于中国统计年鉴)
建立线性回归模型
➢ 用普通最小二乘法估计模型
利用实验数据分别建立Y关于X1、X2、X3的散点图 (SCAT Xi Y)
建立线性回归模型
➢ 用普通最小二乘法估计模型
利用实验数据分别建立Y关于X1、X2、X3的散点图 (SCAT Xi Y)
根据散点图可以看出Y与 X1、X2、X3都呈现正 的线性相关,
建立线性回归模型
➢ 建立一个多元线性回归模型
输出结果,只有X2的系数通过显著性检验, 其他没有通过,而F值很大,通过了显著性 检验,判断模型存在多重共线性。
用逐步回归法克服多重共线性
➢ 找出最简单的回归形式
Y=24023.76+4.1804X1 (5.887) (36.5072) R2=0.977979
D.W.=0.1937
Y=-1592.676+2.6322X2 (-1.1194) (116.4316) R2=0.997792 D.W.=0.6285
用逐步回归法克服多重共线性
➢ 逐步回归
第一步,引入变量X1
用逐步回归法克服多重共线性
《计量经济学》第四章 多重共线性
σ2
R j 2 = X j 对其余 k − 2 个解释变量进行回归的 R 2 σ2 ˆ 还可写成 var( β j ) = VIF j 2
∑x
j
VIF的倒数被称为容许度(TOL j) 的倒数被称为容许度( 的倒数被称为容许度
TOL j = 1 = 1− Rj2 VIFj
采用普通最小二乘法得到以下估计结果
3
财政收入模型的EViews估计结果 财政收入模型的EViews估计结果 EViews
Variable 农业增加值NZ 农业增加值 工业增加值GZ 工业增加值 建筑业增加值JZZ 建筑业增加值 总人口TPOP 总人口 最终消费CUM 最终消费 受灾面积SZM 受灾面积 截距项 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient -1.535090 0.898788 -1.527089 0.151160 0.101514 -0.036836 -11793.34 0.995015 0.993441 481.5380 4405699. -193.4165 1.873809 Std. Error 0.129778 0.245466 1.206242 0.033759 0.105329 0.018460 3191.096 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) t-Statistic -11.82861 3.661558 -1.265989 4.477646 0.963783 -1.995382 -3.695704 Prob. 0.0000 0.0017 0.2208 0.0003 0.3473 0.0605 0.0015 5897.824 5945.854 15.41665 15.75537 632.0999 0.000000 4
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例:
ˆ 的方差为 以二元回归模型 Y X X 为例, 1 0 1 1 2 2
2 2 x2 i 2 2i
ˆ) Var ( 1
x x
2 1i
( x1i x2i ) 2
2
1
( x1i x2i ) 2
x
2 1i 2 1i 2 2t
x x
4.参数估计量经济意义不合理。
如果模型中两个解释变量X1和X2具有线性相关性,那么它们中的一 个变量就可以由另一个变量表征。这时X1和X2的参数并不反映各自与被
解释变量之间的结构关系,而是反映它们对被解释变量的共同影响,所
以各自的参数已失去了应有的经济意义,于是经常表现出似乎反常的现 象,例如估计结果本来应该是正的,结果却是负的。经验告诉我们,在 多元线性回归模型的估计中,如果出现参数估计值的经济意义明显不合 理的情况,应该首先怀疑是否存在多重共线性。
在近似共线性下,虽然可以由式(5-5)得到参数OLS估计量,但
ˆ ) 2 ( X X )1 Cov( β
由于此时 | X X | 0 ,引起( X X )1 主对角线元素较大,且随着 | X X |
逼近于0而增大。这就使得参数估计量的方差增大,从而不能对总体 参数做出准确推断。
在矩阵表示的线性回归模型
Y = Xβ + μ
完全共线性指矩阵 X的秩 R( X ) k 1 即
| X X | 0
近似共线性意味着
| X X | 0
一般来说,解释变量之间的关系可概括为三种情况: a)情况是完全相关,即解释变量之间的相关系数为1; b)情况是完全不相关,即解释变量之间的相关系数为0; c)情况是不完全相关即解释变量之间的相关系数介于0和1之间。 在建立计量经济学模型中,大量的问题是属于第三种情况。
2
ˆ ) Var (
1
x
2
2 1i
0<r<1,
2
可以看出, |r
|
ˆ )越大,多重共线性使得参数估计量 越大, Var ( 1
1 方差增大,称 1 r 2 为方差膨胀因子。其增大趋势如下表所示。
相关系数平方 方差膨胀因子
0 0.5 0.8 0.9 0.95 0.96 0.97 0.98 0.99 0.999 1 2 5 10 20 25 33 50 100 1000
第五章
◆ 学习目的
多重共线性
了解多重共线性的概念,掌握在建立计量经济学模型时如何 避免发生多重共线性,以及在存在多重共线性情况下,如何正确 建立计量经济学模型。
◆ 基本要求
1)了解多重共线性的概念及多重共线性产生的原因; 2)存在多重共线性对计量经济学模型的危害; 3)掌握多重共线性的检验方法以及修正多重共线性的方法; 4)学会利用EViews软件进行逐步回归分析,建立正确的计量经济学模型。
1.如果解释变量存在完全共线性,则模型的参数 无法估计;
多元回归模型
Y = Xβ + μ
的OLS估计量为
(5-4)
ˆ = (X X)-1 X Y β
如果出现完全共线性,则 ( X X )1 不存在,无法得到参数
(5-5)
β 的估计量。
2.如果解释变量之间存在近似共线性,则参数OLS估计量的方差随 着多重共线程度的提高而增加;
4.在模型参数的估计过程中,样本之间的相关是不可避免的,这是 造成多重共线性的客观原因。
第二节
多重共线性的影响
对存在多重共线性的模型直接用普通最小二乘法估计参数, 就会给模型带来严重的不良后果。 1.如果解释变量存在完全共线性,则模型的参数
无法估计;
2.如果解释变量之间存在近似共线性,则参数OLS估计量的方差随 着多重共线程度的提高而增加; 3.变量的显著性检验和模型的预测功能失去意义; 4.参数估计量经济意义不合理。
第五章
多重共线性
◆ 多重共线性及其产生原因
◆ 多重共线性的影响
◆ 多重共线性的检验 ◆ 多重共线性的修正
第一节
多重共线性及其产生原因
—、多重共线性的概念
指模型解释变量之间存在完全线性或近似线性相关的一类问题。 对模型
Yi 0 1 X1i 2 X 2i
,使得 i
k X ki i
i 1, 2,
,n
(5-1)
如果存在不全为零的
1 X1i 2 X 2i
k X ki 0
(5-2)
成立,则称解释变量之间存在完全共线性(perfect multicollinearity);
第一节
多重共线性及其产生原因
—、多重共线性的概念
指模型解释变量之间存在完全线性或近似线性相关的一类问题。 对模型
需要强调,解释变量之间不存在线性关系,并非不存在非线性 关系,当解释变量之间存在非线性关系时,并不违反无多重共线性假定。
二、产生多重共线性的主要原因
1.经济变量之间的内在联系,是产生多重共线性的根本原因。
2.经济变量在时间上有同方向变动的趋势,这也是造成多重共线 性的重要原因。 3.模型中滞后变量的引入,也是造成解释变量多重共线的原因之一。
当完全共线性时,
r 2 1,ˆ Var 1 Nhomakorabea
3.变量的显著性检验和模型的预测功能失去意义;
存在多重共线性的模型,其参数估计量方差的变大,使得计算的 t 统
计量变小,从而检验接受原假设
H 0 : i 0 的可能性增大,这样会使本来
影响很大的重要因素误判为不显著,结果使模型失去可靠性。其次,由于 参数估计量的方差变大,因而对样本值的反映十分敏感,即当样本观测值 稍有变化时,模型参数就有很大差异,致使模型难以应用。另外,由于参 数估计量的方差增大,使模型的精度大大下降,求出的预测值难以置信。
x
2
2 1i
1 1 r2
(5-6)
其中
r
2
( x1i x2i )2
x x
2 1i
2 2i
r ≤1。 是X1与X2线性相关系数的平方,
2
当X1与X2线性无关时,
当X1与X2 近似共线时,
1 2 ˆ 1)= Var( 2 2 > x 1 r 1i x12i
r 0,
Yi 0 1 X1i 2 X 2i
,使得 i
k X ki i
i 1, 2,
,n
(5-1)
如果存在不全为零的
1 X1i 2 X 2i
k X ki 0
(5-3)
成立,则称解释变量之间存在近似共线性(approximate multicollinearity)。