2019年1计量经济学作业多重共线性p171.doc复习进程

合集下载

计量经济学【多重共线性】

计量经济学【多重共线性】

四、多重共线性的解决方法
(三)逐步回归法( Frisch综合分析法) ◆ 从所有解释变量中间先选择影响最为显著的变量 建立模型,然后再将模型之外的变量逐个引入模型; 每引入一个变量,就对模型中的所有变量进行一次显 著性检验,并从中剔除不显著的变量;逐步引入—— 剔除——引入,直到模型之外所有变量均不显著时为 止。这种消除多重共线性的方法称为逐步回归法,也 称 Frisch 综合分析法。
◆ 根据前页表中的数据,回归结果如下所示:
◆ 回归结果表明,在 5%显著性水平下,收入(GNP) 和价格(CPI) 的系数各自均不是统计显著的。模型 通过 F 检验。我们可以断定上述方程存在严重的多 重共线性。为解决这个问题,我们可以用实际进口 额 (IM/CPI) 对实际收入 (GNP/CPI) 进行回归,得到 如下结果:
根据理论分析,可支配收入应该是服装需求最主要的
影响因素,相关系数检验也表明,可支配收入与服装
需求的相关性最强。所以,以
作为最基
本的模型。
(2) 加入服装价格指数 ,对服装需求 关于 建立二元回归模型:
可以看出,加入 后, 值稍微有所减少,参数估 计值的符号也正确,并没有影响 系数的显著性, 所以在模型中保留 。
如果两个解释变量完全相关,如 回归模型退化为一元线性回归模型
,该二元线性
这时,只能确定综合参数 定 各自的估计值。
的估计值,却无法确
二、多重共线性造成的影响
◆ 注意:除非是完全共线性,多重共线性并不意味 着任何基本假设的违背;因此,即使出现较高程度 的多重共线性,OLS 估计量仍具有线性性等良好的 统计性质。问题在于,即使 OLS 法仍是最好的估计 方法,它却不是“完美的”,尤其是在统计推断上
五、案例分析

多重共线性

多重共线性

解决方法
解决方法
(1)排除引起共线性的变量 找出引起多重共线性的解释变量,将它排除出去,以逐步回归法得到最广泛的应用。 (2)差分法 时间序列数据、线性模型:将原模型变换为差分模型。 (3)减小参数估计量的方差:岭回归法(Ridge Regression)。 (4)简单相关系数检验法
谢谢观看
简介
简介
对线性回归模型 基本假设之一是自变量,之间不存在严格的线性关系。如不然,则会对回归参数估计带来严重影响。为了说 明这一点,首先来计算线性回归模型参数的 LS估计的均方误差。为此。重写线性回归模型的矩阵形式为 其中服从多元正态分布,设计矩阵 X是的,且秩为 p。这时,参数的 LS估计为,而回归系数的 LS估计为。 注意到由此获得的 LS估计是无偏的,于是估计的均方误差为 其中是的特征根。显然,如果至少有一个特征根非常接近于零,则就很大,也就不再是的一个好的估计。由 线性代数的理论知道,若矩阵的某个特质根接近零,就意味着矩阵 X的列向量之间存在近似线性关系。 如果存在一组不全为零的数,使得 则称线性回归模型存在完全共线性;如果还存在随机误差 v,满足,使得 则称线性回归模型存在非完全共线性。 如果线性回归模型存在完全共线性,则回归系数的 LS估计不存在,因此,在线性回归分析中所谈的共线性 主要是非完全共线性,也称为复共线性。判断复共线性及其严重程度的方法主要有特征分析法(analysis of eigenvalue),条件数法 (conditional numbers)和方差扩大因子法(variance inflation factor)。
产生原因
产生原因
主要有3个方面: (1)经济变量相关的共同趋势 (2)滞后变量的引入 (3)样本资料的限制
影响
影响

经济计量学 多重共线性问题

经济计量学 多重共线性问题
逆运算矩阵有较小特征根的情形得到改善
3. 岭回归估计是线性估计量
( ) D 1* ( ~ x ~ x I ) 1 ~ x Y
~
0 ( ) [ l MD*1 ( ~ x ~ x I ) 1 ~ x ]Y
4. 岭回归估计是有偏估计量
~
1 n
~ E ( ) D*1 ( ~ x ~ x I ) 1 ~ x ~ x D*
高度共线性
r ( X X ) r ( X ) k 1
det( X X ) a0a1 ak 0
1 ai
ˆ ) 2Tr ( X X ) 1 2 var( i
OLS估计可能出现与较大方差有关的一类症状:
ˆ ) 可能很大; ˆr( (a)个别 va i
X4=轻工业总产值(亿元) X5=农产品收购价格指数与农村工业品牌价指数比 样本区间:1953-1982
农民消费函数主要回归计算结果
ˆ i
-223.33 0.8129
ˆ) var( i
ti
-3.91 7.93
ˆ) VIF ( i
57.127 0.1025
132.52
0.0039
-0.1478 0.0068 94.62
求解知: z 2
~ x a2
,其中:
a2
是矩阵
~ x ~ x 的属于第二大特征根 2 的单位特征向量;
z 2 z 2 2
z1 0
z (~ ( ~ ~ ~ z1 x a ) x a ) a x 2 1 2 1 x a 2 2 a1 a 2 0
逐一求得全部
k
个组合变量 z1 , z 2 , , z k ,它们具有以下性质:

计量经济学-7多重共线性

计量经济学-7多重共线性

2 2
因此,存在完全共线性时,不能利用OLS估计参数,参数的 方差变为无限大。
计量经济学
2.不完全多重共线性
假定X1,X2 间存在不完全多重共线性, 以离差形式表示为: 其中vi 为随机项。则
x1 x2 vi
ˆ 1
[ yi ( xi 2 vi )]( x i22 ) ( yi xi 2 )[ ( xi 2 vi ) xi 2 ] [ ( xi 2 vi ) 2 ]( x i22 ) [ ( xi 2 vi ) xi 2 ]2
计量经济学
6、无多重共线。设( X i1,X i 2, ,X iP)为 (X 1,X 2, ,X P)的第i个观测值, 1 1 记: X 1 X 11 X 21 X n1 X 12 X 22 X n2 X 1P X 2P X nP
4、OLS估计量对观测值的轻微变化相当敏感。
计量经济学
三、多重共线的检验
1、利用解释变量之间的拟合优度(判定系数)检验法 ①每次以一个解释变量对余下的P-1个解释变量做回归, 即建立P个回归方程: 2 X1 g ( X , X , , X ) R 1 2 3 P 1
X2 g ( ,X 3, ,X P) 2 X1 X P g( ,X 2, ,X P 1) p X1
计量经济学
2、利用先验信息 假定对回归模型:
Yi 0 1 X i1 2 X i 2 ui
已知X1和X2 之间高度共线。根据先验信息,确定β2=2β1, 带入模型后可得:
Yi 0 1 X i1 2 1 X i 2 ui 0 1 ( X i1 2 X i 2 ) ui 设变量Z i ( X i1 2 X i 2 ), 估计方程 Yi 0 1Z i ui ˆ 和 ˆ 2 ˆ。 可得到

计量经济学-第7章(多重共线性)-文档资料

计量经济学-第7章(多重共线性)-文档资料
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著 9
3.参数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性,例如 X2= X1 ,这时,X1和 X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它 们对被解释变量的共同影响。1、2已经失去了应有的经济含义,于是经常 表现出似乎反常的现象:例如1本来应该是正的,结果恰是负的。
存在比较严重的多重共线性,因此仅利用相关系数来判断是否存在多
重共线性,有时不能准确判断多重共线性的严重程度。
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著
14
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著
15
2、辅助回归法 利用模型中每一个解释变量分别以其余解释变量为解释变量进行回归, 并计算相应的拟合优度。 如果某一种回归 X j c 1 X1 2 X 2 ... j 1 X j 1 j 1 X j 1 ... k X k
相关情况,大企业二者都大,小企业都小。
(2)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济 关系。 例如,消费=f(当期收入, 前期收入),显然,两期收入间有较强的 线性相关性。
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著 5
(3)多项式项的引入
如研究企业的成本与产量之间的关系时,往往在成本模型中引
进产量的三次方,即:
Yi 0 1 X1i 2 X12i 3 X13i ui
在这种模型中,解释变量之间可能存在一定程度的多重共线性。
(4)样本资料的限制
由于完全符合理论模型所要求的样本数据较难收集,特定范
围内抽取样本可能存在某种程度的多重共线性。 进一步地讲,如果在实际应用中我们有足够多的样本,解释 变量的多重共线性程度就会大大降低。这就再次说明,多重共线 性本质上是样本问题。

计量经济学 第七章 多重共线性

计量经济学 第七章 多重共线性

ˆ QV ( β 1 ) =
2 &2 σ µ ∑ x2 i
&2 &2 & & x1i ∑ x2 i − ( ∑ x1i x2 i )2 ∑
2 &2 σ µ ∑ x2 i ˆ = 2 = ∞ 同 样, V ( β 2 ) = ∞ &2 &2 λ ( ∑ x2 i )2 − λ 2 ( ∑ x2 i )2
第七章 多重共线性
§7.4 消除多重共线性的方法
三、利用事前信息 事前信息指经济理论或前人研究的成果,其在一定的 条件下可消除多重共线性。 如生产函数Y = ALβ1 K β 2 e ε,其中Y 、L、K 分别表示产出 劳力、资本,变换模型有: ln Y = ln A + β 1 ln L + β 2 ln K + ε L、K 之间可能存在共线性,但有“生产规模报酬不变”假定, Y L ln = β 0 + β 1 ln + ε 故有:β 1 + β 2 = 1,故原方程可转换为: K K 从而消除了多重共线性。
1 2
& & ( ∑ x1 x2 ) 2 ∴R = = r12 & &2 x12 x2 ∑
2 1
第七章 多重共线性
§7.3 多重共线性的检验
三 、利 用缺 某个解 释变 量的 拟合优 度检 验 设有 线性回 归模 型 y = f ( x1,x2,⋅ ⋅ ,xk ),其拟合优度为R 2 ⋅
现依次建立缺一个解释变量 的回归方程: y = f1 ( x1,x2,⋅ ⋅ ,xk ) ⋅ y = f 2 ( x1,x3,⋅ ⋅ ,xk ) ⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ y = f j ( x1,x2,x j −1,⋅ ⋅ ,x j +1 ⋅ ⋅ ⋅ ,xk ) ⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ y = f k ( x1,x2,⋅ ⋅ ,xk −1 ) ⋅

计量经济学(第四章多重共线性)

计量经济学(第四章多重共线性)

06
总结与展望
研究结论总结
多重共线性现象普遍存在于经济数据中,对计量 经济学模型的估计和解释产生了重要影响。
通过使用多种诊断方法,如相关系数矩阵、方差膨 胀因子(VIF)和条件指数(CI),可以有效地识别 多重共线性问题。
在存在多重共线性的情况下,普通最小二乘法 (OLS)估计量虽然仍然是无偏的,但其方差可能 变得很大,导致估计结果不稳定。
主成分分析法的优点
可以消除多重共线性的影响,同 时降低自变量的维度,简化模型。
岭回归法
岭回归法的基本思想
通过在损失函数中加入L2正则化项(即所有自变量的平方和),使得回归系数的估计更加稳定, 从而消除多重共线性的影响。
岭回归法的步骤
首先确定正则化参数λ的值,然后求解包含L2正则化项的损失函数最小化问题,得到岭回归系数的估 计值。
逐步回归法的优点
可以自动选择重要的自变量,同时消除多重共线性的影响。
主成分分析法
主成分分析法的基本思想
通过正交变换将原始自变量转换 为互不相关的主成分,然后选择 少数几个主成分进行回归分析。
主成分分析法的步骤
首先对原始自变量进行标准化处理, 然后计算相关系数矩阵并进行特征值 分解,得到主成分及其对应的特征向 量。最后,选择少数几个主成分作为 新的自变量进行回归分析。
岭回归法的优点
可以有效地处理多重共线性问题,同时避免过拟合现象的发生。此外,岭回归法还可以提供对所 有自变量的系数进行压缩估计的功能,使得模型更加简洁易懂。
05
实证研究与结果分

数据来源及预处理
数据来源
本研究采用的数据集来自于公开的统 计数据库,涵盖了多个经济指标和影 响因素的观测值。
数据预处理

计量经济学第四章 多重共线性

计量经济学第四章 多重共线性

x2i


3 2
x3i

x3i
参数的估计值为:
ˆ2
x32i x2i yi x2i x3i x3i yi
(
x22i )(
x32i ) (
x2i
x 3i
)2
x32i
2
x3i yi x32i 2 2
x32i x32i
x2i x3i x22i
x2i x3i
ˆ1 Y ˆ2 X 2 ˆ3 X 3
ˆ2
x32i x2i yi x2i x3i x3i yi ( x22i )( x32i ) ( x2i x3i )2
ˆ3
x22i x3i yi x2i x3i x2i yi •
(
x22i )(
x32i ) (
x2i
x 3i
)
2
x2i yi x3i yi
x2i x3i x32i
4.2多重共线性的后果
如果X1和X2完全线性相关,则存在非0的λ使得:
1 2 X 2i 3 X 3i 0
则有:
1 2 X 2 3 X 3 0
2 X 2i X 2 3 X3i X3 0
X 2i X3i X 2iYi
X
2 3i

X
3iYi


VAR
COV
(βˆ )


2
(XX)1


2

N X 2i


X 3i
X2i
X
2 2i
X 2i X 3i

计量经济第六章多重共线性

计量经济第六章多重共线性

• 2、数据采集的范围有限,或采集 的样本量小于模型的自变量个数。
• 如在罕见疾病的研究过程中,由于病 情罕见、病因又相当复杂,而只能在 少数的患者身上采集大量的变量信息。
3、模型中采用滞后变量
在计量经济模型中,往往需要引入 滞后变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相 关性。
up
三、方差膨胀因子法
• 自变量间的共线性程度越大时,VIF值也随之 增大。所以也可利用方差膨胀因子来检验 多重共线性问题。 • 一般来说,当VIF >10时,表明 涉及的两个 变量存在高度线性相关,模型存在不完全 多重共线性。
P111 【经典实例】
• 计算得到的方差膨胀因子值分别为
VIF1 =10000,VIF2 =10000,VIF3 =9.6525,VIF4 =11.5875
2 2 2 1
同理易得
ˆ ) Var( 2
• EVIEWS遇到完全多重共线性时,会 显示 • Near singular matrix,无法进行估 计
2、不完全多重共线性下的后果
(1)估计量的方差增大 2 2 x 2 ˆ) 由于 Var ( 1 2 x12x2 (x1 x2 )2
• 可以看出,除了 VIF3 10 ,其余的方 差膨胀因子值均大于10,表明模型中 存在较严重的多重共线性问题。
up
第三节 多重共线性的修正 一、改变模型的形式 二、删除自变量 三、减少参数估计量的方差 四、其它方法 习题
up
• 一、改变模型的形式
• (一)变换模型的函数形式
• 例如将线性回归模型转化为对数模 型或者多项式模型。 • (二)改变模型的自变量的形式

计量经济学之多重共线性

计量经济学之多重共线性

计量经济学之多重共线性引言多重共线性是计量经济学中一个重要的概念,在经济学研究中扮演着重要的角色。

在本文中,我们将深入探讨多重共线性的概念、原因和影响,并介绍一些常见的解决方案和应对方法。

什么是多重共线性?多重共线性是指在回归分析中,自变量之间存在高度相关性的情况。

具体来说,多重共线性指的是自变量之间线性相关性较高,可能导致回归分析的结果不准确或难以解释。

多重共线性的原因多重共线性的产生有多种原因,以下是一些常见的原因:1.样本选择偏倚:当样本中存在特定的特征或者数据的选择方式导致一些变量的相关性增强。

2.变量的定义重复:有些变量可能在定义上重复,导致它们之间存在高度相关性。

3.缺少重要变量:当回归模型中存在遗漏的重要变量时,其他变量可能会代替这些遗漏的变量,导致多重共线性。

4.数据测量误差:测量误差也可能导致自变量之间存在高度相关性。

多重共线性的影响多重共线性可能会对回归模型产生一系列的问题和影响:1.估计系数不准确:多重共线性会导致回归系数的估计不准确,使得对自变量的解释变得困难。

2.系数符号相反:多重共线性可能导致估计系数的符号与理论预期相反。

3.误差项的方差增加:多重共线性会导致误差项的方差增加,从而降低了模型的精确度。

4.解释力度减弱:多重共线性会降低模型的解释力度,使得我们难以解释模型的结果。

解决多重共线性的方法针对多重共线性问题,我们可以采取以下方法来解决:1.增大样本量:增大样本量可以降低变量之间的相关性,从而减轻多重共线性的影响。

2.删除相关变量:通过检验变量之间的相关性,删除相关性较高的变量,可以减轻多重共线性的程度。

3.主成分分析:主成分分析是一种降维的方法,可以将相关性较高的变量合并为一个主成分,从而避免了多重共线性的问题。

4.增加惩罚项:在回归模型中增加惩罚项,如岭回归或lasso回归,可以减轻多重共线性的影响。

5.使用时间序列数据:对于存在多重共线性的房地产数据等时间序列数据,可以使用时间序列模型来避免多重共线性的问题。

经济计量学第七讲多重共线性PPT资料(正式版)

经济计量学第七讲多重共线性PPT资料(正式版)

第四节 多重共线性的侦察(2)
二、侦察多重共线性的规则
(一)R2值高而显著的t比率少
(二)回归元之间有高度的两两相关 Ø它只是充分条件而不是必要条件
(三)检查偏相关 Ø偏相关系数不能保证对多重共线性提供 一 个准确的指南。
第四节 多重共线性的侦察(3)
二、侦察多重共线性的规则 (四)辅助回归 做每个解释变量对其他剩余变量 的回归并计算相应的R2值。其中的每 一个回归都被称为是从属或者辅助回 归。
2
j
j
第五节 多重共线性的补救措施
如果存在不完全的多重共线性,
TOj L(1R2 j)1/VIjF
第五节 多重共线性的补救措施
一、先验信息 二、横截面与时间序列数据并用 三、剔除变量与设定偏误 四、变量代换 五、补充新数据 六、在多项式回归中降低共线性 七、拯救多重共线性的其他方法
谢谢观看
(一)完全多重共线性情形
Y = ^1 + ^2X2 + ^3X3 + ^u
^2
(yx2)(x32) - (yx3)(x2x3)
= (x22)(x32) - (x2x3)2
如果 x3 = x2,
^2
=
(yx2)(2x22) - (yx2)(x2x2) (x22)(2 x22) - 2(x2x2)2
=
0 0
经济计量学第七讲多重 共线性
第七讲 多重共线性
第一节 多重共线性的性质 第二节 出现多重共线性时的估计问题 第三节 多重共线性的后果 第四节 多重共线性的侦察 第五节 多重共线性的补救措施
第一节 多重共线性的性质
一、多重共线性的概念 二、多重共线性的来源
一、多重共线性的概念
Y i 1 2 X 2 i 3 X 3 i k X k i u i

计量经济学多重共线性分析-文档资料

计量经济学多重共线性分析-文档资料

用逐步回归法克服Y与X1、X2、X3间的回归(LS Y C Xi )
用逐步回归法克服多重共线性
找出最简单的回归形式
分别作Y与X1、X2、X3间的回归(LS Y C Xi )
用逐步回归法克服多重共线性
找出最简单的回归形式
分别作Y与X1、X2、X3间的回归(LS Y C Xi )
计量经济学多重共线性分析
计量经济学多重共线性分析
根据1980年至2019年我国国民生产总值与社 会固定资产投资、社会消费品零售总额和建筑 业总产值的关系,建立并检验影响国民生产总
值的函数模型,以掌握掌握多重共线性问题出
现的来源、后果、检验及修正的原理,以及相
关的Eviews操作方法。
实验步骤
收集整理实验数据
检验多重共线性
检验简单相关系数
进一步选择Covariance Analysis的Correlation,得到变 量之间的偏相关系数矩阵,观察偏相关系数。
可以发现,Y与X 1 、X 2 、X 3 的相关系数都在0.9以 上,但输出结果中,解释变量X 1 、 X 3 的回归系数 却无法通过显著性检验。认为解释变量之间存在多 重共线性。
用逐步回归法克服多重共线性
找出最简单的回归形式
Y=24023.76+4.1804X1 (5.887) (36.5072) R2=0.977979 D.W.=0.1937
Y=-1592.676+2.6322X2 (-1.1194) (116.4316) R2=0.997792 D.W.=0.6285 Y=23812.76+1.5479X3 (5.2876) (33.047) R2=0.973264 D.W.=0.2997
用逐步回归法克服多重共线性

计量经济学第五章多重共线性 文档全文预览

计量经济学第五章多重共线性 文档全文预览
1x1i+ 2x2i+ …+ kxki=0
■ 非完全多重共线: 包括变量间交互相关 情形如下:
■ 1x1i+ 2x2i+ …+ kxki+ i =0
二、完全多重共线的估计问题
■ 以二元回归为例: yi=β1+β2x2i+β3ix3i+μi
■ 设:x3i= x2i ( r23= 1) 代入上式: ■ ∴如果出现完全多重共线 , 则偏回归系数是不确定的 , 其标 准误是无穷大。

∴估计精度较低

称为方差膨胀因子
■ VIF表明: 估计量的方差由于多重共线的出现而膨胀起来。
■ 当r23=0.7时 ,VIF= 1.96 ■ 当r23=0.9时 ,VIF=5.76 ■ 当r23=0.95时 ,VIF= 10.26
即: 即:
是r23为零时的5.76倍。 是无共线时的10倍。
三、多重共线的实际后果
第五章 多重共线性
■ 多重共线性的性质 ■ 多重共线性时的估计问题 ■ 多重共线性的实际后果 ■ 多重共线性产生的原因 ■ 多重共线性的识别 ■ 多重共线性的克服
一、多重共线性的性质
■ 完全多重共线: 对解释变量x1, x2, … xk, 如果存在一组不全为0的常数 1 、 2 、… kபைடு நூலகம்,使得:
六、多重共线的克服
4. 补充新数据: 以二元回归为例
当r23给定时 ,增加新样本 ,通常可以使
增大,
从而减少 的方差 ,使我们能更准确地估计 2。
习题:
■ 现有美国70-83年进口(百万美元) 、GNP (10亿美元)和消费者价格指数(CPI)数据。
请考虑一下模型 :

计量经济学试题计量经济学中的多重共线性问题与解决方法

计量经济学试题计量经济学中的多重共线性问题与解决方法

计量经济学试题计量经济学中的多重共线性问题与解决方法计量经济学试题-多重共线性问题与解决方法在计量经济学中,多重共线性是一个重要的问题。

它指的是当两个或多个自变量之间存在高度相关性时,会导致模型估计的结果不准确或者不可靠。

多重共线性问题在经济学研究中经常出现,因此探索解决方法是非常必要的。

一、多重共线性问题的原因多重共线性问题通常由于样本中的自变量之间存在强烈的线性相关性而引发。

例如,当一个自变量可以通过其他自变量的线性组合来表示时,就会出现多重共线性问题。

这种情况下,模型估计的结果会变得不稳定,标准误差会变得很大,使得对自变量的解释变得困难。

二、多重共线性问题的影响多重共线性问题对计量经济模型的影响是多方面的。

首先,它会导致模型估计结果的不稳定性。

当自变量之间存在高度相关性时,即使是微小的样本误差也会导致模型估计结果的显著变化。

其次,多重共线性问题会导致标准误差的上升,使得参数的显著性检验变得困难。

最后,多重共线性问题还会导致模型解释力的下降,使得对自变量对因变量的影响进行准确的解释变得困难。

三、解决多重共线性问题的方法1. 删除变量:当发现自变量之间存在高度相关性时,一种解决方法是删除其中一个变量。

如果某个自变量可以用其他变量线性表示,就可以考虑将其删除。

然而,删除变量的过程需要谨慎,以免造成结果的失真。

2. 采用主成分分析:主成分分析是一种常用的处理多重共线性问题的方法。

它通过对自变量进行线性组合,生成新的主成分变量,从而消除原始自变量之间的相关性。

通过采用主成分分析,可以得到一组无关的自变量,从而解决多重共线性问题。

3. 利用岭回归:岭回归是一种通过增加正则化项来减小模型参数估计标准误差的方法。

通过岭回归,可以有效地解决多重共线性问题。

岭回归对相关自变量的系数进行惩罚,从而减小系数估计的方差。

这种方法可以提高模型的准确性和稳定性。

4. 使用其他估计方法:在实际应用中,还可以采用其他估计方法来解决多重共线性问题。

2019年1计量经济学作业多重共线性p171.doc

2019年1计量经济学作业多重共线性p171.doc

计量经济学作业——多重共线性P1718.下表是被解释变量Y,解释变量X1,X2,X3,X4的时间序列观测值:时间序列观测值表序号3 6.5 47.5 5.2 108 864 7.1 49.2 6.8 100 1005 7.2 52.3 7.3 99 1076 7.6 58.0 8.7 99 1117 8.0 61.3 10.2 101 1148 9.0 62.3 14.1 97 1169 9.0 64.7 17.1 93 11910 9.3 66.8 21.3 102 121(1)采用适当的方法检验多重共线性。

(2)多重共线性对参数估计值有何影响?(3)用Frisch法确定一个较好的回归模型。

解:(1)采用参数估计值的统计检验法检验多重共线性。

用OLS最小二乘法,估计被解释变量Y与解释变量X1,X2,X3,X4的样本方程,如下所示:图1-1 在Eviews中建立样本回归模型图1-2 样本回归模型数据表输入被解释变量与解释变量:图1-3 整体样本回归模型建立用最小二乘法求得结果如下所示:图1-4 Eviews的结果分析一元线性样本回归方程为:1.拟合优度检验由上表可知,样本可决系数为:R-squared=0.978915修正样本可决系数为:Adjusted-squared=0.962046即计算结果表明,估计的样本回归方程较好的拟合了样本观测值。

2.F检验提出检验的原假设为对立假设为由图1-4,得F统计量为F-statistic=58.03254对于给定的显著性水平α=0.05,查出分子自由度为4,分母自由度为5的F分布上侧分位数F0.05(4,5)=5.19。

因为F=58.03254>5.19,所以否定H0,总体回归方程显著。

3.t检验提出检验的原假设为由上表可知,t统计量为β0的t-statistic=1.975329β1的t-statistic=1.149646β2的t-statistic=2.401806β3的t-statistic=-0.662938β4的t-statistic=0.472622对于给定的显著性水平α=0.05,查出自由度v=5的t分布双侧分位数t0.05/2(5)=2.57。

计量经济学:多重共线性

计量经济学:多重共线性

计量经济学:多重共线性12第四、五、六章将讨论的主题。

农业和建筑业的发展会减少财政收入吗?国家财政收入主要来自各项税收收入,经济增长是其重要的影响因素。

为了分析各主要因素对国家财政收入的影响,建立财政收入(亿元) (CS)为被解释变量,农业增加值(亿元)(NZ)、工业增加值(亿元)(GZ)、建筑业增加值(亿元)(JZZ)、总人口(万人)(TPOP)、最终消费(亿元)(CUM)、受灾面积(万公顷)(SZM)等为解释变量的计量模型。

数据样本时期为1978年-2003年共26个年份的统计数据(资料来源:《中国统计年鉴2004》,中国统计出版社2004年版)设定的理论模型为:i i i i i i i i u SZM CUM TPOP JZZ GZ NZ CS +++++++=6543210βββββββ采用普通最小二乘法得到以下估计结果关于财政收入的多元回归结果 Variable Coefficient Std. Error t-Statistic Prob. 农业增加值 -1.535090 0.129778 -11.82861 0.0000 工业增加值 0.898788 0.245466 3.661558 0.0017 建筑业增加值-1.527089 1.206242 -1.2659890.2208 总人口 0.151160 0.033759 4.477646 0.0003 最终消费 0.101514 0.1053290.9637830.3473 受灾面积 -0.036836 0.018460 -1.995382 0.0605 截距项-11793.343191.096 -3.6957040.0015R-squared0.995015 Mean dependent var 5897.824 Adjusted R-squared 0.993441 S.D. dependent var 5945.854 S.E. of regression 481.5380 Akaike infocriterion15.41665Sum squared resid 4405699. Schwarz criterion 15.75537 Log likelihood -193.4165 F-statistic 632.0999 Durbin-Watson stat1.873809 Prob(F-statistic)0.000000 从主要指标分析可见,可决系数为0.995,校正的可决系数为0.993,模型拟合很好。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2019年1计量经济学作业多重共线性
p171.d o c
计量经济学作业
——多重共线性P171
8.下表是被解释变量Y,解释变量X1,X2,X3,X4的时间序列观测值:
时间序列观测值表
3 6.5 47.5 5.2 108 86
4 7.1 49.2 6.8 100 100
5 7.2 52.3 7.3 99 107
6 7.6 58.0 8.
7 99 111
7 8.0 61.3 10.2 101 114
8 9.0 62.3 14.1 97 116
9 9.0 64.7 17.1 93 119
10 9.3 66.8 21.3 102 121
(1)采用适当的方法检验多重共线性。

(2)多重共线性对参数估计值有何影响?
(3)用Frisch法确定一个较好的回归模型。

解:(1)采用参数估计值的统计检验法检验多重共线性。

用OLS最小二乘法,估计被解释变量Y与解释变量X1,X2,X3,X4的样本方程,如下所示:
图1-1 在Eviews中建立样本回归模型
图1-2 样本回归模型数据表
输入被解释变量与解释变量:
图1-3 整体样本回归模型建立
用最小二乘法求得结果如下所示:
图1-4 Eviews的结果分析一元线性样本回归方程为:
1.拟合优度检验
由上表可知,样本可决系数为:
R-squared=0.978915
修正样本可决系数为:
Adjusted-squared=0.962046

计算结果表明,估计的样本回归方程较好的拟合了样本观测值。

2.F检验
提出检验的原假设为
对立假设为
由图1-4,得F统计量为
F-statistic=58.03254
对于给定的显著性水平α=0.05,查出分子自由度为4,分母自由度为5的F分布上侧分位数F0.05(4,5)=5.19。

因为
F=58.03254>5.19,所以否定H0,总体回归方程显著。

3.t检验
提出检验的原假设为
由上表可知,t统计量为
β0的t-statistic=1.975329
β1的t-statistic=1.149646
β2的t-statistic=2.401806
β3的t-statistic=-0.662938
β4的t-statistic=0.472622
对于给定的显著性水平α=0.05,查出自由度v=5的t分布双侧分位数t0.05/2(5)=2.57。

t0=1.975329<2.57= t0.05/2(5),所以否定H1,β0显著等于0。

t1=1.149646<2.57=t0.05/2(5),所以否定H1,β1显著等于0。

t2=2.401806<2.57= t0.05/2(5),所以否定H1,β0显著等于0。

|t3|=0.662938<2.57= t0.05/2(5),所以否定H1,β0显著等于0。

t4=0.472622<2.57= t0.05/2(5),所以否定H1,β0显著等于0。

该模型的拟合优度较大,总体线性关系显著,但回归系数在统计上均不显著,即t检验绝对值过小,说明模型存在多重共线性。

(2)多重共线性对参数估计值的影响
多元线性回归模型中如果存在完全的多重共线性,则参数的最小二乘估计量是不确定的,其标准差为无穷大;如果存在近似的多重共线性,则参数的最小二乘估计量是确定的,而且具有无偏性,但其方差较大,常导致参数估计值不精确,不稳定,样本观测值稍有变动,增加或减少的解释变量等都会使参数估计值发生较大变化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响,参数估计量的标准差较大,使参数t假烟增加了接受零假设的可能,从而舍去对被解释变量有显著影响的解释变量。

(3)用Frisch法修正多重共线性
1.对Y分别关于X1,X2,X3,X4作最小二乘回归,其步骤与结果如下所示:
图1-5 Y与X1的最小二乘回归
图1-6 Eviews的结果分析得:
图1-7 Y与X2的最小二乘回归
图1-8 Eviews的结果分析得:
图1-9 Y与X3的最小二乘回归
图1-10 Eviews的结果分析
得:
图1-11 Y与X4的最小二乘回归
图1-12 Eviews的结果分析
得:
根据回归结果易知X1是最重要的解释变量,所以选取第一个回归方程为基本方程。

2.加入X2,对Y关于X1,X2作最小二乘回归,得:
图1-13 Y与X1,X2的最小二乘回归
图1-14 Eviews的结果分析得:
可以看出,加入X2后,拟合优度有所增加,参数估计值的符号也正确,并且没有影响X1的显著性,所以在模型中保留X1。

3.加入X.4,对Y关于X1,X2,X4作最小二乘回归,得:
图1-15 Y与X1,X2,X4的最小二乘回归
图1-16 Eviews的结果分析
得:
可以看出,在加入X4后,拟合优度R2增加不显著,调整后的R2有所减小,并且X1和X4系数均不显著,说明存在严重的多重共线性,在模型中保留X1,略去X4。

相关文档
最新文档