第五章 多重共线性(计量经济学,南开大学)

合集下载

计量经济学实验五 多重共线性的检验与修正 完成版

计量经济学实验五 多重共线性的检验与修正 完成版

习题1.下表给出了中国商品进口额Y 、国内生产总值GDP 、消费者价格指数CPI 。

年份 商品进口额 (亿元)国内生产总值(亿元)居民消费价格指数(1985=100)1985 1257.8 8964.4 1001986 1498.3 10202.2 106.5 1987 1614.2 11962.5 114.3 1988 2055.1 14928.3 135.8 1989 2199.9 16909.2 160.2 1990 2574.3 18547.9 165.2 1991 3398.7 21617.8 170.8 1992 4443.3 26638.1 181.7 1993 5986.2 34634.4 208.4 1994 9960.1 46759.4 258.6 1995 11048.1 58478.1 302.8 1996 11557.4 67884.6 327.9 1997 11806.5 74462.6 337.1 1998 11626.1 78345.2 334.4 1999 13736.4 82067.5 329.7 2000 18638.8 89468.1 331.0 2001 20159.2 97314.8 333.3 2002 24430.3 105172.3 330.6 200334195.6117251.9334.6资料来源:《中国统计年鉴》,中国统计出版社2000年、2004年。

请考虑下列模型:i t t t u CPI GDP Y ++=ln ln ln 321βββ+ (1)利用表中数据估计此模型的参数。

解:ln 3.6489 1.796ln 1.2075ln t t t Y GDP CPI =--+t= (-11.32) (9.93) (-3.415)20.988770.6.0.1124R F S E ===(2)你认为数据中有多重共线性吗?多重共线性的检验 1)综合统计检验法若 在OLS 法下:R 2与F 值较大,但t 检验值较小,则可能存在多重共线性。

计量经济学(南开大学经济学院张伯伟)4-7

计量经济学(南开大学经济学院张伯伟)4-7
假定λ1<>0,
X 1i =
λ2 λ λ v X 2 i + 3 X 3 i + k X ki + i λ1 λ1 λ1 λ1
其中vi 为随机项.我们把这种解释变量间存在的完全或不完全的线性关系 称为多重共线性.由于经济变量自身的性质,它们之间这种多重共线性或 强或弱,普遍存在的.
第三节 多重共线性的影响
( ∑ x 2 i )( ∑ x 32i ) ( ∑ x 2 i x 3 i ) 2 2
2 ( λ ∑ y i x 3 i )( ∑ x 3 i ) ( ∑ y i x 3 i )( λ ∑ x 32i ) 2 ( λ 2 ∑ x 32i )( ∑ x 3 i ) ( λ ∑ x 32i ) 2
二,半对数线性模型: 模型的函数形式可变为:
ln Yi = β1 + β 2 X i + ui
或 Yi = β1 + β 2 ln X i + ui
Yi* = β1 + β 2 X i + ui 或 Yi = β1 + β 2 X i* + ui
根据解释变量的观测值,进行OLS估计,得到:
Y i* = β 1 + β 2 X i 或 Y i = β 1 + β 2 X * i
Yi = β1 + β 2 X * i
因此可得到原模型的估计方程:
1 Yi = β1 + β 2 Xi
二,对数线性模型: 通过对原模型的对数变换,函数形式可变为:
ln Yi = β1 + β 2 ln X 2i + β 2 ln X 3i + ui
* * 令变量 Yi = ln Yi , X ki = ln X ki ,则回归函数可变为:

计量经济学:多重共线性

计量经济学:多重共线性

计量经济学:多重共线性多重共线性52=.53085123 第四章专门讨论古典假定中⽆多重共线性假定被违反的情况,主要内容包括多重共线性的实质和产⽣的原因、多重共线性产⽣的后果、多重共线性的检测⽅法及⽆多重共线性假定违反后的处置⽅法。

第⼀节什么是多重共线性⼀、多重共线性的含义第三章讨论多元线性回归模型的估计时,强调了假定⽆多重共线性,即假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性⽆关。

在计量经济学中所谓的多重共线性(Multi-Collinearity),不仅包括解释变量之间精确的线性关系,还包括解释变量之间近似的线性关系。

从数学意义上去说明多重共线性,就是对于解释变量k X 、、X X 32,如果存在不全为0的数k λλλ,2,1 ,能使得n ,2, ,1i 033221 ==++++ki k i i X X X λλλλ ( 4.1 )则称解释变量k X X X ,,,32 之间存在着完全的多重共线性。

⽤矩阵表⽰,解释变量的数据矩阵为X=213112232223111k k nnkn X X X X X X X X X ??(4.2)当Rank(X )在实际经济问题中,完全的多重共线性并不多见。

常见的情形是解释变量k X X X ,,,32 之间存在不完全的多重共线性。

所谓不完全的多重共线性,是指对于解释变量k X 、、X X 32,存在不全为0的数k λλλ,2,1 ,使得n ,2, ,1i 033221 ==+++++i ki k i i u X X X λλλλ(4.3)其中,i u 为随机变量。

这表明解释变量k X 、、X X 32只是⼀种近似的线性关系。

如果k 个解释变量之间不存在完全或不完全的线性关系,则称⽆多重共线性。

若⽤矩阵4表⽰,这时X 为满秩矩阵,即Rank(X )=k 。

需要强调,解释变量之间不存在线性关系,并⾮不存在⾮线性关系,当解释变量存在⾮线性关系时,并不违反⽆多重共线性假定。

计量经济学第五章

计量经济学第五章
14
2024/10/15
15
用Eviews的多重共线性对策
Quick/Estimate Equation的对话框中
对数法: 直接输入log(Y) c log(X1) log(X2)… 或 差分法: 输入Y-Y(-1) C X1-X1(-1) X2-X2(-1)… 但差分常常会丢失一些信息,运用时应慎重。
则表明多重共线性存在。
11
对策:
• 去掉关系不大的变量,但应注意遗漏变量问题; • 重新建立模型(差分或对数处理); • 利用事先掌握的信息变换模型;
(如:Cobb-Douglas函数中K与L之间存在多 重
共线性,且它们的系数之和等于1) • 增加样本数.
12
用Eviews的多重共线性检验1
相关系数法 首先同时选择所有的自变量; 然后双击-出现选择栏时点击 Open Group/View/Correlations; 观察各自变量之间的大小。
即选择Quick/Estimate Equation后写入 v_hat c xi x2i x3i…
• 命令scalar LM=@regobs*@R² --Enter 双击LM时,在下边出现LM值./或直接计算。
10
二、多重共线性的检验及对策
诊断方法
• 系数估计值的符号不对; • 参数估计值不稳定; • R2很大,但重要的自变量 t 值很低; • 自变量之间呈高度相关(正负0.8~0.9)
• 首先估计出一般方程 • View/Coefficient Tests/Redundant
Variables-Likelihood Ratio • 出现对话框时,写入删除变量名--OK • 对比删除前后的AIC与SC信息值,信息
值小的结论是应采纳的。

第五章 多重共线性(计量经济学-北京大学,岳昌君)

第五章 多重共线性(计量经济学-北京大学,岳昌君)
4
§2 多重共线性的来源
一、解释变量受同一因素的影响 时间序列数据: 1、经济发展;2、政治事件 3、偶然事件;4、时间趋势 二、解释变量中含有当期和滞后变量 I t 1 2 rt 3Yt 4Yt 1 ut Y2 Y3 Y1 , Yn ; Y n Y1 Y2 有多重共线性。 Yn 1
5
§3 多重共线性的影响
一、完全共线性 ˆ X Y ˆ无唯一解 ( X X ) ˆ 的方差是无穷大。 i
6
二、“不完全”多重共线性
ˆ的解不稳定。 ˆ 的方差非常大。 1、 i ˆ 2.8 ˆ 1 1 0.9 2 2 例如: 0.9 1 ˆ 2.9 ˆ 2 3 3 ˆ 2.8 ˆ 3.5678 0.99 1 2 2 0.99 ˆ ˆ 1 2 . 9 6 . 4322 3 3 ˆ 2.8 ˆ 40 .5743 0.999 1 2 2 0.999 2.9 ˆ ˆ 1 51 . 4257 3 3
观察结果(共线性诊断):1、最大条件指数 37.1>30,说明中等相关;2、与最大条件指数在 一行的4个变量的方差比例都大于0.5,说明这4个 变量就是一个具有中等相关的变量集。
14
五、F检验
例如:X2,X3,X4相互回归
1、 X2—X3,X4;若F >F ,则有多重共线性; 否则的话,就没有。 2、 X3—X2,X4;若F >F ,则有多重共线性; 否则的话,就没有。
t 1 t t 1 t

计量经济学分章习题与答案

计量经济学分章习题与答案

第一章 导 论一、名词解释1、截面数据2、时间序列数据3、虚变量数据4、生变量与外生变量二、单项选择题1、同一统计指标按时间顺序记录的数据序列称为 ( )A 、横截面数据B 、虚变量数据C 、时间序列数据D 、平行数据2、样本数据的质量问题,可以概括为完整性、准确性、可比性和 ( )A 、时效性B 、一致性C 、广泛性D 、系统性3、有人采用全国大中型煤炭企业的截面数据,估计生产函数模型,然后用该模型预测未来 煤炭行业的产出量,这是违反了数据的哪一条原则。

( ) A 、一致性 B 、准确性 C 、可比性 D 、完整性4、判断模型参数估计量的符号、大小、相互之间关系的合理性属于什么检验? ( )A 、经济意义检验B 、统计检验C 、计量经济学检验D 、模型的预测检验5、对下列模型进行经济意义检验,哪一个模型通常被认为没有实际价值? ( )A 、i C (消费)5000.8i I =+(收入)B 、di Q (商品需求)100.8i I =+(收入)0.9i P +(价格)C 、si Q (商品供给)200.75i P =+(价格)D 、i Y (产出量)0.60.65i K =(资本)0.4i L (劳动)6、设M 为货币需求量,Y 为收入水平,r 为利率,流动性偏好函数为012M Y r βββμ=+++,1ˆβ和2ˆβ分别为1β、2β的估计值,根据经济理论有 ( ) A 、1ˆβ应为正值,2ˆβ应为负值 B 、1ˆβ应为正值,2ˆβ应为正值 C 、1ˆβ应为负值,2ˆβ应为负值 D 、1ˆβ应为负值,2ˆβ应为正值三、填空题1、在经济变量之间的关系中, 因果关系 、 相互影响关系 最重要,是计量经济分析的重点。

2、从观察单位和时点的角度看,经济数据可分为 时间序列数据 、 截面数据 、 面板数据 。

3、根据包含的方程的数量以及是否反映经济变量与时间变量的关系,经济模型可分为 时间序列模型 、 单方程模型 、 联立方程模型 。

计量经济学之多重共线性

计量经济学之多重共线性

计量经济学之多重共线性引言多重共线性是计量经济学中一个重要的概念,在经济学研究中扮演着重要的角色。

在本文中,我们将深入探讨多重共线性的概念、原因和影响,并介绍一些常见的解决方案和应对方法。

什么是多重共线性?多重共线性是指在回归分析中,自变量之间存在高度相关性的情况。

具体来说,多重共线性指的是自变量之间线性相关性较高,可能导致回归分析的结果不准确或难以解释。

多重共线性的原因多重共线性的产生有多种原因,以下是一些常见的原因:1.样本选择偏倚:当样本中存在特定的特征或者数据的选择方式导致一些变量的相关性增强。

2.变量的定义重复:有些变量可能在定义上重复,导致它们之间存在高度相关性。

3.缺少重要变量:当回归模型中存在遗漏的重要变量时,其他变量可能会代替这些遗漏的变量,导致多重共线性。

4.数据测量误差:测量误差也可能导致自变量之间存在高度相关性。

多重共线性的影响多重共线性可能会对回归模型产生一系列的问题和影响:1.估计系数不准确:多重共线性会导致回归系数的估计不准确,使得对自变量的解释变得困难。

2.系数符号相反:多重共线性可能导致估计系数的符号与理论预期相反。

3.误差项的方差增加:多重共线性会导致误差项的方差增加,从而降低了模型的精确度。

4.解释力度减弱:多重共线性会降低模型的解释力度,使得我们难以解释模型的结果。

解决多重共线性的方法针对多重共线性问题,我们可以采取以下方法来解决:1.增大样本量:增大样本量可以降低变量之间的相关性,从而减轻多重共线性的影响。

2.删除相关变量:通过检验变量之间的相关性,删除相关性较高的变量,可以减轻多重共线性的程度。

3.主成分分析:主成分分析是一种降维的方法,可以将相关性较高的变量合并为一个主成分,从而避免了多重共线性的问题。

4.增加惩罚项:在回归模型中增加惩罚项,如岭回归或lasso回归,可以减轻多重共线性的影响。

5.使用时间序列数据:对于存在多重共线性的房地产数据等时间序列数据,可以使用时间序列模型来避免多重共线性的问题。

计量经济学:多重共线性

计量经济学:多重共线性

影响比较大的,略去影响较小的。
元线性回归模型并进行OLS估计,拟合优度最大且接近1时,说明
这个变量与其他所有解释变量间存在共线性。
第三节 多重共线性的检验
辅助回归法中的方差膨胀因子:
对 于 多 元 线 性 回 归 模: 型Yi 0 1 X 1i ... k X ki ui 为 判 断 诸 自 变 量 间 是存 否在 多 重 共 线 性 , 进如 行下 辅 助 回 归 : X ji 0 1 X 1i ... j 1,i X j 1,i j 1,i X j 1,i ... k X ki v i , j 1,2,...,k 若 上 述 辅 助 回 归 的 可系 决数 为 R2 X j的 方 差 膨 胀 因 子 为 : j, 则 定 义 自 变 量 1 VIF j 1 R2 j
第一节 多重共线性的概念
若有c0+c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n。其中: ci不全为0,则称
解释变量间存在完全多重共线性
若存在:c0+c1X1i+c2X2i+…+ckXki≈0 i=1,2,…,n。 其中:ci不全为0,
则称为解释变量间存在近似多重共线性。
完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,
第二节 多重共线性的来源与后果
4、参数估计值不稳定,经济含义不合理
样本观测值稍有变动、增加或减少解释变量等都会使参数估计值发生较大变 化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响。
5、模型的预测功能失效
较大的方差容易使预测区间变大,从而使预测失去意义
注意:只要模型满足经典假设,则在近似多重共线性情况下,OLS估计量仍 然满足无偏性、线性性和有效性。但此时,无偏性并不意味着对某一给定样 本,其参数估计值就等于真实值。有效性也不意味着参数估计量的方差一定 很小。

《多重共线性》课件

《多重共线性》课件

诊断方法比较
检验统计量
检验统计量提供量化指标,可以 明确指出多重共线性的程度,但 其依赖于样本数据,稳定性相对
较差。
图形化诊断
图形化诊断直观易理解,但可能存 在主观性,并且难以量化多重共线 性的程度。
综合运用
在实际应用中,应综合运用多种方 法进行多重共线性的诊断,以确保 诊断结果的准确性和可靠性。
Condition Index
Condition Index是诊断多重共线性的另一种统计量,当某些Condition Index值特别 大时,可能存在多重共线性问题。
图形化诊断
散点图
通过绘制自变量间的散点图,可以直 观地观察到是否存在线性关系,从而 初步判断是否存在多重共线性问题。
相关系数矩阵
通过绘制相关系数矩阵,可以观察到 自变量间的相关系数,当某两个自变 量的相关系数接近1或-1时,可能存 在多重共线性问题。
多重共线性的影响
参数估计值不稳定
01
模型中的参数估计值会随着样本的微小变化而发生较大的变化
,导致模型预测的不稳定性。
模型预测精度降低
02
由于参数估计值的不准确,会导致模型的预测精度降低,预测
结果的可信度下降。
模型解释性差
03
由于解释变量之间的高度相关关系,使得模型难以解释各个解
释变量对因变量的影响程度,降低了模型的解释性。
多重共线性PPT课件
目 录
• 多重共线性的定义 • 多重共线性的成因 • 多重共线性的诊断 • 多重共线性的处理 • 案例分析
01
多重共线性的定义
什么是多重共线性
1
共线性是指解释变量之间存在高度相关性的现象 。
2
在多元线性回归模型中,如果解释变量之间存在 高度相关关系,会导致模型估计的参数不准确, 甚至出现完全错误的结论。

计量经济学第五章多重共线性 文档全文预览

计量经济学第五章多重共线性 文档全文预览
1x1i+ 2x2i+ …+ kxki=0
■ 非完全多重共线: 包括变量间交互相关 情形如下:
■ 1x1i+ 2x2i+ …+ kxki+ i =0
二、完全多重共线的估计问题
■ 以二元回归为例: yi=β1+β2x2i+β3ix3i+μi
■ 设:x3i= x2i ( r23= 1) 代入上式: ■ ∴如果出现完全多重共线 , 则偏回归系数是不确定的 , 其标 准误是无穷大。

∴估计精度较低

称为方差膨胀因子
■ VIF表明: 估计量的方差由于多重共线的出现而膨胀起来。
■ 当r23=0.7时 ,VIF= 1.96 ■ 当r23=0.9时 ,VIF=5.76 ■ 当r23=0.95时 ,VIF= 10.26
即: 即:
是r23为零时的5.76倍。 是无共线时的10倍。
三、多重共线的实际后果
第五章 多重共线性
■ 多重共线性的性质 ■ 多重共线性时的估计问题 ■ 多重共线性的实际后果 ■ 多重共线性产生的原因 ■ 多重共线性的识别 ■ 多重共线性的克服
一、多重共线性的性质
■ 完全多重共线: 对解释变量x1, x2, … xk, 如果存在一组不全为0的常数 1 、 2 、… kபைடு நூலகம்,使得:
六、多重共线的克服
4. 补充新数据: 以二元回归为例
当r23给定时 ,增加新样本 ,通常可以使
增大,
从而减少 的方差 ,使我们能更准确地估计 2。
习题:
■ 现有美国70-83年进口(百万美元) 、GNP (10亿美元)和消费者价格指数(CPI)数据。
请考虑一下模型 :

多重共线性(Multi-Collinearity)

多重共线性(Multi-Collinearity)

i 0 1 1i 2 2i
k ki i
(i=1,2,…,n)
其基本假设之一是解释变量
X,
1
X2,,
X
k
互相独立 。
如果某两个或多个解释变量之间出现了相关性, 则称为多重共线性。
如果存在
c1X1i+c2X2i+…+ckXki=0
i=1,2,…,n
其中: ci不全为0,即某一个解释变量可以用其它解释 变量的线性组合表示,则称为解释变量间存在完全
2

1

x12i 1 r 2
2
x12i
所以,多重共线性使参数估计量的方差增大。
方差扩大因子(Variance Inflation Factor)为1/(1-r2), 其增大趋势见下表:
相关系 0 0.5 0.8 0.9 0.95 0.96 0.97 0.98 0.99 0.999 数平方 方差扩 1 2 5 10 20 25 33 50 100 1000 大因子
多重共线性(Multi-Collinearity)
§2.8 多重共线性
Multi-Collinearity
一、多重共线性的概念 二、多重共线性的后果 三、多重共线性的检验 四、克服多重共线性的方法 五、案例
一、多重共线性的概念
1、多重共线性
• 对于模型
Y X X X
以二元回归模型中的参数估计量ˆ 为例,ˆ 的方差为
1
1
Var(ˆ )
1

ˆ 2

(X X
)1
22

(
ˆ
2
(
x2
2i
)
x2 )( x2 ) ( x

多重共线性

多重共线性
收入(Y:GDP)与消费 C 的总量与增量数据
1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 Y 4901 5489 6076 7164 8792 10133 11784 14704 16466 18320 21280 25864 34501 47111 59405 68498 C(-1) 2976 3309 3638 4021 4694 5773 6542 7451 9360 10556 11362 13146 15952 20182 27216 34529 C(-1)/Y 0.6072 0.6028 0.5996 0.5613 0.5339 0.5697 0.5552 0.5067 0.5684 0.5762 0.5339 0.5083 0.4624 0.4284 0.4581 0.5041
y ( 1 2 ) x1
只能确定综合参数 1 2 的估计值:
ˆ ˆ 1 2 x1i y i x12i
4.2.2 不完全多重共线性下的 后果
(1)参数估计仍是无偏估计,但不稳定;估计量 及其标准差非常敏感,观测值稍微变化,估计 量就会产生较大的变动。 (2)参数估计式的方差随着共线性程度的增大而 增大。 (3)t检验失效,区间估计失去意义;估计量的 方差很大,相应标准差增大,进行t检验时,接 受零假设的可能性增大 (4)严重多重共线性时,甚至参数估计式的符号 与其经济意义相反。得出完全错误的结论。
2i

2i
2 2i
x y x y x x
1i i 1i 2 1i 2 1i
i
x12i 2 x12i

多重共线性问题课件

多重共线性问题课件
多重共线性通常出现在多元回归分析 中,当两个或多个自变量之间存在高 度相关或完全相关时,会导致模型估 计的参数不稳定。
多重共线性的表现形式
相关性矩阵
通过计算自变量之间的相关性矩阵,可以发现高度相关的自变量 。
特征值
在多重共线性情况下,某些特征值的绝对值会接近于0,这表明自 变量之间存在高度相关。
方差膨胀因子
数据收集阶段预防
总结词
在数据收集阶段,预防多重共线性的关键是保证 数据的准确性和完整性,以及合理的数据样本量 。
总结词
在数据收集阶段,可以通过增加样本量来降低多 重共线性的影响。
详细描述
数据的质量直接关系到模型的准确性和可靠性, 因此需要确保数据的准确性和完整性。此外,合 理的数据样本量可以降低随机误差的影响,提高 模型的稳定性和可靠性。
多重共线性问题的
03
诊断
特征值诊断法
总结词
通过计算模型中自变量的特征值来判断是否存在多重共线性问题。
详细描述
特征值诊断法是通过计算自变量的特征值来判断自变量之间的相关性。如果自变量的特征值接近于零 ,说明该自变量与其他自变量高度相关,存在多重共线性问题。
条件指数法
总结词
通过计算自变量之间的条件指数来判断 是否存在多重共线性问题。
VS
详细描述
条件指数是一种衡量自变量之间相关性的 指标,如果条件指数大于一定阈值,说明 自变量之间存在多重共线性问题。
方差膨胀因子法
总结词
通过计算自变量的方差膨胀因子来判 断是否存在多重共线性问题。
详细描述
方差膨胀因子是衡量自变量对因变量 影响的放大程度,如果方差膨胀因子 大于一定阈值,说明自变量之间存在 多重共线性问题。
Байду номын сангаас

第五 多重共线性精选

第五  多重共线性精选

仍以二元线性模型 y=1x1+2x2+ 为例:
vˆ 1 a ) 2 r ( X X ( ) 1 1 1x 1 2 i x 2 2 2 i ( x 2 2 ix 1 ix 2 i) 2 1 (x 1 ix 2 2 i / ) 2x 1 2 ix 1 2 i x 2 2 i
实际经济问题中的多重共线性
一般地,产生多重共线性的主要原因有以下三个方面 :
(1)经济变量相关的共同趋势
时间序列样本:经济繁荣时期,各基本经济变量( 收入、消费、投资、价格)都趋于增长;衰退时期, 又同时趋于下降。
横截面数据:生产函数中,资本投入与劳动力投入 往往出现高度相关情况,大企业二者都大,小企业都 小。
▪经验告诉我们,在多元线性回归模型的估计中,如果出现参 数估计值的经济意义明显不合理的情况,应该首先怀疑是否存 在多重共线性。
4、变量的显著性检验失去意义
存在多重共线性时
参数估计值的方差与标准差变大
容易使通过样本计算的t值小于临界值, 误导作出参数为0的推断
可能将重要的解释变量排除在模型之外
5、模型的预测功能失效
(2)从定性分析认为,一些重要的解释变量的回归系数 的标准误差较大,在回归方程中没有通过显著性检验时, 可初步判断可能存在严重的多重共线性。
(3)有些解释变量的回归系数所带正负号与定性分析结果 违背时,可能存在多重共线性。
(4)解释变量的相关矩阵中,解释变量之间的相关系数较 大时,可能会存在多重共线性问题。
注意 较高的简单相关系数只是多重共线性存在的充分条件, 而不是必要条件。特别是在多于两个解释变量的回归模型 中,有时较低的简单相关系数也可能存在多重共线性。因 此并不能简单地依据相关系数进行多重共线性的准确判断。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例如,为了估计汽车需求的价格弹性和收入弹性,得到销售量、平均价格、消 费者收入的时间序列数据。设定回归式:
ln(Yt ) 1 2 ln P t 3 ln I t ut
由于在时间序列数据中价格Pt、收入It 一般都具有高度共线的趋势。因此,直接 估计上面的回归式将存在问题。由于在同一式点上,价格与收入的相关程度不高, 可以先利用截面数据估计出收入弹性 ,再利用这一估计结果修改原回归式,变 ˆ 为: 3
R 2 /(k 1) F ~ F (k 1, n k ) 2 (1 R ) /(n k )
可以采用类似的方法检验:
F
R2 ) j /( k 1 (1 R j ) /(n k 1)
2
~ F (k 1, n k )
选择显著水平α ,计算F 统计量的值,与F分布表中的临界值进行比较,若F检验值 小于临界值,则多重共线性不显著,反之,则多重共线性显著。
第三节 多重共线性的探查和解决
一、多重共线性的探查 由于多重共线性使一种普遍现象,而多重共线性的程度影响了参数估计结果, 因此我们关心的是共线性的程度,而不是共线性是否存在。
在双边量回归模型中,可以直接对解释变量的相关系数进行显著性检验,以确 定线性相关的程度(此时相关系数的平方等于样本决定系数)。而对于多于两个结 束变量的回归模型,则不能利用俩俩相关系数来检验。 对于有多个变量的回归模型,可以采用辅助回归的方法,分别以k-1个解释变量 中的第i个对其他变量进行回归,可得到k-2个回归方程的判定系数: R22,R32,…,Rk2。假定这些判定系数中Rj2最大且接近1,则变量Xj 与其他解释变量 中的一个或多个有较高相关程度,因此回归方程出现高度多重共线性。 可以进行F 检验确定其显著性: 根据第三章的结果,检验R2显著性的F检验值为:
2、利用先验信息
假定对回归模型:
Yi 1 2 X 2i 3 X 3i ui
已知X2 和X3 之间高度共线。根据先验信息,确定β3=2β2,带入模型后可得:
Yi 1 2 X 2i 2 2 X 3i ui 1 2 ( X 2 i 2 X 3i ) ui 设变量Z i ( X 2i 2 X 3i ), 估计方程 Yi 1 2 Z i ui ˆ 和 ˆ 2 ˆ。 可得到

2 2 ( yi x3i )( x 3 ) ( y x )( x i 3i 3 i ) i 2 2 2 2 (2 x 3 )( x ) ( x 3i 3i ) i
ˆ 是不确定的。同样 ˆ 也是不确定的。而方差 此时, 2 3 ˆ ) Var ( 2
Yt* 1 2 ln Pt ut
ˆ ln I , 其中Yt* ln Yt 3 t
新的回归式中消除了多重共线性的影响。 6、利用时间序列数据的差分或离差进行估计 如果时间序列数据中,解释变量间存在高度相关,那么这些变量的差分之间不 一定相关。因此利用差分进行回归能降低多重共线性的程度。
根据最小平方和原则,并求解正规方程组,可得到:
ˆ 2
2 ( yi x2i )( x 3 ) ( yi x3i )( x2 i x3i ) i 2 2 ( x 2 )( x ) ( x x ) 3i 2 i 3i 2i
ˆ 3
( yi x2 i )( x 2 ) ( yi x2 i )( x2 i x3i ) 2i
0 0
2 2 x 3 i ˆ ) 在 x2 x3时,Var ( 2 2 2 2 2 2 2 ( x3i) ( x )
3i
x x
2 2i
2 x 2i 2 3i
( x2i x3i)
2

因此,存在完全共线性时,不能利用OLS估计参数,参数的方差变为无限大。
ˆ ) Var ( 2
当样本容量增大时,
x x
2 2i
x
2 3i
( x 2i x3i)
2
2 2i

2 2 x ( 1 r ) 3i 23

x 增大,方差将减小,可以提高参数估计的精度。
2 2i
5、横截面数据与时间序列数据并用 如果时间序列数据中,解释变量间存在高度相关,可以先使用横截面数据估计 出存在高度相关解释变量中的一个或多个,然后再在时间序列数据中剔除这些变量, 在消除多重共线性影响下估计因变分母可化简为 ( x 3 )( v i ) 0。 i ˆ 是可估计的的。同样 ˆ 也是可估计的。而方 此时, 2 3
ˆ ) Var ( 2
x x
2 2i
x
2 3i
2 2 2 x ( x x ) / x 3 i 2 i 3i 2 i 2 2 2 2 x [ 1 ( x x ) /( x x 3i 2 i 3i 2i 2i )]
Yi 1 2 X 2 3 X 3 ui
如果采用OLS估计,则有:
ˆ Y ˆ X ˆ X 1 2 2 3 3 min
2 ˆ ˆ X ˆ X )2 ˆ u ( Y i i 1 2 2 3 3
ˆ x ˆ x )2 ( yi 2 2 3 3
第五章 多重共线性
第一节 违背古典假定的估计问题
我们关于经典线性回归模型(CLRM)有如下假定: 假定1:回归模型对参数是线性的 假定2:在重复抽样中X的值是固定的(非随机) 假定3:干扰项的均值为零。即,E(ui|Xi)=0 假定4:同方差性或ui的方差相等。即 Var(ui|Xi)=E[ui-E(ui)|Xi]2 = E(ui2|Xi]2 = 2 假定5:各个干扰项无自相关。即 Cov(ui,uj|Xi,Xj)=E[ui-E(ui|Xi) ][uj-E(uj|Xj)] = E(ui|Xi)(uj|Xj) = 0 假定6:ui和Xi的协方差为零。即 Cov(ui,Xi) = E[ui – E(ui)][ Xi – E(Xi)] = E[ui (Xi – E(Xi))] =E(ui Xi) – E(ui)E(Xi) = E(ui Xi) = 0 假定7:观测次数必须大于待估计的参数个数。 假定8:解释变量X的只要有变异性。即一个样本中,Xi不能完全相同。 假定9:模型没有设定误差。 假定10:没有完全的多重共线性,即解释变量之间没有完全的线性关系。 在现实中,以上假定不一定得到满足。本章讨论某些假定不成立时的估计问题。
服从t (n-k+1)。给定显著水平α,若统计量大于临界值tα/2,则说明Xj 与Xi引起回归方 程的多重共线性。 二、解决多重共线性的方法 如果发现监视变量之间存在高度得多重共线性,就必须消除这种多重共线性的 影响,保证模型的正确性和估计的有效性。有以下几种解决方法。 1、除去不重要的变量 把回归模型中引起多重共线性,而对因变量的影响不大的变量。但是变量的剔 除可能导致模型的设定偏误。
3 k vi 2 X 1i X 2i X 3i X ki 1 1 1 1
其中vi 为随机项。我们把这种解释变量间存在的完全或不完全的线性关系称为多重 共线性。由于经济变量自身的性质,它们之间这种多重共线性或强或弱,普遍存在 的。
第三节 多重共线性的影响
一、完全多重共线性 以两个解释变量的回归模型为例,假定回归模型为:
二、不完全多重共线性 假定X2,X3 间存在不完全多重共线性, 以离差形式表示为: 其中vi 为随机项。则
x2。 x3 vi
ˆ 2
2 [ yi ( x3i vi )]( x 3 ) ( yi x3i )[ ( x3i vi ) x3i ] i 2 2 [ ( x3i vi ) 2 ]( x 3 ) [ ( x v ) x ] 3i i 3i i
第二节 多重共线性(multi-collinearity)
如果假定10不成立,即在解释变量X1,X2,…,Xk中,存在线性关系。 解释变量间的确定线系关系存在时,存在不全为零的常数
1 , 2 ,k,使
1 X1i 2 X 2i k X ki 0
设1 0, 则 X 1i
如果通过前的F检验得到某解释变量Xj 与其它解释变量存在多重共线性,则可以 通过t 检验寻找Xj 与哪些变量引起多重共线性。 首先计算Xj 与其它每个解释变量的偏相关系数:
rji.2( j 1)( j 1)( i 1)( i 1)k , i j , i 2,3,k 定义统计量: rji.2( j 1)( j 1)( i 1)( i 1)k t 2 (1 r ji ) /(n k 1) .2( j 1 )( j 1)( i 1 )( i 1 )k
2 2 ( x 2 )( x ) ( x x ) 2 i 3 i 2i 3i
如果X2与X3存在完全共线性,即
x2 则: x3
ˆ 2
2 ( yi x2i )( x 3 ) ( yi x3i )( x2i x3i ) i 2 2 ( x 2 )( x ) ( x x ) 3 i 2 i 3i 2i
3、变换模型的形式 如果作为解释变量的某些经济变量间出现高度相关,而进行回归分析的目的是 为了预测,不是研究单个经济变量对因变量的影响时,可以根据实际问题,改变模 型模型的形式。 4、增加样本容量 如果多重共线性是由样本引起,增加样本容量可以减少多重共线性的程度。以 二元回归方程为例,根据第二节的结果,参数估计值的方差为:
2 X 2i 3 X 3i k X ki 1 1 1
这种关系为完全多重共线性,变量间的相关系数为1。实际上更多的情况是, 解释变量间有不完全的线性关系:存在不全为零的数:
1 , 2 ,k,使
假定λ1<>0,
1 X1i 2 X 2i k X ki vi 0

( x2 i x3i)
2
2 2i
相关文档
最新文档