【西南财大课件计量经济学】JLJJ四章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(0) 0
如两个解释变量完全相关: 例如设 x3 x2,则ˆ2、ˆ3的
分子、分母均为(0 不定式)
则无法确定ˆ2、ˆ3的数值。
实际上,在这种情形下,y 2 x2 3x3 u可写为: y (2 3)x2 u x2 u
表明只能给出综合参数的估计值ˆ (ˆ2 ˆ3),而无法得到 2、 3的估计值(即不能独立分辨各解释变量对因变量的作17用)
1)数据资料的来源(如数据来源于年鉴,数据并非研究总体的全部) 2)变量的选择不当
例如,做电力消费Y对收入X2、住房面积X3的回归时 (高收入的家庭一般 都比低收入家庭有较大的住房面积这样一种有形的约束);
例如,在分析建立某省粮食产量Y线性回归模型时,考虑引入解释变量:化 肥X2、灌溉面积X3、农业生产资金投入X4 (在X2、X3和X4之间存在很强的 相关性,由于化肥使用量和灌溉面积(兴修水利的结果)都受农业资金投入的影 响)。 (思考:是否可以去掉农业生产资金投入变量X4?)
进了消费者家庭财富状况X3作为第二个解释变量。模型为:
Yˆ 24.7747 0.9415X 2 0.0424 X 3
SE =(6.7525) (0.8229) (0.0807)
t =(3.6690) (1.1442) (-0.5261)
R 2 0.9531
F=92.4020
注:例1中X2、X3的 t 值小。且X3的系数符号与经济意义不符号。原因?
其中:u为随机项,且E(ui) (0 ui 0);x2与ui不相关(x2ui 0)
ˆ2
x32x2 y x2 x3x3 y
x
2 2
x32
(x2 x3 )2
x2 y(2x22 u 2)(x2 y uy)(x22) x(22 2x22 u 2) (2 x22)2
8Biblioteka Baidu
注:例 2 中X3的 t 值大,但X3的系数符号与经济意义不符号。原因?
一、多重共线性的定义(表现为两种情形)
量的(样一本)观完测全值的之多间重具共有线某性种严格线的C性线回性归1关模系型。2 S中的若3 N干解释3T变量u 或全部解释变
即对于一般线性回归模型
Yi 1 2 X 2i 3 X 3i k X ki ui
5、随机扰动项方差不等于常数=>异方差 ——截面数据时,经常出现异方差
6
主要内 容
第一节 什么是多重共线性 第二节 多重共线性产生的后果 第三节 多重共线性的检验 第四节 多重共线性的补救措施 第五节 解决多重共线性实例
7
第一节 什么是多重共线性
先从两个实例谈起
例1:某地区为研究不同家庭的消费Y与收入X2的关系,在此基础上,还引
例2:某国家分折汽车保养费用支出Y(元)与汽车的行程数X2(公里)以及汽车 拥有的时间X3(周)的关系。建立如下模型:
Yˆ 7.29 27.58X 2 15161.5X 3
SE =(121.50) (28.79)
(21.41)
t = (0.06) (0.958) (-7.06)
R 2 0.946
3、模型中大量地采用滞后变量也易产生多重共线性
(同一变量的逐次值在经济性质上无区别,一般都存在相互关系)
例如,在研究消费函数Y的时候,如果记可支配收入为X ,若在模型中引入 本期可支配收入,还考虑了以往各期的可支配收入,那么同一变量的前后期之值极 有可能是高度线性相关的,故可能产生多重共线性。
4、建模时由于认识的局限性,也易产生多重共线性
2、参数估计值的方差无限大
由第三章得ˆ2和ˆ3的方差为:
Var(ˆ j ) 2c jj
注:Var(ˆ j ) 2c(jj c jj中jj随方程是否含截距项有所不同) 含截距项1,c jj为(X X)1的j行j列的元素;
不含截距项,c jj为(X X)1的(j 1)行(j 1)列的元素。
18
ˆˆ22xx2 2x2 3ˆ3ˆ3xx3232xx2 3yy
解方程,可得 2和 3的OLS估计量分别为:
16
ˆ2 (
yx2 )( x32 ) ( yx3)( x2 x3) ( x22 )( x32 ) ( x2 x3)2
(0) 0
ˆ3
(yx3 )(x22 ) (yx2 )(x2 x3 ) (x22 )(x32 ) (x2 x3 )2
在完全多重共线性条件下: y 2 x2 3x3 u
因为(X
X)1
x 22 x32
1 (x2
x3)2
x32 x2 x3
x2 x3 x22
ˆ2的方差等于:
Var(ˆ2 )(X X)212
2
x22x32
2x32 (x2 x3)2
2x32 x22x32
1 (xx222xx3)322
2
x(22 1 r223)
例:某国家分折汽车保养费用支出(元)与汽车的行程数(公里)以及汽车拥有 的时间(周)的关系。建立如下模型:
Yˆ 7.29 27.58X 2 15161.5X 3 se (121.50)(28.79) (21.41) t (0.06) (0.958) ( 7.06)
R 2 0.946
其中:X 2 — 汽车每周的行程公里数; X 3 — 拥有汽车的时间
如y 2 x2 3x3 u 设x3x2 y (ˆ2 ˆ3)x2 u
只能得到系数的线性组合的唯一解:ˆ (ˆ2 ˆ3)
无法得到
2、
的唯一解。
3
2、参数估计值的方差(标准差)无限大 Var(ˆ j )
问题 : 如y 2 x2 3x3 u 设x3 x2 y (ˆ2 ˆ3)x2 u 能否用系数 2来解释x2对因变量y作用?
不满足的情况,采取相应的补救措施或者新的方法。 • 对基本假定是否满足的检验称为计量经济学检验。
4
不满足基本假定的情形(1)
1、通常不会发生随机扰动项均值不等于0的情形。若发生也不 会影响解释变量的系数,只会影响截距项。
2、随机扰动项正态性假设一般能够成立,就算不成立,在大 样本下也会近似成立。 (所以不讨论以上假定是否违背的问题)
尽管X3的t值较显著,但它的系数符号与经济意义不一致。计算出X2与X223的 相关系数为0.9960,表明汽车的行程数与拥有汽车的时间呈高度的线性相关。
注:
ˆ1
ˆ
ˆ2 ˆ3
(
X
x
2 2
x32
' X )1 X 'Y
1 (x2 x3)2
x32 x2
x3
x2 x22
x3
x2 x3
y y
假定x3与x2之间存在不完全多重共线性,有关系x3 x2 u(是不为0的常数)
如:设x3 x2
Var(ˆ2 )
2(x2 )2 x22(x2 )2 (x2x2 )2
x22
2
19
0
同理:易得ˆ3的方差为:
Var(ˆ3 )
2x22
x22x32 (x2 x3 )2
2
x32
(1
2 23
)
且: Var(ˆ3)
20
小结:完全多重共线性产生的后果
1、参数估计值的不确定性
5
不满足基本假定的情形(2)
3、解释变量之间相关=>多重共线
在多元线性回归模型Y X中,对X的基本假定是 :
矩阵X的各列向量之间是线性无关的 : r( X ) k (k n),即| X'X | 0(, X'X)-1存在。 如果这一假定不满足,则称模型存在多重共线性。
4、随机扰动项相关=>序列自相关 ——时间序列数据经常出现序列相关
(5)Cov(X, ui)=0 (随机项与解释变量X不相关)
(6)随机扰动服从正态分布
3
问题的提出:
• 在前述基本假定下,OLS估计具有BLUE的优良性。 • 然而实际问题中,这些基本假定往往不能满足,使OLS方法
失效,不再具有BLUE特性。 • 估计参数时,必须检验基本假定是否满足,并针对基本假定
(但这些解不具有OLS估计量所具有的统计特性)。
11
(二) 近似(不完全)多重共线性(实际中多为此情况) 若解释变量之间满足近似线性关系:
2 X 2 3 X 3 k X k u 0
称解释变量之间存在着近似(不完全)多重共线性。
例如,X 3 X 2 u(是不为0的常数)存在不完全多重共线性,
各解释变量的样本观测值之间存在一个或多个如下的关系式
2 X 2 3 X 3 k X k 0
式中: 2、3、、k 是不全为0 的常数,则称解释变量之间存在完全多
重共线性。
例如,设有回归模型 C 1 2S 3N 4T u
其中: C为居民个人消费; S为个人工资收入; N为非劳动收入; T为总收入
13
二、产生多重共线性的背景
1、趋同性:经济变量在时间上常存在共同的变化趋势(时间序
列数据)
例如,宏观经济处于上升阶段时,国内生产总值增长,净出口也增长;
例如,经济的增长带动了收入的增长,随之使商品销售额有所增长,相应 地市场利率,零售物价指数,储蓄额等变量也会发生变化。
如将这些变量作为解释变量引入模型,它们之间极有可能存在很强的相关性
21
(二)不完全多重共线性产生的后果
1、可以估计参数,但参数估计不稳定
在不完全多重共线性条件下, | XX | 0,X X非奇异,可由正规方 程求解参数估计值,但样本数据稍有变化或样本容量稍有增、减(删
除一个不显著的解释变量),(X X)1变化大,参数估计值变化敏感 (甚至出现回归系数值难以置信或符号与经济意义相违背的情况)。
不同程度多重共线性的后果;
多重共线性的诊断思路,与异方差性、自相关性的区别;
多重共线性的补救措施(思路、做法),与异方差性、自相关
性的区别。
2
回顾6项基本假定:
(1)解释变量间不相关(无多重共线性)
(2)E(ui)=0
(随机项均值为零)
(3)Var(ui)= 2
(同方差)
(4)Cov(ui, uj)=0 (随机项无自相关)
15
有的学者认为多重共线是一个数据、样本的问题。
第二节 多重共线性产生的后果 一、完全多重共线性产生的后果 1、参数估计值的不确定性
例:二元线性回归模型: Y 1 2 X 2 3 X 3 u
模型的离差形式为: yy 2x2 2 x32x3 u3x3 u
用普通最小二乘法,得参数估计量的正规方程为:
1
教学要求(目的):本章讨论违背古典假定(多重共线性)时, 线性回归模型的建立。通过本章的学习要求:
掌握多重共线性的概念; 模型中出现多重共线性的不良后果; 掌握诊断多重共线性的若干方法; 掌握修正多重共线性的若干方法; 根据本章知识,能够独立解决模型中的多重共线性问题。
重点与难点:
多重共线性的概念及经济意义;
2、经济变量之间本身具有内在联系(截面数据建模)
例,利用截面数据来研究企业生产函数时,从投入的要素看,资本投入、 劳动力投入等,都与企业的生产规模密切相关(较大的企业,资本投入和劳动力 投入都会较多,反之较少。因此,资本投入与劳动力投入之间几乎是高度线性相 关的,它们之间往往存在严重的多重共线性。
14
X 3对Y的作用可由X
完全代替。
2
10
注: 线性变量之间存在完全共线性,正规方程组中的系数矩 阵X不再是列满秩的,秩小于k,(即Rank( X ) k),矩阵X X是奇 异的,其逆矩阵不存在(或:向量矩阵X中,至少有一个列向量可 以由其余的列向量线性表出, X X 0)
故由正规方程组: X Y X Xˆ ˆ (X X)1 X Y 将不能唯一解出ˆ。正规方程有无穷多个解。
关关系,但也不是完全线性相关关系.
12
注: 若线性回归模型的解释变量之间存在近似共线性, 正规方程组中的系数矩阵X又列满秩了,矩阵X X非奇异,矩
阵(X X)的逆存在。即可求的最小二乘估计量。
(但该估计量的准确性相当差)。
| X'X | 0,(X'X)-1对角线元素较大
注意: 解释变量之间无多重共线性,是指解释变量之间不存 在线性相关性,但并不排除解释变量之间存在非线性关系。
这时X 3与X 2的相关系数近似等于1。
例如,影响家庭消费支出的家庭收入和家庭财富两个变量之间就存在明显 的高度相关关系(但不是完全线性相关关系);
例如,用时间序列数据建立回归模型时,由于许多经济变量都有随时间的 推移而同方向变动的特征,往往使得解释变量之间也具有很高的线性相关性;
例如,影响企业产出的劳动投入和资本投入二者之间也往往具有相当高的相
因为 T S N
9
所以 解释变量之间存在完全共线性。
完全多重共线性意味着某个(或某些)解释可以写
成其它解释变量的精确线性组合,即线性函数
如设2 0,
上式为X 2
3 2
X3
k 2
X
)
k
即:X 2与X 3,,X k之间的相关系数 r 1
例如 :
X3
X(2 是不为0的常数),这时X
3与X
的相
2
关系数为1。