第五章 计量经济学检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 越强(即 R k . 越大),则由于多重共线性,该系数估计的方差就越大。
一种最普遍的情形是,解释变量之间是高度相关,而不是 确切相关的。在这种情形下,回归模型仍然保持那些常见的性质, 但是出现了一些潜在的统计问题: 1. 数据扰动存在巨大影响。 2. 虽然模型的整体效果比较好( R 较大),但参数b不显著。 3. 导致参数估计“变性”(符号不合理)。 4.解释变量前的参数并不反映各自与被解释变量之间的结构 关系,而是反映它们对被解释变量的共同影响。
2i
2i
2 2i
x y x y x x
1i i 1i 2 1i 2 1i
i
x12i 2 x12i
x12i 2 x12i
0 0
ˆ 1 为不定式;
ˆ 同理, 2 也为不定式,其值无法确定。
2、近似共线性下普通最小二乘法参数估计量 非有效
在一般共线性(或称近似共线性)下,虽然可以得 到OLS法参数估计量,但是由参数估计量方差的表达 式为
1.经验判别法(最常用的方法)
在OLS法下,模型的R2与F值较大,但各参数估 计值的t检验值较小,说明各解释变量对Y的联合线性 作用显著,但各解释变量间存在共线性而使得它们对 Y的独立作用不能分辨,故t检验不显著。 此方法简便易行,因而是实践中最常用的方法,缺 点是无法确诊。
2.使用相关矩阵检验
一般经验
对于采用时间序列数据作样本、以简单线性形 式建立的计量经济学模型,往往存在多重共线性。
以截面数据作样本时,问题不那么严重,但多 重共线性仍然是存在的。
二、多重共线性的后果
1、完全共线性下参数估计量不存在
多元线性模型
Y X
的普通最小二乘参数估计量为:
( X X ) 1 X Y
X1 = 1 + 2X2 + 3X3 +… + kXk +v
(2) 计算的方差膨胀因子(VIF):
ˆ VIF ( i ) 1 (1 Ri2 )
其中Ri2是第一步辅助回归的决定系数。
(3) 分析多重共线性的程度
VIF越高, 多重共线性的影响越严重。由于没 有VIF临界值表,我们只能使用经验法则:有人 建议用VIF>10作为存在严重多重共线性的标准, 特别在解释变量多的情形应当如此。
在矩阵表示的线性回归模型 Y=XB+N 中,完全共线性指:秩(X)<k+1,即矩阵
1 X 11 1 X 12 X 1 X 1n X 21 X 22 X 2n X k1 X k2 X kn
中,至少有一列向量可由其他列向量(不包 括第一列)线性表出。
1
1
2 这里 R k . 是 x k 基于其它解释变量进行回归的决定系数 R 2 。在多元线性
回归模型中,第 k 个系数最小二乘估计的方差是 2 乘以这个比值。因此,当 x k
2 与其它解释变量之间的相关性越强(即 R k . 越大),则该系数估计的方差就越大。
从而bk的方差为:
ˆ ˆ 1 x12i 2 x1i x 2i x1i y i
2 ˆ ˆ 1 x 2i x1i 2 x 2i x 2i y i
解该线性方程组得:
ˆ 1
x y x x x y x x x x x x x
1i i 1i 2i i 2 2i 2 1i 1i 2 i 1i
ˆ Cov () 2 ( X X) 1
由于此时|X’X|0,从而使参数估计值的方差 增大,OLS参数估计量非有效。
例如,如果一个模型中仅仅包含两个解释变量和一个常数, 则对其中任何一个斜率系数,可以得到:
2 2 Var[bk ] , k 1, 2 n 2 2 2 (1 r12 ) S kk (1 r12 )i 1 ( xik x k )
(2.6.4)
如果存在完全共线性,则(X’X) -1不存在,无法得 到参数的估计量。
例如:对一个离差形式的二元回归模型
y 1 x1 wk.baidu.com x 2
如果两个解释变量完全相关,如x 2 x1 ,则有
x12i X X x x 2 i 1i x1i x 2i x12i 2 x 2i x12i
例如:在中国消费模型中的2个变量:
收入(Y:GDP)与消费 C 的总量与增量数据
1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 Y 4901 5489 6076 7164 8792 10133 11784 14704 16466 18320 21280 25864 34501 47111 59405 68498 C(-1) 2976 3309 3638 4021 4694 5773 6542 7451 9360 10556 11362 13146 15952 20182 27216 34529 C(-1)/Y 0.6072 0.6028 0.5996 0.5613 0.5339 0.5697 0.5552 0.5067 0.5684 0.5762 0.5339 0.5083 0.4624 0.4284 0.4581 0.5041
四、克服多重共线性的方法
1、第一类方法:排除引起共线性的变量
找出引起多重共线性的解释变量,将它排除出去, 是最为有效的克服多重共线性问题的方法。
注意: 剩余解释变量参数的经济含义和数值都发生了变化。
2、第二类方法:差分法 对于以时间序列数据为样本、以直接线性关系
为模型关系形式的计量经济学模型,将原模型变 换为差分模型 Yi=1 X1i+2 X2i++k Xki+ i 可以有效地消除存在于原模型中的多重共线性。 一般讲,增量之间的线性关系远比总量之间的 线性关系弱得多。
4.逐步回归法
以Y为被解释变量,逐个引入解释变量,构成
回归模型,进行模型估计。根据拟合优度的变化 决定新引入的变量是否可以用其它变量的线性组 合代替,而不作为独立的解释变量。 如果拟合优度变化显著,则说明新引入的变量 是一个独立解释变量;
如果拟合优度变化很不显著,则说明新引入的 变量不是一个独立解释变量,它可以用其它变量 的线性组合代替,也就是说它与其它变量之间存 在共线性关系。
x12i 1 x12i 2 2 2 x1i
x1i y i 1 X Y x y x1i y i 2i i
该回归模型的正规方程为 ˆ ( X X) B X Y 或
如果这两个解释变量是完全相关的,则上述方差具有无限大。 确切相关的情形是完全违反了模型的假设,这不是数据的问题。
若模型中存在k个解释变量: 为了方便,定义数据矩阵 X 包含常数和 ( K 1) 个利用与均值偏离 度量的解释变量。假设 x k 表示第 k 个变量, X (k ) 表示剩余的包括常数 项的变量,则逆矩阵 ( X X) 1 中的第 k 个对角元是:
2 Var[bk ] n 2 (1 Rk . )i 1 ( xik x k ) 2
该公式表明: (1) 在其他情况相同时, x k 与其它解释变量之间的相关性 (2) 在其他情况相同时, x k 自身的变差越大,则该系数估计 的方差就越小。 (3) 在其他情况相同时,线性模型的整体拟合效果越好 (体现在 2 上),则该系数估计的方差就越小。
2
三、多重共线性的检验
由于实际样本数据永远不会是正交的,则多 重共线性总是在一定程度上存在的。但是, 什么时候多重共线性成为严重的问题呢?也 就是受到变量之间交互关系影响促使估计量 方差扩散到什么程度时,才能够引起我们的 关注呢? 检验多重共线性的方法主要有:经验判断法、 相关系数判断法、条件数判断法、方差膨胀 因子判断法、逐步回归判断法等。
2、实际经济问题中的多重共线性现象
经济变量的共同变化趋势
时间序列样本:经济繁荣时期,各基本经济 变量(收入、消费、投资、价格)都趋于增长; 衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动 力投入往往出现高度相关情况,大企业二者都大, 小企业都小。
滞后变量的引入
在计量经济模型中,往往需要引入滞后经济变 量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。
其中,方差膨胀因子定义为:
1 VIF 2 1 Rk .
VIF检验的具体步骤如下:
设原方程为:Y = 0 + 1X1 + 2X2 + … + kXk + u 我们需要计算K个不同的VIF,每个Xi 一个。为指定Xi 计算 VIF涉及以下三步: (1) Xi 对原方程中其它全部解释变量进行OLS回归,例如 ,若i =1,则回归下面的方程:
(x M ( k ) x k ) 1 [x x k x X ( k ) ( Xk ) X ( k ) ) 1 Xk ) x k ]1 k k k ( ( xk X( k ) ( Xk ) X( k ) ) Xk ) xk ( ( x x k 1 k x x k k 1 (1 Rk2. ) Skk
统计软件一般提供各解释变量两两之间的相关 系数矩阵,如发现某些相关系数高(绝对值高于 0.8),则表明多重共线性存在。但即使解释变量两 两之间的相关系数都低,也不能排除存在多重共线性 的可能性。 此方法更多被用于只存在两个解释变量的情况。
3.VIF检验
VIF是方差膨胀因子的英文 (Variance Inflation Factors) 缩写, 这是一种比较正规的检验方法。该 方法通过检查指定的解释变量能够被回归方程中 其它全部解释变量所解释的程度来检测多重共线 性。方程中每个解释变量有一个VIF值,高VIF值 表明多重共线性增大了系数估计值的方差,从而 产生一个减小了的t值。
例:有人在建立某地区粮食产量回归模型时,以粮 食产量为因变量y,以化肥用量为x1,水浇地面积为 x2,农业投入资金为x3等作为自变量。 从表面上看到x1,x2,x3都是影响粮食产量的重要因 素,可是建立的回归方程效果很差,原因何在呢?
注意: 完全共线性的情况并不多见,一般出现的是在一定 程度上的共线性,即近似共线性。
第五章 计量经济学检验 ——违背基本假设的情况
一方面,建立一个计量经济学模型要经过四 重检验,其中经济意义检验、统计检验、预 测检验已讲,这一章主要讲计量经济学检验 的范畴。 另一方面,前面讨论了最小二乘估计的优良 性质,但都是基于经典假设。如果这些假设 不满足,会出现什么问题呢?这一章对其进 行分析。
一、多重共线性的概念
1、多重共线性 对于模型 Yi=0+1X1i+2X2i++kXki+i i=1,2,…,n 其基本假设之一是解释变量是互相独立的。
如果某两个或多个解释变量之间出现了相关性, 则称为多重共线性。
如果存在 c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n 其中: ci不全为0,即某一个解释变量可以用其它解 释变量的线性组合表示,则称为解释变量间存在完 全共线性。 如果存在 c1X1i+c2X2i+…+ckXki+vi=0 i=1,2,…,n 其中ci 不全为0, vi 为随机误差项,则称为一般共线性 (近似共线性)或交互相关(intercorrelated)。
本章内容
多重共线性(Multicollinearity) 异方差性(Heteroscedasticity) 自相关(Autocorrelation)
第一节 多重共线性 ( Multi-Collinearity )
多重共线性的概念 多重共线性的后果 多重共线性的检验 克服多重共线性的方法