第五章 计量经济学检验违背基本假设的情况

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4.逐步回归法
以Y为被解释变量,逐个引入解释变量,构成
回归模型,进行模型估计。根据拟合优度的变化 决定新引入的变量是否可以用其它变量的线性组 合代替,而不作为独立的解释变量。 如果拟合优度变化显著,则说明新引入的变量 是一个独立解释变量;
如果拟合优度变化很不显著,则说明新引入的 变量不是一个独立解释变量,它可以用其它变量 的线性组合代替,也就是说它与其它变量之间存 在共线性关系。
四、克服多重共线性的方法
1、第一类方法:排除引起共线性的变量
找出引起多重共线性的解释变量,将它排除出去, 是最为有效的克服多重共线性问题的方法。
注意: 剩余解释变量参数的经济含义和数值都发生了变化。
2、第二类方法:差分法 对于以时间序列数据为样本、以直接线性关系
为模型关系形式的计量经济学模型,将原模型变 换为差分模型 Yi=1 X1i+2 X2i++k Xki+ i 可以有效地消除存在于原模型中的多重共线性。 一般讲,增量之间的线性关系远比总量之间的 线性关系弱得多。
本章内容
多重共线性(Multicollinearity) 异方差性(Heteroscedasticity) 自相关(Autocorrelation)
第一节 多重共线性 ( Multi-Collinearity )
多重共线性的概念 多重共线性的后果 多重共线性的检验 克服多重共线性的方法
2 越强(即 R k . 越大),则由于多重共线性,该系数估计的方差就越大。
一种最普遍的情形是,解释变量之间是高度相关,而不是 确切相关的。在这种情形下,回归模型仍然保持那些常见的性质, 但是出现了一些潜在的统计问题: 1. 数据扰动存在巨大影响。 2. 虽然模型的整体效果比较好( R 较大),但参数b不显著。 3. 导致参数估计“变性”(符号不合理)。 4.解释变量前的参数并不反映各自与被解释变量之间的结构 关系,而是反映它们对被解释变量的共同影响。
如果这两个解释变量是完全相关的,则上述方差具有无限大。 确切相关的情形是完全违反了模型的假设,这不是数据的问题。
若模型中存在k个解释变量: 为了方便,定义数据矩阵 X 包含常数和 ( K 1) 个利用与均值偏离 度量的解释变量。假设 x k 表示第 k 个变量, X (k ) 表示剩余的包括常数 项的变量,则逆矩阵 ( X X) 1 中的第 k 个对角元是:
2 Var[bk ] n 2 (1 Rk . )i 1 ( xik x k ) 2
该公式表明: (1) 在其他情况相同时, x k 与其它解释变量之间的相关性 (2) 在其他情况相同时, x k 自身的变差越大,则该系数估计 的方差就越小。 (3) 在其他情况相同时,线性模型的整体拟合效果越好 (体现在 2 上),则该系数估计的方差就越小。
ˆ Cov () 2 ( X X) 1
由于此时|X’X|0,从而使参数估计值的方差 增大,OLS参数估计量非有效。
例如,如果一个模型中仅仅包含两个解释变量和一个常数, 则对其中任何一个斜率系数,可以得到:
2 2 Var[bk ] , k 1, 2 n 2 2 2 (1 r12 ) S kk (1 r12 )i 1 ( xik x k )
Байду номын сангаас
在矩阵表示的线性回归模型 Y=XB+N 中,完全共线性指:秩(X)<k+1,即矩阵
1 X 11 1 X 12 X 1 X 1n X 21 X 22 X 2n X k1 X k2 X kn
中,至少有一列向量可由其他列向量(不包 括第一列)线性表出。
2、实际经济问题中的多重共线性现象
经济变量的共同变化趋势
时间序列样本:经济繁荣时期,各基本经济 变量(收入、消费、投资、价格)都趋于增长; 衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动 力投入往往出现高度相关情况,大企业二者都大, 小企业都小。
滞后变量的引入
在计量经济模型中,往往需要引入滞后经济变 量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。
一、多重共线性的概念
1、多重共线性 对于模型 Yi=0+1X1i+2X2i++kXki+i i=1,2,…,n 其基本假设之一是解释变量是互相独立的。
如果某两个或多个解释变量之间出现了相关性, 则称为多重共线性。
如果存在 c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n 其中: ci不全为0,即某一个解释变量可以用其它解 释变量的线性组合表示,则称为解释变量间存在完 全共线性。 如果存在 c1X1i+c2X2i+…+ckXki+vi=0 i=1,2,…,n 其中ci 不全为0, vi 为随机误差项,则称为一般共线性 (近似共线性)或交互相关(intercorrelated)。
第五章 计量经济学检验 ——违背基本假设的情况
一方面,建立一个计量经济学模型要经过四 重检验,其中经济意义检验、统计检验、预 测检验已讲,这一章主要讲计量经济学检验 的范畴。 另一方面,前面讨论了最小二乘估计的优良 性质,但都是基于经典假设。如果这些假设 不满足,会出现什么问题呢?这一章对其进 行分析。
统计软件一般提供各解释变量两两之间的相关 系数矩阵,如发现某些相关系数高(绝对值高于 0.8),则表明多重共线性存在。但即使解释变量两 两之间的相关系数都低,也不能排除存在多重共线性 的可能性。 此方法更多被用于只存在两个解释变量的情况。
3.VIF检验
VIF是方差膨胀因子的英文 (Variance Inflation Factors) 缩写, 这是一种比较正规的检验方法。该 方法通过检查指定的解释变量能够被回归方程中 其它全部解释变量所解释的程度来检测多重共线 性。方程中每个解释变量有一个VIF值,高VIF值 表明多重共线性增大了系数估计值的方差,从而 产生一个减小了的t值。
一般经验
对于采用时间序列数据作样本、以简单线性形 式建立的计量经济学模型,往往存在多重共线性。
以截面数据作样本时,问题不那么严重,但多 重共线性仍然是存在的。
二、多重共线性的后果
1、完全共线性下参数估计量不存在
多元线性模型
Y X
的普通最小二乘参数估计量为:
( X X ) 1 X Y
1

1
2 这里 R k . 是 x k 基于其它解释变量进行回归的决定系数 R 2 。在多元线性
回归模型中,第 k 个系数最小二乘估计的方差是 2 乘以这个比值。因此,当 x k
2 与其它解释变量之间的相关性越强(即 R k . 越大),则该系数估计的方差就越大。
从而bk的方差为:
其中,方差膨胀因子定义为:
1 VIF 2 1 Rk .
VIF检验的具体步骤如下:
设原方程为:Y = 0 + 1X1 + 2X2 + … + kXk + u 我们需要计算K个不同的VIF,每个Xi 一个。为指定Xi 计算 VIF涉及以下三步: (1) Xi 对原方程中其它全部解释变量进行OLS回归,例如 ,若i =1,则回归下面的方程:
ˆ ˆ 1 x12i 2 x1i x 2i x1i y i
2 ˆ ˆ 1 x 2i x1i 2 x 2i x 2i y i
解该线性方程组得:
ˆ 1
x y x x x y x x x x x x x
1i i 1i 2i i 2 2i 2 1i 1i 2 i 1i
2i

2i
2 2i
x y x y x x
1i i 1i 2 1i 2 1i
i
x12i 2 x12i
x12i 2 x12i

0 0
ˆ 1 为不定式;
ˆ 同理, 2 也为不定式,其值无法确定。
2、近似共线性下普通最小二乘法参数估计量 非有效
在一般共线性(或称近似共线性)下,虽然可以得 到OLS法参数估计量,但是由参数估计量方差的表达 式为
例:有人在建立某地区粮食产量回归模型时,以粮 食产量为因变量y,以化肥用量为x1,水浇地面积为 x2,农业投入资金为x3等作为自变量。 从表面上看到x1,x2,x3都是影响粮食产量的重要因 素,可是建立的回归方程效果很差,原因何在呢?
注意: 完全共线性的情况并不多见,一般出现的是在一定 程度上的共线性,即近似共线性。
2
三、多重共线性的检验
由于实际样本数据永远不会是正交的,则多 重共线性总是在一定程度上存在的。但是, 什么时候多重共线性成为严重的问题呢?也 就是受到变量之间交互关系影响促使估计量 方差扩散到什么程度时,才能够引起我们的 关注呢? 检验多重共线性的方法主要有:经验判断法、 相关系数判断法、条件数判断法、方差膨胀 因子判断法、逐步回归判断法等。
例如:在中国消费模型中的2个变量:
收入(Y:GDP)与消费 C 的总量与增量数据
1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 Y 4901 5489 6076 7164 8792 10133 11784 14704 16466 18320 21280 25864 34501 47111 59405 68498 C(-1) 2976 3309 3638 4021 4694 5773 6542 7451 9360 10556 11362 13146 15952 20182 27216 34529 C(-1)/Y 0.6072 0.6028 0.5996 0.5613 0.5339 0.5697 0.5552 0.5067 0.5684 0.5762 0.5339 0.5083 0.4624 0.4284 0.4581 0.5041
1.经验判别法(最常用的方法)
在OLS法下,模型的R2与F值较大,但各参数估 计值的t检验值较小,说明各解释变量对Y的联合线性 作用显著,但各解释变量间存在共线性而使得它们对 Y的独立作用不能分辨,故t检验不显著。 此方法简便易行,因而是实践中最常用的方法,缺 点是无法确诊。
2.使用相关矩阵检验
x12i 1 x12i 2 2 2 x1i
x1i y i 1 X Y x y x1i y i 2i i
该回归模型的正规方程为 ˆ ( X X) B X Y 或
X1 = 1 + 2X2 + 3X3 +… + kXk +v
(2) 计算的方差膨胀因子(VIF):
ˆ VIF ( i ) 1 (1 Ri2 )
其中Ri2是第一步辅助回归的决定系数。
(3) 分析多重共线性的程度
VIF越高, 多重共线性的影响越严重。由于没 有VIF临界值表,我们只能使用经验法则:有人 建议用VIF>10作为存在严重多重共线性的标准, 特别在解释变量多的情形应当如此。
(x M ( k ) x k ) 1 [x x k x X ( k ) ( Xk ) X ( k ) ) 1 Xk ) x k ]1 k k k ( ( xk X( k ) ( Xk ) X( k ) ) Xk ) xk ( ( x x k 1 k x x k k 1 (1 Rk2. ) Skk
(2.6.4)
如果存在完全共线性,则(X’X) -1不存在,无法得 到参数的估计量。
例如:对一个离差形式的二元回归模型
y 1 x1 2 x 2
如果两个解释变量完全相关,如x 2 x1 ,则有
x12i X X x x 2 i 1i x1i x 2i x12i 2 x 2i x12i
相关文档
最新文档