7第五章 计量经济学检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
注意!!!
▪ RESET检验仅能检验误设定的存在,而不能告诉我 们到底是哪一类的误设定。
▪ 研究表明,RESET检验能够检验某个方程的设定误 差,即使所有传统的检验标准,如拟合优度、一阶 自相关检验、系数符号以及较高的t值都已给出令人 满意的结果。
▪ 因变量预测值的幂次从2开始,因为1次幂与x完全 线性相关。
▪ Ramsey的RESET检验只适用于LS估计的方程。
第二节 多重共线性 ( Multi-Collinearity )
▪ 多重共线性的概念 ▪ 多重共线性的后果 ▪ 多重共线性的检验 ▪ 克服多重共线性的方法
一、多重共线性的概念
1、多重共线性 对于模型
Yi=0+1X1i+2X2i++kXki+i
模型中包括无关的解释变量, (1)参数估计量仍无偏,但会增大估计量的方差,
即增大误差(证明如下:)。 (2)出现“过度拟合”,损失模型自由度。
(2) 方差变化证明
有偏估计 b1 的方差是 Var[b1] 2(X1X1)1 如果回归方程包括 X2 ,则 X1 的最小二乘系数估计为 b1.2 (X1M2X1)1X1M2Y ,其中, M 2 I X2 (X2X2 )1 X2 所以,它的协方差矩阵是矩阵 2 (XX) 1 的左上三角矩阵,
四、 解决解释变量误设定问题的原则
在模型设定中的一般原则是尽量不漏掉有关的解 释变量。因为估计量有偏比增大误差更严重。但如 果方差很大,得到的无偏估计量也就没有多大意义 了,因此也不宜随意乱增加解释变量。
在回归实践中,有时要对某个变量是否应该作为 解释变量包括在方程中作出准确的判断确实不是一 件容易的事,因为目前还没有行之有效的方法可供 使用。尽管如此,还是有一些有助于我们进行判断 的准则可用,它们是:
如果我们仅仅将 y 基于 X1 (排除了 X2 )进行回归,则估计量是:
b1 (X1 X1 )1 X1y β 1 (X1 X1 )1 X1 X2β 2 (X1 X1 )1 X1ε 取数学期望,我们发现,除非 X1 X2 0 或者β 2 0 , 则 b1 将是有偏的。
三、 包括无关的解释变量
五、 检验误设定的RESET方法
上面给出了选择解释变量的四条准则。可是,有 时这些准则不能提供足够的信息使研究人员确信其 设定是最恰当的,在这种情况下,可考虑使用一些 更正规的检验方法来比较不同估计方程的性质。这 类方法相当多,有一、二十种,这里就不一一列出, 仅介绍Ramsey的回归设定误差检验法(RESET法)。
例如,采用加法关系 y 1 2x 3x2 ε ,而没用
乘法关系
y
1x12
x
3
2
ε
。如果使用泰勒公式将乘法关系
式展开,会发现其表达式包含解释变量的幂和交叉乘积项。 因此,Ramsey 建议在 z 中包含因变量预测值的幂 (它们正好是解释变量的幂和交叉乘积的线性组合)。
RESET检验法的思路
RESET检验法的思路是在要检验的回归方程中加 进 Yˆ 2,Yˆ3和Yˆ 4 等项作为解释变量,然后看结果是否有 显著改善。如有,则可判断原方程存在遗漏有关变 量的问题或其它的误设定问题。
i=1,2,…,n 其基本假设之一是解释变量是互相独立的。
如果某两个或多个解释变量之间出现了相关性, 则称为多重共线性。
如果存在
c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n
其中: ci不全为0,即某一个解释变量可以用其它解 释变量的线性组合表示,则称为解释变量间存在完 全共线性。
第五章 计量经济学检验 ——违背基本假设的情况
▪ 一方面,建立一个计量经济学模型要经过四 重检验,其中经济意义检验、统计检验、预 测检验已讲,这一章主要讲计量经济学检验 的范畴。
▪ 另一方面,前面讨论了最小二乘估计的优良 性质,但都是基于经典假设。如果这些假设 不满足,会出现什么问题呢?这一章对其进 行分析。
X 21 X 22
ຫໍສະໝຸດ Baidu
X k1 Xk2
1 X 1n X 2n X kn
中,至少有一列向量可由其他列向量(不包
括第一列)线性表出。
例:有人在建立某地区粮食产量回归模型时,以粮 食产量为因变量y,以化肥用量为x1,水浇地面积为 x2,农业投入资金为x3等作为自变量。 从表面上看到x1,x2,x3都是影响粮食产量的重要因 素,可是建立的回归方程效果很差,原因何在呢?
ln( GDPt ) 0 1t ut
得到一国GDP的年增长率的估计值,这里t为时间 趋势变量。
二、 遗漏有关的解释变量
模型中遗漏了对因变量有显著影响的解释变量 的后果是:可能使模型参数估计量不再是无偏估 计量。证明如下:
(1) 缺乏相关变量所导致的偏差 假设正确的模型指定形式是: y x1β 1 x2 β 2 ε 上述解释变量数据矩阵的列数维数分别是 K1 和 K 2 。
解该线性方程组得:
x1i yi
ˆ1
x2i yi x12i
x2i x1i
x1i x2i
x1i yi x12i
x22i
x1i yi 2
x12i 0
x1i x2i
x12i x12i
0
x22i
x12i 2 x12i
ˆ1 为不定式; 同理, ˆ2 也为不定式,其值无法确定。
如果存在 c1X1i+c2X2i+…+ckXki+vi=0 i=1,2,…,n
其中ci不全为0,vi为随机误差项,则称为一般共线性
(近似共线性)或交互相关(intercorrelated)。
在矩阵表示的线性回归模型
Y=XB+N 中,完全共线性指:秩(X)<k+1,即矩阵
1 X 11
X
1
X 12
▪ 滞后变量的引入
在计量经济模型中,往往需要引入滞后经济变 量来反映真实的经济关系。
例如,消费=f(当期收入, 前期收入)
显然,两期收入间有较强的线性相关性。
▪ 一般经验
对于采用时间序列数据作样本、以简单线性形 式建立的计量经济学模型,往往存在多重共线性。
以截面数据作样本时,问题不那么严重,但多 重共线性仍然是存在的。
注意: 完全共线性的情况并不多见,一般出现的是在一定
程度上的共线性,即近似共线性。
2、实际经济问题中的多重共线性现象
▪ 经济变量的共同变化趋势
时间序列样本:经济繁荣时期,各基本经济 变量(收入、消费、投资、价格)都趋于增长; 衰退时期,又同时趋于下降。
横截面数据:生产函数中,资本投入与劳动 力投入往往出现高度相关情况,大企业二者都大, 小企业都小。
当这四项用于判断一个变量是否应加进回归方程的准则 出现不一致的情况时,应当特别小心。在这种情况下,作出 正确判断不是一件容易的事,但可以让事情变得容易一些, 办法是将理论准则放在第一位,再多的统计证据也不能将一 个理论上很重要的变量变成“无关”变量。
在选择变量的问题上,应当坚定不移地根据理论而不是 满意的拟合结果来作决定,对于是否将一个变量包括在回归 方程中的问题,理论是最重要的判断准则。如果不这样做, 产生不正确结果的风险很大。
2、近似共线性下普通最小二乘法参数估计量 非有效
在一般共线性(或称近似共线性)下,虽然可以得 到OLS法参数估计量,但是由参数估计量方差的表达 式为
Cov(ˆ ) 2 (XX)1
由于此时|X’X|0,从而使参数估计值的方差 增大,OLS参数估计量非有效。
从而造成所谓的“误设定”问题。
一、选择错误的函数形式
这类错误中比较常见的是将非线性关系作为线 性关系处理。
前面介绍了被解释变量和解释变量都采用对数 的双对数模型,下面再介绍一种比较常见的函数形 式的模型:半对数模型。
半对数模型
半对数模型指的是被解释变量和解释变量中一个
为对数形式而另一个为线性的模型。被解释变量为 对数形式的称为对数-线性模型(log-lin model)。解 释 变 量 为 对 数 形 式 的 称 为 线 性 - 对 数 模 型 (lin-log model)。我们先介绍前者,其形式如下:
即 Var[b1.2] 2(X1M2X1)1 或者表示为: Var[b1.2] 2[X1X1 X1X2(X2X2)1X2X1]1
我们可以通过比较它们的逆矩阵来比较 b1 和 b1.2 ,得到: Var[ b1 | X]1 Var[ b1.2 | X]1 (1/ 2 )X1X2 (X2X2 )1 X2X1 因此我们可以得到结论, b1 的方差不会大过 b1.2 的方差。
选择解释变量的四条准则
1.理论: 从理论上看,该变量是否应该作为解释变 量包括在方程中?
2. t检验:该变量的系数估计值是否显著? 3.R 2 :该变量加进方程中后,R 2 是否增大? 4. 偏倚: 该变量加进方程中后,其它变量的系数估
计值是否显著变化?
如果对四个问题的回答都是肯定的,则该变量应该包 括在方程中;如果对四个问题的回答都是“否”, 则该变 量是无关变量,可以安全地从方程中删掉它。
ln Yt 0 1Xt ut
对数-线性模型中,斜率的含义是Y的百分比变动, 即解释变量X变动一个单位引起的被解释变量Y的百 分比变动。这是因为,利用微分可以得出:
1
d ln Y dX
1 Y
dY dX
dY Y
(dX 1)
这表明,斜率度量的是解释变量X的单位变动所 引起的应变量Y的相对变动。将此相对变动乘以100, 就得到Y的百分比变动,或者说得到Y的增长率。 由于对数-线性模型中斜率系数的这一含义,因而 也叫增长模型 (growth model)。增长模型通常用于 测度所关心的经济变量(如GDP)的增长率。例如, 我们可以通过估计下面的半对数模型
RESET 检验是 Regression Specification Error Test (回归设定误差检验)的简写。
设 y x β zc ε 设定误差检验是检验上式中 c 是否为零。 但关键哪些变量应该进入 z 呢? (1)在缺失变量的情况下,那些缺失变量将构成 z。 (2)在方程设定有误时,应如何处理呢?
X X
x12i x2i x1i
x1i x2i
x
2 2i
x12i x12i
2
x12i x12i
x12i
1
2
X Y
x1i x2i
yi yi
1
x1i yi
该回归模型的正规方程为
(XX)Bˆ XY
或
ˆ1 x12i ˆ2 x1i x2i x1i yi
ˆ1 x2i x1i ˆ2 x22i x2i yi
本章内容
▪ 误设定(Misspecification 或 specification error)
▪ 多重共线性(Multicollinearity) ▪ 异方差性(Heteroscedasticity) ▪ 自相关(Autocorrelation)
第一节 误设定
采用OLS法估计模型时,实际上有一个隐含的假 设,即模型是正确设定的。这包括两方面的含义: 函数形式正确和解释变量选择正确。在实践中,这 样一个假设或许从来也不现实。我们可能犯下列三 个方面的错误: ▪ 选择错误的函数形式 ▪ 遗漏有关的解释变量 ▪ 包括无关的解释变量
RESET检验法的步骤
RESET检验的具体步骤是: (1) 用OLS法估计要要检验的方程,得到
Yˆi ˆ0 ˆ1X1i ˆ2 X 2i
(2) 由上一步得到的值 (i=1,2Y,ˆ…i ,n),计算
,
然后Yˆ用2,YOˆ3和LSYˆ法4 估计:
Yi 0 1X1i 2 X 2i 3Yˆi2 4Yˆi3 5Yˆi4 ui
二、多重共线性的后果
1、完全共线性下参数估计量不存在
多元线性模型
Y X
的普通最小二乘参数估计量为:
( X X ) 1 X Y
(2.6.4)
如果存在完全共线性,则(X’X) -1不存在,无法得 到参数的估计量。
例如:对一个离差形式的二元回归模型
y 1 x1 2 x2
如果两个解释变量完全相关,如x2 x1 ,则有
(3) 用F检验比较两个方程的拟合情况(类似于上一章中 联合假设检验采用的方法),如果两方程总体拟合情况 显著不同,则我们得出原方程可能存在误设定的结论。 使用的检验统计量为:
F (RSSM RSS ) / M RSS /(n k 1)
其中:RSSM为第一步中回归(有约束回归)的残差 平方和,RSS为第二步中回归(无约束回归)的残差 平方和,M为约束条件的个数,这里是M=3。