第九章_设定误差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
传统建模方法的过程
(1)根据有关经济理论的阐释或社会经济实践的惯 常经验,选择模型应当包含的变量及模型具体的函 数形式,构建理论模型。 (2)收集相关变量的样板观测数据,采用一定的计 量经济学方法,对模型参数进行估计,求出理论模 型的样本估计式。 (3)对模型样本估计式进行理论检验,统计检验及 计量经济学检验,如果检验结果能满足先验假设的 要求,模型估计式便被接受。
然后用F统计量进行检验。
j 1,2,3
2 2 ( R R ( RSS R RSSU ) J U R) J F 2 RSSU [n ( k J )] (1 RU [n ( k J )]
其中RSSR和RR2分别是对(1)式回归得到的残差平 方和与拟合优度,RSSU和RU2分别是对(2)式回归 得到的残差平方和与拟合优度,J 为约束条件的 个数,在这里 J=3; 4、若F统计量的值大于临界值,则拒绝H0,表明有 设定误差,否则,表明无设定误差。
15
一、DW检验
基本思想:遗漏的相关变量应包含在随机扰动项中, 那么回归所得的残差序列就会呈现自相关性。
Yi 1 2 X 2 i 3 X 3 i ui 以 Yi 1 2 X 2 i v i
为例。
因此可从自相关性的角度检验相关变量的遗漏。
16
Yi X i ei ui X i vi
为使问题简化,假定
2 e ~ N ( 0 , ui ~ N (0, ), i e )
(2)
2 u
且 ui 和 ei 是不相关的,于是
var( ui ei )
2 v 2 u
2 e
因此,如果用OLS分别估计(1)和(2)式,得
有遗漏。
19
三、一般性检验
一般性检验(RESET, regression specification error
基本思想:在事先不知道遗漏哪个变量的情况下, 可寻找一个替代变量 Z 来检验。若模型回归所得的 残差包含着遗漏的相关变量,那么这个残差可用被 解释变量拟合值的某个函数近似表示。因此替代变 量 Z 通常选用所设定模型被解释变量拟合值的若干 次幂的线性组合,若这个线性组合是显著的,则认 为存在遗漏相关变量。
由于
(2)
E (vi ) E (ui ei ) 0
E ( X i ) E ( X ei ) X
* i * i
所以 Cov( X i , vi ) E[ X i E ( X i )][ v i E (vi )]
E ( X i X )v i
* i
E ( ei )( ei ui )
2
所以 RSS TSS (1 R 2 )
2 RSSU TSSU (1 RU )
故
2 RSS R TSS R (1 RR ),
23
注意到 于是
TSS R TSSU TSS (Yi Y )2
( RSS R RSSU ) J F RSSU [n ( k J )]
17
二、拉格朗日乘数检验
基本思想:遗漏的相关变量应包含在随机扰动中, 因此回归所得的残差序列应与遗漏的相关变量呈现 出某种依存关系,所以对残差序列与相关变量进行 回归,若相关变量具有统计显著性,则认为存在遗 漏相关变量形成的设定误差。
18
拉格朗日乘数检验步骤如下:
1、对设定的回归模型运用OLS估计得残差序列 ei ;
2 2 TSS[(1 RR ) (1 RU ) J 2 TSS (1 RU [n ( k J )]
2 2 ( RU RR ) J 2 (1 RU [n ( k J )]
24
第三节 测量误差
在计量经济模型中,由于变量使用了不准确的数据, 而导致的模型误差称为测量误差。 主要原因有: (1)理论误差。汇总数据可能只是理论值的近似而 形成理论误差; (2)登记误差。由于虚报或误报而产生登记误差; (3)统计误差。由于统计口径不一致或误解指标含 义而产生统计误差; (4)整理误差。由于汇总计算而产生的数据整理误差。
是否遗漏了重要的变量? 是否包含了多余的变量? 模型的函数形式是否正确?
随机扰动项的设定是否合理?
数据收集是否有误差?
7
变量的ห้องสมุดไป่ตู้定误差
模型函数的设定误差
模型设定误差 随机扰动项的设定误差 变量数据的测量误差 本章主要讨论:
变量的设定误差
变量数据的测量误差
8
第一节 设定误差
一、变量设定误差的后果
20
test)是拉姆齐(Ramsey)于1969年提出的一种检验方法
一般性检验步骤如下: 1、对设定的回归模型
Yi 1 2 X 2i k X ki ui
ˆ 运用OLS估计得被解释变量拟合值 Y i ˆ 的线性组合作为替代变量(工具变量), 2、以 Y i ˆ 的平方、立方和四次方的线性 通常选择 Y i 组合,对下列模型进行估计:
12
总
结
1.遗漏相关变量,则系数既有偏误且非一致、随机 误差的估计不正确、假设检验无效;
2.包含无关变量,依然给出真实模型中的系数的无 偏且一致估计量、随机误差的估计正确、假设检验 有效;唯一代价是:系数的方差估计变大了! 虽然误选无关变量不如遗漏相关变量的后果严 重,但我们也不能下结论:与其略掉相关变量,不 如包含无关变量。因为增加无关变量将导致估计量 的方差增大,引起参数估计精度下降,并且将引发 多重共线性的问题,还将导致自由度的损失!
2、引入无关变量(过拟合)的后果
把采用误选了无关解释变量的模型进行估计而带 来的偏误,称为引入无关变量误差。
假定真实模型为: Yi =β1 +β2 X2i + ui
而加入了无关解释变量 X3,模型被设定为:
Yi =α1 +α2 X2i + α3 X3i + vi
这时,参数的OLS估计量是无偏的和一致的,但不 是有效估计量。
22
对F统计量的说明
若F较小,意味着RSSR与RSSU接近,即ui与vi接 近,从而 1 , 2, 3 都接近于零,即原假设H0 成立,反之若F较大,表明原假设不成立,所以 可用F统计量检验。 式子中除以J和n-(k+J)是为了分别消除约束个数 和自由度的影响。
ESS RSS 1 因为 R TSS TSS
3
计量经济模型的传统建模方法的缺陷
实际经济问题范围广泛,类型多样,经济理论难易 对所有对象都给出具体的阐释,实践经验也不总是 能够提供可以借鉴的参照。在这种情况下,理论模 型的构建就将因缺乏依据而不能令人信服。 即使所研究的问题有相关理论的说明或实际经验的 参考,但对于某个具体的经济现象,有其特殊性, 是否一定符合理论与经验的常规,还是一个有待证 明的问题。 有时虽然能根据经济理论和实际经验构建出一个好 的理论模型,但由于数据资料不满足要求,参数估 计困难等原因,使其不具有实用性。
变量设定误差主要有两类: 相关变量的遗漏(欠拟合) 无关变量的误选(过拟合)
9
1、遗漏相关变量(欠拟合)的后果
把采用遗漏了重要解释变量的模型进行估计而带 来的偏误,称为遗漏相关变量误差。
假定真实模型为: Yi =β1 +β2 X2i +β3X3i + ui 但因某种原因遗漏了解释变量 X3,而将模型设为:
13
第二节 设定误差的检验
引入无关变量的检验
模型误选了无关解释变量的检验,比较简单,只要 针对变量系数为零的假设,用 t 检验或 F 检验,对 变量系数作显著性检验即可判断哪些变量是无关变 量。
14
遗漏相关变量的检验 模型遗漏重要解释变量的检验要相对复杂,方法主 要有: (1) DW检验 (2) 拉格朗日乘数检验 (3) 一般性检验 除此之外,还有似然比检验、沃尔德检验、豪斯曼 检验等。
(1)
ˆ2 Y ˆ3 Y ˆ4 v Yi 1 2 X 2i k X ki 1Y i 2 i 3 i i
ˆ2 Y ˆ3 Y ˆ4) (实际上,认为 ei 1Y i 2 i 3 i
(2)
21
j 0, 3、构造原假设 H0:
28
2、解释变量的测量误差 设真实的模型为
Yi X i* ui
(1)
其中Yi 、Xi*分别为被解释变量和解释变量的理论值。 假设解释变量的观测值Xi 与理论值之间存在一个测 量误差 ei ,即
X i* X i ei
则(1)式变为
29
Yi X i ei ui X i vi
2、用ei对全部的解释变量(包括遗漏变量)进 行回归,得可决系数R2; 3、假设 H0:未遗漏相关变量,H1:遗漏相关变量; 4、构造检验统计量nR2 ,在大样本情况下,
nR2~x2(m),m为受约束变量的个数
5、进行判断:若nR2>x2(m) ,则拒绝原假设,
表明遗漏了重要的解释变量,否则,表明没
4
“好的”模型具有的特性
一、简单性
模型永远无法完全把握现实,并非越复杂的模型越 能反映现实,在建模过程中一定程度的抽象或简化 反而是更易操作和抓住关键。
对于给定的一组数据,每个参数只有一个估计值。
二、可识别性
5
三、拟合优度
回归分析的基本思想是用模型中所包含的变量来尽 可能地解释被解释变量的变化。因此,拟合优度越 高,则认为模型就越好。
无论拟合优度多高,一旦模型中的一个或多个参数 的符号有误,该模型就不是一个好的模型。
四、理论一致性
五、预测功效
Friedman: 对模型的真实性的唯一重要的检验是预 测值与经验值的比较。即:模型预测越准确,模型 越好!
6
如果模型不是“好”模型,那就要考虑模型的设定 是否正确,具体来说:
25
一、测量误差的后果
1、被解释变量的测量误差 设真实的模型为
Yi X i u i
*
(1)
其中Yi* 为被解释变量的理论值,Xi为解释变量的理 论值。 假设由于某种原因,被解释变量的观测值 Yi 与理论 值之间存在一个测量误差 ei ,即
Yi Yi* ei
26
于是上述模型相应变为
E ( ei2 ) E ( ei ui )
E (e ) 0
2 i 2 e
30
这说明模型(2)中解释变量 Xi 与随机误差项 vi 是相 关的,在这种情况下,如果运用OLS估计系数,则
27
对于(1)式 对于(2)式 由于
ˆ) Var (
2 x i
2 u
ˆ) Var(
x
v2
2 i
x
2 u
2 i
2 x i
e2
0,
2 e
2 x i 0
所以当被解释变量存在测量误差时,将会增大回归系 数估计值的误差,并且误差幅度随着测量误差的增大 而增大。
DW检验步骤如下: 1、对设定的回归模型运用OLS估计得残差序列 ei ; 2、假设 H0:未遗漏相关变量,H1:遗漏相关变量 ; 3、计算DW统计量: n 2 ( e e ) i i 1 DW i 2 n 2 e i
i 1
4、查DW表,得临界值dL和dU,进行判断,如 果DW值显著,则拒绝原假设,表明遗漏了 重要的解释变量,否则,表明没有遗漏。
Yi =α1 +α2X2i + vi
10
1.如果遗漏的解释变量 X3和含有的X2相关,则α1和α2 的OLS估计值是有偏的,且非一致的,且偏离程度 随着相关程度的增加而增大。 2.如果遗漏的解释变量 X3 和含有的X1不相关, α2 的 估计值是无偏误的,但截距项α1 的估计值依然是有 偏误的。
11
第九章 设定误差与测量误差 (Specification Error and Measurement Error)
1
在前面的章节中,我们考虑回归模型时,我们 隐含地假定了所选择的模型“是对现实的真实反 映”,即它正确地反映了所研究的系统的运行机制。 用专业术语讲,就是假定所选模型中不存在设定误 差。 但完全正确的模型设定只有理论意义,在实践 中也许永远达不到。我们只是希望找到一个能够合 理反映现实的模型,即一个好的模型。