计量经济学-设定误差与测量误差

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

可能会对模型形成不良的后果。
13
二、变量设定误差的后果
当模型设定出现误差时,模型估计结果也会与
“实际”有偏误;
偏误的性质与程度与模型设定误差的类型密切相
关。
从实质上看,变量设定误差的主要后果,是一个
或多个解释变量与随机扰动项之间存在着相关性,
进而影响参数估计的统计特性。
14
1. 遗漏相关变量(欠拟合)偏误
错误称为无关变量的误选(“过拟合”)。
12
设定误差的原因
●数据来源渠道可能不畅。例如,数据很难取得被
迫将具有重要的经济意义变量排斥在模型之外。
●不知道变量应当以什么确切的函数形式出现在回
归模型中。
●事先并不知道所研究的实证数据中所隐含的真实
模型究竟是什么。
设定误差在建模中较容易出现。设定误差的存在
19
ˆ) 如果 X 3 与 X 2 相关,显然有 Var( ˆ2 ) Var( 2
ˆ) 如果 X 3与 X 2不相关,也有 Var( ˆ2 ) Var( 2
4. 遗漏变量 X 3 ,式中的随机扰动项 vi的方差估计 量将是有偏的,即:
2 ˆ v RSSv (n - 2)
2 2 ˆv E u
采用遗漏了重要解释变量的模型进行估计而带来 的偏误,称为遗漏相关变量偏误。
设正确的模型为:
Yi 1 2 X 2i 3i X 3i ui
正确模型离差形式为:
yi 2 x2i 2 x3i (ui - u )
15
却对方程 Yi 1 2 X 2i i 进行回归,得: 取期望
(1)
但却估计了 Y α α X α X v (2) 1 2 2 3 3 如果 3 0,则(2)与(1)相同,因此,可将(1)式 视为以 3 0 为约束的(2)式的特殊形式。 采用OLS 法对(2)进行估计,有:
24
ˆ2
x y x -x y x x x - ( x x )
28
第二节 设定误差的检验
本节基本内容:
●DW检验 ●拉各朗日乘数检验 ●一般性检验
29
对变量设定误差进行检验必须在经济理论指导下进行,
不可抛弃经济理论而进行假设检验。 对于是否误选无关变量的检验,只要针对无关变量系 数的期望值为零的假设,用t检验或F检验,对无关变 量系数作显著性检验即可。
对于遗漏变量设定误差的检验有多种方法,例如DW 检验、拉格朗日乘数检验、豪斯曼检验、RESET 一 般性检验等。 这里只讨论设定误差的一些最常用的检验方法。


Y = 1 + 2 X 2 + v
Y = β1 + β2 X 2 + β3 X 3 + u


v2 ˆ2 ) Var( 2 x2i
ˆ ) Var( 2
x x x (1- x x
2 2i 2 i 3i 2 2i

2
2 3i
)
u2 2 2 x (1r 2i 23 )
7
• 经济学家多年来对真理的寻求曾给人一种 感觉:经济学家们就好像在一间黑房子里 搜寻一只原本并不存在的黑猫,而计量经 济学家还声称找到了一只。
8
一、设定误差及类型
计量经济模型是对变量间经济关系因果性的设想, 若所设定的回归模型是“正确”的,主要任务是所 选模型参数的估计和假设检验。但是如果对计量模 型的各种诊断或检验总不能令人满意,这时应把注 意力集中到模型的设定方面: 考虑所建模型是否遗漏了重要的变量? 是否包含了多余的变量? 所选模型的函数形式是否正确? 随机扰动项的设定是否合理? 变量的数据收集是否有误差? 9 所有这些,计量经济学中被统称为设定误差。
1
此结论对 ˆ 也成立。
3. 随机误差项的方差的估计仍为无偏估计。 接受错误假设的概率会较高。
ˆ 2 方差增大, 4. 通常的区间估计和假设检验程序依然有效,但
27
遗漏相关变量百度文库误选无关变量的比较
(1)遗漏相关变量 将导致参数估计量和假设检验有偏且不一致; (2)误选无关变量 虽参数估计量具无偏性、一致性,又会损失有效性。 (3)注重检验的无偏性、一致性 宁愿误选无关变量也不愿遗漏相关变量; (4)注重估计量的有效性,宁愿删除相关变量。 通常误选无关变量不如遗漏相关变量的后果严重。 因此,模型的设定实际是对偏误与有效进行权衡,偏爱哪一 方取决于模型的研究目的。权衡和折中可用均方误差准则 (MSE)。
x x - ( x
2 2i 2 3i
2i 3i
x )
2
ˆ 2 ) 2 Var( ˆ2 ) 期望和方差: E(
x
v2
(1- r )
25
2 2i
2 23
无关变量的设定误差的后果
1. 可以证明,(2)式参数的OLS估计量是无偏, 且为一致性的。即:
ˆ1 ) 1 , E(
IM = -172.42 + 0.271GDP - 949.12T + 160.73T 2 - 10.18T 3
t (-0.177) (5.67) (-2.22) (2.20)
R2 0.991 F 272.95
(-2.74)
DW 1.97
2
有人根据“简单优于复杂”原则,得到以下方程:
ˆ ) Var( ˆ 2 ); Var( 2
若这两个等式成立,意味着尽管变量 X 3,在理 论上分析是有关的变量,但从所选模型中略去 似乎也不会导致什么危害。这种认识实际也不 正确。
22
因为
2 ˆ v2 ˆ RSSv n - 2 RSSu n -3 u ˆ ˆ ˆ2 ) ˆ 2 ) Var( 是Var( 2 2 2 2 x x x x 2i 2i 2i 2i
30
一、 DW检验
基本思想:
遗漏的相关变量应包含在随机扰动项中,那么回 归所得的残差序列就会呈现单侧的正(负)相关 性,因此可从自相关性的角度检验相关变量的遗 漏。 从遗漏变量的模型看,可以认为遗漏变量模型是 无遗漏变量模型的一个特例:被遗漏变量的系数 为 0。
10
1. 相关变量的遗漏
(Omitting Relevant Variables)
例如,如果“正确”的模型为
Yi 1 2 X 2i 3 X 3i i
而我们将模型设定为
Yi 1 2 X 2i i
即设定模型时漏掉了一个相关的解释变量。 这类错误称为遗漏相关变量(“欠拟合”)。
11
2. 无关变量的误选
(Including Irrevelant Variables)
例如,如果“真实模型”为:
Yi 1 2 X 2i 3 X 3i i
但我们却将模型设定为
Yi 1 2 X 2i 3 X 3i 4 X 4i i
即设定模型时,多选了一个无关解释变量。这类
ˆ3 ) 3 0 E(
同理,可证明:
ˆ 2 ) 2 E(
ˆ2 2 p lim
ˆ1 1 p lim
n
ˆ 3 3 0 p lim
n
26
n
ˆ 2 不是有效估计量: 2.
ˆ2 ) Var( 1 v2 2 2 ˆ Var( 2 ) (1- r23 ) u
IM -217.186 0.173GDP
t (-0.5) (16.94)
(2)
R2 0.960 F 286.95 进行比较:
DW 0.735
两个方程的检验结果都较理想;
方程(2)GDP的t检验值似乎优于方程(1); 方程(2)函数形式也更为简单; 然而,能否根据“Occam’s razor”原则,判断方程(2)比 方程(1)好? 3
ˆ1 ) 1 E( ˆ1 ) 1 且 p lim(
n
ˆ2 ) 2 E( ˆ2 ) 2 p lim(
n
2. 如果X 3 与 X 不相关,则 2的估计满足无偏性与一致 2
性;但这时 的估计却是有偏的。
1
18
ˆ 方差的有偏估计: 3. ˆ 2 的方差是 2
设定误差的类型
从误差来源看,设定误差主要包括: (1)变量的设定误差,包括相关变量的遗漏 (欠拟合)、无关变量的误选(过拟合); (2)变量数据的测量误差; (3)模型函数形式的设定误差; (4)随机扰动项设定误差。 本章主要讨论的两类变量设定误差: (1)相关变量的遗漏(欠拟合); (2)无关变量的误选(过拟合)。
ˆ2 RSSv (n 2) RSSu (n 3) ˆu2 ;
因此,有可能:
RSSv (n 2) RSSu (n 3);
21
(2)若X 3与X 2 不相关,有
2 r23 0和 x2i x3i 2 x 2i 0;
似乎分别有: ˆ 2 2 E
ˆ 2 2 3
x x x
2i 2 2i
3i
x (u x
2i
3i 2 2i
i 2 2i
-u)
ˆ 2 E 2 3 E
x x x
2i
x (u x
2i
i 2 2i
-u)
16
遗漏变量设定误差的后果
X 3的遗漏将产生如下后果。 由此可以看出,
计量经济学
第 九 章 设定误差与测量误差
1
引子:简单一定胜于复杂吗?
西方国家盛行奥卡姆剃刀(Occam`s razor)原则,威廉修士称原理为“如 无必要,勿增实体”(意思是“简单优于复杂”的节约性原则)。这一原 理最常见的形式是:如果你有两个原理,它们都能解释观测到的事实, 那么你应该使用简单的那个,直到发现更多的证据。(经济原理、吝啬 定律、朴素原则)。经济模型永远无法完全把握现实,在建立模型中一 定的抽象和简化是不可避免的。 在研究进口与国内生产总值的关系时,考虑到时间趋势,建立并估计了 以下模型
2i i 2 3i 3i i 2 2i 2 3i 2i 3i
2i 3i 2
x
将(1)式的离差形式代入, yi 2 x2i (ui u ) 整理得:
ˆ2 2
( x )( x2i (ui - u )) - ( x2i x3i )( x3i (ui - u ))
2 3i
5. 与方差相关的检验,包括假设检验、区间估计,
在关于参数的统计显著性方面,都容易导出错误的
结论。
20
特别注意
(1) 若
ˆ ˆ 2 Var X3与X 2相关,r 0,显然,Var 2 ˆ ; ˆ Var 似乎有:Var
2 23
2

2
但实际情形并不完全如此。 可以注意到残差平方和RSS的计算
的有偏估计,即使 X 3与X 2 不相关,也有 ˆ ) Var( ˆ ˆ ˆ ), Var(
2
致使假设检验程序很有可能是可疑的。
必须清楚,一旦根据相关理论把模型建立起来,
再从中删除变量需要有充分的理由并十分谨慎。
23
2. 包含无关变量偏误
定义:模型中包括了不重要的解释变量,即采用误 选了无关解释变量的模型进行估计而带来的偏误, 称为包含无关变量偏误 设正确模型 Y = β1 + β2 X 2 + μ
对模型的设定是计量经济研究的重要环节。 前面各章除了对随机扰动项 ui 分布的基本假定以 外,还强调:
假定设定的模型对变量和函数形式的设定是
正确地描述被解释变量与解释变量之间的真实关
系,假定模型中的变量没有测量误差。
但是在实际的建模实践中,对模型的设定不一定
能够完全满足这样的要求,从而会使模型出现设
定误差。
4
第九章 设定误差与测量误差
本章主要讨论:
●设定误差 ●设定误差的检验 ●测量误差
5
第一节 设定误差
本节基本内容:
●设定误差及类型 ●变量设定误差的后果
6
• 不能机械的做应用计量经济学,他需要理 解、直觉和技巧: • …通常我们在驾车通过一座桥梁时,并不 担心其结构的可靠性,因为我们合理的相 信已经有人严格的检查过其工程的原理和 实践。经济学家做模型时也必须这样,否 则的话,就必须奉送一句警告“使用导致 坍塌概不负责。”
两边取概率极限,有:
Cov X 2i , X 3i Cov X 2i , ui ˆ 2 2 3 p lim Var X 2i Var X 2i n
17
1. 如果漏掉的X 3与 X 相关,则参数估计值是有偏且不一致
2
的。分别在小样本下求期望、在大样本下求概率极限, 有:
相关文档
最新文档