计量经济学 第二版 庞皓 第九章 设定误差与测量误差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
若这两个等式成立, 若这两个等式成立,意味着尽管变量 X3 ,在 理论上分析是有关的变量, 理论上分析是有关的变量,但从所选模型中略 去似乎也不会导致什么危害。 去似乎也不会导致什么危害。这种认识实际也 不正确。 不正确。
20
因为
RSSv n - 2 σ u2 ˆ ) = ˆ = RSSu n - 3 ˆ ˆ ˆ Var(α 2 ) = = 是Var(β 2 2 2 2 2 x2i x2i x2i x2i ∑ ∑ ∑ ∑ ˆ σ v2
设定误差的类型
从误差来源看,设定误差主要包括: 从误差来源看,设定误差主要包括: (1)变量的设定误差,包括相关变量的遗漏 )变量的设定误差, 欠拟合)、无关变量的误选(过拟合); )、无关变量的误选 (欠拟合)、无关变量的误选(过拟合); (2)变量数据的测量误差; )变量数据的测量误差; (3)模型函数形式的设定误差; )模型函数形式的设定误差; (4)随机扰动项设定误差。 )随机扰动项设定误差。 本章主要讨论的两类变量设定误差: 本章主要讨论的两类变量设定误差
11
二、变量设定误差的后果
当模型设定出现误差时, 当模型设定出现误差时,模型估计结果也会与 “实际”有偏误; 实际”有偏误; 偏误的性质与程度与模型设定误差的类型密切相 关。 从实质上看,变量设定误差的主要后果, 从实质上看,变量设定误差的主要后果,是一个 或多个解释变量与随机扰动项之间存在着相关性, 或多个解释变量与随机扰动项之间存在着相关性, 进而影响参数估计的统计特性。 进而影响参数估计的统计特性。
例如,如果“真实模型” 例如,如果“真实模型”为:
Y = β1 + β2 X2i + β3X3i + µi i
但我们却将模型设定为
Y =α1 +α2 X2i +α3X3i +α4 X4i +νi i
即设定模型时,多选了一个无关解释变量。 即设定模型时,多选了一个无关解释变量。这类 错误称为无关变量的误选( 过拟合” 错误称为无关变量的误选(“过拟合”)。
IM = -217.186 + 0.173G P D
t = (-0.5) ( 16.94)
(2)
R2 = 0.960 F = 286.95
D = 0.735 W
进行比较: 进行比较:
两个方程的检验结果都较理想; 两个方程的检验结果都较理想; 方程( ) 检验值似乎优于方程( ); 方程(2)GDP的t检验值似乎优于方程(1); 的 检验值似乎优于方程 方程( )函数形式也更为简单; 方程(2)函数形式也更为简单; 然而,能否根据“ 原则, 然而,能否根据“Occam’s razor”原则,判断方程(2)比 原则 判断方程( ) 方程( ) 方程(1)好?
计量经济学
第 九 章 设定误差与测量误差
1
引子:简单一定胜于复杂吗? 引子:简单一定胜于复杂吗?
西方国家盛行“ 西方国家盛行“Occam`s razor”原则,意思是 ”原则, 简单优于复杂”的节约性原则。 “简单优于复杂”的节约性原则。经济模型永远 无法完全把握现实, 无法完全把握现实,在建立模型中一定的抽象和 简化是不可避免的。 简化是不可避免的。 在研究进口与国内生产总值的关系时, 在研究进口与国内生产总值的关系时,考虑到时 间趋势, 间趋势,建立并估计了以下模型
15
1. 如果漏掉的 X3 X2相关,则分别在小样本下求 与 相关, 期望、在大样本下求概率极限, 期望、在大样本下求概率极限,有:
ˆ E(α1 ) ≠ β1 ˆ 且 p lim(α1 ) ≠ β1
n →∞
3
2
ˆ E(α 2 ) ≠ β2 ˆ p lim(α 2 ) ≠ β2
n →∞
2. 如果 X 与 X 不相关,则 α2 的估计满足无偏性与一致 不相关,
IM = -172.42 + 0.271 D - 949.12 + 160.73 2 - 10.18T3 G P T T
t = (-0.177) (5.67) (-2.22) (2.20) (-2.74)
R2 = 0.991 F = 272.95 D = 1.97 W
2
有人根据“简单优于复杂”原则,得到以下方程: 有人根据“简单优于复杂”原则,得到以下方程:
4. 遗漏变量 X 3 ,式中的随机扰动项 v i的方差估计 量将是有偏的, 量将是有偏的,即: ˆ σ v2 = RSSv ( n - 2)
ˆ E (σ v2 ) ≠ σ u2
5. 与方差相关的检验,包括假设检验、区间估计, 与方差相关的检验,包括假设检验、区间估计, 在关于参数的统计显著性方面, 在关于参数的统计显著性方面,都容易导出错误的 结论。 结论。
21Fra Baidu bibliotek
2. 包含无关变量偏误
定义:模型中包括了不重要的解释变量, 定义 模型中包括了不重要的解释变量,即采用误 模型中包括了不重要的解释变量 选了无关解释变量的模型进行估计而带来的偏误, 选了无关解释变量的模型进行估计而带来的偏误, 称为包含无关变量偏误 设正确模型 Y = β + β X + µ (1) 1 2 2 但却估计了 Y = α + α X + α X + v (2) 1 2 2 3 3 相同, 如果 α3 = 0 则(2)与(1)相同,因此,可将 式 , 与 相同 因此,可将(1)式 为约束的(2)式的特殊形式。 视为以 α3 = 0 为约束的 式的特殊形式。 采用OLS 法对(2)进行估计,有: 法对( )进行估计, 采用
22
ˆ α2
∑ x y ∑ x -∑ x y ∑ x x = ∑ x ∑ x - (∑ x ∑ x )
2i i 2 2i 2 3i 2 3i 3i i 2i 3i
2 3i
12
1. 遗漏相关变量(欠拟合)偏误 遗漏相关变量(欠拟合)
采用遗漏了重要解释变量的模型进行估计而带来 的偏误,称为遗漏相关变量偏误。 的偏误,称为遗漏相关变量偏误。 设正确的模型为: 设正确的模型为:
Yi = β1 + β 2 X 2i + β 3i X 3i + ui
正确模型离差形式为: 正确模型离差形式为:
yi = β2 x2i + β2 x3i + (ui - u )
13
却对方程 Y i = α 1 + α 2 X 进行回归, 进行回归,得:
ˆ α 2 = β 2 + β3
2i
+ν i
取期望
∑x x ∑x
2 i 3i 2 2i
∑ x (u - u ) + ∑x
2i i 2 2i
∑ x2i x3i + ∑ x2i (ui - u ) ˆ E (α 2 ) = E β 2 + β 3 2 2 ∑ x2i ∑ x2i
3
对模型的设定是计量经济研究的重要环节。 对模型的设定是计量经济研究的重要环节。 前面各章除了对随机扰动项 还强调: 外,还强调 分布的基本假定以 ui
假定设定的模型对变量和函数形式的设定是 正确地描述被解释变量与解释变量之间的真实关 假定模型中的变量没有测量误差。 系,假定模型中的变量没有测量误差。 但是在实际的建模实践中, 但是在实际的建模实践中,对模型的设定不一定 能够完全满足这样的要求, 能够完全满足这样的要求,从而会使模型出现设 定误差。 定误差。
18
ˆ ˆ (1) 若 X3与 2相关, 23 ≠ 0,显然,Var (α2 ) ≠ Var β2 X r2
ˆ ˆ 似乎有:Var (α2 ) < Var β2 ;
但实际情形并不完全如此。 但实际情形并不完全如此。 可以注意到残差平方和 可以注意到残差平方和RSS的计算 的计算
( )
( )
ˆ ˆ σν2 = RSSv (n − 2) ≠ RSSu (n − 3) = σu2 ;
14
遗漏变量设定误差的后果
由此可以看出, 的遗漏将产生如下后果。 由此可以看出,X3的遗漏将产生如下后果。 两边取概率极限, 两边取概率极限,有:
Cov ( X 2i , X3i ) Cov ( X 2i , ui ) ˆ p limα2 = β2 + β3 + Var ( X 2i ) Var ( X 2i ) n→∞
因此,有可能: 因此,有可能:
RSSv (n − 2) > RSSu (n − 3);
19
不相关, (2)若 X 3与X 2 不相关,有 )
2 r23 = 0和 ∑ x2i x3i 2 x2i = 0; ∑
似乎分别有: 似乎分别有: ˆ E (α2 ) = β2
ˆ ˆ Var(β2 ) = Var(α2 );
4
第九章 设定误差与测量误差
本章主要讨论: 本章主要讨论:
●设定误差 ●设定误差的检验 ●测量误差
5
第一节 设定误差
本节基本内容: 本节基本内容:
●设定误差及类型 ●变量设定误差的后果
6
一、设定误差及类型
计量经济模型是对变量间经济关系因果性的设想, 计量经济模型是对变量间经济关系因果性的设想, 若所设定的回归模型是“正确” 若所设定的回归模型是“正确”的,主要任务是所 选模型参数的估计和假设检验。 选模型参数的估计和假设检验。但是如果对计量模 型的各种诊断或检验总不能令人满意, 型的各种诊断或检验总不能令人满意,这时应把注 意力集中到模型的设定方面: 意力集中到模型的设定方面: 考虑所建模型是否遗漏了重要的变量? 考虑所建模型是否遗漏了重要的变量? 是否包含了多余的变量? 是否包含了多余的变量? 所选模型的函数形式是否正确? 所选模型的函数形式是否正确? 随机扰动项的设定是否合理? 随机扰动项的设定是否合理? 变量的数据收集是否有误差? 变量的数据收集是否有误差? 所有这些,计量经济学中被统称为设定误差。 所有这些,计量经济学中被统称为设定误差。 7
(1)相关变量的遗漏(欠拟合); )相关变量的遗漏(欠拟合); (2)无关变量的误选(过拟合)。 )无关变量的误选(过拟合)。
8
1. 相关变量的遗漏
(Omitting Relevant Variables) )
例如,如果“正确” 例如,如果“正确”的模型为
Y = β1 + β2 X2i + β3X3i + µi i
的有偏估计, 不相关, 的有偏估计,即使 X 3与X 2 不相关,也有 ˆ ˆ ˆ ˆ Var( β ) ≠ Var(α ),
2
致使假设检验程序很有可能是可疑的。 致使假设检验程序很有可能是可疑的。 必须清楚,一旦根据相关理论把模型建立起来, 必须清楚,一旦根据相关理论把模型建立起来, 再从中遗漏变量需要充分地谨慎。 再从中遗漏变量需要充分地谨慎。
本下有偏,在大样本下非一致。 本下有偏,在大样本下非一致。
的估计却是有偏的。 性;但这时α2 的估计却是有偏的。 即OLS估计量在小样 估计量在小样
16
ˆ 方差的有偏估计: 3. α 2 的方差是 β 2 方差的有偏估计: ˆ
由Y
ˆ = β1 + β2X2 + β3X3 +u 得 Var(α2 ) = x2 ∑ 2i 由Y = α + α x + v 得 1 2 2
σ2
ˆ Var(β2 ) =
∑ x2i x3i ) 2 ∑ x2i (1- x2 x2 ∑ 2i ∑ 3i
σ2
=
2 2 x2i (1- r23 ) ∑
σ2
17
ˆ 相关, ˆ 如果 X 3 与 X 2 相关,显然有 Var(α 2 ) ≠ Var( β 2 )
ˆ 不相关, 如果 X 3与 X 2不相关,也有 Var(α2 ) ≠ Var(β2 ) ˆ
10
设定误差的原因
●数据来源渠道可能不畅。例如,数据很难取得被 数据来源渠道可能不畅。例如, 迫将具有重要的经济意义变量排斥在模型之外。 迫将具有重要的经济意义变量排斥在模型之外。 ●不知道变量应当以什么确切的函数形式出现在回 归模型中。 归模型中。 ●事先并不知道所研究的实证数据中所隐含的真实 模型究竟是什么。 模型究竟是什么。 设定误差在建模中较容易出现。 设定误差在建模中较容易出现。设定误差的存在 可能会对模型形成不良的后果。 可能会对模型形成不良的后果。
而我们将模型设定为
Y =α +α2 X2i +νi i 1
即设定模型时漏掉了一个相关的解释变量。 即设定模型时漏掉了一个相关的解释变量。 这类错误称为遗漏相关变量 遗漏相关变量( 欠拟合” 这类错误称为遗漏相关变量(“欠拟合”)。
9
2. 无关变量的误选
(Including Irrevelant Variables)