模型遗漏变量偏差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2-1
问题
各种设定误差的后果是什么? 如何诊断设定误差? 如果已经犯了设定误差,可以采取哪些补救
措施?
2-2
7.1 “好的”模型具有的性质
经济计量学家哈维(A.C.Harvey)列出了模型 判断的一些标准 :
简约性(parsimony)。 可识别性(identifiability)。 拟合优度(goodness of fit)。 理论一致性(theoretical consistency)。预
如果解释变量中存在度量误差,则建议使用工具 变量或替代变量。
2-11
7.7 诊断设定误差:设定误差的检验
诊断非相关变量的存在
2-12百度文库
7.7 诊断设定误差:设定误差的检验
对遗漏变量和不正确函数形式的检验
判定模型是否恰当主要根据以下一些参数:
1. R2和校正后的 R(2 R 2)
2.估计的 t 值
如果X2和X3不相关,则b32为零;此时,a2 是无偏的,也是一致的;但a1仍然是有偏的 。
2-6
误差方差是真实误差方差的有偏估计量。 a2的方差估计量是真实估计量b2方差的有偏
估计估计量。 通常的置信区间和假设检验过程不再可靠。
2-7
7.3 遗漏相关变量:“过低拟合”模型
2-8
应变量中的度量误差
1.OLS估计量是无偏的。 2.OLS估计量的方差也是无偏的。 3. 估计量的估计方差比没有度量误差时的大。因为应变量
中的误差加入到了误差项 u i中。 解释变量中的度量误差
1.OLS估计量是有偏的。 2.OLS估计量也是不一致的。即使样本容量足够大,OLS
估计量仍然是有偏的。
2-9
7.5 不正确的函数形式
现在考虑另一种设定误差。假设模型包括的变 量Y,X 2,X 3都是理论上正确的变量。考虑如 下两种模型设定:
Yt B1 B2 X 2t B3 X 3t ut ln Yt A1 A2 ln X 2t A3 X 3t vt
2-10
7.6 度量误差
7.4 包括不相关变量:“过度拟合”模 型
Yi B1 B2 X 2i ui Yi A1 A2 X 2i A3 X 3i vi
回归模型的估计后果如下:
1.“不正确”模型的OLS估计量是无偏的(也是一致的)。
2.从回归方程(7.10)中得到的 2 的估计量是正确的。
3.建立在t检验和F检验基础上的标准的置信区间和假设检验仍 然是有效的。 4.从回归方程(7.10)中估计的a 却是无效的——其方差比从 真实模型(7.9)中估计的的方差大。
Yi B1 B2 X 2i B3 X 3i ui
Yi A1 A2 X t vt
2-5
遗漏变量X3的后果
如果遗漏变量X3与模型中的变量X2相关,则 a1和a2是有偏的;也就是说,其均值或期望 值与真实值不一致。
a1和a2也是不一致的,即无论样本容量有多 大,偏差也不会消失。
3.与先验预期相比,估计系数的符号
2-13
7.7 诊断设定误差:设定误差的检验
残差检验
图7-2 回归(7.13)和(7.20)的残差
2-14
7.7 诊断设定误差:设定误差的检验
在线性模型和对数线性模型之间选择:MWD检验
2-15
7.7 诊断设定误差:设定误差的检验
回归误差设定检验:RESET
2-16
测能力(predictive power)。
2-3
7.2 设定误差的类型
主要介绍一些实践中经常遇到的设定误差: 遗漏相关变量 包括不必要变量 采用了错误的函数形式 度量误差
2-4
Venn diagram.
7.3 遗漏相关变量:“过低拟合”模型
遗漏变量偏差(omitted variable bias)。
7.7 诊断设定误差:设定误差的检验
回归误差设定检验:RESET
2-17
问题
“好的”或者“正确的”模型具有哪些性质? 假定一个无所不知的计量经济学家建立了一
个“正确”的模型用于分析某种经济现象。 然而,由于数据的可获得性(出于对成本的 考虑,或是疏忽等其他原因),研究人员使 用了另一个模型,因此比之“正确”模型, 就犯了设定误差的错误。在实践中可能会犯 哪几类设定误差呢?
问题
各种设定误差的后果是什么? 如何诊断设定误差? 如果已经犯了设定误差,可以采取哪些补救
措施?
2-2
7.1 “好的”模型具有的性质
经济计量学家哈维(A.C.Harvey)列出了模型 判断的一些标准 :
简约性(parsimony)。 可识别性(identifiability)。 拟合优度(goodness of fit)。 理论一致性(theoretical consistency)。预
如果解释变量中存在度量误差,则建议使用工具 变量或替代变量。
2-11
7.7 诊断设定误差:设定误差的检验
诊断非相关变量的存在
2-12百度文库
7.7 诊断设定误差:设定误差的检验
对遗漏变量和不正确函数形式的检验
判定模型是否恰当主要根据以下一些参数:
1. R2和校正后的 R(2 R 2)
2.估计的 t 值
如果X2和X3不相关,则b32为零;此时,a2 是无偏的,也是一致的;但a1仍然是有偏的 。
2-6
误差方差是真实误差方差的有偏估计量。 a2的方差估计量是真实估计量b2方差的有偏
估计估计量。 通常的置信区间和假设检验过程不再可靠。
2-7
7.3 遗漏相关变量:“过低拟合”模型
2-8
应变量中的度量误差
1.OLS估计量是无偏的。 2.OLS估计量的方差也是无偏的。 3. 估计量的估计方差比没有度量误差时的大。因为应变量
中的误差加入到了误差项 u i中。 解释变量中的度量误差
1.OLS估计量是有偏的。 2.OLS估计量也是不一致的。即使样本容量足够大,OLS
估计量仍然是有偏的。
2-9
7.5 不正确的函数形式
现在考虑另一种设定误差。假设模型包括的变 量Y,X 2,X 3都是理论上正确的变量。考虑如 下两种模型设定:
Yt B1 B2 X 2t B3 X 3t ut ln Yt A1 A2 ln X 2t A3 X 3t vt
2-10
7.6 度量误差
7.4 包括不相关变量:“过度拟合”模 型
Yi B1 B2 X 2i ui Yi A1 A2 X 2i A3 X 3i vi
回归模型的估计后果如下:
1.“不正确”模型的OLS估计量是无偏的(也是一致的)。
2.从回归方程(7.10)中得到的 2 的估计量是正确的。
3.建立在t检验和F检验基础上的标准的置信区间和假设检验仍 然是有效的。 4.从回归方程(7.10)中估计的a 却是无效的——其方差比从 真实模型(7.9)中估计的的方差大。
Yi B1 B2 X 2i B3 X 3i ui
Yi A1 A2 X t vt
2-5
遗漏变量X3的后果
如果遗漏变量X3与模型中的变量X2相关,则 a1和a2是有偏的;也就是说,其均值或期望 值与真实值不一致。
a1和a2也是不一致的,即无论样本容量有多 大,偏差也不会消失。
3.与先验预期相比,估计系数的符号
2-13
7.7 诊断设定误差:设定误差的检验
残差检验
图7-2 回归(7.13)和(7.20)的残差
2-14
7.7 诊断设定误差:设定误差的检验
在线性模型和对数线性模型之间选择:MWD检验
2-15
7.7 诊断设定误差:设定误差的检验
回归误差设定检验:RESET
2-16
测能力(predictive power)。
2-3
7.2 设定误差的类型
主要介绍一些实践中经常遇到的设定误差: 遗漏相关变量 包括不必要变量 采用了错误的函数形式 度量误差
2-4
Venn diagram.
7.3 遗漏相关变量:“过低拟合”模型
遗漏变量偏差(omitted variable bias)。
7.7 诊断设定误差:设定误差的检验
回归误差设定检验:RESET
2-17
问题
“好的”或者“正确的”模型具有哪些性质? 假定一个无所不知的计量经济学家建立了一
个“正确”的模型用于分析某种经济现象。 然而,由于数据的可获得性(出于对成本的 考虑,或是疏忽等其他原因),研究人员使 用了另一个模型,因此比之“正确”模型, 就犯了设定误差的错误。在实践中可能会犯 哪几类设定误差呢?