第十章模型选择标准与检验精品PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Yt=b0+b1X1t+b2X2t+ut
过度拟合的后果
错误设定模型的OLS估计量仍然是无偏的。其 中,E(b2)=0。(因为X2t不应属于正确模型) 误差方差的估计值是正确的 置信区间和假设检验仍然是有效的
但过度拟合模型中的估计量不是有效的。通常, 它们的方差比真实模型中估计量的方差大。简 言之,OLS估计量是线性无偏估计量,但不是 最优线性无偏估计量。
一随着时间的推移而呈现循环变化的变量
函数设定偏误
模型函数设定 偏误时,残差 序列呈现正负 交替变化。
如图:一元回 归模型中,真 实模型呈幂函 数形式,但却 选取了线性函 数进行回归。
2、一般性设定偏误检验:RESET检验
RESET检验: 更准确更常用的判定方法 拉姆齐(Ramsey)于1969年提出 基本思想:如果事先知道遗漏了哪个变量,只 需将此变量引入模型,估计并检验其参数是否 显著不为零即可;
1、遗漏相关变量:“过低拟合”模型
假定“真实”模型如下: Yt=b0+b1X1t+b2X2t+ut 估计方程: Yt=a0+a1X1t+vt 遗漏变量偏差
动态设定偏误(dynamic mis-specification):遗 漏相关变量表现为对Y或X滞后项的遗漏 。
遗漏变量X2产生的后果
如果遗漏变量X2与模型中的变量X1相关, 则是a0 ,a1有偏的,用符号表示:
例:进口支出函数
“真实”模型: Y’=-859.92+0.6470X1t-23.195X2t se=(111.96) (0.0745) (4.2704) t= (-7.6806) (8.6846) (-5.4316) R2 =0.9776 Y:进口支出 X1:个人可支配收入(PDI) X2:时间或趋势变量,取值从1开始
例:进口支出函数
错误设定的模型: Y’=-261.09+0.2452X1t se=(31.327) (0.0148) t= (-8.334) (16.5676) R2 =0.9388
结果分析
错误设定模型低估了真实的边际进口支 出倾向 X2t=-25.817+0.0173X1t
t= (-23.999) (34.177) R2 =0.9848 b21 =0.0173
问题是不知道遗漏了哪个变量,需寻找一个替 代变量Z,来进行上述检验。 RESET检验中,采用所设定模型中被解释变量 Y的估计值Ŷ的若干次幂来充当该“替代”变量。
RESET检验
E(a0) ≠ b0, E(a1) ≠ b1 E(a0) = b0 +b2 (X2p- b21 X1p) E(a1) = b1 +b2 b21 b21是遗漏变量X2对变量X1的斜率系数
遗漏变量X2产生的后果
a0 和a1是不一致的,也就是说,无论样本 容量有多大,偏差都不会消失 如果X2和X1不相关,即b21为0,则a1是无 偏和一致的。 误差的方差是有偏的 估计量的方差是有偏的 通常的假设检验不再有效
结果分析
截距有偏,高估真实值 斜率和截距的标准差不同
2、包括不相关变量:“过度拟合”模型
非相关变量:指没有具体的理论表明应 该把该变量包括到模型中的变量。
研究人员不确定某些变量在模型中的作用 经济理论不完善
包括不相关变量:“过度拟合”模型
正确设定模型:
Yt=a0+a1X1t+vt
过度拟合的模型
2、检验是否有相关变量的遗漏或函数形式 设定偏误
残差图示法 一般性设定偏误检验 同期相关性的Hausman检验 线性模型与双对数线性模型的选择
1、残差图示法
残差序列变化图
残差序列变化图
(左图)模型变化:模型设定时可能遗漏了
一随着时间的推移而持续上升的变量
(右图)循环变化:模型设定时可能遗漏了
回归结果
lnY’=-23.727+3.8975lnX1t-0.0526X2t se=(4.4314) (0.6031) (0.0167) t= (-5.3542) (6.4623) (-3.154) R2 =0.9763 Y:进口支出 X1:个人可支配收入(PDI) X2:时间或趋势变量,取值从1开始
三、诊断设定误差:设定误差的检验
检验是否含有无关变量 检验是否有相关变量的遗漏或函数形式 设定偏误
1、检验是否含有无关变量
可用t 检验与F检验完成。 检验的基本思想:如果模型中误选了无关变量, 则其系数的真值应为零。因此,只须对无关变 量系数的显著性进行检验
t检验:检验某一个变量是否应包括在模型中; F检验:检验若干个变量是否应同时包括在模型中
4、理论一致性
理论一致性:无论拟合优度有多高,一 旦模型中的一个或多个系数的符号有误, 该模型就不能说是一个好的模型。
5、预测能力
预测能力:“对假设(模型)的真实性 唯一有效的检验就是将预测值与经验值 比较”
二、设定误差的源自文库型
遗漏相关变量:“过低拟合”模型 包括不相关变量:“过度拟合”模型 不正确的函数形式
第十章:模型选择:标准与检验
隐含假定模型是“对现实的真实反映” 专业地说,假定所选模型中不存在设定 偏差或者设定误差
问题
“好的”或者“正确”的模型有哪些性质? 存在哪几种类型的设定误差? 设定误差的后果是什么? 如何诊断设定误差?
一、“好的”模型具有的特性
经济计量学家哈维(A.C.Harvey)列出如下 标准: 节省性: 可识别性: 拟合优度 理论一致性 预测能力
1、节省性
节省性:一个模型永远也无法完全把握 现实,在任何模型的建立过程中,一定 程度的抽象或者简化是不可避免的。
2、可识别性
可识别性:即对给定的一组数据,估计 的参数必须具有唯一值,或者说每个参 数只有一个估计值。
3、拟合优度
拟合优度:回归分析的基本思想是用模 型中所包括的解释变量来尽可能地解释 被解释变量的变化。
思考
包括不相关变量比排除相关变量要好一 些?
不必要变量的增加会减少估计量的有效性 (更大的标准差),也可能导致多重共线性 问题,同时还会引起自由度的损失。
3、不正确的函数形式
在建立模型时,不仅要把理论上相关的 变量包括到模型中,而且要选择适当的 函数形式。
例:进口支出函数
ln Yt=b0+b1lnX1t+b2X2t+ut 回归结果:
过度拟合的后果
错误设定模型的OLS估计量仍然是无偏的。其 中,E(b2)=0。(因为X2t不应属于正确模型) 误差方差的估计值是正确的 置信区间和假设检验仍然是有效的
但过度拟合模型中的估计量不是有效的。通常, 它们的方差比真实模型中估计量的方差大。简 言之,OLS估计量是线性无偏估计量,但不是 最优线性无偏估计量。
一随着时间的推移而呈现循环变化的变量
函数设定偏误
模型函数设定 偏误时,残差 序列呈现正负 交替变化。
如图:一元回 归模型中,真 实模型呈幂函 数形式,但却 选取了线性函 数进行回归。
2、一般性设定偏误检验:RESET检验
RESET检验: 更准确更常用的判定方法 拉姆齐(Ramsey)于1969年提出 基本思想:如果事先知道遗漏了哪个变量,只 需将此变量引入模型,估计并检验其参数是否 显著不为零即可;
1、遗漏相关变量:“过低拟合”模型
假定“真实”模型如下: Yt=b0+b1X1t+b2X2t+ut 估计方程: Yt=a0+a1X1t+vt 遗漏变量偏差
动态设定偏误(dynamic mis-specification):遗 漏相关变量表现为对Y或X滞后项的遗漏 。
遗漏变量X2产生的后果
如果遗漏变量X2与模型中的变量X1相关, 则是a0 ,a1有偏的,用符号表示:
例:进口支出函数
“真实”模型: Y’=-859.92+0.6470X1t-23.195X2t se=(111.96) (0.0745) (4.2704) t= (-7.6806) (8.6846) (-5.4316) R2 =0.9776 Y:进口支出 X1:个人可支配收入(PDI) X2:时间或趋势变量,取值从1开始
例:进口支出函数
错误设定的模型: Y’=-261.09+0.2452X1t se=(31.327) (0.0148) t= (-8.334) (16.5676) R2 =0.9388
结果分析
错误设定模型低估了真实的边际进口支 出倾向 X2t=-25.817+0.0173X1t
t= (-23.999) (34.177) R2 =0.9848 b21 =0.0173
问题是不知道遗漏了哪个变量,需寻找一个替 代变量Z,来进行上述检验。 RESET检验中,采用所设定模型中被解释变量 Y的估计值Ŷ的若干次幂来充当该“替代”变量。
RESET检验
E(a0) ≠ b0, E(a1) ≠ b1 E(a0) = b0 +b2 (X2p- b21 X1p) E(a1) = b1 +b2 b21 b21是遗漏变量X2对变量X1的斜率系数
遗漏变量X2产生的后果
a0 和a1是不一致的,也就是说,无论样本 容量有多大,偏差都不会消失 如果X2和X1不相关,即b21为0,则a1是无 偏和一致的。 误差的方差是有偏的 估计量的方差是有偏的 通常的假设检验不再有效
结果分析
截距有偏,高估真实值 斜率和截距的标准差不同
2、包括不相关变量:“过度拟合”模型
非相关变量:指没有具体的理论表明应 该把该变量包括到模型中的变量。
研究人员不确定某些变量在模型中的作用 经济理论不完善
包括不相关变量:“过度拟合”模型
正确设定模型:
Yt=a0+a1X1t+vt
过度拟合的模型
2、检验是否有相关变量的遗漏或函数形式 设定偏误
残差图示法 一般性设定偏误检验 同期相关性的Hausman检验 线性模型与双对数线性模型的选择
1、残差图示法
残差序列变化图
残差序列变化图
(左图)模型变化:模型设定时可能遗漏了
一随着时间的推移而持续上升的变量
(右图)循环变化:模型设定时可能遗漏了
回归结果
lnY’=-23.727+3.8975lnX1t-0.0526X2t se=(4.4314) (0.6031) (0.0167) t= (-5.3542) (6.4623) (-3.154) R2 =0.9763 Y:进口支出 X1:个人可支配收入(PDI) X2:时间或趋势变量,取值从1开始
三、诊断设定误差:设定误差的检验
检验是否含有无关变量 检验是否有相关变量的遗漏或函数形式 设定偏误
1、检验是否含有无关变量
可用t 检验与F检验完成。 检验的基本思想:如果模型中误选了无关变量, 则其系数的真值应为零。因此,只须对无关变 量系数的显著性进行检验
t检验:检验某一个变量是否应包括在模型中; F检验:检验若干个变量是否应同时包括在模型中
4、理论一致性
理论一致性:无论拟合优度有多高,一 旦模型中的一个或多个系数的符号有误, 该模型就不能说是一个好的模型。
5、预测能力
预测能力:“对假设(模型)的真实性 唯一有效的检验就是将预测值与经验值 比较”
二、设定误差的源自文库型
遗漏相关变量:“过低拟合”模型 包括不相关变量:“过度拟合”模型 不正确的函数形式
第十章:模型选择:标准与检验
隐含假定模型是“对现实的真实反映” 专业地说,假定所选模型中不存在设定 偏差或者设定误差
问题
“好的”或者“正确”的模型有哪些性质? 存在哪几种类型的设定误差? 设定误差的后果是什么? 如何诊断设定误差?
一、“好的”模型具有的特性
经济计量学家哈维(A.C.Harvey)列出如下 标准: 节省性: 可识别性: 拟合优度 理论一致性 预测能力
1、节省性
节省性:一个模型永远也无法完全把握 现实,在任何模型的建立过程中,一定 程度的抽象或者简化是不可避免的。
2、可识别性
可识别性:即对给定的一组数据,估计 的参数必须具有唯一值,或者说每个参 数只有一个估计值。
3、拟合优度
拟合优度:回归分析的基本思想是用模 型中所包括的解释变量来尽可能地解释 被解释变量的变化。
思考
包括不相关变量比排除相关变量要好一 些?
不必要变量的增加会减少估计量的有效性 (更大的标准差),也可能导致多重共线性 问题,同时还会引起自由度的损失。
3、不正确的函数形式
在建立模型时,不仅要把理论上相关的 变量包括到模型中,而且要选择适当的 函数形式。
例:进口支出函数
ln Yt=b0+b1lnX1t+b2X2t+ut 回归结果: