模型设定误差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三部分 实践中的回归分析
一、引言:放宽经典模型的假设 二、模型设定误差 三、多重共线性 四、异方差性 五、序列相关性
前面讨论了满足经济假设的回归模型,但是大多数 经济模型是很难严格满足这些经典假设的。这就极大地 限制了经典回归分析的应用范围。因此,我们有必要 研究在放宽这些经典假设的条件下,是否有可能得到回 归系数较好的估计值?如果有可能,其方法是什么?
数
。
可 见 :(1) 0和1可 能 是 有 偏 的
(2)
E[
var(1
)]肯
定
高
估
了
的
1
实
际
方
差
还有:(3) 0和1也是不一致的.
2020/3/20
11
3.设定误差的诊断和处理
遗漏相关变量和采用错误的函数形式
o 根据设定好的模型进行OLS估计,对结果进行判断 a. 残差图 b. R2和调整的R2 c. 与预期相比,系数估计值的符号 d. 回归系数的t值 e. 德宾-沃森d统计量
o 经典正态线性模型假定模型的设定是正确的,但一般情况 下建立的模型很可能是不正确的,这种情况称为设定误差。
好模型的标准
1、简约性(parsimony) 一定程度的抽象或简化是不可避免的,简单优于复杂。
2、可识别性(identifiability)
对于给定一组数据,每个参数只能有一个估计值。
2020/3/20
异方差性
假定9
序列相关
假定10
误差项非正态分布
假定3和4在联立 方程模型中讨论
对假定5我们做简 单讨论
假定7影响参数估 计的无偏性,暂不 讨论
假定10对于大样 本数据不是必需的 假定。
本讲主要考虑放 宽了其余假定后面 临的问题
2020/3/20
4
微数缺测性
o 从理论上讲,样本容量n和解释变量数目k必须满足n>k+2, 才能进行OLS估计和假设检验。但事实上,即便n满足上 述条件,但如果样本很小,那么虽然能够进行估计和检验, 也很难通过t 检验。
7对于给定的X,误差项均值为0
o 关于误差项的假定
2020/3/20
8对于给定的X,误差项方差相等
9对于给定的X,误差项之间不存在序列相关
10误差项服从正态分布
3
放宽的假定
相应的问题
假定1、2 模型设定问题
假定3、4 随机解释变量
假定5
过度决定(微数缺测性)
假定6
多重共线性
假定7
误差项均值非零
假定8
Var( j )
2
TSS j
1
(
1
R
2 j
);SE( j
)
Var( j )
如果样本容量越小,则X
的变异性就越小,
j
从而TSS j就越小,即Var( j )越大。
2020/3/20
5
二、模型设定误差
1. 什么是设定误差 2. 设定误差的影响 3. 设定误差的诊断和处理 4. 测量误差
1.什么是设定误差(specification error)
如 果 模 型 设 定 为 :Yi
0
1 X1i
v
。
i
可
以
证
明
:
E(1 ) 1 2b21
E(0 ) 0 2 ( X 2 b21 X1 )
E[var(1 )]
var(1 )
2 2
(n 2)
( X2i X2 )2 ( X1i X1 )2Hale Waihona Puke Baidu
其
中
,b21是X
2对X
进
1
行
回
归
后
得
到
的
斜
率系
2020/3/20
9
2.设定误差的影响
1) 遗漏相关变量:回归系数的OLS估计量可能是有偏的、非 一致的;系数的方差估计也是有偏的
2) 包含无关变量:回归系数的OLS估计量是无偏的,方差估 计也是无偏的,但不是最小方差,因而OLS估计量不是有 效的
3) 错误的函数形式:回归系数的OLS估计量可能是有偏的
7
3、拟和优度(goodness of fit)
回归分析的 基本思想是用模型中的解释变量来尽可能 的去解释被解释变量。校正后拟合优度越高,模型越好。
4、理论一致性(theoretical consistency) 无论模型的拟合优度有多高,若模型中存在一个和多个系数
的符号有误,就不能称为一个好模型。
假 若 正 确 的 模 型 为 :IMPORTt 0 1PDIt 2Tt ut
那 么 以 下 几 种 情 况 属 于设 定 误 差 :
a.遗 漏 相 关 变 量 :IMPORTt 0 1PDIt ut b.包 含 无 关 变 量 :IMPORTt 0 1PDIt 2Tt 3Tt 2 ut c.错 误 的 函 数 形 式l:n IMPORTt 0 1 ln PDIt 2Tt ut
5、预测能力(predictive power)
弗里德曼说:对模型有效性的唯一检验就是将预测值 与经验值相比较。
2020/3/20
8
常见设定误差的类型
(1)遗漏相关变量(2)包含无关变量 (3)采用错误函数形式 (4)度量误差
如:1968-1987年美国居民对进口商品的消费支出(IMPORT) 与可支配收入(PDI)的关系
2020/3/20
2
一、引言:放宽经典模型的假设
经典正态线性回归模型(CNLRM)的假定
o 关于模型的假定
1回归模型对参数而言是线性的 2模型是正确设定的
3解释变量X是确定性变量
o 关于解释变量的假定
4若X是随机的,则误差项与X不相关 5解释变量的取值有足够变异 6解释变量之间不存在完全的线性关系
一般来说,遗漏相关变量的后果要严重一些,因为它 损失了无偏性。特别是当样本比较大时,包含不相关变 量带来的自由度减少不太严重,因而包含不相关变量的 影响要小一些。
2020/3/20
10
遗漏相关变量的影响
证明见古扎拉蒂(1995)或平狄克等(1998)
对于Yi 0 1 X1i 2 X 2i ui
图示:一元回归模型中,真实模型呈幂函数形式,但 却选取了线性函数进行回归。
2020/3/20
15
其他:
如果R2较低,或者系数估计值的符号与预期相反, 或者有很多t值不显著,或者d统计量偏小。就有可能是 因为遗漏了某个相关变量,或者采用了错误函数形式。
特别是,d统计量偏小很可能不是因为序列相关,而 是因为遗漏了某个相关变量。因此,如果加入某些变量后 d统计量接近2,那么就应该把这些变量包含在模型中。
2020/3/20
12
a.残差图示法
2020/3/20
13
• 残差序列变化图
(a)趋势变化 :
模型设定时可能遗漏 了一随着时间的推移 而持续上升的变量
(b)循环变化:模
型设定时可能遗漏了一 随着时间的推移而呈现 循环变化的变量
2020/3/20
14
• 模型函数形式设定偏误时残差序列呈现正负 交替变化
一、引言:放宽经典模型的假设 二、模型设定误差 三、多重共线性 四、异方差性 五、序列相关性
前面讨论了满足经济假设的回归模型,但是大多数 经济模型是很难严格满足这些经典假设的。这就极大地 限制了经典回归分析的应用范围。因此,我们有必要 研究在放宽这些经典假设的条件下,是否有可能得到回 归系数较好的估计值?如果有可能,其方法是什么?
数
。
可 见 :(1) 0和1可 能 是 有 偏 的
(2)
E[
var(1
)]肯
定
高
估
了
的
1
实
际
方
差
还有:(3) 0和1也是不一致的.
2020/3/20
11
3.设定误差的诊断和处理
遗漏相关变量和采用错误的函数形式
o 根据设定好的模型进行OLS估计,对结果进行判断 a. 残差图 b. R2和调整的R2 c. 与预期相比,系数估计值的符号 d. 回归系数的t值 e. 德宾-沃森d统计量
o 经典正态线性模型假定模型的设定是正确的,但一般情况 下建立的模型很可能是不正确的,这种情况称为设定误差。
好模型的标准
1、简约性(parsimony) 一定程度的抽象或简化是不可避免的,简单优于复杂。
2、可识别性(identifiability)
对于给定一组数据,每个参数只能有一个估计值。
2020/3/20
异方差性
假定9
序列相关
假定10
误差项非正态分布
假定3和4在联立 方程模型中讨论
对假定5我们做简 单讨论
假定7影响参数估 计的无偏性,暂不 讨论
假定10对于大样 本数据不是必需的 假定。
本讲主要考虑放 宽了其余假定后面 临的问题
2020/3/20
4
微数缺测性
o 从理论上讲,样本容量n和解释变量数目k必须满足n>k+2, 才能进行OLS估计和假设检验。但事实上,即便n满足上 述条件,但如果样本很小,那么虽然能够进行估计和检验, 也很难通过t 检验。
7对于给定的X,误差项均值为0
o 关于误差项的假定
2020/3/20
8对于给定的X,误差项方差相等
9对于给定的X,误差项之间不存在序列相关
10误差项服从正态分布
3
放宽的假定
相应的问题
假定1、2 模型设定问题
假定3、4 随机解释变量
假定5
过度决定(微数缺测性)
假定6
多重共线性
假定7
误差项均值非零
假定8
Var( j )
2
TSS j
1
(
1
R
2 j
);SE( j
)
Var( j )
如果样本容量越小,则X
的变异性就越小,
j
从而TSS j就越小,即Var( j )越大。
2020/3/20
5
二、模型设定误差
1. 什么是设定误差 2. 设定误差的影响 3. 设定误差的诊断和处理 4. 测量误差
1.什么是设定误差(specification error)
如 果 模 型 设 定 为 :Yi
0
1 X1i
v
。
i
可
以
证
明
:
E(1 ) 1 2b21
E(0 ) 0 2 ( X 2 b21 X1 )
E[var(1 )]
var(1 )
2 2
(n 2)
( X2i X2 )2 ( X1i X1 )2Hale Waihona Puke Baidu
其
中
,b21是X
2对X
进
1
行
回
归
后
得
到
的
斜
率系
2020/3/20
9
2.设定误差的影响
1) 遗漏相关变量:回归系数的OLS估计量可能是有偏的、非 一致的;系数的方差估计也是有偏的
2) 包含无关变量:回归系数的OLS估计量是无偏的,方差估 计也是无偏的,但不是最小方差,因而OLS估计量不是有 效的
3) 错误的函数形式:回归系数的OLS估计量可能是有偏的
7
3、拟和优度(goodness of fit)
回归分析的 基本思想是用模型中的解释变量来尽可能 的去解释被解释变量。校正后拟合优度越高,模型越好。
4、理论一致性(theoretical consistency) 无论模型的拟合优度有多高,若模型中存在一个和多个系数
的符号有误,就不能称为一个好模型。
假 若 正 确 的 模 型 为 :IMPORTt 0 1PDIt 2Tt ut
那 么 以 下 几 种 情 况 属 于设 定 误 差 :
a.遗 漏 相 关 变 量 :IMPORTt 0 1PDIt ut b.包 含 无 关 变 量 :IMPORTt 0 1PDIt 2Tt 3Tt 2 ut c.错 误 的 函 数 形 式l:n IMPORTt 0 1 ln PDIt 2Tt ut
5、预测能力(predictive power)
弗里德曼说:对模型有效性的唯一检验就是将预测值 与经验值相比较。
2020/3/20
8
常见设定误差的类型
(1)遗漏相关变量(2)包含无关变量 (3)采用错误函数形式 (4)度量误差
如:1968-1987年美国居民对进口商品的消费支出(IMPORT) 与可支配收入(PDI)的关系
2020/3/20
2
一、引言:放宽经典模型的假设
经典正态线性回归模型(CNLRM)的假定
o 关于模型的假定
1回归模型对参数而言是线性的 2模型是正确设定的
3解释变量X是确定性变量
o 关于解释变量的假定
4若X是随机的,则误差项与X不相关 5解释变量的取值有足够变异 6解释变量之间不存在完全的线性关系
一般来说,遗漏相关变量的后果要严重一些,因为它 损失了无偏性。特别是当样本比较大时,包含不相关变 量带来的自由度减少不太严重,因而包含不相关变量的 影响要小一些。
2020/3/20
10
遗漏相关变量的影响
证明见古扎拉蒂(1995)或平狄克等(1998)
对于Yi 0 1 X1i 2 X 2i ui
图示:一元回归模型中,真实模型呈幂函数形式,但 却选取了线性函数进行回归。
2020/3/20
15
其他:
如果R2较低,或者系数估计值的符号与预期相反, 或者有很多t值不显著,或者d统计量偏小。就有可能是 因为遗漏了某个相关变量,或者采用了错误函数形式。
特别是,d统计量偏小很可能不是因为序列相关,而 是因为遗漏了某个相关变量。因此,如果加入某些变量后 d统计量接近2,那么就应该把这些变量包含在模型中。
2020/3/20
12
a.残差图示法
2020/3/20
13
• 残差序列变化图
(a)趋势变化 :
模型设定时可能遗漏 了一随着时间的推移 而持续上升的变量
(b)循环变化:模
型设定时可能遗漏了一 随着时间的推移而呈现 循环变化的变量
2020/3/20
14
• 模型函数形式设定偏误时残差序列呈现正负 交替变化