模型设定误差

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

图示:一元回归模型中,真实模型呈幂函数形式,但 却选取了线性函数进行回归。
2020/3/5
15
其他:
如果R2较低,或者系数估计值的符号与预期相反, 或者有很多t值不显著,或者d统计量偏小。就有可能是 因为遗漏了某个相关变量,或者采用了错误函数形式。
特别是,d统计量偏小很可能不是因为序列相关,而 是因为遗漏了某个相关变量。因此,如果加入某些变量后 d统计量接近2,那么就应该把这些变量包含在模型中。
对于给定一组数据,每个参数只能有一个估计值。
2020/3/5
7
源自文库
3、拟和优度(goodness of fit)
回归分析的 基本思想是用模型中的解释变量来尽可能 的去解释被解释变量。校正后拟合优度越高,模型越好。
4、理论一致性(theoretical consistency) 无论模型的拟合优度有多高,若模型中存在一个和多个系数
2020/3/5
9
2.设定误差的影响
1) 遗漏相关变量:回归系数的OLS估计量可能是有偏的、非 一致的;系数的方差估计也是有偏的
2) 包含无关变量:回归系数的OLS估计量是无偏的,方差估 计也是无偏的,但不是最小方差,因而OLS估计量不是有 效的
3) 错误的函数形式:回归系数的OLS估计量可能是有偏的
2020/3/5
24
1.什么是设定误差(specification error)
o 经典正态线性模型假定模型的设定是正确的,但一般情况 下建立的模型很可能是不正确的,这种情况称为设定误差。
好模型的标准
1、简约性(parsimony) 一定程度的抽象或简化是不可避免的,简单优于复杂。
2、可识别性(identifiability)
第三部分 实践中的回归分析
一、引言:放宽经典模型的假设 二、模型设定误差 三、多重共线性 四、异方差性 五、序列相关性
前面讨论了满足经济假设的回归模型,但是大多数 经济模型是很难严格满足这些经典假设的。这就极大地 限制了经典回归分析的应用范围。因此,我们有必要 研究在放宽这些经典假设的条件下,是否有可能得到回 归系数较好的估计值?如果有可能,其方法是什么?
o 如果不知道某些变量是否应包含在模型中,可将该变量加 入模型进行回归,并对这些变量的系数做联合F检验(对 于线性约束的检验),如果不显著,这些变量很可能是多 余的。
注意:如果根据理论分析,某些变量必须包括在模型中, 那么即便这些变量的回归系数不显著,也应该把他们保 留在模型中。
2020/3/5
18
PC: 当 前 消 费 ;PI: 永 久 性 收 入 但 利 用 了 可 观 测 变 量Ii PIi ei作 为 解 释 变 量
若 模 型 为 :PCi 0 1PIi ui
但 利 用 了Ii PIi ei作 为 解 释 变 量, Ci PCi vi为 被 解 释 变 量
2020/3/5
23
测量误差的影响
o 因变量存在测量误差:回归系数的OLS估计量是无偏的, 方差估计也是无偏的,但OLS估计量不是有效的
o 自变量存在测量误差:回归系数的OLS估计量是有偏的、 非一致的
测量误差的诊断和助理
o 诊断是否存在测量误差需要应用豪斯曼检验(Hausman Test),对测量误差进行纠正则应该使用工具变量法(参 看:平狄克等,1998)

a.用OLS 方法估计出每个Yi
b.做 以 下 模 型 的OLS回 归
2
3
Yi 0 1 X1i k X ki k1 Yi k2 Yi vi (2)
c.以(2)为 不 受 约 束 的 回 归 方 程,(1)为 受 约 束 的 回 归 方 程 ,
做k1 k2 0的线性约束检验
一般来说,遗漏相关变量的后果要严重一些,因为它 损失了无偏性。特别是当样本比较大时,包含不相关变 量带来的自由度减少不太严重,因而包含不相关变量的 影响要小一些。
2020/3/5
10
遗漏相关变量的影响
证明见古扎拉蒂(1995)或平狄克等(1998)
对于Yi 0 1 X1i 2 X 2i ui
误差项非正态分布
假定3和4在联立 方程模型中讨论
对假定5我们做简 单讨论
假定7影响参数估 计的无偏性,暂不 讨论
假定10对于大样 本数据不是必需的 假定。
本讲主要考虑放 宽了其余假定后面 临的问题
2020/3/5
4
微数缺测性
o 从理论上讲,样本容量n和解释变量数目k必须满足n>k+2, 才能进行OLS估计和假设检验。但事实上,即便n满足上 述条件,但如果样本很小,那么虽然能够进行估计和检验, 也很难通过t 检验。
的符号有误,就不能称为一个好模型。
5、预测能力(predictive power)
弗里德曼说:对模型有效性的唯一检验就是将预测值 与经验值相比较。
2020/3/5
8
常见设定误差的类型
(1)遗漏相关变量(2)包含无关变量 (3)采用错误函数形式 (4)度量误差
如:1968-1987年美国居民对进口商品的消费支出(IMPORT) 与可支配收入(PDI)的关系
22
4.测量误差(measurement error)
例子
若 模 型 为 :PCi 0 1Ii ui
PC: 永 久 性 消 费 ;I: 当 前 收 入 但 利 用 了 可 观 测 变 量Ci PCi vi作 为 被 解 释 变 量
若 模 型 为 :Ci 0 1PIi ui
一般情况下设定误差的检验(RESET)
o 回归设定误差检验(regression specification error test)
更准确更常用的判定方法是拉姆齐(Ramsey)于1969年提出 的所谓RESET 检验(regression error specification test)。
基本思想: 如果事先知道遗漏了哪个变量,只需将此变量引入模型,
d .如果通过假设检验,则可以拒绝原假设,即存在设定误差
2020/3/5
20
o Eviews等计量经济学软件会给出每个回归方程的Ramsey RESET统计量,从而判断是否存在设定误差
o 通过RESET可以判断是否存在设定误差,但无法得知正确的 模型应该如何设定
2020/3/5
21
判断回归模型预测效果的指标


Var( j )

2
TSS j
1

(
1

R
2 j

);SE( j
)


Var( j )
如果样本容量越小,则X
的变异性就越小,
j

从而TSS j就越小,即Var( j )越大。
2020/3/5
5
二、模型设定误差
1. 什么是设定误差 2. 设定误差的影响 3. 设定误差的诊断和处理 4. 测量误差
2020/3/5
12
a.残差图示法
2020/3/5
13
• 残差序列变化图
(a)趋势变化 :
模型设定时可能遗漏 了一随着时间的推移 而持续上升的变量
(b)循环变化:模
型设定时可能遗漏了一 随着时间的推移而呈现 循环变化的变量
2020/3/5
14
• 模型函数形式设定偏误时残差序列呈现正负 交替变化
2020/3/5
2
一、引言:放宽经典模型的假设
经典正态线性回归模型(CNLRM)的假定
o 关于模型的假定
1回归模型对参数而言是线性的 2模型是正确设定的
3解释变量X是确定性变量
o 关于解释变量的假定
4若X是随机的,则误差项与X不相关 5解释变量的取值有足够变异 6解释变量之间不存在完全的线性关系
7对于给定的X,误差项均值为0
估计并检验其参数是否显著不为零即可;
问题是不知道遗漏了哪个变量,需寻找一个替代变量Z, 来进行上述检验。
2020/3/5
19
RESET检验中,采用所设定模型中被解释变量Y的估计 值Ŷ的若干次幂来充当该“替代”变量。
对于Yi 0 1 X1i k X ki ui (1)
假 若 正 确 的 模 型 为 :IMPORTt 0 1PDIt 2Tt ut
那 么 以 下 几 种 情 况 属 于设 定 误 差 :
a.遗 漏 相 关 变 量 :IMPORTt 0 1PDIt ut b.包 含 无 关 变 量 :IMPORTt 0 1PDIt 2Tt 3Tt 2 ut c.错 误 的 函 数 形 式l:n IMPORTt 0 1 ln PDIt 2Tt ut
如 果 模 型 设 定 为 :Yi

0
1 X1i

v

i






E(1 ) 1 2b21

E(0 ) 0 2 ( X 2 b21 X1 )

E[var(1 )]

var(1 )


2 2
(n 2)
( X2i X2 )2 ( X1i X1 )2
o 如果要对两个回归模型的预测效果做出比较,不能对R2进行 比较
o Eviews等计量经济学软件会给出每个回归方程的赤池信息准 则AIC(Akaike information criterion)和施瓦兹信息准则 SC(Schwarz criterion),这两个指标越低的回归方程预测 效果越好
2020/3/5
o 关于误差项的假定
2020/3/5
8对于给定的X,误差项方差相等
9对于给定的X,误差项之间不存在序列相关
10误差项服从正态分布
3
放宽的假定
相应的问题
假定1、2 模型设定问题
假定3、4 随机解释变量
假定5
过度决定(微数缺测性)
假定6
多重共线性
假定7
误差项均值非零
假定8
异方差性
假定9
序列相关
假定10
模 型 三 :IMPORTt 0 1PDIt 2Tt 3Tt 2 ut
n 20, k 3, d 2.098
2020/3/5
17
包含无关变量
o 如果不知道某个变量是否应包含在模型中,可将该变量加 入模型进行回归并作t 检验,如果不显著,该变量很可能是 多余的。


,b21是X
2对X

1








率系


可 见 :(1) 0和1可 能 是 有 偏 的
(2)
E[
var(1
)]肯





1




还有:(3) 0和1也是不一致的.
2020/3/5
11
3.设定误差的诊断和处理
遗漏相关变量和采用错误的函数形式
o 根据设定好的模型进行OLS估计,对结果进行判断 a. 残差图 b. R2和调整的R2 c. 与预期相比,系数估计值的符号 d. 回归系数的t值 e. 德宾-沃森d统计量
2020/3/5
16
例题 美国居民对进口商品的消费支出与可支配收入的关系
模 型 一 :IMPORTt 0 1PDIt ut
n 20, k 1, d 0.595
模 型 二 :IMPORTt 0 1PDIt 2Tt ut
n 20, k 2,d 1.363
相关文档
最新文档