第9章-模型设定与数据问题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

9.2 无 关 变 量 假设真实模型为
yi xi11 i
(9.8)
其中, Cov( xi1 , i ) 0 。而实际估计的模型为
yi xi11 xi2 2 ( i xi2 2 )
0
(9.9)
பைடு நூலகம்
由于真实参数 2 0 ,故可将模型写为 yi xi11 xi2 2 i 。 由于 x2 与 y 无关, 故 x2 也与 y 的扰动项 无关, 即 Cov( xi 2 , i ) 0 。 ˆ ,plim ˆ 0。 但引入无关变量后, 故 OLS 一致, 即 plim 1 1 2 2
(9.14)
各变量的边际效应为: E( y ) E( y ) E( y ) 1 2 x1 , 2 x3 , 3 x2 (9.15) x1 x2 x3
x1 的边际效应依赖于 x1 ; x2 的边际效应依赖于 x3 ;而 x3 的边际效 应依赖于 x2 。如果怀疑边际效应并非常数,应考虑在回归方程中 引入非线性项。
“Ramsey’s RESET 检验”(Regression Equation Specification Error Test)的基本思想是,如果怀疑遗漏非线性项,就把非线性项引入 方程,并检验其系数是否显著。
ˆ xb 。 ˆ是x 回归拟合值 y 既然 y 假设线性回归模型为 y x , ˆ 2 包含了解释变量二次项(含平方项与交叉项)的信 的线性组合, y ˆ 3 包含了解释变量三次项的信息,等等。考虑回归方程: 息, y ˆ3 4 y ˆ4 ˆ 2 3 y y x 2 y
在实践中,较常用 AIC 与 BIC,不常用 HQIC。虽然在大样本 中 BIC 一致而 AIC 不一致,但现实样本有限,而 BIC 准则可能 导致模型过小,故 AIC 准则依然常用。
9.5 对函数形式的检验 如果回归方程中存在非线性项,则边际效应不再是常数。例:
y 0 1 x1 2 x2 3 x3 x12 x2 x3
condition 2 assumption
(9.6)
Cov( z , v ) Cov( z , v) Cov( z , ) 0 0 0
assumption condition 1
(9.7)
因此,将代理变量引入回归方程后使用 OLS,可得到一致估计量。
q 0 1 z v, Cov( z , v) 0
(9.4)
根据第一个条件(多余性),代理变量 z 只通过 q 对 y 发生作用, 故在回归方程已经包含 q 的情况下,z 与 y 的扰动项 不相关,即
Cov( z , ) 0 。
根据第二个条件,q 的扰动项 v 与所有解释变量均不相关,即 Cov( xk , v) 0, k 。将 q 的表达式代入原模型(9.3)可得
(3) “贝叶斯信息准则” (Bayesian Information Criterion, 简记 BIC) 或“施瓦茨信息准则”(Schwarz Information Criterion,简记 SIC 或 SBIC):选择解释变量的个数 K,使得以下目标函数最小化: ln n min BIC ln(e e / n) K (9.11) K n ln n 2 , 故 BIC 准则对于解释变量过多的惩罚比 AIC 一般来说, 严厉。BIC 准则更强调模型的简洁性。 (4)“汉南-昆信息准则”(Hannan-Quinn Information Criterion, 简记 HQIC):选择解释变量的个数 K,使得以下目标函数最小化: ln ln(n) K (9.12) min HQIC ln(ee / n) K n 在时间序列模型中,常用信息准则来确定滞后阶数。比如,考 虑以下 p 阶自回归模型(详见第 20 章),
9.4 解释变量个数的选择 加入过多的解释变量可提高模型的解释力,但会牺牲模型的简 洁性(parsimony)。可供选择的权衡标准如下。 (1) 校正可决系数 R 2 :选择解释变量的个数 K 以最大化 R 2 。 (2) “赤池信息准则”(Akaike Information Criterion,简记 AIC): 选择解释变量的个数 K,使得以下目标函数最小化: 2 min AIC ln(e e / n) K (9.10) K n 右边第一项为对模型拟合度的奖励(减少残差平方和), 第二项为 对解释变量过多的惩罚(解释变量个数 K 的增函数)。当 K 上升时, 第一项下降而第二项上升。
例 李宏彬等(2012)通过就业调查数据,研究“官二代”大学毕 业生的起薪是否高于非官二代。 由于可能存在遗漏变量,该文包括了尽可能多的控制变量,比 如年龄、性别、城镇户口、父母收入、父母学历、高考成绩、大 学成绩、文理科、党员、学生会干部、兼职实习经历、拥有技术 等级证书等。 李宏彬等(2012, p. 1012)认为, “尽管我们无法利用自然实验来解 决线性回归中存在的遗漏变量问题,但是我们可以通过控制大量 可能影响工资的变量来降低可能存在的估计偏差。其中,最为重 要的是,我们将高考成绩作为学生能力或智商的代理变量” 。
yt 0 1 yt 1 p yt p t , t 1,, T
(9.13)
ˆ 是真实 其中,滞后阶数 p 待确定。根据 BIC 或 HQIC 计算的 p ˆ p) 0 , 参数 p 的一致估计量,即当样本容量 T 时, Pr( p ˆ p ) 1, Pr( p ˆ p) 0 。 Pr( p ˆ 却不是一致估计,即使在大样本中也可能高 根据 AIC 计算的 p ˆ p ) 0 ,但 Pr( p ˆ p ) c 0 。证明参见附录。 估 p ,虽然 Pr( p
ˆ 2 error ˆ 2 y y 0 1 y
(9.17)
ˆ 2 不应对 y 有 然后检验“ H 0 : 2 0 ” 。如果模型设定正确,则 y 解释力。如果拒绝 H 0 : 2 0 ,则认为模型设定有误,可考虑加入 非线性项或改变回归的函数形式(比如,取对数)。
证明:假设真实模型为
y 0 1 x1 K xK q
(9.3)
其中,q 为不可观测的遗漏变量。假定 Cov( xk , ) 0, k ,但遗 漏变量 q 与某解释变量 xm 相关(1 m K ),即 Cov( xm , q) 0 ,故 OLS 不一致。 假设找到代理变量 z,满足
ˆ 的方差一般会增大。 估计量 1
n n
9.3 建模策略: “由小到大”还是“由大到小” “由小到大”(specific to general)的建模方式首先从最简单的小模 型开始,逐渐增加解释变量。但小模型很可能存在遗漏变量,导 致估计量不一致,t 检验、F 检验都将失效,因此很难确定该如何 取舍变量。 与此相反, “由大到小”(general to specific)的建模方式从一个尽 可能大的模型开始,收集所有可能的解释变量,逐步剔除不显著 的解释变量。虽然冒着包含无关变量的危险,但危害性没有遗漏 变量严重。但在实际操作上,常常很难找到足够多的解释变量。 实践中,常采用这两种策略的折衷方案。
存在遗漏变量本身并不要紧;问题的关键是,被遗漏的变量不 能与包括在方程内的解释变量相关。 解决遗漏变量偏差的方法主要有: (i) 加入尽可能多的控制变量(control variable); (ii) 使用“代理变量”(proxy variable); (iii) 工具变量法(第 10 章); (iv) 使用面板数据(第 15-17 章); (v) 随机实验与自然实验(第 18 章)。 第(i)种方法:列出所有可能对被解释变量有影响的变量,尽可 能去收集数据。如果有些变量无法获得,则需从理论上说明,遗 漏变量不会与解释变量相关,或相关性很弱。
yi xi11 xi2 2 i
型(estimated model)为
yi xi11 ui (9.2) 遗漏变量(omitted variables) xi2 2 被归入新扰动项 ui xi2 2 i 中。
考虑以下两种情形: (1) 遗漏变量 xi 2 与解释变量 xi1 不相关,即 Cov( xi1 , xi 2 ) 0 。扰动 项 ui 与解释变量 xi1 不相关,OLS 依然可一致地估计 1 。由于遗漏 变量 xi2 2 被归入扰动项 ui 中,可能增大扰动项的方差,影响 OLS 估计的精确度。 (2) 遗漏变量 xi 2 与解释变量 xi1相关,即 Cov( xi1 , xi 2 ) 0 ,OLS 不 再一致,称其偏差为“遗漏变量偏差”(omitted variable bias)。
在实践中,代理变量是否满足以上两个条件,通常只能做定性 讨论,无法严格检验。 如果使用不满足这两个条件的“不完美代理变量” (imperfect proxy variable),仍会导致不一致的估计。 解决遗漏变量偏差的第(iii)-(v)种方法将在以后各章介绍。 任何实证研究中几乎总是存在遗漏变量。 一篇专业水准的实证论文几乎总需要说明,它如何在存在遗漏 变量的情况下避免遗漏变量偏差。
(9.16)
对 H 0 : 2 3 4 0 作 F 检验。如果拒绝 H 0 ,说明模型中应有 高次项;如果接受 H 0 ,则可使用线性模型。RESET 检验的缺点是 在拒绝 H 0 时,不知道具体遗漏哪些高次项。
另一模型设定检验为“连接检验”(link test),由 Tukey (1949) 与 Pregibon (1979, 1980)提出。此处的“连接”指的是,将解释变 量与被解释变量连接在一起的函数形式是否正确。 进行以下回归:
当控制变量不可得时,可考虑第(ii)种方法,即代理变量法。比 如, 在教育投资回归中, 可用智商(IQ)来作为个人能力的代理变量。 一个理想的代理变量应满足以下两个条件: (1) 多余性(redundancy):即代理变量仅通过影响遗漏变量而作 用于被解释变量。比如, “智商”仅通过对“能力”的作用来影响 工资收入。假如有“能力”的数据,那么再引入“智商”作为解 释变量就是多余的。 (2) 剩余独立性: 遗漏变量中不受代理变量影响的剩余部分与所 有解释变量均不相关。 命题 如果上述两个条件满足,则使用代理变量就能获得一致 的估计量。
y ( 0 0 ) 1 x1 K xK 1 z ( v ) (9.5)
容易证明,新扰动项 ( v ) 与所有解释变量均不相关,
Cov( xk , v ) Cov( xk , v) Cov( xk , ) 0 0 0 ( k )
© 陈强,《高级计量经济学及 Stata 应用》 ,第二版,2013 年,高等教育出版社,即将出版。请勿上传或散发。
第 9 章 模型设定与数据问题
9
如果模型设定(model specification)不当,如解释变量选择不当、 测量误差、函数形式不妥等,则会出现“设定误差”(specification error)。数据本身也可能存在问题,如多重共线性、对回归结果影 响很大的极端数据等。 9.1 遗 漏 变 量 假设真实的模型为 (9.1) 其中,x1 , x2 可以是向量,且与扰动项 不相关。而实际估计的模
相关文档
最新文档