伍德里奇《计量经济学导论》笔记和课后习题详解(模型设定和数据问题的深入探讨)【圣才出品】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第9章 模型设定和数据问题的深入探讨
9.1 复习笔记
一、函数形式设误
1.函数形式设误的概念
遗漏一个关键变量能导致误差与某些解释变量之间的相关,从而通常导致所有的OLS 估计量都是偏误和不一致的。在遗漏的变量是模型中一个解释变量的函数的特殊情形下,模型就存在函数形式误设的问题。遗漏函数自变量的函数并不是出现函数误设的唯一方式。
2.侦查误设函数形式的工具
侦查工具为:联合排除性约束的F 检验。通常,在模型中添加任何一个显著变量的平方项并进行一个联合显著性检验都是讲得通的。如果所增加的平方项是显著的,那就可以把它们放到模型中(代价是对模型的解释更复杂些)。
3.对函数形式设误问题的一般检验:RESET
(1)RESET 检验
设原模型为:
011k k y ββx βx u =++
++ (a )
该模型满足假定MLR.4。 令ˆy
表示上式所得到的OLS 拟合值。考虑扩大方程: 2301112ˆˆk k y ββx βx βy
βy =++++++误差项 (b ) 利用这个方程来检验式模型(a )是否漏掉了重要的非线性关系。其中,2ˆy
和3ˆy 都只
是x j 的非线性函数。虚拟假设:模型(b )是正确设定的形式。
RESET 就是在扩大模型(b )中检验H 0:δ1=0,δ2=0的F 统计量。显著的F 统计量表明存在某种函数形式的问题。在大样本情况下,F 统计量的分布在虚拟假设(和高斯-马尔可夫假定)下渐近服从F 2,n -k -3,也可以使用LM 型检验(χ2分布的df 为2)。
(2)RESET 检验的缺陷
①当模型被拒绝后,不能为下一步提供现实的方向;
②只要被遗漏变量的期望值是模型中所包含自变量的线性函数,RESET 就无法侦查出变量遗漏问题。
4.非嵌套模型的检验
对非嵌套模型的检验试图对函数形式误设的其他类型(比如,试图决定某一自变量究竟应以水平值形式还是对数形式出现)做出检验,使之离开经典假设检验的辖域。有可能要相对模型
()()01122log log y ββx βx u =+++ (c ) 来检验模型
01122y ββx βx u =+++ (d )
或者把这两个模型反过来。然而,它们是非嵌套模型,所以不能仅使用标准的F 检验。
(1)米宗和理查德检验
构造一个综合模型,将每个模型都作为一个特殊情形而包含其中,然后检验导致每个模型的约束。在目前的例子中,综合模型为:
()()011223142log log y γγx γx γx γx u =+++++ (e ) 首先检验H 0:γ3=0,γ4=0,作为对式(d )的检验。也可以检验H 0:γ1=0,γ2=0,作为对式(c )的检验。
(2)戴维森—麦金农检验
若式(d)正确,则从另一个模型(c)得到的拟合值在式(d)中应该是不显著的。因此,为了检验式(d),首先用OLS估计模型(c)以得到拟合值,并记之为ˆˆy。然后,该
检验则基于方程
011221ˆ
yββxβxβy
=++++误差项中ˆy的t统计量。显著的t统计量则是拒绝式(d)的证据。
类似地,如果ˆy表示估计式(d)所得到的拟合值,那么下式即为对式(c)的检验:
()() 011221ˆ
log log
yββxβxθy
=++++误差项显著的t统计量便是拒绝式(c)的证据。
(3)非嵌套检验存在的问题
①不一定会出现一个明显好的模型。两个模型可能都被拒绝,也可能没有一个被拒绝。在后一种情形中,可以使用调整R2来进行选择。如果两个模型都被拒绝,则有更多的工作要做。不过,重要的是知道使用这种或那种形式的实际后果:如果关键自变量对Y的影响没有多大差异,那么使用哪个模型实际上并不要紧。
②用戴维森—麦金农检验拒绝了式(d),这并不意味着式(c)就是正确的模型。模型(d)可能会因多种误设的函数形式而被拒绝。
③在比较因变量不同的模型时,如何进行非嵌套检验。典型的情况就是,一个因变量是Y,一个因变量是log(y)。
二、对无法观测解释变量使用代理变量
1.代理变量
(1)遗漏变量问题的植入解
假设在有3个自变量的模型中,其中有两个自变量是可以观测的,解释变量*
3
x观测不
到: *0112233y ββx βx βx u =++++
但有*3x 的一个代理变量,并称之为x 3。*30333x δδx v =++。其中,v 3是因*3x 与
x 3并非完全相关所导致的误差。参数δ3度量了*3x 与x 3之间的关系。*3x 和x 3正相关,所
以δ3>0。如果δ3=0,则x 3不是*3x 合适的代理变量。截距δ0,是容许*3x 和x 3以不同的尺度来度量。
假设x 3就是*3x ,做y 对x 1,x 2,x 3的回归,从而利用x 3得到β1和β2的无偏(或至少是一致)估计量。在做OLS 之前,只是用x 3取代了*3x ,所以称之为遗漏变量问题的植入解。
(2)植入解能得到β1和β2的一致估计量所需要的假定
①误差u 与x 1、x 2和*3x 都不相关,这就是对模型*0112233y ββx βx βx u =++++的一个标准假定。而且,u 与x 3也不相关。(对这个假定的另一种表述是,给定所有这些变量,U 的期望值为0。)
②误差v 3与x 1、x 2和x 3都不相关。v 3与x 1、x 2不相关的假定要求x 3是*
3x 的一个“好”代理变量。 ()()**312333033,,E x x x x E x x δδx ==+
一旦排除了x 3的影响后,*
3x 就与x 1、x 2零相关。
代理变量也可以以二值信息的形式出现。
2.用滞后因变量作为代理变量
(1)使用滞后因变量作为代理变量的原因
①用滞后因变量作为代理变量在某些应用研究中,对于要控制哪些无法观测因素,至少