第三章 经典假设条件不满足时的问题与对策
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E(ˆ
2 j
)
2
,在这种情况下,我们所选择的其实并非
正确模型。当备选模型包含大量无关变量时,选出正
确模型的概率较低。
19
2. 基于预测的均方误差最小的三个准则
希尔的准则是基于回归的标准误差最小,下列三 个准则则是基于预测的均方误差(MSE)最小。这 三个准则是:
马娄斯(Mallows)的 C p准则
23
RESET检验法的思路
RESET检验法的思路是在要检验的回归方程中加 进 Yˆ 2,Yˆ3和Yˆ 4 等项作为解释变量,然后看结果是否有 显著改善。如有,则可判断原方程存在遗漏有关变 量的问题或其它的误设定问题。
直观地看,这些添加的项是任何可能的遗漏变量 或错误的函数形式的替身,如果这些替身能够通过F 检验, 表明它们改善了原方程的拟合状况,则我们有 理由说原方程存在误设定问题。
另一方面, Yˆ 2,Yˆ3和Yˆ 4 等项形成多项式函数形式 ,多项式是一种强有力的曲线拟合装置,因而如果 存在(函数形式方面的)误设定,则用这样一个装 置可以很好地代表它们。
24
RESET检验法的步骤
拉姆齐RESET检验的具体步骤是: (1) 用OLS法估计要检验的方程,得到
Yˆi ˆ0 ˆ1X1i ˆ2 X 2i
21
3. 赤池信息准则(AIC) 赤池信息准则(Akaike’s Information Criterion,AIC )是一个更一般的准则,它可以应用于任何一个可 用极大似然法估计的模型。对于我们这里的应用, AIC的计算公式为
AIC e2(k 1) / n RSS n
与赤池信息准则类似的还有施瓦茨信息准则( Schwarz information criterion,SIC):
4
一. 选择错误的函数形式
这类错误中比较常见的是将非线性关系作为线性 关系处理。函数形式选择错误,所建立的模型当然 无法反映所研究现象的实际情况,后果是显而易见 的。因此,我们应当根据实际问题,选择正确的函 数形式。
5
我们在前面各章的介绍中采用的函数形式以线性 函数为主,上一章还介绍了因变量和解释变量都采用 对数的双对数模型,下面再介绍几种比较常见的函数 形式的模型,为读者的回归实践多提供几种选择方案。 这几种模型是:
本章将对上述问题作简要讨论,主要介绍问题的后 果、检测方法和解决途径。
3
第一节 误设定
采用OLS法估计模型时,实际上有一个隐含的 假设,即模型是正确设定的。这包括两方面的含 义:函数形式正确和解释变量选择正确。在实践 中,这样一个假设或许从来也不现实。我们可能 犯下列三个方面的错误:
选择错误的函数形式 遗漏有关的解释变量 包括无关的解释变量 从而造成所谓的“误设定”问题。
计量经济学家就此提出了很多基于统计学的选择 标准,我们这里讨论其中几种,如表3-1所示。
16
令RSSj表示第j个模型(有kj个解释变量,包括常 数项)的残差平方和,并定义
ˆ
2 j
RSS j nkj
为第j个模型的的
2估计值。我们
ˆ
2 m
用表示包含全
部k个解释变量的模型的 2估计值。
17
表3-1 选择回归模型的准则
3. R 2 : 该变量加进方程中后,R 2 是否增大?
4. 偏倚: 该变量加进方程中后,其它变量的系数 估计值是 否显著变化?
如果对四个问题的回答都是肯定的,则该变量应该包括在 方程中;如果对四个问题的回答都是“否”, 则该变量是 无关变量,可以安全地从方程中删掉它。这是两种容易决 策的情形。
14
X X
上式表明,Y的绝对变动量等于 1乘以X的相对变动量。因
此, 线性-对数模型通常用于研究解释变量每变动1%引起的 因变量的绝对变动量是多少这类问题。
9
2. 双曲函数模型 双曲函数模型的形式为:
Yt
0
1
1 Xt
ut
不难看出,这是一个仅存在变量非线性的模型, 很容易用重新定义的方法将其线性化。
26
第二节 多重共线性
应用OLS法的一个假设条件是;矩阵X的秩=K+1<N。 即自变量之间不存在严格的线性关系,观测值个数大于 待估计的参数的个数。这两条无论哪一条不满足,则 OLS估计值的计算无法进行,估计过程由于数学原因而 中断,就象分母为0一样。
准则
R2 Sp Cp PC AIC
计算公式
RSS j /(n k j )
RSS j /[(n k j )(n k j 1)]
RSS
j
2k
2
jm
RSS j (n k j ) /(n k j )
RSS j exp[2(k j 1) / n]
18
1. R2 准则
希尔(Theil)的 R2 准则基于如下假设:所考虑的
但根据以上原则判断并不总是这么简单。在很多 情况下,这四项准则的判断结果会出现不一致。例如, 有可能某个变量加进方程后, 增R大2,但该变量不显 著。
在这种情况下,作出正确判断不是一件容易的事, 处理的原则是将理论准则放在第一位。
在选择变量的问题上,应当坚定不移地根据理论而 不是满意的拟合结果来作决定,对于是否将一个变量 包括在回归方程中的问题,理论是最重要的判断准则。 如果不这样做,产生不正确结果的风险很大。
15
*五、模型的选择
上一段讨论了某个解释变量应否包括在模型中的 几条原则。实践中,要解决的一个问题是如何从大量 的潜在解释变量的集合中选择一个最合适的子集,以 得到一个正确设定的模型。
上个世纪六十年代后相当一段时间,人们使用逐步 回归法来解决解释变量的选择问题。这种由计算机机 械挑选变量的做法如今已不流行了。目前比较通行的 做法是从少量精心设定的备选模型中选择一个。
25
F (RSSM RSS ) / M RSS /(n k 1)
其中:RSSM为第一步中回归(有约束回归)的残差平方和, RSS为第二步中回归(无约束回归)的残差平方和,M为 约束条件的个数,这里是M=3。
应该指出的是,拉姆齐RESET检验仅能检验误 设定的存在,而不能告诉我们到底是哪一类的误 设定,或者说,不能告诉我们正确的模型是什么。 但该方法毕竟能给出模型误设定的信号,以便我 们去进一步查找问题。另一方面,如果模型设定 正确,RESET检验使我们能够排除误设定的存在, 转而去查找其它方面的问题。
p
X
p t
ut
其中Y表示总成本,X表示产出,P为多项式的阶 数,一般不超过四阶。
多项式回归模型中,解释变量X以不同幂次出现在 方程的右端。这类模型也仅存在变量非线性,因而 很容易线性化,可用OLS法估计模型。
11
二. 遗漏有关的解释变量 模型中遗漏了对因变量有显著影响的解释变量的
后果是:将使模型参数估计量不再是无偏估计量。
SIC n(k1)/ n RSS n
上述两个准则与前述准则 一样,可用于模型选择, 其值也是越小越好。
22
六. 检验误设定的RESET方法
前面给出了选择解释变量的四条原则。可是,有时 这些原则不能提供足够的信息使研究人员确信其设 定是最恰当的,在这种情况下,可考虑使用一些更 正规的检验方法来比较不同估计方程的性质。这类 方法相当多,这里就不一一列出,仅介绍拉姆齐(J. B. Ramsey ) 的 回 归 设 定 误 差 检 验 法 ( RESET 法 , Regression Specification Error Test)。
l 误设定(Misspecification 或specification error) l 多重共线性(Multicollinearity) l 异方差性(Heteroscedasticity或Heteroskedasticity) l 自相关(Autocorrelation) l 随机解释变量(Stochastic explanatory variables)
ln( GDPt ) 0 1t ut
得到一国GDP的年增长率的估计值,这里t为时间趋 势变量。
8
线性-对数模型的形式如下:
Yt 0 1 ln Xt ut
与前面类似,我们可用微分得到
因此
1 X
dY dX
dY dX X
dY dX
1
1 X
这表明
1
Y的绝对变动 X的相对变动
Y X X
Y
1
双曲函数模型的特点是,当X趋向无穷时,Y趋 向 0 ,反映到图上,就是当X趋向无穷时,Y将无 限靠近其渐近线(Y = 0 )。
双曲函数模型通常用于描述著名的恩格尔曲线和 菲利普斯曲线。
10
3. 多项式回归模型 多项式回归模型通常用于描述生产成本函数,其 一般形式为:
Yt
0
1Xt
2
X
2 t
......
在回归实践中,有时要对某个变量是否应该作为解 释变量包括在方程中作出准确的判断确实不是一件容 易的事,因为目前还没有行之有效的方法可供使用。 尽管如此,还是有一些有助于我们进行判断的原则可 用,它们是:
13
选择解释变量的四条原则
1. 理论: 从理论上看,该变量是否应该作为解释变
量包括 在方程中? 2. t检验:该变量的系数估计值是否显著?
(2) 由上一步得到的值 后用OLS法估计:
Yˆi(i=1,2,…,n),计算 Yˆi2,Yˆi3和Yˆi4 ,然
Yi 0 1X1i 2 X 2i 3Yˆi2 4Yˆi3 5Yˆi4 ui
(3) 用F检验比较两个方程的拟合情况(类似于上一章中联合 假设检验采用的方法),如果两方程总体拟合情况显著不同, 则我们得出原方程可能存在误设定的结论。使用的检验统计 量为:
第三章 经典假设条件不满足 时的问题及对策
1
本章内容
第一节 误设定 第二节 多重共线性 第三节 异方差性 第四节 自相关 第五节 随机解释变量
2
OLS估计量令人满意的性质,是根据一组假设条件而 得到的。在实践中,如果某些假设条件不能满足,则 OLS就不再适用于模型的估计。下面列出实践中可能碰 到的一些常见问题:
三. 包括无关的解释变量 模型中包括无关的解释变量,参数估计量仍无偏,
但会增大估计量的方差,即增大误差。
[注] 有关上述两点结论的说明请参见教科书P42-43。
12
四. 选择解释变量的四条原则
在模型设定中的一般原则是尽量不漏掉有关的解释 变量。因为估计量有偏比增大误差更严重。但如果方 差很大,得到的无偏估计量也就没有多大意义了,因 此也不宜随意乱增加解释变量。Leabharlann Baidu
模型中有一个是正确模型。对于正确模型,E(ˆ
2 j
)
2,
对于不正确模型,E(ˆ
2 j
)
2。因此,选择ˆ
2最小的模型一
般就能选出正确模型。由于ˆ 2最小化与R2 最大化是一
回事,我们习惯上称该准则为 R2 最大准则。
这个准则的主要问题是,一个包括正确模型的所有
解释变量但同时也包括一些无关变量的模型也会给出
ln Yt 0 1Xt ut
对数-线性模型中,斜率的含义是Y的百分比变动, 即解释变量X变动一个单位引起的因变量Y的百分比 变动。这是因为,利用微分可以得出:
1
d ln Y dX
1 Y
dY dX
dY Y
( dX 1)
7
这表明,斜率度量的是解释变量X的单位变动所 引起的因变量Y的相对变动。将此相对变动乘以100, 就得到Y的百分比变动,或者说得到Y的增长率。 由于对数-线性模型中斜率系数的这一含义,因而也 叫增长模型 (growth model)。增长模型通常用于测 度所关心的经济变量(如GDP)的增长率。例如, 我们可以通过估计下面的半对数模型
霍金(Hocking)的 S p 准则 阿美米亚(Amemiya)的PC准则 假设正确的方程有k个解释变量,我们考虑的方程 有 k1( k)个解释变量,问题是如何选择k1以及具体的 k1个解释变量的集合。在上述三个预测准则中,这是
通过使的均方误差 E(Yf Yˆf )2 达到最小实现的,其中 Yf
是Y的未来值,而Yˆf 是预测值。
20
上述三个准则都是基于预测的均方误差最小,但在 估计预测的均方误差时采用的假设有所不同,因而形 成各自的计算公式,孰优孰劣,并无定论,在实践中 可根据所用软件提供的输出结果选用其中一个作为模 型选择的准则。具体做法是比较备选的几个模型的
C p、 S p 或PC值,选其中最小的即可。
在三个预测准则的情况下,我们感兴趣的是改善预 测的MSE,只要能改善,可以去掉某些变量,即便是 正确模型中包括它们也在所不惜。
• 半对数模型 • 双曲函数模型 • 多项式回归模型
6
1. 半对数模型 半对数模型指的是因变量和解释变量中一个为对数 形式而另一个为线性的模型。因变量为对数形式的 称为对数-线性模型(log-lin model)。解释变量为对数 形式的称为线性-对数模型(lin-log model)。我们先介 绍前者,其形式如下: