计量经济学第五讲20130416
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五讲 序列相关
一、 为什么要关注序列相关问题?
对于模型01
i i i y x ββε=++,序列无关假定即:(,)0,i j Cov i j εε=≠。对于时间序列数据,这个假定经
常被违背,即出现序列相关问题。
时间序列数据是通过对同一个单元的连续观测而
获得的,所有观测具有固定的时间先后顺序。与之相比,横截面数据是通过对不同单元的观测而获得的,在横截面数据中,所有观测在本质上都处于一个平行位置,而其实际顺序具有随意性。
由于时间序列数据来自于同一个单元,而同一个
单元的某些内在特性在一定时期不会出现较大的变化,因此时间序列数据经常表现出明显的序列相关性。从直觉上看,这种序列相关一般应该是正的序列相关。
由于序列相关主要针对时间序列数据,因此在讨论这个问题时我们把模型中的脚标i 改写为t ,把样本容量N 改写为T : 01t t t y x ββε=++
误差项ε容纳了除x 之外的其他对y 有影响的变量。当这些变量序列相关时,误差项就很可能出现序列相关。理解误差项序列相关的另一个视角是,在时间序列模
型中,误差项经常被称之为冲击(Shock)。对经济系统的冲击经常具有持续性,从而这为误差项序列相关提供了现实依据。
笔记:
在日常生活中,我们经常说“好运连连”、“屋漏偏逢连夜雨”等口头禅。如果把“好运”理解成正向冲击,“连夜雨”理解成负向冲击,则这些口头禅就意味着冲击一般具有正相关性。
序列相关问题会产生什么样的后果呢?
(一)理论意义上的后果
在证明高斯-马尔科夫定理时,我们仅仅在证明OLS估计量具有有效性时涉及到了序列无关假定,而在证明线性、无偏性并没有用到该假定,因此序列相关并不影响OLS估计量所具有的线性与无偏性这两个性质(实际上也不影响OLS估计量的一致性,一致性只涉及到高斯-马尔科夫假定一、二、三),而只影响OLS估计量的有效性。具体来说,当序列相关问题存在时,在所有线性无偏估计量中,OLS估计量再也不是最有效的估计量了。如果在模型估计时利用序列相关信息而不是像OLS估计那样对序列相关问题视而不见,则模型估计的有效性将提高。本章后面我们将介绍如何利用序列相关信息进行模型估计。
(二)实践意义上的后果
计量软件包在默认状态下总是认为同方差假定成立,进而依据一些常规公式来计算参数估计的标准误。
例如,在默认状态下1
ˆβ标准误的计算公式是,
1ˆ)(se β=其中22ˆˆ2
i N δε=-∑是对误差方差的估计。然而我们知道, 1
2
ˆ(())i i i i Var Var k y k βδε==∑∑ 如果序列无关假定不成立,则
12
ˆ2(,)()i i j i j i j
i k k Cov Var k βεεδε≠+=∑∑ 即使同方差假定成立,然而由于0(,)i j i j i j
k k Cov εε≠≠∑,因此们根本无法推导出12ˆ22
()i x x βδδ=-∑这个通常的公式。
计1
ˆβδ的目的显然是不可行的。因此,序列相关问题在实践意义上的后果就是,计量软件包在默认状态下计算出的参数估计量的标准误是无意义的,进而基于这种标准误所进行的假设检验也是无意义的。
笔记:
由于正序列相关更常见,故(,)i j i j i j
k k Cov εε≠∑一般是大于0
的,因此省略此项得到的1
ˆβ的标准差一般会小于其真实的标准差。相应的,计量软件包在默认状态下计算出的参数估计量的标准误很可能低估了真实的标准差,夸大了估计精度。
幸运的是,与异方差问题一样,当出现序列相关
问题时,在大样本情况下,我们能够计算一个稳健标准误。这个标准误既对序列相关问题稳健,也对异方差问题稳健,被称为HAC(heteroskedasticity and autocorrelation consistent)标准误或者Newey-West 标准误。在大样本下,我们可以基于HAC 标准误进行统计推断。关于HAC 标准误的简单介绍参见Stock & Watson(Second edition,p.606-607)。
二、 发现自相关
与异方差检验一样、我们是通过对残差的分析来
检验序列无关假定是否被违背。
(一)图示法
如果残差随着观测顺序的变化并不频繁地改变符号,见图一,则这是误差项序列正自相关的证据;如果残差随着观测顺序的变化频繁地改变符号,则这是
误差项序列负自相关的证据,见图二。
笔记: 1、与上述图形检验思路一样但更正规的一种检验方式是游程检验(runs test )。首先记录残差的符号,例如:(++++++++++)(--)(+++++++)(-)(++++++)。所谓游程是指具有同一符号的一个不间断历程。在此例中,具有5个游程。直观来看,如果游程太多,这意味着残差频繁地改变符号,而这是负自相关的证据;反之,如果游程太少,则是正自相关的证据。给定观测值的个数,利用Swed & Eisenhart 所给出的一定显著水平下关于游程数的两个临界值,我们可以检验误差是独立的这个原假设。详情可参见相关教科书。
2、在图一中,残差大约在三个位置改变了符号,你也许会问,这不是违背了正序列相关的判断吗?记住!我们发现的正序列相关是统计规律,而统计规律是大部分观测所具有的规律。 图一:正序列相关
ˆt ε
ˆt ε
图二:负序列相关
(二)Durbin-Watson (DW )检验
DW 检验用来检验误差项是否存在一阶自相关。
该检验法利用OLS 残差ˆt ε
构造检验统计量: 21
221ˆˆ()ˆT t t t T t t DW εεε-==-=∑∑
很容易证明ˆ2(1)DW ρ≈-,其中ˆρ是残差样本一
阶自相关系数(该证明留作讨论相关图检验时的一个练习)。基于这个结论,显然,如果误差项没有一阶自
相关关系,那么ˆρ应该接近于0,而DW 应该接近于2;
如果误差项具有强烈的一阶正自相关关系,即ˆρ
接近于1,而DW 应该接近于0;如果误差项具有强烈的
一阶负自相关关系,即ˆρ
接近于-1,而DW 应该接近于4。上述这些论述为我们利用DW 统计量来检验序列相关提供了指南。
为了更好地利用DW 统计量,我们当然希望知道它的分布。不过不幸的是,在误差项一阶自相关系数为零的原假设下,DW 的精确分布取决于解释变量的取值。换句话说,当我们利用相同的模型但不同的样本时(这里样本不同不是指样本容量不同,而是指变量取值不同),我们所面对的DW 统计量分布是不同的,从而这损害了DW 统计量的实际应用性。