时间序列数据的伪回归问题
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
称为协整回归(cointegrating)或静态回归(static regression)。
ˆt 的单整性,如果 e ˆt 是稳定的序列,则认 第二步,检验 e 为因变量与自变量之间具有协整关系。检验的方法 仍然是DF检验或ADF检验。
进行检验时,拒绝零假设 H0 : =0 ,意味 着误差项et是平稳序列,从而说明 X与Y间是协 整的。
在时期 t ,假设 X 有一个变化量 Xt ,如果 变量X与Y在时期t与t-1末期仍满足它们间的长 期均衡关系,则Y的相应变化量由式给出:
Yt 1X t vt
式中,vt=t-t-1。
• 实际情况往往并非如此
如果t-1期末,发生了上述第二种情况,即Y 的值小于其均衡值,则 Y 的变化往往会比第一 种情形下Y的变化Yt大一些; 反之,如果 Y的值大于其均衡值,则 Y 的变 化往往会小于第一种情形下的Yt 。
二、协整检验
为了检验两变量 Yt,Xt 是否为协整, Engle 和 Granger 于 1987 年提出两步检验法,也称为 EG检验。 第一步,用OLS方法估计方程: Yt=0+1Xt+t 并计算非均衡误差,得到:
ˆ ˆ0 ˆ1 X t Y t ˆ ˆ Y Y e
t t t
• 检验变量之间的协整关系,在建立计量经 济学模型中是非常重要的。 而且,从变量之间是否具有协整关系出发 选择模型的变量,其数据基础是牢固的,其统 计性质是优良的。
建立回归模型时,如 Ct 0 1GDP t t
只要变量选择是合理的(具有长期稳定的关系, 即协整关系),随机误差项一定是“白噪声”(即均 值为0,方差不变的稳定随机序列),模型参数有合 理的经济解释。 这也解释了尽管这两时间序列是非稳定的,但却 可以用经典的回归分析方法建立回归模型的原因。
而OLS法采用了残差最小平方和原理,因 此估计量是向下偏倚的,这样将导致拒绝零假 设的机会比实际情形大。
于是对et平稳性检验的DF与ADF临界值应该 比正常的DF与ADF临界值还要小。
• MacKinnon(1991)通过模拟试验给出了协整检验的 临界值,下表是双变量情形下不同样本容量的临 界值。
Ct 49.764106 0.45831 GDP t
R2=0.9981
通过对该式计算的残差序列作ADF检验, 得适当检验模型
ˆt 1.55e ˆt 1 1.49e ˆt 1 2.27e ˆt 3 e
(-4.47) (3.93) (3.05)
t=-4.47<-3.75=ADF0.05,拒绝存在单位根的 假设,残差项是稳定的,因此中国居民人均消费 水平与人均GDP是(2,2)阶协整的,说明了该两变 量间存在长期稳定的“均衡”关系。
3.协整 从这里已看到,非稳定的时间序列,它 们的线性组合也可能成为平稳的。 假设Yt=0+1Xt+t式中的X与Y是I(1)序 列,如果该式所表述的它们间的长期均衡关 系成立的话,则意味着由非均衡误差(*)式 给出的线性组合是I(0)序列。这时我们称变量 X与Y是协整的(cointegrated)。
2. 长期均衡
• 某些经济变量间确实存在着长期均衡关系,这 种均衡关系意味着经济系统不存在破坏均衡的内 在机制,如果变量在某时期受到干扰后偏离其长 期均衡点,则均衡机制将会在下一期进行调整以 使其重新回到均衡状态。
假设X与Y间的长期“均衡关系”由式描述:
Yt 0 1 X t t
式Yt=0+1Xt+t中的随机扰动项也被称为非 均衡误差(disequilibrium error),它是变量X与Y 的一个线性组合:
t Yt 0 1 X t
(*)
因此,如果Yt=0+1Xt+t式所示的X与Y 间的长期均衡关系正确的话,(*)式表述的非 均衡误差应是一平稳时间序列,并且具有零期 望值,即是具有0均值的I(0)序列。
• 1、利用非平稳时间序列直接建模容易产生
“伪回归”问题
?个人收入水平
物价指数 个人收入水平
物价指数
较为普遍的现象!!
• 很多经济时间序列都是非平稳的(从直观上看, 随着经济的发展,多数经济时间序列呈明显的上 升趋势),而直接采用非平稳时间序列建立回归 模型,很容易产生“伪回归”问题。
• 由于许多经济变量是非稳定的,这就给经典的回归分析 方法带来了很大限制。 • 但是,如果变量之间有着长期的稳定关系(即它们之间 是 协整 的 cointegration),则是可以使用经典回归模型 方法建立回归模型的。 • 例如,中国居民人均消费水平与人均 GDP 变量之间的回 归预测模型要比ARMA模型有更好的预测功能,其原因在 于,从经济理论上说,人均GDP决定着居民人均消费水 平,而且它们之间有着长期的稳定关系。
• 非平稳时间序列的另一个问题是,虽然这种时间序列事实上会破 坏经典回归分析的基础和有效性,但根据分析结果并不一定能发 现问题。 • 事实上,有时即使时间序列严重非平稳,分析结果完全无效,t、 F、 等指标却仍然很正常,模型的显著性和拟合程度看起来都很 好。这种问题通常称为“伪回归” 问题。 R2
式中:t是随机扰动项。 该均衡关系意味着:给定X的一个值,Y相应 的均衡值也随之确定为0+1X。
在t-1期末,存在下述三种情形之一:
(1)Y等于它的均衡值:Yt-1= 0+1Xt -1;
(2)Y小于它的均衡值:Yt-1< 0+1Xt -1;
(3)Y大于它的均衡值:Yt-1> 0+1Xt -1;
•怎么办???
• 检验是否存在长期稳定的均衡关系, • 误差修正
一、长期均衡关系
1. 问题的提出
• 经典回归模型 (classical regression model)是建立在 稳定数据变量基础上的。
4
2
0
-2
-4 200 400 600 Z2 800 1000
• 对于非稳定变量,不能使用经典回归模型,否则会出 现虚假回归 (伪回归) 等诸多问题。
时间序列数据的伪回归问题 及其处理方法
——长期均衡关系 ——误差修正回归模型
• 运用平稳时间序列数据的经典回归分析是有效的,以往时间序列 数据的计量回归分析实际上隐含假设数据是平稳的。 • 如果把非平稳的时间序列当作平稳序列,事实上会破坏古典线性 回归模型的基本假设,用这样的模型进行回归,得到的统计量都 是失效的,分析、检验和预测结果都是无效的,对计量回归分析 的有效性有很大的影响。
•
1、利用非平稳时间序列直接建模容易产生“伪回归”问题 如:
中国GDP 印度人口
物价指数 个人收入水平 个人收入水平 物价指数
• 1、利用非平稳时间序列直接建模容易产生“伪回 归”问题
中国GDP 印度人口
×
印度的人口增长比较快,中国的GDP增长也比较快,这两 个序列有着共同的趋势,能否把这两个序列建立一个模型。
2、存在着因果关系的变量间建立的回归预测 模型的预测效果越来越差
ຫໍສະໝຸດ Baidu
我们建立的模型是一个均衡的模型,而实 际情况不可能总是在均衡状态下,实际往往会 偏离其均衡状态而处于不均衡状态。这时,则 需要根据 的不均衡程度 的预测 值。
• 利用非平稳时间序列直接建模容易产生“伪回归”问题 • 存在着因果关系的变量间建立的回归预测模型的预测效果越来越 差
表 9.3.1 样本容量 25 50 100 ∝ 双变量协整 ADF 检验临界值 显 著 性 水 平 0.01 -4.37 -4.12 -4.01 -3.90 0.05 -3.59 -3.46 -3.39 -3.33 0.10 -3.22 -3.13 -3.09 -3.05
• 例 检验中国居民人均消费水平CPC与人均国内生 产总值GDPPC的协整关系。 已知C与GDP都是I(2)序列,它们的回归式:
可见,如果Yt=0+1Xt+t正确地提示了X与 Y间的长期稳定的“均衡关系”,则意味着Y对 其均衡点的偏离从本质上说是“临时性”的。 因此,一个重要的假设就是:随机扰动项t 必须是平稳序列。 显然,如果t有随机性趋势(上升或下降), 则会导致Y对其均衡点的任何偏离都会被长期累 积下来而不能被消除。