回归分析中的伪回归和处理

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

回归分析应用预测中经常出现的问题
• 2、利用非平稳时间序列直接建模容易产生“伪回归” 问题
如:
中国GDP 印度人口
物价指数个人收入水平个人收入水平物价指数
回归分析应用预测中经常出现的问题
• 2、利用非平稳时间序列直接建模容易产生“伪回归”问题
中国GDP 印度人口 ×
样本容量 25 50 100 ∝
表 9.3.1 双变量协整 ADF 检验临界值
显著性水平
0.01
0.05
-4.37
-3.59
-4.12
-3.46
-4.01
-3.39
-3.90
-3.33
0.10 -3.22 -3.13 -3.09 -3.05
• 例检验中国居民人均消费水平CPC与人均国内生
产总值GDPPC的协整关系。
（3）Y大于它的均衡值：Yt-1> 0+1Xt -1；
在时期t，假设X有一个变化量Xt，如果变量X与Y在时期t与t-1末期仍满足它们间的长期均衡关系，则Y的相应变化量由式给出:
Yt 1X t vt
式中，vt=t-t-1。
• 实际情况往往并非如此
如果t-1期末，发生了上述第二种情况，即Y 的值小于其均衡值，则Y的变化往往会比第一种情形下Y的变化Yt大一些；
800
1000
Z2
• 对于非稳定变量，不能使用经典回归模型，否则会出现虚假回归 (伪回归) 等诸多问题。
• 由于许多经济变量是非稳定的，这就给经典的回归分析方法带来了很大限制。
• 但是，如果变量之间有着长期的稳定关系（即它们之间是协整的cointegration），则是可以使用经典回归模型方法建立回归模型的。
式中， 1 0 0 (1 )
1 (1 2 ) (1 )
上面回归方程不能直接运用OLS法。对上述分布滞后模型适当变形得：
Yt 0 1X t (1 2 ) X t1 (1 )Yt1 t
1X t
(1 )Yt1
0 1
1 2 1
X t1 t
或， Yt 1X t (Yt1 0 1 X t1) t （**）
eˆt Yt Yˆt
称为协整回归(cointegrating)或静态回归(static regression)。第二步,检验员eˆt 的单整性,如果 eˆt 是稳定的序列,则认为因变量与自变量之间具有协整关系。检验的方法仍然是DF检验或ADF检验。
进行检验时，拒绝零Hale Waihona Puke Baidu设H0：=0，意味着误差项et是平稳序列，从而说明X与Y间是协整的。
已知C与GDP都是I(2)序列，它们的回归式：
Ct 49.764106 0.45831 GDPt
R2=0.9981
通过对该式计算的残差序列作ADF检验，得适当检验模型
eˆt 1.55eˆt1 1.49eˆt1 2.27eˆt3
（-4.47） (3.93) (3.05)
t=-4.47<-3.75=ADF0.05，拒绝存在单位根的假设，残差项是稳定的，因此中国居民人均消费水平与人均GDP是(2,2)阶协整的，说明了该两变量间存在长期稳定的“均衡”关系。
• 例如，中国居民人均消费水平与人均GDP变量之间的回归预测模型要比ARMA模型有更好的预测功能，其原因在于，从经济理论上说，人均GDP决定着居民人均消费水平，而且它们之间有着长期的稳定关系。
2. 长期均衡
• 某些经济变量间确实存在着长期均衡关系，这种均衡关系意味着经济系统不存在破坏均衡的内在机制，如果变量在某时期受到干扰后偏离其长期均衡点，则均衡机制将会在下一期进行调整以使其重新回到均衡状态。
假设X与Y间的长期“均衡关系”由式描述:
Yt 0 1X t t
式中:t是随机扰动项。该均衡关系意味着:给定X的一个值，Y相应
的均衡值也随之确定为0+1X。
在t-1期末，存在下述三种情形之一：
（1）Y等于它的均衡值：Yt-1= 0+1Xt -1；
（2）Y小于它的均衡值：Yt-1< 0+1Xt -1；
0 1
t衡1-11误期差的2 X项非t1均
t
或， Yt 1X t (Yt1 0 1 X t1) t （**）
式中， 1 0 0 (1 )
1 (1 2 ) (1 )
Y的变化决定于 X的变化以及前一时期的非均衡程度。
上面回归方程不能直接运用OLS法。对上述分布滞后模型适当变形得：
3.协整
从这里已看到，非稳定的时间序列，它们的线性组合也可能成为平稳的。
假设Yt=0+1Xt+t式中的X与Y是I(1)序列，如果该式所表述的它们间的长期均衡关系成立的话，则意味着由非均衡误差（*）式给出的线性组合是I(0)序列。这时我们称变量 X与Y是协整的（cointegrated）。
• 检验变量之间的协整关系，在建立计量经济学模型中是非常重要的。
Yt 0 1X t (1 2 ) X t1 (1 )Yt1 t
1X t
因为，从长期均衡的观点看，Y在第t期的变化不仅取决于X本身的变化，还取决于X与Y在 t-1期末的状态，尤其是X与Y在t-1期的不平衡程度。
例如，使用Yt=1Xt+t回归时，很少出现截距项显著为零的情况，即我们常常会得到如下
形式的方程：
Yt ˆ0 ˆ1X t vt ˆ0 0
(*)
在X保持不变时，如果模型存在静态均衡（static equilibrium），Y也会保持它的长期均衡值不变。
建立差分回归模型
Yt 1X t vt
式中， vt= t- t-1
然而，这种做法会引起两个问题：
(1)如果X与Y间存在着长期稳定的均衡关系：
Yt=0+1Xt+t 且误差项t不存在序列相关，则差分式：
Yt=1Xt+t 中的t是一个一阶移动平均时间序列，因而是序列相关的；
(2)如果采用差分形式进行估计，则关于变量水平值的重要信息将被忽略，这时模型只表达了X与Y间的短期关系，而没有揭示它们间的长期关系。
Yt 0 1 X t 2 X t1 Yt1 t
上面回归方程不能直接运用OLS法。对上述分布滞后模型适当变形得：
Yt 0 1X t (1 2 ) X t1 (1 )Yt1 t
1X t
(1 )Yt1
0 1
1 2 1
X t1 t
或， Yt 1X t (Yt1 0 1 X t1) t （**）
但如果使用（*）式，即使X保持不变，Y也会处于长期上升或下降的过程中，这意味着X与Y 间不存在静态均衡。
这与大多数具有静态均衡的经济理论假说不相符。
可见，简单差分不一定能解决非平稳时间序列所遇到的全部问题，因此，误差修正模型便应运而生。
• 误差修正模型（Error Correction Model，简记为ECM）是一种具有特定形式的模型，它的主要形式是由Davidson、 Hendry、Srba和Yeo于1978年提出的，称为DHSY模型。
回归分析应用预测中经常出现的问题
3、存在着因果关系的变量间建立的回归预测模型的预测效果越来越差
我们建立的模型是一个均衡的模型，而实际情况不可能总是在均衡状态下，实际往往会偏离其均衡状态而处于不均衡状态。这时，则需要根据上一期的不均衡程度调整本期的预测值。
• 利用非平稳时间序列直接建模容易产生 “伪回归”问题
而OLS法采用了残差最小平方和原理，因此估计量是向下偏倚的，这样将导致拒绝零假设的机会比实际情形大。
于是对et平稳性检验的DF与ADF临界值应该比正常的DF与ADF临界值还要小。
• MacKinnon(1991)通过模拟试验给出了协整检验的临界值，下表是双变量情形下不同样本容量的临界值。
• 存在着因果关系的变量间建立的回归预测模型的预测效果越来越差
• 怎么办???
• 检验是否存在长期稳定的均衡关系, • 误差修正
一、长期均衡关系
1. 问题的提出
• 经典回归模型（classical regression model）是建立在稳定数据变量基础上的。
4
2
0
-2
-4
200
400
600
• 1、根据解释变量的预测值测算被解释变量的未来值，扩大了最后的预测误差
GDP f (固定资产投资 ,劳动生产率 ,社会商品零售额 )
• 要预测某期的GDP，需要知道解释变量的同期数值, 而实际上，在预测GDP之前，上述解释变量的同期数值也是未知的，因此，需要首先通过其他方法对解释变量的数值进行预测，然后，再利用回归模型预测GDP。这种根据解释变量的预测值回归测算被解释变量未来值的方法无形之中扩大了最后的预测误差。
式Yt=0+1Xt+t中的随机扰动项也被称为非均衡误差（disequilibrium error），它是变量X与Y
的一个线性组合：
t Yt 0 1X t
(*)
因此，如果Yt=0+1Xt+t式所示的X与Y 间的长期均衡关系正确的话，（*）式表述的非
均衡误差应是一平稳时间序列，并且具有零期
望值，即是具有0均值的I(0)序列。
回归分析中的伪回归及其处理方法
——长期均衡关系 ——误差修正回归模型
回归分析的主要作用
• 1.描述分析与探索分析 • 2.预测分析 • 3.结构分析与实证分析 • 4.政策评价
回归分析的主要作用
• 1.描述分析与探索分析 • 2.预测分析 • 3.结构分析与实证分析 • 4.政策评价
回归分析应用预测中经常出现的问题
而且，从变量之间是否具有协整关系出发选择模型的变量，其数据基础是牢固的，其统计性质是优良的。
建立回归模型时,如 Ct 0 1GDPt t
只要变量选择是合理的(具有长期稳定的关系, 即协整关系)，随机误差项一定是“白噪声”（即均值为0，方差不变的稳定随机序列），模型参数有合理的经济解释。
式中， 1 0 0 (1 )
1 (1 2 ) (1 )
Y的变化决定于 X的变化以及前一时期的非均衡程度。
上面回归方程不能直接运用OLS法。对上述分布滞后模型适当变形得：
Yt 0 1X t (1 2 ) X t1 (1 )Yt1 t
1X t
(1
)Yt1
这也解释了尽管这两时间序列是非稳定的，但却可以用经典的回归分析方法建立回归模型的原因。
二、协整检验
为了检验两变量Yt,Xt是否为协整，Engle 和Granger于1987年提出两步检验法，也称为 EG检验。
第一步，用OLS方法估计方程： Yt=0+1Xt+t
并计算非均衡误差，得到：
Yˆt ˆ0 ˆ1X t
反之，如果Y的值大于其均衡值，则Y的变化往往会小于第一种情形下的Yt 。
可见，如果Yt=0+1Xt+t正确地提示了X与 Y间的长期稳定的“均衡关系”，则意味着Y对其均衡点的偏离从本质上说是“临时性”的。
因此，一个重要的假设就是:随机扰动项t 必须是平稳序列。
显然，如果t有随机性趋势（上升或下降），则会导致Y对其均衡点的任何偏离都会被长期累积下来而不能被消除。
三、误差修正模型
1、误差修正模型
• 前文已经提到，对于非稳定时间序列，可通过
差分的方法将其化为稳定序列，然后才可建立经典的回归分析模型。
例如：建立人均消费水平（Y）与人均可支配收入（X）之间的回归模型：
Yt 0 1 X t t
如果Y与X 具有共同的向上或向下的变化趋势
差分
X,Y 成为平稳序列
通过一个具体的模型来介绍它的结构。假设两变量X与Y的长期均衡关系为:
Yt=0+1Xt+t
由于现实经济中X与Y很少处在均衡点上，因此实际观测到的只是X与Y间的短期的或非均衡的关系。
实际上，第t期的Y值，不仅与X的变化有关，而且与t-1期X与Y的状态值有关。假设具有如下(1,1)阶分布滞后形式：
印度的人口增长比较快,中国的GDP增长也比较快,这两个序列有着共同的趋势,能否把这两个序列建立一个模型。
回归分析应用预测中经常出现的问题
• 2、利用非平稳时间序列直接建模容易产生 “伪回归”问题
？物价指数个人收入水平个人收入水平物价指数
较为普遍的现象!!
• 很多经济时间序列都是非平稳的（从直观上看，随着经济的发展，多数经济时间序列呈明显的上升趋势），而直接采用非平稳时间序列建立回归模型，很容易产生“伪回归”问题。