计量经济学第九章 时间序列结构模型课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第九章结构型时间序列模型
时间序列回归模型分类:
1.不含外生变量的非结构型模型,包括单方程模型(如ARMA模型)和多方程模型(如向量自回归模型,V AR)
2.传统的结构模型,包括含有外生变量的单方程回归模型(如确定性趋势或季节模型、静态模型、分布滞后模型、自回归分布滞后模型等)和联立方程模型
3.协整和误差修正模型等现代时间序列模型
第二、三类模型反统称为结构型时间序列模型。

本章将对最基本的几种结构型时间序列模型进行简要介绍。

第一节确定性趋势与季节模型
确定性趋势与季节模型将经济变量看作是时间的某种函数,用于描述时间序列观测值的长期趋势特征和周期性变动特征。

其中的自变量是确定性的时间变量t或反映季节的虚拟变量。

由于自变量是非随机变量,自然是严格外生的,所以不涉及诸如非平稳性、高度持久等问题,一般可以如同横截面数据一样,直接使用经典线性模型的回归分析方法。

一、确定性趋势模型
(一)种类
按照因变量y与时间t的关系不同,常用的确定性趋势模型主要有以下三类:
1.线性趋势模型
01t t y t u ββ=++ (9.1)
当时间序列的逐期增长量(即一阶一次差分1t t t y y y -∆=-)大体相同时,可以考虑拟合直线趋势方程。

2. 曲线趋势模型
2012k t k t y t t t u ββββ=+++⋅⋅⋅++ (9.2)
若逐期增长量的逐期增长量(二阶一次差分21t t t y y y -∆=∆-∆)大致相同,可拟合二次曲线2012t t y t t u βββ=+++。

类似地,如果事物发展趋势有两个拐点,可以拟合三次曲线
230123t t y t t t u ββββ=++++。

其他更高次的曲线趋势比较少用。

3. 指数曲线模型
01t u t t y e ββ= (9.3)

01ln()ln (ln )t t y t u ββ=++
指数曲线的特点是各期的环比增长速度大体相同(即自然对数的一阶一次差分11/ln ln t t t t y y y y --∆≈-基本为常数),时间序列的逐期观测值大致按一定的百分比递增或衰减。

为了更好地表现事物发展的特征,我们还可以给指数曲线设置发展的上限或下限(渐进线)。

常用的带渐进线的指数曲线有以下几种: (1)修正指数曲线模型
01000t u t t y k e k βββ=+,>,≠ ,101<<β (9.4)
(2)龚伯兹(Gompertz )曲线模型
10010001t t
u t y k e k ββββ=,>,<≠1,<≠ (9.5)
(3)逻辑斯蒂(Logistic )曲线模型
010110001t
t u t y k k e ββββ=
+,>,≠,<≠ (9.6)
(二)模型选择标准
如果对同一时间序列有几种趋势线可供选择,在考虑经济意义的基础上,线性模型可以参照第三章第四节有关多元回归模型的评价准则进行优选。

除此之外,还可以用下列指标作为辅助标准,选择这些指标比较小的模型。

1. 均方根误差(Root Mean Squared Error ,RMSE ):
RMSE =
2. 平均绝对误差(Mean Absolute Error ,MAE ):
1
ˆt t MAE y y T
=
-∑ 3.平均绝对百分比误差(Mean Absolute Percent Error ,MAPE ):
ˆ1
100%t t t
y y MAPE T y -=
⨯∑ (三)模型估计
上述确定性趋势模型要么本身是参数线性的,要么通过变换模型形式可以使其线性化,所以均属于广义的线性模型范畴。

而且自变量(时间变量t 及其函数)都是非随机变量(肯定符合严格外生条件),所以,可以直接使
用OLS进行估计,所有估计与推断方法完全等同于横截面数据。

唯一与横截面回归不同的是,时间序列往往存在误差项自相关(将在第十章讨论)。

[例9-1] 改革开放以来我国GDP数据如表9-1所示。

试估计我国实际GDP的年平均增长率。

表9-1 部分年份中国GDP数据(1978年不变价,亿元)
资料来源:《中国统计年鉴·2010》
首先,描出GDP及其对数的时间序列图:
可见,GDP与时间t之间不存在线性关系,而其对数与时间存在线性关系。

即GDP呈指数趋势发展:
01t u t t GDP e ββ=
线性化的趋势模型形式为
01ln ln ln t t GDP t u ββ=+
+(),即 01ln t t GDP t u αα=++ 利用OLS 估计,并消除误差项自相关(自相关问题见第十章),输出结果如下:
表9-2 EViews 输出结果
Dependent Variable: LNGDP
Variable Coefficient Std. Error t-Statistic Prob.
C 8.070429 0.014908 541.3508 0.0000
T 0.094207 0.000778 121.0628 0.0000
AR(1) 1.281566 0.131144 9.772179 0.0000
AR(2) -0.73314 0.128869 -5.689080 0.0000 R-squared 0.999647 Mean dependent var 9.718339 Adjusted R-squared 0.999606 S.D. dependent var 0.833467
S.E. of regression 0.016540 Akaike info criterion -5.24254
6
Sum squared resid 0.007113 Schwarz criterion -5.05572
Log likelihood 82.63820 F-statistic 24538.49 Durbin-Watson stat 2.013367 Prob(F-statistic) 0.000000
Inverted AR Roots .64-.57i .64+.57i
可见,消除误差项自相关后,回归方程为
·ln8.0700.094
=+
GDP t
回归结果说明,样本内我国实际GDP年均增长率为0.094,即9.4%。

〔用水平法计算的GDP10.0989.8%
==〕
二、季节变动模型
与横截面数据相比,时间序列往往受到季节变动的影响。

所谓季节变动是指经济变量因受自然因素或社会经济因素影响,从而形成的有规律的周期性变动。

这里的“季节”一词是广义的,泛指任何一种有规律的、按一定周期(如季、月、旬、周、日)重复出现的变化。

如果忽视其季节因素,回归中就会犯遗漏变量的错误,影响参数估计的无偏性和一致性。

根据回归分析的目的不同,对含有季节变动的数据有不同的处理方法:
1.季节差分。

如季度数据和月度数据分别采用4阶和12阶差分。

2. 季节修匀。

即通过移动平均、指数平滑等方法,去除时间序列中的周期性变化。

3.引入季节虚拟变量。

[例9-2] 某企业最近6年的商品销售额的季度数据表9-3。

试用虚拟变量方法建立季节波动模型。

表9-3 某企业商品销售额的季度数据
4
2913.385 20 0 0 1
2011 1 3163.665 21 0 0 0
2 3486.161 22 1 0 0
3 3205.529 23 0 1 0
4 3348.307 24 0 0 1
数据的变化轨迹见图9-3。

图9-3 销售额变化轨迹图
可见,商品销售额既有明显的线性增长趋势,又含有明显的季节波动。

故应构造含有季节虚拟变量的线性趋势模型。

为避免 “虚拟变量陷阱”,只对第二、三、四季度设置虚拟变量,记为234D D D 、和。

EViews 回归结果如下:
表9-4 EViews 输出结果
Dependent Variable: Y
Method: Least Squares Sample: 2006Q1 2011Q4 Included observations: 24
Coefficie Std. Error t-Statistic Prob. C 975.9741 34.36549 28.39983 0.0000 T 103.2167 1.959216 52.68263
0.0000
D2 127.3019 37.90632 3.358330 0.0033 D3 -70.8203 38.05791 -1.860857 0.0783 D4 -156.967 38.30923 -4.097376
0.0006 R-squared
0.993293 Mean dependent var 2241.061 Adjusted R-squared 0.991881 S.D. dependent var 727.6855 S.E. of regression 65.56791 Akaike info criterion 11.38710 Sum squared resid 81683.87 Schwarz criterion 11.63253 Log likelihood -131.6452 Hannan-Quinn
criter. 11.45221 F-statistic 703.4771 Durbin-Watson stat 1.893665
Prob(F-statistic) 0.000000
故样本回归方程如下:
234ˆ975.974103.217127.30270.820156.967t t t t y t D D D =++-- (9.7)
在使用确定性趋势和季节模型时,我们实际上是用时间变量和季节虚拟
变量作为因变量的所有影响因素的代理变量,简化了回归分析的假定,在经济预测方面应用比较广泛。

但有时失之于过于简单化,不能对影响时间序列变动的具体社会经济因素进行分析,不利于验证经济理论、分析经济结构和政策评价。

另外,这类模型的一个潜在问题是往往存在误差项自相关,这也是需要在应用时加以注意的。

第二节 静态模型
静态模型(Static Model )是时间序列回归分析的基础模型之一。

实际上,上一节介绍的确定性趋势模型和季节模型都属于静态模型。

在静态模型中,被解释变量的值只取决于各解释变量和随机误差项的当期值。

静态模型一般形式如下:
01122...t t t k kt t y x x x u ββββ=+++++ (9.8)
这实际上是将多元线性回归模型应用于时间序列数据。

一、静态模型对数据的要求
1.如果模型中的自变量(1,2,...,)j x j k =是非随机变量,或尽管是随机变量,但严格外生于随机误差项t u ,即
12(|)=(|,,...)=0t t k E u E u X X X X ,其中(2)(1)(1)(2)(,,,,,,)j j t j t jt j t j t x x x x x ++--=⋅⋅⋅⋅⋅⋅X
则静态模型(9.8)可以完全按照横截面数据的经典线性回归模型方法进行参数估计和统计推断,如本章第一节介绍的确定性趋势(季节)回归模型。

2. 如果模型中的自变量(1,2,...,)j x j k =是随机变量,但不严格外生于随机误差项,而是(宽)外生于随机误差项,即仅有12(|)=(|,,...)=0t t t t t kt E u E u x x x X ,这时时间序列的特殊性将给回归分析带来一些问题。

但如果,jt t x y 都是产生
自平稳、遍历过程,应用OLS在大样本下仍然可以获得参数的一致和渐进正态的估计量,因此也可以按照横截面数据回归分析的方法进行参数估计和统计推断。

〔对于非平稳和高度持久的时间序列,由于OLSE的一致性和渐进正态性受到破坏,容易产生伪回归问题。

一般而言,如果生成时间序列的随机过程是非平稳的(或高度持久的),必须将数据平稳化(或弱相依化),然后再进行OLS回归。

由于在一般情况下,大多数非平稳时间序列都是高度持久的,所以时间序列平稳化的过程同时也是弱相依化的过程。


二、趋势平稳序列的回归
什么是趋势平稳序列?
时间序列中确定性趋势导致的伪回归称为第一种类型的伪回归。

如果作为时间序列中包含了确定性的时间趋势,为了避免第一种类型的伪回归,有等价的两种处理方法。

(一)在模型中引入时间变量
如果x、y中含有确定性趋势,若直接将y对x进行回归,相当于遗漏了重要变量t,所以,应该在模型中将其作为独立的自变量引入进来。

这样x 的回归系数才反映在时间t固定(保持不变)条件下,x对y的“纯净”影响,避免伪回归。

〔例9-3〕表9-5中,x是某地人均寿命(岁),y是该地区稻米产量(千克/亩),t是时间变量(以1991年作为起始年份)。

表9-5 某地人均寿命与稻米产量历史数据
如果直接将y 对x 进行回归,结果如下:
2ˆ29.0348.2199 (9.9)
(16.13)
(5.23)
0.305
t t y
x t R =-+==
回归系数高度显著,但在经济上无法解释。

考虑到x 和y 都是t 的函数,即
2
ˆ70.1450.302 (9.10)
(31.46)(2.881)
0.316
t x
t t R =+==

2
450.3117.223 (9.11)
(26.47)(9.043)
0.819
t y t t R =+==
一个自然而然的猜测是,正是由于两个变量存在的长期趋势形成了(9.9)的结果。

将t 引入(9.9),观察x 对y 的“纯净”效应(偏效应),得回归模型如下:
2
ˆ382.370.969 6.931 (9.12)
(2.943)(0.527)(7.033)
0.822
t t y
x t t R =++==
可见,消除了t 的因素,x 对y 的偏效应在统计上不显著。

说明,(9.9)确实是一个伪回归。

(二)去除原序列中的确定性趋势
“剔除”掉时间序列中的确定性趋势,使时间序列平稳化,然后再应用OLS 进行回归分析。

〔例9-4〕在例9-3中,我们已经验证出x 和y 序列中都含有显著的线性趋势,我们将其从原序列“剔除”出去,即作变换
ˆ'(70.1450.302)t t t x x x
x t =-=-+ ˆ'(450.3117.223t t t y y y y t =-=-+)
变换后的数据见表9-6。

表9-6 变换后的时间序列数据
对变换后的序列进行ADF 检验,可以发现,'~(0)'(0)x I y I ,~。

使用OLS ,回归结果如下:
2'69.2750.968' 9.13 (0.543)
0.016
y x t R =+=
=()
可见,二者的线性关系不显著,说明人均寿命与稻米亩产量之间没有实
质性的系统联系。

去势平稳化变换对回归系数的影响与在原序列的回归模型中加入时间趋势t的效果完全一样。

二者反映的都是剔除了t的影响后,x对y的“纯净”效应。

三、差分平稳序列回归
什么是差分平稳序列?
两个差分平稳序列的回归往往产生第二种类型的伪回归。

我们可以通过差分处理“剔除”其中的随机趋势使时间序列平稳化,然后再进行回归。

〔例9-5〕纽约证券交易所(NYSE)证券市场综合指数y和斯里兰卡人
口数x的数据如表9-7所示。

试分析两个序列之间的经济关系。

版)》(复旦大学出版社,2008)第291页,表11.10.
如果直接将y对x进行OLS回归,结果如下:
2
ˆ313.010.03(9.14)
(8.72)
0.75
t t y x t R =-+==
将两个序列进行一阶差分变换,分别记为t x ∆和t y ∆,重新进行OLS 回归,回归方程如下:
¶2
291.800.004(9.15)
(0.93)
0.03
t t y x t R ∆=-=
-=
可见,消除了随机趋势,x 对y 的效应在统计上不显著。

说明,(9.14)确实是一个伪回归。

在单整序列之间进行回归分析时,我们常常遇到不同序列的单整阶数不同,比如我们研究y 与x 、z 之间的关系,但~(1)~(2)~(3)t t t y I x I z I ,,。

这就需要对不同序列分别进行不同次数的差分使之平稳化,再利用差分变量
t y ∆、2t x ∆和3t z ∆进行回归。

〔例9-6〕讨论EViews6.0软件自带的示例文件demo.wf1中GDP 与RS 的关系。

打开EViews\example files\data\demo.wf1,选择GDP 序列和RS 序列,进行单位根检验,结果是,~(2)~(1)GDP I RS I ,。

作2t GDP ∆对t RS ∆的线性回归,EViews 输出结果如下:
表9-8 EViews 输出结果 Dependent Variable: D(D(GDP))
Method: Least Squares
Sample (adjusted): 1952Q3 1996Q4
Included observations: 178 after adjustments
Coefficie
nt Std. Error t-Statistic
Prob. C 0.138438 0.509399 0.271766
0.7861 D(RS) 1.300938 0.650039 2.001322
0.0469 R-squared 0.022251 Mean dependent var
0.162500 Adjusted R-squared 0.016696 S.D. dependent var
6.851778 S.E. of regression 6.794340 Akaike info criterion
6.681229 Sum squared resid 8124.697 Schwarz criterion
6.716980 Log likelihood -592.6294 Hannan-Quinn
criter.
6.695727 F-statistic 4.005289 Durbin-Watson stat
2.797918 Prob(F-statistic) 0.046894
即有回归方程: ·20.138+1.3t t GDP RS =
∆∆
回归结果表明,GDP的二次差分序列与RS的一次差分序列之间存在显著性水平比较低的线性相关关系。

RS的季度增长量每变动一个单位,影响GDP的季度二次增长量(增长量的增长量)变动1.3个单位。

差分处理还有一个好处,可以去除时间序列中的线性确定性趋势(但不能去除非线性趋势)。

所以如果序列具有线性递增(递减)趋势,但无法断定到底是确定性趋势还是随机趋势时,对其进行差分处理一般都可以解决问题。

相关文档
最新文档