计量经济学序列相关

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4.2 序列相关王中昭制作§
违反了随机扰动项
之间相互独立的假
定,称为序列相关。

●学习内容:
王中昭制作
•一、序列相关定义及其类型
•二、实际经济问题中的序列相关性
•三、序列相关性的后果
•四、序列相关性的检验
•五、序列相关性的修正
王中昭制作•1、序列相关(或称自相关)的定义:
•在线性回归模型基本假定4中,我们假设随机扰动项序列的各项之间不相关,如果这一假定不满足,则称之为序列相关。

即用符号表示为:j
i E Cov j i j i ≠≠=当 0)(),(μμμμ一、序列相关定义及其类型
王中昭制作•称为一阶序列相关,即μi =ρμi-1+εi ,,i=1,2,…,n,-1<ρ<1
•其中ρ称为自协方差系数或者一阶自相关系数。

这是常见的序列相关,
除此之外统称为高阶序列相关。

如:μi =ρ1μi-1+ρ2μi-2+εi ,称为二阶序列相关。

1
,2,1 0)(1-=≠+n i E i i μμ如果仅存在●2、类型
王中昭制作•1、经济发展的惯性
•2、模型设定偏误
•3、滞后效应
•4、对数据的处理可能会导致序列相关

5、由随机扰动项本身特性所决定●二、实际经济问题中的序列
相关性
●1、经济发展的惯性
王中昭制作
•大多数经济时间序列都有一个明显的特
点,就是它的惯性。

表现在时间序列数据不
同时间的前后关联上。

众所周知,GDP、价
格指数、生产、消费、就业和失业等时间序
列都呈现周期循环。

相继的观测值很可能是
相互依赖的。

这样就导致经济变量的前后期
(或前后若干期)出现相关,从而使随机误
差项相关。

•这是最常见的序列相关现象。

王中昭制作•从而造成v 自相关。

原因是替代品的价格对牛肉销量有重要影响。

t
t t t t X X X Y μββββ++++=3322110t
t t t v X X Y +++=22110βββt
t t X v μβ+=33例如,如果真实的回归方程形式为,
其中,被解释变量Y 表示牛肉需求量,解释变量分别为牛肉价格X 1、消费者收入X 2和替代品的价格X 3。

但是在作回归时用的是:
那么,随机扰动项就会出现系统性模式:
●2、模型设定偏误(如应含而未含变量
的情形或者模型函数形式有偏误)
王中昭制作•例如:在消费支出C 对收入I 的时间序列分析中,当期的消费支出除了依赖于收入I 等其它变量外,还依赖前期的消费支出.
•如:C t =β1+β2I t +β3C t-1+μt ,
•则C t-1=β1+β2I t-1+β3C t-2+μt-1
•从上式可知因为μt 与μt-1分别为C t 与C t-1的模型的随机误差项,如果C t 与C t-1相关,会导致μt 与μt-1相关。

这种现象常出现在农产品供给函数中,使得模型中随机误差项产生序列相关。

例如农产品(粮食)供给函数为:
t
t t P S μββ++=-121是蛛网理
论啊●3、滞后效应
王中昭制作•在经验分析中,许多数据是经过加工而成的。

例如,在用到季度数据的时间序列回归中,季度数据通常由月度数据加总而成。

这种平均的计算减弱了每月的波动而引进了数据的匀滑性,导致数据的前后期相关。

•另外,在对原始数据进行移动平均等处理后,再用它来建立模型,这时这些数据也会存在前后若干期的相关性。

, (11)
Y Y Y Y N t t t t +--+++=.ˆ,ˆ54相关Y Y ⇒3ˆ:21--++=t t t t Y Y Y Y 如,3
ˆ,3ˆ34552344Y Y Y Y Y Y Y Y ++=++=如●4、对数据的处理可能会导致序列相关
●5、由随机扰动项本身特性所决定
王中昭制作
•在许多情况下,真实的随机扰动项的各
项值是相关的,例如:旱涝、地震、战争、
罢工等纯随机因素所产生的影响将会延续
一段时期,从而导致随机扰动项序列相关。

•因为被解释变量与随机误差项具有相同
的分布(只有数学期望不同而已)。

•可以证明:如果因变量观测值之间如果
存在相关性,则随机扰动项之间也就存在
相关性。

王中昭制作•(1)、参数估计量非有效性:OLS 估计得到的参数值虽然仍为线性、无偏估计量,但不具有有效性(即最小方差性)。

•(2)、变量的显著性检验失效:
可以证明在序列存在相关的情况下,参数估计值的方差可能变小(或者变大),从而使回归系数的t 统计量变大(或者变小)。

这样会使t 检验失去意义。

)ˆvar( ˆi i S ββ=如果i S t i
i ββˆ
ˆ =
则●三、序列相关性的后果
王中昭制作(3)模型预测失效
因为如果存在序列相关则使模型不具有优良性,从而它的预测功能降低。


此时计算预测区间可能没有意义的。


返回
王中昭制作•
序列相关性的检验方法有许多,如:冯诺曼比检验法、回归检验法、D.W 检验等。


这些检验方法的共同思路是:首先采用OLS 估计模型,以求得随机干扰项的“近似估计量e i ”,然后通过分析这些e i 之间的相关性以达到判断随机干扰项是否具有序列相关的目的。


下面只讲4种常用方法:•
1、图形法•
2、回归检验法•
3、D.W 检验(Durbin-Watson)•
4、拉格朗日乘数(LM )检验。

●四、序列相关性的检验
王中昭制作
例4.2.1, (P132),
用例2.6.2的数据(文件d3p56.dta)。

中国国民消费函数,检验是否序列相关.方法1:首先估计模型,然后得到残差residual (记为e t )。

用模型残差e t 与滞后一期e t-1的相关图。

●1、图形法有两种表示方式
王中昭制作reg y x
predict et,residual //记残差变量名为et
gen et_1=L.et //产生滞后1期变量
存在正的一阶序列相关(因为大多数点落在第一和第三象限中),如果大多数点落在第二和第四象限中,则存在负的一阶序列相关,如果点均匀地分布在原点周围,则不存在一阶序列相关.
-
3
-
2
-
1
1
2
R
e
s
i
d
u
a
l
s
-2000-1000010002000
residuals滞后一期
王中昭制作图形法的方法2
•由于上述的检验只能检验一阶序列相关。

因此图形法可以用下面第二种方法来处理:•自相关系数图和偏自相关系数图。

•滞后k 阶的自相关系数公式见下式,自相关系数体现了残差当前期与滞后各期的相关性。

在stata 中用ac 来计算和作图。

)
var()var(),(k t t k t t k COV --⨯=μμμμρ
王中昭制作
•偏自相关系数的含义:
•求出滞后k 自相关系数ρk 时,实际上得到并不是μt 与μt-k 之间单纯的相关关系。

因为μt 同时还会受到中间k-1个随机变量μt-1, μt-2, ……μt-k+1, 的影响,而这k-1个随机变量又都和μt-k 具有相关关系,所以自相关系数ρk 里实际掺杂了其他变量对μt , 和μt-k 的影响。

•为了能单纯测度μt-k 对μt 的影响,引进偏自相关系数的概念。

•对于时间序列{μt },所谓滞后k 偏自相关系数指在给定中间k-1个随机变量μt-1, μt-2, ……μt-k+1的条件下,或者说,在剔除了中间k-1个随机变量μt-1, μt-2, ……μt-k+1的干扰之后,μt-k 对μt 影响的相关程度。

•计算公式为下式,具体计算就用μt 与μt-1, μt-2, ……μt-k 回归后,其系数就是μt 偏自相关系数。

)
var(*)var(/)),...((11k t t k t k t t t k E COV pac --+--=μμμμμμ
王中昭制作
•在stata中用ac (auto-correlation cofficient)
和pac(partial auto-correlation cofficient)命
令来计算自相关系数和偏自相关系数及其
图形。

王中昭制作
•用ac et命令后的结果,灰色区域为95%的置信区间,表明残差的滞后1阶自相关系数较大,一般地在置信区间以外就可认为存在1阶序列相关。

-
1
.
-
.
5
.
.
5
1
.
051015
Lag
Bartlett's formula for MA(q) 95% confidence bands
王中昭制作•用pac et 命令后的结果,灰色区域为95%的
置信区间。

-1.00-0.500.000.50
1.00051015Lag 95% Confidence bands [se = 1/sqrt(n)]•表明残差的滞后1、2阶偏自相关系数
超出置信区间,存在1阶和2阶序列相关。

王中昭制作•如果想看具体数值可用:
•corrgram et,lags(10)
•其中Q 值为检验自相关显著性的一个统计量
王中昭制作
2、回归检验法
(Wooldridge 书中提出的方法)
•以为被解释变量,以各种可能的相
关量,如等作为解释变量建立各种方程:
t e 2
121,,t t t e e e ---1112233, t 2,3,...,n
, t 4,5......,n
t t t t t t t t e e e e e e ρερρρε----=+==+++=对各种方程进行统计检验,如果存在某一种函数形式通过检验,则说明原模型存在序列相关。

回归检验法不仅能知道序列相关是否存在,而且还知道自相关的形式,适合于任何类型的序列相关性问题的检验。

王中昭制作以例4.2.1为例(文件d3p56.dta,P132),经过筛选在各种回归模型中结果较好的模型为:
•容易看出模型通过统计检验(注意不用考虑经济意义检验),故存在序列相关,而且从模型可知至少是二阶以上的序列相关。

e
t
=1.658561e t-1-0.8642281e t-2
王中昭制作
D.W 检验是检验自相关的最著名、最常用
的方法。

此法是由J.Durbin 和G.S.Watson 于1951年提出一种适合于大样本的检验方法。

•内容有:
•(1)、适用条件•(2)、检验步骤
●3、D.W 检验(Durbin-
Watson)
王中昭制作
(1)、适用条件
•(a) 解释变量是非随机的(即自变量与随机扰动项不相关);
•(b)随机扰动项是一阶自相关:μ
t =ρμ
t-1
+v
t

•(c)回归模型解释变量中不包含滞后因变量;•(d)样本容量较大(如n>25).
王中昭制作
(2)、检验步骤
•(a )提出假设
•H 0:ρ=0,即不存在一阶自相关;(μt =ρμt-1+v t )
•H 1:ρ≠0,即存在一阶自相关。

•(b )构造统计量D.W
2
1
2
2
1
()ˆ.,n
t
t t t t t
n
t
t e e
d DW
e Y Y e
-==-==
=-∑∑其中
王中昭制作
ρ的估计量ρ^与d=D.W 的关系
2
11
2
2
22
1
1
()
2(1)
n
n
t
t t
t t t n
n
t
t
t t e
e e e
d e
e
--====-=
≈-
∑∑∑∑12
2
1
ˆn
t
t t n
t
t e e
e
ρ-===∑∑)ˆ1(2ρ
-≈d 2
2
1
22
,,
n
n
t t t t n e e
-==∑∑当较大时,大致相等定义
•(为样本的一阶自相关系数)作为ρ
的估计量。

则有:
因为-1 ≤ρ^≤1,所以,0 ≤ d ≤4
王中昭制作
(c )检验判断
•由样本个数n 、解释变量个数和显著性水平α查D.W 分布表(见p377,注意表中的k=解释变量个数+1)得临界值d L 和d U ,则检验如下,其中d=D.W 。

如果:(1)0<d<d L , 则μt 存在正的序列相关(d 越接近0,越强);
(2)4-d L <d<4,则μt 存在负的序列相关(d 越接近4,越强);
(3)d u <d<4-d u ,则μt 不存在序列相关(d 越接近2,越无相关);
(4)d L <d<d u 和4-d u <d<4-d L , 则用Durbin-Watson 检验不能判断μt 是否存在序列相关。

王中昭制作
经验判断:由于d=2(1-ρ)和μt =ρμt-1+v t
从而有如下结论:(1)当ρ→0时,则d→2, 此时无相关(即d 越接近于2,越无相关);(2)当ρ→1时,则d→0,此时存在正相关;(3)当ρ→-1时,则d→4,此时存在负相关。

王中昭制作D.W检验,以例4.2.1为例(文件d3p56.dta)
reg y x
dwstat
用D.W检验
D.W=0.2771554,n=29,k=2.
取α=0.05,查表得:dL=1.34,dU=1.48由于D.W<dL,因此存在序列相关.
王中昭制作
4. 拉格朗日乘数检验(简称LM 检验,
Lagrange multiplier)
拉格朗日乘数检验克服了DW 检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。

它是由布劳殊(Breusch )与戈弗雷(Godfrey )于1978年提出的,也被称为BG 检验。

i
ki k i i i X X X Y μββββ+++++= 22110对于模型
如果怀疑随机扰动项存在p 阶序列相关:
t
p t p t t t εμρμρμρμ+++=--- 2211
王中昭制作
GB 检验可用来检验如下受约束回归方程
t
p t p t kt k t t X X Y εμρμρβββ+++++++=-- 11110原假设, H 0: ρ1=ρ2=…=ρp =0
在H 0成立的情况下,有:
其中,n 为原模型的样本个数,而n-p 为下面模型的样本个数,R 2为如下辅助回归的决定系数:
01111011...................
t t k tk t p t p t t t t k tk t e X X e e e Y X X βββρρεβββε--=+++++++=++++其中为原模型的残差)
(~)(2
2
p R p n LM χ-=
王中昭制作
检验过程:
.
),()(,
),()(2
2
2
2阶序列相关不存在则如果阶序列相关存在则如果p p R p n p p R p n t t μχμχ<->-给出显著性水平α,由p 及α查临界值χα2(p),
与LM 的值(n-p)R 2比较。

在实际检验中,滞后期p 的选择较为重要,可从1阶、2阶、…
逐次向更高阶检验。

还可以考虑是否要常数项,主要通过变量的显著性检验进行筛选。

王中昭制作•以例4.2.1为例(文件d3p56.dta)•qui reg y x
•bgodfrey,lag(2)
•选取2阶滞后期(p=2),
•结果表明存在2阶序列相关
•bgodfrey,lag(3) small
王中昭制作
•加上small检验统计量针对小样本进行了调整。


在3阶序列相关。

•滞后期选取很重要。

王中昭制作和书上加时间t后建模型
gen t=_n
gen t2=t*t
qui reg y x t2
bgodfrey,lag(2)
•存在2阶序列相关。

王中昭制作检验方法小结
•1、图形法
•2、适合于解释变量是严格外生变量
•回归方法(Wooldridge),D.W检验.
•3、适合于解释变量不是严格外生变量
•D-W’s h 检验(D.W检验方法的改进,stata
操作中有),拉格朗日乘数检验(简称LM检验,也被称为BG检验:Breusch-Godfrey 检
验)。

五、序列相关的修正
王中昭制作
•从前面可看出,序列相关产生原因主要有:
•时间序列本身所具有的特征
•数据本身的问题:取对数和差分能够从一定程度
上降低序列相关
•内容:
•1、一阶差分
•2、广义差分
•(1)一阶序列相关时的广义差分法
•(2)非线性模型的广义差分法
•3、CO 两步法
王中昭制作
1、一阶差分

用OLS 对一阶差分模型(2)进行估计,得到估计量βi 。

此模型即为消除了一阶序列相关的模型。


以后可看到此法也同时消除了多重共线性。

()
:
11
,12
,12
1
,11
1
2
2
1
1
则其一阶差分模型为μ
ββββμββββ-----+++++=+++++=i k
i k
i i i i ik
k
i i i
X
X Y X X X X Y ()
,2:)(......)()(1
22
11
1,1212211111,εμ
μ
μ
βββρμμβββi i i
i
ik k
i i i i i k i i ,,k ,i i ,i i i i X X Y X X X X X X X Y Y +=∆+∆++∆+∆=∆-+-++-+-=-------即列相关如果原模型存在一阶序即
王中昭制作
一阶差分法在stata 中的实现步骤
•直接采用差分函数(注意D 要大写)
•reg D.y D.x,nocon •dwstat
• 注意:一
阶差分后的
模型无常数
项。

μββt
t t t X X Y ∆+∆+∆=∆
22
1
1
例如要计算:
王中昭制作例1、用一阶差分法来估计例2.6.2,
结果如下:
•D.W 值提高了.还存在1阶序列相关吗?
王中昭制作
2、广义差分
•(1)对于一阶序列相关其广义差分模型•(2)非线性模型的广义差分法
王中昭制作
(1)一阶序列相关时广义差分法
.......(2) (1)
1
22110εμ
ρ
μμμββββi i i
i
i ik k i i i X X Y X +=+++++=-存在一阶序列相关:假定原模型: :
,,,2,2
.121ˆ,)1(若存在作广义差分模型检验序列相关是否存在较合理因此用回归模型计算的由于后式是近似关系两者差别不大值式求出或者用的估计值
然后求出式法求出首先用。

)(W D d OLS ρρρ-=-=()()
()ε
ρβ
ρβρβ
ρ
i
k
i ik
k
i i i i
X X X
X Y Y
+-+
+-+-=
-
---,11
.11
1
1
ˆˆ
ˆˆ1 .
,,.,)2(即可消除则经过一阶广义差分后只存在一阶序列相关如果一般地看是否还存在序列相关进行估计和检验再对i μ
王中昭制作
存在
t
l t l t t t εμρμρμρμ++++=--- 2211则广义差分模型为:
22
1
1
μβββ
βi
ik
k
i i i X X X Y +++++= 如果原模型:
()
()()ε
ρρβρρβ
ρρβρ
ρ
ρi
k
L i L
k
i ik
k
L i L
i i L
L
i L
i i i
X
X X X
X Y
Y
Y
Y X
+---++
---+---=-----------,,11
1
,1
,11
1
1
1
2
2
1
1
1
王中昭制作
只讨论非线性模型的一阶序列相关情形。

例如:,ˆln ln ln ln :
ρ
βαμ
β
α拟合上模型求出先化为线性模型u L K A Y L AK Y i +++==●(2)非线性模型的
广义差分法。

t t t t t t t v L L K K b Y Y +-+-+=----)ln ˆ(ln )ln ˆ(ln ln ˆln :
1101ρβραρ
则一阶差分为如何设计
命令?
王中昭制作例如在例4.2.1(P132)中模型
•建立1阶线性广义差分模型:
•reg y x
•predict et,residual
•reg et L.et,nocon //得ρ=0.9489
•gen yy=y-0.9489*L.y
•gen xx=x-0.9489*L.x
•reg yy xx Durbin-Watson d-statistic( 2, 28) = 1.006844
王中昭制作•建立1阶非线性广义差分模型:•gen lny=ln(y)
•gen lnx=ln(x)
•reg lny lnx
•predict et,residual
•reg et L.et,nocon //得ρ=0.7568•
•gen yy=lny-0.7568*L.lny •gen xx=lnx-0.7568*L.lnx •reg yy xx
•dwstat
王中昭制作
DW=1.72, 取α=0.05,查表得(N=28):
d L =1.33,d U =1.48, 4-d u =2.52>DW>d u =1.48, 不存在一阶序列相关。

模型为:LnY^t =0.3185778+0.7568LnY t-1+0.81LnX t -0.613LnX t-1
王中昭制作
1211011,111,1.1,11,,ˆˆˆ,,......,......(1......)(...)......(...),......(4.2.21)1,...,p it t p t p p t t p t p k t k t k p t p k t Y Y Y X X X X X X t p n
ρ
ρρρρβρρβρρβρρε------=+++---+---++---+=+得到估计值代入高阶广义差分模型第一步,估计原模型得到残差项3(或称杜宾)两步法11...... ......(4.2.20)
t t p t p t μρμρμε--=+++μi ,然后估计模型:
、科克伦—奥科特:Cochrane-Orcutt(CO)法
12ˆˆˆˆˆˆ(4.2.21),,......,.(4.2.21),(4.2.21),.(4.2.20),.
p i t i OLS ρρρμεμ对式进行估计得到再代回原模型并求出不是估计而是求出误差项再以此估计这样就完成一次迭代
王中昭制作
12121101,111,1.1,11,,,,......,,
,,......,,:......(...)......(...)p p it t p t p t t p t p k t k t k p t p k t Y Y Y C X X X X X X ρρρρρρρρρβρρβρρε---------=+---++---+经过多次迭代得到估计值一般地直至值与上一次的估计值相差很小为止.
然后将代入高阶广义差分模型,并用OLS 法求出模型则此模型就是修正序列相关后的模型.。

相关文档
最新文档