自相关(计量经济学课件)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
=
ˆ = Σxt yt = + Σxt ut 2 2 2 Σxt Σxt2
2
n t =1
2 u
xt2
(1+ 2
x x
t =1 n t =1
n -1
t t +1
xt2
+ 2
2 t =1
x x
n t =1
n -2
t t +2
xt2
+ ... + 2
n -1
Fra Baidu bibliotek
x1 xn xt2
记为
。 AR(2)
16
一般地,如果 u1 ,u2 ,...,ut 之间的关系为
ut = 1ut -1 + 2ut -2 +...+ mut-m + vt
其中, vt 为经典误差项。则称此式为 m阶自回 归模式,记为 AR(m) 。 在经济计量分析中,通常采用一阶自回归形式, 即假定自回归形式为一阶自回归 AR(1)。
31
第三节 自相关的检验
本节基本内容:
● 图示检验法 ● DW检验法
32
一、图示检验法
图示法是一种直观的诊断方法,它是把给定的
回归模直接用普通最小二乘法估计参数,求出
残差项 et ,et 作为 ut 随机项的真实估计值,
再描绘 et的散点图,根据散点图来判断 et 的 相关性。残差 et的散点图通常有两种绘制方 式 。
r =0
逐次代入可得: ∞ 2 r ut = vt + vt -1 + vt -2 +... = vt-r
这表明随机误差项 ut 可表示为独立同分布的随 机误差序列 v , v , v , 的加权和,权 t t 1 t 2 数分别为 1 , , 2 , 。当 0 1 时, 这些权数是随时间推移而呈几何衰减的; 而当 1 0 时,这些权数是随时间推移而 20 交错振荡衰减的。
=
x2
σ
2
随机误差项 u 有自相关时, ˆ2 依然是无偏的, ˆ 即 E( ) = β ,这一点在普通最小二乘法无偏
2 2
性证明中可以看到。因为,无偏性证明并不需 要 u 满足无自相关的假定。那么,最小二乘估
ˆ 计量 2 是否是有效呢?下面我们将说明。
23
例如,一元回归中
ˆ ) = E( - )2 = E Σxt ut ˆ Var( 2 2 2 2 Σxt
ˆ 2 估计值 t检验统计量为: t 估计量的标准误 ˆ se( 2 )
ˆ 由于 SE( 2 ) 的错误夸大,得到的 t统计量就 可能小于临界值 t / 2 ,从而得到参数 不显著
的结论。而这一结论可能是不正确的。
27
忽视自相关时的检验
如果我们忽视自相关问题依然假设经典假定成 2 ,将会导致错误结果。 ˆ 立,使用 Var(2 ) = 2 Σxt j 当 >0 ,即有正相关时,对所有 j 的有 >0 。 另外回归模型中的解释变量在不同时期通常是 正相关的,对于 X t 和 X 来说 t j
由于某种原因,我们把 回归做成: Yt 1 2 X 2t 3 X 3t vt
在猪肉价格影响牛肉消费的情形下,残差v将表现出某 种系统的模式
11
设定偏误:不正确的函数形式
假如在成本—产出研究中,“真实”模型为:
边际成本i 1 2产出i 3产出i2 ui 但我们拟合了以下模型: 边际成本i 1 2产出i vi 于是有: vi 3产出i2 ui
此式中的 也称为一阶自相关系数。
15
如果式中的随机误差项 vt 不是经典误差项,即
其中包含有 ut 的成份,如包含有 ut 2 则需将 vt 显含在回归模型中,其为
ut = 1ut -1 + 2ut -2 + vt
其中,1 为一阶自相关系数, 2 为二阶自相关系
数,vt是经典误差项。此式称为二阶自回归模式,
影响非常显著。同时可决系数也非常高,F统计量
为4122.531,也表明模型异常的显著。
但此估计结果可能是虚假的,t统计量和F统计量
都被虚假地夸大,因此所得结果是不可信的。为
什么?
4
3.2 自相关
本章讨论四个问题:
●什么是自相关 ●自相关的后果 ●自相关的检验 ●自相关性的补救
5
第一节 什么是自相关
vt 是经典误差项,满足零均值 E(vt ) = 0 ,同方
差 Var(v ) = 2 ,无自相关 E(vt vs ) 0 (t s) t v 的假定。
19
将随机误差项
ut 的各期滞后值: ut -1 = ut -2 + vt -1 , ut -2 = ut -3 + vt -2 , ...
30
四、对模型预测的影响
模型预测的精度决定于抽样误差和总体误差项的
ˆ 方差 2 。抽样误差来自于对 j 的估计,在自相 ˆ 关情形下, j 的方差的最小二乘估计变得不可
靠,由此必定加大抽样误差。同时,在自相关情
形下,对 2 的估计 2 e2 / n - k 也会不可靠 ˆ i 。由此可看出,影响预测精度的两大因素都会因 自相关的存在而加大不确定性,使预测的置信区 间不可靠,从而降低预测的精度。
在有自相关的条件下,仍然使用普通最小二乘 法将低估估计量 的方差 Var( ) ˆ ˆ
2
2
并且
e 将低估真实的 ˆ 2 n-k
2 2 i
22
对于一元线性回归模型,当 u为经典误差项时, ˆ 普通最小二乘估计量 2 的方差为:
ˆ Var(2 ) =
( X - X )
2 2
u u
t=2
n
t t -1
ut2
t 2
n
ut21
t 2
n
的取值范围为 -1 1
上式中 ut -1 是 ut 滞后一期的随机误差项。 因此,将上式计算的自相关系数 称为一阶自相关 系数。
9
二、自相关产生的原因
自 相 关 产 生 的 原 因
经济系统的惯性 经济活动的滞后效应 数据处理造成的相关 蛛网现象
33
图 3.1
绘制
et 与 et 1 的关系
(et -1 , et ) (t 1,2,..., n)
et -1 , et
的散点图。用
作为散布点绘图,如果大部分点落在第Ⅰ、Ⅲ象限,表明 随机误差项 ut 存在着正自相关。
34
自相关的含义:按时间(时间序列数据)或空间(横截 面数据)排列的观测值序列的成员之间的相关。 经典线性回归模型假定在干扰项之间不存在自相关:
E(uiu j ) 0
i j
出现自相关时,则为: E (uiu j ) 0 i j
本教材将自相关和序列相关看成同义语
8
一阶自相关系数
自相关系数 的定义与普通相关系的公式形式相同
用普通最小二乘法估计其参数,结果为
ˆ Yt = 27.9123+ 0.3524 Xt
(1.8690) (0.0055)
t = (14.9343) (64.2069)
R 2 0.9966 F 4122.531
3
检验结果表明:回归系数的标准误差非常小,t 统 计量较大,说明居民收入 X 对居民储蓄存款 Y 的
由于函数形式的错误使用,残差将反映出自相关性质
蛛网现象(Cobweb phenomenon)
供给对价格的反应要滞后一个时期
供给t 1 2价格t 1 ut
12
滞后效应 在消费支出对收入的时间序列回归中,当期消费还会 受到前期消费水平的影响:
消费t 1 2收入t 3消费t 1 ut
本节基本内容:
●什么是自相关
●自相关产生的原因
●自相关的表现形式
6
第一节 什么是自相关
一、自相关的概念
自相关(auto correlation),又称序列相关( serial correlation)是指总体回归模型的随机 误差项之间存在相关关系。即不同观测点上的 误差项彼此相关。
7
自相关的性质
17
第二节 自相关的后果
本节基本内容:
●一阶自回归形式的性质 ●自相关对参数估计的影响 ●自相关对模型检验的影响 ●自相关对模型预测的影响
18
一、一阶自回归形式的性质
对于一元线性回归模型:
Y = 1 + 2 X + u
假定随机误差项 u存在一阶自相关:
ut = ut -1 + vt
其中, t 为现期随机误差, t -1 为前期随机误差。 u u
可以推得:
E(ut ) = r E(vt-r ) = 0
r =0
∞
∞
σv 2 2 Var(vt ) = 2 n Var(vt-r ) = = u 1- 2 r =0
表明,在 ut 为一阶自回归的相关形式时,随机 误差 ut 依然是零均值、同方差的误差项。
21
二、对参数估计的影响
t =1 n
)
24
当存在自相关时,普通最小二乘估计量不再是最 佳线性无估计量,即它在线性无偏估计量中不是
方差最小的。在实际经济系统中,通常存在正的
自相关,即 >0 ,同时 X 序列自身也呈正相关, 因此式(12.18)右边括号内的值通常大于0。因此, 在有自相关的条件下,仍然使用普通最小二乘法 将低估估计量
模型设定偏误
10
自相关的来源详解
惯性:GNP、价格指数、生产、就业和失业等时 间序列变量都呈现出商业循环。 设定偏误:应含而未含变量(excluded variables) 比如: Yt 1 2 X 2t 3 X 3t 4 X 4t ut
其中:Yi 牛肉需求量 X 2 牛肉价格, X 3 消费者收入 , , X 4 猪肉价格, t 时间。
ˆ 的方差 。ˆ Var(2 ) 2 ˆ 2 ei2 (n - k ) 将低估真实的 2 。
25
三、对模型检验的影响
考虑自相关时的检 验
对模型检验的影响
忽视自相关时的
检验
26
考虑自相关时的检验
由于 Var( ) 并不是所有线性无偏估计量中最小的, ˆ 2 使用t检验判断回归系数的显著性时就可能得到 错误的结论。
这种带有因变量的滞后值的回归也叫自回归(autoregression)
数据的“编造”
从月度数据计算得出季度数据,会减小波动,引进 匀滑作用,使扰动项出现系统性模式
数据的内插(interpolation)
数据的外推(extrapolation)
13
三、自相关的表现形式
自相关的性质可以用自相关系数的符号判断
29
一个被低估了的标准误意味着一个较大的t统计 量。因此,当 0时,通常t统计量都很大。 这种有偏的t统计量不能用来判断回归系数的显 著性。 综上所述,在自相关情形下,无论考虑自相关, 还是忽视自相关,通常的回归系统显著性的t检 验都将是无效的。 类似地,由于自相关的存在,参数的最小二乘估 计量是无效的,使得F检验和t检验不再可靠。
3.2 序列相关(自相关)
数据推荐网址: http://www.indexmundi.com/fact s/china#Financial Sector
世界最全面原始统计指标网站之一
2
引子:t检验和F检验一定就可靠吗?
研究居民储蓄存款 Y 与居民收入 X 的关系:
Yt = 1 + 2 X t + ut
即 0 为负相关,
0 为正相关。
当 | | 接近1时,表示相关的程度很高。
自相关是
u1 ,u2 ,...,un 序列自身的相关,因随机误差
项的关联形式不同而具有不同的自相关形式。 自相关多出现在时间序列数据中。
14
自相关的形式
对于样本观测期为 n 的时间序列数据,可得到总
体回归模型(PRF)的随机项为 如果自相关形式为 其中 为自相关系数, v 为经典误差项,即 t
E(vt ) 0 , Var(vt ) , Cov(vt , vt+s ) 0 , s 0
2
u1 , u2 ,..., un,
ut = ut -1 + vt
- 1< < 1
则此式称为一阶自回归模式,记为 AR (1) 。因为
模型中 ut -1是 ut 滞后一期的值,因此称为一阶。
X X
t
t+ j
是大于0的。
28
ˆ 因此,普通最小二乘法的方差 Var(2 ) = 2 Σxt2 ˆ 通常会低估 2 的真实方差。当 较大和 X t 有
较强的正自相关时,普通最小二乘估计量的方
差会有很大偏差,这会夸大估计量的估计精度,
即得到较小的标准误。
因此在有自相关时,普通最小二乘估计 的标 ˆ 2 准误就不可靠了。
ˆ = Σxt yt = + Σxt ut 2 2 2 Σxt Σxt2
2
n t =1
2 u
xt2
(1+ 2
x x
t =1 n t =1
n -1
t t +1
xt2
+ 2
2 t =1
x x
n t =1
n -2
t t +2
xt2
+ ... + 2
n -1
Fra Baidu bibliotek
x1 xn xt2
记为
。 AR(2)
16
一般地,如果 u1 ,u2 ,...,ut 之间的关系为
ut = 1ut -1 + 2ut -2 +...+ mut-m + vt
其中, vt 为经典误差项。则称此式为 m阶自回 归模式,记为 AR(m) 。 在经济计量分析中,通常采用一阶自回归形式, 即假定自回归形式为一阶自回归 AR(1)。
31
第三节 自相关的检验
本节基本内容:
● 图示检验法 ● DW检验法
32
一、图示检验法
图示法是一种直观的诊断方法,它是把给定的
回归模直接用普通最小二乘法估计参数,求出
残差项 et ,et 作为 ut 随机项的真实估计值,
再描绘 et的散点图,根据散点图来判断 et 的 相关性。残差 et的散点图通常有两种绘制方 式 。
r =0
逐次代入可得: ∞ 2 r ut = vt + vt -1 + vt -2 +... = vt-r
这表明随机误差项 ut 可表示为独立同分布的随 机误差序列 v , v , v , 的加权和,权 t t 1 t 2 数分别为 1 , , 2 , 。当 0 1 时, 这些权数是随时间推移而呈几何衰减的; 而当 1 0 时,这些权数是随时间推移而 20 交错振荡衰减的。
=
x2
σ
2
随机误差项 u 有自相关时, ˆ2 依然是无偏的, ˆ 即 E( ) = β ,这一点在普通最小二乘法无偏
2 2
性证明中可以看到。因为,无偏性证明并不需 要 u 满足无自相关的假定。那么,最小二乘估
ˆ 计量 2 是否是有效呢?下面我们将说明。
23
例如,一元回归中
ˆ ) = E( - )2 = E Σxt ut ˆ Var( 2 2 2 2 Σxt
ˆ 2 估计值 t检验统计量为: t 估计量的标准误 ˆ se( 2 )
ˆ 由于 SE( 2 ) 的错误夸大,得到的 t统计量就 可能小于临界值 t / 2 ,从而得到参数 不显著
的结论。而这一结论可能是不正确的。
27
忽视自相关时的检验
如果我们忽视自相关问题依然假设经典假定成 2 ,将会导致错误结果。 ˆ 立,使用 Var(2 ) = 2 Σxt j 当 >0 ,即有正相关时,对所有 j 的有 >0 。 另外回归模型中的解释变量在不同时期通常是 正相关的,对于 X t 和 X 来说 t j
由于某种原因,我们把 回归做成: Yt 1 2 X 2t 3 X 3t vt
在猪肉价格影响牛肉消费的情形下,残差v将表现出某 种系统的模式
11
设定偏误:不正确的函数形式
假如在成本—产出研究中,“真实”模型为:
边际成本i 1 2产出i 3产出i2 ui 但我们拟合了以下模型: 边际成本i 1 2产出i vi 于是有: vi 3产出i2 ui
此式中的 也称为一阶自相关系数。
15
如果式中的随机误差项 vt 不是经典误差项,即
其中包含有 ut 的成份,如包含有 ut 2 则需将 vt 显含在回归模型中,其为
ut = 1ut -1 + 2ut -2 + vt
其中,1 为一阶自相关系数, 2 为二阶自相关系
数,vt是经典误差项。此式称为二阶自回归模式,
影响非常显著。同时可决系数也非常高,F统计量
为4122.531,也表明模型异常的显著。
但此估计结果可能是虚假的,t统计量和F统计量
都被虚假地夸大,因此所得结果是不可信的。为
什么?
4
3.2 自相关
本章讨论四个问题:
●什么是自相关 ●自相关的后果 ●自相关的检验 ●自相关性的补救
5
第一节 什么是自相关
vt 是经典误差项,满足零均值 E(vt ) = 0 ,同方
差 Var(v ) = 2 ,无自相关 E(vt vs ) 0 (t s) t v 的假定。
19
将随机误差项
ut 的各期滞后值: ut -1 = ut -2 + vt -1 , ut -2 = ut -3 + vt -2 , ...
30
四、对模型预测的影响
模型预测的精度决定于抽样误差和总体误差项的
ˆ 方差 2 。抽样误差来自于对 j 的估计,在自相 ˆ 关情形下, j 的方差的最小二乘估计变得不可
靠,由此必定加大抽样误差。同时,在自相关情
形下,对 2 的估计 2 e2 / n - k 也会不可靠 ˆ i 。由此可看出,影响预测精度的两大因素都会因 自相关的存在而加大不确定性,使预测的置信区 间不可靠,从而降低预测的精度。
在有自相关的条件下,仍然使用普通最小二乘 法将低估估计量 的方差 Var( ) ˆ ˆ
2
2
并且
e 将低估真实的 ˆ 2 n-k
2 2 i
22
对于一元线性回归模型,当 u为经典误差项时, ˆ 普通最小二乘估计量 2 的方差为:
ˆ Var(2 ) =
( X - X )
2 2
u u
t=2
n
t t -1
ut2
t 2
n
ut21
t 2
n
的取值范围为 -1 1
上式中 ut -1 是 ut 滞后一期的随机误差项。 因此,将上式计算的自相关系数 称为一阶自相关 系数。
9
二、自相关产生的原因
自 相 关 产 生 的 原 因
经济系统的惯性 经济活动的滞后效应 数据处理造成的相关 蛛网现象
33
图 3.1
绘制
et 与 et 1 的关系
(et -1 , et ) (t 1,2,..., n)
et -1 , et
的散点图。用
作为散布点绘图,如果大部分点落在第Ⅰ、Ⅲ象限,表明 随机误差项 ut 存在着正自相关。
34
自相关的含义:按时间(时间序列数据)或空间(横截 面数据)排列的观测值序列的成员之间的相关。 经典线性回归模型假定在干扰项之间不存在自相关:
E(uiu j ) 0
i j
出现自相关时,则为: E (uiu j ) 0 i j
本教材将自相关和序列相关看成同义语
8
一阶自相关系数
自相关系数 的定义与普通相关系的公式形式相同
用普通最小二乘法估计其参数,结果为
ˆ Yt = 27.9123+ 0.3524 Xt
(1.8690) (0.0055)
t = (14.9343) (64.2069)
R 2 0.9966 F 4122.531
3
检验结果表明:回归系数的标准误差非常小,t 统 计量较大,说明居民收入 X 对居民储蓄存款 Y 的
由于函数形式的错误使用,残差将反映出自相关性质
蛛网现象(Cobweb phenomenon)
供给对价格的反应要滞后一个时期
供给t 1 2价格t 1 ut
12
滞后效应 在消费支出对收入的时间序列回归中,当期消费还会 受到前期消费水平的影响:
消费t 1 2收入t 3消费t 1 ut
本节基本内容:
●什么是自相关
●自相关产生的原因
●自相关的表现形式
6
第一节 什么是自相关
一、自相关的概念
自相关(auto correlation),又称序列相关( serial correlation)是指总体回归模型的随机 误差项之间存在相关关系。即不同观测点上的 误差项彼此相关。
7
自相关的性质
17
第二节 自相关的后果
本节基本内容:
●一阶自回归形式的性质 ●自相关对参数估计的影响 ●自相关对模型检验的影响 ●自相关对模型预测的影响
18
一、一阶自回归形式的性质
对于一元线性回归模型:
Y = 1 + 2 X + u
假定随机误差项 u存在一阶自相关:
ut = ut -1 + vt
其中, t 为现期随机误差, t -1 为前期随机误差。 u u
可以推得:
E(ut ) = r E(vt-r ) = 0
r =0
∞
∞
σv 2 2 Var(vt ) = 2 n Var(vt-r ) = = u 1- 2 r =0
表明,在 ut 为一阶自回归的相关形式时,随机 误差 ut 依然是零均值、同方差的误差项。
21
二、对参数估计的影响
t =1 n
)
24
当存在自相关时,普通最小二乘估计量不再是最 佳线性无估计量,即它在线性无偏估计量中不是
方差最小的。在实际经济系统中,通常存在正的
自相关,即 >0 ,同时 X 序列自身也呈正相关, 因此式(12.18)右边括号内的值通常大于0。因此, 在有自相关的条件下,仍然使用普通最小二乘法 将低估估计量
模型设定偏误
10
自相关的来源详解
惯性:GNP、价格指数、生产、就业和失业等时 间序列变量都呈现出商业循环。 设定偏误:应含而未含变量(excluded variables) 比如: Yt 1 2 X 2t 3 X 3t 4 X 4t ut
其中:Yi 牛肉需求量 X 2 牛肉价格, X 3 消费者收入 , , X 4 猪肉价格, t 时间。
ˆ 的方差 。ˆ Var(2 ) 2 ˆ 2 ei2 (n - k ) 将低估真实的 2 。
25
三、对模型检验的影响
考虑自相关时的检 验
对模型检验的影响
忽视自相关时的
检验
26
考虑自相关时的检验
由于 Var( ) 并不是所有线性无偏估计量中最小的, ˆ 2 使用t检验判断回归系数的显著性时就可能得到 错误的结论。
这种带有因变量的滞后值的回归也叫自回归(autoregression)
数据的“编造”
从月度数据计算得出季度数据,会减小波动,引进 匀滑作用,使扰动项出现系统性模式
数据的内插(interpolation)
数据的外推(extrapolation)
13
三、自相关的表现形式
自相关的性质可以用自相关系数的符号判断
29
一个被低估了的标准误意味着一个较大的t统计 量。因此,当 0时,通常t统计量都很大。 这种有偏的t统计量不能用来判断回归系数的显 著性。 综上所述,在自相关情形下,无论考虑自相关, 还是忽视自相关,通常的回归系统显著性的t检 验都将是无效的。 类似地,由于自相关的存在,参数的最小二乘估 计量是无效的,使得F检验和t检验不再可靠。
3.2 序列相关(自相关)
数据推荐网址: http://www.indexmundi.com/fact s/china#Financial Sector
世界最全面原始统计指标网站之一
2
引子:t检验和F检验一定就可靠吗?
研究居民储蓄存款 Y 与居民收入 X 的关系:
Yt = 1 + 2 X t + ut
即 0 为负相关,
0 为正相关。
当 | | 接近1时,表示相关的程度很高。
自相关是
u1 ,u2 ,...,un 序列自身的相关,因随机误差
项的关联形式不同而具有不同的自相关形式。 自相关多出现在时间序列数据中。
14
自相关的形式
对于样本观测期为 n 的时间序列数据,可得到总
体回归模型(PRF)的随机项为 如果自相关形式为 其中 为自相关系数, v 为经典误差项,即 t
E(vt ) 0 , Var(vt ) , Cov(vt , vt+s ) 0 , s 0
2
u1 , u2 ,..., un,
ut = ut -1 + vt
- 1< < 1
则此式称为一阶自回归模式,记为 AR (1) 。因为
模型中 ut -1是 ut 滞后一期的值,因此称为一阶。
X X
t
t+ j
是大于0的。
28
ˆ 因此,普通最小二乘法的方差 Var(2 ) = 2 Σxt2 ˆ 通常会低估 2 的真实方差。当 较大和 X t 有
较强的正自相关时,普通最小二乘估计量的方
差会有很大偏差,这会夸大估计量的估计精度,
即得到较小的标准误。
因此在有自相关时,普通最小二乘估计 的标 ˆ 2 准误就不可靠了。