自相关性
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
也称p阶自回归形式的自相关,记为AR(p)。
7
自相关产生的原因
自 相 关 产 生 的 原 因
经济系统的惯性 经济活动的滞后效应 数据处理造成的相关 蛛网现象 模型设定误差
8
原因1-经济系统固有的惯性
任何一种经济现象都有其历史的延续性和发 展的继承性,也就是具有时间上的惯性。
如GDP、价格、就业等经济指标都会随经济 系统的周期而波动。例如,在经济高涨时期,较 高的经济增长率会持续一段时间,而在经济衰退 期,较高的失业率也会持续一段时间,这种现象 就会表现为经济指标的自相关现象。
源自文库
9
例如,绝对收入假设下居民总消费函数模型:
Ct=0+1Yt+t t=1,2,…,n
由于消费习惯的影响被包含在随机误差项中,则 可能出现序列相关性(往往是正相关)。
10
原因2- 经济活动的滞后效应
滞后效应是指某一指标对另一指标的影响 不仅限于当期而是延续若干期。由此带来变量 的自相关。 例如,居民当期可支配收入的增加,不会 使居民的消费水平在当期就达到应有水平,而 是要经过若干期才能达到。因为人的消费观念 的改变客观上存在自适应期。再如,一个企业 的生产能力取决于当期和前若干期固定资产的 累积。又如,金融危机等随机因素的影响,往 往要持续多个时期。
13
原因5-模型设定误差
如果模型中省略了某些重要的解释变量或者 模型函数形式不正确,都会产生系统误差,这种 误差存在于随机误差项中,从而带来了自相关。 由于该现象是由于设定失误造成的自相关,因此, 也称其为虚假自相关。
14
例如,假设正确的模型应该用两个解释变量:
Yt 1 2 X 2t 3 X 3t ut
35
1、广义差分法
以一元线性回归模型为例 Yt 1 2 X t ut 假设存在一阶自相关: t ρt 1 vt 且已知, 1 vt 满足古典假定。 将模型滞后一期得: Yt 1 1 2 X t 1 ut 1 ( 2) (1) - (2) ×,得广义差分方程 Yt Yt 1 1 (1 ) 2 ( X t X t 1 ) ut ut 1
et-1
如果大部分点落在第Ⅰ、Ⅲ象限,表明随机误差项 ut 存在
着正自相关。
et
et 1
21
et
et
et-1
et 1
如果大部分点落在第Ⅱ、Ⅳ象限,那么随机误 差项 ut 存在着负自相关。
22
(2)按时间顺序绘制et的图形
ett
tt
如果
et
随着t 的变化逐次变化并不频繁地改变符号,而
et
是几个正的后面跟着几个负的,则表明随机误差项 ut 存 et 在正自相关。
T
t 1
t 2
T
2 t 1
的取值范围是[-1, 1]。当 0时,称 ut 存在正自相关,当 0时,称ut 存在负自相关,当 0时,称ut 不存在自相关。
(2)p阶自相关,即随机误差项与它的前多期值 相关,
t 1t 1 2 t 2 ρ p μt p vt
自相关的检验
1、图示检验法
图示法是一种直观的诊断方法,它是对给定 的回归模型直接用普通最小二乘法估计参数,求 出残差项 et ,作为ut 的真实估计值,再描绘 et 的 散点图,根据散点图来判断ut 的相关性。残差 et 的散点图通常有两种绘制方式 。
20
(1)绘制et-1与et的散点图
et
系数估计误差的不准确,将直接影响模型的预测精 度。
以一元线性回归模型为例来说明。
一元线性回归模型: Yt 0 1 X t ut
ˆ 无自相关时: Var ( )
1
2
( 1)
2 x t
存在一阶自回形式自相关时:
ˆ) Var (
1
xt xs s t 2 ,s t 2 2 2 t s ( xt ) xt
29
DW检验决策规则
0 DW d L
d L DW dU
误差项 u1, u2 ,..., un 间存在 正相关
不能确定
u1, u2 ,..., u 间 n 无自相关
dU DW 4- dU
4- dU DW 4- d L
不能确定 误差项 u1, u2 ,..., un间存在 负相关
由于序列相关性经常出现在以时间序列为样本的模 型中,因此,本节将用下标 t代表 i。
5
计量经济模型中自相关的最常见的形式是一 阶线性自回归形式:
ut ut 1 vt
其中,是ut 与ut 1的相关系数,vt 是满足基本假定的 随机误差项。
ˆ
T
t 2 t t 2 2 t
般的计算机软件都可以计算出DW 值。
25
DW检验的前提条件:
随机误差项为一阶自回归形式 解释变量不包含滞后的被解释变量 截距项不为0 数据无缺失值
样本容量要大(n>15)
26
DW检验步骤: (1)提出假设 H0: 0 H1: ≠ 0 (2)构造DW统计量:
DW
2 (e e ) t t 1 t2 2 e t t 1 n n
但此估计结果可能是虚假的,t 统计量和F 统计量
都被虚假地夸大,因此所得结果是不可信的。为
什么呢?
——自相关性
2
本章讨论四个问题:
什么是自相关性 自相关性产生的原因 自相关性的后果 自相关性的检验 自相关性的补救
3
什么是自相关性
1、自相关性的概念
对于模型: Yi β0 β1 X1i βk X ki ui 随机项互不相关的基本假设表现为 Cov(i , j)=0 ij, i,j=1,2, …,n
2
2
( 2)
比较(1)、(2)两个式子,可以看出随机误差 ˆ 的方差大不相同。 项有无自相关时,
1
由于大多数情况下,随机误差项ut 和解释变 量X t的各期值都是正相关的,所以(2)式右端第 ˆ 二项是正的。因此,当模型存在自相关时,
1
的方差将被低估。
不仅如此,受自相关性的影响, 2的无偏估 计 ei2 (n 2) 也会低估其真实的 2,所以OLS 估计量的方差将会被低估得更多。
et ρ1et 1 ρ2et 2 vt
et ρet2 1 vt
et ρ et 1 vt
ˆ 的统计显著性,判断是否 3)根据可绝系数和 存在自回归及形式。
其优点是可以检验任何形式的自回归,缺点是工 作量大,计算复杂。
34
自相关的补救
经过检验发现随机误差项存在自相关时,应 先分析产生自相关的原因,原因不同,修正的方 法也不同。若是变量选择不当,就对解释变量进 行调整;若是模型的函数形式选择失准,就重新 建立函数形式;若排除了这两个方面原因之后, 仍存在自相关,则表明自相关问题是由客观经济 现象自身特点所决定的,这时需对自相关进行补 救。其基本思想是通过一定的数学手段将模型的 自相关转换为无自相关,然后再对模型中的未知 参数进行估计。
如果对于不同的样本点,随机误差项之间不再 是不相关的,而是存在某种相关性, Cov(i , j) ≠ 0 ,则称随机误差项之间存在自相 关(auto correlation),又称序列相关(serial correlation)。
4
自相关性有多种形式,最常见的形式有: (1)一阶自相关,即随机误差项只与它的前一期值 相关, i=i-1+vi 其 中 : 被 称 为 自 协 方 差 系 数 ( coefficient of auto covariance ) 或 一 阶 自 相 关 系 数 ( firstorder coefficient of auto correlation),vi为满足 古典假定的误差项。
32
3、回归检验法
基本思想:若ut存在自相关,必然在它的 估计量et中反映出来。因此,可以对样本观测 值应用OLS法求出et,然后对et进行不同形式 的自回归检验,从中找出满意的结果。
33
检验步骤如下: 1)将样本观测值用OLS对模型进行回归,计算et; 2)用et作不同形式的自回归,如:
et ρet 1 vt
30
4 - d L DW 4
用坐标图更直观表示DW检验规则:
f (DW)
正 自 相 关
dL
不 能 确 定
dU
无 自 相 关 2
不 能 确 定
4 dU
4 dL
负 自 相 关 4
DW
31
DW检验的缺点和局限性
DW检验有两个不能确定的区域,一旦DW值落在这两 个区域,就无法判断。这时,只有增大样本容量或选取 其他方法,习惯上倾向于拒绝原假设。 DW统计量的上、下限表要求 n>15,这是因为样本如 果再小,利用残差就很难对自相关的存在性做出比较正 n 15 确的诊断。 DW检验不适应随机误差项具有高阶序列相关的检验。 只适用于有常数项的回归模型并且解释变量中不能含滞 后的被解释变量 。
23
t
et
t
如果呈现锯齿形且不断地改变符号,那么随机误 差项可能存在负自相关。
24
2、DW检验法
DW 检验是J.Durbin(杜宾)和G.S.Watson (沃特森)于1951年提出的一种适用于小样本的 检验方法。DW检验只能用于检验随机误差项 具有一阶自回归形式的自相关问题。这种检验
方法是建立经济计量模型中最常用的方法,一
而建立模型时,模型设定为:
Yt β1 β2 X 2t vt
则vt=3X3t + t
,X3对Y的影响便归入随机误差项
u
中,由于X3在不同观测点上是相关的,这就造成了
u在不同观测点是相关的,呈现出系统模式,此时u
是自相关的。
15
自相关性的后果
1.最小二乘估计不再是有效估计。 当模型存在自相关性时,OLS估计仍然是无偏估计, 但不再具备有效性。 2.低估OLS估计的标准误差。 3、t 检验失效。 在自相关性的影响下,很可能使原来不显著的 t值 变为显著的,即易将不重要的因素误引入模型。 4、模型的预测精度降低。
t 检验和 F 检验一定就可靠吗?
ˆ = 27.9123 + 0.3524 X Y t t
t
R2 0.9966 F 4122.531
1
检验结果表明:回归系数的标准误差非常小,t 统计量较大,说明居民收入X 对居民储蓄存款 Y 的影响非常显著。同时决定系数也非常高,F统计
量也非常大,表明模型异常的显著。
12
原因4-蛛网现象
蛛网现象是微观经济学中的一个概念。它表 示某种商品的供给量受前一期价格影响而表现出 来的某种规律性,即呈蛛网状收敛或发散于供需 的均衡点。
许多农产品的供给呈现为蛛网现象,供给对 价格的反应要滞后一段时间,因为供给需要经过 一定的时间才能实现。如果本期的价格低于上一 期的价格,农民就会减少本期的生产量。如此则 形成蛛网现象。
在变量的显著性检验中,统计量是建立在参数方 差正确估计基础之上的,这只有当随机误差项具有同 方差性和互相独立性时才能成立。
ˆ1 t ˆ1 ) Se(
由于低估了真实方差,其标准差也被低估,导致夸 大 t 统计量的值,本应接受的原假设可能被错误地拒 绝,从而夸大了所估计参数的显著性,对本来不重要 的解释变量可能误认为重要而被保留。
11
原因3-数据处理造成的相关
在实际经济问题中,有些数据是通过已知 数据生成的。
因此,新生成的数据与原数据间就有了内 在的联系,表现出自相关性。
例如,将月度数据调整为季度数据,由于 采用了加合处理,修匀了月度数据的波动,使 季度数据具有平滑性,这种平滑性产生自相关。
又如,对缺失的历史资料,采用特定统计 方法进行内插处理,使得数据前后期相关,产 生了自相关。
27
DW统计量与之间的关系
ˆ) DW 2(1
ˆ 值的关系如下: DW值与
ˆ ˆ
-1 (-1,0) 0 (0,1) 1
DW 4 (2,4) 2 (0,2) 0
因此,当DW值显著地接近于0或4时,存在自相关; 而显著地接近于2时,则不存在自相关。
28
这样只要知道DW统计量的概率分布,在 给定的显著性水平下,根据临界值的位置就可 以对原假设H0进行检验,但DW统计量的概率分 布是未知的,作为一种变通的处理方法, Durbin和watson在5%和1%的显著性水平下, 找到了上限临界值dU和下限临界值dL,并编制 了DW检验的上下限表,与样本容量和解释变量 的个数 (不包括常数项)有关。
7
自相关产生的原因
自 相 关 产 生 的 原 因
经济系统的惯性 经济活动的滞后效应 数据处理造成的相关 蛛网现象 模型设定误差
8
原因1-经济系统固有的惯性
任何一种经济现象都有其历史的延续性和发 展的继承性,也就是具有时间上的惯性。
如GDP、价格、就业等经济指标都会随经济 系统的周期而波动。例如,在经济高涨时期,较 高的经济增长率会持续一段时间,而在经济衰退 期,较高的失业率也会持续一段时间,这种现象 就会表现为经济指标的自相关现象。
源自文库
9
例如,绝对收入假设下居民总消费函数模型:
Ct=0+1Yt+t t=1,2,…,n
由于消费习惯的影响被包含在随机误差项中,则 可能出现序列相关性(往往是正相关)。
10
原因2- 经济活动的滞后效应
滞后效应是指某一指标对另一指标的影响 不仅限于当期而是延续若干期。由此带来变量 的自相关。 例如,居民当期可支配收入的增加,不会 使居民的消费水平在当期就达到应有水平,而 是要经过若干期才能达到。因为人的消费观念 的改变客观上存在自适应期。再如,一个企业 的生产能力取决于当期和前若干期固定资产的 累积。又如,金融危机等随机因素的影响,往 往要持续多个时期。
13
原因5-模型设定误差
如果模型中省略了某些重要的解释变量或者 模型函数形式不正确,都会产生系统误差,这种 误差存在于随机误差项中,从而带来了自相关。 由于该现象是由于设定失误造成的自相关,因此, 也称其为虚假自相关。
14
例如,假设正确的模型应该用两个解释变量:
Yt 1 2 X 2t 3 X 3t ut
35
1、广义差分法
以一元线性回归模型为例 Yt 1 2 X t ut 假设存在一阶自相关: t ρt 1 vt 且已知, 1 vt 满足古典假定。 将模型滞后一期得: Yt 1 1 2 X t 1 ut 1 ( 2) (1) - (2) ×,得广义差分方程 Yt Yt 1 1 (1 ) 2 ( X t X t 1 ) ut ut 1
et-1
如果大部分点落在第Ⅰ、Ⅲ象限,表明随机误差项 ut 存在
着正自相关。
et
et 1
21
et
et
et-1
et 1
如果大部分点落在第Ⅱ、Ⅳ象限,那么随机误 差项 ut 存在着负自相关。
22
(2)按时间顺序绘制et的图形
ett
tt
如果
et
随着t 的变化逐次变化并不频繁地改变符号,而
et
是几个正的后面跟着几个负的,则表明随机误差项 ut 存 et 在正自相关。
T
t 1
t 2
T
2 t 1
的取值范围是[-1, 1]。当 0时,称 ut 存在正自相关,当 0时,称ut 存在负自相关,当 0时,称ut 不存在自相关。
(2)p阶自相关,即随机误差项与它的前多期值 相关,
t 1t 1 2 t 2 ρ p μt p vt
自相关的检验
1、图示检验法
图示法是一种直观的诊断方法,它是对给定 的回归模型直接用普通最小二乘法估计参数,求 出残差项 et ,作为ut 的真实估计值,再描绘 et 的 散点图,根据散点图来判断ut 的相关性。残差 et 的散点图通常有两种绘制方式 。
20
(1)绘制et-1与et的散点图
et
系数估计误差的不准确,将直接影响模型的预测精 度。
以一元线性回归模型为例来说明。
一元线性回归模型: Yt 0 1 X t ut
ˆ 无自相关时: Var ( )
1
2
( 1)
2 x t
存在一阶自回形式自相关时:
ˆ) Var (
1
xt xs s t 2 ,s t 2 2 2 t s ( xt ) xt
29
DW检验决策规则
0 DW d L
d L DW dU
误差项 u1, u2 ,..., un 间存在 正相关
不能确定
u1, u2 ,..., u 间 n 无自相关
dU DW 4- dU
4- dU DW 4- d L
不能确定 误差项 u1, u2 ,..., un间存在 负相关
由于序列相关性经常出现在以时间序列为样本的模 型中,因此,本节将用下标 t代表 i。
5
计量经济模型中自相关的最常见的形式是一 阶线性自回归形式:
ut ut 1 vt
其中,是ut 与ut 1的相关系数,vt 是满足基本假定的 随机误差项。
ˆ
T
t 2 t t 2 2 t
般的计算机软件都可以计算出DW 值。
25
DW检验的前提条件:
随机误差项为一阶自回归形式 解释变量不包含滞后的被解释变量 截距项不为0 数据无缺失值
样本容量要大(n>15)
26
DW检验步骤: (1)提出假设 H0: 0 H1: ≠ 0 (2)构造DW统计量:
DW
2 (e e ) t t 1 t2 2 e t t 1 n n
但此估计结果可能是虚假的,t 统计量和F 统计量
都被虚假地夸大,因此所得结果是不可信的。为
什么呢?
——自相关性
2
本章讨论四个问题:
什么是自相关性 自相关性产生的原因 自相关性的后果 自相关性的检验 自相关性的补救
3
什么是自相关性
1、自相关性的概念
对于模型: Yi β0 β1 X1i βk X ki ui 随机项互不相关的基本假设表现为 Cov(i , j)=0 ij, i,j=1,2, …,n
2
2
( 2)
比较(1)、(2)两个式子,可以看出随机误差 ˆ 的方差大不相同。 项有无自相关时,
1
由于大多数情况下,随机误差项ut 和解释变 量X t的各期值都是正相关的,所以(2)式右端第 ˆ 二项是正的。因此,当模型存在自相关时,
1
的方差将被低估。
不仅如此,受自相关性的影响, 2的无偏估 计 ei2 (n 2) 也会低估其真实的 2,所以OLS 估计量的方差将会被低估得更多。
et ρ1et 1 ρ2et 2 vt
et ρet2 1 vt
et ρ et 1 vt
ˆ 的统计显著性,判断是否 3)根据可绝系数和 存在自回归及形式。
其优点是可以检验任何形式的自回归,缺点是工 作量大,计算复杂。
34
自相关的补救
经过检验发现随机误差项存在自相关时,应 先分析产生自相关的原因,原因不同,修正的方 法也不同。若是变量选择不当,就对解释变量进 行调整;若是模型的函数形式选择失准,就重新 建立函数形式;若排除了这两个方面原因之后, 仍存在自相关,则表明自相关问题是由客观经济 现象自身特点所决定的,这时需对自相关进行补 救。其基本思想是通过一定的数学手段将模型的 自相关转换为无自相关,然后再对模型中的未知 参数进行估计。
如果对于不同的样本点,随机误差项之间不再 是不相关的,而是存在某种相关性, Cov(i , j) ≠ 0 ,则称随机误差项之间存在自相 关(auto correlation),又称序列相关(serial correlation)。
4
自相关性有多种形式,最常见的形式有: (1)一阶自相关,即随机误差项只与它的前一期值 相关, i=i-1+vi 其 中 : 被 称 为 自 协 方 差 系 数 ( coefficient of auto covariance ) 或 一 阶 自 相 关 系 数 ( firstorder coefficient of auto correlation),vi为满足 古典假定的误差项。
32
3、回归检验法
基本思想:若ut存在自相关,必然在它的 估计量et中反映出来。因此,可以对样本观测 值应用OLS法求出et,然后对et进行不同形式 的自回归检验,从中找出满意的结果。
33
检验步骤如下: 1)将样本观测值用OLS对模型进行回归,计算et; 2)用et作不同形式的自回归,如:
et ρet 1 vt
30
4 - d L DW 4
用坐标图更直观表示DW检验规则:
f (DW)
正 自 相 关
dL
不 能 确 定
dU
无 自 相 关 2
不 能 确 定
4 dU
4 dL
负 自 相 关 4
DW
31
DW检验的缺点和局限性
DW检验有两个不能确定的区域,一旦DW值落在这两 个区域,就无法判断。这时,只有增大样本容量或选取 其他方法,习惯上倾向于拒绝原假设。 DW统计量的上、下限表要求 n>15,这是因为样本如 果再小,利用残差就很难对自相关的存在性做出比较正 n 15 确的诊断。 DW检验不适应随机误差项具有高阶序列相关的检验。 只适用于有常数项的回归模型并且解释变量中不能含滞 后的被解释变量 。
23
t
et
t
如果呈现锯齿形且不断地改变符号,那么随机误 差项可能存在负自相关。
24
2、DW检验法
DW 检验是J.Durbin(杜宾)和G.S.Watson (沃特森)于1951年提出的一种适用于小样本的 检验方法。DW检验只能用于检验随机误差项 具有一阶自回归形式的自相关问题。这种检验
方法是建立经济计量模型中最常用的方法,一
而建立模型时,模型设定为:
Yt β1 β2 X 2t vt
则vt=3X3t + t
,X3对Y的影响便归入随机误差项
u
中,由于X3在不同观测点上是相关的,这就造成了
u在不同观测点是相关的,呈现出系统模式,此时u
是自相关的。
15
自相关性的后果
1.最小二乘估计不再是有效估计。 当模型存在自相关性时,OLS估计仍然是无偏估计, 但不再具备有效性。 2.低估OLS估计的标准误差。 3、t 检验失效。 在自相关性的影响下,很可能使原来不显著的 t值 变为显著的,即易将不重要的因素误引入模型。 4、模型的预测精度降低。
t 检验和 F 检验一定就可靠吗?
ˆ = 27.9123 + 0.3524 X Y t t
t
R2 0.9966 F 4122.531
1
检验结果表明:回归系数的标准误差非常小,t 统计量较大,说明居民收入X 对居民储蓄存款 Y 的影响非常显著。同时决定系数也非常高,F统计
量也非常大,表明模型异常的显著。
12
原因4-蛛网现象
蛛网现象是微观经济学中的一个概念。它表 示某种商品的供给量受前一期价格影响而表现出 来的某种规律性,即呈蛛网状收敛或发散于供需 的均衡点。
许多农产品的供给呈现为蛛网现象,供给对 价格的反应要滞后一段时间,因为供给需要经过 一定的时间才能实现。如果本期的价格低于上一 期的价格,农民就会减少本期的生产量。如此则 形成蛛网现象。
在变量的显著性检验中,统计量是建立在参数方 差正确估计基础之上的,这只有当随机误差项具有同 方差性和互相独立性时才能成立。
ˆ1 t ˆ1 ) Se(
由于低估了真实方差,其标准差也被低估,导致夸 大 t 统计量的值,本应接受的原假设可能被错误地拒 绝,从而夸大了所估计参数的显著性,对本来不重要 的解释变量可能误认为重要而被保留。
11
原因3-数据处理造成的相关
在实际经济问题中,有些数据是通过已知 数据生成的。
因此,新生成的数据与原数据间就有了内 在的联系,表现出自相关性。
例如,将月度数据调整为季度数据,由于 采用了加合处理,修匀了月度数据的波动,使 季度数据具有平滑性,这种平滑性产生自相关。
又如,对缺失的历史资料,采用特定统计 方法进行内插处理,使得数据前后期相关,产 生了自相关。
27
DW统计量与之间的关系
ˆ) DW 2(1
ˆ 值的关系如下: DW值与
ˆ ˆ
-1 (-1,0) 0 (0,1) 1
DW 4 (2,4) 2 (0,2) 0
因此,当DW值显著地接近于0或4时,存在自相关; 而显著地接近于2时,则不存在自相关。
28
这样只要知道DW统计量的概率分布,在 给定的显著性水平下,根据临界值的位置就可 以对原假设H0进行检验,但DW统计量的概率分 布是未知的,作为一种变通的处理方法, Durbin和watson在5%和1%的显著性水平下, 找到了上限临界值dU和下限临界值dL,并编制 了DW检验的上下限表,与样本容量和解释变量 的个数 (不包括常数项)有关。