计量经济学(第三版)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
ˆ Var ( 1 ) 2 xt
2
即使随机误差的方差 没有被低估,通常OLS参数估计量的方差式(16) 也是存在一阶序列相关时参数估计量方差的偏误估计量。
4.模型的预测失效
被解释变量预测值区间与模型参数和随机误差的估计量的方差有关。 在存在序列相关时OLS估计的随机误差项方差有偏,参数估计量方 差非有效,这样回归模型的被解释变量的预测值及预测区间就不准确, 预测精度降低。 所以,当模型出现序列相关时,它的预测功能失效。
e
t 1
n
2 t
n2
2 ˆ 是真实的 的无偏估计,即有 E ( 2 ) 。但若随机误差项存在一阶序列相关
2
则可以证明:
ˆ E ( 2 )
2 n [2 /(1 )] 2 r
n2
式中
r t 2
xt xt 1
t 1 n
n
为X的相继观测值之间的样本相关系数。
(13)
对于干扰项为一阶序列相关的一元回归模型采用OLS估计,如以前一 样,β 1的OLS估计量为:
ˆ 1
x y x
t 2 t
t
(14)
但给定干扰项为一阶序列相关时, 1 的方差估计量现在为:
ˆ Var ( 1 ) AR1
n 1 xx 2 2 2 t t 1 t 1n 2 xt2 xt2 xt2 t 1
例
给定一个含有50个观测值的样本和3个解释变量,如果
(a)D.W.=1.05,(b)D.W.=1.40,
(c)D.W.=2.50,(d)D.W.=3.97
你能对自相关的问题说些什么??
解:
查D.W.分布表可知,当样本数为n=50,解释变量数k=3时,在5%的
d 显著性水平下D.W.统计量临界值的下界 d L为1.42, U 为1.67。
一般经验表明,对于采用时间序列数据做样本的计量经济学模型,
由于在不同样本点上解释变量意外的其他因素在时间上的连续性, 带来了他们对被解释变量的影响的连续性,所以往往存在序列相关性。
第二节
序列相关性的影响
如果我们在干扰中通过假定Cov( t , t j ) E ( t t j ) 0 引进序列相关,但保留经典模型的全部其他假定,对OLS 估计量及其方差来说会出现什么情况呢?
4.蛛网现象
例如:
假定某农产品的供给模型为:
St 0 1Pt -1 t
(10)
假设t时期的价格Pt低于t-1时期的价格Pt-1,农民就很可能决定在时 期t+1生产比t时期更少的东西。显然在这种情形中,农民由于在年 度t的过量生产很可能在年度t+1消减他们的产量。诸如此类的现象, 就不能期望干扰μt是随机,从而出现蛛网式的序列相关。
Cov( i, j ) E( i j) 0
(2)
如果仅存在
E ( i i 1 ) 0, i 1, 2,..., n
(3)
则称为一阶序列相关或自相关(简写为AR(1)),这是常见的一种序列相关问题。
自相关往往可以写成如下形式:
i i 1 i ,
1 1
二、序列相关的原因 1.经济数据序列惯性 2.模型设定的偏误 3.滞后效应 4.蛛网现象 5.数据的编造
1.经济数据序列惯性
比如:
GDP、价格指数、消费等时间序列数据通常表现为周期循环。当经
济衰退的谷底开始复苏时,大多数经济序列开始上升,在上升期间,序 列在每一时刻的值都高于前一时刻的值。看来有一种内在的动力驱使这 一势头继续下去,直至某些情况出现(如利率或税收提高)才把它拖慢 下来。 因此,在涉及时间序列的回归中,相继的观测值很可能是相互依赖的。
(6)
例2: (模型函数形式有偏误)
在成本—产出研究中,如果真实的边际成本的模型为:
Yt = β0 + β1 X t + β2 X t2 + μt
其中Y代表边际成本,X代表产出。
但是如果建模时设立了如下回归模型:
(7)
Yt 0 1 X t vt
(8)
3.滞后效应 考虑一个消费支出对收入进行回归的时间序列模型,人们常常发 现当期的消费支出除了依赖其他当期收入外,还依赖前期的消费支出, 即回归模型为:
二、回归检验法
, ˆ ˆ ,ˆ 以 et 为被解释变量,以各种可能的相关变量,诸如 et 1 et 2
等为解释变量,
建立各种方程:
ˆ ˆ et et 1 t
t 2,..., n t 3,..., n
(20) (21)
ˆ ˆ ˆ et 1et 1 2 et 2 t
E ( ) 2 I
(11)
即同方差和相互独立性条件。而且在大样本情况下,参数估计量虽然 具有一致性,但仍然不具有渐近有效性。
为了具体说明这一点,我们回到简单的一元回归模型
Yi 0 1 X i i
(12)
为方便我们不妨假定干扰项为(4)所示的一阶序列相关:
t t 1 t
对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方 程显著成立,则说明原模型存在序列相关性。
优点:
一旦确定了模型存在序列相关性,也就同时知道了相关的形式,而且它 适用于任何类型的序列相关性问题的检验。
三、杜宾—沃森检验
D-W检验是杜宾(J.Durbin)和沃森(G.S.Watson)于1951年提出 的一种检验序列自相关的方法。虽然该方法很常用,但它有一些基本假定: (1)回归含有截距项。 (2)解释变量X是非随机的,或者在重复抽样中被固定的。 (3)随机干扰项 t 为一阶自回归形式:t t 1 t
序列相关性
◆ 学习目的
通过本节的学习,你可以知道什么是序列相关性,序列 相关性产生的原因是什么,序列相关性导致什么样的后果, 怎样检验和处理具有序列相关性的模型。 ◆ 基本要求 1)掌握序列相关性的概念、序列相关性的后果和检验方法; 2)了解广义最小二乘法和广义差分法原理; 3)能运用广义差分法和广义最小二乘法估计线性回归模型。
2
(16)
相比,可以看出前者等于后者加上另一与自相关系数 和各期X 的样本协方差有关的项。
2.随机误差项方差估计量是有偏的Leabharlann Baidu
在存在干扰项序列相关的情况下,随机误差方差的OLS估计量偏离
了真实的随机误差项的方差 2。 以一元回归模型为例,在经 典假设情况下,干扰项的 OLS方差估计量
ˆ 2
2
接受原假设。但他们成功导出了临界值的上限 dU 和下限 d L,且这些上下限只与 样本容量n和解释变量的个数有关,而与解释变量的取值无关。
因此,在运用D-W检验时,只须计算该统计量的值,再根据样本容量n 和解释变量数目k查D.W.分布表,得到临界值 d L 和 dU ,然后按下列准则考察
计算得到的D.W.值,以判断模型的自相关状态:
根据D-W检验判断准则可知
(a)D.W.=1.05< d L =1.42,因此随机误差项存在正一阶自相关;
Ct 0 1Yt 2Ct 1 t
其中,C是消费,Y是收入。
类似(9)式的回归模型被称为自回归模型
(9)
注意:
由于心理上、技术上以及制度上的原因,消费者不会轻易改变其消费 习惯,如果我们忽视(9)式中的滞后消费对当前消费的影响,那所带来 的误差项就会体现出一种系统性的模式。
5.数据的编造 新生成的数据与原数据间就有了内在的联系,表现出序列相关性。
例如:
CPI季度数据可能来自月度数据的简单平均,这种平均的 计算减弱了每月数据的波动而引进了数据中的匀滑性,这种 匀滑性本身就能使随机干扰项中出现系统性的因素,从而出 现序列相关性。 利用数据的内插或外推技术构造的数据也会呈现某种系统性的模式。
. 若 0 DW . d L ,则存在正自相关; . 若 d L DW . dU ,则不确定;
. 若 dU DW . 4 dU ,则无自相关; . 若 4 dU DW . 4 d L ,则不确定;
若 4 d L DW . 4 ,则存在负自相关。 . 也就是说,当D.W.值在2附近时,模型不存在一阶自相关。
1.参数估计量非有效 2.随机扰动项方差估计量是有偏的 3.变量的显著性检验t检验统计量和相应的参数置信区间估计失去意义 4.模型的预测失效
1.参数估计量非有效
根据OLS估计中关于参数估计量的无偏性和有效性的证明过程可 以看出,当计量经济学模型出现序列相关性时,其OLS参数估计量 仍然具有线性无偏性,但不具有有效性。因为在有效性证明中我们 利用了
ˆ ˆ (e e
t 2 t n t 1
)2
D.W .
ˆ e
t 1
n
(22)
2
t
杜宾—沃森证明该统计量的分布与出现在给定样本中的X值有复杂的关系,
其准确的抽样或概率分布很难得到;
ˆ ˆ 因为D.W.值要从 et 中算出,而 et 又依赖于给定的X的值。
因此D-W检验不同于t、F或 χ 检验,它没有唯一的临界值可以导出拒绝或
xt2
3.变量的显著性检验t 检验统计量和相应的参数置 信区间估计失去意义
用OLS法估计序列相关的模型得到的随机误差项的方差不仅是 有偏的,而且这一偏误也将传递到用OLS方法得到的参数估计量 的方差中来,从而使得建立在OLS参数估计量方差基础上的变量 显著性检验失去意义。
以一元回归模型为例,
Yi 0 1 X i i
第七章 序列相关性
◆序列相关性及其产生原因
◆
序列相关性的影响
◆序列相关性的检验 ◆序列相关的补救
第一节
序列相关性及其产生原因
—、序列相关性的含义
对于多元线性回归模型
Yi 0 1 X1i 2 X 2i k X ki i i 1, 2,, n
(1)
在其他假设仍然成立的条件下,随机干扰项序列相关意味着
序列相关性的检验方法
一、图示法 二、回归检验法 三、杜宾—沃森检验
四、拉格朗日乘子检验
一、图示法
ˆ 由于残差 et可以作为随机误差 t 的估计,因此,如果 t 存在序列相关性, ˆ ˆ 必然会由残差项 et 反映出来,因此可以利用 et 的变化来判断随机干扰项的序列
相关性,如图7-1所示。
2.模型设定的偏误
定义:
指所设定的模型“不正确”,主要表现在模型中丢掉了重要的解释
变量或模型函数形式有偏误。 (丢掉了重要的解释变量) 例1: 本来应该估计的模型为
Yt 0 1 X1t 1 X 2t 3 X 3t t
但在进行回归时,却把模型设定为如下形式:
(5)
Yt = β0 + β1 X 1t + β2 X 2t +νt
xt xt 2
t 1
n2
xt2
t 1
n
xt xn n 1 t 1 … n xt2 t 1
n 1
(15)
ˆ ˆ 式中Var ( 1 ) AR 为一阶序列相关时 1的方差。
1
把该式与没有干扰项自相关情形的通常公式
ˆ Var ( 1 ) 2 xt
第三节
序列相关性的检验
序列相关性的检验方法有多种,如冯诺曼比检验法、回归检验法、D.W.检验法等。
不同的检验方法的共同思路:
首先采用普通最小二乘法估计模型,以得到随机干扰项的近似估
ˆ 计量,我们用 ei 表示近似估计量:
ˆ ˆ et Yt Ytols
(19)
然后通过分析这些近似估计量之间的相关性以达到判断随机干扰 项是否具有序列相关性的目的。
(4)
其中 称为自协方差系数或一阶自回归系数,
i 是满足以下标准OLS假定的随机干扰项:
E ( i ) 0, Var ( i ) 2 , Cov( i , i s ) 0( s 0)
由于序列相关性经常出现在以时间序列数据为样本的模型中,因此, 本节下面将代表不同样本点的下表i用t 表示。
。
(4)回归模型中不应把滞后应变量作为解释变量之一,即不应出现如下形式模型:
Yt 0 1 X1t 2 X 2t k X kt Yt 1 t
(5)没有缺失数据。
杜宾—沃森针对原假设
H 0 : 0,即 t 不存在一阶自相关,构造如下统计量:
ˆ Var ( 1 ) 2 xt
2
即使随机误差的方差 没有被低估,通常OLS参数估计量的方差式(16) 也是存在一阶序列相关时参数估计量方差的偏误估计量。
4.模型的预测失效
被解释变量预测值区间与模型参数和随机误差的估计量的方差有关。 在存在序列相关时OLS估计的随机误差项方差有偏,参数估计量方 差非有效,这样回归模型的被解释变量的预测值及预测区间就不准确, 预测精度降低。 所以,当模型出现序列相关时,它的预测功能失效。
e
t 1
n
2 t
n2
2 ˆ 是真实的 的无偏估计,即有 E ( 2 ) 。但若随机误差项存在一阶序列相关
2
则可以证明:
ˆ E ( 2 )
2 n [2 /(1 )] 2 r
n2
式中
r t 2
xt xt 1
t 1 n
n
为X的相继观测值之间的样本相关系数。
(13)
对于干扰项为一阶序列相关的一元回归模型采用OLS估计,如以前一 样,β 1的OLS估计量为:
ˆ 1
x y x
t 2 t
t
(14)
但给定干扰项为一阶序列相关时, 1 的方差估计量现在为:
ˆ Var ( 1 ) AR1
n 1 xx 2 2 2 t t 1 t 1n 2 xt2 xt2 xt2 t 1
例
给定一个含有50个观测值的样本和3个解释变量,如果
(a)D.W.=1.05,(b)D.W.=1.40,
(c)D.W.=2.50,(d)D.W.=3.97
你能对自相关的问题说些什么??
解:
查D.W.分布表可知,当样本数为n=50,解释变量数k=3时,在5%的
d 显著性水平下D.W.统计量临界值的下界 d L为1.42, U 为1.67。
一般经验表明,对于采用时间序列数据做样本的计量经济学模型,
由于在不同样本点上解释变量意外的其他因素在时间上的连续性, 带来了他们对被解释变量的影响的连续性,所以往往存在序列相关性。
第二节
序列相关性的影响
如果我们在干扰中通过假定Cov( t , t j ) E ( t t j ) 0 引进序列相关,但保留经典模型的全部其他假定,对OLS 估计量及其方差来说会出现什么情况呢?
4.蛛网现象
例如:
假定某农产品的供给模型为:
St 0 1Pt -1 t
(10)
假设t时期的价格Pt低于t-1时期的价格Pt-1,农民就很可能决定在时 期t+1生产比t时期更少的东西。显然在这种情形中,农民由于在年 度t的过量生产很可能在年度t+1消减他们的产量。诸如此类的现象, 就不能期望干扰μt是随机,从而出现蛛网式的序列相关。
Cov( i, j ) E( i j) 0
(2)
如果仅存在
E ( i i 1 ) 0, i 1, 2,..., n
(3)
则称为一阶序列相关或自相关(简写为AR(1)),这是常见的一种序列相关问题。
自相关往往可以写成如下形式:
i i 1 i ,
1 1
二、序列相关的原因 1.经济数据序列惯性 2.模型设定的偏误 3.滞后效应 4.蛛网现象 5.数据的编造
1.经济数据序列惯性
比如:
GDP、价格指数、消费等时间序列数据通常表现为周期循环。当经
济衰退的谷底开始复苏时,大多数经济序列开始上升,在上升期间,序 列在每一时刻的值都高于前一时刻的值。看来有一种内在的动力驱使这 一势头继续下去,直至某些情况出现(如利率或税收提高)才把它拖慢 下来。 因此,在涉及时间序列的回归中,相继的观测值很可能是相互依赖的。
(6)
例2: (模型函数形式有偏误)
在成本—产出研究中,如果真实的边际成本的模型为:
Yt = β0 + β1 X t + β2 X t2 + μt
其中Y代表边际成本,X代表产出。
但是如果建模时设立了如下回归模型:
(7)
Yt 0 1 X t vt
(8)
3.滞后效应 考虑一个消费支出对收入进行回归的时间序列模型,人们常常发 现当期的消费支出除了依赖其他当期收入外,还依赖前期的消费支出, 即回归模型为:
二、回归检验法
, ˆ ˆ ,ˆ 以 et 为被解释变量,以各种可能的相关变量,诸如 et 1 et 2
等为解释变量,
建立各种方程:
ˆ ˆ et et 1 t
t 2,..., n t 3,..., n
(20) (21)
ˆ ˆ ˆ et 1et 1 2 et 2 t
E ( ) 2 I
(11)
即同方差和相互独立性条件。而且在大样本情况下,参数估计量虽然 具有一致性,但仍然不具有渐近有效性。
为了具体说明这一点,我们回到简单的一元回归模型
Yi 0 1 X i i
(12)
为方便我们不妨假定干扰项为(4)所示的一阶序列相关:
t t 1 t
对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方 程显著成立,则说明原模型存在序列相关性。
优点:
一旦确定了模型存在序列相关性,也就同时知道了相关的形式,而且它 适用于任何类型的序列相关性问题的检验。
三、杜宾—沃森检验
D-W检验是杜宾(J.Durbin)和沃森(G.S.Watson)于1951年提出 的一种检验序列自相关的方法。虽然该方法很常用,但它有一些基本假定: (1)回归含有截距项。 (2)解释变量X是非随机的,或者在重复抽样中被固定的。 (3)随机干扰项 t 为一阶自回归形式:t t 1 t
序列相关性
◆ 学习目的
通过本节的学习,你可以知道什么是序列相关性,序列 相关性产生的原因是什么,序列相关性导致什么样的后果, 怎样检验和处理具有序列相关性的模型。 ◆ 基本要求 1)掌握序列相关性的概念、序列相关性的后果和检验方法; 2)了解广义最小二乘法和广义差分法原理; 3)能运用广义差分法和广义最小二乘法估计线性回归模型。
2
(16)
相比,可以看出前者等于后者加上另一与自相关系数 和各期X 的样本协方差有关的项。
2.随机误差项方差估计量是有偏的Leabharlann Baidu
在存在干扰项序列相关的情况下,随机误差方差的OLS估计量偏离
了真实的随机误差项的方差 2。 以一元回归模型为例,在经 典假设情况下,干扰项的 OLS方差估计量
ˆ 2
2
接受原假设。但他们成功导出了临界值的上限 dU 和下限 d L,且这些上下限只与 样本容量n和解释变量的个数有关,而与解释变量的取值无关。
因此,在运用D-W检验时,只须计算该统计量的值,再根据样本容量n 和解释变量数目k查D.W.分布表,得到临界值 d L 和 dU ,然后按下列准则考察
计算得到的D.W.值,以判断模型的自相关状态:
根据D-W检验判断准则可知
(a)D.W.=1.05< d L =1.42,因此随机误差项存在正一阶自相关;
Ct 0 1Yt 2Ct 1 t
其中,C是消费,Y是收入。
类似(9)式的回归模型被称为自回归模型
(9)
注意:
由于心理上、技术上以及制度上的原因,消费者不会轻易改变其消费 习惯,如果我们忽视(9)式中的滞后消费对当前消费的影响,那所带来 的误差项就会体现出一种系统性的模式。
5.数据的编造 新生成的数据与原数据间就有了内在的联系,表现出序列相关性。
例如:
CPI季度数据可能来自月度数据的简单平均,这种平均的 计算减弱了每月数据的波动而引进了数据中的匀滑性,这种 匀滑性本身就能使随机干扰项中出现系统性的因素,从而出 现序列相关性。 利用数据的内插或外推技术构造的数据也会呈现某种系统性的模式。
. 若 0 DW . d L ,则存在正自相关; . 若 d L DW . dU ,则不确定;
. 若 dU DW . 4 dU ,则无自相关; . 若 4 dU DW . 4 d L ,则不确定;
若 4 d L DW . 4 ,则存在负自相关。 . 也就是说,当D.W.值在2附近时,模型不存在一阶自相关。
1.参数估计量非有效 2.随机扰动项方差估计量是有偏的 3.变量的显著性检验t检验统计量和相应的参数置信区间估计失去意义 4.模型的预测失效
1.参数估计量非有效
根据OLS估计中关于参数估计量的无偏性和有效性的证明过程可 以看出,当计量经济学模型出现序列相关性时,其OLS参数估计量 仍然具有线性无偏性,但不具有有效性。因为在有效性证明中我们 利用了
ˆ ˆ (e e
t 2 t n t 1
)2
D.W .
ˆ e
t 1
n
(22)
2
t
杜宾—沃森证明该统计量的分布与出现在给定样本中的X值有复杂的关系,
其准确的抽样或概率分布很难得到;
ˆ ˆ 因为D.W.值要从 et 中算出,而 et 又依赖于给定的X的值。
因此D-W检验不同于t、F或 χ 检验,它没有唯一的临界值可以导出拒绝或
xt2
3.变量的显著性检验t 检验统计量和相应的参数置 信区间估计失去意义
用OLS法估计序列相关的模型得到的随机误差项的方差不仅是 有偏的,而且这一偏误也将传递到用OLS方法得到的参数估计量 的方差中来,从而使得建立在OLS参数估计量方差基础上的变量 显著性检验失去意义。
以一元回归模型为例,
Yi 0 1 X i i
第七章 序列相关性
◆序列相关性及其产生原因
◆
序列相关性的影响
◆序列相关性的检验 ◆序列相关的补救
第一节
序列相关性及其产生原因
—、序列相关性的含义
对于多元线性回归模型
Yi 0 1 X1i 2 X 2i k X ki i i 1, 2,, n
(1)
在其他假设仍然成立的条件下,随机干扰项序列相关意味着
序列相关性的检验方法
一、图示法 二、回归检验法 三、杜宾—沃森检验
四、拉格朗日乘子检验
一、图示法
ˆ 由于残差 et可以作为随机误差 t 的估计,因此,如果 t 存在序列相关性, ˆ ˆ 必然会由残差项 et 反映出来,因此可以利用 et 的变化来判断随机干扰项的序列
相关性,如图7-1所示。
2.模型设定的偏误
定义:
指所设定的模型“不正确”,主要表现在模型中丢掉了重要的解释
变量或模型函数形式有偏误。 (丢掉了重要的解释变量) 例1: 本来应该估计的模型为
Yt 0 1 X1t 1 X 2t 3 X 3t t
但在进行回归时,却把模型设定为如下形式:
(5)
Yt = β0 + β1 X 1t + β2 X 2t +νt
xt xt 2
t 1
n2
xt2
t 1
n
xt xn n 1 t 1 … n xt2 t 1
n 1
(15)
ˆ ˆ 式中Var ( 1 ) AR 为一阶序列相关时 1的方差。
1
把该式与没有干扰项自相关情形的通常公式
ˆ Var ( 1 ) 2 xt
第三节
序列相关性的检验
序列相关性的检验方法有多种,如冯诺曼比检验法、回归检验法、D.W.检验法等。
不同的检验方法的共同思路:
首先采用普通最小二乘法估计模型,以得到随机干扰项的近似估
ˆ 计量,我们用 ei 表示近似估计量:
ˆ ˆ et Yt Ytols
(19)
然后通过分析这些近似估计量之间的相关性以达到判断随机干扰 项是否具有序列相关性的目的。
(4)
其中 称为自协方差系数或一阶自回归系数,
i 是满足以下标准OLS假定的随机干扰项:
E ( i ) 0, Var ( i ) 2 , Cov( i , i s ) 0( s 0)
由于序列相关性经常出现在以时间序列数据为样本的模型中,因此, 本节下面将代表不同样本点的下表i用t 表示。
。
(4)回归模型中不应把滞后应变量作为解释变量之一,即不应出现如下形式模型:
Yt 0 1 X1t 2 X 2t k X kt Yt 1 t
(5)没有缺失数据。
杜宾—沃森针对原假设
H 0 : 0,即 t 不存在一阶自相关,构造如下统计量: