关于自相关问题的计量分析实例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Yt*
=
510.950
+
0.980 ⋅
X
* 2t
+ 1.374 *
X
* 3t
− 0.018 *
X
* 4t
(5)
(4.216) (38.969) (5.738) (-4.276)
R 2 = 0.999 R 2 = 0.989 D ⋅W⋅ = 1.791
在 5% 显著性水平下,D ⋅W⋅ = 1.791> dU = 1.775(样本容 量 为 28-4=24 个 ) , 已 不 存 在 自 相 关 性 。 计 算
11
万方数据
关于自相关问题的计量分析实例
作者: 作者单位: 刊名:
英文刊名: 年,卷(期):
刘瑜, 吴丽欣 刘瑜(河北大学经济学院), 吴丽欣(河北农业大学林学院)
中国商界 CHINA COMMERCE 2009(11)
参考文献(4条) 1.易丹辉 数据分析与Eviews应用 2.洪楠 SPSS for Windows统计产品和服务解决方案教程 3.李子奈;潘文卿 计量经济学 4.张从军;孙春燕;陈美霞;杨靖三 经济应用模型
年的其他收入; X 4t 为第 t 年的社会从业人数。利用 SPSS
软件,输入 Y 、 X1 、 X 2 、 X 3 、 X 4 等表 1 中的数据, 采用这些数据对模型进行 OLS 回归,得到的模型如下
Y = 1397.7 + 0.002 ⋅ X1 + 0.971⋅X 2+1.463 ⋅ X 3 − 0.026 ⋅ X 4 (5.416)(0.334)(22.348)(5.673)(-5.106)
关键词 逐步回归法 拉格朗日乘数检验 广义 差分法 杜宾两步法
一、问题的提出 一般在进行多元线性回归模型分析时,确保该模型的 随机干扰项具有零均值,同方差及不序列相关性。但由于 时间序列数据本身的特点,即在不同时间具有很强的关联 性,使得多元线性回归模型的随机干扰项存在相关性,严
重的后果之一是该模型即使通过了 F 检验和 t 检验,也并
非是最优模型。所以学者们提出了图示法、回归检验法、
杜宾-瓦森( Dubin − Watson )检验法和拉格朗日乘数 ( Lagrange multiplier )检验。其中图示法是描述时间和
残差项或相邻时期残差项的变化图形,虽然能够反映残差 变化趋势,但描述比较粗糙;由于杜宾-瓦森
( Dubin − Watson )检验法只能检验一阶自相关性,无法
关系数较高,证实确实存在严重的多重共线性。
修 正 多 重 共 线 性 的 方 法 有 四 种 , 包 括 ENTER 、 STEPWISE 、 FORWARD 及 BACKWARD ,就其实用 性来说以 STEPWISE 为佳。本文将借助 SPSS 软件,采用 STEPWISE 法去检验和解决多重共线性问题。通过逐步回 归法( STEPWISE )得到的财政收入回归模型为
2009 11
βˆ0
= βˆ0* 1 − ρˆ1
= 510.950 1 − 0.495
= 1011.78 ,由此,我们得到最终的财政
收入模型为:
Yt*
= 1011.78 + 0.9பைடு நூலகம்0 ⋅
X
* 2t
+1.374 *
X
* 3t
− 0.018*
X
* 4t
(6)
可见,仅与式(5)中的截距项有差别,而各项前面的系数
P = 0.742 ,可以剔除,这表明很可能存在严重的共线性。 计算各解释变量的相关系数,得表 1。
表 1 相关系数矩阵
X1
X2
X3
X4
X1
1
0.986
0.957
0.779
X2
0.986
1
0.983
0.720
X3
0.957
0.983
1
0.678
X4
0.779
0.720
0.678
1
由相关系数矩阵可以看出,各解释变量相互之间的相
关问题,这需要拉格朗日乘数检验,经检验,该模型不存在二
阶自相关问题,这为解决自相关问题限定了范围。随后在解决
一阶自相关问题上,本文借助了广义差分法,但在应用之前需
要借助杜宾两步法估计出随机干扰项相关系数。在运用广义差
分法时,本文利用普莱斯-温斯特变换来填补第一次观测值。通 过图 3 中两种模型的比较分析可以看出,拉格朗日乘数
0 1980
1985
1990
1995
2000
2005
y s j0 1
xm x02
ym x03
图 3 新模型与原有模型拟合比较图 四、结束语 通过以上综合分析,在排除比较严重的多重共线性问题后,
所构建的虽然是回归分析模型,但原始数据存在时间关联性,
也许存在时间序列自相关问题,这一点得到了残差图及 D ⋅W ⋅ 检验的确定。唯独不能确定的是是否存在二阶及二阶以上自相
相关。另外从残差项 eˆt 与时间 t 以及 eˆt 与 eˆt−1 的关系(图1)
2009 11
万方数据
FOREFRONT 前 沿
看,随机干扰项呈现正序列相关性。
600
500
400 300 200 100
0
-1 0 0
-2 0 0
-3 0 0 1980
1985
1990
1995
2000
2005
re s id
R2 = 1.000 R 2 = 1.000 由此可见,该模型 R 2 = 1.000 , R 2 = 1.000 ,可决定
系数很高,F 检验值为 20933.075,明显显著。但当 a = 0.05 时,ta / 2 (n − k) = t0.025 (29 − 5) = 2.064 ,其中 X 1 未通过检验,
相同。该模型(6)说明,在其他因素不变的情况下,当税收收
入和其他收入分别增长 1 亿人民币,财政收入分别增长 0.98 亿
和 1.374 亿元。通过图 3 拟合情况可以看出该模型( xmx02 )
要 优 于 原 始 模 型 [1] ( ymx03 , 即 最 下 面 一 条 ) :
Y = 803.619 + 0.0608⋅ X1 + 0.323⋅ X 2 。可见,模型(6)与原 模型相比具有一定的优势:首先,模型(6)通过杜宾两步法消
本文链接:http://d.g.wanfangdata.com.cn/Periodical_zhonggsj200911005.aspx
− 0.231* X 3t−1 − 0.018 * X 4 − 0.002 * X 4t−1
t = (2.927)(2.873)(9.490)(-2.294)(3.111)
(-0.489)(-4.089)(-0.375) R 2 = 0.9991 R 2 = 0.998 D ⋅W ⋅ = 2.217
检验存在滞后被解释变量的模型,所以本文在利用前两者 的基础上,利用拉格朗日乘数检验法,该法适合高阶序列 相关及模型中存在滞后被解释变量的情景。具体计算步骤 见文[2]。
在证实该模型存在自相关性之后,则需要利用新的方 法估计模型,最常用的有广义最小二乘法( GLS )和广义 差分法。而后者的应用最为广泛,它是将原模型变换成满 足普通最小二乘法的差分模型,再进行 OLS 估计。其中, 关于随机干扰项相关系数的估计,本文采用杜宾两步法, 具体的计算过程见文[2]。
Y = 1372.798 + 0.982 X 2 + 1.434 X 3 − 0.025X 4 (1) (5.659) (39.651)(6.014)(-5.478)
R 2 = 0.998 D.W . = 1.072 F = 28939.420
虽然该模型通过了可决定系数、 t 检验和 F 检验,但 通 过 查 5% 显 著 水 平 的 DW 统 计 表 得 知 , d L = 1.104 , dU = 1.747 ,由于 D.W. = 1.072 < dL ,显然该模型存在自
图 1 残差项 eˆt 与时间 t 关系图
600
500
400
300
200
100
0
-1 0 0
-2 0 0
-3 0 0
-4 0 0
-2 0 0
0
200
400
600
e(-1 )
e
图 2 eˆt 与 eˆt−1 的关系图 下面再进行拉格朗日乘数检验,含2阶滞后残差项的辅
助回归为
eˆt = −113.907 +0.003X2 −0.064X3 +0.002X4 +0.282eˆt−1 +0.271eˆt−2 (2)
10
国统计年鉴》。 三、模型的设定与其检验
设定的计量经济模型为 Yt = β 0 + β1 X 1t + β 2 X 2t + β3 X 3t
+ β 4 X 4t + μt ,其中,Yt 为第 t 年的全国财政收入; X 1t 为
第 t 年的国民总收入;X 2t 为第 t 年的税收收入;X 3t 为第 t
( Lagrange multiplier )检验法和广义差分法能够很好地解
决时间序列模型中的相关性,使得模型的拟合度比较高。
参考文献: [1]张从军,孙春燕,陈美霞,杨靖三.经济应用模型.复旦大学出版 社:187-197. [2]李子奈,潘文卿.计量经济学.高等教育出版社:94-137. [3]洪楠.SPSS for Windows 统计产品和服务解决方案教程:清 华大学出版社,北方交通大学出版社:217-293. [4]易丹辉.数据分析与 Eviews 应用.中国统计出版社:31-58.
除了由于随机干扰项造成的时间序列自相关问题,同时也经过
了其他检验;其次,模型(6)对各年份财政收入的拟合程度要
高于原模型,从图 3 中可以看到新形成的模型与原始数据重合
度很高,而原模型 1996 年以后开始向下偏离,离差逐渐变大。
4 0 ,0 0 0
3 0 ,0 0 0
2 0 ,0 0 0
1 0 ,0 0 0
(-0.448)(0.150)(-0.288)(0.426)(2.694)(2.170)
R 2 = 0.267
R 2 = 0.107
于是,LM = N * R2 = 22 × 0.267 = 5.874 ,该值小于显著
性水平为 5% ,自由度为2的 χ
2
分布的临界值
χ2 0.05
=
5.991,
由此判断原模型不存在2阶序列相关性,所以本文将讨论一
前 沿 FOREFRONT
关于自相关问题的计量分析实例
■ 刘瑜 河北大学经济学院 ■ 吴丽欣 河北农业大学林学院
中图分类号:F011
文献标识:A
文章编号:1006-7833(2009) 11-010-02
摘 要 一般在进行多元线性回归模型分析时,往 往要满足基本假设之一,即模型的随机干扰项相互独立 或不相关。而由于采用的时间序列数据在前后一段时间 联系比较紧密,产生序列相关性的机率很大,所以在分 析的基础上要进行检验。除了检验一阶自相关外,也要 注意由该时间序列所拟合的模型会不会存在二阶以及 二阶以上的自相关性,这里本文借助了拉格朗日乘数检 验,以弥补杜宾检验仅能检验一阶自相关的不足。本文 在前面分析的基础上,利用广义差分法处理自相关问 题,最终得到了比较理想的模型。
阶序列相关性,在此运用杜宾两步法估计 ρ ,为处理自相
关问题提供合理的解决方案,具体实现步骤如下:
第一步,估计模型
Yt
= β0*
+ρ1Yt−1
+β1*X2t
+
β X* 2 2t−1
+β3*X3t
+β4*X3t−1
+β5*X4t
+
β X* 6 4t−1
+εt
得
(3)
Yˆt = 1035.284 + 0.495*Yt + 0.941* X 2t − 0.441* X 2t−1 + 0.905* X 3t (4)
第 二 步 , 作 差 分 变 换 : Yt* = Yt − 0.495*Yt−1 ;
X
* 2t
=
X 2t
− 0.495 * X 2t−1 ;
X
* 3t
=
X 3t
−
0.495
*
X
3t
−1
;
X
* 4t
=
X 4t
− 0.495 * X 4t−1
则 Yt*
关于
X
* 2t
、
X
* 3t
、
X
* 4t
的 OLS
估计结果为
二、样本数据的选取 本文引用财政收入及其影响因素的多元线性回归模 型,将引用张从军等人的观点,认为影响主要因素包括国
民总收入(X 1 )、税收(X 2 )、其他收入(X 3 )及社会从
业人数(X 4 )。选取的数据时限为 1978—2006 年,财政收 入、国民总收入等 5 项指标观测数据,数据来自往年的《中