自相关性检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
…
国民生产 总值
596.7 637.7 691.1 756.0
…
物价 指数 0.7167 0.7277 0.7436 0.7676
…
年份 序号
11 12 13 14
…
投资额
229.8 228.7 206.1 257.9
…
国民生 产总值
1326.4 1434.2 1549.2 1718.0
…
物价 指数 1.0575 1.1508 1.2579 1.3234
DW t 2 n
et2
t2
样本容量n=20,回归
变量数目k=3,=0.05
DWold < dL
原模型有 正自相关
查表
临界值dL=1.10, dU=1.54
ˆ 1 DW / 2 0.5623
作变换
yt* yt 0.5623 yt1
xi*t xit 0.5623xi,t1, i 1,2
0 dL dU 2 4-dU 4-dL 4 DW 正 不无 不负 自 能自 能自 相 确相 确相 关 定关 定关
模型优点 R2=0.9908,拟合度高
s=12.7164
模型缺点 没有考虑时间序列数据的滞后性影响 可能忽视了随机误差存在自相关;如果
存在自相关性,用此模型会有不良后果
自相关性的定性诊断
模型残差 et yt yˆt
et为随机误差t 的估计值
残差诊断法
et 20
10
0
在MATLAB工作区中输出 作残差 et~et-1 散点图
投资额与国民生产总值和物价指数
分 许多经济数据在时间上有一定的滞后性 析 以时间为序的数据,称为时间序列
时间序列中同一变量的顺序观测值之间存在自相关
若采用普通回归模型直接处理,将会出现不良后果
需要诊断并消除数据的自相关性,建立新的模型
年份 序号
1 2 3 4
…
投资额
90.9 97.4 113.5 125.7
yt*
* 0
1 x1*t
2 x2*t
ut
* 0
0
(1
)
以*0, 1 , 2 为回归系数的普通回归模型
步骤
无自相关
原模型
原模型 D-W DW值 检验
广义
差分
有自相关
新模型
继续此 过程
不能确定
增加数据量; 选用其它方法
投资额新模型的建立
原模型 残差et
DWold= 0.8754
n
(et et1)2
新模型 残差et
DWnew= 1.5751
正 不无 不负 自 能自 能自 相 确相 确相
关 定关 定关
样本容量n=19,回归
变量数目k=3,=0.05
dU< DWnew < 4-dU
查表
临界值dL=1.08, dU=1.53
新模型无自相关性
新模型 yˆt* 163 .4905 0.699 x1*t 1009 .033 x2*t
2
97.4
637.7 0.7277 19
3 113.5 691.1 0.7436 20
投资额
401.9 474.9 424.5
国民生 产总值
2631.7 2954.7 3073.0
物价 指数
1.7842 1.9514 2.0688
设已知 t=21时, x1t =3312,x2t=2.1938 基本回归模型 yˆt 485 .6720
参数
参数估计值
置信区间
0
322.7250
[224.3386 421.1114]
1
0.6185
[0.4773 0.7596]
2
-859.4790 [-1121.4757 -597.4823 ]
R2= 0.9908 F= 919.8529 p=0.0000
yˆt 322 .725 0.6185 x1t 859 .479 x2t 剩余标准差
一阶自回归模型 yˆt 469 .7638 ŷt 较小是由于yt-1=424.5过小所致
作业
• 财政收入预测问题:财政收入与国民收入、工 业总产值、农业总产值、总人口、就业人口、 固定资产投资等因素有关。附件列出了19521981年的原始数据,写篇数学建模论文,构造 预测模型。
新模型 ŷt ~ *,新模型 ŷt ~ +
一阶自回归模型残差et比基本回归模型要小
投资额预测
对未来投资额yt 作预测,需先估计出未来的国民 生产总值x1t 和物价指数 x2t
年份 投资额 国民生产 物价 年份
序一号阶自回归模总型值
1
90.9 596.7
yˆt
指4数69 .7序63号8
0.7167 18
t2
t2
DW t2 n
et2
t2
n较大
21
t2 n
t2
et2
( 2 1 ˆ)
1 ˆ 1 0 DW 4 ˆ 1 DW 0 ˆ 1 DW 4
ˆ 0 DW 2
检验水平,样本容量, 回归变量数目
D-W分布表
检验临界值dL和dU
0
dL dU 2 4-dU 4-dL
4 DW
-10
-20
-30
et-1
-30
-20
-10
0
10
20
大部分点落在第1, 3象限
t 存在正的自相关
大部分点落在第2, 4象限
t 存在负的自相关
自相关性直观判断
基本回归模型的随机误
差项t 存在正的自相关
自回归性的定量诊断
D-W检验
自回归模型 yt 0 1x1t 2 x2t t , t t1 ut
1
0.6990
[0.5751 0.8247]
2 -1009.0333 [-1235.9392 -782.1274]
R2= 0.9772 F=342.8988 p=0.0000
总体效果良好
剩余标准差 snew= 9.8277 < sold=12.7164
新模型的自相关性检验 0 dL dU 2 4-dU 4-dL 4 DW
正 不无 不负
自 能自 能自
相 确相 确相
关 定关 定关
由DW值的大小确定自相关性
广义差分变换 DW ( 2 1 ˆ) ˆ 1 DW
2
原模型 yt 0 1x1t 2 x2t t , t t1 ut
变换 yt* yt yt1, xi*t xit xi,t1, i数 ρ~自相关系数
ut ~对t相互独立的零均值正态随机变量
| | 1
ρ= 0
无自相关性
ρ> 0
存在正自相关性
ρ< 0
存在负自相关性
如何估计ρ
D-W统计量
如何消除自相关性
广义差分法
D-W统计量与D-W检验
n
n
ˆ etet1 / et 2
n
(et et1)2
n
et et1
…
基本回归模型
t ~年份, yt ~ 投资额,x1t~ GNP, x2t ~ 物价指数
yt
yt
x1t
x2t
投资额与 GNP及物价指数间均有很强的线性关系
yt 0 1x1t 2 x2t t 0, 1, 2 ~回归系数
t ~对t相互独立的零均值正态随机变量
基本回归模型的结果与分析 MATLAB 统计工具箱
还原为 原始变量
yˆt 163.4905 0.5623yt1 0.699x1,t 0.3930x1,t1 1009.0333x2,t 567.3794x2,t1
一阶自回归模型
模型结果比较
基本回归模型 yˆt 322 .725 0.6185 x1t 859 .479 x2t
一阶自回归模型
投资额新模型的建立
yt* yt 0.5623 yt1 xi*t xit 0.5623xi,t1, i 1,2
yt*
* 0
1 x1*t
2 x2*t
ut
由数据 yt*, x1*t , x2*t 估计系数 0*,1,2
参数 参数估计值
置信区间
*0
163.4905
[1265.4592 2005.2178]
残差图比较
yˆt 163.4905 0.5623yt1 0.699x1,t 0.3930x1,t1 1009.0333x2,t 567.3794x2,t1
拟合图比较
20
500
10
400
0
300
-10
200
-20
100
-30 0
0
5
10
15
20
0
5
10
15
20
新模型 et~ *,原模型 et~ +
国民生产 总值
596.7 637.7 691.1 756.0
…
物价 指数 0.7167 0.7277 0.7436 0.7676
…
年份 序号
11 12 13 14
…
投资额
229.8 228.7 206.1 257.9
…
国民生 产总值
1326.4 1434.2 1549.2 1718.0
…
物价 指数 1.0575 1.1508 1.2579 1.3234
DW t 2 n
et2
t2
样本容量n=20,回归
变量数目k=3,=0.05
DWold < dL
原模型有 正自相关
查表
临界值dL=1.10, dU=1.54
ˆ 1 DW / 2 0.5623
作变换
yt* yt 0.5623 yt1
xi*t xit 0.5623xi,t1, i 1,2
0 dL dU 2 4-dU 4-dL 4 DW 正 不无 不负 自 能自 能自 相 确相 确相 关 定关 定关
模型优点 R2=0.9908,拟合度高
s=12.7164
模型缺点 没有考虑时间序列数据的滞后性影响 可能忽视了随机误差存在自相关;如果
存在自相关性,用此模型会有不良后果
自相关性的定性诊断
模型残差 et yt yˆt
et为随机误差t 的估计值
残差诊断法
et 20
10
0
在MATLAB工作区中输出 作残差 et~et-1 散点图
投资额与国民生产总值和物价指数
分 许多经济数据在时间上有一定的滞后性 析 以时间为序的数据,称为时间序列
时间序列中同一变量的顺序观测值之间存在自相关
若采用普通回归模型直接处理,将会出现不良后果
需要诊断并消除数据的自相关性,建立新的模型
年份 序号
1 2 3 4
…
投资额
90.9 97.4 113.5 125.7
yt*
* 0
1 x1*t
2 x2*t
ut
* 0
0
(1
)
以*0, 1 , 2 为回归系数的普通回归模型
步骤
无自相关
原模型
原模型 D-W DW值 检验
广义
差分
有自相关
新模型
继续此 过程
不能确定
增加数据量; 选用其它方法
投资额新模型的建立
原模型 残差et
DWold= 0.8754
n
(et et1)2
新模型 残差et
DWnew= 1.5751
正 不无 不负 自 能自 能自 相 确相 确相
关 定关 定关
样本容量n=19,回归
变量数目k=3,=0.05
dU< DWnew < 4-dU
查表
临界值dL=1.08, dU=1.53
新模型无自相关性
新模型 yˆt* 163 .4905 0.699 x1*t 1009 .033 x2*t
2
97.4
637.7 0.7277 19
3 113.5 691.1 0.7436 20
投资额
401.9 474.9 424.5
国民生 产总值
2631.7 2954.7 3073.0
物价 指数
1.7842 1.9514 2.0688
设已知 t=21时, x1t =3312,x2t=2.1938 基本回归模型 yˆt 485 .6720
参数
参数估计值
置信区间
0
322.7250
[224.3386 421.1114]
1
0.6185
[0.4773 0.7596]
2
-859.4790 [-1121.4757 -597.4823 ]
R2= 0.9908 F= 919.8529 p=0.0000
yˆt 322 .725 0.6185 x1t 859 .479 x2t 剩余标准差
一阶自回归模型 yˆt 469 .7638 ŷt 较小是由于yt-1=424.5过小所致
作业
• 财政收入预测问题:财政收入与国民收入、工 业总产值、农业总产值、总人口、就业人口、 固定资产投资等因素有关。附件列出了19521981年的原始数据,写篇数学建模论文,构造 预测模型。
新模型 ŷt ~ *,新模型 ŷt ~ +
一阶自回归模型残差et比基本回归模型要小
投资额预测
对未来投资额yt 作预测,需先估计出未来的国民 生产总值x1t 和物价指数 x2t
年份 投资额 国民生产 物价 年份
序一号阶自回归模总型值
1
90.9 596.7
yˆt
指4数69 .7序63号8
0.7167 18
t2
t2
DW t2 n
et2
t2
n较大
21
t2 n
t2
et2
( 2 1 ˆ)
1 ˆ 1 0 DW 4 ˆ 1 DW 0 ˆ 1 DW 4
ˆ 0 DW 2
检验水平,样本容量, 回归变量数目
D-W分布表
检验临界值dL和dU
0
dL dU 2 4-dU 4-dL
4 DW
-10
-20
-30
et-1
-30
-20
-10
0
10
20
大部分点落在第1, 3象限
t 存在正的自相关
大部分点落在第2, 4象限
t 存在负的自相关
自相关性直观判断
基本回归模型的随机误
差项t 存在正的自相关
自回归性的定量诊断
D-W检验
自回归模型 yt 0 1x1t 2 x2t t , t t1 ut
1
0.6990
[0.5751 0.8247]
2 -1009.0333 [-1235.9392 -782.1274]
R2= 0.9772 F=342.8988 p=0.0000
总体效果良好
剩余标准差 snew= 9.8277 < sold=12.7164
新模型的自相关性检验 0 dL dU 2 4-dU 4-dL 4 DW
正 不无 不负
自 能自 能自
相 确相 确相
关 定关 定关
由DW值的大小确定自相关性
广义差分变换 DW ( 2 1 ˆ) ˆ 1 DW
2
原模型 yt 0 1x1t 2 x2t t , t t1 ut
变换 yt* yt yt1, xi*t xit xi,t1, i数 ρ~自相关系数
ut ~对t相互独立的零均值正态随机变量
| | 1
ρ= 0
无自相关性
ρ> 0
存在正自相关性
ρ< 0
存在负自相关性
如何估计ρ
D-W统计量
如何消除自相关性
广义差分法
D-W统计量与D-W检验
n
n
ˆ etet1 / et 2
n
(et et1)2
n
et et1
…
基本回归模型
t ~年份, yt ~ 投资额,x1t~ GNP, x2t ~ 物价指数
yt
yt
x1t
x2t
投资额与 GNP及物价指数间均有很强的线性关系
yt 0 1x1t 2 x2t t 0, 1, 2 ~回归系数
t ~对t相互独立的零均值正态随机变量
基本回归模型的结果与分析 MATLAB 统计工具箱
还原为 原始变量
yˆt 163.4905 0.5623yt1 0.699x1,t 0.3930x1,t1 1009.0333x2,t 567.3794x2,t1
一阶自回归模型
模型结果比较
基本回归模型 yˆt 322 .725 0.6185 x1t 859 .479 x2t
一阶自回归模型
投资额新模型的建立
yt* yt 0.5623 yt1 xi*t xit 0.5623xi,t1, i 1,2
yt*
* 0
1 x1*t
2 x2*t
ut
由数据 yt*, x1*t , x2*t 估计系数 0*,1,2
参数 参数估计值
置信区间
*0
163.4905
[1265.4592 2005.2178]
残差图比较
yˆt 163.4905 0.5623yt1 0.699x1,t 0.3930x1,t1 1009.0333x2,t 567.3794x2,t1
拟合图比较
20
500
10
400
0
300
-10
200
-20
100
-30 0
0
5
10
15
20
0
5
10
15
20
新模型 et~ *,原模型 et~ +