对镇江市近几年来降雨量的时间序列分析及预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对镇江市近几年降雨量数据进行时间序列分析及预测
一、引言
最早的时间序列分析可以追溯到7000年前的古埃及。

当时,为了发展农业生产,古埃及人一直在密切关注尼罗河泛滥的规律。

把尼罗河涨落的情况逐天记录下来,就构成了所谓的时间序列。

对这个时间序列长期的观察使他们发现尼罗河的涨落非常有规律。

天狼星第一次和太阳同时升起的那一天之后,再过200天左右,尼罗河就开始泛滥,泛滥期将持续七八十天,洪水过后,土地肥沃,随意播种就会有丰厚的收成。

由于掌握了尼罗河泛滥的规律,古埃及的农业迅速发展,解放出大批的劳动力去从事非农业生产,从而创建了古埃及灿烂的史前文明。

像古埃及人一样,按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。

对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。

由此可见,时间序列分析在我们生活中将扮演着一个十分重要的角色。

于是,我们先进行时间序列的定义。

在统计研究中,常用按时间顺序排列的一组随机变量
……,X1,X2,……,Xt,……
来表示一个随机事件的时间序列,简记为{Xt,t∈T}或{Xt}
用x1,x2,……,xn或{xt,t=1,2,…,n}
表示该随机序列的n个有序观察值,称之为序列长度为n的观察值序列。

二、文献综述及数据来源
为充分了解时间序列在生活中的应用,本例就取镇江市近几年的降雨量数据进行时间序列分析,并在进行模型建设及检验完毕后,对2010年的月降雨量进行预测,并进行真实值的校对,以确认时间序列在生活中的有效应用。

本例数据来源于江苏省统计年鉴2000—2009年,其中参考文献为中国人民大学出版社出版的《应用时间序列分析》。

关键字:时间序列模型建设检验预测
三、数据展示及描述性分析
数据来源于江苏省统计年鉴2000—2009,选取的是镇江市从2000年到2009年的月降雨量。

由描述统计量表得出,镇江市近几年的月降雨量在90.7925间波动,且极小值与极大值之间的差距还是挺大的,说明降雨量是一个具有季节性的数据。

四、时间序列数据的预处理
①对原数据进行时序图检验和自相关图检验:
800
600
400
200
00010203040506070809
图一1
Date: 06/07/11 Time: 19:14
Sample: 2000:01 2009:12
.|** | .|** | 1 0.208 0.208 5.3472 0.021
.|. | *|. | 2 -0.046 -0.093 5.6047 0.061
*|. | .|. | 3 -0.071 -0.043 6.2342 0.101
*|. | *|. | 4 -0.116 -0.100 7.9317 0.094
*|. | *|. | 5 -0.135 -0.103 10.267 0.068
**|. | *|. | 6 -0.189 -0.168 14.856 0.021
*|. | *|. | 7 -0.149 -0.117 17.723 0.013
*|. | **|. | 8 -0.175 -0.199 21.745 0.005
*|. | *|. | 9 -0.127 -0.158 23.882 0.004
.|* | .|. | 10 0.096 0.033 25.117 0.005
.|** | .|* | 11 0.293 0.177 36.654 0.000
.|** | .|* | 12 0.242 0.098 44.611 0.000
.|** | .|* | 13 0.212 0.156 50.779 0.000
.|* | .|* | 14 0.105 0.070 52.293 0.000
*|. | *|. | 15 -0.103 -0.099 53.775 0.000
*|. | *|. | 16 -0.142 -0.062 56.598 0.000
**|. | *|. | 17 -0.206 -0.142 62.647 0.000
*|. | *|. | 18 -0.181 -0.082 67.328 0.000
*|. | .|. | 19 -0.091 0.047 68.534 0.000
*|. | .|. | 20 -0.119 -0.033 70.595 0.000
*|. | *|. | 21 -0.105 -0.106 72.211 0.000
.|. | *|. | 22 -0.040 -0.150 72.453 0.000
.|** | .|* | 23 0.282 0.136 84.479 0.000
.|** | .|. | 24 0.297 0.031 97.905 0.000
.|** | .|* | 25 0.240 0.119 106.78 0.000
.|. | *|. | 26 -0.005 -0.095 106.79 0.000
*|. | .|. | 27 -0.062 0.002 107.39 0.000
*|. | *|. | 28 -0.166 -0.099 111.77 0.000
*|. | .|. | 29 -0.159 -0.019 115.82 0.000
.|. | .|. | 30 -0.039 0.056 116.06 0.000
*|. | *|. | 31 -0.167 -0.069 120.66 0.000
*|. | .|. | 32 -0.144 -0.002 124.11 0.000
.|. | .|. | 33 -0.050 -0.006 124.53 0.000
.|. | *|. | 34 0.036 -0.092 124.76 0.000
.|* | *|. | 35 0.131 -0.082 127.70 0.000
.|* | .|. | 36 0.186 -0.053 133.74 0.000
图一2
由时序图显示该序列具有一个周期长度为一年的平稳的季节变动。

同时查看数据的自偏相关系数图及P值检验,得知此数据为平稳的相对随机数据,除几个数值的P值>0.05外,其余的P值均<0.05。

所以对原序列先做一阶差分,提取线性长期趋势。

②一阶差分运算
在Eiews中Genr里输入dx=d(x),得到一阶差分后的时序图和自相关图:
600
400
200
-200
-400
-600
00010203040506070809
图二1
Date: 06/07/11 Time: 19:37
Sample: 2000:01 2009:12
Included observations: 119
***|. | ***|. | 1 -0.339 -0.339 14.055 0.000
*|. | **|. | 2 -0.146 -0.295 16.680 0.000
.|. | *|. | 3 0.014 -0.186 16.704 0.001
.|. | *|. | 4 -0.015 -0.162 16.732 0.002
.|. | *|. | 5 0.025 -0.094 16.810 0.005
*|. | *|. | 6 -0.062 -0.152 17.303 0.008
.|. | *|. | 7 0.041 -0.081 17.523 0.014
.|. | *|. | 8 -0.048 -0.144 17.826 0.023
*|. | **|. | 9 -0.110 -0.287 19.419 0.022
.|. | ***|. | 10 0.018 -0.337 19.460 0.035
.|* | **|. | 11 0.155 -0.204 22.649 0.020
.|. | **|. | 12 -0.012 -0.225 22.669 0.031
.|. | *|. | 13 0.048 -0.115 22.986 0.042
.|. | .|. | 14 0.063 0.055 23.525 0.052
*|. | .|. | 15 -0.107 0.007 25.098 0.049
.|. | .|* | 16 0.018 0.072 25.143 0.067
.|. | .|. | 17 -0.056 -0.006 25.585 0.082
.|. | *|. | 18 -0.040 -0.132 25.812 0.104
.|* | .|. | 19 0.073 -0.046 26.580 0.115
.|. | .|. | 20 -0.028 0.021 26.696 0.144
.|. | .|. | 21 -0.032 0.051 26.847 0.176
*|. | **|. | 22 -0.163 -0.225 30.791 0.100
.|* | *|. | 23 0.196 -0.099 36.572 0.036
.|. | *|. | 24 0.043 -0.175 36.858 0.045
.|* | .|. | 25 0.119 0.045 39.029 0.037
*|. | .|. | 26 -0.118 -0.052 41.173 0.030
.|. | .|. | 27 0.030 0.052 41.311 0.038
*|. | .|. | 28 -0.069 -0.034 42.057 0.043
*|. | *|. | 29 -0.071 -0.104 42.856 0.047
.|* | .|. | 30 0.155 0.016 46.747 0.026
*|. | .|. | 31 -0.096 -0.051 48.247 0.025
.|. | .|. | 32 -0.045 -0.044 48.589 0.030
.|. | .|. | 33 0.005 0.041 48.592 0.039
.|. | .|. | 34 -0.007 0.024 48.600 0.050
.|. | .|. | 35 0.026 -0.009 48.715 0.062
.|. | **|. | 36 -0.028 -0.193 48.856 0.075
图二2
图二1显示,一阶差分后线性信息被提取,1阶差分序列具有稳定的季节波动和不随机波动。

故对1阶差分后序列再进行12步的周期差分,提取季节波动信息。

③一阶12步差分运算
在Genr里输入ds=d(x,1,12),得到周期差分后序列时序图和自相关图:
600
400
200
-200
-400
-600
-800
00010203040506070809
图三1
Date: 06/07/11 Time: 23:07
Sample: 2000:01 2009:12
Included observations: 107
Autocorrelation Partial Correlation AC PAC Q-Stat Prob
***|. | ***|. | 1 -0.434 -0.434 20.710 0.000
**|. | ****|. | 2 -0.211 -0.492 25.675 0.000
. |* | ***|. | 3 0.147 -0.331 28.094 0.000
. |. | **|. | 4 0.014 -0.292 28.116 0.000
. |. | .*|. | 5 0.013 -0.173 28.136 0.000
. |. | .*|. | 6 -0.016 -0.108 28.167 0.000
. |. | . |. | 7 0.009 -0.009 28.177 0.000
. |. | . |. | 8 -0.036 -0.026 28.330 0.000
.*|. | **|. | 9 -0.103 -0.265 29.599 0.001
. |* | .*|. | 10 0.186 -0.166 33.772 0.000
. |** | . |*** | 11 0.199 0.364 38.569 0.000
****|. | . |. | 12 -0.469 0.039 65.622 0.000
. |* | .*|. | 13 0.091 -0.113 66.639 0.000
. |** | .*|. | 14 0.211 -0.137 72.210 0.000
.*|. | **|. | 15 -0.123 -0.260 74.116 0.000
. |. | .*|. | 16 0.051 -0.136 74.452 0.000
. |. | . |. | 17 0.007 0.057 74.457 0.000
.*|. | .*|. | 18 -0.130 -0.091 76.656 0.000
. |* | . |. | 19 0.109 -0.010 78.222 0.000
. |. | . |. | 20 0.039 0.027 78.421 0.000
. |. | . |. | 21 0.002 -0.049 78.422 0.000
.*|. | **|. | 22 -0.152 -0.215 81.581 0.000
. |. | . |* | 23 0.062 0.119 82.110 0.000
. |* | . |. | 24 0.076 0.011 82.916 0.000
. |. | . |. | 25 0.027 0.051 83.018 0.000
.*|. | .*|. | 26 -0.147 -0.143 86.135 0.000
. |* | . |. | 27 0.167 -0.017 90.198 0.000
.*|. | .*|. | 28 -0.146 -0.123 93.364 0.000
. |. | .*|. | 29 -0.041 -0.146 93.617 0.000
. |** | .*|. | 30 0.235 -0.075 102.00 0.000
.*|. | . |. | 31 -0.131 -0.030 104.61 0.000
.*|. | . |. | 32 -0.080 0.009 105.60 0.000
. |* | . |. | 33 0.067 0.017 106.30 0.000
. |* | .*|. | 34 0.066 -0.087 107.00 0.000
. |. | . |** | 35 0.031 0.252 107.15 0.000
**|. | . |. | 36 -0.190 0.028 113.06 0.000
图三2
图三1显示,周期差可以非常好的地提取周期信息。

至此,差分运算已经比较充分地提取了原序列中蕴含的季节效应和长期趋势效应等确定性信息。

差分后显示序列呈现典型的随机波动特征。

同时考察差分后序列的自相关图,如图三2显示,自相关图显示除了延迟2阶的自相关系数在2倍标准差范围之外,其他阶数的自相关系数都在2倍标准差范围内波动,根据自相关系数的这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。

同时,可以认为该序列自相关系数2阶截尾。

偏自相关系数显示出非截尾的性质。

于是此时可以开始对数据进行模型建设。

五、平稳序列建模
(一)逐步剔除法
①首先在equation中输入:
Ds ar(1) ma(1) ma(2) ma(3) ma(4) sma(12) sar(12),得到EQ03为
Dependent Variable: DF
Method: Least Squares
Date: 06/07/11 Time: 20:09
Sample(adjusted): 2002:03 2009:12
Included observations: 94 after adjusting endpoints
Convergence achieved after 21 iterations
Variable Coefficient Std. Error t-Statistic Prob.
AR(1) -0.049019 0.167082 -0.293385 0.7699
SAR(12) -0.314246 0.080397 -3.908691 0.0002
MA(1) -0.991537 0.198932 -4.984295 0.0000
MA(2) 0.004492 0.234865 0.019125 0.9848
MA(3) 0.147705 0.150480 0.981560 0.3290
MA(4) -0.026096 0.104138 -0.250587 0.8027
R-squared 0.810495 Mean dependent var 0.905319 Adjusted R-squared 0.797426 S.D. dependent var 148.9924
S.E. of regression 67.05885 Akaike info criterion 11.32057
Sum squared resid 391229.3 Schwarz criterion 11.50996
Inverted AR Roots .88 -.24i .88+.24i .64 -.64i .64+.6
4i
.24 -.88i .24+.88i -.05
-.24+.88i
-.24 -.88i -.64 -.64i -.64 -.64i -.88
-.24i
-.88+.24i
Inverted MA Roots .99 .86+.49i .86 -.49i .8
1
.49+.86i .49 -.86i .29 .2
8
-.00 -.99i -.00+.99i -.39 -.49
-.86i
-.49+.86i -.86+.49i -.86 -.49i
-.99
选取P值>0.05,从P值最大的开始逐一剔除,中间省略一些方程式,最终得到在equation中输入
Ds ma(1) sma(12) sar(12),得
Dependent Variable: DS
Method: Least Squares
Date: 06/07/11 Time: 23:16
Sample(adjusted): 2002:02 2009:12
Included observations: 95 after adjusting endpoints
Convergence achieved after 13 iterations
Backcast: 2001:01 2002:01
Variable Coefficient Std. Error t-Statistic Prob.
AR(12) -0.330844 0.105382 -3.139481 0.0023
MA(1) -0.724908 0.084887 -8.539664 0.0000
R-squared 0.753418 Mean dependent var 1.601053 Adjusted R-squared 0.748058 S.D. dependent var 148.3528
S.E. of regression 74.46401 Akaike info criterion 11.48958
Sum squared resid 510129.8 Schwarz criterion 11.57023 Inverted AR Roots .88+.24i .88 -.24i .64+.64i .64
.24+.88i .24 -.88i -.24 -.88i
-.24+.88i
-.64+.64i -.64+.64i -.88+.24i -.88
-.24i
Inverted MA Roots .98 .85+.49i .85 -.49i .7
2
.49+.85i .49 -.85i -.00 -.98i
-.00+.98i
-.49 -.85i -.49+.85i -.85+.49i -.85
-.49i
-.98
此时,P值均小于0.05,符合条件。

同时记录
AIC=11.48958
SC=11.57023
②为了数据更为精确,将由图形中疑似数据进行再一次模型建设,在equation中输入
ds ar(1) ar(2) ma(1) ma(2) ma(3) ma(4) ma(5) sma(12) sar(12)
得:
Dependent Variable: DS
Method: Least Squares
Date: 06/07/11 Time: 23:25
Sample(adjusted): 2002:04 2009:12
Included observations: 93 after adjusting endpoints
Convergence achieved after 70 iterations
Backcast: 2000:11 2002:03
AR(1) 0.293644 0.095624 3.070821 0.0029
AR(2) -0.419469 0.100152 -4.188311 0.0001
SAR(12) -0.236898 0.095605 -2.477879 0.0152
MA(1) -1.406811 0.000173 -8150.078 0.0000
MA(2) 0.797688 0.120683 6.609776 0.0000
MA(3) -0.296827 0.205876 -1.441773 0.1531
MA(4) -0.017020 0.179322 -0.094913 0.9246
MA(5) -0.065769 0.089703 -0.733182 0.4655
SMA(12) -0.885809 0.083322 -10.63116 0.0000
R-squared 0.823526 Mean dependent var -0.769892 Adjusted R-squared 0.806719 S.D. dependent var 148.9072
S.E. of regression 65.46521 Akaike info criterion 11.29268 Sum squared resid 359998.2 Schwarz criterion 11.53777
Log likelihood -516.1096 Durbin-Watson stat 2.051307 Inverted AR Roots .86 -.23i .86+.23i .63+.63i .63
.23 -.86i .23+.86i .15+.63i .15
-.63i
-.23 -.86i -.23+.86i -.63 -.63i -.63
-.63i
-.86+.23i -.86 -.23i
Inverted MA Roots .99 .99 .86+.49i .86
-.49i
.49+.86i .49 -.86i .38 -.61i .38+.6
1i
-.00 -.99i -.00+.99i -.17 -.31i
-.17+.31i
-.49 -.86i -.49+.86i -.86+.49i -.86
-.49i
-.99
Ds ar(1) ar(2) ma(1) ma(2) sma(12)
得:
Dependent Variable: DS
Method: Least Squares
Date: 06/07/11 Time: 23:29
Sample(adjusted): 2001:04 2009:12
Included observations: 105 after adjusting endpoints
Convergence achieved after 14 iterations
Backcast: 2000:02 2001:03
Variable Coefficient Std. Error t-Statistic Prob.
AR(1) -0.535800 0.145167 -3.690912 0.0004
AR(2) -0.214145 0.083124 -2.576202 0.0115
MA(1) -0.458593 0.177958 -2.576969 0.0114
MA(2) -0.351618 0.173268 -2.029329 0.0451 SMA(12) -0.885820 0.000238 -3724.675 0.0000 R-squared 0.792895 Mean dependent var 0.695238 Adjusted R-squared 0.784611 S.D. dependent var 148.9217 S.E. of regression 69.11457 Akaike info criterion 11.35586 Sum squared resid 477682.4 Schwarz criterion 11.48224
Inverted AR Roots -.27+.38i -.27 -.38i
Inverted MA Roots .99 .87 .86+.49i .86
-.49i
.49+.86i .49 -.86i -.00 -.99i
-.00+.99i
-.41 -.49 -.86i -.49+.86i
-.86+.49i
AIC=11.35586 SC=11.48224
较之第一个模型的AIC和SC数值,第二个模型的AIC和SC数值来的要小,说明第二个模型比第一个模型要好。

(二)逐步添加法
为更好的选取模型,我又选用了另一种方法进行建模,在equation中先输入:ds c ar(1) ma(1) sar(12) sma(12)
得:
Dependent Variable: DS
Method: Least Squares
Date: 06/09/11 Time: 22:51
Sample(adjusted): 2002:03 2009:12
Included observations: 94 after adjusting endpoints
Convergence achieved after 10 iterations
Variable Coefficient Std. Error t-Statistic Prob.
C 0.551887 0.319299 1.728432 0.0874
AR(1) -0.092467 0.112576 -0.821372 0.4136
SAR(12) -0.327961 0.078565 -4.174410 0.0001
MA(1) -0.818161 0.092873 -8.809434 0.0000
R-squared 0.793696 Mean dependent var 0.905319
Adjusted R-squared 0.784424 S.D. dependent var 148.9924
S.E. of regression 69.17745 Akaike info criterion 11.36295
Sum squared resid 425911.3 Schwarz criterion 11.49823
Log likelihood -529.0587 F-statistic 85.60045
Durbin-Watson stat 2.163474 Prob(F-statistic) 0.000000
Inverted AR Roots .88+.24i .88 -.24i .64+.64i .64
-.64i
.24+.88i .24 -.88i -.09 -.24
-.88i
-.24+.88i -.64+.64i -.64+.64i
-.88+.24i
-.88 -.24i
Inverted MA Roots .99 .86+.49i .86 -.49i .8
2
.49+.86i .49 -.86i -.00 -.99i
-.00+.99i
-.49 -.86i -.49+.86i -.86+.49i -.86
-.49i
-.99
观察自偏相关图,并进行逐个添加因子,中间省略许多拟合建模方程,得到
最终最优方程为:
Equation中输入为DS AR(1) AR(2) MA(1) SAR(12) SMA(12) SMA(24) Dependent Variable: DS
Method: Least Squares
Date: 06/08/11 Time: 19:36
Sample(adjusted): 2002:04 2009:12
Included observations: 93 after adjusting endpoints
Convergence achieved after 18 iterations
Backcast: 2000:03 2002:03
Variable Coefficient Std. Error t-Statistic Prob.
AR(1) -0.282376 0.102778 -2.747431 0.0073
AR(2) -0.213553 0.092065 -2.319589 0.0227
SAR(12) -0.368128 0.083206 -4.424277 0.0000
MA(1) -0.736814 0.074971 -9.828027 0.0000
SMA(12) -0.659630 0.000438 -1507.547 0.0000
SMA(24) -0.200378 0.089276 -2.244465 0.0273
R-squared 0.801883 Mean dependent var -0.769892 Adjusted R-squared 0.790497 S.D. dependent var 148.9072
S.E. of regression 68.15707 Akaike info criterion 11.34385
Sum squared resid 404148.6 Schwarz criterion 11.50724
Log likelihood -521.4889 Durbin-Watson stat 2.065084
Inverted AR Roots .89+.24i .89 -.24i .65+.65i .65
-.65i
.24+.89i .24 -.89i -.14 -.44i
-.14+.44i
-.24 -.89i -.24+.89i -.65+.65i
-.65+.65i
-.89+.24i -.89 -.24i
Inverted MA Roots .99 .86+.49i .86 -.49i .85
-.23i
.85+.23i .74 .62+.62i .62+.6
2i
.49 -.86i .49+.86i .23 -.85i .23+.8
5i
.00 -.99i -.00+.99i -.23 -.85i
-.23+.85i
-.49 -.86i -.49+.86i -.62 -.62i
-.62+.62i
-.85+.23i -.85 -.23i -.86+.49i -.86
-.49i
在各系数P值都通过检验的情况下,比较两种方法最终三个方程的AIC和
法比逐步添加法来的更实用,更精确。

(四)最终模型确立
写出方程如下:
1+MA(1)1+SMA(12)+SMA(24)
(1-B)(1-B4)Xt=C+─────────*───────────*εt
1-AR(1)-AR(2) 1—SAR(12)
引入数据,方程的具体模型为:
1—0.736814 1—0.659630—0.200378
(1-B)(1-B4)Xt=C+───────────*─────────────*εt
1+0.282376+0.213553 1+0.368128

(1-B)(1-B4)Xt=0.01798εt
六、模型检验
1、残差自相关检验
检验原理:确定模型拟合好之后,我们要对该模型的拟合效果进行检验。

如果残差序列显示出纯随机的性质,即E(εt,εt-j)=0,дj≥1
就说明确定性模型拟合得非常好,已经能够充分提取序列中的相关信息了,我们不需要再对残差序列进行二次信息提取了,即分析结束。

反之,如果残差序列显示出显著的自相关性,即E(εt,εt-j)≠0,дЗj≥1
那就说明确定性模型拟合得不够精确,序列中的相关信息没有得到充分提取,我们应该对残差序列再次拟合,提取其中残存的相关信息,以提高模型拟合的精度。

由此,进行模型的残差自相关性检验,观察图四如下:
Date: 06/11/11 Time: 10:05
Sample: 2002:04 2009:12
Included observations: 93
Q-statistic
probabilities
adjusted for 6
ARMA term(s)
Autocorrelation Partial Correlation AC PAC Q-Stat Prob
. | . | . | . | 1 0.022 0.022 0.0482
. | . | . | . | 2 -0.004 -0.005 0.0498
. | . | . | . | 3 0.048 0.048 0.2753
. | . | . | . | 4 -0.011 -0.014 0.2881
. | . | . | . | 5 -0.008 -0.007 0.2940
. | . | . | . | 6 -0.046 -0.048 0.5092
. | . | . | . | 7 0.007 0.010 0.5139 0.473
. | . | . | . | 8 -0.010 -0.011 0.5247 0.769
. | . | . | . | 9 -0.041 -0.036 0.7034 0.872
. | . | . | . | 10 -0.036 -0.037 0.8412 0.933
. |*. | . |*. | 11 0.139 0.142 2.9251 0.712
. |*. | . |*. | 12 0.180 0.179 6.4677 0.373
. |** | . |** | 13 0.202 0.214 10.971 0.140
. | . | . | . | 14 0.054 0.049 11.300 0.185
. | . | .*| . | 15 -0.052 -0.071 11.607 0.236
. | . | . | . | 16 -0.024 -0.055 11.671 0.308
. | . | . | . | 17 -0.028 -0.027 11.762 0.382
. | . | . | . | 18 -0.025 -0.011 11.837 0.459
. | . | . | . | 19 -0.022 -0.006 11.894 0.536
. | . | . | . | 20 -0.027 -0.014 11.983 0.608
. | . | . | . | 21 -0.032 -0.007 12.111 0.671
. | . | . | . | 22 -0.045 -0.034 12.368 0.718
. | . | . | . | 23 0.000 -0.034 12.368 0.777
. |*. | . | . | 24 0.112 0.024 13.974 0.731
. | . | .*| . | 25 0.009 -0.087 13.985 0.785
. | . | .*| . | 26 -0.007 -0.064 13.992 0.831
. | . | . | . | 27 -0.015 -0.025 14.022 0.869
. | . | . | . | 28 -0.031 0.010 14.149 0.896
. | . | . | . | 29 -0.024 0.014 14.231 0.920
. | . | . | . | 30 0.001 0.032 14.231 0.941
. | . | . | . | 31 -0.034 -0.027 14.395 0.954
. | . | . | . | 32 -0.016 -0.006 14.432 0.967
. | . | . | . | 33 -0.028 -0.006 14.549 0.975
. | . | . | . | 34 -0.023 0.008 14.632 0.982
. | . | . | . | 35 0.019 0.018 14.688 0.987
. | . | . | . | 36 0.003 -0.005 14.690 0.991
得知,此模型拟合的非常好,且P值均通过了检验。

2.异方差自相关性检验
通常,我们对残差序列有一个重要的假定——残差序列{εt}为零均值白噪声序列。

换言之,残差序列要满足如下三个假定条件。

㈠零均值E{εt}=0;
㈡纯随机性Cov(εt,εt-i)=0,дj≥1;
㈢方差齐性
V ar(εt)=σt2;
如果方差齐性假定不成立,即随机误差序列的方差不再是常数了,它会随着时间的变化而变化,可以表示为时间的某个函数:V ar(εt)=h(t) 这种情况被称作异方差。

在残差序列的这三个假定中,零均值假定最容易实现,只要对序列进行中心化处理就可以实现。

所以这个假定通常无需检验。

纯随机假定一直是我们重点监控的对象。

如果这个假定不满足就说明残差序列中还蕴含着值得提取的自相关信息。

为了有效检验这个假定条件是否成立,统计学家们构造了许多适用于不同场合的自相关检验统计量,比如说Q统计量、LB统计量、DW统计量等,为此我们先进行纯随机性检验,
Q—statistics检验
Date: 06/09/11 Time: 23:31
Sample: 2002:04 2009:12
Included observations: 93
Q-statistic
probabilities
adjusted for 6
Autocorrelation Partial Correlation AC PAC Q-Stat Prob
. | . | . | . | 1 -0.040 -0.040 0.1516
.*| . | .*| . | 2 -0.080 -0.081 0.7692
. | . | . | . | 3 -0.039 -0.046 0.9156
. | . | . | . | 4 0.016 0.005 0.9398
. | . | . | . | 5 -0.034 -0.040 1.0552
.*| . | .*| . | 6 -0.058 -0.062 1.3933
. | . | .*| . | 7 -0.050 -0.062 1.6535 0.198
.*| . | .*| . | 8 -0.108 -0.129 2.8592 0.239
. | . | . | . | 9 -0.020 -0.050 2.9029 0.407
. |*. | . |*. | 10 0.162 0.136 5.7113 0.222
. |*. | . |*. | 11 0.148 0.153 8.0864 0.152
**| . | .*| . | 12 -0.206 -0.186 12.721 0.048
**| . | **| . | 13 -0.212 -0.245 17.706 0.013
. | . | . | . | 14 0.026 -0.050 17.780 0.023
. | . | . | . | 15 0.030 -0.009 17.882 0.037
.*| . | . | . | 16 -0.059 -0.055 18.280 0.050
. | . | . | . | 17 -0.007 -0.003 18.286 0.075
. | . | . | . | 18 0.009 0.002 18.296 0.107
. | . | . | . | 19 0.047 0.027 18.564 0.137
. | . | . | . | 20 0.062 -0.025 19.036 0.164
. | . | .*| . | 21 0.030 -0.088 19.146 0.207
. | . | . | . | 22 -0.030 -0.023 19.256 0.256
. |*. | . |** | 23 0.083 0.234 20.132 0.268
**| . | **| . | 24 -0.201 -0.193 25.291 0.117
. |*. | . | . | 25 0.165 0.063 28.819 0.069 . | . | . | . | 26 -0.017 -0.047 28.859 0.091 . | . | . |*. | 27 0.037 0.087 29.040 0.113 . | . | . | . | 28 0.001 -0.001 29.040 0.144 . | . | . | . | 29 0.008 -0.041 29.048 0.179 . |*. | . |*. | 30 0.105 0.122 30.599 0.166 . | . | . |*. | 31 0.019 0.109 30.648 0.201 . | . | . | . | 32 -0.030 -0.015 30.780 0.237 . | . | . | . | 33 0.061 0.054 31.327 0.258 . | . | . | . | 34 -0.022 0.009 31.401 0.300 .*| . | . | . | 35 -0.079 0.054 32.350 0.305 .*| . |
.*| . |
36 -0.099 -0.171 33.874 0.286
显然,此模型通过了纯随机检验。

只有第三个假定——方差齐性假定,在此之前我们没有进行任何检验。

在缺省检验的情况下就默认残差序列一定满足这个条件。

但实际上,这个假定条件并不总是满足。

忽视异方差的存在会导致残差的方差被严重低估,继而参数显著性检验容易犯纳伪错误错误,这使得参数的显著性检验失去意义,最终导致模型的拟合精度受影响。

所以为了提高模型拟合的精度,我们需要对残差序列进行方差齐性检验,并且对异方差序列进行深入分析。

①直观图
-200
0200
400-1000
-5000
50010000
000000
②拉格朗日乘子检验(LM 检验)
Breusch-Godfrey Serial Correlation LM Test: F-statistic 4.186837 Probability 0.018440
Test Equation:
Dependent Variable: RESID
Method: Least Squares Date: 06/09/11 Time: 23:37
Variable Coefficient Std. Error t-Statistic Prob. AR(1) 0.174479 0.279209 0.624904 0.5337 AR(2) -0.039364 0.183359 -0.214683 0.8305 SAR(12) -0.088927 0.081841 -1.086587 0.2803 MA(1) -0.147635 0.154142 -0.957781 0.3409 SMA(12) 0.000999 0.000468 2.133884 0.0357 SMA(24) -0.178592 0.086835 -2.056677 0.0428 RESID(-1) -0.089218 0.311310 -0.286590 0.7751 RESID(-2) 0.088609
0.308839
0.286909
0.7749
R-squared
0.083512 Mean dependent var -5.407739 Adjusted R-squared 0.008036 S.D. dependent var 66.05572 S.E. of regression 65.78976 Akaike info criterion 11.29290 Sum squared resid 367904.9 Schwarz criterion 11.51076
由残差的直观图进行诊断,当残差序列{εt}方差齐性时,它应该在零值附近随机波动,不带任何趋势,否则就显示出异方差的性质了。

故此,我们由图可以得出此模型显然通过了检验,即不具有异方差性,而且拟合程度很好。

七、数据预测
对数据进行建模及通过检验后,我们进行对数据的预测,预测镇江市2010年一年的月降雨量。

首先我们在eview 中将时间范围改至2010年12月,分别进行动态和静态预测,得:
上图为动态预测,下图为静态预测
-400
-200
200
400
03
04
05
0607
0809
10
-800
-400
400
800
03
04
05
060708
09
10
并且我们分别得到ds 和x 的2010年1月份到12月份的动/静态预测值:
动态DS 预测值 静态ds 预测值 静态x 预测值
-0.493637314 -0.49363731 68.83049955 -76.53306115 -76.5330611 68.921681 54.18974769 54.18974769 68.88238655 44.91990616 44.91990616 68.70493976 -30.449067 -30.449067 68.58135434 -116.3000411 -116.300041 68.44528729 115.4517782 115.4517782 69.94881429 -37.36810603 -37.368106 69.89505087 -54.35456219 -54.3545622 69.25347684 116.378242 116.378242 68.97962255 -116.9902465 -116.990246 69.64402776 51.77697908 51.77697908 70.00026257
八、总结
查看预测数据,得知预测的数据挺集中的,但总体预测数值除个别省份外,其它均与现实意思差距不大,并查询统计年鉴2010,对其中的镇江市2010年数据进行比较分析得,预测的数据在平均水平上相对来说还是比较准确的,可见模型建立的有效性。

通过《时间序列》课程的学习及相关软件Eviews 的操作,我对时间序列的建模知识理解的更加深刻了,我了解到时间序列分析是一个关于动态数据的处理统计方法,是用于解决实际性的现实问题。

时间序列分析就是用已有的数据,运用统计学的方法加以处理,预测未来事物的发展,这种方法简单、有效、实际。

相关文档
最新文档