eviews 时间序列模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

成都空气污染指数API的建模与预测
20085728 刘童超
【目录】
1..数据来源与数据预处理 (2)
1.1数据来源 (2)
1.2离群点和缺失值的检验..................................................................... 错误!未定义书签。

2.直观分析和相关分析 (4)
2.1直观分析和特征分析 (4)
2.2相关分析 (6)
2.3平稳性检验 (7)
3.liu(t)序列的零均值处理 (8)
3.1数据的零均值化 (8)
3.2零均值过程的检验 (8)
4.模型的识别和初步定阶 (8)
5.模型的参数估计 (9)
6.模型的检验 (10)
6.1参数的显著性检验 (10)
6.2模型的适用性检验 (11)
7.模型的预测 (12)
7.1对序列liu1(t)的预测 (12)
7.2对序列liu(t)的预测 (12)
【附录及参考文献】 (13)
附录1.零均值化处理后的数据 (13)
参考文献: (14)
1..数据来源与数据预处理
1.1数据来源
原始数据见附件,我们需要的数据见下表:
此处一共160个数据,其中1~150用来建立模型,我们称为样本,151~160用来检验预测值与真实值的误差,我们成为检验值。

其中的时间的意义是:t=1代表日期2010-5-30,t=2代表日期2010-5-31,t=3代表日期2010-6-1,以此类推,t=160代表日期2010-11-4。

数据中的API 为空气污染指数,我国目前采用的空气污染指数(API )分为五个等级,API ≤50,说明空气质量为优,相当于国家空气质量一级标小准;50<API ≤100,表明空气质量良好,相当于达到国家质量二级标准;100<API ≤200,表明空气质量为轻度污染,相当于国家空气质量三级标准;200<API ≤300表明空气质量差,称之为中度污染,为国家空气质量四级标准;API>300表明空气质量极差,已严重污染。

由SPSS 分析出来的结果见表1-2
由表1-2可以看出,数据个数为150个,没有缺失值。

t X =66.41,t S =18.07 数值与平均值的距离见图1-1
图1- 1
由图1-1可以看出,对任意时间t ,t 1t X X +-都在-t S 与t S 之间,所以我们可以得
出结论,该数据没有离群点。

综上所述,需要建模的数据正常——既没有离群点,也没有缺失值。

2.直观分析和相关分析
2.1直观分析和特征分析
在eviews软件中,我们将该数据命名为liu(t)。

用eviews画出的折线图如图2-1
图2- 1
通过eviews画出的柱状统计图见图2-2
X=66.4,中位数为64,最大值为116,由以上图表可以看出:样本liu(t)的均值
t
S=18.69,偏度为0.24,峰度为2.54,由于相伴概率最小值为28,样本标准差
t
为0.256,大于0.05,所以我们接受数据服从正态分布的假设,故认为原数据是正态分布数据。

检验样本是否服从正态分布也可以用用P-P图和Q-Q图来检验,SPSS做出
的PP图见图2-3
P-P图基本是一条直线,说明它的分布对称,服从正态分布,进一步验证了以上的结论。

2.2相关分析
在eviews中作出自相关系数和偏相关系数图,结果见图2-4
自相关系数图和偏相关系数图两侧的虚线之心水平α=0.05的置信带,称为barlett线,意思是如果系数落在barlett线内,我们可以认为该系数等于零。

由图2-4可以看出,两阶以后的自相关系数和偏相关系数基本都落在barlett 线内,所以我们可以认为该数据平稳,为了进一步说明这个问题,我们在进行一次单位根检验以验证该数据的平稳性。

2.3平稳性检验
在eviews中执行view→Unite root test.检验结果如图2-5
图2- 5
由上图可以得知,t统计量的值时-6.95,小于显著性水平下的临界值,拒绝
原假设,也就是说序列liu(t)不存在单位根,该系统是平稳的,进一步验证了2.2的结果,也证明由图2-1推断出来的季节性是不存在的。

由上图知,其中的检验式为:liu()0.4898(1)32.31t liu t ∆=--+ (2-1) 3.liu(t)序列的零均值处理 3.1数据的零均值化
对于均值非零的数据,一般有两种处理方法,一是建立非中心化的ARMA 模型,将序列的均值作为一个参数估计,但是需要估计的参数要比中心化的ARMA 模型多一个,于是在这里我们采用另一种方法,用样本均值t X 作为样本均值u 的估计,即零均值处理,下面是具体过过程。

新序列liu1(t)=liu(t)-t X =liu(t)-66.4。

零均值化后的序列数据见附录1. 3.2零均值过程的检验
在对liu (1)序列执行命令“view →Descriptive Statistics →Histogram and Stats ”得到柱状统计图,结果见图3-1
图3- 1
因为时间序列liu(1)的均值t X 为-0.165,标准差t S 为18,样本均值t X 落在0±2t S 当中,所以我们接受均值为0的原假设,表明序列liu(1)已经是一个零均值序列。

4.模型的识别和初步定阶
时间序列liu1(t)的自相关系数和偏相关系数见图4-1
由上图可以看到,样本的自相关系数1ρ较大,而其余的自相关系数都落在barlett 线以内,而且
11
2222
11221
2)20.518)0.20242)0.2024(2)
k k ρρρ+=+⨯≈<
+=≥(4-1)
当k>1时,自相关函数都落在该范围内,所以时间序列liu1(t)在1步后是截尾的,因此可以用MA (1)模型进行拟合。

对于偏相关系数,我们也可以看出,只有11ϕ较大,其余都很小,且大于一阶
的样本偏相关系数几乎都满足0.1633kk ϕ≤
=≈,虽然16,16ϕ为-0.166,其绝对值略大于0.1633,但由于简约性原则,我们仍然认为其偏相关系数在一
步之后截尾的,因此可以用AR (1)来对数据拟合。

根据Box-Jenkins 建模方法,一般初步设定的模型是ARMA(n ,n-1),即自回归的阶数比移动平均的阶数高一阶,于是这里我们将初步模型定为ARMA (2,1)。

5.模型的参数估计
参数的估计一般有三种方法:矩估计;最小二乘估计;极大似然估计。

但是由于矩估计太简单,精度低,只实用于做初估计,而极大似然估计计算量非常大,特别是对于ARMA 模型,似然函数公式十分复杂,所以我们这里采用最小二乘估计。

利用eviews 软件可以得到各个模型中的参数的最小二乘估计和剩余平方和和AIC 值,ARMA(2,1)模型结果如表5-1
AR (2)模型最恰当。

6.模型的检验
6.1参数的显著性检验
该模型参数检验的目的是看是否有系数显著为零。

在eviews 命令窗口中输入“ls liu1 ar(1) ar(2)”便得到参数检验的结果,详细结果见图6-1
图6- 1
由2ϕ的相伴概率可以看出,我们应该接受2ϕ=0的原假设,令2ϕ=0,继续用AR(1)拟合数据,参数检验的结果如图6-2
图6- 2
由相伴概率和单位根可以看到,利用AR(1)模型对序列liu1(t)进行拟合比较恰当。

6.2模型的适用性检验
对AR (1)进行适用性检验,残差序列的样本自相关系数如图6-3
图6- 3
从自相关系数值可以看出,几乎所有0.160(1)
k k ρ<
=≥ (6-1)
但13ρ=-0.167,170.177ρ=,28ρ=0.25不满足式子6-1,这说明序列liu1(t)中还有少量的自相关信息没有被提出出来,这也是该模型的不足。

由图6-2所得到的系数可知,时间序列liu1(t)的模型为:
liu1(t)=ε
(t)+0.517850⨯liu1(t-1) (6-2)
原序列liu(t)的模型为:
liu(t)=liu1(t) +66.41 (6-3)
7.模型的预测
7.1对序列liu1(t)的预测
对于t=151到160的数据,利用差分形式进行预测时间序列liu1(t),即:liu1(t)=0.517850 liu1(t-1) (t=151,152……160)
其预测值见表7-1
对原始时间序列liu(t)的预测采用公式6-3
即:liu(t)=liu1(t) +66.41
其详细值见表7-2
残差图如下:
图7- 1
由残差图可见,该模型不是非常的拟合原数据,其实,这种结果其实在8.2进行使用性检验时就应该预料到,还有,在四步预测之后,预测数据就趋于一个定值,这与实际情况已经矛盾了,所以该模型不能用来做长期预测。

不过由于API的划分是[0,50]为一级空气的标准,(50,100]为二级空气的标准,所以预测的空气质量等级并没有改变,这也是该模型的可取之处。

【附录及参考文献】
附录1.零均值化处理后的数据
参考文献:
[1]王沁.时间序列分析及其应用.四川.西南交通大学出版社.2008
[2]潘红宇.时间序列分析.北京.对外经济大学出版社.2006
[3]王振龙.应用时间序列分析.北京.科学出版社.2007。

相关文档
最新文档