应用时间序列分析论文_应用统计18_陈叮_5061214012

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用时间序列分析

大作业

*名:**

学号: **********

专业班级:应用统计18

院系:信息工程学院数学系

时间: 2017/5/22

题目:对苏格兰异性结婚数据的时序分析

摘要:

本文以苏格兰1855年至2015年异性结婚数据为研究对象,首先运用R软件对1855-2010年的结婚数据绘制时序图、自相关图和做差分进行相关分析,得出一阶差分后的数据是趋于平稳的,然后根据主观确定拟合模型为)2(

MA,并运用R软件里面的()

ARIMA模型即auto函数进行模型的自动选择,得出)2,1,0(

.arima

MA是最优的,最后运用)2(

MA模MA模型最优,故我们所选择的拟合模型)2(

)2(

型预测并进行预测残差检验,得出了苏格兰2011-2015年异性结婚数据的预测值(29200.45,28905.94,28905.94,28905.94,28905.94)与实际值(29135,30534,27547,28702,28020)相比,相差不大,这说明模型拟合较好,能反映数据的真实水平,而且残差检验也表明预测残差是平均值为0且方差为常数的正态分

MA模型是可以提供非常合适布(服从零均值、方差不变的正态分布),这进一步说明)2(

预测的模型。

关键词:苏格兰;()

arima函数;auto.()

arima函数;R软件;预测

二、数据来源

本文的数据是1855-2015年苏格兰的结婚数据(Marriages, Scotland, 1855 to 2015 ),数据可以从网上(https:///statistics-and-data/statistics/statistics-by-theme/vital-events/marriages-and-ci vil-partnerships/marriages-time-series-data)下载,数据见附件一。

三、模型的定阶与确定

3.1模型的定阶

3.1.1序列预处理[1]

首先,我们对苏格兰1855年至2010年的时间序列进行时序图和自相关分析,分析结果如图3.1.1.1和图3.1.1.2所示,程序见附录一。

1855-2010年苏格兰结婚数据的时序图

时间

结婚数据

18501900

19502000

2000035000

5000

图3.1.1.1 苏格兰1855年至2010年异性结婚数据的时序图

05101520

-0.20.20.61.0

Lag

A C F

Series dataseries

图3.1.1.2 苏格兰1855年至2010年异性结婚数据的自相关图

图 3.1.1.1显示苏格兰的结婚数值的均值和方差变动很大,随着时间的增加,具有明显的上升趋势,是典型的非平稳序列。

图3.1.1.2显示该序列的自相关系数都超出了两倍标准误差,所以进一步证明了该序列是非平稳的。

综上所述,该序列是非平稳序列。 对于该非平稳时间序列,首先我们对数据进行1阶差分处理,以便消除其具

有的强烈的趋势性,来观察数据是否大致趋于平稳。因此得到的1阶差分时间序列图如下:

1855-2010年苏格兰一阶差分结婚数据的时序图

时间

一阶差分数据

1850

1900

19502000

-100000500

图3.1.1.3 苏格兰1855年至2010年异性结婚数据1阶差分后的时序图

从图3.1.1.3中我们可以看出,经过1阶差分后,该序列的平均值和方差是大致平稳的,所以我们使用ARMIA(p,1,d)模型是很合适的。通过一阶差分,我们去除了结婚数据的趋势部分,剩下了不规则部分。接下来我们可以检验不规则部分中邻项数数值是否具有相关性;如果有的话,可以帮助我们建立一个预测模型来预测苏格兰异性结婚数据的数值趋势。

3.1.2平稳性检验

由图3.1.1.3可以认为该序列一阶差分后,序列基本平稳,为了进一步判断其平稳性,考察差分序列的自相关图和偏自相关图,如图五和图六所示。

图3.1.2.1自相关图显示延迟2阶、3阶、4阶和5阶时的自相关值超出了2倍标准差范围,但是其他在延迟1-25阶的自相关系数都落入2倍标准差范围以内,从而判断该序列有很强的短期相关性,是2阶截尾,所以可以初步认为1阶差分后序列平稳。

图3.1.2.2偏自相关图显示,在延迟2阶和4阶时的偏自相关系数超出了2倍标准差范围,从lag4之后缩小至0,是4阶截尾,该序列趋于平稳。

综上所述,我们可以认为该序列的一阶差分序列自相关图2阶截尾和偏自相关图4阶截尾。

0510

152025

-0.20.20.61.0

Lag

A C F

Series dataseriesdiff1

图3.1.2.1 该序列一阶差分后的自相关图

510

152025

-0.3-0.10.1

Lag

P a r t i a l A C F

Series dataseriesdiff1

图3.1.2.2 该序列一阶差分后的偏自相关图

3.1.3纯随机性检验

为了判断序列是否有分析价值,必须对序列进行纯随机性检验,即白噪声检验。如表3.1.3.1所示,P 值远远小于0.05的临界值,因此,拒绝原假设,即可以认定1阶差分后的序列是平稳非白噪声序列,需要建立模型来拟合该序列的变化趋势。

表3.1.3.1 纯随机性检验

代码

Box.test(dataseriesdiff1,type="Ljung-Box",lag=30); Box-Ljung test

Data: Dataseriesdiff1 X-squared=83.411 Df=30 P-value=6.313e-07

3.2模型确定

3.2.1根据阶数确定模型

由该序列一阶差分的自相关图和偏自相关图,知道自相关值在滞后2阶之后

为0,且偏自相关值在滞后4阶之后缩小至0,那么意味着接下来的ARIMA 模型对于一阶时间序列有如下性质:

1、(4,0)ARMA 模型:即偏自相关值在滞后4阶之后缩小至0且自相关值缩小至0,则是一个阶层p=4自回归模型。

2、(0,2)ARMA 模型:即自相关图在滞后2阶之后为0且偏自相关图缩小至0,则是一个阶数q=2的移动平均模型。

3、(p,)ARMA q 模型:即自相关图和偏自相关都缩小至0,则是一个具有p 和q 大于0的混合模型。

接下来我们利用简单的原则来确定哪个模型是最好的:即我们认为具有最少参数

的模型是最好的。(4,0)ARMA 有4个参数,(0,2)ARMA 有2个参数,而(,)

ARMA p q

相关文档
最新文档