以数学建模竞赛为例基于spss建立arima模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

20201/295徐

1981要/数理统计学专业副教授/博士/广州民航职业技术学院人文社科
学院/南方医科大学访问学者/从事统计学方法和应用研究工作(广州510403)
以数学建模竞赛为例基于SPSS 建立ARIMA 模型
Combined with learning pass and BOPPPS model to improve the teaching effect of electrical science


基金项目:
2019年高等学校中青年教师国内访问学者项目资助。



SPSS 软件是当前应用最广泛的统计软件之一,其菜单化操作模式能够让使用者快速入门,SPSS 软件中时间序列模块能够实现模型的自动化筛选,参数估计和模型检验,是非统计学专业人员进行数据分析的有力工具。

是本文以2019年全国大学生数学建模竞赛D 题为例,以SPSS23软件为工具,对数据进行时间序列分析,建立ARIMA 模型。

关键词
数学建模;SPSS;时间序列;ARIMA 模型
中图分类号:R058
文献标识码:A
DOI :10.19694/ki.issn2095-2457.2020.01.16
0引言
SPSS 软件是当前世界上应用最广泛的统计软件之一,菜单化操作、图表化输出的特点特别受到非统计学专业人员的欢迎。

使用SPSS 软件,我们几乎可以完全自动的自变量的预变换、筛选、模型优化、检验等工作。

SPSS 软件中的预测模块,纳入了常用的时间序列分析模型,如ARIMA 模型,包括自动的模型选择、参数估计和模型检验等功能,实现了简单操作即可得到可靠的时间序列模型,其功能得到了使用者的肯定。

近年来,全国大学生数学建模竞赛频频出现大数据统计建模试题,作为非统计学专业的大学生,对于复杂的数据统计分析方法和工具接触并不很多,如何让这些学生快速入门和掌握一门有利的数据分析软件工具、完成数据分析和建模等任务就是我们近几年来数学建模培训教学研究的重点。

本文以2019年全国大学生数学建模竞赛D 题为例,竞赛提供的数据是由空气监测
仪每间隔2分钟记录下来的空气污染物浓度监测数据,呈现明显的时间序列数据的特征,因此,我们考虑对其进行时间序列分析,建立ARIMA 模型,并对模型进行检验。

我们以竞赛提供的数据为例,利用SPSS23完成数据建模和分析。

1SPSS23数据建模和分析1.1建立数据文件
首先,我们在SPSS23中导入竞赛提供的Excel 数据文件,“文件”→“打开”→“数据”。

在弹出的“打开Excel 数据源”对话框中,“工作表”下面选择数据文件,单击“确定”,如图1。

我们需要对导入的数据做基本的检查,比如变量的定义、是否有缺失、数据的类型和分布特征等。

由于竞赛提供的数据量大,我们采用人工检查与SPSS 检查相结合的方式:人工查看“数据视图”和“变量视图”,查看数据和变量;SPSS 软件“分析”→“统计描述”→“描述”,查看数据情况。

1.2数据预处理
在做时间序列分析之前,我们需要对数据进行预处理,即定义数据的日期:“数据”→
50
S c ie nc e &T e c hno lo g y V is io n “定义日期”,在“定义日期”对话框中设置日期的格式。

确定了日期格式后,SPSS 数据表格的“数据视图”中可以看到新插入的变量“Year”、“Month”、“Date”。

1.3时间序列建模
首先,我们检验数据的时间序列特征,进行自相关检验(以数据中的PM2.5为例,下同):“分析”→“预测”→“自相关”,在“自相关”对话框中,将“PM2.15”选入“变量”列表框中,单击“确认”按钮,如图2。

自相关分析结果显示PM2.5具有强自相关性,下一步可以作为时间序列进行分析。

我们将非平稳时间序列经过差分转化为平稳时间序列,然后将因变量对于它的滞后值以及随机误差项进行回归建立ARIMA(p,d,q)模型,称为差分自回归移动平均模型,其中的AR 是自回归,p 为自回归项数;MA 是移动平均,q 是移动平均项数;d 是差分次数。

ARIMA 模型的操作过程:“分析”→“预测”→“创建模型”,在“时间序列建模器”对话框中,将“PM2.5”选入“因变量”列表框中,将“温度”、“湿度”、“风速”、“压强”、“降水量”选入“自变量”列表框中,“方法(M)”下拉列表中选择“ARIMA”,如图3。

其他一些设置主要有:“Statistics”中选择“平稳的R 方”、“拟合优度”“显示预测值”,如图4;“图”中选择“观察值”,如图5;“保存”
中选择“预测值———保存”,如图6。

单击“确认”。

1.4结果分析
SPSS 输出了模型的描述,给出了R 方、平稳的R 方、正态化的BIC 等指标,我们选择R 方较大、BIC 较小的模型。

下一步还应当结合专业背景,将分析结果应用到实际中去检验其实用价值,讨论实际应用中存在的问题。

2总结
SPSS 软件菜单化操作、图表化输出的特点让非统计学专业人员能够快速地掌握数据的统计建模和分析能力,易于理解和应用。

我们以2019年大学生数学建模D 题为例,利用SPSS23进行时间序列分析,建立了ARIMA 模型,模型检验显示拟合效果好。

参考文献
[1]张文彤.SPSS 统计分析高级教程(第3版)[M].北京:高等教育出版社,2018.[2]武松,潘发明.SPSS 统计分析大全[M].北京:清华大学出版社,2014.
[3]孙祝岭.时间序列与多元统计分析[M],上海:上海交通大学大学出版社,2016.9.[4]熊斯,柏文,陈远.SAS 软件在变形监测数据分析中的应用[J]河南科技,2010(06):20-21.
图1打开Excel 数据源图2自相关检验
图3时间序列建模器图4“Statistics ”对话框
图5“图”对话框图6“保存”对话

51。

相关文档
最新文档