以ARIMA模型预测全国生产安全事故
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
以ARIMA模型预测全国生产安全事故
崔伟杰
【摘要】本文根据2000~2015年全国各类生产安全事故死亡人数统计数据,建立ARIMA(1,1,0)模型,并对2020年全国各类生产安全事故死亡人数进行了预测,预测结果表明,ARIMA(1,1,0)模型预测值与全国安全生产"十三五"规划中规划目标值的相对误差为1.4%,建立的模型预测精度较高,预测结果可为安全生产管理决策提供科学依据.
【期刊名称】《安全》
【年(卷),期】2017(038)006
【总页数】3页(P27-28,31)
【关键词】ARIMA;时间序列;安全生产预测;SPSS
【作者】崔伟杰
【作者单位】国家安全生产监督管理总局研究中心
【正文语种】中文
预测是决策的基础,安全生产预测的目的是通过研究安全生产规律特点,对未来一段时间的安全生产状况进行预测,为政府和企业安全管理决策提供科学依据。
安全生产定性预测主要是基于人的主观意识,即人的观察分析能力、经验判断能力和逻辑推理能力;安全生产定量预测主要是基于大量安全生产统计数据、现代数学方法和先进计算机技术,通过建立数学模型揭示安全生产状况随时间变化的规律,从而对未来安全生产状况作出预测。
安全生产预测结果可用于分析研判未来安全生产发
展趋势,为制定安全生产中长期规划目标、年度安全生产控制指标和安全管理措施提供重要决策依据。
20世纪70年代后期,美国人Box和英国人Jenkins提出了差分自回归移动平均模型(ARIMA),它是一种预测精度较高的时间序列预测方法[1]。
ARIMA模型是把研究对象随时间变化而产生的数据作为一个随机数据序列,这些数据能用一定的数学模型进行描述,若这个数学模型被认为可以反映数据特征和规律,那么就可以以过去和现在的数据为依据,对未来可能出现的变化进行预测。
ARIMA模型包含了自回归AR(p)模型、移动平均MA(q)模型和自回归移动平均ARMA(p,q)模型[2]。
如果一个非平稳的时间序列经过d阶差分后转化为平稳的ARMA模型,则称原时间序列为差分自回归移动平均模型,记为ARIMA (p,d,q)模型[3]。
建立ARIMA(p,d,q)模型的基本步骤如下:
(1)数据预处理和检验。
对时间序列进行平稳性检验,如果序列为平稳序列,建立ARIMA模型;若序列是非平稳的,需要对原始数据进行预处理,并使处理后的时间序列通过平稳性和非白噪声检验。
(2)ARIMA模型阶数的确定。
首先通过自相关系数图和偏自相关系数图初步判定p、q的值,然后取不同的p、q值,尝试建立多个模型,通过多项评价指标(平稳的R方等)的对比分析,确定ARIMA模型中p、q的阶数[4]。
(3)模型检验。
对建立的ARIMA模型参数和残差序列的随机性进行检验,确定最适合的模型。
(4)预测。
利用所建立的模型对未来变化趋势进行预测分析。
2.1 数据预处理和检验
2.1.1 平稳性检验
建立2000~2015年全国各类生产安全事故死亡人数时间序列,利用SPSS软件
进行分析发现,2000~2015年全国各类生产安全事故死亡人数整体呈下降趋势,因此可认为全国各类生产安全事故死亡人数时间序列原始数据是非平稳的,不能直接利用原始数据来建立ARIMA模型,需要对原始数据进行差分后进一步分析。
2.1.2 数据预处理
将全国各类生产安全事故死亡人数时间序列原始数据进行一阶差分得到一阶差分序列,由一阶差分序列的ACF图和PACF图(如图1)可见,一阶差分后的时间序
列基本达到平稳,同时一阶差分序列的自相关和偏自相关图没有全部都在置信区间内,一阶差分序列也不是纯随机序列,经过一阶差分后的时间序列满足ARIMA模型建模需要。
2.2 模型阶数的确定
由一阶差分序列的ACF图和PACF图可见,序列一阶自相关系数与偏自相关系数
均不为零,因此,尝试建立ARIMA(1,1,0)、ARIMA(1,1,1)、ARIMA(0,1,1)三种模型,三种模型拟合结果,见表1。
通过对比发现,ARIMA(1,1,0)模型中,平稳的R方数值最大(0.493),正态
化的BIC数值最小(17.357),因此,三种模型中,ARIMA(1,1,0)模型的拟合优度最佳。
2.3 模型检验
(1)参数检验
通过SPSS软件计算得出,AR(1)的参数估计值为0.84,T统计量的相伴概率为0.000(相伴概率<0.05),因此,ARIMA(1,1,0)模型参数通过检验。
通过计算,得到全国各类生产安全事故死亡人数预测模型为:
dyt=0.84dyt-1
式中:
yt—t年全国各类生产安全事故死亡人数;
dyt—yt的一阶差分。
(2)残差检验
建立模型后,还需要对残差序列进行自相关检验。
将SPSS软件计算的残差做残差序列的ACF图和PACF图,其结果如图2所示,由ACF图和PACF图可见,残差
序列为白噪声序列(纯随机序列),ARIMA(1,1,0)模型通过检验,可以确定ARIMA(1,1,0)模型为较为适合的模型。
2.4 模型预测
利用ARIMA(1,1,0)模型计算出2001~2015年和2020年全国各类生产安全事故死亡人数的预测值,具体预测值,见表2。
由计算结果可见,ARIMA(1,1,0)模型预测值的相对误差为0.3%-9.8%,平均相对误差为2.84%;2020年全国生产安全事故死亡人数预测值为60436人,与全
国安全生产“十三五”规划目标值的相对误差仅为1.4%。
由此可见,ARIMA (1,1,0)模型预测精度较高。
(1)ARIMA模型使用的前提条件是保证时间序列的平稳性和非纯随机性,建立
模型后还必须进行参数检验和残差检验,ARIMA模型的建模步骤不能省略,否则会影响预测结果的科学性、准确性。
(2)从预测结果来看,ARIMA模型预测精度较高,预测结果具有较强的参考性,为安全生产决策提供科学依据。
(3)由于ARIMA模型是根据近期历史数据建立的,因此,其短期预测比长期预
测更为精确,ARIMA模型多适用于短期预测。
【相关文献】
[1] 王璐,王沁.spss统计分析基础、应用与实战精粹[M].北京:化学工业出版社,2012
[2] 王振龙,胡永宏.应用时间序列分析[M].北京:科学出版社, 2007
[3] 孙玉亮,梁明,王胜康.基于spss时间序列模型的煤矿百万吨死亡率的预测[J].煤炭技
术,2011,(8):3-5
[4] 李榕.我国工伤事故死亡率分析及其ARIMA预测[J].中国安全科学学报,2010,20(11):56-60,90。