基于ARIMA模型的生活垃圾产生量预测

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

置信上限
r2
0. 795
0. 818
0. 842
0
均方根误差 (RMSE)
0. 749
0. 723
0. 742
在建模之前,需先确定采用 2004—2012 年
为该序列为平稳序列,否则是非平稳序列。
逐月数据建模对 2013 年生活垃圾产生量预测是
生活垃圾产生量数据一般具有上升趋势,另 否具有一定的可靠性。由于本研究数据量充足,
外,针对大城市而言,暂住人口流动、不同季节 故分别采用 2004—2009 年逐月数据建模预测 36
型,通过不同年份数据建模预测结果对比,确定预测期为建模期后 12 个月。应用 SPSS 19 软件对 2013 年逐月生活垃 圾产生量进行预测,该区域 2013 年生活垃圾年产生 199. 36 万 t,在 2012 年基础上增长 14. 38%。
关键词:生活垃圾;预测;时间序列分析;ARIMA 模型 中图分类号:X705;O29 文献标识码:A 文章编号:1005-8206 (2013) 05-0001-04
第 21 卷第 5 期 2013 年 10 月
环境卫生工程 Environmental Sanitation Engineering
Vol.21 No.5
October 2013 ·1·
基于ARIMA模型的生活垃圾产生量预测*
吴灵玲 1,卢加伟 1,廖 利 1,姜建生 2
(1. 华中科技大学 环境科学与工程学院,湖北 武汉 430074;2. 深圳市环境卫生管理处,广东 深圳 518000) 摘 要:以深圳市某行政区 2004—2012 年逐月生活垃圾产生量为基础数据,建立了时间序列分析的 ARIMA 模
各参数的 p 值均需小于给定的显著性水平 (一般 分别为 8. 99%、7. 33%、6. 12%;而对于建模期
为 0. 05) 即具有统计学意义,否则即使模型的 1 a 以后的预测,不论是年产生量预测还是逐月预
AIC 或 BIC 值最小,也不能视为最优模型。残差 测,其效果均明显变差。
白噪声检验通过绘制残差自相关函数图来实现, 此外,由表 2 中 3 个模型拟合优度的对比结
即 AIC 值或 BIC 值最小的模型为最优模型。
2010 年、2004—2011 年逐月数据建模,对建模期
3) 模型检验。通常包括参数显著性检验和 后 1 a 内预测效果较好,年产生量预测误差分别
残差白噪声检验。对模型参数进行显著性检验, 为 8. 90%、5. 10%、5. 42%,逐月预测平均误差
* 基金项目:深圳市城管科研项目 (201308) 收稿日期:2013-09-06
序列图、自相关图来判断平稳性:一般地,若序 列图无明显上升或下降趋势,在某一常数值附近
·2·
环境卫生工程
第 21 卷
随机波动,且波动范围有界,自相关图中自相关 2. 1 预测期确定
系数随着延迟期数增加而迅速衰减为零,即可认
Prediction of Domestic Waste Output Based on ARIMA Model Wu Lingling1,Lu Jiawei1,Liao Li1 ,Jiang Jiansheng2
(1. School of Environmental Science & Engineering, Huazhong University of Science and Technology, Wuhan Hubei 430074; 2. Environmental Sanitation Management Office of Shenzhen, Shenzhen Guangdong 518000)
年清运量/万 t
240 观测值
220
2004—2009 年数据建模预测值
2004—2010 年数据建模预测值
200
2004—2011 年数据建模预测值
180
160
140
120
2006 2007
2008 2009 2010 2011 2012
年份
图 1 不同年份数据建模对年清运量预测结果比较
赤池信息准则 (AIC) 或贝叶斯信息准则 (BIC), 预测结果显示:采用 2004—2009 年、2004—
当序列中同时存在趋势性和季节性的周期和
的情况下,对序列中的突变点也能做到较好的拟 趋势时,还需进行季节差分才能使序列平稳化。
合。时间序列分析另一个更显著的优势是对季节 此时拟合 ARIMA (p,d,q)(P,D,Q)s 模型,可 性变化数据有较好的拟合及预测能力。因此,相 表示为下列形式:
比于回归分析法和灰色预测,对影响因素确定、 数据序列光滑性的严格要求以及预测结果不能反
平均误差 8. 99
15. 47 14. 24
7. 33 30. 96
6. 12
第5期
吴灵玲,等 基于ARIMA模型的生活垃圾产生量预测
·3·
表 2 不同年份数据建模模型拟合优度比较
模型拟合优度度量值
建模期 (年份) 2004—2009 2004—2010 2004—2011
0. 50 0. 25
Abstract:Based on the monthly data of domestic waste generation in one district of Shenzhen from 2004 to 2012, an ARIMA model of time series analysis was established. By contrast of the modeling results of different yearly data, the forecast period was identified to be 12 months. The monthly output of domestic waste in 2013 was forecast by using SPSS 19 software. The output of domestic waste was forecast to be 1. 993 6 million tons in this district in 2013, with 14. 38% increase rate on the basis of the output in 2012.
法,已广泛运用于消费品市场预测[1]、电网电价 噪声序列,即 1 组相互之间无关、均值为 0、方
预测[2 ]、证券综合走势预测[3 ]等多个社会经济 领域。时间序列分析用时间来综合代替各种复杂 影响因素,从统计学角度来揭示时间序列内部的 规律并建立模型[ 4 ],简化了计算分析过程,降低 了确定预测参数带来的误差。特别是,时间序列 分析对数据的平滑性要求并不高,在数据量足够
Key words:domestic waste; prediction; time series analysis; ARIMA model
起 源 于 1927 年 的 时 间 序 列 分 析 是 一 种 根
准(P B)荦dZt=θ(q B)αt。
(1)
据动态数据揭示系统动态结构和规律的统计方
式中:Zt 为原序列;d 为差分阶数;αt 为白
圾产生量为基础数据,用 SPSS 19 软件进行分析 实际应用中,更适用于环卫管理系统的操作层
建模。
面,如填埋场、焚烧厂等垃圾处理设施每月
表 1 不同年份数据建模对月清运量预测误差比较
%
建模数据年份 预测年份 1 月
2010 10. 14
2004—2009 2011 17. 45
2012 0. 86
差为 σ2 的随机变量序列;B 为后移算子,BZt=Zt-1; 荦为向后差分算子,荦Zt=Zt-Zt-1=(1-B)Zt;准P 为自 回归算子,准(P B)=1-准1B-…-准PBP,P 为自回归阶 数 ; θq 为 移 动 平 均 算 子 , θq (B)=1 -θ1B - … θqBq,q 为滑动平均阶数。
圾产生量进行预测分析。
1) 序列平稳化。建模前要对原始数据序列进
1 ARIMA 模型
行平稳性检验,序列平稳的判别标准为:均数与
时间序列分析最常用的模型为 ARIMA (p, 方差不随时间变化,自相关系数只与时间间隔有
d,q) 模型,可表示为下列形式[12]:
关而与所处的时间无关。实际应用中常根据观察
数;Bs 为季节性后移算子,BsZt=Zt-s;Φp 为季节性 自回归算子,Φ(p B)s =1-Φ1Bs-…-Φ(p B)s P,P 为季 节性自回归阶数;ΘQ 为移动平均算子,Θ(Q B)s =1Θ1Bs-…-Θ(Q B)s Q,Q 为季节性滑动平均阶数。
基于 ARIMA 模型的建模具体步骤如下[13]:
准(P B)Φ(p B)s 荦s荦DdZt=θ(q B)Θ(Q B)s αt。 (2) 式中:D 为季节差分的阶数,s 为季节周期
映季节性变化的缺点[ 5-11 ],时间序列分析可以对 更短的时间跨度 (逐月、逐周) 的生活垃圾产生 量数据进行分析。笔者在深圳市某行政区 2004—2012 年逐月生活垃圾产生量数据的基础 上,应用时间序列分析的 ARIMA 模型对生活垃
(一般采用 1 阶差分,荦12Zt=Zt-Zt-1)2 ,同时进行差 (见图 1 和表 1),从而确定具有较高可靠性的预 分变换 (一般不超过 2 阶,荦Zt=Zt-Zt-1,荦2Zt=荦Zt- 测期长度。
荦Zt-)1 直到序列平稳。 2) 模型识别。根据平稳化处理后序列的自相
关函数及偏自相关函数的特征,建立相应的时间 序列模型。平稳化处理后,若偏自相关函数是截 尾的,而自相关函数是拖尾的,则建立 AR 模型; 若偏自相关函数是拖尾的,而自相关函数是截尾 的,则建立 MA 模型;若偏自相关函数和自相关 函数均是拖尾的,则建立 ARMA 模型。建模过程 通常选取不同的 p、q、P、Q 值拟合模型,根据
5月 12. 13 21. 12 19. 73 2. 81 19. 99 1. 47
6月 7月 7. 99 7. 32 17. 39 13. 64 15. 09 14. 89 2. 15 8. 11 28. 21 30. 92 5. 96 5. 45
8月 10. 21 17. 59 15. 59 4. 86 32. 91 6. 38
9 月 10 月 11. 88 9. 15 16. 50 16. 33 14. 51 13. 13 7. 99 8. 84 37. 62 41. 52 7. 62 8. 50
11 月 6. 82 13. 32 11. 24 12. 80 45. 58 9. 04
12 月 13. 78 9. 07 15. 53 20. 79 42. 35 3. 54
残差自相关函数均落在置信区间内即证明残差为 果可以看出,随着建模数据量的增加,模型的 r2
百度文库
白噪声序列。通过这 2 项检验的模型才能用于后 增大,且平均绝对百分比误差 (MAPE) 减小,
续预测。
即模型可靠性提高。因此可以认为采用 2004—
4) 根据模型计算递推预测值,如果模型是对 2012 年逐月数据建模,对 2013 年逐月生活垃圾
变化后的序列建立的,预测原始序列需对模型预 产生量进行预测其结果是可靠的。本研究确定预
测结果进行逆变换,从而得到原始序列的预测值。 测期为建模期后 12 个月。
2 建模与预测
由以上分析可以看出,时间序列分析法对
以深圳市某行政区 2004—2012 年逐月生活垃 生活垃圾产生量短期预测的效果较好,因此在
2004—2010
2011 2012
3. 05 37. 37
2004—2011 2012 18. 59
2月 2. 19 4. 81 15. 71 10. 71 16. 44 3. 12
3月 5. 76 19. 37 15. 14 4. 03 20. 85 3. 65
4月 10. 47 19. 04 19. 49 1. 78 17. 75 0. 14
蔬菜瓜果品种不同等都会造成生活垃圾产生量具 个月数据、采用 2004—2010 年逐月数据建模预
有季节性变化趋势 (一般以 12 个月为周期变化), 测 24 个月数据、采用 2004—2011 年逐月数据建
因此在建模之前必须对序列进行季节性差分变换 模 预 测 12 个 月 数 据 , 对 其 预 测 效 果 进 行 比 较
相关文档
最新文档