基于ARIMA模型的全国公路客运量预测
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于ARIMA 模型的全国公路客运量预测
摘要:采用自回归移动平均模型(ARIMA ),对国家统计局提供的全国公路客运量数据进行分析,然后利用求解出的模型对未来的公路客运量进行预测,为我国未来公路客运量的估计提供参考作用。
关键词:ARIMA 客运量 时间序列分析
公路运输现在已经成为5种主要运输方式中完成运输量最多,实现营业收入最高的一种运输方式。2004年全国累计完成公路客运量为162.89亿人,比上年增长11.2%的同时旅客周转量达到8719.15亿人公里,比上年增长13.5%。公路运输量是区域经济发展的一个重要衡量指标,也是反映区域经济活力的指标之一,对其进行科学而准确的预测是很有必要的,是科学落实运输相关政策的前提。同时,公路客运量是一个复杂的变量,受多种因素的影响,还存在着许多无法预知的内在影响关系,为了消除不客观因子对起客运量的影响,本文拟用时间序列ARIMA 模型的基本原理,对全国公路客运量进行预测。
一、 ARIMA 模型建模思路
ARIMA 模型( p, d, q) 又称为自回归移动平均模型。其中AR 指自回归; p 为模型的自回归阶数; MA 为移动平均; q 为模型的移动平均阶数; I 指积分; d 为时间序列成为平稳之前必须取差分的次数。其一般的表达式为:
q t q t t p t y p t y t y t y -++-+-++-++-+-+=μβμβμβμβαααα 22110022110
( 一) 建模思路
ARIMA 建模思路是: 假设所研究的时间序列是由某个随机过程产生的, 用实际统计序
列建立、估计该随机过程的自回归移动平均模型, 并用此模型求出预测值。
( 二) 建模步骤
1. 观察时间序列。根据时间序的散点图自相关函数( ACF) 图和偏自相关函( PACF) 图以及ADF 单位根检验观察其方差、趋势及其季节性变化规律, 识别该序列的平稳性。
2. 对序列进行平稳化处理。如果数据序列是非平稳的, 并存在一定的增长或下降趋势, 则需对数据进行差分处理; 如果数据序列存在异方差性, 则需对数据进行对数转换或者开方处理, 直到处理后数据的自相关函数值和偏相关函数值无显著地异于零。
3. 模型识别。若平稳时间序列的偏相关函数是截尾的, 而自相关函数是拖尾的, 则可断定此序列适合AR 模型; 若平稳时间序列的偏相关函数是拖尾的, 而自相关函数是截尾的, 则可断定此序列适合MA 模型; 若平稳时间序列的偏相关函数和自相关函数均是拖尾的, 则此序列适合ARMA 模型。
4. 对ARIMA( p, d, q) 模型定阶, 估计参数。
5. 模型检验。进行假设检验, 诊断白噪声检验假设模型残差的ACF 值和PACF 值在早期或季节性延迟点处不得大于置信区间, 同时残差应理想化为0 均值。可观察残差的ACF 图、PACF 图, 并辅以D —w 值、t 值等检验法。
6. 预测分析。时间序列分析包括以下步骤: 分析时间序列的随机特性; 用实际统计序列构造预测模型; 根据所得模型做出最佳的预测值。
二、数据说明
本文中采用的数据来源于国家统计局统计年鉴,全国公路客运量(1950~1998)。三、ARIMA模型的应用
(一)分析时间序列
全国公路客运量(1950~1998)(单位:万人)
根据全国公路客运量序列,运用EVIEWS3.1软件,根据时间序列{yt} 的折线图、自相关函数(ACF) 图和偏自相关函数( PACF) 图, 以及ADF单位根, 观察其是否存在异方差, 其趋势以及识别该序列的平稳性。在此,y表示客运量(万人)。
首先运用Eviews3. 1 软件对y做折线图如下:
图一
表1
从序列y的折线图可知该序列含有时间趋势,由ADF检验结果可以看出: t 统计值>ADF临界值,该序列没有通过平稳性检验。
(二)平稳化处理
从图一和表一可知该序列为非平稳序列,即序列{yt}存在异方差,因此需要对其进行平稳化处理,从而消除异方差。经过多次尝试, 采用对序列{ yt} 取对自然对数即lny, 然后进行2 阶差分, 序列{ Zt} ( 对y 的2 阶差分) 达到平稳, 其序列折线图和ADF 检验结果分别如图2和表2 所示。
图2
表2
由图二和表二可知,序列{zt}已经趋于平稳了,即的D(Iny,2)为平稳序列,所以此模型中d=2.
( 三) 模型识别
模型识别即是选择用AR( p) 、MA( q) 还是用ARMA( p, q) 模型相对平稳的时间序列进行估计。若平稳时间序列的偏相关函数是截尾的, 而自相关函数是拖尾的, 则可断定此序列适合AR 模型; 若平稳时间序列的偏相关函数是拖尾的, 而自相关函数是截尾的, 则可断定此序列适合MA 模型; 若平稳时间序列的偏相关函数和自相关函数均是拖尾的, 则此序列适合ARMA 模型。从2 阶差分后的ACF和PACF图即图3 可以看出均是拖尾, 因此序列适合ARMA 模型分析。
( 四) 模型定阶与参数估计
根据对模型的平稳处理我们已经知道I( d) 的阶数为2, 即d =2, 现在主要对ARMA 模型进行定阶分析。经过对图三的分析,进行反复筛选,最后确定p=1,q=1.即本文中选定ARMA (1,1)模型。利用EVIEWS软件计算输出模型参数见表3。
图3
表3
( 五) 模型检验
模型检验也就是对模型残差项是否为白噪声过程的检验。如果模型通过检验, 则可以进行预测, 否则回到建模第三步———对选用模型类型进行重新识别。根据对时间序列的模型进行回归模拟, 并且得到拟合值和残差图( 图4) 。对其残差进行检验, 得到残差的自相关图和偏自相关图( 图5) 以及扩充的ADF 单位根检验结果( 表5)
图4
图5