多种预测方法在公路运输量预测中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多种预测方法在公路运输量预测中的应用
李竞
【摘要】文章介绍了趋势外推法、普通最小二乘回归法和偏最小二乘回归法三种基本的公路运输量预测方法,并运用这三种方法对江西省的公路货运量进行预测,同时根据统计口径调整的预测处理方法对预测结果进行调整,最终取三种预测结果的平均值作为预测结果数据.
【期刊名称】《西部交通科技》
【年(卷),期】2013(000)003
【总页数】5页(P68-72)
【关键词】预测方法;公路运输量
【作者】李竞
【作者单位】江西省交通运输厅规划办公室,江西南昌330008
【正文语种】中文
【中图分类】U492.4+13
0 引言
公路运输量是国民经济和社会发展的重要产物,是公路交通需求的具体反映,是进行交通基础设施建设、规划和管理的基础。
公路运输量预测是在公路运输量历年数据调查和分析的基础上,运用科学的方法测算未来的运输量,可为公路运输发展提供数据依据和决策支持。
公路交通运输量的预测方法有很多,不同的预测方法模型的预测机理不同。
单独采取某一种模型往往有其局限性。
而在工作中,往往需要找到一种方便快捷、有效可靠的预测形式来进行预测工作。
为避免单一预测方法导致的预测结果精度不准确的问题,提高结果可信度,给规划工作打下良好的基础,本文以公路运输量中的公路货运量预测为例,提出利用三种高效的预测方法进行组合预测。
此外,预测收集的历年统计数据有时存在因为统计口径改变而产生统计数据发生跳跃式变化进而失去数据连续性、可比性的问题。
如交通运输部于2008年开展全国公路水路运输量专项调查后调整了交通运输量统计范围口径,导致无法直接运用两种统计口径下的数据进行预测。
本文也针对这种情况,提出了统计口径调整的预测处理方法。
1 预测方法介绍
现在常用的预测方法主要有三种,包括:趋势外推法、普通最小二乘回归法(Ordinary Least Squares Regression,简称OLS回归)和偏最小二乘回归法(Partial Least Squares Regression,简称PLS回归)。
趋势外推法是指当预测对象依时间变化呈现某种上升或下降趋势,但没有明显的季节波动,并且能够找到一条合适的函数曲线来拟合预测对象和时间之间的变化趋势时所使用的预测方法。
在应用趋势外推法之前通常有两个假定:(1)假设事物发展过程没有跳跃式的变化;(2)假定事物的发展因素也决定其未来的发展,其条件是不变的或者变化不大。
在趋势外推法中,常用的模型有:(1)线性曲线外推模型,主要适用于变化速度比较稳定的指标的预测;(2)多项式曲线外推模型,主要适用于变化速度波动较大的指标的预测;(3)对数曲线外推模型,主要适用于变化速度一开始较快,以后逐渐趋于平缓的指标的预测;(4)指数曲线外推模型,主要适用于变化速度持续加快且增幅越来越大的指标的预测;(5)乘幂曲线外推模型,主要适用于变化速度持续加快且增幅相对稳定的指标的预测。
常用的模
型识别方法有散点图法和差分法。
普通最小二乘回归法是一种统计学上对数据进行分析的方法,主要用于探讨数据之间是否存在特定的关系。
该方法用于建立被解释变量(因变量)和解释变量(自变量)之间关系的模型,其目的在于揭示两个或者多个变量之间是否相关、正相关还是负相关以及相关强度的大小。
在估计模型参数时,普通最小二乘回归法主要用到的数学方法是最小二乘法(Method of Least Squares),该方法的基本思想是使被解释变量观测值与其估计值的离差平方和达到最小来求得模型参数的估计值,这样就可以得到预测模型。
普通最小二乘回归法是研究变量之间统计关系及其数学形式的最常用的方法,广泛应用在经济管理、社会科学以及工程技术领域,是一种普遍应用的统计分析与预测技术。
偏最小二乘回归法是一种先进的多元分析方法。
它于1983年由伍德(S.Wold)和阿巴诺(C.Albano)等人首次提出,主要用于解决多元回归分析中的解释变量之间存在多重共线性或者解释变量个数多于样本点个数等实际问题。
也就是说该方法与普通最小二乘回归方法的最主要区别在于:它可以在解释变量存在严重多重共线性的条件下进行回归建模。
此外,它在回归建模的同时,还可以分析两组变量的相关关系(典型相关分析),或者对两组变量分别进行主成分分析。
由于偏最小二乘回归法解决了一些以往普通最小二乘回归法无法解决的难题,因此该方法被越来越多地应用到社会生活的各个领域。
2 统计口径调整的预测处理
由于交通运输部门统计口径在2008年做过调整,统计口径发生变化虽然会带来运输量的变化,但是整个公路运输量的历年实际变化趋势是相对稳定的。
因此考虑利用2007年以前的数据构建预测模型,然后根据构建的模型得到预测结果,最后根据口径调整情况对预测的结果也作相应地调整。
以利用趋势外推法预测公路货运量为例说明调整过程。
如利用趋势外推法得到2010-2015年公路货运量平均增速
为7.9%。
那么以口径调整后最新的数据——2011年公路货运量数据为基数,以7.9%为平均增速,可以得到2015年公路货运量预测值。
3 预测方法在公路运输量预测中的应用——以公路货运量为例
(1)趋势外推法
1995-2000年,江西省的公路货物运输发展相对平稳,货运量基本保持在1.8亿吨左右的水平。
但进入新世纪以来,公路货运量增速明显加快,特别是2003-2007四年间货运量一直保持在一个较高的增速增长,如图1所示。
图1 1995-2007年江西省公路货运量变化曲线图
由于当数据不存在周期性变化特征时,通常临近年份的数据更能反映数据今后的变化特征,故选用2001-2007年这一时间段的数据建立趋势外推模型。
在预测过程中,可以看到2001-2007年间公路货运量的总趋势是呈线性增长的,但也存在波动,如图2所示。
因此预测模型分为两大部分:趋势部分和波动部分。
图2 2001-2007年公路货运量变化情况图
对于趋势部分,将采用趋势外推法,波动部分则利用MA模型进行预测。
模型的基本形式为:公路货运量=公路货运量趋势+公路货运量波动。
为了便于勾勒出趋势变化情况,对公路货运量先进行对数变换再进行相关的预测,将公路货运量对数变换后的指标记为ln(公路货运量)。
对于趋势部分,建立ln(公路货运量)与时间t之间的关系模型,模型预测结果如图3所示,模型形式为:
ln(公路货运量)趋势=10.946+0.061*t
图3 2008-2015年公路货运量趋势部分预测结果图
对于波动部分,其模型的输出结果如表1所示,根据表1建立MA模型,有如下形式:
公路货运量波动=-0.031+[MA(1)=0.851]+[MA(3)=-0.582]
表1 公路货运量波动部分模型输出结果表0.571 MA(1)0.851 0.176 4.840
0.008 MA(3)-0.582 0.053 -10.894 0.000 R-squared 0.885 Mean dependent var 0.001 Adjusted R-squared 0.828 S.D.dependent var 0.209 S.E.of regression 0.086 Akaike info criterion -1.760 Sum squared resid 0.030 Schwarz criterion -1.784 Log likelihood 9.162 Hannan-Quinn criter. -2.047 F-statistic 15.445 Durbin-Watson stat 0.722 Prob(F-statistic)___Prob.C-0.031 0.050 -0.617 Coefficient Std.Error t-Statistic
0.013________________________________
结合趋势部分和波动部分的模型即可得到总模型,从利用总模型预测的近七年(2001-2007年)预测结果来看,预测误差可控制在±1%以内,预测值与实际值的拟合效果如图4所示,可以认为所得到的预测模型是理想的。
图4 公路货运量预测值与实际值拟合情况图
(2)普通最小二乘回归法
对江西省经济社会发展的主要指标进行分析,江西省的公路货运量与其GDP之间的相关系数为0.993,显然两者之间存在着较高的相关性。
并且通过相关性检验结果表明,公路货运量和GDP之间相关性检验的P值<1%,表明在1%的显著性水平下公路货运量和GDP之间的相关性是显著的,如表2所示。
表2 公路货运量与GDP之间的相关性检验结果表**.Correlation is significant at the 0.01level(2-tailed)________________相关性检验GDP______公路货运量Pearson Correlation 0.993(**)0.000 Sig.(2-tailed)
故可考虑利用普通最小二乘回归法建立两者之间的一元线性回归模型。
模型结果如表3所示。
表3 ln(公路货运量)与ln(GDP)之间的模型输出结果表注:表中的Y代表公路货运量,X代表GDP。
0.000 X 0.339 0.029 11.753 0.000 R-squared 0.926 Mean dependent var 9.952 Adjusted R-squared 0.920 S.D.dependent var
0.172 S.E.of regression 0.049 Akaike info criterion -3.057 Sum squared resid 0.026 Schwarz criterion -2.970 Log likelihood 21.869 Hannan-Quinn criter. -3.075 F-statistic 138.125 Durbin-Watson stat 0.453 Prob (F-statistic)________Prob.C 7.311 0.225 32.485 Coefficient _Std.Error __t
-Statistic 0.000___________________________________
由表3可知,模型自变量系数的t检验和整个模型的F检验都是显著的;并且模型的R2=0.926,表明该模型的拟合效果较好。
因此,得到的模型可用来预测公路
货运量指标,模型的形式如下:
ln(公路货运量)=7.311+0.339*ln(GDP)
(3)偏最小二乘回归法
除了GDP指标,江西省的公路货运量与其工业增加值、固定资产投资、社会消费品零售总额等指标之间也存在着较高的相关性,如表4所示。
可以看到,公路货
运量与固定资产投资、工业增加值和社会消费品零售总额等三个指标之间的相关性检验结果都是显著的。
表4 公路货运量与主要经济指标之间的相关系数及相关性检验表**.Correlation is significant at the 0.01level(2-tailed).运量96(**)0.994(**)
0.985(**)Sig.(2-tailed)0.000 0.000 0.0000.000 Pearson Correlation 0.993(**)1 0.994(**)0.995(**)0.998(**)GDP Sig.(2-tailed)0.000 0.000 0.000 0.000工业增加值Pearson Correlation 0.996(**)0.994(**)1 0.990(**)0.988(**)Sig.(2-tailed)0.000 0.000
0.000 0.000固定资产投资Pearson Correlation 0.994(**)0.995(**)0.990(**)1 0.989(**)Sig.(2-tailed)0.000 0.000 0.000 0.000社会
消费品零售总额
________________________________________________________________________________
_____Pearson Correlation 0.985(**)0.998(**)0.988(**)0.989(**)1 Sig.(2-tailed)0.000 0.000 0.0000.000
但是从表4还可以看到,GDP、固定资产投资、工业增加值、社会消费品零售总额两两之间的相关性也非常高,四个指标两两之间的相关系数均在0.98以上,并且这四个指标两两之间在1%的显著性水平下相关性检验结果都是显著的。
如果简单地将公路货运量和GDP、工业增加值、固定资产投资、社会消费品零售总额建立回归模型,就很可能会导致多重共线性问题,而利用偏最小二乘回归法就可以有效地避免此问题。
利用偏最小二乘回归法,可以得到如下回归模型:
ln(公路货运量)=7.869+0.085*ln(GDP)+0.066*ln(工业增加值)+0.050*ln(固定资产投资)+0.096*ln(社会消费品零售总额)
其中,R2=0.930,说明有较好的拟合效果,可以用来预测公路货运量。
(4)预测结果选取
利用以上三种预测方法可以分别推算出2015年江西省公路货运量,然后根据统计口径调整的预测处理方法,对预测结果进行调整,最后给出推荐值和“十二五”期平均增速,如表5所示。
一般而言,没有一种预测方法在任何情况下都会绝对地优于其它预测方法,并且从预测结果来看,三种预测结果相差不大,因此,表5给出的推荐值由三种预测方法分别推算的预测值的简单平均得到。
表5 公路货运量预测结果表(单位:亿吨)年份趋势外推法普通最小二乘回
_____________________归法偏最小二乘回归法_______________推荐值“十二五”平均增速(%)_2015___11.9_____10.1_____10.7 10.96.4___
将三种方法分别求得的2015年公路货运量数据求算术平均值,得到2015年公路货运量推荐值。
即:2015年公路货运量推荐值=(11.9+10.1+10.7)/3=10.9亿吨。
根据求得的推荐值以及基年2010年的统计值,计算得到“十二五”期的平均增速,即:
“十二五”期平均增速100%-100%=6.4%
最终得到2015年(“十二五”期末)江西省公路货运量为10.9亿吨,“十二五”期平均增速为6.4%。
4 结语
没有一种预测方法在任何情况下都会绝对地优于其它预测方法。
本文采用趋势外推法、普通最小二乘回归法和偏最小二乘回归法三种预测方法对公路货运量进行了预测,并考虑了统计口径调整的预测处理,最终取三种预测结果的平均值作为预测结果数据。
这不仅能提高预测值的可信度,也能为预测提供充分的理论依据,可以作为类似预测工作的参考方法。
参考文献
[1]宁宣照,刘思峰.管理预测与决策方法[M].北京:科学出版社,2009. [2]王惠文,偏最小二乘回归方法及应用[M].北京:国防工业出版社,1999. [3](美)多米尼克·萨尔瓦多,(美)德里克·瑞杰著,杜艺中译.统计学与计量经济学[M].上海:复旦大学出版社,2008.
[4]江西省统计局,国家统计局江西调查总队.2008江西统计年鉴[M].北京:中国统计出版社,2008.。