基于改进LSSVM的节假日高速公路行程时间预测

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于改进LSSVM的节假日高速公路行程时间预测
李松江;宋军芬;王鹏;杨迪
【摘要】节假日高速公路交通量突增,导致路段行程时间不确定增加,严重扰乱人们的出行安排,因此有效的行程时间预测至为关键.首先对历史数据集按照节假日行程时间的分布规律进行分类,使得子数据集和特征向量之间的关系,与预测时段行程时间和特征向量之间的关系更加相似.然后对LSSVM(Least Squares Support Vector Machines)模型进行改进,通过构造混合核函数,降低了模型计算复杂度;对PSO优化算法进行改进,解决了标准PSO算法搜索精度低,容易陷入局部极值的缺点.最后使用改进LSSVM模型对不同数据集进行训练,完成行程时间的预测.研究表明:(1)对历史数据集的分类,提高了模型预测的准确性;(2)与传统模型相比,改进后的模型训练速度更快,预测精度更高.
【期刊名称】《长春理工大学学报(自然科学版)》
【年(卷),期】2018(041)005
【总页数】6页(P116-121)
【关键词】行程时间预测;历史数据集分类;改进LSSVM模型;混合核函数;PSO算法
【作者】李松江;宋军芬;王鹏;杨迪
【作者单位】长春理工大学计算机科学技术学院,长春 130022;长春理工大学计算机科学技术学院,长春 130022;长春理工大学计算机科学技术学院,长春 130022;长春理工大学计算机科学技术学院,长春 130022
【正文语种】中文
【中图分类】TP391
高速公路作为现代化的交通基础设施具有高速迅捷的特性,而节假日免费放行政策造成的交通拥堵严重扰乱了出行者的时间安排,因此,科学有效的交通预测方法成为了能够有效缓解我国高速公路节假日交通拥挤的重要手段,而行程时间预测可以有效调节出行者的路径选择[1,2],节省出行时间[3-5]。

在行程时间预测方法的研究方面,统计模型和智能化方法不断被提出。

李瑞敏等使用多源数据,建立了权重分配和神经网络的数据融合模型对行程时间进行预测[6]。

BUSTILLOS等结合N-Curve与KNN方法,提出了单近邻与多近邻的行程时间预测模型[7]。

Wosyka等布设车牌识别系统采集车辆行程时间,建立决策树模型预
测行程时间[8]。

Wang J等提出STDNN时空延迟神经网络模型预测行程时间[9]。

上述预测方法中的样本数据都需要依托采集设备完成,由于经济状况和高速公路的等级局限,导致数据获取困难、信息缺失。

而收费数据易获取、质量高、实效性强,且能反映车辆行驶信息,因此本文采用获取方便的收费数据,对节假日高速公路行程时间进行预测。

1 数据来源
以第一类客车(7座以下轿车、客车)的行程时间作为预测主体数据,实验选取东北某省2012年至2015年高速公路部分路网法定节假日收费数据作为历史数据集,以2016年S1路段(19.68km)数据作为测试数据,预测该路段的行程时间。

首先统计车辆从收费站i到收费站j的进入时间和离开时间,然后按照公式(1)计
算从收费站i至收费站j平均行程时间,时间间隔为15min。

式中,Ni,j,m是时段m内驶入收费站i,驶出收费站j的车辆总数;tex(p,j,m)是样本数据中第p条记录中车辆驶入收费站j的时刻;ten(p,i,m)是数据中第p条记录中车辆驶出收费站i的时刻。

2 数据分析及分类
以东北某省高速公路为例,对其节假日数据集按照行程时间分布规律集进行分类。

(1)清明节数据分析
统计2012年至2016年清明节时期某路段的客车数据,按照公式(1)计算行程时间,得到图1的清明节期间行程时间的变化曲线。

图1 清明节行程时间变化
(2)劳动节数据分析
以2012年至2016年五一期间的客车收费数据为例,按照公式(1)计算行程时间,得到图2劳动节前、中、后期的行程时间变化曲线。

图2 五一行程时间变化
(3)国庆节数据分析
统计2012年至2016年的收费数据,按照公式(1)计算行程时间,得到图3国庆节期间行程时间的变化曲线。

图3 国庆节行程时间变化
(4)元旦时期数据分析
统计2012年至2016年这5年元旦期间的收费数据,按照公式(1)计算行程时间,得到图4元旦前期、中期、后期行程时间的变化曲线。

图4 元旦行程时间变化
(5)春节数据分析
统计2012年至2016年这5年春节期间的收费数据,按照公式(1)计算行程时间,得到图5春节期间行程时间的变化曲线。

图5 春节行程时间变化
通过上述对节假日数据的分布规律,将节假日历史数据集分为5个子集:清明节、劳动节、国庆节、元旦的晨高峰和春节中期的晨高峰为一类;清明节、劳动节、国庆节、元旦前期的午高峰为一类;清明节、劳动节、国庆节、元旦后期的晚高峰为一类;春节前期和后期的高峰为一类;节假日的平峰为一类。

3 高速公路行程时间预测模型
3.1 最小二乘支持向量机
最小二乘支持向量机是一种以支持向量机为基础的基于统计学理论的学习算法,使用最小二乘线性系统作为SVM算法的损失函数,将SVM中的不等式约束变换为
等式约束,简化了模型计算的复杂性,提高了求解速度。

对于给定的训练样本集T=(xi,yi)(i=1,2,…,n),根据结构风险最小化原理,定义以
下优化问题:
式中,ω为权重,γ为惩罚因子,ei为损失函数的松弛因子,b是偏置项。

引入Lagrange函数解决上述优化问题:
式中,αi为Lagrange乘子。

对式(3)中参数求偏导为零,得到:
联立求解方程组,得到LSSVM的回归模型:
式(5)中K(xi,xj)为核函数。

3.2 构造核函数
在LSSVM模型中,为了更好的拟合,引入了核函数[10],提高了模型的非线性处理能力,解决了维数灾难问题。

经典的核函数分为全局核和局部核,它们性能差异较大,各有各的优缺点。

目前的建模方法中一般采用单个核函数,然而这样建立的模型预测精度并不高,为了使行程时间的预测更为准确,提出把全局核Sigmoid和局部核RBF结合起来,互补不足,形成一个性能良好的混合核函数,公式如下:
式中,Km为混合核函数;KS为Sigmoid核函数;KR为局部核函数;β为混合
权重因子,用来平衡全局核和局部核对混合核的影响。

根据Sigmoid核和RBF核的公式,公式(6)可变形为:
3.3 PSO算法
PSO粒子群算法是通过对一群随机粒子的迭代寻找最优解,在每一次迭代过程中,粒子通过寻找个体最优值和全局最优值更新自身的速度和位置[11]。

假设在一个由N个粒子组成的种群的D维搜索空间中,粒子i在D维搜索空间中的位置为xi=(xi1,xi2,…,xid),速度为vi=(vi1,vi2,…,vid),粒子个体最优位置为
Pi=(Pi1,Pi2,…,Pid),粒子群体全局最优位置为Pg=(Pg1,Pg2,…,Pgd),其中
i=1,2,…,N。

迭代中,粒子通过个体极值和全局极值更新自身的速度和位置,更新
公式如下:
式中,vtid+1和xtid+1分别是粒子在t+1代的速度和位置;vtid和xtid为粒子在迭代t次后的速度和位置;w为惯性权重;c1和c2为学习因子;r1和r2是两个随机数,取值范围为[0,1]。

传统PSO算法收敛速度快,但是容易陷入局部极值,搜索精度不高,为了优化PSO算法,一些研究者对惯性权重和学习因子进行了改进。

(1)惯性权重是为了更好地平衡算法的全局搜索和局部搜索能力,当w值较大时,
粒子的全局寻优能力强,不易陷入局部极值,反之,则局部寻优能力强,收敛速度快。

基于此,研究者对w采用线性递减策略,即:
这样虽然可以达到所需效果,但是也存在弊端,即在搜索前期如果无法找到最优值,那么在搜索的后期随着权重的减小,很容易使算法快速收敛到局部最优。

(2)学习因子是用来调节模型学习的步长,公式(8)中第二部分为粒子自我认
知部分,为社会经验部分。

当c1=0时,粒子失去了自我认知能力,只有社会经验,这时粒子有扩展搜索空间的能力,具有较快的收敛速度,但容易陷入局部最优;当c2=0时,则粒子之间没有社会信息,只有自我认知能力,这时由于粒子之间没有信息的共享,整个粒子群相当于都在进行盲目的随机搜索,收敛速度慢,以致于算法很难得到最优解。

因此很多研究借鉴线性递减策略的思想,对c1采用线性递减策略,对c2采用线性递增策略,即:
这样虽然可以达到所需效果,但是也存在w一样的弊端。

3.4 改进PSO算法
为了让群体快速找到全局最优,本文将对PSO算法进行以下改进。

(1)二阶递减惯性权重
对惯性权重采用二阶递减策略,不但减少迭代次数,还降低算法陷入局部最优的概率,公式如下:
式中,wmax为最大惯性权重;wmin为最小惯性权重;t为当前迭代次数;tmax 为算法最大迭代次数。

(2)二阶异步变化的学习因子
对学习因子c1、c2分别采用二阶线性递减和二阶线性递增策略,公式如下:
式中,c1max和c2min是学习因子c1和c2的最大值,c1min和c2min是学习因子c1和c2的最小值。

4 实验分析
4.1 改进LSSVM模型参数设置
在预测行程时间之前,需要先设置模型的各个参数:设置γ∈[0 , 1000];核函数
σ∈[0 ,10];Sigmoid参数η∈[0 , 10],权重因子β∈[0 , 1];种群规模N=30,
最大迭代次数tmax=300,惯性权重w∈[0 , 1],学习因子c1∈[0 , 2.5] ,
c2∈[0 , 2.5]。

4.2 性能评价指标
采用定义均方根误差(RMSE)、平均绝对误差(MAE)与平均绝对误差百分比(MAPE)评价预测结果的精度。

其中,TP(h)为h时段的预测行程时间;TA(h)为h时段的实际行程时间;Nh为预测时段数。

4.3 预测结果分析
选取2012年至2015年的节假日行程时间数据作为训练数据集,以2016年的节假日数据作为测试数据集。

(1)数据集分类预测结果分析
按照第2节中介绍的分类方法对选取的训练集和测试集进行分类,使用改进后的LSSVM模型对行程时间进行预测,以国庆节为例,得到图6所示的国庆行程时间预测结果。

图6 国庆节行程时间预测结果
从图6可以看出,国庆各个时期的行程时间预测值的变化趋势与实际值基本符合,
表明对节假日数据集分类是可行的。

为分析分类后预测模型的有效性和准确性,使用AMPSO-MK-LSSVM模型对未进行数据集分类的节假日高速公路行程时间进行预测。

结果对比如图7所示。

图7 行程时间预测结果对比
由图7可以看出:与未进行数据集分类的行程时间预测值相比,数据集分类后的预测效果更好,预测值与实际值更吻合。

为体现数据集分类方法的预测精度更高,按式(16)-(18)计算RMSE、MAE和MAPE,结果如表1所示。

表1 两种方法预测结果对比方法数据集分类未分类RMSE/min 1.15 1.62
MAE/min 0.87 1.03 MAPE/%4.62 5.17
由表1可以看出,数据集分类后模型预测的RMSE、MAE和MAPE与未进行数据集分类的模型预测结果相比均有一定程度的减少,其中RMSE降低了0.47,MAE 降低了0.16,MAPE降低了0.55%。

由此可见,对数据集分类提高了模型的预测精度。

(2)不同核函数预测结果分析
分别使用Sigmoid核、RBF核和MK核的AMPSO-LSSVM模型对10月7日路段行程时间进行预测,得到如下图所示的预测结果。

图8 基于Sigmoid核的模型预测结果
图9 基于RBF核的模型预测结果
由图8-图10可以看出,基于混合核函数的AMPSO-LSSVM模型预测效果更好,预测值与实际值基本一致。

而且Sigmoid核和RBF核的预测效果相差无几,残差范围分别为[-3.68,6.87]、[-3.19,7.46],但是混合核函数的AMPSO-LSSVM 模型预测效果更好,残差范围仅为[-2.9,3.12]。

由此看出:混合核函数涵盖了全局核和局部核的优点,相对于单核核函数,使用混合核函数的AMPSO-LSSVM模型的预测效果显著提高。

图10 基于混合核的模型预测结果
(3)改进PSO算法预测效果分析
对比使用PSO-MK-LSSVM模型和AMPSO-MK-LSSVM模型的预测效果,在预
测分析前先设置PSO-MK-LSSVM模型的各项参数:惯性权重w=0.9,学习因子
c1=1.5,c2=1.7,其他参数设置同4.1节中设置的参数一致。

改进PSO算法和标准PSO算法在参数寻优过程中适应度随迭代次数的变化曲线对比如图11所示。

图11 参数优化算法对比
由图11可以看出AMPSO算法迭代至75次就趋于全局最优解,而标准PSO算
法需要迭代至99次才能趋于最优解。

为体现改进模型的预测性能,将其与PSO-MK-LSSVM模型进行对比研究,使用RMSE、MAE和MAPE作为评价指标,计
算结果如表2所示。

表2 两种模型预测性能对比模型AMSPO标准PSO RMSE/min 1.15 1.69
MAE/min 0.87 1.09 MAPE/%4.62 5.51
由表2可以看出,改进模型预测的RMSE、MAE、MAPE值与传统模型相比均有
一定程度的减少,其中均方根误差降低了0.54,平均绝对误差降低了0.22,平均绝对误差百分比降低了0.89%。

由此可见,与标准PSO算法相比,改进的PSO
算法有着较好的全局学习能力和局部学习能力,很大程度上改善了标准PSO算法早熟收敛的缺点,降低了迭代次数,加快了寻优速度,提高了预测精度。

5 结论
(1)提出对节假日数据集进行分类的方法,提高了模型预测的准确性。

(2)使用混合核函数代替LSSVM原有的单核核函数,提高了模型非线性处理能力,预测准确度有了很大的提升。

(3)使用改进后的PSO算法对预测模型的参数进行优化,加快了样本训练速度,提高了预测精度。

参考文献
【相关文献】
[1] 娄岩,弓晋霞,王俊辉,等.高速公路交通量时空特性分析[J].长春理工大学学报:自然科学版,2017,40(6):13-17.
[2] 李松江,张异,龚跃.基于蚁群算法的智能交通最优路径研究[J].长春理工大学学报:自然科学版,2015(4):122-126.
[3] Chung C,Jason L.An adaptue system for predicting freeway travel
times[J].International Journal of Information Technology&Decision Making,2012,11(04):727-747.
[4] Yildirimoglu M,Geroliminis N.Experienced travel time prediction in congested freeway routes[C].Transportation Research Board 92nd Annual Meeting,2013.
[5] Pirc J,Turk G,Ž̌Ura ing the robust statistics for travel time estimation on highways[J].Intelligent Transport Systems Iet,2015,9(4):442-452.
[6] 李瑞敏,陈熙怡.多源数据融合的道路旅行时间估计方法研究[J].公路交通科技,2014,31(2):99-103.
[7] Bustillos B I,Chiu Y.Real time freeway experienced travel time prediction using N-curve and K nearest neighbor methods[J].Transporttation Research Record,2011(2243):127-137.
[8] Wosyka J,Pribyl P.Real-time travel time estimation on highways using loop detector data and license plate recognition[C].Proceedings of 9th International Conference,Elektro.Slovakia:IEEE,2012:391-394.
[9] Wang J,Tsapakis I,Zhong C.A space-time delay neural network model for travel time prediction[J].Engineering Applications of Artificial Intelligence,2016,52(C):145-160.
[10] 徐飞.基于混合核函数的LSSVM发酵建模[D].大连:大连理工大学,2012.
[11] 司文静,封喜波,耿立艳,等.基于ADPSO算法优化LSSVM的高速公路交通量预测方法[J].
河北大学学报:自然科学版,2017,37(3):302-308.
[12] 张军,王远强,朱新山.改进PSO优化神经网络的短时交通流预测[J].计算机工程与应用,2017,53(14):227-231.。

相关文档
最新文档