基于改进LSSVM的节假日高速公路行程时间预测
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于改进LSSVM的节假日高速公路行程时间预测
李松江;宋军芬;王鹏;杨迪
【摘要】节假日高速公路交通量突增,导致路段行程时间不确定增加,严重扰乱人们的出行安排,因此有效的行程时间预测至为关键.首先对历史数据集按照节假日行程时间的分布规律进行分类,使得子数据集和特征向量之间的关系,与预测时段行程时间和特征向量之间的关系更加相似.然后对LSSVM(Least Squares Support Vector Machines)模型进行改进,通过构造混合核函数,降低了模型计算复杂度;对PSO优化算法进行改进,解决了标准PSO算法搜索精度低,容易陷入局部极值的缺点.最后使用改进LSSVM模型对不同数据集进行训练,完成行程时间的预测.研究表明:(1)对历史数据集的分类,提高了模型预测的准确性;(2)与传统模型相比,改进后的模型训练速度更快,预测精度更高.
【期刊名称】《长春理工大学学报(自然科学版)》
【年(卷),期】2018(041)005
【总页数】6页(P116-121)
【关键词】行程时间预测;历史数据集分类;改进LSSVM模型;混合核函数;PSO算法
【作者】李松江;宋军芬;王鹏;杨迪
【作者单位】长春理工大学计算机科学技术学院,长春 130022;长春理工大学计算机科学技术学院,长春 130022;长春理工大学计算机科学技术学院,长春 130022;长春理工大学计算机科学技术学院,长春 130022
【正文语种】中文
【中图分类】TP391
高速公路作为现代化的交通基础设施具有高速迅捷的特性,而节假日免费放行政策造成的交通拥堵严重扰乱了出行者的时间安排,因此,科学有效的交通预测方法成为了能够有效缓解我国高速公路节假日交通拥挤的重要手段,而行程时间预测可以有效调节出行者的路径选择[1,2],节省出行时间[3-5]。
在行程时间预测方法的研究方面,统计模型和智能化方法不断被提出。李瑞敏等使用多源数据,建立了权重分配和神经网络的数据融合模型对行程时间进行预测[6]。BUSTILLOS等结合N-Curve与KNN方法,提出了单近邻与多近邻的行程时间预测模型[7]。Wosyka等布设车牌识别系统采集车辆行程时间,建立决策树模型预
测行程时间[8]。Wang J等提出STDNN时空延迟神经网络模型预测行程时间[9]。上述预测方法中的样本数据都需要依托采集设备完成,由于经济状况和高速公路的等级局限,导致数据获取困难、信息缺失。而收费数据易获取、质量高、实效性强,且能反映车辆行驶信息,因此本文采用获取方便的收费数据,对节假日高速公路行程时间进行预测。
1 数据来源
以第一类客车(7座以下轿车、客车)的行程时间作为预测主体数据,实验选取东北某省2012年至2015年高速公路部分路网法定节假日收费数据作为历史数据集,以2016年S1路段(19.68km)数据作为测试数据,预测该路段的行程时间。首先统计车辆从收费站i到收费站j的进入时间和离开时间,然后按照公式(1)计
算从收费站i至收费站j平均行程时间,时间间隔为15min。
式中,Ni,j,m是时段m内驶入收费站i,驶出收费站j的车辆总数;tex(p,j,m)是样本数据中第p条记录中车辆驶入收费站j的时刻;ten(p,i,m)是数据中第p条记录中车辆驶出收费站i的时刻。
2 数据分析及分类
以东北某省高速公路为例,对其节假日数据集按照行程时间分布规律集进行分类。(1)清明节数据分析
统计2012年至2016年清明节时期某路段的客车数据,按照公式(1)计算行程时间,得到图1的清明节期间行程时间的变化曲线。
图1 清明节行程时间变化
(2)劳动节数据分析
以2012年至2016年五一期间的客车收费数据为例,按照公式(1)计算行程时间,得到图2劳动节前、中、后期的行程时间变化曲线。
图2 五一行程时间变化
(3)国庆节数据分析
统计2012年至2016年的收费数据,按照公式(1)计算行程时间,得到图3国庆节期间行程时间的变化曲线。
图3 国庆节行程时间变化
(4)元旦时期数据分析
统计2012年至2016年这5年元旦期间的收费数据,按照公式(1)计算行程时间,得到图4元旦前期、中期、后期行程时间的变化曲线。
图4 元旦行程时间变化
(5)春节数据分析
统计2012年至2016年这5年春节期间的收费数据,按照公式(1)计算行程时间,得到图5春节期间行程时间的变化曲线。
图5 春节行程时间变化
通过上述对节假日数据的分布规律,将节假日历史数据集分为5个子集:清明节、劳动节、国庆节、元旦的晨高峰和春节中期的晨高峰为一类;清明节、劳动节、国庆节、元旦前期的午高峰为一类;清明节、劳动节、国庆节、元旦后期的晚高峰为一类;春节前期和后期的高峰为一类;节假日的平峰为一类。
3 高速公路行程时间预测模型
3.1 最小二乘支持向量机
最小二乘支持向量机是一种以支持向量机为基础的基于统计学理论的学习算法,使用最小二乘线性系统作为SVM算法的损失函数,将SVM中的不等式约束变换为
等式约束,简化了模型计算的复杂性,提高了求解速度。
对于给定的训练样本集T=(xi,yi)(i=1,2,…,n),根据结构风险最小化原理,定义以
下优化问题:
式中,ω为权重,γ为惩罚因子,ei为损失函数的松弛因子,b是偏置项。引入Lagrange函数解决上述优化问题:
式中,αi为Lagrange乘子。对式(3)中参数求偏导为零,得到:
联立求解方程组,得到LSSVM的回归模型:
式(5)中K(xi,xj)为核函数。
3.2 构造核函数
在LSSVM模型中,为了更好的拟合,引入了核函数[10],提高了模型的非线性处理能力,解决了维数灾难问题。