基于支持向量回归的行程时间预测算法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于支持向量回归的行程时间预测算法

作者:邱淳风王珊王超群

来源:《计算机时代》2014年第04期

摘要:作为交通规划、运营和通行能力评估的重要指标,行程时间的预测对出行者的路线和时间点的选择,以及交通规划部门的信号控制策略有着重要的实际意义。对于高级交通诱导系统而言,行程时间预测是一项关键的研究内容。现有行程时间预测方法较少,且预测误差较大。为此,运用浮动车和微波雷达测速数据,提出了基于支持向量机解决行程时间预测的方法,并且与历史平均法进行了比较。在杭州市高架路线上的实验结果表明,所提方法的预测精度大幅度超过了历史平均法。

关键词:支持向量机;行程时间;智能交通;历史平均

中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2014)04-40-03

Abstract: As an important indicator of transportation planning, operations and capacity assessment, the forecasted travel time has important practical meaning for the choice of route and timing, as well as for traffic signal control strategy of transportation planning department. For advanced transportation guidance systems, it is a key issue to predict travel times between pairs of points of interest. There are few travel time prediction methods with high probability of prediction error. In this paper, the speed data returned from probe vehicles and microwave radars is used to predict travel times based on support vector regression(SVR), and the new algorithm is compared to the historical mean algorithm. The experimental results over elevatedroads in Hangzhou show that the SVR based algorithm significantly outperforms the historical mean algorithm.

Key words: support vector machine; travel time; intelligent transportation; historical average

0 引言

行程时间是交通规划、运营和通行能力评估的重要指标。基于预测的行程时间,出行者可以直观地进行路线选择或者出行时间点的选择,交通规划部门能够做出合理的信号控制策略。因此,准确预测行程时间具有重要的应用价值。

支持向量机(SVM)[1]是Vapnik在1995年提出的,已经被广泛地应用到监督分类领

域。因为该方法采用了结构风险最小化的设计,比起经验风险最小化方法,其泛化能力更强,因此往往表现出较强的测试精度。特别地,工程实践往往难以获得大量标注样本,而SVM在小样本学习问题上表现出较佳的性能。另外,SVM采用严格的数值计算方法,不会收敛到局部最小解。在智能交通领域,运用SVM解决交通状态评估的工作较多,并且能得到高精度的路况估计结果。

近年来,基于支持向量回归(SVR)的方法被应用到股市预测[2]、电价预测[3]等领域,表现出较高的预测精度。而在智能交通领域,SVR方法的应用还相对较少。本文运用SVR预测车流量较为集中的城市高架桥的行程时间。

本文的结构安排是:第1节介绍如何计算和预测行程时间;第2节介绍支持向量回归方法;第3节通过实验评估支持向量回归在城市高架桥上的预测精度;第4节总结全文。

1 行程时间计算和预测方法

行程时间指的是从一个感兴趣的位置到达另一个感兴趣的位置所需的车辆行驶时间。一般有两种计算方法:区间观测方法和定点观测方法。前者指的是运用浮动车在感兴趣的两个位置之间行驶,记录耗费的行驶时间。后者指的是运用定点传感器(例如地感线圈、微波雷达、卡口、视频等传感器)采集的大量观测数据估算区间内行程时间。区间观测方法一般具有较高的精度,但测量困难,难以广泛应用。相对而言,定点观测方法虽然精度较低,但在工程上更加可行。

交通数据可以大致分为三类:历史数据、当前数据和预测数据。行程时间的预测方法一般有两种:基于统计模型的预测方法和基于分析模型的预测方法。统计方法可理解为数据驱动的方法,它利用一系列历史变量和当前变量(速度、流量、行程时间)作为输入来预测未来的因变量(行程时间)。常见的统计预测方法包括ARIMA模型[4]、线性模型[5]等。分析模型运用微观的交通仿真器,例如METANET[6]等来预测行程时间。一般运用动态的OD矩阵作为输入,预言结果利用仿真来演化。

2 支持向量回归(SVR)

支持向量机分类方法的基本思想是利用函数Φ将训练数据从低维空间映射到更高维的空间,以类间空白最大化为目的,在特征空间中构造一个分类超平面。给定一组训练向量数据

xi|Rd,i=1,2…,h,其中h表示训练样本的个数。yi=±1表示类标签,即一类用+1表示,另一类用-1表示。SVM将寻找一个超平面法方向w和截距b,使得正实例满足f(x)=wΦ(x)+b⩾0,负实例满足f(x)=wΦ(x)+b

图1是一个支持向量机的例子,假定圈和点分别代表不同的两类数据,在图1(a)所示的输入空间中,找不到一个线性函数可以将两类数据分割,若将数据映射到如1图(b)所示的更高维度的特征空间,则可以找到一个线性函数将两类数据分割开。分割超平面的选择力图最大化类间空白,而类间空白的最大化大大地降低了测试阶段的误判风险。

3 实验

支持向量回归方法需要设定参数,在下面的实验中,我们采用RBF核宽度σ=0.1,

ε=0.02,C=800。

相关文档
最新文档