基于多机器学习竞争策略的短时交通流预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

收稿日期:2015-11-20
修回日期:2016-05-25
录用日期:2016-05-31
基金项目:国家自然科学基金/ National Natural Science Foundation of China(61273304);上海市重点项目/ Key Projects of
Shanghai City(ZY3-CCCX-3-6002);南昌大学研究生创新项目/Innovation Project of Nanchang University(cx2015097).
条交通道路监测的交通流量信息构成的交通流量
时间序列信息系统,记为 Di = ( Ai,Vi,Ni,F,g) .
{ } 其中 Ai = ai1,ai2,⋯,aim 代表第 i 条道路内 m
个具有时间先后顺序的交通流时序段构成的集
合,每个时序数据段的长度为 h 个时间单元.即对
第 i 条道路的第 j 个时间窗口的数据表达为
(aij
Biblioteka Baidu
,
1)öø÷,
f
æçt è
(aij
,
2)öø÷,
⋯,
f
æçt è
(aij,
ö h)ø÷
数据样本 Di 对应的时间序列 Vi 集合可以记 为交通局部时序数据矩阵模型 Vi 如式(1)所示.
第 16 卷 第 4 期
基于多机器学习竞争策略的短时交通流预测
187
Vi
=
éTSi1ù ëêêêTT⋮SSii2mûúúú
在 上 述 单 种 类 机 器 学 习 方 法 的 基 础 上 ,文 献 [4]提出了一种混合 AGO-SVM 高速公路交通流 量预测方法.文献[5]采用一种布谷鸟搜索算法优 化 BP 神经网络参数的短时预测模型.文献[6]提出 了基于最小二乘支持向量机的交通流量预测改进 模型.文献[7]结合集成学习的思路对 GMDH 算法 进行改进.文献[8]针对短时交通流变化周期性与 随机性特点,选取时间和空间序列流量观测值作 为支持向量机训练样本进行训练,使用空间序列 预测值对交通流时间序列预测结果进行修正,并 通过对历史时间空间序列预测结果分析,动态调 整其对未来预测的影响.还有文献[9]针对预测精 度问题,提出一种分车型的流量预测方法,实验取 得了很好的预测精度.
路采集的原始信息以车辆为单位,包括道路编号,
牌照、到达时间、离开时间等.首先对各道路每分钟
车流数量进行统计,并将交通流量数据按一定时
间长度进行统一的窗口切分.最后将流量的度量离
散为不同级别.
指定某区域内 L 条交通流量数据的集合设
{ 为 D = D1,D2,⋯, DL} ,且 Di ∈ D 的语义为 D 中第 i
第16卷 第 4 期 2016 年 8 月
交通运输系统工程与信息 Journal of Transportation Systems Engineering and Information Technology
文章编号 :1009-6744(2016)04-0185-06
中图分类号 :U491.2
Vol.16 No.4 August 2016
Abstract: Short- term traffic flow prediction is an important issue of traffic- oriented big data application. Traditionally, traffic flow prediction is determined by the local recordings, whereas the natural relations of adjacent roads are neglected. Based on the characteristic of downtown traffic flow, a multi-dimensional data model concerning relevant roads is proposed. Meanwhile, a multi- machine learning competing strategy is developed. The essence of proposed prediction strategy is training commonly used machine learning algorithms independently with the clustered temporal information as input. By selecting high prediction performance as dominating weak classifier, the weight is further assigned to corresponding algorithm so that a strong classifier is eventually developed. As a result, the traffic flow prediction problem is converted to a weighted multi- machine learning problem. Experiments on downtown streets of Nanchang show that the superiority of proposed method as compared to traditional single time series based solutions. Keywords: urban traffic; traffic flow; machine learning; ensemble learning; time series
(即 V1,V2,V3,⋯,Vl ),按照每段时间序列的起始时 间的先后顺序组合转换成一列数据.最后将需要预
测的第 i 条道路的各个时间窗口未来 k min 交通流
量值 Ni = {Ni1,Ni2,k,…, } Nim 加入到相应时间段,作
为相对于第 i 条道路预测的一列决策数据.得到如
ù ú úú
⋮ úú
f (t(aim,h))ûú
(1)
式中:每一行表示为对应 TSij 数据集合的 h 个数据
的水平转置.
由于各道路之间的交通流量会相互影响,因此
不直接使用单条道路的历史流量数据来预测未来
流量,而是对该道路及其邻近道路历史数据进行建
模.将 D 集合中 L 条道路的交通局部时序数据矩阵
Prediction of Short-term Traffic Flow Based on Ensemble Learning Mechanism
XU Jian-feng1,2, TANG Tao1, YAN Jun-feng1, LIU Zhen3
(1. School of Software, Nanchang University, Nanchang 330047, China; 2. School of Electronic and Information Engineering, Tongji University, Shanghai 201804, China; 3. School of Computer Science, Beijing Jiaotong University, Beijing 100044, China)
| | a ={t ,t ,t ,…,t } ij
(aij , 1)
(aij , 2)
(aij , 3)
(aij , h)

aij ∈ Ai
、 aij
=h

t(aij,k + 1) 与 t(aij,k) 之间满足前驱后续关系.
Vi ={TSi1,TSi2,TS ,i3 …, TSim} 代表第 i 交通道
的 多 条 道 路 作 为 研 究 对 象 ,并 提 出 了 基 于 集 成 学 习 思 想 的 混 合 多 机 器 学 习 [10-12] 策 略 的 交 通 流 量预测模型.本模型将交通流量预测看作多维时 间序列数据挖掘.
1 多维时序交通流量数据分析
本研究的实验对象选取的是电子警察测速仪
采集的各个道路主要路段交通车流量数据.每条道
路监测的流量数据样本中的 m 个前驱后继的交通
流量时间序列数据构成的集合.
{ } { Ni =
Nik1,
Nik2,
⋯,
Nk im
代 表 Vi = TSi1,TS , i2
TSi3,…,TS }im 中每段历史交通流量时序数据之后的
连续 K min 内交通流量取值的集合(特征值可以是
流 量 、平 均 速 度 或 其 它 指 标),其 取 值 由 映 射
可以看出,上述研究往往都是以被预测道路 自 身 的 数 据 作 为 研 究 对 象 进 行 分 析 和 建 模 ,而 临近道路之间的交互影响一般都较少研究.但 是 ,同 一 区 域 内 的 多 条 道 路 之 间 的 交 通 流 量 显 然 具 有 一 定 的 关 联 性 ,因 此 本 研 究 以 同 区 域 内
近年来,许多学者已经提出了一些短时交通 流量预测的预测模型.例如文献[1]提出小波分析 的支持向量机预测模型,模型首先对交通流量进 行小波分解,使交通流量平稳化,得到交通流量信 号的高频和低频部分,采用支持向量机进行预测, 最后将高频和低频部分的预测结果采用小波重 构,获得最终预测值.文献[2]认为交通状态中存在 混沌,该文运用混沌与分形理论恢复交通流量序 列的动力学系统,并用多元局域预测法对时间序 列进行预测,并实地采集数据运用模型进行分析 校验,取得了较高的预测精度.文献[3]针对短时交 通流量预测中的不确定信息难题,提出了一种基 于贝叶斯网络的多方法组合预测模型,其预测精 度优于单一的预测模型.
g:TSij

Nk ij
决定,其中
j ∈{1,2,⋯,m} .
F 是一个映射,F:aij → Tij ,其语义为 Vi 中的
任意第 j 段时间序列数据 TSij 与 Ai 中的第 j 段时
序 数 据 段 aij 的 一 一 映 射 关 系. 可 记 为
( ) { } Tij = F aij =
f
æçt è
作者简介:徐健锋(1973- ),男,江西南昌人,副教授,研究生导师,博士生.
*通信作者:jianfeng_x@ncu.edu.cn
186
交通运输系统工程与信息
2016 年 8 月
0引言
21 世纪以来,各国城镇化及家庭汽车急剧增 加.尽管这些给人们出行带来了便利,但由于交通 基础设施的发展速度无法赶上私人汽车的发展速 度,交通拥堵问题越来越突出,交通事故也日益增 多.以短时交通流量预测为核心的交通智能诱导技 术越来越成为未来智能交通的热点问题之一.
文 献 标 志 码:A
基于多机器学习竞争策略的短时交通流预测
徐健锋*1,2,汤 涛 1,严军峰 1,刘 真 3
(1. 南昌大学 软件学院,南昌 330047;2. 同济大学 电子与信息工程学院,上海 201804; 3. 北京交通大学 计算机系,北京 100044)
摘 要: 交通流量预测是当前交通大数据应用的重要议题之一.经典的交通流量预测 方法通常只根据被预测道路自身的数据进行分析和决策,而往往较少考虑由于同一区域 不同道路之间的交通流量关联性.本研究根据城市核心区交通流量数据的特点,构建同区 域内多条相关道路的交通流量多维度数据模型.并且,基于该数据模型提出了一种基于多 机器学习竞争策略的交通流量预报算法.该算法的主要核心思想是利用时间序列聚类的 方式将多维交通流量数据进行降维,然后通过引入多种多机器学习方法进行并发训练, 其训练结果通过竞争获得最优分类器群.最后设计了多最优机器学习集成预测方法进行 交通流量预测.本模型通过在南昌市中心道路进行的实验显示,其预测结果优于传统单时 间序列机器学习方法. 关键词: 城市交通;交通流量;机器学习;集成学习;时间序列
=
éF(ai1)ù ëêêêFF⋮((aaii2m))ûúúú
=
é ê êê
f f
(t ) (ai1,1) (t ) (ai2,1)
êê ⋮
ê ë
f
(t(aim,
)1)
f (t(a ),2) i1
f (t ) (ai2,2)
⋮ f (t ) (aim,2)
… …

f f
(t ) (ai1,h) (t ) (ai2,h)
相关文档
最新文档