基于相空间重构与LSSVM的交通流量预测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于相空间重构与LSSVM的交通流量预测
杨文;弓晋丽
【摘要】针对仅利用欧氏距离不能准确反映相空间中相点间的相似性大小,提出一种改进预测模型,该模型同时考虑相点间的欧氏距离和相似性来选取邻近点.在对交通流量时间序列进行相空间重构后,运用最小二乘支持向量机分别对不同方法得到的邻近点进行训练,并对未来时段的交通流量进行了多步预测.实际案例的预测结果表明,改进方法比一般方法具有更好的适应能力和预测精度.
【期刊名称】《交通科技》
【年(卷),期】2010(000)005
【总页数】3页(P78-80)
【关键词】智能交通系统;流量预测;相空间重构;欧氏距离;最小二乘支持向量机【作者】杨文;弓晋丽
【作者单位】同济大学交通运输工程学院,上海,201804;同济大学交通运输工程学院,上海,201804
【正文语种】中文
交通流诱导作为城市智能交通系统的重要研究方向,可以有效地减少交通拥挤和城市环境污染、提高道路通行能力和改善交通安全状况等[1],而实现城市交通流诱导系统的关键和前提是道路交通状况的预测,也就是如何有效地利用交通数据信息去预测未来时段内的交通状况。

过去对交通流量的预测主要是采用指数平滑法、
ARIMA法、Kalman滤波法等[2]。

这些经典的分析方法是把交通流量这一时间序列看成随机过程进行研究的,因而整个理论是以随机过程为基础的。

随着混沌理论的引入,人们发现复杂系统的本质往往不是随机因素而是非线性动力系统中的混沌因素所造成[3]。

在混沌预测中关键是邻近点的确定,因为预测精度在很大程度上取决于所选取的邻近点。

然而以欧氏距离公式所确定的邻近点并不能准确反映邻近点与原相点间的相似性,因此在高嵌入维数的重构相空间其预测精度往往不够理想。

据此,本文提出了一种改进方法的预测模型,该模型在选取邻近点时,将同时考虑相点间的欧氏距离和相似性。

1 相空间重构的基本原理
相空间重构是根据有限的数据在重构的相空间中把系统的混沌吸引子恢复出来以研究系统动力学行为的方法,其基本思想是:动力学系统中任一分量的演化都是由与之相互作用着的其他分量所决定的,这些相关分量的信息就存在于任一分量的发展过程中。

这样,就可以从某一分量的时间序列数据中提取和恢复系统原来的运动规律。

因此,在重构一个相空间时,只需考虑一个分量,通过决定系统长期演化的单一变量时间序列来研究系统的混沌行为。

Takens[4]证明了在由一维观测序列及其适当的延时值所构成的维数合适的相空间中,混沌系统演化的动力学特征可由此空间中的点的演化轨迹无歧义的表达出来。

将这个观测值及其延时值所构成的空间称为重构相空间,这种以数据构造系统等价相空间的方法叫做相空间重构法。

对于时间序列{xi,i=1,2,…,n},n为序列的长度。

根据Takens提出的嵌入定理,重构相空间为(xi,xi+τ,…,xi+(m-1)τ),i=1,2,…,M [5]。

式中:xi为相空间的点;m为嵌入维数;τ为延迟时间;M为重构相空间中相点的个数,M=n-(m-1)r,相空间的吸引子矩阵为
2 最小二乘支持向量机
支持向量机是一种新型机器学习算法,与传统的神经网络学习方法不同,实现了结构风险最小化归纳原则,而神经网络方法实现的是经验风险最小化归纳原则。

支持向量机模型同时最小化经验风险与VC维的界,这就取得了较小的实际风险,即对未来样本有较好的泛化性能。

支持向量机的另一个优点是它的训练等价于解决一个线性约束的二次规划问题,存在惟一解,解中只有一部分系数不为零,对应的样本就是支持向量。

支持向量机己经扩展为解决非线性回归估计问题,而且与神经网络方法相比,有着显著的优越性,被认为是人工神经网络方法的替代方法。

最小二乘支持向量机(least squares support vector machines,LSSVM)是支持向量机的一个版本,它是将标准支持向量机算法中的不等式约束转化为等式约束而得到的[6]。

与支持向量机的其他版本相比LSSVM的待选参数少,这就减少了一些不确定性因素,另外,该算法采用了最小二乘法,这也是它的运算速度明显快于支持向量机其他版本的原因。

3 基于相空间重构与LSSVM的交通流量预测模型
3.1 改进的邻近点选取方法
在邻近点的选取过程中,不仅希望邻近点与预测中心点的距离较近,而且希望邻近点与预测点的演化趋势尽可能相似。

本文对选择邻近点的方法进行了改进,邻近点与当前相点之间不仅要满足一定的欧氏距离限制,还要满足一定的相似系数大小的限制,即只有同时满足这2个限制的邻近点才是最邻近点。

以下是相似系数的判定准则[7]:
以每天一定时段的流量时间序列数据作为一个列向量fk,k为序列长度,选择欲加以分析的n个数据向量构成矩阵F=[fk1,fk2,…,fkn],2向量之间的相关程度定义为相似系数S,即:设fa和fb是2组流量数据,则
式中:Cov(fa,fb)为2个数据向量之间的协方差系数;D(fa)和D(fb)分
别为2组数据向量的方差。

Sab越大,表明2个数据向量之间的相似程度越大。

3.2 预测流程
预测流程如图1所示。

图1 基于相空间重构与LSSVM的交通流量预测流程
3.3 评价指标
为了评价预测效果,选取了下面的4个指标作为评价依据。

式中:F为预测值;R 为实际值。

(1)相对误差
(2)平均绝对百分比误差
(3)平均绝对误差
(4)均方误差
4 案例分析
数据采用上海南北高架路某检测线圈检测的每5min交通流量,从2006年10月23日开始到27日止,时间是每天00:00~24:00。

用10月23日00:00~10月27日07:30的流量数据作为已知数据,预测10月27日07:30~09:30的交通流量。

首先用Lyapunov指数法对交通流量时间序列的混沌特性进行判断[8],计算得到最大Lyapunov指数为λ=0.008 4>0,表明该流量序列具有混沌特性。

利用互信息函数法计算延迟时间τ=6。

利用Cao氏法计算嵌入维数m =8。

在对邻近点进行选取时,采用了改进的邻近点选取方法。

首先用欧式距离法计算当
前相点与每个相点的距离,邻近相点的个数根据阈值进行调节。

本文选取阈值K1
为0.13,相点间距离小于0.13的邻近点为暂时邻近相点,然后计算当前相点与每个暂时邻近相点的相似系数,阈值K2取0.995,相似系数大于0.995的暂时邻近相点作为最终邻近点。

以选取的最终邻近点向量作为LSSVM的训练样本,把当前相点输入训练好的LSSVM模型,即可得到一步预测流量值。

把预测相点作为当前相点,再进行邻近点的选择,重复以上步骤进行滚动预测,得到交通流量的多步预测结果。

一般方法与改进方法的预测误差见表1。

表1 一般方法与改进方法的预测误差比较方法MAPE/%MAE/(pcu·5min-1)MSE/(pc u·5min-1)一般方法4.05 11.750 0 2.938 6 4.53 13.166 7 3.397 3改进方法
从表1可见,不管是MAPE、MAE 还是MSE,改进方法的误差都小于一般方法。

其中,一般方法的绝对百分比误差大于10%的有3个,最大为13.79%,最小为0.31%,小于5%的占总数的58%;而改进方法的绝对百分比误差大于10%的有
2个,最大为14.18%,最小为0,小于5%的占总数的75%。

整体而言,改进方
法要优于一般方法。

5 结语
对于给定的交通流量时间序列,在判断其为混沌系统的基础上,用相空间重构来近似原系统状态空间,并在该相空间中,用最小二乘支持向量机建立多步预测模型。

在选取训练样本时,考虑到单纯用欧氏距离法不能准确反映邻近点与预测中心点的相似程度,提出了改进的邻近点选取方法。

预测结果显示,将相空间重构理论和最小二乘支持向量机结合起来所建立的预测模型能够捕捉到原混沌系统的动力学特征,改进方法比一般方法具有更好的预测精度。

参考文献
[1]刘静,李亮,关伟,等.基于神经网络的北京环路交通流短期预测研究
[J].交通运输系统工程与信息,2005,5(6):110-115.
[2]史其信,郑为中.道路网短期交通流预测方法比较[J].交通运输工程学报,2004,4(4):68-71.
[3]Hu J M.An applicable short-term traffic flow forecasting method based on chaotic theory[C]//Proc.of IEEE 6th International Conference on Intelligent Transportation Systems(Vol.1).2003:608-613.
[4]吕金虎,陆君安,陈士华.混沌时间序列分析及其应用[M].武汉:武汉大学出版社,2002.
[5]Kennel M B,Brown R,Abarbanel H D I.Determining embedding dimension for phase space reconstruction using ageometrical construction [J].Physical Review A ,1992,45(6):3403-3411.
[6]Kang Y W,Li J,Cao,G Y,et al.Dynamic temperature modeling of an SOFC using least squares support vector machines[J].Journal of Power Sources 2008,179(2):683-692.
[7]Ou X L,Qiu G.Analysis of similarity for urban traffic volumes [J].Central South Highway Engineering,2003,28(2):4-7.
[8]Rosenstein M T.A practical method for calculating largest Lyapunov exponents from small data sets[J].Physica D,1993,65:117-134.。

相关文档
最新文档