数据挖掘在智能交通中的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
交通流背景知识
道路交通流量挖掘
交通信息分析与决策系统模型设计
一、交通流背景知识
交通流是在指定时间内通过道路某地点或某断面 的车辆、行人数量。通常仅指机动车交通量。它是 随时变化的,常以平均交通量、高峰小时交通量和设 计小时交通量作为代表性的交通流 。 智能交通业界常用3个参数来定量描述交通流: (l)交通流量,又称交通量,表示在单位时间内通过道 路指定断面的车辆数量,单位是辆/小时; (2)交通流速度,简称流速,表示交通流流动的快慢, 单位是米/秒或公里/小时; (3)交通流密度,表示交通流的疏密程度,即道路单位 长度上含有车辆的数量,单位是辆/公里。
智能交通数据挖掘技术研究中的几个关键方面: 1)交通流量预测 道路交通的变化过程是一个实时、非线性、高维、非 平稳随机过程,随着统计时段的缩短,交通流变化的随机 性和不确定性越来越强。 2)交通拥堵分析 各交通信息采集点采集的道路交通数据随着时间的推 移,已经形成了海量的道路交通数据库,针对大规模交 通数据设计更高效的数据挖掘算法对交通拥堵事件进行 分析成为建立交通拥挤预警和报警系统的关键技术之一。
这三个量之间的关系是一种三维关系,投影到三个二 维坐标系中即是速度--密度、交通量--密度和速度--交 通量之间的关系,如图1所示:
wk.baidu.com
图1 交通量、速度以及密度关系图
根据不同的信息采集技术,道路交通数据分为道路 断面交通数据和道路路段交通数据: (l)道路断面交通数据是用安装在固定地点的交通 检测设备检测移动的车辆,获得的是检测设备设置点 的交通数据信息,一般得到交通流量、速度及占有率 等交通数据。 (2)道路路段交通数据是运用安装有车载设备(如 GPS)的车辆的移动位置获取交通数据信息,移动检测 设备记录车辆的移动信息,通过车辆的移动信息可计 算路段内的交通信息。
图4 交通流量序列分隔 在交通流量序列分割算法中,我们可以发现根据流量 和时间两个维度,先后使用聚类算法划分交通流量模式 是符合交通流量分布情况。
三、基于数据挖掘技术的智能交通信息分析与决策 系统模型设计
(1)交通数据仓库 构建交通信息数据仓库是本系统结构的核心,其实现 形式包括:数据采集与ETL(数据抽取、转换和装载)、数 据仓库管理系统、元数据管理系统三部分。在建模过程 中,考虑到智能交通领域涵盖范围广泛,要求数据仓库具 有很强的可伸缩性。 (2)信息智能分析模块。 在数据仓库基础上直接采用的智能化分析技术主要 有:联机分析处理、数据挖掘和知识发现技术。 联机分析技术的主要功能是进行多维数据分析和生 成报表,并且以一种直观易懂的形式将查询结果提供给 决策人员。数据挖掘与知识发现技术是从海量数据中抽 取隐含的、潜在的有用知识的过程。知识发现是数据挖 掘的主要目的,也是新一代辅助决策系统的关键所在。
2、交通流量预测算法 针对路口短时交通流量预测问题,采用基于交通 流量序列分割和神经网络组合模型的交通流量预测 CITFF(Combined Intersection Traffic Flow Forcast).CITFF算法首先采用聚类方法对交通流量 在流量和时间上进行模式划分,然后再采用神经网 络方法对各个交通流模式进行建模和预测。 2.1 交通流量序列分割 交通流量数据是时间序列的一种形式,最常用的 时间序列分割方法是逐段线性描述,即使用线性模 型对序列进行分割与逐段描述。本文采用基于流量 聚类的方法对交通流流量序列进行分割,选择K— Means聚类算法。
3)交通分布模式分析 采用有效的方法自动快速获取道路网络上交通流 的空间分布模式,根据交通流的空间分布特性,合理 划分路网交通子区。 4)道路交通安全分析 道路交通数据挖掘还包括道路交通安全相关的数 据挖掘,如交通事故的数据挖掘、道路交通犯罪的数 据挖掘等内容。这两部分内容的数据因为管理体制 的关系,目前相关数据分散在各区县公安分局、各保 险公司,并且其中大部分数据属于保密数据,不对外 公开。
二、道路交通流量挖掘 1、问题分析 交通流量预测按照预测时间长短,可分为长期流量 预测(又称战略流量预测)和短时交通预测(一般预测 未来5分钟的流量);按照预测物件,可分为十字路口 流量预测和高速公路流量预测。图2是一个十字路 口的简化模型,其交通流量区别于路段上单点的交 通流量。
图2 十字路口的简化模型
例:某市的城西路是一条穿过市区的主干道,其中城西 路和经发大道以及和机场路的交叉路口是两个非常重 要的十字路口,其车流量大且交通地位高,其地理位置 和相互之间的关系如图3所示:
图3 路口示例 采用序列分割算法,对图3所示经发大道和城西路的向 南方向的来自iCentro View系统中某一天的交通流量 数据(线圈每隔5分钟采集一次数据,一天24小时共获 287个样本)进行分割,得出质心和质量分别为:
(3)辅助决策模块 该模块逻辑上主要由知识库、模型库、方法库、推 理机、咨询/解释系统和问题处理系统构成。 (4)模拟运行模块 该模块主要由问题发生器、情景分析、模拟、优化 和评价比较五部分构成。 (5)接口与会话管理模块 该模块通过可视化技术,提供易于被用户理解和使用 的,具有智能纠错、自我学习的界面系统,并提供自然 语言和人类思维式与计算机之间进行转换的功能。 总结: 该模型采用新一代的信息智能分析手段和决策支持理 论,综合知识工程、人工智能、数据挖掘技术等方面的 研究成果对交通信息进行智能分析,从而为动态交通管 理提供客观科学的依据。
假设交通流为自由流,在长度为L的路段上有连续 进行的N辆车,其速度为V,由三个参数的定义可知: L L路段上的车流密度: K N N号车通过A断面的时间:
L t N
t
N号车通过A断面的交通流量: Q N 将以上各式整理得: Q KV 式中:Q---流量,辆/h; V---区间速度,km/h; K---密度,辆/km.
算法基本思想如下: l)将所有的交通流量数据按照流量值的大小,选择 K-Means算法作为聚类分段的基础算法(取k=3),采 用欧几里德距离作为聚类的距离函数; 2)根据上一步聚类,生成C1 、C2、C3三个簇。 3)经过两步聚类后,我们将一天的流量值聚为7个 簇。 4)计算各个簇的质心和质量,质心的横坐标为时间, 纵坐标为流量的平均值,簇的质量为簇中对象的个数, 按照质心的横坐标(时间)大小排序, 记t1 t2,t3,t4,t5,t6,t7; 对应的质量为m1,m2,m3,m4,m5,m6,m7; 5)按照公式1计算 : ,即 tn mn tn tn tn1 tn mn1 _ mn
交通流背景知识
道路交通流量挖掘
交通信息分析与决策系统模型设计
一、交通流背景知识
交通流是在指定时间内通过道路某地点或某断面 的车辆、行人数量。通常仅指机动车交通量。它是 随时变化的,常以平均交通量、高峰小时交通量和设 计小时交通量作为代表性的交通流 。 智能交通业界常用3个参数来定量描述交通流: (l)交通流量,又称交通量,表示在单位时间内通过道 路指定断面的车辆数量,单位是辆/小时; (2)交通流速度,简称流速,表示交通流流动的快慢, 单位是米/秒或公里/小时; (3)交通流密度,表示交通流的疏密程度,即道路单位 长度上含有车辆的数量,单位是辆/公里。
智能交通数据挖掘技术研究中的几个关键方面: 1)交通流量预测 道路交通的变化过程是一个实时、非线性、高维、非 平稳随机过程,随着统计时段的缩短,交通流变化的随机 性和不确定性越来越强。 2)交通拥堵分析 各交通信息采集点采集的道路交通数据随着时间的推 移,已经形成了海量的道路交通数据库,针对大规模交 通数据设计更高效的数据挖掘算法对交通拥堵事件进行 分析成为建立交通拥挤预警和报警系统的关键技术之一。
这三个量之间的关系是一种三维关系,投影到三个二 维坐标系中即是速度--密度、交通量--密度和速度--交 通量之间的关系,如图1所示:
wk.baidu.com
图1 交通量、速度以及密度关系图
根据不同的信息采集技术,道路交通数据分为道路 断面交通数据和道路路段交通数据: (l)道路断面交通数据是用安装在固定地点的交通 检测设备检测移动的车辆,获得的是检测设备设置点 的交通数据信息,一般得到交通流量、速度及占有率 等交通数据。 (2)道路路段交通数据是运用安装有车载设备(如 GPS)的车辆的移动位置获取交通数据信息,移动检测 设备记录车辆的移动信息,通过车辆的移动信息可计 算路段内的交通信息。
图4 交通流量序列分隔 在交通流量序列分割算法中,我们可以发现根据流量 和时间两个维度,先后使用聚类算法划分交通流量模式 是符合交通流量分布情况。
三、基于数据挖掘技术的智能交通信息分析与决策 系统模型设计
(1)交通数据仓库 构建交通信息数据仓库是本系统结构的核心,其实现 形式包括:数据采集与ETL(数据抽取、转换和装载)、数 据仓库管理系统、元数据管理系统三部分。在建模过程 中,考虑到智能交通领域涵盖范围广泛,要求数据仓库具 有很强的可伸缩性。 (2)信息智能分析模块。 在数据仓库基础上直接采用的智能化分析技术主要 有:联机分析处理、数据挖掘和知识发现技术。 联机分析技术的主要功能是进行多维数据分析和生 成报表,并且以一种直观易懂的形式将查询结果提供给 决策人员。数据挖掘与知识发现技术是从海量数据中抽 取隐含的、潜在的有用知识的过程。知识发现是数据挖 掘的主要目的,也是新一代辅助决策系统的关键所在。
2、交通流量预测算法 针对路口短时交通流量预测问题,采用基于交通 流量序列分割和神经网络组合模型的交通流量预测 CITFF(Combined Intersection Traffic Flow Forcast).CITFF算法首先采用聚类方法对交通流量 在流量和时间上进行模式划分,然后再采用神经网 络方法对各个交通流模式进行建模和预测。 2.1 交通流量序列分割 交通流量数据是时间序列的一种形式,最常用的 时间序列分割方法是逐段线性描述,即使用线性模 型对序列进行分割与逐段描述。本文采用基于流量 聚类的方法对交通流流量序列进行分割,选择K— Means聚类算法。
3)交通分布模式分析 采用有效的方法自动快速获取道路网络上交通流 的空间分布模式,根据交通流的空间分布特性,合理 划分路网交通子区。 4)道路交通安全分析 道路交通数据挖掘还包括道路交通安全相关的数 据挖掘,如交通事故的数据挖掘、道路交通犯罪的数 据挖掘等内容。这两部分内容的数据因为管理体制 的关系,目前相关数据分散在各区县公安分局、各保 险公司,并且其中大部分数据属于保密数据,不对外 公开。
二、道路交通流量挖掘 1、问题分析 交通流量预测按照预测时间长短,可分为长期流量 预测(又称战略流量预测)和短时交通预测(一般预测 未来5分钟的流量);按照预测物件,可分为十字路口 流量预测和高速公路流量预测。图2是一个十字路 口的简化模型,其交通流量区别于路段上单点的交 通流量。
图2 十字路口的简化模型
例:某市的城西路是一条穿过市区的主干道,其中城西 路和经发大道以及和机场路的交叉路口是两个非常重 要的十字路口,其车流量大且交通地位高,其地理位置 和相互之间的关系如图3所示:
图3 路口示例 采用序列分割算法,对图3所示经发大道和城西路的向 南方向的来自iCentro View系统中某一天的交通流量 数据(线圈每隔5分钟采集一次数据,一天24小时共获 287个样本)进行分割,得出质心和质量分别为:
(3)辅助决策模块 该模块逻辑上主要由知识库、模型库、方法库、推 理机、咨询/解释系统和问题处理系统构成。 (4)模拟运行模块 该模块主要由问题发生器、情景分析、模拟、优化 和评价比较五部分构成。 (5)接口与会话管理模块 该模块通过可视化技术,提供易于被用户理解和使用 的,具有智能纠错、自我学习的界面系统,并提供自然 语言和人类思维式与计算机之间进行转换的功能。 总结: 该模型采用新一代的信息智能分析手段和决策支持理 论,综合知识工程、人工智能、数据挖掘技术等方面的 研究成果对交通信息进行智能分析,从而为动态交通管 理提供客观科学的依据。
假设交通流为自由流,在长度为L的路段上有连续 进行的N辆车,其速度为V,由三个参数的定义可知: L L路段上的车流密度: K N N号车通过A断面的时间:
L t N
t
N号车通过A断面的交通流量: Q N 将以上各式整理得: Q KV 式中:Q---流量,辆/h; V---区间速度,km/h; K---密度,辆/km.
算法基本思想如下: l)将所有的交通流量数据按照流量值的大小,选择 K-Means算法作为聚类分段的基础算法(取k=3),采 用欧几里德距离作为聚类的距离函数; 2)根据上一步聚类,生成C1 、C2、C3三个簇。 3)经过两步聚类后,我们将一天的流量值聚为7个 簇。 4)计算各个簇的质心和质量,质心的横坐标为时间, 纵坐标为流量的平均值,簇的质量为簇中对象的个数, 按照质心的横坐标(时间)大小排序, 记t1 t2,t3,t4,t5,t6,t7; 对应的质量为m1,m2,m3,m4,m5,m6,m7; 5)按照公式1计算 : ,即 tn mn tn tn tn1 tn mn1 _ mn