交通卡口大数据中的套牌车实时检测算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
交通卡口大数据中的套牌车实时检测算法
刘
文,黎茂林
(中国电子科技集团公司第二十八研究所,江苏南京
210007)
摘要:传统的套牌车识别算法通过串行工作方式在网络化城市交通监控系统所产生的大规模数据中进行两两比对实现
套牌车检测,因此在处理海量数据时存在性能瓶颈问题。文章提出了一种新的基于Storm 框架的算法模型,该算法具有实时特征,通过引入多台硬件计算资源协同处理大规模数据下的套牌车检测问题,显著提高了计算性能。同时,采用基于滑动窗口计算技术,能进一步提高算法的检测速度和识别精度。关键词:交通卡口大数据;套牌车;Storm 中图分类号:TP301.6
文献标识码:A
Fake Plate Real-Time Detection Algorithm Based on Traffic Big Data
LIU Wen,LI Mao-lin
(The 28th Research Institute of China Electronics Technology Group Corporation,Nanjing 210007,China )
Abstract :With the rapid development of urban traffic,traditional fake plate detection algorithm which used serial working mode shows performance bottlenecks in dealing with large-scale traffic data.In this paper,we proposed a new algorithm based on Storm framework.It brings real-time data processing capabilities to detect fake plate.At the same time,through using hardware cluster to deal with large-scale data,it improved computing performance significantly.Key words:traffic big data;fake plate;Storm
收稿日期:2017-02-09修回日期:2017-03-02作者简介:刘文(1977-),女,吉林人,高级工程师,主要研究方向:大数据存储与应用;黎茂林(1979-),男,贵州人,高级工程师,主要研究方向:区域卫生信息化系统总体技术。
随着我国经济的发展,以机动车为主的交通工具保有量出现爆发式增长,交通违法行为甚至犯罪急剧上升,机动车套牌违法行为频发。套牌车是指那些没有按照正常程序到交通管理部门领取和办理相关车牌手续,而通过悬挂非法伪造车牌的在交通道路上行驶的车辆。现有的套牌车鉴别和防范方法主要有以下几种方式:基于视频和图形分析的号牌识别技术;防套牌功能车牌;安装无源芯片的智能识别车牌技术;基于电子标签的车牌识别技术;机动车车牌专用固封装置等[1]。
当前,随着全国各城市具备分析功能的视频安防系统的大范围建设和普及,基于网格化的号牌识别系统由于保存了通过该监控点的每一辆机动车的车牌信息,在进行城市的套牌车检测和识别方面具有优势。例如,卢晓春[2]等提出的基于网络化监控的套牌车检测系统,王涛[3]等提出的基于Hadoop 的套牌车并行检测算
法。文献[2]提出了基于卡口时间比对的算法原理,但由于该算法是基于传统的关系数据库,其性能和扩展性存在一定的局限性,即使扩大CPU 、内存等硬件的性能,也不适合实时处理交通大数据,性能瓶颈是个无法避免的问题。文献[3]通过实现MapReduce 并行编程,从并行算法方面在很大程度上提高了交通大数据的处理效率,但实时性还是不能满足实际应用要求。
鉴于上述问题,本文提出了一种新的实时性较好的、基于Storm 的交通卡口大数据套牌车分析算法。该算法采用基于Storm 实时计算框架实现套牌车的检测,解决交通卡口大数据下的检测实时性问题。
1交通卡口大数据的特征及套牌车的形式化
定义
1.1交通卡口大数据的特征
电脑与信息技术2017年6月
城市交通信号灯卡口数据是一种基于机动车检测传感器采集的网络流数据,具有时间和空间特性。随着城市智能交通流检测传感网络的发展,针对一个城市或地区进行交通流数据采集时,形成了网络化存储和访问,其产生的传感器数据也可以称为交通物联网大数据[4]。
交通卡口数据具有如下特性:
(1)事件驱动。实时自动识别车牌号码、车辆类型等信息;(2)非间断性;能够全天候、不间断地对通过卡口的机动车辆进行自动拍摄,准确地记录并存储机动车的牌照、时间、地点、速度、车辆行驶方向、全景等信息;(3)无限体积。
1.1套牌车的形式化定义
所谓套牌车,是指在一定的行使时间内,在不可能同时出现的地理位置检测到多辆相同车牌号的机动车,其更准确的名称应该称为套牌嫌疑机动车辆,但是,确定是哪一辆机动车违法还需要交通执法者进一步确认。为便于表述,将套牌车的形式化上定义为如下的集合形式:
F={Z:D Z=D(T W,G)且Q Z>1}(1)
在式(1)中,F表示套牌嫌疑机动车辆的集合,Z 表示符合嫌疑特征的机动车辆,对Z施加条件成立的两个方面的约束条件:(1)D Z=D(T W,G),即车辆在一个最小行使时间段内,出现在G所标定的空间范围。(2)Q Z>1,表示在条件(2)所限定的时空范围内,车辆Z的出现的次数大于1次。实际中,往往是不能满足在限定条件下的行使时间内同一个车辆出现在两个不同的位置。在城市的视频监控网络中,其分布示意图可表示成如图1形式。
图1城市交通网格化监控系统示意图
在图1中,Z a、Z b等表示机动车检测点的ID。如果任意两个检测点之间可通行,则图1中的边表示两两检测点之间的最短行使时间,定义为:
Tw=min(T(Z o,Z d):坌O,d∧Z o,Z o是监控点(2)
在式(2)中,Z o表示计算行使时间的源监控点,Z d 表示计算行使时间时的目的监控点。在本文中,为避免误将超速车辆判定为套牌车,应该将输入参数的最短旅行时间略大于用极限速度驶完该路径的时间。为了更贴近实际,可以将该时间阈值允许人工根据实际情况调整和校正。
2套牌车实时自动检测模型
模型的中心思想是:同一个车牌,经过不同的交通卡口的时间间隔,如果小于指定的某一最小值,则认为两车存在套牌。卡口最小时间间隔由卡口时间矩阵确定。如图2所示,为实时套牌车判定模型总体结构。
图2套牌车实时自动检测模型
模型的数据为交通局结构化卡口数据,数据结构包括字段:车辆牌照号码、监控卡口经纬度坐标、车辆行驶方向、车辆行驶速度、通过卡口的时间点、车牌照片等信息。
2.1资源化卡口最短旅行时间矩阵
在套牌车判定的算法模型计算之前,需要预先设置任意两个可通行监控点之间的最短行使时间作为检测模型的输入。在本文中,首先计算各个交通卡口间通行需要的最短旅行时间,将其保存到一个大小为m×n 的方阵A中,其中m为交通卡口的个数,A[k,j]中存储从卡口k行驶至卡口j所需最短时间。检测模块针对各个监控点汇总上传到后台中心数据库的车辆信息记录,实时检测相应车辆在指定时间段内通过其它监控点的时间记录,然后针对每个监控点的通过记录,判断此车辆的通过时间到当前时间是否小于这两点之间的套牌时间设定的阈值,如果小于,则认为此车辆有套牌嫌疑。在实时套牌车检测中,只需直接比较车辆驶过各个卡口的时间和通过这段路程所需最短时间,无需重复计算卡口间最短通行时间,达到提高系统效率、缩短运行时间的目的。在车辆牌照精度识别的条件下,本文所述判定方法基本能100%检测监控区域内出现的套牌车辆。
2.2基于Storm框架的嫌疑车辆分析方
法·12·