关联规则方法在智能交通管理系统中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

交通管理技术在昝能交通管理系统中的库用
孙放放1枓彦魅2
孙欺欣1杜彦辉2
1.山东省德州市公安局
2.中国人民公安大学
摘要:智能交通管理系统自应用以来,产生和积累了大量交通管理的各类相关数据,这些以T计算的海量数据中蕴藏着不 能被直观察觉的有价值规律。

将数据挖掘应用于智能交通管理系统,对数据挖掘技术进行分析,并选取了关联规则 中的FP-Growth算法对某市智能交通管理系统中海量的交通违法数据进行分析和挖掘,得到频繁项集,找到了交通 违法行为的一般规律,并根据实际工作经验对挖掘模式和结果进行了评价。

通过实例说明,将数据挖掘应用到智能 交通管理系统中是切实可行的。

关键词:FP-Gnwth離智能麵
引言
智能交通管理系统在辅助管理交通秩序、减少交通违 法行为、实时监控路面交通状况、解放警力等方面已取得显 著成效,因而得到各地交通管理部门的青睐。

智能交通管理 系驢大数据、云计算的落脚点,它集合了舰车数据库、驾驶人数据库'各类业务数据、警情信息等数据。

但传统的 数据统计查询已不能满足查找有价值信息的需求,无法获得 驗在数据之中、深层次的信息和知识。

数据挖掘是当前研究的热点,已被广泛应用于拥有海 量数据的各个行业。

关联规则作为数据挖掘技术之一应用 广泛,关联规则可应用于挖掘智能交通管理系统中的大量 交通违法行为,将道路交通中的人、车、路、天气等不同 属性进行关联规则挖掘,发现各个道路交通要素之间的内 在联系,发现交通违法的内在规律,及时采取相关措施,改善交通违法行为多发地的道路通行环境,有针对性的发
布交通诱导信息,并对特定驾驶员进行提醒和培训,对有
效减少交通违法行为的发生,降低交通事故发生率,缓解
交通拥堵都具有重大的意义。

本文将关联规则应用于智能交通管理系统中进行研
究,选择FP-Growth算法作为本次数据挖掘的工具;在某市
智能交通管理系统中选取主干道的交通违法信息为研究对
象,根据数据挖掘的要求对驾驶人、机动车、违法行为的构
成要件进行概化处理,通过Java实现FP-Growth算法,得
到频繁项集,并根据工作实际经验对挖掘模式和结果进行了
评价。

通过实例说明,将数据挖掘应用到智能交通管理系统
中是切实可行的。

—、数麵处理
东方红路是某市贯穿老城区、开发区、高铁新区的主
〇丨丨〇66〇1111〇丨〇972018年第3期81
交通管理技术
要干道,沿线共有四个大队。

本次以某市智能交通管理系 统中东方红路的交通违法行为为研究对象,进行挖掘实验。

从智能交通管理系统中的后台数据库oracle 11g中提 取东方红路2015年至2016年有效的违章信息共计5万余 条。

每条违章信息包括车辆、驾驶员、违法行为的具体信 息。

车辆信息包含车辆类型、号牌种类、车牌号码等,如 表1所示;驾驶员信息包括姓名、年龄、性别、驾驶年限 等,如表2所示;违法行为包括违法时间、违法地点、违 章代码等。

表1车辆信息表
车牌号车辆类型违章时间点违章类型NXXXXX麵货车2014-1-8 11:34新华书店路口13460 NXXXXX中型客车2014-4-1 06:22大酒店路口12080 NXXXXX小型鮮、轿车2014-8-9 21:01康博大道与东方红路16250 NXXXXX专项作业车2014-9-3 15:56崇德一趙与东方娜13450
表2驾驶员信絲
驾驶员姓名号码性别年龄驾龄黄XX3714281984xxxx男315
孙XX3724211979xxxx男3610
李XX3714021990X X X X女252
王XX3724011952xxxx男6325
由于关联规则分析的是离散的数据,而数据中的很多 都是连续性的字段,并且为了在平台运行时能加快速度不再 识别文字信息,需要对数臟行基于臆的藤里。

•对于车辆类型:CL1[重型货车],CL2[中型货车], CL3[轻型货车],CL4[大型客车],CL5[中型客车],CL6[小型客车、轿车],CL7[麵客车],CL8[专项作业车];
•对于驾驶人年龄:八1[<20],似[20-29],幻[30- 39], A4[40-49], A5[50-59], A6[>60];
•对于驾驶员驾驶年限:D1[<1], D2[1-2], D3[2- 3], D4[3-5], D5[5-10], D6[10-20], D7[>20];
•对于违法地点:L1东方红路与迎宾路交叉口], L2[东方红路与解放路交叉口],L3[东方红路与地安街交叉 口], L4[60009:人民医院路口],L5[德州大酒店路口], L6[东方红路与东地路交叉口],L7[老市局路口],L8[广川 大道与东方红东路交叉口],L9[长河大道与东方红路交叉 口], L10[康博大道与东方红东路交叉口],L11 [晶华大道与 东方红路交叉口], L12[崇德一大道与东方红路交叉口],
L13[崇德三大道与东方红路交叉口],L14[[崇德四大道与东 方红路交叉口], L15[[崇德六大道与东方红路交叉口], L16[[崇激饮道与东方红路交叉口];
•对于违法代码:V1[12080:不按导向车道行驶],V2[13450:违反禁止标线],V3[16250:闯红灯], V4[10390:机动车违反规定停放],V5[13010:机动车逆向 行驶],V6[13440:机动车违反禁令标线],V7[16360:驾 驶中型以外的其他机动车行驶超过规定时速大于30%小于 50%的];
•对于违法曰期数据:按月概化为M1-M12;按星期 雛为W1-W7;
•对于违法时间数据:根据上下班高峰期的经验,概 化为:凌晨T1[00:00-6:59],早高峰T2[07:00-9:59],中午 T3[10: 00-13:59],下午T4[14:00-16:59],晚高峰T5[17:00-19:59],夜间T6[20:00-23:59]。

经过处理的数据如表3所示。

表3预的数据表
车牌号码车辆类型违章类型驾驶员年龄违驾驶员性别NXXXXX CL1V1D3L41 NXXXXX CL6V3D2L21 NXXXXX CL5V1D3L62 NXXXXX CL7V2D5L102
二'数据挖掘
从智能交通管理系统的后台数据库oracle 11g中提取东 方红路2015年至2016年有效的违章信息共计5万余条。

经 过预处理后,得到9217条有效数据进行分析和挖掘。

(—}数情况
从单个频繁项来看,以支持度为指标,按照支持度从
大到小的顺序,得到前10个频繁集,如表4所示。

表4单他项的频s it况
序号频繁项内容支持度
1车辆种类=〇_694.4%
2性别=男70.2%
367.8%
4年龄=A334.2%
5雖地点=L331.5%
6年龄=A231.4%
7时间属性=T330.7%
8性别=女29.8%
从单个选项的频繁情况可以看出,车辆类型为CL6的、违法代码为V2的、年龄为A3等项目出现频率的支持度较 高,值得关注。

在违法行为中V2、V1值得关注,V4、V5、V6' V7的支持度相細氐。

(二)关K W J分析
参考文献[5]中,采用Visual C++编程工具,可以在 Microsoft Visual C++ 6.0中进行编程和运算,论文探索用 Java实现FP-Growth算法。

编程的源代码借鉴其他参考文献 的部分内容,部分源代码表述如下:
82I罾親涿3 2018年第3期
FP-Growth算法:
public void FP-Growth(List<List<String»trans Records,
List<String> post Pattern){
Array List<Tree Node> Header Table= build Header Table(trans Records);
Tree Node tree Root= build FP-Tree(trans Records, Header Table);
if(tree Root.get Children()==null I I tree Root.get Children().size()== 0)
return;
if(post Pattem!=nullX
for(Tree Node header:Header Table){
System.out.print(header.get Count() + ■N T+ header.get Name〇);
for(String ele:post Pattern)
SystBm.out.printfV1+ ele);
System.out.println();
}
FP-Growth(new Trans Records,new Post Pattern);
}
}
—般模型默认的支持度为0.1,置信度为0.8。

根据交警 部门业务经验,这里将支持度设为0.005 (0.5% ),置信度 设为0.33 ( 33% ),通过关联规则分析,可以得到5823条 频繁项集。

设置最小置信度为0.35,根据业务知识,通过挖掘从
众多规则中选择获得的部分有效的关联规则如表5所示。

表5通过关联规则挖掘出的频繁规则集
序号规则集支持度置信度比例
1
{驾龄=D5,年龄=A3,车辆种
类=〇_6,星期=W2丨=>丨违法代
码=V2}
1.30%68.18%(120/176)
2{年龄=A2}=>{违雜码=V2}21.42%68.12%(1974^2898)
3
{驾龄=D6,年龄=M,车辆种
类=CL6,时间属性=丁2}=>{违
航码=V2}
1.02%68.12%(94/138)
4{年龄=A2,性别=男,时间属
性=T2}=>{违法代码=V2}
3.47%68.09%(32C V470)
5雌地点=L3}=.狱码=V1}29.08%83.75%(2880/2900)
6
{时间属性=T2,违法地点=L10}
=>{违献码=V1}
11.98%22.45%(572/2548)
7
{车辆种类=CL6,星期=W6}=>
{违献码=V2}
7.32%69.44%(675/972)
8
{月份=M7,违法地点=L12}=>
{违雜码=V2}
7.28%91.67%(671/731 )
9{违法代码=V3}=>{违法地点=L13} 4.60%53.30%(226/424)规则鮮:
1: {驾龄=D5,年龄=A3,车辆种类=CL6,星期
=W2}=>{违法代码=V2},表明驾龄在5~10年、年龄在
30 ~ 39岁之间的驾驶人于星期二驾驶轿车出行时,如果出
现违法行为,压线的可能性为68.18%。

2: {年龄=/^2}=>{违法代码=V2},表明年龄在20~
29岁的驾驶人在出行时,一旦违法,有68.12%可能会有违
反禁止标线的行为。

因此要面向年龄为20 ~ 29岁的驾驶人
重点进行违反禁止标线违法行为的危害宣传。

3: {驾龄=D6,年龄=A4,车辆种类=CL6,时间属性
=丁2}=>{违法代码=V2}表明驾龄在10~ 20年、年龄在40~
49岁的驾驶人,驾驶小型车辆,_旦在早高峰7:00~
10:00的时间范围内出行,其出现违反禁止标线违法行为的
可能性为68.12%,因此需要加强在早高峰时段内对小型车
辆的治理。

4: {年龄=A2,性别=男,时间属性=丁2}=>{违法代码
=V2},表明年龄在20~ 29岁的男性驾驶人在时间早高峰
7:00 ~ 10:00的时间范围内,容易发生违反禁止标线的违法
行为,可能性为68.09%。

因此,需要在早高峰7:00~
10:⑴的时间范围内开展针对男性驾驶人的交通安全宣传。

5: {违法地点=13}=>{违法代码=V1},表明在地安街与
东风路交叉口发生不按导向车道行驶的违法行为的可能性为
83.75%,支持度为29.08%,因此需要加强该地点的违法行
为环境的治理。

6:埘间属性=12,违法地点=L10}=>{违法代码=V1},
表明康博大道与东方红路交叉口在早高峰7:00 ~ 10:00的时间
〇丨1〇66〇1111〇丨〇972018年第3期8
3
交通管理技术
范围内,出现不按导向车道行驶的可能性为11.98%,因此需 要加强_□的早高峰麵遙錢治力度。

7: {车辆种类=CL6,星期=西6}=>{违法代码=V2},表 明小型轿车在周六出行,出现违反禁止标线的可能性为 69.44%,因此开展此类时间段内针对性的执法。

8: {月份=M7,违法地点=1_12}=>{违法代码=V2},表 明7月份,在崇德一大道与东方红路交叉口,小型车辆的违 法行为较为突出,可能性为78.81 %,因此需要开展针对性 的治理。

9: {违法代码^3}=>{违法地点=L13},在专门针对闯 红幻现象的研究中,发现只要是闯红灯的违法行为,在崇德 三大道与东方红路交叉口出现的可能性为53.3%,应展开专 门治理。

三、结果评价
数据挖掘结果表明:
(1 )在地安街与东顺交叉口发生不按导向车道行驶 的违法行为的可能性较大,在德州市交警支队设施大队得 知:该处信号灯绿灯时显示有左转箭头,但指示标线不允许 左转,容易造成驾驶人误判。

2015年6月纖处信号灯已设置为黄灯闪烁,无违法抓拍电子设备。

该结果与实际情况相
(2)年龄在20~29岁的驾驶人在出行时,_旦违 法,在有2/3可能会违反禁止标线,说明年轻的驾驶人容易 忽略该违法行为。

(3 )康博大道与东方红路交叉口在早高峰7:00 ~ 10:00 的时间范围内,出现不按导向车道行驶的可能性非常大。

该 路口是经济技术开发区的主要干道,早高峰上班时间较为拥 堵,经常出现右转车道直行的违法行为,与实际情况相符。

拟建议设施部门更改道路标识标线,允许车辆在右转车道直 行行驶,喇随法行为的发生,减少早高峰时期的拥堵。

(4 ) 2014年以来交管部门加大了对闯红灯违法行为的 处罚力度,扣分从3分提高到6分,闯两次红灯就要重新考 科目_,闯红灯的违法成本较大,该交通违法行为也逐渐减 少。

崇德三大道是经济技术开发区与高铁新区的交界,2014年7月份在与东方红路交叉口处闯红幻现象较多,因为 高铁新区的电子警親拍在7月份正式开始使用,在以后的 月份中逐渐减少,说明电子警察抓拍在处罚违法驾驶人的同 时,起到了威慑作用,8月份以后,闯红灯现象明显减少。

(5 ) 2014年以来,公安部交管局同样加大了对超速违 法行为的处罚力度。

超速违法行为的违法代价较大,根据以往的工作经验判断,该违法行为明显下降。

根据以上分析表明,本文以德州市智能交通管理系统 的违法数据作为挖掘对象,使用Java实现FP-Growth算 法,挖掘结果是有效的,是符合交通管理工作实际的,可以 用于指导日常的公安交通管理工作。

四、结束语
根据公安部、省公安厅部署,山东省作为“大数据、瞀务云”试点单位,在数据采集、数据融合'数撫究方面发展迅速,目前全省各公安部门都在建设大数据库,并通过 市么咬局接入省JT*务云平台。

智能交通管理平台自使用以 来,为大数据警务云工程提供了大量鲜活的数据。

数据挖掘 能够从海量数据中挖掘出隐藏的、深层次的、有价值的信息 和知识。

论文将数据挖掘技术应用于智能交通管理系统,通 过对海量的交通违法数据进行分析和挖掘,棚交通违法行为的一般规律,对未来的交通违法行为进行预测,为交通管 理者提供决策支持,有针对性的开展整治行动,从而减少交 通违法,缓解交通拥堵,降低事故发生概率〇K
参考文献
[1]Dursun Delen,Ramesh.Sharda^Max Bessonov.Identifying
Significant Predictors o f Injury Severity in Traffic Accidents
Usii堪a Series o f Artificial Neural NetworksQ].Accident
Analysis and Prevention,2006(38)1: 434—44.
[2] 兰天.关联规则数据挖掘方法的研究与实现[D].西安科技
大学,2008.
[3] 徐甲平.面向智能交通系统的空间数据挖掘技术研究[D].
同济大学,2007.
[4] 孟碧波.数据挖掘技术在智能交通检测系统中的应用[D].
武汉理工大学,2008.
[5] 谢亚芬.基于GIS和数据挖掘的智能交通管理系统的设计
与实现[D].浙江工业大学,2006.
[6] 王新宇,杜孝平,谢昆青.FP-Growth算法的实现方法研究
[]].计耸机工程与应用,2004(9): 174-176.
[7] 谢嘉孟,彭宏,周兵.基于数据挖掘技术的智能交通信息分
析与决策研究[J]•公路,2〇04(4): 156-158.
[8]Zhu Liyun,W en Hui min,Sun Jianping.A pplication Oriented
Spatio-temporal Data Model Design for Transportation
Planning[C]//Proceedings o f t he IEEE ITSC2006, 2006 IEEE
Intelligent Transportation Systems Conference,Toronto,
Canada,September,2006: 17—20.
[9] 肖揭,叶楓.智能交通系统开发中关联规则挖掘算法的应
用〇].计算机系统应用,2009(9): 136-139.
[10] 李雪峰.P2P僵尸网络体系结构研究|D]■清华大学,2011.
[11] (加)Jiawei Han.MiclielineKamber著.数据挖掘概念与技术
[M].范明,孟晓峰译.北京:机械工业出版社,2005.185.
[12]Huanjing Wang,Allen Parrish,Randy K Smith.Improved
Variable and Value Ranking Techniques for M ining
Categorical Traffic Accident DataQ].Expert Systems with
AppHcations,2005(29):795-806.
84匿麗U32018年第3期。

相关文档
最新文档