基于大数据的犯罪行为分析研究综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于大数据的犯罪行为分析研究综述
作者:杨开鹏高冠东王鹏罗荣源郑俊峰王昕源
来源:《电脑知识与技术》2017年第16期
摘要:随着数据时代来临,目前大数据与云计算技术已经成为人们研究的热点。医疗,经济,政治,文化等领域已经开始结合这些技术进行革新,并应用在各个行业。将大数据技术运用至犯罪行为分析研究上,加速科技强警、精准出警的实现,是警力现代化的必要条件,但目前国内在此方面的研究较少。文章从大数据系统的构建概况、大数据犯罪分析系统的研究、数据挖掘和分析方法研究、GIS犯罪热点技术介绍、犯罪行为模式分析介绍这几个方面较为详尽地对基于大数据技术的犯罪行为分析方法进行介绍与综述。
关键词:大数据;犯罪行为分析;数据挖掘;云计算平台;地理信息系统
随着科学技术的进步,如何应用新兴技术解决社会问题是人们一直思考的问题。根据司法部颁布的《全国监狱信息化建设规划》,制定了信息化建设总体目标为构建能够覆盖全国,操作规范统一、信息资源共享、平台功能完备的现代化信息化体系。而地方各项犯罪数据庞大、错综复杂,本文力图通过犯罪行为分析系统,对该系统内数据进行分析、整理,力图探索罪犯的犯罪规律,为社会治安总结规律并为提高出警效率提供有据参考。
基于大数据的犯罪行为分析,搭建云计算平台,采用带有地理信息的半结构化数据对犯罪行为进行分析,对警力部署效率的提高有很大作用。Matthew a.teddy等人跟踪每周的暴力犯罪事件,利用叶斯半参数模型用于建立标记的泊松空间点的时间序列关系模型,从而实现犯罪热点的检测,提前部署警力预防犯罪。张海文等人提出利用警用GIS平台,把地理信息系统(GIS)、遥感系统(RS)、全球定位系统(GPs),即3S有机地结合起来,为警力指挥调度提供了可视化的、便捷的辅助手段。中国地质大学的陈叶一等人提出运用关联规则以及空间关联规则的数据挖掘技术,对大量而繁杂的警务人口、案件数据进行挖掘;利用GIS地图显示机制与空间分析技术在现有的警务系统的基础之上,建成网络化分布和联网运行的警情研判分析系统。虽然国内外的研究者在不同的时期对犯罪行为分析领域做了较多研究,但目前对犯罪行为的分析还存在不少难点。首先,犯罪行为的发生受较多外在不确定因素的影响,变量多而杂;其次,犯罪数据过于庞杂,主要为非结构化数据,为数据关联分析和挖掘带来很大的困难。本文通过研究犯罪行为分析方法及系统的发展现状,介绍了基于大数据的犯罪行为分析方法和步骤,对数据挖掘和分析方法研究进行了比较和分析,总结概括了不同的分析与研究方法,并对未来云计算平台在司法行政领域的发展趋势进行了探索。
1基于大数据的犯罪行为分析综述
1.1大数据系统构架方案
如图1所示分类表示了大数据分析处理框架,数据源板块除了图中所示的思路外,还可以分为近似实时数据离线数据、线数据和实时数据。图中的分类其实就是说明了数据存储的结构。
在根据往年某区域内犯罪时间的发生频率来预测当今或未来该区域犯罪发生热点地区的时候,需要借助如图2所示的犯罪概率预测平台。该平台的大致原理为在Linux系统上利用Hadoop软件搭建云计算平台,然后将大量非结构化数据进行清理为半结构化数据,在将数据录入GIS。最后将带有GIS信息的往年犯罪数据录入云计算平台,通过该平台来预测与推断某区域未来的犯罪事件发生热点地。
1.3大数据系统及分析技术研究
在国内,2013年山东农业大学农业大数据研究中心的崔文斌等分析了Hadoop集群的构造模块和组件,搭建了Hadoop集群,并进行了测试。2013年首都师范大学的王慧m重点研究了Hadoop软件框架中的HDFS、MapReduce、HBase等组件的核心架构及其运行机制,并分析了框架的不足,如HDFS、MapRe—duce的单点故障及安全性等问题,提出了相应的解决方案,并基于此搭建了高可靠安全的Hadoop环境。在高可靠安全的Hadoop平台上,结合传统分类聚类算法的特点给出了一种基于云计算的数据挖掘系统的设计方案,并对该系统的各层次的功能及该系统中的分类聚类模块进行了详细的阐述。在国外的技术研究方面,2014年计算机科学部门的Dilpreet Singh等调查不同的硬件平台可用于大数据分析和评估的优点和缺点,使用星评级表,严格的定性比较不同平台的六大特点,讨论了对大数据分析的算法。为了提供更多的洞察每个平台的有效性的大数据分析,具体的实现级别的细节在各种平台上广泛使用的k-means聚类算法也在伪代码的形式描述。2016年Janez-Kranjc等提出了一个分布式计算平台平台,称为ClowdFlows,被实现为一个基于云的web应用程序的图形用户界面支持数据挖掘工作流程的建设和执行,包括web服务作为工作流组件。
1.4大数据犯罪分析系统的应用研究
在交通和智能城市领域,2016年广东工业大学的乐柏成提出用Hadoop大数据平台解决交通拥堵问题。2016年吉林大学的赵卫丹针对上海交通大数据,基于Hadoop大数据平台对上海市民一卡通乘车数据进行处理。
在公安司法领域,2013年天津大学的魏婧楠深入剖析大数据内涵与特征的基础上,以天津公安信息化建设为研究对象,使用文献分析、案例分析等研究方法,基于大数据时代发展客观需求对存在的问题进行分析,进而提出针对性的解决方案与对策。2014年广东省中山市公安局的冯冠筹结合公安工作实际和发展前景,提出科学运用大数据原理,着力推动公安工作的科学持续发展,并认为在实施预测警务中必须解决优化技术架构、全警采集信息、规范信息存储、搭建运用平台等问题。在监狱应用这一板块,2015年湖北省孝感监狱信息化管理科的左
运国结合目前监狱的安防现状就目前热门的大数据分析技术在监狱的应用,监狱信息化建设现状及存在问题等做一探讨。
在实际应用方面,2012年6月末,美国洛杉矶警察局宣布扩大对犯罪预测软件的使用,它的原理是根据某地区过去一段时间内的犯罪活动所产生的数据,借助于特殊算法,计算出当地某种犯罪行为再次发生的概率,以及最有可能发生犯罪的时间。它犯罪数据不仅仅能够利用来预防犯罪,还能够帮助从一个更高的角度理解犯罪发生的原因。
2GIS犯罪热点技术介绍
2.1GIS热点与犯罪制图
犯罪制图的过程主要包括寻找热点、分析热点稳定性、进行热点场所的缓冲区制图、基于制图做犯罪空间分布统计和影响因子分析,正所谓“一图胜千言”,一目了然。
第一步,制作热点图。犯罪热点制图的种类很多,有散点图、密度图、色温图、网格图、路段色温图、克里金插值图、局部Gi指数图等。第二步,分析热点稳定性,即探索持续热点区块。随着时间的流逝,犯罪热点呈现出什么形态?第三步,评估热点场所的缓冲区。
2.2犯罪热点技术的应用
犯罪热点的分析结果相对精确地确定了犯罪的高发地区、高发时段或者高发类型等,为警方精确打击犯罪提供了直接的决策支持。不仅如此在公安工作中,警方会依据历史发案情况、当前治安情况以及警力配备情况等进行巡逻路线、卡口位置以及其他防范设施的规划和调整,犯罪热点分析结果则为这种防范控制提供了参考,并可以用来评价其实际效应。
目前,各级公安机关陆续开通了网上公安局、网上警务室、警方论坛、警方微博等系列互联网应用,不仅发挥传统的对外宣传和公告等功能,更重要的是在公安机关和其他行业及群众之间建立了良好的互动关系,满足了公众网上办事、网上议政、网上监督、网上发布等实际应用需求。
2.3犯罪行为模式分析介绍
犯罪模式分析是犯罪情报分析的一种主要类型,同时也是一种常用的犯罪情报分析方法;类似于我国并案侦查中的串并案件。在西方警务执法活动中,常见的犯罪模式分析方法主要有初步分析法与犯罪地图标注法。
在西方警务执法活动中,犯罪模式分析是犯罪情报分析的一种主要类型。犯罪模式分析,就是指情报分析人员通过阅读犯罪报告,查询各种犯罪情报信息,以从大量犯罪案件中寻找那