大数据浪潮中犯罪防控系统分析及应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第21卷第4期重庆科技学院学报(自然科学版)2019年8月大数据浪潮中犯罪防控系统分析及应用
邹开其
(大连大学信息工程学院,辽宁大连116622)
摘要:对犯罪问题的深人具体研究,有助于客观评估犯罪的实际状况,合理制定打击犯罪的专项政策和措施,从而 降低犯罪率。介绍大数据的研究现状和发展趋势,以及利用大数据知识对各种主题下的犯罪类型进行预测的方法。
综合分析复杂可变的犯罪因素,预测潜在案件发生的趋势及属性,并对发展情况进行预测分析,有助于提前布警布 控,使犯罪防控技术更为完善。
关键词:大数据;犯罪预测;犯罪防控技术;犯罪预测模型
中图分类号:TP311 文献标识码:A文章编号:1673 -1980(2019)04 -0001 -05
信息技术的不断发展,以及云计算、互联网技术 的兴起,引发了数据模式的更新变化。大数据,已成 为当下最热门的技术词语之一,逐渐应用于各个领 域。例如,大型超市沃尔玛每小时处理逾100万条 用户请求,维护着一个庞大的数据库[1]。有专家预 测,到2020年全球数据将增长402。届时,每秒 钟,将有290封邮件发送,亚马逊将接受72. 9笔订 单;每月,人们浏览F acebook的总时长可达7 x 108 mm[1]。与传统的数据相比,大数据的性质发生了根 本性的变化,数据技术面临巨大的变革。
1大数据基本概念
大数据技术被定义为:“以新数据处理技术为 手段,在海量、结构复杂、内容多样的数据集中,以较 快速度解析出具有规律性或根本性的判断、趋势或 预见”[2]。这意味着,大数据的出现伴随着信息价 值产生和集成的过程。在解决大数据问题的时候,数据大小只是需要考虑的因素之一。对于很多企业 来说,面对数据量增长的同时,更要面对其增强后的 复杂性。例如,采用先进的识别模式,不是只针对数 月前的数据进行分析,而是更多地针对数年甚至数十年来的完整数据进行分析。大数据的应用价值巨 大,对社会及科学研究的各个方面都有重要的意义,可为人们更深入地了解和感知这个世界提供丰富的
信息。2009年,Google(谷歌公司)研究员通过对每
日超过30亿次搜索请求和网页数据的挖掘分析,在
H1N1流感爆发几周前就预测出流感即将传播。2010年,《时代》杂志刊载的“医学界年度十大突破 性”研究成果中,医疗科技公司CardioD X公司就是
通过对上亿个基因样本大数据的分析,最终识别出
能够预测冠心病的23个主要基因。2012年,著名
国际咨询机构Gartnei•公司(高德纳咨询公司)预测 =,全球大数据相关产业的规模将达到2 320亿美 元。通过对微博等网络大数据的挖掘分析,能够发
现社会动态,预警重大事件和突发事件[3]。大数据
有以下几个主要特点*
(1 ) 数 量庞 大。大 数 规模
10T B级,有更多的数据甚至达到P B级规模。
(2)数 丰 。数 相 丰 ,主 包含了结构化、半结构化和非结构化等数据类型。
(3 ) 数 处理速度快。数 量相 庞大
况下,也能对数据进行及时处理。
收稿日期:2019 -05 -13
作者简介:邹开其(1944 一),男,硕士,国家二级教授,日本东京理科大学客座教授,比利时根特大学客座教授,研究方向为神 经网络、图论、模糊逻辑、CF范畴;任大连大学学术梯队带头人,大连大学应用数学研究所所长,埃及国际知识基础 系统会议副主席,国际信息工程和知识工程会议主席,国际创新计算、信息与控制学术会议主席,2015东方思维与 模糊逻辑国际学术会议组织委员会主席,国际一般系统论研究会中国模糊信息与模糊工程专业委员会理事长,中国运筹学会模糊信息与工程分会执行理事长;获评为大连市科技精英;被国家劳动人事部评为特殊贡献专家,享受 国务院政府特殊津贴。
邹开其:大数据浪潮中犯罪防控系统分析及应用
(4)数据价值密度低。数据的总量与价值密度 呈反比。
从数据库到大数据,表面上看似只是技术上的 演进,但仔细研究会发现,两者存在本质上的区别。大数据的出现,使得数据的来源、处理方式等都会发 生革命性的变化,彻底颠覆了传统的数据管理方式。
2国内外大数据发展状况
2.1国外大数据发展状况
大数据这个概念最早出现于1980年。在大数 据的应用方面,国外比较领先。如Windows Azure 平台,这是一个云计算平台,可提供云服务[4]。同时,亚马逊的云计算平台也能提供全球领先的云计 算服务,通过平台可展开新应用的研发。还有,公司也在研究如何实现大数据挖掘,以便为用户提供更多、更好的决策[5]。
2.2国内大数据发展状况
国内的大数据发展还处在初级阶段。早期,腾 讯、百度、淘宝等互联网企业,就曾对每天产生的 浏览、交易数据进行用户行为分析。用户行为分 析对如何吸引更多的互联网用户起着非常重要的 作用。例如,淘宝网会在每年的“双11”购物活动 中,根据不同区域的用户及其购物习惯,在首页推 送个性化商品信息,以吸引更多用户来浏览[(]。随着大数据的普遍应用,将有更多企业针对不同 用户产生的大数据进行分析和数据挖掘,并据此 制定最优决策。
目前,大数据应用水平比较领先的行业有医疗、通讯、金融等行业[>9]。在这些行业中,利用大数据 挖掘了新的业务,甚至改变了商业模式。在医疗行 业中,随着电子医疗的广泛应用,医学影像、电子病 历以及各种药物的研究结果等,都在各医院信息系 统中以数据库的形式保存起来,各地的医疗系统通 过联网,实现了数据库的规范化应用。为了紧跟互 联网的发展浪潮,通讯运营商也将技术发展的重点 转向了大数据。例如,中国电信的“天翼空间”等新 网数 ,大数 。大数 据时代背景下,用户量、用户访问习惯等都可以被分 类、归纳、分析,揭示潜在的机会,企业据此开展各种 活动并推广给用户。此外,金融服务行业也同样通 过挖掘大数据来满足客户的新需求,以提升自身的 优。
大数据热潮,使得“拿数据说话”的思想更深入 • 2 •人心,改变了从前不重视数据积累的传统认识。有
了这种思维模式,大数据的应用就有了很大的发展
景。
3大数据在犯罪防控系统中的应用
3.1犯罪预测模型
科学地应用犯罪预测技术,可以帮助公安机关
更有效地对未来发生的犯罪行为进行预测,并且以
此为据进行战略部署,使社会资源发挥到最大功
效[10]。将大数据技术应用于犯罪防控,我们便可通
过分析犯罪数据库,找出潜在的犯罪规律,从而为科
学决策提供技术支持[11]。例如,如果用数据分析法
预测出某地区的犯罪率,那么我们就可以通过部署
降低犯罪率的方案来应对不同的预测结果,从而对
警力资源进行合理分配[12]。比如,若某地区犯罪率
高,我们就相应增加10%的警力;若该地区犯罪率
非常高,我们就增加60%的警力。
犯罪大数据是指反映与犯罪相关的人、事、物特
征,时空分布特征及其变化过程的多源数据,主要具
有多源异构和高维度的特点[1+]。
(1)多源异构。犯罪数据的来源相当复杂,包 括人口基本信息数据库、违法犯罪人员数据库、案件
信息库、警员基本信息库等。犯罪数据的类型多样,
包括犯罪位置、车辆轨迹、犯罪现场照片、统计数据
等多种结构化和非结构化的数据。
(2) 度。产 和 是多
相 作用 结 ,数量 和 相
关。每个犯罪对象都有许多独立或者属性相关的数 ,数 库 作 时间、、作
点手段等多个属性。在分析过程中,需进行多维度分
析,分析十几个甚至更多维度之间的相互关系。
基于数据分析的预测模型,是对输入数据和输
出数 映 。首 ,构将与 每
条重要信息(时间、人物、事件、手段等等)以电子数
据的形式保存起来,然后再对各种数据予以集中分 ,构 模 ,。构 模 之 ,
必须对已知的数据进行整理,挖掘其中规律,并进行
归类。根据犯罪数据,公安机关应对嫌疑犯的特征
进行整理和汇总,将关于嫌疑犯的所有数据映射为
多维空间向量[14-15]。
3.2犯罪轨迹数据分析及案例
3.2.1 犯罪轨迹分析
轨迹,是指某一个点所通过的全部路径。犯罪