论“大数据”发展给侦查工作带来的新挑战及应对
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
论“大数据”发展给侦查工作带来的新挑战及应对
□周峰
【摘要】【内容摘要】“大数据”的新发展在给侦查工作带来新的机遇和便利条件的同时,也带来了新的挑战。
通过分析数据来源的真实性,数据种类、格式繁多,数据信息价值密度小,数据更新速度快,存储具有一定的时间限制等因素给侦查工作带来的影响,建议加强顶层设计,完善建构工作机制;强化规范基础信息采集,拓宽系统数据信息来源渠道;加强大数据信息交换平台建设,搭建数据情报信息共享平台;规范研判流程,制定专业完整的信息研判流程,创新数据信息研判新方法新战法,建立规范的线索报备机制;强化队伍建设,建立有力的专业研判队伍。
【期刊名称】产业与科技论坛
【年(卷),期】2016(015)017
【总页数】3
【关键词】【关键词】“大数据”;数据分析;规范研判
一、引言
大数据(Big Data)或称海量数据,它指的是所涉及的数据量规模巨大到无法通过人工在合理时间内达到截取、处理、并整理成为人类所能解读的信息。
[1]国际著名的的数据调查公司麦肯锡认为,大数据是指无法在一定时间内利用传统数据软件对其进行收集、存储、处理和分析的数据集合。
[2]
“大数据”的出现标示着一个新的时代已经到来,“大数据”是一种趋势,伴随着互联网新时代的到来,网络化,信息化的发展,时刻影响着人们的生活,同时也给侦查工作带来了新的机遇与挑战。
“大数据”的出现为侦查机关全面
掌控犯罪动态;利用数据挖掘和研判来预防和打击犯罪;使用综合信息作战平台为实现协同作战等提供了可能性。
伴随着电脑、手机终端的普及,QQ、微博,网上购物,尤其是智能手机出现后,各种安装在智能手机客户端上的应用APP的广泛推广和使用,这些新兴事物和技术的出现,给人们的生活带来无穷便利的同时,又使得人们在使用过程中不知不觉将自己的个人信息暴露出来,同时也无法避免地留下数字信息。
这些新兴事物和技术的出现和广泛应用,代表着一种新的变革和一个新的潮流。
如何利用好这一新的事物,如何在工作中结合当前的实际情况,利用好这一新事物的新成果,是值得我们深思的问题。
广泛的信息源头,是海量数据收集的基本条件。
伴随着“大数据”时代互联网技术的新发展,以各种手机购物、手机网上银行、各种打车软件、铁路12306为代表的各种出行购票软件、以聊天为基本功能兼具支付,转账,出行打车,购票,文件传输等综合功能的微信等APP的出现,这些新媒体和包含多元信息的,每天海量的信息数据的产生,给公安情报信息工作提供了很大的便利。
海量数据收集的基本条件已经具备,虽然这些信息源已经出现,也具备海量信息数据收集的基本条件,但也带来了新的挑战。
这些数据信息是公安情报工作的巨大财富,但是这些海量数据只不过是零散的、无序的、不完整的、不系统的,未被结构化、无法直接关联的信息碎片。
可在情报工作中信息只有经过发现,提取,识别和传递以后才能称之为情报。
这些每天产生的数据信息都是一个信息结点,在没有找到各信息的节点的关联处之前,每一个信息点就是一座座的信息孤岛,如同散落在海量数据和信息中的一个个结点,这样的信息只不过是碎片化的信息。
如何充分挖掘碎片化信息中有价值的情报信息,找到与公安工
作需要的情报信息中的连接点,还原案件的事实真相,并对这些信息碎片进行全面准确的搜集以及筛选然后进行深度的挖掘加工研判,使公安情报工作达到事半功倍的效果,是公安情报工作中的关键环节。
二、“大数据”的新发展带来的新挑战
(一)大数据自身的属性给侦查带来的新挑战。
大数据具有数据体量巨大,数据种类繁多,各种数据的格式繁多,数据信息价值密度小,数据更新速度快,数据的存储具有一定的时间限制等属性特征。
1.数据的真实性影响数据的有效性,容易混淆侦查视线,贻误战机。
一直以来,我们都有一个主观的想法就是,只要收集到全面的收据,就一定能够通过数据来分析清楚或者说明问题,但是事实并非如人们的主观想法一样,在我们实际的工作当中虽然获得了数据,但还是会遇到一些无法忽视和避免的问题,比如侦查员在信息数据的搜集时所搜集到的数据是否真实;同时侦查员采集信息时很有可能采集到的数据不一定全面,甚至采集到的数据信息中只有很少部分是与案件相关的数据信息,从而导致侦查员无法研判该信息是否真实有效。
同时在案件的侦查过程中,部分犯罪嫌疑人有很强的反侦查能力,为了转移侦查视线,故意伪造虚假的信息;例如犯罪嫌疑人通过购买他人的身份信息或冒用他人的身份信息从事犯罪活动;同时在信息产生的同时不可避免会产生一些干扰信息,这些干扰信息也同时被数据系统记录下来,例如:网吧上网轨迹信息的记录,身份证遗失后没有及时挂失处理,被其他人捡到后冒名到网吧上网等,这样就不可避免产生干扰信息,同时在公安数据信息平台建设时,部分基层公安机关为了应付检查的需要或者责任心不强,将部分虚假数据导入到数据信息交换平台,无形增加了虚假数据信息的干扰性;所以单纯的数据并不能够说明
所有的问题,也不一定反映的就是全部的事实真相。
2.海量数据的冲击,影响数据的全面搜集,导致难以找到信息的切入点。
海量数据的冲击,伴随着大数据时代的发展和推进,各种各样新的数据源出现,现代科技的进步,几乎全部的数据都能够被记录储存下来,同时新的数据交换方式的产生使得数据信息相互的交流更加频繁,伴随着超媒体,超链接等新的传播方式的产生,无形中加快了海量数据信息的增长速度,除了海量的数据外,新的传播方式为数据信息跨界的传播提供了更加便利的条件。
同时,随着视频监控的普及和公安卡口等手段的普及,现在每天的监控信息量和卡口信息量都不断增长,综合以上所述,新的信息源的出现,新的传播方式的产生,视频监控和卡口为代表的传统数据手段的增长等原因,导致海量数据给侦查工作带来了更大的冲击,增加了数据的采集挖掘难度,对数据的分析能力提出了更高的要求,因为庞杂的资料信息和信息源过多,就容易造成信息混乱容易将真正有价值的信息掩盖住,容易造成信息的浪费和误判。
案件的侦查,数据的挖掘,都是在案件发生以后,所以必须首先找到与案件相关的数据,调取出来以后经过深度的挖掘、加工、分析以后才能成为对案件侦破有用的可视化的信息,这样就出现了以下问题,在调取数据过程中由于大量数据的冲击,增加了数据挖掘、加工、分析的难度,大部分无用的数据将有用的数据信息掩盖,从而影响侦查员的主观判断,往往侦查人员只能找到部分的相关数据信息,甚至是很少部分的信息,这样就导致侦查人员找不到信息的切入点,影响对案情的基本把握,找不到侦查的线索,也就是说由于信息数据的不完整性尤其是关键信息数据的缺失,找不到与案件相关的切入点而造成的侦查僵局。
3.数据种类、格式繁多,给数据的采集、加工,挖掘、分析、共享等带来很大
的挑战。
伴随着智能设备、社交网络、手机APP、网络订购、网络出行等的流行,新的数据信息交换方式的转变,数据类型也变得更加复杂,各种各样的新的数据源也不断地更新和涌现,不仅传统的数据关系没有或者很少被淘汰外,新的数据关系也不断地被提出和应用,传统的网页、视频、音频、e-mail、文档,现在新出现的微信、微博、微视频、手机购物、手机支付、滴滴打车、二维码、12306出行软件等形式存在的未加工的、半结构化的和非结构化的数据。
各种各样的新数据源,数据载体的出现,就容易导致数据类型的更加多样化,传统的数据分析平台也必须伴随着新的数据源新的数据类型的出现而进行进一步的改进,往往在侦查工作中,与案件相关的数据信息跨界度大,除了侦查机关自己建立的数据库了数据存储外,还需要很多社会数据信息的支持,伴随着异地作案,连续作案,流窜作案,网络诈骗,境外作案等新的犯罪形式的出现,同时根据目前大侦查格局的形成,案件的侦破需要对情报信息的收集,存储,交流,共享,分析提出了新的要求,数据信息的分析挖掘也是如此,但是新的信息源出现,数据种类繁多,各种数据的格式繁多,给数据的采集、加工,存储,案件数据信息的挖掘、共享带来很大的挑战,各个数据的格式不一样,兼容性差,数据组合难,难以形成有效的数据信息共享机制。
例如视频设备款式型号多种多样,品牌多种多样,视频信息存储的格式也各不相同,传统常用的视频播放器根本无法满足视频监控播放的需求,这就给视频信息共享带来了很大的阻碍。
4.数据流动速度快,数据的存储具有一定的时间限制等特征,容易导致案件侦查僵局。
我们通常理解流动速度的是数据的获取、存储以及挖掘有效信息的速度。
[2]我们平常使用智能手机,只要打开手机就会有新的数据产生,只要我们
出门,只要我们与社会接触就会有与我们相关的数据产生,数据是时时刻刻都在变化,时时刻刻都在增加的,数据是动态变化的,快速的数据信息更新速度就同样对数据处理能力提出了更高的要求。
数据的提取和挖掘往往是在案件发生后,数据的提取具有滞后性和不全面性的特点,所以不可能就在案件发生的瞬间发现数据,并能将数据提取出来,但是由于存储数据的设备空间往往是有限的额,所以数据保存的时间是有限制的额,数据一旦缺失就不可能再补充回来,所以数据一旦缺失就不可能再补充回来,由数据的不对称性或不完整性造成的侦查僵局案件非常多。
5.数据信息价值密度小,给案件信息的发现、提取增加了更大的难度。
海量的数据在不断增长的同时,隐藏在海量数据的有用信息却没有相应比例增长,反而使我们获取有用信息的难度加大,当前信息载体越来越多,增加不仅仅是数据量的增加,同时伴随着的还有跨界数据的信息连接点的增加,案件相关信息的流转伴随着信息载体和流通环节,跨界环结点增多而增多。
我们所采集的大量数据信息的价值密度很低,能够作为反映案件信息的结点数也更少。
以视频为例,连续的监控过程,可能有用的数据仅有一两秒。
仅仅是数据海量,对于大数据的分析将更加复杂、往往在案件侦过程中更追求速度、更注重实效,所以在提取了大量数据的同时,对深度挖掘数据信息和数据处理分析能力提出了更高的要求。
(二)大数据的新发展给侦查数据应用带来的新挑战。
1.数据调取过程中的难度。
调取难的技术性难度,数据载体各种各样,格式繁多,不同的数据可能需要采用不同的设备和技术进行采集,但是缺乏数据调取的专业人才,所以容易导致由于不会设备或缺乏设备而出现数据无法采集的情
况;在调取数据过程中发现有用的数据难度大,往往很多时候在调取过程中,部分侦查人员由于不熟悉案情,不知道哪些数据是有用,哪些数据是多余的,但是为了搜集证据的全面性,往往将所有的数据全部调取过来,这样进一步增加了数据处理和分析的负担。
后储存的难度,没有有效的储存意识,没有备份意识,时间一长就找不到了,不像公安机关现场勘查一样提取痕迹物证一样保存,而是随意保存的情况居多。
例如在基础信息采集方面:数据信息采集不全面,部分无用信息的过量采集,部分有用数据没有采集并及时导入信息系统,部分单位责任心不强,导致部分假社会数据进入数据系统,部分关键数据没有及时的采集并及时的上传至系统内等原因这样容易造成情报信息的误判错判。
2.数据的挖掘和应用的难度。
由于数据自身存在数据种类繁多的特征,没有同一个的存储格式,在情报信息存储的同时并没有建立有效的数据库和共享的机制,都仅限于本单位或小区域范围的共享,不能够像公安机关现场勘查以及并案侦查数据的共享功能;数据情报共享数据库建立的难,在于各种各样的数据多,种类多,格式多,需要的容量大,检索速度慢,检索的方法不到位,检索的关键词难以确定如何找到需要的数据更难。
目前公安机关已经建立了全国违法犯罪人员信息数据库、指纹信息数据库,全国在逃人员信息库等,然而在大数据时代,这些数据系统的建立还达不到案件侦破工作的需要。
在信息研判中往往出现数据量大,有用的数据很少,容易被忽略,同时数据来往广泛,并不是单一的数据就一定很有用,如何从多类的数据找到关联性同时有些数据的缺失会导致信息研判的丢失,数据没有很好共享给案件的串并工作带来了很大的影响。
在数据的研判过程中,由于数据量太大,容易出现遗漏或者忘却的情况,容易造成误判;数据分析的方法落后,调取的数据往往种类多,兼容性很差,
无法使用传统的软件进行分析。
未建立完整的存储,保留,共享,查询的合成作战机制和制度。
三、“大数据”时代做好侦查工作的对策建议
(一)加强顶层设计,完善建构工作机制。
构建合理的数据信息采集,共享和研判机制,建立有效的多警种紧密协作的长效机制,上下联动同步,建立省厅、市局平台与分县局分层研判,上下信息联通互换互惠。
整合警种资源,信息高度整合,完善信息数据收集的全面性和及时性。
加强对社会数据信息的挖掘能力,并及时将社会数据纳入数据平台,实现数据资源共享引入数据情报信息会商机制、专题化研,建立信息及时汇总、提炼、存储的长效机制。
(二)强化规范基础信息采集,拓宽系统数据信息来源渠道。
围绕案件要素和地域性高危人群要素,健全基础信息采集机制。
基层单位有着得天独厚的条件,能够快速、便捷、规范、高质量地采集犯罪嫌疑人人像、指纹、DNA等多种生物特征信息,并严格控制嫌疑人基础信息采集质量,丰富涉案人员电子数据采集内容。
全面采集嫌疑人手机中储存的通讯录、微信、虚拟身份等电子数据,并自动汇集到电子数据信息应用系统,供情报员开展后续的分析研判工作。
建立与社会有价值领域的数据库单向联系,将其他有价值领域的信息及时导入到数据交换平台,这样一来就极大拓宽了侦查领域的大数据平台的数据来源。
(三)加强大数据信息交换平台建设,搭建数据情报信息共享平台。
现在部分省份已经建立了大数据交换平台,在建立平台的同时加强数据库的建设,严把入口关,加强数据库的数据信息采集,整理和规范入库的质量,建立规范统一的数据信息情报交流平台,强化平台对各种数据的兼容性。
(四)规范研判流程,制定专业完整的信息研判流程,创新数据信息研判新方法
新战法,建立规范的线索报备机制。
建立完整规范的信息采集、分析,研判,线索报备流程。
以行技、网安资源手段为突破点,将刑侦部门的涉案信息与行技部门的“通讯活动轨迹”、网安部门的互联网活动轨迹紧密关联,按照不同类案前科人员的作案手段、犯罪规律开展综合关联比对、复合研判。
健全涉案线索的规范报备,将获取的个案或串案的零星线索通过“平台线索报备”及时报送上级机关,由上级机关范围内比对串并和综合分析研判。
(五)强化队伍建设,建立有力的专业研判队伍。
开展多种形式的培训练兵,创新培训模式,不断提升基层民警信息采集及信息研判等应用技能。
举办大数据相关的技能大赛,选拔优秀的技术能手。
例如上海市公安局于2013年开发了“涉案视频监控基础信息采集”、“涉案手机查询的基本元素”等16个覆盖基础信息采集、研判方面的微课程。
2015年湖南省公安厅在湖南警察学院举行了首届视频侦查岗位能手大赛。
【参考文献】
[1]陶雪娇,胡晓峰,刘洋.大数据研究综述[J].系统仿真学报,2013,8。