大数据技术在公安综合情报工作中的落地与应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我国政府部门目前几乎没有使用大数据技术,很多政府部门 并未对利用大数据提升业务能力予以足够重视,大数据资源 管理的思维尚未建立。大数据在政府治理中的技术运用尚在 探索。因此,现阶段最基本的思想认识就是“务实”,特别 是综合情报部门不能跟着互联网商业“大数据”的套路“瞎 起哄”。要把成熟的商业“大数据”工具、技术与公安综合 情报业务实际相结合,与当前数据现状相结合,与公安的其
鼍爹j辫
摘要:
“大数据”在公安综合情报领域的应用是一项系统工程,理清实际应用需求,找准实现路径与方法,结合实战引入成 熟的“大数据”技术,逐步形成具有公安综合情报工作特点的“大数据”应用体系。
关蝴:大数据公安综刽青报应用
的综合情报分析过程中,查询或者检索将不再是主要的应用
一、引言
综合情报应用是近年来公安机关为实现警务机制升级 转型而衍生的一项重要新职能,各级公安综合情报部门作为 一支研判违法犯罪规律、辅助警务战略决策和指导“打防管 控”警务实战的新兴力量,无可避免要与“大数据”亲密接 触。海量、动态、多样的“大数据”浪潮使传统的公安情报 分析思维和行为方式面临着巨大挑战。高效整合数据资源, 将“大数据”的理念、技术手段和运作模式率先在公安综合 情报部门“落地”,已经成为当前公安机关迫切需要研究和 着手解决的重大课题。
三、解决路径
当前公安机关面临的“大数据”应用还属于起步阶 段, “现阶段,大数据在政府治理领域还未得到足够重视。
(二)统筹不同类型数据库技术的综合应用 数据处理的核心手段和支撑是数据库技术。 “大数
据”应用也不例外,当前公安机关遇到的主要数据库技术首 先是关系型数据库。如ORACLE、MYSQL等;其次是 NOSQL类的数据库,这一部分在公安行业处于起步阶段, 目前集中在一些应用比较发达的地区使用,比如 HADOOP的Hbase等;第三是内存数据库,又包括集中内 存技术和分布式内存技术,其SPARK就属于后者。对于 上述三类数据处理技术。 “大数据”应用更为侧重后两者,
的、或者涉及多个变量运算以及一些实时处理。内存数据库
的优势就比较明显。
数据存储
S
数据资源
Βιβλιοθήκη BaiduDS
raCle
T O
‘\√
KAFKA
基础算法包括聚类、决策树算、贝叶斯等。虽然这些算法都 已经非常成熟,但是,如何将公安数据源和公安综合情报分
公安 各类 数据 采集 应用 服务
MYSOL
R M
消息 队列
\——一/
Parallel
据的集中度等.观测分布的主要目的就是了解数据稳定性和
集中度。三是洞察趋势。即研判目标数据的发展趋势。通过 既往积累的海量数据判断未来数据是波动还是平缓。分析哪 个阶段变化较大,预判异常数据点可能何时发生。洞察趋势 的目的就是把握工作的整体的走向。因此这是综合情报部门 “大数据”应用的最高级方式。 从技术支撑看:综合情报部门欲顺利将“大数据”落 地应用,以下三个基础技术支撑能力必不可少:一是具备高 效处理海量结构化数据的能力。随着信息化应用的深入。常 规数量的数据已经远远不能满足警务实战的需要,如现在的 侵财型犯罪分子驾车流窜作案特征明显,这就需要我们对车 辆卡口的抓拍信息进行细致分析。通过车辆信息来确定相应 人员的轨迹,目前一个地级市一天的卡El车辆数据就有上千 万条,对一个月的信息进行处理。面临的数据就是数个亿。 二是具备高效处理分布存储数据的能力。由于目标数据量呈
增长、结构不断更新。公安综合r褂艮应用面临的形势已经从
原先的基础信息登记加常规数据集数据统计,发展到了海量 数据汇聚加“大数据”分析预测的新阶段。在“数据为王” 的时代。公安综合情报部门对“大数据”应用落地的需求主 要集中在内容、方式和技术支撑三个方面: 从内容看:基于数据进行相关规律分析将是一段时期 内公安“大数据”落地应用的主要内容。在基于“大数据”
大数据专家委员会.
[21 Amnd
I加mam著[美],王斌译.大数据 /互联网大规模数据挖掘与分布式处理. 术研究.警察技术2013(05).
它代表着用系统的方法描述解决问题的策略机制。对于综合 情报而言,其主要工作是研判分析,因此对数据分析的系列
算法的研究与落地是“大数据”应用落地的关键。所谓的基
础算法是根据数据创建数据挖掘模型的一组试探法和计算 为了达到创建模型的目的,算法首先将对目标数据进行分 析,并查找特定类型的运行模式或者发展趋势。数据分析的
Search
图2买时处理与离线处理相结合的应用模式
(三)研发一个灵活的“大数据”建模工具平台 公安综合情报分析的深化应用牵引着“大数据”技术 的“落地”进程,驱动着信息化建设从传统的系统集成向海 量数据存储、—体化调度管理和深度整合应用发展。面临海 量数据进行情报的挖掘分析,必须搭建一个基于模型的海量 数据挖掘分析工具平台。综合情报部门对海量数据挖掘分析 的本质特征是演绎、归纳、推导,循序渐进,由此及彼,由 表及里,由浅入深的过程,也是一个建模、验证、流程化、 智能化的过程。“大部分数据建模的方法可以描述为下列两 种做法之一:一是对数据进行简洁的近似汇总描述;二是从 数据中抽取出最突出的特征来代替数据并将剩余内容忽 略”,公安情报分析的业务建模也是如此,它是具体情报分 析业务的抽象和概括。面对海量的数据的压力,实现从业务 模型到数据模型、软件模型的统一。综合情报部门的“大数 据”建模工具平台,必须依托分布式并行处理的总体架 构。通过统一的数据服务总线。支持不同类型的海量数据的 分布存储与异地计算,支持结构化数据及非结构化数据的标 准化处理。应当采用图形化的模型搭建工具,支持流程化的 模型配置。需要集成第三方插件,支持将其他工具及服务简 易地集成与应用,实现从业务模型到数据模型、软件模型的 流程化与智能化。 (四)实现数据分析基础算法向公安情报分析专业算 法的演进 算法是针对某一类问题而形成的完整和准确的解题方 案。在信息化领域,算法就是一系列解决问题的清晰指令,
综合情报应用 数据处理
传统关系型数据 处理体系:
常麓结构化敛据 OLAP/OLTP,元数据.锁
现出几.何级数的增长,动辄以数亿来计量的数据显然已经无
法用常规数据交换工具来进行汇聚,以往使用的清洗转换汇 聚的手段已经无法完成任务。因此必须具备和掌握处理分布 数据的统一架构与相应的工具手段。三是具备高效处理实时 数据的能力。对于综合情报部门而言,实现以上两项能力还 不够,因为它们大多是建立在离线数据非实时处理基础上。 处理的数据对象—般相对静止。综合情报部门的部分工作带 有很强的时效性,需要实时处理数据,如对机动车的布控与 路面查缉,若信息延迟数分钟,被查缉的车辆早已经在数十 公里之外,可能所有的路面查缉动作都会成为摆设。只有具 备数据实时处理的能力,才能使情报服务实战落到实处。
公安综合情报的应用,是一场真正意义上的变革,在技术推 进的同时,必须要对传统的情报工作流程、管理规范乃至组 织架构进行重组,对相关的控制节点进行重构,最终还要对 效果评估进行重新定义和设计。技术与业务两者互相促进, 互相推动,方能真正实现“大数据”在综合情报音6i-]的落地
与应用。目
眨弱圜
『11中国大数据技术与产业发展白皮书∞14),中国计算机协会
商业“大数据” 处理体系:
巨■怔价值密虞螂
机制.索引.SOL执行与 优化.埋存处理,备份. 监控臂理
箍裟瓣‰擀篙器 :!l鬻墓5|m
基础数据源
HADOOP框架I HDFS存 储.MIR计算框架.HIVE 等).SPARK框架.
KAFKA辅.STORM流
式处理NOSQL数据库…
圈1以MPP为主体的总体架构
对关系的洞察是公安“大数据”应用的杨b内容,包括信息
与信息之间的关系、数据与数据之间的关系、数据与警员之 间的关系等。 从方式看:对公安行业而言,数据收集、汇总可能不 是难事,难点在于对收集好的数据按照何种方式进行解读, 最终如何展现才能服务实战应用。当前“大数据”比较容易 在公安综合情报部门落地应用的方式。包括以下三种:一是 进行比对。其中包括微观形态的数据碰撞形式和宏观形态的 整体对比形式。前者类似于小数据集条件下的应用,比如在
Processing)并不是一个新事物,提出这个架构是因为它与 当前公安层级管理模式和应用现状比较匹配。在技术上又能 兼顾传统关系型数据库处理与商业“大数据”处理两个套路 的优势。特别是目前“大数据”处理的主要对象还是海量结 构化、半结构化数据,在大多数情况下要进行包括元数据,
数据表、索引文件等基础管理,且要求能够比较好的支持
万方数据
逃人员比对:后者简单的如环比和同比方式,复杂一点是基 于时间轴或者区域划分来判断延续性、变量关系和相关关系 等。二是观测分布。对目标数据段的整体分布进行分析。得 出发散度或者集中度,还包括中间值判断或者某个占比的数
他信息化应用相结合,有的放矢,循序渐进。找到“大数 据”在公安综合情报部门“落地”途径,除了领导重视、组 织领导等常规工作举措以外,需要做好以下四项重点内容。 (一)搭建一个以分布式并行处理体系为主体的总体 架构 分布式并行体系(MPP,Massive
形式。综合情报部门的应用重点是使用海量的数据去洞察客 观规律。以及通过各种工具和方法发现警务活动中隐含的知 识。与以往警务决策更依赖直觉和经验相比,随着“大数 据”时代的到来,之前处于主导地位的公安传统业务专家的 地位会逐步改变,
“大数据”思维将大大优化我们警务“知
识库”。这个“知识库”主要包含三个方面内容:一是警务 信息背后的规律。涉及到公共安全的每一张图片、每一段文 字、每—个视频,都是警务信息,对所有与警务相关信息的 规律洞察和理解是公安“大数据”应用第一个重要的领域。 二是警员行为背后的特征。这项可以扩大到每一个参与公共 安全活动的对象,包括警员、辅警甚至是治安积极分子,主
析方法与之相结合,最终封装出一批直接服务警务决策和警 务实战的公安“专业算法”,是综合情报部门研判工作深化 发展的必由之路。比如聚类算法在公安情报部门的落地应 用,就可以以相关人员的行为特征进行聚类,得出嫌疑指数
C…’
搜索
0LAP
L—
Hbase
eais
圄
高。刁
HADOOP离线处理
m怕e l同
一s
/
比较高的人群。当然。专业算法的落地是与建模工具平台密 切相关的,只有基于建模工具平台进行具体专业算法的应 用,这类算法才可能真正得到固化和更大范围的普及共享。
但在具体应用时,要看到上述三个方面都是各有所长、互相 补充的,比如,结构化程度很高的轻量级数据使用关系型数
Police
Technology
2015年第3期
9
万方数据
目囤
据库;海量数据检索。特别是类似车辆轨迹动辄会达到百亿 的巨量结构化的信息,基于Hbase进行检索就是一个比较合 适的选择。还有一些数据量不是很巨大。但是要求找出频次
二、需求分析I 一、rr日1、/J’I』
近年来,全国公安机关大力推进信息化建设工作,为 公安综合情报应用向纵深发展奠定了坚实基础。特别是在数 据层面。各级公安机关掌控的数据种类不断丰富、总量急速
要体现在每个参与对象的基本行为特征、潜在操作习惯,应 用发展走向等内容。三是警务活动形成的“关系知识库”。
四、结语
“大数据”的在综合情tE音Sl'7的应用最终的落脚点是 业务价值,最终目的是对海量的数据进行处理后,不但能够 全局共享。实现查询、比对、统计等基础应用,更能支撑趋 势预测、辅助决策、洞察规律等进一步的深度应用,只有这 样才能最大限度的体现“大数据”在公安情报战线的价值。 “大数据”在公安综合情报部门的应用是公安工作实现新一 轮跨越的一项t,?,4-T-工程,在此过程中,我们除了技术的推进 外,更要关注相匹配的机制体制配套,没有相应的机制体 制,技术更新永远只是属于小打小闹的局部“手术”或者是 一种改良,只能在个别环节上提高工作效率。 “大数据”在
SQL体系,便于与目前已经存在的公安业务应用进行对接。 采用这种架构的另一个好处是可以有效衔接列存储、大索引 文件、流式比对、并行数据加载等多类“大数据”处理技 术,使这些“大数据”技术在当前警务活动中找到合适自己 的应用场景。另外,这个架构也可以有效支撑PB级别的结 构化、半结构化的数据分析。对于搭建公安情报中心的新一 代“数据仓库”,分布式并行处理架构是一个比较合适的 解决路径。