一种公安专题知识图谱系统的构建方法[发明专利]

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201811326924.5
(22)申请日 2018.11.08
(71)申请人 北京航天长峰科技工业集团有限公

地址 100854 北京市海淀区永定路50号
(72)发明人 朱彤 张丹普 
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/25(2019.01)
(54)发明名称
一种公安专题知识图谱系统的构建方法
(57)摘要
本发明提供一种公安专题知识图谱系统的
构建方法,基于人、事、地、物、组织构建包含社会
关系网络与事件的知识图谱,实现高效线索研判
和深度挖掘预警,包括案件线索解析、人案关系
智能推演、犯罪团伙挖掘、时空轨迹比对、高危人
员预测预警、情报数据挖掘分析等,降低公安人
员与后期研发人员工作量。

权利要求书1页 说明书2页CN 111159418 A 2020.05.15
C N 111159418
A
1.一种公安专题知识图谱系统的构建方法,其特征在于,包括:
(1)数据抽取:使用基于kettle的ETL平台,将分布的、异构数据源中的数据如关系数据、平面数据文件抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库Hive中,作为知识图谱的数据源;
(2)知识表示:根据数据源中表结构与先验业务知识,将数据抽象为RDF知识三元组表示;
(3)知识存储:使用Jane与neo4j图数据库,配合Hbase、Hive大数据存储技术,实现基于图数据库的混合存储技术实现大规模知识图谱数据存储;
(4)知识融合:使用Limes度量空间的链接发现框架,实现对RDF等知识结构中对相同实体结构进行关联;
(5)知识推理:构建各类群体、事件的社会化关系网络知识图谱,根据搜索关键字进行本体知识的因果分析获得新的知识推论,具体方案使用Jena处理RDFS的规则引擎接口;
(6)搜索分词:使用THULAC中文词法分析工具包,对搜索内容进行分词,支持中文语言直接搜索知识图谱知识关系。

权 利 要 求 书1/1页CN 111159418 A
一种公安专题知识图谱系统的构建方法
技术领域
[0001]本发明涉及公共安全技术领域,具体涉及一种公安专题知识图谱系统的构建方法。

背景技术
[0002]公安部门的网络普遍存在业务数据机密性要求高、业务连续性要求强、网络结构相对封闭、信息系统架构形式多样等特点,而公安内部网络中不同业务功能模块的信息安全需求又各不相同:如面向互联网的便民服务信息系统具有相对开放的结构特点,用户一般为普通民众,便民服务业务对数据的可用性和完整性要求往往大于其对机密性要求;而独立运行的业务信息系统具有相对封闭的结构特点,用户一般为内部用户,用户对数据的完整性和保密性要求往往大于可用性要求。

[0003]因此,公安网络安全风险贯穿公安内部网络和互联网,可以认为:外部网络面临的服务中断、外部攻击、非法入侵、安全漏洞等威胁的概率比较大;而内部网络面临的敏感数据泄露、监管审计不到位等威胁概率比较大。

[0004]目前公安内部网络和外部网络的安全控制与措施大多独立考虑,导致只解决了局部问题,未能从整体解决安全问题,从而降低了整体的安全效率,导致多个信息安全孤岛。

因此,传统的安全防护系统已经难以满足内控与合规管理要求,主要面临以下新的问题:[0005]安全架构日趋复杂、新型技术不断涌现;
[0006]不但有传统物理服务器、网络设备和安全设备,也有虚拟服务器和虚拟设备;不仅有C/S,B/S架构传统应用,也有云平台和大数据应用;
[0007]安全数据快速增长,数据快速处理能力不足;
[0008]每台物理设备每天生成5万至50万条安全事件,全网带宽也从百兆提升至千兆,每年需处理的安全数据在10TB数量级,而现有安防系统的处理能力仍停留在1TB数量级,无法快速提取有价值的数据进行分析;
[0009]安全处理能力分散,未能形成整合优势;
[0010]现有安全处理方式仍然按照防火墙、病毒防范、行为审计等独立事件进行处理,未能整合安全事件之间的相互关系、行为关联来产生总体安全态势,缺乏科学决策依据。

发明内容
[0011]本发明的目的在于针对公安安全面临的诸多问题,采用大数据整合公安方面海量数据,构建面向实战的全息画像和知识图谱系统。

[0012]本发明的技术方案如下:
[0013]一种公安专题知识图谱系统的构建方法,其特征在于,包括:
[0014](1)数据抽取:使用基于kettle的ETL平台,将分布的、异构数据源中的数据如关系数据、平面数据文件抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库Hive 中,作为知识图谱的数据源;
[0015](2)知识表示:根据数据源中表结构与先验业务知识,将数据抽象为RDF知识三元组表示;
[0016](3)知识存储:使用Jane与neo4j图数据库,配合Hbase、Hive大数据存储技术,实现基于图数据库的混合存储技术实现大规模知识图谱数据存储;
[0017](4)知识融合:使用Limes度量空间的链接发现框架,实现对RDF等知识结构中对相同实体结构进行关联;
[0018](5)知识推理:构建各类群体、事件的社会化关系网络知识图谱,根据搜索关键字进行本体知识的因果分析获得新的知识推论,具体方案使用Jena处理RDFS的规则引擎接口;
[0019](6)搜索分词:使用THULAC中文词法分析工具包,对搜索内容进行分词,支持中文语言直接搜索知识图谱知识关系。

[0020]本发明基于人、事、地、物、组织构建的社会关系网,有助于实现公共安全领域的高效线索研判和深度挖掘预警。

实现人案关系可视化的智能推演分析,提供精准高效的可疑团伙和高危人员预测预警。

业务上达到大案快破、小案多破、提前预警,实时管控的作战效果。

具体实施方式
[0021]本发明基于人、事、地、物、组织构建包含社会关系网络与事件的知识图谱,实现高效线索研判和深度挖掘预警,其能力包括案件线索解析、人案关系智能推演、犯罪团伙挖掘、时空轨迹比对、高危人员预测预警、情报数据挖掘分析等,降低公安人员与后期研发人员工作量。

[0022]具体包括如下步骤:
[0023](1)数据抽取:使用基于kettle的ETL平台,将分布的、异构数据源中的数据如关系数据、平面数据文件抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库Hive 中,作为知识图谱的数据源;
[0024](2)知识表示:根据数据源中表结构与先验业务知识,将数据抽象为RDF知识三元组表示;
[0025](3)知识存储:使用Jane与neo4j图数据库,配合Hbase、Hive大数据存储技术,实现基于图数据库的混合存储技术实现大规模知识图谱数据存储;
[0026](4)知识融合:使用Limes度量空间的链接发现框架,实现对RDF等知识结构中对相同实体结构进行关联;
[0027](5)知识推理:构建各类群体、事件的社会化关系网络知识图谱,根据搜索关键字进行本体知识的因果分析获得新的知识推论,具体方案使用Jena处理RDFS的规则引擎接口;
[0028](6)搜索分词:使用THULAC中文词法分析工具包,对搜索内容进行分词,支持中文语言直接搜索知识图谱知识关系。

相关文档
最新文档