【CN109992786A】一种语义敏感的RDF知识图谱近似查询方法【专利】

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 (43)申请公布日 (21)申请号 201910279900.7

(22)申请日 2019.04.09

(71)申请人 杭州电子科技大学

地址 310018 浙江省杭州市下沙高教园区2

号大街

(72)发明人 徐小良 颜海江 王宇翔 何宏 

夏一行 

(74)专利代理机构 杭州千克知识产权代理有限

公司 33246

代理人 周希良

(51)Int.Cl.

G06F 17/27(2006.01)

G06F 16/36(2019.01)

(54)发明名称

一种语义敏感的RDF知识图谱近似查询方法

(57)摘要

本发明公开了一种语义敏感的RDF知识图谱

近似查询方法,该方法包括以下步骤:将类型相

同的RDF知识图谱实体归为一类作为划入领域知

识子图,并将其作为根节点,通过根节点向外遍

历实体,根据实体与根节点周围的谓词的分布计

算混合实体相似度,同时选定合适的阈值,将混

合实体相似度大于阈值的划入子图;利用TransE

方法训练各个子图,获得子图谓词之间的语义相

似度;将谓词相似度作为RDF知识图谱实体之间

边的权重,并通过语义敏感的路径探查方法进行

Top -K近似查询,获取语义近似的路径和实体结

果。本发明利用子图划分,克服了大规模知识图

谱语义相似度时间复杂度高的问题,利用语义敏

感的路径探查方法加快查询的收敛速度。权利要求书2页 说明书5页 附图1页CN 109992786 A 2019.07.09

C N 109992786

A

1.一种语义敏感的RDF知识图谱近似查询方法,该方法包含如下步骤:

步骤1:领域知识子图划分

步骤1.1:领域知识子图划分的初始化

根据RDF知识图谱O中实体的类型,将属于一个领域知识的所有相关实体汇集成领域知识子图,得到O1、O2……O n,其中O i∈O,i=1,2,3…n,领域知识子图O i中都包含了相同类型实体集合E i,其中E i∈E,对于领域知识子图O i 中的每个实体都有

步骤1.2:领域知识子图划分的完善

针对步骤1.1中的领域知识子图O i中的实体集合E i,

逐个遍历实体完善领域知识子图的划分:

a)将实体作为根节点通过广度优先遍历方法在RDF知识图谱O中向外遍历;

b)对探查到的每个实体,

考虑该实体和根节点周围谓词的分布,据此进行基于Jaccard和余弦相似度相结合的混合实体相似度计算;当混合实体相似度大于设定阈值时,将其纳入该领域知识子图,遍历直至找不到满足阈值条件的实体终止;

最终得到与领域知识相关的实体构成的领域知识子图,完成领域知识子图的划分;

步骤2:谓词的语义相似度计算

针对步骤1生成的每个领域知识子图O i,将其构建成TransE的输入数据,利用随机梯度下降法调整其向量表示最小化TransE的目标函数,以获取所有实体与谓词的语义向量,形成模型M i;

接着加载模型M i,对领域知识子图O i中每一个谓词计算其与其它谓词在模型中语义向量的距离,通过取负再归一化得到谓词之间的语义相似度值;最终,任意两个谓词间都将具有一个唯一的语义相似度值,可在后续查询中使用;

步骤3:语义敏感的Top-k近似查询,这个阶段具体包含如下步骤:

步骤3.1:待查领域知识子图的选取

用户给定一个查询图,通过一组明确的实体和谓词来查询所有符合某类型约束的未知实体;根据用户指定的期望返回的实体类型t选取领域知识子图O t,根据用户指定的关系谓词p选取该谓词与领域知识子图O t中其他谓词的语义相似度,维持一个对应关系谓词p的谓词语义相似度表S,作为领域知识子图O t中实体与实体之间边的权重,将用户指定的实体作为查询的起始点e start;若用户指定多个实体及其不同的关系谓词,则维持不同起始点对应不同谓词语义相似度表,后续的查询使用多线程的方式,每一线程使用不同的起始点和谓词语义相似度表进行探查;

步骤3.2:语义敏感的路径探查

a)创建一个优先级队列PQ用来存放需要向外遍历的实体及起始点到该实体经过的实体集合,即起始点到达该实体的路径;

b)将起始点e start放入优先级队列PQ中,优先级为1,路径{e start};

c)从优先级队列PQ取出队列中的元素,假设取出的元素代表的实体为e,路径代表的实体集合为Path,循环遍历完e的邻居实体e nb;

d)新建实体集合NewPath,添加实体集合Path中的元素,并添加邻居实体e nb;

权 利 要 求 书1/2页

2

CN 109992786 A

相关文档
最新文档