【CN110019844A】一种保险行业知识图谱问答系统构建方法及装置【专利】

合集下载

一种基于知识图谱的保险自动问答方法及问答系统[发明专利]

一种基于知识图谱的保险自动问答方法及问答系统[发明专利]

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202010826806.1(22)申请日 2020.08.17(71)申请人 广东技术师范大学地址 510635 广东省广州市天河区中山大道西293号(72)发明人 闫艺婷 肖政宏 马智勇 周健烨 (74)专利代理机构 佛山市禾才知识产权代理有限公司 44379代理人 曹振 罗凯欣(51)Int.Cl.G06F 16/33(2019.01)G06F 16/332(2019.01)G06F 16/36(2019.01)G06Q 40/08(2012.01)(54)发明名称一种基于知识图谱的保险自动问答方法及问答系统(57)摘要本发明公开了一种基于知识图谱的保险自动问答方法,其应用于保险自动问答系统,其中步骤依次包括:步骤S1:首先利用爬虫技术采集保险产品的相关信息;步骤S2:对保险实体关系的数据进行标注;步骤S3:利用预训练的词向量文件构建embedding矩阵;步骤S4:制定实体对齐方法基于I ‑SPRS相似度;步骤S5:问句理解模型构建;步骤S6:最后答案生成;制定实体对齐方法基于I ‑SPRS(Insurance ‑Surrounding Property and relation Similarity)相似度,问句理解模型构建,最后答案生成。

有益效果是:这样的设计使得在查询数据时可以减少由于传统数据库的约束所带来的影响,使答案更为准确且易于理解,并且也提高问句理解的泛化能力。

权利要求书2页 说明书6页 附图3页CN 112800174 A 2021.05.14C N 112800174A1.一种基于知识图谱的保险自动问答方法,其应用于保险自动问答系统,其中步骤依次包括:步骤S1:首先利用爬虫技术采集保险产品的相关信息;步骤S2:对保险实体关系的数据进行标注;步骤S3:利用预训练的词向量文件构建embedding矩阵;步骤S4:制定实体对齐方法基于I‑SPRS相似度;步骤S5:问句理解模型构建;步骤S6:最后答案生成。

知识图谱构建方法及装置、存储介质及电子终端[发明专利]

知识图谱构建方法及装置、存储介质及电子终端[发明专利]

专利名称:知识图谱构建方法及装置、存储介质及电子终端专利类型:发明专利
发明人:孙树春,陈阳
申请号:CN201910870536.1
申请日:20190916
公开号:CN110609906A
公开日:
20191224
专利内容由知识产权出版社提供
摘要:本公开涉及计算机技术领域,具体涉及一种知识图谱构建方法、一种知识图谱构建装置、一种存储介质以及一种电子终端。

所述方法包括:获取待处理数据,对所述待处理数据进行转换以获取源数据;所述源数据包括实体数据和关系数据,并分别存储于第一存储单元和第二存储单元;结合预设的自定义基础配置数据以及所述待处理数据构建自定义目标配置数据;所述自定义目标配置数据包括:实体类别、实体属性、实体值域以及实体关系类别中任一项或任意多项的组合;基于所述自定义目标配置数据由所述第一存储单元和第二存储单元对所述源数据进行筛选,以获取目标数据;对所述目标数据进行处理以生成目标知识图谱。

本公开能够实现对知识图谱的定制化构建。

申请人:金色熊猫有限公司
地址:中国香港铜锣湾希慎道33号利园一期19楼1907室
国籍:HK
代理机构:隆天知识产权代理有限公司
更多信息请下载全文后查看。

保险知识图谱的构建方法、装置、计算机设备及存储介质[发明专利]

保险知识图谱的构建方法、装置、计算机设备及存储介质[发明专利]

专利名称:保险知识图谱的构建方法、装置、计算机设备及存储介质
专利类型:发明专利
发明人:陈岳峰
申请号:CN202011313478.1
申请日:20201120
公开号:CN112417167A
公开日:
20210226
专利内容由知识产权出版社提供
摘要:本发明公开了一种保险知识图谱的构建方法、装置、计算机设备及存储介质,该方法包括:接收用户输入的第三方保险平台的网址信息和官方备案平台的网址信息;基于网址信息和网络爬虫程序分别从第三方保险平台和官方备案平台中获取构建保险知识图谱的第一数据集和第二数据集;根据口碑评分模型从第一数据集中获取每一保险产品的口碑评分;根据本体模型从第一数据集、第二数据集中进行数据抓取以得到保险知识图谱中所有保险产品的销售状态信息、产品属性信息;根据销售状态信息、产品属性信息、口碑评分构建保险知识图谱。

本发明基于知识图谱技术,通过该方法不仅准确的对保险产品进行全方位的记录,而且兼顾了时效性和信息的权威性。

申请人:中国平安人寿保险股份有限公司
地址:518000 广东省深圳市福田区益田路5033号平安金融中心14、15、16、37、41、44、45、46层
国籍:CN
代理机构:深圳市精英专利事务所
代理人:涂年影
更多信息请下载全文后查看。

知识图谱的绘制方法及装置[发明专利]

知识图谱的绘制方法及装置[发明专利]

专利名称:知识图谱的绘制方法及装置专利类型:发明专利
发明人:裴博润,接钧靖,张毅然
申请号:CN201910637000.5
申请日:20190715
公开号:CN110347845A
公开日:
20191018
专利内容由知识产权出版社提供
摘要:本发明提供了一种知识图谱的绘制方法及装置,该方法包括:创建具有映射关系的原始表和目标表,其中,原始表用于实时从源端获取源端数据,目标表用于存储对源端数据进行处理后得到的目标数据;对原始表中实时获取的源端数据进行目标处理得到目标数据,并将目标数据存储到目标表中;确定目标表中存储的目标数据是否满足知识图谱绘制条件,其中,知识图谱绘制条件包括目标数据中至少包括一条边的数据和一条边所连接的两个点;在目标表中存储的目标数据满足知识图谱绘制条件的情况下,绘制目标数据对应的知识图谱。

通过本发明,解决了相关技术中知识图谱的绘制效率较低的问题,进而达到了提高知识图谱的绘制效率的效果。

申请人:北京明略软件系统有限公司
地址:100086 北京市海淀区中关村东路1号院1号楼10层A1002
国籍:CN
代理机构:北京康信知识产权代理有限责任公司
代理人:江舟
更多信息请下载全文后查看。

一种基于知识图谱的问答模板自动生成方法及装置[发明专利]

一种基于知识图谱的问答模板自动生成方法及装置[发明专利]

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202011430799.X(22)申请日 2020.12.07(71)申请人 厦门渊亭信息科技有限公司地址 361000 福建省厦门市软件园二期望海路61号801单元N8-01(72)发明人 洪万福 钱智毅 熊朝阳 (74)专利代理机构 北京鼎承知识产权代理有限公司 11551代理人 王义刚 赖庆梧(51)Int.Cl.G06F 16/332(2019.01)G06F 16/36(2019.01)G06F 16/33(2019.01)(54)发明名称一种基于知识图谱的问答模板自动生成方法及装置(57)摘要本发明提供了一种基于知识图谱的问答模板的自动生成方法、装置、可读存储介质及计算设备,通过自动生成问答模板,能够将自然语言拆分若干子句,分别寻找其答案,最后合并答案,简化了检索过程,降低了检索难度,大大提升了效率,方法包括:获取多个用于生成问答模板的用户问题和答案对;根据多个所述用户问题和答案对,生成多个问答模板;所述问答模板包括话语模板、查询图模板、以及话语模板和查询图模板的对齐信息;当接收到用户输入的问题时,如果确定所述用户输入的问题和所述话语模板的解析树匹配,则根据所述对齐信息和字典实例化所述查询图模板,得到候选答案;对多个所述候选答案进行排名,将排名前一位或多位的候选答案返回给用户。

权利要求书2页 说明书10页 附图3页CN 112632237 A 2021.04.09C N 112632237A1.一种基于知识图谱的问答模板的自动生成方法,其特征在于,包括:获取多个用于生成问答模板的用户问题和答案对;根据多个所述用户问题和答案对,生成多个问答模板;所述问答模板包括话语模板、查询图模板、以及话语模板和查询图模板的对齐信息;当接收到用户输入的问题时,如果确定所述用户输入的问题和所述话语模板的解析树匹配,则根据所述对齐信息和字典实例化所述查询图模板,得到候选答案;对多个所述候选答案进行排名,将排名前一位或多位的候选答案返回给用户。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

( 54 )发明 名称 一种保险行业知识图谱问答系统构建方法
及装置 ( 57 )摘要
本发明公开了一种保险行业知识图谱问答 系统构建方法及装置,属于行业知识图谱问答系 统 ,方法包括 :构建保险 知识图 谱的 本体与知识 表示;将与保险行业相关的多种原始数据基于本 体与知识表示 ,生成保险 知识图 谱数据 ,并存储 至图谱数据库中 ;获取用户问句,并对所述用户 问句进行问句理解,其中 ,所述问句理解包括问 句类型 识 别 、问 句意图 识 别 、实 体识 别以 及实 体 标准化;基于查询模板对所述问句理解获得的信 息进行问 句映 射 ,生成查 询语 句 ;使 用所述查 询 语句在所述图谱数据库中进行查询,得到查询结 果并返回。本发明实施例创新性地提出了数据层 ( 知识表示)与逻辑层(问句映射)的联动机制,从 而可以提供可靠的、可扩展的保险行业智能客服 服务。
2
CN /2 页
问 句理解模块 ,用于获取 用户问 句 ,并对所述 用户问 句进行问 句理解 ,其中 ,所述问 句 理解包括问句类型识别、问句意图识别、实体识别以及实体标准化;
问 句映 射模块 ,用于基于查 询模板对所述问 句理解获得的 信息进行问 句映 射 ,生成查 询语句;
(72)发明人 陆宇杰 李勇 张发幼 邹辉
(74)专利代理机构 北京市万慧达律师事务所 11111
代理人 张慧娟
(51)Int .Cl . G06F 16/36(2019 .01) G06F 16/332(2019 .01) G06Q 40/08(2012 .01)
(10)申请公布号 CN 110019844 A (43)申请公布日 2019.07.16
( 19 )中华人民 共和国国家知识产权局
( 12 )发明专利申请
(21)申请号 201910125877 .6
(22)申请日 2019 .02 .20
(71)申请人 众安信息技术服务有限公司 地址 518052 广东省深圳市前海深港合作 区前湾一路1号A栋201室(入驻深圳市 前海商务秘书有限公司)
权利要求书2页 说明书20页 附图4页
CN 110019844 A
CN 110019844 A
权 利 要 求 书
1/2 页
1 .一种保险行业知识图谱问答系统构建方法,其特征在于,所述方法包括: S1:构建保险知识图谱的本体与知识表示; S2 :将与保险 行业 相关的 多 种原始数 据基于所述本体与知识表示 ,生成保险 知识图 谱 数据,并存储至图谱数据库中; S3 :获取 用户问 句 ,并对所述 用户问 句进行问 句理解 ,其中 ,所述问 句理解包括问 句类 型识别、问句意图识别、实体识别以及实体标准化; S4:基于查询模板对所述问句理解获得的信息进行问句映射,生成查询语句; S5:使用所述查询语句在所述图谱数据库中进行查询,得到查询结果并返回。 2 .根据权利要求1所述的方法,其特征在于,所述步骤S1进一步包括: S1 .1:确定保险业务涉及的保险产品领域和多个业务支撑领域,并设置本体规范; S1 .2:构建各个领域的分类体系以及知识表示,并定义保险产品实例与各个业务支撑 实例之间的关系,以及各类实例的属性。 3 .根据权利要求1或2所述的方法,其特征在于,所述步骤S2进一步包括: S2 .1:判断所述多种原始数据中是否存在来自不同数据源且属于同种类别的数据; S2 .2:若步骤S2 .1的判断结果为是,则判断所述数据是否符合融合场景; S2 .3:若步骤S2 .2的判断结果为是,则对所述数据进行融合处理,否则,不进行融合处 理; S2 .4:将所述多种原始数据中经过融合处理的数据以及无需融合处理的数据,基于所 述本体与知识表示,生成数据结构为三元组结构的保险知识图谱数据。 4 .根据权利要求1所述的方法,其特征在于,所述步骤S4进一步包括: S4 .1 :确定问 句类型识别获得的问 句类型 ,若问 句类型为知识问答型 ,则执行步骤 S4 .2,若问句类型为场景判断型,则执行步骤S4 .3; S4 .2:先确定用户问句中的实体和属性信息,再调用规则方法,以填充到知识型模板 中,生成查询语句; S4 .3:确定问句意图识别获得的问句意图、实体识别获得的实体类别以及实体标准化 获得的实体信息,执行步骤S4 .4; S4 .4:根据问句意图、实体类别对调用相应的处理方法,将实体信息填充到相应的场景 判断型模板中,生成查询语句。 5 .根据权利要求4所述的方法,其特征在于, 所述问句类型包括以下之一: 知识型问句、场景型问句及其他类型问句; 所述问句意图的类型包括以下之一: 核保、续保、核赔、核药、其他; 所述实体类别包括以下之一: 产品、疾病、年龄、职业、地区、药品。 6 .一种保险行业知识图谱问答系统构建装置,其特征在于,所述装置包括: 本体构建模块,用于构建保险知识图谱的本体与知识表示; 图谱构建模块,用于将与保险行业相关的多种原始数据基于预先构建的本体与知识表 示,生成保险知识图谱数据,并存储至图谱数据库中;
图 谱查 询模块 ,用于使 用所述查 询语 句在所述图 谱数 据库中 进行查 询 ,得到查 询结果 并返回。
7 .根据权利要求6所述的装置,其特征在于,所述本体构建模块具体用于: 确定保险业务涉及的保险产品领域和多个业务支撑领域,并设置本体规范; 构建各个领域的分类体系以及知识表示,并定义保险产品实例与各个业务支撑实例之 间的关系,以及各类实例的属性。 8 .根据权利要求6或7所述的装置,其特征在于,所述图谱构建模块具体用于: 判断所述多种原始数据中是否存在来自不同数据源且属于同种类别的数据; 若存在,则判断所述数据是否符合融合场景; 若符合,则对所述数据进行融合处理,否则,不进行融合处理; 将所述多种原始数据中经过融合处理的数据以及无需融合处理的数据,基于所述本体 与知识表示,生成数据结构为三元组结构的保险知识图谱数据。 9 .根据权利要求6所述的装置,其特征在于,所述问句映射模块具体用于: 确定问句类型识别获得的问句类型; 若问句类型为知识问答型,则先确定用户问句中的实体和属性信息,再调用规则方法, 以填充到知识型模板中,生成查询语句; 若问 句类型为场景 判断 型 ,则确定问 句意图 识别获得的问 句意图 、实体识别获得的 实 体类别以及实体标准化获得的实体信息; 根据问 句意图 、实体类 别对 调 用相应的处理方法 ,将实体 信息填充到 相应的 场景 判断 型模板中,生成查询语句。 10 .根据权利要求9所述的装置,其特征在于, 所述问句类型包括以下之一: 知识型问句、场景型问句及其他类型问句; 所述问句意图的类型包括以下之一: 核保、续保、核赔、核药、其他; 所述实体类别包括以下之一: 产品、疾病、年龄、职业、地区、药品。
相关文档
最新文档