【CN110019844A】一种保险行业知识图谱问答系统构建方法及装置【专利】

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(72)发明人 陆宇杰 李勇 张发幼 邹辉
(74)专利代理机构 北京市万慧达律师事务所 11111
代理人 张慧娟
(51)Int .Cl . G06F 16/36(2019 .01) G06F 16/332(2019 .01) G06Q 40/08(2012 .01)
(10)申请公布号 CN 110019844 A (43)申请公布日 2019.07.16
( 19 )中华人民 共和国国家知识产权局
( 12 )发明专利申请
Baidu Nhomakorabea
(21)申请号 201910125877 .6
(22)申请日 2019 .02 .20
(71)申请人 众安信息技术服务有限公司 地址 518052 广东省深圳市前海深港合作 区前湾一路1号A栋201室(入驻深圳市 前海商务秘书有限公司)
权利要求书2页 说明书20页 附图4页
CN 110019844 A
CN 110019844 A
权 利 要 求 书
1/2 页
1 .一种保险行业知识图谱问答系统构建方法,其特征在于,所述方法包括: S1:构建保险知识图谱的本体与知识表示; S2 :将与保险 行业 相关的 多 种原始数 据基于所述本体与知识表示 ,生成保险 知识图 谱 数据,并存储至图谱数据库中; S3 :获取 用户问 句 ,并对所述 用户问 句进行问 句理解 ,其中 ,所述问 句理解包括问 句类 型识别、问句意图识别、实体识别以及实体标准化; S4:基于查询模板对所述问句理解获得的信息进行问句映射,生成查询语句; S5:使用所述查询语句在所述图谱数据库中进行查询,得到查询结果并返回。 2 .根据权利要求1所述的方法,其特征在于,所述步骤S1进一步包括: S1 .1:确定保险业务涉及的保险产品领域和多个业务支撑领域,并设置本体规范; S1 .2:构建各个领域的分类体系以及知识表示,并定义保险产品实例与各个业务支撑 实例之间的关系,以及各类实例的属性。 3 .根据权利要求1或2所述的方法,其特征在于,所述步骤S2进一步包括: S2 .1:判断所述多种原始数据中是否存在来自不同数据源且属于同种类别的数据; S2 .2:若步骤S2 .1的判断结果为是,则判断所述数据是否符合融合场景; S2 .3:若步骤S2 .2的判断结果为是,则对所述数据进行融合处理,否则,不进行融合处 理; S2 .4:将所述多种原始数据中经过融合处理的数据以及无需融合处理的数据,基于所 述本体与知识表示,生成数据结构为三元组结构的保险知识图谱数据。 4 .根据权利要求1所述的方法,其特征在于,所述步骤S4进一步包括: S4 .1 :确定问 句类型识别获得的问 句类型 ,若问 句类型为知识问答型 ,则执行步骤 S4 .2,若问句类型为场景判断型,则执行步骤S4 .3; S4 .2:先确定用户问句中的实体和属性信息,再调用规则方法,以填充到知识型模板 中,生成查询语句; S4 .3:确定问句意图识别获得的问句意图、实体识别获得的实体类别以及实体标准化 获得的实体信息,执行步骤S4 .4; S4 .4:根据问句意图、实体类别对调用相应的处理方法,将实体信息填充到相应的场景 判断型模板中,生成查询语句。 5 .根据权利要求4所述的方法,其特征在于, 所述问句类型包括以下之一: 知识型问句、场景型问句及其他类型问句; 所述问句意图的类型包括以下之一: 核保、续保、核赔、核药、其他; 所述实体类别包括以下之一: 产品、疾病、年龄、职业、地区、药品。 6 .一种保险行业知识图谱问答系统构建装置,其特征在于,所述装置包括: 本体构建模块,用于构建保险知识图谱的本体与知识表示; 图谱构建模块,用于将与保险行业相关的多种原始数据基于预先构建的本体与知识表 示,生成保险知识图谱数据,并存储至图谱数据库中;
图 谱查 询模块 ,用于使 用所述查 询语 句在所述图 谱数 据库中 进行查 询 ,得到查 询结果 并返回。
7 .根据权利要求6所述的装置,其特征在于,所述本体构建模块具体用于: 确定保险业务涉及的保险产品领域和多个业务支撑领域,并设置本体规范; 构建各个领域的分类体系以及知识表示,并定义保险产品实例与各个业务支撑实例之 间的关系,以及各类实例的属性。 8 .根据权利要求6或7所述的装置,其特征在于,所述图谱构建模块具体用于: 判断所述多种原始数据中是否存在来自不同数据源且属于同种类别的数据; 若存在,则判断所述数据是否符合融合场景; 若符合,则对所述数据进行融合处理,否则,不进行融合处理; 将所述多种原始数据中经过融合处理的数据以及无需融合处理的数据,基于所述本体 与知识表示,生成数据结构为三元组结构的保险知识图谱数据。 9 .根据权利要求6所述的装置,其特征在于,所述问句映射模块具体用于: 确定问句类型识别获得的问句类型; 若问句类型为知识问答型,则先确定用户问句中的实体和属性信息,再调用规则方法, 以填充到知识型模板中,生成查询语句; 若问 句类型为场景 判断 型 ,则确定问 句意图 识别获得的问 句意图 、实体识别获得的 实 体类别以及实体标准化获得的实体信息; 根据问 句意图 、实体类 别对 调 用相应的处理方法 ,将实体 信息填充到 相应的 场景 判断 型模板中,生成查询语句。 10 .根据权利要求9所述的装置,其特征在于, 所述问句类型包括以下之一: 知识型问句、场景型问句及其他类型问句; 所述问句意图的类型包括以下之一: 核保、续保、核赔、核药、其他; 所述实体类别包括以下之一: 产品、疾病、年龄、职业、地区、药品。
2
CN 110019844 A
权 利 要 求 书
2/2 页
问 句理解模块 ,用于获取 用户问 句 ,并对所述 用户问 句进行问 句理解 ,其中 ,所述问 句 理解包括问句类型识别、问句意图识别、实体识别以及实体标准化;
问 句映 射模块 ,用于基于查 询模板对所述问 句理解获得的 信息进行问 句映 射 ,生成查 询语句;
( 54 )发明 名称 一种保险行业知识图谱问答系统构建方法
及装置 ( 57 )摘要
本发明公开了一种保险行业知识图谱问答 系统构建方法及装置,属于行业知识图谱问答系 统 ,方法包括 :构建保险 知识图 谱的 本体与知识 表示;将与保险行业相关的多种原始数据基于本 体与知识表示 ,生成保险 知识图 谱数据 ,并存储 至图谱数据库中 ;获取用户问句,并对所述用户 问句进行问句理解,其中 ,所述问句理解包括问 句类型 识 别 、问 句意图 识 别 、实 体识 别以 及实 体 标准化;基于查询模板对所述问句理解获得的信 息进行问 句映 射 ,生成查 询语 句 ;使 用所述查 询 语句在所述图谱数据库中进行查询,得到查询结 果并返回。本发明实施例创新性地提出了数据层 ( 知识表示)与逻辑层(问句映射)的联动机制,从 而可以提供可靠的、可扩展的保险行业智能客服 服务。
相关文档
最新文档