基于本体的行业知识图谱构建技术的研究与实现

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于本体的行业知识图谱构建技术的研究与实现正是因为有获取和形成知识的能力,人类才可以不断进步。而知

识对于人工智能的重要价值就是在于让机器具备认知能力,去理解这

个世界,理解应用的行业或者领域。知识图谱的结构类似于人类大脑

组织知识的结构,有助于机器模拟以人的思维模式和知识结构来进行

语言理解、视觉场景解析和决策分析。因此,知识图谱作为人工智能

的支撑基础,是实现真正的类人智能的必经之路。近年来,不少企业愈加重视行业+知识图谱。行业知识图谱在金融、农业、医疗、电商等

领域已经有了很好的应用。对于企业来说,行业知识图谱可以帮助行

业人员解答关于行业的任务型需求,辅助各种复杂的分析应用或决策

支持,构建行业壁垒。一个行之有效的行业知识图谱构建系统可以保

证知识库的质量与规模、可扩张性和推理能力。但是不同行业数据模式不同,业务需求差异化使得目前没有统一的行业知识图谱构建系统。本文针对特定的行业数据,但是旨在搭建一个通用型的行业知识图谱

构建系统。首先,本文研究了知识图谱的相关技术,包括知识图谱架构、知识表示、知识抽取、知识存储和基于知识图谱的问答系统五部分。针对每一部分,详细介绍了其定义、关键技术与难点。为本课题算法

设计和实现部分打下理论基础。其次,本文设计了基于本体的半自动

化表格知识抽取算法。该方法通过本体库的指导和约束,可以高效准

确的从表格中抽取三元组知识。该方法具有一定的泛化能力,可以应

用于每个单元格都是最小单位的所有表格。实验结果表明该方法可以对产品手册中百分之八十的表格进行直接抽取,得到准确完整的三元

组。然后,本课题尝试将构建的行业知识图谱应用到智能客服领域,

设计了基于模板匹配的知识图谱问答系统算法。该方法从用户日志中挖掘模板,模板包括问句意图、实体槽位和对应的SPARQL查询语句。对于新的用户问题,通过相似度计算找到匹配的模板,即可得到用户

的意图、实体值。将意图和实体值作为对应SPARQL查询语句的参数,从知识库中抽取答案。实验结果表明,问答系统雏形可以回答常用的用户问题,具有一定的泛化能力。最后,本文分别实现了行业知识库的构建系统和基于知识图谱的问答系统。根据行业数据特点,采用自顶向下和自底向上相结合的知识图谱构建方法。即先自顶向下的方式构建知识图谱的模式层,再自底向上的方式抽取知识构建数据层。问答系统包括自然语言理解模块、知识库查询模块和自然语言生成模块,旨在构建一个灵活和自然的智能客服系统。

相关文档
最新文档