融合因果事件的知识图谱构建及其应用研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

融合因果事件的知识图谱构建及其应用研究知识图谱以网络化的方式将互联网上海量的知识资源整合起来,构成一张巨大的语义网络,提供了一种更好地组织和利用信息的能力,已经发展成为大数据时代的基础设施。随着信息抽取技术的发展和实际应用的需要,人们开始从非结构化的文本中挖掘事件知识。事件知识是一种重要的决策依据,在我们身边,每天都会发生各种事件,这些事件通常不是孤立存在的,往往存在着某种语义上的因果逻辑。事件之间的因果逻辑是一种十分有价值的知识,将因果事件知识作为知识图谱的补充,可以进一步丰富和完善知识图谱,从而让知识图谱在实际应用中发挥更大的价值。

本文以金融领域为例,首先基于半结构化的数据构建初步的金融知识图谱,然后从非结构化的金融新闻中抽取因果事件知识,并将其融合到金融知识图谱中,进一步丰富和完善了金融知识图谱,从而用于基于知识图谱的分析与决策等应用场景中。本文主要完成了以下工作:提出了金融知识图谱的构建框架;在详细调研和分析金融领域的概念和知识的基础上,将金融领域重要的概念和类抽象出来,并且详细的定义了实体的属性和值域,完成了金融本体库的构建;同时,针对D2R 工具将关系数据库映射为RDF图的过程中会出现冗余信息的问题,本文提出了一种数据表设计原则,将实体和实体关系分开建数据表存储,很好的解决了这个问题;然后使用D2R工具完成了知识抽取;最后将知识图谱存储在Neo4j图数据库中,实现了初步的金融知识图谱的构建。采用序列标注方法,将因果事件抽取任务转化为序列标注任务,实现了从非结构化的金融新闻中抽取因果事件。实验对比了三种不同序列标注模型,发现基于BiLSTM+CRF模型具有最好的性能,在测试集上的F1达到了79%。

然后利用该模型从新闻中共抽取了5278个因果事件对,将因果事件对中的“原因事件”和“结果事件”分别当作实体,构造出<原因事件,因果关系,结果事件>三元组,接下来通过向量空间模型来计算事件之间的相似度,从而构建<事件,相似关系,事件>的三元组;最后,将事件作为实体、事件与事件的因果关系、事件与事件的相似关系以及事件和与事件相关联的实体连接为关联关系加入到知识图谱中,从而进一步丰富和完善知识图谱的知识。基于最终构建好的金融知识图谱,结合“长春长生疫苗事件”和“智利地震事件”两个实例,分析

了知识图谱在金融风险控制和辅助决策分析等应用场景下的应用,并分析了知识图谱在这些应用场景下的优势和价值。

相关文档
最新文档