基于语义理解的智能问答系统关键技术研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于语义理解的智能问答系统关键技术研究大数据、人工智能等技术的蓬勃发展使得网络数据规模急剧增长,传统搜索引擎根据用户输入的关键字返回相关网页链接的无序列表,检索结果包含大量无关冗余信息,无法满足当前用户的需求。智能问答系统综合自然语言处理、知识管理等技术理解用户查询意图,将精确答案以自然语言形式返回用户。

然而现有问答系统大多采用大型语料库作为知识源,数据冗余且维度单一,同时受同义词、多义词的影响,用户问句不能清晰反映其查询意图,这造成了系统检索术语错配、返回出错等情况。语义Web技术的快速发展给以上问题提供了良好的解决思路,越来越多的研究者尝试将语义Web中的关键技术如本体构建、语义查询等应用于问答系统,以解决问答系统缺乏语义理解的问题。

本文将语义Web技术与问答系统相结合,使用本体作为问答系统的知识源,在语义和知识层次上描述信息,增加了语义理解和知识推理,解决传统问答系统中问句匹配度差、用户查询意图模糊的问题,旨在优化智能问答系统的语义理解能力,提供准确、全面的问答服务。本文创新工作如下:(1)多特征融合的句子语义相似度计算。

在句子相似度计算中综合考虑句子的结构信息与语义信息,提取句子词形特征、词序特征及句长特征,使用层次分析法进行权重分配,计算结构相似度;给本体中概念间关系赋予权重,使用权重计算语义距离,基于概念间语义距离描述语义相似度;最终使用加权融合方法计算整体相似度。相较于传统余弦相似度算法和基于编辑距离的相似度算法,多特征融合的相似度计算方法明显地提高了计算精度。

(2)基于语义的问句查询扩展。用户查询经问句处理后得到查询关键词序列,

使用概念占有率思想将查询关键词映射到领域本体,改进最小生成树算法生成最小查询扩展子树,利用有效路径扩展查询生成树,使用语义相似度进行扩展词集的筛选重排,最终生成用户查询的关键词扩展词集,从语义层面更加清晰的描述了用户的查询意图,提高基于本体的查询效率。

实验结果表明,与无扩展方法和关键词扩展方法相比,基于语义的查询扩展获得了更高的F﹣度量值。(3)搭建基于语义理解的智能问答系统。

以图书领域为背景,构建图书领域本体、常用问题库和寒暄问题库,设计常用问题库问答和语义问答结合的问答策略,实现对用户提问的准确回答。系统同时提供可视化界面对相似度计算、查询扩展和数据源进行展示,验证了上述算法的可行性和有效性。

相关文档
最新文档