文本主题识别关键技术研究综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

A Review on Topic Identification of Scientific Text
Files
作者: 许海云[1,2];董坤[2,3];刘春江[2];王超[2,3];王振蒙[2,3]
作者机构: [1]中国科学技术信息研究所,北京100038 [2]中国科学院成都文献情报中心,四川成都610041 [3]中国科学院大学,北京100190
出版物刊名: 情报科学
页码: 153-160页
年卷期: 2017年 第1期
主题词: 主题识别 文本分析 主题挖掘 语义分析 多元关系融合
摘要:�目的/意义】文本主题自动识别是多种情报分析,如文献分类、检索以及领域前沿识别的基础,因此对文本主题自动识别方法的研究意义显著。

【方法/过程】系统调研了当前文本主题识别的关键技术,包括主题词获取方法、知识单元的关联强度计算以及面向多元关系融合的主题分析方法及实践。

【结果/结论】在总结当前文本主题识别方法的不足之处的基础上,本文提出综合全面的主题词获取方法,并在抽取范围以及语法、语义层面结合运用;在主题词关联计算中,充分利用已有语义词典和领域本体,将基于语义词典相似度和知识单元共现分析结合,并考虑主题关联的多元关系融合。

相关文档
最新文档