中文新词识别技术综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中文新词识别技术综述
张海军;史树敏;朱朝勇;黄河燕
【期刊名称】《计算机科学》
【年(卷),期】2010(037)003
【摘要】新词识别是中文信息处理领域的关键技术.新词识别主要包括候选字串的提取过滤和词性猜测两项任务.中文没有特定符号标志词边界,因此任何相邻字符都有成词的可能性,这给新词提取过滤带来了很大困难;由于没有先验知识和统计数据,新词词性猜测一直是中文词性标注的技术瓶颈.详细分析了中文新词识别技术的研究现状,重点讨论了候选新词提取和词性猜测的研究方法与存在的主要问题,最后对新词识别研究方向进行了展望.
【总页数】6页(P6-10,16)
【作者】张海军;史树敏;朱朝勇;黄河燕
【作者单位】中国科学技术大学计算机科学与技术学院,合肥,230027;新疆师范大学计算机系,乌鲁木齐,830054;中国科学院计算机语言信息工程研究中心,北
京,100097;中国科学技术大学计算机科学与技术学院,合肥,230027;中国科学院计算机语言信息工程研究中心,北京,100097
【正文语种】中文
【中图分类】TP391.1
【相关文献】
1.规则与统计相结合的中文新词识别研究 [J], 王琳琳
2.面向中文社交媒体语料的无监督新词识别研究 [J], 张婧;黄锴宇;梁晨;黄德根
3.中文新词识别研究概述 [J], 李淑平
4.一种基于主动学习的中文新词识别算法 [J], 王博;代翔;时聪;刘洋
5.基于新词发现和Lattice-LSTM的中文医疗命名实体识别 [J], 赵耀全;车超;张强因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档