语料库词性标注一致性检查方法研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语料库词性标注一致性检查方法研究
张虎;郑家恒;刘江
【期刊名称】《中文信息学报》
【年(卷),期】2004(018)005
【摘要】在对大规模语料库进行深加工时,保证词性标注的一致性已成为建设高质量语料库的首要问题.本文提出了基于聚类和分类的语料库词性标注一致性检查的新方法,该方法避开了以前一贯采用的规则或统计的方法,利用聚类和分类的思想,对范例进行聚类并求出阈值,对测试数据分类来确定其标注的正误,进而得出每篇文章的词性标注一致性情况,进一步保证大规模语料库标注的正确性.
【总页数】6页(P11-16)
【作者】张虎;郑家恒;刘江
【作者单位】山西大学,计算机科学系,山西,太原,030006;山西大学,计算机科学系,山西,太原,030006;山西大学,计算机科学系,山西,太原,030006
【正文语种】中文
【中图分类】TP391
【相关文献】
1.词性标注的方法研究——结合条件随机场和基于转换学习的方法进行词性标注[J], 阴晋岭;王惠临
2.利用词性标注语料库自动推断维吾尔语词缀变体的研究 [J], 阿布都哈力力·阿布都热依木;邹帅;余长江
3.基于分类的汉语语料库词性标注一致性检查 [J], 张虎;郑家恒
4.汉语语料库词性标注自动校对方法研究 [J], 张虎;郑家恒;刘江
5.基于词性标注的中医症候名语料库 [J], 游正洋;王亚强;舒红平;
因版权原因,仅展示原文概要,查看原文内容请购买。