面向EBMT系统的汉蒙双语语料库的构建

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

作者: 淑琴;那顺乌日图
作者机构: 内蒙古大学蒙古学学院蒙古语文研究所,内蒙古呼和浩特010021
出版物刊名: 内蒙古社会科学
页码: 140-144页
主题词: 汉蒙对照双语语料库;语料标注;词语对齐
摘要:汉蒙对照双语语料库是建设综合型语言知识库的有机组成部分,又是基于实例的机器翻译系统的基础。

因为双语语料库中包含两种语言互译信息特征,能够提供两种语言之间丰富的匹配信息。

所以不仅在翻译知识的获取、双语词典的编纂、基于语料库的词义消歧等方面起到关键作用,而且在跨语言文献检索、跨语言信息提取、语言教学、双语对比研究等领域都有着广泛的应用前景。

作为语言信息处理所需要的语言资源,并行语料库必须有一套统一的标准和规范才能实现资源共享。

早日制定蒙古语语料库切分、标注规范对后续工作意义重大。

同时实现不同层次的对齐是双语语料库建设的一项重要内容。

相关文档
最新文档