面向汉英专利机器翻译的介词短语自动识别策略

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

On the Methods of Auto-Identifying Prepositional Phrases in Chinese-English Patent Machine
Translation
作者: 胡韧奋
作者机构: 北京师范大学中文信息处理研究所,北京100875
出版物刊名: 语言文字应用
页码: 136-144页
年卷期: 2015年 第1期
主题词: 专利 机器翻译 介词短语 自动识别 句法分析
摘要:专利语料中的介词短语一般长而复杂,且存在嵌套现象,不易为机器自动识别。

针对专利语料的特殊性,本文提出一种基于语义分析的识别策略,汉语介词因语义功能不同而被分为两类,可根据介词语义类和上下文特征信息来制定规则,确定短语的左右边界及句法层次。

测试结果表明,融合本策略的机器翻译系统在短语识别准确率、召回率和BLEU值三项指标上均得到显著提升。

相关文档
最新文档