基于特征比较和最大熵模型的统计机器翻译错误检测杜金华
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
➢基于最大熵模型的特征比较 利用最大熵分类器在汉英NIST数据集上进行以下几组实验:
➢ 基于WPP特征的分类实验,分析比较其性能; ➢ 单独语言学特征的分类实验,分析语言学特征性能; ➢ WPP特征与语言学特征的组合分类实验,分析比较其性能。
➢结论
➢ 不同方法的WPP和语言学特征都有效降低了CER,但三种WPP特征的错误检测 能力有显著差异;
NLP&CC 2012
基于特征比较和最大熵模型的统计机器翻译错误检测
杜金华 王莎
西安理工大学 自动化与信息工程学院 西安
➢SMT翻译错误检测问题
➢ 将翻译错误检测视为分类问题,以词为单位,进行"正确"与"错误"二类分类。
➢特征
➢ 三种典型的WPP特征 (基于固定位置,基于滑动窗,基于词对齐的WPP) ➢ 词汇化特征 (单词实体特征、词性标注特征) ➢ 句法特征 (LG句法分析器抽取的句法特征)
➢ 组合特征的性能优于单个特征,其特征与单个特征的特性具有一致性。
ห้องสมุดไป่ตู้
➢ 基于WPP特征的分类实验,分析比较其性能; ➢ 单独语言学特征的分类实验,分析语言学特征性能; ➢ WPP特征与语言学特征的组合分类实验,分析比较其性能。
➢结论
➢ 不同方法的WPP和语言学特征都有效降低了CER,但三种WPP特征的错误检测 能力有显著差异;
NLP&CC 2012
基于特征比较和最大熵模型的统计机器翻译错误检测
杜金华 王莎
西安理工大学 自动化与信息工程学院 西安
➢SMT翻译错误检测问题
➢ 将翻译错误检测视为分类问题,以词为单位,进行"正确"与"错误"二类分类。
➢特征
➢ 三种典型的WPP特征 (基于固定位置,基于滑动窗,基于词对齐的WPP) ➢ 词汇化特征 (单词实体特征、词性标注特征) ➢ 句法特征 (LG句法分析器抽取的句法特征)
➢ 组合特征的性能优于单个特征,其特征与单个特征的特性具有一致性。
ห้องสมุดไป่ตู้