机器翻译的自动评测技术 机器翻译技术
机器翻译的研究方法和技术
机器翻译的研究方法和技术随着科学技术的不断进步,机器翻译技术也在不断地发展。
在信息爆炸的时代,人们需要更加便捷、准确、快速地进行跨语言沟通,机器翻译作为一种自然语言处理技术,可以帮助人们更好地处理不同语言之间的转换。
但是,机器翻译的研究和实践并不简单,需要不断地探索和创新,采用一系列的研究方法和技术。
本文将会介绍机器翻译的研究方法和技术,带领读者深入了解机器翻译。
1. 语料库建设语料库是机器翻译技术的基础,是进行机器翻译研究、开发和评估的必备工具。
语料库建设是机器翻译研究中最早的、也是最基本的环节。
语料库的质量和数量对机器翻译的结果有很大的影响。
较好的语料库不仅能够提高机器翻译的翻译质量,而且能够获得更高的数据分析效率和更优的机器翻译模型。
语料库可分为人工语料库、机器语料库和组合语料库。
人工语料库是由人工制作的、经过专家翻译且经过校对的翻译语料库,包括单句和长篇句子甚至文章,它的形式都比较固定,传统上经常是句对句,句子的数量和长度以及语料库的覆盖范围,都具有明显的主观性。
人工制作的语料库,其质量较高,但花费较大,且不能满足多样化的翻译需求。
机器语料库是通过网络爬虫、机器翻译等手段获取的大型并不需要人工干涉的语料库。
其涉及面广,但是由于来源不可靠因此质量常常比较低。
组合语料库的优点是它是基于人工语料库和机器语料库之上进行的构建,可以为机器翻译引入更多的细节,致力于更好的数据分析和最终翻译结果。
2. 机器翻译算法机器翻译算法的选择和使用对机器翻译的翻译效果起着至关重要的作用。
目前主流的机器翻译算法有统计机器翻译(SMT)和神经机器翻译(NMT)两种。
SMT是先将输入语言转换为中间法 (interlingua),再将其转换为输出语言,主要的工作步骤包括对齐、分类、词汇替代和排序等。
SMT具有成熟且稳定的理论体系,但是其翻译质量受数据条件束缚,只能按照训练数据中存在的句型进行翻译,容易出现硬性的死板翻译,同时也不好处理长篇句子和上下文信息。
024036机器翻译技术及应用
机器翻译技术及应用王海峰东芝(中国)研究开发中心关键词:机器翻译 评测引言语言是人类进行交流的工具,语言不通会阻碍人们之间进行交流。
于是,人类在克服语言交流障碍的过程中发展了语言之间的翻译,产生了翻译学。
用机器来帮助甚至替代人工翻译是人类长久以来的一个梦想。
最原始的机器翻译思想可以追溯到17世纪关于机械词典的构想。
韦弗(Weaver)1949年的著名备忘录1则标志着基于现代计算机的机器翻译正式登上历史舞台。
机器翻译既涉及到人类对自身语言和思维方式的认知,又涉及到人工智能、信息论、知识工程和软件工程等很多技术领域,是一个多项技术深度交叉的学科。
机器翻译也是一门独立的学科。
它既具有自身的发展规律,同时又需要在多种学科基础上综合发展。
本文将在简要回顾机器翻译发展史的基础上,全面论述机器翻译方法,然后介绍牵引机器翻译技术发展的两驾马车:科学评测和实际应用,最后进行总结2。
机器翻译发展回顾机器翻译发展至今,经历了1954年之前的草创期、1954~1966年的高期望期、1967~1976年的沉寂期、1976~1989年的复苏期以及1989年之后的发展期等5个不同的历史时期。
1954年,美国IBM公司和乔治敦大学合作开发的机器翻译原型系统第一次向人们展示了一个现实的机器翻译系统。
这不仅使各国从事机器翻译研究的学者们倍受鼓舞,而且还吸引了大量的政府机构的资金投入。
第一代机译系统都是采用直接法,主要以词典为驱动,辅以较低层次上的语法分析和语义特征的使用。
1966年的ALPAC3报告指出,机器翻译速度慢,准确率低,比人工翻译花费多,且不能马上实用。
为此,各类机器翻译项目纷纷下马,机器翻译研究陷入低谷。
从70年代中期开始,基于规则的第二代机器翻译的方法逐渐成熟,机器翻译研究重现生机。
第二代方法的主导思想是面向句法、基于规则的转换策略。
80年代末开始,在国际交流日益增多的环境下,随着计算机、互联网等相关技术日新月异的发展,机器翻译的技术与应用也呈现出了蓬勃生机。
机器翻译技术的使用方法与性能评估
机器翻译技术的使用方法与性能评估机器翻译技术是一种自然语言处理领域的重要技术,可以将一种自然语言自动转换为另一种自然语言,极大地简化了跨语言沟通的难度。
本文将介绍机器翻译技术的使用方法,并探讨如何评估其性能。
首先,了解机器翻译技术的使用方法是使用该技术的关键。
一般来说,机器翻译的使用方法包括以下几个步骤:1. 准备数据:机器翻译技术需要大量的语料库来进行学习和训练。
这些语料库可以是已经翻译好的双语平行文本,也可以是自动生成的语料库。
2. 选择模型:机器翻译技术涉及多个模型,如统计机器翻译(SMT)模型和神经网络机器翻译(NMT)模型。
根据需求和数据情况选择适合的模型。
3. 数据预处理:在输入数据之前,需要进行一些预处理工作,如分词、音系标注和词性标注等。
这些预处理工作可以提高机器翻译的效果。
4. 模型训练:使用准备好的语料库进行模型的训练。
在训练过程中,可以对模型进行调参和优化,以提高翻译效果。
5. 翻译生成:经过训练,模型可以用来进行翻译生成。
用户可以输入源语言句子,通过模型生成目标语言的翻译结果。
虽然机器翻译技术在跨语言沟通中起到了巨大的作用,但其性能仍然是一个关键问题。
为了评估机器翻译的性能,可以采用以下几种方法。
1. 自动评估指标:机器翻译领域常用的自动评估指标包括BLEU、TER、METEOR等。
这些指标可以通过与人工参考翻译进行比较,评估机器翻译结果的准确性和流畅性。
2. 人工评估:除了自动评估指标,还可以请专业的人工翻译人员对机器翻译结果进行评估。
他们可以从语法、语义、流畅性等多个角度进行评估,提供更加细致和全面的评估结果。
3. 目标领域评估:机器翻译的性能评估还需要考虑目标领域的特殊要求。
有些领域如医学、法律等专业术语较多,需要特殊处理。
根据实际需求,可以进行特定领域的评估和调整。
4. 数据质量评估:机器翻译技术对输入数据要求较高。
数据质量的好坏会直接影响机器翻译的性能。
因此,在使用机器翻译技术之前,需要对数据进行质量评估,确保数据的准确性和完整性。
bleu评测方法
bleu评测方法摘要:1.引言2.BLEU评测方法简介3.BLEU评测指标计算方法4.BLEU评测方法的优缺点5.结论正文:【引言】在自然语言处理领域,机器翻译和文本生成任务越来越受到人们的关注。
为了评估这些任务的性能,研究人员提出了许多评价指标。
其中,BLEU (Bilingual Evaluation Understudy)评测方法因其简洁、易用和高效而成为最受欢迎的自动评估方法。
本文将详细介绍BLEU评测方法,包括其计算原理、优缺点以及在实际应用中的使用方法。
【BLEU评测方法简介】BLEU评测方法由IBM的研究员Tomaso Esposti等人于2004年提出,旨在为机器翻译和文本生成任务提供一个简洁、高效的评价指标。
BLEU评测方法的核心思想是将生成的文本与参考译文进行比较,从而衡量生成文本的质量。
BLEU评测方法适用于多种语言对,既可以评估机器翻译质量,也可以评估文本生成任务的性能。
【BLEU评测指标计算方法】BLEU评测指标的计算方法如下:1.相似度计算:计算生成文本与参考译文的相似度。
常用的相似度计算方法有编辑距离(Levenshtein距离)和Jaccard相似度。
2.词序惩罚:惩罚生成文本与参考译文之间词序不同的情况。
词序惩罚可以通过计算N-gram(如N-1gram、N-2gram等)的匹配度来实现。
3.长度惩罚:惩罚生成文本过长或过短的情况。
长度惩罚可以通过计算生成文本与参考译文的长度比例来实现。
4.惩罚项加权:将上述相似度、词序惩罚和长度惩罚加权求和,得到BLEU 评测指标。
【BLEU评测方法的优缺点】优点:1.简洁性:BLEU评测方法公式简单,易于理解。
2.高效性:BLEU评测方法计算速度快,适用于大规模数据评估。
3.普适性:BLEU评测方法适用于多种语言对和任务类型。
4.易于实现:BLEU评测方法有成熟的Python库可供使用,如SacreBLEU。
缺点:1.仅考虑词汇层面:BLEU评测方法主要关注词汇层面的相似度,较少考虑句子结构和语义层面的差异。
机器翻译技术教程及常见问题解答
机器翻译技术教程及常见问题解答一、机器翻译技术教程机器翻译(Machine Translation, MT)指利用计算机软件将一种语言的文字自动转化成另一种语言的文字的技术。
它在跨语言沟通、文本翻译等领域有着广泛的应用。
本文将介绍机器翻译的基本原理和常见的机器翻译技术。
1. 基本原理机器翻译的基本原理是将一种语言的句子转化为另一种语言的句子。
它通过对源语言句子的分析和理解,然后根据目标语言的语法和语义规则生成对应的句子。
具体而言,机器翻译可以分为以下几个步骤:(1)句法分析:对源语言句子进行分词、词性标注等处理,以获取句子的基本结构和语法信息。
(2)句子理解:利用句法分析的结果,推断句子的语义信息,包括句子的主题、动作、时间等。
(3)目标语言生成:根据句子理解的结果和目标语言的语法规则,生成对应的目标语言句子。
(4)优化和后处理:对生成的目标语言句子进行优化和后期处理,以增强翻译质量。
2. 常见的机器翻译技术(1)统计机器翻译(Statistical Machine Translation, SMT):统计机器翻译是目前应用最广泛的机器翻译技术之一。
它基于大规模的双语语料库进行训练,通过统计算法来建立源语言和目标语言之间的映射关系。
(2)神经网络机器翻译(Neural Machine Translation, NMT):神经网络机器翻译是近年来兴起的一种机器翻译技术。
它基于神经网络模型,通过训练来学习源语言和目标语言之间的映射关系。
(3)混合机器翻译(Hybrid Machine Translation, HMT):混合机器翻译是将多种机器翻译技术相结合的一种方法。
通过将统计机器翻译和神经网络机器翻译等不同的技术进行集成,可以提高翻译质量。
3. 机器翻译工具和平台目前市面上有许多机器翻译工具和平台可以帮助用户进行翻译任务。
例如,Google Translate、百度翻译、有道翻译等都是比较知名的机器翻译工具。
机器翻译的评估方法及其使用中的误差分析
机器翻译的评估方法及其使用中的误差分析摘要:机器翻译是一项重要的自然语言处理任务,旨在将一种语言的文本转换为另一种语言的等价文本。
为了评估机器翻译的质量,人们发展了各种各样的评估方法。
本文将介绍几种常见的机器翻译评估方法,并分析这些方法在使用中可能出现的误差。
引言:随着全球交流的增加,机器翻译在跨语言交流中起着越来越重要的作用。
然而,要准确评估机器翻译的质量并非易事。
与人类翻译相比,机器翻译往往会出现各种错误,包括语法错误、语义错误和上下文错误等。
因此,评估机器翻译的质量是非常关键的。
本文将介绍一些常见的机器翻译评估方法,并分析在使用中可能遇到的误差。
一、BLEU评估方法BLEU(Bilingual Evaluation Understudy)是一种常用的机器翻译评估方法。
它将机器翻译结果与人工参考翻译进行比较,并计算一个0到1之间的BLEU分数。
BLEU分数越高,说明机器翻译的质量越好。
然而,BLEU方法也存在一些误差。
首先,BLEU方法主要是基于片段级的匹配,没有考虑句子层面的连贯性。
其次,BLEU方法对于句子结构调整问题比较敏感,经常会导致误差。
二、NIST评估方法NIST(National Institute of Standards and Technology)评估方法是另一种常用的机器翻译评估方法。
与BLEU方法类似,NIST方法也是将机器翻译结果与人工参考翻译进行比较,并计算一个分数。
NIST方法相对于BLEU方法而言,更加注重句子级的连贯性。
然而,NIST方法也存在一些误差。
由于NIST方法只使用了有限的参考翻译,因此可能无法覆盖所有的语法和语义变化。
三、TER评估方法TER(Translation Edit Rate)评估方法是一种基于编辑距离的机器翻译评估方法。
它将机器翻译结果转换为参考翻译的最小编辑距离,并计算一个分数。
TER方法相对于BLEU和NIST方法而言,更加注重句子结构和语义的准确性。
机器翻译性能评估的使用教程
机器翻译性能评估的使用教程机器翻译(Machine Translation, MT)是一种使用计算机技术自动将一种自然语言的文本转换为另一种自然语言的文本的方法。
随着人工智能技术的发展,机器翻译的性能逐渐提升,但仍然存在差异。
为了评估和比较不同机器翻译系统的性能,常常需要进行评估。
本篇文章将介绍如何使用机器翻译性能评估工具来进行机器翻译性能评估。
一、机器翻译性能评估工具介绍为了准确评估机器翻译系统的性能,需要使用专门的评估工具。
在这里,我们介绍一种常用的机器翻译性能评估工具——BLEU。
BLEU(bilingual evaluation understudy)是一种机器翻译质量评估指标,使用统计方法比较机器翻译结果与参考翻译之间的一致性。
BLEU主要通过计算n-gram的匹配数来评估翻译的质量,同时还考虑了句子长度等因素。
二、使用BLEU进行机器翻译性能评估的步骤1. 确定参考翻译在进行机器翻译性能评估之前,需要准备参考翻译。
参考翻译是与机器翻译结果相对应的正确翻译。
通常情况下,可以选择人工翻译或者专业翻译人员进行准确翻译。
2. 准备机器翻译结果使用机器翻译系统对需要翻译的文本进行翻译,并将结果保存为文本文件。
确保每个句子单独占一行,并且与参考翻译的顺序一致。
3. 安装评估工具在评估之前,需要安装BLEU评估工具。
BLEU评估工具可以在开源机器翻译工具包中找到,如Moses。
4. 运行BLEU评估工具打开终端或命令行界面,进入评估工具所在的目录。
运行评估工具的命令,指定参考翻译文件和机器翻译结果文件的路径。
```bash$ perl ./multi-bleu.pl reference.txt < translation.txt```其中,reference.txt为参考翻译文件的路径,translation.txt为机器翻译结果文件的路径。
运行命令后,评估工具会自动计算BLEU指标,并将结果输出到终端或命令行界面。
专业的翻译工具与技术
专业的翻译工具与技术在现代社会中,随着全球化的发展,翻译行业的需求也日益增长。
为了提高翻译效率和准确度,专业的翻译工具与技术起到了重要的作用。
本文将介绍几种常见的专业翻译工具与技术,并探讨其在翻译领域中的应用。
一、计算机辅助翻译工具(Computer-Assisted Translation Tools,CAT)计算机辅助翻译工具是翻译行业中常用的工具之一。
它能够自动处理文本,并提供一系列功能来提高翻译的效率和准确度。
其中,最常用的CAT工具是电子词典和术语库。
电子词典可以帮助翻译人员迅速查找单词的含义和用法,而术语库则提供了特定领域的术语翻译,能够保持翻译的一致性。
二、机器翻译技术(Machine Translation,MT)机器翻译技术是利用计算机程序将源语言的文本自动转化为目标语言的文本。
目前,机器翻译技术已经取得了很大的进展,在某些特定领域的翻译中已经能够达到较高的准确度。
机器翻译技术的主要优势在于速度快、可扩展性强,但相比于人工翻译,其准确度仍然有待提高。
三、语料库与平行语料库(Corpora and Parallel Corpora)语料库是指收集并整理的大规模文本库,其中既包括源语言文本,也包括目标语言文本。
平行语料库是指同时包含源语言文本和目标语言文本的语料库。
借助语料库和平行语料库,翻译人员可以通过文本检索和对比分析,更好地理解源语言文本,同时在翻译过程中能够提高准确度和翻译一致性。
四、语音识别技术(Speech Recognition)语音识别技术是将语音信号转化为文字的过程,它在口译和录音转录等方面有着广泛的应用。
通过语音识别技术,翻译人员可以将口译的内容转化为文字,从而进行后续的翻译工作。
这样既提高了翻译的准确度,也提高了翻译人员的工作效率。
五、云端翻译平台(Cloud Translation Platform)随着云计算技术的发展,云端翻译平台成为了翻译行业中的新趋势。
机器翻译技术的性能评估和优化
机器翻译技术的性能评估和优化自然语言处理技术的发展让人们的交流变得更加便利,而机器翻译技术作为其中的一环,已经广泛应用于各种场景中。
然而,机器翻译的质量不稳定,有时甚至很难达到与人工翻译相等的水平。
因此,对机器翻译技术进行性能评估和优化是非常必要的。
一、机器翻译技术的性能评估要对机器翻译技术进行性能评估,需要制定相应的评估指标。
当前,机器翻译性能评估主要采用自动评估指标和人工评估指标两种方式。
1.自动评估指标BLEU、METEOR、TER 等指标是当前机器翻译领域中最常用的自动评估指标。
这些指标利用了 N-gram 统计方法或者语义模型等技术,能够对机器翻译后的译文与人工翻译对照相进行评分,并输出相应的评分结果。
虽然这些指标能够快速评估机器翻译的质量,但是也存在评估结果与人工评估不一致等问题。
2.人工评估指标人工评估方式采用专业的翻译人员或普通用户,让他们针对机器翻译后的译文进行评分。
这种方式评估结果更为准确,但是需要大量人力和时间成本,难以应用于大规模数据集的评估。
二、机器翻译技术的优化机器翻译技术的性能与翻译模型的质量密切相关。
目前,最常用的机器翻译模型有基于规则的机器翻译(Rule-Based Machine Translation, RBMT)、基于统计的机器翻译(Statistical Machine Translation, SMT)和基于神经网络的机器翻译(Neural Machine Translation, NMT)等。
1.基于规则的机器翻译基于规则的机器翻译需要手动编写翻译规则,能够解决一些语言结构简单的语言翻译问题。
但是,其适用范围有限,难以满足语言的多样性和语法复杂性,效果不稳定。
2.基于统计的机器翻译基于统计的机器翻译利用数学模型对大量的历史翻译数据进行学习,生成一种概率模型。
在翻译时,根据模型中各个单元之间的概率权重,自动生成译文。
SMT 在大规模语料处理方面有着优越性,但是对于复杂语言和分布式语言处理的效果较差。
机器翻译模型翻译质量评估说明
机器翻译模型翻译质量评估说明机器翻译(Machine Translation,MT)模型的翻译质量评估是对机器翻译系统输出的译文进行评估的过程。
翻译质量评估主要用于衡量机器翻译系统的性能和效果,帮助研究人员和开发者进一步改进和优化机器翻译模型。
本文将介绍常用的机器翻译质量评估方法和评价指标,并探讨评估过程中可能出现的挑战和解决方法。
评估方法:1. 人工评估:人工评估是现阶段最常用的机器翻译质量评估方法之一。
该方法通常由专业人员组成的评估小组,对机器翻译系统输出的译文进行评估和打分。
人工评估可以提供准确和详细的质量评价,但受到人力资源和时间成本的限制。
2. 语言学评估:语言学评估方法主要从语言学角度出发,对机器翻译系统的译文进行语法、语义和风格方面的评估。
该方法可衡量译文的语言准确性和自然度,但可能会忽视一些语义上的细微差异。
3. 自动评估:自动评估是一种使用计算机程序对机器翻译系统输出的译文进行评估的方法。
其中,BLEU(Bilingual Evaluation Understudy)是最常用的自动评估指标之一。
BLEU 指标通过比对机器翻译系统输出的译文和人工参考译文的相似度,对译文进行评估并给出一个0到1之间的分数。
除了BLEU,还有其他自动评估指标,如METEOR、NIST等,它们在计算方式和评价标准上各有不同。
评估指标:1. 准确性:准确性是机器翻译系统翻译质量的核心指标之一。
准确性指评估译文与参考译文的一致性和正确性,包括语义和语法的正确性。
常用的评估指标有词错误率(Word Error Rate,WER)和句错误率(Sentence Error Rate,SER)。
2. 流畅度:流畅度衡量译文的语言自然性和可读性。
一个流畅的译文应该具有良好的句法结构和自然的表达方式。
流畅度可以通过语言模型来评估,如困惑度(Perplexity)。
3. 一致性:一致性评估机器翻译系统对于相同句子的翻译结果是否一致。
机器翻译技术的自动评估方法与指标选择
机器翻译技术的自动评估方法与指标选择机器翻译技术在现代社会中发挥着越来越重要的角色。
随着全球化的加速推进和语言交流的日益频繁,机器翻译技术通过将不同语言之间的文字进行转化,使得人们能够更方便地进行跨语言的交流。
然而,机器翻译技术的质量直接影响着信息传递的准确性和流畅性。
因此,如何对机器翻译技术进行准确评估,选择合适的评估指标,成为了研究人员和开发者们共同关注的焦点问题。
在过去,人工评估被广泛使用来判断机器翻译技术的优劣。
然而,人工评估耗时耗力,且受到主观因素的干扰,限制了其应用的范围和效率。
因此,研究人员们开始发展自动评估方法,以提高机器翻译技术评估的效率和客观性。
自动评估方法可以通过与人工评估结果进行比较来评估机器翻译的质量。
这些方法可以分为基于参考译文的方法和不基于参考译文的方法。
基于参考译文的方法使用人工创建的参考译文作为评估的标准。
这些方法通过比较机器翻译结果与参考译文之间的相似程度来评估机器翻译的质量。
常用的基于参考译文的评估指标包括BLEU(Bilingual Evaluation Understudy)、NIST(National Institute of Standards and Technology)和METEOR(Metric for Evaluation of Translation with Explicit ORdering)等。
BLEU指标通过计算机器翻译结果与参考译文之间的匹配程度来评估翻译质量。
BLEU指标将机器翻译结果分为多个片段,并计算重叠的n-grams数量来评估翻译的准确性。
NIST指标类似于BLEU,但在计算重叠的n-grams时使用了不同的权重。
METEOR指标结合了词级别和短语级别的信息,通过计算机器翻译结果与参考译文之间的词汇、短语、语义等方面的匹配程度来评估翻译的质量。
与基于参考译文的方法相比,不基于参考译文的方法更加灵活。
这些方法不依赖于人工创建的参考译文,而是使用其他模型或技术来评估机器翻译的质量。
智能翻译系统多语言翻译准确度评估说明
智能翻译系统多语言翻译准确度评估说明智能翻译系统多语言翻译准确度评估说明一、引言智能翻译技术的发展使得多语言之间的翻译变得更加便捷和高效。
然而,准确度是评估一个智能翻译系统优劣的重要指标之一。
本文旨在介绍智能翻译系统多语言翻译准确度的评估方法和指标,以及评估过程中需要注意的问题。
二、评估方法和指标1. 平行语料准确度的评估需要使用到平行语料,即同一文本的原语言版本和翻译版本。
通过比对系统生成的翻译和人工翻译,可以计算得出准确率、召回率和F1值等指标。
2. 人工评估法人工评估法是一种直接评估机器翻译准确度的方法。
评估员根据预先设定的评估标准,对系统生成的翻译进行准确性评估。
评估员可以根据意义、语法、结构和流畅性等方面进行评估,并给出相应的评分。
3. 自动评估法自动评估法是一种通过计算机程序自动评估机器翻译准确度的方法。
常用的自动评估方法包括BLEU指标、METEOR指标和TER指标等。
这些指标用于衡量机器翻译结果与人工翻译之间的差距。
三、评估过程中的注意事项1. 样本选取在评估过程中,需要从不同领域、不同类型的文本中选取一定数量的样本。
这样可以更好地反映智能翻译系统在不同场景下的翻译准确度。
2. 评估标准在进行人工评估时,需要提前确定评估标准和评分规则。
评估标准应该具有客观性和一致性,评分规则应该简明清晰,便于评估员操作。
3. 多维度评估除了对翻译的准确性进行评估,还可以对流畅性、可读性、一致性和专业性等方面进行综合评估。
这样可以更全面地了解智能翻译系统的表现。
4. 数据清洗在计算自动评估指标时,需要对翻译结果和人工翻译进行预处理,如去除标点符号和停用词。
这样可以减少噪音干扰,提高指标的准确性。
5. 多次评估为了验证评估结果的可靠性,建议多次进行评估,并计算平均值。
这样可以减少评估结果的偶然误差,提高评估的可信度。
四、结论准确度评估是评估智能翻译系统优劣的重要环节。
通过合适的评估方法和指标,可以全面客观地评估系统的翻译准确度。
机器翻译中的质量评估方法研究
机器翻译中的质量评估方法研究机器翻译(Machine Translation,MT)是利用计算机技术将一种自然语言的文本转化为另一种自然语言的文本的过程。
随着机器翻译技术的不断发展,如何评估机器翻译的质量成为一个重要的研究课题。
本文将介绍机器翻译中的质量评估方法的研究进展。
一、人工评估方法评估机器翻译质量最直接的方法是人工评估,即由人类专家对翻译结果进行评估和打分。
人工评估可以分为两种类型:一是人工评估比较,即将机器翻译的结果与人工参考翻译进行比较;二是人工评估可信度,即由人工专家对机器翻译的质量进行全面的评估,并给出一个综合的质量得分。
人工评估方法的优点是能够准确地反映机器翻译的质量,尤其适用于一些关键性的翻译任务。
然而,人工评估方法也存在一些问题,比如费时费力、成本高昂等。
为了解决这些问题,研究人员提出了其他的机器评估方法。
二、自动评估方法自动评估方法是利用计算机算法对机器翻译的质量进行评估。
这些方法主要分为两大类:基于标准答案的方法和基于语言模型的方法。
1. 基于标准答案的方法基于标准答案的方法通过将机器翻译的结果与人工参考翻译进行比较来评估机器翻译的质量。
这类方法常用的评估指标包括BLEU (Bilingual Evaluation Understudy)、NIST(Normalized Information Similarity Test)、METEOR(Metric for Evaluationof Translation with Explicit Ordering)等。
BLEU是最常用的机器翻译评估指标之一,它通过计算机器翻译结果与参考翻译之间的n-gram重叠率来评估翻译的准确性。
BLEU指标的取值范围是0到1,值越接近1代表机器翻译的质量越好。
NIST是根据信息检索的原理设计的一种评估指标,它将机器翻译结果与参考翻译之间的信息接近度作为评价标准。
NIST指标也是0到1之间的值,越接近1表示机器翻译的质量越高。
翻译中的翻译质量评估软件和工具
翻译中的翻译质量评估软件和工具随着全球化的加剧,翻译行业的重要性越来越显著。
在物资、资源、产业以及文化交流的全面展开中,翻译成为了不可或缺的工作之一。
但是,翻译工作的这种重要性也难免会带来一定的质量问题。
因此,评估翻译质量的软件和工具的发展和应用也日益受到重视。
翻译质量的评估工作主要包括两大类:一是自动评估,二是人工评估。
自动评估是指利用计算机技术和人工智能技术来对翻译成果进行评价和分析;人工评估则是通过专业人员对翻译成果进行反复对比、检查和修改等工作,从而评估翻译成果的质量。
随着科技的发展和翻译行业的不断壮大,自动评估在评估翻译质量方面的应用越来越广泛。
接下来,我们将重点介绍和讨论自动评估领域中的一些翻译质量评估软件和工具。
1. BLEUBLEU(Bilingual Evaluation Understudy)是翻译领域中最有名的评测方法之一。
它是由IBM的Peter F.Brown等人在2002年提出,是一种机器翻译质量自动评估方法。
BLEU依据自然语言处理技术来对翻译成果进行分析和评价。
BLEU评测方法最初是用来评价机器翻译系统的自动评测方法,但是目前也广泛应用于评价人工翻译的质量。
BLEU将翻译成果与参考答案(楷书或译文)进行比较,然后根据匹配程度计算翻译的质量得分。
BLEU方法主要通过比较单词、短语以及句子的重叠情况来评价翻译的质量。
BLEU的使用既可以是在评估具体的翻译成果时使用,也可以是在比较多个不同翻译成果的质量时使用。
在进行翻译质量评估时,BLEU得分越高,则表示翻译的质量越好。
2. NISTNIST(National Institute of Standard and Technology)是一种针对自动语音识别和机器翻译的质量评估方法。
NIST评测方法的主要特点是使用稳健的手段来保证评测的公正性和客观性。
它主要使用几种自然语言处理技术来进行评测,包括信息检索、机器学习、语言模型和信息熵等。
机器翻译技术
机器翻译技术随着全球化的不断深入,人们之间的交流变得越来越频繁,语言翻译的需求也越来越大。
传统的人工翻译虽然精准度很高,但耗时耗力,成本高昂。
为了解决这个问题,机器翻译技术在近年来的发展中取得了显著的进步。
机器翻译技术是指利用计算机自动翻译一种语言为另一种语言的技术。
该技术应用广泛,涵盖人工智能、自然语言处理等多个领域。
机器翻译技术的核心是机器翻译引擎,它模拟人类翻译的过程,将一种语言的句子转换为另一种语言的对应句子。
机器翻译技术的发展经历了三个阶段。
第一阶段是基于规则的机器翻译,在这个阶段,翻译的结果是基于人工编写的翻译规则和语言知识库,精准度很高,但是翻译范围受到限制,只能翻译那些在规则库中被覆盖的语言片段。
第二阶段是基于统计机器翻译,它是基于大量的双语文本语料库进行训练,并根据翻译语料的频度和概率来生成翻译结果。
这一阶段实现了广泛的语言翻译,但是精度仍然有待提高。
第三阶段是基于神经机器翻译,它使用深度神经网络对两种语言之间的对应关系进行建模。
相比于前两个阶段,神经机器翻译的准确率更高,在计算上的效率也更好。
现在,机器翻译技术已经广泛应用于各个领域。
例如,在跨国公司、国际组织、研究机构,以及留学生活等各种场合中,机器翻译成为解决语言交流问题的一个有效工具。
并且,它已经可以翻译出格式正确、清晰明了的文本、邮件、技术文献等。
机器翻译技术虽然取得了很大的进步,但仍然存在一些挑战。
首先,语言的多义性和歧义性极大的增加了翻译的难度,机器翻译在面对一些复杂语言结构时,仍然会出现错解的情况。
其次,语言的文化和语法差异对于翻译来说很重要,机器翻译引擎并不一定能够准确地把握这些细节。
最后,目前的机器翻译引擎仅支持文本翻译,对于语音和形象的翻译仍有待发展。
总体来说,机器翻译技术的不断进步必将为全球化进程的推进提供便利。
随着技术的不断发展,机器翻译渐渐成为一项实用性强的工具,帮助人们打破语言的障碍,促进跨文化的交流。
机器翻译技术介绍
机器翻译技术介绍近年来,随着互联网技术的飞速发展,机器翻译技术越来越受到人们的关注。
机器翻译技术是指使用计算机软件将一种语言的文本自动翻译成另一种语言的技术,其广泛运用于跨语种文本翻译、机器辅助翻译和智能语音交互等领域。
本文旨在介绍机器翻译技术的基本原理、常见类型以及应用场景。
一、机器翻译技术的基本原理机器翻译技术的基本原理是使用机器学习算法对大规模的双语文本进行学习,从而建立源语言和目标语言之间的映射关系,实现自动翻译。
机器学习算法主要包括统计机器翻译和神经机器翻译两种。
统计机器翻译基于传统的概率统计模型,将整个翻译过程分为三个步骤:分词、翻译和生成。
具体过程是:先对原文进行分词处理,然后将原语言的词汇映射到目标语言的词汇。
最后,将目标语言的词汇组合成翻译文本。
神经机器翻译则是使用深度神经网络对大规模的双语文本进行学习,同时结合注意力机制和编码-解码模型,实现源语言和目标语言之间的高效映射。
二、机器翻译技术的常见类型机器翻译技术根据其所使用的语言种类和机器学习算法的不同,可分为多种类型。
例如,根据语言种类的不同,机器翻译技术可分为汉英翻译、英汉翻译、中日翻译、中韩翻译等。
根据机器学习算法的不同,机器翻译技术可分为传统的统计翻译、基于规则的翻译和神经网络翻译等。
其中,神经网络翻译技术是当前最为先进的机器翻译技术之一。
基于神经网络的机器翻译技术在翻译质量上远远优于传统的机器翻译技术,可准确翻译语言中的复杂结构和长句子,同时具有较高的自动化处理能力和准确性。
三、机器翻译技术的应用场景机器翻译技术的应用场景非常广泛,特别是在跨语种交流和信息翻译方面。
例如,在外贸、旅游、教育、商业等领域中,机器翻译技术可用于对商务文件、官方文件、论文、合同等文本进行快速准确的翻译,从而有效地促进了经济全球化和文化多元化的交流。
此外,机器翻译技术还被广泛运用于机器人、智能客服、语音识别、语音翻译等智能语音交互领域。
例如,在机器人领域中,机器翻译技术可以使机器人快速理解人类语言,并进行自动化回复和翻译。
机器翻译技术介绍
机器翻译技术介绍机器翻译技术(Machine Translation,简称MT)是一种利用计算机程序自动将一种自然语言的文本转换为另一种自然语言的文本的技术。
随着信息技术的不断发展和全球化时代的来临,机器翻译技术的重要性和应用领域日益扩大。
本文将介绍机器翻译技术的基本原理、主要方法和应用现状。
一、基本原理机器翻译技术的基本原理是通过计算机程序对源语言文本进行分析和处理,产生一个中间语言表示,然后再根据中间语言表示生成目标语言文本。
其中,源语言可以是任意一种自然语言,目标语言也可以是任意一种自然语言。
机器翻译技术的关键在于正确地理解和翻译源语言文本的语义和语法。
二、主要方法1.统计机器翻译(Statistical Machine Translation,简称SMT):统计机器翻译是机器翻译技术的主流方法之一。
它基于大量的双语平行语料库,通过统计分析源语言和目标语言之间的对应关系,从而生成翻译模型。
在翻译时,根据翻译模型计算源语言句子与目标语言句子之间的最佳对应关系,从而得到翻译结果。
2.神经网络机器翻译(Neural Machine Translation,简称NMT):神经网络机器翻译是近年来兴起的一种机器翻译方法。
它基于深度学习模型,通过训练神经网络来实现翻译功能。
与传统的统计机器翻译相比,神经网络机器翻译能够更好地处理长句子和复杂结构,翻译质量更高。
3.规则机器翻译(Rule-based Machine Translation,简称RBMT):规则机器翻译是一种传统的机器翻译方法,基于语言学规则和词典等资源进行翻译。
它通过提前定义各种语言之间的语法和翻译规则,将源语言句子转换为目标语言句子。
规则机器翻译需要大量的人工语言学知识和规则库,翻译效果受限于规则的覆盖范围和准确性。
三、应用现状机器翻译技术在各个领域的应用越来越广泛。
在互联网领域,机器翻译技术被广泛应用于网页翻译、在线翻译工具和社交媒体翻译等场景。
机器翻译技术在翻译业中的应用
机器翻译技术在翻译业中的应用随着全球经济一体化的加速和市场开放程度的提高,各国之间的沟通和合作日益增加。
而语言的壁垒是影响国际沟通和合作的一大障碍。
对于企业和个人而言,如何突破语言障碍,顺利开展国际交流和业务活动,成为了摆在他们面前的一个重要问题。
而机器翻译技术的应用,则为解决这个问题提供了新的方案。
机器翻译技术(Machine Translation,MT)是指利用计算机技术,将一个语言的文本自动转换成另一个语言的过程。
其与人工翻译不同,它主要基于语言和语言结构的规则,通过数学模型和算法将一种语言转换成另一种语言。
受当下人工智能技术的发展影响,机器翻译技术在短时间内取得了惊人进展。
目前已广泛应用于许多领域,如法律、医疗、金融、旅游等。
在翻译业中,机器翻译技术的应用已成为了业界的热点话题之一。
一方面,其能够快速、自动地完成大量翻译工作,从而提高翻译效率和生产效益,具有明显的优势。
另一方面,机器翻译技术的质量和精度一直是人们关注的焦点。
因为不同的语言有其特有的语音、语法和语义,而人类自然语言的复杂度和不确定性更是难以刻画和捕捉。
这也就导致机器翻译在应用过程中,会出现很多不准确、不连贯、甚至是荒谬的翻译结果。
那么,在机器翻译技术的应用过程中,如何提高翻译质量和精度,成为了摆在我们面前的一个难题。
下面,我们将从以下三个方面来阐述机器翻译技术在翻译业中的应用。
一、机器翻译技术的基础和原理机器翻译技术的基础是语言学和计算机科学两个学科。
在语言学方面,机器翻译技术主要涉及语言的语音、语法和语义等方面的知识。
在计算机科学方面,则主要是涉及到数学模型、算法和编程等方面的知识。
具体来说,机器翻译技术的基础是:1. 语料库:所谓语料库,就是一组用于机器翻译的句子、段落或文章等语言数据的集合。
它是机器翻译技术的基石和核心。
通常,机器翻译的精度和质量与语料库规模和质量有很大关系。
因此,拥有庞大、质量高的语料库对于机器翻译而言至关重要。
机器翻译的自动评测技术 机器翻译技术
机器翻译的自动评测技术机器翻译技术本文介绍了机器翻译评测的基本原理以及常用评测标准,包括人工评测方法、基于n元匹配的BLEU和NIST自动评测方法。
机器翻译领域最困难的任务之一就是对给定的翻译系统或者翻译算法进行评价,我们称其为机器翻译评测。
由于机器翻译所处理的对象――语言本身存在某种程度的歧义,无法像数学公式或者物理模型那样简单客观地描述出来,这使得为机器翻译结果进行客观的打分变得非常困难。
最早的方法是人工评测,这种方法得到的结果一般是十分准确的,但评测的成本太高,周期过长(评测过程可能长达几周甚至数月),评价结果也会随着评价人的变化和时间的推移而不同,这使得评价结果不可重复,缺乏客观性,因此,机器翻译的自动评测应运而生。
实践证明,机器翻译的评测尤其是自动评测对机器翻译研究的影响十分巨大,对研究发展和技术进步起着非常重要的引导作用。
基于n元匹配的自动评测方法如果一个机器翻译评测系统只根据源语言文本就能自动地为若干译文打分并选择出其中最好的结果,那么这个评测系统本身就是一个质量更好的机器翻译系统了。
因此,自动评测最初的出发点就是给出一些标准的翻译结果,然后比较机器生成的译文与这些翻译之间的相似程度。
我们称这些标准的翻译为参考译文(或者参考答案)。
同一个句子可以有多个不同的参考译文,这些参考译文都表达同一个含义,但可能使用了不同的词汇,或者虽然使用了相同的词汇但在句中的词序不同。
这样一来,机器翻译自动评测的问题转换为比较机器翻译系统输出的一个翻译结果和多个通过人工产生的正确的参考译文之间的相似度的问题,使用不同的相似度计算方法即可得到不同的自动评测方法。
例如,考虑如下两个机器翻译系统生成的翻译结果:源语言文本: 今年前两月广东高新技术产品出口37.6亿美元系统译文1: The new high-tech products in Guangdong exported 3.76 billion dollars in the first two months this year系统译文2: This year,the former two of Guangdong,the export of hi-tech products 37.6 yi US dollars从直观上看,上面两个翻译结果的质量有较大的差别,第一个翻译结果明显通顺、流畅、易于理解,如何将这种人的直观印象与具体的客观分数统一起来?这里引入三个人工翻译的参考译文来进行比较:参考译文1: Guangdong’s export of new high technology products amounts to US$3.76 billion in first two months of this year参考译文2: Guangdong’s Exports US$3.76 Billion Worth of High Technology Products in the First Two Months of This year参考译文3: In the first 2 months this year,the export volume of new high-tech products in Guangdong Province reached 3.76 billion US dollars可以看出,质量较好的系统译文1与三个参考译文共现了很多个翻译片段: 与参考译文1共现“3.76 billion”,与参考译文3共现“dollars”,与参考译文2共现“in the first two months”和“this year”。
机器翻译技术的评估与改进方法
机器翻译技术的评估与改进方法机器翻译技术是指用计算机代替人类进行翻译的技术。
随着人工智能技术的发展,机器翻译技术受到了越来越多的关注和重视。
机器翻译技术可以帮助人们打破语言障碍,促进不同语言之间的交流与合作。
然而,由于语言的多样性和复杂性,机器翻译技术的质量和准确性还存在一定的问题。
本文将探讨机器翻译技术的评估与改进方法。
一、机器翻译技术的评估指标机器翻译技术的评估指标需要反映出机器翻译技术的质量和准确性。
目前,评估机器翻译技术的指标主要有以下几个方面:1.自动评估指标自动评估指标是一种通过计算机自动计算翻译结果与人工翻译结果之间的差异来评估机器翻译技术质量的方法。
目前,自动评估指标主要有BLEU、TER、METEOR、NIST等指标。
其中BLEU是最常用的一种指标。
它主要通过计算n元语法(句子中包含n个单词的短语)的重叠率来评估翻译结果的质量。
当然,自动评估指标也存在一些问题,例如:无法考虑上下文的语义和语体等问题。
2.人工评估指标人工评估指标是通过人工评价翻译结果的准确性和流畅性来评估机器翻译质量的方法。
在人工评估中,评估者需要根据规定的评分标准对翻译结果进行评分,评分通常是1到5分。
人工评估指标通常被认为是比较准确的评估方法,但它也存在着一些问题,例如:耗费时间和人力成本高等问题。
二、机器翻译技术的改进方法机器翻译技术的改进方法需要根据评估结果来分析问题和提高翻译质量。
目前,机器翻译技术的改进方法主要有以下几种:1.基于人工纠错的方法这种方法主要是通过人工干预来纠正机器翻译结果中的错误,从而提高翻译结果的准确性和流畅性。
这种方法需要人工参与,但可以提高机器翻译的准确性。
近年来,有一些平台,比如有道云翻译、谷歌翻译等都采用了基于人工纠错的方法来改进翻译质量。
2.基于机器学习的方法机器学习是一种利用数据和统计学方法来训练机器翻译模型的方法。
通过对大量数据的学习和训练,机器学习可以提高机器翻译的准确性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
机器翻译的自动评测技术机器翻译技术
本文介绍了机器翻译评测的基本原理以及常用评测标准,包括人工评测方法、基于n元匹配的BLEU和NIST自动评测方法。
机器翻译领域最困难的任务之一就是对给定的翻译系统或者翻译算法
进行评价,我们称其为机器翻译评测。
由于机器翻译所处理的对象――语言本身存在某种程度的歧义,无法像数学公式或者物理模型那样简单客观地描述出来,这使得为机器翻译结果进行客观的打分变得非常困难。
最早的方法是人工评测,这种方法得到的结果一般是十分准确的,但评测的成本太高,周期过长(评测过程可能长达几周甚至数月),评价结果也会随着评价人的变化和时间的推移而不同,这使得评价结果不可重复,缺乏客观性,因此,机器翻译的自动评测应运而生。
实践证明,机器翻译的评测尤其是自动评测对机器翻译研究的影响十分巨大,对研究发展和技术进步起着非常重要的引导作用。
基于n元匹配的自动评测方法
如果一个机器翻译评测系统只根据源语言文本就能自动地为若干译文打分并选择出其中最好的结果,那么这个评测系统本身就是一
个质量更好的机器翻译系统了。
因此,自动评测最初的出发点就是给出一些标准的翻译结果,然后比较机器生成的译文与这些翻译之间的相似程度。
我们称这些标准的翻译为参考译文(或者参考答案)。
同一个句子可以有多个不同的参考译文,这些参考译文都表达同一个含义,但可能使用了不同的词汇,或者虽然使用了相同的词汇但在句中的词序不同。
这样一来,机器翻译自动评测的问题转换为比较机器翻译系统输出的一个翻译结果和多个通过人工产生的正确的参考译文之间
的相似度的问题,使用不同的相似度计算方法即可得到不同的自动评测方法。
例如,考虑如下两个机器翻译系统生成的翻译结果:
源语言文本: 今年前两月广东高新技术产品出口37.6亿美元
系统译文1: The new high-tech products in Guangdong exported 3.76 billion dollars in the first two months this year
系统译文2: This year,the former two of Guangdong,the export of hi-tech products 37.6 yi US dollars
从直观上看,上面两个翻译结果的质量有较大的差别,第一个
翻译结果明显通顺、流畅、易于理解,如何将这种人的直观印象与具体的客观分数统一起来?这里引入三个人工翻译的参考译文来进行
比较:
参考译文1: Guangdong’s export of new high technology products amounts to US$3.76 billion in first two months of this year
参考译文2: Guangdong’s Exports US$3.76 Billion Worth of High Technology Products in the First Two Months of This year
参考译文3: In the first 2 months this year,the export volume of new high-tech products in Guangdong Province reached 3.76 billion US dollars
可以看出,质量较好的系统译文1与三个参考译文共现了很多
个翻译片段: 与参考译文1共现“3.76 billion”,与参考译文3共现“dollars”,与参考译文2共现“in the first two months”和
“this year”。
相比而言,系统译文2与上述三个参考译文的共现片段比较少。
通过上述比较,可以很容易地写出一个评价算法来评价上述翻译结果的质量。
通过引入一个称为n元匹配的概念,可对翻译结果1给出比翻译结果2更高的分数。
n元匹配的含义是: 翻译结果与参考译文句子中的任意连续n个单词完全相同,这里的n值可以取任意正整数。
基于n元匹配的策略非常与常用的准确度的计算思想类似,首先统计系统译文与参考译文中共现的n元匹配的个数,再除以相应的系统译文中n元词的总数,用这个比值来表示相应的n元准确率。
机器翻译评测领域目前使用最为广泛的自动评测方法是BLEU ( Bilingual Evaluation Understudy),就基于n元匹配的这一类方法中的典型代表,由IBM于xx年提出。
类似的方法还包括NIST方法,该方法由美国标准和技术研究所提出并命名,它在BLEU方法的基础上,综合考虑了每个n元词的权重,对于那些在参考译文中出现次数更少的词赋给更高的权重以体现其所包含的信息量。
BLEU和NIST是最常用的两种机器翻译自动评测方法,但这一类评测方法并不是在真正地评价系统译文与原文的一致程度,而是根据若干个参考译文为系统译文打分而已。
系统得分似乎与待翻译的原
文没有关系,参考译文的数量多寡与质量好坏才是影响评测结果的关键因素。
基于准确率和
召回率的自动评测方法
基于n元匹配的自动评测方法是一种基于准确率的方法,与参考译文越相似的系统译文可获得越高的分数。
研究人员提出了一些同时考虑召回率的自动评测方法,其中比较典型的是纽约大学提出的GTM评测方法。
该方法应用了图的最大匹配算法来计算词的共现次数。
图1描述了这个计算过程。
图1中的黑点表示参考译文和系统译文共现的词的位置。
图中的B和C都存在两次以上的共现,这些点被认为是互相冲突的,在实际计算时应避免重复,只保留一个即可。
使用图搜索算法找到最大匹配的区块,如图中灰色部分所示,并在此基础上计算最大匹配块长度MMS,准确率和召回率都通过MMS进行计算,在上例中分别为4.6/8和4.6/10。
系统最终的得分使用准确率和召回率的调和平均值F值来表示。
基于GTM的评测标准最大的优点在于,没有人为地设置匹配时的最高阶数值(即n元匹配中的n的最大值,BLEU方法一般只考虑
到4元或者5元匹配),图的最大匹配算法会自动地寻找针对某个参考译文的最大匹配词数。
据称这种基于F值的自动方法与人工评测的一致性可以比BLEU或者NIST更高。
其缺点在于,计算MMS本身是一个“NP难”的问题,比较费时。
引入语言知识的自动评测方法
BLEU、NIST以及GTM方法都是基于字面的完全匹配,并没有理解系统译文和参考译文的含义,引入多个参考译文只能在一定程度上减轻这方面的缺陷。
研究人员尝试使用基于更多语言学知识的评测方法来评价翻译质量的好坏。
早在十几年前,北京大学计算语言学研究所的俞士汶教授就提出了一种基于测试点的机器翻译自动评价方法。
这种方法并不直接评价译文句子,而是考虑系统译文在给定的测试点上的质量。
其基本原理类似于在考试出题时设置考点,考生答题时答到相应的考点即可得分。
基于测试点的评测方法是一种非常巧妙的方法。
使用这种评测方法,通过对评测结果进行细致深入的分析,很容易知道系统在哪些语言问题上处理得不够好,有针对性地对系统进行改进即可进一步提高系统翻译的质量。
近几年来研究人员又提出了一些融合了语义知识的机器翻译评测方法,由美国南加州大学信息科学研究所的Zhou Liang等人提出的ParaEval方法通过引入语义对BLEU方法进行改进,中科院计算所
的刘洋等人在GTM自动评测方法的基础上,引入模糊匹配的策略。
这些机器翻译自动评测方法试图利用更多的语言学知识,更好地评价机器翻译系统译文的质量,使其结果与人工评价更为接近。
(本文作者刘洋为中科院计算技术研究所助理研究员,博士研究生)
内容仅供参考。