浅谈机器翻译存在的问题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

机器翻译及其问题浅析

摘要:由于信息技术高速发展,国际交流日益频繁,如何克服语言障碍已经成为国际社会共同面对的问题,而人工翻译的方式已经远远不能满足需求。利用机器翻译协助人们快速获取信息已成为必然趋势,但机器翻译仍存在一些影响译文可读性和准确性的问题。本文将简单介绍机器翻译并对常见问题进行浅析。

关键词:机器翻译问题语法应用

一、引言

机器翻译(Machine Tanslation,简称MT),又称自动翻译,是利用计算机来进行不用的自然语言之间的翻译,它是自然语言处理(Natural Language Processing)的一个分支,与计算语言学(Computational Linguistics )、自然语言理解(Natural Language Understanding)之间存在着密不可分的关系。它是横跨语言学、数学、计算机科学、翻译学及人工智能等的综合学科,也是信息时代语言应用的一个重要领域。

二、机器翻译的简介

(一)机器翻译简史

人类在近代就萌发了机器翻译的梦想,但是真正把设想付诸现实还是因为计算机的诞生和计算机技术的发展。机器翻译的研究历史课追溯到20世纪四五十年代。1946年第一台现代电子计算机ENIAC诞生,同一年,美国科学家韦弗(W. Weaver)和英国工程师布斯(A. D. Booth)在讨论电子计算机的应用范围时,提出了利用计算机进行语言自动翻译的想法。1949年,韦弗(W. Weaver)发表《翻译备忘录》,正式提出机器翻译的思想。经过六十年的曲折发展,到目前互联网的普遍应用,以及人们对翻译需求的迅猛增长,给机器翻译带来新的发展机遇。我国相继推出了一系列的机器翻译软件如“译星”、“雅信”、“通译”、“华建”等。在市场需求的推动下,商用机器翻译系统迈入了实用化阶段,走进了市场,来到了用户面前。

(二)机器翻译的主要方法

机器翻译的过程一般可简化为三个阶段:原文分析、原文译文转化和译文生成。表象上,机器翻译的核心问题是翻译的准确性;实质上,体现在技术层面则是机器翻译系统采用的方法论问题。在方法论层面,机器翻译系统可分为基于规则(Rule-Based )和基于语料库(Corpus-Based)两大类。

基于规则(Rule-Based )就是由词典和语法规则库构成翻译知识库。尽管语言学家经过长期努力创建了含有成千上万条规则的规则库,覆盖了相当大范围的语言现象,但却难以

应付现实世界中复杂多变的语言现象。基于语料库(Corpus-Based)则是以语料的应用为核心,由经过划分并具有标注的语料库构成知识库。语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。基于语料库的方法使翻译质量有所提高,但建立一个完善的语料库需要投入巨大的人力和物力。不过在一个受限的领域内,该方法是非常有效的。

三、机器翻译存在的问题

众所周知,英汉两种语言之间的差异明显大大超过了西方各语言之间的任何差异,英汉机器翻译的难度也就可想而知。尽管与多年前相比,机译的速度和质量已明显提高,但与人工翻译相比,机译的译文还达不到百分之五十的准确率和可读性。除了机器翻译的译文比较生硬,机器味过浓,在翻译过程中存在一些影响译文的典型问题。下面就某些常见问题加以举例说明:

(一)词义辨析错误

英语中一词多义现象非常普遍,一个词在与不同的词语搭配时具有不同的词义。人工翻译会根据语境来选择,而机器翻译还达不到通过语境来判断语义,通常是根据该次的第一个词义来进行翻译,这就容易出现一些选词不当或错误的翻译结果。例如:Have you ever operated a computer?

[机译] 你曾经运转过一种计算机吗?

[人译] 你操作过计算机吗?

(二)词类判断错误

英语中有很多词是有多种词性的,如“do”和“have”等既可以用作实义动词,也可用作没有意义的助动词,但计算机往往会当成实义动词来译。特别是那些形式上与谓语动词相同,而实际上是作定语或状语的分词,也会当作动词来处理。例如:

Telescopes are housed in large building called observatories.

[机译] 望远镜是坐落在大建筑物调用天文台。

[人译] 望远镜安置在高大的建筑物即天文台上。

(三)冠词的取舍

汉语中没有冠词,而英语中的冠词有时候相当于汉语中的指示代词“这”、“那”、“该”等,但并非所有的冠词都需要译出来。因而如何把握就成了机器翻译的难题,就会出现表达不当的情况:

Welcome to the world of computer telecommunications.

[机译] 欢迎您到该计算机的世界远程通信来。

[人译] 欢迎来到计算机电信世界。

(四)状语和定语的位置

计算机目前还无法根据状语、定语等在句中的修饰关系,灵活准确地处理状语和定语等在汉语中恰当的位置,因而在机译中常常会有不符合汉语表达习惯的情况出现,如:Electrons revolve about the nucleus at tremendous speed.

[机译] 电子围绕该核心以巨大的速度旋转。

[人译] 电子绕原子核高速旋转。

(五)所有格的判断

英语中的名词所有格“’s”的形式与系动词“is”的缩写“’s”形式相同,所以机器在翻译时常常将两者混淆,如:

What is the temperature at the sun’s center?

[机译] 该温度在太阳是中心是什么?

[人译] 太阳中心的温度是多少?

以上所列只是某些简单句子通过机器翻译表现出来的,反映出了一些具体问题,但具有一定局限性。由于英语的语法现象较多,特别是在从句中,所以还有很多机器翻译容易出现的问题尚未列出,如介词短语和定语从句的辨析错误、丢失主句的主语、时态表达不正确等。

四、正确使用机器翻译

机器翻译的译文质量不应该用出版物的质量标准还衡量,其从某种程度只能够传达原文的内容,我们应降低对机器翻译的译文质量的接受值。通常从使用目的来看,法国机器翻译专家将其分为四种:

(一)用于浏览的机器翻译(For the watcher,简称MT-W):用于愿意接受粗糙的译文,也不愿一无所获。

(二)用于修改的机器翻译(For the reviser,简称MT-R):目的在与给客户提供草稿,以便用户修改。

(三)用于翻译的机器翻译(For the translator,简称MT-T):机器翻译系统为翻译人员提供在线词典、参考译文的实例,帮助翻译人员进行翻译。

(四)用于作者的机器翻译(For the author,简称MT-A):作者在翻译时,由机器翻译提供译文中可能产生的歧义,以便得到更好的译文。

这四种类型实际上也反映了机器翻译发展的不同阶段,随着机器翻译技术的发展,机器

相关文档
最新文档