一本翻译界能读懂的机器翻译著作

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一本翻译界能读懂的机器翻译著作

——评《语义组合与机器翻译》

孙洪山

(济南大学外国语学院,山东省济南市,250022)

摘要:本文从5个方面评价了学术专著《语义组合与机器翻译》,认为该著是一本朴素的学术专著,是一本

翻译界能读懂的机器翻译著作。机器翻译一直是翻译界讳莫如深但又很难涉足的领域,该著揭开了机器翻

译的神秘面纱,便于译界更加深入了解机器翻译。

关键词:《语义组合与机器翻译》,机器翻译,翻译界

中图分类号: H059 文献标识码:B

机器翻译的终极目标在于代替人类从事翻译活动(Koehn, 2010:xi)。不论这个目标(更确切的说法是“梦想”)能否实现,机器翻译与翻译者的关系是十分密切的。翻译工作者应该关注这个能够帮助自己,甚至将来抑或会取代自己的“新生事物”。实际上,机器翻译已经不是一个新鲜的概念了(Hutchins, 2000:xii),广大的翻译工作者已经接受了“机器翻译”的概念,市场上某些机器翻译软件也让译者们见识了“机器翻译”的翻译效果。然而,翻译界对于机器翻译的“误读”从而产生“排斥”的趋势却越来越明显。其原因之一就在于机器翻译论著太“深奥”、太“专业”,翻译界读不懂。 “复杂的自然语言处理教材是为计算机程序员而非语言学家编写的(Covington,2007:601)。”实际情况也大抵如此,因为机器翻译一般被认为是自然语言处理技术的应用,其研究通常是在人工智能、信息技术和统计模型等领域进行的,语言研究尤其是翻译研究对机器翻译研究的深度不够。当然研究深度不够不是因为翻译界“避重就轻”,不去了解和关注机器翻译的原理和实现过程,而是因为机器翻译所涉及的各种计算机算法和数学公式实在太复杂——似乎翻译界完成不了这个工作。这又回到了机器翻译研究的主体问题,翻译界能不能做机器翻译研究?

张霄军博士的专著《语义组合与机器翻译》(科学出版社,2010)给这个问题做了肯定的回答。就作者的学科背景而言,他是语言学专业的科班出身(硕士就读专业为外国语言学与应用语言学,博士就读专业为语言学与应用语言学)。就该书内容而言,国内计算机专家和语言学家都给出了很高的评价(见该著封底)。笔者是一名普通的翻译教学工作者,长期关注机器翻译研究现状,通读此书,得出的一句评价是:该书是笔者所阅读过的机器翻译著作中最容易读懂的。这样的结论基于该书以下几点特色:

(1)作者擅用图表来解释难点,避免使用大量难懂的数学公式。第3章在构建面向机器翻译动词选择的“双语动词语义词典(BiVSD)”时,作者使用组合流程图(见该著第71页)的形式说明了BiVSD的内部构成;第5章用流程图的形式(见该著第95页)清楚地表明了基于规则或者中间语的机器翻译系统工作流程和本书主要研究对象处理的全过程。一般的机器翻译著作在介绍机器翻译原理,尤其是统计机器翻译原理时,总会使用大量的数学公式,而该书在概括机器翻译研究方法时只用了噪声信道模型的数学公式。第6章(第6.3节)在建立机器翻译译文评价方法——“模糊综合评判法”数学模型时,作者先给出了

一个带有假设值的数学模型,之后以翻译案例的形式阐释了该模型的应用情况。这样的话,

尽管后面有具体的数值运算,读者因为有了前面对该数学模型的先行理解所以也不会感到突兀和难以接受。

(2)作者对机器翻译原理的介绍(参见该书第4和第5章)既有宏观的概括,又有微观的详解。在宏观概括机器翻译研究方法时,对于各种研究方法,作者不只是简单的介绍,还包括对各种方法优劣点的评价。如在介绍IBM统计机器翻译方法时,作者写道:“从理论上说,IBM 模型只考虑了词与词之间的线性关系,没有考虑句子结构的非线性关

系。当两种语言的语序相差较大时,效果可能不太好。如果在考虑语言模型和翻译模型时,将

句法结构或语义结构考虑进来,才能得到更好的结果。”(第86页)

该著的主要研究内容是英汉机器翻译系统中动词的译词选择问题,通过“动词译词选择”这个研究主题可以很好地微观阐释机器翻译的全过程。该书第5章详细分析了动词译词选择的各步骤,在机器翻译原理介绍的每个细节上都注意到了内容的普适性。

(3)作者巧妙地把语言研究和机器翻译联系在了一起,而这种联系同时又是解决机器翻译“义障”的有效途径。不管采用语言学规则,还是利用统计学知识,语义始终是自然语言处理绕不过去的瓶颈,词义的模糊性、歧义性和多样性是影响自然语言理解的主要原因。对机器翻译来说更是如此——这是一种跨语言的词义消歧,即寻找跨语言的语义对应关系。该书采取的解决方案是利用语义的组合模式。这是一种很朴素但很实用的思想:如果源语和目标语的单词之间的语义对应关系难以确定的话,那我们可以扩大对象——单词的特定义项难以确定,那么几个组合在一起的词语序列的义项则是相对固定的。这就是语义组合。语义组合模式中既包括词汇的语义特征组合,也包括语法语义特征。在语义组合研究过程中,细心的张博士还发现了“主观性语义特征”,并将其也纳入了语义组合模式之中。

(4)作者对研究对象的选择方法既有语言学界惯用的“人工内省法”,也有计算机学界常见的“自动筛检法”。首先,通过知识库融合的方法从英语FrameNet和英汉双语HowNet中自动生成了常见的英语多义动词839个,在大量真实语料和词典例句语料的基础

上对其语义特征组合模式进行了人工归纳总结,共提取英语多义动词的5,092种语义组合

模式。在每种模式中,作者都给出了该英语动词相对应的汉语可选译词。在此基础上构建了供机器翻译译词选择所“专用”的“双语动词语义词典(BiVSD)”,利用BiVSD中这

5,000余种语义组合模式及其所涉及英语动词的汉语可选译词,辅以动词语法语义特征,

机器翻译系统就可以准确判断出该动词在一个具体语境中的恰当译词,从而选择出恰当的

译词。

(5)该书研究体系完整,内容翔实。很明显,作者的研究目的不仅仅是要找到源语和目标语动词相对应的语义组合模式,而且要将这种研究方法应用到机器翻译实践中去。因此,他将机器翻译中的“译词选择”作为论文的另一重要内容。换句话说,他在完成了源语动词的语义消歧和目标语译词的语义消歧之后,还完成了目标语译词的生成。最后,为了验证这种方法的有效性,他又将“译文质量评测”纳入了研究范畴,设计了验证实验,实验结果

表明利用语义组合模式进行译词的语义选择是有效的。这样的话,从理论分析到语义组合模式提取,再到语义组合模式应用,最后到方法有效性检验,全书的结构就很完整了,结论

也很有说服力。

当然,本书也有不足和改进之处,作者自己在第7.3和7.4节(第164-167页)也提到了一些。笔者想就另一点改进之处再提一下:该书是在作者博士毕业论文基础上修改而成的,诚如他在“后记”以及其导师在“前言”中所提到的——该书的研究对象839个多义英语动词的语义组合特征模式的提取工作是在作者毕业后才完全完成的。造成这种结果的原因在

相关文档
最新文档