军事平行语料库的建立及其在军事翻译方面的应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

军事平行语料库的建立及其在军事翻译方面的应用

The Building and Application of a Parallel Corpus of Military

Texts in Military Translation

■麻丽莉王祥兵

摘要:文章介绍了自建小型军事平行语料库的建库过程,并探讨了该库在军事翻译方面的应用,重点探索了该库如何作为翻译工具辅助军事

翻译。

关键词:军事平行语料库军事翻译译者

中图分类号:E0-059文献标识码:A

文章编号:1671-4547(2009)01-0038-04

军事语料库是指由服务于军事甚至内容涉及军事的单一语种或多语种的文本所组成的语料库,也可以是含图片、语音、视频等媒体形式的语料库。军事语料库的建设、开发与研究对大多数国家来说仍然是刚刚起步的新鲜事物。本文介绍了自建小型军事平行语料库的建库过程,并探讨了该库在军事翻译方面的应用,重点探索了该库如何作为翻译工具辅助军事翻译。

一、建库过程

语料库的整体设计及建库过程决定着语料库研究及应用。语料的选取方式及语料库的建立方法往往限定了其未来的发展,甚至确定了研究能得到什么样的结果。

作者简介:

麻丽莉,女,硕士研究生,国防科技大学人文与社会科学学院,410073

王祥兵,男,副教授,硕导,国防科技大学人文与社会科学学院,410073

殊符号,于是消除杂乱格式和乱码也成了任务之一。这部分的工作因为规律性差,现在还没有简单易行的方法,需要人工整理及仔细校对。总而言之,这一步骤的预期目标是得到

没有噪音和乱码的整齐干净的文本文档。

第三步,英汉文本句子级对齐。在预处理过的基础上,现在的整齐语料已经可以利用一些小程序来达到整理目标了。·首先,用一个小程序来断句,达到无论英汉文本都呈现每一句话单独一个自然段的目标,并且将各个文本里的自然段按顺序标号。·然后,进行人工校对。标号的自然段便于查找和校对。这里经常遇到的问题是错误断句,如英文文本中M r.会被当作一个整句断开。如果编程时考虑全面,类似这些问题是可以避免的。但是有时译文本身就不是完全对应原文翻译的,可能会有一句英文被译为两句/多句中文,或两句/多句英文被译为一句中文,这时人工校对就显得非常必要了。

·最后,用另一个小程序去掉标号,并且在句首加,句尾加,以便于以后语料库的机读。

第四步,进行中文分词。因为现有的经典语料库分析软件大多是西方国家开发的,而中文具有自己的特点,本身不适合运用这些分析软件。为了解决这一问题,要对最后的中文文本进行分词。网上这类软件有很多,笔者所用软件为吕震宇根据ICTCLAS 改编的一个小程序。

第五步,语料库的整合。为了让语料库看起来更像一个整体,也为了给将来的扩展工作留下空间,最后要对语料库进行整合。

·首先,将英文语料保存为en 为开头的文本文档,而与其对应中文语料则保存为ch 为开头的文本文档。·接下来,要为每个文档添加附加信息。如下表:

在添加附加信息之后,所建语料库更具整体性。而且对表中的“领域”可以进行进一步的分类,军事科技、军事情报、军事装备等等。这样,语料库扩充时就会有条理。

经过以上的步骤,一个小型军事平行语料库初步建成。

由于本语料库的初衷就是为了探索平行语料库在军事翻译中的应用问题,基于这个目的,笔者决定:选取翻译水平较高的英汉军事翻译语料,首先建成一个开放型试验库。下面简要介绍一下这个语料库的建立步骤:

第一步,开始语料收集工作。这里要注意几个问题:

·英汉对译。要建立一个英汉军事平行语料库,无疑限定词越多,语料收集难度越大。

·语料越新越好。因为所建库主要涉及开发在军事翻译中的应用,不涉及古英语和古汉语的语言研究。

·电子文本格式,必须能够机读。虽然是小型的试验库,语料库动辄上百万字的容量使得机读成为一项必然要求。

·过硬的语言质量。无论是英语的原文还是汉语的译文,都要质量过关,不然不具备作为翻译参考的资格。

·抽样原则。为了保证在小型语料库中不同译者的比例,以免发生同一译者或同一出版社的影响过大,使得语料库失去参考意义,必须将所收集语料按比例收入语料库。语料库容量越大,对抽样的要求越放松。

第二步,语料的预处理。所收集的电子语料存在这样那样的噪音。例如,来源于网页的语料经常有版权信息和空行等;来源于电子书籍的语料则混杂着页码和章节信息等。为了方便程序处理,所有语料最后都要保存为文本文档格式,而这种格式不能识别图、表、粗体、斜体、脚注、下划线以及一些特

标记

标记内容

中文标题/英文标题作者名/译者名来源领域年代

上帮助译者避免以上问题的出现。(以在笔者所建小型军事平行语料库为例,所使用的检索工具为Paraconc 。)

(1)军事平行语料库可以帮助译者理解原文。在检索英文缩写GIG 时,该语料库的检索结果会将库中所有含有GIG 的英文句子及其对应的中文翻译调出,并将这两个部分同时展示给译者。译者可以左键双击任何一个句子查看该句子所在的语篇。

如果译者对原文理解不透彻,可点击查询结果的英文部分,这时该语料库会显示GIG 的英文使用情况,通过观察GIG 在原文词、句、篇方面的使用情况加深理解(如图1)。

(2)军事平行语料库可以帮助译者规范其译文。同理,如果译者对译文中对该词该如何处理不确定的话,可点击查询结果的中文部分,这时该语料库会显示GIG 的中文翻译情况,译者可以根据翻译中遇到的具体问题而具体分析该参考哪种情况(如图2)。

在提供参考译文时,该语料库可以主要可以发挥两种

作用:可以提供权威的军事术语、习惯用法的准确翻译;还可以为原文中比较特殊的语言现象和表达方式提供常用译法参考。

总而言之,该语料库既可以为译者提供完全对应的词

二、应用于军事翻译

军事翻译有着自己的特点与难点,从某种程度上来说,这也是军事平行语料库存在的意义。

1.军事翻译的特点及难点

文体的特殊性使得军事翻译具有自己的特征。

在词的层面,军事文体除了拥有自己的一套术语体系之外,还倾向于将日常词专业化;军事文体使用的新造词、合成词较多,且经常使用缩略语。

在句子层面,军事文体倾向于使用陈述句、复合句、完整句而非省略句。可以说,军事文体在话语基调上大致属于正式语体。

在篇章语法层面,由于军事文体以阐述客观事实为主要目的,所以倾向于被动语气。另外,便于各种成分修饰(如非限定性从句后置、介词短语后置、同位语及各种前置修饰)的名词化广泛使用,使得文章显得严谨、紧凑,信息含量大,且书面语意味浓厚。军事文体的这些特点决定了军事翻译存在以下难点:

第一,理解原文不到位。军事文体的特点使得译者在从事军事翻译的时候,无论是词、句子还是语篇方面都存在一定程度上的理解问题,可能无法做到从形式上分析到位,从内容上理解到位。

第二,译文表达不地道。由于译者可能不熟悉军事领域的习惯表达法,太多的专有名词、常用语用作术语、各种缩略语、繁复的句子、篇章结构等造成译者堆砌文字,无法理顺词、句、

篇之间的关系,翻译结果不甚理想。2.军事平行语料库作为军事翻译的辅助工具

军事平行语料库可以在一定程度

图1

图2

相关文档
最新文档