机器翻译研究和机器翻译系统浅谈
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
●翻译p
机器翻译研究和机器翻译系统浅谈
○北京外国语大学 李向东 中科院华建集团 张 宇
圣经《创世纪》中说,人类讲同一种语言的时候,曾经想建造一座高达天庭的巴比塔。被震惊的上帝施展神通,让人们说不同的语言,使他们难以交流。传说虽不足以解释世界上出现各种语言的缘由,但语言的不同一直是人们交际的障碍。计算机的出现为解决这个问题带来了新的曙光。
机器翻译是利用计算机把一种自然语言转变成另一种自然语言的过程。从1949年至今,机器翻译研究经历了一个曲折的发展历程。
第一阶段(1949年—60年代中期)的机器翻译系统以词汇为主,主要采用直译式,即把源语的词或句子直接替换成相应的译语的词或句子,翻译的质量是低劣的。
1966年11月,美国科学院语言自动处理咨询委员会发表了《语言与机器》的黑皮书,否认了机器翻译实用的可能性。这对世界范围内的机器翻译研究产生了很大的负面影响,许多国家的机器翻译研究工作因此遭遇到财政上和组织上的巨大困难,机器翻译研究进入第二阶段。第二阶段(60年代中期—70年代末期)机器翻译研究处于萧条状态,但并没有完全中止。这个阶段的机器翻译系统以句法分析为主,主要采用转换式,即源语分析与译语生成单独进行,两个部分通过语际间的转换衔接起来。
进入80年代,机器翻译研究开始了它的第三阶段———复兴阶段。这一阶段的机器翻译系统具备一定的知识,达到了一定的智能化程度,采用复杂特征集和合一运算作为语法系统的基础。一批商用机器翻译系统陆续问世。因特网的发展使网上翻译成为近年来机器翻译发展的一大特点。
中国是世界上最早从事机器翻译研究的国家之一。1957年,中科院语言所和计算所率先开展了俄汉机器翻译研究。此后,北京俄语学院(北京外国语大学的前身)、华南工学院、哈尔滨工业大学也都开始了俄汉机器翻译研究。1959年北京外国语学院成立了英汉机器翻译研究组。1959年进行了首次机器(俄汉)翻译试验。文革期间机器翻译研究完全停顿,直到70
○РУССКИЙЯЗЫК/2005.1 49
●翻译p
年代后期才重新恢复。80年代中期到90年代初期诞生了两个在中国机器翻译史上具有重要意义的实用化系统:军事科学院研制的“KY-1”英汉机译系统,即后来的“译星”,这是中国第一个商品化系统;还有中科院计算所研制的“863-IM T”英汉机译系统,它不但获得了国家科技进步一等奖,还取得了十分可观的效益。此后,中国的机器翻译事业得到了快速发展,出现了许多商品化系统。
1993年中科院华建电子有限责任公司(前身是中科院计算所机器翻译研究组)与北京外国语大学俄语学院开始联合研制俄汉机器翻译系统。历时近十年,开发出全国首家提供俄汉全文翻译的机译系统。它包括三套俄汉机器翻译软件:华建译通俄汉翻译简体中文版、华建智能辅助翻译系统(俄汉翻译个人版)和华建智能辅助翻译系统(俄汉翻译网络版)。
华建译通俄汉翻译简体中文版———信息浏览翻译软件
该软件属于低端普及型翻译产品,它主要针对普通的俄语学习者、俄语使用者以及大多数与俄语国家有基本交流的客户群体。该软件可以对网页及word系列格式的文档进行实时的单词、句子乃至全文的翻译,并保持原文的格式不变。它拥有俄汉词典(12万条词汇,11万多条词组)、汉俄词典(21万多条词汇)和缩略语词典(1万多条缩略语)。遇到该软件没有的单词时,用户可以通过用户自定义词库添加新词或专业词汇。此外,该软件具有双语发音与即时翻译发声功能,可以朗读计算机中的中、俄文单词、句子和文章。该软件的价位是360元。
华建智能辅助翻译系统个人版———追求优质俄汉译文的翻译软件
该软件是我国第一款针对专业翻译人员的精确翻译需求而开发的专业级软件。它的突出特点是除了具有前面软件的基本功能外,还具有记忆翻译的功能,这在很大程度上可以保证用户经常翻译的一些相关、相近的文章达到很高的准确率。
该系统实现了基于规则分析、类比推理和统计知识的多种翻译模式的集成处理,提供人机交互接口,实现人工对翻译结果的干预,并实现了面向对象的工程、任务管理。通过多种策略的有机融合,提高实际翻译系统的翻译质量与速度。在具体翻译过程中,系统可根据所要翻译处理的内容来决定不同策略的优先。当遇到从未翻译过的句子时,可利用基于规则的分
○俄语学习2005.1
50
●翻译p
析转换机制,对句子进行翻译转换处理,生成译文;当遇到曾经翻译过的相同或相似的句子时,则利用记忆库中已有的成功句子的分析经验,通过启发式类比匹配,生成译文。
该产品包括翻译平台、管理平台和对齐平台三个组成部分。翻译平台通过鼠标点译等智能化的编辑工具,选择正确的译文字符串,对修饰成分进行编辑,从而快速获得高质量的译文。管理平台可实现知识库和项目工程的管理。对齐平台帮助用户将曾经翻译过的材料的原文和译文存入到记忆库中,形成记忆,便于今后的翻译匹配。在词典方面,该软件新添加了航空航天(3万词条)、船舶(10.8万词条)、商贸(3.5万词条)3个专业词库。该软件价格是5580元。
华建智能辅助翻译系统俄汉翻译网络版———向多用户、网络化的拓展该软件是为企业级用户设计的服务器版产品,包括三个基本用户。与个人版相比,网络版的突出特点是管理平台增加了多用户管理功能,提供翻译语料的实时共享,确保翻译的一致性和准确性。管理平台将该软件用户分为3大角色:管理者、翻译人员和只读人员。管理者负责管理其他人员的工作和记忆库中语料的添加、删除等管理工作;翻译人员负责翻译语料并对语料进行记忆;而只读人员只完成翻译任务,但是其翻译成果不可或需经管理人员校对后才能存入记忆库,以保证记忆库中语料的准确性。此外,该软件的记忆功能中的近似匹配功能比个人版产品优化了很多。该软件适合于从事大量专业翻译的企事业单位。该软件价格是38000元。
结束语
机器翻译涉及计算机科学与语言学,它的处理对象是复杂的自然语言。就目前而言,计算机并未达到人类对语言的驾驭程度,因此,人机(人工翻译和机器翻译)互助已成为当今世界机器翻译研究界的共识。高质量的全自动翻译尚不现实。
随着因特网的普及、信息时代的到来,机器翻译系统对国际间的交流与合作将发挥越来越积极的作用,机器翻译的应用前景是广阔的。机器翻译研究对于了解人类语言与思维的基本机制、探索计算机和人工智能的潜力和极限都有着重要意义。
○РУССКИЙЯЗЫК/2005.1 51