机器翻译和计算机辅助翻译
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当前的翻译机构必须倚重翻译技术,越来越多的大中型翻 译机构要求加盟的专职和兼职译员掌握诸如 Trados 、 Wordfast等主流的TM软件
计算机辅助翻译基本过程
词汇复用:系统提供大容量的专业词库,为用户节省查词典的 时间,可自动进行词频记忆并按词频排序,用户只要点击鼠标 或按快捷键即可完成句子翻译。 句子复用:采用先进的翻译记忆( TM)技术,把用户翻译的原文
机器翻译当前存在 的两大突出问题:
二、在处理语义的组成部分上,仍有问题
三 机器翻译的推动作用
人类想尽一切办法研制并完成了一个一个的 机器翻译系统,开发了一个一个的翻译软件,推动了经济的发展,社会的进 步,消除了世界人与人之间的语言障碍,沟通了整个世界,促进了交流,加快 了全球化进程。 随着机器翻译研究水平不断提高,翻译领域也取 得了前所未有的成就。在我们的翻译工作中,我们可以借助各种翻译系统 或软件完成翻译任务,这样可以提高翻译的速度和准确度,提高了翻译工作 的效率。
句子和译文自动记忆到数据库中。翻译过程中,通过搜索引擎,
自动查找记忆库,对需要翻译的内容进行快速分析、对比,保 证相同的句子永远不要翻译第二遍。
模糊匹配复用:一旦发现与记忆库中例句相同或相似的句子, 将根据与原文的匹配情况,系统自动给出翻译建议,用户可选 择自动匹配替换,直接得到翻译结果,避免重复性劳动,提高 工作效率。 片段复用:如果当前翻译的句子与记忆库中例句有相同的片段 时,系统会给出提示,作为翻译时的参考。
1957年,中国科学院语言研究所与计算技术研究所合作开展俄汉机器翻译试验,翻译
了9种不同类型的较为复杂的句子。 从20世纪50年代开始到20世纪60年代前半期,机器翻译研究呈不断上升的趋势。
2.受挫期(1964-1975)
1964年,为了对机器翻译的研究进展作出评价,美国科学院成立了语言 自动处理咨询委员会 (Automatic Language Processing Advisory Committee,简称ALPAC委员会),开始了为期两年的综合调查分析和测 试。1966年11月,该委员会公布了一个题为《语言与机器》的报告(简
随着全球经济的发展和各国之间交流的增多,对语言翻译 的需求将会进一步增加。在这样的背景下,如何更加高效、 高质的处理语言转换已经成为众多机构和公司共同关心的 问题。计算机辅助翻译技术正是在这种背景下应运而生, 它能够帮助翻译者优质、高效、轻松地完成翻译工作。
前景
翻译产业化的重要途径就是翻译信息化, CAT技术的研究,就 是为了适应现代计算机技术在语言转换、国际交流、本地化、 国际化以及翻译领域中的发展和应用。但这一能够使学生面对 市场,面对竞争,面对未来的 CAT技术教学,在我国的外语、 翻译教学中尚缺乏应有的席位,不能不令人深感遗憾。国内的 大学外语或翻译院系,应认识到将 CAT这样实用的技术纳入翻 译专业课程体系设置的必要性和紧迫性,尽早考虑开设 CAT相 关课程,使培养的人才能更好地面向社会,面向时代的要求。
主要功能
在翻译过程中,存在着大量重复或相似的句子和片段。采用人工笔译哪怕是最简单 的句子, 也需要书写一遍。 CAT技术具有自动记忆和搜索机制,可以自动存储用户 翻译的内容。当用户翻译某个句子时,系统自动搜索用户已经翻译过的句子,如果 当前翻译的句子用户曾经翻译过,会自动给出以前的翻译结果;对于相似的句子, 也会给出翻译参考和建议。 CAT是一个具有自学习功能的软件,它会随着用户的使用,学习新的单词、语法和句 型,为用户节省更多的时间。CAT还配有增强工具CAM (Computer Aided Match), 可将用户以前翻译过的资料转换为可以重复使用的记忆库。这样,用户就无需重复 以前的劳动,从而提高翻译速度和准确性。
翻译项目管理
项目管理是多语翻译和多语软件本地化项目的关键因素。 术语词库准备:在翻译ຫໍສະໝຸດ Baidu始之前,项目经理准备术语词库和例句库,由同
一项目中的所有翻译者共享。术语词库准备可大大影响项目的成本,还可
以统一用词和相同句的译法。 材料接收和完成:翻译者收到项目经理所发来的需翻译的材料和术语词库, 就可用翻译软件打开文件,进行翻译。翻译时,翻译者可使用翻译记忆和 术语词库,并不断的把新的语言片断加入到翻译记忆中,也不断把新的术 语词汇加入到词库中。翻译完成后,翻译者以目的语言代替源语言,建立 一个与源语言文件布局完全一致的目的语言文件。再通过电子邮件的形式, 发送给项目经理。
称ALPAC报告),该报告全面否定了机器翻译的可行性,并建议停止对
机器翻译项目的资金支持。这一报告的发表给了正在蓬勃发展的机器翻译 当头一棒,机器翻译研究陷入了近乎停滞的僵局。无独有偶,在此期间, 中国爆发了“十年文革”,基本上这些研究也停滞了。机器翻译步入萧条 期。
3.恢复期(1975-1989)
推动社会的进步
提高翻译效率
促进其他领域发展
机器翻译涉足数学、计算机科学、语言学、 翻译学等多门学科领域,需要这些学科强劲的发展,丰厚的成果作基础,从 而促进了这些领域的发展。
四 机器翻译的前景:
1、用计算机分析语言将在处理语言材料方面带 来重大变革 2、计算机将使我们重新获得控制现有各种语言 中所可利用的大量情报的能力 3、机器翻译的研制成功,必将快速排除交流情 报的障碍
核心技术
CAT 技术的核心是翻译记忆技术,当翻译在不停地工作时, CAT则在后台忙于建立语言数据库。这就是所谓的翻译记忆。 每当相同或相近的短语出现时,系统会自动提示用户使用记忆 库中最接近的译法。用户可以根据自己的需要采用、舍弃或编 辑重复出现的文本。
辅助功能
对于CAT技术来说,另一个重要组成部分则是术语管理。广义的说,翻译 中出现的任何词汇,如果有重复使用的必要,都可以作为术语进行保存, 保存的术语集合则成为术语库。术语库也可以重复利用,不仅仅是在本次 翻译,还可以在以后的项目或其他人的翻译工作中重复使用,不但提高工 作效率,更重要的是解决翻译一致性问题。
计算机辅助翻译
计算机辅助翻译(Computer aided translation,CAT)类似于CAD(计算 机辅助设计),能够帮助翻译者优质、高效、轻松地完成翻译工作。 它不 同于以往的机器翻译软件,不依赖于计算机的自动翻译,而是在人的参与 下完成整个翻译过程。与人工翻译相比,质量相同或更好,翻译效率可提 高一倍以上。CAT使得繁重的手工翻译流程自动化,并大幅度提高了翻译 效率和翻译质量。计算机辅助翻译是一个广泛的和不精确的术语,涵盖了 一系列的工具,从非常简单到更复杂的。
二 机器翻译的优缺点
弊端:很粗糙,使用者必须先作译前编辑;相应地会增加成 本,进而导致成本高于人的翻译。
优点:一、准确无误地完成了翻译定额;二、译文也将随着 语言学家和程序编制人员探索如何更好地处理语言而得到改 进;三、成本也正在稳定下降;四、有助于全世界的学者及 时了解现代发展的情况。
一、尚无法做到确认不同讲话人的等值 语音
一、机器翻译简史
机器翻译的研究历史可以追溯到20世纪四五十年代,学界一般将其划分为如下四个阶 段: 1.开创期(1946-1964) 1954年,美国乔治敦大学(Georgetown University )在IBM公司协同下,用IBM701计算机首次完成了英俄机器翻译试验,向公众和科学界展示了机器翻译的可行性, 从而拉开了机器翻译研究的序幕。 中国开始这项研究也并不晚,早在1956年,国家就把这项研究列入了全国科学工作发 展规划,课题名称是“机器翻译、自然语言翻译规则的建设和自然语言的数学理论”。
机器翻译和计算机辅助翻译
MT& CAT 邵白杨 刘洋 刘娜 邓雯 马雪
机器翻译
机器翻译(Machine Translation),又称为自动翻译,是利用计算 机把一种自然源语言转变为另一种自然目标语言的过程,它是自然 语言处理(Natural Language Processing)的一个分支,与计算语 言学( Computational Linguistics )、自然语言理解( Natural Language Understanding)之间存在着密不可分的关系。
进入70年代后,随着科学技术的发展和各国科技情报交流 的日趋频繁,国与国之间的语言障碍显得更为严重,传统 的人工作业方式已经远远不能满足需求,迫切地需要计算 机来从事翻译工作。
4.新时期:(1990~现在)
随着Internet的普遍应用,世界经济一体化进程的加速以及国际社会交流 的日渐频繁,传统的人工作业的方式已经远远不能满足迅猛增长的翻译需 求,人们对于机器翻译的需求空前增长,机器翻译迎来了一个新的发展机 遇。国际性的关于机器翻译研究的会议频繁召开,中国也取得了前所未有 的成就,相继推出了一系列机器翻译软件,例如“译星”、“雅信”、 “通译”、“华建”等。