翻译概论第十五章 信息技术和翻译-PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1933年,苏联发明家特罗扬斯基设计了一种用机械方法将 一种语言转换成另一种语言的自动翻译机,此项发明在同年9 月5日被登记了下来,但是由于当时技术水平不够发达,他构 想的自动翻译机并没有制成。1946年,美国宾夕法尼亚大学莫 尔电工学院制造出世界上第一台电子数字计算机,它的出现激 起了语言学家对于机器翻译新发展的研究兴趣,同年,英国工 程师布斯与美国计算机语言学的先驱,洛克菲勒基金会总裁沃 伦.韦弗在研究电子计算机的应用范围时,提出了运用计算机 进行自动翻译的想法,第二年七月韦弗发表了一本名为《翻译》 的备忘录,这本备忘录影响深远,其中正式提出了机器翻译的 问题,阐述了机器翻译的理论,提出了将一种语言通过一种通 用语或终结于译成另一种语言的想法。韦弗与1949年又发表了 一篇备忘录《韦弗备忘录》,提出了四点建议:“1)意义的 多重性可以通过考察词语前后紧邻的语境来解决;2)语言中 逻辑因素的存在意味着翻译问题可以从形式上解决;3)密码 方法可以用在机器翻译中;4)语言具有普遍性,可以通过机 械的方法来处理。”(转引自文军,2019)
此外,我国台湾地区和香港特别行政区也开展机器翻译研 究。香港的机器翻译研究始于19世纪70年代,今年来香港在机 器翻译教学方面取得了很大的进展,2019年香港中文大学开办 了世界上第一个计算机辅助翻译硕士课程。2019年,举办了第 一节世界范围内的翻译软件国际会议(International Conference on Translation Software: The State of the Art)。台湾的机器翻译虽然起步较晚,开始于1985年,但是 其抓住了发展契机,已经跟其他地区站在了统一起跑线上。 纵观中外机器翻译发展的数十年的发展历程,经历过大大 小小的波折与困难,道路并不平坦。然而,直到今天,机器翻 译研究仍然在马不停蹄的进行着,研究越来越深入,内容越来 越丰富。留下的许多尚未解决的问题,还需要新时期的年轻人 担负起再发展、再创造的光荣使命,让机器翻译研究事业蒸蒸 日上,取得更加令人瞩目的成绩。
从20世纪80年代末开始,一些新发展使整个机器翻译的视野 发生了转变,产生了基于语料库的第三代机器翻译方法,标志着 机器翻译研究进入了一个新的发展阶段。基于语料库的机器翻译 系统包括基于统计的(Statistics-based)和基于实例的 (Example-based)两种机器翻译方法,与此前基于规则的翻译 系统不同的是它们不再利用句法或语义规则来分析文本或选择对 等词汇了。 从两千年以后,随着社会发展和信息需求的不断变化,机器 翻译不再被看做是独立的活动,研究者特别注重其与其他功能, 如文档创建、信息分析等相关方面的功能相结合,满足多样化的 服务需求。新时期的机器翻译系统为全球化信息交流作出了卓越 的贡献。如今,机器翻译不仅是专业译员的辅助工具,也成为了 大众双语或多语学习者的好帮手,发展前景非常乐观。
形式化、确定性和系统性是机器词典的三大特征。因为机器 词典为计算机软件所使用,所以其中包含的信息必须是类似于 计算机语言代码一样的各种形式的复杂特征集合,而不是人类 语言信息,由此可以说机器词典是形式化的。正是由于机器词 典采用了形式化的表示方式,而不是像人工词典应用自然语言 解释而容易出现一词多义等现象,信息是确定的,避免了自然 语言释义的模糊性,所以说机器词典有具有确定性。机器词典 中,所有信息都采用统一的框架进行描述,具有较好的一致性, 所以又拥有了系统性这一大特征。 1.2.2 语料库 所谓语料库,顾名思义,就是储存语言材料的仓库,通常 指为了语言研究而收集、整理的,以电子计算机为载体储存的 语言材料集合。随着机器翻译研究的逐渐深入,语料库为其提 供了重要的发展思路,也成为了计算机语言学中的重要研究课 题和分支,称作语料库语言学。语料库语言学的发展及兴起对 语言研究和翻译产生了巨大的影响。
1975年,在中国科技情报所的组织下,集中了原来几个重 要研究所的技术人员,共同研究,以冶金方面的材料为研究对 象,经过五年多的不懈努力,开发出了新的多语机器翻译系统, 积累了宝贵的经验,推动了机器翻译事业走向复苏。 机器翻译研究的繁荣时期到来之后,先后出现了一大批机 器翻译系统,并推出了商业化服务,其中有代表性的成果有: “译星”英汉机器翻译系统、高立英汉机器翻译系统、IMT/EC 英汉翻译系统、Matrix英汉机器翻译系统、SinoTrans汉外机 器翻译系统等,其中“译星”英汉机器翻译系统是中国第一个 商业化机器翻译系统。与此同时,许多知名院校也纷纷参与到 了开发之中,比如:哈尔滨工业大学、国防科技大学、南京大 学、清华大学、北京大学、上海交通大学等。我国的863科研 发展计划对机器翻译研究的大力支持,为我国机器翻译研究的 发展给予了极大的帮助。新时期的机器翻译系统实用性强,操 作简单,可以进行网络在线翻译,应用范围广,大众化趋势越 来越明显。
机器词典总体上可以分为两大类:一类是机读词典,即计 算机可以通过某种编辑或阅读软件显示或打印的词典,通常是 纸质词典的电子版或在其基础上又增加了索引结构的形式等; 另一类是机器可循词典,即具备了机器翻译系统或其他自然语 言处理系统可以直接利用的框架或格式的词典。因为计算机并 不能像人类阅读的方式去理解词典,所以机读词典并不是机器 翻译系统可以直接操作的词典。如果想要让计算机利用机读词 典,必须通过人工或自动的方式将其转换成机器可循词典,因 此,大体上说,狭义的机器词典一般指的是机器可循词典。如 果按照一定的条件细致划分,机器词典大致可以分为以下几种 情况:如果按照词典涉及的语言来划分,可以分为单语词典和 双语词典。如果按照词典中包含信息的侧重点不同来划分,可 以分为语法词典和语义词典。对于计算机辅助翻译系统来说, 为了适应不同专业领域的翻译要求,需要配有大量的专业词汇。 因此,词典又可以根据用途不同划分为通用词典和专业词典, 这种划分更便于维护和扩充。
目录 第一节 机器翻译 第二节 计算机辅助翻译 第三节 信息技术翻译手段的评价与发 展前景
第一节 机器翻译
1.1 机器翻译的历史
1.1.1 外国机器翻译史 1.1.2 中国机器翻译史
1.2 机器翻译的语言资源
1.2.1 词典 1.2.2 语料库
第一节 机器翻译
翻译是一种自然语言到另一种自然语言的转换,机器翻译( Machine Translation,简称MT),又被称为自动翻译,则是 利用计算机将一种自然语言转换为另一种自然语言的过程。它 是一门由语言学、数学与计算机科学学多个学科相结合而成的 交叉学科,属于应用语言学的一个重要分支。机器翻译必须借 助一种人工智能系统来完成,这种系统被称作机器翻译系统, 也就是一种能够完成机器翻译的软件系统。
1.1.2 中国机器翻译史 我国是继美国、英国、苏联之后,世界上第四个开展翻译 研究工作的国家,得到国家的高度重视,我国的机器翻译研究 主要由政府出资支持。早在1956年,机器翻译就被列入了我国 科学研究的发展规划,课题名称为“机器翻译、自然语言翻译 规划的建立和自然语言的数学理论。”(转引自杨沐昀、李志 升、于浩,2000)该课题被列入当时的《科学发展纲要》,此 后,机器翻译还相继被列为“六五”、“七五”,以及“863” 等重大科研项目。与国外及其发展历史相似,我国的机器翻译 研究至今也经历了初创期(1956-1966)、停滞期(19661975)、复苏期(1975-1987)、繁荣期(1987-)四个阶段。
1.2 机器翻译的语言资源 1.2.1 词典 任何一个计算机辅助翻译系统都需要通过查阅词典来获得 所需的语义或语法。词典与计算机辅助翻译研究存在着以下两 点重要联系:(1)系统中的词典规模是实用化计算机辅助翻译 系统发展的关键要素之一。有些系统在到达实践阶段时,往往 因为词典的规模有限而阻碍了其性能进一步提高。因此,尽可 能地扩大机器词典规模,作为实用化系统(如:电子词典、在 线翻译软件等)的竞争策略是尤其值得考虑的。在计算机辅助 翻译发展初期,由于计算机存储空间的大小有限,机器词典的 安装规模也受到很大的阻碍。20世纪80年代以来,随着计算机 技术的不断发展进步,计算机的储存空间不断增大,迅速不断 提高,机器词典的安装规模问题也得到了较好的解决。(2)机 器词典的词条信息的丰富与否是能否生成高质量译文的重要决 定因素之一。理想的计算机辅助翻译系统需要有一部信息丰富、 易于机器使用的词典作为基础。只有将翻译所需要的词汇搭配 知识等重要信息都列入词典,在进行计算机辅助翻译时才能高 速、高效的译出语义准确、贴切,语法规范的译文来。
1.1 机器翻译的历史 1.1.1 外国机器翻译史 其实早在计算机没有问世之前,就有人提出过使用机器 进行翻译的想法,但由于当时各种条件的不足,使这个设想只 停留在了理想层面上。机器翻译的设想真正意义上被提出并付 诸实践是在20世纪30年代,法国科学家乔治.阿尔楚尼提出机 器翻译的设想,并且获得了一项叫做“机器脑”的创造专利, 虽然他提出这个机器非常适合进行机器翻译,但由于第二次世 界大战的爆发,翻译实验未能进行。
第中巴别塔的故事想必在翻译界是家喻 户晓的。人类建造通天塔使上帝大为震惊,于是便施展神通, 让人们说不同的语言,彼此不能沟通,无法共同工作,以惩罚 人类的异想天开。然而,正是因为巴别塔的建造触怒了上帝, 人类的相互交往出现障碍,才促使了翻译的产生,使其得以存 在、发展。有史以来,人类对翻译方法的探求就不曾停止过, 然而,随着世界各国商贸、政治往来越来越频繁,经济全球化 越来越迅速,对于翻译的需求量越来越大,人们对于更加快捷、 更加简便的翻译方式的渴求也越来越强烈。电子计算机的出现, 使人类的生活发生了翻天覆地的变化,也给传统的人工翻译变 革带来了新的曙光。 本章从机器翻译和计算机辅助翻译两个大方面讨论信息技 术与翻译之间的千丝万缕的联系。介绍了机器翻译和计算机辅 助翻译的发展历史和发展前景,还对其中包含的重要组成部分 进行了重点介绍,让读者清晰的了解信息技术与翻译的关系。
1957年,当时的中国科学院语言研究所和计算技术研究所 携手,率先开展了俄汉机器翻译研究。1958年11月,中国科学 院语言研究所正式成立了机器翻译研究所,一方面还与计算技 术研究所合作研究俄汉机器翻译,一方面又与北京外国语学院 合作研究英汉机器翻译。同年12月,当时的北京俄语学院、华 南工学院也分别成立的俄汉机器翻译研究组。1959年4月,哈尔 滨工业大学也成立了俄汉机器翻译研究组。 1961年,中国语言研究所、计算技术研究所、北京外国语 学院和中国科学技术情报研究所共同制定了1961型俄汉机器翻 译方案。其中提出的“相关分析独立生成”原则以及“中介成 分”理论,至今仍然为我国机器翻译研究工作所采用。1966年 到1976年十年时间,受到“文化大革命”的影响,机器翻译研 究转为停止状态。但这一时期中,研究者也认识到了全自动机 器翻译的不可行,应该将更多精力放到机器辅助翻译研究上, 为今后研究工作的复苏提供了重要方向。
从1954年开始,除美国、英国以外,其他许多国家也掀起了 研究机器翻译的高潮,成立了许多研究机构。1964年成立的自 动语言处理咨询委员会,对当时机器翻译的速度、质量、费用 以及翻译需求等方面问题进行了调查、分析,并发表了《语言 和机器》研究报告显示机器翻译不仅质量不过关,速度也并不 比人工翻译速度快。因此,ALPAC不建议再对机器翻译投资的 意见,建议开发供译员使用的全自动词典等机器辅助翻译工具, 这导致机器翻译研究事业陷入低谷。 被ALPAC的报告打击后,加拿大、德国和法国仍然坚持着 对机器翻译的研究。不久,托马在Georgetown-IBM系统的基础 上研发了大型机器翻译系统SYSTRAN,该系统翻译正确率较高。 1976年,加拿大蒙特利尔大学TAUM研究组成功研制出了METEO 系统,1977年5月,METEO系统开始正式投入日常运营,成为第 一个译文不需经过编辑就可用的机器翻译系统。METEO系统的 成功研制标志着机器翻译系统研究由复苏走向繁荣。
相关文档
最新文档