机器翻译概论解析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 基 于 语 料 库 的 方 法(Corpus-Based): 基于实例的机 器翻译EBMT( example-based machine translation) 统计机器翻译SBMT(statistics-based machine translation):如Google翻译引擎
机器翻译的缺陷
• 参考译文:He is two meters high.
从语言上下文联系角度
• 不胜惭愧。 • 机器翻译:It is ashamed very。 • 这句话的上下文若是为自己有缺点,做错 了事或未能尽到责任而感到不安,此句应 译为“ I feel quite ashamed.” • 但其上下文若是受人赞扬而表示自谦,则 此句话只具备语用意义,应译为 “ I feel greatly flattered.”
机器翻译方法分类
• (1)基于规则分析,就是对源语言语句 的词法、语义、语法和句法进行分析并进行判断 和取舍,然后重新进行排列组合,最后生成目标语言。 这一系列过程均是模仿人脑进行翻译的过程。
• 2)基于语料库技术,工作原理是利用统计学和 概率方法建立一个包含各种句型的双语对照语料 库。
• 基于规则的机器 翻 译(Rule-Based):直接翻译 法,即输入→形态分析→双语字典查询→词序调 整→输出;转换系统;基于中间语的机器翻译 逐词进行翻译,又称逐词翻译法:翻译效果差, 属于早期过时认识,现已无人采用: How are you ? 怎么是你? How old are you ? 怎么老是你?
数码相机
机器翻译:数の カ メ ラ *这里“数码相机”翻译成“数の カ メ ラ”, 日本人是不会懂的。 参考译文:デ ジ タ ル カ メ ラ
机器翻译的优点
• 机器翻译是科技翻译,尤其是各具体学科、 专业翻译的最佳途径。因为这类翻译句式 结构较为简单,专业词汇重复量大,而机器翻 译速度快、效率高,完全可以在这方面大显 身手。
第十章
第一节 机器翻译概论
1.机器翻译 2.机器翻译的应用
概念
机器翻译(machine translation),又称机译(MT), 是利用计算机把一种自然语言转变成另一 种自然语言的过程。用以完成这一过程的 软件叫做机器翻译系统。
国外机器翻译历史
• 国外机器翻译的发展历史: • 20纪30年代初,法国科学家G B阿尔楚尼最早提 出机器翻译的设想。 • 1946年,英国和美国的两位工程师在1949年出版 了《翻译备忘录》一书。 • 1954年 年,美国乔治敦大学和国际商用机器公司 (IBM) 首次联合试验使用电脑机译系统,并将 由250个词组成的简单的俄文材料译成了基本上 可以接受的英文。 • 这次试验的成功标志着机器翻译系统的真正诞生。
中国机器翻译历史
• 1956年我国开始研究机器翻译。 • 1987 年中国军事科学院成功研制出“科译 4 号”,这标 志着我国机译系统从无到有。 • 1967-1976年的沉寂期 • 1997 年底,东方快车以“智能汉化”为口号,在国内掀 起翻译软件的高潮。 • 1988年是中国翻译软件最红火的一年,国内出现了通译、 译星、朗道、即时通、汉神、Internet宝典等几十种翻译 软件。
• 参考译文:她是位时髦迷人的女郎。
• 狗嘴里吐不出象牙 • 机器翻译:No ivory issues from the mouth of a dog. • 在汉语中有关狗的词语往往带有贬义色彩,然而 在英语国家中,狗被普遍认为是人类最忠诚的朋 友,对狗的忠诚大加赞赏,因此如果在这个句子 中,把狗直译为 dog,会产生文化色彩的变异。 • 在这里机器翻译忽略了“ 狗”( dog)在中英的 特殊文化意义。对这个句子大家比较接受的翻译 为:A filthy mouth can’t utter decent language.
• 天有不测风云 • 机器翻译:A wind and cloud may arise from a clear sky . • 汉语中的 “风云“ 一词如果照字面直译为英语中 的 wind and cloud,那么英语读者是很难体会出 “ 风云”一词所包含的文化内涵的。 • “风云”一词在汉语中可以用来比喻 “不安定的, 多变的局势”,比如 “风云变幻”,“ 风云突变” 等词组中的 “风云”都包含有这一层的含义。为 了便于英语读者的理解,应当根据其真正的文化 意义来真实再现原文信息: • 参考译文:Something unexpected may happen any time.
• 目前有多种网络资源可以提供词汇、专有 名词、例句、文化背景等资料检索功能,大 大方便了翻译学习和研究,并为翻译教学提 供新的思路。 • 常见的资料检索渠道有搜索引擎、在线词 典(如金山在线)、在线百科全书(如维基百 科等)、双语平行语料库(如中国译网、句酷 等 )。
• 人类对自然语言的认识是无尽的,对机器 翻译的研究也是无尽的。不管怎么说,机 器翻译的速度却是无可置疑的,因此我们 必须相信机器翻译的质量将会越来越好, 越来越成熟。 • 我们不能完全依赖于机器翻译,最多把机 器翻译当做一种参考,一份 “草稿”,再 进行人工翻译的思考与修改。
• 他有两米高。
• 机器翻译:He has two meters high. • 这就是我们经常所说的 Chinglish ( 中式英语)现象,机 器翻译也同样出现了这种问题,只懂得按字面意思翻译。
• have (has) 是“ 有”的意思,表示拥有某物,具有所属的 关系。但是汉语中的 “有”不能完全等同于 “ have (has)” 。 他“有”两米高表示他的特征,本身所具有的属 性,不能按照字面进行直译。
• 1. These tests determine if the subsystem has a problem. • 机器翻译:这些测试确定子系统是否有问 题。
• 非文学出版物的机器翻译一直在进行,产品说明书、 天气预报等一些基于专业语料库的材料的翻译效 果还是不错的。例如,蒙特利尔大学研制的英法翻 译系统进行天气预报的自动翻译,多年来每天自动 翻译1,5002,000份天气预报材料,具有很强的实用 性。 • 世界上有70%以上的网站都是用英文编写的,而只 有12%13%的网站是由汉语编写而成的。 • 互联网以及与计算机相关材料的翻译很大一部分 依赖机器翻译。机器翻译在这方面发挥着机器辅 助翻译所不能比拟的作用。
从语言语法角度
• We don‘t read books for amusement. • 机器翻译:我们为了消遣而不读书。 • 原文中的 not位于 read 前,形式上是否定谓语,而在实际意 义上是否定后面的 for amusement,原文的正常语序应 是:We read books not for amusement. • 但英语中习惯把 not提到前面去,这叫“ 否定前置”。又如 我们常说的“: 我们活着不是为了吃饭,而吃饭是为了活 着”,译为英语就是:We do not live to eat but eat to live.原 译单纯在形式上与原文相对应,但意思却完全错误。 • 参考译文:我们读书不是为了消遣。
• 以至于近来有人说“MT,不是machine wk.baidu.comranslation的缩写,而是mad translation(疯 子的翻译)的缩写”。
• 虽然机器翻译历经了70多年的研究,机译的 译文质量确实还是不能令人满意。
从语言文化角度
• 每个国家都有其独特的文化,文化的差异 形成于历史沉积,渗透于生活的方方面面。 • 机器翻译在进行翻译过程中遇到英汉之间 文化差异和文化障碍,通过“ 金山快译”和 “ 东方快车”这两种常用的翻译软件来举 例说明:这是机器翻译的一个缺陷,也是其 重要的薄弱点。
• She is a fox. • 机器翻译:她是狐狸. • 机器翻译对这个句子进行了直接字面翻译,似 乎没有错。在中英文中, “狐狸”一词都可以与 狡猾或诡计多端的人联系在一起。 • 但是“当 狐狸”一词与女性联系在一起时, 汉语与英语却分别具有了不同的色彩和暗示。 • 按照中国人的心理 “狐狸”形容女性是贬义, 指“ 狐狸精”,这无疑是错误的,因为在英语中 “FOX ”形容女性是指时髦迷人的女子。 • 如果直译为“: 她是只狐狸”,便容易在中国读 者心中唤起一种传统上遭到贬斥的形象。