翻译ppt

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

来翻译,那么它就必须包含语言的所有特征。这种
努力不仅毫无止境,而且很可能毫无结果。”
机译原理
基于语料库(corpus-based)
塔多思(Tradoser)
Trados是一款世界级的顶级专业翻译软件, 中文名字我们可以叫它“塔多思”,它是一 款基于翻译记忆库和术语库技术的桌面级计 算机辅助翻译软件,据不完全统计,80%的 翻译业务都选择采用了SDL Trados Studio 这 款软件,并且它也使得翻译项目的整体速度 加快了40%。
基于统计的(statistics-based)和基于实例
的(example-based)两类。
A. 基于统计的机器翻译
翻译的问题其实就是信息传递的问题,即用语言B 准确或近似的再现语言A的信息。基于统计的机器翻译
方法把机器翻译看成是一个信息传输的过程,用一种信
道模型对机器翻译进行解释。这种思想认为,源语言句 子到目标语言句子的翻译是一个概率问题,任何一个目 标语言句子都有可能是任何一个源语言句子的译文,只 是概率不同,机器翻译的任务就是找到概率最大的句子。

九十年代以后,随着计算机技术的突飞猛进和 网络技术的日新月异,机器翻译的发展出现了 前所未有的势头。
的深层结构。就像一座桥梁,把人类不同的语言连接
起来,使彼此可以翻译交流。
三、基于中间语的机器翻译
自然语言大多一个单词有多种意思,容易产生歧义。在 机器翻译中,为了简化纷繁复杂的表达结构,避免其含糊 不清的语义现象,人们设计出一种计算机语言,它独立于 各种自然语言,同时又能够清晰准确的表达各种自然语言。


20世纪50年代和60年代是机器翻译的早期, 美苏冷战促进了机器翻译的发展,一些开 发人员开发了最早的机器翻译系统(即双 语词典加简单转化规则的直接转换系统)由 于没有语言学家和翻译家的参与,机器翻 译中的诸多语言问题和翻译问题都未能给 与足够的考虑。

进入60年代:1966年,美国国家科学学会 的语言自动处理咨询委员会(ALPAC)就机器 翻译发表了评估报告.报告否定了机译研究, 导致机器翻译几乎沉寂了一二十年之久, 当然,ALPAC的报告也并非一无是处,它里 面包括一些对机器翻译未来发展具有深远 意义的建议。
历史与展望
17世纪:俄国人petr smirnov-Troyanskii和美籍 法国人George Artsrouni具体提出“机器翻译”主 张并获得技术专利,但是由于当时技术条件的 限制,机器翻译的大门仍未开启。 美国人Warren Weaver,将人类带进机器翻译 时代,被称为“机器翻译之父”。
具体方法是将翻译看做对原文通过模型转换为译文的解
码过程。
B.基于实例的机器翻译
与统计方法相同,基于实例的机器翻译方法也是一种基于语料 库的方法,其基本思想由日本著名的机器翻译专家长尾真提出,他 研究了外语初学者的基本模式,发现初学外语的人总是先记住最基 本的英语句子和对应的日语句子,而后做替换练习。参照这个学习 过程,他提出了基于实例的机器翻译思想,即不经过深层分析,仅 仅通过已有的经验知识,通过类比原理进行翻译。其翻译过程是首 先将源语言正确分解为句子,再分解为短语碎片,接着通过类比的 方法把这些短语碎片译成目标语言短语,最后把这些短语合并成长 句。对于实例方法的系统而言,其主要知识源就是双语对照的实例 库,不需要什么字典、语法规则库之类的东西,核心的问题就是通 过最大限度的统计,得出双语对照实例库。


二十世纪八十年代中期:机器翻译(MT)携机助 翻译(MAT)雄风再起。当时欧共体从美国购买 了Systran系统的英—法版来帮助减轻它的翻译负 担。这等于是宣布机器翻译的商业时代的来临。 在新的资金支持下,机器翻译步入一个新的发 展阶段。 八十年代,基于知识的和基于中间语言的新的 机器翻译思想给机器翻译带来了长足进步。
在1957年,美国学者V.Yingve提出过机器翻译的三个阶段:
用代码化的结构来标注原语的句子结构。(分析阶段)
把原语句子的结构标志转换为目的语句子的结构标志。(转换 阶段) 由目的语句子结构标志生成目的语句子。(生成阶段)
分析
转换
生成
原语词语
原语句法
双语词法
双语句法
目的语句法
目的语词法
著名翻译研究家奈达根据乔姆斯基的“转换生成法” 对人类翻译过程也做过类似的表达。

二战以后,随着电子计算机的广泛应用,人们 开始关注计算机在非数据上的应用,这其中就 包括翻译,先驱者是Alan Turing。 Weaver在1949年发表了以《翻译》为题的备 忘录,对机器翻译的可行性和难点问题的解决 提出大胆设想。他提出的机器翻译思想犹如星 星之火,一下子点燃了人们对机器翻译的热忱。 机器翻译研究迅速燃及世界
机器翻译的应用
几天过去了,空气中仍能嗅到爆炸后留下的硝 烟味除了远处偶尔零星的枪炮声,小镇又仿佛 回到了往日的恬静街角边围着几个当地的小孩 一位美军士兵正通过手中的机器跟他们说话几 小时后军方宣布他们找到了一个藏有大量武器 的仓库。
机器翻译的相关软件
机器翻译的相关软件
机器翻译的相关软件
什么是机器翻译

机器翻译(machine translation),又称为自 动翻译,是利用计算机把一种自然源语言转变 为另一种自然目标语言的过程,一般指自然语 言之间句子和全文的翻译
基于规则的机器翻译系统
本质
机器翻译的本质是人类思维和语言活动的模拟
(输入)原语
分析
转换
生成
目的语(输出)
基于规则的机器翻译系统,其规则主
要包括词法,句法,短语规则,转换生成
语法等。它大致可分为三种类型:
●直接翻译
●结构转换翻译
●中间语翻译
一、直接翻译系统
直接翻译系统是把原语中的单句或句子直接替换成相应的 目的语的单句和句子,必要时对语序进行适当的调整。 这是机器翻译的最初构想,一般在单词的层面上进行,即 从目的语中寻找与原词汇相对应的单词,它相当于现在的电 子词典,只是翻译的不是单个词汇,而是句子中所有词汇。 发展后期,加入了一些简单的句法甚至语义规则,对替换后 的词语进行重新排序,生成目的语文本
对现有的语料库进行深层次的开发和 研究是现在语料库建设的关键。它包括对 原始材料进行词性、语法、句子结构、语 音、语义、语篇乃至语用上附码标记,以 及双语(尤其是按长度和译词数目进行的 句子层面上的)对齐。标记准确、对齐合
理,非常有利于计算机自动高效地检索,
从而得出理想的翻译。
基于语料库的机器翻译系统又可细分为
SL输入
形态分析
双语字典查询
词序调整
TL输出
正确的翻译 我和你一块玩
I play with you.
由于原语与目的语在句子语法结构上千
差万别,翻译出来的句子的可读性可想而
知。但它毕竟迈出了机器翻译的最实质的
一步,是机器翻译从梦想到现实的一次飞 跃。
二、转换系统
转换系统通常包括分析,转换和生成这三部分,其中从原语 向目的语的转换是该系统的核心。
常见语料库:
原始语料库(raw corpora) 附码语料库(annoted corpora) 平行语料库(parallel corpora) 学习者语料库(learner corpora) 网格式语料库(lattice corpora)

对机器翻译用处最大的要数平行语料库,又 称双语语料库(bilingual corpora)。它是两种 语言互译文本的集合,其中存储大量真实的翻 译例句,由研究人员从无数真实的翻译文本中 搜集遴选整理而成,是双语在段落、句子乃至 单词短语层次上对齐的互动语料库,广泛地应 用于语言翻译(包括机器翻译)和语言对比研 究。
这种通用的人造语言,就是中间语。
基于中间语的机器翻译原理就是在不同语言之间建立 一个通用的语义—句法表达式,翻译时先将原语转换成这 种通用的语义—句法表达式,然后再将这种语义—句法表 达式转化成目的语。如图所示:
SL
分析
中间语(IL)表达式
TL合成
Байду номын сангаас
SL词典和语法库
SL词典
TL词典和语法库
人类语言复杂多变,要使中间语来对应翻译多 种语言绝不是一朝一夕的功夫,正如法国人斯莱德 指出的:如果要设计出一种元语言(中间语言)用
SL表层结构
TL表层结构
分析
SL深层结构 转换
生成
TL深层结构
机器翻译中,从原语句子的表层结构到其深层结
构需要经过词法,句法,语义等分析。形成的深层结
构是一种句法树(syntax tree)。它反映的是一个句子
内部的语法结构,这种结构被认为是人类抽象思维的
逻辑表达式,人们相信,不同的语言具有相同和相似
相关文档
最新文档