《什么是机器翻译》PPT课件

合集下载

英语翻译之机器翻译

英语翻译之机器翻译
机器翻译
内容
1 机器翻译的定义 ( 谈海燕) 2 基于规则的机器翻译系统中直接翻译系统(曾祥 翠) 3 基于规则的机器翻译系统中的转换系统(王彩媛) 4 基于规则的机器翻译系统中基于中间语的机器翻 译(李廷霞) 5基于语料库的机器翻译系统中基于统计的翻译 (陈玉凤) 6基于语料库的机器翻译系统中基于实例的机器翻 译(沈怡) 7 机器翻译的历史与展望(毛秋琦)
举例:
待翻译的句子: 他买了一本计算机语言入门书。 假定计算机中已经储存了如下实例: A他买了-----he bought B一本计算机语言学入门书-----a book on introduction to Computational Linguistics 重组产生:he bought a book on introduction to Computational Linguistics.
基于实例的机器翻译
• 定义:把全部或部分人们已经翻译过的句子实例对齐组成 一个庞大的双语对齐语料库。由此通过精确的检索和对比, 从而得到高质量的译文。 • 起源:最早由日本著名机器翻译专家长尾真提出。他在探 讨了人类外语学习和翻译的过程后发现:人们在翻译理解 新句子时,不是去仔细分析语法结构,而是参照曾经掌握 的句子结构,通过类比进行翻译。 因此他设想:若让计算机预先存入标准的翻译实例, 那么翻译时只要将输入的句子与实例中的句子相比较,找出 与之最相似的那个实例,便可模仿其现成译文进行翻译了。
历史与展望
历史
开创期 (1947-1964)
1954 年,美国乔治敦大学(Georgetown University) 在 IBM 公司协同下, 用 IBM-701计算机首次完成了英俄机器翻译试 验,向公众和科学界展示了机器翻译的可行 性,从而拉开了机器翻译研究的序幕。

机器翻译实例分析PPT课件

机器翻译实例分析PPT课件

这次创新研修我只是对两个比较有名气,口碑好,业界公 认数据库比较全面的在线翻译网站进行了评测。除了这两个网 站,还有很多大大小小的网站加入了在线翻译的竞争行列中, 竞争的结果无疑会促进在线机器翻译技术的发展,使得机器翻 译在效率和准确率上再上一个台阶。
22
2020/1/15
就已有的成就来看,在线翻译工具的译文质量离机器翻译的 终极目标仍相差甚远。中国数学家、语言学家周海中教授曾 在论文《机器翻译五十年》中指出:要提高机译的质量,首 先要解决的是语言本身问题而不是程序设计问题;单靠若干程 序来做机译系统,肯定是无法提高机译质量的。同时,他还 指出:在人类尚未明了大脑是如何进行语言的模糊识别和逻 辑判断的情况下,机译要想达到“信、达、雅”的程度是不可能 的。这也是制约机译质量提高的一大瓶颈。
4.在中世纪,欧洲教堂采用大的内部空间和吸声系数低的墙面,以产生长混响 声,造成神秘的宗教气氛。 B:In the middle ages, European church with large inner space and the sound absorption coefficient of low wall, in order to produce growth and mixing sound, resulting in the religious atmosphere of the mysterious. G:In the Middle Ages, European churches with large interior space and low absorption coefficient of the wall, in order to generate long reverberation, resulting in a mysterious religious atmosphncient Romans’【是创造了罗马人】,严重失误。 ②‘壮丽’谷歌采用了‘stunning’而查常见为‘壮丽’。

机器翻译简介 整理页PPT文档52页PPT

机器翻译简介 整理页PPT文档52页PPT

机器翻译简介 整理页PPT文档
11、不为五斗米折腰。 12、芳菊开林耀,青松冠岩列。怀此 贞秀姿 ,卓为 霜下杰 。
13、归去来兮,田蜀将芜胡不归。 14、酒能祛百虑,菊为制颓龄。 15、春蚕收长丝,秋熟靡王税。
谢谢你的阅读
❖ 知识就是财富 ❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非

英语翻译之机器翻译

英语翻译之机器翻译

基于规则的机器翻译系统之 中间语的机器翻译
自然语言大多一个单词有多种意思,比如,中文 的“方便”二字就有很多不同的意思,容易产生 歧义。在机器翻译中,为了简化纷繁复杂的表达 结构,避免其含糊不清的语义现象,它独立于各 种自然语言,同时又能清晰准确地表达各种自然 语言的人造计算机语言英语而生。这种通用的人 造计算机语言就是中间语。
信息 编码 信息 解码
பைடு நூலகம்
(噪音信道)
语言B
信宿
噪音
基于统计的机器翻译过程图解
ST
转换 全局搜索,求P(T)X P(S/T)最大值 转换
TL文本
P(S/T)词典 模式
P(s/T)对齐模 式
P(T)语言模 式
P(T)为某句在目的语(TL)中出现的概率,P(S/T)表 示原语文本(ST)译成目的语(TL)文本的概率。
寻找中间语的难度
“如果设计出一种原语言(中间语言)用 来翻译,那么它就必须包涵多种语言的所 有特征。这种努力不仅毫无止境,而且很 可能毫无止境。” —法国人斯莱德
基于语料库的机器翻译系统
基于规则的机器翻译益处:它通过上下文的搭配关系进 行分析和生成。借助对语法的分析,将语法现象总结成 规律,用于机器翻译。同时借助传统语法树和广义语法 分析,让计算机根据这些规则举一反三进行翻译 基于规则的机器翻译弊处:由于有些语言相差悬殊,其 结构更是大相径庭,所以给构造映射规则带来了巨大困 难。且规则库再大也是有限的,无法涵盖复杂多变的自 然语言现象,随着分析不断深入,需要的相关信息就越 来越多,这样构造的规则就会越来越难,很容易出现死 循环和前后矛盾等难题。
基于规则的机器翻译系统之 转换系统
出现原因
为了提高译文的可读性,人们更 多地从句子的层面来分析处理原 语与目的语的特征 于是在直接翻译系统的基础上, 出现了机器翻译的转换系统

机器翻译演示

机器翻译演示
• SYSTRAN
网址: SYSTRAN 是世界上最成功的机器翻译系统,可以对36种语言进行 机器翻译,翻译领域可涉及20个不同的专业。
• 华建
网址: 华建是我国华建集团开发的即时翻译系统,可以在线进行英语-汉语 之间、日语汉语之间的双向机器翻译,以及德语到汉语、俄语到汉语的 机器翻译。
5.机器翻译的优缺点--优点
机 器 翻 译 可 在 短 时 间 内 完 成 大 量 翻 译 额
机 器 翻 译 的 译 文 可 以 直 接 加 以 利 用
6. 因特网上的机器翻译工具
机器翻译系统和机器翻译软件
翻译记忆系统
词典和词表
其他翻译工具
6. 因特网上的机器翻译工具--机器翻译系统和软件
翻译系统和软件
(2)错误的翻译
她将生活是百吗?
eg. Will she live to be hundred? (3) 出现带有歧义的句子 eg. She drove into the bank.
bank: 银行 岸,坡
5.机器翻译的优缺点--歧义现象
• 英语中的名词、动词、代词、形容词、连接词、介词在不 同语境下都可能存在歧义。
6. 因特网上的机器翻译工具--翻译记忆系统
翻译记忆系统
• 翻译记忆技术是机器翻译技术的补充,可使用户避免无谓的 重复劳动,很多机器翻译系统同时也采用了翻译记忆技术。 • TRADOS
网址: 德国的塔多思公司研制,在全球“翻译记忆”市场上处于领先地位,致 力于多语言内容管理开放型平台的开发和推广,并将其引入互联网平台, 为用户提供一整套全球化、多语言的解决方案。
3.机器翻译主要应用领域
欧盟作为一个共同体,成功地建立了统一的大市场,统 一使用欧元,建立共同外交和安全政策。但是一直以来语言 问题都困扰着他们,而且现在都还没有应对的好办法。 按照 欧盟的前身,欧洲经济共同体1957年首脑会议通过的关于语 言多样化的决议,每个成员国有平等使用本国语言的权利, 每个成员国的官方语言即成为这个组织的工作语言。在当时 因为只有六个创始国,开会时只使用4种语言,所以问题还 不是十分突出。但是,到1995年欧盟扩大到15个国家时,它 的官方语言增加到11种。据统计,欧盟每次正式会晤至少需 要33个翻译人员,才能完成11种语言间高达110种可能的互 译。据媒体报道,每年欧盟的大小会议共有10000多个,因 此要付出150000个翻译人/日,全年翻译的文件达1130000 页以上。由此可见,翻译的需求是多么的大。

机器翻译基础ppt课件

机器翻译基础ppt课件
1.2 机器翻译的历史
1
1.2.1 什么是机器翻译?
• 机器翻译(machine translation),又称 机译(MT),是利用计算机把一种自然语 言转变成另一种自然语言的过程。用以 完成这一过程的软件叫做机器翻译系统。
– 文本机器翻译 – 语音机器翻译
2
1.2.1 什么是机器翻译?
• 机器辅助翻译(Machine Aided Translation 或Computer Aided Translation,简称MAT 或CAT)
机器翻译的未来可以概括为: • 前途光明,道路曲折 • 没有最好,只有更好 • 路漫漫兮,其修远兮
16
1.3 机器翻译路在何方?
• 危机 机器翻译比起10年前,可以说相当繁荣了。但 是在这繁荣的后面,却存在着危机。前面说到 的ALPAC报告曾给机器翻译带来的创伤如今似 乎已被抚平了。但实际上它的阴影始终会时不 时地再出现在机译研究者的头上。如今随着有 越来越多的机译系统走向市场,政府部门感到 在这种情况下如果还要投资攻关似乎有点名不 正言不顺了。而商家则只是想现在该是把现成 的技术包装包装就可以赚钱的时候了。
17
1.3 机器翻译路在何方?
• 研究者的尴尬: “你估计开发出产品要多长时间?你的系统正确
率如何?”. 如何回答?“正确率大约在百分之五十左右”?
18
1.3 机器翻译路在何方?
• 挑剔者的挖苦与讽刺: "MT?不是machine translation,而是mad translation (疯子的翻译) " "满篇英文难不住,满篇中文看不懂"
20
1.3.1 机器翻译与人工翻译的区别
机译过程: • 一句一句处理,处理第一句时不知道第二句的

什么是机器翻译

什么是机器翻译

机器翻译的利与弊
通过对机器翻译和人工翻译的比较,发现
机器翻译有其速度快、效率高、词汇量 大的优点,但也发现机器翻译存在的不足, 比如翻译死板、灵活性低、句子歧义和 存在文化因素的问题 。
智能型
基于语料库的机译系统是以语 料的应用为核心,由经过划分 并具有标注的语料库构成知识 库。基于语料库的方法可以分 为基于统计(Statisticsbased)的方法和基于实例 (Example-based)的方法。
基于统计的机器翻译
基于统计的机器翻译方法把机器翻译看成是一 个信息传输的过程,用一种信道模型对机器翻 译进行解释。这种思想认为,源语言句子到目 标语言句子的翻译是一个概率问题,任何一个 目标语言句子都有可能是任何一个源语言句子 的译文,只是概率不同,机器翻译的任务就是 找到概率最大的句子。具体方法是将翻译看做 对原文通过模型转换为译文的解码过程。Biblioteka 中 国 的 机 器 翻 译
系 统 划 分
机译系统可划分为基于规则( RuleBased )和基于语料库(Corpus-Based) 两大类。前者由词典和规则库构成知识 源;后者由经过划分并具有标注的语料 库构成知识源,既不需要词典也不需要 规则,以统计规律为主。机译系统是随 着语料库语言学的兴起而发展起来的, 世界上绝大多数机译系统都采用以规则 为基础的策略,一般分为语法型、语义 型、知识型和智能型。不同类型的机译 系统由不同的成分构成。抽象地说,所 有机译系统的处理过程都包括以下步骤: 对源语言的分析或理解,在语言的某一 平面进行转换,按目标语言结构规则生 成目标语言。技术差别主要体现在转换 平面上。
在线机译
目前网络上比较知名的几译 。
机器翻译的现状
我们需要的是计算机帮助人类完成某些翻译 工作,而不是完全替代人,人与机器翻译系 统之间应该是互补的关系,而不是相互竞争。 机器翻译还不成熟,需要的是人与系统的配 合,而不是有意为难,辅助机器翻译可以大 大减轻人的负担。

机器翻译基础ppt课件

机器翻译基础ppt课件
9
(3)机器翻译第三阶段
• 20世纪80年代,机器翻译由面向句法、基于规则的 理性主义方法过渡到语义处理阶段,诞生了基于实例 ( Example-Based Machine Translation) 和 基 于 统 计 (Statistical Based Machine Translation)的机器翻译方 法,被称之为经验主义方法主导的机器翻译系统。
10
(4)机器翻译第四阶段
显著特点 语料库语言学成为语言研究的主流,为满足实 际应用的需要,基于大规模语料库的统计方法 在自然语言处理领域中逐渐占据了主导地位[19]; 20世纪80年代提出的新的语言理论在实际系统 中得到广泛应用,并与大规模语料库的统计方 法结合,建立了具有实用性的新一代机器翻译 系统;开始了新的机器翻译应用研究,如基于 对话的机器翻译。
6
ALPAC报告
• ALPAC报告核心内容:经过调查,机器翻 译速度慢,准确率很差,比人工翻译费 用高得多,在近期或可以预见的未来, 开发出实用的机器翻译系统的可能性不 大。 这个报告后来虽曾受到许多严肃的批评, 认为它是带有严重偏见的,但它对机器 翻译研究造成了很大的损5
(1)机器翻译的萌芽
受Bar Hillel的影响,美国国立科学院于1964 年成立自动语言处理咨询委员会(Automatic Language Processing Advisory Committee, 简称ALPAC),对这10年的研究成果进行评价。 2年后,该委员会发表了一个否定机器翻译系 统实用性的调查报告,即被后人称之为ALPAC 报告,并中止机器翻译项目的研究经费。从此 机器翻译的研究跌入低谷。
1.2 机器翻译的历史
1
1.2.1 什么是机器翻译?
• 机器翻译(machine translation),又称 机译(MT),是利用计算机把一种自然语 言转变成另一种自然语言的过程。用以 完成这一过程的软件叫做机器翻译系统。

人工智能与机器翻译PPT课件

人工智能与机器翻译PPT课件
(2)他每天下午都去玩足球 (3)太原市的夏天既干燥又炎热。 (4)所有人都有饭吃。 (5)喜欢玩篮球的人必喜欢玩排球 (6)要想出国留学,必须通过外语考试。
.
5
第2章 知识表示
5.一阶谓词逻辑表示法适用于表示哪种类型 的知识?它有哪些特点?.
6.什么是单元表示?它有什么优点?
7.把下列语句表示成语义网络描述:
现在的奸商真是胆大,居然连芯片也敢仿冒。
IT行业的游戏规则就是硬件产品越来越在丰富,更新 总是很迅速,而且价格越来越便宜。
7.什么是词性兼类,消除词性兼类有什么重要意义?
8.试构思一种中文人名识别方法,并分析优缺点。
9.什么是词义消歧?主要有哪些方法?
.
16
第6章 语法语义分析
1. 试说明句法分析的必要性及其主要任务。 2. 试举例说明上下文无关语法与正则语法。 3. 描述基于转换的句法分析器的处理过程。 4. 试举例说明汉语的特点? 5. 比较句子成分
第3章 产生式及搜索方法
1. 何谓产生式系统?它由哪些部分组成?试 举例说明?
2. 产生式系统有哪些类型? 3. 试举例说明不可撤回搜索方法的基本思想?
.
9
第3章 产生式及搜索方法
4. 用回溯策略求解如下所示二阶梵塔问题, 画出搜索过程的状态变化示意图
5.
对每个状态规定的操作顺序为:
先搬1柱的盘,放的顺序是先2柱后3柱;
.
3
第2章 知识表示
1. 何谓知识表示?一个好的知识表示方法应 具备哪些特点?
2. 为什么知识表示要实现模块化与简单化? 3. 请写出用一阶谓词逻辑表示知识的步骤。
.
4
第2章 知识表示
4.设有下列语句,请用相应的谓词公式把它 们表示出来:

人工智能课件机器翻译概述

人工智能课件机器翻译概述

词法分析有单词切分(包括歧义切分)和单词形态分析; 还有专有名词问题,如政府机构名称、地理名称、公司名称、 人名、日期、专业头衔等,若不能正确识别,就不会有正确 的翻译
句法分析任务是确定句子中每个词的词性(或称词 类),确定词与词之间的关系以便构成短语,确定短 语之间的关系以便构成更大的短语或者组成句子。
践上都还没能找到这样的Φ,实际上,由于Ll,L2都是无限集, 在只有有限资源(计算速度、存储容量等)的计算机系统中,这 样的Φ是不存在的。因此, 从工程实现的角度,只能对Ll, L2 加以限制,并给出Φ的近似描述。
Φ的最直观的描述是枚举。在计算机系统中建立一部词典即数据 库文件, 它的每个记录只要包含英语与对应的汉语这样两个字段就
人做翻译工作的必要条件是懂得两种语言。一般 情况下,有一种语言是其母语, 另 一种是外语. 因 而工作的难点在外语上,需要记外语单词,学外语 语法。
人能记住的单词与语法规则总是有限的,翻译时免不了要查 词典或参考书。还应当注意到, 人在翻译时会自觉或不自觉地 运用自已头脑中所有的关于客观世界的各种各样的知识, 而人 的知识又是可以不断积累与更新的. 因此,高水平的翻译人是 可以达到的。
当然, 不是人人都能达到最高境界, 正确认识人的知识在 翻译过程中的作用正是把握机器翻译能做到什么程度以及 做不到什么程度的关键。
显然、计算机系统能够翻译的必要条件也是要能“懂得” 两种语言,而且, 这两种语言对于计算机系统来说都是“外 语”。不难想象,机器翻译是很难、很难的研究课题, 通观
当今世界上现有的机器翻译系统,大多数是建立在句法学的 基础上的, 当然也注意吸收语义学的研究成果,因此—般以 句子为单位进行翻译。
显然, 同一种语言内部存在不同的句子结构。不同的语言之间, 表达等价意义的句子的结构可能相同, 也可能不同。在翻译的时候, 通常的做法就是按照句子结构的本来面貌把原语言的一个句子分解 成较小的构成要素,如短语。再将较小的结构进一步分解成更小的 构成要素, 直 到基本的构成要素。这样便得到了关于原文句子的 结构。

机器翻译简介 整理页PPT文档

机器翻译简介 整理页PPT文档

2.受挫期(1964-1975)
1964年,为了对机器翻译的研究进展作出评价,美国科学 院成立了语言自动处理咨询委员会(Automatic Language Processing Advisory Committee,简称ALPAC委员会), 开始了为期两年的综合调查分析和测试。
1966年11月,该委员会公布了一个题为《语言与机器》 的报告(简称ALPAC报告),该报告全面否定了机器翻译 的可行性,并建议停止对机器翻译项目的资金支持。这一报 告的发表给了正在蓬勃发展的机器翻译当头一棒,机器翻译 研究陷入了近乎停滞的僵局。无独有偶,在此期间,中国爆 发了“十年文革” ,基本上这些研究也停滞了。机器翻译 步入萧条期。
MT, the abbreviation of machine translation, is a sub-field of computational linguistics that investigates the use of software to translate text or speech from one natural language to another.
例1:The sight and sound of our jet planes filled me with special longing.
科智系统:我们的喷气式飞机的情景和声音使我充满 特别的渴望。
功学系统:我们的喷射机的景象和声音充满我以(和) 特别的longing。
参考译文:看到我们的喷气式飞机,听到隆隆的机声, 令我特别神往。
例4:I had a car stolen yesterday. 金山快译:我昨天偷一辆汽车。 东方快车:我把了一辆汽车昨天被偷窃。 例5:I used to have three cars. I couldn’t keep them all in my small
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档