机器翻译系统发展与研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中图分 类号 :0 5 H 8 文 献 标 识 码 : B
2 世纪 7 年 代 ,西欧和加拿 大开始 出现 0 0 以追求可读性和 忠实性 为 目 的第二代机器 翻 标 译系统 。 这些系统 以基于转换的方法为代 表 , 普 遍采用 以句法分析 为主 、 以语 义的基于规则 辅 的方法 ,采用有抽象 的转换表 示的分层次实现 策 略 , 合 了多 种技术 : 与算 法分离 , 综 知识 模块 化设计 , 多种句法分析策 略以及语 义分析等等 , 机器 翻译概况 并且大多 引入 了人 工智能技术 ,其中许多方法 机器 翻译 ( ah et nli )又称 为 自 和技术直到今天仍被沿 用。期 间 比较著名 的系 m ci a s tn , n r ao 动 翻译 ,是利用计算机把 一种 自然源语言转变 统有 :Y T A S S R N多语 言 翻译 系统 、 i e We dr系 n 为另 Leabharlann Baidu种 自然 目 标语 言的过程 ,一般指 自然语 统 、 U P T A 多国语翻译 系统 、A M— — E ROR T U ME 言 之间句子和全文 的翻译 。它是 自然语言处理 T O系统等 。 E ( trlL n u g rcsig Naua ag a ePo es )的一个分支 , n 与 2 世纪 9 年代 至今 ,随着 Itnt 0 0 n re 的普 e 计 算语 言 学 (o pti a Lnu t s)自然 遍应用 ,世界经济一体化进程 的加速以及 国际 C m u tnl i ii 、 ao g sc 语 言 理解 (N t a Lnug nes nig 社会交流 的 日 a rl agaeU drad ) u t n 渐频 繁 , 传统 的人 工作 业的方式 之 间存在着 密不 可分的关 系。 已经远远不能满足迅猛增 长的翻译需求 ,人们 整个机器 翻译 的过 程可 以分 为原文 分析 、 对于机器翻译 的需求空前增 长 ,机器 翻译迎来 原文 译文转换和译文生成 3 阶段。在具体 的 了一个新 的发展机 遇。国际陛的关于机器翻译 个 机器 翻译系统 中, 根据不 同方 案的 目的和要求 , 研究的会议频繁 召开 ,中国也取 得了前所未有 可 以将原 文译文转换阶段 与原 文分析阶段结合 的成就 , 相继推 出了一 系列机器 翻译 软件 , 例如 在一起 , 译文生成 阶段独立起来 , 立相关 “ 星” 、 雅 信”、“ 而把 建 译 “ 通译 ”、“ 建” 。在市 华 等 分析独立生成 系统 。 在这样 的系统 中, 原语分析 场需求的推动下 , 商用机器 翻译 系统迈人 了实 时要 考虑译语的特点 ,而在译语 生成 时则不考 用化阶段 , 了市场 , 走进 来到了用户面前。 虑原语 的特点 。在搞多种语言对 一种 语言的翻 三 、 国机器翻译发展 我 译 时 , 于采 用这样 的相关分析独立 生成系统 。 宜 中国机器翻译研究 起步于 15 年, 9 7 是世界 也可 以把 原文分析 阶段独立起 来 , 原文译 文 上第 4 把 个开始搞 机器翻译 的国家 ,0 6 年代 中期 转换 阶段 同译文生成 阶段结合起 来 ,建立独立 以后一度 中断 , 年 代中期 以来 有了进 一步 的 7 0 分析相关生成 系统 。 在这样 的系统 中, 原语分析 发展 。现在 , 国社会科学 院语言研 究所 、 国 中 中 时不考虑 译语的牛| 寺 ,而在译语生成 时要考虑 科学技术 隋报研究所 、中国科学 院计 算技术研 原语 的特点 ,在搞一种语言对多 种语 言的翻译 究所 、 黑龙江大学 、 哈尔滨工业大学等单 位都在 时, 宜于采用这样的独立分析相关生成系统 。 还 进行机器翻译的研究 ;上机进行 过实 验的机器 可 以把原 文分析 、原文译文转换 与译文 生成分 翻译 系统 已有十多个 ,翻译 的语 种和类型有英 别独立开来 , 建立独立分析独立生成系统。 在这 汉 、 、 、 、 等一对一 的系统 ' 俄汉 法汉 日汉 德汉 也有 样 的系统 中 , 析原语时不考虑译语 的特 点 , 分 生 汉译英 、 、 俄 、 的一 对多 系统 (A R 法 日、 德 F J A系 成译语 时也不考虑原语 的特点 , 原语译 语的差 统 ) t , 。a , )l还建立 了一个 汉语语料库 和一个科 异通过原 文译文转换来解决 。在搞多种语 言对 技英 语语料库。 中国机器 翻译 系统的规模正在 多种语言 的翻译 时 ,宜于采用这样 的独立分 析 不断地 扩大 , 内容正在不断地完善 。 比较有代表 独立生成系统 。 性 的系统有 :高立英汉 翻译 系统 , TE I /C英汉 M 二、 国外机器翻译发展 翻译 系统 , a i英汉机 器翻译 系统 ,i Tas M tx r S or n n 15 9 4年 ,由 Gere w ogt n大学 和 I M公 司 汉外机 器翻译系统等等 。 o B 合作 , 了第一个 真正的机器翻译 系统 , 且 实现 并 鉴于机器 翻译仍具相 当市 场 ,中国涉足这 在 IM纽约总部进行 了俄译英公开演示 。f 领域 的厂商也不一 而足 。目 , B 【 ] 前 国内市场上的 用 IM 7 1 B 一 0 计算 机 , 把几个简单 的俄语句子 翻 翻译 软件产品可 以划分为 四大类 : 文翻译 ( 全 专 译成英语 。 尽管这个系统很小 , 只有 20 5 条俄 语 业 翻译 )在线翻译 、 、 汉化软件 和电子词典 。 全文 词汇 ,条语法规 则以及精 心挑选 的翻译例 句 , 翻译软 件以中软 “ 6 译星” 以及“ 信 C T . 为代 雅 A 2” 5 但是第一次 向公众 和科 学界展示 了机器 翻译 的 表 ; 翻译软 件 主要 以“ 山快译 . t 0” 在线 金 n 2 1、 e0 可行 l。 生 华建 的 “ 网上通 ” 翻译 为代表 ; 化类 翻译软 件 汉 2 世纪 5 年代中期,在美国掀起了机器 主要 以“ 陕车 30 ” 0 0 东方 00为代表 ; 词典工具 以“ 金 翻译研究 的高潮 。这一 时期的机器翻译 系统 主 山词 霸. t 0 ” n 2 1为主要代表 。 e0 要采用直 接翻译 (i c Tas tn方法 , Dr t rnli ) e ao 一般 由于机器翻译在今后需要满 足人 们在浩瀚 都没有进行很好 的源语 言据法结构分析 , 是 的互联 网上方便地进行信息搜集 的需 求 ,于是 而 主要 以词典 为驱 动 , 利用 词典中 的语法 和语 义 很 多 翻译 开 发者 在翻 译准 确度 上 下工 夫 的 同 特征来实现翻译 。直接 翻译 方法 的栈 是在 源 时 , 开始 注重结合用户的使用领域并进 行方 向 语 言分析阶段和 目 标语 言综合 ( 即生成 ) 间没 性 的开发 。 之 根据 目 的市场发展看来 , 前 在新一轮 有 明确的区分 ,这样 的系统被 称为第一代机器 的竞赛中, 在线翻译前景十分看好。目 , 前 中国 翻译 系统 。 的网民已超 4 , 亿 并继续以极 li度 增长。 央塞
兰
:
C ia N w e h oo isa d P o u t h n e T c n lge n r d cs
机 器翻译 系统发展 与研 究
计 丽 丽
信 技 息术
( 安徽理工大学计算机科 学与工程学院, 安徽 淮南 2 2 0 ) 30 1
摘 要: 本文详 细地 论述 了机 器翻 译研 究 的发展 历程 和现状 。综述 了机 器翻 译 系统的 类型 和特 点。详 细地介 绍 了九十 年代 以来提 出 的一些 新的 方法 以及 国 内国 际研 究动 态 。 关 键词 : 器翻译 ; 于规 则 ; 于语料 库 机 基 基
2 世纪 7 年 代 ,西欧和加拿 大开始 出现 0 0 以追求可读性和 忠实性 为 目 的第二代机器 翻 标 译系统 。 这些系统 以基于转换的方法为代 表 , 普 遍采用 以句法分析 为主 、 以语 义的基于规则 辅 的方法 ,采用有抽象 的转换表 示的分层次实现 策 略 , 合 了多 种技术 : 与算 法分离 , 综 知识 模块 化设计 , 多种句法分析策 略以及语 义分析等等 , 机器 翻译概况 并且大多 引入 了人 工智能技术 ,其中许多方法 机器 翻译 ( ah et nli )又称 为 自 和技术直到今天仍被沿 用。期 间 比较著名 的系 m ci a s tn , n r ao 动 翻译 ,是利用计算机把 一种 自然源语言转变 统有 :Y T A S S R N多语 言 翻译 系统 、 i e We dr系 n 为另 Leabharlann Baidu种 自然 目 标语 言的过程 ,一般指 自然语 统 、 U P T A 多国语翻译 系统 、A M— — E ROR T U ME 言 之间句子和全文 的翻译 。它是 自然语言处理 T O系统等 。 E ( trlL n u g rcsig Naua ag a ePo es )的一个分支 , n 与 2 世纪 9 年代 至今 ,随着 Itnt 0 0 n re 的普 e 计 算语 言 学 (o pti a Lnu t s)自然 遍应用 ,世界经济一体化进程 的加速以及 国际 C m u tnl i ii 、 ao g sc 语 言 理解 (N t a Lnug nes nig 社会交流 的 日 a rl agaeU drad ) u t n 渐频 繁 , 传统 的人 工作 业的方式 之 间存在着 密不 可分的关 系。 已经远远不能满足迅猛增 长的翻译需求 ,人们 整个机器 翻译 的过 程可 以分 为原文 分析 、 对于机器翻译 的需求空前增 长 ,机器 翻译迎来 原文 译文转换和译文生成 3 阶段。在具体 的 了一个新 的发展机 遇。国际陛的关于机器翻译 个 机器 翻译系统 中, 根据不 同方 案的 目的和要求 , 研究的会议频繁 召开 ,中国也取 得了前所未有 可 以将原 文译文转换阶段 与原 文分析阶段结合 的成就 , 相继推 出了一 系列机器 翻译 软件 , 例如 在一起 , 译文生成 阶段独立起来 , 立相关 “ 星” 、 雅 信”、“ 而把 建 译 “ 通译 ”、“ 建” 。在市 华 等 分析独立生成 系统 。 在这样 的系统 中, 原语分析 场需求的推动下 , 商用机器 翻译 系统迈人 了实 时要 考虑译语的特点 ,而在译语 生成 时则不考 用化阶段 , 了市场 , 走进 来到了用户面前。 虑原语 的特点 。在搞多种语言对 一种 语言的翻 三 、 国机器翻译发展 我 译 时 , 于采 用这样 的相关分析独立 生成系统 。 宜 中国机器翻译研究 起步于 15 年, 9 7 是世界 也可 以把 原文分析 阶段独立起 来 , 原文译 文 上第 4 把 个开始搞 机器翻译 的国家 ,0 6 年代 中期 转换 阶段 同译文生成 阶段结合起 来 ,建立独立 以后一度 中断 , 年 代中期 以来 有了进 一步 的 7 0 分析相关生成 系统 。 在这样 的系统 中, 原语分析 发展 。现在 , 国社会科学 院语言研 究所 、 国 中 中 时不考虑 译语的牛| 寺 ,而在译语生成 时要考虑 科学技术 隋报研究所 、中国科学 院计 算技术研 原语 的特点 ,在搞一种语言对多 种语 言的翻译 究所 、 黑龙江大学 、 哈尔滨工业大学等单 位都在 时, 宜于采用这样的独立分析相关生成系统 。 还 进行机器翻译的研究 ;上机进行 过实 验的机器 可 以把原 文分析 、原文译文转换 与译文 生成分 翻译 系统 已有十多个 ,翻译 的语 种和类型有英 别独立开来 , 建立独立分析独立生成系统。 在这 汉 、 、 、 、 等一对一 的系统 ' 俄汉 法汉 日汉 德汉 也有 样 的系统 中 , 析原语时不考虑译语 的特 点 , 分 生 汉译英 、 、 俄 、 的一 对多 系统 (A R 法 日、 德 F J A系 成译语 时也不考虑原语 的特点 , 原语译 语的差 统 ) t , 。a , )l还建立 了一个 汉语语料库 和一个科 异通过原 文译文转换来解决 。在搞多种语 言对 技英 语语料库。 中国机器 翻译 系统的规模正在 多种语言 的翻译 时 ,宜于采用这样 的独立分 析 不断地 扩大 , 内容正在不断地完善 。 比较有代表 独立生成系统 。 性 的系统有 :高立英汉 翻译 系统 , TE I /C英汉 M 二、 国外机器翻译发展 翻译 系统 , a i英汉机 器翻译 系统 ,i Tas M tx r S or n n 15 9 4年 ,由 Gere w ogt n大学 和 I M公 司 汉外机 器翻译系统等等 。 o B 合作 , 了第一个 真正的机器翻译 系统 , 且 实现 并 鉴于机器 翻译仍具相 当市 场 ,中国涉足这 在 IM纽约总部进行 了俄译英公开演示 。f 领域 的厂商也不一 而足 。目 , B 【 ] 前 国内市场上的 用 IM 7 1 B 一 0 计算 机 , 把几个简单 的俄语句子 翻 翻译 软件产品可 以划分为 四大类 : 文翻译 ( 全 专 译成英语 。 尽管这个系统很小 , 只有 20 5 条俄 语 业 翻译 )在线翻译 、 、 汉化软件 和电子词典 。 全文 词汇 ,条语法规 则以及精 心挑选 的翻译例 句 , 翻译软 件以中软 “ 6 译星” 以及“ 信 C T . 为代 雅 A 2” 5 但是第一次 向公众 和科 学界展示 了机器 翻译 的 表 ; 翻译软 件 主要 以“ 山快译 . t 0” 在线 金 n 2 1、 e0 可行 l。 生 华建 的 “ 网上通 ” 翻译 为代表 ; 化类 翻译软 件 汉 2 世纪 5 年代中期,在美国掀起了机器 主要 以“ 陕车 30 ” 0 0 东方 00为代表 ; 词典工具 以“ 金 翻译研究 的高潮 。这一 时期的机器翻译 系统 主 山词 霸. t 0 ” n 2 1为主要代表 。 e0 要采用直 接翻译 (i c Tas tn方法 , Dr t rnli ) e ao 一般 由于机器翻译在今后需要满 足人 们在浩瀚 都没有进行很好 的源语 言据法结构分析 , 是 的互联 网上方便地进行信息搜集 的需 求 ,于是 而 主要 以词典 为驱 动 , 利用 词典中 的语法 和语 义 很 多 翻译 开 发者 在翻 译准 确度 上 下工 夫 的 同 特征来实现翻译 。直接 翻译 方法 的栈 是在 源 时 , 开始 注重结合用户的使用领域并进 行方 向 语 言分析阶段和 目 标语 言综合 ( 即生成 ) 间没 性 的开发 。 之 根据 目 的市场发展看来 , 前 在新一轮 有 明确的区分 ,这样 的系统被 称为第一代机器 的竞赛中, 在线翻译前景十分看好。目 , 前 中国 翻译 系统 。 的网民已超 4 , 亿 并继续以极 li度 增长。 央塞
兰
:
C ia N w e h oo isa d P o u t h n e T c n lge n r d cs
机 器翻译 系统发展 与研 究
计 丽 丽
信 技 息术
( 安徽理工大学计算机科 学与工程学院, 安徽 淮南 2 2 0 ) 30 1
摘 要: 本文详 细地 论述 了机 器翻 译研 究 的发展 历程 和现状 。综述 了机 器翻 译 系统的 类型 和特 点。详 细地介 绍 了九十 年代 以来提 出 的一些 新的 方法 以及 国 内国 际研 究动 态 。 关 键词 : 器翻译 ; 于规 则 ; 于语料 库 机 基 基