论人工智能机器翻译时代下机译与人译之关系

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

B@
C科技风 DEDF 年 FD 月
电子信息
说明这样的问题( 机器在处理#信息型$文本时的效率)要 远高于其他# 表情型$ 和# 操作型$ )参考孙瑾/ 基于文本类 型理论的机器翻译研究0 一文中对德国翻译家卡塔琳娜3 赖斯" f7EI7@/-?^?/BB% 所提出的文本类型三分理论!信息 型" /-NF@J7E/A?% +表情型 " ?SM@?BB/A?% + 操 作 型 " FM?@7E/A?% ( 其中)信息型 文 本 指 自 然 科 学+ 工 商 经 济+ 科 技 类 文 书 文 本*表情型文本以诗歌+小说等文学作品为代表*操作型文 本以广告+宣传手册为主)多用于商业活动的文本)这是因 为机 器 翻 译 的 # 语 言 技 术 的 研 究 已 滞 后 于 计 算 机 技 术$ )&$T' 在隐喻+歧义+感染力+文化内涵及其他等创造性 方面的问题存在极大的技术门槛和开发不足的问题(
. All能否Ri有g朝h一t日s 替R代e人se的r工v作ed呢.2
从人机共生的翻译图景来看)在强大技术的影响下) 翻译这一古老的行当已经有了全新面貌)机译环境极大影 响着翻译实践( 翻译行业除了传统的人工翻译外)逐渐发 展出机器辅助翻译+译后编辑等人机交互的模式( 如今大 多数的翻译需求已经可由机器来完成初稿)甚至部分文本 可由机器独立地完成翻译工作( 由于翻译需求量和信息 实效性要求的提升)机译已经能够独立承担起那些交付时 间短+翻译质量要求相对较低的内容翻译)如天气预报+网 页翻译等( 而机器辅助翻译和译后编辑这类# 机助人译$ 和#人助机译$的类型)也在市场上广泛应用( 因而)如今 # 以翻译技术为核心 的 计 算 机 辅 助 翻 译+机 器 翻 译 和 翻 译 管理系统集成在一起)构成译者的集成翻译环境$ (&1' 技术 的便捷+高效)既满足了需求也创造了更多的需求)塑造了 今天人机交互的集合环境(
C科技风 DEDF 年 FD 月
电子信息 !"#!$%&$'(') *+&,-./&$01$21(3$&)%)$(0%)T
论人工智能机器翻译时代下机译与人译之关系
王希铭
上海师范大学人文学院!上海!"$$"%@
摘4要近年来神经网络机器翻译的应用极大提升了翻译效率开启了机器翻译的人工智能时代 技术的进步促使 我们在人工智能时代下重新反思机译与人译的关系 一方面机译与人译呈现出充满张力的博弈关系技术全面参与的 翻译环境型塑行业图景但归根结底机译的发展仍有局限人译把握着主体性另一方面机译与人译的未来期待更平衡 的自由关系翻译技术应当在注重实用商用的同时兼顾对自然语言本质的探索译者则应该在保有自己主体性和价值 感的同时将技术作为一种通向真理的方法进而实现人与技术之间良性的互动
B%Leabharlann 电子信息科技风 DEDF 年 FD 月
化了)乃至于# 人类的 语 言 知 识 已 经 被 大 规 模 的 语 言 数 据 替代了)语言规则的作用已经不那么明显了$ (&('
人工智能的运用使得翻译机器能像人一样直接面对 完整的句子)因 此 较 之 于 统 计 方 法) 这 种 技 术 极 有 效 率 地 实现了机器翻译的智能化( )%$0 年谷歌关于神经网络机 器翻译的实验结果表明)比起以前基于短语的翻译系统) 神经网络模型的错误率平均下降了 0%a)其质量超过了现 今所有已发表的成果(&3' 有着如此卓越表现的神经网络翻 译技术)因其 开 发 周 期 短+ 人 工 成 本 低+ 效 率 高 等 种 种 优 点)一经开发便迅速# 取代了统计机术$ (&T' 目前 以谷歌为例)其线上翻译系统已经支持超过 $%% 种语言的 通用翻译)而微软+ 百 度+ 搜 狗+ 腾 讯 等 多 家 互 联 网 公 司 也 竞相在神经网络方向上积极研发)翻译效率大幅提升)机 译进入人工智能时代(
三反思构建机译与人译的平衡 在人工智能助力机器翻译的时代下)人机共存+共生 将是可以预见的未来( 在这样的背景之下)如何平衡人译 与机译二者的关系成为重要的命题( 反思技术的本质( 随着技术的发展)现代社会中关于 技术理性的话语渐占上风)技术至上也渐趋主流( 这在翻 译的研究中也是如此( 翻译研究中的# 技术转向$ 已成共 识)&$)' 但更值得注意的是)为了应对技术讨论维度的过度 膨胀)翻译技术 研 究 对 人 与 社 会 的 问 题 有 了 更 多 的 关 注) 形成了一个关于人的转向(&$(' 这种转向的背后是对技术 与社会的深刻反思( 不轻视机译的发展+不否认机译产生 的积极意义)但 也 不 任 由 技 术 无 限 膨 胀) 进 而 丧 失 人 的 主 体意义( 把握机译与人译的平衡)首先需要对技术本质进 行有时代性地反思( 海德格尔曾以/技术的追问0 为题)用哲学的方式追问 现代技术的本质( 尽管海德格尔对现代技术总体上持批判 态度)但他也认为)技术的本质中蕴含着积极的因素( 他认 为技术是人的一种工具性手段)其本质是一种#解蔽$ &$3' ( 机器翻译也是如此)其# 解蔽$ 的本质在于更好地认识 理解语言+交流文化( 但机器翻译从基于语义规则)到依 赖统计数据)再 到 人 工 智 能) 技 术 研 究 者 们 的 研 发 思 路 发 生了转向)从最 开 始 把 握 自 然 语 言 本 质 规 则) 转 向 了 基 于 经验实例的 数 据 运 算 和 统 计) 再 到 如 今 的 类 神 经 网 络 技 术)技术渐长而离语言的本质越远( 机译本身的表现也能
性$ 得到充分挖掘)但语言之间的通用规则毕竟难以把握) 这直接导致了#程序开发难度大+人工成本高$ &)' 等问题( 普通语言学的艰深探索不及技术开发的要求和速度)因而 随着计算机运算能力的提升)把握语义规则的方法逐渐被 统计计算替代(
)%%( 年)时任南加州大学工程学院信息科学研究所研 究员的弗兰茨3约瑟夫3奥赫" d@7-Y]FB?N",I% 利用统计 的模型改进了传统机译方法)其研发的统计机译系统在美 国商业部国家标准与技术研究所的测试中取得了最高的 成绩( 赛后)奥赫效仿阿基米德的口吻表示!# 只要给我充 分的并行语言数据)那么对于任何的两种语言)我就可以 在几小时之内给你构造出一个机器翻译系统($ &(' 正如奥 赫所说)统计技术堪比克服语言翻译障碍中的# 力学杠 杆$( 统计的翻译方法不再完全致力于寻找语言规律)而 是设法建立数学模型)通过导入大量的多语言文本数据库 来训练机器提高翻译的准确度( 计算机经由上百亿次复 杂的数学公式运算)通过统计概率最大化的方法得到语言 之间的对应规律)得出翻译结果( 统计的方法既使翻译效 率大幅提升)又 回 避 了 对 自 然 语 言 的 深 层 开 掘) 可 说 是 轻 松绕过了通用语言规律的# 巴别塔$ )凭借计算机和数学的 # 捷径$ )实现了不同语言之间的互译(
关键词人工智能机器翻译机译与人译 中图分类号C%T'44文献标识码X
44古往今来)翻译之于文化交流与文明发展有着重要的 意义( 近年来)随着计算机深度学习的广泛应用)机器翻 译技术也尝试与人工智能相结合)出现了以神经网络机器 翻译" 5?H@7KD7,I/-?Q@7-BK7E/F-% 为代表的新模型( 人工 智能为机器翻译技术带来了全新的跃进)揭开了人工智能 翻译的新时代( 技术的飞跃似在预言机器翻译的大好前
另一方面)技术 的 蔓 延 并 非 漫 无 边 际) 机 译 尚 有 其 局 限)人译仍把握着主体性( 就技术而言)目前神经网络机 器翻译属于#弱人工智能$ 范畴( 何为弱人工智能2 人工 智能的强弱之争是该领域的重要问题)持#强人工智能$ 观 念者认为# 由数字计算机操作的二进制数字串能代表任何 东西$ )&W' 人工智能能够思维+能够自主行动*相信# 弱人工 智能$者则认为# 心是语义的)人心不仅仅是一个形式结 构)它是有内容的$ )&'' 人思维的本质是无法被形式+运算 所涵盖的)不能为程序所设定( 而类神经网络确实使机器 具备了自主学习能力)但仍必须借助人所预先设定的程序 与目标进行工作( 而且)目前的人工智能翻译# 要依靠成
而神经网络 机 器 翻 译 的 原 理 又 是 什 么) 其 突 破 在 哪 里2 如果说统计的应用使机器摆脱了对人工编写语言规 则的依赖)人们无须# 告诉$ 计算机如何翻译)而是让它自 己弄清楚)那么人工神经网络技术就是让机器翻译的这种 自主性更进一步( 人工神经网络是一种仿生物神经网络 结构的数学模型)在机器学习及认知科学领域有着广泛的 研究与应用)其最主要的特点在于它通过众多人工神经元 的联结模拟大脑神经结构)从而实现机器的自主学习( 神 经网络机器翻译就是通过建立编码器与解码器的模型框 架)借助模拟递归神经网络来实现翻译的自动化( 这是一 种端到端的翻译技术)也就是说机器翻译的中间过程被弱
. All景)R但i技gh术t挤s占的Re空s间e需rv要e传d统. 来让渡)技术的发展也需
要人去适应)翻译行业中复杂的人机关系值得关注( 在这 样的背景下)关 于 机 译 与 人 译+ 技 术 与 人 的 思 考 再 一 次 被 推至眼前(
一机译的发展人工智能翻译新时代 回望机器翻译的线性历程)机译的发展可以简单地划 分为两个阶段!第一阶段是 )% 世纪 3% 年代至 '% 年代)以 基于语义规则" ^HK?287B?G% 的早期机器翻译为代表*第二 阶段是 '% 年代后广泛运用统计数据" >E7E/BE/,B287B?G% 的近 期机器翻译( 而如果将近年来)以谷歌团队为首所实现的 神经网络翻译技术视为全新的突破)那么现在可说是机器 翻译的最新阶段( 在机器翻译构想之初)寻求语言学上的# 语言规则$ 是 普遍的思路与方法( 早在 $1 世纪就有人提出可以通过制 作#机器词典$来实现不同语言之间的互译(&$' 这种希望借 助机器以类似#查词典$ 的方式来实现翻译的尝试)都属于 基于语言规则的机译( 在早期的研究中)机器翻译由语言 学家共同参与)他们与工程师和设计人员共同合作)基于自 然语言表述的规律)尤其是通过总结主流语言之间的规则) 形成一套类似#中间语$ 或# 通用语$ 的规则)最后交由计算 机执行完成翻译( 在这之后)从一开始的词对词翻译)机译 逐渐发展至注重源语言和目标语言之间句法结构关系的翻 译)最后再到实现语义上的互译( 可见在这一研发过程中) 机译的研发逐步深入语言的内部)渐次涵盖更为复杂的语 言关系)机器技术与语言知识的探索是共同进步的( 然而)尽管# 句法+词法和语义等深层次自然语言特
创造性也意味着翻译本身是一项# 不可为$ 的任务( 因为两种语言的互译并不存在绝对正确+完美的答案)这 一点恰恰与追求准确率的机器翻译背道而驰( 再创造的 能力是预先设定好翻译目标+依赖现有语料数据库的机器 所不能企及的( 我们并不是希望通过翻译得到完美+精准 的对应文本)而是为了在翻译的过程中完成深层的文化互 动( 这是机译和人译之间的根本不同)也是人机关系之中 人占主体地位的原因(
百万的现成翻译文本作为参照分析的基础$ )&$%' 且这些文 本大多来自于标准化的机构+取用主流的语言)因而使得 翻译趋于标准化的表达)适用范围有限)也无法满足多元 创造的表达需求(
最为重要的是)翻译本身的创造性要求构成了机译的 根本局限( 翻译活动从来都不能被简单地视作是一项从 #源预言$到# 目标语言$ 的转化工作)尽管译者的实际工 作确实是语言间的互译)但译者翻译的初衷+创造性的译 法)以及译本在 流 通 阅 读 中 的 流 变 等) 都 是 极 为 复 杂 的 过 程( 在翻译理论中)不乏类似# 创译$ # 异化$ 或# 归化$ 等 理论)无不是在强调作为# 中介$ 的翻译实际上是译者的再 创造( 正如本雅明所说)# 译者的任务就是用自己的语言 去释放藏于另一种语言表达之下的纯语言)用自己的再创 作解放原先作品中被束缚的语言($ &$$' 这种# 释放$ 与# 束 缚$ 不仅仅指翻译过 程 中 因 文 化 差 异 而 产 生 的 表 达 困 难) 更暗示了把握# 纯语言$+对# 纯语言$ 进行再表述是翻译 之要务(
二人机博弈人工智能与技术焦虑 今天不借助机器的翻译已是不可想象)而翻译这项原 本的译者事业)也在全球化翻译需求激增+机译与人译的 交互下)发展出人机共存的新图景( 但发展与隐忧并存) 机译极具冲击力的新发展引起了更多关于人工翻译何去 何从的思考)甚 至 有 学 者 预 言) 翻 译 的 未 来 或 许 会 由 译 后 编辑来取代现在大多数的翻译工作(&0' 那么)人工智能助 力下机译与人译的关系为何2 效率大增+应用极广的机译
相关文档
最新文档