翻译质量量化评价研究综述_张霄军
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
· 81 ·
其中 , X 表示中心信息 — — — X1 : 信息量( 基本事实) X2 : 形象转换( 歪曲或没有歪曲事实) ( X 3): 虚设标准( 预留做他用) Y 表示附加信息 — — — Y 1 : 风格层次( 比较风格) Y2 : 情感元素( 内涵等) ( Y3 ) : 虚设标准( 预留做他用) Z 表示结构信息 — —— Z1 : 元语言方面( 相异之处的转化) Z2 : 修辞与逻辑( 相同之处的模拟) Z3 : 音韵( 主要适用于诗歌翻译) 他还在公式( 2) 的基础 上制定 了适 于编写 计算机 程序的工作方 程式 。 其 流程 为 : 输入 数据 ※加权 ※计算 ※输出数据 。 可以说 , 将模 糊数学 的基本 原理和方法引入 译文 评价是 一种 尝试 , 中 国译界 已经迈出了可喜的一步 。 但近年来 , 模糊数 学应用 于量化 译文 质量评 价的研究“一直没有取得突破性的进展 , 仅仅停留 在十多年 前 的 可 行性 研 究 上” ( 邵 璐 2007 : 74)。 模糊理论的核心 是模 糊集合 论 , 但 目前发 表的有 关翻译模糊性的成果大都探讨模糊语言的特点及 翻译技巧 , 真正应用模 糊集合 论来 探讨译 文质量 评价的也就仅限于 上述 研究 。 此 外 , 由于 模糊数 学与翻译的学科 隔阂 , 模糊数 学方 法在量 化译文 质量 评 价 研 究 上 尚 不 能 得 到 广 泛 应 用 。 穆 雷 ( 2004) 将“模糊综合评判”方法应用到了翻译教学 中的文本测试实 验上 , 并实现 了人 机界面 的友好 互动 , 这是一个有益的尝试 。 3. 2 机器翻译的翻译质量量化评价 机器翻译的译文评测一般是由第三方中立机 构对某种产品根据统一指标使用相同工具来进行 的评比 , 其目的是为用户提供一种客观的比较 , 以 帮助用户选择合适的产品 ; 同时 , 通过评估机器翻 译的性能和发展 水平 , 为现有 机器 翻译系 统的改 进提供方向或为开发新型机译系统的技术路线的 选择提供决策依 据 , 促 进机器 翻译 系统发 挥社会 效益与经济效益( 赵铁军 2000 : 344 345) 。 机器翻译译文质量的量化评测最先开始于美 国的 A LPAC 报告 。 该报告提出从可 懂度和信息 度两方面来评估 机器 翻译的 译文 , 前者分 为 9 个 等级 , 后者分为 10 个等级 , 以此为标准 , 对俄英机 器翻译译文做 了评 估 。 A LPAC 报 告的出 台完全
*
本文得到陕西师范大学校级重点科研项目资助 。
· 80 ·
考译文 。 3. 国内外翻译质量量化评测现状 3. 1 人工翻译的翻译质量量化评价 在人工翻译的翻 译质量 评价 方面 , 传 统的评 价模式为定 性 研究 模式 , 即 以“ 翻 译标 准” ( “信 、 达 、雅”或其它) 为准绳而展开的评议式 、举例式和 总结式的定 性 评价 。 尤其 是 在国 内 的翻 译 批评 界 , 多习惯于用不同译本比较的方式 、回译的方式 等对译文质量进行定性评价 。 传统的翻译质量评估模式是建立在语篇微观 错误对比分析的基础上的 。 错误对比分析意味着 可能牵涉错误 数量的计算 。 目 前的 T QA 研究现 状有以下特点 : ( 1) 量化模式大都建立在语篇的微 观层次上 ; ( 2) “错误”分类既有二分法也有复杂体 系; ( 3) 许多原则参照模式既考虑语篇微观特征也 考虑宏观特征 , 如衔接与 连贯 ; ( 4) 所有的 语篇模 式都没能清晰地厘定整体质量评估概念和错误容 忍度 ; ( 5) 错误的 概念 划分不 细 , 不便 于操 作 ; ( 6) T QA 理论大都规避“ 标准” , 而使用“ 原则或准则” ( 武光军 2005 : 72)。 国内人工翻译的翻译质量量化评价研究肇始 于等 值 学 说 的 兴 起 。 吴 新 祥 、李 宏 安 ( 吴 、李 1984 : 1 -10 ; 吴 1985 : 15 -28) 指出对 译文作定量 分析是方向和趋 势 , 随 后提出 了具 体的量 化表达 公式 。范守 义( 1986 : 8) 首次 提出 了“ 信 、达 、雅关 系的数学表示” 。 他 认为“ 信 、达 、雅” 三者 缺一不 可 , 可以成为翻译的标 准 。 如果用“ F” 表 示“信” , 用“ R”表示“达” , “S”表示原作的风格“雅” , “S ”表 示译作的风格“ 雅” , 则 可以用 下面 的公式 来表示 信达雅之关系 : I =( R/ F)·( S / S) 其中 ,“ F ” 与“ S” 可 看成 是常 量 , “ R ” 愈接 近“ F ” , “ S ” 愈接近“ S” , 则“ I”( 表示译作 与原作 接近程度 的指数) 愈接近[ 1] ; 恰好等于[ 1] 是不可能的 。 假 如能计算出某一体裁的译作与原作接近程度的指 数 , 那么就可以在从[ 1] 至[ 0] 的区 间标出 这一体 裁指数的具体 位置 。 凭经 验 , 非文 学类( 论文 体 、 公文体等) 比文学类( 小说体 、散文 体 、诗歌 体等) 的译文更接近[ 1] , 其中诗歌体距[ 1] 稍远些 , 而某 些不可译的笑话 、幽默 或文字 游戏则 趋向 于[ 0] 。 这里已显露出了在量化翻译质量评价中的模糊数 学思想 。模糊 数学 是 1965 年由 美国 加利 福尼亚 大学控制论专家扎德教授开创的 , 于 1976 年传入
j =1 4
∑W j . . . aij
进行运算 , 即可 得译 文的评 价值 , 然 后进 行比较 。 范守 义( 1990 : 43 -67) 后来又修 正了译 文评价的 数学模型 , 文中他认为质量是个语言变量 , 是由主 标准和次标准组成的并集 , 可以用公式表达如下 : ( 1)Q =X ∪ Y ∪ Z 或 ( 2)Q = [ X1 , X2 , ( X3 ) ] ∪ [ Y1 , Y2 , ( Y3 ) ] ∪ [ Z1 , Z2 , Z3 ]
Hale Waihona Puke Baidu
我国 , 已广泛应用于管理科学 、系统工程 、经济学 、 地质学 、气象 学 、语 言学等 许多 领域 。 后来 , 范守 义( 1987 : 2 -9) 明 确提 出了用 模糊数 学的 理论和 方法把对译文所作的用“文字”表达的定性评价转 化为用“数字”表达的定量评价 。 范文具体设定了 评价译文的 9 个“ 方面” , 对译 文以句 为单 位进行 评价 。 一般是每句 只从 一个“ 方面” 进行 观察 , 据 此给出这个句子达 到这 个“方 面” 的 隶属 度 , 然后 将所有句子所达 到的 隶属度 相加并 求其 平均数 , 即为对该段( 篇) 译文所做出的评价 。 范文提出的 模糊数学 评 价方 法在 翻译 界 产生 了 相当 大 的影 响 。 徐盛桓( 1987 : 89 -96) 提出 了一种 改进 的用 于量化翻译质量评价的数学模型 : ( W 1 , W2 , . . . , W n )X 1 , X 2 , . . . , Xn 其中 X 表示“标准” , W 表示“ 权值” 。 根据这 个模型 , 徐文提出 4 项标准 , 并分别赋予权值 , 即 : X1 表示实在 意义( W1 =3 . 5); X2 表 示 文学 表达 ( W 2 =2 . 5); X3 表示风格和修辞的传递( W3 =2) ; X4 表示衔 接与 语气 ( W 4 =2) 。 穆雷 ( 1991 : 66 69) 提出的数学公式则适用于多专家评价 , 计算了 评价对象信度的隶属频率 , 即 : U 0 对 A 的隶属频率 =“ U 0 ∈ A ” 的次数/ n ( A 为信度的隶属函数集合) 表示“评价对象信 度的 隶属频 率等于 它属 于某个 隶属度的次数除以评价的次数 。 ”按照这个公式 , n 值越大 , 即参加评价的专家越多 , 隶属频率就越处 于稳定 状 态 。 频 率稳 定 所在 的 那 个数 , 就 是 U 0 对 A 的隶属度 。 以“ 信 、达 、雅” 为评价标 准 , 则构 成论 域 U =[ 信( U 1 ), 达( U 2 ), 雅( U3 ) ] 。 另外 , 李新华( 1991) 使用相关矩阵法比较了原译文与优 化后的译 文 。 该法 设 4 个 因素 , 即 命题 意义( a) 、 文学表达( b) 、文 体修辞( c) 和篇 章信 息( d), 其权 重分别 为 : W1 =3 . 5 , W2 =2 . 5 , W3 =2 , W 4 =2 。 该法使用公式
1 . 翻译质量评价的学科意义 人文学科一般由三个部分组成 : 理论研究 、批 评研究和史的研究( 吕俊 2006 : 52) 。 翻 译学也不 例外 。在翻译学 科建设 和发 展的“ 三驾马 车” 中 , 翻译评价( 或翻译批评) 研究远远落后于翻译史和 翻译理论研究 。 近年 来 , 翻译 评价 的研究 越来越 引起翻译学界的 重视 , 作为翻 译评 价研究 的中心 内容, 翻 译 质 量 ( 主 要 指 译 文 质 量 )评 价 ( T ranslation Q uality A sses sment , T QA ) 研 究也 应受到重视 。 计算语言学( 自然语言处理) 的初衷就是实现 翻译的自动化 , 即机器翻译 。 几十年来 , 机器翻译 研究虽步履蹒跚 , 但其贡献和成果却也有目共 睹 , 基于规则的 、基于统计 的和基 于实 例的机 器翻译 系统已经实 现 , 也 有 商用 的 机器 翻 译 软件 面 市 。 计算语言学是一个“多边 缘的 交叉学 科”( 冯志伟 2005 : 1) , 因此机器翻译也势必带上人文科学和自 然科学的双重学科身 份 。 与其 它人 文学 科相 比 , 机器翻译尚处于 起步 阶段 , 对 其研 究更应 该从一 开始就套上“三 驾马 车” — — —机器翻 译理 论研 究 、 机器翻译评价研究和机器翻译史的研究 。 由于机 器翻译具有 实验 学科 的 性质 , 机 器翻 译 评价 ( 或 “ 机器翻译评测”) 研究就尤为重要 。 总之 , 从学科建设和学科发展的角度来看 , 无 论是人工翻译还 是机 器翻译 , 翻译 质量的 评价研 究都相当重要 。 2. 翻译质量量化评价 2. 1 定性评价研究与定量量化评价 从方法论的角度 来看 , 评 价研究 可以 分为定 性的评价研究和定量的评价研究两种 。 在人工翻
译中常用的翻译批评方法主要是定性的( 或“定相 的”) , 在机器翻译 中常 用的译 文评测 方法 则是定 量的( 或“自动的”) 。 定性研究和定量研究各有其 特点 和 适 用 范 围 ( 桂 诗 春 、宁 春 岩 1997 : 212 213) , 都不可偏废 。 目前翻译质量评价研究方法的薄弱点是定量 研究 , 尤其是人工 翻译 的翻译 质量评 价的 定量研 究以及机器翻译的译文评测标准的量化研究 。 但 “量化研究”并不 等同于“ 定量 研究” , 因为 翻译质 量的量化评价研 究绝不 局限于 完全形 式化 的“定 量” , 在量化过程中势必会有定性的判断 。 定量与 定性相结合 , 突出定量研究的优势 , 在定量研究的 基础上得出定性的结论 , 是为“量化研究” 。 2. 2 翻译质量量化评价研究概述 翻译质量量化评价研究的途径有很多种 。 最 传统的如“打分法” , 即 评价者 在看到 译文 后根据 参考译文( 或评价者心目中的理想译文) 给出一定 的分值 , 整篇译文 的得 分为组 成该篇 译文 的各个 部分译文的得分总和 。 这种量化的评价方法如同 教师批改考卷 。 采用这种评价方法有两个基本前 提: ( 1) 评价者有较高的原语与译语的语言水平且 具有一定的评判能力 ; ( 2) 有参考译文或评判者心 目中有可资参考的理想译文 。 另外一种较 为流行 的 、常 用于机 器翻译 译文 评测的量化途径 为“ 统 计法” , 即评价 者根 据参考 译文和译文之间的某种相似性( 一般来说是结构 、 形式上的相似性) 来人工 或( 半) 自动 地实 现这两 者之间的匹配关系 , 统计它们相互匹配的结果 , 匹 配越多译文质量就越好 。 这种方法的实现也需要 一个前提 : 有参考 译文 且有足 够多的 高质 量的参
DO I : 10 . 13978 / j. cnki . wyy j . 2007 . 04 . 013 2007 年第 4 期 总第 104 期
外语研究 F or eign L ang uages Research
2007 , № 4 Serial № 104
翻译质量量化评价研究综述
张霄军
*
( 南京师范大学文学院 , 江苏 南京 210097 ; 陕西师范大学外国语学院 , 陕西 西安 710062)
摘 要 : 本文从学 科建设的角度论述了翻译质量评价的意义 , 从人工翻 译和机器翻译两个方面对国内 外翻译 质量的量化评价研究与实践进行了综述 , 并指出了目前的量化翻译质量评价的缺陷 。 关键词 : 翻译质量 评价 ; 量化 ;人工翻译 ; 机器翻译 中图分类号 :H059 文献标识码 : A 文章编号 : 1005 -7242( 2007) 04 -0080 -05