翻译测试的信度研究
大学英语口语测试的信度问题及对策研究
大 学 英 语 口语 测 试 ቤተ መጻሕፍቲ ባይዱ 信 度 问题 及 对 策 研 究
杨 杨
( 江 大 学 外 国语 学 院 , 北 荆 州 长 湖
摘 要 : 为 最 直 接 检 测 英 语 学 习者 实 际 口语 水 平 的 方 作 式 , 语 测 试 一 直 以来 受 到 广 大 学 者 的 关 注和 研 究 。 该 类 测 7 1 但 试 的 信 度 较低 , 引起 人 们 对 1 语 测 试 的质 疑 。 今 尚 未形 成 较 7 迄 为 完 善 的 口语 测评 体 系 。口语 测试 过 程 中的 评 分 人 员、 分 标 评 准 和 评 分 方 式 都 成 为 影 响 口语 测 试 信 度 的 至 关 重要 的 因素 高校 应 对 考 官进 行 筛 选 和培 训 , 定 包括 学 生 口语 表 达 、 际 制 交 策 略 、 际效 果 、 感 态度 、 作 意 识 等 综 合 因素 的评 分 标 准 . 交 情 合 并 应 用 形 成评 价 体 系作 为传 统 终 结 性 评 价 的 有 益 补 充 .从 而 有 效 地提 高 口语 测 试 的 信度 .使 口语 测 试 有 效 地 反 拨 口语 教 学 , 进 英 语 口语 教 学 的提 高 。 促 关键 词 :大 学英 语 口语 测 试 信 度 问题 对 策 研 究 大 学 英 语 口 语 测试 的必 要 性 随着 我 国改 革 开 放 的进 一 步 深 化 ,经 济 的 发展 和社 会 的 进 步 对 人 才 培 养 提 出 了更 高 的要 求 .广 大 大学 生也 迫切 要求 提 高 英 语 口语 水 平 , 得更 强 的 英 语 口语 交 际 能 力 . 会 更 是 获 社 大 量 需 求 应 用 性 的英 语 交 际 人 才 。为 了进 一 步 推动 我 国 大 学 英 语 教 学 , 应 国家 改 革 开放 的 需 要 . 育 部 制 定 的 《 学 英 适 教 大 语 课 程 教 学 要 求 》 确 指 出 : 学 英 语 的教 学 目标 是 培养 学 生 明 大 的英 语 综 合 应 用 能 力 , 特别 是 听 说 能 力 . 他 们 在 今 后 工 作 和 使 社 会 交 往 中用 英 语 有 效 地 进 行 口头 和 书 面 的信 息交 流 .以适 应 我 国社 会 发 展 和 国际 交 流 的需 要 。 着这 一 新 要 求 的颁 行 , 随 大 学 英 语 1语 教 学 受 到 越 来 越 多 的关 注 . 1语 测 试 对 E语 教 5 5 l 学 的促 进 作 用 也 引 起 了高 校 英 语 教 师 的普 遍 重 视 ,很 多 专 家 和 学 者 在 积 极 探 索 提 高 听 说 能 力 的教 学 方 法 和测 试 手段 但 由于 传 统 的教 学 和 测 试 模 式 的根 深 蒂 固 .教 师 还 是 偏 重 于 阅 读 和 写 作 等 书 面 语 言 技 能 的 教 学 , 上 四 、 级 考 试 的社 会 效 加 六 应, 大学 英语 教 学 仍 以传 统 的应 试 教 育 为 导 向 , 大多 数 高 校在 制 订 人 才 培 养 计 划 时 忽 略 了 口语 教 学 ,使 得 口语 教 学 改 革 难 以真 正 推 行 : 于 口语 测 试 自身 的 特 点 , 鉴 口语 测 试 难 以实 现其 效 度 和 信 度 ,使 得 口语 教 学 和 测 试 在 实 践 中仍 面 临 大量 实 际 问 题 。 文 主 要 围绕 大 学 英语 口语 测试 的特 点 , 本 探讨 口语 测 试 中面 临 的 实 际 问题 , 提 出相 应 的 对 策 。 并 二、 口语 测 试 的特 点 及 面 临 的 问 题 1 高效 度 。 1 语 测 试 是 一 种 通 过 直 接 的方 式 针 对 考 生 的 . 5 语 言 表 达 能 力 进行 的测 试 。 是 能 够表 达 的一 定 能 够 领 会 . 凡 但 能 够 领 会 的 不 一定 能 够 表 达 , 在 口语 测 试 过 程 中 , 生 运 用 而 学 语 言 的结 果 可 以直 接 为 我 们 所 观 察 , 们 的 产 出性 技 能 在 测 他 试 中 能 真 实 地 呈 现 , 一 种 直 接 反 映输 出 性语 言 能 力 的 测 试 , 是 对 学 生语 言 能 力 的 测量 准确 , 度 较 高 。 效 2低 信 度 。 ah a 认 为 信 度 与 效 度 是 语 言 测试 中 的 两个 . B cm n 互 补 因素 , 相 对 平 衡 , 高 口语 测 试 信 度 . 是 要 提 高 其 评 应 提 就 分 的 可 信 性 和 稳 定 性 , 与 评 分 方 法 、 分 标 准 、 分 人 员 有 这 评 评 直接 的关 系 。第 一 , 口语 测 试 属 于一 种 主 观 型 测试 . 测 试 结 对 果 的评 分 需 要 评 分 人 员 的 主 观 判 断 并 受 评 分 人 员 主 观 因素 的 影 响 , 度 较 差 , 而影 响其 效度 。 由 于 1语 测 试 是 测 定 考 生 信 从 5 的语 言 表 达 和 运 用 能 力 ,评 分人 员 对 测 试 结 果 的评 判 与 其 观 点 , 言 水 平 , 评 分 标 准 的 理 解 , 及 当 时 的 疲 劳 程 度 和 情 语 对 以 绪 等 因素 有 关 ,因 此 不 同评 分 人 员 对 同一 结果 可 能 产 生 不 同 的 判 断 ,同 一 评 分 人 员 在 不 同时 间对 同一 结果 可 能 产 生 不 同 的判断。 二 , 第 口语 测试 的评 分 通 常有 两 种 : 析法 和综 合 法 。 分 分 析 法 是 把 E语 分 解 成 若 干 要 素 , 语 法 、 容 、 音 语 调 的 l 如 内 语 流 利 程 度 、 确 度 、 汇等 。 准 词 评分 人 员 根 据 一 定 的标 准 . 不 同 对
用信度和效度理论指导英语测试
目表 ,把任务安排到题项中去 ,使每一个题有具体的任
信度是 “ 测试 的一致性 ” 。简言之 ,就是测试结果 务 ,整 个 测试具 有 良好 的代 表性 。 信 度 所涉 及 的 问题 是个 体 测试 成 绩在 多大程 度 上 是 的 可信 度 、可 靠度 。我们 可 以这 样 来检 验 测 试 的 信 度 : 使 用 同样 一份 试卷 ,在 两 种不 同 的场 合 、环境 中 ,在 较 由测试误差或其它因素所影响的。效度所关注的问题是 短 的时 间间 隔 内 ,施 与 同样 的学 生 ,如 果 测试 结果 基 本 个 体 测 试 成 绩 在 多大 程 度 上 和个 体 语 言 能 力相 关 。因 吻 合 ,那 么证 明 该测 试是 有信 度 的 。一 份试 卷的 测 试 结 而 ,我们研究信度的目的是使测试误差造成的影响最小 果 如果 缺乏 信 度 ,就 没有 使用 价值 ,同时 也减 弱 了考 试 化 ,研究效度 旨在使我们想要检测的语言能力的效果最 的 公正 性 。当 然 ,要 完 全 消除 不 一致 性 也是 不 可 能 的 , 我 们能 做 的是 尽量 把 影响 不一 致性 的 不 利因 素控 制 在最
规定的内容 ,主要指试题与所要考查的语言知识 、技能 通常包括三个方面 :测试本身的信度 、受试者在不同情 ni 列举了五项影响 n 或语言能力的相关性 、代表性 ,与考生的合适性 。一般 况下的表现以及评 分的信度。Hen g 1 来说 ,一项测试的内容效度越高,就越能精确地了解所 测试信度的因素 : ()学 习者的波动 ,如临时的心理 2 要测试的内容,并产生较好的正面反拨效应 。语言测试 或生理的变化 ; ()评分 的波动 ,如评 分 员之 间、每 3 的 目的实 质上 是 为了推 测 个 人的 语言 能 力 。推测 的 依据 个 评 分 员 自身 前后 之 间 的 差异 ; () 测试 过 程 中的 波
国内英语测试信度与效度研究述评
U ie st ,Gu nv ri y …n ,Gu g i 4 0 4,Ch R an x 5 1 0 ia)
Ab ta t Th sp p r r ve o si t d f t e r l b l y a d v l iy o g i h t s v r s r c : i a e e iws d me t s u y o h ei i t n a i t fEn l e to e c a i d s
.
r s a c r o os d e e r h a e pr p e .
Ke r s En ih t s ;t s e i b lt y wo d : gls e t e tr la iiy; t s a i iy e t v ld t
一
、
引
信度 、 效度 和可行 性是语 言测 试 的三个 根本 问题 , 中效度 最 为重 要 , 其 因为效 度 是语 言 测 试 的基本 出发点 ( 惠 中 ,9 8 5 ) 杨 1 9 :5 。信 度则是 效度 的前提 条件 。信度 (ei it ) 指测 试分 数 的稳 定性 和 一致性 程 度 , rI bly 是 a i 它所
l iy a d r l b l y o g ih t s e eo s s e d l n t e p s y a s o ih t e s u y i i t n e i i t f En l e td v l p t a i i h a t 1 e r , f wh c h t d n d a i s y 1
关 键 词 : 英 语 测 试 ; 试 信 度 ; 试 效 度 测 测
大学英语成绩测试中的信度和效度
等因素 , 只是收集手头 现成 的试 题 , 把一些 无任何 价值 、 又
不相干的题堆积起来 , 测试 内容 则过多 地重视 英语知 识点 的测试 而不是英语 自身 , 准化测试 题 型成为英 语试题 库 标 中的主要测试形 式。试卷 的老套和模式的僵化 只能 检测学 生的语 言知识点 , 而无 法检测 学生运 用语 言的能力 。这 种 传统的设计 测试 卷的方法对教学和学习效果能否提供 公正
试成绩与真实水平 相一致 的程度 。信度受测试 环境 、 劳 、 疲
焦虑等因素的影响 , 与语 言能 力无关 。而这些 影响 因素越 小, 测试的信度就越大。 考试信度的大小说 明考试 的可靠
程度。我们可 以用信度 系数 , 即表 明信度 的大小统计量 , 来 表示信度的大小 。信度 系数越 大 , 明测 量 的可信程度 就 表 越大。信度系数 的最大值 为 1 。效度 是指大学 英语成绩 测
性, 保证较 高的评分者信度 。
第二 , 再测信度指 同一个被 测试 卷先后 两次测验 成绩 所得结果的一致 性程 度。再测信度主要测量所测结 果短期
内不会随着时间的推移而 改变 , 保持一 定的稳定 性和一致
性 。再测信度 的高低 与测量时 间的间隔有密切关 系。时间
间隔越 长 , 信度越低 ; 反之 , 时间间隔越 短 , 信度就越高 。所 以, 再测信度适合于速度测量 。 第三 , 复本信度 指被测试 卷在 两个 等级测 验上成绩 的
量工具在多 大程度 上反 映 了我们 想要 测量 内容的 真实 含 义 。效度有两 层含 义 : 一是 考试 内容 ; 二是 考试 测 出的 程 度 。效度是针对 测试 目的 、 测量结 果 而言 的。效度 是最 大
大学英语网络测试的信度与效度分析
2 测试 的信 度
有关结构 效度的定义 . 很多 的研究学者给出了比较复杂且相对不 同的定 义。 首先 A i d e r s o n , e t a 1 . ( 1 9 9 5 ) 将结构效度看作是“ 测试能够在何 种程度 上检测 出某种特性或性质” 。 所 谓的构成效度 。 并不是一个具体 的东西 , 而是一个抽象 的心理学概念。 它所测试 出的这种特性 . 是经过 多次实际考试 . 综合分析考试结果与预测结果之后所得 出的 效度 的概念 曾经一度被划分为许多详细的分 支 . 现在有有 被众 多 学者的研究 主流又转变为将其进 行统一 。本文之前 所提到 的 . A P A 、 A E R A和 N C M E联合委员会的定义“ V a l i d i t y i s a u n i t a r y e o n c e p t . ” 换句 话说 . 诸 多被 细分 的效度概念我们可以用一个结构效度来统一联 系起 来。 3 _ 3 效度 的验证 目前, 不 同学者对结构效度的验证方法有着不 同的见解 比如 . L . J . C r o n b a c h 和P . E . M e e h l 提 出了五种验证方法 . 即分组区分法( g r o u p d i f f e r e n c e s ) 、 相 关矩 阵 与 因素 分 析法 ( e o r r e l a t i o n ma t r i c e s a n d f a c t o r a n l a y s i s ) 、 内部 结构研 究 ( s t u d i e s o f i n t e r n a l s t ue r t u r e ) 、 不 同场合 下 的 变 化研 究 ( s t u d i e s o f c h a n g e o v e r o c c a s i o n s ) 、 过 程研 究 ( s t u d i e s o f p r o .
初中英语口语测试信度研究
第一章引言1.1理论背景社会生活的信息化和经济的全球化,使英语的重要性日益突出。
英语作为最重要的信息载体之一,已成为人类生活各个领域中使用最广泛的语言。
许多国家在基础教育发展战略中,都把英语教育作为公民素质教育的重要组成部分,并将其摆在突出的地位。
改革开放以来,我国的英语教育规模不断扩大,教育教学取得了显著的成就。
然而,英语教育的现状尚不能适应我国经济建设和社会发展的需要,与时代发展的要求还存在差距。
主要表现在学生实际语言运用能力的薄弱,尤其表现在口语能力方面(邵永真,1998;马天泽,1998;井升华,1999;姜澎,2001)。
口语能力较弱有语言学习固有特点的所造成的客观原因。
有研究表明,在听、说、读、写四种语言技能中,说的技能最难掌握。
语言学家海霍(Hayhoe, R)认为:听、说、读、写从易到难的顺序应该是读一写一听一说.‘读是最容易的,说是最难的。
(转引自贾冠杰,1996)韩晓惠(1998)的调查表明:30“个受调查者中,大多数人认为即使在英语学习上花费了多年时间,英语口语仍然是最难掌握的能力。
邱东林、季佩英(2004)对复旦大学2002级学生入学时的口语水平进行了抽样调查,在调查的408名学生中,52%的学生认为最薄弱的技能是说。
上述事例虽然反映大学生英语口语能力状况,但实质上是国内(大中小学)英语教学存在的共性问题。
整个社会大环境对学生的口语能力普遍感到不满意,对学生英语口头表达能力较弱提出了强烈批评,自然会引出对英语测试的批评。
刘润清(2000)认为,“在听、说、读、写四种语言技能中,说的技能无论怎么强调恐怕也不过分,因为学习语言的最终目的是把它作为一种工具来进行交际,而交际首先指的是口头交际。
语言教学今天所强调的文际教学,首先是口头交际。
从社会对外语人才的需求来看,一个人的口语能力无疑是十分重要的。
所以说,没有口语测试的语言测试是不全面的,或者说不能称其为语言测试。
”科学的语言测试包括口语测试。
国内英语测试研究现状与展望——对国内13种外语类核心期刊5年(2005-2009)的统计分析
运用 ; 从个 别技 能测 试转 向测试 多 项技 能 ; 从单 一 的终 结性 评估 到形 式性 评估 和 终结 性 评估 相结 合 ( 薛荣 ,0 8 4 — 7 。 了让 语 言测试 研 究者 更全 2 0 :4 4 ) 为
面地 了解 英 语测 试 研 究 的现 状 与未 来 , 文 对 1 本 3 种核 心刊 物上 的文 章进 行 了统计 和分 析 ,希望 对
13 4
所 占百分 比 %
l. 8 9
2. 31
2. 1 7
l. 1 9
2. 44
1o 0
表 1 据显示 : 数 虽然 2 0 0 8年发表 的相关论 文
3 研究 方法 . 2
篇数有 减少 , 占 1.%, 只 1 9 但我 们还 是 可 以清楚 看
出近 5年来英语 测试研 究总 体呈 上升趋 势 。特别 是 20 年 , 0 9 有急 剧上 升的趋 势 , 2 . 占 44 %。
等 ,而 2 0 0 6年实 证性 研 究 比非 实 证性 研 究 多 了
— —
对 国 内 1 外 语 类 核 心期 刊 5年 ( 0 5 2 0 ) 3种 2 0 — 0 9 的统 计 分 析 李 莲英
( 西 大学 外 国语 学 院 广
王金 生
广西 南宁 邮编 :3 0 4) 50 0
摘
要 :本 文 对发 表 于 国 内 1 外语 类核 心期 刊 上有 关英语 测 试 的 文章进 行 了文 献 3种
1 3
5 0
2 2
6. 67
1 4
4. 67
9
5 0
2 5
6. 9 5
8 3
5. 84
非 实 证 研 究
英语专业八级翻译测试的反拨效应研究
英语专业八级翻译测试的反拨效应研究作者:彭辉来源:《现代交际》2012年第03期[摘要]语言测试的反拨作用对教学有着重要的影响,而英语专业八级翻译测试作为考试项目之一,也起着不容忽视的作用。
本文基于独立本科院校英语专业翻译测试的现状,指出了目前英语专业中翻译教学测试的不足,论述了它对英语专业翻译教学的反拨效应。
[关键词]独立本科院校英语专业专业八级翻译测试反拨作用[中图分类号]H315.9[文献标识码]A[文章编号]1009-5349(2012)03-0049-02引言语言测试对语言教学有着重要的影响,二者相互作用,不容分割,它是一种重要的教学评估手段。
因而国内外语言研究者及其爱好者在研究语言测试时青睐于语言测试对语言教学的作用,即语言测试的反拨效应(backwash or washback)。
随着经济全球化的发展,英语在国内的影响力也日益重要,各高校对英语专业也随之加大投入力度。
英语专业八级考试是目前检测英语专业学生水平的重要手段之一,是一种标准参照性考试。
翻译作为“听、说、读、写、译”五项基本技能之一,在英语水平测试以及学生就业方面都发挥着不容忽视的作用。
为了顺应这一潮流,英语专业八级测试将翻译纳入测试范围之一,因而大学英语教学中对学生翻译能力更为重视。
本文着重研究独立本科院校英语专业八级翻译测试的现状及存在的问题,从而探讨了该项测试对英语翻译教学的影响,也即反拨效应。
一、独立本科院校英语专业八级翻译测试的反拨作用——对英语专业翻译教学的影响英语专业八级翻译测试有着很大的反拨作用,即对英语专业翻译教学产生很大影响。
其影响主要体现在对教师所设定的教学目标和动机,学生学习目标和动机,从而影响教学关系中师生选择的教学材料。
因而本文主要从这三个方面阐述英语专业八级翻译测试产生的反拨效应,既有正面影响,也包括负面作用。
(一)教师教学目标以及教学中存在的问题根据英语专业八级测试需要,教师的教学模式侧重于翻译真题的特点,进行针对性训练。
关于商务英语翻译测试的探讨
三、 商务 英语 翻译 测试 的 改革 策略
从应 试者 来看 , 生 往 往 也 会 按 普 通英 语 的 传统 答 学 题思 路去 处理 商 务 翻译 试 题 , 导致 学 生在 翻译 过 程
中 只注重 翻 译 的连 贯 性 , 是 翻 译 的 基 本 原 则 , 或 即
收 稿 日期 :0 1—0 2 21 3— 5
经济 事物 的桥 梁 , 作用 也 随之 凸 显 出来 。 目前 , 很 有 多翻译 公 司 、 自由翻译 者 、 校教 师 和学 生等 群体 都 高 加入 到商 务英 语 翻译 的 队伍 中来 。结果却 是 胜任 者
少之甚少。为了培养社 会急需的商务翻译人才 , 就 要从 商 务英语 翻译 的每 个环 节进 行 研究 和探 讨 。但
2 1 年第 3 01 期 辽 宁 师 专 学 报 (社 会 科 学 版 ) ( 7 总 5期 ) J U N LO IO IGT A H R O L G S CA CE C SE I O ) O R A FLA NN E C E S LE E( O ILS IN E DT N C I
从 目前 的研究 成 果来 看 , 不难 发 现 , 注 的焦 点依 然 关 是对 商务 英语 翻 译 的教 学模 式教 材选 用 等方 面进 行
不 断 的改革 和 完 善 , 忽 略 了测 试 环 节 的重 要 性 。 却 因此本 文希 望对 商务 英 语 翻译 测试 的一 些 问题 的探 讨, 解决 测试 中存在 的某 些 问题 并 能提 供 一 些 有 益
个 最大 的问题 就是其 评 分标 准 和测 试原 则 都不 免会 走 人普 通英 语 测试标 准 的怪 圈 。测 试 的 内容 是 商务
英语 翻译 , 以涉及 商业 信 函 、 可 广告 、 同 、 合 备忘 录 等 不 同的 内容 , 测 试形式 却 与 内容 不符 , 常就 是考 但 通 查词 汇 、 子 、 句 篇章 等 的翻译 。其结 果 就是评 分 标 准
中、澳、英、美、加六种笔译资格考试比较研究
103THE WHOLE WORLD区域治理作者简介:赵护林,生于1982年,博士,研究方向为国别区域、语言服务。
中、澳、英、美、加六种笔译资格考试比较研究江苏理工学院 赵护林摘要:文章选择了国内外六种较权威的笔译资格考试(中国大陆的CATTI、中国台湾的CETICE、澳大利亚的NAATI、美国的ATA、英国的IoL和加拿大的CTTIC),从考试目标/构念、考试设计、考试实施与管理三个方面进行异同分析,尝试为笔译资格证书考试开发与运用、翻译硕士专业教育提供参考。
关键词:笔译资格考试;考试目标/构念;考试设计;考试实施与管理;翻译硕士专业教育中图分类号:D691.46文献标识码:A文章编号:2096-4595(2020)34-0103-0003学术型学位旨在培养面向教学和科研的人才,专业型学位主要培养面向实践和应用的人才。
为改变我国高端翻译人才短缺的局面,2007年教育部批准设置翻译硕士专业学位(MTI)。
截至目前,设置翻译本科专业学位的高校多达272所,设置翻译硕士专业学位的高校升至249所,翻译专业人才培养受到了空前的关注。
MTI 指导性培养大纲(MTI 教指委2011年8月修订版)规定,MTI 培养目标为:培养德、智、体全面发展,能适应全球经济一体化及提高国家国际竞争力的需要,适应国家社会、经济、文化建设需要的高层次、应用型、专业性口笔译人才。
同时建议BTI 学生在毕业前通过全国翻译专业资格(水平)考试(CATTI)三级笔译或口译,MTI 学生在毕业前通过CATTI 二级笔译或口译。
经国务院同意,人力资源社会保障部印发《关于公布国家职业资格目录的通知》(人社部发〔2017〕68号)。
目录显示,CATTI 为唯一入选的翻译行业水平评价类国家职业资格考试。
“在翻译职业化的进程中,职业化的高等教育、资格认证考试和职业/行业协会是三个重要的影响因素”(穆雷2012:14)。
翻译资格考试的设立旨在加强我国外语翻译专业人才队伍建设,科学、客观、公正地评价翻译专业人才水平和能力,同时进一步规范翻译市场,加强对翻译行业的管理,改革翻译系列职称评审制度。
英语口语测试的信度和效度研究
键 , 指我们 把一 项 测试 成 绩 作 为要 测 试 的能力 是
或结 构 的指示 物对 它所 能进行 解释 的程 度 。结 构
表性 ; 比如 , 再 尽量 使试 卷 的评 分客 观一些 。评分
效度 是一个 动态 的过程 , 根据 测 试 成 绩所 作 的解 释永 远不 能说是 绝 对 有效 的 , 只 是 一个 相 对 的 它 概念 。讨论 测试 效度必 须 与具体 的测试 目的相结 合, 否则是 没有 意义 的 。对 于某些 测试 理论家 , 结 构效 度是 测试 效度 的一 种形 式 , 实 质 上是 评 定 它 测试 在 多大程 度上有 效地 基于其 基础理 论 , , 即 测
这种困境, 于测试有效性是相对而非绝对的。 在
不一 致性 的不 利 因素 控 制 在最 低 程 度 , 以便 于提 高测 试 信 度 。信 度 主 要 是 看 学 生 的分 数 是 否 稳
定, 如果 分数 忽高忽 低 , 就说 明信度不 高 。信度是
受许 多 因素影 响 的 , 比如测 试 的时 间 、 境 、 生 环 学 的健康 状况 、 题 目的理 解 等 等 。例 如不 同 的环 对 境 对 听力测试 的影 响是 很 大 的 , 些 靠 近喧 闹街 那 道教 室里 的学生 是很难 将注 意力 放在 听力材料 上
可靠则 要看 评分 标准 是否 客观 、 准确 , 评分 过程是
否一 致 。测试 效度 可通过 对学 生进行 访谈 或 问卷 调查 的方 式 , 了解 他 们 对 测 试 的态 度 、 映 和感 反
条件 : 度 与 效 度 。B c ma [ ( 9 6 把 信 度 定 信 a h n3 1 9 )
手 段 。而 口语 测试 的信 度与 效度 的把握 则是 测试
简版脑卒中患者专门生存质量量表的汉化及信度、效度检验
简版脑卒中患者专门生存质量量表的汉化及信度、效度检验*唐宝丽1,易雅玮1,和晓莉1,姚楠1,赵静2,孙红娟2(1空军军医大学唐都医院,陕西西安,710038;2中国人民解放军总医院海南医院,海南三亚,572000)[摘要]目的开发建立适用于我国脑卒中康复期患者生存质量评估的中文版量表。
方法在POST教授的简版脑卒中患者专门生存质量量表(the short version of the stroke specific quality of life scale,SV-SS-QoL)的基础上,采用双人翻译-回译的方法对英文版SV-SS-QoL量表进行翻译、回译和跨文化调适、预调查,构建中文版SV-SS-QoL量表;将量表应用在312例脑卒中康复期患者进行测评,采用项目分析、探索性因子、验证性因子以及Cronbach^a系数、折半信度、重测信度等评价量表的信度与效度。
结果①中文版SV-SS-QoL包括身体健康相关的生活质量、社会心理健康相关的生活质量两个维度,12个条目,各条目与总分之间的相关系数为0.416~0.721(均P<0.05),决断值为3.976-10.298(均PvO.05)。
②量表以及两个维度水平的内容效度指数分别为0.930.0.917.0.944,各条目水平的内容效度指数为0.833-1.000;探索性因子分析共提取2个特征根〉1的公因子,累计贡献率为86.529%;验证性因子分析显示,各条目载荷值均大于0.300,模型拟合指标大部分相关指数在标准范围。
③总量表以及两个维度Cronbach^a系数分别为0.882,0.891,0.832;总量表以及两个维度折半信度分别为0.845.0.872.0.834;总量表以及两个维度重测信度分别为0.839.0.816.0.877o结论中文版SV-SS-QoL鉴别力、信度和效度良好,可为我国脑卒中康复期患者生存质量的评估提供一种可靠的测评工具。
信度检验 英语
信度检验英语全文共四篇示例,供读者参考第一篇示例:信度检验(Reliability Test)是评估某个测试工具或问卷的稳定性和可靠性的一种统计分析方法。
在心理学、教育学、医学等领域,信度检验被广泛应用于评估各种测量工具的信度,以确保其能够稳定地反映被研究对象的特征或状态。
在进行信度检验时,常用的统计方法包括Cronbach's Alpha系数、Kuder-Richardson系数等。
这些系数可以帮助研究者评估测试工具的内部一致性,即所测量的各项指标之间的关联程度。
Cronbach's Alpha系数通常用于评估一个问卷中各项问题之间的内部一致性,其取值范围在0到1之间,数值越接近1说明问卷的信度越高。
除了内部一致性外,信度检验还可以评估测试工具的重测信度。
重测信度是指在多次测试中,同一个被测量对象在不同时间或环境条件下的得分变化。
通过重复测量同一对象,研究者可以评估测试工具在不同情况下的信度表现,以进一步确认其可靠性。
在进行信度检验时,研究者需要注意以下几点:要确保测量工具具有良好的设计和结构,以确保其测量项目之间有较高的相关性;要选择适当的统计方法进行信度检验,以确保结果的可信度和准确性;要对信度检验结果进行解释和分析,以确定测试工具的信度是否符合研究需求。
信度检验是评估测试工具可靠性的重要手段,可以帮助研究者确保测量工具的稳定性和准确性,提高研究结果的可信度和科学性。
在实际研究中,研究者应充分重视信度检验的重要性,以确保其研究结论的有效性和可靠性。
第二篇示例:信度检验(英语:reliability test)是指对某种测量或评估工具的一种统计分析方法,用来评估该工具的稳定性和一致性。
信度检验是研究者在进行研究时非常重要的一项工作,因为一个具有高信度的测量工具可以提高研究结果的可靠性和准确性。
在研究设计阶段,研究者需要对所使用的测量工具进行信度检验,以确保所得到的研究结果能够反映出研究对象的真实情况。
浅议高职英语测试中信度与效度的平衡
浅议高职英语测试中信度与效度的平衡" 论文关键词:高职英语测试信度效度平衡论文摘要:本文从介绍语言测试中的信度和效度入手,介绍了语言测试中两者的关系。
作者通过分析高职英语教学和测试的现状,指出了高职英语测试中存在的各种问题,并针对这些问题提出了平衡信度和效度的方法。
语言测试是语言教学的重要组成部分,高质量的语言测试能够很好地反映语言教学的效果,它的测试结果为教学实践提供参考,帮助教学者和学习者成功实现语言学习目标。
国内外语言测试领域的专家普遍认为:语言测试的评估标准主要包括信度、效度和可行性(难易度、区分度、可操作性、可重复性、有益的反拨性、分数的可解释性和经济上的可承受性等)。
专家们尤其认为:信度和效度是语言测试中两个非常重要的标准,低信度和低效度的语言测试是失败的语言测试。
作为高等教育重要组成部分的高职教育现在已占据了我国高等教育的半壁江山,其目的是培养适应社会发展要求的高素质、复合型、应用型人才。
与普通高等教育不同,高职教育强调培养学生对特定知识的应用能力和相关技能的动手能力。
因此,高职英语教学也应突出培养学生对英语的应用能力,高职英语测试要做到信度和效度的平衡,体现高职英语教学的目标,以提高教学水平。
一、语言测试的信度和效度1.信度(Reliability)国际著名语言测试专家Lyle F.Bachman把“信度”定义为“测试结果的一致性”。
信度也称测试结果的可靠性和稳定性,即在不同时间、地点和环境下对相同测量对象用同样的“尺子”进行重复测量时,总是能获得类似的结果。
一份试卷的测试结果如果缺乏信度就没有使用价值,也就削弱了考试的公正性。
要绝对消除测试的“不一致性”是不可能的,相对地将影响测试“一致性”的不利因素控制在最低水平才是提高测试的信度的方法。
评估信度系数的主要方法包括:再测信度、平行试卷信度和内部一致信度。
再测信度(Test Retest)指的是用同一测量工具(通常指试卷)在不同的时间内对同一受试对象重复测量两次,两次测量结果的相关系数即为再测信度。
大学英语网络测试的信度与效度分析
大学英语网络测试的信度与效度分析0 引言2008年,教育部实施大学英语四级机考试点改革。
从此,大学英语四级无论是从形式上还是从内容上都有了较大的变化。
由于整个社会对大学英语四级的认知度都比较高,而且考生只有在大学就学期间才可以参加这项考试。
因此,各个学校的大学英语教学也纷纷以大学英语四级考试为目标,制定相应的教学计划,对教学活动进行调整。
辽宁工业大学从2009年开始,进行大学英语网络测试实践以来,已经进行了23场全校范围的测试,参加人数超过了二万人次。
目前,已经形成了较为完善的测试硬件系统,和较为成熟的测试机制与体系。
基于以上背景,本文通过分析辽宁工业大学英语网络测试的实施过程与结果,考察这项测试的效度与信度,为今后大学英语教学的组织与进行,大学英语网络测试的创新与完善提供相应的依据。
1 高质量考试的标准大学英语四级考试是一项由专家团队精心打造的考试,经过多年的验证,被社会广泛认可,可以当之无愧地称作“高质量考试”。
那么,辽宁工业大学的大学英语网络测试,是否也是一项“高质量考试”呢?Bachman & Palmer将以下六大要素作为决定测试质量优劣条件,分别为信度(reliability)、效度(construct validity)、真实性(authenticity)、交互性(interactiveness)、影响性(impact)、可行性(practicality)。
所谓真实性,是指考生在测试过程中能够正确解答某个问题,是否等于其在实际场合下也具备与之相对应的能力。
所谓交互性,是指考生在完成测试任务过程中个人特征的参与程度和形式。
所谓影响性,是指测试对于这个社会、教育制度、或是此项制度中的个人所造成的影响,同时还包括测试的波及效应(washback effect)。
最后的可行性与前面几项要素不同,它包括测试以何种方式实施、甚至于最初的测试能否能够实施的问题。
但是,正如Bachman & Palmer所说,决定测试质量的最主要因素应属信度和效度。
试论口译测试模式及质量评估
[ 参考 文献 ] 【】蔡小红 .论 口译 教 学 训练评 估 叨 . 中国翻 译 ,20 ,6 1 05 . [】蔡小红 . 口译 课效 果评 估初 探 【 .现 代外 语 , 19 . 2 2 J 】 92 【】刘 和平 . 口译 理论 与教 学 【 .北 京: 中 国对外 翻译 出版 公 司 , 3 3 M】 [】杨 承 淑 . 口译 教 学研 究 :理 论 与 实践 【 . 北京 : 中 国对 外翻 4 M】
一
、
引 言
随着改革开放 的 日趋深入 ,综合 国力 的不 断增 强,以及 越来越多地参与 国际性事务 , 我国对 口译人才的需求也 日益 增多 ,口译事业蓬勃发展 ,成为炙手可热的行业 ,出现了前 所未有 的繁荣局面 。 为一 门新 兴的学科 ,与其相关的学术 作 研究也如火如荼地发展起来 。 众多的 口译研 究领 域,对于 在 口译测试模式 以及质量评估体 系一直争论不休 。 由于我 国口 译教学发展历史较短 ,口译测试 在效度 、信度 、区分度、可 行性 、后效等各 项测试指 标上均 与合理 的标准 存在较 大差 距 ,教学效果得不到有效 的检验 。而且评估 “ 既要考虑科学 客观 , 又要照顾特 定的训练 目标 和技 能;既要关注普遍的水 平 ,又不能忽视个人 的需要 ;既要把握训练进度 ,又要注重 心理素质 的锻炼 与培 养” 。虽然 目前无 论是国 内高校在制定 口译教学大纲 时, 还是 口译资格认证考 试中心在评判考生成 绩 时,均制 定了一套 自己的口译测试模式及质量评估体系 , 但现有 的模式及评估体系大都带有不 同程度 的片面性 , 无法 满足 口译教 学的实际需要 。因此 ,寻求一种科学客观并行之 有效 的测试模 式 以及 分析测评 口译 的效果 与质 量是我们 迫 切需要解决 的问题 , 这对高校如何培养优秀 口译人才具有很 强 的指导意义 。 二 、我 国口译测试模式及质量评估体 系 1 .发展现状 虽然 语言教 学和语 言测试理论研 究 的发 展 已经有相 当 长 的历史 , 是相对 与西方的 口译研 究而言,我国关于 口译 但 测试 的理论研究起步较 晚,直 到 9 0年代中后期, 口译教学 逐步走上 了职业化 、 学化和规范化的道 路,目前仍处于发 科 展 的阶段 。 口译测试及质量评估是 口译教学过程中十分重要 的一个环节 , 估系统的合理设计可 以在 口译训练中起到指 评 挥棒 的作用 ,能够 更加 客观 、更加科学地评价学生的 口译水 平 。因此 ,加强 口译测试及评估体系 的研究,使 口译测试 及 评估更加科学化和规 范化 , 而解 决 口译测试 中存在 的问题 进 是 当前 口译界一项重要而紧迫 的任务 。 2 .国 内口译测 试及 教学评估的主要问题 第一 , 口译 教学 人员对 口译测试及质量评估 的认 识和 研 究有待加强 。 第二 ,口译测试及教 学评估 的价值取 向存在 偏 差 。第三 ,口译测试及 教学评估 的主体单 一,忽视 了评估 主 体 的多元性 。第 四,评估方式单一 ,评估标准过于简单 。 三、构建科学的 口译测试及质量评估体系 1 口译测试 的 目的及 内容 . 口译则是一种表现为 口头交际的复杂交际行为 , 即以 口 头的形式将一种语言所表达的 内容用另一种语言传达 出来 。 从 口译的形式过程上看, 口译将信息 的来源语形式转 换为 目 标语形式,即 由 “ 源语 ”转换 为 “ 译语 ” :源语输入 一语码 转换 一译 语输 出;从 口译过程的 内容上看 ,口译从信 息的感 知开始 ,经过加工处理 ,再将信息表达 出来 :信息感知一信 息处理一信息表达 ; 以上三个阶段又可 以具体分解 为信 息 而 的接收 、解码 、记录 、编码和表达这五个阶段 :接收一解码 记录一编码一表 达。鉴于 口译具有现场性 、 即席性 、限 时性和交互性 的特点 , 它作 为一种 即席双 语传言活动 , 员 译 只有具有 高超 的即席应变 能力和流 利的现 时表达 能力等一
语言测试的信度和效度及其关系
科技信息 2008年第 17期 SCIENCE &TECHNOLOGY INFORMATION我们知道 , 测试是教与学的向导 , 而为了让它发挥出向导的作用 , 一份好的试卷是必不可少的 , 而且是至关重要的 . 一般情况下 , 我们判断一份试卷的好坏的主要标准是:是否有信度、效度、区分度、实用性、全面性、公正性及后期效应。
其中, 以信度和效度最为重要。
一、语言测试的信度语言测试的信度, 又叫可靠性, 是指考试结果的可靠性和稳定性。
即看学生的分数是否稳定, 如果同一个学生做同一套试卷 , 做的几次的结果都是一致的 , 那么我们说这次考试是有信度的; 反之 , 如果分数忽高忽低就说明信度不高 , 那么表明考试的信度不高。
信度可以分为复测的效度、判卷的效度和每一个测试项目的效度。
同一学生不管考多少次, 所得的分数都是一样, 那么就说这个分数有复测的可靠性。
影响分数的一个很重要的因素就是判卷人, 在判卷过程中, 不同的判卷人对同一试卷也会做出不同的反映; 同一个人在不同的时间对同一试卷给的分数也是不一样的。
试卷不仅要达到其整体的可靠性, 而且每一题都必须能达到这个标准, 那才是一份有信度的试卷。
与能力无关却又会影响试卷信度评判的因素有很多,例如:1. 考试条件差, 天气热、考场周围太吵闹等。
2. 考试条件不一样。
同一个学生在安静与吵闹的环境中做同一份试卷,其结果不一样。
3. 监考施策。
不同的老师对考生的松与严, 看见考生作弊或违纪不勒令禁止。
4. 题目要求不清, 学生根本无法弄清题义, 也就无法真实的反映考生的水平。
5. 保密工作做的不好, 泄题事件发生。
6. 评分。
主观测试的评分常常因评卷人而异, 难以达到较高的信度; 客观试卷的评分不受评卷人的影响因此信度较高。
7. 样品数量太小, 样本不足。
8. 身体及心理状态不好等等, 这些因素都会影响到信度。
因此, 为了提高信度, 我们必须对症下药, 采取各种措施。
英语测试信度与效度的多维分析
者的主观判断和 印象来 打分 。这是根据它 们各 自的评分 方 法而不是根据试题本 身的性质而命名 的。
英语 多项选择题通 过测试学生所 掌握 的语音 、 词汇 、 语
体系, 是语音、 语法和词汇的总和。此时的测试取消了作文
和翻译 , 而以多项 选择 和人 机 对话 的方式 取而 代之 。罗伯
学家海姆斯( y e) H m s发表了《 论交际功能》 强调了语言的 ,
社会功 能 , 在这一理论 影 响下产 生 了交 际教学 法 和交 际测
容。作为衡量学生英语水平的一种尺度 , 考试本身必须可
靠、 有效 。然 而 , 大学英语测试 中占有较大 比例 的多项选择 题是否能客观地衡量学生 的外语水 平?而对于 近年来分 数 比例 日益增大 的主观性试题 的信 度与效度又 是怎样 ?这两 类试题的优劣何在?这正是 本文所 要研究的 内容 。 二 、 言测试 史的回顾及信度 与效 度的发展 语 测试理论 的发展大 致 经历 了三个 阶段 , 一 阶段被 称 第 为“ 前科 学测 试 阶 段 ” pec nicp r d 。半 个 世 纪 以 ( rsi t e o ) e f i i 前, 传统的语言学家把语言作 为一种 孤立 的现象 加以研究 。 在这一基础上产生 了语法 、 翻译法 , 以语 法分 析 、 它 翻译 和 短文写作为 主体 。测试 内容严重偏 重 文法 , 视 口语 。此 忽 时的测试毫无信度 可言 , 虽有一定效 度 , 因其测试形 式和 但 评判标准 的极大 主观随意性 而大大减弱 。随后语言测试 进 入 了第二 阶段 , 即心理 、 结构测试 阶段 ( sco e i —s u - pyh m tc t t r r trlt e o ) ua sp r d 。结构主义语 言学 家们把语言看成一 个形式 i i
浅议基于翻译能力发展的翻译测试改革
2对 于 翻 译 测 试 的 选 材 . 查 显 示 。 部 分 内 容 为 科 技 、 . 调 大
文学 。 次 为 经 济 。 于测 试 时 间 的 限制 , 章 的数 量 总是 有 其 由 篇 限 .如 若 某 种 体 裁 由 于术 语 的 生 僻 给 大部 分受 试 者 带 来 理 解
高 以及 改 革 开 放 的深 化 . 会 对 学 习 者 的 翻 译 能 力 , 别 是 交 社 特
际 能力 和双 语 能 力 提 出 了 更 高 的要 求 .这 也 给 翻译 的 测 试 和
乎 能 够 考 察应 试 者 的综 合 翻 译 能 力 .然 而 这种 单 一 题 型设 计
却 不 能 清 晰 的体 现 出译 者 的 翻 译 策 略 和技 巧 .忽 略 了测 试 的
1明确 测 试 目的 .
根 据 现 代 测 试 理 论 .测 试 题 的效 度 要 求 其 测 试 目的 是 非 常 明确 和 专 一 的 。即 使 翻译 包括 对 原 文 的 阅 读 理 解 和 用 译 文 的书 面表 达 .但 翻 译 题 的设 计 者 必 须 非 常 清 楚 自已 所 设 计 的 某 种 形 式 的翻 译 题 在 教 学 中 主要 是 测 试 何 种 语 言 能力 的 如 果 是 为 了测 试 翻 译 能 力 . 么 为 了 提 高测 试 的效 度 , 该 采 取 那 应 有 相 对 完 整 独 立 意 思 的全 篇 短 文 翻 译 题 形式 .而最 好 不是 摈 弃 缺 乏语 篇 环 境 的单 句 的翻 译 因为 翻译 能 力是 一 种 不 仅 包 括 语 言 能 力 , 且 还 包 括 翻 译 技 巧 、 化 素 养 、 科 知 识 等 语 而 文 百
教 学工 作 提 出 了更 高 的 要求 。 然 而 , 译 究 竟是 什 么 , 译 能 翻 翻
英汉双向口译测试评分结果的一致性——一项关于口译评分者之间信度的实证研究
英汉双向口译测试评分结果的一致性——一项关于口译评分
者之间信度的实证研究
范琴;韩潮
【期刊名称】《海外英语(上)》
【年(卷),期】2018(000)002
【摘要】口译测试评估是口译教学的重要组成部分,对成绩评估、人才选拔等具有重要意义.在口译评估中,评阅人员之间的信度对口译测试的整体信度具有很大影响.本研究通过比较不同评分人员给学生英汉互译测试的分数,发现在英译汉和汉译英两个方向上,学生评分员之间的评分数据差异最大,而教师评分员之间的评分数据差异最小;在汉译英方向一位学生评分人员与一位教师评分人员的评分数据之间存在着具有统计学意义的显著差异.评分者语言能力、口译实践经验、口译评分经验等都是影响口译评分的重要因素.
【总页数】3页(P40-42)
【作者】范琴;韩潮
【作者单位】西南大学外国语学院,重庆400715;西南大学外国语学院,重庆400715
【正文语种】中文
【中图分类】G424
【相关文献】
1.口译标准及其实现——一项基于顺应论的口译教学实证研究 [J], 伍永花
2.不同评分方法下翻译测试评分员间信度的实证研究 [J], 肖维青
3.口译听辨理解能力和译前准备训练对口译学习的影响——一项基于口译实验课的实证研究 [J], 崔翠
4.口译质量评估实证研究在中国-一项基于口译质量评估实证性研究论文的文献计量研究 [J], 黄靓;
5.英汉双向口译测试评分结果的一致性——一项关于口译评分者之间信度的实证研究 [J], 范琴;韩潮
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
传统上我们习惯以终结性课程评价为主, 也就 是说, 一般以学期末或某个学习阶段结束后的学生 测试成绩为评价对象, 对学生此阶段的学习提供鉴 定性评价。近年来, 外语教学评估的诸多研究对翻 译教学评价产生了很大的借鉴意义, 有学者希望今 后能够采用形成性评估( fo rmat iv e evaluat ion) 和终 结性评估( summat ive evaluatio n) 相结合的做法, 既 要进行总结性评价, 还要进行初始评价与过程中的 持续性评价, 从而形成对翻译学习过程的动态监控 ( 武光军, 2006: 18) 。还有学者 主张加强形成性 评 估, 采取观察、日记、问卷、访谈、文献和资料分析、自 我评估等方法, 让渐进性、为学生提供适当反馈的形 成性评估对翻译教学产生强有力的、正面的影响( 王 华、富长洪, 2006: 68~ 69) 。也就是说, 只有形成性 评估和终结性评估相结合, 才能保证测试和评估的 信度。
影响信度的因素很多, 比如: 试题的量、试题的性质、
然而, 历史悠久的翻译测试并没有受到应有的 试题的区分度、考试之间的差异性、题目的难易度等
学术关注。即使是与它血脉相连的语言测试理论也 等( 刘润清、韩宝成, 2000: 210, 213~ 214) 。针对翻
对它弃之不顾。语言测试近三十年内取得了很大的 译测试的特殊性质, 我们主要关注的是评分是否客
o f t ranslat ion t est s results. T his paper invest igat es t he co ncept of r eliabilit y in t ranslat ion assessm ent in t erms of rat er reliabilit y, it em t ypes, and f ormat ive assessm ent . It points o ut t hat mo re reliable, ef fect ive and pragm atic t est measures
*
翻译测试的信度研究
t 肖维青
[ 摘 要] 翻译测试的信度是指翻译考试结果的可靠性和稳定性。从题 型设计、形 成性评估和评阅 方式等几个方面来看, 应该可以设计出更加可信、有效、实用的翻译测试方法。
语
[ 关键词] 翻译测试; 信度; 评阅人; 形成性评估
言
[ 中图分类号] H059 [ 文献标识码] A [ 文章编号] 1673- 8179( 2010) 02- 0171- 04
进展, 但主要是针对听、说、读、写而进 行的测试分 观。一般来说, 主观测试的评分常常因人而异, 而客
析, 对翻译测试少有涉及。各种论述英语测试的专 观测试的评分由于不受评卷人的影响, 因此信度较
著, 几乎不提翻译测试。原因很多, 其一, 当然可能 高。当然, 翻译测试为了追求信度, 完全采取客观测
三、教师评阅
在纯粹的翻译测试中, 我们可以增加一些客观 试题, 由此可以避免阅卷过程中的误差; 但是翻译测 试和写作测试一样, 有自身的特点, 必须包括相当的 主观试题。那么, 如何避免教师评阅过程中的主观 性呢?
1. 制定参考/ 标准译文。由评阅教师亲自参与 参考译文的翻译与修订, 不能以某一名家译文或已 出版的译文作为唯一标准; 充分考虑受试者的实际 水平, 尤其要参考预测所得的中等水平考生的译文 质量; 明确区分/ 可接受0与/ 不可接受0的译文( 宋志 平, 2002: 32) ; 尽量罗列出可以接受的译文, 并按其 优劣程度排列。
究
经成为了炙手可热的产业。其实, 翻译测试古已有 翻译教学中, 然而对翻译测试的基本问题如信度、效
之。仅以中国为例, 有记载的早期翻译测试始于清 度却极少有人问津。本文拟从题型设计、形成性评
代科举考试。据马祖毅( 1984) 、付克( 1986) 等人的 估和评阅方式等几 个方面讨论翻译 测试的信度 问
3. 改错题。改错题是指给出有错误的译文, 让 考生发现错误并予以纠正的试题。这种试题难度较 大, 能有效地检测考生解决问题的能力。
4. 段落填空和段落改错题。段落填空的特点是 让考生根据一段相对完整的原文在译文中的空白处 填上适当的内容。段落改错的特点是对照原文找出 译文的错误或欠妥之处, 并予以纠正。
学
#
教
On the Reliability of Translation Testing
育
XIA O W e-i qing
学
( S hang hai I nt er nat ional S tudi es Universi ty , Shanghai 200083, China)
Abstract: Reliabilit y of t ranslat ion t esting m eans t he reliabilit y and st abilit y
5. 条件性翻译测试题。条件性翻译的命题方式 是在一段文章中对一些重点测试点提出条件, 限定 翻译方法。这种试题的优势是能够培养学生自觉运 用技巧进行翻译的能力。在制定翻译条件时, 所提 出的条件应是唯一理想的翻译方法。
6. 翻译评论。翻译评论题的设计有两种: 以篇 章为评论对象或以划线句子为评论对象。前者难度 较高, 比较适合程度较高的学生, 后者较前者容易控 制评分标准。翻译评论题便于检测考生的知识深度 和综合分析能力。
的
年来, 翻译考试不论是规模还是种类都蔚为
近 壮观, 比如国 家人事部的二、三级翻译 专业
试研究难度很大。测试作为教学过程中的一个重要 环节, 是检查教学大纲执行情况、评估教学质量、促
信 度
资格( 水平) 考试、上海市紧缺人才工程的口 进教学改革的重要手段。一门课程的测试是衡量学
研
பைடு நூலகம்
译考试等, 甚至在一些地区, 翻译考试、翻译培训已 生学业成就的主要工具。虽然翻译测试一直伴随在
是受到测试语种的限制, 比如研究英语语言测试的 试, 显然是荒谬的。翻译既是艺术又是科学, 有一定
专家未必精通汉语, 而且涉及两种语言的主观性测 的内在规律, 也存在相应的理论体系, 所以翻译测试
* 基金项目: 国家社科基金项目( 09CYY 005) 。
171
语 言 学 # 教 育 学
肖 维 青 翻 译 测 试 的 信 度 研 究
记载, 同文馆的翻译考试分初试和复试, / 初试是把 题, 期待有更加可信、有效、实用的翻译测试方法。
外国照会译成汉文。复试是将某条约中的一个片断
译成外文0。但这些记载都是非常粗略的描述, 今人
一、题型设计
已无法得知当时翻译测试的评分标准、评阅制度和
测试的信度是指考试结果的可靠性和稳定性。
实施方法等若干细节( 穆雷, 2006: 466) 。
172
可以适当引入并提高客观题的比重。总之, 题型不 能单一, 要多样化、科学化, 并有针对性。
传统的翻译测试一般只进行单纯的句子、段落 或者篇章的翻译。这种过于简单的命题方式的缺陷 除了评分主观性较大以外, 测 试目的也不明确, 覆 盖面过窄, 试题内容难以涉及需要检查的知识和技 能, 致使教学重点不突出, 所学的知识得不到巩固。 除了传统的句子翻译、段落翻译和篇章翻译, 翻译教 师在自己的教学实践中摸索出了很多行之有效的题 型( 徐莉娜, 1998: 31~ 32) 。例如:
1. 单项填空。这种题型可分为基 础知识填空 和实践填空两种。翻译原则、基本概念、两种语言的 不同点以及译者素养都可作为测试点。实践填空, 也称/ 完成下列译文0, 侧重于检测考生运用某种技 巧的能力。空格内容的设计应具有代表性并能体现 出某种技巧在具体实践过程中所发挥的作用。
2. 判断题和多项选择题。判断题和多项译文选 择题都以/ 忠实0、/ 通顺0作为答题标准, 这两种题型 便于考查考生运用翻译理论诊断、分析译文的能力。
厦门大学的杨士焯( 2002: 55) 研究过在自己教 学中如何应 用/ 长篇翻译0 这样一个 项目。经过 修 改, 上海外国语大学英语学院的文学翻译课( 针对翻 译专业三年级学生) 也采取了类似的做法, 相信这是 一个非常好的形成性评估的例子。具体可以这样操 作: 每个学期开学不久( 第二、三周) 就向学生布置一 篇长篇英文翻译。所谓长篇, 起码是 5000 字以上, 当然还要考虑所选篇章的难度、学生的程度以及是 否有足够的课余时间。材料的选取可以由教师来规 定, 也可以由学生自主选择, 不过学生自选篇目要经 过教师认可。这项任务可以由学生个人独立完成, 也可以是团队作业( t eamw o rk) , 如果 是后者, 字 数 和难度应该有所增加, 团队人数也要进行控制, 一般 不超过 4 人。交稿的期限定 在学期结 束前的两 三 周。但是, 这个教学活动并不是简单的布置任务收取作业两个步骤。从开始选材、任务分工、查询资 料、着手翻译、产 生初稿、校对、产生终 稿等多个 程 序, 学生需要提供详尽的翻译笔记, 需要每两周和教 师汇报进度、讨论出现的问题, 需要在上交终稿后写 出自我评估并进行全班性口头展示( oral presentat ion) ; 教师也需要在整个过程中适时检查学生的笔 记、记录访谈。为了引起学生的重视, 对这个活动的 评估可以占学生学期总评成绩的一定比例, 一般以 30% ~ 40% 较稳妥。这种形成性评估的优点很多, 比如能够促进学生边学边用各种技巧, 融会贯通, 充 分展示他们的翻译水平和能力, 使他们有充裕的时 间对译文进行仔细推敲, 也可以克服一次或两次翻 译测试/ 定终身0 的片面性评估。正如我们所知, 翻 译教学是一个流动、充满活力的过程, 翻译测试和评 估应该反映这种教学现状, 并有效地推动教学的开 展。
广西民族大学学报( 哲学社会科学版)
JOURNAL OF GUANGXI UNIVERSITY FOR NATIONALITIES ( Ph ilosophy an d S ocial S cien ce Edit ion)