大学专业英语的测试信度与效度研究
英语测试中的效度、信度和真实性
【 摘要 】 英语考试种类繁 多, 有 国家四六级 , A B级 , 还有面向社会 的 P E T S考试 出国试 命 题 的 角度 出发 , 分 析 一份 试 卷 的 效 度 、 信 度 和 真 实性 , 对 一 线 的教 学工 作 者 而 言 知 道 如 何 确 定 试 卷 的质 量 , 在 以后 的 教 学 中会 有很 重要 的应 用 价值 。
一
它指 的是 考 生 在 完 成 某一 测 试 任务 时 . 其语 言 能 力 的哪 些 方 面 参 与 了完成 该 测 试 任 务 的 活 动 . 参 与 的 程 度 如何 . 与 情 景 真 实性 真 实性 不 同 . 交 际真 实性 强 调 的 是 考 生 与 测试 任 务 之 间
无 所 知 的 学 生 而言根 本测 不 出他 们 的 写作 能 力 。所 以 . 这 个 的 交 际 关 系 。 题 目对后 者 而言 效 度很 低 . 因 为我 们 要 测 的是 他 们 的写 作 能 力 4 . 3如 何 提 高 语 言 测试 交际 真 实性 而不 是摄 影 知 识 能 力 需要 指 出的是 . 语 言测 试 的 效度 是 一 个 般 来说 . 提 高测 试 的 情 景 真 实性要 容 易些 . 而提 高 交 际 相 对 概 念 例 如 . 把 剑桥 商务 英 语 证 书 考 试 来 测试 非 英 语 专 业 的真 实性 要 难 些 B a c h e r ma n 提 出用 以提 高语 言 测 试 交 际 真 实 的 学生 英语 水平 效 度 就很 低 性 的 四 项 措施 H : 在 设 计 考题 时 可 以具 体 说 明考 生 只 有 使 用何 2 . 信 度 种 策略 才能 完 成任 务 提 供 机会 即给 考 生提 供 充足 的 时 间 、 必 信 度 是 指 考试 结 果 的 可 靠性 和 稳 定 性 . 它 通 常 以 两 次考 试 要 的信 息 和 _ T - 具 等 考试 任 务 要得 当 任务太难会影响考生的 结 果 相 关 系数 来 表 示 . 系数 越 高 , 信 度 也 就越 高 影 响信 度 的 因 策略 的 应 用 。考试 任 务 要 有 趣味 性 。 通 过 提 高考 试 的情 景 真 实 素很 多, 主要 有 外部 环 境 和 个 人 因素 , 同 时试 卷 的 量是 否足 够 性 可 以提 高 考试 任 务 的趣 味 性 大, 区分 度 是 否 高 , 难 易度 是 否适 中 , 评 分是 否客 观 等 因素 也 影 4 . 4编 写 试 题 的 真 实 性 原 则 响 着信 度 、 语 言 的测 试 目的 就是 为教 学服 务 的 . 要 考察 考 生在 实 际的 3 . 信 度 和 效 度 的关 系 环境 下使 用 语 言 的 能 力 . 所 以试 题 的 编 写要 遵 循 试 题 的真 实性 信 度 和 效度 是 衡 量 测 试质 量 最 重要 的 两个 指 标 . 他 们 之 间 原 则 例如 . 下 面 的例 子 中 : 是 相 互依 从 . 相 互排 斥 的 关 系 从 方 向 而言 它们 是 单 方 向 的 . 即 1 wo u l dt a k e a r t u mb r e l l awi t hme
英语测试中的效度、信度和真实性
英语测试中的效度、信度和真实性作者:陈莉燕王军来源:《课程教育研究·上》2014年第01期【摘要】英语考试种类繁多,有国家四六级,AB级,还有面向社会的PETS考试出国人员的GRE\TOFEL等。
本文从各种英语考试命题的角度出发,分析一份试卷的效度、信度和真实性,对一线的教学工作者而言知道如何确定试卷的质量,在以后的教学中会有很重要的应用价值。
【关键词】英语测试效度信度真实性【中图分类号】G718.5 【文献标识码】A 【文章编号】2095-3089(2014)01-0096-01如何评判一份试卷的质量?如何测试各种语言技能和如何设计各种测试题目?我们知道一套试卷最终设计好了之后,我们更应该知道它的质量如何?也就是它是否符合语言测试的要求?所以,需要对试卷质量进行评估,评估的主要标准是什么?一般就是它的效度、信度和真实性。
下面分别讨论之。
1.效度效度,又称有效性。
它是指一套测试卷所考的是否就是设计人所要考的内容,或者说,在多大程度上考了想要考的。
所以,效度的高低是衡量一套语言测试卷最重要的指标,它是语言测试的出发点,是基点,因为一项效度很低的语言测试是没有实际意义的。
例如,测试听力的考试中出现了写作,这种测试效度是很低的。
例如,Is photography an art or science?这种题目效度很低,因它似乎是对有摄影知识的学生才起作用,对摄影一无所知的学生而言根本测不出他们的写作能力。
所以,这个题目对后者而言效度很低,因为我们要测的是他们的写作能力而不是摄影知识能力。
需要指出的是,语言测试的效度是一个相对概念。
例如,把剑桥商务英语证书考试来测试非英语专业的学生英语水平效度就很低。
2.信度信度是指考试结果的可靠性和稳定性,它通常以两次考试结果相关系数来表示,系数越高,信度也就越高。
影响信度的因素很多,主要有外部环境和个人因素,同时试卷的量是否足够大,区分度是否高,难易度是否适中,评分是否客观等因素也影响着信度。
国内英语测试信度与效度研究述评
U ie st ,Gu nv ri y …n ,Gu g i 4 0 4,Ch R an x 5 1 0 ia)
Ab ta t Th sp p r r ve o si t d f t e r l b l y a d v l iy o g i h t s v r s r c : i a e e iws d me t s u y o h ei i t n a i t fEn l e to e c a i d s
.
r s a c r o os d e e r h a e pr p e .
Ke r s En ih t s ;t s e i b lt y wo d : gls e t e tr la iiy; t s a i iy e t v ld t
一
、
引
信度 、 效度 和可行 性是语 言测 试 的三个 根本 问题 , 中效度 最 为重 要 , 其 因为效 度 是语 言 测 试 的基本 出发点 ( 惠 中 ,9 8 5 ) 杨 1 9 :5 。信 度则是 效度 的前提 条件 。信度 (ei it ) 指测 试分 数 的稳 定性 和 一致性 程 度 , rI bly 是 a i 它所
l iy a d r l b l y o g ih t s e eo s s e d l n t e p s y a s o ih t e s u y i i t n e i i t f En l e td v l p t a i i h a t 1 e r , f wh c h t d n d a i s y 1
关 键 词 : 英 语 测 试 ; 试 信 度 ; 试 效 度 测 测
大学英语成绩测试中的信度和效度
等因素 , 只是收集手头 现成 的试 题 , 把一些 无任何 价值 、 又
不相干的题堆积起来 , 测试 内容 则过多 地重视 英语知 识点 的测试 而不是英语 自身 , 准化测试 题 型成为英 语试题 库 标 中的主要测试形 式。试卷 的老套和模式的僵化 只能 检测学 生的语 言知识点 , 而无 法检测 学生运 用语 言的能力 。这 种 传统的设计 测试 卷的方法对教学和学习效果能否提供 公正
试成绩与真实水平 相一致 的程度 。信度受测试 环境 、 劳 、 疲
焦虑等因素的影响 , 与语 言能 力无关 。而这些 影响 因素越 小, 测试的信度就越大。 考试信度的大小说 明考试 的可靠
程度。我们可 以用信度 系数 , 即表 明信度 的大小统计量 , 来 表示信度的大小 。信度 系数越 大 , 明测 量 的可信程度 就 表 越大。信度系数 的最大值 为 1 。效度 是指大学 英语成绩 测
性, 保证较 高的评分者信度 。
第二 , 再测信度指 同一个被 测试 卷先后 两次测验 成绩 所得结果的一致 性程 度。再测信度主要测量所测结 果短期
内不会随着时间的推移而 改变 , 保持一 定的稳定 性和一致
性 。再测信度 的高低 与测量时 间的间隔有密切关 系。时间
间隔越 长 , 信度越低 ; 反之 , 时间间隔越 短 , 信度就越高 。所 以, 再测信度适合于速度测量 。 第三 , 复本信度 指被测试 卷在 两个 等级测 验上成绩 的
量工具在多 大程度 上反 映 了我们 想要 测量 内容的 真实 含 义 。效度有两 层含 义 : 一是 考试 内容 ; 二是 考试 测 出的 程 度 。效度是针对 测试 目的 、 测量结 果 而言 的。效度 是最 大
试论高职英语测试中信度与效度的平衡
力, 旨在 通 过 题 目测 试 考 生 对 四 级 大 纲 范 围 内 的词 汇 、 组 、 词 句 型 、 法 、 用 法 等 知 识 点 的掌 握 情 况 。要 准 确 翻译 除 了掌 语 惯 握 和 应 用 所学 的英 语 知 识 外 , 更重 要 的 是要 学会 分 析 , 于发 善 现 考 点 。通 过 对 上 面7 道历 年 四级 真 题 的 分 析 , 难 看 出 : 拟 不 虚 语 气 是 近 几 午大 学 英 语 四级 考 试 的一 个 必 考 知 识 点 。针 对 这
原形” 的结 构 。so l在 此 为 助 动词 , 身 无 实 际 意 义 , 以省 hu d 本 可 略 . 种 主 语 从 句 由连 词 ta  ̄ 导 . 用 于 句 型 “ts a +m. 这 ht I 常 Iiw s i / pr n av al i eai ,t. a…” , 如 : sipr n ot f di bemprt eech t 中 例 a s / v t Ii m o at t t ta h s o l )w r ad 或 是 用 于 “ts a + d i drq et h t e( ud okh r . h I i w s a vs / u s / e e . e/ get ,t.a…” 中 。 由此 可 以 看 出 在 样 题 E中 。 ds gs d e t t u e ch Ii ts sget 后 面 的 主 语 从 句 的谓 语 动 词 形 式 必 须 用 “sol) ugs d e (hud + 动 词 原 形 ” “ 装 ” 以 用 f , s l “ 窗 户 旁 ” 以用 介 词 。 ;安 可 i i tl 在 x na, 可 b ,e r 者 b s e 因 此 翻 译 为 : u g s d ta tear y na或 ei 。 d I i s g et t h i ts e h
大学英语网络测试的信度与效度分析
2 测试 的信 度
有关结构 效度的定义 . 很多 的研究学者给出了比较复杂且相对不 同的定 义。 首先 A i d e r s o n , e t a 1 . ( 1 9 9 5 ) 将结构效度看作是“ 测试能够在何 种程度 上检测 出某种特性或性质” 。 所 谓的构成效度 。 并不是一个具体 的东西 , 而是一个抽象 的心理学概念。 它所测试 出的这种特性 . 是经过 多次实际考试 . 综合分析考试结果与预测结果之后所得 出的 效度 的概念 曾经一度被划分为许多详细的分 支 . 现在有有 被众 多 学者的研究 主流又转变为将其进 行统一 。本文之前 所提到 的 . A P A 、 A E R A和 N C M E联合委员会的定义“ V a l i d i t y i s a u n i t a r y e o n c e p t . ” 换句 话说 . 诸 多被 细分 的效度概念我们可以用一个结构效度来统一联 系起 来。 3 _ 3 效度 的验证 目前, 不 同学者对结构效度的验证方法有着不 同的见解 比如 . L . J . C r o n b a c h 和P . E . M e e h l 提 出了五种验证方法 . 即分组区分法( g r o u p d i f f e r e n c e s ) 、 相 关矩 阵 与 因素 分 析法 ( e o r r e l a t i o n ma t r i c e s a n d f a c t o r a n l a y s i s ) 、 内部 结构研 究 ( s t u d i e s o f i n t e r n a l s t ue r t u r e ) 、 不 同场合 下 的 变 化研 究 ( s t u d i e s o f c h a n g e o v e r o c c a s i o n s ) 、 过 程研 究 ( s t u d i e s o f p r o .
基于TEM4听力测试标准的英语专业期末听力测试信度和效度分析——
右、 语速 为每 分钟 1 2 0个 单词 的录音 材料 , 错误 率不超 需 要被考查 的内容 , 考试的结果能不 能用来 评判预定 要
过8 %。与此对 应 的 T E M 4听力 测试结构 包括听 写和听 测试的语言能力 。作 为评 价测试 的另外一个重要标 准 ,
力理解 两个方 面 , 听写就是 《 大纲 ) ) E部分 的具 体表现形 它所反应 的是 测试 与测试 目标之 间 的一 种相关 性 即关
第 . 晶
o u r n a l 太 o f 原 T 城 a i y 市 u a 职 n 业 U r 技 b a n 术 V 学 o c 院 a i t 学 o n 报 a l C
总 4 听力测试标准的英语专业期末听力测试信度和效度分析
测试信度和效度
语专业 学生 的语 言基础 知识 , 以评估学 生 的英语综 合技 能 的国家级水平测试 。根据《 高等学校 英语专业英语 教
1 . 测试 信 度
测试信度 ( t e s t r e l i a b i l i t y ) 是指 考试结果 的可信 度或
学 大纲》 ( 下文 中简称《 大纲 》 , 2 0 0 0 ) 的规 定 , 它对 高校英 者说 可靠 度 。邹 申 ( 2 0 0 5 )把 它定 义为 考分 的一 致性 语 专业 的学生在 不 同阶段应 达 到的英语 水平 提 出了具 ( c o n s i s t e n c y o f t e s t s c o r e s ) 。信度通 常是评价测试 的其 中
语专业学 生的英语听力教学就 有很重要 的指 导作用 , 那 队与他人之间 的对话 等 , 如果测试结果 显示这套试 题确
么如何 正确利 用它 的指 导作用 是值 得英语 教师 们研讨 实 测 出了学生在 规定方 面 的能力 , 从理论 上来说 , 这 套
大学英语测试中多项选择词汇题和阅读选词填空信度、效度比较
词汇是语 言的重要 要素 , 词汇测试是语 言测试 的重要 组成部
分, 大部分标准测试 中都有词汇项 目。通过何种词汇测试形式 有 效地 衡量 学生 的词汇水 平是 测试设 计者必 须仔 细考虑 的 问题 。
试 最流行 的题型是 “ 四选一” 多项选择 。在 题 目下提供几个答案 ,
Байду номын сангаас
项 选择词汇题 由于难 易度 合适 , 区分度 良好 , 与其它题型得 分相 关性 显著 , 因此表 现出较高 的信 度。相 比而言 , 阅读 选词填空 难
度 系数较高 , 响了此 题的 区分 度和相关 系数 , 影 因此 信度系数 要
大学英语词汇测试 主要有两种题 型 : 多项选择题 和阅读选词填 空
的平均分 ) 的相关 系数 为 06 , . 而阅读选词 填空 与总成绩 的相 关 5 系数只有 0 , 过计算答对 率获得 的难度 系数值分别 为 : 31通 多项 选择词 汇题 ,.1阅读选 词填空 , . 。双列相关 系数计算 得出 0 ; 7 03 3 的数据表明多项选择词汇题 中有 1 道题 ( 2 题 ) 共 0 区分度未达标 ,
分 布数 据 ; ④此 次试题 与 以往 试题相 比的等值数 据等 ( 筱菊 , 李
3 ) 7。
率普遍较低 , 这直接导致 了该题型信度不高 。
3 多项选择词汇题和 阅读选词填空效度 比较
测试 的效度是指考试在 多大程度上 测出预期 要测量的东西 ,
或者说考试在多 大程度上完成 了预期 的测量 任务 , 到了预期测 达
对大学英语机辅口语测试任务的信度及效度研究
信度 是指测试的稳定性。效度是指根据测试成绩得 出的 具体推断是否合理 ,有意义,有作用。信度和效度有密切 的 关系 ,但又不能混淆起来。只有信度较 高的测试才能有较 高 的效度 ,但是,效度较高不能保证信度 也一定较高。可以这 样说 ,信度和效度 的关系是单方面的。信度差则效度差,但 效度差不一定信度差 。因此可以得 出结论:只有机辅 口试具 有 高信 度 ,才能为它 的高 效度提 供保障 。
() 分 信 度 3评
中国 观代 装 备
为难度最大 的,其他 数值居 中。
() 构 效 度 2结
旨先 ,评分信度取 决于评分标准。评分标准 是否具体 , 准确,便 于操作,直接决定 了评分的信度 。此次测试 评分采
用 百 分 制 ,第 一题 2 分 , 第 二 题 5 分 , 第 三 题 3 分 ,满 分 0 0 0
或背诵,②复述故事,③看图说话或看短片 回答问题 ,④给
定题 目进行即席讲话,⑤双人对话或小组讨论 ,等等。前两
个任务主要考查学生的语音语调,任务③④重 点测试学生 的
连 贯 表达 能力 ,最 后一 个 任 务 交 际性 最 强 , 可测 试 出 学 生根
据情景作出适 当反应的能力 。在此次我校进行的测试中采用 了三种题型① 自命题演讲 ,②给定题 目进行即席讲话,③双 人对 话,分别测试学生上述三方面 的口语能力 。
掌握 得很好 。三个部分的试题从易到难呈梯形递增,而且从
学 生 成 绩 的 分布 也 体 现 了 区分 度 。
() 2 施测信度 所谓施测信度 ,是指测试 的准备形式和测试过程 是否具 有可靠性。在这方面,机辅 口试具有很高的信度。该测试在 统一时间进行 ,学生在语言实验室同时考 同一套题 ,同时录 音 ,保证了测试 的公平与保密 。机辅 口语测试统一预先录音 提 问,发音标准清晰 ,音量速度适中 ,问题在屏幕上同时出
大学英语四、六级计算机口语测试效度、信度和可操作性研究
大学英语四、六级计算机口语测试效度、信度和可操作性研究一、本文概述随着全球化进程的加速,英语作为国际交流的主要语言,其重要性日益凸显。
大学英语六级考试作为中国规模最大的英语水平考试,其口语测试部分对于评估学生的英语口语能力至关重要。
本文旨在深入研究大学英语六级计算机口语测试的效度、信度和可操作性,以期为提高该测试的科学性和公正性提供理论支持和实践指导。
本文将阐述计算机口语测试的基本原理和优势,包括其与传统口语测试的区别以及其在评估英语口语能力方面的独特作用。
本文将重点分析大学英语六级计算机口语测试的效度,即测试内容是否能够真实、准确地反映考生的英语口语能力。
为此,我们将通过对比分析不同测试方法的结果,评估测试内容与真实语境的契合度以及测试分数的预测能力。
本文还将关注大学英语六级计算机口语测试的信度,即测试结果的稳定性和可靠性。
我们将通过统计分析大量考生的测试数据,评估测试分数的内部一致性、重测信度以及评分者信度,以揭示测试结果的稳定性和可靠性。
本文将探讨大学英语六级计算机口语测试的可操作性,即测试实施的便捷性和实用性。
我们将从测试设计、测试过程、评分方法等方面分析测试的可操作性,并提出改进建议,以期提高测试的效率和公平性。
本文旨在全面、系统地研究大学英语六级计算机口语测试的效度、信度和可操作性,以期为提高该测试的科学性和公正性提供有益参考。
二、文献综述近年来,随着语言测试理论的发展以及计算机技术的广泛应用,计算机口语测试逐渐成为语言评估领域的研究热点。
特别是针对大学英语六级考试的计算机口语测试,其效度、信度和可操作性成为了众多学者关注的焦点。
在效度研究方面,学者们普遍认为计算机口语测试能够较为全面地评估考生的口语能力。
通过对比传统面试口语测试和计算机口语测试的结果,一些研究发现两者之间存在较高的相关性,表明计算机口语测试在评估考生口语水平方面具有较高的效度。
同时,计算机口语测试还能够通过提供标准化的测试环境和评分标准,减少测试过程中的人为因素干扰,提高评估的公正性和客观性。
英语口语测试的信度和效度研究
键 , 指我们 把一 项 测试 成 绩 作 为要 测 试 的能力 是
或结 构 的指示 物对 它所 能进行 解释 的程 度 。结 构
表性 ; 比如 , 再 尽量 使试 卷 的评 分客 观一些 。评分
效度 是一个 动态 的过程 , 根据 测 试 成 绩所 作 的解 释永 远不 能说是 绝 对 有效 的 , 只 是 一个 相 对 的 它 概念 。讨论 测试 效度必 须 与具体 的测试 目的相结 合, 否则是 没有 意义 的 。对 于某些 测试 理论家 , 结 构效 度是 测试 效度 的一 种形 式 , 实 质 上是 评 定 它 测试 在 多大程 度上有 效地 基于其 基础理 论 , , 即 测
这种困境, 于测试有效性是相对而非绝对的。 在
不一 致性 的不 利 因素 控 制 在最 低 程 度 , 以便 于提 高测 试 信 度 。信 度 主 要 是 看 学 生 的分 数 是 否 稳
定, 如果 分数 忽高忽 低 , 就说 明信度不 高 。信度是
受许 多 因素影 响 的 , 比如测 试 的时 间 、 境 、 生 环 学 的健康 状况 、 题 目的理 解 等 等 。例 如不 同 的环 对 境 对 听力测试 的影 响是 很 大 的 , 些 靠 近喧 闹街 那 道教 室里 的学生 是很难 将注 意力 放在 听力材料 上
可靠则 要看 评分 标准 是否 客观 、 准确 , 评分 过程是
否一 致 。测试 效度 可通过 对学 生进行 访谈 或 问卷 调查 的方 式 , 了解 他 们 对 测 试 的态 度 、 映 和感 反
条件 : 度 与 效 度 。B c ma [ ( 9 6 把 信 度 定 信 a h n3 1 9 )
手 段 。而 口语 测试 的信 度与 效度 的把握 则是 测试
信度和效度名词解释
信度和效度名词解释一、信度1. 定义- 信度是指测验结果的一致性、稳定性及可靠性。
一般多以内部一致性来加以表示该测验信度的高低。
信度系数愈高即表示该测验的结果愈一致、稳定与可靠。
例如,用同一个量表对同一组被试在不同时间进行测量,如果每次测量结果都很相近,就说明这个量表的信度较高。
2. 信度的类型- 重测信度:用同一种测验,对同一组被试者,前后施测两次,再根据被试者两次测验分数计算其相关系数,即得重测信度。
它反映了测验跨时间的稳定性。
例如,在一个月内,对同一批学生使用相同的智力测验进行两次测试,两次测试结果的相关性就是重测信度。
- 复本信度:复本是内容、形式、难度等方面与原测验相似的测验。
复本信度是根据一组被试者接受两个复本测验的得分计算的相关系数。
有A、B两套英语水平测试题,它们在题型、难度等方面相似,对同一组学生先进行A卷测试,过一段时间再进行B卷测试,然后计算两次成绩的相关系数就是复本信度。
- 内部一致性信度:主要反映的是测验内部题目之间的关系,表示测验能够测量相同内容或特质的程度。
例如,在一个包含多个项目的人格测验中,内部一致性信度高意味着各个项目之间测量的是人格的同一个方面,常用的计算方法有克伦巴赫α系数等。
- 评分者信度:用于衡量不同评分者对同一组被试评分的一致性程度。
在一些主观性较强的测验中,如作文评分、面试评分等,评分者信度就非常重要。
如果不同评分者对同一篇作文或同一个面试者的评分比较接近,那么评分者信度就较高。
3. 影响信度的因素- 被试样本:被试样本的同质性(相似性)程度会影响信度。
如果被试样本的同质性高,信度可能会较低,因为他们在测验所测特质上的差异较小;反之,异质性高的被试样本可能会使信度较高。
例如,在一个只针对高智商学生的智力测验中,由于学生的智商都比较高且接近,可能会导致信度系数较低。
- 测验长度:一般来说,测验的题目数量越多,信度越高。
因为较长的测验能够更全面地测量被试的特质,减少随机误差的影响。
浅论校内英语测试的信度和效度
、
信度 ( lb i) 效 度 (ait) r i iy ̄ ea l t v li dy
信 度 与 效度 原 是 计量 学 中 的 两 个 重 要概 念 .是 在上 世 纪 3 0年代 被 引入 语 言 测 试领 域 。上 世 纪 6 0年 代 .对 这 两个 概 念 . L d 等 为代 表 的结 构主 义 测 试 学 家进 行 了 系统 的 阐述 以 a0
“ 响 ” 不 同 的称 谓 , “ x i p c ”D vd B k r 1 9 ) 影 有 如 t t m a t( a i a e , 9 1 、 e
“
度。 根据 结 构 主 义 测试 学 家 的 传统 解 释 . 言 测 试 的 效度 是 指 语 测 试 是 否 考 了 它 所 要 考 的 测 试 效 度 有 五 种 :结 构 效 度 ( nt c vl i ) 内 容 效 度 ( netvl i ) 同 期 效 度 c s ut ai t 、 o r dy c t a dt 、 o n i y
d (z fsm l  ̄ 区 分 度 ( sr n tn等 。语 言 测 试 的 效 X i o a pe se ) d ci a o1 i mi i
度 表 明 一种 相 关 性 ( lv n e ,即测 试 与 测 斌 目标 的 关 联 程 r eac) e
的环节. 在语 言 教 学 中处 于 重要 的地 位 。 为教 学 提 供 目标 并 它 为 教 师和 学 生 成功 地 实现 这 些 目标 提 供 现实 依 据 语 言测 试 影 响 教学 . 在 教 学界 似 乎 已经 成 为 大 家 的 共 识 。 种 所谓 的 这 这
面的。 在教 学 上 , 它会 导 致 应试 教育 。 导致 学生 高 分 低 能 。 心 在 理上 . 会 使 学生 产 生 焦虑 感 。 它 但也 有 人 认 为 它会 促 进 学 生 语 言水 平 的 提 高(oee l19) N lnt ,9 2。设 计 良好 的教 学 测 试 会 给 教 a 学带来裨益. 产生 正 反拨 作 用 , 设 计 不 当的 则 给 正常 教 学带 而 来 负 面 影 响 。 至 冲 击 正常 教 学 。 因此 , 测 语 言测 试 成 功 与 甚 检 否 就 要看 它对 教学 产 生 什 么样 的影 响 本 文 拟从 语 言 测 试 质 量 的信 度 和 效 度 的 角 度 来 讨 论 大 学 校 内 英 语 测 试 存 在 的 问 题 . 提 出一 些 改 进 的方 法 。 望 能 起 到抛 砖 引玉 的 作 用 。 并 希
大学英语校内测试信度、效度分析
几个 方 面 : 速 阅读 , 力 理 解 , 细 阅读 ,词 汇 与 结 构 , 型填 快 听 仔 完
空, 翻译 , 词形 转 换 和作 文 。 历年 统 计 结 果 显 示 , 有 题 型 中 , 所 听
力 , 细阅读 . 仔 和词 汇 与 结 构 区分 度 良好 , 易 度 合 适 , 且 都 呈 难 而 正 态 分 布 。 完 型 填 空 ,翻 译 和 作 文 历 年 来 得 分 率 仅 在 5 %一 2
主 观题 的 评 分 采 用 集 体 评 阅 , 一 细 化 评 分 标 , 水 作 业 , 统 流 以 提高 评 分 的信 度 。 ( ) 了 确 保试 题 在 难 度 、 分 度 等 方 面 的稳 5为 区 定 性 , 证 考 试 的客 观 公 , 校 正 努 力 实施 教考 分离 , 立 大 保 学 建
\ 倍度指标 试题分 、 测试时 \ 相 天系数 卜 f 度 系数 () a 足甭 l } 态分佰 难度 系数 分度不达 标题 目数
5 %, 形 转 换 更 低 , 分 率 仅 为 4 %一 5 % , 明试 题 偏 难 , 7 蒯 得 2 3 说 正
态 分 l 据 表 明 , 型 、 译 和词 形 转 换 多呈 非 正态 分 布 。 反 , 布数 完 翻 相
套 形 式 、 容 与 原 试 题 平 行 的 试 卷 , 同 样 的 学 生 在 连 续 的 时 间 内 让
差 . 分 率 , 目区 分 度 , 易 度 , 数分 布情 况 等 , 得 题 难 分 而且 要 详 细
分析 学 生 的 弱 项 . 提 改 进 意 见 , 包括 教学 和 命 题 两方 面 。 4 对 ()
中 图分 类 号 :G 4 62
论英语语言测试的信度和效度
论英语语言测试的信度和效度摘要:信度和效度是英语语言测试中两个比较重要的评价标准,也是衡量测试是否有效且可靠的重要因素。
信度是指测试结果的可靠性,可信性以及稳定性;效度是指语言测试的科学性和有效性,即考试达到预定目标的程度。
本文将深入探讨信度和效度的两个概念,并进一步阐述两者之间的关系。
关键词:英语语言测试;信度;效度;语言测试是一门具有语言教学的综合性科学,并运用一系列科学而又具有实践性的方法来客观评估学生的语言运用能力。
语言测试的标准包括信度,效度,真实度,区分度,实用性等。
在这些衡量标准中,信度和效度是两个非常重要的衡量维度,也是必须在英语语言测试中应用到的两个衡量标准。
信度和效度这两个概念最初于1930年引进到语言测试这个领域中的。
以Lado为代表的结构主义测试者,他系统地阐述并论证了信度和效度这两个概念,认为语言测试已经形成了一个科学体系,成为一个独立的学科。
从整体上看,语言测试在理论和实践上都偏向于信度和效度。
此外,信度和效度是评价学业测试的重要依据。
两者之间的关系是学术考试的基本问题,学术考试的最终目标是为语言教学服务。
因此,两者的作用在于是否对英语教学产生重要影响,是否能够支撑英语教学,是否能够实现教学目标,又是否能和学习的过程相契合。
语言测试不仅能够检查学生掌握知识的能力和水平,还能够发现学生学习中存在的潜在问题,并能够为教师之后的教学提供有效的指导和帮助。
鉴于此,本文将深入探讨信度和效度的两个概念,并进一步阐述两者之间的关系。
1.语言测试中的信度和效度信度又称有效性,是指测试结果的可靠性、可信性和稳定性,要求其结果不受受试群体和试题的干扰,从而反映被测试者真实的语言行为。
简而言之,测试结果应当客观真实地反映,不受其他因素影响。
如果一份英语试卷了信度,也就不能客观公正地反映被测试者的语言行为,那么这份试卷就失去了它的使用价值。
因此,同一份测试题在不同场合下测试,得到的结果在很大程度上保持一致,则该测试的信度是比较高的(冯彤,2003)。
大学英语网络测试的信度与效度分析
大学英语网络测试的信度与效度分析0 引言2008年,教育部实施大学英语四级机考试点改革。
从此,大学英语四级无论是从形式上还是从内容上都有了较大的变化。
由于整个社会对大学英语四级的认知度都比较高,而且考生只有在大学就学期间才可以参加这项考试。
因此,各个学校的大学英语教学也纷纷以大学英语四级考试为目标,制定相应的教学计划,对教学活动进行调整。
辽宁工业大学从2009年开始,进行大学英语网络测试实践以来,已经进行了23场全校范围的测试,参加人数超过了二万人次。
目前,已经形成了较为完善的测试硬件系统,和较为成熟的测试机制与体系。
基于以上背景,本文通过分析辽宁工业大学英语网络测试的实施过程与结果,考察这项测试的效度与信度,为今后大学英语教学的组织与进行,大学英语网络测试的创新与完善提供相应的依据。
1 高质量考试的标准大学英语四级考试是一项由专家团队精心打造的考试,经过多年的验证,被社会广泛认可,可以当之无愧地称作“高质量考试”。
那么,辽宁工业大学的大学英语网络测试,是否也是一项“高质量考试”呢?Bachman & Palmer将以下六大要素作为决定测试质量优劣条件,分别为信度(reliability)、效度(construct validity)、真实性(authenticity)、交互性(interactiveness)、影响性(impact)、可行性(practicality)。
所谓真实性,是指考生在测试过程中能够正确解答某个问题,是否等于其在实际场合下也具备与之相对应的能力。
所谓交互性,是指考生在完成测试任务过程中个人特征的参与程度和形式。
所谓影响性,是指测试对于这个社会、教育制度、或是此项制度中的个人所造成的影响,同时还包括测试的波及效应(washback effect)。
最后的可行性与前面几项要素不同,它包括测试以何种方式实施、甚至于最初的测试能否能够实施的问题。
但是,正如Bachman & Palmer所说,决定测试质量的最主要因素应属信度和效度。
信度和效度在大学英语成绩测试中的作用
张利萍’ , 但冰 洁 , 汪 洁。 , 曾 华
( 1 . 2 . 贵州师范大学 大学外语教学部 , 贵州 贵州 阳职业技术学院 基础部 , 贵州 贵阳 5 5 0 0 0 8 )
摘 要: 成绩测试 ( A c h i e v e m e n t T e s t ) 是 大学英语 教 学 中不 可缺 少的重要环 节 , 是 评价 学生学期 学 习成 绩和教 师教 学效
5 5 0 0 0 1 ; 3 . 贵阳中医学院 大学外 语教学部 , 贵州 贵 阳 5 5 0 0 0 2 ; 4 . 贵
果的有效手段 。而信度和效度则是评估成绩测试 的两个最为 可靠的质量指标 , 但 两者在本质 上互相 冲突。为 了保证 成 绩测试的总效 用达到最 大化 , 我们要在 构成试卷 时力 求在信度 和效度之 间寻找 最佳的平衡 点 , 以构建科 学而合理 的大学
m a k e u p a s c i e n t i i f c a n d r e so a n bl a e a c h i e v e m e n t t e s t p a p e r o f c o l l e g e E n l g i s h .
ห้องสมุดไป่ตู้
Z H A N G L i - p i n g , D AN B i n g - j i e , WA N G — J i e , Z E N G Hu a 4
( 1 . 2 .I n s i t t u t e o f F o r e i g n L a n g u a g e s E d u c a t i o n , f G u i z h o u N o r ma l U n i v e r s i t y , G u i y a n g 5 5 0 0 0 1 ,C h i n a ;
《大学体验英语听说自主学习系统》 测试平台信度及效度分析
《大学体验英语听说自主学习系统》测试平台信度及效度分析刘英;张伟明【摘要】运用SPSS软件,从数据统计学角度分析了<大学体验英语听说自主学习系统>测试平台的信度与效度.研究分析表明:(1)信度值为(0.758),达到了可接受的信度值(0.7);(2)效度方面,试卷的结构合理,口语部分考查了学生的口语表达能力及反应能力.听力郜分考查了学生的听力理解能力及学生的瞬间反应能力.鉴于该份试卷作为听说自主训练的一个考查试卷,认为其信度已经达到了一个理想值,且结构效度合理.【期刊名称】《韶关学院学报》【年(卷),期】2010(031)004【总页数】5页(P153-157)【关键词】《大学体验英语听说自主学习系统);测试;信度;效度【作者】刘英;张伟明【作者单位】韶关学院外语学院,广东韶关512005;广东电视大学外语系,广东广州510091【正文语种】中文【中图分类】H3192007年修订的《大学英语课程教学要求》明确指出:“大学英语的教学目标是培养学生的英语综合应用能力,特别是听说能力,使他们在今后学习、工作和社会交往中能用英语有效地进行交际,同时增强其自主学习能力……”[1]为培养学生的听说能力,给他们创造自主学习的条件,我校建立了大学英语听说自主学习体验中心,选用了高等教育出版社《大学体验英语听说自主学习系统》软件以及其测试软件,《大学体验英语听说自主学习系统》测试平台2008年1月投入使用。
为了解大学英语听说自主学习体验中心在培养学生听说能力方面的情况,我校每学期都利用大学英语视听说测试软件系统对学生进行测试。
以2008级学生的期终测试成绩为测评依据,对《大学体验英语听说系统》测试平台进行了信度、效度分析,并就该平台的可信度以及有效度进行了合理的评估。
测试是教学过程的一个有机组成部分,也是有效学习的一个保障系统[2]。
随着计算机辅助语言教学软件的深入发展,语言测试平台也成为研究的热点。
大学英语专业-简明英语测试教程-重点
考试信度:考分的一致性。
考试效度:考试达到其预期测试意图的程度。
直接考试:学生被要求直接运用被试的技能或能力。
间接考试:测试那些相关技能、以达到评估能力的目的。
诊断考试:此类考试旨在了解学生在某个阶段中学习上的长处与短处,其最终目的是为了给教师提供教学效果或质量方面的信息。
整体评分法:把作文视作一完整的篇章,根据对其总体印象打分。
原始分数:未经处理或未加权重的分数。
考试:用来获取某些行为的方法,其目的是从这些行为中推断出个人具有的某些特征。
交互性:指在考试所设计的任务中学生的参与程度。
1.根据考试的方式,考试的分类:1直接考试(①侧重考试形式的真实性②便于从总体上考查产出性技能,如口语能力、写作能力、翻译能力等③从命题人员的角度出发,直接考试具有比较明确的测试目标)2间接考试(①不强调考试形式上的真实性,即考试形式无需与实际语用环境相一致②由于不受语用环境的限制,所选择测试的技能可以更具有代表性和概括性③间接考试可选用多项选择题型,可以提高考试信度。
)2.常用的口试形式及特点:①朗读:学生事先在规定时间里浏览朗读材料,然后朗读。
材料的长度视考试难度或学生水平而定,可以是单句,也可以是段落。
但是,朗读作为口试形式只测试学生的语音语调等,无法检查整体口语能力。
②看图说话:给学生一幅或多幅图片,让他们描绘或叙述图中所发生的事件。
③简短说话:是一种弹性口试形式,即在难度上有伸缩性,可以是一个三言两语的形式,也可以是一个时间较长的形式。
④对话:在一个假设情景中进行,学生之间或学生与考官之间根据情景要求进行对话。
对话者既要运用一些常用会话技能,同时还要运用解决沟通问题的技能。
⑤小组讨论:学生们就一个话题展开交流,一般控制在三四个人左右。
⑥面试型口试:基本上采取问答形式,但又不同于简单的一问一答形式。
考官通过各种提问技巧,从多个层面来观察学生的口语能力。
3.如何评阅作文,特点?⑴整体评分法①节省评阅时间②阅卷人员注重作文的整体质量③它的问题主要表现在阅卷人员对标准的理解和掌握上,以及所定档次标准瑜现实作文之间的吻合性。
大学英语成就测试信度效度研究
大学英语成就测试信度效度研究王艺玮;王晓军【期刊名称】《海外英语(上)》【年(卷),期】2013(000)011【摘要】就大学英语成就测试存在的质量问题,依据当代语言测试相关理论,对宁夏大学物理电气信息专业2011级学生期末试卷进行统计分析,通过与相关理论标准对照,发现试卷总体质量良好,试题区分度方面存在一些问题。
这些问题应引起高校英语老师的关注,以便使试卷得到改进从而保证高校英语成就测试的客观与公正。
%To investigate the quality of college English achievement test, this article makes an analysis of achievement tests of 2011 grades students who are majoring in the School of Circuits and Systems in Ningxia University with reference to modern testing theory and associate criteria. And this article finds out that the overall quality of this achievement test is good but the item discrimination exist some quality problems. Highly attention from teachers and developers should be paid in order to improve the test quality and guarantee the objectiveness and fairness of college English achievement test.【总页数】2页(P44-45)【作者】王艺玮;王晓军【作者单位】宁夏大学外国语学院,宁夏银川750021;宁夏大学外国语学院,宁夏银川750021【正文语种】中文【中图分类】H0【相关文献】1.西北少数民族地区成就测试信度效度研究 [J], 王晓军2.对大学英语机辅口语测试任务的信度及效度研究 [J], 李琳3.浅析加强大学英语测试中信度和效度研究的必要性 [J], 李兰兰4.大学英语测试中信度和效度的个案研究--以吕梁学院为例 [J], 樊红红5.大学英语成就测试信度效度研究 [J], 王艺玮;王晓军因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大学专业英语的测试信度与效度研究Reliability & Validation Study of College Specialized English重庆大学外语学院黄萍副教授Huang Ping College of Foreign Languages, Chongqing University 400044[摘要]全国大学英语四、六级考委会立项的科研项目“大学英语专业阅读阶段完成之后的测试方式及构卷研究”是对大学专业英语能否进行统一测试的研究。
本文从一套诊断性大学专业英语试题入手,从333个学生的答题分数与其四级考试分数、专业英语期末考试成绩相对比,对该套大学专业英语测试题的信度与效度进行了分析与研究,并从学生的反馈中得出结论:大学专业英语统一测试是必要的,也是可行的。
[Abstract] The research project “The Testing Method and Structure of College Specialized English after Reading Period” sponsored by the National College English CET 4&6 Committee is to study the feasibility of the College Specialized English Test in China. This thesis analyzed the results from 333 students who had a diagnosed test and studied the reliability and validation through comparing with the students’ CET 4 test scores and the specialized English achievement test scores. From the students’ feedback we can conclude that the College Specialized English is feasible and essential.[关键词] 可行性,信度,效度,方差,统计学[Key Words] feasibility, reliability, validation, SD, statistics1998年6月,由全国大学英语四、六级考委会立项,重庆大学外语学院承接了科研项目“大学英语专业阅读阶段完成之后的测试方式及构卷研究”。
项目研究的目的是对大学专业英语进行统一测试的可行性进行研究,其具体过程是通过对西南地区各高校大学专业英语的现状调查,对专业英语测试的内容、方式及构卷进行诊断性测试,为大学英语能进行统一地专业英语测试提出可行性方案,并为大学专业英语测试最终能进行全国统一测试奠定基础,对统一考试可能出现的问题和困难提出意见及可能解决的办法,以进一步推动大学专业英语测试的尽快实施,并对提高专业英语考试的效度与信度,使考试更具有合理性和科学性提出建设性的意见。
一.大学专业英语测试研究目的本研究由大学英语考委会立项,在重庆大学外语学院以及国家级专家韩其顺教授的指导下进行的。
目的在于探讨专业英语统一测试是否可行,会存在哪些问题,是否有解决办法,其效度与信度怎样,测试的内容与方法与效度和信度的关系,构卷的方法与研究等。
研究是基于《大学英语教学大纲》中对专业英语阶段的要求来进行的,因此,专业英语测试的内容与构卷也严格围绕着大纲的要求制定。
鉴于大学专业英语测试的目的是为了检查对教学大纲的执行情况,因此,测试内容力求反映大纲的要求。
我们认为,大学英语专业英语测试与大学四、六级考试的测试重点是截然不同的,大学英语专业英语测试应着眼于语言的运用(use),而不是在于语言的习惯(usage)。
语言学家认为语言内容的测试是从语言的交际需要中分离出来的。
本考试的目的是为了促进培养既懂专业又懂英语的技术人才,使他们进入社会后能用英语作为工具和手段,满足自己工作的需要。
因此,与CET-BAND4不同,它强调的不是学习者语言习惯的形式的准确性,而是通过具有意义的语言实践掌握语言习惯的模式,即它所强调的是语言的适切性(appropriacy)。
二.大学专业英语测试信度与效度课题小组在国家级专家韩其顺教授的指导下,设计了专业英语诊断性(Diagnose )试题。
2000年4月16日,我们在重庆大学对400多个学生(有效试卷333份)近十个专业的学生进行了试测。
为了有效地对该试题进行分析,我们让被试学生在答题纸上写上了四级通过分数,并在考试完成后对学生就本次考试进行了问卷回答。
以下是我们对受试者答卷进行的统计分析。
从考试结果来看,受试者成绩频数分布曲线图如下:1020304050600~25~30~35~40~45~50~55~60~65~70~分数段频数图1 专业英语测试成绩分布曲线图所有受试总分分布情况是否呈正态分布呢?检验其偏态值SK , 结果为-0.27; 检验其峰值Kurt , 结果为-0.001。
从成绩分布曲线图上来看,虽然出现一个小双峰形态,但双峰紧邻平均数大致呈对称分布。
由此可以认为,本次专业英语测试总分基本呈正态分布。
根据测试结果,进行了内部一致性信度计算。
我们采取了较为实用的信度计算方法,没有采用再测信度、等值测试信度。
本测试包含了若干客观和半客观性命题,不能采用分半信度计算方法和库德-理查逊公式法进行计算,因而采用克龙巴赫所创造的α 系数公式。
该公式为:α = SS Ti K K 221(1∑--)其中, α为信度系数;K 为题目数;Si2为各题各被试得分的方差; ST2为各被试所得总分的方差。
表1 专业英语测试信度与效度分析(注:*表示在0。
05水平上相关,**表示在0.01水平上相关)由表1可知,①从学生本次考试与国家四级成绩来比较,科技英语班r=0.389**,P< 0.05;商务英语班r=0.463****,P<0.001;说明本次考试是有效的,有很大的信度与效度。
②从学生本次考试与科技英语班学生期末考试成绩相比较(期末考试题采用由东南大学《新科技英语》教材项目组的试题),r=0.63****,P< 0.001; 学生本次考试与商务英语班期末考试成绩相比较(试题采用剑桥商务英语等级证书考试题), r=0.465****,P< 0.001,也说明本次考试是有效的,有很大的信度与效度。
③从单项比较来看,我们对商务英语班用大学英语四、六级口语考试判分(两个口语测试员为大学英语考委会正式聘用的口语测试员),所得的相关系数也很高,r=0.56****,P< 0.001。
④除科技英语班翻译与本次考试的相关性不大外,其他各单项都与本次考试是相关的,且相关性很大。
而就其科技英语班翻译与本次考试的相关性不大的原因在于,该翻译试题在一次练习中学生已做过,因此,其成绩与本次考试不相关,从另一方面可以看出,我们所研究的相关性与试题的效度与信度是很有关的。
表2. 专业英语测试信度与效度分析(*表示相关,**表极其相关)由表2可知,①从学生本次考试与国家四级成绩来比较,总的来讲,相关性是很大的, r=0.417*****,P<0.001。
表明本次考试是有效的,有很大的信度与效度。
材料专业的四级成绩与本次考试不太相关的原因是:可能是因为四级考试数据不太准确,34人考试只有27人有四级考试成绩。
②对以上五个专业的单项测试与本次考试的相关性研究来看,除了金压专业外,其他专业的听力与本次考试的相关性都很高,而金压专业只有r=0.135,P>0.2 与本次考试不太相关,我们发现,金压专业的四级成绩与本次考试也刚好相关,r=0.448*,P<0.05就其原因,学生大多数来自农村,其听力本来就不太好,而本次考试的听力又以主观性试题为主,所以,学生考试听力与本次考试不太相关,这从听力与本次考试的难度值也可以看出,听力的难度是最大的。
③对以上五个专业的相关性研究发现,专业好的学生,不管是四级成绩,还是单项测试与本次考试的相关性都很大,反之亦然。
三. 大学专业英语测试的可行性专业英语测试是属于专门用途英语领域的一门测试。
人们通常认为要使它具有较高的效度,就必须为每一个专业单独设计一套试题,这种看法虽然有一定道理,但如要为每一个专业都设计一套题的话,专业英语就很难有一个较为统一的标准,就不可能做到较大规模的专业英语测试,也就难以真正推动和促进专业英语教学。
本测试的目的就是试图在一套题中测试出各专业英语的共同性,我们这样设计的理由是,第一,专业英语的领域太广,如果要把各专业领域在测试中都能涵盖,那么,一次考试就可能包含许多专业的测试题,这样不仅仅要花太多的人力、物力,而且很难保证各专业在同一次考试中的难易度;第二,各专业英语在语言风格上有很大的不同,如法律英语与科技英语,专业术语也不同,但是,各专业在文体上是有关系的,如文摘的格式、绪论、定义、结束语的格式等,此外,语法也有其共同性,如无人称、陈述客观、准确、语言规范、文体质朴、逻辑性强等都是专业英语的共同特点;第三,教育部通过专业目录的调整后,专业划分过细的现象不存在了,大学英语教学大纲虽然要求学生通过专业英语的学习,能听、读懂本专业文献,能说、写、翻译本专业有关文献,但是,正如以上所说,各专业英语的文体都有其相同之处,我们设计出的专业英语测试题主要是检验各高校是否完成了大学英语教学大纲所要求的任务,而不是测试学生是否懂得本专业英语内容;第四,现代科学发展的一个显著特点是跨专业跨学科研究,大学毕业生毕业后也有可能从事其他专业的工作,如学文的改行学计算机,从时代发展的角度来看,专业英语测试内容完全可以测试专业英语的共同性,加强其使用性。
我们正是基于以上理由,大胆地尝试了用一套专业英语试题来测试各专业英语,以达到标准一致、评分一致以及实用性强、针对性强。
为了更好地说明我们的这套试题的可行性,请看我们对商务英语、材料、电力、工业设计、计算机、金属锻压等几个不同专业学生的测试结果来看其显著性差异:表3.专业英语测试组各对平均数之间q值与临界值比较通过方差分析,我们发现至少有一对平均数差异显著,因而进一步进行了q检验,来确定哪些对平均数的差异达到显著水平。
结果发现,97工设组与其他五组(97金压组除外)的平均数q值超过了0.05水平的临界值,其中有两对超过了0.01水平的临界值,即差异极为显著。
97工业设计专业受试组的平均数仅为37.3,与其他受试组的表面差异也比较大,检验结果也说明这一组的平均数异常,差异显著,其他各组间的平均数均无显著差异。