教育测量与评价的质量特性

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
▪ 所谓复本测验是指在性质、内容、题型、题数、 难度等方面都一致(或相等)的两份或多份测 验。
施测 连续施测或间隔施测 A型
相关系数
施测 B型
例二
▪ 以A、B两型英语复本测验对初中三年级10个
学生施测,为避免由测验施测顺序所造成的误 差,其中5个学生先做A型测验,休息15分钟后, 再做B型测验;而另5个学生先做B型测验,休 息15分钟后,再做A型测验。10个学生A型测 验结果记为X,B型测验结果记为Y,其测验的 复本信度如何?
▪ 2、两次测验之间的时间间隔要适宜。应 由测验的性质、测题类型、测题数量和 被试特点所决定;
▪ 3、重测法适用于速度测验而不适用于难 度测验;
▪ 4、应注意提高被试者的积极性。
重测信度与时间间隔
▪ 两次测量之间的间隔时间不同,重测信度也不同。 间隔时间太短,存在记忆效应;间隔时间太长,影响
测量的干扰因素增加。一般而言,时间间隔越长,信度系 数越低。 ▪ 适宜的间隔时间因测验性质、被试特点而异。
问题
▪ 一个能力测验用于人才招聘,经检验它的 信度为0.70,如何理解这个信度系数的含 义。
▪ 理解:0.70的信度系数表明,在不同的招 聘候选人之间进行比较,候选人测验分数 的70%差别是由于个体之间真实的能力差 异所导致的,而30%差别是由于随机误差 所导致。
二、信度的种类及估计方法
▪ 采用不同的方法来计算相关系数,就会得 到不同类型的信度指标:重测信度、复本 信度、分半信度、同质性信度、评分者信 度。
如:对儿童测量时间间隔相对短一些成人测量时间间 隔可以长一些。一般以2周到4周较宜,最好不超过6个月。 ▪ 报告重测信度时要明确说明两次测验之间的时间间隔,并 且,一个经过良好评估的测验应当具有多个时间间隔的重 测信度。
(二)复本信度
▪ ——指两个平等的测验测量同一批被试所得结 果的一致性程度。
▪ 其大小等于同一批被试在两个复本测验上所得 分数的相关系数。
第二章 教育测量的质量特性
▪ 衡量教育测量的质量,可采用四个指标: 信度 主要对整个测验而言。 效度
难度 主要对测验项目而言。
区分度
第一节 教育测量与评价的信度
一、什么是信度
——指测量结果的稳定性ห้องสมุดไป่ตู้可靠性程度。 ▪ 一般地说,一个好的测量必须具有较高
的信度,也就是说,一个好的测量工具, 只要遵守操作规则,其结果就不应随工 具的使用者或使用时间等方面的变化而 发生较大的变化。
▪ 学生序号 1 2 3 4 5 6 7 8 9 10 11 12
▪X
20 20 21 22 23 23 23 24 25 26 26 27
▪Y
20 21 21 20 23 23 25 25 26 26 27 29
在使用重测法计算信度值时,应注意 以下问题:
▪ 1、信度的取值范围为[0,1],当信度值 较大时,说明前后两次测量结果比较一 致;
统计学上,我们通常把对同一组被试实施的两次 等值测验的成绩的相关系数作为这一测验的信度。
r
NXY XY
r
N XY X Y
N
X X N Y 2
N X 2 2 X 2 NY 2 Y22
Y2
X:第一次测验的实得分数; Y:第二次测验的实得分数; N:被试人数。
例一
▪ 用一个算术四则的速度测验12个小学生, 得分记为X,为了考察测量结果的可靠性, 于3个月后再测一次,得分记为Y,问测验 结果是否可靠?
对信度的理解
①信度指实测值(X)和真值(T)相差的程 度;
②考察信度系数时,常常采用相关系数作为信 度指标,测验结果之间的相关程度越高,信 度就越高。采用不同的方式计算相关系数, 就得到不同类型的信度系数。
③心理测验的信度值在0-1.00之间,当信度系 数等于1.00时,表示测验完全可靠;当信度 系数等于0时,则表示测验根本不可靠。
分半信度
▪ ——将测验分半,再求被试在每一半测验上所 得分数的相关系数。
▪ 首先根据内容、形式、题数、平均数、标准差、 难度、测题间相关以及分布形态相等的原则, 将试题分成两半,或者将从易到难排列的测题, 按照测题序号,奇数测题为一组,偶数测题为 一组,分成两半;
▪ 学生序号 1 2 3 4 5 6 7 8 9 10
▪X
19 19 18 17 16 15 15 14 13 12
▪Y
20 17 18 18 17 15 13 15 12 12
复本信度的优缺点表现:
优点:
▪ 1、测验的两个复本,如果在不同的时间使用, 其信度既可以反映在不同时间的稳定性,又可 以反映对于不同测题的一致性;
▪ 2、两个复本测验有可能在某种程度上测量了 不同的性质,这就会低估测验的信度;
▪ 3、被试同时接受性质相似的两个测验,可能 减少完成测验的积极性;
▪ 4、虽然两个复本测验的题目材料不同,但被 试一旦掌握了解题的某一模式,就能触类旁通, 有可能失去复本的意义。
(三)同质性信度
同质性信度 ——也称内部一致性信度,指测验内部所有题目
▪ 五种信度的含义和计算方法各异,我们在 使用时要特别注意每一种信度的特定内涵 和适用范围。
(一)重测信度
——指同一个量表对同一组被试施测 两次所得结果的一致性程度。
▪ 其大小等于同一组被试在两次测验上所 得分数的相关系数,一般采用皮尔逊积 差相关的公式来计算。
施测
时间间隔 相关系数
再施测
重测信度的计算
之间的一致性程度。 ▪ 两层意思:
①测验所有题目测的是否为同一种心理特质; ②测验所有题目得分之间是否具有较高的正相关。
▪ 基本假设:当一个测验具有较高的同质性信度时, 说明测验主要测的是某一个单一心理特质,由于众 多题目测试了同一心理特质,那么实测结果就是该 特质水平的反映。
估计方法
▪ 分半信度(p49) ▪ 库德-理查逊信度(p50) ▪ 克龙巴赫系数(α系数,p52) ▪ 荷伊特信度(p52)
▪ 2、两个复本在同时使用时,可以避免再测信 息的一些缺点,如首测时再测在记忆、练习、 效果的影响,间隔期间获得新知识的影响,两 次施测的环境不同和被试主观状态不同的影响, 以及为了应付测验所作训练的影响等。
复本信度缺点:
▪ 1、编制两个完全相等的测验是很困难的,如 果两个复本过分相似,则变成再测形式,而过 分不相似,又使等值的条件不存在;
相关文档
最新文档