教育测量与评价测量指标
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3、折半信度(分半信度)
• 就是将测验分半,再求被试在每一半测验上所 得分数的相关系数。 • 首先根据内容、形式、题数、平均数、标准差、 难度、测题间相关以及分布形态相等的原则, 将试题分成两半,或者将从易到难排列的测题, 按照测题序号,奇数测题为一组,偶数测题为 一组,分成两半; • 然后计算每个被试在两个分半测验分数的积差 相关系数,再用斯皮尔曼—布朗公式加以校正。 • 斯皮尔曼—布朗公式为
例三
• 对初中一年级学生进行地理成绩测验,每答对1题得1分,答错1 题得0分,其测验结果如下表,试估计该测验的折半信度? • 学生序号 题 序 • 1 2 3 4 5 6 • 1 1 0 0 0 0 0 • 2 0 0 0 1 0 0 • 3 1 0 1 0 0 0 • 4 1 1 0 0 1 0 • 5 1 0 0 1 0 0 • 6 1 1 1 0 1 1 • 7 1 1 1 1 0 1 • 8 1 1 0 1 1 0 • 9 0 1 1 0 0 1 • 10 1 1 1 1 1 1
2、内容效度的估计
• (1)逻辑分析法 • 其工作思路是请有关专家对测验题目与原定内 容范围的吻合程度作出判断。 • (2)统计分析法 • 从同一个教学内容总体中抽取两套独立的平行 测验,用这两个测验来测同一批被试,求其相 关。若相关高,表明测验内容效度较高;若相 关低,表示测验的内容效度较低。 • 采用求统计量的公式进行计算,其公式有以下 三种形式:
缺点:
• 1、编制两个完全相等的测验是很困难的,如 果两个复本过分相似,则变成再测形式,而过 分不相似,又使等值的条件不存在; • 2、两个复本测验有可能在某种程度上测量了 不同的性质,这就会低估测验的信度; • 3、被试同时接受性质相似的两个测验,可能 减少完成测验的积极性; • 4、虽然两个复本测验的题目材料不同,但被 试一旦掌握了解题的某一模式,就能触类旁通, 有可能失去复本的意义。
(三)提高信度的方法
1、影响测量信度的主要因素 (1)被试方面 (2)主试方面 (3)施测情境方面 (4)测量工具方面 (5)两次施测的间隔时间方面
2、提高测量信度的常用方法
(1)适当增加测验的长度 (2)测验的难度要适中 (3)测验的内容应尽量同质 (4)测验的程序应统一 (5)测验的时间要充分 (6)测验的评分要尽量做到客观化,减少 评分误差
• 学生序号 1 2 3 4 5 6 7 8 9 10 11 12 • X 20 20 21 22 23 23 23 24 25 26 26 27 • Y 20 21 21 20 23 23 25 25 26 26 27 29
在使用重测法计算稳定性系数时,应 注意以下问题:
1、信度的取值范围为[0,1],当信度值较 大时,说明前后两次测量结果比较一致; 2、两次测验之间的时间间隔要适宜。应由 测验的性质、测题类型、测题数量和被 试特点所决定; 3、重测法适用于速度测验而不适用于难度 测验; 4、应注意提高被试者的积极性。
2、复本信度
• 指的是两个平等的测验测量同一批被试 所得结果的一致性程度。 • 其大小等于同一批被试在两个复本测验 上所得分数的相关系数。 • 所谓复本测验是指在性质、内容、题型、 题数、难度等方面都一致(或相等)的 两份或多份测验。
例二
• 以A、B两型英语复本测验对初中三年级10个 学生施测,为避免由测验施测顺序所造成的误 差,其中5个学生先做A型测验,休息15分钟后, 再做B型测验;而另5个学生先做B型测验,休 息15分钟后,再做A型测验。10个学生A型测 验结果记为X,B型测验结果记为Y,其测验的 复本信度如何?
(二)效度的估计
效度估计就是多方寻找证据来证明一个测验的有 效性程度的过程。 1、内容效度 就是指测验内容对所要测量的内容的代表性程度。 也就是说,测验的内容范围、材料与所要测量 的内容范围、教育目标是否相符合;测验中测 题所引起的行为是否是所要测量的属性的明确 反应;测验的结果是否是一个有代表性的行为 样本。 为了使测验的内容具有有效性,成为所欲测量内 容的一个具有代表性的行为样本,在编制测验 时,就要考虑建立内容效度的问题。
• 学生序号 1 2 3 4 5 6 7 8 9 10 • X 19 19 18 17 16 15 15 14 13 12 • Y 20 17 18 18 17 15 13 15 12 12
复本信度的优缺点表现:
• 优点: • 1、测验的两个复本,如果在不同的时间使用, 其信度既可以反映在不同时间的稳定性,又可 以反映对于不同测题的一致性; • 2、两个复本在同时使用时,可以避免再测信 息的一些缺点,如首测时再测在记忆、练习、 效果的影响,间隔期间获得新知识的影响,两 次施测的环境不同和被试主观状态不同的影响, 以及为了应付测验所作训练的影响等。
二、效度的概念
(一)什么是效度 效度是指测量结果的准确性和有效性的程度。也 可以说是测量是否达到了预期的目的。 1、效度是一个相对的概念。 (1)测量的效度是相对一定的测量目的而言的 (2)测量的效度是相对测量的结果而言的 2、一种测量的效度只是高或低的问题 测量结果总是有一定效度的,只是效度高低不同 罢了。
教育测量与评价
——测量的质量指标
教育测量的质量指标
衡量教育测量的质量,可采用四个指标: • 信度 主要对整个测量而言。 • 效度 • 难度 主要对测量的项目而言。 • 区分度
一、信度概述
(一)什么是信度 信度是指测量结果的稳定性或可靠性程度。 一般地说,一个好的测量必须具有较高的信度, 也就是说,一个好的测量工具,只要遵守操作 规则,其结果就不应随工具的使用者或使用时 间等方面的变化而发生较大的变化。 必须从以下两个方面去理解测量的信度: 信度指实测值(X)和真值(T)相差的程度; 信度指两次重复测量或等值测量之间的关联程度。
(二)信度的估计方法
1、重复信度(再测信度) 指的是同一个量表对同一组被试施测两次 所得结果的一致性程度。 其大小等于同一组被试在两次测验上所得 分数的相关系数,一般采用皮尔逊积差 相关Fra Baidu bibliotek公式来计算。
例一
• 用一个算术四则的速度测验12个小学生,得 分记为X,为了考察测量结果的可靠性,于3 个月后再测一次,得分记为Y,问测验结果 是否可靠?