教育测量的质量指标
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 教育测量的质量指标
第一节 信度
第二节 效度
第三节 难度
第四节 区分度
一、 信度的概念
信度指的是测量结果的稳定性或可靠的程度。也就是测量结果是否真实、客观地反映了考生的实际水平。具体而言,可以从以下三方面来理解测量的信度。
(一)信度指实测值与真值相差的程度
测量的目的之一,就是希望通过测量得到的实测值能够接近事物的真实值。由于各种原因,实测值一般不会完全等于真实值,两者之差称为测量误差。测量误差越小,测量的信度就越高。用一个等式表示如下:
x = T + E
式中,x 表示实测值,T 表示真值,E 表示误差。但测量的真实值是未知的,因此,误差也就无法求出来。当然,可以把很多次测量的实测值的平均值作为真实值的近似值,但这在实践上不具有可操作性。所以,根据这种理解,无法求出信度的大小。
(二)信度指统计量与参数之间的接近程度
统计量和参数是统计学中的两个基本概念。统计量是指样本上的各种数字特征(如样本的平均数、标准差等),参数是总体上的各种数字特征(如总体的平均数、标准差等)。统计量越接近参数,这个统计量的可靠性就越高,因此,信度就越高。要知道统计量对参数的接近程度,可以对参数进行区间估计。这种方法对估计真分数也很有用的。但这种理解也无法计算出信度。
(三)信度指两次重复测量或等值测量之间的关联程度
如果对同一对象进行两次重复测量或者等值测量以后,计算两次测量的相关系数,相关系数越高,说明测量的信度就越高;反之,就越低。对于信度的这种理解,有利于信度的计算。但重复测量会受到被测对象的经验、知识增长等因素的影响,等值测量又较难编制,因此,采用这种方法计算信度时,也是有误差的。
信度是任何一个测量的必要条件,对于教育测量来说,它具有更为重要的意义。因为教育测量的对象主要是精神现象,所测量的特性不易把握,为了能真实地反映测量对象的某种特点,需要更加注意测量的信度,从而正确地判断测量结果的价值。只有信度高的测量才能成为教育工作者有用的工具,否则,测量的结果是无意义的、无效的。
二、 信度的理论公式
根据上述对实数的分解,可将实得分数的方差分解为:2x σ=2T σ+2E σ,其中,
2T σ 表示真分数的方差,2E σ表示随机误差方差。
信度的计算公式为:r
xx =
2
2
x
T
σ
σ
=1-
2
2
x
E
σ
σ
从以上公式可以看出,随机误差的方差越小,测量的信度就越高。信度的取值范围为[0,1],如果测量误差的方差为0,那么,测量的信度等于1,如果测量误差的方差等于观察分数的方差,则测量的信度为0。
三、信度的类型
采用上述的理论公式是计算不了信度的,因为真分数根本不知道,这样也就计算不出误差分数。因此,上述理论公式只能帮助我们更进一步地理解信度的含义。那么,在实际测量中,如何计算或估计信度的大小呢?下面介绍几种常用方法。
(一)稳定性系数
(1)稳定性系数又称重测信度。它是指用同一测验试卷,在先后两个不同时间内对同一组被测试卷,两次测验实得分数的相关系数。稳定性系数是估量信度最简单的方法,只需用同一份试卷对同一被测试卷测验两次即可。
(2)估计稳定系数的基本程序是:
适当时距
测验A
1(A)测验A
2
(A)
A表示两次测验试卷相同,A
1和A
2
表示同一测验经过适当时间间隔施行两
次。时距可以是几天或者几个月。
(3)使用重测法要注意几点:
〔1〕重测法只适用于速度测验而不适用于难度测验;
〔2〕所测的信度大小,常常受两次测验时间间隔长短影响;
〔3〕第二次测验没有吸引力,不易引起学生的兴趣;
〔4〕要实施两次测验,耗费人力、物力和时间较多。
(二)等值性系数
(1)当同一测验的一种型式不能或不适合实施两次时,就需要采用该测验的另一平行型测验或者复份。复份在测验的内容、题数、格式、难度、平均分、标准差等方面应与原测验一样,否则,估计的等值系数就会出现较大误差。
(2)决定等值系数的方法是。先实施第一次测验,然后在最短的时间内实施第二份等值的测验,再求它们得分的相关系数。这个相关系数即为信度的等值性系数。
(3)其基本程序为:
最短时距
测验A
1测验B
1
A 1表示用试卷A进行的第一次测验,B
1
表示用试卷B进行的第一次测验,试卷A
和B等值。这种确定信度系数的方法称为复份法。
(4)采用复份法估计信度系数要注意:
〔1〕两次测验试卷要等值,即在内容、题型、题数、难度、区分度等方面要基本相同;
〔2〕两次测验要尽可能在较短的时矩内进行;
〔3〕确定两次测验是否等值,还要考察两次测验结果的平均数与标准差。 〔4〕在实际操作中,要编制两份等值的测验非常困难。
(三)内部一致性系数
前两种估计信度系数的方法都要测验两次。该种估计信度系数的方法只需测验一次。方法是把一次测验人为地分成两个部分,比较两个部分的一致性程度,从而估计信度系数。
根据分成两部分的不同,内部一致性系数的估计方法有两种:
(1)分半信度
这种方法是将一次测验分成两个假定相等而独立的两部分来记分,通常是以题目的奇数为一组,偶数为一组,计算两组的相关系数,最后用斯皮尔曼—布朗公式校正,求得整个测验的信度系数。 斯皮尔曼—布朗公式为:xy xy
tt r 1r 2r +=
式中,r xy 为两组测验分数的相关系数,r tt 表示整个测验的信度系数。
(2)库德尔—理查德森公式法
用这种方法只需测验一次,然后以各个问题的正确反应数为基础,或根据各人总分的平均数和标准差,计算信度系数,常用的库德尔—理查德森公式有 r 20KR 和r 21KR 。
〔1〕r 20KR 的用法:这个公式以每题能正确回答的人数占总人数的百分数为基础(每题只有通过或未通过两种分数)。
r 20KR =)1(12
s pq K K ∑-- 式中,r 20KR 为整个测验结果的信度系数。K 为测验题目数,p 为各题正确反应人数占总人数的百分数,q 为各题错误反应人数占总人数的百分数,s 2为各应试者各题得分之和的方差。
〔2〕r 21KR 的用法:这个公式以各反应者总分的平均数和方差为基础计算,无需各题难度的信息。公式如下:
r 21KR =1-2
)(8.0Ks x K x -⨯ 式中,x 是各人总分的平均分,2s 是各人总分的方差,K 是题目数。
〔3〕计算内部一致性系数,需要注意下列问题: