教育测量的质量指标

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章 教育测量的质量指标

第一节 信度

第二节 效度

第三节 难度

第四节 区分度

一、 信度的概念

信度指的是测量结果的稳定性或可靠的程度。也就是测量结果是否真实、客观地反映了考生的实际水平。具体而言,可以从以下三方面来理解测量的信度。

(一)信度指实测值与真值相差的程度

测量的目的之一,就是希望通过测量得到的实测值能够接近事物的真实值。由于各种原因,实测值一般不会完全等于真实值,两者之差称为测量误差。测量误差越小,测量的信度就越高。用一个等式表示如下:

x = T + E

式中,x 表示实测值,T 表示真值,E 表示误差。但测量的真实值是未知的,因此,误差也就无法求出来。当然,可以把很多次测量的实测值的平均值作为真实值的近似值,但这在实践上不具有可操作性。所以,根据这种理解,无法求出信度的大小。

(二)信度指统计量与参数之间的接近程度

统计量和参数是统计学中的两个基本概念。统计量是指样本上的各种数字特征(如样本的平均数、标准差等),参数是总体上的各种数字特征(如总体的平均数、标准差等)。统计量越接近参数,这个统计量的可靠性就越高,因此,信度就越高。要知道统计量对参数的接近程度,可以对参数进行区间估计。这种方法对估计真分数也很有用的。但这种理解也无法计算出信度。

(三)信度指两次重复测量或等值测量之间的关联程度

如果对同一对象进行两次重复测量或者等值测量以后,计算两次测量的相关系数,相关系数越高,说明测量的信度就越高;反之,就越低。对于信度的这种理解,有利于信度的计算。但重复测量会受到被测对象的经验、知识增长等因素的影响,等值测量又较难编制,因此,采用这种方法计算信度时,也是有误差的。

信度是任何一个测量的必要条件,对于教育测量来说,它具有更为重要的意义。因为教育测量的对象主要是精神现象,所测量的特性不易把握,为了能真实地反映测量对象的某种特点,需要更加注意测量的信度,从而正确地判断测量结果的价值。只有信度高的测量才能成为教育工作者有用的工具,否则,测量的结果是无意义的、无效的。

二、 信度的理论公式

根据上述对实数的分解,可将实得分数的方差分解为:2x σ=2T σ+2E σ,其中,

2T σ 表示真分数的方差,2E σ表示随机误差方差。

信度的计算公式为:r

xx =

2

2

x

T

σ

σ

=1-

2

2

x

E

σ

σ

从以上公式可以看出,随机误差的方差越小,测量的信度就越高。信度的取值范围为[0,1],如果测量误差的方差为0,那么,测量的信度等于1,如果测量误差的方差等于观察分数的方差,则测量的信度为0。

三、信度的类型

采用上述的理论公式是计算不了信度的,因为真分数根本不知道,这样也就计算不出误差分数。因此,上述理论公式只能帮助我们更进一步地理解信度的含义。那么,在实际测量中,如何计算或估计信度的大小呢?下面介绍几种常用方法。

(一)稳定性系数

(1)稳定性系数又称重测信度。它是指用同一测验试卷,在先后两个不同时间内对同一组被测试卷,两次测验实得分数的相关系数。稳定性系数是估量信度最简单的方法,只需用同一份试卷对同一被测试卷测验两次即可。

(2)估计稳定系数的基本程序是:

适当时距

测验A

1(A)测验A

2

(A)

A表示两次测验试卷相同,A

1和A

2

表示同一测验经过适当时间间隔施行两

次。时距可以是几天或者几个月。

(3)使用重测法要注意几点:

〔1〕重测法只适用于速度测验而不适用于难度测验;

〔2〕所测的信度大小,常常受两次测验时间间隔长短影响;

〔3〕第二次测验没有吸引力,不易引起学生的兴趣;

〔4〕要实施两次测验,耗费人力、物力和时间较多。

(二)等值性系数

(1)当同一测验的一种型式不能或不适合实施两次时,就需要采用该测验的另一平行型测验或者复份。复份在测验的内容、题数、格式、难度、平均分、标准差等方面应与原测验一样,否则,估计的等值系数就会出现较大误差。

(2)决定等值系数的方法是。先实施第一次测验,然后在最短的时间内实施第二份等值的测验,再求它们得分的相关系数。这个相关系数即为信度的等值性系数。

(3)其基本程序为:

最短时距

测验A

1测验B

1

A 1表示用试卷A进行的第一次测验,B

1

表示用试卷B进行的第一次测验,试卷A

和B等值。这种确定信度系数的方法称为复份法。

(4)采用复份法估计信度系数要注意:

〔1〕两次测验试卷要等值,即在内容、题型、题数、难度、区分度等方面要基本相同;

〔2〕两次测验要尽可能在较短的时矩内进行;

〔3〕确定两次测验是否等值,还要考察两次测验结果的平均数与标准差。 〔4〕在实际操作中,要编制两份等值的测验非常困难。

(三)内部一致性系数

前两种估计信度系数的方法都要测验两次。该种估计信度系数的方法只需测验一次。方法是把一次测验人为地分成两个部分,比较两个部分的一致性程度,从而估计信度系数。

根据分成两部分的不同,内部一致性系数的估计方法有两种:

(1)分半信度

这种方法是将一次测验分成两个假定相等而独立的两部分来记分,通常是以题目的奇数为一组,偶数为一组,计算两组的相关系数,最后用斯皮尔曼—布朗公式校正,求得整个测验的信度系数。 斯皮尔曼—布朗公式为:xy xy

tt r 1r 2r +=

式中,r xy 为两组测验分数的相关系数,r tt 表示整个测验的信度系数。

(2)库德尔—理查德森公式法

用这种方法只需测验一次,然后以各个问题的正确反应数为基础,或根据各人总分的平均数和标准差,计算信度系数,常用的库德尔—理查德森公式有 r 20KR 和r 21KR 。

〔1〕r 20KR 的用法:这个公式以每题能正确回答的人数占总人数的百分数为基础(每题只有通过或未通过两种分数)。

r 20KR =)1(12

s pq K K ∑-- 式中,r 20KR 为整个测验结果的信度系数。K 为测验题目数,p 为各题正确反应人数占总人数的百分数,q 为各题错误反应人数占总人数的百分数,s 2为各应试者各题得分之和的方差。

〔2〕r 21KR 的用法:这个公式以各反应者总分的平均数和方差为基础计算,无需各题难度的信息。公式如下:

r 21KR =1-2

)(8.0Ks x K x -⨯ 式中,x 是各人总分的平均分,2s 是各人总分的方差,K 是题目数。

〔3〕计算内部一致性系数,需要注意下列问题:

相关文档
最新文档