第四章 测量信度

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章测量信度

第一节信度概述

一、什么是信度

信度又叫可靠性,是指测量结果的稳定性程度或一致性程度。一个好的测验必须稳定可靠,即多次测量的结果保持一致,否则便不可信。例如:我们用一个智力量表去测量某一个儿童,第一次测得的结果是IQ=90,第二次测得的结果是IQ=120。那么我们就会问:到底这儿童的智商是多少?这就是该智力测验的可靠性有问题。就好象用橡皮筋去量东西的长度。前面讲过,任何一种测量,总有或多或少的误差,信度受随机误差的影响。随机误差越大,信度也就越低;随机误差越小,信度就越高。因此,信度也可看作测量结果受机遇影响的程度。

信度的含义可以从两个层面加以分析:(1)当我们以同样的测量工具重复测量某项持久性的特质时,是否得到相同的结果?由此可知此一测量工具的稳定性。(2)测量工具能否减少随机误差的影响,提供某项特质个别差异程度的真实量数?由此可知测量结果的精确性。(如新旧枪射击结果图)

在测量理论中,信度被定义为:一组测量分数的真变异数与总变异数(实得分数的变异数)的比率。即:

γXX = S T2 /S X2

式中γXX代表测量的信度,S T2代表真分数变异数,S X2代表总变异数,即实得分数的变异数。

由于X=T+E,所以信度还可表示为:

γXX=(S X2-S E2)/ S X2=1- S E2/ S X2

由于真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概念,由于我们无法得到测验的真正信度,我们只能用一些指标对它进行估计。

二、信度系数

大部分的信度指标都以标志着系数表示,即用同一被试样本所得的两组资料的相关作为测量一致性的指标,称作信度系数。

对信度系数要注意三点:(1)在不同的情况下,对不同样本,采用不同方法会得到不同的信度系数,因此一个测验可能不止一个信度系数。(2)信度系数只是对测量分数不一致

程度的估计,并没有指出不一致的原因。(3)获得较高的信度系数并不是心理测量追求的最终目标,它只是迈向目标的一步,是使测验有效的一个必要条件。

信度系数达到多高才可以接受呢?最理想的情况是γXX=1,但这是办不到的。不过我们可用已有的同类测验作为比较的基准。一般能力与成就测验的信度系数要求在0.90以上,有的可以达到0.95;至于性格、兴趣、价值观等人格测验的信度系数,通常在080到085或更高些。当γXX<0.70时,不能用测验来对个人作评价,也不能在团体间作比较;当γXX大于或等于0.70时,可用于团体间比较;当γXX大于或等于0.85时,可用于鉴别个人。

任何测验只有包含特定样本的题目,由特定的施测者,对特定的被试,在特定的时间、地点施测,情况不同便会得到不同的分数。由于信度系数总是在特定情况下获得的,因此,只有当一个测验在很多情况下被证实具有较高的信度时,才可以说它是比较可靠的测验。

三、信度的作用

信度系数有两个实际用处:一是用来解释个人分数的意义,二是用来比较不同测验分数的差异。

1.信度可以用来解释个人测验分数的意义

由于存在测量误差,一个人所得分数有时比真分数高,有时比真分数低,有时二者相等。理论上我们可对一个人施测无限多次,然后求所得分数的平均数与标准差,这样平均数就是这个人的真分数,标准差就是测量误差大小的指标。但这在实际上是行不通的。然而,我们可以用一组被试(人数足够多)两次施测的结果来代替对同一个人反复施测,以估计测量误差的变异数。此时,每个人在两次测验中的分数之差可以构成一个新的分布,这个分布的标准差就是测量的标准误,是表示测量误差大小的指标。

测量的标准误可用下式计算:

SE=S X 1 - γXX

这里SE为测量的标准误,S X为所得分数的标准差,γXX为测量的信度。从式中可以看出,测量的标准误与信度之间有互为消长的关系:信度越高,标准误越小;信度越低,标准误越大。

根据上公式,知道了一组测量的标准差和信度系数,就可以求出测量的标准误。进一步我们就可以从每个人的实得分数估计出真分数的可能范围,即确定出在不同或然率水准上真分数的置信区间。人们一般采用95%的或然率水准,其置信区间为:

(X-1.96SE)≤ T ≤ (X+1.96SE)

这就是说,大约有95%的可能性真正分数落在所得分数±1.96SE的范围内,或者5%的

可能性落在这范围之外。这实际上也表明了再测时分数改变的可能范围。

例如:在一次测验中有一学生得80分,这是否反映了他们的真实水平?如果再测一次他的分数将改变多少?已知该次测验的标准差为5,信度系数为0.84。

首先计算SE:

SE= 5⨯1-0.84 =2

T=80 ± 1.96 ⨯ 2 = 76.08—83.92

我们可以说该学生的真正分数有95%的可能性落在76与84分之间。

2.信度可以帮助进行不同测验分数的比较

来自不同测验的原始分数是无法直接比较的,而必须将它们转换成相同尺度的标准分数才能进行比较。

如某班期末考试,张生语文、数学的成绩转换成T分数(平均数为50、标准差为10)分别为65和70,由此我们可以知道张生的数学比语文考得稍好些,但二者差异是否有意义,仍不清楚。为了说明个人在两种测验上表现的优劣,我们可以用“差异的标准误”来检验其差异的显著性,常用的公式为:

SE d=S 2 - γXX -γYY

公式中SE d为差异的标准误,S为标准分数的标准差(如T分数的S=10),γXX和γYY 分别是两个测验的信度系数。

如上例中,假定此次语文、数学考试的信度分别为0.84和0.91,张生的两个分数差异的标准误为:

SE d=10 ⨯2-0.84-0.91 = 5

若采用95%的置信区间(即.05显著水平),则张生在这两门课上T分数的差异必须达到或超过1.96Sed = 1.96 ⨯ 5 = 9.8 ,才能认为二者真有差异。因为数学的T分数只比语文高5分,所以差异并不显著。

用SE估计个人分数的误差要注意三点:(1)一个测验有很多可能的信度估计,因而也有同样多的标准误估计,在实际工作中要注意选择最适合某一特殊情况的信度估计来解决问题。(2)本理论假定SE在所有分数水平都一样,但有时高分段与低分段其标准误并不相同。水平高的人与水平低的人在做测量时会有不同的随机误差,受随机误差的影响也不一样。(3)测验分数是一个人真正分数的最佳估计,但由于存在测量误差,所以必须将测验分数看成以该点为中心上下波动的范围,而不要看成确切的点。这一范围有多宽将取决于测量标准误的大小,最终取决于信度系数。(4)测量标准误是对测量误差的描绘,用它能对个人真正分数

相关文档
最新文档