第四章信度
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章信度
一、什么是信度
含义:指的是测量结果的稳定性程度(或叫可靠性)。也指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
1、理论定义:测验实测值和真值的相差程度。
2、操作定义:
定义1:一组测量分数的真分数变异数(方差)与总变异数(总方差、实得分数的方差)的比率,或者是真实分数方差占总方差的的百分比。计算公式:
rxx=ST2/SX2
定义2:信度乃是一个被试团体的真分数与实得分数的相关系数的平方。即
rxx=ρTx2
定义3:信度乃是一个测验X(A卷)与它的任意一个“平行测验”X’(B卷)的相关系数。即
rxx=ρxx’
二、信度的类型及估计方法
(一)重测信度
1、含义与计算
又称稳定性系数。他的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。
三、信度的类型及估计方法
(一)重测信度(再测信度)
例:15名同学在1个月间隔内,先后2次重复施测某测验,测验结果如表中所列,请根据这些数据对该测验的重测信度进行计算。
三、信度的类型及估计方法
(一)重测信度
三、信度的类型及估计方法
(一)重测信度
可见,这两次测验分数之间有较高的正相关,该测验有较高的重测信度。
2、使用的前提条件
(1)所测量的心理特性必须是稳定的。
(2)遗忘和练习的效果基本上相互抵消。
(3)在时间间隔中没有学习另外的与测验有关的东西,或者说每人学习其他东西的程度都一样。
3、优缺点:
优点:
(1)它最符合重复测验的涵义,是重复测验最简单最明确的方式。(2)首测和再测只需要一套测验题目,省时、省力。(3)同一套题目无论施测几次,所测的属性是完全相同的。
缺点:
(1)同一组被试对同一个测验先后两次作答相互之间是不独立的。(2)如果两次施测时间间隔较长,在此期间被试的身心发展,新知识的获得,都会使两次测验结果不相同。(3)同一个被试对现一个测验先后两次作答,对测验的兴趣不同,影响测验结果。(4)两次施测的环境不同,也是产生测量误差的因素。(二)复本信度
1、含义与计算:
含义:
又称等值性系数。它是以两个平行或复本的测验(等值但题目不同)来测量同一群体,然后求得被试在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。复本信度反映的是测验在内容上的等值性,故称等值性系数。
2、使用的前提条件:
(1)要两份或两份以上真正平行的测验。
(2)被试要有条件接受两个测验。主要取决于时间、经费等几方面。
3、优缺点:
优点:
(1)一个测验的复本使得测验数目的增加,对于所欲测量的属性相联系的行为总体代表性强,因此,一个测验的两个复本在两三天至一周对同一组被试施测时,获得的复本信度系数是相当准确的。(2)测验的两个复本,如果在不同时间使用,其信度不仅可以反映在不同时间的稳定性,而且还可以反映对于不同测题的一致性。(3)两个复本在同时使用时,可以避免再测验信度的缺点。
缺点:
(1)编制两个完全相等的测验是很困难的。(2)复本法只能减少而不能完全排除练习和记忆的影响。(3)被试同时接受性质相似的两个测验可能减少完成测验的积极性。
(三)分半信度
1、含义
指采用分半法估计所得的信度系数。这种方法估计信度系数只需一种测验形式,实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分
数的相关系数。 2、计算
(1)两半测验分数的变异数相等(方差齐性)
先计算两半测验的积差相关系数,再进行校正。常用的修正公式是:斯皮尔曼-布朗公式:
21hh
hh
r r r χχ
=
+
(2)两半测验分数的变异数不等(方差不齐),可采用:弗朗那根公式或卢伦公式中的任意一个。
22
2
21a b
x s s r s ⎛⎫+=- ⎪⎝⎭
2
2
22
1d
x
d x s r s s s =-其中为两半测验分数之差的变异数,为测验总分的变异数.
问题:对初一年级学生进行地理成绩测验,每答对1题得1分,答错1题得0分.得分如表所示,试估计该测验的分半信度。
3、使用条件及范围
分半信度通常是在只能施测一次或没有复本的情况下使用。当一个测验无法分成对等的两半时,分半信度不宜使用。 (四)同质性信度
1、含义:指测验内部所有题目间的一致性。
题目的一致性有两层含义:其一是指所有题目都测的是同一种心理特质;其二是指所有题目之间都具有较高的正相关。总之,同质性信度就是一个测验所测内容或特质的相同程度。 幻灯片22
2、测量同质性信度的基本公式:
1(1).
ij kk ij
ij kk Kr r k r r r =
+-其中K 为构成测验的项目数,为项目间相关系数的平均数,为同质性信度值3
、库德-理查逊公式:适用于客观性试题(0、1记分)
20221222
1111()(1)i i x i i x x
x K R p q k k S K K R kp q k k S kS X k X k S K X -⎛⎫∑⎛⎫=- ⎪
⎪-⎝⎭⎝
⎭-⎛⎫⎛⎫=- ⎪
⎪-⎝⎭⎝⎭--=-kk 2i i x kk 2x 公式:
r 表示构成测验的题目数,p 为通过第i 题的人数比例,q 为未通过第i 题的人数比例,s 为测验总分的变异数.公式:
r 表示构成测验的题目数,为测验总分的平均数,s 为测验总分的变异数.
3、克伦巴赫系数
222211i x i x S k k S K S S α⎛⎫∑=- ⎪
-⎝⎭
其中为测验的题目数,为某一题目分数的变异数,为测验总分的变异数.
例题:某态度量表共7题,100个被试在各题上的得分方差分别是 0.81,0.82,0.79,0.83,0.85,0.76,0.77。测验总分的方差为14.00 求此测验的信度(α=0.70) (五)评分者信度
1、含义与计算:指的是多个评分者给同一批人的答卷进行评分的一致性程度。是用于测量不同评分者之间所产生的误差。
式中W 为和谐系数,K 为评分者的人数,N 为被评对象数,Ri 为每一对象被评的等级总和。
()
()
2
22
3
1
12
i i R R N
W K N
N
∑∑-=
-
例子:假设有三位专家给六篇论文评等级,结果如表所示,试计算此次评分者的评分者信度。 学1 学2 学3 学4 学5 学6 专1 2 4 1 5 6 3 专2 3 4 1 5 6 2 专3 3 5 1 4 6 2 Ri 8 13 3 14 18 7
()()22
2232
23:,63,811,3,6
1
12
638116
1
3(66)120.95
i i i i
R R k n R R
N
W K N N ∑=∑===∑∑-
=
--
=
⨯-=i 解分别求出各篇论文等级之各R 则有