第四章信度

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章信度

一、什么是信度

含义:指的是测量结果的稳定性程度(或叫可靠性)。也指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。

1、理论定义:测验实测值和真值的相差程度。

2、操作定义:

定义1:一组测量分数的真分数变异数(方差)与总变异数(总方差、实得分数的方差)的比率,或者是真实分数方差占总方差的的百分比。计算公式:

rxx=ST2/SX2

定义2:信度乃是一个被试团体的真分数与实得分数的相关系数的平方。即

rxx=ρTx2

定义3:信度乃是一个测验X(A卷)与它的任意一个“平行测验”X’(B卷)的相关系数。即

rxx=ρxx’

二、信度的类型及估计方法

(一)重测信度

1、含义与计算

又称稳定性系数。他的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。

三、信度的类型及估计方法

(一)重测信度(再测信度)

例:15名同学在1个月间隔内,先后2次重复施测某测验,测验结果如表中所列,请根据这些数据对该测验的重测信度进行计算。

三、信度的类型及估计方法

(一)重测信度

三、信度的类型及估计方法

(一)重测信度

可见,这两次测验分数之间有较高的正相关,该测验有较高的重测信度。

2、使用的前提条件

(1)所测量的心理特性必须是稳定的。

(2)遗忘和练习的效果基本上相互抵消。

(3)在时间间隔中没有学习另外的与测验有关的东西,或者说每人学习其他东西的程度都一样。

3、优缺点:

优点:

(1)它最符合重复测验的涵义,是重复测验最简单最明确的方式。(2)首测和再测只需要一套测验题目,省时、省力。(3)同一套题目无论施测几次,所测的属性是完全相同的。

缺点:

(1)同一组被试对同一个测验先后两次作答相互之间是不独立的。(2)如果两次施测时间间隔较长,在此期间被试的身心发展,新知识的获得,都会使两次测验结果不相同。(3)同一个被试对现一个测验先后两次作答,对测验的兴趣不同,影响测验结果。(4)两次施测的环境不同,也是产生测量误差的因素。(二)复本信度

1、含义与计算:

含义:

又称等值性系数。它是以两个平行或复本的测验(等值但题目不同)来测量同一群体,然后求得被试在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。复本信度反映的是测验在内容上的等值性,故称等值性系数。

2、使用的前提条件:

(1)要两份或两份以上真正平行的测验。

(2)被试要有条件接受两个测验。主要取决于时间、经费等几方面。

3、优缺点:

优点:

(1)一个测验的复本使得测验数目的增加,对于所欲测量的属性相联系的行为总体代表性强,因此,一个测验的两个复本在两三天至一周对同一组被试施测时,获得的复本信度系数是相当准确的。(2)测验的两个复本,如果在不同时间使用,其信度不仅可以反映在不同时间的稳定性,而且还可以反映对于不同测题的一致性。(3)两个复本在同时使用时,可以避免再测验信度的缺点。

缺点:

(1)编制两个完全相等的测验是很困难的。(2)复本法只能减少而不能完全排除练习和记忆的影响。(3)被试同时接受性质相似的两个测验可能减少完成测验的积极性。

(三)分半信度

1、含义

指采用分半法估计所得的信度系数。这种方法估计信度系数只需一种测验形式,实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分

数的相关系数。 2、计算

(1)两半测验分数的变异数相等(方差齐性)

先计算两半测验的积差相关系数,再进行校正。常用的修正公式是:斯皮尔曼-布朗公式:

21hh

hh

r r r χχ

=

+

(2)两半测验分数的变异数不等(方差不齐),可采用:弗朗那根公式或卢伦公式中的任意一个。

22

2

21a b

x s s r s ⎛⎫+=- ⎪⎝⎭

2

2

22

1d

x

d x s r s s s =-其中为两半测验分数之差的变异数,为测验总分的变异数.

问题:对初一年级学生进行地理成绩测验,每答对1题得1分,答错1题得0分.得分如表所示,试估计该测验的分半信度。

3、使用条件及范围

分半信度通常是在只能施测一次或没有复本的情况下使用。当一个测验无法分成对等的两半时,分半信度不宜使用。 (四)同质性信度

1、含义:指测验内部所有题目间的一致性。

题目的一致性有两层含义:其一是指所有题目都测的是同一种心理特质;其二是指所有题目之间都具有较高的正相关。总之,同质性信度就是一个测验所测内容或特质的相同程度。 幻灯片22

2、测量同质性信度的基本公式:

1(1).

ij kk ij

ij kk Kr r k r r r =

+-其中K 为构成测验的项目数,为项目间相关系数的平均数,为同质性信度值3

、库德-理查逊公式:适用于客观性试题(0、1记分)

20221222

1111()(1)i i x i i x x

x K R p q k k S K K R kp q k k S kS X k X k S K X -⎛⎫∑⎛⎫=- ⎪

⎪-⎝⎭⎝

⎭-⎛⎫⎛⎫=- ⎪

⎪-⎝⎭⎝⎭--=-kk 2i i x kk 2x 公式:

r 表示构成测验的题目数,p 为通过第i 题的人数比例,q 为未通过第i 题的人数比例,s 为测验总分的变异数.公式:

r 表示构成测验的题目数,为测验总分的平均数,s 为测验总分的变异数.

3、克伦巴赫系数

222211i x i x S k k S K S S α⎛⎫∑=- ⎪

-⎝⎭

其中为测验的题目数,为某一题目分数的变异数,为测验总分的变异数.

例题:某态度量表共7题,100个被试在各题上的得分方差分别是 0.81,0.82,0.79,0.83,0.85,0.76,0.77。测验总分的方差为14.00 求此测验的信度(α=0.70) (五)评分者信度

1、含义与计算:指的是多个评分者给同一批人的答卷进行评分的一致性程度。是用于测量不同评分者之间所产生的误差。

式中W 为和谐系数,K 为评分者的人数,N 为被评对象数,Ri 为每一对象被评的等级总和。

()

()

2

22

3

1

12

i i R R N

W K N

N

∑∑-=

-

例子:假设有三位专家给六篇论文评等级,结果如表所示,试计算此次评分者的评分者信度。 学1 学2 学3 学4 学5 学6 专1 2 4 1 5 6 3 专2 3 4 1 5 6 2 专3 3 5 1 4 6 2 Ri 8 13 3 14 18 7

()()22

2232

23:,63,811,3,6

1

12

638116

1

3(66)120.95

i i i i

R R k n R R

N

W K N N ∑=∑===∑∑-

=

--

=

⨯-=i 解分别求出各篇论文等级之各R 则有

相关文档
最新文档