第四章 测量信度

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
测验 1 2 3 13 14 4 13 12 被 5 11 11 16 15 16 16 试 6 10 9
7 10 11 9
8 8
9
10 7 7
X1
X
2
8
6
求解过程
先计算出公式所需的各统计量
X
1
112
X
2
110
2 X 2 1324
X1 X 2 1324
X
2
1
1334
1)要构造出两份或两份以上真正平行的测验;
2)计算复本信度需要对同一批被试测试两份平
行测验,这就需要掌握一个合理的时间安排。
3)应该尽量在测试结果报告中,详尽地说明两
次测试的时间间隔、测试顺序安排、测试过 程中被试的有关测验经历等。
4 消除施测顺序的影响
为排除施测顺序的影响,求复本信度之前,
一、重测信度P53
1 定义
2 计算方法 测验
一段时距
再测验
计算公式
r r
tt
X 1X 2

2 1
X X X X / n
1 2 1 2
(1)
X ( X ) / n X ( X ) / n
2 1 2 2 2 2
其中, X 1
X2 、
分别代表首测和再测分数
3 例子
假设有一份主观幸福感调查表,先后两次施测于 10名大学生,时间间隔为半年。结果列入下表。 计算该测验的重测信度。
测量标准误差(standard error of measurement)是测量误差的假设分布的标准 差。用下列公式能够容易地计算测量标准误差:
SEM SDt 1 rXX
式中,SDt表示测验分数的标准差,rXX表示信 度系数。
四、信度的标准与作用P51
1.信度是评价测验质量的重要指标之一。
SEdiff SD 2 rxx ryy 15 2 0.97 0.93 4.74
因为4.74×1.96=9.29,因此,言语和操作智商相差
10分时,在0.05水平上,我们说存在显著差异。若
要在0.01水平上作出差异显著的结论,就要相差13 分 (4.74×2.58 )。
(3)内部一致性系数(internal consistency coefficients)也叫同质性信 度(homogeneity reliability),是指测 验内部所有题目间的一致性程度,主要 的计算方法有KR20公式、KR21公式、 克朗巴赫α系数,以及荷伊特信度等 。 P56
2.经典测量理论的测量标准误P51
二、信度的统计定义
1.经典测量理论假设的推论
X T E
T V I

2 X 2 T 2 E
X V I E


2 T 2 V 2 I
2 T
2 I 2 E

2 X 2 V
二、信度的统计定义P46
2.信度的统计定义
定义1:信度是被试团体真分数方差与实得 分数方差之比【变异数】 2 2 2 E T T rXX 2 2 2 X
X V I E
式中,X为观察分数,T为一般真分数, E为随机误差分数,V为目标真分数,I为 非目标真分数(系统误差)。
2.信度的定义
X V I E
T
测量追求的初步目标:T占X的比例越大越好。 测量追求的终极目标:V占X的比例越大越好。
当T占X的比例很大时,那么测值就会是稳定的。 一般来说,稳定的测值是可靠的、可信的,因此,信 度可被认为是测量结果的稳定性程度。
信度(reliability)定义:
1.P49信度指的是测量结果的稳定程度,即 若能用同一测量工具反复测量某人的同一 种心理特质,则其多次测量的结果间的一致 性程度就叫信度.
2
(理解)信度是指在不同时间,使用同一测验, 或者使用两个不同项目的等值测验,抑或在其 他不同的测试条件下,对同一组被试实施两次 或多次测试所得分数的一致性。
测验设计时可以先把被试分为两组,一组人 先作A型测验,再作B型测验,另一组人先 作B型测验,再作A型测验。
三、内在一致性系数
前言 测验既无复本,也不可能重复测量时,我们 常用内在一致性系数来估计测验的信度。这 类系数反映的是测验内部的一致性
项目同质性 当被试在同一测验里表现出跨项 目的一致性时,就称测验具有项目同质性。 也就是测验里各测题得分为正相关时,即为 同质,反之测题间相关为零则为异质。
X1
X2
可计算出以下统计值
X X
1 2 1
158 2600
1 2
X X
2 2 2
151 2409
X X
rtt
2494
运用公式(1)即可求出复本信度
2494 158151/ 10 2600 158 / 10 2409 151 / 10
2 2
.94
3.应用条件
测验类型 学业成就测验

0.66
信度系数 中 0.92

0.98
学术能力测验
特殊能力倾向测验
0.56
0.26
0.90
0.88
0.97
0.96
人格测验
兴趣测验
0.46
0.42
0.85
0.84
0.97
0.93
态度测验
0.47
0.79
0.98
2.信度是测量过程中所存在的随机误差 大小的反映。 3.信度可以用来解释个人测验分数的意 义——测量标准误。P51-52
第四章 测量信度
本章提要
测量信度的概念及作用
信度的估计方法 影响信度的主要因素 提高信度的常用方法
第一节 信度概述
信度:测验结果一致性的判断 (一个测验可靠性和稳定性的指标) 一个好的测验在多次测量同一个人的 时候结果应该是基本一致的.
一、信度与测量误差
1.经典测量理论的假设
X T E T V I
门的训练和培训,以保证重测信度反
映的是随机因素的影响效应。
Байду номын сангаас
4.使用重测信度时需要注意的问题
两次施测时间间隔的长短会影响重测信度
系数估计值的大小,因此,在报告重测信
度系数时应该报告间隔的时间长度。
应该根据已有的相关研究结论考虑所测心
理特质本身的稳定性程度,以确定前后两
次施测时间的间隔究竟应该多长比较合适
验。也就是用不同的题目测量同样的
内容而且其测验结果的平均值和标准
差都相同的两个测验。
2.评估方法
复本信度的估计过程就是计算同一批被试
在两个平行的复本测验上所得分数的相关 系数,也叫作等价系数(coefficient of equivalence)。
测试设计:同时测试和延时测试。
同时测试是在同一个时间段内进行测试,而延
式中,SEdiff是差异分数的测量标准误;rXX和rYY
是两个测验各自的信度系数;SD是两测验间使
用的相同的标准差。在比较分数之前,必须将 两个测验分数转为具有相同量表的标准分数。
4.信度可以帮助进行不同测验分数的比较。
例如,在韦氏成人智力量表中,言语和操作分测验
的信度为 0.97和0.93,而它们的智商的平均数为 100,标准差为15,故言语和操作智商差数的标准误为:
把上述数值代入公式
rtt
1324 112110/ 10 1334 1122 / 10 1324 1102 / 10
.97
3.应用条件
1)测量工具所测量的个体心理特质在
时间上应该是相对稳定的。
2)测量工具所测量的个体心理特质应
该不存在明显的练习效应和遗忘效应。
3)在两次施测间隔期间不应该进行专
三、描述信度的指标
1.经典测量理论的信度系数 信度系数是表示测量结果的稳定性程 度的指标。记为: rXX
信度系数的值域:[0,1]
没有百分之百可靠的测量,因此,
rXX=1只是理论上的值,实际当中是不
会存在的。
三、描述信度的指标
1.经典测量理论的信度系数
(1)重测信度(test-retest coefficients),是 指用同一个量表对同一组被试施测两次所得结 果的一致性程度,其大小等于同一组被试在两 次测验上所得分数的相关系数。P53 (2)复本信度(alternative--form coefficients),是指两个平行的测验测量同一 批被试所得结果的一致性程度,其大小等于同 一批被试在两个复本测验上所得分数的相关系 数。P54
时测试则是在两个时间段进行测试,同时测试 可能会存在作答疲劳的效应,而延时测试则可 能会存在学习或培训效应。
复本信度
1 定义
2 计算方法
测验复份A
计算公式
最短时距
测验复份B
r r
tt
X 1X 2

2 1
X X X X / n
1 2 1 2
(1)
X ( X ) / n X ( X ) / n
信度系数就会越大。
重测信度系数较大时,说明该测量工
具前、后两次的测量结果比较一致。
结果具有较好的跨时间上的稳定性
2.评估方法
重测信度的大小可以通过计算测
量工具的重测系数(test-retest
coefficient)或叫稳定性系数
(coefficient of stability)来标志。
具体来说,就是求取同一组被试 在两个不同时间施测同一个测量 工具所得结果分数的相关系数。
2 1 2 2 2 2
其中,
X
1
X2 、
分别代表测A和测B分数
3练习
假设用A、B两型创造力复本测验对初中一年级 的10个学生施测,结果列入下表。 X 1, X 2 分别 表示A、B两型测验。试计算该测验的复本信度。
测验 形式 被 1 20 20 2 19 20 3 19 18 4 18 16 5 17 15 试 6 16 17 7 14 12 8 13 11 9 12 13 10 10 9
SEM SDt 1 rXX 53.42 1 0.965 9.99
例如,我们已知高考文科试卷的总信度rXX =0.965,文科 考生总分的标准差为53.42,那么,文科考试成绩的标准误为:
如果某生的考试成绩为495分,在置信度为0.95时,其真 分数的置信区间为:
[495 1.96 9.99, 495 1.96 9.99] [475,515]
rxxdiff
1 2
(rxx ryy ) rxy 1 rxy
式中,rXXdiff是差异分数的信度系数;rXX和rYY
是两个测验各自的信度系数; rXY是两测验间的 相关系数。
4.信度可以帮助进行不同测验分数的比较。
差异分数的测量标准误可用如下公式求出:
SEdiff SD 2 rxx ryy
时,不应该随便选择间隔时间的长短。
二、复本信度P54
1.含义
两个平行的测验(复本测验)测量同
一批被试所得结果的一致性程度。
复本信度反映了由于题目的不同以及
时间间隔所导致的测量误差。
平行测验或复本测验指的是两个在题
目内容、数量、形式、难度、区分度、
指导语、时限以及所用的例题、公式
和测验等其他方面都相同或相似的测
三、内部一致性信度(同质性信度)P56
1.含义
内部一致性信度主要评价了测验各随
机组成部分之间是否测量了相同的心 理特质,因此,它反映的是题目内容 的抽样一致性程度。
具体估计方法主要包括分半信度评估
第二节 信度的估计方法P48
一、重测信度
1.含义
同一个测量工具在两个不同时间对 同一组被试施测所得结果的一致性 程度.
重测信度主要考察了一个测量工具是
否能够保证在不同时间测量结果的一
致性,他反映了测量工具的结果受到
时间间隔因素影响的大小。
一般来说,重测的时间间隔越短,那
么各种施测情境的变化就越小,重测
2 X
T
E
2 X
定义2:信度是被试团体真分数与实得分数 2 rXX TX 相关系数的平方 定义3:信度是一个测验X(A卷)与它的任意 一个平行测验(B卷)的相关系数 rXX XX
实际!
理解信度概念时应该注意的地方P52
1、一个测验可以有多个信度估计计算,因而
其误差估计值也会有多个,在实际工作中要 注意选择。 2、CTT假定同一个团体中所有人的测量误差 都是相同的,但实际上水平高的人与水平低 的人在做测量时会有不同的随机误差。 3、测量的结果不能僵硬地看成是一个点,而 应看成是一个以该点为中心,以SE的某个倍 数为半径上下波动的一个范围(区间估计)
考察两个分数的差异是否可靠,是否真有差异的问
4.信度可以帮助进行不同测验分数的比 较。P47
题。比如,某人的物理成绩是否真的优于化学?某 人的数学技能本学期是否真有进步?某人在韦氏智 力量表上操作智商与言语智商的差异是否真有显著 意义等。
当两测验的方差相等时,差异分数的信度系数可用
如下公式求出:
相关文档
最新文档