第三讲 信度
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例题
10名被试在一个有10个条目的测验中得分如下,求 该测验的分半信度?
测验题目得分 被试 1 2 3 4 5 6 7 8 9 10 单号 双号 得分 得分 单双 之差
1பைடு நூலகம்
2 3
2
2 2
2
1 2
2
1 2
1
2 2
2
1 1
2
0 2
1
0 1
0
1 1
0
0 1
1
0 1
7
4 7
6
4 8
1
0 -1
4
5 6 7 8 9 10
SE S x 1 xx
SE:测量的标准误 rxx:测验的信度系数 SX :所得分数的标准差
可见,测量的标准误与信度呈负相关。
第二节 信度评估的方法
一、重测信度
再测信度 稳定性系数
第 三 讲 测 验 的 信 度
使用同一测验,在同样条件下对同一组被试 前后施测两次测验,求两次得分间的相关系数。
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
例题
A、B两位教师给6篇作文评分,结果如下, 试求两位教师评分一致性的程度。 作 文 1 2 3 4 5 6
教师A
教师B
25
22
30
26
27
23
20
20
28
25
32
35
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
几种信度相应误差(变异)的来源
信度类型 误差(变异)来源 重测信度 时间误差 复本信度(连续施测) 内容误差 复本信度(间隔施测) 时间、内容误差 分半信度 内容(项目)误差 同质信度 项目异质误差 评分者信度 评分者间误差
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
估计信度的方法很多,实际上有多少 随机误差的来源,便有多少估计信度的方 法。所以,在确定测验的信度时,应根据 情况采用不同的信度指标,原则上一个测 验哪种误差大,便应该用哪种误差估计。
0
-2 1 -1 1 2 1
合计 18
50
48
2
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
分半信度实际上只是一半测验项目的相关 系数,要评估整个测验的信度,就需用斯皮尔 曼一布朗公式校正。
rxx =
2rhh
1+
rhh
rhh :两半测验分数的相关系数 rxx :整个测验的信度估计
使用前提:两半测验分数的方差相等
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
二、复本信度
等值性系数 以两个等值但题目不同的测验(复本)来测 量同一群体,然后求得被试者在两个测验上得分 的相关系数。
复本信度反映的是测验在内容上的等值性,故又称 等值性系数。如果两个复本的施测相隔一段时间,则称 重测复本信度或稳定与等值系数。
解: 第1次成绩 (X) 第2次成绩 (Y) 88 56 89 76 85 68 47 76 45 75 705 X2 7396 3364 6241 4096 7744 3364 3025 6724 1024 5625 48603 Y2 7744 3136 7921 5776 7225 4624 2209 5776 2025 5625 52061 XY 7568 3248 7031 4864 7480 3944 2585 6232 1530 5625 50017
K:构成测验的题目数 Pi:通过第i题的人数比例 qi:未通过第i题的人数比例 SX2:测验总分的方差
适用范围:0/n计分的测验。
第二节 信度评估的方法
3.克伦巴赫系数
第 三 讲 测 验 的 信 度
∑ Si2 K α= K-1[1- S 2 x
Si2:某项目分数的方差
]
SX2:测验总分的方差
说明: 适用多重记分(1~n)的测验。 当题目以二分法记分时,∑Si2=∑Piqi,故 库德-理查逊公式可看为α 系数的特例。
1
1 2 2 2 2 2
0
2 2 2 2 2 2
17
0
0 1 1 2 2 1
13
1
1 2 2 2 2 1
15
0
0 2 1 0 2 2
11
0
0 1 1 1 1 1
9
0
0 1 0 1 1 1
6
0
0 1 0 0 0 0
3
0
0 1 0 1 0 0
3
0
0 0 0 0 0 1
3
1
1 7 4 6 7 6
1
3 6 5 5 5 5
第三节 信度在测验中的作用
例题
第 三 讲 测 验 的 信 度
假设在一个智力测验中,某个被试的IQ 为100,这是否反映了他的真实水平,如果再 测一次他的分数将改变多少?(已知该智力测验 的标准差为15,信度系数为0.84) SE=SX 1-rXX SE=15 1-0.84 = 6.0 X-1.96SE≤XT≤X+l.96SE 88≤XT≤112
信度系数
第一节 信度的概念
第 三 讲 测 验 的 信 度
由于真分数的方差ST2无法统计,则
XX
S S S 1 2 SX S
2 X 2 E
2 E 2 X
信度也可以间接地看作,在总的方差中测量 误差(随机)的方差所占的比例。
第一节 信度的概念
二、信度的描述指标
第 三 讲 测 验 的 信 度
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
如果两半测验分数的平均数和标准差不同, 可以采用弗朗那根公式和卢伦公式来估计信度。
Sa2+Sb2 rxx=2[1--———] Sx2
弗朗那根公式
Sd2 rxx=1-—— Sx2
Sx2:测验总分的方差
卢伦公式
Sa2、Sb2:两半测验分数的方差
rxx:估计信度
ST rXT = S = X
( rXT≥ rxx )
rxx
( 0≤rxT≤1)
第一节 信度的概念
(二)测量标准误
第 三 讲 测 验 的 信 度
对一个人施测N次测验,从其N个测验分数中随机抽取 K个样本数为n的小样本,得到K个样本均数。K个样本均 数的平均数就是这个人的真分数;n个样本均数的标准差 就是标准误(SE),它反映抽样误差大小。
高 0.98 0.97 0.96 O.97 O.93 0.98
第三节 信度在测验中的作用
三、解释个人分数的意义
第 三 讲 测 验 的 信 度
即测量标准误的应用。 SE=SX 1-rXX ①估计真实分数的范围(置信区间) ②了解实得分数再测时的可能范围 X-1.96SE≤XT≤X+l.96SE
即真实分数(或再测分数)有95%的可能性落在 所得分数X-1.96SE≤XT≤X+l.96SE 的范围内(也有5 %的可能性落在该范围之外)。
所测量的特质必须是稳定的; 遗忘与练习的效果相同; 两次施测期间被试的学习效果没有差别。
第二节 信度评估的方法
重测信度的说明:
第 三 讲 测 验 的 信 度
重测信度并非越高越好。 重测信度不易获得很高的数值。 罗宾逊(Robinson)对重测信度的评价 间隔时间 信度系数 评 价 ≥1年 ≥0.50 模范级 3~12月 ≥0.40 广泛级 1~3月 ≥0.30 普通级 <1月 ≥0.20 最低限度级
r
= —————— = 0.89
LXY
LXX
LYY
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
重测信度的专用计算公式:
rxx =
Σ X1X2 / N-X1X2
S1S2
rxx:测验的信度系数
N:样本数 X1、X2:同一被试的两次测量分数 S1、S2:两次测验的标准差
计算重测信度应满足以下几个条件:
第三节 信度在测验中的作用
第 三 讲 测 验 的 信 度
一、解释真分数与实得分数的关系
信度系数可以解释总的方差中有多少比例 是由真实分数的方差决定的,也就是测验的总 变异中真实分数造成的变异占百分之几。 如 rXX=0.85,可认为实得分数中85%的变 异是真分数造成的,15%是来自测验的随机误 差。
复本信度使用前提条件:
要有两份或以上真正平行的测验。 被试有条件接受两个测验。
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
三、分半信度 劈半信度 折半信度
测验实施后将测验题按奇、偶数分为相等的 两半,分别计算每位被试在两半测验上的得分, 求出这两半分数的相关系数。 由于没有时间因索的干扰,分半信度是一种 很好的确定信度的方法,也非常常用。
被试的真实IQ(或再测一次,他的IQ分数)有95%的可 能性落在88与112之间。
第三节 信度在测验中的作用
心理测量学
第三讲
心理测验的信度
教 学 内 容
第 三 讲 测 验 的 信 度
第一节 信度的概念
第二节 信度评估方法 第三节 信度在测验中的作用 第四节 影响信度的因素
信度与效度
信度:稳定性,一致性 效度:准确性,有效性
●● ● ● ●
●● ● ● ●
●
● ●
A
●
B
C
●
花生重量=花生净重+泥土重量 花生重量=花生仁重量+花生壳重量+泥土重量
第一节 信度的概念
根据统计方差分析理论
第 三 讲 测 验 的 信 度
S S S
2 X 2 T
2 E
SX2:测验实得分数的方差(即总方差) ST2:测验真分数的方差 SE2:测验误差的方差。
在测量理论中,信度被定义为:一组测量 分数的真分数方差与总方差的比率 。
2 ST xx 2 SX
rxx:信度
Sd2:两半测验分数差的方差
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
四、同质性信度 内部一致性信度
指测验内部所有题目间的一致性程度。 同质性是指测验的所有题目测量的是同一种 特质或同一种能力。若各测题的得分有较高的正 相关时,则测验为同质的。相反,若各测题的得 分相关很低或为负相关时,则测验为异质的。 同质性信度是最常用的信度指标。
两次测验的时距随测验的目的、性质和被试特点而 异,一般人格测验常用的重测间隔是两周到四周较宜, 间隔时间最好不超过六个月。 举例 10名学生用同一量表两次测验的成绩如下,求它们之 间的相关系数? 第1次成绩:86 58 79 64 88 58 55 82 32 75 第2次成绩:88 56 89 76 85 68 47 76 45 75
86 58 79 64 88 58 55 82 32 75
合计(∑) 677
(∑X)2 LXX=∑(X-X)2= ∑X2- ——— = 2770.1 n
(∑Y)2 LYY=∑(Y-Y)2= ∑Y2- ——— = 2358.5 n
(∑X) (∑Y) LXY=∑(X-X) (Y-Y) = ∑XY- ————— n = 2288.5
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
五、评分者信度
两位评分者对随机抽取的若干份测验卷按评 分标准分别给分,然后根据每份测验卷的两个分 数计算相关系数,即得评分者信度。它反映不同 评分者之间所产生的误差。 一般要求在成对的受过训练的评分者之间平 均一致性达0.90以上,才认为评分是客观的。
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
l.计算同质性信度的基本公式
K rij rxx= 1+ (K-1)rij
rxx:同质性信度值 K:为构成测验的项目数 rij:项目间相关系数的平均数
第二节 信度评估的方法
第 三 讲 测 验 的 信 度
2.库德-理查逊公式
K ∑ piqi rxx= K-1[1- S 2 ] x
第一节 信度的概念
一、信度的定义
第 三 讲 测 验 的 信 度
信度是指同一被试在不同时间内用同一测验 (或用另一套相等的测验)重复测量,所得结果 的一致程度。
信度只受随机误差的影响。系统误差稳定, 不影响信度。随机误差越大,信度越低。因此, 信度亦可视为测验结果受随机误差影响的程度。 实得分数(X)= 真分数(T)+ 误差(E)
第三节 信度在测验中的作用
第 三 讲 测 验 的 信 度
二、确定信度可以接受的水平
一般的能力测验和成就测验的rXX都在0.90 以上,有的可达0.95;而人格测验、兴趣、态 度、价值观等测验的rXX一般在0.80~0.85。
信度系数对测验的评价
rXX≥0.85 个人评价、预测 + 团体比较 +
0.70≤ rXX <0.85
(一)信度系数与信度指数
1.信度系数 最常用 指同一被试样本所测得的两组资料的相关系 数。理论上,是真分数方差与实得分数的方差的 比值。
S xx S
2 T 2 X
( 0≤rxx≤1)
第一节 信度的概念
第 三 讲 测 验 的 信 度
2.信度指数
真分数标准差与实得分数的标准差的比值称 信度指数。它是信度系数的平方根。
rXX<0.70
-
-
+
-
第三节 信度在测验中的作用
第 三 讲 测 验 的 信 度
几种类型的心理测验的信度系数
测验类型
成套成就测验 学术能力测验 成套倾向性测验 客观人格测验 兴趣测验 态度量表 信
低 0.66 0.56 0.26 0.46 0.42 0.47
度 中 0.92 0.90 0.88 0.85 0.84 0.79