第三讲测量的信度

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二、信度的作用 1、信度是测量过程中所存在随机误差大小的反映。 (CCT 的数学模型: X=T+E 与 rxx=S2T/S2X) 2、 信度可以用来解释个人测验分数的意义。 SE=SX√1- rxx (X-1.96SE)<=T<=(X+1.96SE) 3、 信度可以帮助进行不同测验分数的比较。 SEd= √SE12+SE22 SEd= S√2-rxx-ryy
46993 67.0 65.9 284 10 rxx 0.820 17.8619.40 346.5
相关系数的统计学意义判断 确定自由度(df):df=N-2 查表:上例 df=10-2=8,r0.05(8)=0.632、 r0.01(8)=0.765 判断:r=0.819 ∵ r>0.765 ∴ p<0.01
2.使用的前提条件 •只能施测一次或没有相应复本。 •一个测验能够被分成对等的两半。
3.注意事项: 计算分半信度先要对测验分半。不同的分半法可 能会得到不同的信度值。 为了使两半基本等值,可将项目按由易到难的顺 序排列编号,然后按奇数和偶数序号将项目分半。 由于分半信度实际上只是半个测验的信度,测验 越长、项目越多,两半分数的相关就越高。因此,对 长度不同的测验,要用校正公式。
举例: 10 名被试者在一个有 10 个条目的测验中得分如下, 求该测验 的分半信度?
测验题目得分 被试 1 2 3 4 5 6 7 8 9 10 1 2 2 2 1 1 2 2 2 2 2 2 2 1 2 0 2 2 2 2 2 2 3 2 1 2 0 0 1 1 2 2 1 4 1 2 2 1 1 2 2 2 2 1 5 2 1 1 0 0 2 1 0 2 2
2.使用的前提条件 (1)首先必须构造出两份以上的平行测验复本。 (2)被试有条件接受两个测验。 (3)迁移效应对测量结果影响不大。
3.注意之处: 对于稳定性与等值性系数,在报告结果时,也应报告 两次施测的间隔,以及在此间隔内被试的有关经历。
4、优缺点: 优点: (1) 一个测验的复本使得测验数目的增加, 对于所欲测量的属性相联 系的行为总体代表性强,因此,一个测验的两个复本在两三天至一周 对同一组被试施测时,获得的复本信度系数是相当准确的。 (2)测验的两个复本,如果在不同时间使用,其信度不仅可以反映在 不同时间的稳定性,而且还可以反映对于不同测题的一致性。 (3)两个复本在同时使用时,可以避免再测验信度的缺点。 缺点: (1)编制两个完全相等的测验是很困难的, (2)复本法只能减少而不能完全排除练习和记忆的影响。 (3)被试同时接受性质相似的两个测验可能减少完成测验的积极性。
5、 适用范围 (1)如果两个复本的施测相隔一段时间,则称稳定与等值 系数。 稳定与等值系数既考虑了测验在时间上的稳定性, 也 考虑了不同题目样本反应的一致性, 因而是更为严格的信度 考察方法,也是应用较为广泛的方法。 (2)在实际应用时,为了抵消施测顺序的效应,应该有半 数的被试先作 A 本再作 B 本,另一半被试先作 B 本再作 A 本。 (3)复本测验不仅适用于难度测验,也是估计速度测验信 度的最好方法。
rtt rx1x2
x x x x /n x ( x ) / n x ( x )
1 2 1 1 2 2 1 2 2 2 2
2
/n
X
rxx
1
X2
N
X1 X 2
S1S 2
rx1x2 相关系数 X1、X2 同一被试的前测和再测的分数 n 样本例数
2.使用的前提条件 (1)所测量的潜在特质必须是稳定的。 (2)遗忘和练习的效果基本抵消。 (3)在两次施测期间,被试在所要测查的心理特质方面 要求没有获得更多的学习和训练。 3.注意之处: 在报告重测信度时,应说明两次施测的间隔,以及在 此期间内被试的有关经历。
单双 之差 1 0 -1 0 -2 1 -1 1 2 1 2
合计 18 17 13 15
X1
X
N
i

50 5.0 10
X2
X
N
i

48 4.8 10
S1
(X (X
i
X a )2
N X b )2

52 5.2 2.28 10
S2
i
N

31 3.16 1.78 10
第1次成绩:86 58 79 64 91 48 55 82 32 75 第2次成绩:83 52 89 78 85 68 47 76 25 56 X1 X 2 X X 计算
公式: r xx
N
1
2
S1S 2
计算两组平均值:X1=67 X2 =65.9 计算两组标准差:S1 = 17.86 S2 =19.40 计算两次成绩的积和:∑X1X2 ∑X1X2=86×83+58×52+79×89+64×78+91×85+48×68+ 55×47+82×76+32×25+75×56 =46993 样本例数:N=10 计算相关系数
一、 复本信度 1.含义和计算 复本信度指的是两个互相平行的测验测量同 一组被试所得结果的一致性程度。 其大小等于
同一组被试在两平行测验上所得分数的皮尔逊积
X X
1
2
差相关系数
rxx
N
X1 X 2
S1S 2
复本等值要符合下列条件: 各份测验测量的是同一种心理特性。 各份测验具有相同的内容和形式。 各份测验的题目不应重复。 各份测验题目数量相等,难度和区分度大体相同。 各份测验的分数分布(平均数和标准差)大致相等。 复本编好后,应再测一次,以确保各份测验的等值。
rtt rx1x2
46993 670*659 /10 48080 670 /10 47193 659 /10
2 2
0.82
相关系数的统计学意义判断 确定自由度(df):df=n-2 查表:上例 df=10-2=8,r0.05(8)=0.632、 r0.01(8)=0.765 判断:r=0.819 ∵ r>0.765 ∴ p<0.01
X X
1
2
rxx
N
X1 X 2
S1S 2
275 5.0 4.8 10 0.862 2.281.78
判断相关(查表) 计算校正分半信度
wk.baidu.com
2rhh 2 0.862 rtt 0.926 1 rhh 1 0.862
其它计算分半信度方法 斯皮尔曼–布朗校正分半信度的公式假设两半测验分数的变 异相等,如实际情况不符合这一假设,应采用下列公式计算。 弗拉南根(Flanagan)公式
区分:等值性系数和稳定性—等值性系数 图示
稳定性系数: T1—— t ——T1 等值性系数: T1—— ——T2 稳定性—等值性系数:T1—— t ——T2
稳定性系数:即重测信度。 等值性系数:如果两个复本测验是同时连续施测的,则称这种复本信 度为等值性系数。 稳定性—等值性系数: 如果两个复本测验是相距一段时间分两次施测, 则称这种信度为稳定性与等值性系数。
实 得 分 数
包括68%实得分数的全距 X在T上的回归 SE 真实分数(T)
(X)
第二节
信度的估计方法
一、 重测信度 1.含义和计算 重测信度指的是用同一个量表对同一组被试施测两次 所得结果的一致性程度。 其大小等于同一组被试在两次测验上所得分数的皮尔逊 积差相关系数。当信度值较大,说明前后两次测量的结果 比较一致,测量工具比较稳定,被试的潜在特质受被试状 态和环境变化的影响较小。
第1次成绩:86 58 79 64 91 48 55 82 32 75 第2次成绩:83 52 89 78 85 68 47 76 25 56 计算
公式: 计算两组的总和: ∑ X1=670, ∑X2 =659 计算两组的平方和: ∑ X21=48080, ∑X22 =47193 计算两次成绩的积和:∑X1X2 ∑X1X2=86×83+58×52+79×89+64×78+91×85+48×68+ 55×47+82×76+32×25+75×56 =46993 样本例数:n=10 计算相关系数
5、优缺点: 优点: (1) 它最符合重复测验的涵义,是重复测验最简单最明 确的方式 (2)首测和再测只需要一套测验题目,省时、省力 (3)同一套题目无论施测几次,所测的属性是完全相同的。 缺点: (1)同一组被试对同一个测验先后两次作答相互之间是不 独立的。 (2)如果两次施测时间间隔较长,在此期间被试的身心发 展,新知识的获得,都会使两次测验结果不相同。 (3)同一个被试对现一个测验先后两次作答,对测验的兴 趣不同,影响测验结果。 (4)两次施测的环境不同,也是产生测量误差的因素。
一、 分半信度 1.含义和计算 分半信度,又叫内部一致性系数,指的是将一个测验分成对等 的两半后,所有被试在这两半上所得分数的一致性程度。 其大小等于同一组被试在两半测验上所得分数的皮尔逊积差相 关系数的校正值。 斯皮尔曼——布朗公式:
2rhh rtt 1 rhh
rhh 为两半分数的相关系数 rtt 为校正后(原测验长度时)信度的估计值
第三讲
测量信度
本讲内容:

什么是信度 信度的估计方法有哪些 怎样提高测量信度 信度的作用有哪些
第一节
信度概述
一、什么是信度 理论:信度指的是测量结果的稳定程度。也就是若能用 同一测量工具反复测量某人的同一种潜在特质,则其多次 测量的结果之间的一致性程度就叫信度。信度有时也叫测 量的可靠性。
4、时间间隔的把握 间隔时间越长,稳定性系数越低。适宜时间间隔依照 测验目的、性质及被试特点而定。几分钟至几年。 年幼儿童,间隔要小;年长群体,间隔可大。智力测 验的间隔不能太短,成就测验的间隔不能太长。 一般间隔时间不超过六个月。 (即不能让被试记住上 一次测验的内容,又不能让其特质发生变化,或对所学知 识产生遗忘)
11
6 2 0 2 0 0 1 1 1 1 1
9
7 1 0 1 0 0 1 0 1 1 1
6
8 0 1 1 0 0 1 0 0 0 0
3
9 0 0 1 0 0 1 0 1 0 0
3
10 1 0 1 0 0 0 0 0 0 1
3
单号 得分 7 4 7 1 1 7 4 6 7 6 50
双号 得分 6 4 8 1 3 6 5 5 5 5 48
操作: 1、信度乃是一个被测团体的真分数的变异数与实得分 数的变异数之比,即:rxx=S2T/S2X 2、信度是一个被试团体的真分数与实得分数的相关系 数TX 的平方,即: rxx= 2TX 3、信度乃是一个测验与它的任意一个平行测验的相关 系数XX ,即: rxx= XX
二、信度的指标 (一)信度系数:大部分情况下,信度是信度系数为指标,它是一种 相关系数。理论上说就是真分数方差与实得分数的方差的比值,公式 2 是:rxx=ptx (二)信度指数:是真分数标准差与实得分数的标准差的比值,公式 是: 2 2 信度指数的平方就是信度系数 rxx=ST /SX (三)标准误:指出个人测验分数的变异量。信度系数表示一组测量 的实得分数与真分数的符合程度,标准误表示个人测验分数的变异 量。 用一组被试两次测量结果来代替同一个人反复实测, 有了信度的另一 个指标: 测量标准误。测量的标准误与信度之间呈反比关系:标准误越小,信 度越高;标准误越大,信度越低。
S S rtt 2(1 ) 2 St
2 a 2 b
Sa2 和 Sb2 分别表示两半测验分数的方差 St2 为测验总分的方差
举例(仍用上例) 计算 Sa2=[(7-5)2+ (4-5)2+ (7-5)2+ (1-5)2+ (1-5)2+(7-5)2+ (4 - 5)2+ (6 - 5)2+ (7 - 5)2+ (6 - 5)2] / 10=5.2 计算 Sb2 =[(6-4.8)2 + (4-4.8)2 + (8-4.8)2 + (1-4.8)2 + (6 -4.8)2 +(6-4.8)2 + (5-4.8)2 + (5-4.8)2 + (5-4.8)2 + (5 -4.8)2 ]/10 =3.16 计算 Sx2 = [(13-9.8)2+ (8-9.8)2+ (15-9.8)2+ (2-9.8)2+(4 - 9.8)2+ (13 - 9.8)2+ (9 - 9.8)2+ (11 - 9.8)2+(12 - 9.8)2+ (11 -9.8)2]/10=15.36
相关文档
最新文档