5心理测量 第五章 经典测验理论——信度

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4
5
18
324
05
2
4
5
3
14
196
∑R=60 ∑R2=830
信度系数 稳定性系数
估计方法 重测法(积差相关)
应用 人格、速度测验
等值性系数 等值稳定性系数
复本法(积差相关) 复本重测法(积差相关)
智力、学绩、速度 智力、学绩、人格
内部一致性系数
1. 分半法(积差相关,斯皮 尔曼——布朗公式校正) 1. 库德——理查森公式 1. α系数(克伦巴赫系数)
rDD

rxx
ryy 2
rxy
1 rxy
rxx X变量信度 ryy Y变量信度 rxy XY变量相关
某测验信度为0.8,前后测相关为0.8,差异分数的信度为何? 某测验信度为0.8,前后测相关为0.5,差异分数的信度为何?
三、特殊的信度问题
3、合成分数(Composite scores)
02
10
10
100
100
100
03
9
10
81
100
92
04
6
6
36
36
36
05
10
10
100
100
100
06
7
8
49
64
56
07
5
4
25
16
20
08
7
8
49
64
56
09
9
9
81
81
81
10
4
4
16
16
16
∑X=75
∑Y=78
∑X2=601 ∑Y2=658 ∑XY=627
二、估算信度系数的方法
复本信度的估计可分为两种情况: a. 即刻施测或连续施测:其相关系 数大小只反映两个复本测验的题目 差异所带来的变异情况。这种情况 下,复本信度称为等值性系数
Spearman-Brown公式的通用形式是这 样的:
rXX=nrhh / {1+(n-1)rhh } 其中n为测验题目增加或缩减的倍数, rhh是计算相关得到的测验的信度, rXX是校正后测验的信度。
五、影响信度的因素
分量表的α系数 如果抽取其中部分分量表的题目组成新
的测验,必须重新计算信度
四、信度系数的作用
1、评价测验 rXX=1.00,理想化的 智力、能力倾向、成就,0.90以上; 人格、兴趣、态度,应0.80-0.85。 当rXX<0.70,不能用,或扔,或重编 当rXX≥0.70,可用于团体间的比较; 当rXX≥0.85时,可用于鉴别个人。
5
-3
9
3
3
4
3
0
0
4
4.5
7
6.5
-2
4
4
4.5
3
2
2.5
6.25
5
6
7
6.5
-0.5
0.25
6
7
9
9
-2
4
7
8
5
4
4
16
8
9
10
10
-1
1
9
10
8
8
2
4
∑D2=44.5
被试 评分者1 评分者2 评分者3 评分者4 等级和R R2
01
1
2
1
2
6
36
02
3
1
2
1
7
49
03
5
3
3
4
15
225
04
4
5
一、什么是信度?
信度(Reliability)是指测量结果的一致性或 稳定性。信度的大小用信度系数来表示
定义1:一被测团体的真分数变异数(方差) 与观察分数的变异数之比。
定义2:一被测团体的真分数与观察分数的 相关系数的平方。
定义3:一个测验X与其平行测验X’的相关 系数。
二、估算信度系数的方法
1225
1296
1260
∑X=382
∑Y=374 ∑X2=14624 ∑Y2=14014 ∑XY=14311
二、估算信度系数的方法
分半之后,每半测验的题目只相当于原测验 的1/2,也就是说,样本数少了一半,信度 偏小,需要修正
斯皮尔曼-布朗( Spearman-Brown)公
r r 式:rXX=2 hh /(1+ hh )
四、估算信度系数的方法
b. 间隔一段时期进行第二次施测: 其相关系数既反映测验形式上的变 化,也反映时间上的变化,这种相 关系数称为稳定性与等值性系数。
从数值上,稳定性与等值性系数应 既小于稳定性系数,又小于等值性 系数。
二、估算信度系数的方法
3、内部一致性系数 a、分半信度:实施一次测验后,将 测验分为等值的两半,分别计算被 试在两半测验上的得分,再计算其 相关系数。此相关系数就代表了两 半测验在内容取样上的一致性程度
序号 1 2 3 4 5 6 7 8 9 10
六个项目进行分半的十种可能方法
分半A
分半B
1,2,3
4,5,6
1,2,4
3,5,6
1,2,5
3,4,6
1,2,6
3,4,5
1,3,4
2,5,6
1,4,5
2,3,6
1,5,6
2,3,4
2,3,5
1,4,6
2,4,5
1,3,6
2,4,6
1,3,5
Cn/2*n
Spearman-Brown公式要求:两半测验的 方差齐性。(方差F检验,方差齐性检验)
二、估算信度系数的方法
在数据达不到这一要求时(方差不齐性) 卢仑/卢龙Rulon公式:
rXX =1-Sd2/ Sx2
弗朗那根Flanagan公式:
rXX =2[1-(Sa2+ Sb2) ] / Sx2
二、估算信度系数的方法
要计算分半信度,首先遇到的问题是 如何分半,直接分成前后两个部分是 不可取的,因为前后两部分项目在类 型和难度上都有所不同,而且会受到 受练习效应或疲劳等因素的影响,通 常采用奇偶分半法
被试
奇数题总分 偶数题总分
(X)
(Y)
X2
Y2
XY
01
38
02
37
03
38
04
41
05
例子:某被试在韦克斯勒智力测验中言语智 商为102,操作智商110,这两个分数都是 100为平均数,15为标准差的标准分数( IQ=100+15Z)。言语测验和操作测验的 分半信度分别为0.87和0.88,那么他的操作 智商是否显著高于言语智商?
五、影响信度的因素
一、测量过程 1、主试:不按规定施测、给予协助、制造紧
标准误,我们可以根据每个人的实际测量分数 估计出真分数可能范围(置信区间),一般采 用95%和99%两种置信水平: X—1.96SEM< Xt < X+1.96SEM X—2.58SEM< Xt < X+2.58SEM
四、信度系数的作用
例子:假设一次智力测验中,某个被试的IQ 为100分,这是否是他的真实水平?如果再 测一次,他的分数还是100吗?,但是如果 知道信度,我们可以估计他智商的得分范围
如果该测验的标准差是15,信度系数是 0.84,那么他智商的真实得分范围是多少?
四、信度系数的作用
3、比较不同测验分数的差异 测量标准误和测验信度在评价两个测验
分数是否有明显差异时也非常重要。 通过差别分数的标准误,可以比较两个
人不同分数的差别和一个被试在两个同 类测验上的差别
四、信度系数的作用
α系数来表示,使用范围广泛
被试 题目1 题目2 题目3 题目4 题目5 题目6 总分Xt Xt2
01
3
4
3
2
1
4
17
289
02
6
3
4
5
4
6
28
784
03
1
3
1
2
4
5
16
256
04
6
2
2
1
5
3
19
361
05
5
3
1
2
4
2
17
289
∑X
21
15
11
12
18
20
97 1979
∑X2
107
47
31
38
74
90
人格、学绩、智力、选拔
1、斯皮尔曼等级相关法 评分者信度系数
2、肯德尔和谐系数
作文、创造、投射、道德
三、特殊的信度问题
1、速度测验的信度
对于速度测验,无法使用内部一致 性系数,只能使用重测法和复本法
三、特殊的信度问题
把测验题目分成两半,分开 印刷然后分别是总测验时间 的一半来实测,计算两半测 验得分的相关系数,同样要 进行斯皮尔曼—布朗校正。
质方面没有获得过学习和训练 注意提高被试的积极性
二、估算信度系数的方法
2、复本信度 平行测验信度 parallel form reliability 对一组被试用两个复本测验(平行测
验)施测,计算积差相关系数,就是复 本信度。
被试 测验A(X) 测验B(Y)
X2
Y2
XY
01
8
9
64
81
72
四、估算信度系数的方法
Kuder-Richardson库德-理查森公式,适合 0、1计分
K-R20 当题目难度接近时,每个项目的通过率应基 本相等,我们就不用逐个题目计算通过率
K-R21 难度:某题目上,答对人数和总人数的百分比
被试 01 02 03 04 05 06 07 08 09 10
三、特殊的信度问题
把整个时限分成四等分,测验完 成后,把被试在第一、第四两个 时段的分数相加,第二第三时间 段的分数相加作为两半得分,计 算相关系数,并用斯皮尔曼—布 朗公式校正。
三、特殊的信度问题
2、差异分数Different scores
受测者在两个测验的分数的差值(D) D=X-Y( D=后侧-前测) 通常用于反应进步幅度
100
100
100
03
9
10
81
100
92
04
6
6
36
36
36
05
10
10
100
100
100
06
7
8
49
64
56
07
5
4
25
16
20
08
7
8
49
64
56
09
9
9
81
81
81
10
4
4
16
16
16
∑X=75
∑Y=78
∑X2=601 ∑Y2=658 ∑XY=627
二、估算信度系数的方法
估计重测信度时,应注意以下几点: 重测时间间隔 重测信度测量的心理特性必须是稳定的 两次实测的间隔期,被试所测得的心理特
40
06
36
07
38
Leabharlann Baidu
08
39
09
40
10
35
37
1444
1369
1406
37
1369
1269
1369
36
1444
1296
1369
39
1681
1521
1599
39
1600
1521
1560
34
1296
1156
1224
38
1444
1444
1444
39
1521
1521
1521
39
1600
1521
1560
36
多个测验分数加总的合并分数
分数合成后,信度倾向于提高
测验间的相关越高,合成信度越高
rss
1
k
k (krii ) (k 2 k )rij
rii 平均测验信度 rij 平均测验相关
k 测验数目
三、特殊的信度问题
4、分量表的信度 有些量表是测量单一心理特质、心理内
容的,可计算全量表的信度系数 有些量表由多种分量表构成,应计算各
1、重测信度(test-retest reliability) 用同一测验,对同一组被试进行前后两次 施测,所得相关系数就叫重测信度。
重测信度反映测验跨时间的稳定性,又称 为稳定性系数。
公式:皮尔逊积差相关
被试
第一次测验 第二次测验
(X)
(Y)
X2
Y2
XY
01
8
9
64
81
72
02
10
10
张气氛等 2、施测情景:噪音、通风、光线、测验工具 二、被试 1、单个被试:生理心理因素 2、被试团体:异质团体
五、影响信度的因素
三、测验工具 1、测验项目的代表性 2、测验项目的同质性程度 3、测验的难度 4、测验的长度 四、心理特质的特点 五、不同的信度估计方法
五、影响信度的因素
C10*20=92378
信度估计 0.64 0.68 0.82 0.79 0.88 0.81 0.82 0.72 0.71 0.74
二、估算信度系数的方法
b、同质性信度 (homogeneity reliability)
同质性信度主要反映测验能够测量相同 内容或特质的程度,或者说所有测验题 目得分之间的一致性。
典型信度系数 0.95 0.90 0.85
0.80
0.75 0.70 0.65 0.60 0.55 0.50
信度系数的意义
测验类型
解释
测量误差几响乎没有影
能力、智力、成就
高到中等的信度
人格测验和态度、兴 趣等一些等级量表
课堂测验
中到低的信度
投射测验
低信度 真分数和误差对测验
四、信度系数的作用
2、解释个人分数 信度系数可以更加精确的解释个人分数,根据
5 0.5 0.5 0.25
题目5 0 0 1 0 1 0 0 0 1 1
4 0.4 0.6 0.24
题目6 0 0 1 0 1 0 0 0 1 1
4 0.4 0.6 0.24
四、估算信度系数的方法
克伦巴赫( Cronbach)α系数 非0、1计分,如人格测验、态度测验 0、1计分的测验同样可以采用 大多测验采用克伦巴赫( Cronbach)
∑X p q pq
题目1 1 1 0 1 0 1 1 1 1 1
8 0.8 0.2 0.16
题目2 0 0 0 1 1 1 1 1 1 1
题目3 0 0 0 1 0 1 1 1 0 1
题目4 0 1 0 0 0 0 1 1 1 1
7 0.7 0.3 0.21
5 0.5 0.5 0.25 ∑pq=1.35
二、估算信度系数的方法
4、评分者信度 主观题时要考虑评分者信度。 如果是两个评分者,计算等级相关
系数。 如果是多个评分者,需计算
Kendal肯德尔和谐系数
被试 01 02 03 04 05 06 07 08 09 10
甲评分者 转换等级 乙评分者 转换等级 等级差D
D2
1
1
2
1
0
0
2
2
6
相关文档
最新文档