第四章 测量信度
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、信度的统计定义
信度是被试团体真分数方差与实得分数方差之rX比X :TX22
T2
2 E
2 X
2 T
2 E
2 X
信度是被试团体真分数与实得分数相关系数的平方:
rXX XX
rXX
2 TX
理论定义
操作定义
信度是一个测验X(A卷)与它的任意一个平行测验 (B卷)的相关系数。
两组测验分数之间的相关
方差相等时
rxx
2rhh 1 rhh
弗拉南根公式 卢尤公式
方差不等时
(二)同质信度
同质性 题目间的内部一致性
克龙巴赫 系数
各类 题型
类型 库-理信度
0、1 题型
K-R20 难度不同
k-R21 难度相近
四、评分者信度
含义 评分者评分的一致性
2评分者
rXY
rρ
方法
2个以上者 肯德尔和谐系数
真分数与实得分数相关的解释 信度系数和指数
测验B1
等值稳定性系数
测验A1
合适时距
测验B1
等值性系数
含义
两等值测验 最短时间内 对同组对象 施测结果r
程序
A卷
最 短 时 距
等值
B卷
性
误差
内容 取样
评价
优点
代表性增强,信度更准 避免练习、记忆效应
不足
编制复本难 影响积极性
触类旁通 顺序效应
等值稳定性系数
含义
两等值测验 一定时间内 对同组对象 施测结果r
典型测验的信度高低水平
测验类型
成套成就测验 学术能力测验 成套倾向性测验 客观人格测验
兴趣问卷 态度量表
低中
高
.66 .92 .98 .56 .90 .97 .26 .88 .96 .46 .85 .97 .42 .84 .93 .47 .79 .98
各种信度反映的误差来源比较
信度类型
重测信度 等值性系数 等值稳定性系数
二、信度的作用
信度是测量过程中所存在的随机误 差大小的反映(评价测验好坏)
标准化学绩或能力测验 0.9以上 人格测验 0.8以上 教师自编学绩测验 0.6以上
信度可以用来解释个人测验分数的意义——测 量标准误(用区间估计来表示真分数的范围)
理论上:用一个测验对一个人测无数次,实测值的标 准差即为标准误
第一节 信度概述
一、信度的定义(reliability)
信度是指测量结果的稳定性程度。(测量结果的可 靠性程度。可信度。)
信度就是测验在测量它所测东西的一致性。或者说, 就是同一测验先后测同一对象时所得分数的一致性。
信度系数是表示测量结果的稳定性程度的指标。记 为:
信度系数r的XX 值域:[0,1]
一致性百分比法
(两次测验合格人数+两次测验不合格人数)/测验总人数
第三节 提高测验信度的方法
一、影响测量信度的因素
试问: 1)真分数的方差是多少? 2)各种信度的误差是多少?
分析结果
信度类型 重测复本
rXX 0.70
分半信度 0.80
源自文库
两者之差
误差源 时间、内容
内容取样
时间取样
误差的方差
1-0.70=0.3 1-0.80=0.2 0.3-0.2=0.1
评分者信度 0.92
总误差方差 真分数方差
评分者差异
1- 0.92=0.08 0.2+0.1+0.08=0.38 1-0.38=0.62
直接解释
信度系数 决定系数
间接解释
rXX
∵ r2XT = ST²/SX² =rXX ∴ rXX为各方差的百分比
rXX=0.90
S2X分为 各S2E和S2T
∵误差源不同 信度估计法不同
间接解释范例
例2-13:设有两平等的创造力测验
(A和B)。现: 1)间隔两月施测100人,其信度为0.70; 2)两卷分半信度校正值为0.80; 3)第2个评分者随机抽50份,信度0.92;
程序
A卷
一 定 时 距
误差
内容取样 时间
等值性
B卷
稳定性
等值稳定性系数
反映题目间的差别、两次实测时的情境、被试 特质水平方面的差异。
两个测验要具有更高的等值性 测验的时距要根据问题性质和测量目的来定 经费的问题 报告结果时,应报告间隔的时间
等值稳定性系数与重测、等值性系数 谁得估计更严格,为何?
造作上:用一组被试两次施测的结果之间的差异来表 示,差异的分布为标准误
SE SX 1 rXX
例题
某智力测验的信度为0.95,标准差为15,某儿 童得分为120分,试估计真分数的范围。
SE=3.35 120-1.96*3.35 120+1.96*3.35
信度可以帮助进行不同测验分数的比较(一个人在 不同测验上的得分是否有显著差异)
A卷
时间
一
定 时 距
太短 练习效应 记忆效应
太长 身心变化
稳定 性
A卷
评价
优点
省力、省时 测量属性相同 提供随时间变化的资料
不足
时间间隔长短 被试的积极性
适用范围 所测心理特质稳定
运动技能 速度
二、复本信度
两个平行测验测量同一批被试所得结果的一致性 程度。(积差相关)
等值性系数 测验A1
最短时距
②复本信度:两个平行测验测量同一批被试 所得结果的一致性程度。
③分半信度:将一个测验分成对等两半后, 所有被试在这两半上所得分数的一致性程度。
④同质性信度:指测验内部所有题目间的一
致性程度,也叫内部一致性系数。
KR20
⑤评分者信度
KR21
系数
一、重测信度
含义
程序
误差
同一测验
同组对象
前后测2次 相关系数
不同测验的原始分不能直接比较
转换成相同尺度的标准分数(Z分数或T分数)
求标准误
求Z值
SEd S 2 rXX rYY
Z
Z1 Z2
1* 2 rXX rYY
测验分数的比较与平均数差 异显著性检验是一回事吗?
第二节 信度的估计方法
信度的估计方法
①重测信度:用同一个量表对同一组被试施 测两次结果的一致性程度。
分半信度 同质性信度 评分者信度
误差来源
时间 内容 时间和内容 内容 内容 评分者之间的差异
注意问题
以上方法仅适用于常模参照测验 目标参照测验要以概化理论为基础进行处理
以上方法仅适用于难度测验 速度测验的信度问题
目标参照测验的信度
前期目标预测测验和后期目标检测测验的比较 (第二次达标的人在第一次测试中达标的比例)
三、内部一致性信度
含义
测验 各题间 一致性
题目 一致
性
是否测量 类型 同一特性
同质性 信度
内容 取样
分半 信度
(一)分半信度
将一个测验分成对等两半后,所有被试在这两半 上所得分数的一致性程度。
只能测一次或没有副本的情况下使用 要把题目分成对等的两半(分半的方法不同,结
果不同)
公式
斯皮尔曼 -布朗公式