第四章 测量信度

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二、信度的统计定义
信度是被试团体真分数方差与实得分数方差之rX比X :TX22
T2
2 E
2 X
2 T
2 E
2 X
信度是被试团体真分数与实得分数相关系数的平方:
rXX XX
rXX
2 TX
理论定义
操作定义
信度是一个测验X(A卷)与它的任意一个平行测验 (B卷)的相关系数。
两组测验分数之间的相关
方差相等时
rxx
2rhh 1 rhh
弗拉南根公式 卢尤公式
方差不等时
(二)同质信度
同质性 题目间的内部一致性
克龙巴赫 系数
各类 题型
类型 库-理信度
0、1 题型
K-R20 难度不同
k-R21 难度相近
四、评分者信度
含义 评分者评分的一致性
2评分者
rXY

方法
2个以上者 肯德尔和谐系数
真分数与实得分数相关的解释 信度系数和指数
测验B1
等值稳定性系数
测验A1
合适时距
测验B1
等值性系数
含义
两等值测验 最短时间内 对同组对象 施测结果r
程序
A卷
最 短 时 距
等值
B卷

误差
内容 取样
评价
优点
代表性增强,信度更准 避免练习、记忆效应
不足
编制复本难 影响积极性
触类旁通 顺序效应
等值稳定性系数
含义
两等值测验 一定时间内 对同组对象 施测结果r
典型测验的信度高低水平
测验类型
成套成就测验 学术能力测验 成套倾向性测验 客观人格测验
兴趣问卷 态度量表
低中

.66 .92 .98 .56 .90 .97 .26 .88 .96 .46 .85 .97 .42 .84 .93 .47 .79 .98
各种信度反映的误差来源比较
信度类型
重测信度 等值性系数 等值稳定性系数
二、信度的作用
信度是测量过程中所存在的随机误 差大小的反映(评价测验好坏)
标准化学绩或能力测验 0.9以上 人格测验 0.8以上 教师自编学绩测验 0.6以上
信度可以用来解释个人测验分数的意义——测 量标准误(用区间估计来表示真分数的范围)
理论上:用一个测验对一个人测无数次,实测值的标 准差即为标准误
第一节 信度概述
一、信度的定义(reliability)
信度是指测量结果的稳定性程度。(测量结果的可 靠性程度。可信度。)
信度就是测验在测量它所测东西的一致性。或者说, 就是同一测验先后测同一对象时所得分数的一致性。
信度系数是表示测量结果的稳定性程度的指标。记 为:
信度系数r的XX 值域:[0,1]
一致性百分比法
(两次测验合格人数+两次测验不合格人数)/测验总人数
第三节 提高测验信度的方法
一、影响测量信度的因素
试问: 1)真分数的方差是多少? 2)各种信度的误差是多少?
分析结果
信度类型 重测复本
rXX 0.70
分半信度 0.80
源自文库
两者之差
误差源 时间、内容
内容取样
时间取样
误差的方差
1-0.70=0.3 1-0.80=0.2 0.3-0.2=0.1
评分者信度 0.92
总误差方差 真分数方差
评分者差异
1- 0.92=0.08 0.2+0.1+0.08=0.38 1-0.38=0.62
直接解释
信度系数 决定系数
间接解释
rXX
∵ r2XT = ST²/SX² =rXX ∴ rXX为各方差的百分比
rXX=0.90
S2X分为 各S2E和S2T
∵误差源不同 信度估计法不同
间接解释范例
例2-13:设有两平等的创造力测验
(A和B)。现: 1)间隔两月施测100人,其信度为0.70; 2)两卷分半信度校正值为0.80; 3)第2个评分者随机抽50份,信度0.92;
程序
A卷
一 定 时 距
误差
内容取样 时间
等值性
B卷
稳定性
等值稳定性系数
反映题目间的差别、两次实测时的情境、被试 特质水平方面的差异。
两个测验要具有更高的等值性 测验的时距要根据问题性质和测量目的来定 经费的问题 报告结果时,应报告间隔的时间
等值稳定性系数与重测、等值性系数 谁得估计更严格,为何?
造作上:用一组被试两次施测的结果之间的差异来表 示,差异的分布为标准误
SE SX 1 rXX
例题
某智力测验的信度为0.95,标准差为15,某儿 童得分为120分,试估计真分数的范围。
SE=3.35 120-1.96*3.35 120+1.96*3.35
信度可以帮助进行不同测验分数的比较(一个人在 不同测验上的得分是否有显著差异)
A卷
时间

定 时 距
太短 练习效应 记忆效应
太长 身心变化
稳定 性
A卷
评价
优点
省力、省时 测量属性相同 提供随时间变化的资料
不足
时间间隔长短 被试的积极性
适用范围 所测心理特质稳定
运动技能 速度
二、复本信度
两个平行测验测量同一批被试所得结果的一致性 程度。(积差相关)
等值性系数 测验A1
最短时距
②复本信度:两个平行测验测量同一批被试 所得结果的一致性程度。
③分半信度:将一个测验分成对等两半后, 所有被试在这两半上所得分数的一致性程度。
④同质性信度:指测验内部所有题目间的一
致性程度,也叫内部一致性系数。
KR20
⑤评分者信度
KR21
系数
一、重测信度
含义
程序
误差
同一测验
同组对象
前后测2次 相关系数
不同测验的原始分不能直接比较
转换成相同尺度的标准分数(Z分数或T分数)
求标准误
求Z值
SEd S 2 rXX rYY
Z
Z1 Z2
1* 2 rXX rYY
测验分数的比较与平均数差 异显著性检验是一回事吗?
第二节 信度的估计方法
信度的估计方法
①重测信度:用同一个量表对同一组被试施 测两次结果的一致性程度。
分半信度 同质性信度 评分者信度
误差来源
时间 内容 时间和内容 内容 内容 评分者之间的差异
注意问题
以上方法仅适用于常模参照测验 目标参照测验要以概化理论为基础进行处理
以上方法仅适用于难度测验 速度测验的信度问题
目标参照测验的信度
前期目标预测测验和后期目标检测测验的比较 (第二次达标的人在第一次测试中达标的比例)
三、内部一致性信度
含义
测验 各题间 一致性
题目 一致

是否测量 类型 同一特性
同质性 信度
内容 取样
分半 信度
(一)分半信度
将一个测验分成对等两半后,所有被试在这两半 上所得分数的一致性程度。
只能测一次或没有副本的情况下使用 要把题目分成对等的两半(分半的方法不同,结
果不同)
公式
斯皮尔曼 -布朗公式
相关文档
最新文档