第四章 测量信度
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分析结果
信度类型 重测复本 分半信度 rXX 0.70 0.80 误差源 时间、内容 内容取样 误差的方差
两者之差
评分者信度 0.92
总误差方差 真分数方差
时间取样
评分者差异
1-0.70=0.3 1-0.80=0.2 0.3-0.2=0.1 1- 0.92=0.08 0.2+0.1+0.08=0.38 1-0.38=0.62
第一节 信度概述
一、信度的定义(reliability)
信度是指测量结果的稳定性程度。(测量结果的可 靠性程度。可信度。) 信度就是测验在测量它所测东西的一致性。或者说, 就是同一测验先后测同一对象时所得分数的一致性。 信度系数是表示测量结果的稳定性程度的指标。记 为: 信度系数的值域:[0,1] rXX
题目 一致 性
是否测量 同一特性 同质性 信度
类型
内容 取样
分半 信度
(一)分半信度
将一个测验分成对等两半后,所有被试在这两半 上所得分数的一致性程度。
只能测一次或没有副本的情况下使用 要把题目分成对等的两半(分半的方法不同,结 果不同)
公式
斯皮尔曼 -布朗公式
弗拉南根公式 卢尤公式
方差相等时
选择测验时应注意
取样团体的变异性和能力水平
建立信度的团体与欲测团体是否一致
测量工具
试题取样(题目太少,考察的不全面)
试题之间的同质性程度 试题难度
时间间隔 智力的时间变化
间隔期 信度系数
同日或次日
1年 2~2.5年 5年 9年
0.90~0.95
0.85 0.80 0.75~0.80 0.78
第三节 提高测验信度的方法
一、影响测量信度的因素
被试
影 响 测 量 信 度 的 因 素 主试 施测环境
测量工具
施测间隔的时间
被试方面
身心状况、应试动机、作答态度等
样本团体异质性的影响 样本团体平均能力水平的影响
样本团体异质性的影响
特点
样本越异质,分数分布越广,S↑,r↑ ,测验越可靠
二、信度的统计定义
2 T rXX 信度是被试团体真分数方差与实得分数方差之比:2 X
T2
X2
E2
E2
T2
X2
信度是被试团体真分数与实得分数相关系数的平方:
2 rXX TX
rXX XX
理论定义
操作定义
信度是一个测验X(A卷)与它的任意一个平行测验 (B卷)的相关系数。
分析
散点图 计算
散点图
低
整段范围
高
样本团体平均能力水平的影响
团体平均水平太高或太低,使测验分数的分 布变窄,低估测量的信度
SE S X 1 rXX
例题
某智力测验的信度为0.95,标准差为15,某儿 童得分为120分,试估计真分数的范围。 SE=3.35 120-1.96*3.35 120+1.96*3.35
信度可以帮助进行不同测验分数的比较(一个人在 不同测验上的得分是否有显著差异)
等值性 稳定性
B卷
等值稳定性系数
反映题目间的差别、两次实测时的情境、被试 特质水平方面的差异。 两个测验要具有更高的等值性 测验的时距要根据问题性质和测量目的来定 经费的问题 报告结果时,应报告间隔的时间
等值稳定性系数与重测、等值性系数
谁得估计更严格,为何?
三、内部一致性信度
含义 测验 各题间 一致性
方差不等时
2rhh rxx 1 rhh
(二)同质信度
同质性 题目间的内部一致性
克龙巴赫 系数
各类 题型
类型 库-理信度
K-R20 难度不同
0、1 题型
k-R21 难度相近
四、评分者信度
含义 评分者评分的一致性 方法 2评分者
2个以上者 rXY rρ 肯德尔和谐系数
真分数与实得分数相关的解释
太长 身心变化
稳定 性
A卷
评价
优点
省力、省时 测量属性相同 提供随时间变化的资料
不足
时间间隔长短 被试的积极性
适用范围
所测心理特质稳定 运动技能 速度
二、复本信度
两个平行测验测量同一批被试所得结果的一致性 程度。(积差相关) 等值性系数 最短时距 测验A1 测验B1
等值稳定性系数
合适时距
测验A1
不同测验的原始分不能直接比较 转换成相同尺度的标准分数(Z分数或T分数) 求标准误
求Z值
SEd S 2 rXX rYY
Z Z1 Z 2 1* 2 rXX rYY
测验分数的比较与平均数差 异显著性检验是一回事吗?
第二节 信度的估计方法
信度的估计方法
①重测信度:用同一个量表对同一组被试施 测两次结果的一致性程度。 ②复本信度:两个平行测验测量同一批被试 所得结果的一致性程度。
注意问题
以上方法仅适用于常模参照测验 目标参照测验要以概化理论为基础进行处理
以上方法仅适用于难度测验 速度测验的信度问题
目标参照测验的信度
前期目标预测测验和后期目标检测测验的比较 (第二次达标的人在第一次测试中达标的比例) 一致性百分比法
(两次测验合格人数+两次测验不合格人数)/测验总人数
两组测验分数之间的相关
二、信度的作用
信度是测量过程中所存在的随机误 差大小的反映(评价测验好坏)
标准化学绩或能力测验 0.9以上 人格测验 0.8以上 教师自编学绩测验 0.6以上
信度可以用来解释个人测验分数的意义——测 量标准误(用区间估计来表示真分数的范围)
理论上:用一个测验对一个人测无数次,实测值的标 准差即为标准误 造作上:用一组被试两次施测的结果之间的差异来表 示,差异的分布为标准误
测验B1
等值性系数
含义 两等值测验 最短时间内 对同组对象 施测结果r
等值 性
程序 A卷
最 短 时 距
误差 内容 取样
B卷
评价
优点 代表性增强,信度更准 避免练习、记忆效应 不足 编制复本难 影响积极性 触类旁通 顺序效应
等值稳定性系数
含义 程序 A卷
一 定 时 距
误差 内容取样 时间
两等值测验 一定时间内 对同组对象 施测结果r
信度系数和指数
直接解释 rXX
∵ r2XT = ST² X² =rXX /S ∴ rXX为各方差的百分比
信度系数 决定系数
间接解释
S2X分为 各S2E和S2T
∵误差源不同 信度估计法不同
rXX=0.90
间接解释范例
例2-13:设有两平等的创造力测验 (A和B)。现: 1)间隔两月施测100人,其信度为0.70; 2)两卷分半信度校正值为0.80; 3)第2个评分者随机抽50份,信度0.92; 试问: 1)真分数的方差是多少? 2)各种信度的误差是多少?
典型测验的信度高低水平
测验类型 成套成就测验 学术能力测验 成套倾向性测验 客观人格测验 兴趣问卷 态度量表 低 .66 .56 .26 .46 .42 .47 中 .92 .90 .88 .85 .84 .79 高 .98 .97 .96 .97 .93 .98
各种信度反映的误差来源比较
信度类型 重测信度 等值性系数 等值稳定性系数 分半信度 同质性信度 评分者信度 误差来源 时间 内容 时间和内容 内容 内容 评分者之间的差异
③分半信度:将一个测验分成对等两半后, 所有被试在这两半上所得分数的一致性程度。
④同质性信度:指测验内部所有题目间的一 KR20 致性程度,也叫内部一致性系数。 ⑤评分者信度
KR21
系数
一、重测信度
含义 同一测验 同组对象 前后测2次 相关系数
程序
A卷
一 定 时 距
太短 练习效应 记忆效应
误差
时间Baidu Nhomakorabea
二、提高测验信度的常用方法
适当增加测验的长度 提 高 测 验 信 度 的 常 用 方 法 控制试题的难度分布 努力提高每道题的区分度
维持测验的同质性
规范施测程度、统一施测环境
保证被试有充裕的作答时间 严格控制评分误差 努力提高测验在被试中各个 同质亚团体上的信度