心理咨询师三级第3节测验的信度PPT幻灯片
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、测验标准误(二级)
缘由:rXX
只反映X与T的符合程度 未反映个体测验分数的变异
测验中个体真分数的指标
理论上:一个个体多次测验结果分布的变异 实际上:一组个体两次测验结果分布的变异
测量标准误
测量误差分数分布的标准差
用途
衡量测量值(X)与测量对象真值(T)的 偏离程度的一种指标
S2T
S2E
S2X
S2T
S2E
S2X
(一)信度的定义
1、理论定义
真分数方差与观测分数方差的比值
rT2X
S
2 T
S
2 X
或
rT2X
1
S
2 E
S
2 X
T X E
ST2SX 2 SE 2
rT2X
SX2 SE2 SX2
2、操作定义
两组测验分数之间的相关系数 测量工具或结果的一致性(稳定性)程度
S
2 T
奇偶题 分半
难易:低高 两半相似:
M、S 项目组间相关
分布形态
内容
两半相关:rhh 校 正:rnn
2、校正方法(二级)
斯皮尔曼 -布朗公式
弗拉南根公式 卢尤公式
方差相等时
rnn
2rhh 1 rhh
方差不等时
(二)同质信度
同质性 题目间的内部一致性
克龙巴赫 系数
各类 题型
类型 库-理信度
(二级)
含义
两等值测验 最短时间内 对同组对象 施测结果r
等值 性
程序
A卷
最 短 时 距
B卷
误差
内容 取样
评价
优点
代表性增强,信度更准 避免练习、记忆效应
不足
编制复本难 影响积极性
触类旁通
重测复本信度(二级)
含义
两等值测验 一定时间内 对同组对象 施测结果r
等值性 稳定性
程序
A卷
一 定 时 距
B卷
误差
内容取样 时间
150 30
203.2 -
真正重量T 10 20 30 40 50
150 30
200 -
误 差E
2 -1 -3
1 1 0 0
3.2 1.8
定义 数学模型
T与X关系
X=T+E T=X-E
SX 2 ST2SE 2
二、信度的概念
S2T, S2E , S2X的关系与信度
SX2测验实得分数的方差; SE2为测验误差的方差,ST2为测验真分数的方差。
重测信度与复本信度有何异同?
重测复本信度与重测、复本信度 谁得估计更严格,为何?
小结与问题
跨时间 一致性
内部 一致性
试题之间 有何关系
跨形式 一致性
三、内部一致性信度
含义
测验 各题间 一致性
题目 一致
性
所有题目间 类型
的一致性
同质性 信度
两半测验 内容取样
分半 信度
(一)分半信度
1、分半条件与程序
信度概念 信度的评估方法 信度与测验分数的解释 影响信度的因素
第一单元 信度的概念
一、经典测验理论
成熟 标志
三大 支柱
20世纪50年代 古利科逊
《心理测验理论》
基本假设 信度 效度
Classical Test Theory(CTT)
(一)测量误差
1、定义
测量 因素
测量 结果
与测量目的无关
0、1 题型
K-R20 难度不同
k-R21 难度相近
四、评分者信度
(一)含义与方法
含义
评分者评分的一致性
0.9以上,才认为是客观的。
方法
2评分者
rXY
rρ
2个以上者 肯德尔和谐系数
(二)肯德尔和谐系数(二级)
应用范围和W系数
应用
K个评价者评N个被评者或作品 1个评价者先后K次评 N个被评者或作品
W范围 0~1
第三单元 信度与测验分数的解释
真分数与实得分数相关的解释
信度系数和信度指数 测量标准误
信度的评价
一、真分数与实得分数相关的解释 (一)信度系数和指数
直接解释
信度系数 决定系数
间接解释
rXX
∵ r2XT = ST²/SX² =rXX ∴ rXX为各方差的百分比
rXX=0.90
兴趣问卷 态度量表
低中 高 .66 .92 .98 .56 .90 .97 .26 .88 .96 .46 .85 .97 .42 .84 .93 .47 .79 .98
公式
三、解释个人分数的意义
——个体真分数估计(二级)
SE eSX 1rXX
置信度
TX1.96SE e
置信区间
D=.95
S2X分为 各S2E和S2T
∵误差源不同 信度估计法不同
用途
衡量测量值(X)与测量对象真值(T)的偏离程度的一 种指标
用来估计个人的真分数
信度系数可以解释为总的方差中有多少比例是由真 实分数的方差决定的。范围在0-1之间。
rXX=0:所有变异和差别都反映的是测量误差 rXX = 1:完全没有测量误差,所有变异均来自真实分数
同一测验 同组对象 前后测2次 相关系数
稳定 性
程序
误差
A卷
一 定 时 距
A卷
时间
太短 练习效应 记忆效应
太长 身心变化
2-4周为宜 不超过6个月
评价
优点
省力、省时 测量属性相同 提供随时间变化的资料
不足
时间间隔长短
适用范围 异质性
运动技能 速度
二、复本信度
S
2 X
rT2X
rT2XrXX
3、rXX值与测验误差的关系
S²T S²E
S²T S²E
S2 S²T E
r=0.50
r=0.75
r=0.90
(二)信度的指标 1、信度系数与信度指数
同一群人 几次测验结果
一致性
rXX rT2X
S
2 T
S
2 X
信度系数的 平方根
rTX
ST2 SX2
ST SX
用来估计个人的真分数
个人分数的误差
个体测验分数重测时的变化
公式
SE ESX 1rXX
个人分数的误差
实得分数 标准差
rXX越大:变化的可能性越小 rXX = 1:完全不变化
第二单元 信度评估的方法
不同的信度反映测验误差的不同来源。
重测信度
复本信度 重测复本信度 信度 内部一致性 分半信度
二、确定信度可接受水平
典型测验的一般标准
测验类型
最低标准
标准化测验
0.90
人格测验等
0.80-0.85
非标准化测验
0.60-0.85
低于0.70时,不能对个人作出预测或评价; 在0.70-0.85之间,可用于团体比较; 高于等于0.85,才能用来鉴别或预测个人成绩
典型测验的信度高低水平
测验类型 成套成就测验 学术能力测验 成套倾向性测验 客观人格测验
测量 效应
不准确
测验
或不一致 真值
3、误差来源
三层面模式
测量 工具
测试对象
施测 过程
(二)基本假设与真分数
1、分数
测验所得 未加工
无误差
理论上 真正特质水平
操作上 多个平等测验的平均数
2、基本假设
例2-1:某一物理测量结果(单位:微)
物质编号
A B C D E ∑ M
S² SE
实测重量X 12 19 27 41 51