心理测量学误差及其检验1_PPT幻灯片

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
等值 性
程序
A卷
最 短 时 距
B卷
误差
内容 取样
复本等值的条件
● 各测验测量的是同一种心理特质; ● 各测验具有相同的内容和形式; ● 各测验的题目不应重复; ● 各测验题目数量相等;各测验难度和区分度大体相同; ● 各测验的分数分布(标准差和平均数)大体相同; ● 复本编制好后,应再测一次,以确保等值。
弗拉南根公式 卢尤公式
方差相等时
方差不等时
使用条件
▪ 测验只能施测一次或没有复本的情况下使用. ▪ 当一个测验无法分成对等的两半时不宜使用.
2、同质信度(Homogeneity raliability)
同质性 题目间的内部一致性
克龙巴赫 系数
各类 题型
类型 库-理信度
二值 记分
(四)评分者信度(Scorer raliability)
真分数方差与观测分数方差的比值
r XX
S
2 T
S
2 X
信度是反映测量中随机误差大小的指标。
三、 信度评估的方法
信度
重测信度 复本信度
内部一致性 信度
分半信度 来自百度文库质性信度
评分者信度
(一)重测信度(Test-retest reliability)
含义
同一测验 同组对象 前后测2次 相关系数
稳定 性
程序
▪ 被试对每个复本的反应计算出分半信度为0.80. ▪ 同时,我们将另一个评分者随机抽取50份卷子另
外评分,得到评分者信度为0.92。 ▪ 然后,我们对这这三种方法所产生的误差变异进
观察分数(X)与真分数(T)之 间是一种线性关系,并只相差一个随机误 差(E)。
即: X=T+E
关于测量误差还有如下假设:
▪ (1)如果对一个人测量无数次,其误差之和为0,平均 误差为0。
▪ (2) 误差与真分数相互独立,相关为0。 ▪ (3)一个团体的平均真分数等于该团体中所有被试实得
分数的平均值。 ▪ (4)对于一个团体来说,实得分数、真分数、和测量误
使用条件
▪ 第一,前提是有复本测验。 ▪ 第二,被试有条件接受两个测验(时间和经费等)。 ▪ 第三,报告结果时要报告两次测验的间隔及有关经历.
评价
优点
代表性增强,信度更准 一定程度避免练习、记忆效应
不足
编制复本难 影响积极性
触类旁通
重测信度与复本信度有何异同?
小结与问题
跨时间 一致性
内部 一致性
第一节 测量的误差及其来源
◆ 误差的定义 ◆ 误差的种类 ◆ 误差的来源
1、误差的定义
考研题
测量 因素
与测量目的无关
测量 结果
不准确 或不一致
误差:与测验目的无关的因素所导致的测验结果不一致或不准确的现象.
2、误差的种类
系统误差
随机误差
1.测验题目取样不当
测 2.测验题目格式不妥 量
3.测题的难度不当
差之间有如下关系:
SX2 ST2SE2
随机误差
在一次测验中,一个团体的实测分数的变 异数是由与测量目的有关的变异数、稳定但出 自无关来源的变异数和偶然但出自无关来源的 变异数所决定的。
S
2 X
S
2 T
S
2 E
S
2 T
S
2 V
S
2 I
S
2 X
S
2 V
S
2 I
S
2 E
二、信度的定义
信度指的是测量结果的稳定性程度(或一致性程度)。
工 具 4.测题或指导语用语不当
5.测验时限过短
......
施测过程
测 测主 意 评 试 试试 外 分 环 时因 干 记 境 间素 扰 分
测试 对象
应 测 测 练 反生 试 验 验 习 应理 动 焦 经 效 倾变 机 虑 验 应 向因
▪ 经典测验理论 ▪ 信度概念 ▪ 信度的评估方法 ▪ 信度系数的应用 ▪ 影响信度的因素
一、经典测验理论
考研题
成熟 标志
三大 支柱
20世纪50年代 Gulliksen
《心理测验理论》
基本假设 信度 效度
▪ Classical Test Theory(CTT)
基本假设与真分数
1、真分数
测验所得 未加工
理论定义 真正特质水平
操作定义 无数次测量结果的均值
▪ 经典测验理论(CTT)假定:
误差
A卷
一 定 时 距
A卷
时间
太短 练习效应 记忆效应
太长 身心变化
使用条件
▪ 第一,所测的心理特性必须是稳定的。 ▪ 第二,遗忘和练习的效果基本上相互抵消。 ▪ 第三,所测心理特质在两次施测的间隔时间内
没有获得更多的学习和训练。 ▪ 第四,报告结果时要报告两次测验的间隔及有
关经历.
评价
优点
省力、省时 测量属性相同 提供随时间变化的资料
试题之间 有何关系?
跨形式 一致性
(三)内部一致性信度
含义
测验 各题间 一致性
题目 一致

同质性 信度
类型
分半 信度
1、分半信度(Split-half raliablity)
奇偶题 分半
难易:低高 两半相似: M、S 项目组间相关
分布常态
两半相关:rhh 校 正:rnn
校正方法
斯皮尔曼 -布朗公式
时间取样 内容取样 时间与内容取样 内容取样 内容的一致性 评分者间的差异
友情提示
▪ 实际上,有多少种误差的来源,就有多少 种信度估计的方法。一般来说,一个测验 哪种误差大,就应该用哪种误差估计。有 时一个测验需要几种信度估计。
操作演练
▪ 假设对100个六年级学生以两个月的时间间隔先 后施测一个创造力测验的A/B两个复本,所得的 等值与稳定性系数为0.70。我们还根据
含义
评分者评分的一致性 方法
2评分者 rXY
2个以上者 肯德尔和谐系数
附:确定信度的可接受水平
▪ 典型测验的一般标准
测验类型 标准化测验
人格测验 非标准化测验
最低标准 0.90
0.80-0.85 0.60-0.85
▪ 典型测验的信度高低水平
测验类型
低中

成套成就测验
.66 .92 .98
学术能力测验
不足
时间间隔长短
★ 时间间隔越长,重测信度越低; ★ 时间间隔视测验目的、性质、被试 特点而定; ★ 年幼儿童,间隔要小;年长成人,间隔可长; ★ 智力测验间隔不能太短,成就测验不能太长; ★ 一般间隔时间不超过6个月。
(二)复本信度(Alternate-form raliability)
含义
两等值测验 最短时间内 对同组对象 施测结果r
.56 .90 .97
成套倾向性测验 .26 .88 .96
客观人格测验
.46 .85 .97
兴趣问卷
.42 .84 .93
态度量表
.47 .79 .98
各种信度系数相应误差变异的来源
信度系数的类型
再测信度 复本信度(连续施测) 复本信度(间隔施测) 分半信度 同质性信度 评分者信度
误差变异的来源
相关文档
最新文档