第六章++信度和效度(新)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
rxy为测验效度;Sv2为有效方差; Sx2为总方差。
3.效度与信度的关系
信度和效度的差别在于所考虑的误差 不同。信度考虑的是随机误差的影响;效 度考虑的误差还包括系统误差。 信度高,效度不一定高;效度高,信 度必定高。信度是效度的必要条件,但不 是充分条件。
二、信度的作用
解释真实分数与实得分数的相关。
说明可以接受的信度水平。
三、效度的性质
效度指的是测量结果的效度;
效度是连续性的;
效度同时也是针对测量目标而言的;
效度是从已有的证据推理而得到的。
第二节 信度的评估方法
一、重测信度 二、复本信度 三、内部一致性信度 四、评分者信度
一、重测信度
1.重测信度的概念 重测信度又称为稳定性系数,指同一 测验在不同的时间上对同一群体先后施测 两次的测验结果的一致性。这两次测验结 果的相关系数即为重测信度系数。
第六章 信度和效度
第一节 信度和效度概述
第二节
第三节
信度的评估方法
效度的评估方法
第一节
信度和效度概述
一、信度和效度的定义 1. 信度的定义 信度是指测验结果的可靠性、稳定 性和一致性。 ★信度实际上是对随机误差的一种 度量,它是从反面来考察随机误差的大 小。随机误差越大,信度越低,反之, 信度越高。
(1)应避免将测验取样的行为领域过于泛化。
(2)要注意测验分数中无关因素的影响。
3. 内容效度的应用 内容效度最适合于评估教育和职业 成就测验,也适合于某些用于选拔和分 类的人事测验,一般不适用于能力倾向 测验和人格测验。
二、效标关联效度
1.效标关联效度的概念:也称效标效度, 它反映的是测验分数与外在标准(效标)的相关 程度。 2.预测效度和同时效度 预测效度是指测验分数对任一段时间间隔 后被试行为表现的预测程度。 同时效度是指测验分数和同一时间采集的 效标材料之间的相关程度。
(1)重测信度一般只反映由 随机因素导致的变化,而不反映 被试行为的长久变化。 (2)不同行为受随机误差的 影响不同。
(3)重测信度的假设前提是:每一被试对 前一次测验的遗忘程度相同;每一被试在重测 的间隔期内没有学习与测验有关的其他材料。 这个假设不容易完全满足。 (4)有些解决问题型的测验不适合采用重 测的方式来考察其信度;只有不容易受重复影 响的测验,如感觉—运动型测验或人格测验较 适合采用重测的方式来考察其信度。
二、复本信度
1. 复本信度的含义 复本信度又称等值性系数,是以 两个功能等值而题目内容不同的测验 复本来测量同一群体,然后求得被试 在这两个测验上得分的相关系数。 2. 计算复本信度的目的 考察两个测验复本的题目取样或 内容取样是否等值。
3. 复本信度的优缺点
优点: 能够避免重测信度关于记忆、练习等方面的问题; 适用于进行长期追踪研究或调查某些干涉变量对测 验成绩的影响; 减少了辅导或作弊的可能性。 缺点: 不能完全消除练习的影响; 对于解决型的问题,容易产生解题的“迁移”问题。 有些测验较难找到完全等值的复本。
思考题:
1.简述信度和效度的定义及二者的关系。 2.信度的评估方法有哪些?简述各种方法的 含义。 3.效度的评估方法有哪些?简述各种方法的 含义。 4. 什么是评分者信度?其测算公式是什么? 5.影响信度和效度的因素分别有哪些?
K为评分者人数,N为被评定的人数或答卷数, Ri为每一个对象评定等级。
例如,有四名评分者,对六份答卷进行评分,所 评等级如下:
答卷编号 评分者 一 甲 乙 丙 丁 Ri 4 5 4 6 19 二 3 3 1 4 11 三 1 2 2 1 6 四 2 1 3 2 8 五 5 4 5 3 17 六 6 6 6 5 23
说明:
★预测效度适用于人员选拔、分类和安置等的测验。 ★同时效度适用于培训、绩效考核等方面的测验。
★同时效度和预测效度的差异的根源不是收集效标 的时间,而是在于测验目的的不同。前者多用于诊 断现在的状态,后者多预测未来的结果。
三、构想效度
构想效度是指测验能够测量到理论
上的构想或特质的程度。
四、影响效度的因素
2.重测的间隔时间
重测信度所考察的误差来源主要是时间的 变化所带来的随机影响,因此,必须注意间隔 时间的长短。间隔时间的长短要根据测验的性 质和目的来确定。如果希望测验成绩能够预测 较长时间的变化,则间隔时间应该较长。 例如,人格测验的重测间隔时间规定在两 周至6个月较为合适。
3.进行重测信度评估时注意的问题
真实分数 测得分数 系统误差
误差
随机误差
信度高低通常以相关系数表示, 称为信度系数。在理论上表示为实得 分数与真实分数相关的平方:
rxx
ST 2 SX
2
Sx为实得分数的标准差。
ST为真实分数的标准差;
2.效度的定义 效度是指所测量到的结果反映所想 要考察内容的程度。 用公式可以表示为:rxy=Sv2/Sx2
三、内部一致性信度
内部一致性信度主要反映的是测验 内部题目之间的相关关系,考察测验的 各个题目是否测量了相同的内容或特质。 它可分为分半信度和同质性信度。
(一)分半信度 将一份测验分为两部分,计算这两部分测 验之间的相关系数。 注意: 1.要分为可比的两半,常采用奇偶分半。 2.由于分半后题目的数量减半,使测验题 目变短,从而使信度人为地降低,因此应该进 行修正。
重测信度 复本信度(连续施测) 重测复本信度 分半信度 同质性信度 评分者信度
误差方差来源
时间取样 内容取样 时间取样和内容取样 内容取样 内容的异质性 评分者间的差异
五、影响信度的因素
(一)样本团体的性质 1.样本团体的分数分布 样本团体的分数分布越广,信度系数越高; 2.样本团体的异质性 取样团体的异质性越大,信度系数越高; 3.不同团体间能力水平的差异 能力低,受猜测的影响就越大,信度就越低。
(一)测验的因素
1.测验题目的质量;
2.测验实施时的干扰因素;
3.被试的影响因素;
4.测验的长度。
(二)样本团体的性质
1.同一测验对不同团体所测量的 功能可能不同; 2.同一测验,样本团体的性质不 同,效度就可能不同; 3.样本团体的异质性对效度也会 有影响。
(三) 效标的性质
其他条件相同时,所测量的 行为或心理特质与效标行为或特 质越相似,效度系数就越高。
(二)同质性信度
同质性信度指测验内部的各题目
在多大程度上考察了同一内容。
四、评分者信度
1.评分者信度的概念 评分者信度是指不同评分者对同样对象进 行评定时的一致性。 2.评分者信度的计算公式
W
S 其中, 1 2 3 K (N N ) 12
S
R
i 1
N
2
i
1 N 2 ( Ri ) N i 1
R R
i i
19 11 6 8 17 23 84
2
19 11 6 8 17 23 1400
2 2 2 2 2 2 2
S 1400 84 / 6 22ຫໍສະໝຸດ Baidu 224 W 0.8 1 2 3 4 (6 6) 12
各种信度系统相应的误差来源 信度系数类型
(二)测验的长度 测验越长,信度值越高。 (三)测验的难度 测验的难度适中,信度就较高;而测验 过难或过易,都会使信度降低。
第三节 效度的评估方法
一、内容效度 二、效标关联效度 三、构想效度
一、内容效度
1.内容效度的概念
内容效度是检查测验内容是否是所欲测量的 行为领域的代表性取样的指标。 2.内容效度分析时要注意两方面的问题: