测验的效度

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 6、一般来说,最佳行为测验(最高作为 测验)往往表面效度要求较( ) • A、高 • B、低 • C、中等 • D、无法确定
• 7、双向细目表有助于内容效度分析,布 鲁姆的学习水平分类是双向细目表的重 要组成部分,共分( )个层次 A、4个 B、5个 C、6个 D、7个
• • • • •
Baidu Nhomakorabea
8、内容效度有时有称为() A、逻辑效度 B、结构效度 C、实证效度 D、效标效度
• • • • •
一个好的效标必须具备以下条件: (1)效标要有效(有效) (2)效标要有信度(可信) (3)效标可用数字或等级表示(操作) (4)效标测量简单、省时、经济。
(二)效标效度的评估方法 1、相关法:求测验与效标的相关。 2、区分法:比较测验与效标分数差异。 3、命中率法:测验与效标成绩比较。 总命中率 正命中率
设计2: • 举行两场考试,使被试相信一场考试关 系重大,一场考试无关要紧。 • 挑选两组被试,高焦虑组和低焦虑组。 • 比较考试成绩,出现下述情况,说明测 验有构想效度:
– 焦虑分数高组学生,如在第一场考试中成绩 比平时有所下降,在第二场考试中却能正常 发挥。 – 焦虑分数低组学生,无论在哪场考试都发挥 正常。
• 11、要保证测验具有较高效度,测验本身的因 素要做到() • (A)测验材料必须对整个内容具有代表性 • (B)测验设计时应尽量避免容易引起误差的 题型(如是非题) • (C)测验难度要适中,具有较高的区分度 • (D)测验长度要恰当,测题的排列应先易后 难
• 12、( )是检验测验分数能否有效地区 分由效标所定义的团体的一种方法。 • (A)相关法 • (B)区分法 • (C)命中率法 • (D)失误法
一、测验本身的因素 如词汇和句型不能过于太难,如低年 级小学生,要用拼音和图形来注解。测 验取材、测验长度、试题类型、难度、 区分度及编排方式等都会影响效度。
做好以下几点
• • • • • (1)测验材料对整体内容要有代表性; (2)避免引起误差的题型; (3)难度要适中; (4)测验长度恰当; (5)测验排列顺序。
2 I
2 E
s s s s
s r s
2 xy
2 v 2 X
r
2 xy
表示效度,
rxy
表示效度系数
信度与效度的区别举例
打靶
二、效度的性质
(一)效度具有相对性 任何测验的效度是对一定的目标来说 的,或者说测验只有用于与测验目标一 致的目的和场合才会有效。 没有任何一个测验都能测任何所有心 理特质,也没有任何一个测验“放之四 海皆准”,因此任何一个测验都有其局 限性,都是针对一定目的而言。

二、内容效度
(二)确定内容效度的方法 1、专家判断法 2、复本分析法
内容效度可由一组被试在取自同样内容 范围的两个测验复本上得分之相关来作数量 估计。 如果相关低,说明其中至少有一个缺乏 内容效度。如果相关高,一般推论测验有内 容效度。当然也可能两个测验取样有同样或 相似的偏差。
二、内容效度
(二)确定内容效度的方法 1、专家判断法 2、复本分析法 3、再测分析法
• 三、预测效率指数(E值) • K表示无关系数,(1-K)可作为预测效 率的指数。E=100 (1-K)E值大小表示 使用测验比盲目预测能减少多少误差。
2 Sest s y 1 rxy
2 K Sest / s y 1 rxy
第四单元
影响效度的因素
一、测验本身的因素 二、测验实施中的干扰因素 (一)主试的影响因素 (二)被试的影响因素 三、样本团体的性质 (一)样本团体的异质性 (三)干涉变量 四、效标的性质
• 9、提高测量效度的方法( ) • A、精心编制测验量表,避免出现较大的系统 误差 • B、妥善组织测验,控制随机误差 • C、创设标准的应试情境,让每个被试都能发 挥正常水平 • D、选好正确的效标,定好恰当的效标测量, 正确地使用有关公式
• • • • •
10、下列( )属于结构效度的估计方法 A、测验内部寻找证据法 B、测验之间寻找证据法 C、考察测验的实证效度法 D、观察和实验法
先将测验施测于某个团体,该团体对测验所包含的 内容仅具有最少量的知识因而得分很低。 让这个团体参与有关材料的教学和培训,结束后再 进行测验。 如果成绩提高,说明测验测量的是课堂上所教的内 容,推论测验对于教学具有较高的内容效度。

(二)确定内容效度的方法 1、专家判断法 2、复本分析法 3、再测分析法 4、经验法
2、测验间的相互比较 (1)相容效度:相关法(与一个“权威的” 效度高的求相关)。 (2)区分效度:与相异测验相关高,则区 分低,效度差。 (3)因素分析法:如EPQ分为四个分量表 (四个维度),即P、E、N和L。
3、效标效度的研究证明 (1)普通组与对照照(效标组)得分 比较; (2)从发展变化来考察。 4、实验法和观察法证实 从观察或实验前后来比较差差异。
(二)确定内容效度的方法
1、专家判断法
也叫逻辑效度,因为这是一个逻辑分析的过程。 具体的步骤包括:
定义好内容的总体,描绘出有关知识和行为的轮廓。 划分好细纲目,并规定各纲目的比例,对内容范围作详尽 的描述。 确定每个题目所测的知识和技能,将自己的分类与测验编 制者的纲目作比较。 制定评定量表:从测验内容所测的技能、题目对所定义的 内容范围的覆盖率、各种题目数量、分数的比例、题目形式 对内容的适当性等方面,对测验作出总的评定。
(二)效度具有连续性 测验效度通常用相关系数表示, 它只有程度上的不同,而没有“全 有”或“全无”的区别。只是介于 “全有”或“全无”的连续统上中 间的某个值,如高效度、中效度和 低效度。
(三)效度是针对测验结果的 效度是针对某种测验来说的,更 是对测验结果而言的。效度指向一 定的结果,是和测验结果相联系的。
信度和效度的关系(重点)
一、信度是效度的必要而非充分条件(重点) 二、效度是受信度制约的
sv2 ST 2 S I 2 SI 2 2 rxy 2 rxx 2 2 sX sX sX
rxy rxx
• 一个测验的效度总是受它的信度所制约; • 信度系数的平方根是效度系数的最高限度; • 效度系数的最高限度是信度指数。
三、效标效度
(一)什么是效标效度 又称实证效度、统计效度、效标关联效 度。主要考虑:测验与效标预测的程度。 分同时效度和预测效度,如张厚粲修订 SPM(瑞文标准推理测验)时,既考虑 了同时效度又考虑了预测效度。
• 同时效度例子:飞行员(观察系统 和替代性测验);机械能力测验等 招工考试。 • 预测效度例子:MBA考试预测; TOEFL考试。
• 例如 – 构想:考试焦虑是当考试结果对个人有 重大意义时的一种害怕失败的紧张情 绪”。 – 有一个焦虑测验,考察这测验是否有构 想效度。 – 设计几种试验情境:
设计1: • 比较不同重要性考试时该测验的分数
– – – – 按照构想,重要考试时焦虑分数高 平时考试中实施此焦虑测验 重要考试之前施该焦虑测验 比较两次分数,如重要考试前的焦虑分数 显著提高,就说明这个测验对测量考试焦 虑是有效的。
设计3: • 收集被试在经历一场重大考试时的生理 心理参数作为焦虑的指标 • 将其同焦虑测验分数比较 • 相关高证明焦虑测验测量了焦虑这个特 质。
(三)对构想效度的评价
• 构想效度这一概念提出的最大贡献是把着眼 点放在提出假设、检验假设上,因此使心理 测验不再只是作实际决定的辅助工具,同时 还成为发展心理学理论的重要工具。 • 有些构想概念模糊,缺乏一致的定义。同样 构想可能有不同名称;同样的概念可能有不 同解释理解。 • 确定效度时没有明确的操作步骤与程序。没 有单一的数量指标来描述有效程度。
(三)内容效度的特点 2、内容效度的应用
• 内容效度是评价学业测验的最适当的方法。 • 对人员选拔和安置的职业测验也使用内容效 度的评价。 • 对能力倾向和人格测验,内容效度适用性就 差些,因为范围界定不易。 • 内容效度缺乏理想化的数量指标。
二、构想效度
(一)什么是构想效度 定义:是指测验能够测量到理论上的构 想或特质的程度,即测验的结果是否能 证实或解释某一理论的假设、术语或构 想,解释的程度如何。
例如,经验表明测验成绩随 年龄提高,因此分析测验成绩或 题目通过率与年龄大小的关系, 如果测验分和题目通过率随年龄 而提高,则说明测验内容有效。
(三)内容效度的特点 1、内容效度常与表面效度搞混 • 表面效度是由外行对测验作表面上的检查所确定的。内 容效度是由够资格的专家详尽地、系统的对测验作评价 而建立的。 • 前者只考虑题目与测量目的之间明显的、直接的关系。 后者则同时考虑题目与测量目的和内容总体之间的逻辑 的微妙关系。 • 最高行为测验(如能力测验)要求有较高的表面效度, 以使受测验者具有较强的动机,尽最大的努力完成。典 型行为测验(如人格测验)却要求较低的表面效度,如 果受试者很容易就从题目上看出测题的目的,就可能作 出假的反应。
练习与思考
• 1、如果某测验的效度系数是0.70,则在 测验中无法作出正确预测的比例是 ( )。 • (A)0.30 • (B)0.51 • (C)0.49 • (D)0.70
• 2、一个测验所测量的与所要测量的心理 特点之间符合的程度,指的就是测验的 ( )。 (A)信度 (B)难度 • (C)区分度 (D)效度
二、测验实施中的干扰因素 (一)主试的影响因素 (二)被试的影响因素 三、样本团体的性质 (一)样本团体的异质性 (三)干涉变量 四、效标的性质(效标测量的信度、效标 与测量成绩是否线性相关)
提高测量效度的方法
• 宗旨:控制随机误差,减小系统误差 • 1、精心编制量表,避免出现较大的系统 误差 • 2、妥善组织测验,控制随机误差 • 3、创设标准的应试情景,让每个被试都 能发挥正常的水平 • 4、选好正确的效标,定好恰当的效标测 量,正确使用有关公式。
第三单元 效度的功能
一、预测误差(区间估计):
Sest s y 1 r
2 xy
效度系数的平方叫决定系数,表示测验正确预测或解 释的方差占总方差的比例。Sy为效标成绩的标准差。 真正效标分数落在预测效标分数±1个S范围,有68% 的可能性。
• 二、预测效标分数(点估计) • y=a+bx • b=rxy Sy/Sx
心理测量学知识
主讲:牛端 E-mail:niuduan@gmail.com
第四节 测验的效度
第一单元 效度的概念
一、效度的定义 在心理测验中,效度是指所测量的与 要测量的心理特点之间符合的程度,或 者简单地说是指一个心理测验的准确性 或有效性。
s s s
2 T 2 v
2 X 2 v 2 I
• 3、好的效标应具备的条件包括( )。 • (A)效标测量本身必须有效 • (B)效标必须具有较高的信度 • (C)效标可以客观地加以测量 • (D)效标测量的方法经济实用
• 4、一个测验的内容效度主要与( 有关。 • (A) 测验人数 (B)测验时间 • (C) 测验长度 (D)测验题目

• 5、效度的用途主要包括( )。 • (A)预测误差 (B)预测效标分数 • (C)预测效率指数 (D)预测可信程度
第二单元 效度评估的方法
一、内容效度
(一)什么是内容效度
内容效度指的是测验题目对有关内容或行为范围取 样的适当性。 比如,教师为了解学生在某一学科知识掌握的情况, 要进行一个全面的考试。考试不可能包含所有学科内 容。于是,就从学科知识范围可能的题目中取样来编 成测验,根据测验分数推论学生学科知识掌握的情况。 如果测验题目的取样代表性好,则推论将有效;如果 题目取样有偏差,则推论将无效。 由于这种测验的效度主要同测验的内容有关,所以 叫内容效度。
建立构想效度的三步
• 第一步:提出理论结构(理论); • 第二步:设计和编制测验进行实际测量 (实践); • 第三步:验证理论与实践的符合程度 (往往采用因素分析或结构方程等模型 来进行验证)
(二)构想效度的估计方法
1、对测验本身的分析
这类方法是通过研究测验内部结构来 界定理论构想,从而为构想效度提供证 据。 (1)内容效度; (2)测验的同质性(单维性); (3)分析被试者对题目反应过程。
相关文档
最新文档