第六章效度

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(3)考察测验的准则关联效度(实证效度)法 根据效标把被试分组,考察其得分差异。 根据测验得分差异把被试分组,考察其所测特 质(行为表现)的差异。
(4)实验操作法 控制某些实验条件,观察其对测验分数的影 响。 如:平时的焦虑测验分数-重大考试前焦虑 测验分数
(5)发展水平的变化 根据理论,预测:随着年龄的增长,所测心理 品质会发生什么变化。
5 建立效度方法的概化 用不同方法得到的效度指标是否一致? 不同的效度之间是否有矛盾?
二、交叉效度分析 交叉效度分析是考察效度概化能力的一种方法, 只涉及被试样本的概化。 方法:对两个独立取自同一总体的样本分别建 立预测源-效标关系,看从一个样本中得到的 效度资料是否适用于另一样本。
三 、提高测量效度的方法
1、影响测量效度的因素 A.测验的构成 项目的质量 项目数量 测验长度与效度的关系:
n测验增长倍数
B.测验的实施过程 C.被试 身心特点: 样本特点: 常模团体的同质性影响到对被试测验得分的解 释,进而影响到测验的效度。
D.效标 测量行为与所选效标的相似性越高,效度越高。 测验分数与效标行为之间是否是线性关系,如 果不是线性关系,求皮尔逊相关就会低估效度。 效标本身的测量越可靠,效度就可能越高。
2、结构效度的确定方法(★)
结构效度确立的一般步骤: (1)提出理论框架; (2)依据理论框架推演出有关测验成绩的假设; (3)用逻辑或实证的方法来证明假设。

(1)测验内部寻找证据法 A. 分析测验的内容效度:若内容效度高, 说明其结构效度也高。 B. 分析被试对题目反应的特点:有无社会 称许性的题目,如“当事情不顺我意时, 我时常动怒。” C. 计算测验的同质性信度:单一特质或?
操作定义:总变差中与由所测量的特性造成 的变差所占的百分比。
(★)
效度=SV2/SX2=rXY
SX2
SV2 SI2 SE2
ST2
2、效度的性质
① ② ③
效度是针对测验结果的。 效度是针对某种特定的测验目的的。 效度只有程度上的差异
三、效度的种类
1.
2.
3.
内容效度:测验用的测题对整个测验内容范 围的代表性程度。成就测验 结构效度:测验能说明心理学上的理论结构 或特质的程度。 准则关联效度:测验分数对某一行为表现的 预测能力。用测验分数和准则分数之间的相 关来表示。

定性分析 相对主观:理论不统一,理解有差异。
双向细目表

双向细目表包括:测量的内容范围(内容); 学习结果(行为目标);权重。 布鲁纳的教育目标分类 学习活动:认知、精神运动、情感 认知包括:知识、理解、应用、分析、综合、 评价

例:小学自然常识测验编题计划
知识 生物世界 资源利用 动力与机械 物质与能量 气象 宇宙 地球 合计 3 2 2 5 2 2 2 18 理解 5 3 3 6 4 5 2 28 应用 6 3 4 8 3 4 2 30 分析 3 1 2 3 2 1 1 13 综合 2 1 0 2 2 0 1 8 评价 1 0 1 1 0 0 0 8 合计 20 10 12 25 13 12 8 100
2、提高测量效度的方法



(1)精心编制测验量表,避免出现较大的系 统误差. (2)妥善组织测验,控制随机误差。 (3)创设标准的应试情境,让每个被试都能 发挥正常的水平。 (4)选好正确的效标,定好恰当的效标测量, 正确地使用有关公式。
补充:效度资料的概化


概化:指在一定条件下得出的结论能否适用于 其他情况。 测验的效度和信度一样,都与特定情境有关, 只有在具体情境下的效度,而没有笼统谈论某 一测验的效度。
(三) criterion-related validity
1、criterion
(★) criterFra bibliotekon :指被预测的行为,是检
验测验是否有效的标准。 Criterion的测量 阿斯丁把效标分为两个层次: 观念效标:效标的理论定义,如“大学的成 功”。 效标测量:效标的操作定义,效标测量必须能 真正反映观念效标。如大学成绩

(2)复本法 用两个测验复本来测同一批被试,用测验的相 关来进行估计。 若相关高,则内容效度可能高,也可能有相同误 差。 若相关低,则必有一个测验缺乏内容效度。
(3)再测法 前测→教学→后测 如果后测成绩优于前测成绩,说明该测验对于 教学具有一定的内容效度。
(4)经验法 不同的被试团体在测验上的得分和对每题的反 应存在较大差异。 如: 不同的被试团体:高年级-低年级 测验上的得分和对每题的反应:总分和题目的通 过率。 若一致,则:效度高
第六章
效 度
一、效度概述 二、 效度的估计 三 、影响效度的因素 四、效度的应用
第一节
效度概述
一、效度要回答的基本问题 1. 测验测量的是什么? 2. 测验对它所测量的东西测量到了什么程度?
二、效度的含义
1、什么是效度 (★)validity是指测量的有效性,即一个测验对所要测 量的心理特质准确测量的程度。 说明: (1)效度是一个相对的概念:每个测量工具都有自己 的目的;内隐特质通过外显行为间接测得。 (2)效度是测量的随机误差和系统误差的综合反映。 (3)判断一个测量是否有效要从多方面收集证据
B/(A+B)
(5)功利率 比较使用测验所需的费用和所得到的收 益,看是否利大于弊。 一个测验如果简单易行,省时省钱, 不经过特殊训练的人也能掌握,又适合 于团体施测,那么,即使效度低一些, 也会有人使用。 反之,只有效度极高,能给人带来很 大好处时,才会使用。
4、标准参照测验的效度


标准参照测验:主要用于检验学习效果,看 对指定的内容范围掌握得如何或是否达到某 种标准。 衡量标准参照测验的主要指标:内容效度
(2)分组法 分组依据:根据准则测量成绩分组。 考察:测验分数(预测分数)能否区分由准则测量所 定义的不同的团体。 如: 按学习成绩分高低两组: 如果高考成绩高,准则测量得分也高;高考成绩低, 准则测量得分也低。即:两组之间的测验成绩有显著 差异。 说明:该测验是有一定效度的。
(3) 预期表法 方法:把预测源分数和效标分数制成双锥图表, 每个变量按水平分成若干档次,然后列出每个档 次上的人数百分比。 如:
学业成就(智力) 临床诊断(人格) 实际工作表现(职业倾向) 特殊训练成绩(成就) 不同团体的总体表现(智力) 先前有效的测验 等级评定
2、准则关联效度的估计方法
(1)效度系数(相关法):计算测验分数与准 则测量之间的相关系数。 优点:数量化;可用回归方程进行个人准则预测 缺点:要求预测源与准则呈线性关系;无法提供 关于取舍正确性的指标
(二)、结构效度
(★) structure validity:指一个测验实 际测到所要测量的理论结构或特质的 程度,或者说测验分数能够说明心理 学理论的某种结构或特质的程度。
1、结构效度的特点: (1)具有不同理论构思的测验,其结构效度无 法进行比较; (2)结构效度有时很难获得; (3)结构效度没有单一的指标,是由各方面的 证据累积起来进行评价的。
一、效度概化的五个方面的问题: 1 预测源的概化 使用同一测验的不同复本是否同样有效? 同一测验对不同分数水平的人的预测是否同样有效? 2 效标的概化 采用不同种类或不同时距的效标,测验是否同样有效? 对于效标的不同分数水平是否预测得一样好?
3 施测情境的概化 不同的施测者、不同的施测条件以及在不同的指导语 或心向下做测验是否同样有效? 4 被试团体的概化 测验对于取自同一总体的另一样本是否同样有效? 测验对于不同性别、不同年龄、不同教育水平、不同 社会经济地位、不同地区、不同民族、不同学校、不 同职业的被试是否同样有效?
① ②
一个测验要有内容效度必须具备两个条件: 要有确定好内容范围,项目均在此范围内。 测验题目应是所界定的内容范围的代表性取样。 (双向细目表)

应用范围:教育成就测验,职业选拔测验。 (标准参照测验)
2.内容效度的确定方法(★)
(1)专家判断法(逻辑分析法) 专家根据自己的知识经验对测验项目与所 涉及的内容范围进行符合性判断。
大学一年级成绩 高 考 成 绩 A 高 中 60 10 B 40 20 40 30 C D E

10
40
40
40
(4)命中率法(取舍正确性) 应用范围:预测源和效标都是二分的。
工 作 表 现 测验成绩 合格 不合格 不合格 A C 合格 B D
强调社会公平时使用,总命中率=(B+C)/(A+B+C+D) 当测验用于提高工作或学习效率时使用,正命中率=
criterion的特性(补)
a.多样性: 一个测验可能有不同的观念效标, 同一个观念效标又可能有不同的效标测量。 b.复杂性: 几乎每一种效标行为都由多种特质 构成,包含复杂的成分。 c.特殊性: 即使一个普通的效标,在应用时也 有特殊性。 d.时间性: 近期效标与最后效标
criterion测量的条件(★)
a.有效性:效标测量能真正反映观念效标。 b.可靠性:有较高的信度 c.客观性: 效标测量必须能真正反映观念效标, 防止效标污染。
效标污染(criterion contamination)是指评定者知道被试的测验分 数,因而影响到对效标的客观评定。
d.实用性: 经济实用
常用的效标



(2)测验间寻找证据法 A. 相容效度:新老测验之间的相关(两测验测 的是同一心理特质)。若相关高,则说明新 测验可能有较高的效度。 B. 区分效度:新老测验之间的相关(两测验测 的不是同一心理特质),若相关低,则说明 新测验可能有较高的效度。 C. 因素分析法:得出的因素符合理论的构思, 说明效度高。

计算测验效度所依据的样本必须与选择项目所 依据的被试样本不同。如果使用同一样本,则 会使效度系数假性的高。实质是循环论证。
具体步骤: ①确定测验内容的总体范围;并描绘出有关知识 与技能的轮廓。 ②划分细纲目,并根据重要性规划好各个纲目的 加权比例。 ③确定每个项目所测的知识与技能,将自己的分 类与测验编制者的纲目作比较。 ④ 编制评定量表。从测验内容所测的技能、题目 对所定义的范围的覆盖率、各种题目数量和分 数的比例以及题目形式的适当性等方面,对测 验作出总的评价。
四、效度与信度的关系(★) (1)信度高是效度高的必要而非充分条件 一个测验效度高,其信度也必然高; 但一个测验信度高,其效度不一定高。 (2)测验的效度受它的信度制约 rXY≤rXX 一个测验的信度必然比效度高,至少相等。
二、 效度的估计
(一)、内容效度 1、 (★) content validity是指测验项目对欲测 的内容或行为范围取样的适当程度 ,即一个 测验实际测到的内容与所要测量的内容之间 的吻合程度。
相关文档
最新文档