[教育学]测验的效度

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

区分效度法

因素分析法

效标的研究证明
若效标效度高,则根据效标区分为两组 被试,然后比较两组被试在所编测验上 的成绩,若测验分数能将两组区分开, 则构想效度高。 根据测验分数将被试分成两组,分析其 行为特点是否与理论构想相符,若相符 则构想效度高。 考察心理特质发展:若测验分数能反映 所测特质的发展规律,则测验的构想效 度高。
类型

区分法
步骤
根据效标,将被试区分为高分组和低分组 对两组被试用所编测验施测,计算出它们的 平均数和标准差 根据公式求解。

t
XH XL
s
2
H
缺点

NH
s
2
L
NL
受团体大小的影响。
重叠量的分析
计算每一组内得分超过或低于另一组平 均数的人数百分比得出(如P364)。 计算两组分布的共同区的百分比(如 P364)。 重叠量越大,说明两组分数差异越小, 即测验的效度越差。
效度高,信度高;信度高,效度不一定高。信度是效 度的必要条件。 r2xy ≤ rxX
效度与信度的关系

效度的性质
相对性

效度是相对于一定测量目标而言。
连续性
效度只有程度上的不同,没有“全有”或 “全无”的区别。 效度是针对结果而言的。

效度的评估方法
内容效度及其评估方法 构想效度及其评估方法 效标效度及其评估方法
效标效度的评估方法
相关法 区分法 命中率法
相关法
定义

是求测验分数与效标资料间的相关,这一相关又称 为效度系数。它是评估效标效度最常用的方法
积差相关:两列分数均为连续变量。 点二列相关:一列分数为连续变量;另一列分数为 真正二分称名变量。 二列相关:一列分数为连续变量;另一列分数为人 为二分称名变量。 贾斯朋多系列相关:一列分数为连续变量;另一列 分数为等级变量。 等级相关:两列分数均为等级变量。
测验的效度
主讲:邓稳根
效度的定义
一般定义

指所测量的与所要测量的心理特点之间符合的程度, 即一个心理测验的准确性。它是科学测量工具最重要 的必备条件。
经典测量理论定义


S2x=S2T+S2E S2T=S2V+S2I(S2V为有效方差,S2I为系统误差方差) S2x= S2V+S2I+S2E r2xy=S2V/ S2x
实验法和观察法证实
针对某种心理特质进行训练,观察实验 前和实验后(即进行训练后)分数的差 异,如果差异大,则构想效度高。
什么是效标效度
定义:

又称实证效度,反映的是测验预测个体在某种情境 下行为表现的有效程度。被预测的行为是检验效度 的标准,即效标。 同时效度:测验所得的分数可与效标同时验证;通 常与心理特征的评估与诊断有关。 预测效度:效标需要一段时间才能搜集到,通常用 于选拔、分组。 注意:两类效标效度的差异不是来源于时间,而是 来自测验的目的,前者与用来诊断现状的测验有关, 后者与预测将来结果的测验有关。
什么是构想效度
定义

指测验能够测量到理论上构想或特质的程度, 即测验的结果是否能证实或解释某一理论的 假设、术语或构想,解释的程度如何。它又 叫构思效度,结构效度。
步骤
从某一理论出发,提出关于某一心理特质的 假设 设计和编制题目组成测验进行施测。 对结果进行实证分析,验证与理论假设的程 度。

构想效度的估计方法
对测验本身的分析 测验间的比较 效标效度的研究证明 实验法和观察法证实
对测验本身的分析
特点

是通过研究测验内部结构来界定构想效度的 证据。
方法
测验的内容效度 测验的内部一致性指标 分析被试者对题目的反应特点

测验间的相互比较
相容效度法

一个是已有效度证据的成熟测验,一个是想研究其 构想效度的测验,如果两者相关高(即相容效度 高),构想效度高,反之,则构想效度低 两个构思不同的测验,其相关为区分效度,如果区 分效度低,则构想效度高;如果区分效度高,则不 一定证明构想效度高。 找到影响测验分数的共同因素。采用验证性因素分 析法。
什么是内容效度
定义: 指的是测验题目对有关内容或行为取样的适 用性,从而确定测验是否是所欲测量的行为 领域的代表性取样。 编制高内容效度测验的步骤: 对所测量的心理特性有个明确的概念,并划 定出哪些行为与这种心理特性有关,即确定 内容范围。 测验题目应是所界定的内容范围的代表性取 样。即编制细目表。 注意:要求内容效度的测验,并不一定要求测 验为同质的。
内容效度的评估方法
专家判断法

定义:指请有关专家对测验题目与原定内容的符合 性做出判断。所得的内容效度又叫逻辑效度。 步骤: 定义好测验内容的总体范围,描述有关的的知识 与技能及所用材料的来源; 编制双向细目表,确定内容和技能各自所占的比 例,并由测验编制者各题所测的是何种内容与技 能; 制定评定量表来测量测验的整个效度,由每位专 家在评定量表上做出判断,总估获得测验内容效 度的证据。
命中率法
定义

指当测验用来做取舍的依据时,用其正确决 定的比例作为效度指标的一种方法。 效标成绩 失败(-) 测验预测 成功(+) (A)失误 成功(+) (B)命中
分类:

好的效标的条件
1.必须能最有效地反映测验的目标,即效标测 量本身必须有效; 2.必须具有较高的信度,稳定可靠,不随时间 等因素而变化; 3.效标可以客观地加以测量,可用数据或等级 来表示; 4.效标的测量方法简单,省时省力,经济实用。 注意:一般来讲,学业成绩、教师的评定等常 用作智力测验的效标;有经验精神科医生的诊 断、教师或其他有关人员的评判可作为个性问 卷或精神科症状评定量表的效标;特殊课程或 特殊训练的成绩可作为能力倾向测验的效标。
统计分析法
评分者的一致性: 复本上得分的相关。 再测法。

经验推测法

是通过实践来检验效度。Biblioteka Baidu发展量表。
内容效度的特性
内容效度不具有普遍适用性,它具有内容范围 的特定性和时间的特定性。 内容效度与表面效度既区别又联系。



评定主体不同:表面效度是靠外行的表面检查而确 立的,它不反映测验实际测量的东西,内容效度是 专家系统分析确立的。 评定标准不同:表面效度考虑明显的、直接的关系; 内容效度考虑逻辑的、微妙的关系。 测验编制必须考虑表面效度。最高行为测验要求表 面效度高,典型行为测验要求表面效度低。
相关文档
最新文档