第六章 效度理论

合集下载

第六章效度

第六章效度

(3)考察测验的准则关联效度(实证效度)法 根据效标把被试分组,考察其得分差异。 根据测验得分差异把被试分组,考察其所测特 质(行为表现)的差异。
(4)实验操作法 控制某些实验条件,观察其对测验分数的影 响。 如:平时的焦虑测验分数-重大考试前焦虑 测验分数
(5)发展水平的变化 根据理论,预测:随着年龄的增长,所测心理 品质会发生什么变化。
5 建立效度方法的概化 用不同方法得到的效度指标是否一致? 不同的效度之间是否有矛盾?
二、交叉效度分析 交叉效度分析是考察效度概化能力的一种方法, 只涉及被试样本的概化。 方法:对两个独立取自同一总体的样本分别建 立预测源-效标关系,看从一个样本中得到的 效度资料是否适用于另一样本。
三 、提高测量效度的方法
1、影响测量效度的因素 A.测验的构成 项目的质量 项目数量 测验长度与效度的关系:
n测验增长倍数
B.测验的实施过程 C.被试 身心特点: 样本特点: 常模团体的同质性影响到对被试测验得分的解 释,进而影响到测验的效度。
D.效标 测量行为与所选效标的相似性越高,效度越高。 测验分数与效标行为之间是否是线性关系,如 果不是线性关系,求皮尔逊相关就会低估效度。 效标本身的测量越可靠,效度就可能越高。
2、结构效度的确定方法(★)
结构效度确立的一般步骤: (1)提出理论框架; (2)依据理论框架推演出有关测验成绩的假设; (3)用逻辑或实证的方法来证明假设。

(1)测验内部寻找证据法 A. 分析测验的内容效度:若内容效度高, 说明其结构效度也高。 B. 分析被试对题目反应的特点:有无社会 称许性的题目,如“当事情不顺我意时, 我时常动怒。” C. 计算测验的同质性信度:单一特质或?

心理学测量笔记连载第六章:效度

心理学测量笔记连载第六章:效度

心理学测量笔记连载第六章:效度1、效度测验能测量到所要测量的对象的程度。

这一定义包含着两层含义:测验测量什么?测验对测量目标的测量精确度和真实性是多少?2、效度的公式rxy = SV2/SX2它是与测量目标有关的真实分数方差与总方差的比率。

其中rxy是常用的效度表示法;SV2是“有关的真实方差”,也就是由测验所要测量的心理变量引起的方差,也叫有效方差;SX2是总方差。

3、信度和效度的差别两者所涉及的误差不同:信度仅考虑偶然的随机误差占测验总变异的比例,效度则还包括与测验无关的但稳定的测量误差。

(1)信度是效度的必要而非充分条件。

(2)效度是受信度制约的。

4、效度的性质效度的真实含义是指测验结果的效度,也就是测验结果的准确程度。

(1)效度具有相对性。

(2)效度具有连续性。

测验的有效性只有程度上的差别。

(3)效度也不是直接就可以测量到的,它是从已有的证据推理而来的。

5、效度的种类内容效度、构思效度和效标关联效度。

6、效标关联效度测验总分数与外在标20、准(效标)之间的相关程度,反映的是用测验预测个体在某种情境下行为的表现如何的有效性程度。

由于外在标准成了考察测验有效性的参照标准,因此简称为效标。

7、阿斯丁把效标分为两个层次一是理论描述水平的“观念效标”,二是操作定义水平的“效标测量”。

(1)观念效标是效标的理论定义,效标测量是效标的操作定义,效标测量必须能真正反映观念效标。

(2)效标测量的一个重要特征是客观性。

为此因做到:1 避免偏见影响效标测量,特别是以等级评定为效标4 测量时,评分者的主观偏见会有很大影响。

2 防止效标污染,即指个人的效标因评定者知道个体的测验分数(也叫预测源分数)而受到影响。

8、常用的效标学业成就、临床诊断、实际工作表现、特殊训练成绩、效标团体比较、先前有效的测验、等级评定。

9、同时效度它的效标资料是和测验分数差不多同时搜集的。

一般情况下,它可以代替预测效度。

10、预测效度的效标是经过一段时间以后才获得的,预测效度反映的是从测验分数预测任何效标情境或一段时间后被试的行为表现的程度。

效度

效度


效度是针对某个特定的测验目的的
比如,NEO是测量正常人格的,对某些特殊的人格障碍的鉴 定不一定有效。

测量的效度只有程度上的差异
有效性程度。不是“全”或“无” 的,而是“很有效的”或 “不太有效的”。
1、什么是效度:信度与效度的对比

信度的理论公式 SX=ST +SE r信= ST / SX= (SV + SI ) / SX 即信度是一组测验分数真变异与总变异(实测变异)的比值。 效度的理论公式 SX= SV + SI +SE R效= SV / SX 即效度是与测验目的有关的变异(有效变异)与总变异(实测变异)的 比值。
效标效度的类型: -同时效度:比如心理素质与心理健康同时测量。 -预测效度:人才选拔中的运用。 效标的选择: -外显、客观:智力与学习成绩 -简单、省事:案例:社会适应性量表的编制。 -科学、权威:比如用心理健康指标作为心理素质的 效标。


效标效度的估计方法
1.相关法 相关系数 回归方程 结构方程模型 2.分组法 案例:性别对性别角色认知量表的预测 3.命中率法 见下页


2.3 结构效度



术语和定义:也称构想效度、构念效度。 即测验对理论上的构想或特质的测量程度。 确定结构效度的基本步骤 首先从某一理论出发,提出某一心理特质的假 设,即构成心理特质的成分或因素,然后设计和编 制测验并进行试测,最后对测验的结果采用相关或 因素分析等方法分析,验证与理论假设的相符程度。 案例:大学生心理素质的结构效度的获得
效 度
什么是效度 效度的类型 影响效度的因素
1、什么是效度:真分数模型
个体而言 X=T+E X是观测分数,T是真分数, E是测量误差。 团体而言 SX=ST +SE 即观测分数变异数( SX)等于真分数变异数 ( ST )加上误差分数变异数( SE )。 这里误差分数变异数只是涉及到随机误差的变异

效度的名词解释

效度的名词解释

效度的名词解释效度是指一种测量工具或测试的准确性和有效性。

在心理学、教育学、社会科学和医学等领域,效度是评估研究方法和工具的重要指标。

本文将从效度的定义、类型、测量方法和影响因素等方面进行解释。

一、效度的定义效度是指测量工具或测试所测量的概念或现象的准确性和有效性。

简单来说,效度是指测量工具或测试是否能够准确地反映出所要测量的概念或现象。

例如,一份英语考试的效度是指它是否能够准确地反映出考生的英语水平。

如果一份英语考试的效度很高,那么它所测量的英语水平就会比较准确。

二、效度的类型效度可以分为内部效度和外部效度两种类型。

1. 内部效度内部效度是指测量工具或测试所测量的不同项目之间的相关性。

例如,一份数学考试的内部效度是指其中各个数学题目之间的相关性。

如果一份数学考试的内部效度很高,那么它所测量的数学能力就会比较准确。

2. 外部效度外部效度是指测量工具或测试所测量的概念或现象与其他相关概念或现象之间的相关性。

例如,一份英语考试的外部效度是指它与其他英语考试的相关性。

如果一份英语考试的外部效度很高,那么它所测量的英语水平就会比较准确。

三、效度的测量方法效度的测量方法有很多种,其中比较常用的方法有以下几种。

1. 内部一致性内部一致性是指测量工具或测试中的各个项目之间的相关性。

例如,一份数学考试中各个数学题目之间的相关性。

内部一致性可以通过计算各个项目之间的相关系数来进行测量。

2. 重测效度重测效度是指测量工具或测试在不同时间或不同场合下所测量的结果之间的相关性。

例如,一份英语考试在不同时间或不同场合下所测量的英语水平之间的相关性。

重测效度可以通过计算不同时间或不同场合下所测量的结果之间的相关系数来进行测量。

3. 交叉效度交叉效度是指测量工具或测试与其他相关测量工具或测试之间的相关性。

例如,一份英语考试与其他英语考试之间的相关性。

交叉效度可以通过计算不同测量工具或测试之间的相关系数来进行测量。

四、效度的影响因素效度的影响因素有很多,其中比较常见的因素有以下几种。

效度的名词解释

效度的名词解释

效度的名词解释
效度是指一个测试或测量工具的有效性和准确性。

在心理学、教育学、医学等领域中,效度是评估测量工具的重要指标之一。

它是指测量工具所测量的内容是否与被测量的现象相对应。

如果一个测量工具具有高效度,则说明它能够准确地测量出被测量的现象,从而可靠地评估人们的表现、能力、态度、情感等方面。

效度分为内部效度和外部效度两种。

内部效度是指测量工具的各项指标之间的相互关系,包括信度、稳定性、一致性等。

信度是指测量工具的稳定性和一致性,即测量结果的可靠性。

稳定性是指测量工具在不同时间、不同环境下所得到的结果是否一致。

一致性是指测量工具的各项指标之间是否相互协调和一致。

外部效度则是指测量工具与被测量现象之间的关系,包括相关效度、预测效度、构效度等。

相关效度是指测量工具所测量的内容与被测量现象之间的相关性。

预测效度是指测量工具能否准确地预测被测量现象的变化趋势。

构效度是指测量工具所测量的内容是否与被测量现象的内在结构相一致。

测量工具的效度是评估其是否具有正确性和准确性的重要指标。

一个测量工具的效度高,则说明它能够准确地测量出被测量的现象,从而可靠地评估人们的表现、能力、态度、情感等方面。

因此,在选择和使用测量工具时,必须考虑其效度,以保证测量结果的准确性和可靠性。

同时,在测量过程中,也应该注意对测量工具的效度进行监测和评估,以确保测量结果的正确性和准确性。

总之,效度是测量工具的一个重要指标,它关系到测量结果的准
确性和可靠性。

在选择和使用测量工具时,必须考虑其效度,并对其进行监测和评估,以确保测量结果的正确性和准确性。

第六章 效度(同等学力辅导班资料)

第六章 效度(同等学力辅导班资料)

S
2 CO
S
S
2 SP
S
2 e
2 t
三、效度的种类
1. 内容效度 2. 效标关联效度 3. 结构效度
返回
第二节 内容效度
一、内容效度的含义 二、验证测验内容效度的程序 三、内容效度的确定方法 四、适用范围 五、表面效度
一、内容效度的含义
内容效度(content validation)
测验项目对所要测量的内容范围的代表性程度。 测验的使用者希望估计测验在它所要代表的环境整 体中一个考生表现如何。 (1974) 内容关联凭证(content-related evidence) (1985) 基于考试内容的凭证(evidence based on test content )(1999)(p299)
第三节 效标关联效度
一、效标关联效度概述 二、效标 三、效标关联效度估计的方法 四、效标关联效度的应用
一、效标关联效度概述
效标关联效度(criterion-related validity)
指测验分数与外部效标之间的相关。 又称准则关联效度。
效标即效度标准。
指独立于测验结果,反映测验目的的行为参照。
三、搜集结构效度资料的方法
1.测验内方法 2.测验间方法 3.效标关联法 4.实验操作法 5.发展水平的变化
1.测验内方法
• 确定测验的内容效度 • 分析被试对项目的反应过程 • 考察测验的同质性
2.测验间方法
相容效度 计算新旧同类测验分数之间的相关 区分效度 计算不同结构的测验之间的相关 因素效度 通过因素分析找到影响测验分数的共同 因素,每个测验在共同因素上的负荷量即 每个测验与共同因素的相关,称为测验的 因素效度

第六章 经典测验理论——效度

第六章 经典测验理论——效度

二、效度的类型
2.测验间法 . 通过对几个测验的比较研究, 通过对几个测验的比较研究,找出它们 所测的共同特质, 所测的共同特质,这样便可确定这些测 验是否具有构想效度。 验是否具有构想效度。
二、效度的类型
c.相容效度(congruent validity): 相容效度( 相容效度 ): 求一个新测验与一已有测验的相关( 求一个新测验与一已有测验的相关(若无已有测 用部分有关系的测验代替) 验,用部分有关系的测验代替) 比如,我们编制了一个人格量表, 比如,我们编制了一个人格量表,经检 和已有的能有效测量人格的量表( 验,和已有的能有效测量人格的量表(如 16pf)有高度的正相关,说明我们的量表 )有高度的正相关, 也可以测量人格,有较高的效度。 也可以测量人格,有较高的效度。
一、什么是效度? 什么是效度?
公式: 公式:rxy=Sv2/ Sx2 从公式看效度也是一个理想的概念 实际中我们是通过寻求测验工具之 外的一些证据间接来证明或检验一 个测验的有效性
一、什么是效度? 什么是效度?
1、效度是个相对概念 、 一种测量工具的效度只是对一定得测量 目的有效 有效也是一定程度上到相对有效 2、效度是测量的随机误差和系统误差的 、 综合反映 3、判断一个测量是否有效要从多方面来 、 收集证据
二、效度的类型
e.因素效度: 因素效度: 因素效度 建立构想效度最为常用的方法, 建立构想效度最为常用的方法,通过对 一测验的项目进行因素分析,找到影响 一测验的项目进行因素分析, 测验分数的共同因素, 测验分数的共同因素,每个项目在共同 因素上的负荷量( 因素上的负荷量(即每个项目与共同因 素的相关), ),称做测验的因素效度 素的相关),称做测验的因素效度
二、效度的类型

第六章-效度理论

第六章-效度理论
• 效度系数越高,正确预测率越高,越能测验经费开支
四、在人员安置和分类中的重要影响
• 一、安置: • 定义:根据对被试在单一效标上的观测结
果而做出的处理和安排 • 例:分班考试将学生分配到不同班级
• 二、分类:
• 使用两个或两个以上的效标,效标的多少 取决于分类数量
• 一般采用多元回归方程,多元判别分析补 充
三、同时提高的困难
• 测验同质性:信度高,效度低 • 测验异质性:信度低,效度高
采用成套性测验: ①每一个单一性测验,信度高 ②整个成套性测验,效度高
第二节 影响因素
1、测验本身 2、测量误差 3、样本
一、测验本身
• 测验的内容、难度、区分度、长度等
• 与长度:长度越长,效度越高
• 长度增加倍,效度估计
rY(nX)
rYX
1 rXX n
rXX
• 可以求 rY ( nX ) , n
二、测量误差
• 测量误差越小,效度越高
(1)减弱校正法:
rW
rYX rXX rYY
• 注:属于理论问题,实际运用较少
(2)效标信度估计法:
rWX
rYX rYY
三、样本
• (1)代表性:代表性越强,效度越高

c 2
s2
2 e
2 c2s2
rXX
rYX


2 s 2 t

2

2 t


2 c

2 t


2 s 2 t
信度 效度
信度是效度的必要条件
2、效度受信度制约
• 有公式:rmax rXXrYY rXX表示测验信度 rYY 表示效标测量的信度

第六章人员甄选-第一节甄选及其有效性(二)

第六章人员甄选-第一节甄选及其有效性(二)

(一)概念效度即有效性,反映了一种测试工具对于它所要测量的内容或特质进行准确测量的程度。

【注意】信度是效度的必要条件(但不是充分条件)。

如果一项测试的效度较好,则其信度一定也比较高。

3个)(1)概念●一项测试的内容与测试所要达到的目标之间的相关程度,即一项测试的内容能够代表它所要测量的主题或特质的程度;●内容效度所要考察的是在测试中所涉及的问项、提出的问题或者设置的难点是否能够很好地反映实际工作情境或代表在实际工作中存在的典型问题●一份具有较高内容效度的测试将会使求职者置身于与实际工作非常类似的情境之中,然后测试求职者目前是否有足够的知识、技术或能力来处理将来可能会面临的这些情况【举例】例如招聘打字员,一般凭据打字的速度及准确性招聘,效度是最高的;如用计算机维修技术作为测试方法,其内容效度就比较低。

(2)采用专家判断方法检验(3)不太适合对智力、领导能力以及诚实性等较为抽象的特质进行评价。

(4)一项测试要想具有较好的内容效度,通常必须满足条件:●确定好想要测试的内容的范围,并且使测试中的全部项目均在此范围之内;●测试中的项目应当是已经界定好的内容范围中具有代表性的样本。

(5)局限性●首先,隐藏在内容效度背后的一个基本假设是:求职者在被雇用的时候已经具备了一定的知识、技术或能力。

因此,如果一个组织准备在甄选和雇用求职者之后,再通过正式培训计划来教会他们掌握工作所必需的技能,那么内容效度就不太适合。

●其次,由于在内容效度中主观判断的作用很大,因而必须设法将判断过程中的推测成分减至最少,最好是将评价者的评分建立在某种相对具体和可观察的行为的基础之上。

(1)概念也称效标关联效度,是指一种测试或甄选技术对被试者的一种或多种工作行为或工作绩效进行预测的准确程度。

特点:省时,但有可能无法准确预测应聘者未来的工作潜力。

(2)判断方法●看通过甄选测试所得到的分数与实际工作绩效得分之间是否存在实证性联系。

●如果在测试分数与实际工作绩效分数之间存在明显的相关关系,那么便可以证明这种测试具有较好的效标效度。

心理测量第六章测量效度

心理测量第六章测量效度
构想效度的概念是1954年提出的,是处 理效度的一种新方法。
在心理学上,所谓构想是指用来解释人 类行为的理论框架或心理特质,它是心理 学中抽象的假设性的概念、特性或变量。 如智力、焦虑、内向、动机、创造性等都 可称为构想。
构想效度主要涉及的是心理学的理论概念 问题,是指测验对某一理论上的构想或特 质测量的程度,即测验的结果是否能证实 或解释某一理论的假设、术语或构想,解 释的程度如何。
3.考察测验的同质性可以为评估构想效度 提供证据。
这种方法以测验的内在一致性系数(比 如库德—理查逊的K-R20、K-R21公式以及 α系数等)为指标,判断测验测的是单一性 质还是多种性质,看它与所预期的结构的 相符度,也就是测验的同质性问题,从测 验的一致性就可以为构想效度提供证据。
(二)测验间方法
四、效度与信度的关系
(一)高信度是高效度的必要而非充分 的条件
(二)测验的效度受它的信度制约
信度系数的平方根是效度系数的最高限 度
第二节 内容效度
一、内容效度的性质 二、确定内容效度的方法 三、内容效度的特点 四、内容效度的应用与评价
一、内容效度的性质
内容效度指的是测验题目对欲测的有关 内容或行为范围取样的适当性,从而确定 测验是否是所欲测量的行为领域的代表性 取样。即测验用的测题对整个测验内容范 围的代表性程度。由于这种测验的效度主 要与测验内容有关,所以称内容效度。
(一)测验内方法
这类方法主要是通过研究测验内部构造 (如测验的内容、对题目作反应的过程、 以及题目间或分测验间的关系)来分析测 验的构想效度。
主要包括:
1.测验的内容效度可以作为构想效度的证 据。
对测验所取样的内容或行为范围确定后, 就可利用这些资料来定义测验所要测的构 想效度的性质。即确定了测验的内容效度 便提供了有关构想效度的证据。

第六章 效度

第六章 效度


(2)二列相关系数
适用于两个连续变量,其中一个变量被人 为分成两个类别,如测验通过与不通过、 学校是重点与非重点,然后计算这两个变 量之间的相关的情况。
计算公式
X p X q pq rb st Y
是二列相关系数 p 是人为划分的两个类别的变量中,属于其中一个类别(通过、重点) 的被试占全体被试人数的比例;q 为属于另外一个类别的被试比例。 X X p 是属于通过或重点类别的被试测验分数的平均值, q 是属于另一类 别的被试测验分数的平均值。 s t 是全体被试测验分数的标准差, Y 是在常态分布曲线上、比率 p 所对应的纵轴高度。


内容效度: 测题代表测验内容范围的程度。 成就测验特别关注内容效度。方法:采取 专家评判。

结构效度: 测验能测量到理论结构的程度 编制的测验是否能体现所欲测量的假设结 构,体现的程度如何? 方法有多种:内容效度、被试答题时的 反应、测验的同质性、与已有相似测验的 相关、与该心理特征的身心发展变化的关 系、、不同群体间的差异、多种方法-多特 质分析、因素分析等
第六章 测量的效度



信度衡量的是测验的结果是否稳定、一致。它以 真分数方差与实测分数的方差之比来表示, 真分数 方差在实测分数方差中所占的比率越高表示测验 的结果越稳定. 本章中要学习另一个问题, 即测验结果是否准确, 即测验是否测到了要测的东西、测到多少的问题。 测验的效度越高, 说明测验测到要测的东西的程度 越高, 也就是测验的结果越准确。 测验的效度主要是为了回答两个问题: 一是测验 要测量什么特性? 第二个是它对所要测量的特征 测量到什么程度?
3 效度与信度的关系

信度是效度的必要条件,但非充分条件

效度

效度
3)编制效度(construct validity)。指一套测试题的诸项目对编制该测试所依据的理论的各个基本方面 的反映程度。例如,以结构主义语言理论为基础,认为系统的语言习惯是通过句型而获得的,那么,强调词汇和 语法环境的测试题目就失去了编制效度。
4)经验效度(empirical validity)。经验效度是一种衡量测试有效性的量度,通过把一次测试与一个或 多个标准尺度相对照而得出。经验效度可分为两种:一是共时效度(concurrent validity),即将一次测试的 结果同另一次时间相近的有效测试的结果相比较,或同教师的鉴定相比较而得出的系数;二是预测效度 (predictive validity),即将一次测试的结果同后来的语言能力相比较,或是同教师后来对学生的鉴定相比 较而得出的系数。
影响统计效度的因素
影响统计效度的因素主要有方面:统计功效低、违反统计方法的使用条件、测量信度低。
统计结论效度的条件
研究的统计结论效度主要取决于两个方面的条件:一是数据的质量,数据分析程序的效度是以数据的质量作 为基础的,数据质量差的研究是谈不上统计结论效度的;二是统计检验方法,数据分析中所采用的各种统计方法, 都有其明确的统计检验条件的要求,一项研究中统计检验条件不明确或者被违反,就会显著降低统计结论效度。
测试维度
测试维度
1)表面效度(face validity)。指测试应达到的卷面标准,即一套测试题从表面看来是否是合适的。例 如,若一次阅读理解力的测试包括许多受试者没有学过的方言词汇,则可认为这次测试缺乏表面效度。表面效度 是测试出受试者正常水平的一种保证因素。
2)内容效度(content validity)。指一套测试题是否测试了应该测试的内容或者说所测试的内容是否反 映了测试的要求,即测试的代表性和覆盖面的程度。例如,如果某一套发音技能测试题仅仅考查发音所必须具备 的某些技能,如只考单一音素的发音,而不考查重读、语调或音素在词语中的发音,那么,该测试的内容效度就 很低。

心理测量课件_第六章 效度

心理测量课件_第六章 效度

绩效度量
100% 80% 60% 40% 20% 0%
变异来源
效度 内部误差 时间抽样 未解释
被解释的变异比例
效度的种类
• 证明一个测验是有效的(validation),必须 保证在以下三方面均是有效的
• 内容(content) • 效标关联或实证(criterion-related or empirical) • 构想或结构(construct) • 不能只独立地保证一方面。
• 会聚(辐合)效度(convergent validation)
– 如,一个艺术能力测验与其他艺术能力测验、创造力测验以 及去当地艺术博物馆的频率等有高相关
• 区分效度(discriminant validation)
– 如,一个艺术能力测验与耐力(力量)测验或与去体育馆的 频率等没有相关
14
因素分析
• 测验=预测源 • 行为=效标 • 效标效度是基于数据的( data based)
– 一个选拔测验与工作绩效的相关 – 一个成就测验与年级的相关 – 一个诚实测验与偷窃的相关
两种效标关联效度
• 预测效度(predictive validity):
– 测验对未来表现预测 得有多好
– 他会患焦虑症吗?
效标的适当、缺陷与污染
• 效标适当(relevance):实际测量的效标中应测量的部分 (B+E区)
• 效标缺陷(deficiency):实际效标没有覆盖的终极效标 部分(A+D区)
• 效标污染(contamination):实际效标中与要测量的东西 无关的部分(C+F区)
终极效标 A B C
E DF
• 其中使用的测验技术包括:结构化面 试,评价中心,纸笔考试(专业知识) 等。

6心理测量 第六章 经典测验理论——效度

6心理测量 第六章 经典测验理论——效度

确定构念效度的基本步骤 : • 从某一理论出发或者提出关于某一心理特质 的构念和假设。 • 设计和编制测验并进行施测 • 测验的结果采用相关或因素分析等方法进行 分析,验证测验结果与理论假设的相符程度, 即测验在多大程度上正确地验证了编制测验 的理论构想。
二、效度的类型
• 构念效度常用方法: 1、因素效度: • 建立构念效度最为常用的方法 • (1)通过对变量(测验的所有项目,或者分测验) 进行因素分析,找到影响变量的共同因素,每个变 量在共同因素上的负荷量(即每个变量与共同因素 的相关),称做测验的因素效度
二、效度的类型
内容效度 内容效度指测验题目对所要测量的内 容范围的代表性程度。实际上是说题目 取样的代表性问题。
二、效度的类型
• 判断内容效度的方法: 一、专家评判法:请有关专家对测验题目与原 定内容的吻合程度作出判断。看题目是否代 表了规定的内容。 主要依据专家的逻辑分析,所以内容效度 有时也叫逻辑效度。
二、统计方法 • 1、题目样本和总体的相关 • 2、重测法 • 3、复本信度 • 4、内容效度比
• 编制任何测验都要考虑内容效度 • 内容效度主要应用于学绩测验和成就测验 • 职业心理测验中,如果工作表现是能够明 确界定的 ,则考察测验的内容效度也是 适合的。 • 智力和人格测验而言,考察其内容效度不 适当。
一、什么是效度?
• 效度(validity)就是指测量的有效性 测验对所要测量的特质准确测量的程度 两层含义: • 说测验能不能测到它要测的东西 • 测验对它的测量对象测量到什么程度
一、什么是效度?
• 公式:rxy=Sv2/ Sx2 • 从公式看效度也是一个理想的概念 • 实际中我们是通过寻求测验工具之外的 一些证据间接来证明或检验一个测验的 有效性

心理学《效度》课件

心理学《效度》课件

的东西,它在测量中占的比例大小即为效度。 Val= Sco2/ St2
2、效度性质
(1) 针对某种测验结果和目的的。是针对 测量的某种特殊的用途,不具普遍性。
(2)心理测验的效度只有程度差异,而不是 “全”或“无”的差别。因而只能用“高 效”“中等”“低效”来评价。
(3)效度指标特别是(SC02)不可能直接得 到的只能是一种间接的估计。
第四节 影响效度的因素
一、测验本身的因素 1、 测验中的词汇和句型不能太难 2、 题意应当清楚。 3、 测题应当适合要测量的结果。 4、 不能提供额外线索。 5、 测题的编制合理程度。 6、 选择题的答案不能有明显的组型。 7、 测量数量(能增加效度) 8、 测验的难度要适当。
二、测验实施方面和计分方面。 测验情景:如布置、材料的准备。 实施过程是否标准。 指导语是否将答题要求说清楚,是否按时限要
2、区分法(组的分类即T检验的差异) 根据被试在准则上的表现,将其分为不同的组别,
那么这些组在预测时也应该有显著差异。如果被证实 则说明这个预测的效度较高。 3、命中率法=录取成功人数/总录取人数。 4、败成比。 失败组超过成功组均数的得分人数与成功 组超成功组均数的人数比。败成比越小,则两组差异 越大。
好的效标的特点
有效性——能反应测验的目的 可靠性——效标必须有高的信度,稳定可靠 可操作——效标可客观测量 实用性——效标的测量简单、省时省力,经济实

第二节 内容效度和结构效度 。
1、验证和提高内容效度的方法 : (1)专家评定法,让一组都非常熟悉测量内容的专家,用
逻辑法判断对所研究的领域的取样(测验测题)是否具有 代表性。(这与评分者信度相同因而评分者信度可作为测 验的确良效度指标) (2)比较法:与权威测验比较,如果相关高,就具高效度。 缺点: (1) 是一种符合性判断,缺少量化指标。 (2) 专家对有关问题的不同看法和侧重点会影响内容效度 的判断。 2、编制双向细目表。 测验前要做的第一件事就是尽可能明确而详尽地规定应 测量的领域,编制双向细目表。(适用于教育测验)

测验效度

测验效度

理论建构 概念或特质 编制测验并实施 效度高 结果证明特性
3.适用范围:主要用于智力测验、人格测验等。 4.结构效度的确定方法: ①因素分析法:是确定心理特质的一种方法。通过对 测验结果进行因素分析,寻找影响测验分数的公共 因素。主因素分析法或方差极大法得到的因素负荷 正好是各项目与公共因素的相关系数,有时也称因 素负荷为因素效度。因素分析法的目的是把一些具 有错综复杂关系的因素归结为数量较少的几个综合 因素或称共同因素,并以此测验所测之特质对测验 分数作出解释。
•0.13 •0.22
•第2 •因素
•0.54 •0.55
•3.你觉得现在的工作能充分体现你的价值。
•4.你做现在的工作时感到很高兴。 •5.你在现在的工作中能充分发挥你的创造力。 •6.你所在的单位团队精神很强。 •7.你在单位中能够畅所欲言。 •8.你在单位中和同事们一起工作时心情舒畅。 •9.你在单位中遇到难题时能无顾虑地请教别人。 •10单位里的同事们能重视自己的意见。
2
4
4
10
8假设检验
2
4
4
10
9方差分析 10非参数法 项目数总计
4 3 25
3 3 30
1 3 25
2 1 30
10 10 100

表6-2 台湾地区某初中的统考内容
章 节 单元名称 1-1 因子与倍 数 1-2 质因子分解 1-3 最大公 因子与 最小公 倍数 2-1 2-2
分数的加法, 分数的除法 减法与乘法

第三节 结构效度

1.结构效度(construct validity,也称建 构效度) :是指一个测验实际测到所要测 量的理论结构和特质的程度。或测验分数 能够说明教育与心理理论的某种结构或特 质的程度。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、信度是效度的必要条件
• 测验分数总方差分为三部分: 2 (1)所欲测量的属性引起的方差 c (2)与所欲测量属性无关的特性所引起的方 2 差(包括系统误差) s (3)由误差引起的方差 e2 则测验分数总方差 t2 c2 s2 e2
2 2 t2 e 2 2 2 t2 c s e
• 可以求 rY ( nX ) , n
二、测量误差
• 测量误差越小,效度越高 (1)减弱校正法: rYX rW rXX rYY
• 注:属于理论问题,实际运用较少 (2)效标信度估计法: rYX rWX rYY
三、样本
• (1)代表性:代表性越强,效度越高 • (2)容量大小:容量越大,效度越高 • (3)异质性:异质性越强,效度越高 全距缩小,则会低估效度,需加以校正: r( X X) r 2 2 2 2 1 r r ( X X )
四、在人员安置和分类中的重要影响
• 一、安置: • 定义:根据对被试在单一效标上的观测结 果而做出的处理和安排 • 例:分班考试将学生分配到不同班级
• 二、分类: • 使用两个或两个以上的效标,效标的多少 取决于分类数量 • 一般采用多元回归方程,多元判别分析补 充 • 因多个效标,故需要多个测验,且测验异 质
二、效标分数预测的置信区间
• 背景:预测效标分数总会存在误差 • 假设:实际效标分数围绕着预测效标分数 呈正态分布
则可对实际效标分数进行区间估计
三、提高人才甄选的正确率
错误淘汰 (20人) 正确录取 (40人)
D B
A C
正确淘汰 (30人)
错误录取 (10人)
• 影响正确预测和错误预测的比率的因素 • (1)效度系数越高,正确预测的比率越大, 错误预测的比率越小 • (2)受效标变量上成功与失败比率影响 • (3)受测验变量上录取分数线影响
效 度 理 论
理 论 定 义
与 信 度 的 关 系
影 响 因 素
测 验 效 度 的 应 用
测 验 本 身
测 量 误 差
样 本
测 效 标 分 数 预
估计标 准误差、 效标分 数预测 的置信 区间
提高 人才 甑选 的正 确率
人员 安置 和分 类
效度与信度的比较
第三节 应用
1、预测效标分数 2、估计标准误差、效标分数预测的置信区间 3、提高人才甑选的正确率 4、在人员安置和分类中的重要影响
一、预测效标分数
• 条件:测验分数和效标分数呈线性关系 • 已知:测验的效度系数、某一被试的测验 分数 则可利用回归方程 Y ˆ Y rYX (X X ) Y X
XX YY
YY
三、同时提高的困难
• 测验同质性:信度高,效度低 • 测验异质性:信度低,效度高 采用成套性测验: ①每一个单一性测验,信度高 ②整个成套性测验,效度高
第二节 影响因素
1、测验本身 2、测量误差 3、样本
一、测验本身
• 测验的内容、难度、区分度、长度等 • 与长度:长度越长,效度越高 • 长度增加倍,效度估计 rYX rY ( nX ) 1 rXX rXX n
预测效标分数的估计值
二、估计标准误差
• 定义:预测效标分数并不一定等于实际被 测的效标分数,由预测而产生的误差,称 为估计标准误差 • 公式: 2 ˆ (Y Y ) east n2
2 1 r • 简单形式: east Y YX
1 r
2 YX
• 称为无相关系数,用K表示 • 由效度系数决定: rYX 1,K 0 表示不存在估计标准误 • ( 1) 差,即所预测的效标分数等于实际的效标 分数 rYX 0,K 1 表示效度系数对效标分 • ( 2) 数的预测毫无效力
第六章
效度理论
内容
理论定义、与信度的关系 影响因素 测验效度的应用
一、理论定义
• 在一组测验分数中,所欲测量的属性引起 的方差与测验分数总方差的比率。 即 Val

2 c 2 t
表示) c2表示所欲测量的属性引起的方差 t2 表示测验分数总方差
Val表示效度(常用 rYX
二、与信度的关系

2 2 c
2 s
rXX r YX
2 s 2 t
2 2 2 c s 2 2 2 t t t
信度 效度
信度是效度的必要条件
2、效度受信度制约
r • 有公式:
max

rXX r YY
rXX r YY
YX
表示测验信度 表示效标测量的信度
YX XX
则 r r r 取 r 最大值1,则 r r 则由公式得,效度受信度制约
• 为正确计算预测率提高的数量,先介绍以下概念:
A D • ( 1) 基本率 A B C D
A D 正确预测率 • ( 2) A B C D
• 则正确预测率提高的数量=正确预测率-基本率
A A D 正确预测率提高的数量 AC A B C D
• 效度系数越高,正确预测率越高,越能测验经费开支
相关文档
最新文档