心理测量学第五章-效度

合集下载

心理测量学 第五章 效度(用)

心理测量学 第五章  效度(用)

b YX r XY
sY sX
0
0 . 923

a=57.5-0.923×69.4=-6.56 Yˆ =-6.56+0.923X
如果我们已知一组人的测验得分,我们可以 根据上式得到他们的效标成绩平均值的预测 值: X=76时, Yˆ =-6.56+0.923×76=63.6 X=55时, Yˆ =-6.56+0.923×88=74.7 预测值不是一个确定值,只是一个估计值, 可以被理解为所有获得某一测验分数者的平 均效标分数值。就是说,所有在测验上得76 分的人的效标分数的平均分为63.6,在例1 中,测验中实际得76分的人的效标平均分为 59.5,测验得88分的人的效标平均分为79.5。
三、影响效标关联效度的因素
(一)样本 这种影响来自两个方面:一是样本的含量,二是样 本的代表性。 (二)基础率 基础率是经选择的总体中具有某种与测验目的有关 的特质的人数比例。极高与极低的基础率,运用测 验都是得不偿失的。 (三)录取率 录取率是根据测验选拔出的人数与全体受测者的比 例。录取率越低,选拔的有效性越高。录取率越高, 错误选择的可能性越大。
2. 方差比例。根据效度定义,效度是有效 分数方差在所得分数方差中所占比例。这只 是一种理论概念,在实际的效度系数的计算 中,效度分数的平方可以解释为在效标分数 的方差中可以用测验分数来解释的百分比,
r XY
2

S YX SY
2
2

r XY =效度系数
S YX
2
SY
2
=由测验所决定的效标分数方差 =效标分数方差
例1 为了考察高等教育自学考试数学试卷的 效度,有关单位在自学高考的高等数学考试 之后,请30名考生参加了某重点大学的高等 数学结业考试。这些考生在两次考试上的成 绩如下表。 计算自学高考数学试卷成绩与普通大学数学 考试成绩之间的相关系数:见附件1

心理问师三级心理测量学知识点整理

心理问师三级心理测量学知识点整理

心理问师三级心理测量学知识点整理心理问师三级第五章心理测量学知识点整理一、测量要素:参照点:1)绝对零点;2)相对零点。

在心理测量中不会找到绝对零点,只能人为的采纳相对零点(常模)。

单位:(必须具备两个条件):1)有确定的意义;2)有相同的价值。

二、测量量表:是一具有单位和参照点的延续体:从低级到高级分成四中水平:(1)命名量表:数字只能用来做标记和分类,别能做数量化分析。

(2)顺序量表:数字仅表示等级,并别表示某种属性的真正量或绝对值。

(3)等距量表:有相同单位,其数值能够做加减运算,但没有绝对零点,所以别能做乘除运算。

注:等距量表的数值加或减一具常数或用一具常数乘或除,别破坏原来数据的关系。

(4)等比量表:既有相等单位,又有绝对零点。

所得的数值均能够做加、减、乘、除运算。

如长度、分量和时刻基本上等比量表。

注:心理测量首先是在顺序量表上举行的。

然后运用某些统计学的办法,把这种顺序量表得到的数据,换算到等距数据举行转换。

三、测验的分类:按测验的功能分类:1、智力测验 2、特别能力测验;3、人格测验。

按测验材料的性质分类:1、文字测验;2、操作测验(非文字测验)。

按测验材料的严谨程度分类:1、客观测验;2、投射测验(受社会赞许妨碍别大;受应试动机的妨碍较小)。

按测验的要求分类:1、最高作为测验(有正确的答案。

如智力测验、成就测验等);2、典型行为测验(没有正确答案。

如人格测验均属典型行为测验)。

四、确定常模团体时,要先确定普通总体,再确定目标总体,最终确定样本。

常模团体的条件1、群体的构成必须明确界定;2 常模团体必须是所测群体的代表性的样本;3、样本的大小要适当(样本大小适当的关键是样本具有代表性,普通性常模:最低很多于 30 或 100 个)。

4、全国性常模:普通 2000~3000 人为宜。

5、标准化样组是一定时空的产物五、常模团体取样的办法:从目标人群中挑选有代表性的样本。

分为:1、简单随机抽样;2、系统抽样(目标总体无序可排,也无等级机构存在);3、分组抽样(总体目标较大,如全国取样);4、分层抽样(分层比例抽样,分层非比例抽样)。

心理测量学第五章-效度

心理测量学第五章-效度

.93 .50 .96 .53 .51 .92
方 A4 .58 .21 .11 法 B4 .18 .61 .09 4 C4 .20 .15 .71
.66 .11 .19 .30 .68 .18 .22 .18 .70
.70 .13 .14 .22 .68 .20 .23 .19 .71
.89 .51 .90 .52 .50 .91
(2)分析被试的答题过程
♪ 例如,在人格测验上有这样一些题目:“当事情不顺 我意时,我时常动怒。”“我总避免批评别人的言 行。”
(3)计算测验的同质性信度来检验结构效度:其一,求 取每个题目与测验总分之间的相关系数;其二,根据 测验总分将被试分为高分组和低分组,再比较这两组 被试在每个题目上的通过率。证明题目与总测验是测 量的同意结构。
(2)区分效度
含义:
♪ 新编测验的分数与已知测量不同结构的测验分数 的相关。如相关高则说明测验有问题。
方式:
♪ 求一个新编测验与另一已知结构测验间的相关。
♪ 例:例如新编一套道德感测验,用它与瑞文推理 测验作比较,如果相关高,便说明新编测验有问 题。
3.考查测验的实证效度法
(1)根据效标把人分成两类,考查其得分。 ♪ 例:一组公认为外向的人在测试中的外向性得分
(三)内容效度的适用范围及评价
♪ 内容效度主要用于学绩测验和职业测验(基于工作任务分 析),也就是测量知识或技能掌握程度的测验。
♪ 人格测验、能力倾向测验、智力测验不适合采用内容效度, 这类测验很难预先确定测试的内容范围。
♪ 内容效度不但是评价学绩测验的最适合的方法,而且编制 任何测验都要加以考虑的方面。
例:双向细目表
第一步、教学目标(以橫轴表示) ♪ 以Bloom所提的认知领域六个教学目标为依据:知识、

心理测量学知识--效度

心理测量学知识--效度

智力结构。
• 测验的内部一致性指标可以推断测验是测量单一 还是多种特质:分半信度、a系数等。

分析被试者对题目的反应特点也可以作为构思效
度的证据:
24
2013-7-9
二、构想效度
第二单元 效度评估的方法
测验间的相互比较
通过分析几个测验间的相互关系,找出共同之处,进 而推断这些测验的特质是什么,确定构思效度如何。 • 相容效度是构思效度的一个证据:一个旧测验是 有效度证据的,一个新测验是没有效度证明的, 两者测同一种特质。计算两种测验之间的相关。 相关高,新测验所测特质与旧测验一致性就高, 这一相关为相容效度。 • 相容效度高,证明新测验构思效度高。
(logical validity)。
2013-7-9
17
一、内容效度
第二单元 效度评估的方法
专家判断法 • 专家评定前的准备: 1、定义好测验内容的总体范围,描述有关的知识与技 能及所用材料的来源; 2、编制双向细目表,确定内容和技能各自所占的比例, 每个题目测什么内容和技能; 3、制定评定量表来测量测验的整个效度; 最后,由每位评判者在评定量表上作出判断,获得测
第一单元 效度的概念
学了,就知道了!
1、什么是效度?
效度是指所测量的与所要测量的心理特点之间符合的程度,或者简 单地说是指一个心理测验的准确性。
2、信度与效度的关系?
信度受随机误差影响,效度受随机误差和系统误差影响。可信的测
验未必有效,有效的测验比可信。信度是效度的必要条件。
3、效度的性质?
相对性、连续性
(一)效度具有相对性
任何测验的效度都是对一定的目标来说的。测 验只有用于与测验目标一致的目的和场合才会 有效。… 测验不是万能的,只对特定心理属性有效。…

心理测量学中的信度和效度分析

心理测量学中的信度和效度分析

心理测量学中的信度和效度分析心理测量学是研究心理测量方法与技术的学科,旨在通过反映被测者的心理特征和过程,揭示其心理素质、智力水平等信息。

而在心理测量过程中,信度和效度分析是两个重要的概念。

一、信度分析信度是指测量工具在测量同一心理特征或过程时的稳定性和一致性。

换句话说,信度反映了测量工具在同一被测者群体中的结果是否稳定,并且是否能复现。

具体来说,信度分析主要从可靠性和稳定性两个方面来考量。

1.可靠性可靠性是指测量工具的结果是否稳定且一致。

在心理测量学中,一种常用的方式是通过内部一致性来评估可靠性,最常见的统计方法是Cronbach's α系数。

Cronbach's α系数介于0和1之间,数值越大代表内部一致性越高,通常要求α系数达到0.7以上为可靠。

2.稳定性稳定性是指测量工具在不同时间或在不同条件下所得到的结果是否一致。

为了评估测量工具的稳定性,常用的方法是再测法和半分法。

再测法是指在不同时间或条件下对同一样本重复测量,然后通过计算相关系数来评估稳定性。

而半分法则是将测量工具的题目分成两部分,分别进行测量并计算两部分得分的相关系数。

二、效度分析效度是指测量工具是否能够准确地测量所要测量的心理特征或过程。

也就是说,效度是评估测量工具是否真的测量到了我们想要测量的东西。

效度分析主要从描述效度、判别效度和预测效度三个方面来考量。

1.描述效度描述效度是指测量工具是否能够全面、准确地描述被测者的心理特征或过程。

具体来说,可以通过专家评定法和内容效度等方法来评估描述效度。

专家评定法是通过请相关领域的专家对测量工具进行评定,包括评估题目的合理性、适用性等方面。

而内容效度是指测量工具的题目是否充分、恰当地涵盖了被测者的心理特征或过程。

2.判别效度判别效度是指测量工具能否区分不同的心理特征或过程。

为了评估判别效度,常用的方法是构太效度。

构太效度是通过与已知测量工具或理论进行比较,来确定测量工具是否能够与其他相关测量工具或理论得到一致或相似的结果。

2019年 第五章 心理测量学(打印版)

2019年 第五章 心理测量学(打印版)
心理测验在未来发展倾向:团体智力测验、能力倾向测验、人格测验和操作测验。 (二)现代心理测验在我国的发展
1916 年樊炳清先生首先介绍了比内—西蒙智力量表。1920 年,北京高等师范和南京师 范学校建立了我国最早的两个心理学实验室,廖世承和陈鹤琴先生在南京高等师范学校开设 心理测量课。1921 年,他俩正式出版《心理测验法》一书,当时影响很大。1922 年夏天, 中华教育改进社聘请美国教育心理测验专家麦考尔来华讲学。
单位是测量的基本要素,没有单位就无法进行测量。好的单位具备条件:一是确定的 意义,二是相同的价值。一般来说,心理测量的单位往往不够完善。
三、测量量表
量表是根据一定法则在一个定有单位和参照点的连续体上把事物的属性表现出来的连 续体。根据量表的精确度,斯蒂文斯将量表从低到高分为成四种水平,即命名量表、顺序量 表、等距量表和等比量表。 (一)命名量表
课程简介
心理测量学是心理学的一门专业基础学科,心理测量是重要的心 理学研究方法,是心理诊断和人力资源管理中决策的辅助工具,但心 理测量工具目前尚不完善。
心理测量是心理学工作者需要熟练掌握的一项工具或一种手段。 因为心理测量学中涉及到统计学和数学方面知识,在心理咨询师知识 结构中是最难学、最难懂的一门课程,所以,本章课程对大部分参加 心理咨询师课程学习者来说是具有相当难度的。
心理咨询师 (基础知识)
第五章 心理测量学
辅 导 资 料
洪进鹏 2018.11
第五章 心理测量学 课程目录
第一讲 测量:心理咋测量 第二讲 定义:什么是心理测验 第三讲 常模:成绩好坏跟谁比 第四讲 信度:心理测量可靠吗 第五讲 效度:心理测量准确吗 第六讲 项目分析:这次测验难吗 第七讲 编制:测验咋编制 第八讲 技术:测验咋使用

第五章效度

第五章效度

1、影响测量效度的因素
(4)所选效标的性质 有的学者认为,智力测验分数与教师对学生等级评定之 间的效度系数只要在0.30~0.50之间就可以了,因为 教师的评价会受到与智力无关的其他因素的影响。与此 类似,相同科目的标准化测验成绩与教师评价之间的相 关应达到0.60~0.70,两种不同智力测验或标准化测验 之间的相关应达到0.60~0.80等等。 所有这些不同的要求,主要是因为所用效标的不同而提 出来的。
式中 是测验x增长至原来的K倍后,新测验与 效标(y)的相关(效度系数);K为测验增长的 倍数; 原测验的效度系数; 为原测验的信
度系数。
1、影响测量效度的因素
(2)测验的实施过程 一个测验在实施过程中,如不遵从指导语的要求、
或出现以外干扰、或评分计分出现差错等等,都会降低 测量效度。 (3)接受测验的被试
(二)构想效度(construct Validity)
1954年提出,有人翻译为构思效度,也有叫结 构效度。它是指测验能够测量到理论上的构想 和特质的程度,即测验的结果是否能证实或解 释某一理论的假设、术语或构想,解释的程度 如何。
(三)效标效度
1、定义:又称实证效度,反映的是测验预测个 体在某种情境下行为表现的有效性程度。
一般情况下,被试的应试动机、情绪、态度、身体 状态等等,都会影响测量信度,造成较大的随机误差, 进而影响测量的效度。
就整个被试团体而言,如果缺乏必要的同质性,则 很可能会得到不恰当的效度资料。
1、影响测量效度的因素
(4)所选效标的性质
由于同一个测验可以有不同的效标,同一 个观念效标也可以有不同的效标测量,所以在 评价测量效度时,所选效标的性质是很重要的 考虑因素。
3、效标和效标测量:

心理测量学真分数与信度和效度

心理测量学真分数与信度和效度
过失误差
一般把明显歪曲实验结果的误差成为过失误差,它是由于实验观测过 程中的过失造成的。这些错误有测错、传错、记错、仪器失灵、取样错 误。在实验数据整理过程中必须鉴别、舍弃这些含有过失误差的数据(又 称异常点),否则会严重影响实验结果的准确性,得出不正确的结论。
心理测量误差的三方面来源
• 在心理测量中,常见的误差来源于三个方 面: 测验内部,施测过程,受测者本身。
4.信度信息的解释
要解释信度信息,须作以下区别:
r (1) X1X2 ——观测分数变异中可归因于受测者真分数
中变动的比例部分
(2)( rX1X2 )2——一份平行测验上所得的观测分数变异
中能用另一份平行测验的观测分数的变异预测的比例部分
(3) rXT ——真分数和观测分数的相关
假设一份测验手册报告信度系数 rX1X 2 =0.81,那么
(ST2/SX2)——测验的信度 (SV2/SX2)——测验的效度
效度和效度的定义
信度在心理测量理论中被定义为:
2
2
在一列测量数据中,真分数变异( T )在总变异( X )中
占的比例。真分数变异在总变异中占的比例越大,说明随机误
差对测量结果的影响越小,则测量工具的信度越高。
rXX '


rXT
T X
式中: rXT -代表信度指数; T -真分数的标准差;
X -实得分数(观测分数)的标准差。
信度系数(reliability coefficient):可定义为平行测验分数
之间的相关系数。如果用 x1和 x2 分别表示一组受测者在两套平行 测验中所得的离差分数,则:
rX1 X 2
真分数理论——
真分数是一个在理论上构想出来的概念

心理测量学知识---5

心理测量学知识---5



第二单元 项目区分度

难度和区分度都是相对的。一般来说。较难的项目对高
水平的被试区分度高;较易项目对低水平的被试区分度 高;中等难度项目对中等水平的被试区分度高。

总体上,特别难和特别易的项目少些,中等难度的项目
多些,所有项目平均难度为0.50。即可以保证多数项目
的区分度,也保证整个测验的区分能力。
的行为活动作具体分析。包括:(1)确定哪些心理特征 和行为可以使要预测的活动达到成功,…进而确定题目;
(2)建立衡量被试是否成功的标准,即效标。……

对特定概念下定义:对所测的东西进行界定。比如,创造 力的定义:有人定义为:发散思维的能力。据此创造力应 该从反应的流畅性、灵活性、独创性、详尽性来测量。 确定测验的具体内容:………
验总分应该接近常态分配。
如果获得的分数不是常态,而是偏态分布的,说明题目
偏难或偏易。
第一单元 项目的难度
如左图,属于正偏态分布。题目难了,必须Leabharlann 增加足够数量的较容易的项目;
而右图,属于负偏态分布,题目容易了,必
须增加足够数量的有较高难度的项目。
第一单元 项目的难度
当然,不是所有测验都要求测验分数呈常态分布,
第一单元 测验的目标分析
二、测验的用途

所编制的测验是对被试做描述,还是做诊断、
选拔、预测,应该事先确定。

一般来说,测验可以分为两类:显示性测验、
预测性测验。
第一单元 测验的目标分析
(一)显示性测验,是指测验题目和所要测量的
心理特征相似的测验。如成就测验。

古德纳夫把显示性测验分为:样本测验、标记 测验。
第二单元 项目区分度

效度的名词解释

效度的名词解释

效度的名词解释效度是心理学中一个非常重要的概念,它指的是一种度量工具或测试工具能够测量出所要测量的心理特征或行为的程度的准确程度。

效度是心理测量学的核心概念之一,也是心理测量学的基本要求之一。

在心理学研究中,效度是评价一个测量工具的优劣的重要指标之一,它是测量工具是否有效的重要标准。

在心理测量学中,效度通常分为两种类型:内部效度和外部效度。

内部效度是指测量工具能否测量出所要测量的心理特征或行为的程度的准确程度。

外部效度是指测量工具与其他测量工具和实际情况的相关性和一致性。

内部效度和外部效度都是评价测量工具的重要指标,两者缺一不可。

内部效度是评价测量工具的准确性的重要指标。

内部效度可以通过比较测量工具内部各项指标的一致性来评价。

内部效度的评价方法包括:同质性检验、因素分析、信度检验等。

同质性检验是通过比较测量工具不同题目的得分来评价测量工具的内部一致性。

因素分析是通过分析测量工具的各项指标之间的关系来评价测量工具的内部一致性。

信度检验是通过比较测量工具的重复测量结果来评价测量工具的内部一致性。

这些方法可以帮助评价测量工具的内部效度,从而更准确地测量心理特征和行为。

外部效度是评价测量工具的相关性和一致性的重要指标。

外部效度可以通过比较测量工具与其他测量工具和实际情况的相关性和一致性来评价。

外部效度的评价方法包括:相关系数分析、回归分析、判别分析等。

相关系数分析是通过比较测量工具与其他测量工具和实际情况的相关性来评价测量工具的外部效度。

回归分析是通过比较测量工具与其他测量工具和实际情况的一致性来评价测量工具的外部效度。

判别分析是通过比较测量工具与其他测量工具和实际情况的差异来评价测量工具的外部效度。

这些方法可以帮助评价测量工具的外部效度,从而更准确地测量心理特征和行为。

在心理测量学中,效度是评价一个测量工具的优劣的重要指标之一。

效度是测量工具是否有效的重要标准。

评价测量工具的效度可以通过比较测量工具内部各项指标的一致性和测量工具与其他测量工具和实际情况的相关性和一致性来评价。

5笔记 心理测量学知识

5笔记 心理测量学知识

第五章心理测量学知识第一节心理测量在心理咨询中的功能:临床诊断,评估疗效。

心理测验:依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,心理测验的分类:按照测验功能:智力、特殊能力、人格按照测验材料性质:文字、操作按照测验材料的严谨程度:客观、投射按照测验的方式:个别、团体按照测验的要求:最高行为、典型行为错误的测验观:1、测验万能论,2、测验无用论,3、心理测验即智力测验正确的测验观:1、心理测验是重要的心理学研究方法之一,是决策的辅助工具2、心理测验作为研究方法和测量工具尚不完善在咨询中的应用:运用较多的三类:智力测验、人格测验、心理评定量表咨询前:诊断;咨询后:评估。

咨询中测验不是必不可少的环节,如果问题明确,可放弃不必要的测验测验发展史:F.高尔顿——1、提出人的气质和智能是按身体特点遗传的。

(气质是先天的;能力大部分是先天的,少部分是后天的;性格是后天的)2、设计了测量差异的方法,心理测验的开端。

3、提出了相关概念,奠定了统计学基础。

J. M.卡特尔——1、发表《心理测验与测量》,心理测验第一次正式出现于心理学文献中2、主张测验手续和考试方法应有统一规定,并要有常模A.比内——1905年,发表一个30个项目的量表,世界上第一个正式心理测验第二节测验的常模常模团体:由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。

任何一个测验都有许多可能的常模团体。

常模团体的条件:1、群体的构成必须明确界定。

2、常模团体必须是所测群体的代表性样本。

3、样本的大小要适当。

总体数目小,只有几十个人,则需要100%的样本。

如果总体数目大,相应的样本也大,一般最低不小于30或100个。

全国性常模,一般应有2000~3000人为宜。

4、标准化样组是一定时空的产物。

取样的方法:简单随机抽样,系统抽样(等距抽样),分组抽样(先随机分组,再从每组中随机抽人),分层抽样常模分数:施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。

第五章 心理测量学知识点

第五章 心理测量学知识点

第五章心理测量学知识第一节概述1、简述测量的元素。

测量元素:事物、数字、法则。

所谓事物:指的是我们要测量的对象,更准确地说,就是引起我们兴趣的事物的属性和特征。

所谓数字:是代表某一事物或事物某一属性的量。

所谓法则:代表的是测量所依据的规则和方法。

2、心理测验的定义是什么?所谓心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出的推论和数量化分析的一种科学手段。

3、简述心理测验与心理咨询的关系。

咨询和治疗的有效性,不仅取决与咨询人员对心理咨询的性质、过程的正确认识,熟练掌握心理咨询的原则、方法和技巧,同时还有赖于对求助者心理特性、行为问题性质的正确评估和诊断,以便于提供适当的指导、帮助和行为矫正训练。

因此,心理测验在心理咨询中有重要意义。

心理门诊中:智力测验、人格测验以及心理评定量表。

4、简述世界第一个正式的心理测验。

1904年,法国教育部委派许多教育专家、医学专家和其他科学家组成一个委员会,专门研究公立学校中智力落后儿童的教育方法,比内极力主张用一种测验的方法辨别和发现智力落后的儿童。

结果他与助手西蒙的精心研究,次年在《心理学年报》上发表了一篇文章,题为《诊断异常儿童智力的新方法》,在这篇文章中他介绍了一个包括30个项目的量表。

这个量表很粗糙。

但它在心理测验史上极其重要,是世界上第一个正式的心理测验。

第二节测验的常模1、常模选择的步骤是什么?确定一般总体、确定目标总体、确定样本2、取样的定义是什么?取样即从目标人群中选择有代表性的样本3、简述常模的定义及类型。

常模分数构成的分布,就是通常所说的常模,它是解释心理测验分数的基础。

常模有一般常模与特殊常模之分。

测验手册上所列的常模通常为一般常模,不一定适合使用者的具体情况。

特殊常模是为非典型团体建立的,一般比为消团体建立的常模范围更窄。

其优点是,可使被试的结果与最接近的人进行比较,但这同时也是它的缺点,不容许分数在较广范围内作解释。

第5章效度

第5章效度
2 I 2 E
2 2 2 X T E

2 T 2 V
2 I

2 X 2 V
s r s
2 xy
2 v 2 X
r
2 xy
表示效度,
rxy
表示效度系数
信度与效度的区别举例
打靶
二、效度的性质
(一)效度具有相对性 任何测验的效度是对一定的目标来说的, 或者说测验只有用于与测验目标一致的目 的和场合才会有效。 没有任何一个测验都能测任何所有心理 特质,也没有任何一个测验“放之四海皆 准”,因此任何一个测验都有其局限性, 都是针对一定目的而言。
二、构想效度
(一)什么是构想效度 定义:是指测验能够测量到理论上的构 想或特质的程度,即测验的结果是否能 证实或解释某一理论的假设、术语或构 想,解释的程度如何。
建立构想效度的三步
• 第一步:提出理论结构(理论); • 第二步:设计和编制测验进行实际测量 (实践); • 第三步:验证理论与实践的符合程度(往 往采用因素分析或结构方程等模型来进行 验证)
做好以下几点
• • • • • (1)测验材料要有代表性; (2)避免引起误差的题型; (3)难度要适中; (4)测验长度恰当; (5)测验排列顺序。
二、测验实施中的干扰因素 (一)主试的影响因素 (二)被试的影响因素 三、样本团体的性质 (一)样本团体的异质性 (三)干涉变量 四、效标的性质
练习与思考
信度和效度的关系(重点)
一、信度是效度的必要而非充分条件(重点) 二、效度是受信度制约的
2 2 2 2 s S S S 2 v rxy 2 T 2 I rxx I2 sX sX sX
rxy rxx
• 一个测验的效度总是受它的信度所制约; • 信度系数的平方根是效度系数的最高限度; • 效度系数的最高限度是信度指数。

心理测量 第5章 测量效度

心理测量 第5章 测量效度

21 同异性相处时感到害羞不自在 22 感到受骗,中了圈套或有人想抓住您 23 无缘无故地突然感到害怕 24 自己不能控制地大发脾气 25 怕单独出门 26 经常责怪自己 27 腰痛 28 感到难以完成任务 29 感到孤独 30 感到苦闷
31 过分担忧 32 对事物不感兴趣 33 感到害怕 34 您的感情容易受到伤害 35 旁人能知道您的私下想法 36 感到别人不理解您、不同情您 37 感到人们对您不友好,不喜欢您 38 做事必须做得很慢以保证做得正确 39 心跳得很厉害 40 恶心或胃部不舒服
比例,作出尽可能详细的描述 ➢ 确定每道题所测的知识与技能,将自己的分类与测
验编制者的纲目作比较 ➢ 制定评定量表,从各方面对测验作出评定
复本法
克伦巴赫认为,内容效度可由一组被试在 取自同样内容范围的两个测验复本上得分的相 关来做数量上的估计。如果相关低则说明两个 测验中至少有一个缺乏内容效度,但无法确定 究竟哪一个缺乏内容效度。当相关高时,一般 推论测验具有内容效度,但也可能出现两个测 验有相同偏差的情况。
内容效度的应用
作为一种方法,内容效度较为适合于评价教育 成就测验和职业选拔测验。在这种测验中,测 验内容是知识、技能和实际工作的代表性样本。 内容效度不仅是评价教育成就测验和职业选拔 测验的较好方法,而且也是编制任何测验都应 加以考虑的基本方面。内容效度对标准参照测 验更为重要,因为在标准参照测验中我们主要 关心的是被试对一定范围内的知识、技能掌握 得如何。
这说明,对于一个具体的测量目标来说, 有表面效度的题目不见得真正有效,没有表面 效度的题目也可能有效,因此,表面效度不是 确定内容效度的客观指标。尽管如此,表面效 度对被试的动机、态度和行为会产生影响,从 而影响到测验的效度,因此在编制测验题目时, 对表面效度要适当控制。

第五章心理测量工具的评价指标

第五章心理测量工具的评价指标

第五章心理测量工具的评价指标正如任何一个测量工具一样,心理测量工具也有它自身的评价指标。

在心理测量学中,信度、效度、项目区分度和有效的常模都是检验心理测量工具是否具有可靠性、有效性、鉴别性、可比性等良好测量特征的技术指标。

因此,了解相关技术指标的内涵和计算方法对于从事心理测量的人力资源管理部门工作人员来说具有重大意义。

第一节心理测量的信度在进行心理测量时,最重要的心理测量学指标之一就是信度(reliability)。

任何一项好的测量都必须有良好的信度,这是人事测评的中心问题,同时它也是标准化测评的一项基本要求和原则。

一、信度的定义信度指的是测量数据和结果的一致性或可靠性程度,它用于分析测量工具测量的前后一致性水平,并以这种一致性的程度来判断测量工具或测量方法的可靠性。

也就是说使用的测评工具可以稳定地测到它所要测量的事物的程度。

我们在选择和使用测评工具或方法时,信度必须是考虑的重要问题。

测验信度越高,表示测验结果越可信,但也无法期望两次测验结果完全一致,信度除受测验工具本身的影响外,亦受很多其它因素的干扰,如所测量的被试样本特征等。

因此没有一份测验是完全可靠的,信度只是一种程度上大小的差别而已。

一致性高的测量工具是指同一群人接受性质相同内容相同的测验测量后,在各结果间显示出的较强的正相关。

稳定性高的测量工具则是指同一批被试在不同的时间接受同样的测验时,结果间的差异很小。

二、信度与误差在进行心理测量时,信度指的是测验分数未受测量误差(errors of measurement)影响的程度。

测量误差指由与测量目的无关的因素产生的不准确或不一致的效应。

测量误差愈小,测量结果愈可靠;换言之,如果测量的结果能反应受试者真实的特征,而不因其他因素而影响测验结果,那么这个测验所测量的结果是可靠的。

测量误差通常包括两种不同类型的误差,即系统误差和随机误差。

系统误差是由与测量目的无关的因素引起的一种恒定而有规律的效应,它稳定地存在于每一次测量中,此时虽然每次的测量值具有一致性,但不正确。

心理测量学中的可靠性和效度的评估方法

心理测量学中的可靠性和效度的评估方法

心理测量学中的可靠性和效度的评估方法心理测量学是一门研究个体心理特征的科学,为了准确测量人们的心理特征,我们需要依靠可靠性和效度的评估方法。

本文将介绍心理测量学中常用的可靠性和效度评估方法,并探讨其意义和应用。

一、可靠性评估方法可靠性指测量工具或方法在重复测量条件下的稳定性和一致性程度。

在心理测量学中,我们常用以下几种方法来评估可靠性。

1. 重测法(Test-Retest)重测法是指在一定时间间隔后对同一样本进行两次测量,通过比较两次测量结果的一致性来评估测量工具的可靠性。

该方法适用于对相对稳定的心理特征进行测量,如人格特征等。

2. 内部一致性法(Internal Consistency)内部一致性法通过分析测量工具内部各项指标之间的相关性来评估可靠性。

常见的内部一致性评估方法包括Cronbach’s alpha系数和切割半法。

该方法适用于评估问卷或量表等多个指标组成的测量工具。

3. 等价形式法(Alternate Forms)等价形式法通过比较两个相似但不完全相同的测量工具对同一样本进行测量,从而评估测量工具的可靠性。

该方法适用于对一些相对稳定但容易遭受记忆影响的心理特征进行测量。

二、效度评估方法效度指测量工具或方法能否有效地测量所要衡量的心理特征。

在心理测量学中,我们常用以下几种方法来评估效度。

1. 内容效度(Content Validity)内容效度是指测量工具或方法是否包含了所要衡量的心理特征的全部内容。

专家评估法是常用的评估内容效度的方法,通过请专家对测量工具的内容进行评判来确定其效度。

2. 面向标准的效度(Criterion-related Validity)面向标准的效度是指测量工具或方法与某个已被广泛接受的标准测量工具或行为的相关性。

常用的面向标准的效度评估方法有相关效度和预测效度。

3. 结构效度(Construct Validity)结构效度是指测量工具或方法是否与所要测量的心理特征的理论结构相符合。

第五章测量效度 ppt课件

第五章测量效度 ppt课件

(2)效标的特性
a.多样性: 一个测验可能有不同的观念效标,同一个观念效标又可能有不同的效标测量。
b.复杂性: 几乎每一种效标行为都由多种特质构成,包含复杂的成分。
c.特殊性: 即使一个普通的效标,在应用时也有特殊性。
d.时间性: 近期效标与最后效标
(3)效标测量的条件
a.有效性:效标测量能真正反映观念效标。 b.可靠性:有较高的信度 c.客观性: 效标测量必须能真正反映观念效标,防止效标污染。 效标污染(criterion contamination)是指评定者知道被试的测验分数,因而影响到 对效标的客观评定。
2.效标 (1)效标与效标测量
效标(criterion)就是衡量一个测验是否有效的外在标准,独立于测验并可以从实践 中直接获得我们所感兴趣的行为。
常用的效标:学业成就、临床诊断、实际工作表现、特殊训练成绩、不同团体的总体 表现、先前有效的测验、等级评定。
观念效标:理论定义,如“大学的成功” 效标测量:操作定义,如“大学成绩”
dcbabcpct失误命中命中20216713结构效度结构效度含义特点与应用范围含义特点与应用范围结构效度结构效度structurevaliditystructurevalidity是指一个测验实际测到所要测是指一个测验实际测到所要测量的理论结构或特质的程度或者说测验分数能够说明心理学理量的理论结构或特质的程度或者说测验分数能够说明心理学理论的某种结构或特质的程度论的某种结构或特质的程度构思或结构是指心理学理论所涉及
(2)测验之间寻找证据法
a.相容效度法:新老测验之间的相关(两测验测的是同一心理特质)。若相关高,则 说明新测验可能有较高的效度。
b.区分效度法:新老测验之间的相关(两测验测的不是同一心理特质),若相关低, 则说明新测验可能有较高的效度。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、内容效度
(一)内容效度的含义 1.内容效度: ♪ 指测验实际测到的内容与所要测量的内容之间的吻合程度,也
就是对测量工具本身的具体内容进行系统性的查验,以确定这 些内容是不是测量目标特质或行为领域的一个有代表性的样本。 2.内容效度的关键问题是测验题目的代表性程度。 ♪ 没有代表性表现:覆盖面不够、偏题、超纲。 3.具备高内容效度的两个基本条件: ♪ (1)所要测量的内容范围必须定义清楚,界限分明,重点突出。 ♪ (2)测验题目应是所界定的内容范围的代表性取样。
2.统计分析法
相关法——复本信度
♪ r高:内容效度高(冒风险:都低)
♪ r低:至少一个缺乏内容效度
再测法
♪ 被试学习某知识前做一次测验, 在学过该知识后再做同样地测 验,如后测成绩显著优于前测 成绩,说明所测内容是被试新 进学习的内容,从而证明测验 效度高。
相关
复本1
复本2
被试团体
知识 学习
比较 前后测
3.结构效度的特点:
♪ 其大小取决于事先假定的心理特质理论。
♪ 实际资料不证明理论不代表结构效度一定就不高。
♪ 主要用于智力测验、人格测验。
(二)验证结构效度的步骤
♪ 1.寻找测验依据的理论定义。 ♪ 2.提出理论假设,并把这一假设分解成一些细小的纲目,以
解释被试在测验上的表现。 ♪ 3.依据理论框架,推演出有关测验成绩的假设。 ♪ 4.搜集资料,用逻辑的和实证的方法来验证假设。
一个测验要有效必须具备以下几点:
♪ 1.效度系数显著地大于0,即同一特质的各种不同测量应 有正相关;
♪ 2.以不同方法测量同一特质的相关必须高于不同的特质用 同一方法来测的相关。也就是说,特质的差异必须比方法 的差异更重要;
(1)表面效度是由外行对测验做表面上的检查确定的,而 内容效度是由够资格的判断者(专家)详尽地、系统地对 测验评价而建立的。
♪ 例如,MMPI中有这样的题目:“我的喉咙里总好象有一 块东西堵着似的。”
(2)表面效度不是效度的客观指标,但能对受测者的动机 产生影响,因而也会影响到效度。
♪ 最高行为测验要求有较高的表面效度,典型行为测验却 要求较低的表面效度。
SV2
SI2
SE2
♪ 2.效度高,S²V占较大比重,S²T↑,S²E↓,rxx↑。效度高,信度必高
♪ 3.图解信效度的关系
信度不高,效度 也不高
信度高,效度也 高
信度高,效度却 不高
信度不高,效度 也不高
(二)测验的效度受它的信度制约
♪ 信度系数永远大于效度系数的最高界限。 ♪ 根据效度和信度的定义
♪ 它的主要缺点是缺乏理想的数量指标,因而妨碍了信息交 流和各测验间的相互比较。
二、结构效度
(一)含义、特点与应用范围:
1.结构效度:是指一个测验实际测出某种心理特质或 特质结构的程度。实验与理论之间的一致性,即实 验是否真正测量到假设(构造)的理论。
2.结构(构想):是心理学理论所涉及的抽象而属假设性 的概念或特质,例如:智力、创造力、动机以及焦 虑等。
(三)搜集结构效度资料的方法
♪ 1.测验内部寻找证据法 ♪ 2.测验之间寻找证据法 ♪ 3.考察测验的实证效度法 ♪ 4.多种特质——多种方法矩阵 ♪ 5.因素分析法 ♪ 6.其他方法
1、测验内部寻找证据法
(1)确定内容效度作为结构效度的证据
♪ 例如,编制语文能力测验时,编制者将总体内容描述 为对词汇下定义、对语言做类比推理、以及在句子中 正确运用文字的能力,这在实际上就是给“语文能力” 的构想下了定义。
关很高,则说明测量效度较高(相容效度即属此 类)。
♪ 从理论上看,测验的结果应与其所要测的特质有显 著相关而与其他不相干的特质无关。
♪ 以相同方法测量相同特质所得的分数之间应具有最 大的相关,
♪ 以不同方法测量相同特质所得的分数之间应具有次 大的相关,
♪ 以相同方法测量不同特质所得的分数之间的相关应 较低,
.93 .50 .96 .53 .51 .92
方 A4 .58 .21 .11 法 B4 .18 .61 .09 4 C4 .20 .15 .71
.66 .11 .19 .30 .68 .18 .22 .18 .70
.70 .13 .14 .22 .68 .20 .23 .19 .71
.89 .51 .90 .52 .50 .91
r2xy= S²V/ S²X rxx= S²T/S²X ♪ 再由公式S²T= S²V + S²I ♪ 可得 r2xy= (S²T - S²I )/ S²X= rxx- S²I/S²X ♪ 因为 S²I>0 r2xy< rxx ♪ 注意:r2xy的表示存在不同的观点,建议用rxy 。
第二节 效度的评估
(2)区分效度
含义:
♪ 新编测验的分数与已知测量不同结构的测验分数 的相关。如相关高则说明测验有问题。
方式:
♪ 求一个新编测验与另一已知结构测验间的相关。
♪ 例:例如新编一套道德感测验,用它与瑞文推理 测验作比较,如果相关高,便说明新编测验有问 题。
3.考查测验的实证效度法
(1)根据效标把人分成两类,考查其得分。 ♪ 例:一组公认为外向的人在测试中的外向性得分
(二)内容效度的评估方法
1.逻辑分析法 2.统计分析法 ♪ 相关法 ♪ 再测法 3.经验推测法
1.逻辑分析法
(1)含义 ♪ 专家按测题和假设内容范围作出的符合度判断 (2)作法与程序 ♪ 明确欲测内容的范围及权重;如双向细目表; ♪ 与双向细目表对比,分析题目的代表性及被试作答的心理过
程; ♪ 制定评定量表; (3)局限 ♪ 无良好的数量指标描述这种符合性的程度; ♪ 不同专家对同一测验内容效度判断可能不一致; ♪ 不同专家对内容范围会有不同的理解
第五章 测量效度
本章学习目标: 1、理解效度的概念和统计学含义。 2、掌握信度和效度之间的关系。 3、掌握三种效度的概念及其估算方法。 4、了解提高测量效度的途径。
本章提要
第一节 效度概述 第二节 效度的估计 第三节 提高测量效度的方法 第四节 效度的应用
第一节 效度概述
一、什么是效度 (一)效度(validity): ♪ 是一个测验实际能测出其所要测量的心理特质的程度。指测
量结果的有效性、准确性程度。 (二)效度回答两个基本问题: ♪ 其一,心理测验所测查的“心理特质”是什么(测验目的); ♪ 其二,该测验对欲测量的心理特质测查到了什么程度?测量
的准确性和有效性如何?
(三)效度检验的实质: ♪ 实质:实际测量结果和测量目标的一致性程度。
实际测量结果
测量目标(心理特质)
♪ 以不同方法测量不同特质所得的分数之间的相关应 最低
多种特质——多种方法矩阵图
方 法1 特 质 A1 B1 C1
方法2 A2 B2 C2
方 法3 A3 B3 C3
方 法4 A4 B4 C4
方 A1 .90
法 B1 .50 .89
聚合 效度或相容效度

1 C1 .35 .41 .81

方 A2 .58 .25 .10
能力
积极的行为指标
1.同情心及敏感性 形成使病人安全的气氛;
严肃地对待病人,对其医疗保密;
快速理解病人的情绪和心情;
医 生 2.沟通技巧 职 业 要 求
…… 显示主动倾听的技能; 不是以恩人的态度出现; 在方法上有信心; ……
3.临床专业技术 相信你的临床判断;
临床能力;
提供预想的照顾;
……
内容效度与表面效度的区别
(三)内容效度的适用范围及评价
♪ 内容效度主要用于学绩测验和职业测验(基于工作任务分 析),也就是测量知识或技能掌握程度的测验。
♪ 人格测验、能力倾向测验、智力测验不适合采用内容效度, 这类测验很难预先确定测试的内容范围。
♪ 内容效度不但是评价学绩测验的最适合的方法,而且编制 任何测验都要加以考虑的方面。
(2)分析被试的答题过程
♪ 例如,在人格测验上有这样一些题目:“当事情不顺 我意时,我时常动怒。”“我总避免批评别人的言 行。”
(3)计算测验的同质性信度来检验结构效度:其一,求 取每个题目与测验总分之间的相关系数;其二,根据 测验总分将被试分为高分组和低分组,再比较这两组 被试在每个题目上的通过率。证明题目与总测验是测 量的同意结构。
弗兰西与米西贝(French & Michbel)1966提出,并被 APA《教育与心理测验及诊断技术标准》所采用的效度分类 法: ♪ 一、内容效度(Content Validity) ♪ 二、结构效度(Construct Validity) ♪ 三、实证效度(Criterion related Validity) 效度是一个整合的概念,不同类型的效度只是寻求证据的方式 不同,收集大量资料和证据来检验测验效度的工作过程就叫 做效度验证 。
一测
再测
3.经验推测法
通过实践过程系统的观察来检验效度
♪ 例如儿童发展量表是否有效,经过对不同年龄阶段 的儿童进行调查,然后分析其结果,观察不同年龄 阶段的儿童对每个题目的反应是否依据年龄的发展 而有所不同,如果通过率是随着年龄的增加而增加 的,就可以推测该测验的内容效度高低。
♪ 实际上看结果是不是证明年龄大的孩子比年龄小的 孩子在得分上要高,高就符合常理,那测验的效度 就高,反之亦然。
一致性程度
♪ 注意:与信度的“一致性”做区别,信度的一致性指的是两 次实际测量的结果的一致性。
实际测量结果1 一致性程度
实际测量结果2
二、效度的概念理解 (一)效度是一个相对的概念。 ♪ 效度是相对于一定的测量目的而言的。 ♪ 效度是相对于一定时间和空间的。 ♪ 效度不是一个全或无的概念。 (二)效度是随机误差和系统误差的综合反映。 (三)判断一个测验是否有效要从多方面搜集证据。 ♪ 心理特质不可直接观测,不能直接与结果比较,
相关文档
最新文档