心理测量学 第五章 效度(用)

合集下载

心理测量学知识复习知识点

心理测量学知识复习知识点

心理测量学知识复习知识点第五章心理测量学知识复习1、首先倡导科学心理测验的学者是英国生物学家和心理学家高尔登(F.Galton)。

2、1890年,卡特尔在《心理》杂志上发表“心理测验与测量”一文,这是心理测验第一次浮现于心理学文献中。

3、比内(A.Binet)与其助手西蒙(T.Simon) 研究制作了世界上第一具正式的心理测验。

4、心理测验的进展⒈操作测验的进展⒉团体智力测验的进展:由欧提斯所编团体测验的基础上进展而来的陆军甲种和乙种智力测验,用于美国军队对官兵选拔和分派兵种的需要。

⒊能力倾向测验的进展:韦克斯勒所编的学前儿童,学龄儿童和成人智力量表,首先抛弃智龄那个测量单位,运用离差智商代替比率智商,将表分言语和操作两部分,别仅能够计算IQ,也可区分智力的别同侧面。

⒋人格测验的进展:包括对性格,气质,情绪状态,人际关系,动机,兴趣和态度的测量。

先驱是克雷丕林,最早将自由联想测验施测于精神病人5、心理测验的定义依照一定的法则用数字对人的行为加以确定,即依照一定的心理学理论,使用一定的操作程序,给人的行为确定出一种数量化的价值。

6、心理测验三个基本要素:⒈行为样本:是一具人对测验题目所举行的反应,所包含的不过全部也许题目的一具样本。

取部分代表全体,取样研究的有效与否,关键在于样本的代表性,即别是任何部分都能够代表全体。

⒉标准化:指测验编制,实施,记分及测验分数解释程序的一致性,重要的是建立有代表性的常模。

⒊难度的客观测量:测验的实施,评分,解释应是客观的,尽可能减少主试和被试的随意程度。

测题或整个测验的难度水平的确必须客观。

7、心理测验的性质(领略)⒈间接性:无法直截了当测量人的心理。

⒉相对性:没有绝对的标准,也没有绝对的零点,测的结果是相对照较而言的。

⒊客观性:实际算是测验的标准化咨询题。

8、心理测验分类(识记)⒈智力测验:测量人的普通智力水平,包括:比内—西蒙智力量表,斯坦福—比内智力量表,韦克斯勒儿童和成人智力量表。

(完整版)心理学中的各种信度和效度

(完整版)心理学中的各种信度和效度

(完整版)⼼理学中的各种信度和效度⼼理学中的各种信度和效度⼀、信度所谓信度,指的是测量结果的稳定性程度,其操作定义是,信度乃是⼀个测验X与它的任意⼀个“平⾏测验X'的相关系数。

⽆关因素、测验的长度、测验试题的区分度、被试团体的代表性都会影响信度。

(⼀)重测信度1、定义:利⽤同⼀量表,让同⼀被试群体在不同时间两次施测之后的相关值。

这⼀信度值表⽰的是测验结果的稳定性,故也称之为稳定性系数。

2、形式:施测——经过适当时间——再施测3、举例:假设有⼀份主观幸福感调查表,先后两次施测于10名学⽣,时间间隔为半年,结果如下表所⽰,求该测验的重测信度。

4、使⽤的前提条件(1)所测量的⼼理特质必须是稳定的。

(2)遗忘和练习的效果基本上互相抵消。

(3)在两次施测的间隔期内,被试在所要测查的⼼理特质⽅⾯没有更多的学习和训练。

5、注意事项(1)有些测验不宜采⽤重测法估计信度,如测量推理和创造⼒的测验。

那些不易受重复使⽤影响的测验才能⽤再测法估计信度。

如感觉运动测验、⼈格测验。

(2)两次测验间隔的时间要适当,并注意提⾼被试的积极性(3)测验⼿册中报告重测信度时应说明两次施测的间隔,以及在此期间内被试的有关经历(4)时间间隔的把握:适宜时间间隔依照测验⽬的、性质及被试特点⽽定,可以是⼏分钟甚⾄⼏年。

例如对于年幼⼉童的间隔要⼩;年长群体的间隔可⼤。

但智⼒测验的间隔不能太短,成就测验的间隔不能太长。

⼀般间隔时间不超过六个⽉,既不能让被试记住上⼀次测验的内容,⼜不能让其特质发⽣变化,或对所学知识产⽣遗忘。

6、重测信度的评价:(1)优点:能够提供有关测验结果是否随时间⽽变异的资料,可作为预测受测者将来⾏为表现的依据。

(2)缺点:易受练习和记忆的影响,前后两次施测间隔的长短必须要适度。

(⼆)复本信度1、什么是复本:任何测验只是所有可能题⽬中的⼀份取样,所以可编制许多平⾏的等值测验,叫做复本。

复本等值要符合下列条件:(1)各份测验测量的是同⼀种⼼理特性。

心理测量学第五章-效度

心理测量学第五章-效度

.93 .50 .96 .53 .51 .92
方 A4 .58 .21 .11 法 B4 .18 .61 .09 4 C4 .20 .15 .71
.66 .11 .19 .30 .68 .18 .22 .18 .70
.70 .13 .14 .22 .68 .20 .23 .19 .71
.89 .51 .90 .52 .50 .91
(2)分析被试的答题过程
♪ 例如,在人格测验上有这样一些题目:“当事情不顺 我意时,我时常动怒。”“我总避免批评别人的言 行。”
(3)计算测验的同质性信度来检验结构效度:其一,求 取每个题目与测验总分之间的相关系数;其二,根据 测验总分将被试分为高分组和低分组,再比较这两组 被试在每个题目上的通过率。证明题目与总测验是测 量的同意结构。
(2)区分效度
含义:
♪ 新编测验的分数与已知测量不同结构的测验分数 的相关。如相关高则说明测验有问题。
方式:
♪ 求一个新编测验与另一已知结构测验间的相关。
♪ 例:例如新编一套道德感测验,用它与瑞文推理 测验作比较,如果相关高,便说明新编测验有问 题。
3.考查测验的实证效度法
(1)根据效标把人分成两类,考查其得分。 ♪ 例:一组公认为外向的人在测试中的外向性得分
(三)内容效度的适用范围及评价
♪ 内容效度主要用于学绩测验和职业测验(基于工作任务分 析),也就是测量知识或技能掌握程度的测验。
♪ 人格测验、能力倾向测验、智力测验不适合采用内容效度, 这类测验很难预先确定测试的内容范围。
♪ 内容效度不但是评价学绩测验的最适合的方法,而且编制 任何测验都要加以考虑的方面。
例:双向细目表
第一步、教学目标(以橫轴表示) ♪ 以Bloom所提的认知领域六个教学目标为依据:知识、

心理测量学知识--效度

心理测量学知识--效度

智力结构。
• 测验的内部一致性指标可以推断测验是测量单一 还是多种特质:分半信度、a系数等。

分析被试者对题目的反应特点也可以作为构思效
度的证据:
24
2013-7-9
二、构想效度
第二单元 效度评估的方法
测验间的相互比较
通过分析几个测验间的相互关系,找出共同之处,进 而推断这些测验的特质是什么,确定构思效度如何。 • 相容效度是构思效度的一个证据:一个旧测验是 有效度证据的,一个新测验是没有效度证明的, 两者测同一种特质。计算两种测验之间的相关。 相关高,新测验所测特质与旧测验一致性就高, 这一相关为相容效度。 • 相容效度高,证明新测验构思效度高。
(logical validity)。
2013-7-9
17
一、内容效度
第二单元 效度评估的方法
专家判断法 • 专家评定前的准备: 1、定义好测验内容的总体范围,描述有关的知识与技 能及所用材料的来源; 2、编制双向细目表,确定内容和技能各自所占的比例, 每个题目测什么内容和技能; 3、制定评定量表来测量测验的整个效度; 最后,由每位评判者在评定量表上作出判断,获得测
第一单元 效度的概念
学了,就知道了!
1、什么是效度?
效度是指所测量的与所要测量的心理特点之间符合的程度,或者简 单地说是指一个心理测验的准确性。
2、信度与效度的关系?
信度受随机误差影响,效度受随机误差和系统误差影响。可信的测
验未必有效,有效的测验比可信。信度是效度的必要条件。
3、效度的性质?
相对性、连续性
(一)效度具有相对性
任何测验的效度都是对一定的目标来说的。测 验只有用于与测验目标一致的目的和场合才会 有效。… 测验不是万能的,只对特定心理属性有效。…

第5章效度_PPT幻灯片

第5章效度_PPT幻灯片

3、经验推测法
这种效度是通过实践来检验效度。如儿 童发展量表是否有效,需要经过实践调查。
(三)内容效度的特性 表面效度(重点):是由外行对测
验作表面上的检查确定的,它不反映 测验实际测量的东西,只是指测验表 面上看来好像是测量所要测的东西。
编制测验时,表面效度需要考虑。
最高行为测验,如智力测验、成 就测验,需要较高的表面效度。
第三节 影响效度的因素
一、测验本身的因素 二、测验实施中的干扰因素 (一)主试的影响因素 (二)被试的影响因素 三、样本团体的性质 (一)样本团体的异质性 (三)干涉变量 四、效标的性质
一、测验本身的因素
如词汇和句型不能过于太难,如低年级 小学生,要用拼音和图形来注解。测验取 材、测验长度、试题类型、难度、区分度 及编排方式等都会影响效度。
• 1、如果某测验的效度系数是0.70,则在测 验中无法作出正确预测的比例是( )。
• (A)0.30 • (B)0.51 • (C)0.49 • (D)0.70
• 2、一个测验所测量的与所要测量的心理特 点之间符合的程度,指的就是测验的( )。
(A)信度 (B)难度 (C)区分度 (D)效度
• 3、好的效标应具备的条件包括( )。 • (A)效标测量本身必须有效 • (B)效标必须具有较高的信度 • (C)效标可以客观地加以测量 • (D)效标测量的方法经济实用
典型行为测验却要求较低的表面效 度,如大多数人格测验,如UPI中的25 题“想轻生”。
二、构想效度
(一)什么是构想效度 定义:是指测验能够测量到理论上的构
想或特质的程度,即测验的结果是否能 证实或解释某一理论的假设、术语或构 想,解释的程度如何。
建立构想效度的三步

心理测量学的知识

心理测量学的知识

心理测量学的知识第五章心理测量学知识第一节概述第一单元测量与测量量表一、什么是测量1.测量是依据一定的法则用数字对事物加以确定。

该定义包括三个要素,即事物、数字和法则。

2.数字具有区分性、序列性、等距性和可加性。

二、则量要素(一)参照点1.要确定事物的量,必须有一个计算的起点,这个起点叫做参照点。

2.参照点有两种:一是绝对零点。

二是人为确定的参照点,即相对零点。

3.理想的参照点是绝对零点,但在心理测量中很难找到绝对零点,多采用人为标定的测量零点。

(二)单位:具备两个条件1.有确定的意义。

2.有相同的价值。

三、测量量表根据量表的精确程度,斯蒂文斯将测量从低级到高级分成四种水平:(一)命名量表1.命名量表是测量水平最低的一种量表形式,只用数字来代表事物或把事物归类。

2.这种量表分为两种:(1)代号——用数字来代表个别事物。

(2)类别——用数字来代表具有某一属性的事物的全体。

3.在命名量表中,数字只用来作标记和分类,而不能作数量化分析,既不能比大小,也不能做加、减、乘、除运算。

(二)顺序量表1.顺序量表比命名量表水平高,其中的数字不仅指明类别,同时也指明类别的大小或含有某种属性的程度。

2.数字包含有数量关系,代表符号是“>”,如A>B>C等,主要用于分等或排出顺序。

3.顺序量表既无相等单位,又无绝对零点,数字仅表示等级,并不表示某种属性的真正量或绝对值。

(三)等距量表1.有大小关系,而且具有相等的单位,其数值可做加、减运算,但因为没有绝对零点,所以不能做乘、除运算。

2.等距量表的数值加上或减去一个常数,或者用一个常数去乘或除,不会破坏原来数据之间的等距关系。

(四)等比量表1.等比量表是最高水平的量表,既有相等单位,又有绝对零点。

2.长度、重量、时间等都是等比量表,其数值可以做加、减、乘、除运算。

心理测量是在顺序量表上进行,利用某种统计方法,可以把顺序量表得到的数据换算为等距数据来进行统计。

第二单元心理测量的基本概念一、心理测量的定义:依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。

2019年 第五章 心理测量学(打印版)

2019年 第五章 心理测量学(打印版)
心理测验在未来发展倾向:团体智力测验、能力倾向测验、人格测验和操作测验。 (二)现代心理测验在我国的发展
1916 年樊炳清先生首先介绍了比内—西蒙智力量表。1920 年,北京高等师范和南京师 范学校建立了我国最早的两个心理学实验室,廖世承和陈鹤琴先生在南京高等师范学校开设 心理测量课。1921 年,他俩正式出版《心理测验法》一书,当时影响很大。1922 年夏天, 中华教育改进社聘请美国教育心理测验专家麦考尔来华讲学。
单位是测量的基本要素,没有单位就无法进行测量。好的单位具备条件:一是确定的 意义,二是相同的价值。一般来说,心理测量的单位往往不够完善。
三、测量量表
量表是根据一定法则在一个定有单位和参照点的连续体上把事物的属性表现出来的连 续体。根据量表的精确度,斯蒂文斯将量表从低到高分为成四种水平,即命名量表、顺序量 表、等距量表和等比量表。 (一)命名量表
课程简介
心理测量学是心理学的一门专业基础学科,心理测量是重要的心 理学研究方法,是心理诊断和人力资源管理中决策的辅助工具,但心 理测量工具目前尚不完善。
心理测量是心理学工作者需要熟练掌握的一项工具或一种手段。 因为心理测量学中涉及到统计学和数学方面知识,在心理咨询师知识 结构中是最难学、最难懂的一门课程,所以,本章课程对大部分参加 心理咨询师课程学习者来说是具有相当难度的。
心理咨询师 (基础知识)
第五章 心理测量学
辅 导 资 料
洪进鹏 2018.11
第五章 心理测量学 课程目录
第一讲 测量:心理咋测量 第二讲 定义:什么是心理测验 第三讲 常模:成绩好坏跟谁比 第四讲 信度:心理测量可靠吗 第五讲 效度:心理测量准确吗 第六讲 项目分析:这次测验难吗 第七讲 编制:测验咋编制 第八讲 技术:测验咋使用

心理测量学人格测验5(评定量表)

心理测量学人格测验5(评定量表)

例如: (1)他的社交如何? 常处于领导地位;善于交际;交流有限; 常回避;不易于与人交流 (2)他和别人的谈话如何? 只回答别人的问题;沉默少言;语至则 谈;语言流利;好多言
(二)猜人测验(Guess-Who Test) 猜人测验是一种标准评定量表,主要目 的是利用同班同学的长时间相处,互相评定 一群学生的各种人格特质。猜人测验最初是 哈特松(H. Hartshorne)在从事品格教育 研究时首先应用的。后经特莱隆(C.M.Tryon 等的研究,发展为两种不同的形式。
三、评定量表举例
(一)莱氏品质评定量表
(Scale for Measuring Introversion Extroversion Qualities)
莱氏品质评定量表又叫内外向品质量 表,是莱德(D. A. Laird)编制的评定他 人内向还是外向在评定时,评定者必须观察被 评者最近数月内的思想行为,逐题评定。在 每一题后面的5个短句中,选择与被试最相 符或相近的一个。评定时间不加限制,记分 时应先查明每题从外向到内向的顺序,然后 以5等记分,依次为1、2、3、4、5分。总分 可与常模比较,高分为内向,低分为外向。
猜人测验1:
下列横线上有12对性质相反的形容词, 横线下面的词语是用来解释或补充这些形容 词的含义的。当你看到每一个形容词时,同 时请你仔细想一想,在你的同班同学中,谁 的日常行为表现和这个形容词的含义最接 近,就把他的姓名填在这个形容词旁边的括 号里,顺着填下去,每个形容词旁边只填写 一个人的姓名,不要空下不填。
记分方式: 按照提名的先后顺序,对提名结果有 加权记分与非加权记分两种方式。前者考 虑到提名顺序的差异可能代表着不同的意 义,给第一提名记5分,给第二提名记3分, 给第三提名记1分;后者不考虑提名顺序 的不同,给第一、第二、第三提名都记为 1分。

心理测量学知识---5

心理测量学知识---5



第二单元 项目区分度

难度和区分度都是相对的。一般来说。较难的项目对高
水平的被试区分度高;较易项目对低水平的被试区分度 高;中等难度项目对中等水平的被试区分度高。

总体上,特别难和特别易的项目少些,中等难度的项目
多些,所有项目平均难度为0.50。即可以保证多数项目
的区分度,也保证整个测验的区分能力。
的行为活动作具体分析。包括:(1)确定哪些心理特征 和行为可以使要预测的活动达到成功,…进而确定题目;
(2)建立衡量被试是否成功的标准,即效标。……

对特定概念下定义:对所测的东西进行界定。比如,创造 力的定义:有人定义为:发散思维的能力。据此创造力应 该从反应的流畅性、灵活性、独创性、详尽性来测量。 确定测验的具体内容:………
验总分应该接近常态分配。
如果获得的分数不是常态,而是偏态分布的,说明题目
偏难或偏易。
第一单元 项目的难度
如左图,属于正偏态分布。题目难了,必须Leabharlann 增加足够数量的较容易的项目;
而右图,属于负偏态分布,题目容易了,必
须增加足够数量的有较高难度的项目。
第一单元 项目的难度
当然,不是所有测验都要求测验分数呈常态分布,
第一单元 测验的目标分析
二、测验的用途

所编制的测验是对被试做描述,还是做诊断、
选拔、预测,应该事先确定。

一般来说,测验可以分为两类:显示性测验、
预测性测验。
第一单元 测验的目标分析
(一)显示性测验,是指测验题目和所要测量的
心理特征相似的测验。如成就测验。

古德纳夫把显示性测验分为:样本测验、标记 测验。
第二单元 项目区分度

第五章心理测量工具的评价指标

第五章心理测量工具的评价指标

第五章心理测量工具的评价指标正如任何一个测量工具一样,心理测量工具也有它自身的评价指标。

在心理测量学中,信度、效度、项目区分度和有效的常模都是检验心理测量工具是否具有可靠性、有效性、鉴别性、可比性等良好测量特征的技术指标。

因此,了解相关技术指标的内涵和计算方法对于从事心理测量的人力资源管理部门工作人员来说具有重大意义。

第一节心理测量的信度在进行心理测量时,最重要的心理测量学指标之一就是信度(reliability)。

任何一项好的测量都必须有良好的信度,这是人事测评的中心问题,同时它也是标准化测评的一项基本要求和原则。

一、信度的定义信度指的是测量数据和结果的一致性或可靠性程度,它用于分析测量工具测量的前后一致性水平,并以这种一致性的程度来判断测量工具或测量方法的可靠性。

也就是说使用的测评工具可以稳定地测到它所要测量的事物的程度。

我们在选择和使用测评工具或方法时,信度必须是考虑的重要问题。

测验信度越高,表示测验结果越可信,但也无法期望两次测验结果完全一致,信度除受测验工具本身的影响外,亦受很多其它因素的干扰,如所测量的被试样本特征等。

因此没有一份测验是完全可靠的,信度只是一种程度上大小的差别而已。

一致性高的测量工具是指同一群人接受性质相同内容相同的测验测量后,在各结果间显示出的较强的正相关。

稳定性高的测量工具则是指同一批被试在不同的时间接受同样的测验时,结果间的差异很小。

二、信度与误差在进行心理测量时,信度指的是测验分数未受测量误差(errors of measurement)影响的程度。

测量误差指由与测量目的无关的因素产生的不准确或不一致的效应。

测量误差愈小,测量结果愈可靠;换言之,如果测量的结果能反应受试者真实的特征,而不因其他因素而影响测验结果,那么这个测验所测量的结果是可靠的。

测量误差通常包括两种不同类型的误差,即系统误差和随机误差。

系统误差是由与测量目的无关的因素引起的一种恒定而有规律的效应,它稳定地存在于每一次测量中,此时虽然每次的测量值具有一致性,但不正确。

5笔记 心理测量学知识

5笔记 心理测量学知识

第五章心理测量学知识第一节心理测量在心理咨询中的功能:临床诊断,评估疗效。

心理测验:依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,心理测验的分类:按照测验功能:智力、特殊能力、人格按照测验材料性质:文字、操作按照测验材料的严谨程度:客观、投射按照测验的方式:个别、团体按照测验的要求:最高行为、典型行为错误的测验观:1、测验万能论,2、测验无用论,3、心理测验即智力测验正确的测验观:1、心理测验是重要的心理学研究方法之一,是决策的辅助工具2、心理测验作为研究方法和测量工具尚不完善在咨询中的应用:运用较多的三类:智力测验、人格测验、心理评定量表咨询前:诊断;咨询后:评估。

咨询中测验不是必不可少的环节,如果问题明确,可放弃不必要的测验测验发展史:F.高尔顿——1、提出人的气质和智能是按身体特点遗传的。

(气质是先天的;能力大部分是先天的,少部分是后天的;性格是后天的)2、设计了测量差异的方法,心理测验的开端。

3、提出了相关概念,奠定了统计学基础。

J. M.卡特尔——1、发表《心理测验与测量》,心理测验第一次正式出现于心理学文献中2、主张测验手续和考试方法应有统一规定,并要有常模A.比内——1905年,发表一个30个项目的量表,世界上第一个正式心理测验第二节测验的常模常模团体:由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。

任何一个测验都有许多可能的常模团体。

常模团体的条件:1、群体的构成必须明确界定。

2、常模团体必须是所测群体的代表性样本。

3、样本的大小要适当。

总体数目小,只有几十个人,则需要100%的样本。

如果总体数目大,相应的样本也大,一般最低不小于30或100个。

全国性常模,一般应有2000~3000人为宜。

4、标准化样组是一定时空的产物。

取样的方法:简单随机抽样,系统抽样(等距抽样),分组抽样(先随机分组,再从每组中随机抽人),分层抽样常模分数:施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。

第五章 心理测量学知识点

第五章 心理测量学知识点

第五章心理测量学知识第一节概述1、简述测量的元素。

测量元素:事物、数字、法则。

所谓事物:指的是我们要测量的对象,更准确地说,就是引起我们兴趣的事物的属性和特征。

所谓数字:是代表某一事物或事物某一属性的量。

所谓法则:代表的是测量所依据的规则和方法。

2、心理测验的定义是什么?所谓心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出的推论和数量化分析的一种科学手段。

3、简述心理测验与心理咨询的关系。

咨询和治疗的有效性,不仅取决与咨询人员对心理咨询的性质、过程的正确认识,熟练掌握心理咨询的原则、方法和技巧,同时还有赖于对求助者心理特性、行为问题性质的正确评估和诊断,以便于提供适当的指导、帮助和行为矫正训练。

因此,心理测验在心理咨询中有重要意义。

心理门诊中:智力测验、人格测验以及心理评定量表。

4、简述世界第一个正式的心理测验。

1904年,法国教育部委派许多教育专家、医学专家和其他科学家组成一个委员会,专门研究公立学校中智力落后儿童的教育方法,比内极力主张用一种测验的方法辨别和发现智力落后的儿童。

结果他与助手西蒙的精心研究,次年在《心理学年报》上发表了一篇文章,题为《诊断异常儿童智力的新方法》,在这篇文章中他介绍了一个包括30个项目的量表。

这个量表很粗糙。

但它在心理测验史上极其重要,是世界上第一个正式的心理测验。

第二节测验的常模1、常模选择的步骤是什么?确定一般总体、确定目标总体、确定样本2、取样的定义是什么?取样即从目标人群中选择有代表性的样本3、简述常模的定义及类型。

常模分数构成的分布,就是通常所说的常模,它是解释心理测验分数的基础。

常模有一般常模与特殊常模之分。

测验手册上所列的常模通常为一般常模,不一定适合使用者的具体情况。

特殊常模是为非典型团体建立的,一般比为消团体建立的常模范围更窄。

其优点是,可使被试的结果与最接近的人进行比较,但这同时也是它的缺点,不容许分数在较广范围内作解释。

第5章效度

第5章效度
2 I 2 E
2 2 2 X T E

2 T 2 V
2 I

2 X 2 V
s r s
2 xy
2 v 2 X
r
2 xy
表示效度,
rxy
表示效度系数
信度与效度的区别举例
打靶
二、效度的性质
(一)效度具有相对性 任何测验的效度是对一定的目标来说的, 或者说测验只有用于与测验目标一致的目 的和场合才会有效。 没有任何一个测验都能测任何所有心理 特质,也没有任何一个测验“放之四海皆 准”,因此任何一个测验都有其局限性, 都是针对一定目的而言。
二、构想效度
(一)什么是构想效度 定义:是指测验能够测量到理论上的构 想或特质的程度,即测验的结果是否能 证实或解释某一理论的假设、术语或构 想,解释的程度如何。
建立构想效度的三步
• 第一步:提出理论结构(理论); • 第二步:设计和编制测验进行实际测量 (实践); • 第三步:验证理论与实践的符合程度(往 往采用因素分析或结构方程等模型来进行 验证)
做好以下几点
• • • • • (1)测验材料要有代表性; (2)避免引起误差的题型; (3)难度要适中; (4)测验长度恰当; (5)测验排列顺序。
二、测验实施中的干扰因素 (一)主试的影响因素 (二)被试的影响因素 三、样本团体的性质 (一)样本团体的异质性 (三)干涉变量 四、效标的性质
练习与思考
信度和效度的关系(重点)
一、信度是效度的必要而非充分条件(重点) 二、效度是受信度制约的
2 2 2 2 s S S S 2 v rxy 2 T 2 I rxx I2 sX sX sX
rxy rxx
• 一个测验的效度总是受它的信度所制约; • 信度系数的平方根是效度系数的最高限度; • 效度系数的最高限度是信度指数。

心理测量 第5章 测量效度

心理测量 第5章 测量效度

21 同异性相处时感到害羞不自在 22 感到受骗,中了圈套或有人想抓住您 23 无缘无故地突然感到害怕 24 自己不能控制地大发脾气 25 怕单独出门 26 经常责怪自己 27 腰痛 28 感到难以完成任务 29 感到孤独 30 感到苦闷
31 过分担忧 32 对事物不感兴趣 33 感到害怕 34 您的感情容易受到伤害 35 旁人能知道您的私下想法 36 感到别人不理解您、不同情您 37 感到人们对您不友好,不喜欢您 38 做事必须做得很慢以保证做得正确 39 心跳得很厉害 40 恶心或胃部不舒服
比例,作出尽可能详细的描述 ➢ 确定每道题所测的知识与技能,将自己的分类与测
验编制者的纲目作比较 ➢ 制定评定量表,从各方面对测验作出评定
复本法
克伦巴赫认为,内容效度可由一组被试在 取自同样内容范围的两个测验复本上得分的相 关来做数量上的估计。如果相关低则说明两个 测验中至少有一个缺乏内容效度,但无法确定 究竟哪一个缺乏内容效度。当相关高时,一般 推论测验具有内容效度,但也可能出现两个测 验有相同偏差的情况。
内容效度的应用
作为一种方法,内容效度较为适合于评价教育 成就测验和职业选拔测验。在这种测验中,测 验内容是知识、技能和实际工作的代表性样本。 内容效度不仅是评价教育成就测验和职业选拔 测验的较好方法,而且也是编制任何测验都应 加以考虑的基本方面。内容效度对标准参照测 验更为重要,因为在标准参照测验中我们主要 关心的是被试对一定范围内的知识、技能掌握 得如何。
这说明,对于一个具体的测量目标来说, 有表面效度的题目不见得真正有效,没有表面 效度的题目也可能有效,因此,表面效度不是 确定内容效度的客观指标。尽管如此,表面效 度对被试的动机、态度和行为会产生影响,从 而影响到测验的效度,因此在编制测验题目时, 对表面效度要适当控制。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

b YX r XY
sY sX
0
0 . 923

a=57.5-0.923×69.4=-6.56 Yˆ =-6.56+0.923X
如果我们已知一组人的测验得分,我们可以 根据上式得到他们的效标成绩平均值的预测 值: X=76时, Yˆ =-6.56+0.923×76=63.6 X=55时, Yˆ =-6.56+0.923×88=74.7 预测值不是一个确定值,只是一个估计值, 可以被理解为所有获得某一测验分数者的平 均效标分数值。就是说,所有在测验上得76 分的人的效标分数的平均分为63.6,在例1 中,测验中实际得76分的人的效标平均分为 59.5,测验得88分的人的效标平均分为79.5。
三、影响效标关联效度的因素
(一)样本 这种影响来自两个方面:一是样本的含量,二是样 本的代表性。 (二)基础率 基础率是经选择的总体中具有某种与测验目的有关 的特质的人数比例。极高与极低的基础率,运用测 验都是得不偿失的。 (三)录取率 录取率是根据测验选拔出的人数与全体受测者的比 例。录取率越低,选拔的有效性越高。录取率越高, 错误选择的可能性越大。
2. 方差比例。根据效度定义,效度是有效 分数方差在所得分数方差中所占比例。这只 是一种理论概念,在实际的效度系数的计算 中,效度分数的平方可以解释为在效标分数 的方差中可以用测验分数来解释的百分比,
r XY
2

S YX SY
2
2

r XY =效度系数
S YX
2
SY
2
=由测验所决定的效标分数方差 =效标分数方差
例1 为了考察高等教育自学考试数学试卷的 效度,有关单位在自学高考的高等数学考试 之后,请30名考生参加了某重点大学的高等 数学结业考试。这些考生在两次考试上的成 绩如下表。 计算自学高考数学试卷成绩与普通大学数学 考试成绩之间的相关系数:见附件1
例2 某工厂考虑采用一项考试作为招收工 人的依据。为了检验这项考试的效度,对 20名新工人施测考试之后,让他们工作 了一年,并根据其工作各方面表现进行综 合评定。这20名工人的考试成绩和工作 评定成绩如表。见附件2
为了将系统误差与随机误差相区别,我们将系统误差(System Error)记为SE,将随机误差(Random Error)记为 RE,V 为有 效分数,这样一个人的测验得分即为: X=V+SE+RE 对于一组人的测验分数,相应于上式即有:
S X S V S SE S RE
2 2 2 2
效标效度的分类
根据效标资料的收集时间,效标关联 效度又可以分为同时效度和预测效度。
预测效度:效标资料需要经过一定的 时间距离之后才能收集到的效度。招 生、招工、职业选择测验的效标关联 效度均属于预测效度。 预测效度反映了测验对效标行为的预 测程度。所要回答的问题是:某人会 获得某种能力吗?某人会得精神病吗?
一、定义:测验题目取样的适当性称为内容 效度。例如 二、提高内容效度的条件: 1 要定义测验所代表的内容范围 2 采用系统取样方法。 三、对内容效度的评价(或检验) 对于内容效度较难进行数量化的评价,通常 可以结合具体情况选用某种方法。
(一)与总体的相关
当测验内容所涉及的总体比较明确且数量有 限,能够对一组人施测总体题目时,可以比 较一组人在测验上的表现与总体上的表现, 计算二者相关,看二者是否有较高的一致性。 若一致性较高,则测验有较好的内容效度。 由于测验内容所涉及的总体往往数量很大, 难以全部施测,所以,此种方法只有在个别 情况下才能考虑。
(三)经处理后再测法
通过在一项教学或训练计划实行 的前后两次对一组人施测某一项测验, 可以了解这项测验的内容效度。如果 两次施测的分数差别较明显,可以认 为这个测验与这项教学或训练计划的 内容有较紧密的联系,是这部分内容 的一个代表性样本。
(四)系统比较

评价内容效度最常用的方法是由有关 专家对测验题目与测验所涉及的内容总体 的符合性进行判断,即定性的方法,而不 是定量的方法。将测验所涉及的内容总体 进行细分,由专家们对各个部分进行系统 比较,可以大大地提高这种定性判断的准 确性。
二、效度的种类
对于效度可以从多种方面进行分类。根据美 国心理学会颁布的“教育和心理测验的标 准”,效度被划分为 内容效度(content validity) 效标关联效度(criterion-related validity) 概念效度(construct validity)
第二节 内容效度

取舍正确性指标的计算 要求测验分数和效标分数都是二分的,如 果不是二分的,就要将分数划分成“成功” 与“失败”两组。这样,比较测验分数和效 标分数,即比较预测结果和实际结果可以得 到预测成功而且实际上成功(正确录取), 预测成功而事实上不成功(错误录取),预 测失败而事实上成功(错误拒绝),预测失 败而事实上失败(正确拒绝)四个组,如下 表:
对于例1,我们可以认为,由于 r XY =
2
(0.882)2=0.78,所以,数学成绩(效标 分数)的方差的78%可以用测验分数来解释。
3.预测效标 如果我们已经计算出测验成绩与效标成 绩之间的相关系数,即效度系数,我们就可 以得到从测验成绩预测效标成绩的回归方程 式:
ˆ y a b yX X
同时效度: 效标资料与测验同时收集的效
度叫。例如,在进行智力测验的同时,可以 收集受测者的在校成绩,老师、同学对该受 测人的评价等资料,并以这些资料作为一种 效标来考察这项智力测验的有效性。
二、效标关联效度的检验
(一)效度系数 测验分数与效标测量之间的相关系数可以作为一种 效度指标,称为效度系数,效度系数的计算包括下 列程序: 1. 确定一个适当的研究团体。 2. 对这个团体施测测验。 3. 将这个团体放臵一定的条件下接受观察。 4. 收集效标资料。 5. 计算测验分数与效标分数之间的相关。
第三节
效标关联效度
一、效标和效标关联效度 二、效标关联效度的计算 三、影响效标关联效度的因素
第三节 效标关联效度
一、效标和效标关联效度
效标关联效度是指一个测验对个体行为预
测时的有效性。 例如:用大学入学测验——大学学习成绩 大学入学测验是预测源
作为证明预测源有效性的标准叫效标 大学入学测验 技术工人选拔测验 飞行源选拔测验
t
X
s
X
a 2
n s
1 S s n a 1 S a
2
ns na 2

ns na nsna

80 . 25 57 15 212 . 56 13 308 16 14 2 16 14 16 14
=3.964
(三) 取舍正确性 运用测验的目的是为决策提供依据,是 为了提高正确决定的比例和减少错误决定的 比例。因此,评价一个测验的效度的方法之 一就是计算正确决定的比例,即计算取舍正 确性。
4.预测误差 当我们知道了效度系数以后,可以根据下式 去预测一个人的有效分数的臵信区间。即
SE S Y 1 r XY
2
一个人有效分数95%的臵信区间为
ˆ ˆ Y 1 . 96 SE Y Y 1 . 96 SE
(二)组间比较
确定效度的另一个途径是测验的分数是否可以区分以 效标行为水平所定义的不同的群体。在例1中,如果 普通高校中评定学生期未数学成绩的方法不是五分制, 而是“及格”和“不及格”,那么,效标行为水平就 将学生分成了及格与不及格两组,如果两组之间在测 验分数上有明显的差异,那么,可以认为测验是有效 的,即测验可以对效标分数的高低进行区分,否则, 则可以认为测验是无效的。
除了积差相关外,还有二列及点二列相关
对于效度系数,可以做四种解释,即效度系数 包含着四种含义: 1. 比较意义。对于某一特定的目,例如,选拔 可以达到最高产量的职工,我们有时会面临几 种可供选择的测验,通过计算效度系数和进行 比较,我们可以选择对于这一目的最有效的测 验。例如,如果测验A的效度系数为0.60,测 验B的效度系数为0.50,那么,我们就可以选择 测验A作为我们的预测依据。
上式表明,测验分数的方差可以分成三个部分:有效分数方差、 系统误差分数方差和随机误差分数方差。 图示如下:
SV
2
S SE
2
S RE
2
SX
2
定义 效度为有效分数方差与测验所得分数方差
的比值,即效度系数
r XY SV
2
SX
2
r XY =效度系数 由于效度既要排除随机误差,也要排除系统误差, 所以效度永远小于信度。

例3 如果将60分定为及格线,根据效标成绩将例1 中的一组考生分为及格组和不及格组,则两组人的 测验成绩的统计参数为:
及格组
X
i
=80.25
X
a
S S =212.56
2
n s =16
n a =14
不及格组
=57
S a =308
2
用t 检验看两组在测验成绩平均分数上是否存在显 著差异:
P pc
正确录取人数 录取总人数

A AB
对于上题中的数据,正命中率为:
P pc 14 14 8 14 22 0 . 64
(四)功利率 对测验的进一步的评价就是确定测验是否能 够带来实际的经济效益,这在选拔工人和职 员中非常重要。评价实际效益的指标为功利 率。计算测验的功利率的条件是对测验编制 和实施的费用,对测验所产生的经济效益进 行核算。
b YX r XY SY S
X

ˆ y =预测的效标分数
相关文档
最新文档