第五部分心理测量的信度教学案例
心理测量学 第五章 效度(用)
b YX r XY
sY sX
0
0 . 923
a=57.5-0.923×69.4=-6.56 Yˆ =-6.56+0.923X
如果我们已知一组人的测验得分,我们可以 根据上式得到他们的效标成绩平均值的预测 值: X=76时, Yˆ =-6.56+0.923×76=63.6 X=55时, Yˆ =-6.56+0.923×88=74.7 预测值不是一个确定值,只是一个估计值, 可以被理解为所有获得某一测验分数者的平 均效标分数值。就是说,所有在测验上得76 分的人的效标分数的平均分为63.6,在例1 中,测验中实际得76分的人的效标平均分为 59.5,测验得88分的人的效标平均分为79.5。
三、影响效标关联效度的因素
(一)样本 这种影响来自两个方面:一是样本的含量,二是样 本的代表性。 (二)基础率 基础率是经选择的总体中具有某种与测验目的有关 的特质的人数比例。极高与极低的基础率,运用测 验都是得不偿失的。 (三)录取率 录取率是根据测验选拔出的人数与全体受测者的比 例。录取率越低,选拔的有效性越高。录取率越高, 错误选择的可能性越大。
2. 方差比例。根据效度定义,效度是有效 分数方差在所得分数方差中所占比例。这只 是一种理论概念,在实际的效度系数的计算 中,效度分数的平方可以解释为在效标分数 的方差中可以用测验分数来解释的百分比,
r XY
2
S YX SY
2
2
r XY =效度系数
S YX
2
SY
2
=由测验所决定的效标分数方差 =效标分数方差
例1 为了考察高等教育自学考试数学试卷的 效度,有关单位在自学高考的高等数学考试 之后,请30名考生参加了某重点大学的高等 数学结业考试。这些考生在两次考试上的成 绩如下表。 计算自学高考数学试卷成绩与普通大学数学 考试成绩之间的相关系数:见附件1
《心理咨询师 理论知识》第五章 心理测量学知识(精华版)
第一节概述第一单元测量与测量量表(P348-350)一、测量的定义:测量就是依据一定的法则用数字对事物加以确定。
该定义包括三个主要的元素:事物(指的是我们要测量的对象,更准确地说,就是引起我们兴趣的事物的属性或特征)、数字(是代表某一事物或事物某一属性的量)、法则(代表的是测量所依据的规则和方法)。
二、测量要素:参照点、单位参照点:要确定事物的量,必须有一个计算的起点,这个起点叫做参照点。
1绝对零点(全无)2相对零点(人为);单位:是测量的基本要求,没有单位就无法进行测量;好的单位必须具备的两个条件:有确定的意义、相同的价值。
三、测量量表:斯蒂文斯测量表的四水平:命名量表、顺序量表、等距量表、等比量表(心理测量为顺序量表)种类功能基本特征运算举例1.命名量表代号或分类无相等单位无绝对零点不能+-×÷性别、学号⋯2.顺序量表1+等级无相等单位无绝对零点不能+-×÷品德、名次、⋯3.等距量表2+差异决策和比较有相等单位无绝对零点可+-温度、分数⋯4.比率量表3+比值决策和比较有相等单位有绝对零点可+-×÷身高、体重⋯第二单元心理测量的基本概念(P350-352)一、心理测量的定义:心理测验的定义:依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。
1、心理测验测量的是人的行为。
2、心理测验在测量个别差异的时候,往往只是对少数经过慎重选择的行为样本进行观察,来间接推知被试者的心理特征。
3、为了使不同的被试者所获得的分数有比较的可能性,测验的条件对所有的被试者都必须是相同的。
4、个人在测验中所得到的原始分数并不具有什么意义,只有将它与其他人的分数或常模相比较才有意义。
二、心理测验的性质:间接性(心理测量的间接性迄今为止,我们还无法直接测量人的心理,只能通过测量人的外显行为,即通过测量人们对测验题目的反应来推论出他的心理特质);相对性(心理测量的相对性我们在比较不同人之间的行为或心理特征时,没有绝对的标准,也没有绝对的零点,我们有的只是一个连续的行为序列);客观性(1、测验的刺激是客观的2、对反应的量化是客观的3、对结果的推论是客观的)第三单元心理测验的分类(P352-354)分类标准分类定义智力测验按功能分特殊能力测验人格测验文字测验按测验材料的性质分操作测验客观测验按测验材料的严谨程度分投射测验个别测验按测验的方式分团体测验最高作为测验要求受测者尽可能做出最好的回答,与认知过程有关,有正确答案;如智力测验、成就测验按测验的要求分典型行为测验要求受测者尽按通常的习惯方式做出反应,没有正确答案;如人格测验第四单元纠正错误的测验观(P354)错误的测验观:万能论、无用论、心理测验即智力测验正确的测验观:重要的心理学研究方法之一;是决策的辅助工具;作为研究方法和测量工具尚不完善第五单元心理测验在心理咨询中的应用(P355-356)在我国的心理门诊中应用较多的三类心理测验:智力测验(可在求助者有特殊要求时及对方有可疑智力障碍的情况下应用);人格测验(有助于治疗者对求助者人格特征的了解,以便于对其问题有更深入的理解,并可针对性地开展咨询与心理治疗工作);心理评定量表(用于检查求助者某方面心理障碍的存在与否或其程度如何)。
心理测量学课程教学大纲讲课教案
心理测量学课程教学大纲一、课程编号二、课程英文名称Psychological measurement三、学时\学分64学时\4学分四、开课学期(春、秋、全年)第三学期(秋)五、先修课程普通心理学、心理统计学六、适用专业(层次)应用心理学本科七、课程简介本课程是心理学专业的学科专业基础课程,属于定量研究方法类课程,包括心理测量的理论和心理测量的具体方法两部分。
通过心理测量理论的学习,学生将了解心理测量史,理解心理测量的性质,掌握信度、效度、难度、区分度等概念及估计,了解测验编制的基本方法,掌握测验分数的解释方法等。
通过心理测量具体方法的学习,学生将了解有关智能量表、人格量表等量表的内容、测验方法、记分和解释等,获得基本的测验实施技能。
八、课程内容主要内容:心理测量理论部分包括心理测量史、测量的性质、测验的编制、测验的实施、测验分数的解释、信度、效度、难度、区分度等。
心理测量具体方法部分包括智能量表、人格量表等量表的内容、测验方法、记分和解释等。
课程重点:测量的性质、测验的实施、测验分数的解释、信度、效度、难度、区分度。
课程难点:测验分数的解释、信度、效度、难度、区分度。
第一章心理测量的历史发展了解:中国古代的心理测量思想和实践,西方心理测量早期的探索,科学心理测验产生与发展,心理测量和测验在中国的发展第一节中国古代的心理测量思想和实践一、孔子二、孟子三、刘邵与《人物志》四、科举取士制度五、中国民间第二节西方心理测量早期的探索一、早期对智力落后儿童的分类与训练的尝试二、冯特实验心理学的影响三、高尔顿的思想和贡献四、卡特尔及其早期个别差异研究第三节科学心理测验产生与发展一、比奈和世界上第一个智力测验二、心理测验在西方的发展第四节心理测量和测验在中国的发展一、旧中国心理测验的发展与停滞二、新中国成立后心理测量和测验的发展三、近20年来的发展第二章心理测量的性质了解:测验的种类,测验的应用理解:测量的基本问题,心理测量的基本概念,心理测验的基本概念第一节测量的基本问题一、测量的定义史蒂文斯:就其广义来说,测量是按照法则给事物指派数字。
2019年 第五章 心理测量学(打印版)
1916 年樊炳清先生首先介绍了比内—西蒙智力量表。1920 年,北京高等师范和南京师 范学校建立了我国最早的两个心理学实验室,廖世承和陈鹤琴先生在南京高等师范学校开设 心理测量课。1921 年,他俩正式出版《心理测验法》一书,当时影响很大。1922 年夏天, 中华教育改进社聘请美国教育心理测验专家麦考尔来华讲学。
单位是测量的基本要素,没有单位就无法进行测量。好的单位具备条件:一是确定的 意义,二是相同的价值。一般来说,心理测量的单位往往不够完善。
三、测量量表
量表是根据一定法则在一个定有单位和参照点的连续体上把事物的属性表现出来的连 续体。根据量表的精确度,斯蒂文斯将量表从低到高分为成四种水平,即命名量表、顺序量 表、等距量表和等比量表。 (一)命名量表
课程简介
心理测量学是心理学的一门专业基础学科,心理测量是重要的心 理学研究方法,是心理诊断和人力资源管理中决策的辅助工具,但心 理测量工具目前尚不完善。
心理测量是心理学工作者需要熟练掌握的一项工具或一种手段。 因为心理测量学中涉及到统计学和数学方面知识,在心理咨询师知识 结构中是最难学、最难懂的一门课程,所以,本章课程对大部分参加 心理咨询师课程学习者来说是具有相当难度的。
心理咨询师 (基础知识)
第五章 心理测量学
辅 导 资 料
洪进鹏 2018.11
第五章 心理测量学 课程目录
第一讲 测量:心理咋测量 第二讲 定义:什么是心理测验 第三讲 常模:成绩好坏跟谁比 第四讲 信度:心理测量可靠吗 第五讲 效度:心理测量准确吗 第六讲 项目分析:这次测验难吗 第七讲 编制:测验咋编制 第八讲 技术:测验咋使用
心理测量与教案测量信度教学目的通过本章的教学
《心理测量与评估》教案 跨时间跨形式的一致性。是合估等值性与稳定性而得到的信度系数。 既能反映由于试题变异(复份)引起的测验成绩变化的程度,又能反映由于应试者的变异(在两次测验 的间隔中,由学习、练习、成熟等引起的应试者的变化)而产生的测验成绩的变化的程度。 计算等值稳定性系数基本上采用复份法,但要求一个适当长的时距。 等值稳定性系数的模式如下:测验A1 适 当 时 距 测验B1 皮尔逊积差相关公式
四、内部一致性系数(同质性信度) (homogeneity reliability) 跨项目的一致性。主要反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。内部一致 性系数是用同一测验量表的两个部分得分的相关系数。 同质性信度指测验内部所有题目间的一致性。题目的一致性有两层含义:其一是指所有题目都测的是同 一种心理特质;其二是指所有题目之间都具有较高的正相关。总之,同质性信度就是一个测验所测内容或特 质的相同程度。 计算内部一致性系数的方法有以下两种: 1、分半法 这种方法是把一个量表按题目序号分为两半,一般奇数题,一般偶数题,计算时先把每个人的奇数题、 偶数题得分相加,得一个奇数题总分,一个偶数题总分,然后求所有应试者奇数题总分与偶数题总分的相关 系数。最后用斯皮尔曼—布朗公式校正,求整个测验的信度系数。 皮尔逊积差相关公式
2
2
其中,rkk 为整个测验结果的信度系数;K 为题目数;pi 为通过第 i 个题目的人数占总人数的百分数;qi 为 2 未通过第 i 个题目的人数占总人数的百分数(qi=1-pi) ;Sx 为测验总分的变异数。 注:适用答对一题得一分,答错无分的测验。 ②KR21 用法:这个公式以各应试者总分的平均数和方差为基础计算,无需各题难度的信息。
其中,k 是题目数:pi 为题目的平均通过率;qi 为 1-pi;X 为测验总分的平均数;Sx 为测验总分的变异 数。
五章节心理测量信度
我们可以用“差异的标准误”来检验差异的显著 性。
差S 异d的E 标S 准1 误2 E 的S公2E 2 式 为S:2rxx ry(y 公式5-5)
r SE d为差异的标准误,S为相同尺度的xx标准r y分y 数的
标准差,Z分数为1,T分数为10。 、 分别为 两个测验的信度系数。
先将原始分数化成标准分数,然后将两个标准分
(3)获得较高的信度系数并不是心理测 量有效的充分条件,只是一个必要条件。 back
1.评价测验
信度系数是衡量测验好坏的一个重要的技术指 标。
一般能力与学绩测验的信度系数为0.90以上, 有的可以达到0.95;标准智力测验的信度系数 应达到0.85以上,个性和兴趣测验的信度系数 可稍低,一般应达到0.70~0.80,(也有人认 为兴趣、性格、价值观等人格测验的信度系数, 通常在0.80~0.85或更高些)。当信度系数小 于0.70时,不能用测验来对个人进行评价,也 不能用来进行团体间的比较;当信度系数大于 0.70时,可用来进行团体间的比较;大于0.85 时,可以用来鉴别个人。
第五章 心理测量的信度
第一节 第二节 第三节
什么以表示为:
rxx
1
S 2E S2X
(公式5-2)
这个定义有两点要注意:
(1)信度是一组测量分数的特性,不是 某个测量分数的特性。是对一个人测量 多次或对一个群体进行测量得到一组测 量分数的特性
表5-1 某幸福感调查表的两次测试结果
测
被试
验 1 2 3 4 5 6 7 8 9 10
X1 16 15 13 13 11 10 10 9 8 7
X2 16 16 14 12 11 9 11 8 6 7
计算再测信度必须注意几个问题:
心理测量学—信度
内容抽样
复本信度 (间隔施测)
内容抽样,时间抽样
分半信度 内容抽样
同质性信度 内容的异质性
评分者信度 评分者之间的差异
Pearson相关
Pearson相关
Pearson相关
Pearson相关 Spearman-Brown校正 0,1计分:K-R法 多级计分:α系数 Pearson相关 Kender’W系数
rxx
88.7 0.97 72.06 117
练习:
以下是10名被试在同一测验中两次测量的得分 情况,计算该测验的重测信度。
测 验
ABCDE FGH
I
J
X1 70 82 65 69 77 90 45 85 66 72
X2 75 83 63 70 75 92 46 87 70 70
2、计算重测信度的几个假设:
被试
题目
1
2
3
4
5
6
7
8
1
0
1
0
0
0
0
0
0
2
1
0
1
1
0
1
0
0
3
1
1
0
1
0
0
0
0
4
1
1
1
1
1
0
0
0
5
1
1
1
1
1
1
1
1
6
1
1
0
1
1
1
1
1
7
1
0
1
1
1
0
0
0
8
1
1
1
1
第五章 测量效度
效度不是一个全或无的概念。
2、效度是随机误差和系统误差的综合反映。
3、效度不是直接可以测量到的,判断一个测验 是否有效要从多方面搜集证据,从证据去推 论测验的效度 (犹如法庭上收集证据一样) 。
三、用统计学术语谈效度
根据CTT假设,有以下公式存在:
S S +Sபைடு நூலகம்=S S S
2 X
2 T
2 E
2 V
2 I
2 E
效度系数等于有效分数的方差与观测分数的方差之 比,即:
r
2
xy
S S
2 V 2 X
四、效度和信度的关系
1、信度高是效度高的必要而非充分的条件。 即信度高但效度不一定高(非充分条件),信 度低则效度一定低(必要条件)。
高信度,低效度 高信度,高效度 低信度,低效度
总命中率关心录取者中合格的人数与淘汰者 中不合格的人数的比率。 正命中率只关心录取者中有多少合格的人, 不关心淘汰者是否有合格的人。
(三)影响效标关联效度的因素
1、效标的选择:效标的适当性; 2、效标测量与预测源测量的时间间隔; 3、预测源与效标测量的信度; 4、被试样本的特征:样本的大小、样本的 代表性。
一、内容效度
(一)内容效度的含义
定义:指一个测验实际测到的内容与所要测量
的内容之间的吻合程度。或者说,指测验题目 对所要测量的内容范围的代表性程度。 内容效度的关键问题是测验题目取样的代表性 程度。(覆盖面不够、偏题、超纲)
金瑜《心理测量》-章节题库-第5章 信 度【圣才出品】
第5章信度一、单项选择题1.某测验的信度为0.64,实得分数的标准差为5,该测验的标准误为()。
[统考2010研]A.0.36B.1.04C.3.00D.4.36【答案】C【解析】根据标准误的公式,代入数据,得:3===SE S2.在经典测量理论模型X=T+E中,关于E的表述,错误的是()。
[统考2010研]A.真分数和误差分数(E)之间的相关为零B.各平行测验上的误差分数(E)之间相关为零C.误差分数(E)是随机误差与系统误差之和D.误差分数(E)是一个服从均值为零的正态分布的随机变量【答案】C【解析】真分数理论有三个基本假设作为整个理论的支柱:①误差分数的平均数是零,即E是个服从均值为零的正态分布;②误差分数与真分数相互独立,相关为零;③两次平行测验测量的误差分数之间的相关为零。
第②、③条说明E是个随机误差,没有包含系统误差在内。
3.重测信度的主要误差源是()。
[统考2009研]A.内容取样B.时间取样C.统计方法D.评分者【答案】B【解析】重测信度是指同一个测验先后施测于同一批被试,比较这两次测验结果的一致性程度。
其中时间的长短是影响其信度的关键因素。
如果时间太短则被试可能存在记忆;如果时间太长,则被试的消失率或者被试本身的成熟发育等会影响实验结果。
4.在测量研究中,强调对测验情境关系进行考察的心理测量理论是()。
[统考2009研]A.经典测量理论B.项目反应理论C.概化理论D.测验等值理论【答案】C【解析】概化理论提出了测验情境关系说,在不同的测验情境关系下,测量误差的结构不同,误差量也不同。
由此测验编制者可以通过改变测验情境关系达到改善测量,降低测量误差的目的。
他们认为研究测量必须先研究测验情境关系,而测验情境关系是由一个测量目标和若干个测量侧面构成的。
5.衡量测验跨时间一致性的信度称为()。
[统考2008研]A.重测信度B.复本信度C.同质性信度D.评分者信度【答案】A【解析】不同的信度考查的内容不同。
心理测量第三篇—信度
二、概化理论的基本原理和概念
1.测量目标——希望测量的实体,如能力、 成就等特性。 2.侧面——一组特定的测量条件,其中条 件的数量为该侧面的水平。
例题:如果要求每个被试写两篇题目不同的短文,并 由三名评分者给所有短文评分 测量目标:被试的写作水平; 侧面:题目和评分者; 水平数:分别为2和3。
二、测验长度的影响
一般说来,在—个测验中增加同质性的题 目,可以使信度提高。
二、测验长度的影响
假设有一个包括10个题目的测验,信度 为0.50,若把测验增加到50个题目,其 信度将增加到:
二、测验长度的影响
当由于测题过少而导致信度较低时,增加 多少个题目可以达到理论的信度指标,可 以用下式来推算:
一、概化理论对经典测验理论的发 展
2.概化理论的诞生及其特点 (1)诞生:1972年,克朗巴赫出版《行 为测量的可靠性:测验分数和剖面图的概 化理论》,正式形成了概化理论(GT)。 (2)特点: 克朗巴赫指出:“概化分析超越经典信度 分析之处在于它明确问到,这个分析过程 如何计算误差?每个来源的变异有多大?”
一、测量的标准误的含义及其作用
5.测量的标准误差的解释
比如:以95%的置信度为标准,则Z0.95=1.96,
它表示真分数有95%的可能性落在 范围内。
二、直接估计标准误差
1.公式: 估计信度rtt要求每个人都有两个测验分数, 估计Se也是一样要求每个人要有成对的分 数,每个人成对的分数由复份法、再测法、 分半法获得。
(二)分半信度
2.“斯皮尔曼—布朗公式”校正
条件:两个分半测验分数的变异性相等。
(二)分半信度
当两个分半测验分数的变异性不等时: 费拉南根(Flanagan)公式:
心理测量学真分数与信度和效度 ppt课件
③、意外干扰
在测验环境复杂,特别是当受试人数较多时,容易发生出乎意料的干扰或分心事件。 例如:停电、有人生病、有人作弊、计时表停了、临时发现题目或作答纸张印刷不清或装 订错误等,无论哪种情况都会引起不安和扰乱,导致成绩不准确、不一致。
Hale Waihona Puke ④、评分计分评分不客观以及计算登记分数出错也是常见的误差。一般选择题的评分教为客观。而 问答题、论文题等自由反应型的题目,评分标准很难掌握,加之阅卷者的偏好个不相同, 因而难以保证分数的一致性。不仅各教师间有此差异,即使是同一教师一次评许多卷,受 情绪疲劳、外界干扰、卷面整洁、考试前后位置引起的对比效应以及对学生成见的影响, 标准也可能不统一,甚至同一张试卷隔一段事件再评,前后给分也可能不一致。至于学校 间、地区间的差别就更大了。
系统误差
就是观测过程中服从确定规律性的误差。由于实验条件不同,造成不 同的有一定规律性的误差属于这类误差。心理学实验中,不同的实验方法、 不同的被试样本等都会对实验结果产生规律性的影响。这类误差不能通 过增加实验次数消除。如果需要可以通过实验设计加以消除,这一问题我 们将在后边的变量处理和实验设计中讨论。
4
心理测量学真分数与信度和效度
随机误差
又称偶然误差。由实验中一些偶然因素引起又不可控制的误差。随机 误差产生的原因十分复杂,但其存在是绝对的。
随着实验观测次数的增加,随机误差的变化会呈现一定的规律性—— 它总是围绕被观测的真正值(又称真分数,一般用多次观测的平均值来表 示,真正值是无法测量到的)波动,随机误差的算术平均数随着观测次数 的增加而逐渐减少以至于趋近于零。
2021/2/5
(ST2/SX2)——测验的信度 (SV2/SX2)——测验的效度
13
第五章-测量效度
第五章测量效度第一节效度概述一、什么是效度(一)效度的概念效度是指一个测验或量表实际能测出其所要测的心理特质的程度。
例如,一个小学生数学测验的成绩若同时受到其数学和语文能力的影响(如,有的人看不懂题意等)则认为实际测到其所要测的特质(数学能力)的程度不高,因而它是个效度不高的数学测验。
(二)对效度概念的理解1、效度是一个相对概念。
这种相对性表现在两个方面:(1)效度是相对于一定的测量目的而言的。
因为效度是指实测结果与所要测查的特质之间的吻合一致性程度,因此,一个测验或量表是否有效主要是看它是否达到了测量目的。
测量某一特质有效的量表,若用它来测量另一种特质,则必然会无效或效度极低。
例如,测量身高很有效的钢尺若用它来测量体重则必定无效。
又如,人的测量智力很有效的量表若是用来测量性格则必定是效度不高的。
(2)心理特质是较隐蔽的特性,只能通过他的行为表现来进行推测,因此,心理测量不可能达到百分之百的准确,而只能达到某种程度上的准确。
不过,由于任何一个量表的编制都有其目的,所以在正常情况下,一个量表的效度也不会为零。
例如,一个数学测验,无论其文字表达如何艰深,它总能测到一定的数学能力,即总会有一定的效度,而不会效度为零。
(3)判断一个测量是否有效要从多方面收集证据。
表面上看来,测量的效度就是实际测量的结果与我们所要测量的心理特性的吻合一致性程度,获取效度的办法也就是拿实测结果与心理特性来比较。
然而,心理特性是我们要测的东西,是未知的,通常也是比较抽象和隐蔽的。
因此,不能把它直接拿来与结果比较,而必须先从多种角度把这种特性描述清楚。
由于描述心理特性的角度可以是理论上的,也可以是实践上的,途径很多,因此,获取测量效度的途径也是多样的。
例如,智力测验是否测得了人的智力,我们就可以从理论上做逻辑分析,也可以从他在工作、学习中的实际表现等许多方面加以证实。
(4)效度和信度一样,也是指一列测量的特性,也是一个构想概念。
心理测量—测验的项目分析
第二节 区分度
一、什么是区分度 区分度又叫鉴别力,指测验项目对被试
间心理品质差异水平的区分程度。 评价测验项目的区分度高低依赖于对被
试水平的准确测量,一般称为效标分数。 测验项目区分度的效标分数一般使用的 是测验总分,又称内部效标。
二、项目区分度的计算方法
1.极端分组法(项目鉴别指数)
D=PH-PL D:项目鉴别指数 PH:高分组通过率 PL:低分组通过率
123 4
5.面对工作时,有力不从心的感觉。 1 2 3 4
6.工作时感到心灰意冷。
123 4
从未 很少 有时 经常 如此 如此 如此 如此
7.觉得自己推行工作的方式不适当。 1 2 3 4
8.想暂时休息一阵子或另调其他职务。 1 2 3 4
9.只要努力就能得到好的结果。
123 4
10.我能肯定这份工作的价值。
2.
P PH PL
P:难度
2
PH:在一题目上高分组的通过率 PL:在一题目上低分组的通过率
例:在100名学生中,高分组与低分组各有27 人。其中高分组答对第一题的有20人,低分 组答对第一题的有10人。试问该题的难度是 多少?
PH
20 27
0.74
10 PH 27 0.37
P 0.74 0.37 0.56 2
D值为0称为无区分,表示项目与被试 心理特质水平无关。
D值为负值称为消极区分。-1表示项 目与被试心理水平相反。
对区分度值的评价(R.L.Ebel,1965)
0.40以上:非常优良 0.30—0.39:良好 0.20—0.29:尚可,需修改 0.19以下:劣,必须淘汰
2.方差法 计算被试在项目得分的方差。方差越大,表
《心理测量信度》课件
信度系数可以帮助雇主了解测验的一致性和可靠性,从而更好地解释 和比较测验结果。
03
在职业测验中,信度可以通过重测法、分半法、同质性法等方法进行 评估。
04
高信度的测验结果可以更准确地反映应聘者的能力和潜力,为雇主做 出更明智的招聘决策提供支持。
信度在临床心理测验中的应用
在临床心理测验中,信度是评 估测验可靠性和稳定性的关键
因素。
在临床心理测验中,信度可以 通过重测法、分半法、同质性 法等方法进行评估。
信度系数可以帮助心理医生了 解测验的一致性和可靠性,从 而更好地解释和比较测验结果
。
高信度的测验结果可以更准确 地反映患者的心理状况和需求 ,为心理医生制定更有效的治 疗方案提供支持。
THANKS
感谢观看
测验难度
测验难度对信度的影响主要体现在被 试的得分分布上。如果测验难度适中 ,被试的得分分布较为集中,信度就 较高;如果测验难度过高或过低,被 试的得分分布就会过于分散,导致信 度下降。
VS
在编制心理测验时,应根据测验的目 的和被试的特点来设置适当的难度水 平,以保证测验的信度。
被试样本
被试样本的差异也会影响测验的信度 。如果被试样本具有代表性,那么测 验的信度就较高;如果被试样本偏差 较大,那么测验的信度就会受到影响 。
信度的意义
提高测量结果的可靠性
信度评估可以确定测量工具的一致性 ,从而提高测量结果的可靠性,使结 果更加准确可靠。
减少误差
比较和解释
信度评估可以比较不同测量工具之间 的结果,以及在不同时间或情境下对 同一对象进行测量的结果,从而更好 地解释和比较测量结果。
信度评估可以识别和减少测量误差, 从而提高测量的准确性。
第五章、心理测验的技术指标
统计平均值
统计平均值:为了表示一组数 据的规律性,需要计算出一 些能够反映这组数据的统计 特征的数字。我们把它们称 为统计平均值。最常用的统 计平均值是平均数和标准差。
(一)、平均数(M):反映一组数据 的集中趋势。 计算公式是M=(∑Xi)/N 例1:有几组观测数据,请分别计算它 们的平均数? (1)30,40,50,60,70,80,90; (2)10,30,40,70,80,90,100; (3)45,50,55,60,65,70,75;
最常见的常模表示方法有两种:标准分 数和百分位数。 标准分数是在原始分的基础上按照一定 的规则转化过来的,它反映了原始分数 在分数总体中的相对位置。 百分位系统,又称百分制,它是将一组测 验分数分成100等分。一个百分位数反 映在标准团体中高于和低于某个分数的 人数比例。例如,不管实际的得分是多 少,如果某人在测验中的得分为80百分 位数,那就意味着高于这个分数的人只 有20%,他处于80%人的最前端。
1.测验题目不能反应要测量的特 征.
2. 实施过程偏离了标准化的程 序. 3. 被试不如实回答.
2、效度的类别
类别 解释说明:
指测验项目所涉及的内容对欲测内容范围的代 表性程度。或者说所测内容对要测内容范围取 样的代表性。 构想效度表示一个测验是否达到了对某一理论 概念或特质的测量。如果一个人格测验测得的 结果与该测验所依据的人格理论或假设相符合, 那么,我们说该测验具有较高的构想效度。 预测效度又称效标关联效度,是指一个测验对 我们所感兴趣的行为能够预测到什么程度。在 这里,被预测的行为是检验测验效度的标准,简 称效标。
(二)、标准差(S):标准差就是一 组数据离平均数的平均距离。反映一组 数据的分散程度。 计算公式:S=√∑(Xi-M)2/N 例1:有几组观测数据,请分别计算它 们的标准差? (1)30,40,50,60,70,80,90; (2)10,30,40,70,80,90,100; (3)45,50,55,60,65,70,75;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(二)其它计算内部一致性系it-half reliability): 分半信度就是将测验题目分成等值的两 半,分半求出量表题目的总分,再计算 两部分总分的相关系数。
分半的方法很多,常见的方法是把一个 量表按题目番号分为两半,一半是奇数 题,另一半数偶数题。求出每个人的奇 数题的总得分和偶数题的总得分,然后 求出奇数题总得分和偶数题总得分的相 关系数,最后对相关系数进行校正。
X2 20 20 18 16 15 17 12 11 13 9
复本信度应用时应注意以下几点:
(1)复本信度的关键在于两个量表必须 等值,即必须具有相同的难度、区分度、 长度、题型等。
(2)两次测验的时距应尽可能短促,以 便避免知识的积累、练习效应等因素的 影响。
(3)由于量表的两个复份在许多方面近 似,所以信度系数有稍稍偏高的倾向。
弗朗那根公式:
r 21S2aS2xS2b (公式5-8)
式中, S 2 变异数, 信度值。
a、
S
2为S x
2 分别为两半测验分数的 测b 验总分的变异数。r为
卢伦公式:
r
1
S 2d S 2x
(公式5-9)
式中,S 2 d为两半测验分数之差的变异数, S 2 x 为测验总分的变异数。r为信度值。
2.用来估计个人的测验分数(真分数)
由于误差的存在,一个人通过测量得到 的分数很难等于真分数。理论上,我们 可以对一个人施测无数次,然后求得所 得分数的平均数和标准差。在这个假设 的分布里,平均数就是这个人的真分数, 标准差则为误差大小的指标。
X
在实际工作中,我们用一组被试(人数足够多) 两次施测的结果来代替对同一个人反复施测, 以估计测量误差的变异数。此时,个人在两次 测验中的分数差异就是测量误差。据此可制成 误差分数的分布。这个分布的标准差(误差分 布的标准差)我们称之为测量的标准误,是表 示测量误差的大小的指标,其计算公式为:
(2)信度系数只是对测量分数不一致程 度的估计,并没有指出不一致的原因。
(3)获得较高的信度系数并不是心理测 量有效的充分条件,只是一个必要条件。 back
1.评价测验
信度系数是衡量测验好坏的一个重要的技术指 标。
一般能力与学绩测验的信度系数为0.90以上, 有的可以达到0.95;标准智力测验的信度系数 应达到0.85以上,个性和兴趣测验的信度系数 可稍低,一般应达到0.70~0.80,(也有人认 为兴趣、性格、价值观等人格测验的信度系数, 通常在0.80~0.85或更高些)。当信度系数小 于0.70时,不能用测验来对个人进行评价,也 不能用来进行团体间的比较;当信度系数大于 0.70时,可用来进行团体间的比较;大于0.85 时,可以用来鉴别个人。
(3)如遇到有牵连的项目或一组解决同 一问题的项目时,这些项目应放在同一 半,否则会高估信度的值。
(4)将一个测验分成两半的方法很多 (如,按题号的奇偶性分半、按题目的 难度分半、按题目的内容分半等),因 此,一个测验可以有多个分半信度值。 提供分半信度值时,要说明分半的方法。
back
分半法实际上是对测验内部一致性的一 个粗略估计。但对于同一个测验分半的 方法是很多的,而且用不同的分半方法 求出的分半信度都不一样,因此分半信 度不是最好的内部一致性的估计。为了 弥补分半法的不足,可以采用其它的方 法。
优点:
(1)因两次测试有适当的时间间隔,减少了 复本法中的练习、疲劳效应。
(2)只要时间间隔适当,可用于计算稳定性 不高的心理特质的测验的信度。
注意:
等值稳定性信度系数的值一般要比等值性系数 和稳定性系数要低。
等值稳定性系数是测验信度的最严格的考察, 得到的是信度系数的下限。
back
利用一次测验所获得的资料来计算信度 系数。这样计算出来的信度系数反应的 是测验内部的一致性,即测验项目的同 质性,叫做内部一致性系数或同质性系 数。
数的差异与1.96SEd(0.05显著性水平)进行比较,
如果其绝对值大于此值,则差异显著,否则差异 不显著。
例2,某校五年级进行了两次数学测验, 小张第一次考了85分,此次数学测验年 级平均分是77分,标准差是8分,此次测 验的信度系数是0.84;第二次考了95分, 此次数学测验年级平均分是81分,标准 差是10分,此次测验的信度系数是0.91; 问小张这两次数学测验的成绩是否有显 著差异?
表5-1 某幸福感调查表的两次测试结果
测
被试
验 1 2 3 4 5 6 7 8 9 10
X1 16 15 13 13 11 10 10 9 8 7
X2 16 16 14 12 11 9 11 8 6 7
计算再测信度必须注意几个问题:
(1)所测量的特性必须是稳定的。当然绝对 的稳定是不可能的,但应该是比较稳定的。
例4:有一个由100题构成的量表施测于10个高 三学生。测验一次后,应试者即毕业离校。现 在怎样评介测验结果的信度?
(1)计算出每个应试者的奇数题总分(X1)和 偶数题总分(X2),见表5-3。
得
被试
分 1 2 3 4 5 6 7 8 9 10
X1 38 37 38 41 40 36 38 39 40 35
我们可以用“差异的标准误”来检验差异的显著 性。
差S 异d的E 标S 准1 误2 E 的S公2E 2 式 为S:2rxx ry(y 公式5-5)
r SE d为差异的标准误,S为相同尺度的xx标准ry分y 数的
标准差,Z分数为1,T分数为10。 、 分别为
两个测验的信度系数。
先将原始分数化成标准分数,然后将两个标准分
(4)被试易出现疲劳、失去积极性等反 应,还会出现迁移。这些称为顺序效应, 为了抵消顺序效应,可随机分配一半被 试先做复本A再做复本B,另一半被试先 做复本B再做复本A,以平衡顺序效应。
(5)复本法只能减少而不能完全排除练 习和记忆的影响。
(6)对于许多测验来说,建立复本是相
当困难的。
back
X2 37 37 36 39 39 34 38 39 39 36
采用分半信度应注意以下几个问题:
(1)若用分半法时,以按奇数题和偶数题分 半为宜。
(2)在使用斯皮尔曼-布朗公式时要求全体 被试在两半测验上的得分的变异数相等。当一 个测验不宜分成对等的两半时分半信度不宜采 用。
(2)当试卷中存在任选题时,不宜采用分半 法。速度测验也不宜采用分半法。因为速度测 验中试题的难度低,被试得分的多少主要是看 答题的多少,分半法易使得分相同,从而夸大 分半法的信度估计。
式(皮尔逊积差相关公式的变式)为:
rxx
X1X2 NX1X2 S1S2
(公式5-6)
式中X1、X2为同一被试的两次测验分数,X 1 、X 2
为全体被试两次测验的平均数,S1、S2为两次
测验的标准差,N为被试人数。
再测法的模式是:施测 适当时距 再施测
例2:假设有一份主观幸福感调查表,先后两次施测于 10名学生,时间间隔为半年,结果如表所示,求该测 验的重测信度。(为了便于理解和计算,本章估计信 度的例子都是小样组,实际应用时应采用大样组。)
复本信度的模式是:复本A 最短时距 复本B
例3:假设用A、B两型创造力复本测验对 初中一年级10个学生施测。结果见表5- 2。请同学们自己计算。
表5-2 某创造力复本测验测试结果
测
被试
验 1 2 3 4 5 6 7 8 9 10
X1 20 19 19 18 17 16 14 13 12 10
真变异数与总变异数(实得变异数)的比率。
即
式中
rxx
S
2 T
S 2X
(公式5-1)
rxx代表信度系数,S 2T 代表真分数的变异数,
S
2 X
代表实得分数的变异数,即总变异数。
根据公式5-1,信度还可以表示为:
rxx
1
S 2E S2X
(公式5-2)
对于信度系数,还应该注意以下几点:
(1)在不同的情况下,对于不同的样本, 采用不同的方法会得到不同的信度系数, 因此一个测验可能不止一个信度系数。
校正公式有:
(1)斯皮尔曼-布朗(Spearman-Brown) 公式
rxx
2r hh 1 rhh
(公式5-7)
式中,rhh 是两半测验分数的相关系数,
rxx 为整个测验的信度估计值。
采用斯皮尔曼-布朗(Spearman-Brown) 公式进行校正时,假定两半测验等值, 亦即两半测验具有相同的平均数和标准 差。当假定不能满足时,可以采用下面 两个公式来估计信度。
3.用来对两种测验分数进行比较
来自不同测验的原始分数是无法直接进 行比较的,只有将它们转换成相同尺度 的标准分数才能进行比较。
如,某班期末考试,小明的数学成绩是 80分,语文成绩是70分。另外,已知小 明所在班级的数学平均成绩是70分,标 准差是10分,语文平均成绩是60分,标 准差是7分 。
注意几点:
(1)SE对真分数做的是区间估计,不可 能由此得到一个确切的点。这就是说, 测验分数不是一个定点,而是具有一定 的分布范围。因此,两次测验分数之间 存在差异是很正常的。
(2)置信水平确定后,估计的精度主要 取决于SE,SE越小,范围越小,估计就 越精确,反之也然。
(3)真分数不能等同于真正能力或心理 特质,真分数中包括了系统误差。
SESx 1rxx
(公式5-4)
式中SE表示测量的标准误,即误差分布的标准 差 度系;数Sx表。示一次测量分数的标准差;rxx表示信
我们可以用测量的标准误来估计个人测 验的真分数的大小。
如果选用95%的可靠性水平(置信水
平),即显著性水平(a值)为.05,,
真分数有95%的可能落入X
±Z
2
(2)遗忘和练习的效果基本上相互抵消。