第五章心理测量的信度说课讲解
2019年 第五章 心理测量学(打印版)
1916 年樊炳清先生首先介绍了比内—西蒙智力量表。1920 年,北京高等师范和南京师 范学校建立了我国最早的两个心理学实验室,廖世承和陈鹤琴先生在南京高等师范学校开设 心理测量课。1921 年,他俩正式出版《心理测验法》一书,当时影响很大。1922 年夏天, 中华教育改进社聘请美国教育心理测验专家麦考尔来华讲学。
单位是测量的基本要素,没有单位就无法进行测量。好的单位具备条件:一是确定的 意义,二是相同的价值。一般来说,心理测量的单位往往不够完善。
三、测量量表
量表是根据一定法则在一个定有单位和参照点的连续体上把事物的属性表现出来的连 续体。根据量表的精确度,斯蒂文斯将量表从低到高分为成四种水平,即命名量表、顺序量 表、等距量表和等比量表。 (一)命名量表
课程简介
心理测量学是心理学的一门专业基础学科,心理测量是重要的心 理学研究方法,是心理诊断和人力资源管理中决策的辅助工具,但心 理测量工具目前尚不完善。
心理测量是心理学工作者需要熟练掌握的一项工具或一种手段。 因为心理测量学中涉及到统计学和数学方面知识,在心理咨询师知识 结构中是最难学、最难懂的一门课程,所以,本章课程对大部分参加 心理咨询师课程学习者来说是具有相当难度的。
心理咨询师 (基础知识)
第五章 心理测量学
辅 导 资 料
洪进鹏 2018.11
第五章 心理测量学 课程目录
第一讲 测量:心理咋测量 第二讲 定义:什么是心理测验 第三讲 常模:成绩好坏跟谁比 第四讲 信度:心理测量可靠吗 第五讲 效度:心理测量准确吗 第六讲 项目分析:这次测验难吗 第七讲 编制:测验咋编制 第八讲 技术:测验咋使用
心理测量知识点之什么是信度_毙考题
心理测量知识点之什么是信度第五章测量的信度第一节什么是信度一、信度的定义信度又叫可靠性,指的是测量的一致性程度。
一个好的测量工具必须稳定可靠,即多次测量的结果要保持一致,否则便不可信。
信度只受随机误差影响。
随机误差越大,信度越低。
因此,信度亦可视为测量结果受机遇影响的程度。
系统误差产生恒定效应,不影响信度。
在测量理论中,信度被定义为:一组测量分数的真变异数与总变异数(实得变异数)的比率。
即,(5.1)式中rxx代表测量的信度,S 代表真分数的变异数,代表实得分数的变异数,即总变异数。
根据公式(4.3),信度还可表示为(5.2)该定义有两点要注意: 1)信度指的是一组测验分数或一列测量的特性,而不是个人分数的特性。
2)真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概念,只能根据一组实得分数作出估计。
任何测验只能包含特定样本的题目,由特定的施测者,对特定的被式,在特定的时间、地点施测,情况不同便会得到不同的分数。
信度涉及的主要问题是对测验分数的意义的概化能力,即从一次测量来推论总体(真实分数)能达到何种正确程度。
根据现代信息论,每组信息可包括一些真正信息(信号)和一些错误的信息(噪音)。
为了提供有用的数据,任何测量必须有高的信号噪音比率即提供更多真正的信息。
信号可由真实分数的变异数表示,噪音可由误差分数的变异数表示。
信噪比与信度有如下关系:信号/噪音= (5.3)公式(5.3)并不难证明,将代入上式的右端可得:=信号/噪音假如一个测验的信度为0.90,则信噪比为0.90/(1 0.90)=9.0即真正变异数对误差变异数的比率为9:1。
一个测验的信度只要稍微增加一点就会使信噪比大大改变。
例如,信度从0.90增为0.91,可使信噪比从9:1,变为10.1:1。
因此,即使一个相当可靠的测验也应努力改善其信度。
二、信度系数大部分的信度指标都以相关系数表示,即用同一被试样本所得的两组资料的相关作为测量一致性的指标,称作信度系数。
国家三级心理咨询师第五章心理测量
心理测量学基础
• • • • • • • • • • • • • • 1979年,林传鼎,吴天敏,张厚粲在武汉举办全国测验培训班 1979年,龚耀先主持修订“韦克斯勒成人智力量表” 1979年,林传鼎、张厚粲编制“少年儿童学习能力测验” 1980年,林传鼎、张厚粲主持修订“韦克斯勒儿童智力量表” 1980年,北师大开设心理测验课 1980年,张厚粲开始对高考试卷做系统分析 1981年,刘绍衣修订“卡特尔16种人格因素问卷” 1982年,吴天敏第三次修订中国比内测验 1982年,宋维真修订“明尼苏达多相人格调查表” 1983年,龚耀先、陈仲庚修订“艾森克问卷” 1984年,中国心理学会成立心理测量专业委员会 1984年,我国正式加入“国际教育成就评价协会” 1985年,张厚粲主持修订“瑞文标准推理测验” 1986年,龚耀先主持修订“韦克斯勒幼儿智力量表”
算。
测量水平最低的一种形式,如代号、类别
7
心理测量学基础
• (2)顺序量表
表明类别的大小或某种属性的多少。
主要用于分等论级和分类。
数字仅表示等级并不表示某种属性的真正量或绝对值。 无参照点(没有绝对零度)和单位。 无法进行数学方法运算。
8
心理测量学基础
(3)等距量表 存在大小关系。 无绝对零度,但存在 • 54. 其数值只可以 相对零点。有相等单位,可以进行加 进行加减运算,二 减数学运算,但不能做乘除运算。 不能进行乘除的量 (4)等比量表 表是()2013.05 是最精确的测量。具有相等单位又有 A命名量表 绝对零点。 B顺序量表 大多是物理量表,可以进行各种数学 C等距量表 运算。可以知道事物之间的某种特点 D等比量表 上相差多少及它们之间的倍数关系。 心理测验属于?量表!
29
第五章 测量效度
效度不是一个全或无的概念。
2、效度是随机误差和系统误差的综合反映。
3、效度不是直接可以测量到的,判断一个测验 是否有效要从多方面搜集证据,从证据去推 论测验的效度 (犹如法庭上收集证据一样) 。
三、用统计学术语谈效度
根据CTT假设,有以下公式存在:
S S +Sபைடு நூலகம்=S S S
2 X
2 T
2 E
2 V
2 I
2 E
效度系数等于有效分数的方差与观测分数的方差之 比,即:
r
2
xy
S S
2 V 2 X
四、效度和信度的关系
1、信度高是效度高的必要而非充分的条件。 即信度高但效度不一定高(非充分条件),信 度低则效度一定低(必要条件)。
高信度,低效度 高信度,高效度 低信度,低效度
总命中率关心录取者中合格的人数与淘汰者 中不合格的人数的比率。 正命中率只关心录取者中有多少合格的人, 不关心淘汰者是否有合格的人。
(三)影响效标关联效度的因素
1、效标的选择:效标的适当性; 2、效标测量与预测源测量的时间间隔; 3、预测源与效标测量的信度; 4、被试样本的特征:样本的大小、样本的 代表性。
一、内容效度
(一)内容效度的含义
定义:指一个测验实际测到的内容与所要测量
的内容之间的吻合程度。或者说,指测验题目 对所要测量的内容范围的代表性程度。 内容效度的关键问题是测验题目取样的代表性 程度。(覆盖面不够、偏题、超纲)
(完整版)心理测量学的知识
第五章心理测量学知识第一节概述第一单元测量与测量量表一、什么是测量1。
测量是依据一定的法则用数字对事物加以确定.该定义包括三个要素,即事物、数字和法则。
2。
数字具有区分性、序列性、等距性和可加性。
二、则量要素(一)参照点1.要确定事物的量,必须有一个计算的起点,这个起点叫做参照点。
2.参照点有两种:一是绝对零点。
二是人为确定的参照点,即相对零点。
3。
理想的参照点是绝对零点,但在心理测量中很难找到绝对零点,多采用人为标定的测量零点。
(二)单位:具备两个条件1.有确定的意义。
2。
有相同的价值。
三、测量量表根据量表的精确程度,斯蒂文斯将测量从低级到高级分成四种水平:(一)命名量表1。
命名量表是测量水平最低的一种量表形式,只用数字来代表事物或把事物归类.2.这种量表分为两种:(1)代号-—用数字来代表个别事物.(2)类别-—用数字来代表具有某一属性的事物的全体。
3.在命名量表中,数字只用来作标记和分类,而不能作数量化分析,既不能比大小,也不能做加、减、乘、除运算.(二)顺序量表1。
顺序量表比命名量表水平高,其中的数字不仅指明类别,同时也指明类别的大小或含有某种属性的程度。
2.数字包含有数量关系,代表符号是“>”,如A>B>C等,主要用于分等或排出顺序。
3。
顺序量表既无相等单位,又无绝对零点,数字仅表示等级,并不表示某种属性的真正量或绝对值。
(三)等距量表1.有大小关系,而且具有相等的单位,其数值可做加、减运算,但因为没有绝对零点,所以不能做乘、除运算。
2.等距量表的数值加上或减去一个常数,或者用一个常数去乘或除,不会破坏原来数据之间的等距关系.(四)等比量表1。
等比量表是最高水平的量表,既有相等单位,又有绝对零点。
2.长度、重量、时间等都是等比量表,其数值可以做加、减、乘、除运算。
心理测量是在顺序量表上进行,利用某种统计方法,可以把顺序量表得到的数据换算为等距数据来进行统计。
第二单元心理测量的基本概念一、心理测量的定义:依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。
心理测量第三篇—信度
二、概化理论的基本原理和概念
1.测量目标——希望测量的实体,如能力、 成就等特性。 2.侧面——一组特定的测量条件,其中条 件的数量为该侧面的水平。
例题:如果要求每个被试写两篇题目不同的短文,并 由三名评分者给所有短文评分 测量目标:被试的写作水平; 侧面:题目和评分者; 水平数:分别为2和3。
二、测验长度的影响
一般说来,在—个测验中增加同质性的题 目,可以使信度提高。
二、测验长度的影响
假设有一个包括10个题目的测验,信度 为0.50,若把测验增加到50个题目,其 信度将增加到:
二、测验长度的影响
当由于测题过少而导致信度较低时,增加 多少个题目可以达到理论的信度指标,可 以用下式来推算:
一、概化理论对经典测验理论的发 展
2.概化理论的诞生及其特点 (1)诞生:1972年,克朗巴赫出版《行 为测量的可靠性:测验分数和剖面图的概 化理论》,正式形成了概化理论(GT)。 (2)特点: 克朗巴赫指出:“概化分析超越经典信度 分析之处在于它明确问到,这个分析过程 如何计算误差?每个来源的变异有多大?”
一、测量的标准误的含义及其作用
5.测量的标准误差的解释
比如:以95%的置信度为标准,则Z0.95=1.96,
它表示真分数有95%的可能性落在 范围内。
二、直接估计标准误差
1.公式: 估计信度rtt要求每个人都有两个测验分数, 估计Se也是一样要求每个人要有成对的分 数,每个人成对的分数由复份法、再测法、 分半法获得。
(二)分半信度
2.“斯皮尔曼—布朗公式”校正
条件:两个分半测验分数的变异性相等。
(二)分半信度
当两个分半测验分数的变异性不等时: 费拉南根(Flanagan)公式:
心理测量-信度与效度
五、测量的标准误差
X T E
2 X
2 T
2 E
1
Байду номын сангаас
2 T 2 X
2 E 2 X
1
X1X2
2 E 2 X
2 E
2 X
(1
X1X
2
)
E X 1 X1X2 E称为测量的标准误差
(一)速度测验的信度
没有完成测验的人数的百分比,可以作为 判断一个测验是否是速度测验的依据。但要视具 体情况而定。
一般来说,纯速度测验几乎不考虑难度因 素,但如果难度与速度测验混在一起,就更难处 理了。
纯速度测验可用复本法和再测法,指标是 两次回答完题目的数量。
如果速度和难度混在一起,就将时间分为 四等份,在每个时间点上要被试作记号, 然后将一四时间段的题目合并,二三时间 段的题目合并,再用分半相关法计算信度。
4、内容效度没有可靠的数量指标。
5、内容效度是许多测验要考虑的,但不适合 人格和能力倾向测验,因为它们没有明确 范围。
影响效度的因素:
1、测验本身的因素(题目、结构) 2、实施 3、信度
(四)差异信度(如语文与数学分数差异的稳 定性)
(五)变迁信度
有时,分数稳定性对研究者来说毫无意义,相 反,我们希望分数是提高或者降低的(如教学、 心理治疗、体育训练等),所以传统的信度理 论(高信度)还要发展,以应对复杂的问题。
一、效度概述 (一)效度要回答什么 1、一个测验测量到什么东西? 2、测验对它要测量的东西测验到什么程度? (二)效度的含义 1、效度的概念:一个测验对其要测量的特性测
(二)标准参照测验的信度
作为心理与教育统计,都是以个别差异的 模式为基础的,即适合常模参照测验。在 教育测验种有很多是标准参照测验(掌握 测验),统计方法还在探索中,还不成熟。 一般以两次测验的通过率差异来判断,当 然,前提是被试同质
《心理测量信度》课件
信度系数可以帮助雇主了解测验的一致性和可靠性,从而更好地解释 和比较测验结果。
03
在职业测验中,信度可以通过重测法、分半法、同质性法等方法进行 评估。
04
高信度的测验结果可以更准确地反映应聘者的能力和潜力,为雇主做 出更明智的招聘决策提供支持。
信度在临床心理测验中的应用
在临床心理测验中,信度是评 估测验可靠性和稳定性的关键
因素。
在临床心理测验中,信度可以 通过重测法、分半法、同质性 法等方法进行评估。
信度系数可以帮助心理医生了 解测验的一致性和可靠性,从 而更好地解释和比较测验结果
。
高信度的测验结果可以更准确 地反映患者的心理状况和需求 ,为心理医生制定更有效的治 疗方案提供支持。
THANKS
感谢观看
测验难度
测验难度对信度的影响主要体现在被 试的得分分布上。如果测验难度适中 ,被试的得分分布较为集中,信度就 较高;如果测验难度过高或过低,被 试的得分分布就会过于分散,导致信 度下降。
VS
在编制心理测验时,应根据测验的目 的和被试的特点来设置适当的难度水 平,以保证测验的信度。
被试样本
被试样本的差异也会影响测验的信度 。如果被试样本具有代表性,那么测 验的信度就较高;如果被试样本偏差 较大,那么测验的信度就会受到影响 。
信度的意义
提高测量结果的可靠性
信度评估可以确定测量工具的一致性 ,从而提高测量结果的可靠性,使结 果更加准确可靠。
减少误差
比较和解释
信度评估可以比较不同测量工具之间 的结果,以及在不同时间或情境下对 同一对象进行测量的结果,从而更好 地解释和比较测量结果。
信度评估可以识别和减少测量误差, 从而提高测量的准确性。
心理学考研专业课心理测量知识点:信度
心理学考研专业课心理测量知识点:信度1、信度是指:测量结果的可靠性和一致性。
因为心理测验通常测量人的行为,行为会由于各种各样的原因,因时、因事、因地而产生变动,这些因素有些是偶然的,有些是固有的,人在完成心理测验时的行为也会受上述因素的影响,从而使测验结果与真实结果不完全一致,所以我们要用信度来衡量测验的可靠性和一致性。
2、信度的操作化定义:(1)误差理论认为:一个人的测验分数X是由真实分数(T)和误差(E)两部分构成的,公式是X = T + E。
(2)因此信度就被定义为:一组测量分数的真实方差与实得方差的比,或者是指真实方差占总方差的百分比。
公式为:rxx = 1-SE 2/SX 2(3)根据统计学理论,真实方差与实得方差的比是一个相关系数的平方,所以我们把这种相关系数的平方叫做信度系数。
(4)计算公式为:rxx = ST2/SX23、由于误差的来源信度的可分为:这种分类是基于信度的传统定义-真分数理论。
(1)重测信度:考虑的误差来源是时间取样。
(2)复本信度:考虑的误差来源是内容取样。
(3)分半信度:它考虑的误差来源也是内容取样,它与复本信度的差别是:分半信度考查一个测验内容的两半题目测量的是否是同一个心理特点行为。
(4)同质性信度(内部一致性系数):考虑的是测验内容是否异质。
(5)评分者信度:考虑的误差来源是评分者间的差别。
4、信度的表示方法:(1)信度系数和信度指数:1信度系数:rxx = rx2T = S2T/S22信度指数:rXT = ST/SX(2)测量标准误:SE = SX 1-rxx5、信度的意义:(1)信度系数可以解释为样本测验分数的总方差中有多少比例是真分数方差,也就是测验的总变异中真分数造成的变异占百分之几。
它直接告诉我们测量的误差有多大。
(2)测量的标准误可以告诉我们有多大可能性真实分数在某一分数范围内,并且可以预测实得分数再测时可能的变化情况。
6、信度的作用:(1)解释预测个人分数的意义。
第五章心理测量工具的评价指标
第五章心理测量工具的评价指标正如任何一个测量工具一样,心理测量工具也有它自身的评价指标。
在心理测量学中,信度、效度、项目区分度和有效的常模都是检验心理测量工具是否具有可靠性、有效性、鉴别性、可比性等良好测量特征的技术指标。
因此,了解相关技术指标的内涵和计算方法对于从事心理测量的人力资源管理部门工作人员来说具有重大意义。
第一节心理测量的信度在进行心理测量时,最重要的心理测量学指标之一就是信度(reliability)。
任何一项好的测量都必须有良好的信度,这是人事测评的中心问题,同时它也是标准化测评的一项基本要求和原则。
一、信度的定义信度指的是测量数据和结果的一致性或可靠性程度,它用于分析测量工具测量的前后一致性水平,并以这种一致性的程度来判断测量工具或测量方法的可靠性。
也就是说使用的测评工具可以稳定地测到它所要测量的事物的程度。
我们在选择和使用测评工具或方法时,信度必须是考虑的重要问题。
测验信度越高,表示测验结果越可信,但也无法期望两次测验结果完全一致,信度除受测验工具本身的影响外,亦受很多其它因素的干扰,如所测量的被试样本特征等。
因此没有一份测验是完全可靠的,信度只是一种程度上大小的差别而已。
一致性高的测量工具是指同一群人接受性质相同内容相同的测验测量后,在各结果间显示出的较强的正相关。
稳定性高的测量工具则是指同一批被试在不同的时间接受同样的测验时,结果间的差异很小。
二、信度与误差在进行心理测量时,信度指的是测验分数未受测量误差(errors of measurement)影响的程度。
测量误差指由与测量目的无关的因素产生的不准确或不一致的效应。
测量误差愈小,测量结果愈可靠;换言之,如果测量的结果能反应受试者真实的特征,而不因其他因素而影响测验结果,那么这个测验所测量的结果是可靠的。
测量误差通常包括两种不同类型的误差,即系统误差和随机误差。
系统误差是由与测量目的无关的因素引起的一种恒定而有规律的效应,它稳定地存在于每一次测量中,此时虽然每次的测量值具有一致性,但不正确。
第五章、心理测验的技术指标
统计平均值
统计平均值:为了表示一组数 据的规律性,需要计算出一 些能够反映这组数据的统计 特征的数字。我们把它们称 为统计平均值。最常用的统 计平均值是平均数和标准差。
(一)、平均数(M):反映一组数据 的集中趋势。 计算公式是M=(∑Xi)/N 例1:有几组观测数据,请分别计算它 们的平均数? (1)30,40,50,60,70,80,90; (2)10,30,40,70,80,90,100; (3)45,50,55,60,65,70,75;
最常见的常模表示方法有两种:标准分 数和百分位数。 标准分数是在原始分的基础上按照一定 的规则转化过来的,它反映了原始分数 在分数总体中的相对位置。 百分位系统,又称百分制,它是将一组测 验分数分成100等分。一个百分位数反 映在标准团体中高于和低于某个分数的 人数比例。例如,不管实际的得分是多 少,如果某人在测验中的得分为80百分 位数,那就意味着高于这个分数的人只 有20%,他处于80%人的最前端。
1.测验题目不能反应要测量的特 征.
2. 实施过程偏离了标准化的程 序. 3. 被试不如实回答.
2、效度的类别
类别 解释说明:
指测验项目所涉及的内容对欲测内容范围的代 表性程度。或者说所测内容对要测内容范围取 样的代表性。 构想效度表示一个测验是否达到了对某一理论 概念或特质的测量。如果一个人格测验测得的 结果与该测验所依据的人格理论或假设相符合, 那么,我们说该测验具有较高的构想效度。 预测效度又称效标关联效度,是指一个测验对 我们所感兴趣的行为能够预测到什么程度。在 这里,被预测的行为是检验测验效度的标准,简 称效标。
(二)、标准差(S):标准差就是一 组数据离平均数的平均距离。反映一组 数据的分散程度。 计算公式:S=√∑(Xi-M)2/N 例1:有几组观测数据,请分别计算它 们的标准差? (1)30,40,50,60,70,80,90; (2)10,30,40,70,80,90,100; (3)45,50,55,60,65,70,75;
心理测量信度与效度分析
心理测量信度与效度分析在心理学领域,心理测量是评估个体心理特征和行为的重要工具。
而信度和效度则是衡量心理测量工具质量的关键指标。
理解信度和效度对于正确使用和解释心理测量结果至关重要。
信度,简单来说,就是测量的稳定性和一致性。
想象一下,你用一把尺子去测量一个物体的长度,每次测量得到的结果都应该差不多,这就是信度的体现。
如果今天测量是 10 厘米,明天测量变成了 15 厘米,那这把尺子的信度就很差。
信度可以分为重测信度、复本信度、内部一致性信度等。
重测信度是指在不同时间对同一组被试进行相同测量,然后比较两次测量结果的一致性。
比如说,我们给一群学生在本学期初进行了一次数学能力测试,在学期末又进行了一次相同的测试,如果两次测试的成绩相关性很高,就说明这个测试具有较好的重测信度。
复本信度则是使用两个内容和形式相似但不完全相同的测量工具对同一组被试进行测量。
就像我们有两份相似的数学试卷,给同一批学生做,如果他们在两份试卷上的得分相关性高,那么复本信度就不错。
内部一致性信度常用于衡量一个量表内部各个项目之间的一致性。
比如一个关于焦虑的量表,如果其中的各个项目都能有效地反映焦虑这一概念,彼此之间高度相关,那么这个量表的内部一致性信度就比较高。
那么,信度高的测量工具有什么意义呢?首先,它能让我们更有信心地依赖测量结果。
如果一个测试的信度低,我们就无法确定测量结果是真实反映了被试的特征,还是仅仅由于测量的误差导致的。
其次,高信度有助于提高测量的准确性和可靠性,为进一步的研究和应用提供坚实的基础。
然而,仅仅有信度是不够的,效度同样重要。
效度是指测量工具能够准确测量出它所要测量的东西的程度。
比如,一个号称能测量智力的测试,如果实际上测的是知识储备,那就缺乏效度。
效度可以分为内容效度、效标关联效度和构想效度。
内容效度关注的是测量工具的内容是否涵盖了所要测量的概念的各个方面。
比如一份语文考试,如果能够全面考查学生的听、说、读、写能力,就具有较高的内容效度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.用来对两种测验分数进行比较
来自不同测验的原始分数是无法直接进 行比较的,只有将它们转换成相同尺度 的标准分数才能进行比较。
如,某班期末考试,小明的数学成绩是 80分,语文成绩是70分。另外,已知小 明所在班级的数学平均成绩是70分,标 准差是10分,语文平均成绩是60分,标 准差是7分 。
SE
,即
X ±1.96 SE的范围之内,也可以写成X
-1.96SE T X+1.96 SE,SE则用公
式5-4代入。或有5%的可能落入这范围
之外。这实际上也表明了再测时分数改
变的可能范围。
例1,已知WISC-R的标准差为15,信度系 数为0.95,对一名12岁的儿童实施该测 验后,IQ为110,那么他的真分数在95% 的可靠度要求下,变动范围应是多大?
第五章 心理测量的信度
第一节 第二节 第三节
什么是信度 估计信度的方法 影响信度系数的因素
一、信度的意义 二、信度系数的作用
back
一、信度的意义
信度即测验的可靠性,指的是测量的一致性程 度。
信度受随机误差的影响,随机误差越大,信度 越低。
在测量学中,信度被定义为:一组测量分数的
我们可以用“差异的标准误”来检验差异的显著 性。
差S 异d的E 标S 准1 误2 E 的S公2E 2 式 为S:2rxx ry(y 公式5-5)
r SE d为差异的标准误,S为相同尺度的xx标准ry分y 数的
标准差,Z分数为1,T分数为10。 、 分别为
两个测验的信度系数。
先将原始分数化成标准分数,然后将两个标准分
表5-1 某幸福感调查表的两次测试结果
测
被试
验 1 2 3 4 5 6 7 8 9 10
X1 16 15 13 13 11 10 10 9 8 7
X2 16 16 14 12 11 9 11 8 6 7
计算再测信度必须注意几个问题:
(1)所测量的特性必须是稳定的。当然绝对 的稳定是不可能的,但应该是比较稳定的。
数的差异与1.96SEd(0.05显著性水平)进行比较,
如果其绝对值大于此值,则差异显著,否则差异 不显著。
例2,某校五年级进行了两次数学测验, 小张第一次考了85分,此次数学测验年 级平均分是77分,标准差是8分,此次测 验的信度系数是0.84;第二次考了95分, 此次数学测验年级平均分是81分,标准 差是10分,此次测验的信度系数是0.91; 问小张这两次数学测验的成绩是否有显 著差异?
式(皮尔逊积差相关公式的变式)为:
rxx
X1X2 NX1X2 S1S2
(公式5-6)
式中X1、X2为同一被试的两次测验分数,X 1两次
测验的标准差,N为被试人数。
再测法的模式是:施测 适当时距 再施测
例2:假设有一份主观幸福感调查表,先后两次施测于 10名学生,时间间隔为半年,结果如表所示,求该测 验的重测信度。(为了便于理解和计算,本章估计信 度的例子都是小样组,实际应用时应采用大样组。)
(2)信度系数只是对测量分数不一致程 度的估计,并没有指出不一致的原因。
(3)获得较高的信度系数并不是心理测 量有效的充分条件,只是一个必要条件。 back
1.评价测验
信度系数是衡量测验好坏的一个重要的技术指 标。
一般能力与学绩测验的信度系数为0.90以上, 有的可以达到0.95;标准智力测验的信度系数 应达到0.85以上,个性和兴趣测验的信度系数 可稍低,一般应达到0.70~0.80,(也有人认 为兴趣、性格、价值观等人格测验的信度系数, 通常在0.80~0.85或更高些)。当信度系数小 于0.70时,不能用测验来对个人进行评价,也 不能用来进行团体间的比较;当信度系数大于 0.70时,可用来进行团体间的比较;大于0.85 时,可以用来鉴别个人。
注意几点:
(1)SE对真分数做的是区间估计,不可 能由此得到一个确切的点。这就是说, 测验分数不是一个定点,而是具有一定 的分布范围。因此,两次测验分数之间 存在差异是很正常的。
(2)置信水平确定后,估计的精度主要 取决于SE,SE越小,范围越小,估计就 越精确,反之也然。
(3)真分数不能等同于真正能力或心理 特质,真分数中包括了系统误差。
back
一、再测信度 二、复本信度 三、等值稳定性系数 四、内部一致性系数 五、评分者信度 总结 练习
back
再测信度(Test-Retest Reliability) ,也叫 重测信度,也叫稳定性系数。用同一个测验,
对同一组被试前后施测两次,对两次测验分数
求相关,其相关系数就叫再测信度。其计算公
真变异数与总变异数(实得变异数)的比率。
即
式中
rxx
S
2 T
S 2X
(公式5-1)
rxx代表信度系数,S 2T 代表真分数的变异数,
S
2 X
代表实得分数的变异数,即总变异数。
根据公式5-1,信度还可以表示为:
rxx
1
S 2E S2X
(公式5-2)
对于信度系数,还应该注意以下几点:
(1)在不同的情况下,对于不同的样本, 采用不同的方法会得到不同的信度系数, 因此一个测验可能不止一个信度系数。
2.用来估计个人的测验分数(真分数)
由于误差的存在,一个人通过测量得到 的分数很难等于真分数。理论上,我们 可以对一个人施测无数次,然后求得所 得分数的平均数和标准差。在这个假设 的分布里,平均数就是这个人的真分数, 标准差则为误差大小的指标。
X
在实际工作中,我们用一组被试(人数足够多) 两次施测的结果来代替对同一个人反复施测, 以估计测量误差的变异数。此时,个人在两次 测验中的分数差异就是测量误差。据此可制成 误差分数的分布。这个分布的标准差(误差分 布的标准差)我们称之为测量的标准误,是表 示测量误差的大小的指标,其计算公式为:
SESx 1rxx
(公式5-4)
式中SE表示测量的标准误,即误差分布的标准 差 度系;数Sx表。示一次测量分数的标准差;rxx表示信
我们可以用测量的标准误来估计个人测 验的真分数的大小。
如果选用95%的可靠性水平(置信水
平),即显著性水平(a值)为.05,,
真分数有95%的可能落入X
±Z
2