心理学测量笔记连载第五章:信度
2 心理测量学--信度
![2 心理测量学--信度](https://img.taocdn.com/s3/m/7130b62683c4bb4cf7ecd1b1.png)
一、重测信度(test-retest reliability)
又称稳定性系数。它的计算方法是采用重测法,即使用
同一测验,在同样条件下对同一组被试者前后施测两次
测验,求两次得分间的相关系数。….
优、缺点:考察测验的时间效应。但有练习和记忆的影
响。
间隔时间短,有记忆的影响。太长,成长、经验影响。 最适宜的时距随测验的目的、性质和被试特点而异,一
SE = 15 √1 - 0.84 = 6.0
±1.96×6≈88~112
IQ = 100
2016/5/29
36
四、比较不同测验分数的差异 这种比较包括两个人不同分数的差别和同一被试在两个 测验上的差别。这就是差异分数的标准误问题。
SEd=S 2 rxx ryy
SEd为差异的标准误,S代表两个测验使用的标准差,这个标准 差要相同,因为只有在两个分数具有相同的单位时才可以比较。
6、什么是信度系数? 信度系数是信度的指标之一,是一种相关系数,常常 是同一被试样本所得两组资料的相关。 7、信度指数与信度系数关系? 平方。 8、测量标准误与信度系数关系? 信度越高,标准误越小;信度越低,标准误越大。
第三节 测验的信度
第一单元 信度的概念
第二单元 信度评估的方法
第三单元 信度与测验分数的解释 第四单元 影响信度的因素
有什么建议?
2016/5/29
17
您一定记住了!
1、什么是信度?
信度是指在不同时间内用同一测验(或另一个测验)重复测量同
一被试者,所得结果的一致程度。 2、信度只受什么误差的影响? 随机误差 3、信度与误差关系? 误差大,信度低 4、信度的指标有哪些? 信度系数,信度指数,测量标准误。
第五讲 心理学研究的信度和效度
![第五讲 心理学研究的信度和效度](https://img.taocdn.com/s3/m/bd8651df7f1922791688e8a1.png)
第五讲心理学研究的信、效度长江大学教育科学系严磊研究设计的主要目标是特高整个研究的科学性水平,即保证研究结果、结论能真实的反映人的心理活动规律和教育规律。
信度与效度不但是研究设计应当遵循的标准,而且也是评价研究设计质量乃至整个研究结果科学水平。
信度、效度源于心理与教育测验领域,现在心理学者将诶用了测量领域的信度与效度概念,并把研究的信度和效度作为设计与评价各种研究的标准,以提高心理与教育科学中各类研究的客观性、可靠性和科学性。
如今,有关研究信度和效度的理论和方法已经为心理、教育研究者普遍接受,成为研究和实验设计的关键,也成为心理、教育研究方法发展的里程碑。
一心理测量的信度和效度射击打靶1.真分数假设假设一:在所讨论的问题范围内,真分数不变,亦即个体具有恒定的特质,其分量一定,取值是常数。
假设二:误差是完全随机的。
这里有二层意思,一是测量误差是平均数(期望值)为零的正态随机变量;二是测量误差跟被测心理特质即真分数间相互独立。
假设三:观察分数是真分数与误差分数的和。
2.测量的信度信度(reliability)是指测量结果的稳定性和可靠性程度。
重测信度、复本信度、分半信度、评分者一致性信度3.测量的效度一研究的信度二研究的信度1.研究信度的概念研究的信度指研究所的事实、数据的一致性和稳定性程度。
一向好的心理与教育研究,其结果必须稳定可靠,即重复研究的结果要保持稳定、一致,否则便可不信。
根据影响信度的误差来源,信度可分为两大类:稳定性和同质性。
稳定性指研究结果跨时间、跨情境的一致性。
同质性指研究工具本身各项目内容的一致性。
举例:用同一思维研究工具在前后相隔较短的时间内测查某一年级的儿童两次,结果发现两次测查结果不一致,第一次测查结果表明被试未达到逻辑思维水平,第二次结果发现他们已经达到逻辑思维水平。
2.判定研究信度的方法重复法运用重复测量、重复研究的方法,在相同条件下用相同方法进行两次以上的研究,然后考察它们是否取得相同结果。
心理测量信度与效度分析
![心理测量信度与效度分析](https://img.taocdn.com/s3/m/84db9cb077eeaeaad1f34693daef5ef7ba0d12d8.png)
心理测量信度与效度分析在心理学领域,心理测量是一项重要的研究和应用工具。
而在心理测量中,信度和效度是两个至关重要的概念,它们对于评估测量工具的质量和可靠性起着关键作用。
信度,简单来说,就是测量结果的一致性和稳定性。
想象一下,你用同一把尺子去测量同一个物体的长度,每次测量的结果都应该比较接近,如果结果差异很大,那么这把尺子的信度就有问题。
在心理测量中也是如此,如果一个心理测验今天测出来一个人的某种心理特质是这样,明天再测又变成了另外一个样子,那这个测验就不可靠,信度低。
信度主要包括重测信度、复本信度、内部一致性信度等几种类型。
重测信度就是在不同时间对同一批被试进行相同的测量,然后比较两次测量结果的一致性。
比如说,给一组学生在本学期初做了一次智力测验,到期末的时候再做一次,看看两次结果是否相似。
复本信度则是使用两个平行的测验版本(也就是内容相似但题目不同的测验)对同一批被试进行测量,比较这两个测验结果的相关性。
内部一致性信度通常用于衡量一个测验内部各个项目之间的一致性,比如一份问卷中的各个题目是否都在测量同一个心理特质。
信度的高低受到多种因素的影响。
测量工具本身的质量是一个重要因素,如果题目表述不清、选项设置不合理,就容易导致测量结果不稳定。
被试的状态也会有影响,比如被试在两次测量之间经历了重大的生活事件,情绪和心理状态发生了很大变化,可能会影响测量结果的一致性。
此外,测量的环境和施测者的差异也可能对信度产生影响。
那么,如何提高心理测量的信度呢?首先,要确保测量工具的质量,题目设计要科学合理,经过充分的预测试和修订。
在施测过程中,要尽量保持环境的一致性,施测者要严格按照规定的程序进行操作,减少人为因素的干扰。
对于被试,要提前告知测量的目的和注意事项,让他们能够以稳定的状态参与测量。
说完信度,我们再来看效度。
效度指的是测量工具能够准确测量出所要测量的心理特质或概念的程度。
一个有效的心理测验应该能够真正反映出被试在特定心理特质上的真实水平。
《心理测量学》(郑日昌版)超详细知识点笔记
![《心理测量学》(郑日昌版)超详细知识点笔记](https://img.taocdn.com/s3/m/0ed6ac30ed630b1c59eeb55e.png)
第 1 章概论1 、中国古代心理测量简述:( 1 )公元六世纪初,南朝人刘勰的著作《新论· 专学》中提到了类似现代“ 分心测验” 的思想。
( 2 )在中国古代,“ 七巧板” 是很常见的一种儿童玩具,其实它可以作为创造力测量的工具。
( 3 )中国古代心理测量的思想中包含着典型的东方文化特点:定性描述及带有道德判断色彩。
2 、中国近代心理测量的出现:( 1 ) 1916 年,樊炳清先生首先介绍了比内 - 西蒙智力量表。
( 2 ) 1920 年,北京高等师范学校和南京师范学校建立了我国最早的两个心理学实验室,廖世承和陈鹤琴先生在南京高等师范学校开设心理测验课。
1921 年,他俩正式出版《心理测验法》一书。
( 3 ) 1922 年夏天,中华教育改进社聘请美国教育心理测验专家麦考尔来华讲学。
( 4 ) 1924 年,陆志韦先生发表了《订正比内西蒙智力测验说明书》, 30 年代又与吴天敏再次做了修订。
( 5 ) 1931 年由艾伟、陆志韦、陈鹤琴、萧孝嵘等倡议,组织并成立了中国测验学会。
( 6 ) 1932 年《测验》杂志创刊。
( 7 )至抗战前夕,由我国心理学工作者制定或编制出的合乎标准的智力测验和人格测验约 20 种,教育测验 50 多种。
3 、中国现代心理测量的发展:( 1 ) 1936 年,苏联在批判“ 儿童学” 时扩大化,心理测验也被一概禁止。
( 2 )从 1978 年北京大学首建心理系开始,心理测验才重新得到恢复。
( 3 ) 1979 年,林传鼎、张厚等以国外资料为参考,编制了少年儿童学习能力测验。
( 4 ) 1980 年初,北师大心理系开设了心理测量课。
1984 年,在北京召开的第五届全国心理学年会上,成立了心理测验工作委员会,加强了测验工作的指导和监督。
4 、科学心理测验的产生:心理测验的产生,是出于实际需要。
最初,人们用测验,是因为要治疗智力落后者和精神病病人。
( 1 )法国的医生艾斯奎罗第一个把智力落后与精神病分开。
信度的种类和内涵心理学解释
![信度的种类和内涵心理学解释](https://img.taocdn.com/s3/m/8feef9ff1b37f111f18583d049649b6648d70998.png)
标题:信度的种类和内涵心理学解释引言信度是心理测量学中一个重要的概念,用来评估测量工具或者测量结果的稳定性和一致性。
在心理学研究中,信度是确保测量结果可靠和准确的关键因素之一。
本文将介绍信度的种类和内涵,并提供心理学解释。
一、信度的概念和意义1.1 信度的定义信度是指测量工具或者测量结果的稳定性和一致性程度。
它反映了测量工具或测量结果中随机误差的程度。
1.2 信度的意义信度是心理学研究中至关重要的概念,它保证了研究的可信度和准确性。
如果测量工具或者测量结果的信度较高,研究者可以更有信心地使用这些工具进行数据收集和分析,并得出可靠的结论。
二、信度的种类2.1 内部一致性信度内部一致性信度是指测量工具内部各项指标或题目之间的相互关联程度。
常用的内部一致性信度指标包括Cronbach's alpha 系数和Kuder-Richardson公式20。
2.2 测试-重测信度测试-重测信度是指同一测量工具在不同时间点上的测量结果之间的相关性。
通过重复测试同一受试者,可以评估测量工具的稳定性和一致性。
2.3 平行形式信度平行形式信度是指不同但具有相似测量目标的测量工具之间的相关性。
研究者使用不同的测量工具来测量同一概念,通过比较它们的结果相关性来评估平行形式信度。
2.4 交叉信度交叉信度是指不同的评分者或评分项目对同一对象进行评分时的一致性程度。
它常用于评估客观性测量工具,例如问卷调查中的主观题。
三、信度的计算方法3.1 相关系数法相关系数法是最常用的计算信度的方法之一。
通过计算两个变量(例如两次测量结果)之间的相关性来评估信度的程度。
常用的相关系数包括皮尔逊相关系数和斯皮尔曼相关系数。
3.2 内部一致性信度的计算方法内部一致性信度可以使用Cronbach's alpha系数或Kuder-Richardson公式20来计算。
这两种方法可以评估测量工具内部各项指标或题目之间的相互关联程度。
3.3 直接比较法直接比较法是通过比较不同测量工具或不同评分者的结果来评估信度。
心理测量信度与效度分析
![心理测量信度与效度分析](https://img.taocdn.com/s3/m/e768e26691c69ec3d5bbfd0a79563c1ec4dad769.png)
心理测量信度与效度分析在心理学领域,心理测量是一项至关重要的工具,它帮助我们了解个体的心理特征、能力水平和行为倾向。
而信度和效度则是评估心理测量工具质量的两个关键指标。
理解信度与效度对于正确使用和解释心理测量结果具有重要意义。
信度,简单来说,就是测量的可靠性或稳定性。
想象一下,你用一把尺子去测量一个物体的长度,如果每次测量的结果都差不多,那么这把尺子就具有较高的信度;反之,如果每次测量的结果差异很大,那么这把尺子的信度就很低。
在心理测量中也是如此,如果一个心理测试在不同时间、不同情境下对同一个人进行测量,得到的结果都比较接近,那么这个测试就具有较好的信度。
信度主要有以下几种类型。
重测信度是指在不同时间对同一组被试进行相同的测量,然后计算两次测量结果之间的相关性。
例如,我们对一组学生进行智力测验,两周后再次对他们进行相同的测验,比较两次测验的得分,如果相关性较高,说明该测验的重测信度良好。
复本信度则是使用两个内容相似但形式不同的测验版本,对同一组被试进行测量,然后比较两个版本测验结果的一致性。
内部一致性信度常用于衡量一个测验内部各个项目之间的一致性程度,比如通过计算克朗巴哈系数来评估。
那么,如何提高心理测量的信度呢?首先,测验的题目应该表述清晰、明确,避免产生歧义。
其次,测量的环境要保持稳定,减少外部因素的干扰。
再者,增加测验的长度通常也能提高信度,因为更多的题目可以更全面地反映被试的特征,从而减少随机误差的影响。
接下来,我们谈谈效度。
效度指的是测量的准确性或有效性,即一个测验能够真正测量到它想要测量的东西的程度。
如果一个智力测验确实能够准确地反映一个人的智力水平,那么这个测验就具有较高的效度。
效度可以分为内容效度、结构效度和效标效度等类型。
内容效度关注的是测验的内容是否涵盖了所要测量的领域的主要方面。
比如,一个数学考试如果能够全面覆盖数学的各个重要知识点,那么它就具有较好的内容效度。
结构效度则考查测验是否符合某种理论上的结构或模型。
心理测量信效度
![心理测量信效度](https://img.taocdn.com/s3/m/ffaa761c52d380eb62946dcb.png)
效度的估计
• ◎内容效度:是指一个测验实际测到的内容,与所要测量的内容之间的吻合
• 程度,估计一个测验的内容效度就是去确定该该测验在多大程度上代表了所 要测量的行为领域 应用范围:主要适用于成就测验,选拔和分类的职业测试;不适用于能力倾 向测验和人格测验 确定方法:※逻辑分析法:明确预测内容的范围—确定每个题目所要测的内 容——制定评定量表 ※克龙巴赫还提出过内容效度的统计分析方法。同一个教学内容总体 中抽取两套独立的平行测验,用这两个测验来测同一批被试,求其相关,若 相关低,则两个测验中至少有一个缺乏内容效度;若相关高,则测验有较高 的内容效度(除非两个测验取样偏向同一个方面) ※再测法:在被试学习某种知识之前做一次测验(如学习电学之前考 电学知识),在学习该知识后再做同样的测验。这时,若后测成绩显著的优 于前侧成绩,则说明所测内容正是被新近所学习的内容,进而证明该测验对 这部分内容具有较高的内容效度
信度的估计方法
• 同质性信度:也叫内部一致性系数,是指 测验内部所有的题目间的一致程度。包括 两点:一、所有的题目测的都是同一种心 理特质,二、题目的分之间都有较高的正 相关
• 评分者信度:指的是多个评分者给同一批 人答卷进行评分的一致性程度 • 计算:肯德尔系数
影响信度的因素
被试方面:身体健康状况、应试动机、注 意力、耐心、求胜心、作答态度 主试方面:暗示、协助、评分标准前后不 一 施测环境:安静、光线和通风情况、设备 齐全、桌面、空间宽窄 测量工具:稳定性 两次施测的间隔时间:时间越短信度越大 、时间越长、信度越慢
信度的估计方法
1.重测信度:指的是用同一个量表对同一组 被试施测两次所得结果一致性程度,其大 小等于同一组被试在两次测验上所得分数 的皮尔逊积差相关系数
信度名词解释心理学
![信度名词解释心理学](https://img.taocdn.com/s3/m/7683512ccd1755270722192e453610661ed95af4.png)
信度名词解释心理学
信度是心理学中一个重要的概念,它涉及到心理学研究中识别和量化特定测量指标的准确性和可靠性。
信度是测量技术能够从不同环境中生成相似数据以及观察者不断重复使用测量工具而不会有结果
变化的可靠性。
因此,在任何心理学研究中,信度都是一个非常重要的评估指标,它可以对采用的测量工具、技术方法和结果进行精确的评估,从而确保研究的准确性和可靠性。
信度的概念可以进一步分为内部信度和外部信度,而内部信度又可以分为可重复性信度和可鉴别性信度。
可重复性信度指的是测量技术的重复性,即在不同的时间段中,测量结果的重复性;可鉴别性信度则是指测量技术能够有效区分不同测量目标之间的差异。
因此,在心理学研究中,内部信度是一个重要的测量技术,可以有效检测信息的重复性和鉴别性。
外部信度可以指测量结果的关联性,即测量结果与其他与它相关的结果之间的关联性程度。
例如,在心理学研究中,外部信度可以用来评估某一测量技术的准确性和可靠性,采用不同的测量技术分析同一现象,比较测量结果在不同条件下的差异,以获取数据的有效性和准确性。
此外,还有一种测量方法,即单重信度,它通常用于测量结果的数量性质。
单重信度是测量技术提供准确数据的能力,它可以用来鉴别测量结果在特定环境下的准确性和可靠性。
另外,单重信度还可以用来评估测量结果的内在关联性,比如测量结果的相关性和共现性,
可以帮助心理学研究人员检验数据的准确性。
信度和它的相关概念在心理学研究中都是十分重要的评估指标,它们可以用来判断特定测量技术的准确性、可靠性以及其在不同时间段和环境中的表现。
因此,使用信度可以帮助心理学研究者获得准确而有效的测量数据,以便在心理学研究中取得更好的成果。
第五章 信度(同等学力辅导班资料)
![第五章 信度(同等学力辅导班资料)](https://img.taocdn.com/s3/m/f36c521f6edb6f1aff001f6e.png)
• 满足等值性时,使用斯皮尔曼—布朗公式(SpearmanBrown) 2roe
rXX=
rkk=
1+roe
K rxx 1+(K-1)rxx
(通式)
K为总测验为分半长度的倍数
(四)评分者信度(Scorer Reliability)
1、定义: 指多个评分者给一组测验结果评分,所得分数之间的一致性程 度。
估计信度的方法与测验复本的数目 以及施测次数的关系
所需要 施测的次数
所需要副本的数目 一 二
一
分半信度 同质性信度 评分者信度
复本信度 (连续施测)
二
再测信度
复本信度 (间隔施测)
各种信度系数相应误差变异的来源
信度系数的类型 再测信度 复本信度(连续施测) 复本信度(间隔施测) 分半信度 同质性信度 评分者信度
测验A
最短时间
测验B
相关系数
稳定性与等值性(Stability and Equivalent)信度 1、定义: 如果两个复本测验是相距较长一段时间分两次施测的,同 一组被试施测结果的一致性程度。 • 是一种最为严格的信度指标 • 时间间隔施测,内容变异+重测信度误差 2、形式:复本A—适当时间—复本B
真题
• 15.让一被试两次接受同一测试,这 是 (2006年) • A.重测信度 • B.复本信度 • C.分半信度 • D.同质性信度
真题
• 7.分半信度(2002年) • 12.下列各项方法中,不能用来计算项目间 一致性的方法是__________。(2003年) • A.因素分析 • B.复本信度 • C.克伦巴赫a系数 • D.荷依特信度
在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两
心理测量第三篇—信度
![心理测量第三篇—信度](https://img.taocdn.com/s3/m/bd19f423dd36a32d737581ad.png)
二、概化理论的基本原理和概念
1.测量目标——希望测量的实体,如能力、 成就等特性。 2.侧面——一组特定的测量条件,其中条 件的数量为该侧面的水平。
例题:如果要求每个被试写两篇题目不同的短文,并 由三名评分者给所有短文评分 测量目标:被试的写作水平; 侧面:题目和评分者; 水平数:分别为2和3。
二、测验长度的影响
一般说来,在—个测验中增加同质性的题 目,可以使信度提高。
二、测验长度的影响
假设有一个包括10个题目的测验,信度 为0.50,若把测验增加到50个题目,其 信度将增加到:
二、测验长度的影响
当由于测题过少而导致信度较低时,增加 多少个题目可以达到理论的信度指标,可 以用下式来推算:
一、概化理论对经典测验理论的发 展
2.概化理论的诞生及其特点 (1)诞生:1972年,克朗巴赫出版《行 为测量的可靠性:测验分数和剖面图的概 化理论》,正式形成了概化理论(GT)。 (2)特点: 克朗巴赫指出:“概化分析超越经典信度 分析之处在于它明确问到,这个分析过程 如何计算误差?每个来源的变异有多大?”
一、测量的标准误的含义及其作用
5.测量的标准误差的解释
比如:以95%的置信度为标准,则Z0.95=1.96,
它表示真分数有95%的可能性落在 范围内。
二、直接估计标准误差
1.公式: 估计信度rtt要求每个人都有两个测验分数, 估计Se也是一样要求每个人要有成对的分 数,每个人成对的分数由复份法、再测法、 分半法获得。
(二)分半信度
2.“斯皮尔曼—布朗公式”校正
条件:两个分半测验分数的变异性相等。
(二)分半信度
当两个分半测验分数的变异性不等时: 费拉南根(Flanagan)公式:
什么是信度?
![什么是信度?](https://img.taocdn.com/s3/m/61c3f8c1c0c708a1284ac850ad02de80d4d806ed.png)
什么是信度?教育测量中,如何保证测验的客观性,取决于测验的几个相互联系的基本因素,这就是测验要有较高的信度、效度,测验题目要具有比较高的区分度和比较适当的难度。
只有保证了测验的这些要求,就可以做到将想要测验的内容测出来,把被评价者区分开,这也就达到了测量的目的。
可以说,保证测验是科学的和有价值的,必须关心测验的信度、难度、测验题目区分度以及测验的难度。
从测量与评价的结果来说,测验的科学性指的就是测评结果能准确地反映被测对象的真实情况,达到测量的目的,即测量要具有较高的信度和效度。
一、教育评价与测量的信度信度,简单地说就是测量结果的可信程度。
信度(reliability)指的是测量结果的稳定性程度,如果用同一测量工具反复测量同一种特质对象,则多次测量结果间的一致性程度就叫信度。
各种类型的测量,无论是物理测量还是教育与心理测量,先后向同一对象施测后,所得数值很难做到绝对一致。
每次测量结果实际上包含了被测量特质对象的实际水平和测量误差两部分。
如果每次测量结果中误差部分都很小,那么测量结果必然是稳定的。
教育测量,由于对象的特殊性,出现测量误差的可能性更大,如施测环境、完成时限、主被试关系、被试的动机和情绪等因素都可能影响到测量的结果。
信度在这里就是指对这种随机误差的控制。
测验本身排除无关变量影响的能力强,测验实施过程各方面偶然误差因素控制得好,多次施测所得分数的一致性就高,测量信度也就高,测验就比较可靠。
测验信度是对测验工具及其操作的整体质量的一种量度,是测验性能的重要质量指标。
1.信度定义信度指的是测量结果的稳定性程度。
如果用同一测量工具反复测量某人的同一特质,多次测量结果间的一致程度就叫信度,也可以叫做测量的可能性。
一个好的测量必须要具有较高的信度。
一个好的测量工具,只要遵守操作规则,其结果不应随工具的使用者或使用时间等方面的变化而发生较大变化。
信度有如下三个等价的定义:定义1,信度是一个被测团体的真分钟变异数与观察分数变异数之比。
第五章心理测量工具的评价指标
![第五章心理测量工具的评价指标](https://img.taocdn.com/s3/m/b9430f2b6f1aff00bfd51e44.png)
第五章心理测量工具的评价指标正如任何一个测量工具一样,心理测量工具也有它自身的评价指标。
在心理测量学中,信度、效度、项目区分度和有效的常模都是检验心理测量工具是否具有可靠性、有效性、鉴别性、可比性等良好测量特征的技术指标。
因此,了解相关技术指标的内涵和计算方法对于从事心理测量的人力资源管理部门工作人员来说具有重大意义。
第一节心理测量的信度在进行心理测量时,最重要的心理测量学指标之一就是信度(reliability)。
任何一项好的测量都必须有良好的信度,这是人事测评的中心问题,同时它也是标准化测评的一项基本要求和原则。
一、信度的定义信度指的是测量数据和结果的一致性或可靠性程度,它用于分析测量工具测量的前后一致性水平,并以这种一致性的程度来判断测量工具或测量方法的可靠性。
也就是说使用的测评工具可以稳定地测到它所要测量的事物的程度。
我们在选择和使用测评工具或方法时,信度必须是考虑的重要问题。
测验信度越高,表示测验结果越可信,但也无法期望两次测验结果完全一致,信度除受测验工具本身的影响外,亦受很多其它因素的干扰,如所测量的被试样本特征等。
因此没有一份测验是完全可靠的,信度只是一种程度上大小的差别而已。
一致性高的测量工具是指同一群人接受性质相同内容相同的测验测量后,在各结果间显示出的较强的正相关。
稳定性高的测量工具则是指同一批被试在不同的时间接受同样的测验时,结果间的差异很小。
二、信度与误差在进行心理测量时,信度指的是测验分数未受测量误差(errors of measurement)影响的程度。
测量误差指由与测量目的无关的因素产生的不准确或不一致的效应。
测量误差愈小,测量结果愈可靠;换言之,如果测量的结果能反应受试者真实的特征,而不因其他因素而影响测验结果,那么这个测验所测量的结果是可靠的。
测量误差通常包括两种不同类型的误差,即系统误差和随机误差。
系统误差是由与测量目的无关的因素引起的一种恒定而有规律的效应,它稳定地存在于每一次测量中,此时虽然每次的测量值具有一致性,但不正确。
心理测量的理论基础 2测量的信度
![心理测量的理论基础 2测量的信度](https://img.taocdn.com/s3/m/2412f9e6524de518964b7dc8.png)
程 诚Βιβλιοθήκη 二 测量的信度信度(reliability) 信度(reliability): 测量结果的稳定性程度。信度这一概念是 测量结果的稳定性程度。信度这一概念是 计算各个分数的测量误差的基础,据此我 们能够预测各个分数受到无关因素或未知 因素的偶然因素的影响而可能发生的波动 范围。 信度与真分数理论的联系: 真分数是不变的,变化的是误差分数,能 够较好的控制误差,就能保证测量观测分 数的稳定性,就能获得较高的信度。
同质性信度( reliability) 同质性信度(homogeneity reliability) 也叫做内部一致性系数,是指测验内部所有 题目间的一致性程度。 题目间的一致性含有两层意思: ①指所有题目都测的是同一种心理特质, ②指所有题目得分之间都具有较高的正相关。 同质性信度就是一个测验所测内容或特质的 同质性信度就是一个测验所测内容或特质的 相同程度。 相同程度。 测量单一特性是同质性高的必要条件,而非 充分条件。同质性高才是测验测得单一特质 的充分条件。
重测信度的误差来源: 测验本身:测验所得的特性的本身就不稳 测验本身:测验所得的特性的本身就不稳 定。 受测者:成熟、知识的发展、练习因素、 受测者:成熟、知识的发展、练习因素、 记忆效果。重测的信度会随着时间的增长 而逐渐减小。重测间隔时间不应该超过6 而逐渐减小。重测间隔时间不应该超过6个 月。 偶发因素:记忆错误、情绪波动、健康状 偶发因素:记忆错误、情绪波动、健康状 况、动机等。
影响信度系数的因素 分数分布范围的影响 测验长度的影响 测验难度的影响 提高信度的方法 1.适当增加测验的题目数量。 1.适当增加测验的题目数量。 2.使测验中所有的试题的难度都接近正态分布,并 2.使测验中所有的试题的难度都接近正态分布,并 控制在中等水平。 3.努力提高测验试题的区分度。 3.努力提高测验试题的区分度。 4.选取适当的受测群体,提高此次测验在各同质性 4.选取适当的受测群体,提高此次测验在各同质性 较强的亚群体上的信度。 5.主测者严格执行实测规程,评分者严格按标准给 5.主测者严格执行实测规程,评分者严格按标准给 分,实测场地按测验手册的要求进行布置,较少无 关因素的干扰。
心理测量信度与效度分析
![心理测量信度与效度分析](https://img.taocdn.com/s3/m/ed62d30ba88271fe910ef12d2af90242a895ab9d.png)
心理测量信度与效度分析在心理学领域,心理测量是评估个体心理特征和行为的重要手段。
而信度和效度则是衡量心理测量工具质量的关键指标。
理解和掌握信度与效度的概念、分析方法以及它们之间的关系,对于正确使用和解读心理测量结果至关重要。
信度,简单来说,就是测量的稳定性和一致性。
想象一下,你用同一把尺子去测量一个物体的长度,每次测量的结果都应该比较接近,这就是信度的体现。
如果今天测出来是 10 厘米,明天测出来是 15 厘米,那这把尺子的信度就很差。
在心理测量中,信度通常分为重测信度、复本信度、内部一致性信度等几种类型。
重测信度,是指在不同时间对同一组被试进行测量,然后比较两次测量结果的一致性程度。
比如,我们用一份焦虑量表对一组人进行测量,两周后再用同样的量表对他们进行测量,如果两次测量的分数相近,说明这份量表的重测信度较好。
复本信度则是使用两份相似但不完全相同的测量工具对同一组被试进行测量。
就像我们有两把差不多的尺子,分别测量同一个物体,如果测量结果接近,复本信度就高。
内部一致性信度,常见的有克朗巴赫α系数,主要用于衡量一个测量工具内部各个项目之间的一致性。
比如一份智力测验,其中的数学题、逻辑题、推理题等各个部分之间的得分应该有较高的一致性。
信度的高低通常用信度系数来表示,系数越高,信度越好。
一般来说,信度系数在 07 以上被认为是可以接受的,但对于一些要求较高的测量,信度系数可能需要达到 09 以上。
效度,指的是测量工具能够准确测量出所要测量的心理特质或行为的程度。
它是一个测量工具有效性的指标。
比如说,我们想用一个测验来测量学生的数学能力,如果这个测验大部分题目都是语文阅读理解,那显然它是没有效度的,因为它没有测量到我们想要的东西。
效度可以分为内容效度、构想效度和效标效度。
内容效度是指测量工具的内容是否涵盖了所要测量的概念的全部范围。
例如,一个关于心理健康的问卷,如果没有涉及到焦虑、抑郁等常见的心理健康问题,那它的内容效度可能就不高。
五章心理测量的信度
![五章心理测量的信度](https://img.taocdn.com/s3/m/745d27f5f021dd36a32d7375a417866fb84ac095.png)
三、等值稳定性系数
等值稳定性系数是用两个平行的(等值的)测 验,间隔适当时距施测于同一组被试得到两组 测验分数,求这两组测验分数的相关,其相关 系数就是等值稳定性系数。
等值稳定性系数的模式是:
测验A 适当时距 测验B
计算方法同稳定性系数和等值性系数。
等值稳定性系数也是采用复本对被试施测,但 等值性系数的测验要求两次测验的时间间隔尽 可能短,而计算等值稳定性系数的两次测验却 要求有一个适当的时距。
(1)计算出每个应试者的奇数题总分(X1)和 偶数题总分(X2),见表5-3。
得
被试
分 1 2 3 4 5 6 7 8 9 10
X1 38 37 38 41 40 36 38 39 40 35
X2 37 37 36 39 39 34 38 39 39 36
采用分半信度应注意以下几个问题:
(1)若用分半法时,以按奇数题和偶数题分 半为宜。
复本信度的模式是:复本A 最短时距 复本B
例3:假设用A、B两型创造力复本测验对 初中一年级10个学生施测。结果见表5- 2。请同学们自己计算。
表5-2 某创造力复本测验测试结果
测
被试
验 1 2 3 4 5 6 7 8 9 10
X1 20 19 19 18 17 16 14 13 12 10
2
SE
,即
X ±1.96 SE的范围之内,也可以写成X
-1.96SE T X+1.96 SE,SE则用公
式5-4代入。或有5%的可能落入这范围
之外。这实际上也表明了再测时分数改
变的可能范围。
例1,已知WISC-R的标准差为15,信度系 数为0.95,对一名12岁的儿童实施该测 验后,IQ为110,那么他的真分数在95% 的可靠度要求下,变动范围应是多大?
第五章信度
![第五章信度](https://img.taocdn.com/s3/m/59e79e28b4daa58da0114ac9.png)
四、同质性信度
1.含义
同质性信度(homogeneity reliability), 也叫内部一致性系数,是指测验内部所有题 目间的一致性程度。可弥补分半法的不足。
(★)
2.计算及适用范围 基本公式: rkk = K rij / [ 1 +(K - 1)rij ] K为测验项目数 r ij是项目间相关系数的平均数。
复本信度(间隔施测)
分半信度 同质性信度 评分者信度
时间与内容取样
内容取样 内容取样和内容的异质性 评分者间的差异
第五节 影响信度系数的因素
一、影响因素 除被试、测验内容、施测情景外,影响信度系数的因 素还有: (一)分数分布的影响 分数分布范围越宽,信度系数就越高。被试团体同质 性水平 同质性越高(个体差异越小)→分数分布范围小→ 信度越低
概化理论的提出
克龙巴赫(Cronbach)等率先提出了概化理论 (Generalizabillity Theory )的基本框 架; 运用对方差或协方差分量分解的方法,将测 验情景中的各类误差进行分解和控制,实现 了对经典测量理论的扩展; 用于评分者信度的估计、临界分数误差估计、 测验分数的推广性和标准参照测验的信度研 究中。
库德-理查逊公式 KR20公式: rxx = [ K /(K - 1)] [ 1-(Σpiqi)/ Sx2 ] pi为答对第i题的人数的比例;qi为答错第i题的 人数的比例;K为题目数, Sx2为测验总分 的变异。 适用于:已知各项目的难度
KR21公式: rxx = [ K /(K - 1)] [1 -(K p q )/ Sx ] =[K Sx2-X(K-X)]/(K-1) Sx2 适用于:各项目难度相近的情况
பைடு நூலகம்
5心理测量 第五章 经典测验理论——信度
![5心理测量 第五章 经典测验理论——信度](https://img.taocdn.com/s3/m/273ac0a40029bd64783e2ceb.png)
5 0.5 0.5 0.25
题目5 0 0 1 0 1 0 0 0 1 1
4 0.4 0.6 0.24
题目6 0 0 1 0 1 0 0 0 1 1
4 0.4 0.6 0.24
四、估算信度系数的方法
克伦巴赫( Cronbach)α系数 非0、1计分,如人格测验、态度测验 0、1计分的测验同样可以采用 大多测验采用克伦巴赫( Cronbach)
质方面没有获得过学习和训练 注意提高被试的积极性
二、估算信度系数的方法
2、复本信度 平行测验信度 parallel form reliability 对一组被试用两个复本测验(平行测
验)施测,计算积差相关系数,就是复 本信度。
被试 测验A(X) 测验B(Y)
X2
Y2
XY
01
8
9
64
81
72
α系数来表示,使用范围广泛
被试 题目1 题目2 题目3 题目4 题目5 题目6 总分Xt Xt2
01
3
4
3
2
1
4
17
289
02
6
3
4
5
4
6
28
784
03
1
3
1
2
4
5
16
256
04
6
2
2
1
5
3
19
361
05
5
3
1
2
4
2
17
289
∑X
21
15
11
12
18
20
97 1979
∑X2
107
47
心理学考研-心理测量资料-测量的信度
![心理学考研-心理测量资料-测量的信度](https://img.taocdn.com/s3/m/a73a2775b307e87101f69649.png)
For personal use only in study and research; not for commercial use2017考研已经拉开序幕,很多考生不知道如何选择适合自己的考研复习资料。
中公考研辅导老师为考生准备了【心理学考研知识点讲解和习题】,希望可以助考生一臂之力。
同时中公考研特为广大学子推出考研集训营、专业课辅导、精品网课、vip1对1等课程,针对每一个科目要点进行深入的指导分析,欢迎各位考生了解咨询。
第二节测量的信度(一)信度的含义1. 信度的定义信度是指测量结果的稳定性程度或一致性程度,有时也叫测量的可靠性。
信度有三种等价的定义:① 信度(信度系数,reliability coefficient )是一个被测团体的真分数的变异数与实得分数数,即实得分数的变异。
② 信度是一个被试团体的真分数与实得分数的相关系数的平方,即2x T ρ=xx r 。
③ 信度是一个测验x 与它的任意一个“平行测验”x'的相关系数,即x'x ρ=xx r 。
注:上述三个定义中,信度是就一批人的数据而言的,并不是用同一种工具反复测量同一个人(定义3除外)。
定义1和2只有理论意义,只有定义3才具有实际意义。
2. 描述测量一致性程度的指标还可以用信度指数T x ρ,它实际上是信度系数的平方根。
3. 信度的作用①信度是测量过程中所存在的随机误差大小的反映(注意:信度与测量中的系统误差无关);②信度可以用来解释个人测验分数的意义(利用测量标准误来估计真分数的置信区间)'x r -1xx E S S ∙=,S E 为测量的标准误,S x 为实得分标准差,'r xx 为测量的信度。
真分数估计的置信区间:E c E c S Z x T S Z x +≤≤-,x 为被试的观测分数,Z c 是对应于某个统计检验显着性水平的标准正态分布下的临界值。
③信度可以帮助进行不同测验分数的比较通常来自不同测验的原始分数不能直接进行比较,必须转化成标准分数再进行比较。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、信度
测量结果的可靠性和一致性。
因为心理测验通常测量人的行为,行为会由于各种各样的原因,因时、因事、因地而产生变动,这些因素有些是偶然的,有些是固有的,人在完成心理测验时的行为也会受上述因素的影响,从而使测验结果与真实结果不完全一致,所以我们要用信度来衡量测验的可靠性和一致性。
2、信度的操作化定义:
(1)误差理论认为:一个人的测验分数X是由真实分数(T)和误差(E)两部分构成的,公式是X = T + E。
(2)因此信度就被定义为:一组测量分数的真实方差与实得方差的比,或者是指真实方差占总方差的百分比。
公式为:rxx = 1-SE 2/SX 2
(3)根据统计学理论,真实方差与实得方差的比是一个相关系数的平方,所以我们把这种相关系数的平方叫做信度系数。
(4)计算公式为:rxx = ST2/SX2
3、由于误差的来源信度的可分为:这种分类是基于信度的传统定义-真分数理论。
(1)重测信度:考虑的误差来源是时间取样。
(2)复本信度:考虑的误差来源是内容取样。
(3)分半信度:它考虑的误差来源也是内容取样,它与复本信度的差别是:分半信度考查一个测验内容的两半题目测量的是否是同一个心理特点行为。
(4)同质性信度(内部一致性系数):考虑的是测验内容是否异质。
(5)评分者信度:考虑的误差来源是评分者间的差别。
4、信度的表示方法:
(1)信度系数和信度指数:
1 信度系数:rxx = rx2T = S2T/S2
2 信度指数:rXT = ST/SX
(2)测量标准误:SE = SX 1-rxx
5、信度的意义:
(1)信度系数可以解释为样本测验分数的总方差中有多少比例是真分数方差,也就是测验的总变异中真分数造成的变异占百分之几。
它直接告诉我们测量的误差有多大。
(2)测量的标准误可以告诉我们有多大可能性真实分数在某一分数范围内,并且可以预测实得分数再测时可能的变化情况。
6、信度的作用:
(1)解释预测个人分数的意义。
(2)解释真实分数与实得分数间的关系,明确告诉我们测验误差大小。
(3)新编的测验信度应高于原有的同类测验或相似测验。
(4)下结论说某测验比较可靠,必须是依据情境的,经多次证实的。
(5)它是确定测验好坏的一个指标。
一般的原则是:
1 当rxx<0.70时,测验不能用于对个人作出评价或预测,而且不能做团体间比较。
2 当0.70≤rxx<0.85时,可用于团体比较。
3 当rxx ≥0.85时,才可以用来鉴别或预测个人成绩或作用
7、重测信度:有时也叫稳定性,主要针对时间变量。
(1)重测信度采集数据得方法是:对同一组被试间隔一定的时间重复测试一次。
(4)重测信度的计算方法是积差相关法,因而rxx就是皮尔逊的积差相关系数。
(7)重测信度的时间间隔选择依测验性质和目的而定,如果测验是用于长期预测,则测量间隔长一些。
对儿童的智力测验一般是两周到四周为宜。
对成年人,间隔可到半年,很少超过6个月。
(13)使用重测信度应注意:不是所有测验都可以计算重测信度。
并且重测信度只是反映了随机误差的影响,而不是反映被试心理特点的长期变化。
8、复本信度:又叫等值性系数。
(1)数据采集方法是:给被试施测两个内容等值但题目不同的测验,求两组数值的相关。
计算方法常见的也是积差相关法。
(2)复本信度的高低反映了两个互为复本的测验等价的程度,而不是反映一个测验本
身受随机误差影响的大小。
复本信度的高低关键取决于复本测验的选择,因而施题目取样问题,或者说是测验的内容取样问题。
(3)复本信度优于重测信度的地方是:避免了重测带来的记忆效应和练习效应;可用于长期追踪研究前后测量;减少了作弊的可能性。
(4)复本信度的缺点:有些测验的复本很难找到;有些测验因正迁移效应使测验性质改变;如测量的内容很容易受练习的影响,复本信度也无法清除这种练习效应。
(5)重测复本信度,即再不同的时间里施测两个等值的测验(复本),得到的相关就是重测复本信度,也叫稳定等值系数。
它比单一的重测信度或复本信度都要严格、全面一些。
9、斯皮尔曼-布朗公式
rnn = nrtt/1 +(n-13、1)rtt,14、rnn是校正以后的相关系数,15、rtt是实得的相关系数,16、n为rnn对应的测验长度与rtt 对应的测验长度之比。
分半时,17、n = N /(N/2)= 2(N为测验全长),18、所以分半法信度的校正公式是:rxx = 2 rnn/1 + rhh 其中rhh为两半测验的相关系数。
(1)卢伦公式:rxx = 1-Sd2/Sx2 其中Sd2是两半测验分数之差的方差,Sx2为总方差。
(2)从理论上分析,分半信度反映的实际上是两半测验能够测量相同内容或心理特点的程度。
10、内部一致性信度(同质性信度):
同质性是指测验的所有题目间性质的一致性,即测的是同一种心理特质或行为。
同质性是测量单一特质的必要条件。
这里讲的同质性是指测验题目得分反映的心理特质一致,同质性的判别标准是:题目间呈高正相关,如果相关很低或是呈负相关,则题目为异质。
(1)库德和里查德森提出的K-R20公式只适合预测题目是二分法计分的。
克伦巴赫α系数适合于非二分法计分的测验的内部一致性信度估计法。
(2)从同质性信度的含义我们不难看出,分半信度是求测验两半之间的一致性或同质性,而同质性是求所有题目间的一致性。
因此分半信度实际上是同质性信度的一种,可以作为测验同质性评价的粗略估计指标。
因为可以根据测验得分来推论或验证某种概念或理论构思,因此同质性信度也是一种构思效度,或叫结构效度,它实际上介于信度与效度之间。
11、评分者信度:
有些心理测验的得分不是根据客观的计分系统计分的,是由评分者来给被试打分,因此,这样的测验的可靠性如何取决于评分者评分的一致性和稳定性如何。
评分者信度因评分者人数不同而估计方法不一样。
如果是两个评分者,独立对被试的反应评分,则可以用积差相关来计算,或用斯皮尔曼等级相关法计算。
如果评分者在三人以上,而且是等级评分,则可以用“肯德尔和谐系数”(W)来求评分者信度。
12、以测量标准误表示信度的好处是:
(1)信度的单位与测验分数的单位相同,因此解释个人分数时非常直接,能直接指出允许测验分数变化的范围。
(2)测验同质与否并不影响测量标准误的大小。
测量标准误的不足之处时:无法比较不同测验间的信度高低。
比较不同测验的信度用信度系数(rxx)解释个人分数时用测量标准误(SE)。
13、常见的影响信度的因素有:
样本特征、测验的长度、测验的难度、测量的时间间隔等。
14、我们做信度考验时,常常选取一个与常模样本性质相同的样本施测,根据被试得分求出信度系数。
(1)样本团体得分分布的影响:求信度的样本团体得分分布如果比较窄小的话信度就低。
(2)样本团体异质性的影响:样本团体异质的话,测验分数的分布就比同质样本的要广,分数的离差就大,样本的方差就大,信度就高。
实际上,高信度可能是假性高信度,勤&思网站正在不断更新中,请关注勤*思网站,关注考研!是由样本团体的异质造成的。
但如果常模总体要求各种各样的人,则异质的信度样本求得的信度就是真信度。
这时,相反的情况就需要校正信度。
(3)样本团体平均能力水平的影响。
由于信度也会因样本间团体平均能力水平的不同而不同,因此在求信度时,一定要注意信度样本与常模总体间是否一致。
15、测验的长度
在其他条件均等的情况下,测验越长,信度越高。
原因在于:
(1)测验越长,即题目越多,测验的内容取样就越有可能有代表性。
(2)测验越长,被试的猜测因素影响就越小。
16、测验的难度:
难度对信度的影响之存在于某些测验中,如智力测验、成就测验、能力倾向测验、教育测验等。
测验的难度对信度有间接影响,因为如果测验过难,被试的得分会集中在低分区。
过于容易,分数则集中在高分区。
两种情况都使信度样本的得分范围变窄,变异量降低,从而低估测验信度。
17、测验的时间间隔:
这一因素之对重测信度和不同时测量时的复本信度有影响,对其余的信度来说不存在时间间隔问题。