湖州师范学院：心理测量教学课件第五章心理测量的信度

合集下载

心理测量学知识1-PPT课件

好，看一下大家是否知道
6、00C意味着没有温度吗？
错。
7、其数值可以进行＋、－、×、÷运算的量表是？
等比量表。
8、一般来说，心理测量是在什么变量上进行的？
顺序变量。
第一节概述
第一单元第二单元第三单元第四单元第五单元第六单元测量与测量量表心理测验的基本概念心理测验的分类纠正错误的测验观心理测验在心理咨询中的应用心理测验的发展史。
也不等距。
第一单元测量与测量量表三、测量量表测量的本质是根据某一法则将事物数量化，即在一个定有单位和参照点的连续体上把事物的属性表现出来，这个连续体称为量表。要测量某事物的属性，将该事物的属性放在这个
连续体适当的位置上，看他们距离参照点的远近，可
以得到一个测量值，这个测量值就是对这一属性数量化的说明。
衡量智力水平。法则好，测量结果理想；法则差，结果难以接
受。心理测验良好法则较难设计，所以，心理现象难以测量。
第一单元测量与测量量表
二、测量的两个要素
（一）参照点
（二）单位
第一单元测量与测量量表（一）参照点确定事物的量，必须有一个计算的起点，即参照点。
参照点有两种：绝对零点和相对零点（人定的参照点）。
不能＋、－、＊、\。不能做数量化分析。
第一单元测量与测量量表 ③ 等距量表
比顺序量表水平高。有大小关系，单位相等。可以＋、
－。没有绝对零点，不能×、÷。如：摄氏温度。量表的数值加或减一个常数，或用一个常数乘或除量表的数值，原来的数据关系不会被破坏。所以，一个量表上的数值可以转换为另一个具有不同单位的量表上的数
…….两个人的争吵涉及了“心理测量”这一问题。

心理测量学第五章.ppt

五、心理测在咨询中的应用
（一）智力测验：中国比内量表韦氏智力量表（成人、儿童、幼儿）瑞文智力测验（SPM、CRT）
五、心理测验在咨询中的应用
（二）人格测验艾森克人格问卷（EPQ）卡特尔16人格因素问卷（16PF）明尼苏达多项人格调查表（MMPI）
五、心理测验在咨询中的应用
霍兰德职业倾向测验
四、纠正错误的测验观
（一）错误的测验观不客观的态度分二类：
测验完美无缺；测验无用且有害错误的测验观有三种： 1.测验万能论 2.测验无用论 3.心理测验就是智力测验
四、纠正错误的测验观
（二）正确的测验观 1.心理测验是重要的心理学研究方
法之一，是决策的辅助工具。 2.心理测验尚不完善。
心理测验的最大问题是理论基础不够坚实
五、心理测验在咨询中的应用
心理测验在心理咨询中的作用：心理测验主要用于对求助者心理特性、行为问题性质进行正确评估和诊断，以便于提供适当的指导、帮助和行为矫正训练
五、心理测验在咨询中的应用
心理门诊中运用较多的心理测验：智力测验人格测验心理评定量表
心理测量在顺序量表上进行
二、心理测验的基本概念
心理特质：个人对刺激作反应的一种内在倾向。是个体特有的、稳定的、可辨别的特征。
心理测验：依据心理学理论，使用一定的操作程序，通过观察人的少数有代表性的行为，对人的心理特质做出推论和数量化的一种科学手段
二、心理测验的基本概念
包含4个基本的含义： 1.心理测验是测量人某种行为的工具 2.要全部了解行为样本的意义 3.测验条件对所有被试都相同（标准化） 4.个人分数与常模比较才有意义（常模）
首先做一个心理测验（抑郁自评量表）通过这个测验大家可以想到哪些问题？

心理测量学中的信度和效度分析

心理测量学中的信度和效度分析心理测量学是研究心理测量方法与技术的学科，旨在通过反映被测者的心理特征和过程，揭示其心理素质、智力水平等信息。

而在心理测量过程中，信度和效度分析是两个重要的概念。

一、信度分析信度是指测量工具在测量同一心理特征或过程时的稳定性和一致性。

换句话说，信度反映了测量工具在同一被测者群体中的结果是否稳定，并且是否能复现。

具体来说，信度分析主要从可靠性和稳定性两个方面来考量。

1.可靠性可靠性是指测量工具的结果是否稳定且一致。

在心理测量学中，一种常用的方式是通过内部一致性来评估可靠性，最常见的统计方法是Cronbach's α系数。

Cronbach's α系数介于0和1之间，数值越大代表内部一致性越高，通常要求α系数达到0.7以上为可靠。

2.稳定性稳定性是指测量工具在不同时间或在不同条件下所得到的结果是否一致。

为了评估测量工具的稳定性，常用的方法是再测法和半分法。

再测法是指在不同时间或条件下对同一样本重复测量，然后通过计算相关系数来评估稳定性。

而半分法则是将测量工具的题目分成两部分，分别进行测量并计算两部分得分的相关系数。

二、效度分析效度是指测量工具是否能够准确地测量所要测量的心理特征或过程。

也就是说，效度是评估测量工具是否真的测量到了我们想要测量的东西。

效度分析主要从描述效度、判别效度和预测效度三个方面来考量。

1.描述效度描述效度是指测量工具是否能够全面、准确地描述被测者的心理特征或过程。

具体来说，可以通过专家评定法和内容效度等方法来评估描述效度。

专家评定法是通过请相关领域的专家对测量工具进行评定，包括评估题目的合理性、适用性等方面。

而内容效度是指测量工具的题目是否充分、恰当地涵盖了被测者的心理特征或过程。

2.判别效度判别效度是指测量工具能否区分不同的心理特征或过程。

为了评估判别效度，常用的方法是构太效度。

构太效度是通过与已知测量工具或理论进行比较，来确定测量工具是否能够与其他相关测量工具或理论得到一致或相似的结果。

心理测量学(基础知识)PPT课件

P355 16
心理咨询师培训课程-—《心理测量学》
五、心理测验的发展简史
1. 现代心理测验的开始
波林：在测验领域，“19世纪80年代是高尔顿的10年，90年代是卡特尔的10年，20世纪头10年则是比内的10年。”
（1）英国的高尔顿（F.Galton）。受达尔文进化论的影响，最早关注个体气质特点与智能差异，即个性差异；为了研究差异的遗传性，设计了差异测量的方法，这可被看作是心理测验的开端；高尔顿提出相关的概念，并由他的学生皮尔逊（K.Pearson）发展出积差相关，为心理测验奠定了统计学基础，使心理测验的信度、效度评估和进行因素分析成为可能。其实际测量集中在1884后的6年。
（2）人格测验：艾森克人格问卷（ EPQ）、卡特尔16 种人格因素问卷（16PF）、明尼苏达多项人格调查表（MMPI）等。这些测验可以达到了解、诊断和预测的目的；
（3）心理评定量表：精神病评定量表、躁狂状态评定量表、抑郁量表、恐怖量表等。这些测验主要用来进行临床诊断和疗效评估。
12/22/2019
P351 13
心理咨询师培训课程-—《心理测量学》
正确看法
第一，心理测验是心理学研究和实际工作中的有效工具，可以帮助人们收集有关人的心理特征、心理状态的资料，获得对人的心理活动规律性的认知和进行科学决策；
第二，心理测验作为研究方法和测量工具，尚不完善，其使用中会带来系统的和随机的误差，所以可信但不能全信、可靠但不是绝对可靠的。“无用论”和“万能论”都是错误的；
12/22/2019
P353 12
心理咨询师培训课程-—《心理测量学》
三、如何看待心理测验
错误看法
第一，万能论：心理测验测验完美无缺，可以解决一切问题；第二，无用论：侵犯隐私，违背民主原则，种族歧视，宿命论等；第三，心理测验就是智力测验：

心理测量信效度

பைடு நூலகம்
效度的估计
• ◎内容效度：是指一个测验实际测到的内容，与所要测量的内容之间的吻合
• 程度，估计一个测验的内容效度就是去确定该该测验在多大程度上代表了所要测量的行为领域应用范围：主要适用于成就测验，选拔和分类的职业测试；不适用于能力倾向测验和人格测验确定方法：※逻辑分析法：明确预测内容的范围—确定每个题目所要测的内容——制定评定量表 ※克龙巴赫还提出过内容效度的统计分析方法。同一个教学内容总体中抽取两套独立的平行测验，用这两个测验来测同一批被试，求其相关，若相关低，则两个测验中至少有一个缺乏内容效度；若相关高，则测验有较高的内容效度（除非两个测验取样偏向同一个方面） ※再测法：在被试学习某种知识之前做一次测验（如学习电学之前考电学知识），在学习该知识后再做同样的测验。这时，若后测成绩显著的优于前侧成绩，则说明所测内容正是被新近所学习的内容，进而证明该测验对这部分内容具有较高的内容效度
信度的估计方法
• 同质性信度：也叫内部一致性系数，是指测验内部所有的题目间的一致程度。包括两点：一、所有的题目测的都是同一种心理特质，二、题目的分之间都有较高的正相关
• 评分者信度：指的是多个评分者给同一批人答卷进行评分的一致性程度 • 计算：肯德尔系数
影响信度的因素
被试方面：身体健康状况、应试动机、注意力、耐心、求胜心、作答态度主试方面：暗示、协助、评分标准前后不一施测环境：安静、光线和通风情况、设备齐全、桌面、空间宽窄测量工具：稳定性两次施测的间隔时间：时间越短信度越大、时间越长、信度越慢
信度的估计方法
1.重测信度：指的是用同一个量表对同一组被试施测两次所得结果一致性程度，其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数

心理测验技能第五章心理测量学知识

4.比率数据（ratio data）特点：有相等单位，有绝对 0点，可加减、乘除。如身高、体重、反应时等。

等距数据：有相等单位，但没有绝对0点。不喜欢异性朋友与自己的同性交往？ a.非常不符合 b.比较不符合 c.不确定 d.比较符合 e.非常符合

你是否认为不努力学习是不行的？ a.总是认为 b.时常认为 c.偶尔认为

估计结构效度的方法：
通过分析测验的内部构造来获取
（1）测验内方法效度证据。
（2）测验间方法通过计算测验与标准化测验的相关来获取效度证据。
（3）因素分析
（4）多特质——多方法矩阵原理是若用多种极不相同的方法测量同一种特质相关很高，则说明测验的效度较高。（当然，用极为相似的方法测量不同特质，相关就应该很低。）
第五章心理测量学知识
第一节数据类型与测量层次
一、数据的类型（一）根据数据来源分类

1.计数数据（count data）：计算个数的数据。如人数、学生数、男女数。特点：用整数表示。 2.测量数据（measurement data）:借助一定的测量工具而获得的数据。如体重、智力测验分数、感觉阈值等。特点：用实数表示。

等比数据：有相等单位，也有绝对0点。
（三）根据数值表示是否连续

1.离散数据（discrete data）如0、1之间是间断的（整数）。特点：任意两个数之间一般不存在其他数。 2.连续数据（continuous data）特点：任意两个数之间都存在其他数。

二、测量的层次

定名测量

定序测量

对心理测试来说，首先要提出理论假设，这就要根据测试内容来查阅文献，看已有研究中对该内容的理论构建，自己在这基础上总结、归纳、提炼，或者根据自己的理论假设提出测验内容的维度和因素，再在此基础上形成题目。量表的框架就出来的。然后拿给专家评议，根据他们的意见进行维度和因素的调整，然后再在维度、因素的基础上设计不同的题目，这样初始问卷就出来了，再去初测，对得到的数据进行统计分析、修定、调整。

心理测量第三篇—信度

二、概化理论的基本原理和概念
1.测量目标——希望测量的实体，如能力、成就等特性。 2.侧面——一组特定的测量条件，其中条件的数量为该侧面的水平。
例题：如果要求每个被试写两篇题目不同的短文，并由三名评分者给所有短文评分测量目标：被试的写作水平；侧面：题目和评分者；水平数：分别为2和3。
二、测验长度的影响
一般说来，在—个测验中增加同质性的题目，可以使信度提高。
二、测验长度的影响
假设有一个包括10个题目的测验，信度为0.50，若把测验增加到50个题目，其信度将增加到：
二、测验长度的影响
当由于测题过少而导致信度较低时，增加多少个题目可以达到理论的信度指标，可以用下式来推算：
一、概化理论对经典测验理论的发展
2.概化理论的诞生及其特点 (1)诞生：1972年，克朗巴赫出版《行为测量的可靠性：测验分数和剖面图的概化理论》，正式形成了概化理论(GT)。 (2)特点：克朗巴赫指出：“概化分析超越经典信度分析之处在于它明确问到，这个分析过程如何计算误差?每个来源的变异有多大?”
一、测量的标准误的含义及其作用
5.测量的标准误差的解释
比如：以95%的置信度为标准，则Z0.95=1.96，
它表示真分数有95％的可能性落在范围内。
二、直接估计标准误差
1.公式：估计信度rtt要求每个人都有两个测验分数，估计Se也是一样要求每个人要有成对的分数，每个人成对的分数由复份法、再测法、分半法获得。
（二）分半信度
2.“斯皮尔曼—布朗公式”校正
条件：两个分半测验分数的变异性相等。
（二）分半信度
当两个分半测验分数的变异性不等时：费拉南根(Flanagan)公式：

第五章心理测量工具的评价指标

第五章心理测量工具的评价指标正如任何一个测量工具一样，心理测量工具也有它自身的评价指标。

在心理测量学中，信度、效度、项目区分度和有效的常模都是检验心理测量工具是否具有可靠性、有效性、鉴别性、可比性等良好测量特征的技术指标。

因此，了解相关技术指标的内涵和计算方法对于从事心理测量的人力资源管理部门工作人员来说具有重大意义。

第一节心理测量的信度在进行心理测量时，最重要的心理测量学指标之一就是信度（reliability）。

任何一项好的测量都必须有良好的信度，这是人事测评的中心问题，同时它也是标准化测评的一项基本要求和原则。

一、信度的定义信度指的是测量数据和结果的一致性或可靠性程度，它用于分析测量工具测量的前后一致性水平，并以这种一致性的程度来判断测量工具或测量方法的可靠性。

也就是说使用的测评工具可以稳定地测到它所要测量的事物的程度。

我们在选择和使用测评工具或方法时，信度必须是考虑的重要问题。

测验信度越高，表示测验结果越可信，但也无法期望两次测验结果完全一致，信度除受测验工具本身的影响外，亦受很多其它因素的干扰，如所测量的被试样本特征等。

因此没有一份测验是完全可靠的，信度只是一种程度上大小的差别而已。

一致性高的测量工具是指同一群人接受性质相同内容相同的测验测量后，在各结果间显示出的较强的正相关。

稳定性高的测量工具则是指同一批被试在不同的时间接受同样的测验时，结果间的差异很小。

二、信度与误差在进行心理测量时，信度指的是测验分数未受测量误差(errors of measurement)影响的程度。

测量误差指由与测量目的无关的因素产生的不准确或不一致的效应。

测量误差愈小，测量结果愈可靠；换言之，如果测量的结果能反应受试者真实的特征，而不因其他因素而影响测验结果，那么这个测验所测量的结果是可靠的。

测量误差通常包括两种不同类型的误差，即系统误差和随机误差。

系统误差是由与测量目的无关的因素引起的一种恒定而有规律的效应，它稳定地存在于每一次测量中，此时虽然每次的测量值具有一致性，但不正确。

《心理测量信度》课件

02
信度系数可以帮助雇主了解测验的一致性和可靠性，从而更好地解释和比较测验结果。
03
在职业测验中，信度可以通过重测法、分半法、同质性法等方法进行评估。
04
高信度的测验结果可以更准确地反映应聘者的能力和潜力，为雇主做出更明智的招聘决策提供支持。
信度在临床心理测验中的应用
在临床心理测验中，信度是评估测验可靠性和稳定性的关键
因素。
在临床心理测验中，信度可以通过重测法、分半法、同质性法等方法进行评估。
信度系数可以帮助心理医生了解测验的一致性和可靠性，从而更好地解释和比较测验结果
。
高信度的测验结果可以更准确地反映患者的心理状况和需求，为心理医生制定更有效的治疗方案提供支持。
THANKS
感谢观看
测验难度
测验难度对信度的影响主要体现在被试的得分分布上。如果测验难度适中，被试的得分分布较为集中，信度就较高；如果测验难度过高或过低，被试的得分分布就会过于分散，导致信度下降。
VS
在编制心理测验时，应根据测验的目的和被试的特点来设置适当的难度水平，以保证测验的信度。
被试样本
被试样本的差异也会影响测验的信度。如果被试样本具有代表性，那么测验的信度就较高；如果被试样本偏差较大，那么测验的信度就会受到影响。
信度的意义
提高测量结果的可靠性
信度评估可以确定测量工具的一致性，从而提高测量结果的可靠性，使结果更加准确可靠。
减少误差
比较和解释
信度评估可以比较不同测量工具之间的结果，以及在不同时间或情境下对同一对象进行测量的结果，从而更好地解释和比较测量结果。
信度评估可以识别和减少测量误差，从而提高测量的准确性。

心理测量测量的信度共63页

谢谢！
心理测量测量的信度
26、机遇对于有准备的头脑有特别的亲和力。 27、自信是人格的核心。
28、目标的坚定是性格中最必要的力量泉源之一，也是成功的利器之一。没有它，天才也会在矛盾无定的迷径中，徒劳无功。- -查士德斐尔爵士。 29、困难就是机遇。--温斯顿．丘吉尔。 30、我奋斗，所以我快乐。--格林斯潘。
பைடு நூலகம்
61、奢侈是舒适的，否则就不是奢侈。——CocoCha nel 62、少而好学，如日出之阳；壮而好学，如日中之光；志而好学，如炳烛之光。 ——刘向 63、三军可夺帅也，匹夫不可夺志也。 ——孔丘 64、人生就是学校。在那里，与其说好的教师是幸福，不如说好的教师是不幸。 ——海贝尔 65、接受挑战，就可以享受胜利的喜悦。——杰纳勒尔·乔治·S·巴顿

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

SE S x 1 rxx

我们可以用测量的标准误来估计个人测验的真分数的大小。如果选用95％的可靠性水平（置信水平），即显著性水平（a值）为.05 ，，真分数有95％的可能落入X ±Z 2 SE ，即 X ±1.96 SE的范围之内，也可以写成X －1.96SE T X＋1.96 SE，SE则用公式5－4代入。或有5％的可能落入这范围之外。这实际上也表明了再测时分数改变的可能范围。

对于信度系数，还应该注意以下几点：（1）在不同的情况下，对于不同的样本，采用不同的方法会得到不同的信度系数，因此一个测验可能不止一个信度系数。（2）信度系数只是对测量分数不一致程度的估计，并没有指出不一致的原因。（3）获得较高的信度系数并不是心理测量有效的充分条件，只是一个必要条件。 back

1.评价测验信度系数是衡量测验好坏的一个重要的技术指标。一般能力与学绩测验的信度系数为0.90以上，有的可以达到0.95；标准智力测验的信度系数应达到0.85以上，个性和兴趣测验的信度系数可稍低，一般应达到0.70～0.80，（也有人认为兴趣、性格、价值观等人格测验的信度系数，通常在0.80～0.85或更高些）。当信度系数小于0.70时，不能用测验来对个人进行评价，也不能用来进行团体间的比较；当信度系数大于 0.70时，可用来进行团体间的比较；大于0.85 时，可以用来鉴别个人。
第五章

心理测量的信度
什么是信度估计信度的方法影响信度系数的因素
第一节第二节第三节

一、信度的意义二、信度系数的作用

back
一、信度的意义信度即测验的可靠性，指的是测量的一致性程度。信度受随机误差的影响，随机误差越大，信度越低。在测量学中，信度被定义为：一组测量分数的真变异数与总变异数（实得变异数）的比率。即 S 2T rxx （公式5－1） S 2X 2 r S 式中 xx 代表信度系数， T 代表真分数的变异数， 2 代表实得分数的变异数，即总变异数。 S X

我们可以用“差异的标准误”来检验差异的显著性。差异的标准误的公式为： 2 2 SEd SE1 SE2 S 2 rxx ryy （公式5－5）
标准差，Z分数为1，T分数为10。rxx 、ryy分别为两个测验的信度系数。先将原始分数化成标准分数，然后将两个标准分数的差异与1.96SEd（0.05显著性水平）进行比较，如果其绝对值大于此值，则差异显著，否则差异不显著。

一、再测信度二、复本信度三、等值稳定性系数四、内部一致性系数五、评分者信度总结练习

back
再测信度 (Test-Retest Reliability) ，也叫重测信度，也叫稳定性系数。用同一个测验，对同一组被试前后施测两次，对两次测验分数求相关，其相关系数就叫再测信度。其计算公式（皮尔逊积差相关公式的变式）为： X1 X 2 X1 X 2 N r xx （公式5－6） S1S 2 X2 式中 X1 、 X2 为同一被试的两次测验分数，X 1 、为全体被试两次测验的平均数，S1、S2为两次测验的标准差，N为被试人数。再测法的模式是：施测适当时距再施测

SEd 为差异的标准误，S为相同尺度的标准分数的

例2，某校五年级进行了两次数学测验，小张第一次考了85分，此次数学测验年级平均分是77分，标准差是8分，此次测验的信度系数是0.84；第二次考了95分，此次数学测验年级平均分是81分，标准差是10分，此次测验的信度系数是0.91；问小张这两次数学测验的成绩是否有显著差异？ back

根据公式5－1，信度还可以表示为：
S 2E 1 S 2X
rxx
（公式5－2）

这个定义有两点要注意：（1）信度是一组测量分数的特性，不是某个测量分数的特性。是对一个人测量多次或对一个群体进行测量得到一组测量分数的特性（2）真分数的变异数不能直接测量，因此信度是一个理论上构想的概念，只能根据一组实得分数进行估计。

例1，已知WISC-R的标准差为15，信度系数为0.95，对一名12岁的儿童实施该测验后，IQ为110，那么他的真分数在95％的可靠度要求下，变动范围应是多大？

注意几点：（1）SE对真分数做的是区间估计，不可能由此得到一个确切的点。这就是说，测验分数不是一个定点，而是具有一定的分布范围。因此，两次测验分数之间存在差异是很正常的。（2）置信水平确定后，估计的精度主要取决于 SE ， SE 越小，范围越小，估计就越精确，反之也然。（3）真分数不能等同于真正能力或心理特质，真分数中包括了系统误差。
ቤተ መጻሕፍቲ ባይዱ
2.用来估计个人的测验分数（真分数）由于误差的存在，一个人通过测量得到的分数很难等于真分数。理论上，我们可以对一个人施测无数次，然后求得所得分数的平均数和标准差。在这个假设的分布里，平均数就是这个人的真分数，标准差则为误差大小的指标。

X

在实际工作中，我们用一组被试（人数足够多）两次施测的结果来代替对同一个人反复施测，以估计测量误差的变异数。此时，个人在两次测验中的分数差异就是测量误差。据此可制成误差分数的分布。这个分布的标准差（误差分布的标准差）我们称之为测量的标准误，是表示测量误差的大小的指标，其计算公式为：（公式5－4）式中SE表示测量的标准误，即误差分布的标准差；Sx表示一次测量分数的标准差； rxx表示信度系数。

3.用来对两种测验分数进行比较来自不同测验的原始分数是无法直接进行比较的，只有将它们转换成相同尺度的标准分数才能进行比较。如，某班期末考试，小明的数学成绩是 80分，语文成绩是70分。另外，已知小明所在班级的数学平均成绩是70分，标准差是10分，语文平均成绩是60分，标准差是7分。