第四章测量的信度

合集下载

第四章心理测量的信度

第四章心理测量的信度一、单项选择题。

1.当代信度理论的大部分要点是（）。

（4.1.63）A斯皮尔曼 B皮尔逊 C桑代克 D库德2.重测信度的大小等于同一组被试在两次测验上所得分数的（）。

（4.2.67）A.克伦巴赫α系数B.皮尔逊积差相关系数C.肯德尔和谐系数D.肯德尔W系数3.关于重测信度说法正确的是（）。

（4.2.67）A．每一种信度系数都能说明信度B．重测信度高，说明分数受被试状况和测验情境变化的影响小C．所有的测验都可以计算重测信度D．重测信度不仅反映了随机误差的影响，也反映了被试心理特点的长期变化4.关于重测信度下列说法正确的是（）。

（4.2.67）A每一种信度系数都能说明信度。

B重测信度高，说明分数受被试状态和测验情境变化的影响小。

C所有的测验都可以计算重测信度。

D重测信度不仅反映了随机误差的影响，也反映了被试心理特点的长期变化。

5.关于重测信度下列说法不正确的是（）。

（4.2.69）A任何一个测验都可能有不止一个再测信度系数。

B一份完备的测验应有很多重测系数，分别与不同的测验间隔时间相对应。

C重测相关很低意味着测验不可信。

D重测相关很低可能是被试被研究的特性发生了改变。

6.等值性系数取决于平行测验的得分之间的相关，且两次测验的时间间隔极短，所以若等值性系数偏低肯定是由于（）造成的。

( 4.2.71)A.学生自身变化B.题目取样不同C.主试的反应D.测试环境变化7.分半信度只适用于（）。

(4.2.7 4)A.难度测验B.速度测验C.=非标准化测验D.成就测验8.同质性信度是指测验的（）的一致性程度。

(4.2.74)A.题目内容B.题目形式C.所有题目间D.各维度题目9.下列估计信度的方法需施测2次的是（）。

（4.2.80）A．分半信度 B.同质性信度C.评分者信度D.再测信度10.下列哪项不是影响信度的因素（）。

（4.3.82）A.样本团体平均水平B.题目数量C.系统误差D.施测情境11.人格测验的信度应达（）以上。

(整理)心理与教育测量重点全部

第一章心理与教育测量概论1、测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程。

所谓一定的法则，是指任何测量都要建立在科学规则和科学原理基础之上，并通过科学的方法和程序完成测量过程。

所谓事物的特征，是指所要测量的事物的特定属性。

所谓量具，是指测量中所使用的工具。

所谓定量描述，是指任何测量的结果总是对事物特征的量的确定。

2、任何测量都必须具备两个基本要素，即测量的参照点和测量的单位。

参照点有两种，一种是绝对参照点，即以绝对的零点作为测量的起点。

另一种是相对参照点，即以人为确定的零点为测量的起点。

理想的测量单位应当具备两个条件：一是要有确定的意义，二是要有相等的价值。

3、测量量表分为4种：1）命名量表，是最低水平的量表，它只是用数字代表事物或对事物进行分类；2）顺序量表，如第1名，第2名；3）等距量表，不仅能代表事物的类别，等级，而且具有相等的单位，等距量表没有绝对的零点；4）比率量表，是最高水平的测量量表，有绝对的零点。

心理与教育测量的量表属于顺序量表。

心理与教育测量属于顺序量表。

★4、心理测验实质上是对行为样本的客观的和标准化的测量。

编制一个测验应当具备下列4个基本条件：1）行为样本。

从人的大量行为中抽取与欲测量的心理特质直接有关的一组行为进行测量，并依据对这一组行为的测量结果推断其心理特质和教育成就。

这一组被抽取出来的，作为直接的测量对象的行为就是行为样本。

2）标准化标准化就是指测验的编制、实施、记分以及测量分数解释的程序的一致性。

测验的标准化要具备下列条件：a、测验内容的标准化；b、施测条件的标准化；c、评分规则的标准化；d、测验常模的标准化。

3）难度或应答率4）信度和效度5、心理与教育测验的种类：按测量对象：智力测验、能力倾向测验、成就测验、人格测验。

按测量方式：个别测验，团体测验。

按测验内容的形式：文字测验，非文字测验按测验功能：成就测验与预测测验，难度测验与速度测验，描述测验与诊断测验。

测量的概念层次与信度

◦ 文盲、半文盲、小学、初中、高中、大专、大学、大学以上
定序测量（ordinal measurement ）
特征：
◦ 不仅能将事物区分为不同的类别，而且还能反映事物或现象在高低、大小、先后、强弱等序列上的差异。
◦ 数学特征是大于或小于 ◦ 所得到的信息比定类测量多一个或几个特征变量的信息 ◦ 对称性特征：区分同类与不同类 ◦ 不对称性特征：甲对乙有某种关系时，乙对甲并不一定具有同样的
语义差异量表
语义差异量表（semantic differential），也叫语义分化量表，主要用来研究概念对于不同的人所具有的不同含义。
在社会学、社会心理学和心理学研究中，语义差异量表主要用于文化的比较研究、个人及群体间差异的比较研究，以及人们对周围环境或事物的态度、看法的研究等等。
语义差异量表
研究者通过对这些记号所代表的分数的统计和计算，来研究人们对某一概念或事物的看法或态度，或者进行个人或团体间的比较分析。
女同学
1
2
3
4
5
6
7
热情的
冷漠的
主动的
被动的
大方的
拘谨的
强的
弱的
快的
慢的
善的
恶的
概念的操作化
概念、变量和指标
概念（concept）：
◦ 概念是对现象的抽象，是事物属性在人们主观上的反映。概念抽象程度有高低之分，描述特征的明确程度也有差别。
指标选择的多样性
有些概念往往很难甚至不可能在具体现象中找到其所对应的指标。
一个操作性定义往往也不能够完全代表一个概念。
对抽象概念进行操作化时，往往在具体方法和测量指标方面，存在多种不同的选择。
关于“夫妻权力”的案例

第四章测验信度作业

第四章测量信度一、单选题1.速度测验的信度应以( c )取得。

dA．奇偶法 B.筛选法 C.反应时法 D.重测法2.在其他条件均等的情况下，测验长度和信度之间的关系是( d )。

bA.测验越长，信度越低B.测验越长，信度越高C.没有关系D.上述说法都不正确3.计算一项测验的分半信度最常用的方法是比较( b )。

A.测验的前半部分与后半部分的得分。

B.奇数项目与偶数项目的得分。

C.将测验随机分为两部分,比较这两部分的得分。

.D.上述方法都可以。

4.一个40道题目的测验其奇偶分半后的信度为0.50,那么该测验的信度接近多少?( b )A. 0.50B. 0.67C. 0.80D. 1.05.当测验的信度减少(接近0)时,测量的标准误将会怎样变化(c )?A.减小,趋向于零。

B.只要趋向于1.0,它就会要么增大,要么减小。

C.增大,趋向于测验的标准差。

D.增大,逼近无限大。

6.再测信度所考虑的误差来源是(d )所带来的随机影响。

A.形式的不同B.题目的不同C.考生的不同D.时间的不同7.在考查评分者信度时,如果三人以上评阅数份试卷,则需计算( a )。

A.肯德尔和谐系数B.等级相关系数C.皮尔逊积差相关系数D.克伦巴赫α系数8.(a )是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得结果的一致程度。

A.信度B.效度C.难度D.区分度9.信度只受(d )的影响。

bA ．系统误差 B.随机误差 C.恒定效应 D.概化理论10.复本信度又称等值性系数。

它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系效。

复本信度反映的是测验在( c )上的等值性。

dA.时间B.题目C.评分D.内容11.分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系效。

这个相关系数就代表了( d )内容取样的一致程度。

第4章测量的信度与效度

2 2 X T2 E
实得分数的方差等于真分数的方差与误差方差之和。
调研人员应运用所掌握的统计知识，分析其是属于系统误差还是属于随机误差。系统误差会使调查结果有误，所以应尽量避免。随机误差可通过提高样本代表性、增大样本量来减少。
信度一般规定是：真分数的方差在总体方差中所占的比重，即信度系数：
当题目间的相关系数越大时，α系数也会越大。当题目数目n越多时，S
2 H
n 值越大，越接近于0， 2 SH n 1
2 S i
越接近于1，故α系数也会越接近于1。
要做信度分析须先检查每个题目是否都是同方向的，即都是正面问法，反向问题需要做处理后才可以加入分析。
在计算α系数时，应该注意有些调查量表测量的内容包含几个领域，这时宜分别计算各个领域的α系数。克朗巴哈α系数适用于项目多重计分的测验数据或问卷数据，可以用该系数测量Likert量表的信度。在基础研究中，信度至少应达到0.8才可接受；在探索性研究中，信度只要达到0.7就可以接受；在旅游调查测量实践中，信度只要达到0.6即可接受。 α系数通常与量表题目数量有关，题目数量越多，α系数就越大。
理想（甚佳，信度佳（信度高）很高）非常理想（信度非非常理想（甚佳，常好）信度很高）
二、克朗巴哈 α系数的手工计算
以一份有8个题项的量表为例，8个题项均为正向题，受试样本数有6位，采用Likert 5点量表填答，获得调查结果如下表：
题号样本
量表试题
01 5 5 5 5 5 4 02 1 1 2 1 1 1 03 2 2 2 2 2 1 04 5 4 5 5 5 5 05 2 3 3 3 3 3 06 5 5 5 5 5 4 07 4 5 5 5 5 4 08 3 2 2 3 2 2 总分 27 27 29 29 28 24

(2021年整理)心理测量学重点

心理测量学重点编辑整理：尊敬的读者朋友们：这里是精品文档编辑中心，本文档内容是由我和我的同事精心编辑整理后发布的，发布之前我们对文中内容进行仔细校对，但是难免会有疏漏的地方，但是任然希望（心理测量学重点）的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈，这将是我们进步的源泉，前进的动力。

本文可编辑可修改，如果觉得对您有帮助请收藏以便随时查阅，最后祝您生活愉快业绩进步，以下为心理测量学重点的全部内容。

心理测量学第一章概论一、测量:根据一定的法则使用量尺对事物的属性进行定量描述的过程.二、测量的精确度决定于测量对象本身的性质（确定型、随机型、模糊型）和测量工具的精密性。

三、测量的基本要素 :1。

参照点(1）绝对参照点(有绝对的零点,可进行乘除运算）（2）相对参照点（以人确定的零点，只可加减）2。

单位：条件：要有确切的意义和相等的价值四、测量的量表 : 称名量表、顺序量表、等距量表（可进行加减运算)、比率量表（可进行加减乘除）五、心理与教育测量的定义：根据心理学和教育学法则给人的心理特质和教育成就指派数字，或者根据一定的心理学和教育学理论在测验上对人的心理特质和教育成就进行定量描述的过程。

六、编制一个测验应当具备下列四个基本条件:（1)行为样本.（2）标准化:指测验的编制、实施、记分以及测量分数解释的程序的一致性。

标准化条件:测验内容、施测条件、评分规则和测验常模的标准化。

（3）难度或应答率。

（4）信度和效度。

七、1918年，桑代克提出“凡客观存在的事物都有其数量”。

1939年，麦柯尔进一步提出“凡有其数量的事物都可以测量"作业补充题:1、为什么说心理与教育测验的分数本质上是顺序量表上的分数？答：从本质上讲，心理与教育测量的量表属于顺序量表。

（1)从使用的参照点来说，教育测量和心理测量领域的参照点均为相对零点；（2)从使用的单位来说，教育与心理测量的单位远没有其他测量的单位成熟完善.第二章简史一、现代心理与教育测量的起源：(1）1879年德国心理学家冯特在莱比锡大学建立了世界上第一个心理实验室.（2）高尔顿把统计方法应用到对个别差异资料的分析之中.学生皮尔逊创立了积差相关公式。

第四章测量

社会调查方法
21世纪思想政治教育专业系列教材
第四节量表
三、语义差异量表
语义差异量表(semantic differential)也称为语义分化量表，主要用来研究概念对于不同的人所具有的不同含义。语义差异量表的形式由处于两端的两组意义相反的形容词构成，每一对反义形容词间又分为7~11个等级区间，我们对观念、事物或人的感觉可以通过我们所选择的两个相反形容词之间的区间反映出来。记分方法有两种（以7个等级为例），一种是将每一等级的分数从左至右分别记为7、6、5、4、3、2、 1，另一种则是记为+3、+2、+1、0、-1、-2、-3。
社会调查方法
21世纪思想政治教育专业系列教材
第四节量表
一、总加量表
总加量表（summated rating scales）也称为总和量表或总全评量，它由一组反映人们对事物态度或行为的陈述项目构成，回答者分别对这些陈述发表意见，根据他们的答案（同意或不同意、是或不是）分别计分，然后将回答者在全部项目上的得分加起来，以此表示回答者对这一现象的态度或行为得分。这个分数是其态度、行为的数量化结果，它的高低代表了个人在态度、行为量表上的位置。
社会调查方法
21世纪思想政治教育专业系列教材
第一节测量的概念和特征
测量的四个要素用来表示测量结果的工具客观世界中存在的事物或现象，是我们要用数字或符号来进行表达、解释和说明的对象
测量客体
数字或符号 Company LOGO
测量内容
用数字或符号表达事物各种属性或特征的统一标准.
测量法则
社会调查方法
21世纪思想政治教育专业系列教材
第五节信度和效度
信度：简单地说，信度就是指测量数据和结论的可靠性程度，也就是说测量工具能稳定地测量到它要测量的事项的程度。

戴海崎《心理与教育测量》(第3版)课后习题(第4章测量信度——第6章测验的项目分析)【圣才出品】

第4章测量信度1．各种信度系数所对应的误差来源是什么？答：信度主要包括重测信度、复本信度、分半信度、同质性信度、评分者信度，各种信度系数所对应的误差来源分别简述如下：（1）重测信度系数对应的误差来源重测信度是指用同一个量表对同一组被试施测两次所得结果的一致性程度，其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。

除去主试，施测环境和被试等方面的误差，它的独特误差来源主要有：①施测过程中所产生的遗忘和练习效应；②在两次施测的间隔时间内，被试在所要测查的心理特质方面获得了学习机会。

（2）复本信度系数对应的误差来源复本信度是指两个平行的测验测量同一批被试所得结果的一致性程度，其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。

它的误差来源有：①不能获得严格意义上的平衡测验；②施测过程中产生的顺序效应和迁移效应；③在两次施测的间隔时间内，被试在所测量的心理特质上获得了学习机会。

（3）分半信度系数对应的误差来源分半信度是指将一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。

它的误差来源是：不同的分半方法的分半信度不同，可能是由于将测验分为相平行的两半的方法不同而产生误差。

（4）同质性信度系数对应的误差来源同质性信度也称内部一致性系数，它是指测验内部所有题目之间的一致性程度。

克龙巴赫α值还是所有可能的分半信度的平均值，它只是测量信度的下界的一个估计值。

即，α值大，必有测量信度高；但α值小时，却不能断定测量信度不高。

它的误差来源产生于题目是否同质，这包括两个方面：①所有题目都测的是同一种心理特质；②所有题目得分之间都具有较高的正相关。

（5）评分者信度系数对应的误差来源评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。

在心理与教育测量工作中，客观题的评分很少出现误差，但主观题的评分常常会造成误差。

它的误差来源主要是多个评分者之间的个体差异，对相同答案的不同评定，这种个体差异不可能完全消除，只能最大程度低依赖正规的测查程序和统计方法来减小它。

4第四章社会测量及指标

4．定比尺度
定比尺度也称比例尺度、等比尺度。定比尺度除具有上述三种尺度的全部性质之外，还具有一个共同的基准— —有实际意义的零点(绝对零点)。所以它所测得的数据，既能作加减运算，又能作乘除运算。例如身高、年龄、出生率、工资等都是定比尺度。如张三的工资是180元，李四的工资是90元，便可说张三
下面是一个包括4项用来测量堕胎态度陈述的哥特曼量表。 (1)任何孕妇均可要求堕胎：同意反对 (2)孕妇在其身心健康受影响的情况下可以堕胎：同意反对 (3)孕妇在生命有危险时方可堕胎：同意反对 (4)孕妇在胎儿有残废和死亡倾向时可以堕胎：同意反对依据对堕胎的保守程度，这4项陈述是依次排列的，对此做出的回答有下列5种模式。思想开放的回答者(类别A)同意全部回答项目，最保守的回答者(类别E)反对全部项目。
字、符号分别来代表人、事物、事件属性的过程和方法。
社会测量与自然科学测量相比，社会测量
有两个特点：
(1)对社会现象的测量其标准化和精确化程度均
较低
(2)这种测量不完全是数量化的，它也可以是类别化的。
（二）社会测量的尺度
作为社会研究与社会统计中可以取二个或以上值的变
量，它有质的差异和量的不同，有间断和连续的区别；同
X1＝5十1十4十3=13(分) 这里X1代表某人在变量A上的得分。倘若我们发了500份问卷，其中300份是工人填的，200 份是农民填的。统计结果，300个工人的平均得分为12分,200个农民的平均得分为14分。我们就可以从总体上进行比较，农民平均得分高于工人，说明农民在重男轻女问题上受封建思想影响比工人深。
2、定序尺度
定序尺度也称等级尺度、顺序尺度。定序尺度的取值可以按照某种逻辑顺序将调查对象排列出高低或大小，确定其等级及次序。所得变量可用数学符号 “>”或“<”来表示。例如：文化程度： (1)不识字或识字很少， (2)小学， (3)初中， (4)高中， (5)大专， (6)大学， (7)大学以上

心理测量第4章心理与教育测量的信度

库德-理查逊公式
K-R20公式
K-R21公式
克伦巴赫系数
库德-理查逊公式只适用于答对一题得一分，答错无分的测验，不适用于项目多重记分的测验，针对这一需要，克伦巴赫提出了系数的方法。其公式为：
K为测验题目数，为某一题目分数的变异数，为测验总分的变异数
采用SPSS计算信度
数据库
两次施测期间被试的学习效果没有差别
计算再测信度应满足以下几个假设；
两次测验的时间间隔要适当
应注意提高被试的积极性
再测法适用于速度测验和人格测验，而不适用于难度测验
采取此法时应注意以下几个问题：
用再测法估计信度的优点是能提供测验结果是否随时间而变化的资料，可作为预测被试将来行为的依据。其缺点是易受练习和记忆的影响。
S为相同尺度的标准分数的标准差，rxx、ryy分别为两个测验的信度系数。然后再将标准分数的差异与1.96SE（0.05水平）进行比较，即可得出两个测验的差异是否显著。
例：韦克斯勒对104名14岁半至15岁半的儿童，间隔一个月时间前后测了两次，求得全量表的稳定性系数为0.95，实测分数的标准差为15，则测量的标准误为：
同质性信度计算方式
结果
输入40题
评分者信度
标准化测验一般都有较为严格的评分程序。对于客观性试题来讲，评分所引起的误差是可以忽略不计的，但是对于一些主观题来讲，评分者之间的变异是产生误差的重要原因之一。
考察评分者信度的方法是随机抽取部分试卷，由两个或多个评分者独立按评分标准打分，然后求其间的相关。在计算相关时，如果是两个评分者，则采用积差相关或等级相关的方法，一般认为经过训练的成对评分者之间的一致性达0.90以上，评分才是客观的。如果是多个评分者则采用和谐系数来估计信度。其公式为：

第四章测量的信度与效度ppt课件

力等难度测验
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
➢ （二）复本信度（Alternate-form reliability） ➢ 1.含义与计算 ➢ 是指两个平行测验测量同一批被试所得结果的一
致程度，其大小等于同一组被试在两个复本测验上所得分数的积差相关系数。计算公式同重测信度。
2. 信度的测量学定义（操作性定义）
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
3. 误差方差与信度的关系
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
➢ 二、信度的估计方法 ➢ （一）重测信度（test-retest reliability） ➢ 1.含义与计算 ➢ 重测信度是指用同一量表对同一组被试测试两次
所得结果的一致程度，其大小等于同一组被试在两次测验上所得分数的积差相关系数。即：
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
➢ 当评分者人数为2时，评分者信度等于两个评分者给同一批被试答卷所给分数的相关系数。如果是多个评分者，评分者信度采用肯德尔和谐系数进行估计。
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。

第四章测量的信度

3.重测信度实质: 主要考察了一个测量工具是否能够保证在不同时间测量结果的一致性，表示测验结果的稳定性。故称之为稳定性系数（ Coefficient of Stability）
一般来说, 重测的时间间隔越短, 那么各种施测情境的变化就越小, 重测信度系数就会越大。
重测信度系数较大时, 说明该测量工具前、后两次的测量结果比较一致。结果具有较好的跨时间上的稳定性。
定义2: 信度是被试团体真分数与实得分数相关系数的平方
定义3: 信度是一个测验X（A卷）与它的任意一个平行测验（B卷）的相关系数
由于真分数的方差无法统计，可转化为: rxx=（S2x-S2E)/S2x =1- S2E/S2x 该定义有两点需要注意: 第一、信度指的是一组测验分数或一列测量的特性，
X―1.96SE＜T≤X+1.96SE
• 例：在一个智力测验中，某个被试的IQ为100，这是否反映了他的真实水平？如果再测一次，他的分数将改变多少？
• 已知该智力测验的标准差为15，信度系数为.84，则其IQ
的测量标准误和可能范围为：勇于开始，才能找到成
•
功的路
注意几点: （1）SE对真分数做的是区间估计，不可能由此得到一
课后作业
1.某智力测验的信度r=0.75，某次施测得到标准差为 3.00，则该测验的测量标准误是多少，若某被试得分为100，试估计其真分数1- =.95的置信区间
2. 某测验的信度为0.75。要使该测验的信度达到 0.90，须增加多少题目（原测验长度的多少倍）？
3.一个包含10个题目的测验，信度为0.50，若增至 50个题目，其信度将是多少？
•
真分数的估计区间为:
X－1.个人测验的真分数的大小。

第四章效度

（3）创设标准的应试情境，让每个被试都能发挥正常的水平
（4）选好正确的效标，定好恰当的效标测量，正确地使用有关公式
第四节效度资料的概化
所谓概化，是指在一定条件下得出的结论能否适用于其他情况。测验的效度和信度一样，都与特定情境有关，只有在具体情境下的效度，而没有笼统谈论某一测验的效度。一、效度概化的几个方面 1 预测源的概化 •使用同一测验的不同复本是否同样有效？ •同一测验对不同分数水平的人的预测是否同样有效？
（3）考察测验的实证效度法 l 根据效标把被试分组，考察其得分差异。
l 根据测验得分差异把被试分组，考察其所测特质（行为表现）的差异。
（4）多种特质-多种方法矩阵法
方法：1、2、3 特质：A、B、C
A1
B1
C1
A2
B2
C2
A3
B3
C3
A1
B1 C1 A2
0.90
0.50 0.89 0.35 0.41 0.81 0.58 0.25 0.10 0.95
2．结构效度的确定方法结构效度确立的一般步骤：（1）提出理论框架；（2）依据理论框架推演出有关测验成绩的假设；（3）用逻辑或实证的方法来证明假设。
具体方法：（1）测验内部寻找证据法 l分析测验的内容效度：若内容效度高，说明其结构效度也高；
l分析被试对题目反应的特点：
有无社会称许性的题目，如“当事情不顺我意时，我时常动怒。”对该题的回答，也许反映不了要测的性格。
第四章测量效度
第一节效度概述
一、什么是效度
效度（ validity ）是指一个测验或量表实际能测出其所要测的心理特质的程度。
（1）效度是一个相对的概念：每个测量工具都有自己的目的；内隐特质是通过外显行为间接测得的。

测量的信度

2 KS X X (K X ) 2 ( K 1) S X
GO
BACK1
31
BACK2
32
心理测量
心理测量
3.内在一致性信度的适用范围
1 ）内在一致性信度适用于同质性测验，而不适用于异质性测验。 2）不适用于速度测验。
被试 M N O P Q
表2 100题纯速度测验的结果
做题总数 50 84 54 36 28 奇数题正确数 25 42 27 18 14 偶数题正确数 25 42 27 18 14
8
心理测量
心理测量重测信度的计算举例
施测时间间隔相关系数再施测
10名学生幸福感调查的两次施测分数
A X1 16 15 B 15 16 C 13 14 D 13 12 E 11 10 F 10 9 G 10 11 H 9 8 I 8 6 J 7 7
图1 重测信度图式
X2
9
10
心理测量
心理测量
2.使用前提条件
信度只是一个理论构念，由于真分数无法直接获得，只能估计。估计信度的方法取决于你认为误差是什么。重测信度复本信度同质性信度评分者信度误差来源时间内容内容评价者/观察者
7
（一）重测（test-retest）信度
1.定义及计算：
用同一个测验对同一组被试在不同时间施测两次所得结果的一致性程度，其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。又称稳定性信度、再测信度、施测—再施测信度、跨时间一致性。
适当增加测验的长度使所有题目的难度接近正态分布控制在中等水平努力提高测题的区分度选取恰当的被试团体主试严格执行施测规程59心理测量四信度的作用评价测验解释分数用于计算测验分数的误差比较不同测验分数差异分数的信度相关的校正60心理测量几种心理测验的信度系数aiken1985测验类型信度成套成就测验066092098能力测验056090097成套倾向性测验026088096客观人格测验046085097兴趣测验042084093态度量表04707909820141111161心理测量信度的可接受水平不同功能测验信度接受水平不同能力测验和成就测验090以上095人格测验080085或更高自编学绩测验060以上个人评价与团队比较信度水平不同低于070070085之间高于085新编的测验信度应高于原有同类测验62心理测量测量的标准误standarderrormeasurement信度系数表明一个测验有多可信测量的标准误告诉我们一个人的分数究竟有多可信信度的另一种表达方式如果一个人在一个测验上做了无数次他的得分会形成一个分布他所得分数分布的平均值应是他的真分数观测分数分布的标准差应是测量的标准误差63心理测量测量的标准误与真分数估计围绕平均值真分数的分数的标准差称为平均值的标准误差或简称标准误sems1rtt12sem标准误tt测验的信度如果一个测验的平均值50tt

第四章测量信度

五、评分者信度
评分者信度（Scorer
Reliability）指的是
多个评分者给同一批被试作答情况进行评分
的一致性程度。它主要用于主观性作品的评
价过程中，如论述题评分、作文题评分、歌
唱比赛的评分、设计作品的评分等。
评分者信度的计算方法
1、当评分者人数为2时，评分者信度等于两者评分的相关系数（积差相关或等级相关）。 2、当评分者人数大于2时，评分者信度采用肯德尔和谐系数计算。 W = 12 [∑R2i –(∑Ri)2 / N] / [ K2 ( N3–N )] 其中K是评分者人数，N是被评的对象数，Ri 是第i个被评对象的被评等级之和。
采用复本信度的条件

要构造出2份或2份以上真正平行的测验。被试有条件接受两次以上的测验。
复本信度的优缺点
优点：
1、减少了记忆效应和练习效应。 2、适用于追踪研究的多次测量。 3、减少了辅导的可能性。
缺点：
1、编制复本测验的难度较大。 2、被试要有接受两次以上测验的条件和意愿。
三、分半信度
第一节信度的定义
一、什么是信度

信度指测量结果的稳定性、一致性程度。一个好的测量工具必须具备好的信度，也就是说它多次测量的结果应该相对的稳定、一致。

信度反映的是测量中随机误差的大小，随机误差小，则信度高；反之，则信度低。
测验题目本身并不能提供信度的估计值，信度统计来自于测验分数。也就是说，在检验信度之前必须要实施心理测验，以获得测验分数。
遗忘和练习的效果基本相互抵消；（3）在两次施测的间隔期内，被试所要测查的心理特质没有获得更多的学习和训练；（4）被试有条件接受两次相同的测验，取决于时间、经费等因素。

第四章心理与教育测量的信度

仅适用于(0,1)记分测验。
同质性信度 pq rXX = 1- 2 K -1 SX
p 和 q 分别为题目的平均通过率和平均失败率。
仅适用于(0,1)记分，且所有题目的难度接近的测验。
同质性信度的计算及使用条件
D. 克龙巴赫α系数：适用于任何计分方式的测验。
概化理论的发展测验情景关系说测验设计任务
5
6
G研究 D研究
D研究的指标
7 8
对概化理论的评价
一、测验分数方差的测量学意义
1、测验分数方差有目标测量分数方差和误差分数方差。
2、误差来源的多样性与总分方差结构的复杂性。
3、经典测量理论处理分数方差的办法：假定X=T+E，有σ
X 2=σ T 2+σ E 2，
重测信度的使用条件
1、所测量的心理特质必须是稳定的
2、遗忘和练习的效果基本上相互抵消
3、两次测验间隔，被试要测的特质没有学习和训练
重测信度练习
例3：10名学生接受了某测验，分数记为X，为考察该测
验的信度，一星期后，对这10个学生重新测了一次，分数
记为Y，根据两次测验结果，求该测验信度。
学生号 01 Xi 31 Yi 30
rXX = K rij
1+ K -1 rij
r ij 为项目间相关系数的平均数。 Κ为测验项目数，
同质性信度的计算及使用条件
B. 库德-理查逊公式(K-R20)：
n pi q i K 1- i 1 2 rXX = K -1 SX
Κ为测验题目数，pi为通过第i题的人数比例，qi为未通过第i题的人数比例，SX2为测验总分的变异数。
平行测验A

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

只一个信度系数。
2.信度系数只是对测量分数不一致程度的估计，并没有指出不一致的原因。 3.获得较高的信度系数并不是心理测量追求的最终目的，它只是迈向目标的一步，是使测量有效的一个必要条件。
10
Measurement Reliability
信度系数要达到多高才可以接受呢？
最理想的是rxx ＝1.00,但办不到研究结果显示，能力，成就测验都在0.90以上，有的还可以达到0.95以上;人格测验、兴趣、态度、价值观等都在0.80～0.85。一般原则： ⑴当rxx﹤0.70时，测验不能用于对个人作出评价或预测，而且不能做团体比较； ⑵当0.70≤rxx <0.85时，可用于团体比较； ⑶当rxx≥0.85时，才能用来鉴别或预测个人成就或作为。另一原则：新编的测验信度应该高于原有的同类测验或相似测量
得分数的标准差；rxx表示信度系数。
14
Measurement Reliability
三、信度的作用（信度与测验分数的解释）
1.信度是测量过程中所存在的随机误差大小的反映
（解释真实分数与实得分数的相关）
信度系数可以解释为：总的方差中有多少比例是由真实分数的方差决定的，也就是测验的总变异中真分数造成的变异占百分之几。例如，r=0.9时，实得分数90％的变异来自真分数，10％来自误差。r=1呢？r=0呢？
rxx代表测量的信度，S2T代表真分数的变异数， S2x代表是实得分数的变异数，即总变异数。
定义2：信度是被试团体真分数与实得分数相关系数的平方
rXX
2 TX
定义3：信度是一个测验X（A卷）与它的任意一个平行测验（B卷）的相关系数
rXX XX
4
Measurement Reliability
8
Measurement Reliability
经典测量理论的信度系数
重测信度——稳定性系数复本信度——等值性系数、等值性与稳定性系
数
内部一致性系数——分半信度、同质性信度
评分者信度——肯德尔和谐系数
9
Measurement Reliability
对信度系数要注意的几点：
1.在不同情况下，对不同样本，采用不同方法会得到不同的信度系数，因此一个测验可能不
13
Measurement Reliability
此时，个人在两次测验中的分数差异就是测量误差。据此可制成误差分数的分布。这个分布的标准差（误差分布的标准差）我们称之为测量的标准误，是表示测量误差的大小的指标，其计算公式为：

SE S x
1 rxx
SE表示测量的标准误，即误差分布的标准差；Sx表示实
2
Measurement Reliability
第一节
信度概述
一、什么是信度 1.信度的理论定义
信度即测量结果的稳定性、一致性或可靠性。是
用同一测量工具反复测量某人的同一种心理特质，
所得结果的一致性程度。
3
Measurement Reliability
2.信度的统计定义
定义1：信度是被试团体真分数方差与实得分数方差之比
11
Байду номын сангаас
Measurement Reliability
测验类型学业成就测验学术能力测验特殊能力倾向测验人格测验
信度系数
低
0.66 0.56 0.26 0.46
中
0.92 0.90 0.88 0.85
高
0.98 0.97 0.96 0.97
兴趣测验
态度测验
0.42
0.47
0.84
0.79
0.93
由于真分数的方差无法统计，可转化为： rxx=（S2x-S2E)/S2x =1- S2E/S2x 该定义有两点需要注意：第一、信度指的是一组测验分数或一列测量的特性，而不是个人分数的特性；第二、真分数的变异数是不能直接测量的，因此信度是一个理论上构想的概念，只能根据一组实得分数做出
估计。
程度，但并没有直接指出个人测验分数的变异量。由于误差存在，一个人所得分数有时比真分数高，有时比真分数低，有时二者相等。理论上我们可以对一个人施测无数次测验，然后求得分数的平均数和标准差。这个平均数就是这个人的真分数，而标准差就是测量误差大小的指标。但在实际上是行不通的。然后，我们可以用一组被试两次测量结果来代替对同一人的反复施测，以估计测量误差的变异数。
rxx =r2XT=s2T/s2x rXT信度指数，它的平方就是信度系数
7
Measurement Reliability
信度系数是表示测量结果的稳定性程度的指标。记为：
rXX
信度系数的值域：？[0,1] 相关系数的值域是[-1,+1] ，信度系数的值域：[0,1]，为什么？没有百分之百可靠的测量，因此，rXX=1只是理论上的值，实际当中是不会存在的。
5
Measurement Reliability
信度只受随机误差的影响。随机误差越大，信度越低。
信度不受系统误差的影响。
6
Measurement Reliability
二、信度指标
1.信度系数与信度指数大部分情况下，信度是以信度系数为指标，信度系数
又以相关系数表示，即用同一被试样本所得的两组资料的相关系数作为测量一致性的指标，称作信度系数（ rxx）信度系数是表示测量结果的稳定性程度的指标。
0.98
注：表中数据来源，Lewis R. Aiken: Psychological testing and assessment (eighth edition), Allyn and Bacon, Inc, 1994.
12
Measurement Reliability
2.标准误
信度系数仅表示一组测量的实得分数与真分数的符合
Measurement Reliability
第四章
测验的信度
1
Measurement Reliability
导学
信度是评价测验优劣的重要指标，了解信度的相关知识是编制优质高效测验的前提。通过本章的学习我们可解
决三个问题：
一、明确信度的理论定义及操作定义；（难点）二、掌握几种常模参照测验的信度估计方法；（重点）三、了解影响信度的因素，在信度估计时尽量避免由此造成的误差；提高信度的方法。

第四章测量的信度

第四章心理测量的信度

(整理)心理与教育测量重点全部

测量的概念层次与信度

第四章 测验信度作业

第4章 测量的信度与效度

(2021年整理)心理测量学重点

第四章 测量

戴海崎《心理与教育测量》(第3版)课后习题(第4章 测量信度——第6章 测验的项目分析)【圣才出品】

4第四章社会测量及指标

心理测量第4章心理与教育测量的信度

第四章测量的信度与效度ppt课件

第四章测量的信度

第四章 效度

测量的信度

第四章 测量信度

第四章 心理与教育测量的信度

第四章测验信度作业

第4章测量的信度与效度

第四章测量

戴海崎《心理与教育测量》(第3版)课后习题(第4章测量信度——第6章测验的项目分析)【圣才出品】

第四章效度

第四章测量信度

第四章心理与教育测量的信度