第四章 测验信度作业
测验的信度练习试卷1(题后含答案及解析)

测验的信度练习试卷1(题后含答案及解析)题型有:1.jpg />其中rxx代表测验的信度,代表测验中实得分数的变异,代表对测验中真分数的变异。
因此,测验中真分数造成的变异应该为测验信度(rxx),即80%。
知识模块:测验的信度5.对信度的评估方法()。
A.有统一通用的原则B.没有一个统一通用的原则C.可用一种信度系数就能说明信度的不同方面D.要用多种信度系数来说明信度的总的方面正确答案:B解析:对信度的评估方法是没有通用法则的,因为不同的信度反映测验误差的不同来源,故每一种信度系数只能说明信度的不同方面,因而具有不同的意义。
知识模块:测验的信度6.在计算重测信度时,两次施测的间隔时间不宜太短,是为了避免()。
A.被试学习经验的积累B.被试身心状况的发展变化C.被试出现遗忘D.练习效应正确答案:D解析:重测信度估计两次测试的时间间隔要恰当,间隔时间太长,被试品质发生了变化,会造成低估测验信度,间隔时间太短,练习和记忆会造成高估测验信度。
知识模块:测验的信度7.对重测信度的理解正确的是()。
A.使用同一测验,在不同条件下,对同一组被试前后两次实施之间的相关系数B.使用同一测验,在同样条件下,对同一组被试前后两次实施之间的相关系数C.使用同一测验,在同样条件下,对不同被试前后两次实施之间的相关系数D.使用不同的测验,在不同条件下,对同一组被试前后两次实施之间的相关系数正确答案:B解析:重测信度考察的是时间因素对信度的影响,因此只有两次施测仅有时间因素不同,才可以将测验成绩的变化归因为时间因素。
因此,重测信度是在除了时间不同以外,其他条件都相同的条件下,被试两次测验的相关系数。
知识模块:测验的信度8.同质性信度()。
A.是检验测验内部所有题目的一致性B.是用同一测验重复测量的一致性程度C.是检验两个测验在内容上的等质性D.主要指测验题目的内容和形式,而不论其正、负相关性正确答案:A解析:同质性主要代表测验内部所有题目间的一致性。
信度和效度练习题答案

信度和效度练习题答案1.关于测验的信度与效度的关系,说法正确的是()。
A.测验有信度,一定有效度B.测验有信度,一定没有效度C.信度与效度是正相关的D.效度高,信度一定高1.【答案】D。
解析:本题考查测验的信度与效度的关系。
其中效度是指一个测验或测量工具能真实的测量出所要测量的事物的程度。
信度主要测量结果的前后一致性程度。
具体表现为:效度高,信度一定高;效度低,信度不一定;信度低,效度一定低;信度高,效度不一定高。
A选项,信度高,效度不一定高。
因此,此说法错误。
B选项,信度高,效度不一定高。
因此,此说法错误。
C选项,信度与效度的关系具体表现为:效度高,信度一定高;效度低,信度不一定;信度低,效度一定低;信度高,效度不一定高。
因此,选项说法不正确。
D选项,效度高,信度一定高。
故说法正确。
综合上所述,本题正确答案是D。
2.柴也愚,参也鲁,师也辟,由也喭。
该古语体现的教学原则是()。
A.因材施教B.循序渐进C.启发性原则D.巩固性原则2.【答案】A。
解析:本题考查教学原则。
A选项,因材施教原则,是指教师要从学生的实际情况、个别差异出发,有的放矢地进行教学,使每个学生都能扬长避短,获得最佳发展。
B选项,循序渐进原则,要求教师严格按照科学知识的内在逻辑体系和学生认识能力发展的顺序来进行教学。
C选项,启发性原则要求教师充分调动学生学习的主动性、积极性,引导学生独立思考,积极探索,生动活泼地学习。
不符合题意,排除。
D选项,巩固性原则,是指教师要引导学生在理解的基础上牢固地掌握知识和基本技能,并使其长久地保存在记忆中,能根据需要迅速再现出来,以利于对知识、技能的运用。
不符合题意,排除。
题干中,高柴愚笨,曾参迟钝,颛孙师偏激,仲由鲁莽。
他们也是日常生活中有缺点的平凡人,但他们经过针对性的教育后,却都各有一番长进。
由此可知,体现的是因材施教。
本题正确答案是A。
3.【判断】班级授课制是近代教学主要的教学组织形式,因此,班级授课制没有任何缺点。
第四章信度

第四章信度一、什么是信度含义:指的是测量结果的稳定性程度(或叫可靠性)。
也指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
1、理论定义:测验实测值和真值的相差程度。
2、操作定义:定义1:一组测量分数的真分数变异数(方差)与总变异数(总方差、实得分数的方差)的比率,或者是真实分数方差占总方差的的百分比。
计算公式:rxx=ST2/SX2定义2:信度乃是一个被试团体的真分数与实得分数的相关系数的平方。
即rxx=ρTx2定义3:信度乃是一个测验X(A卷)与它的任意一个“平行测验”X’(B卷)的相关系数。
即rxx=ρxx’二、信度的类型及估计方法(一)重测信度1、含义与计算又称稳定性系数。
他的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。
三、信度的类型及估计方法(一)重测信度(再测信度)例:15名同学在1个月间隔内,先后2次重复施测某测验,测验结果如表中所列,请根据这些数据对该测验的重测信度进行计算。
三、信度的类型及估计方法(一)重测信度三、信度的类型及估计方法(一)重测信度可见,这两次测验分数之间有较高的正相关,该测验有较高的重测信度。
2、使用的前提条件(1)所测量的心理特性必须是稳定的。
(2)遗忘和练习的效果基本上相互抵消。
(3)在时间间隔中没有学习另外的与测验有关的东西,或者说每人学习其他东西的程度都一样。
3、优缺点:优点:(1)它最符合重复测验的涵义,是重复测验最简单最明确的方式。
(2)首测和再测只需要一套测验题目,省时、省力。
(3)同一套题目无论施测几次,所测的属性是完全相同的。
缺点:(1)同一组被试对同一个测验先后两次作答相互之间是不独立的。
(2)如果两次施测时间间隔较长,在此期间被试的身心发展,新知识的获得,都会使两次测验结果不相同。
(3)同一个被试对现一个测验先后两次作答,对测验的兴趣不同,影响测验结果。
第四章 测验的信度与效度

复本信度的计算举例
10名学生创造力的复本测验结果
ABCDE FGH I J X1 20 19 18 18 17 16 14 12 12 10 X2 20 20 19 16 16 17 12 11 13 9
❖ 3、注意事项
要构造真正的平行测验 ❖ 复本测验必须在题目的内容、数量、形式、难度、 区分度、指导语、时限以及所用的例题、公式、测验 其它方面都相同或相似。
=0.95
• 如在评定中有相同的等级时,用下式校正。其中n为 相同等级的个数
R i2 R i 2/N
W 1 2K2N2NK n3n/12
25
四、信度对测验分数的意义 ❖ 1、解释真实分数与实得分数的相关
信度系数可以解释为测验的总变异中,真分数造成的变 异占百分之几。如,当rxx=0.90时,我们可以说实得分 数中有90%的变异是真分数造成的,仅10%来自测验的误 差。rxx=1.00,则表示完全没有测量误差,所有的变异 均来自真实分数;同样,信度系数也告诉测量的误差比 例是多少。
27
❖ 3、解释个人分数的意义(区间估计)
从信度可以解释个人分数的意义,这就是测量标准误的 应用。它有两个作用 其一是估计真实分数的范围;其 二是了解实得分数再测时可能的变化情形。
28
❖ 由于误差的存在,一个人通过测量得到的分数很难 等于真分数。理论上,我们可以对一个人施测无数 次,然后求得所得分数的平均数和标准差。在这个 假设的分布里,平均数就是这个人的真分数,标准 差则为误差大小的指标。
rxx= 2rhh 1 rhh
18
变异数不相等:
弗朗那根(Flanagan)公式:
rxx=2
1
sa2
sx2
sb2
心理与教育测量第四章

编辑ppt
16
+ 评价
– 优点:能提供有关测验是否随时间而变异的资 料,可作为被试将来行为表现的依据。
– 缺点:难以消除记忆和练习及学习的影响;难 以取得被试的全面合作。
编辑ppt
①“名片效应” ②“光环效应” ③“对比效应” ④“先后效应”
– 环境与组织管理的影响。
编辑ppt
35
+ 控制论文式试题评分误差的方法。
– 命题进尽量控制作答的发散范围,预先制定好 评分规则,并尽是客观、精细,但不吹毛求疵。
– 选择和培训阅卷人员,统一评分标准,规范阅 卷行为。
– 流水作业评分。 – 分因素评分。
+ 评价
– 优点:只需施测一次便能求取信度。 – 缺点:有些题目,很难分为对等的两半,比如
语文考试里的作文,就没办法分半;分半方法 很多,所估信度很可能有差异。
编辑ppt
25
四、同质性信度
+ 定义
– 测验内部所有题目间的一致性程度。 一致性包 含两重含义:
所有题目都是测同一种心理特质。 所有题目得分之间都有较高的正相关。 两者的关系:正相关高是同质性高的必要而非充分
信度也是多次测量同一对象的一致性程度。
编辑ppt
4
+ 信度的统计定义(统计等价定义)
– 信度是被试团体真分数方差与实得分数方差之 比,即:
rXX T2 /X2
– 信度是被试团体真分数与实得分数相关系数的
r 平方,即: XX
2 TX
– 信度是一个测验与它的任意一个平行测验的相 关系数,即:
第四章 测验信度

1 a系数 它是一种表示测验同质信度的指标,该公式 又称为克伦巴赫公式:
∑S2 k i a= 1− 2 k −1 SX
Si
SX
2
=第 i 道题的方差 =测验总分的方差
2
K=题目数量
2. 库德-里查森公式(KuderRichardson): 当题目分数均为0, 1 的 二分法记分时,作为α系数的一种特例, 可采用库德-里查森公式:
分半的方法
如果测验中包含一些大 题目,大题目之中又包 含若干个小题目,那么, 奇偶分半应按最小的题 目划分。
按题目的奇偶顺序分半 易受难易程度、练习、疲劳因 素的影响
速度测验不宜采用分半信度
分半信度的校正
矫正公式为斯匹尔曼——布朗公式: 式中crxx为经过校正的信度值 2rhh CrXX = rhh 为未经校正的信度值 1 + rhh 斯匹尔曼——布朗公式假设测验所分成的两半具有相 同的变异,弗朗那根公式可以不做这样的假设。
ssw321??????tknnkr12??123???nntn相同等级数目?例题见附件6求评分者信度?肯德尔和谐系数??w肯德尔和谐系数每位受测者所得等级的和数的平方和rss??r每位受测者所得等级数的和?k评分者人数?n受测者人数??nnksswr??32121??nrrssr22????第四节对信度的讨论?一信度与误差变异的关系?信度系数类型误差变异来源?再测信度时间取样?复本信度连续施测内容取样时间与内容取样内容取样评分者间的差异?复本信度间隔施测?分半信度?评分者信度?有时同一个测验需要检验几种信度系数这样我们就能把总分数的变异分成不同的分支
rnn = 1 −
so (1 − roo )
2
snቤተ መጻሕፍቲ ባይዱ
第四章 测量信度

主
要
测量工具
因
素
施测间隔的时间
现在您浏览到是十五页,共十七页。
二、提高测验信度的常用方法
适当增加测验的长度
提
控制试题的难度分布
高 测
努力提高每道题的区分度
验 信
维持测验的同质性
度 的
规范施测程度、统一施测环境
常 用
保证被试有充裕的作答时间
方 法
严格控制评分误差
努力提高测验在被试中各个 同质亚团体上的信度
现在您浏览到是九页,共十七页。
• 2、复本信度:
• ①定义:两个平行测验测量同一批被试所得结果 的一致性程度。
• ②计算方法:其大小等于同一批被试在两个复本 测验上所得分数的皮尔逊积差相关系数。
• ③使用的前提条件
现在您浏览到是十页,共十七页。
3、分半信度:
①定义:将一个测验分成对等两半后,所有被试在这两半 上所得分数的一致性程度。
③使用的前提条件 第一:所测量的心理特征必须是稳定的 第二:遗忘和练习的效果基本上相互抵消 第三:在两次施测的间隔时期内被试在所要 测查的心理特质方面没有获得更多的学习和 训练。
现在您浏览到是八页,共十七页。
内容总结
第四章 测量信度。信度是一个测验X(A卷)与它的任意一个平行。1、评价测验—衡量 测验好坏的重要指标之一。3、信度可以用来解释个人测验分数的意义——测量标准误。第 二节 信度的估计方法。②计算方法:分半,如奇偶分半,题目分半等。斯皮尔曼——布朗 公式校正。①定义:指测验内部所有题目间的一致性程度,也叫内部一致性系数。②计算方法 肯德尔和谐系数W系数。第三节 提高测验信度的方法。规范施测程度、统一施测环境。见 P57
现在您浏览到是十六页,共十七页。
心理测量 第4章 心理和教育测量的信度

采用SPSS计算信度
数 据 库
同 质 性 信 度 计 算 方 式
结果
输入40题
结果
评分者信度
标准化测验一般都有较为严格的评分程序。
对于客观性试题来讲,评分所引起的误差是可 以忽略不计的,但是对于一些主观题来讲,评 分者之间的变异是产生误差的重要原因之一。
一般原则是:当rxx<0.70时,测验不能
对于个人作出评价或预测,而且不能做团体比
较;当0.70≤rxx<0.85时,可用于团体比较;
当rxx≥0.85时,才能用来鉴别或预测个人成
绩或行为。 另一原则是,新编的测验信度应高于原有的 同类测验或相似测验。
表3-1 几种心理测验的信度系数
测验类型
低 成套成就测验 学术能力测验 成套倾向性测验 客观人格测验 兴趣测验 态度测验 0.66 0.56 0.46 0.46 0.42 0.47
115,那么他的智商的真分数的变动范围就是
115±1.96×3.35,也就是说,有95%的把握
认为,这个儿童真正的智商水平在108.4至
121.6之间。
某被试在韦氏成人智力测验中言语智商为 102,操作智商为110,已知两个分数都是 以100为平均数、15为标准差的分数,假 设言语测验和操作测验的分半信度分别为 0.87和0.88,问其操作智商是否显著高于 言语智商?
信度系数ቤተ መጻሕፍቲ ባይዱS为分数标准差, X 为分数的均值,C 为达标分数或分数线。
用决策的一致性作为信度指标
标准参照测验常用来把被试分为掌握(达标)和未掌 握(未达标)两组,这实际上是用测验来作决策,因此可 用作决策的一致性而不是分数的一致性来确定信度,也就 是看再测时被同样归类的受测者的比例,两次施测被同样 归类的受测者比例越高,说明信度越高。
心理测量 信度练习题

心理测量信度练习题心理测量是心理学中的重要领域之一,它通过各种测量工具和方法,对个体的心理特征进行测量和评估。
而心理测量的信度则是指测量工具在不同场景下的一致性和稳定性。
本文将提供一些心理测量信度的练习题,以帮助读者更好地理解信度的概念和计算方法。
练习题一:测试工具的内部信度计算某位心理学家设计了一份评估社交焦虑的问卷,该问卷一共包含10个题目,并通过5个等级的评分(1-5分)来衡量受试者的社交焦虑水平。
以下是8名受试者的答题情况:受试者1:4 3 2 4 5 1 3 2 2 1受试者2:2 2 3 3 3 2 2 5 4 4受试者3:3 5 4 3 4 3 2 4 2 1受试者4:5 4 5 5 4 3 5 4 4 5受试者5:3 3 2 3 3 4 2 3 2 3受试者6:5 4 5 4 5 4 5 4 5 4受试者7:2 1 1 1 3 2 2 1 3 2受试者8:4 4 3 3 3 4 4 3 4 3根据以上数据,请计算该问卷的内部信度,即采用Cronbach's alpha方法计算该问卷的信度。
练习题二:测试工具的重测信度计算研究人员使用了一份用于评估对学习英语的自信心的问卷进行实证研究,该问卷共有15个题目,通过7个等级的评分(1-7分)来测量受试者对自己学习英语的自信程度。
在某时间点T1,有60名受试者填写了该问卷,两周后的时间点T2,受试者再次填写了同一份问卷。
以下是10名受试者在两个时间点T1和T2的得分情况(T1代表时间点1的得分,T2代表时间点2的得分):受试者1:T1 - 4 3 6 5 7 5 6 4 5 7 6 5 7 5 6,T2 - 6 5 7 6 7 6 7 6 7 7 5 6 7 6 7受试者2:T1 - 5 4 7 5 6 5 7 4 5 7 4 5 6 5 7,T2 - 7 6 7 6 6 7 7 6 6 7 6 6 7 7 6受试者3:T1 - 6 5 4 6 7 6 5 7 6 5 4 6 5 7 5,T2 - 7 6 5 7 7 7 6 7 6 5 7 7 7 7 7受试者4:T1 - 4 5 6 6 7 5 6 7 6 4 6 7 5 6 7,T2 - 7 6 7 7 6 7 6 7 7 6 7 6 6 7 6受试者5:T1 - 5 6 4 5 7 5 6 4 5 6 4 7 5 6 4,T2 - 6 6 7 6 7 6 6 7 7 6 6 7 6 6 7受试者6:T1 - 6 7 7 6 6 7 7 7 7 6 7 6 6 6 7,T2 - 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7受试者7:T1 - 4 3 5 6 7 4 5 6 5 4 6 7 6 7 7,T2 - 7 6 7 6 7 7 7 6 7 7 7 6 7 7 6受试者8:T1 - 7 7 6 6 5 6 5 6 7 7 6 7 7 6 7,T2 - 6 5 6 7 6 7 7 6 7 7 5 6 7 7 6受试者9:T1 - 4 5 6 7 6 5 7 6 5 7 5 6 7 5 7,T2 - 7 7 7 7 7 7 6 7 7 6 7 7 7 7 7受试者10:T1 - 5 3 6 4 5 7 5 6 7 5 6 5 7 5 6,T2 - 7 6 7 7 7 7 6 7 7 6 7 7 7 7 7请根据以上数据,计算该问卷在T1和T2时间点的重测信度,即采用Pearson相关系数计算该问卷的信度。
第四章测量的信度与效度

结构效度主要应用于智力测验、人格测验等一些心理测 验方面。
2.结构效度的确定 确定结构效度的基本程序 第一,对所研究的心理特质的结构进行界定 第二,依据理论框架,提出可能的假设 第三,收集数据,验证假设
③考察测验的同质性。
④因素分析的方法 ⑤结构方程的方法
(2)测验间法 通过对几个测验的比较研究,找出它们所测的共同特质,
这样便可以确定这些测验是否具有结构效度。 ①相容效度:计算被试在新旧两个同类测验上的分数的
相关。如果相关高,则说明两个测验测的是相同的特质。 ②区分效度:一个有效的测验不仅与其它测量同一构想
(二)结构效度(construct validity) 1.结构效度的含义、特点与应用范围 结构效度是指一个测验实际测到所要测量的理论结构和
特质的程度,或者说测验分数能够说明测量的理论结构 和特质的程度。
结构效度有如下特点:
(1)结构效度首先取决于事先假定的心理特质的结构理 论
(2)当实际测量的资料无法证实事先的理论假设时,并 不一定就表明该测验结构效度不高。
测量随机误差大,测量结果就会与真分数发生较大偏离。 ➢ 信度是衡量一个测验好坏的重要指标之一,测验的信度达
到多少才可以接受呢?一般来讲,能力与成就测验的信度 应该在0.90以上,人格测量信度系数应该在0.80 以上。 ➢ 测量中的系统误差与信度无关。
➢ (二)解释分数
➢ 1. 解释个人测验分数的意义 ➢ 从理论上讲,一个人的真分数本来是用同一测验对他反复
向细目表对照 ③制订评定量表,考察题目对所定义的内容范围的覆盖
率、判断题目难度与能力要求之间的差异等。
第四章测量的信度

一般来说, 重测的时间间隔越短, 那么各种施测情境 的变化就越小, 重测信度系数就会越大。
重测信度系数较大时, 说明该测量工具前、后两次 的测量结果比较一致。结果具有较好的跨时间上的 稳定性。
定义2: 信度是被试团体真分数与实得分数相关系数的平 方
定义3: 信度是一个测验X(A卷)与它的任意一个平行测验 (B卷)的相关系数
由于真分数的方差无法统计,可转化为: rxx=(S2x-S2E)/S2x =1- S2E/S2x 该定义有两点需要注意: 第一、信度指的是一组测验分数或一列测量的特性,
X―1.96SE<T≤X+1.96SE
• 例:在一个智力测验中,某个被试的IQ为100,这是否反 映了他的真实水平? 如果再测一次,他的分数将改变多 少?
• 已知该智力测验的标准差为15,信度系数为.84,则其IQ
的测量标准误和可能范围为: 勇于开始,才能找到成
•
功的路
注意几点: (1)SE对真分数做的是区间估计,不可能由此得到一
课后作业
1.某智力测验的信度r=0.75,某次施测得到标准差为 3.00,则该测验的测量标准误是多少,若某被试得分 为100,试估计其真分数1- =.95的置信区间
2. 某测验的信度为0.75。要使该测验的信度达到 0.90,须增加多少题目(原测验长度的多少倍) ?
3.一个包含10个题目的测验,信度为0.50,若增至 50个题目,其信度将是多少?
•
真分数的估计区间为:
X-1.个人测验的真分数的大小 。
第四章测量信度.ppt

第一节 信度概述
信度:测验结果一致性的判断 (一个测验可靠性和稳定性的指标)
一个好的测验在多次测量同一个人的 时候结果应该是基本一致的.
一、信度与测量误差
1.经典测量理论的假设
X T E T V I X V I E
式中,X为观察分数,T为一般真分数, E为随机误差分数,V为目标真分数,I为 非目标真分数(系统误差)。
分半信度?使用时需注意的问题?在估计测验的分半信度时虽然要求把一个测验的所有题目随机地划分成对半的两个部分但是在实践中对测验分半时为了尽量减少无关因素的影响通常需要考虑题型题分题目测试先后顺序等因素的平衡问题比如按照题目顺序奇偶分半就是一个经常选择的方法
第四章 测量信度
本章提要
测量信度的概念及作用 信度的估计方法 影响信度的主要因素 提高信度的常用方法
项目同质性 当被试在同一测验里表现出跨项 目的一致性时,就称测验具有项目同质性。 也就是测验里各测题得分为正相关时,即为 同质,反之测题间相关为零则为异质。
三、内部一致性信度(同质性信度)P56
1.含义 ➢内部一致性信度主要评价了测验各随 机组成部分之间是否测量了相同的心 理特质,因此,它反映的是题目内容 的抽样一致性程度。
测量标准误差(standard error of measurement)是测量误差的假设分布的标准 差。用下列公式能够容易地计算测量标准误差:
SEM SDt 1 rXX
式中,SDt表示测验分数的标准差,rXX表示信 度系数。
四、信度的标准与作用P51
1.信度是评价测验质量的重要指标之一。
测验类型
4.使用重测信度时需要注意的问题 ➢两次施测时间间隔的长短会影响重测信度 系数估计值的大小,因此,在报告重测信 度系数时应该报告间隔的时间长度。 ➢应该根据已有的相关研究结论考虑所测心 理特质本身的稳定性程度,以确定前后两 次施测时间的间隔究竟应该多长比较合适 时,不应该随便选择间隔时间的长短。
第四章 信度和效度1

第二节 信度的评估方法
一、重测信度 二、复本信度
一、重测信度的概念及间隔时间
• (一)重测信度的概念及理解 • 又称稳定性信度,指同一测验在不同的时间上对 同一群体先后施测两次的测验结果的一致性。这 两次测验结果的相关系数即为重测信度系数。 • (二)重测的间隔时间 • 重测信度所考察的误差来源主要是时间的变化所 带来的随机影响,因此,必须注意间隔时间的长 短。间隔时间的长短要根据测验的性质和目的来 确定。如果希望测验成绩能够预测较长时间的变 化,则间隔时间应该较长。 • (三)重测信度的评估(见下页)
(四)复本信度的优缺点
• 复本信度的主要优点在于: • 1.能够避免重测信度的关于记忆、练习等方 面的问题; • 2.减少了辅导、练习和作弊的可能性。 • 然而,它也存在其局限性 • 1.不能完全消除练习的影响; • 2.有些测验较难找到完全等值的复本。
第三节 效度的概念、性质以及与信 度的关系
(三)重测信度的评估
• • • • • • • • • • • 1.在进行重测信度评估时要注意: (1)重测信度一般只反映由随机因素导致的 变化,而不反映被试行为的长久变化; (2)不同行为受随机误差的影响不同。 2.重测信度的假设前提 (1)每一被试对前一次测验的遗忘程度相同; (2)每一被试在重测的间隔期内没有学习与 测验有关的其他材料。 3.注意:解决问题型的测验不适合采 用重测的方式来考察其信度;而感觉-运动 型测验或人格测验较适合采用重测的方式 来考察其信度。
戴海崎《心理与教育测量》(第4版)章节题库(测量信度)【圣才出品】

第4章测量信度一、单项选择题1.某测验的信度为0.64,实得分数的标准差为5,该测验的标准误为()。
A.0.36B.1.04C.3.00D.4.36【答案】C【解析】根据标准误的公式,代入数据,得:2.重测信度的主要误差源是()。
A.内容取样B.时间取样C.统计方法D.评分者【答案】B【解析】重测信度是指同一个测验先后施测于同一批被试,比较这两次测验结果的一致性程度。
其中时间的长短是影响其信度的关键因素。
如果时间太短则被试可能存在记忆;如果时间太长,则被试的流失率或者被试本身的成熟发育等会影响实验结果。
3.衡量测验跨时间一致性的信度称为()。
A.重测信度B.复本信度C.同质性信度D.评分者信度【答案】A【解析】不同的信度考查的内容不同。
重测信度衡量测验跨时间的一致性。
复本信度(连续施测)衡量测验两个平行测验内容之间的一致性,复本信度(间隔施测)衡量两个平行测验内容之间跨时间的一致性。
分半信度衡量一个测量的两半内容之间的一致性。
评分者信度衡量评分者间的一致性。
4.将测验对等分半后,两半测验得分的相关系数为0.60,校正后该测验的分半信度是()。
A.0.70B.0.75C.0.80D.0.85【答案】B【解析】利用分半法计算测验的信度,可能会低估原长度测验的信度,所以需要用斯皮尔曼-布朗公式对分半信度系数进行修订,根据校正公式可知校正后该测验的分半信度是0.75。
5.同质性信度主要反映测验内部()间的一致性。
A.两半测验B.题目与分测验C.所有题目D.分测验与测验【答案】C【解析】同质性信度主要反映的是所有题目间的一致性。
当各个测题的的得分有较高的正相关时,不论题目的内容和形式如何,则测验为同质的。
相反,表面看起来题目都是测的是同一特质,但各个题目间相关很低或负相关时,则测验为异质的。
分半信度测的是两半测验的一致性。
6.在不同时间内用同一测验重复测量同一被试者,所得结果的一致程度称为()。
A.信度B.效度C.难度D.区分度【答案】A【解析】A项,信度主要是指测量结果的可靠性或一致性,可用重测信度、复本信度、内部一致性信度、评分者信度进行评估。
第四单元 信度

信度的估计方法
Test-Retest Reliability Inter-rater Reliability
Internal Consistency Reliability
Parallel-Forms Reliability
思考
• 简要概括各种信度的基本构想 • 分析各种信度的优缺点
Question: What Is Reliability?
different items, whose scores are completely
interchangeable? Perhaps the teacher would like to put the items in a computer and have the students respond at the keyboard. A computer program could decide which items each student should be tested on.
时间间隔的把握
间隔时间越长,稳定性系数越低。
适宜时间间隔依照测验目的、性质及被试特点而
定。 年幼儿童,间隔要小;年长群体,间隔可大。 智力测验的间隔不能太短,成就测验的间隔不能 太长。
时间间隔的把握
一般间隔时间不超过六个月。(即不能让被
试记住上一次测验的内容,又不能让其特质发生
变化,或对所学知识产生遗忘)
or fail.
• 你认为采用什么方法可以证明这个测验的信度?
f) If different items had been written, would
they have measured the same thing? Equally
well? In particular, can two tests be made, with
第四章 心理与教育测量的信度

仅适用于(0,1)记分测验。
同质性信度 pq rXX = 1- 2 K -1 SX
p 和 q 分别为题目的平均通过率和平均失败率。
仅适用于(0,1)记分,且所有题目的难度接近的测验。
同质性信度的计算及使用条件
D. 克龙巴赫α系数:适用于任何计分方式的测验。
概化理论的发展 测验情景关系说 测验设计任务
5
6
G研究 D研究
D研究的指标
7 8
对概化理论的评价
一、测验分数方差的测量学意义
1、测验分数方差有目标测量分数方差和误差分数方差。
2、误差来源的多样性与总分方差结构的复杂性。
3、经典测量理论处理分数方差的办法: 假定X=T+E,有σ
X 2=σ T 2+σ E 2,
重测信度的使用条件
1、所测量的心理特质必须是稳定的
2、遗忘和练习的效果基本上相互抵消
3、两次测验间隔,被试要测的特质没有学习和训练
重测信度练习
例3:10名学生接受了某测验,分数记为X,为考察该测
验的信度,一星期后,对这10个学生重新测了一次,分数
记为Y,根据两次测验结果,求该测验信度。
学生号 01 Xi 31 Yi 30
rXX = K rij
1+ K -1 rij
r ij 为项目间相关系数的平均数。 Κ为测验项目数,
同质性信度的计算及使用条件
B. 库德-理查逊公式(K-R20):
n pi q i K 1- i 1 2 rXX = K -1 SX
Κ为测验题目数,pi为通过第i题的人数比例,qi为未通过 第i题的人数比例,SX2为测验总分的变异数。
平行测验A
第四章-测量信度

第四章 测量信度一、填空题1、根据一组被试在两个平行或两个复本 测验上的得分计算的相关系数即为复本信度。
2、各种估计信度的方法都是对测验的一致性进行估计,但由于误差来源不同,它们研究的侧面各不相同,说明的是信度的不同方面。
其中,再测信度可用来估计________________________,复本信度可用来估计_________________,等值稳定性系数可用来估计_______________________,内部一致性系数可用来估计测验跨项目或两个分测验之间的一致性,评分者信度可用来估计测验跨评分者的一致性。
3、用同一个测验,对同一组被试前后施测两次,对两次测验分数求相关,其相关系数就叫重测信度。
4、一般认为经过训练的成对评分者之间的一致性达 0.90 以上,评分才是客观的。
5、再测信度又叫__________。
6、增加测验长度对信度产生的效果可用XXXX KK r K Kr r )1(1-+=公式来计算。
7、利用两平行形式测验测查同一批被试所得的两批观察分数,求其间的相关系数,跟____一样,也可求得测验的信度系数。
这种用平行形式相关求得的信度系数,因为特别强调两测验形式的____,所以又叫____。
8、复本信度又叫〔 〕系数。
二、单项选择题信度的定义1、如果某测验的信度系数为0.80,那么该测验中真分数造成的变异占〔 A 〕A 80%B 20%C 64%D 36%2、信度之于效度正如〔B 〕。
A 准确性之于一致性B 一致性之于准确性C 偏差数之于常模D 常模之于偏差数3、在能力测验中,代表测验量表的稳定性和一致性的指标是〔 C 〕。
〔华南师大2001研〕 A 效度B 区分度C 信度D 难度4、信度指的是测量的〔 C 〕。
A 正确性B 针对性C 一致性D 有效性5、信度指数的〔 B 〕就是信度系数。
7、关于信度的指标正确的是〔 C 〕。
A 信度系数,即实得分数方差与真分数的方差的比值B 信度指数即是信度系数C 测量标准误与信度呈负相关D 测量标准误与信度呈正相关〔相似题目〕关于信度的指标,说法错误的是〔 D 〕。
第四章 测量信度

二、用统计术语谈信度
1、信度系数可定义为一个被测团体的真分数方
差与观测分数方差之比。或者说,真分数变异
能够解释观测分数变异的比例(理论定义)
rxx = s2T / s2x
(rxx为信度系数)
真分数方差
观测 分数 方差
2、信度系数等于一个测验X与它的任意一个平
行测验X´的相关系数(操作定义)
rxx = rxx´
两种复本信度
等值性系数:如果两个平行测验连续施测, 则这种复本信度为等值性系数。它反映的是 两个平行测验的题目差异所带来的变异情况。
稳定性与等值性系数:如果两个平行测验是 间隔一段时间后施测,则这种复本信度为稳 定性与等值性系数。它反映题目差异与时间 间隔两方面所带来的变异情况,影响因素更 多。一般而言,稳定性与等值性系数最为严 格,它的值也最低。
(rxx为信度系数)
考察信度系数时,常常采用相关系数作为信 度指标。采用不同的方式计算相关系数,就 得到不同类型的信度系数。
信度值在0~1.00之间,当信度系数等于1.00 时,表示测验完全可靠;当信度系数等于0时, 则表示测验根本不可靠。
问题
一个能力测验用于人才招聘,经检验它的信 度为0.70 ,如何理解这个信度系数的含义?
分半信度只需要一种测验形式,实施一次测验, 操作起来更简便。
当一个测验无法分成对等的两半时,不宜使用 分半信度。
分半信度的计算方法
1、当两个半测验分数的方差(S2a 和S2b)相等时,计 算两个“半测验”之间的皮尔逊积差相关系数,然 后用斯皮尔曼-布朗公式校正。为何要校正?
rxx = 2rhh / (1+rhh) (斯皮尔曼-布朗公式)
被试
题目
总
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章测量信度一、单选题1.速度测验的信度应以( c )取得。
dA.奇偶法 B.筛选法 C.反应时法 D.重测法2.在其他条件均等的情况下,测验长度和信度之间的关系是( d )。
bA.测验越长,信度越低B.测验越长,信度越高C.没有关系D.上述说法都不正确3.计算一项测验的分半信度最常用的方法是比较( b )。
A.测验的前半部分与后半部分的得分。
B.奇数项目与偶数项目的得分。
C.将测验随机分为两部分,比较这两部分的得分。
.D.上述方法都可以。
4.一个40道题目的测验其奇偶分半后的信度为0.50,那么该测验的信度接近多少?( b )A. 0.50B. 0.67C. 0.80D. 1.05.当测验的信度减少(接近0)时,测量的标准误将会怎样变化(c )?A.减小,趋向于零。
B.只要趋向于1.0,它就会要么增大,要么减小。
C.增大,趋向于测验的标准差。
D.增大,逼近无限大。
6.再测信度所考虑的误差来源是(d )所带来的随机影响。
A.形式的不同B.题目的不同C.考生的不同D.时间的不同7.在考查评分者信度时,如果三人以上评阅数份试卷,则需计算( a )。
A.肯德尔和谐系数B.等级相关系数C.皮尔逊积差相关系数D.克伦巴赫α系数8.(a )是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得结果的一致程度。
A.信度B.效度C.难度D.区分度9.信度只受(d )的影响。
bA .系统误差 B.随机误差 C.恒定效应 D.概化理论10.复本信度又称等值性系数。
它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系效。
复本信度反映的是测验在( c )上的等值性。
dA.时间B.题目C.评分D.内容11.分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系效。
这个相关系数就代表了( d )内容取样的一致程度。
A.原测验B.所有条目之间C.题目与分测验之间D.两半测验⒓.斯皮尔曼―布朗公式21tt hh hh r r r =+式中hh r 为(c )的相关系数, tt r 为测验在原长度时的信度估计值。
A.全测验B.原测验C.一半分数D.全部分数13.同质性信度主要代表测验内部( b )间的一致性。
A.两半测验B.所有题目C.题目与分测验D.分测验14.KR 20公式、KR 21公式有别于克伦巴赫α系数的是,它们只能用于( b )。
A.多项选择题B.是非题C.简答题D.论述题15.一般要求在成对的受过训练的评分者之间平均一致性达到(c )以上,才认为评分是客观的。
A. 0.70B. 0.80 c. 0.90 D. 1.0016.确定可以接受的信度水平的一般原则是,当(a )时,测验不能用于对个人做出评价或预测,而且不能作团体比较。
A. tt r <0.70B. 0.70≤tt r <0.85C. tt r ≥0.85D. tt r =1.0017.一般而言,若获得信度的取样团体较为异质的话,往往会(a )测验的信度。
A.高估B.低估C.忽略D.不清楚18.对于不同平均能力水平的团体,题目的(b )会影响信度系数。
aA.难度B.区分度C.信度D.效度19.一个包括40个题目的测验信度为0.80,欲将信度提高到0.90,通过斯皮尔曼―布朗公式的导出公式计算出至少应增加(d )个题数。
A. 40B. 60C.100D. 5020.以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越(a )。
A.大B.低C.小D.不变21.如果某测验的信度系数为0.81,那么该测验中真分数造成的变异占(a )。
A. 81%B.19%C.9%D.18%22.在能力测验中,代表测验量表的稳定性和一致性的指标是(c )。
A.效度B.区分度C.信度D.难度23.衡量测验内部一致性的指标是(a )。
cA.重测信度B.肯德尔和谐系数C.α系数D.复本信度24.分半信度求出后通常需要进行校正,通常用(b )校正。
A.α系数B.斯皮尔曼—布郎公式C.KR20公式D.肯德尔W系数参考答案:1.D 2.B 3.B 4.B 5.C 6.D ⒎A ⒏A 9.B 10.D 11.D 12.C 13.B 14.B 15.C 16.A 17.A 18.A 19.D 20.A 21.A 22.C 23.C 24.B二、多选题1.以下哪些因素会导致测验信度被低估?(abd )abcdA.测验的题目难度过高B.被试的同质性太高C.测验题目很多D.测验的题目难度过低=,公式中SE为测量的标准误,从公式中可以看出,测量的标准误与信2.SE S度之间的关系是( bd )。
A. 信度越低,标准误越小B.信度越低,标准误越大C. 信度越高,标准误越大D.信度越高,标准误越小3.复本信度的缺点有(bcd )。
abdA. 如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响。
B. 由于第二个测验只改变了题目的内容,已经掌握的解题原则可以很容易地迁移到同类问题。
C. 能够避免重测信度的一些问题,如记忆效果、学习效应等。
D. 对于许多测验来说,建立复本是十分困难的。
4.一般来说,在一个测验中增加同质的题目,可以使信度提高。
下列描述中正确的是(bd )。
abdA.测验越长,测验的测题取样或内容取样就越有代表性。
B. 测验越长,被试者受猜测因素的影响就越小。
C. 测验越长,越遵循报酬递增率原则。
D.测验太长,有时反而会引起被试者的疲劳和反感而降低可靠性。
5.信度系数在解释个人分数的意义时的作用是( ac )。
bcA.估计误差分数的范围B.估计真实分数的范围C.了解实得分数再测时可能的变化情形D.了解误差分数的大小6.信度是指测验结果的(a d )。
A.可靠性 B.有效性 C.特殊性 D.一致性7.计算内部一致性信度常用的指标包括(abd )。
A.分半信度B.克伦巴赫α系数C.肯德尔W系数D.KR20。
8.下列信度类型中受测量的时间间隔影响的有(ad )。
A.重测信度B.复本信度C.分半信度D.重测复本信度参考答案:1.ABCD 2.BD 3.ABD ⒋ABD ⒌BC 6.AD 7.ABD 8.AD三、概念题1.克郎巴赫α系数2.测量的标准误四、简答计算题1.指出各种信度系数所对应的误差来源。
2.已知“16人参加一次测验后在奇数题和偶数题上的得分情况,试用两种以上方法估计测量信度。
解:r=0.893.已知某态度量表有6道题,被试在各题上得分的方差分别是0.80、0.81、0.79、0.78、0.80、0.82,测验总分的方差为16.00,求α值。
解:4.信度的影响因素有哪些?怎样提高测量信度?5.某智力测验的信度r=0.75,某次施测得到分数的标准差为3.00,则该测验的标准误是多少?若某被试得分为100,试估计其真分数95%的置信区间?解:Se=2.5 95.1~104.96.甲被试在韦氏成人智力量表测验中言语智商为102,操作智商为110。
已知两个分测验都是以100为平均数,15为标准差的标准分数。
假设言语测验和操作测验的信度为0.93和0.94,问:甲被试的操作智商是否显著高于言语智商?解:7.如何根据测验的类型选择信度的估计方法?答:测验信度是测验在测量它所测特质时得到的分数(测值)的一致性。
它反映了测验工具对各种随机误差控制的好坏,是测验性能的重要质量指标。
由于真分数无法直接得到,因而通常需要采用重测法、复本法、分半法和内部一致性系数等几种方式来估计信度,但由于每一种方法都特别强调了对某方面误差的控制,因此,它们并不适用于所有类型的测验。
重测法多用于所测特质是相对稳定的测验。
如智力测验、能力倾向测验和人格测验等。
复本法和分半法多用于学业成就测验和智力测验。
内部一致性系数多用于智力测验、能力倾向测验和个性测验,但当测验所测特质包含性质不同的方面时,不能采用内部一致性系数。
以上信度系数估计方法的选择是相对的,实践中可根据测验目的、性质不同采取多种估计方法。
8.为什么可以用标准误估计个人测验分数的误差?解:9.在一次测验中,有些学生得了80分,已知这次测验的标准差为5,信度系数为0.84,如再测一次他们的分数将改变多少?解:1.96Se=3.9210.已知某个测验的信度为0.75,要使该测验的信度达到0.90,必须增加多少题目?解:n=3,增加到原来的3倍11.为节省测验成本,将某个信度为0.98的测验由500题减为300题,则信度变为多少?(结果保留两位小数)解:r=0.96712. 一个包括10个题目的测验,信度为0.5,若增至50个题目,其信度将是多少?解:r=0.83。