第四章-测验信度作业

合集下载

第四章__测量信度

第四章__测量信度

五、评分者信度
评分者信度(Scorer
Reliability)指的是
多个评分者给同一批被试作答情况进行评分
的一致性程度。它主要用于主观性作品的评
价过程中,如论述题评分、作文题评分、歌
唱比赛的评分、设计作品的评分等。
如有A、B、C三位专家给6位应聘者的面试评分,结 果如下,试求评分者信度。
A 1 75 B 66 C 45
5、测量时间把握不恰当
6、评分不客观
(三)被试方面的可能影响
1、动机作用 2、测验经验 3、测验焦虑
4、生理变因(身心健康、疲劳等)
5、被试团体的异质性程度
同质性信度——内部一致性系数;
评分者信度——评分者之间的一致性。
第三节 影响信度的因素与提高方法 一、影响测量信度的主要因素
(一)测量工具的可能影响
1、题目样本的选择不当
题目样本不具代表性(偏题怪题),题目涵盖面过于
狭窄等。
2、题目含义及表达的模棱两可
题目含义不明确,语言表达模棱两可,会造成被试的
弗朗那根公式:rxx = 2 [ 1-( S2a + S2b )/ S2x ]
卢仑公式: rxx = 1- S2d / S2x
其中rxx是测验的分半信度, S2a 、 S2b表示被试
在两半测验上得分的方差,S2x表示被试在整个测验
上得分的方差, S2d表示被试在两半测验上得分之差 的方差。
四、同质性信度
5、测验长度偏短
测验长度偏短,难以全面考察被试的心理特质, 增加回答问题的随机性,从而降低信度。
6、特殊题型中靠猜测答题的可能性较大
猜测性将增加测验得分的随机性,从而降低测 验信度。
(二)施测过程的可能影响

心理测量 第四章 测量的信度

心理测量 第四章 测量的信度

什么样的测量要考虑重测信度?
• 人的多数心理特质如智力、性格等,具有 相对的稳定性,因此对这些心理特质的测 量,应该前后一致。因此,我们希望得到 测验稳定性的证据。 • 另外,我们还经常要用测验分数对人做预 测,此时测验分数的跨时间的稳定性更加 重要。
• 重测信度的优点在于提供有关测验结果是否随时 间而变异的资料,作为预测受试者将来行为表现 的依据。其缺点是易受学习和记忆的影响。 • 如果相隔时间太短,则记忆犹在,练习的影响很 大,往往造成假性的高相关;如果相隔时间太长, 那么身心特质的发展与学习经验的累积等均足以 改变测验分数的意义,使相关降低。 • 一般来说,最适宜的相隔时间随测验的目的和性 质而异,少者两周,多者半年。
2.信度可以帮助进行不同测验分数 的比较
• 来自不同测验的原始分数是无法直接比较 的,而必须将它们转换成相同尺度的标准 分数才能进行比较。 • 例:某班期末考试,张生语文、数学的成 绩转换成T分数(平均数为50、标准差为10) 分别为65和70,由此我们可以知道张生的 数学比语文考得稍好些,但二者差异是否 有意义,仍不清楚。
再测信度(稳定性) 复本信度,分半信度(等值性) , Alpha系数(同质性) 先后施测两个复本
评分者信度
一、重测信度
• 1.含义和计算 • 重测信度(test-retest reliability)指的是用同一个量表对 同一组被试施测两次所得结果的一致性程度。 • 重测信度能表示两次测验结果有无变动,反映测验分数的 稳定程度,所以又叫稳定性系数。 • 其计算公式即皮尔逊积差相关公式: • XX = [ (X X ) (YY )] / √ (X X )2. (YY )2 • 公式中,XX是重测信度,X及X是第一次测量的实得分数 及实得分数的平均值,Y及Y是第二次测量的实得分数及 实得分数的平均值。

心理测量 第4章 心理与教育测量的信度

心理测量 第4章 心理与教育测量的信度

两个测验必须在项目的内容、形式、数量、难易、 时限、指导语等方面相同或相似; 两次测验的时间间隔要适当;

尽管复本信度的估计方法避免了再测法的 缺点,应用范围较广,但它本身也有一定的局 限性:

复本法只能减少而不能完全排除练习和记忆的影响; 对于许多测验来说,建立复本是相当困难的; 由于第二个测验只改变了题目的内容,已经掌握解 题原则,可以很容易迁移到同类问题中去。
2 K为测验题目数,Si2 为某一题目分数的变异数,Sx 为测验 总分的变异数
采用SPSS计算信度
数 据 库
同 质 性 信 度 计 算 方 式
结果
输入40题
结果
评分者信度
标准化测验一般都有较为严格的评分程序。
对于客观性试题来讲,评分所引起的误差是可 以忽略不计的,但是对于一些主观题来讲,评 分者之间的变异是产生误差的重要原因之一。
测验的信度。
根据统计学里讲的区间估计的方法,
我们可以得知:个人在每次测量中所得分
数X有95%的可能性在真分数加减1.96个
标准误的范围内,即
X 1.96SE T X 1.96SE

两种测验分数的比较 来自不同测验的原始分数是无法直接 比较的,只有参照统一团体的平均分数, 将它们转换成相同尺度的标准分数(如T分 数或Z分数),才能进行比较。为了说明个 人在两种测验上的差异,我们可以用差异 标准误来检验其差异的显著性,其公式:
信度是测量过程中随机误差大小的反应 信度可以用来解释个体测验分数的意义 信度可以帮助不同测验分数之间进行比较

一个测验有多个信度估计值,因而误差估计值也有 多个,我们在实际工作中要注意选择最适合某一特 殊情况的信度估计来解决问题。

第4章 测量的信度与效度

第4章 测量的信度与效度
2 2 X T2 E
实得分数的方差等于真分数的方差与误差方差之和。
调研人员应运用所掌握的统计知识,分析其是属于系统 误差还是属于随机误差。 系统误差会使调查结果有误,所以应尽量避免。 随机误差可通过提高样本代表性、增大样本量来减少。
信度一般规定是:真分数的方差在总体方差中所占的比 重,即信度系数:
当题目间的相关系数越大时,α系数也会越大。 当题目数目n越多时,S
2 H
n 值越大, 越接近于0, 2 SH n 1
2 S i
越接近于1,故α系数也会越接近于1。
要做信度分析须先检查每个题目是否都是同方向的,即 都是正面问法,反向问题需要做处理后才可以加入分析。
在计算α系数时,应该注意有些调查量表测量的内容包 含几个领域,这时宜分别计算各个领域的α系数。 克朗巴哈α系数适用于项目多重计分的测验数据或问卷 数据,可以用该系数测量Likert量表的信度。 在基础研究中,信度至少应达到0.8才可接受; 在探索性研究中,信度只要达到0.7就可以接受; 在旅游调查测量实践中,信度只要达到0.6即可接受。 α系数通常与量表题目数量有关,题目数量越多,α系 数就越大。
理想(甚佳,信度 佳(信度高) 很高) 非常理想(信度非 非常理想(甚佳, 常好) 信度很高)
二、克朗巴哈 α系数的手工计算
以一份有8个题项的量表为例,8个题项均为正向题, 受试样本数有6位,采用Likert 5点量表填答,获得调查 结果如下表:
题号 样本
量表试题
01 5 5 5 5 5 4 02 1 1 2 1 1 1 03 2 2 2 2 2 1 04 5 4 5 5 5 5 05 2 3 3 3 3 3 06 5 5 5 5 5 4 07 4 5 5 5 5 4 08 3 2 2 3 2 2 总分 27 27 29 29 28 24

第四章 测验的信度与效度

第四章 测验的信度与效度
14
复本信度的计算举例
10名学生创造力的复本测验结果
ABCDE FGH I J X1 20 19 18 18 17 16 14 12 12 10 X2 20 20 19 16 16 17 12 11 13 9
❖ 3、注意事项
要构造真正的平行测验 ❖ 复本测验必须在题目的内容、数量、形式、难度、 区分度、指导语、时限以及所用的例题、公式、测验 其它方面都相同或相似。
=0.95
• 如在评定中有相同的等级时,用下式校正。其中n为 相同等级的个数
R i2 R i 2/N
W 1 2K2N2NK n3n/12
25
四、信度对测验分数的意义 ❖ 1、解释真实分数与实得分数的相关
信度系数可以解释为测验的总变异中,真分数造成的变 异占百分之几。如,当rxx=0.90时,我们可以说实得分 数中有90%的变异是真分数造成的,仅10%来自测验的误 差。rxx=1.00,则表示完全没有测量误差,所有的变异 均来自真实分数;同样,信度系数也告诉测量的误差比 例是多少。
27
❖ 3、解释个人分数的意义(区间估计)
从信度可以解释个人分数的意义,这就是测量标准误的 应用。它有两个作用 其一是估计真实分数的范围;其 二是了解实得分数再测时可能的变化情形。
28
❖ 由于误差的存在,一个人通过测量得到的分数很难 等于真分数。理论上,我们可以对一个人施测无数 次,然后求得所得分数的平均数和标准差。在这个 假设的分布里,平均数就是这个人的真分数,标准 差则为误差大小的指标。
rxx= 2rhh 1 rhh
18
变异数不相等:
弗朗那根(Flanagan)公式:
rxx=2
1
sa2
sx2
sb2

心理测量 信度练习题

心理测量 信度练习题

心理测量信度练习题心理测量是心理学中的重要领域之一,它通过各种测量工具和方法,对个体的心理特征进行测量和评估。

而心理测量的信度则是指测量工具在不同场景下的一致性和稳定性。

本文将提供一些心理测量信度的练习题,以帮助读者更好地理解信度的概念和计算方法。

练习题一:测试工具的内部信度计算某位心理学家设计了一份评估社交焦虑的问卷,该问卷一共包含10个题目,并通过5个等级的评分(1-5分)来衡量受试者的社交焦虑水平。

以下是8名受试者的答题情况:受试者1:4 3 2 4 5 1 3 2 2 1受试者2:2 2 3 3 3 2 2 5 4 4受试者3:3 5 4 3 4 3 2 4 2 1受试者4:5 4 5 5 4 3 5 4 4 5受试者5:3 3 2 3 3 4 2 3 2 3受试者6:5 4 5 4 5 4 5 4 5 4受试者7:2 1 1 1 3 2 2 1 3 2受试者8:4 4 3 3 3 4 4 3 4 3根据以上数据,请计算该问卷的内部信度,即采用Cronbach's alpha方法计算该问卷的信度。

练习题二:测试工具的重测信度计算研究人员使用了一份用于评估对学习英语的自信心的问卷进行实证研究,该问卷共有15个题目,通过7个等级的评分(1-7分)来测量受试者对自己学习英语的自信程度。

在某时间点T1,有60名受试者填写了该问卷,两周后的时间点T2,受试者再次填写了同一份问卷。

以下是10名受试者在两个时间点T1和T2的得分情况(T1代表时间点1的得分,T2代表时间点2的得分):受试者1:T1 - 4 3 6 5 7 5 6 4 5 7 6 5 7 5 6,T2 - 6 5 7 6 7 6 7 6 7 7 5 6 7 6 7受试者2:T1 - 5 4 7 5 6 5 7 4 5 7 4 5 6 5 7,T2 - 7 6 7 6 6 7 7 6 6 7 6 6 7 7 6受试者3:T1 - 6 5 4 6 7 6 5 7 6 5 4 6 5 7 5,T2 - 7 6 5 7 7 7 6 7 6 5 7 7 7 7 7受试者4:T1 - 4 5 6 6 7 5 6 7 6 4 6 7 5 6 7,T2 - 7 6 7 7 6 7 6 7 7 6 7 6 6 7 6受试者5:T1 - 5 6 4 5 7 5 6 4 5 6 4 7 5 6 4,T2 - 6 6 7 6 7 6 6 7 7 6 6 7 6 6 7受试者6:T1 - 6 7 7 6 6 7 7 7 7 6 7 6 6 6 7,T2 - 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7受试者7:T1 - 4 3 5 6 7 4 5 6 5 4 6 7 6 7 7,T2 - 7 6 7 6 7 7 7 6 7 7 7 6 7 7 6受试者8:T1 - 7 7 6 6 5 6 5 6 7 7 6 7 7 6 7,T2 - 6 5 6 7 6 7 7 6 7 7 5 6 7 7 6受试者9:T1 - 4 5 6 7 6 5 7 6 5 7 5 6 7 5 7,T2 - 7 7 7 7 7 7 6 7 7 6 7 7 7 7 7受试者10:T1 - 5 3 6 4 5 7 5 6 7 5 6 5 7 5 6,T2 - 7 6 7 7 7 7 6 7 7 6 7 7 7 7 7请根据以上数据,计算该问卷在T1和T2时间点的重测信度,即采用Pearson相关系数计算该问卷的信度。

戴海崎《心理与教育测量》(第3版)课后习题(第4章 测量信度——第6章 测验的项目分析)【圣才出品】

戴海崎《心理与教育测量》(第3版)课后习题(第4章 测量信度——第6章 测验的项目分析)【圣才出品】

第4章测量信度1.各种信度系数所对应的误差来源是什么?答:信度主要包括重测信度、复本信度、分半信度、同质性信度、评分者信度,各种信度系数所对应的误差来源分别简述如下:(1)重测信度系数对应的误差来源重测信度是指用同一个量表对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。

除去主试,施测环境和被试等方面的误差,它的独特误差来源主要有:①施测过程中所产生的遗忘和练习效应;②在两次施测的间隔时间内,被试在所要测查的心理特质方面获得了学习机会。

(2)复本信度系数对应的误差来源复本信度是指两个平行的测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。

它的误差来源有:①不能获得严格意义上的平衡测验;②施测过程中产生的顺序效应和迁移效应;③在两次施测的间隔时间内,被试在所测量的心理特质上获得了学习机会。

(3)分半信度系数对应的误差来源分半信度是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。

它的误差来源是:不同的分半方法的分半信度不同,可能是由于将测验分为相平行的两半的方法不同而产生误差。

(4)同质性信度系数对应的误差来源同质性信度也称内部一致性系数,它是指测验内部所有题目之间的一致性程度。

克龙巴赫α值还是所有可能的分半信度的平均值,它只是测量信度的下界的一个估计值。

即,α值大,必有测量信度高;但α值小时,却不能断定测量信度不高。

它的误差来源产生于题目是否同质,这包括两个方面:①所有题目都测的是同一种心理特质;②所有题目得分之间都具有较高的正相关。

(5)评分者信度系数对应的误差来源评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。

在心理与教育测量工作中,客观题的评分很少出现误差,但主观题的评分常常会造成误差。

它的误差来源主要是多个评分者之间的个体差异,对相同答案的不同评定,这种个体差异不可能完全消除,只能最大程度低依赖正规的测查程序和统计方法来减小它。

第四章 信度

第四章  信度


分半信度 同质性信度 评分者信度
复本信度 连续施测) (连续施测)

再测信度
复本信度 间隔施测) (间隔施测)
在一般情况下,间隔施测的复本信度最低,因 为很多因素有机会影响到分数.相反,校正过 的分半相关,因为影响的因素少,所得的信度 估计为最高.
各种信度系数相应误差变异的来源
信度系数的类型 再测信度 复本信度(连续施测) 复本信度(连续施测) 复本信度(间隔施测) 复本信度(间隔施测) 分半信度 同质性信度 评分者信度
时间间隔的把握
间隔时间越长,稳定性系数越低. 间隔时间越长,稳定性系数越低.适宜时间间隔依照测验 目的,性质及被试特点而定.几分钟至几年. 目的,性质及被试特点而定.几分钟至几年. 年幼儿童,间隔要小;年长群体,间隔可大. 年幼儿童,间隔要小;年长群体,间隔可大.智力测验的 间隔不能太短,成就测验的间隔不能太长. 间隔不能太短,成就测验的间隔不能太长. 一般间隔时间不超过六个月. 一般间隔时间不超过六个月.(即不能让被试记住上一次 测验的内容,又不能让其特质发生变化, 测验的内容,又不能让其特质发生变化,或对所学知识产 生遗忘) 生遗忘)
★注意排除施测顺序的影响
在报告结果时,应报告两次施测的间隔,及在此间隔内被试的有关经历.
稳定性与等值性(Stability 稳定性与等值性(Stability and Equivalent)信度 Equivalent)信度 1,定义: 如果两个复本测验是相距较长一段时间分两次施测的, 如果两个复本测验是相距较长一段时间分两次施测的,同 一组被试施测结果的一致性程度. 一组被试施测结果的一致性程度. 是一种最为严格的信度指标 时间间隔施测, 时间间隔施测,内容变异+重测信度误差 2,形式:复本A—适当时间—复本B 形式:复本A 适当时间—复本B

第四章 心理与教育测量的信度

第四章 心理与教育测量的信度

仅适用于(0,1)记分测验。
同质性信度 pq rXX = 1- 2 K -1 SX
p 和 q 分别为题目的平均通过率和平均失败率。
仅适用于(0,1)记分,且所有题目的难度接近的测验。
同质性信度的计算及使用条件
D. 克龙巴赫α系数:适用于任何计分方式的测验。
概化理论的发展 测验情景关系说 测验设计任务
5
6
G研究 D研究
D研究的指标
7 8
对概化理论的评价
一、测验分数方差的测量学意义
1、测验分数方差有目标测量分数方差和误差分数方差。
2、误差来源的多样性与总分方差结构的复杂性。
3、经典测量理论处理分数方差的办法: 假定X=T+E,有σ
X 2=σ T 2+σ E 2,
重测信度的使用条件
1、所测量的心理特质必须是稳定的
2、遗忘和练习的效果基本上相互抵消
3、两次测验间隔,被试要测的特质没有学习和训练
重测信度练习
例3:10名学生接受了某测验,分数记为X,为考察该测
验的信度,一星期后,对这10个学生重新测了一次,分数
记为Y,根据两次测验结果,求该测验信度。
学生号 01 Xi 31 Yi 30
rXX = K rij
1+ K -1 rij
r ij 为项目间相关系数的平均数。 Κ为测验项目数,
同质性信度的计算及使用条件
B. 库德-理查逊公式(K-R20):
n pi q i K 1- i 1 2 rXX = K -1 SX
Κ为测验题目数,pi为通过第i题的人数比例,qi为未通过 第i题的人数比例,SX2为测验总分的变异数。
平行测验A

第四章测验信度作业

第四章测验信度作业

第四章测验信度作业-标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII第四章测量信度一、单选题1.速度测验的信度应以( c )取得。

dA.奇偶法 B.筛选法 C.反应时法 D.重测法2.在其他条件均等的情况下,测验长度和信度之间的关系是( d )。

bA.测验越长,信度越低B.测验越长,信度越高C.没有关系D.上述说法都不正确3.计算一项测验的分半信度最常用的方法是比较( b )。

A.测验的前半部分与后半部分的得分。

B.奇数项目与偶数项目的得分。

C.将测验随机分为两部分,比较这两部分的得分。

.D.上述方法都可以。

4.一个40道题目的测验其奇偶分半后的信度为0.50,那么该测验的信度接近多少? ( b )A. 0.50B. 0.67C. 0.80D. 1.05.当测验的信度减少(接近0)时,测量的标准误将会怎样变化(c )A.减小,趋向于零。

B.只要趋向于1.0,它就会要么增大,要么减小。

C.增大,趋向于测验的标准差。

D.增大,逼近无限大。

6.再测信度所考虑的误差来源是(d )所带来的随机影响。

A.形式的不同B.题目的不同C.考生的不同D.时间的不同7.在考查评分者信度时,如果三人以上评阅数份试卷,则需计算( a )。

A.肯德尔和谐系数B.等级相关系数C.皮尔逊积差相关系数D.克伦巴赫α系数8.(a )是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得结果的一致程度。

A.信度B.效度C.难度D.区分度9.信度只受(d )的影响。

bA .系统误差 B.随机误差 C.恒定效应 D.概化理论10.复本信度又称等值性系数。

它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系效。

复本信度反映的是测验在( c )上的等值性。

dA.时间B.题目C.评分D.内容11.分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系效。

心理测量信度习题

心理测量信度习题

计算内部一致性信度常用的指标包括
A、分半信度 B、克伦巴赫a系数
C、肯德尔W系数 D、 KR20 答案ABD
01
03
02
计算题 1、假设有一份自我效能感问卷,先后两次施测于5学生,时间间隔为1个月,结果如下表,求该测验的信度(适用公式?) =
01
计算公式
01
则选择95%的置信水平,Z0.95=1.96 X-1.96SE<T<=X+ 1.96SE
01
信度习题
如何根据测验的类型选择信度的估计方法?
测验信度是测验在测量它所测特质时得到的分数的一致性。它反映了测验工具对各种随机误差控制的好坏,是测验性能的重要质量指标。常采用重测法、复本法、分半法和内部一致性系数等方式来估计信度。
重测法多用于所测特质是相对稳定的测验,如智力、能力倾向、人格等测验。复本法和分半法多用于学业成就和智力测验。内部一致性系数多用于智力、能力倾向、个性测验,但当测验所测特质包含性质不同的方面时,不能采用内部一致性系数。实践中可根据测验目的、性质不同采取多种估计方法。
01
03
02
简答:
单选题 计算一项测验的分半信度最常用的方法是比较( ) 测验的前半部分与后半部分的得分 将测验随机分为两部分,比较这两部分的得分 奇数项目与偶数项目的得分 上述方法都可以 答案:C
一个40道题目的测验其奇偶分半后的信度为0.50,那么该测验的信度接近多少?
0.50
0.67
0.82
0.91 答案:n= rxx(1-rhh)/rhh(1-rxx)=0.67
当测验的信度减少(趋近于0)时,测量的标准误会怎样变化?
减小,趋向于零
只要趋向于1.0,它就会要么增大,要么减小

第四章测量的信度与效度

第四章测量的信度与效度
(3)结构效度通过测量什么、不测量什么的证据积累起 来给以确定的,因而不可能有单一的数量指标来描述结 构效度。
结构效度主要应用于智力测验、人格测验等一些心理测 验方面。
2.结构效度的确定 确定结构效度的基本程序 第一,对所研究的心理特质的结构进行界定 第二,依据理论框架,提出可能的假设 第三,收集数据,验证假设
③考察测验的同质性。
④因素分析的方法 ⑤结构方程的方法
(2)测验间法 通过对几个测验的比较研究,找出它们所测的共同特质,
这样便可以确定这些测验是否具有结构效度。 ①相容效度:计算被试在新旧两个同类测验上的分数的
相关。如果相关高,则说明两个测验测的是相同的特质。 ②区分效度:一个有效的测验不仅与其它测量同一构想
(二)结构效度(construct validity) 1.结构效度的含义、特点与应用范围 结构效度是指一个测验实际测到所要测量的理论结构和
特质的程度,或者说测验分数能够说明测量的理论结构 和特质的程度。
结构效度有如下特点:
(1)结构效度首先取决于事先假定的心理特质的结构理 论
(2)当实际测量的资料无法证实事先的理论假设时,并 不一定就表明该测验结构效度不高。
测量随机误差大,测量结果就会与真分数发生较大偏离。 ➢ 信度是衡量一个测验好坏的重要指标之一,测验的信度达
到多少才可以接受呢?一般来讲,能力与成就测验的信度 应该在0.90以上,人格测量信度系数应该在0.80 以上。 ➢ 测量中的系统误差与信度无关。
➢ (二)解释分数
➢ 1. 解释个人测验分数的意义 ➢ 从理论上讲,一个人的真分数本来是用同一测验对他反复
向细目表对照 ③制订评定量表,考察题目对所定义的内容范围的覆盖
率、判断题目难度与能力要求之间的差异等。

第四章测量的信度

第四章测量的信度
3.重测信度实质: 主要考察了一个测量工具是否能 够保证在不同时间测量结果的一致性,表示测 验结果的稳定性。故称之为稳定性系数( Coefficient of Stability)
一般来说, 重测的时间间隔越短, 那么各种施测情境 的变化就越小, 重测信度系数就会越大。
重测信度系数较大时, 说明该测量工具前、后两次 的测量结果比较一致。结果具有较好的跨时间上的 稳定性。
定义2: 信度是被试团体真分数与实得分数相关系数的平 方
定义3: 信度是一个测验X(A卷)与它的任意一个平行测验 (B卷)的相关系数
由于真分数的方差无法统计,可转化为: rxx=(S2x-S2E)/S2x =1- S2E/S2x 该定义有两点需要注意: 第一、信度指的是一组测验分数或一列测量的特性,
X―1.96SE<T≤X+1.96SE
• 例:在一个智力测验中,某个被试的IQ为100,这是否反 映了他的真实水平? 如果再测一次,他的分数将改变多 少?
• 已知该智力测验的标准差为15,信度系数为.84,则其IQ
的测量标准误和可能范围为: 勇于开始,才能找到成

功的路
注意几点: (1)SE对真分数做的是区间估计,不可能由此得到一
课后作业
1.某智力测验的信度r=0.75,某次施测得到标准差为 3.00,则该测验的测量标准误是多少,若某被试得分 为100,试估计其真分数1- =.95的置信区间
2. 某测验的信度为0.75。要使该测验的信度达到 0.90,须增加多少题目(原测验长度的多少倍) ?
3.一个包含10个题目的测验,信度为0.50,若增至 50个题目,其信度将是多少?

真分数的估计区间为:
X-1.个人测验的真分数的大小 。

第四章 测验信度

第四章 测验信度

1 a系数 它是一种表示测验同质信度的指标,该公式 又称为克伦巴赫公式:
∑S2 k i a= 1− 2 k −1 SX
Si
SX
2
=第 i 道题的方差 =测验总分的方差
2
K=题目数量
2. 库德-里查森公式(KuderRichardson): 当题目分数均为0, 1 的 二分法记分时,作为α系数的一种特例, 可采用库德-里查森公式:
分半的方法
如果测验中包含一些大 题目,大题目之中又包 含若干个小题目,那么, 奇偶分半应按最小的题 目划分。
按题目的奇偶顺序分半 易受难易程度、练习、疲劳因 素的影响
速度测验不宜采用分半信度
分半信度的校正
矫正公式为斯匹尔曼——布朗公式: 式中crxx为经过校正的信度值 2rhh CrXX = rhh 为未经校正的信度值 1 + rhh 斯匹尔曼——布朗公式假设测验所分成的两半具有相 同的变异,弗朗那根公式可以不做这样的假设。
ssw321??????tknnkr12??123???nntn相同等级数目?例题见附件6求评分者信度?肯德尔和谐系数??w肯德尔和谐系数每位受测者所得等级的和数的平方和rss??r每位受测者所得等级数的和?k评分者人数?n受测者人数??nnksswr??32121??nrrssr22????第四节对信度的讨论?一信度与误差变异的关系?信度系数类型误差变异来源?再测信度时间取样?复本信度连续施测内容取样时间与内容取样内容取样评分者间的差异?复本信度间隔施测?分半信度?评分者信度?有时同一个测验需要检验几种信度系数这样我们就能把总分数的变异分成不同的分支
rnn = 1 −
so (1 − roo )
2
snቤተ መጻሕፍቲ ባይዱ
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章测量信度一、单选题1.速度测验的信度应以( c )取得。

dA.奇偶法 B.筛选法 C.反应时法 D.重测法2.在其他条件均等的情况下,测验长度和信度之间的关系是( d )。

bA.测验越长,信度越低B.测验越长,信度越高C.没有关系D.上述说法都不正确3.计算一项测验的分半信度最常用的方法是比较( b )。

A.测验的前半部分与后半部分的得分。

B.奇数项目与偶数项目的得分。

C.将测验随机分为两部分,比较这两部分的得分。

.D.上述方法都可以。

4.一个40道题目的测验其奇偶分半后的信度为0.50,那么该测验的信度接近多少? ( b )A. 0.50B. 0.67C. 0.80D. 1.05.当测验的信度减少(接近0)时,测量的标准误将会怎样变化(c )?A.减小,趋向于零。

B.只要趋向于1.0,它就会要么增大,要么减小。

C.增大,趋向于测验的标准差。

D.增大,逼近无限大。

6.再测信度所考虑的误差来源是(d )所带来的随机影响。

A.形式的不同B.题目的不同C.考生的不同D.时间的不同7.在考查评分者信度时,如果三人以上评阅数份试卷,则需计算( a )。

A.肯德尔和谐系数B.等级相关系数C.皮尔逊积差相关系数D.克伦巴赫α系数8.(a )是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得结果的一致程度。

A.信度B.效度C.难度D.区分度9.信度只受(d )的影响。

bA.系统误差 B.随机误差 C.恒定效应 D.概化理论10.复本信度又称等值性系数。

它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系效。

复本信度反映的是测验在( c )上的等值性。

dA.时间B.题目C.评分D.内容11.分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系效。

这个相关系数就代表了( d )内容取样的一致程度。

A.原测验B.所有条目之间C.题目与分测验之间D.两半测验⒓.斯皮尔曼―布朗公式21tthhhh rrr??式中hh r为(c )的相关系数, tt r为测验在原长度时的信度估计值。

A.全测验B.原测验C.一半分数D.全部分数13.同质性信度主要代表测验内部( b )间的一致性。

A.两半测验B.所有题目C.题目与分测验D.分测验14.KR20公式、KR21公式有别于克伦巴赫α系数的是,它们只能用于( b )。

A.多项选择题B.是非题C.简答题D.论述题15.一般要求在成对的受过训练的评分者之间平均一致性达到(c )以上,才认为评分是客观的。

A. 0.70B. 0.80 c. 0.90 D. 1.0016.确定可以接受的信度水平的一般原则是,当(a )时,测验不能用于对个人做出评价或预测,而且不能作团体比较。

A. tt r<0.70B. 0.70≤tt r<0.85C. tt r≥0.85D. tt r=1.0017.一般而言,若获得信度的取样团体较为异质的话,往往会(a )测验的信度。

A.高估B.低估C.忽略D.不清楚18.对于不同平均能力水平的团体,题目的(b )会影响信度系数。

aA.难度B.区分度C.信度D.效度19.一个包括40个题目的测验信度为0.80,欲将信度提高到0.90,通过斯皮尔曼―布朗公式的导出公式计算出至少应增加(d )个题数。

A. 40B. 60C.100D. 5020.以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越(a )。

A.大B.低C.小D.不变21.如果某测验的信度系数为0.81,那么该测验中真分数造成的变异占(a )。

A. 81%B.19%C.9%D.18%22.在能力测验中,代表测验量表的稳定性和一致性的指标是(c )。

A.效度B.区分度C.信度D.难度23.衡量测验内部一致性的指标是(a )。

cA.重测信度B.肯德尔和谐系数C.α系数D.复本信度24.分半信度求出后通常需要进行校正,通常用(b )校正。

A.α系数B.斯皮尔曼—布郎公式C.KR20公式D.肯德尔W系数参考答案:1.D 2.B 3.B 4.B 5.C 6.D ⒎A ⒏A 9.B 10.D 11.D 12.C 13.B 14.B 15.C 16.A 17.A 18.A 19.D 20.A 21.A 22.C 23.C 24.B二、多选题1.以下哪些因素会导致测验信度被低估?(abd )abcdA.测验的题目难度过高B.被试的同质性太高C.测验题目很多D.测验的题目难度过低21ttt SESr??,公式中SE为测量的标准误,从公式中可以看出,测量的标准误与信度之间的关系是( bd )。

A. 信度越低,标准误越小B.信度越低,标准误越大C. 信度越高,标准误越大D.信度越高,标准误越小3.复本信度的缺点有(bcd )。

abdA. 如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响。

B. 由于第二个测验只改变了题目的内容,已经掌握的解题原则可以很容易地迁移到同类问题。

C. 能够避免重测信度的一些问题,如记忆效果、学习效应等。

D. 对于许多测验来说,建立复本是十分困难的。

4.一般来说,在一个测验中增加同质的题目,可以使信度提高。

下列描述中正确的是(bd )。

abdA.测验越长,测验的测题取样或内容取样就越有代表性。

B. 测验越长,被试者受猜测因素的影响就越小。

C. 测验越长,越遵循报酬递增率原则。

D.测验太长,有时反而会引起被试者的疲劳和反感而降低可靠性。

5.信度系数在解释个人分数的意义时的作用是( ac )。

bcA.估计误差分数的范围B.估计真实分数的范围C.了解实得分数再测时可能的变化情形D.了解误差分数的大小6.信度是指测验结果的(a d )。

A.可靠性 B.有效性 C.特殊性 D.一致性7.计算内部一致性信度常用的指标包括(abd )。

A.分半信度B.克伦巴赫α系数C.肯德尔W系数D.KR20。

8.下列信度类型中受测量的时间间隔影响的有(ad )。

A.重测信度B.复本信度C.分半信度D.重测复本信度参考答案:1.ABCD 2.BD 3.ABD ⒋ABD ⒌BC 6.AD 7.ABD 8.AD三、概念题1.克郎巴赫α系数2.测量的标准误四、简答计算题1.指出各种信度系数所对应的误差来源。

2.已知“16人参加一次测验后在奇数题和偶数题上的得分情况,试用两种以上方法估计测量信度。

被试12345678910111213141516奇数题32404228353041283234263436254041偶数题31394530402939303230304036264042解:r=0.893.已知某态度量表有6道题,被试在各题上得分的方差分别是0.80、0.81、0.79、0.78、0.80、0.82,测验总分的方差为16.00,求α值。

解:4.信度的影响因素有哪些?怎样提高测量信度?5.某智力测验的信度r=0.75,某次施测得到分数的标准差为3.00,则该测验的标准误是多少?若某被试得分为100,试估计其真分数95%的置信区间?解:Se=2.5 95.1~104.96.甲被试在韦氏成人智力量表测验中言语智商为102,操作智商为110。

已知两个分测验都是以100为平均数,15为标准差的标准分数。

假设言语测验和操作测验的信度为0.93和0.94,问:甲被试的操作智商是否显著高于言语智商?解:7.如何根据测验的类型选择信度的估计方法?答:测验信度是测验在测量它所测特质时得到的分数(测值)的一致性。

它反映了测验工具对各种随机误差控制的好坏,是测验性能的重要质量指标。

由于真分数无法直接得到,因而通常需要采用重测法、复本法、分半法和内部一致性系数等几种方式来估计信度,但由于每一种方法都特别强调了对某方面误差的控制,因此,它们并不适用于所有类型的测验。

重测法多用于所测特质是相对稳定的测验。

如智力测验、能力倾向测验和人格测验等。

复本法和分半法多用于学业成就测验和智力测验。

内部一致性系数多用于智力测验、能力倾向测验和个性测验,但当测验所测特质包含性质不同的方面时,不能采用内部一致性系数。

以上信度系数估计方法的选择是相对的,实践中可根据测验目的、性质不同采取多种估计方法。

8.为什么可以用标准误估计个人测验分数的误差?解:9.在一次测验中,有些学生得了80分,已知这次测验的标准差为5,信度系数为0.84,如再测一次他们的分数将改变多少?解:1.96Se=3.9210.已知某个测验的信度为0.75,要使该测验的信度达到0.90,必须增加多少题目?解:n=3,增加到原来的3倍11.为节省测验成本,将某个信度为0.98的测验由500题减为300题,则信度变为多少?(结果保留两位小数)解:r=0.96712. 一个包括10个题目的测验,信度为0.5,若增至50个题目,其信度将是多少?解:r=0.83。

相关文档
最新文档