第五部分心理测量的信度

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

三、等值稳定性系数
等值稳定性系数是用两个平行的（等值的）测验，间隔适当时距施测于同一组被试得到两组测验来自百度文库数，求这两组测验分数的相关，其相关系数就是等值稳定性系数。
等值稳定性系数的模式是：
测验A 适当时距测验B
计算方法同稳定性系数和等值性系数。
等值稳定性系数也是采用复本对被试施测，但等值性系数的测验要求两次测验的时间间隔尽可能短，而计算等值稳定性系数的两次测验却要求有一个适当的时距。
（4）被试易出现疲劳、失去积极性等反应，还会出现迁移。这些称为顺序效应，为了抵消顺序效应，可随机分配一半被试先做复本A再做复本Ｂ，另一半被试先做复本Ｂ再做复本A，以平衡顺序效应。
（5）复本法只能减少而不能完全排除练习和记忆的影响。
（6）对于许多测验来说，建立复本是相
当困难的。
back
X2 37 37 36 39 39 34 38 39 39 36
采用分半信度应注意以下几个问题：
（1）若用分半法时，以按奇数题和偶数题分半为宜。
（2）在使用斯皮尔曼－布朗公式时要求全体被试在两半测验上的得分的变异数相等。当一个测验不宜分成对等的两半时分半信度不宜采用。
（2）当试卷中存在任选题时，不宜采用分半法。速度测验也不宜采用分半法。因为速度测验中试题的难度低，被试得分的多少主要是看答题的多少，分半法易使得分相同，从而夸大分半法的信度估计。
弗朗那根公式：
r 21S2aS2xS2b （公式5－8）
式中， S 2 变异数，信度值。
a、
S
2为S x
2 分别为两半测验分数的测b 验总分的变异数。r为
卢伦公式：
r
1
S 2d S 2x
（公式5－9）
式中，S 2 d为两半测验分数之差的变异数， S 2 x 为测验总分的变异数。r为信度值。
我们可以用“差异的标准误”来检验差异的显著性。
差S 异d的E 标S 准1 误2 E 的S公2E 2 式为S：2rxx ry（y 公式5－5）
r SE d为差异的标准误，S为相同尺度的xx标准r y分y 数的
标准差，Z分数为1，T分数为10。、分别为两个测验的信度系数。
先将原始分数化成标准分数，然后将两个标准分
SESx 1rxx
（公式5－4）
式中SE表示测量的标准误，即误差分布的标准差度系；数Sx表。示一次测量分数的标准差；rxx表示信
我们可以用测量的标准误来估计个人测验的真分数的大小。
如果选用95％的可靠性水平（置信水
平），即显著性水平（a值）为.05，，
真分数有95％的可能落入X
±Z
2
3.用来对两种测验分数进行比较
来自不同测验的原始分数是无法直接进行比较的，只有将它们转换成相同尺度的标准分数才能进行比较。
如，某班期末考试，小明的数学成绩是 80分，语文成绩是70分。另外，已知小明所在班级的数学平均成绩是70分，标准差是10分，语文平均成绩是60分，标准差是7分。
式（皮尔逊积差相关公式的变式）为：
rxx
X1X2 NX1X2 S1S2
（公式5－6）
式中X1、X2为同一被试的两次测验分数，X 1 、X 2
为全体被试两次测验的平均数，S1、S2为两次
测验的标准差，N为被试人数。
再测法的模式是：施测适当时距再施测
例2：假设有一份主观幸福感调查表，先后两次施测于 10名学生，时间间隔为半年，结果如表所示，求该测验的重测信度。（为了便于理解和计算，本章估计信度的例子都是小样组，实际应用时应采用大样组。）
例4：有一个由100题构成的量表施测于10个高三学生。测验一次后，应试者即毕业离校。现在怎样评介测验结果的信度？
（1）计算出每个应试者的奇数题总分（X1）和偶数题总分（X2），见表5－3。
得
被试
分 1 2 3 4 5 6 7 8 9 10
X1 38 37 38 41 40 36 38 39 40 35
back
一、再测信度二、复本信度三、等值稳定性系数四、内部一致性系数五、评分者信度总结练习
back
再测信度(Test-Retest Reliability) ，也叫重测信度，也叫稳定性系数。用同一个测验，
对同一组被试前后施测两次，对两次测验分数
求相关，其相关系数就叫再测信度。其计算公
1.库德－理查逊公式（K－R20公式）库德（Kuder）、理查逊（Richardson）
针对分半法的不足，提出以项目统计量
为转移，利用项目统计量来计算信度。
称为K-R20公式。
rkR20KK11 Sp2xiqi
校正公式有：
（1）斯皮尔曼－布朗（Spearman-Brown）公式
rxx
2r hh 1 rhh
（公式5－7）
式中，rhh 是两半测验分数的相关系数，
rxx 为整个测验的信度估计值。
采用斯皮尔曼－布朗（Spearman-Brown）公式进行校正时，假定两半测验等值，亦即两半测验具有相同的平均数和标准差。当假定不能满足时，可以采用下面两个公式来估计信度。
复本信度的模式是：复本A 最短时距复本B
例3：假设用A、B两型创造力复本测验对初中一年级10个学生施测。结果见表5－ 2。请同学们自己计算。
表5－2 某创造力复本测验测试结果
测
被试
验 1 2 3 4 5 6 7 8 9 10
X1 20 19 19 18 17 16 14 13 12 10
表5－1 某幸福感调查表的两次测试结果
测
被试
验 1 2 3 4 5 6 7 8 9 10
X1 16 15 13 13 11 10 10 9 8 7
X2 16 16 14 12 11 9 11 8 6 7
计算再测信度必须注意几个问题：
（1）所测量的特性必须是稳定的。当然绝对的稳定是不可能的，但应该是比较稳定的。
SE
，即
X ±1.96 SE的范围之内，也可以写成X
－1.96SE T X＋1.96 SE，SE则用公
式5－4代入。或有5％的可能落入这范围
之外。这实际上也表明了再测时分数改
变的可能范围。
例1，已知WISC-R的标准差为15，信度系数为0.95，对一名12岁的儿童实施该测验后，IQ为110，那么他的真分数在95％的可靠度要求下，变动范围应是多大？
优点：
（1）因两次测试有适当的时间间隔，减少了复本法中的练习、疲劳效应。
（2）只要时间间隔适当，可用于计算稳定性不高的心理特质的测验的信度。
注意：
等值稳定性信度系数的值一般要比等值性系数和稳定性系数要低。
等值稳定性系数是测验信度的最严格的考察，得到的是信度系数的下限。
back
利用一次测验所获得的资料来计算信度系数。这样计算出来的信度系数反应的是测验内部的一致性，即测验项目的同质性，叫做内部一致性系数或同质性系数。
（4）应注意提高被试者的积极性。 back
复本信度（ Alternate Form Reliability ），也称等值性系数（Coefficient of Equivalence）
用两个平行（等值）的测验对同一组被试施测，得到两组测验分数，求这两组测验分数的相关系数，这就是复本信度。因为这反应了两个测验的等值程度，因此又称等值性系数。计算方法与再测法是一样的。
数的差异与1.96SEd（0.05显著性水平）进行比较，
如果其绝对值大于此值，则差异显著，否则差异不显著。
例2，某校五年级进行了两次数学测验，小张第一次考了85分，此次数学测验年级平均分是77分，标准差是8分，此次测验的信度系数是0.84；第二次考了95分，此次数学测验年级平均分是81分，标准差是10分，此次测验的信度系数是0.91；问小张这两次数学测验的成绩是否有显著差异？
（一）分半法（分半信度）
（二）其它计算内部一致性系数的方法
back
分半信度（Split-half reliability）: 分半信度就是将测验题目分成等值的两半，分半求出量表题目的总分，再计算两部分总分的相关系数。
分半的方法很多，常见的方法是把一个量表按题目番号分为两半，一半是奇数题，另一半数偶数题。求出每个人的奇数题的总得分和偶数题的总得分，然后求出奇数题总得分和偶数题总得分的相关系数，最后对相关系数进行校正。
注意几点：
（1）SE对真分数做的是区间估计，不可能由此得到一个确切的点。这就是说，测验分数不是一个定点，而是具有一定的分布范围。因此，两次测验分数之间存在差异是很正常的。
（2）置信水平确定后，估计的精度主要取决于SE，SE越小，范围越小，估计就越精确，反之也然。
（3）真分数不能等同于真正能力或心理特质，真分数中包括了系统误差。
对于信度系数，还应该注意以下几点：
（1）在不同的情况下，对于不同的样本，采用不同的方法会得到不同的信度系数，因此一个测验可能不止一个信度系数。
（2）信度系数只是对测量分数不一致程度的估计，并没有指出不一致的原因。
（3）获得较高的信度系数并不是心理测量有效的充分条件，只是一个必要条件。 back
2.用来估计个人的测验分数（真分数）
由于误差的存在，一个人通过测量得到的分数很难等于真分数。理论上，我们可以对一个人施测无数次，然后求得所得分数的平均数和标准差。在这个假设的分布里，平均数就是这个人的真分数，标准差则为误差大小的指标。
X
在实际工作中，我们用一组被试（人数足够多）两次施测的结果来代替对同一个人反复施测，以估计测量误差的变异数。此时，个人在两次测验中的分数差异就是测量误差。据此可制成误差分数的分布。这个分布的标准差（误差分布的标准差）我们称之为测量的标准误，是表示测量误差的大小的指标，其计算公式为：
1.评价测验
信度系数是衡量测验好坏的一个重要的技术指标。
一般能力与学绩测验的信度系数为0.90以上，有的可以达到0.95；标准智力测验的信度系数应达到0.85以上，个性和兴趣测验的信度系数可稍低，一般应达到0.70～0.80，（也有人认为兴趣、性格、价值观等人格测验的信度系数，通常在0.80～0.85或更高些）。当信度系数小于0.70时，不能用测验来对个人进行评价，也不能用来进行团体间的比较；当信度系数大于 0.70时，可用来进行团体间的比较；大于0.85 时，可以用来鉴别个人。
（3）如遇到有牵连的项目或一组解决同一问题的项目时，这些项目应放在同一半，否则会高估信度的值。
（4）将一个测验分成两半的方法很多（如，按题号的奇偶性分半、按题目的难度分半、按题目的内容分半等），因此，一个测验可以有多个分半信度值。提供分半信度值时，要说明分半的方法。
back
分半法实际上是对测验内部一致性的一个粗略估计。但对于同一个测验分半的方法是很多的，而且用不同的分半方法求出的分半信度都不一样，因此分半信度不是最好的内部一致性的估计。为了弥补分半法的不足，可以采用其它的方法。
第五部分心理测量的信度
一、信度的意义二、信度系数的作用
back
这个定义有两点要注意：
（1）信度是一组测量分数的特性，不是某个测量分数的特性。是对一个人测量多次或对一个群体进行测量得到一组测量分数的特性
（2）真分数的变异数不能直接测量，因此信度是一个理论上构想的概念，只能根据一组实得分数进行估计。
X2 20 20 18 16 15 17 12 11 13 9
复本信度应用时应注意以下几点：
（1）复本信度的关键在于两个量表必须等值，即必须具有相同的难度、区分度、长度、题型等。
（2）两次测验的时距应尽可能短促，以便避免知识的积累、练习效应等因素的影响。
（3）由于量表的两个复份在许多方面近似，所以信度系数有稍稍偏高的倾向。
（2）遗忘和练习的效果基本上相互抵消。
在做第一次测验时，被试可能会获得某种技巧，但只要间隔时间适度，这种练习的效果会基本上被遗忘掉。
再测信度要考虑时间间隔的问题。到底多长合适呢？一般来说，无论对于那种被试，初测与再测的间隔最好不要超过六个月。
（3）再测法适用于速度测验而不适用于难度测验。