心理测量信度课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用一次测验所获得的资料来计算信度 系数。这样计算出来的信度系数反应的 是测验内部的一致性,即测验项目的同 质性,叫做内部一致性系数或同质性系 数。 (一)分半法(分半信度) (二)其它计算内部一致性系数的方法 back
分半信度(Split-half reliability): 分半信度就是将测验题目分成等值的两 半,分半求出量表题目的总分,再计算 两部分总分的相关系数。 分半的方法很多,常见的方法是把一个 量表按题目番号分为两半,一半是奇数 题,另一半数偶数题。求出每个人的奇 数题的总得分和偶数题的总得分,然后 求出奇数题总得分和偶数题总得分的相 关系数,最后对相关系数进行校正。
SE S x 1 rxx
百度文库
我们可以用测量的标准误来估计个人测 验的真分数的大小。 如果选用95%的可靠性水平(置信水 平),即显著性水平(a值)为.05 ,, 真分数有95%的可能落入X ±Z 2 SE ,即 X ±1.96 SE的范围之内,也可以写成X -1.96SE T X+1.96 SE,SE则用公 式5-4代入。或有5%的可能落入这范围 之外。这实际上也表明了再测时分数改 变的可能范围。
例2:假设有一份主观幸福感调查表,先后两次施测于 10 名学生,时间间隔为半年,结果如表所示,求该测 验的重测信度。(为了便于理解和计算,本章估计信 度的例子都是小样组,实际应用时应采用大样组。) 表5-1 某幸福感调查表的两次测试结果
测 验
被试
1 16 16 2 15 16 3 13 14 4 13 12 5 11 11 6 10 9 7 10 11 8 9 8 9 8 6 10 7 7
被试
1 38 37 2 37 37 3 38 36 4 41 39 5 40 39 6 36 34 7 38 38 8 39 39 9 40 39 10 35 36
得 分
X1 X2
采用分半信度应注意以下几个问题: ( 1 )若用分半法时,以按奇数题和偶数题分 半为宜。 ( 2 )在使用斯皮尔曼-布朗公式时要求全体 被试在两半测验上的得分的变异数相等。当一 个测验不宜分成对等的两半时分半信度不宜采 用。 ( 2 )当试卷中存在任选题时,不宜采用分半 法。速度测验也不宜采用分半法。因为速度测 验中试题的难度低,被试得分的多少主要是看 答题的多少,分半法易使得分相同,从而夸大 分半法的信度估计。
(4)被试易出现疲劳、失去积极性等反 应,还会出现迁移。这些称为顺序效应, 为了抵消顺序效应,可随机分配一半被 试先做复本A再做复本B,另一半被试先 做复本B再做复本A,以平衡顺序效应。 (5)复本法只能减少而不能完全排除练 习和记忆的影响。 (6)对于许多测验来说,建立复本是相 当困难的。 back
一、再测信度 二、复本信度 三、等值稳定性系数 四、内部一致性系数 五、评分者信度 总结 练习
back
再测信度 (Test-Retest Reliability) ,也叫 重测信度,也叫稳定性系数。用同一个测验, 对同一组被试前后施测两次,对两次测验分数 求相关,其相关系数就叫再测信度。其计算公 式(皮尔逊积差相关公式的变式)为: X1 X 2 X1 X 2 N r xx (公式5-6) S1S 2 X2 式中 X1 、 X2 为同一被试的两次测验分数,X 1 、 为全体被试两次测验的平均数,S1、S2为两次 测验的标准差,N为被试人数。 再测法的模式是:施测 适当时距 再施测
复 本 信 度 ( Alternate Form Reliability ) , 也 称 等 值 性 系 数 (Coefficient of Equivalence) 用两个平行(等值)的测验对同一组被 试施测,得到两组测验分数,求这两组 测验分数的相关系数,这就是复本信度。 因为这反应了两个测验的等值程度,因 此又称等值性系数。计算方法与再测法 是一样的。 复本信度的模式是:复本A 最短时距 复本B
第五章
心理测量的信度
什么是信度 估计信度的方法 影响信度系数的因素
第一节 第二节 第三节
一、信度的意义 二、信度系数的作用
back
一、信度的意义 信度即测验的可靠性,指的是测量的一致性程 度。 信度受随机误差的影响,随机误差越大,信度 越低。 在测量学中,信度被定义为:一组测量分数的 真变异数与总变异数(实得变异数)的比率。 即 S 2T rxx (公式5-1) S 2X 2 r S 式中 xx 代表信度系数, T 代表真分数的变异数, 2 代表实得分数的变异数,即总变异数。 S X
SEd 为差异的标准误,S为相同尺度的标准分数的
例2,某校五年级进行了两次数学测验, 小张第一次考了85分,此次数学测验年 级平均分是77分,标准差是8分,此次测 验的信度系数是0.84;第二次考了95分, 此次数学测验年级平均分是81分,标准 差是10分,此次测验的信度系数是0.91; 问小张这两次数学测验的成绩是否有显 著差异? back
2.用来估计个人的测验分数(真分数) 由于误差的存在,一个人通过测量得到 的分数很难等于真分数。理论上,我们 可以对一个人施测无数次,然后求得所 得分数的平均数和标准差。在这个假设 的分布里,平均数就是这个人的真分数, 标准差则为误差大小的指标。
X
在实际工作中,我们用一组被试(人数足够多) 两次施测的结果来代替对同一个人反复施测, 以估计测量误差的变异数。此时,个人在两次 测验中的分数差异就是测量误差。据此可制成 误差分数的分布。这个分布的标准差(误差分 布的标准差)我们称之为测量的标准误,是表 示测量误差的大小的指标,其计算公式为: (公式5-4) 式中SE表示测量的标准误,即误差分布的标准 差;Sx表示一次测量分数的标准差; rxx表示信 度系数。
X1 X2
计算再测信度必须注意几个问题: ( 1 )所测量的特性必须是稳定的。当然绝对 的稳定是不可能的,但应该是比较稳定的。 (2)遗忘和练习的效果基本上相互抵消。 在做第一次测验时,被试可能会获得某种技巧, 但只要间隔时间适度,这种练习的效果会基本 上被遗忘掉。 再测信度要考虑时间间隔的问题。到底多长合 适呢?一般来说,无论对于那种被试,初测与 再测的间隔最好不要超过六个月。 ( 3 )再测法适用于速度测验而不适用于难度 测验。 (4)应注意提高被试者的积极性。 back
根据公式5-1,信度还可以表示为:
S 2E 1 S 2X
rxx
(公式5-2)
这个定义有两点要注意: (1)信度是一组测量分数的特性,不是 某个测量分数的特性。是对一个人测量 多次或对一个群体进行测量得到一组测 量分数的特性 (2)真分数的变异数不能直接测量,因 此信度是一个理论上构想的概念,只能 根据一组实得分数进行估计。
我们可以用“差异的标准误”来检验差异的显著 性。 差异的标准误的公式为: 2 2 SEd SE1 SE2 S 2 rxx ryy (公式5-5)
标准差,Z分数为1,T分数为10。rxx 、ryy分别为 两个测验的信度系数。 先将原始分数化成标准分数,然后将两个标准分 数的差异与1.96SEd(0.05显著性水平)进行比较, 如果其绝对值大于此值,则差异显著,否则差异 不显著。
三、等值稳定性系数 等值稳定性系数是用两个平行的(等值的)测 验,间隔适当时距施测于同一组被试得到两组 测验分数,求这两组测验分数的相关,其相关 系数就是等值稳定性系数。 等值稳定性系数的模式是: 测验A 适当时距 测验B 计算方法同稳定性系数和等值性系数。 等值稳定性系数也是采用复本对被试施测,但 等值性系数的测验要求两次测验的时间间隔尽 可能短,而计算等值稳定性系数的两次测验却 要求有一个适当的时距。
1.评价测验 信度系数是衡量测验好坏的一个重要的技术指 标。 一般能力与学绩测验的信度系数为0.90以上, 有的可以达到0.95;标准智力测验的信度系数 应达到0.85以上,个性和兴趣测验的信度系数 可稍低,一般应达到0.70~0.80,(也有人认 为兴趣、性格、价值观等人格测验的信度系数, 通常在0.80~0.85或更高些)。当信度系数小 于0.70时,不能用测验来对个人进行评价,也 不能用来进行团体间的比较;当信度系数大于 0.70时,可用来进行团体间的比较;大于0.85 时,可以用来鉴别个人。
例3:假设用A、B两型创造力复本测验对 初中一年级10个学生施测。结果见表5- 2。 表5-2 某创造力复本测验测试结果
被试 1 2 3 4 5 6 7 8 9 10
测 验
X1
X2
20
20
19
20
19
18
18
16
17
15
16
17
14
12
13
11
12
13
10
9
复本信度应用时应注意以下几点: (1)复本信度的关键在于两个量表必须 等值,即必须具有相同的难度、区分度、 长度、题型等。 (2)两次测验的时距应尽可能短促,以 便避免知识的积累、练习效应等因素的 影响。 (3)由于量表的两个复份在许多方面近 似,所以信度系数有稍稍偏高的倾向。
3.用来对两种测验分数进行比较 来自不同测验的原始分数是无法直接进 行比较的,只有将它们转换成相同尺度 的标准分数才能进行比较。 如,某班期末考试,小明的数学成绩是 80分,语文成绩是70分。另外,已知小 明所在班级的数学平均成绩是70分,标 准差是10分,语文平均成绩是60分,标 准差是7分 。
校正公式有: (1)斯皮尔曼-布朗(Spearman-Brown) 公式 (公式5-7) rhh 是两半测验分数的相关系数, 式中, rxx 为整个测验的信度估计值。
2r hh rxx 1 rhh
采用斯皮尔曼-布朗(Spearman-Brown) 公式进行校正时,假定两半测验等值, 亦即两半测验具有相同的平均数和标准 差。当假定不能满足时,可以采用下面 两个公式来估计信度。 弗朗那根公式: S 2 a S 2b r 2 1 2 (公式5-8) S x 2 2 式中, S a、 S b 分别为两半测验分数的 变异数, S 2 x 为测验总分的变异数。 r 为 信度值。
对于信度系数,还应该注意以下几点: (1)在不同的情况下,对于不同的样本, 采用不同的方法会得到不同的信度系数, 因此一个测验可能不止一个信度系数。 (2)信度系数只是对测量分数不一致程 度的估计,并没有指出不一致的原因。 (3)获得较高的信度系数并不是心理测 量有效的充分条件,只是一个必要条件。 back
例1,已知WISC-R的标准差为15,信度系 数为0.95,对一名12岁的儿童实施该测 验后,IQ为110,那么他的真分数在95% 的可靠度要求下,变动范围应是多大?
注意几点: (1)SE对真分数做的是区间估计,不可 能由此得到一个确切的点。这就是说, 测验分数不是一个定点,而是具有一定 的分布范围。因此,两次测验分数之间 存在差异是很正常的。 (2)置信水平确定后,估计的精度主要 取决于 SE , SE 越小,范围越小,估计就 越精确,反之也然。 (3)真分数不能等同于真正能力或心理 特质,真分数中包括了系统误差。
优点: (1)因两次测试有适当的时间间隔,减少了 复本法中的练习、疲劳效应。 (2)只要时间间隔适当,可用于计算稳定性 不高的心理特质的测验的信度。 注意: 等值稳定性信度系数的值一般要比等值性系数 和稳定性系数要低。 等值稳定性系数是测验信度的最严格的考察, 得到的是信度系数的下限。 back
卢伦公式: 2 S d r 1 2 (公式5-9) S x 2 式中, S d 为两半测验分数之差的变异数, 2 S x 为测验总分的变异数。 r为信度值。
例4:有一个由100题构成的量表施测于10个高 三学生。测验一次后,应试者即毕业离校。现 在怎样评介测验结果的信度? (1)计算出每个应试者的奇数题总分(X1)和 偶数题总分(X2),见表5-3。