第四章 信度
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、再测信度
再测倍度是一种表示测验稳定性的方法,因此可用稳 定性系数表示。稳定性系数是用同一测验试卷,在先后两 个不同时问内对同一组考生施测后求得的实得分数的相关 系数。因此,计算再测信度实际上使用的是重测法。 计算再测信度的基本模式为:
A表示两次测验试卷相同,A1和A2表示同一测验经过 适当时间间隔施测两次。时距可以几天或者几个月。
二、测验倍度与测验难度的关系
测验项目的难度也会影响测验的信度。当测验项 目难度太大时.被试大部分都得低分,分数形成正 偏态分布,当测验项目难度太小时,被试大部分都 得高分,分数形成负伯态分布。在这两种分布情况、 下,分数分布的范围和分数之间的差异都较小,要 提高测验信度,应使难度的范围缩小,即尽量使 各题的难度接近。
例如,假设对10名学生用两个等值的A1与B1测验施测,测验实得分数源自文库别用X和Y表 示,测验结果如表6.2所示。求该测验的信度。
故A1和B1两次测验结果的相关系数极高,说明测验结果的信度极高。
使用复本法计算等值性系数要注意下列几点:
1、复本法必须保持两个测验等值。即要求两个测验在内容范 围、题型、题数、难度、区分度方面要等同。只有符合这一要求, 两次测验成绩求得的等值性系数才有价值。 2、两次测验的时距应尽可能短。两次测验保持时距最短的原 因是,避免被试知识积累、练习效应等因素的影响。如果条件允 许,能在一次测验中先后用两个测验材料测验被试最好。 3、由于测验的两个复本在许多方面近似.所以信度系数有稍 微偏高的倾向。由此,确定两次测验是否等值,还必须考察两次 测验结果的平均数与标淮差。只有当两次测验结果的平均数和标 准差比较接近,而且等值性系数又比较高时,才能肯定两次测验 材料是等值的,否则估计出的等值性系数将会受到歪曲。 4、两次测验紧接着进行时,应注意被试因测试过久而产生厌 倦心理,从而对测验产生影响。
三、抽样误差
抽样误差是指由于测验中被试之间的差异造成的误差。描述被
试之间差异程度的最好特征量是标准差或方差。而方差的大小正好 反映测验的信度系数。由于信度是指实测值与真值相差的程度。用 公式描述这一相差程度为:
说明:如果某样本位试在第一次测验中分数相差较大,
彼此悬殊,要想保持第一次与第二次测验结果的一致性, 那么被试在第一次测验中的名次在第二次测验中应当变 化不大,事实上这是容易做到的。相反.如果第二次测 验时被试的名次与第一次测验相比要发生较大变化,必 须使第二次测验分数发生大幅度变化,才能改变两次测 验结果的一致性,然而,这个条件是不容易满足的。同 样道理.如果方差较小,被试分数整齐.被试的分数只 要发生少许变化,名次就可能改变,从而很容易降低两 次测验结果的一致性.即降低测验信度。
二、复本信度
复本信度是一种表示测验等值性的方法,因此,复本信度可用 等值性系数表示。等值性系数是以两个等值但具体内容不同的量 表,在最短时距内,对相同被试先后施测两次测验所获得的两组对 应分数的相关系数。所谓测验的等值是指测验在题型、题数、难 度、区分度等方面应相等。 计算复本信度的基本模式为
这种方法是编制两份等值的量表(复份),先用第一种量表对 被试测验一次(AI),接着(时距可短到两次测验接着进行)再用第 二种量表对原被试再测验一次(B1)。然后按积差相关系数公式计 算两次测验实得分数的相关系数,这个相关系数也就是等值性系 数。
三、测验信度与测验项目区分度的关系
项目区分度是指测验项目对被试实际水平的区分程度;具有良 好区分度的稿验,实际水平高的校试应得高分.实际水平低的被试 应得械分。项目区分度格影响酗验情度,因为只省当贸验具有良 好区分度时,测验结果才较稳定可靠,否则,被试成绩的可信度 低。
由上表可知.测验信度是随区分度的提高而增长的,可见,要 想达到理想的测验信度,提高试题的区分度是一个好方法。
使用重测法计算再测信度即稳定性系数可用积差相 关系数的计算公式来求。
例如,用某量表测验14名学生,得分记为X。为了考察测量结 果的可靠性,于16天后用原量表对这14名学生再测一次,得分记 为Y,如表6.1所示。问测验结果是否可靠?
把各统计量代入以上积差相关系数公式得:
在使用重测法计算再测信度时,要注意:
第三节 提高测验信度的方法
提高测验信度的方法比较多,我们主要根据影 响测验信度的因素着手,进行方法上的探究。由于 影响测验信度的主要因素是随机误差和抽样误差, 所以,提高测验信度的方法既要考虑侧验本身的长 度、难度、区分度、时间、程序以及评分标准,又 要考虑被试本身的积极性和整齐程度。
一、测验信度与测验长度的关系
1.再测信度的大小易受两次间隔测试时间长短的影响。间隔时间 过长,由于经验、练习及成熟等的影响,测验结果会与第一次测验 大有差异,因而降低了稳定性;间隔时间过短,第一次测验的题目 可能在第二次测验中记亿犹新,容易回忆出上次测验的答案,因而 夸大了稳定性。 2.再测信度适用于速度测验而不适用于难度测验的信度计算。因 为速度测验规定有严格的时间,而测验题目又较多,要求被试用较 短的时间回答较多的题目,被试无暇慢慢回忆,所以受第一次测验 的记忆影响较少。 3.应提高被试的积极性。由于重测法是把原测验原封不动地重测 一次,所以第二次测验没有吸引力,不易引起被试的兴趣,初试可 能采取不积极合作的态度.使第二次测验质量较低。
二、随机误差
所谓随机误差是由于各种偶然因素的影响而使测验产生的误 差,它主要表现在,用同一方法多次测量相同被试时,测得结果 不完全一致。因而,随机误差没有规律性,这种误差是随机发生 的,没有固定倾向,时高时低,有时在第一次测验中出现,第二 次测验中却不一定出现,这样,就导致两次测验结果的一致性受 到影响。所以,随机误差必然影响测验信度。导致随机误差产生 的因素很多,有量表的特点,有测验的程序,有测验中环境的影 响,也有被试测验过程中身心状态等。
测验信度与测验的长度有密切关系。测验的长度是指测验所包含 的题目的多少程度。如果一个测验包含的题目很少,测验愈短.则 测验得分越容易受试题取样偶然因素的影响,测验信度就会降低。 增加测验的题目,延长测验的长度,不仅可以缩小试题抽样的偶然 因素的影响,也可以使学生扩大得分的范围,愈能反映学生的真实 水平.使信度系数增大,提高测验的可靠性。 当然,我们延长一个测验可能或多或少要受到一些实际情况的限 制。它既受到可用的测验时间数量的限制,也受到被试在测验过程 中疲劳和厌烦等因素的影响。有时,还会由于我们不能编造出质量 相当的题目,而受到限制。但在这些有限范围内,在增加测验长度 时,信度是可以提高的。
第二节 影响测验信度的因素
影响测验信度的因素很多,不过根本原因 在于测量误差的影响。前面我们研究过,误 差主要有三种,即系统误差、随机误差及抽 样误差,下面我们研究三种误差对测验信度 的影响。
一、系统误差
测验信度即可靠性或稳定性程度。而系统 误差则是由于量表有问题或评分标准掌握过 宽或过严等原因导致测验结果成倾向性的偏 大或偏小。因而系统误差虽然导致测量不准 确,但不影响测量结果的稳定性或可靠性, 所以不影响测验信度。
第四章 信 度
一个良好的教育测验首先必须保证测验的 结果可靠,测验结果的可靠性称为测验的信 度。由于信度是良好测验的必要条件.所以 本章首先研究测验的信度问题。
第一节 信度的计算
在教育测量学中对信度的估计或计算,一般采用相关分析 的方法,即计算出两种变量的相关系数(r),用相关系数的 大小来表示一致性程度的高低。如果一种测验前后两次施测 同样的被试,测试结果的相关系数大,则该测验的信度高; 前后两次测试结果的相关系数小.则该测验信度低。根据计 算方法,可将信度分为再测信度、复本信度、内部一致性信 度和评分者信度等。