戴海崎《心理与教育测量》笔记和课后习题详解(目标参照测验)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第10章目标参照测验
10.1 复习笔记
一、目标参照测验概述
(一)目标参照测验的产生
从20世纪中期开始,随着常模参照测验模式的局限性(并不是所有的测验都只关心个体间的差异)逐渐被人们发觉,目标参照测验(亦称标准参照测验)应运而生。1962年戈莱塞(R.Glaser)和克劳斯(D.Klaus)首先提出目标参照测验的概念。
(二)目标参照测验的定义
目标参照测验的主要目的在于了解个体在所规定的测量内容上的行为水平,因此其出发点是个体本身的绝对水平,而不再是个体间的水平差异。戈莱塞认为:“所谓目标参照测验,是根据某一明确界定的内容范围而缜密编制的测验,并且,被试在测验上所得结果,也是根据某一明确界定的行为标准直接进行解释的。”
二、目标参照测验的项目分析
(一)内容范围的确定
一个测验的内容范围包括所欲测量特质中蕴含的全部行为。任何一个内容范围都具有一些共同的特点:内容范围具有边界;每一内容范围内容均可分为几类,每一类中又可分为更细更小的类,当每一类的内容及其在此内容范围内的相对重要性确定以后,内容范围就有了明确的结构。
(二)测验项目的内容效度分析
目标参照测验的项目分析,首先要对构成测验的每一个题目是否合适以及有效进行分析,即检验题目与测验内容范围所要求的内容与目标的一致性。这一过程一般缺乏客观的统计分析手段,通常采用专家评定的方法。
专家评定可以采取不同方式,其中比较直观和常用的一种方式是要求有关内容领域的专家填写项目内容评定表,在五级量表上对每个题目所测内容与项目编制者所欲测量的目标内容之间的一致性做出评定,通常情况下,需要同时邀请多位专家进行评定,以考察专家评定之间的一致性。
(三)测验项目的难度和区分度分析
1.测验的预测
测验编制完成后,须选取一定数量的被试进行预测,由此获得预测数据,然后才能在此数据基础上对项目的难度和区分度进行量化分析。目标参照测验的预测方法主要有以下三种:(1)前测—后测方法:选取一组被试,在其接受与测验目标内容有关的教学过程前后各施测一次,取得前测和后测的结果,前者表示未掌握者在测验中的水平,后者表示已掌握者的水平。
(2)已接受教学组——未接受教学组方法:选取两组被试,其中一组已经接受了有关测验目标内容的教学,而另一组从未接受过,将测验对这两组被试同时施测,亦可获得与第一种方法中含义类同的两组结果。
(3)对照组方法:对照组方法是对前两种方法的弥补:选取两组被试,其中一组被试被其教师评定为掌握组,而另一组则被教师评定为未掌握组。将测验同时施测于这两组被试,便获得与上述方法类同的结果。
2.测验项目的难度分析
目标参照测验的项目难度一般以通过率来表示。但是目标参照测验的项目难度分析并不重要,甚至有时并不必要。对于目标参照测验的项目难度的计算,在大多情况下只是作为项目区分度分析的基础。
3.测验项目的区分度分析
测验项目的区分度一般采取两类指标:难度差值和相关系数。
(1)难度差值
①掌握组——未掌握组鉴别指数(D)
a.分别计算掌握者和未掌握者两组在某项目上的平均通过率,记为PA和PB,则该项目的鉴别指数为:K=PA-PB。
b.鉴别指数D的大小,可以直观反映出该项目在多大程度上对掌握者和未掌握者作出了区分。D值从-1.00到+1.00之间变化,越接近于+1.00,题目区分度越高。
②个人获得指数(DIG)
a.采取前测—后测方法,可获得在前测中错误回答某项目而在后测中能够正确回答的被试人数比例,此即该项目的个人获得指数,其值在0至+1.00之间变化,其大小直接反映了经过教学活动之后受益的被试比例。
b.由于DIG只考虑到前测中失败而在后测中通过的被试,却没有考虑到在前测中通过而在后测中反而失败的被试,因而其值不会出现负值,这使它所能反映的问题少于一般的区分度指标,因此其应用也受到限制。
(2)相关系数
以相关系数为指标的区分度在-1.00至+1.00之间变化,当其值为负时,应检查题目的
问题所在,予以修改或删除;当其值为正时,越接近于1,题目越有效;当其值为0时,题目不具区分力,一般不予保留,但在纯粹目标参照测验中应视该题所测内容在内容范围中的重要性而决定其取舍。
三、目标参照测验的信度与效度
(一)信度及其估计
信度是指测量结果的一致性或稳定性。目标参照测验的目的一般不在于鉴别个体差异,而在于了解个体在所测内容上的掌握水平,分数分布比较集中,若用相关系数作信度指标,所得的信度系数也会很低。所以,通常以相关系数所表示的信度指标在目标参照测验上是不太适用的。对于目标参照测验的信度估计,有两种方法:
1.分类一致性信度
目标参照测验在其分数解释上最常见的做法就是将被试分类,一般是根据某一分数分界点将被试分为掌握者和未掌握者两类,称作“达标—未达标”或者“及格—未及格”。对测验分类一致性的度量指标称作分类一致性信度。采用同一被试团体在两次测验结果中均被分为及格或不及格类别中的人数百分比例作为分类一致性信度的指标。测验的分类一致性信度为两次施测中均及格和均不及格人数占总人数的比例。
分类一致性信度大,值为1,说明两次施测结果对被试的分类完全一致,测验结果完全一致。越接近于1,说明测验结果的一致性或稳定性越高,测验越可靠。分类一致性信度的优点在于计算简单,意义直观易懂。缺点为:再测法和复本法的缺点在此同样存在;分类一致性信度也受到测验长度和被试分数分布的影响;最重要也最独特的一个因素是测验分数分界点的确定问题。
2.方差分析方法——荷伊特信度
荷伊特信度不受测验目的或被试异质性的影响,不会随测验分数分界点而变化,因而更具普遍性。其计算公式为:测验分数的总变异可分解为被试间变异,项目间变异SS题和人与试题交互作用三部分。荷伊特认为可用作为被试方差估计值,用
作为误差方差估计值,并可用下式作为测验信度的估计值:
(二)效度及其估计
1.内容效度
目标参照测验注重被试在其所测内容范围内的掌握程度,因而测验的内容效度显得尤为重要。目标参照测验一般来讲有相对比较确定的内容范围,可以命题细目表表示,同时,也可以采用专家评定的方法对题目效度进行分析,从而保留有效题目,删除无效题目。
2.效标关联效度
在目标参照测验中,可以用“决策效度”来评估目标参照测验的效标关联效度。
3.结构效度
关于目标参照测验的结构效度,目的尚未得到较大关注。
四、测验分数的解释——分数分界点的确定
测验分数的分界点,亦称切割分数线,或称及格线。可以将被试进行分类,通常分为“及格”和“不及格”两类。在分类过程中,分界点的确定是至关重要的。就目标参照测验本身