教育测量与评价课件(7)(第七章 教育测验“标准”及其建立方法)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
答:
教育测验标准的含义
教育测验的“标准”指的是教育测验的成就标准,它对于编制标准参照
测验以及解释标准参照测验的分数具有重要的意义。从对波帕姆 “标准参照 测验”的定义的分析来看,Baidu Nhomakorabea们可以从以下两个方面来认识“标准”一词的
含义:
① 从定性方面讲,“标准”一词指的是测试的内容或行为的范围,而 这个范围是测验分数所参照的,它将通过“内容领域规范”得到明确。 ② 从定量方面看,每当人们利用标准参照测验成绩进行有关评价决策
掌握测验
掌握测验是建立一组教学和行为目标上的测验,主要用于判断学生是否掌握某 组给定的教育目标。掌握测验的题目要根据它们与目标的一致性和对教学处理的灵 活度来加以选择。这种以目标为出发点来选择题目、构建试卷的测验,其内容范围 相对不够精确。从这个意义上讲,掌握测验类似于目标参照测验,均可用于某一行 为目标或教学目标的形成性评价。
(5)我国高等教育自学考试标准的建立模式
① 课程性质与设置目的; ② 各章节的课程内容与考核目标要求。这是考试大纲的主体部分,是自学考试标 准的规定; ③ 考试说明与实施的要求。包括对能力目标层次的界定与说明、选用教材版本及 参考书的说明、自学方法的指导、对社会助学的建议以及命题考试方面的若干要求; ④ 样题或样卷。
第七章
教育测验的“标准”及其建立方 法
教育测验标准的含义 标准参照测验分数的解释
标准参照测验的定性标准——测验内容领域规范
标准参照测验的定量标准——合格分数线
标准参照测验的定义
心理学家波帕姆对“标准参照测验”的定义是使用最为广泛的。他认为, 标准参照测验是依据事先明确规定的知识能力标准而制定,并据此标准可以对 被试的测验成绩作出解释的一类测验。标准参照测验主要关心的问题是要获得 严格而精确的领域规范或行为领域规范。 对于波帕姆的这个定义,我们需要从以下几个方面作进一步认识。 ① 在这个领域规范中像目标、能力及技巧这样的术语可以互相换用; ② 标准参照测验所测的内容、行为目标或能力技巧等,必须是规定明确 而详细的; ③ 在一次测验中测量几种不同的能力时,通常更好、更科学的解释应当 是分别按每种能力进行; ④ 波帕姆的标准参照测验定义并不以某个切断分数为参照,通常是将标 准参照测验的每项能力定出一个最低的要求,然后把被试的成绩同这最低要求 进行比较。但是,在利用标准参照测验成绩进行“掌握—未掌握”或“合格— 不合格”分类决策时,那么,提供个合宜的切断点是很必要的。
确定标准参照测验合格分数线的方法(二)
(3)基于题目“目标—难度”层次评估法 基于题目“目标—难度”层次评估法来确定一个测验的合格线时,其主 要思想是根据对题目考查目标层次的认识以及对题目难易程度作出经验判断, 把整个测验卷中所有题目按照两个特征进行双向分类;然后由任课教师给每 一类题目指派一个临界概率,这个临界概率就是设想一个尚未可接受的最低 能力的学生,能够正确回答该类题目的可能性大小,或者认为这一临界概率 是对每一位被称为合格的学生提出至少应答对该 类题目的比例大小(同概率 值大小相等)。 (4)基于已知“掌握—未掌握”效标组的统计分析法 可选择两组学生样本,其中一组被课任教师公认为已经掌握了特定课程 的内容,另一组则被公认为未掌握特定课程的内容。然后把有待确定合格线 的测验,放在这两组学生中进行试测,分别统计两组学生的测验成绩分布, 以此判定测验的合格线。
标准参照测验分数解释方法之一:正确百分数
正确百分数是以学生在标准参照测验中答对题目的比例来解释测验分数或 描述学生取得成就的方法。正确百分数的计算公式: 正确百分数 答对题目数 100 总题目数 使用正确百分数时,要注意以下几个问题: ① 测验所要测定的内容(成就)范围必须明确,而且测验题目组能够成 为这个内容(成就)范围的代表性良好的样本。 ② 在标准参照中,可以针对整个测验为每一个学生确定其答案的正确百 分数,对学生的内容掌握程度作出判断。 ③ 在课堂教学评价及其他有关资格证书测验中,为了对多层次的测验结 果分别做出解释和描述,就需要分别对每一教育目标或内容板块去选择题目组, 构成总测验。在解释测验结果时,既可以针对整个测验确定一个正确百分数, 也可以根据测验的内容层次,分别计算不同内容层次的正确百分数。 ④ 在许多情形下,测验中不同内容的题型是不一样的,用公式 答对题目数 ( 正确百分数 总题目数 100)计算出正确百分数有些情况就不够客观。因此,我们可 以利用公式( 得分百分数 测验原始得数 100 )来计算学生个人的得分百分数。 测验原始总分
基于题目分类下的经验判断方法,就是利用课任教师对成就测验标准的“格式塔” 心理现象和教师具备的考评经验来分析测验题目并做出分类与判断的思想方法。 具体一点讲,就是要求课任老师在编好测验之后,认真审察测验中的每一个题目, 分别把测验中所有的题目按特定课程的教学要求分成三类,第一类称为“基本要求 的”;第二类称为“中等要求的”;第三类称为“高要求的”。接着,要求课任教师 假想一组“最低能力的且恰是可接受”的被试,对他们在作答以上三类题目时提出具 体标准,即决定在第一类题目中他们每个人至少应答对多少(比如90%);在第二类题 目中他们每个人至少应答对多少(比如60%);在第三类题目中他们每个人至少应答对 多少(比如说30%)。最后,根据上述判断结果进行加权计算。
目标参照测验
目标参照测验是包含和目标相适应的一组题目所构成的测验。如果对于事先确 定好的测量目标,测验设计者能够为每一测量目标定出许多能充分体现该目标的内 容范围或题目领域,然后分别从各个目标名下的内容领域中进行科学抽样来设计测 验,那么,在这种情形下的目标参照测验实际上和标准参照之间并没有本质区别。 但是,如果目标测验的设计者随意地编写题目并组成测验,尔后再分析题目所测的 行为目标,那么,这样的目标参照就不能看作是标准参照测验。
(3)英国GCSE模式
① 简介或引言; ② 目的; ③ 评价目标 ④ 内容或核心内容; ⑤ 评价目标和内容的关系; ⑥ 评价技术; ⑦ 等级描述。
编写测验内容领域规范的方法(二)
(4)我国高中毕业会考标准的建立模式
① 制定各学科考试大纲; ② 使用参照试卷进行取样测试,建立高中毕业会考的标准分量表: T 85 15Z ; ③ 根据分数,把高中毕业会考成绩确定为五个等级; ④ 编制与参照试卷大体平行的会考试卷; ⑤ 在保密的状态下,抽取有代表性的样本,随机分成两组,分别用会考试卷和参 照试卷进行测试,取得数据; ⑥ 在会考试卷原始分数和参照考试卷原始分数建立等值对应关系; ⑦ 根据每位高中生的会考成绩,经分数转换表,便可得知会考的等级分数。
(2)美国IOX模式
① 一般描述:是对测量的领域进行一般性的、简明扼要的描述。 ② 样本题目:是给出一个带有指导性与限制性的测验题目的具体例子。 ③ 刺激的界定:是对题目的内容、素材、难度、广度等因素作出更为明确的规
定。
④ 反应的界定:是对被试者如何作答题目的方式,包括正确答案与错误答案的 区分准则等方面作出规定。 ⑤ 其他补充说明:若有必要时,对界定测验内容领域所涉及的有关问题作出交 待或补充说明。
标准参照测验定量标准的含义
标准参照测验定量标准是指测验成绩的最低合格分数线 (切断点),它是人们利用标准参照测验成绩进行分类决策 的依据。当然,这里的切断点可能是分数连续尺子上的一个 切断分数点,也可能是采用正确作答题目数量的百分比。
确定标准参照测验合格分数线的方法(一)
(1)基于题目分类下的经验判断方法
(2)基于题目双基度指标下的经验评判法
标准参照测验题目的双基度指的是题目的考查内容和测量目标对体现特定学科 “基础知识、基本技能”双基教学要求的适切性程度。 假设一份测验卷中有N个题目,它们的双基度值及其分数值可用(b1,x1),(b2, x2),…,(bN,xN)来表示,则该测验的合格线分数: E b1 x1 b2 x2 bN xN
标准参照测验分数解释方法之三:内容等级分数
为了更好地解释教育测验的分数,人们把内容参照和常模参照结合起来。
在编制测验过程中,不仅要明确内容范围具体任务,而且把成就分成若干差
别明显的等级水平,标明不同等级水平的成就特征与问题类型,建立起内容 等级分数及其评定量表。这样,将任一学生的测验结果与内容等级评定量表
时,难免从客观上需要确定一个切断点作为分类决策的依据。当然,这里的
切断点可能是分数连续尺子上的一个切断分数点,也可能是采用正确作答题 目数量的百分比。不管是哪一类切断点,它在一定程度上体现“标准”一词
的在测量评价功能的定量标准。
几个与标准参照测验相关的概念
领域参照测验
领域参照测验是建立在一套完善的题目汇编或内容领域规范汇编基础上用以检 查被试的素质及发展水平的测验。如果按照波帕姆提出的标准参照测验的定义,那 么标准参照测验和领域参照测验这两个概念和术语没有本质的区别。
思考题 如何理解“标准参照测验”的概念?
标准参照测验是依据事先明确规定的知识能 力标准而制定,并据此标准可以对被试的测验成绩作出 解释的一类测验。标准参照测验主要关心的问题是要获 得严格而精确的领域规范或行为领域规范。对于这一定 义,我们需要从以下几个方面作进一步认识: (1)在这个领域规范中像目标、能力及技巧这 样的术语可以互相换用; (2)标准参照测验所测的内容、行为目标或能 力技巧等,必须是规定明确而详细的; (3)在一次测验中测量几种不同的能力时,通 常更好、更科学的解释应当是分别按每种能力进行; (4)这一定义并不以某个切断分数为参照,通 常是将标准参照测验的每项能力定出一个最低的要求, 然后把被试的成绩同这最低要求进行比较。
标准参照测验分数解释方法之二:掌握分数
无论是针对每一教学单元的形成性测验,还是针对一门课程的终结性测 验,如果要了解与判断学生是否掌握所学的内容,我们就要编制一份有内容效 度的教育测验,并且事先定出一个可接受的最低标准。这个标准是人为确定的, 它可以是百分制评分量尺上的某一人点,也可以是80%-90%的正确反应 所对应的分数,作为最低通过标准。这个分数就是所谓的掌握分数。以它作为 判断标准,把所有的学生区分为掌握和未掌握两类。 对于掌握分数,应注意以下几点: ① “掌握”与“未掌握”是人为确定的。 ② 从知识的掌握状态来讲,事实上更应该是一种连续模型。因此,把学 生区分为“掌握”与“未掌握”两类,在许多情况下的确是迫不得已的办法。 ③ “掌握”、“及格”或“合格”的概念类似,但有区别。 ④ 当利用测验的掌握分数给学生进行二分类时,对于不同的年级、不同 的课题内容、不同的测验乃至同一测验中不同的分测验,人为规定的掌握分数 也未必相同。
相对照,不仅能给出学生等级分数,而且还能具体描述学生会做什么,不会
做什么的问题。
标准参照测验定性标准的含义
标准参照测验定性标准是指测试的内容或行为的范围, 而这个范围是测验分数所参照的,它将通过“内容领域规范” 得到明确。
编写测验内容领域规范的方法(一)
(1)汉布莱顿模式
① 说明:对能力所包括的内容和行为作简明的描述。 ② 实例指导与题目样本:一个测验指导的例子和一个测量能力的典型例题。 ③ 内容范围:一个对能力测量中的内容和行为的详细说明以及一个关于试题库 的结构和内容的详细说明。 ④ 答案范围:必须预先准备好备择的不正确的答案的说明。