教育测量与评价课件(7)(第七章 教育测验“标准”及其建立方法)
《教育测验与评量》课件
测验的编制过程
总结词
测验的编制过程包括确定测试目标、选择适当的题型和难度水平、制定评分标准和程序等步骤。
详细描述
在编制测验时,首先需要明确测试目标和目的,并根据测试目标和内容范围选择适当的题型和难度水 平。同时,需要制定详细的评分标准和程序,以确保测试结果的准确性和公正性。最后,需要对测验 进行审查和修订,以确保测验的质量和有效性。
测验与评量的重要性
提高教学质量
评估教育政策
通过测验与评量,教师可以了解学生 的学习状况,发现教学中的不足,从 而调整教学策略,提高教学质量。
测验与评量可以用于评估教育政策的 实施效果,为政策调整提供依据。
促进学生发展
通过测验与评量,学生可以了解自己 的学习状况,发现自己的不足,从而 调整学习策略,提高学习效果。
03
教育评量的基本方法
观察法
总结词
直接、客观、全面
详细描述
观察法是通过直接观察学生的表现来进行评量的方法。它具有直接性和客观性,能够全 面了解学生在课堂上的表现、学习态度和习惯等方面的信息。观察法适用于小范围的学
生群体,如班级或小组。
测验法
总结词
标准化、量化、准确性
详细描述
测验法是一种通过试题来评估学生学 习成果的方法。测验法具有标准化和 量化的特点,能够准确地衡量学生的 学习水平。常见的测验类型包括笔试 、口试和实操考试等。
《教育测验与评量》ppt课件
目录
• 测验与评量的基本概念 • 教育测验的类型与编制 • 教育评量的基本方法 • 教育测验与评量的应用 • 教育测验与评量的挑战与展望
01
测验与评量的基本概念
定义与目的
定义
测验与评量是指通过一系列标准 化的程序和工具,对学生的学习 成果进行测量和评估的过程。
教育测量与评价课程大纲
教育测量与评价第一章教育测量与评价的学科发展第一节教育测量与评价的基本问题一、教育测量与评价的含义1.测量:从广义上是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。
2.测量的要素:一是必须依据某些科学原理与法则,发展出合适的量具或制定出科学的测量方案;二是必须有意义相对明确的测量单位;三是用数字对事物在量上的规定性予以确定,就需要有一个测量或计算的起点,即参照点。
参照点不同,其策略结果也就不同,且测量结果之间也无法进行直接比较。
参照点分绝对零点和相对零点。
测量三个基本要素:量具、单位、参照点。
3.教育测量的含义:针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
教育测量反馈的是关于课堂教与学两方面的信息。
4.教育测量的特点:总的来看,教育测量是属于精神特性的测量。
与物理量的测量相比,其具有(1):间接性和推断性。
目前只能通过人的外显行为或通过人对来自外界的一些刺激所作出的反应,对人的知识技能、智力水平、思维品质、创造能力、心理素质、情感态度、思想道德等作出间接性、推断性的测量。
(2)测量对象的模糊性和测量误差的不可避免性(3)量表具有多样性,结果具有相对抽象性。
量表根据测量的精确程度,从低级到高级可分为称名量表、顺序量表、等距量表和比率量表四种水平(各自定义)。
测验的原始分数经过统计处理后推导出一种新的量表分数,此时分数“零”有时也是一个相对的零点。
但绝大多数教育测量的内容不可穷尽,故大多数教育测量往往没有绝对的零点。
二、教育评价的基本问题1.评价的含义:广义的评价泛指衡量、判断人物或事物的价值。
2.教育评价的概念:格兰郎德(N. E. Gronlund)认为,评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的(课堂)系统过程;评价包括对学生的定量描述(测量)和定性描述(非测量)两方面。
根据格兰朗德的观点,评价总是包括对测量结果需求程度的价值判断。
教育测量与评价复习资料 (1)
第一章教育测量与评价的学科发展1. 测量的三要素:量具、测量的单位、测量的参照点。
2. 教育测量是为了了解学生的发展,尤其是为评价学习成绩而进行的测量活动。
这是教育测量活动最原始的动机,也是教育测量学科发展最早的立足点。
3. 教育测量的特点:间接性和推断性、测量对象的模糊性和测量误差的不可避免性、量表具有多样性以及结果具有相对抽象性。
4. 史蒂文斯根据测量的精确度将量表分为:称名量表、顺序量表、等距量表和比率量表四种水平。
称名量表是用来对事物活人的心理现象进行分类,指派的数值没有数量意义,只是表明事物的类别和性质不同;顺序量表也用于对事物活人的心理现象进行分类,这种分类基于所测属性在数量大小基础上进行的有序得分类,四等级评分法和五分法都是顺序量表;等距量表不但能在一个连续体上表示事物量的大小,而且具有形同的测量单位,但她的零点是相对的,是人为规定的;比率量表是最高水平的量表,除了具有量的大小和相同的单位,还具有绝对的零点。
5.教育评价的概念:格兰朗德:评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的系统过程,评价=测量(定量描述)+非测量(定性描述)+价值判断斯塔费尔比姆:评价是一种划定、获取和提供叙述性和判断性信息的过程,评价最重要的不是为了证明,而是为了改进。
泰勒:评价过程本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程。
日本桥本重治:评价师与教育的目标和价值有明确关系的概念,是按照教育目标和价值观对学生学习成果及教育计划的效果等进行测量的过程。
因此,评价的概念重点在于以教育目标为标准的价值判断。
布鲁姆:评价是为了某个目的而进行的,对各种想法、作品、解答、方法、资料等的价值作出判断的活动。
所谓教育评价,是指按照一定的价值标准和教育目标,利用测量和非测量的各种方法系统的收集资料信息,对学生的发展变化和影响学生发展变化的各种要素进行价值分析和价值判断,并未教育决策提供依据的过程。
《教学测量与评价》PPT课件
2021/3/26
2.2 定性分析(综合分析)
综合分析是指在定量分析数据结果的基础上, 结合考试的具体情况,进行归纳、分析、综合 、概括,从而得出具有普遍意义的结论的分析 方法。
如结合定量分析数据结果对不同专业考生具 体差异,考生在学习中普遍存在的问题,教学 中的薄弱环节等进行分析。
另外,对试卷命题质量中比如题目表述是否科 学、文字表述是否正确以及阅卷情况等直接进 行定性分析。
教学测量与评价
2021/3/26
1
第一讲 教学测量与评价的含 义与作用
一、什么是教学测量 二、什么是教学评价 三、教学测量与评价与关系 四、教学测量与评价的作用
2021/3/26
2
一、教学测量
1.含义 教学测量(instructional measurement)
是考核教学成效的一种方法。这是借助于一 定的手段与方式,对学生的学习成绩(简称 学绩)进行探察,并以一定的数量来表示的 考核办法。
语文表达等比较复杂的成就;
(2)拟评测学生对某些科学知识的意见或态度;
(3)拟评测学生分析、应用或评价整体科学概念
的能力;
(4)受试人数不多无足够时间命题:
(5)教师个人在评阅答案时,能明确制订统一的
评分标准。
2021/3/26
21
2.在下列情况下,以使用客观型试题来评 价为宜
课程考试目的:对学生学习状况和相关知识掌 握程度,教师教学计划的完成程度及效果进行 检查 ;对学生的学业水平、能力做出判断、 区分和解释。
第七章教育测量标准与其建立
– 同一个分数可能是由于不同原因造成的,应结 合以上三方面的因素对测验分数作出解释。同 一分数可作出不同解释。
– 例如,用具有初中文化程度的标准化样本常模 的智力测验来测量一个小学文化程度的受测者, 如果测得IQ为85,就可以认为他基本上是中等 智力水平;如果受测者原来文化程度是大学毕 业,也测得IQ为85,就可解释为受测者可能由 于某种原因而使智力有所减退,属于中下水平。
– 如:智力年龄
第七章教育测量标准与其建立
• 4.等级评定量表
– 在某些情况下,我们感兴趣的不是人们是否掌 握了某种知识,而是一个人完成某种过程或生 产出某种产品的技能。
– 通常我们需要采用等级评定量表来报告一种活 动的熟练水平或一种产品的质量。
– 为了使评定尽可能客观,需要对各种等级定出 标准。对每种水平都定出标准样本,并作出详 细说明。
第七章教育测量标准与其建立
(一) 如何看待测验分数的意义
• 施测者进行测验结果的解释必须:
– ①对所做的测验(包括它的常模的代表性、信 度、效度、难度等)要熟悉了解。
– ②对受测者的情况(文化程度、职业、是否可 能接触测验中的有关问题等)也要有所了解。
– ③对当时测验的具体情况,例如是否有干扰, 受测者当时有无情绪波动或身体不适等情况的 了解。
第七章教育测量标准与其建立
– 如果把这种双变量分布的每个单元的人数转换 成百分比,结果就是期望表。
– 例:预测分数是第一学期末 “区别能力倾向测 验”中的数推理测验(DAT),效标则是第二学期 最后一次考试的课程成绩。数据从211名六年级 学生中得出。测验分数和效标的相关是0.60。 : (见下表)。
– 如:各种等级考试
第七章教育测量标准与其建立
《教育评价与测量》课件
标准化处理可以采用多种方法,如Z 分数法、百分位数法等,将原始数据 转换为标准分数或相对位置,以消除 不同评价指标之间的量纲和量级差异 。
04 教育评价的实施过程
评价计划的制定
确定评价目的和评价对象
确定评价方法和工具
明确评价的目标和评价的对象,为后 续的评价工作提供指导。
根据评价标准和指标,选择合适的评 价方法和工具,确保评价的有效性和 可靠性。
评价指标的权重分配
总结词
权重分配是根据各评价指标的重要程 度对其进行加权处理,以突出重要指 标在评价中的作用。
详细描述
权重分配应根据教育目标和评价目的 进行合理设置,可以采用专家打分、 层次分析法等定性与定量相结合的方 法进行权重赋值。
评价指标的标准化处理
总结词
标准化处理是将不同性质和单位的评 价指标转换为可比较的统一标准,以 便进行综合评价。
测量的效度与项目分析
效度评估
内容效度、结构效度和验证效度。
项目分析
对测验项目的质量进行评估,包括难度、区分度和项目功能差异等指标。
03 教育评价的指标体系
评价指标的确定
总结词
确定评价指标是教育评价的关键步骤,需要综合考虑教育目 标、学生发展需求和课程要求等因素。
详细描述
在确定评价指标时,应首先明确教育目标和期望学生达到的 发展水平,然后根据课程内容和教学要求,选择能够反映学 生知识、技能、态度等方面的可测量指标。
教育评价的类型和特点
总结词
教育评价可以分为多种类型,每种类型具有不同的特 点和应用范围。
详细描述
根据不同的分类标准,教育评价可以分为多种类型。按 照评价目的可以分为诊断性评价、形成性评价和终结性 评价;按照评价对象可以分为学生评价、教师评价、课 程评价、学校评价等。每一种评价类型都有其特定的应 用范围和特点,需要根据具体情境选择合适的评价类型 和方法,以达到最佳的评价效果。同时,不同评价类型 之间也存在相互补充的关系,应该根据实际需要综合运 用。
教育测量与评价
3、折半信度(分半信度)
• 就是将测验分半,再求被试在每一半测验上所 得分数的相关系数。 • 首先根据内容、形式、题数、平均数、标准差、 难度、测题间相关以及分布形态相等的原则, 将试题分成两半,或者将从易到难排列的测题, 按照测题序号,奇数测题为一组,偶数测题为 一组,分成两半; • 然后计算每个被试在两个分半测验分数的积差 相关系数,再用斯皮尔曼—布朗公式加以校正。 • 斯皮尔曼—布朗公式为
教育测量与评价
海南师范学院教育系
黄秀兰
第一章 教育测评概述
• • • • • • • 一、教育测量 (一)测量的定义 测量是根据法则给事物分派数字。(史蒂文斯) 测量这一定义包含了三个要素: 1、法则——给事物的属性分派数字的依据 2、事物属性——测量的对象或目标 3、数字——描述事物属性的符号
(二)四种测量量表
2、教育评价与教学评价
• 联系: • 教学评价是以教学为对象的教育评价,只是教 育评价的一个方面,用逻辑学术语讲,教育评 价是一个上位概念,而教学评价仅是一个下位 概念。 • 区别: • 教育评价的范围比教学评价要广得多,它不仅 关注教学评价,还有学校管理评价、教师评价、 学生评价、课程评价、总务评价等等。
例三
• 对初中一年级学生进行地理成绩测验,每答对1题得1分,答错1பைடு நூலகம் 得0分,其测验结果如下表,试估计该测验的折半信度? • 学生序号 题 序 • 1 2 3 4 5 6 • 1 1 0 0 0 0 0 • 2 0 0 0 1 0 0 • 3 1 0 1 0 0 0 • 4 1 1 0 0 1 0 • 5 1 0 0 1 0 0 • 6 1 1 1 0 1 1 • 7 1 1 1 1 0 1 • 8 1 1 0 1 1 0 • 9 0 1 1 0 0 1 • 10 1 1 1 1 1 1
(完整word版)《教育测量与评价》教案
《数学教育测量与评价》教案第一章数学教育测量与评价的学科发展[教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系,了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求,认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。
[重点与难点]重点:数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。
难点:数学教育测量和教育评价的含义及二者之间的关系。
[教学时数]讲授2课时,课堂讨论、学生自主学习1课时[教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合第一节数学教育测量与评价的基本问题一、数学教育测量与评价的含义二、教育评价的基本问题三、教育评价相关概念辨析第二节数学教育测量与评价的发展历史一、中国是考试制度的发源地二、中国科举制度的世界地位三、数学教育测量学科的诞生四、数学教育测量运动的蓬勃开展五、美国的“八年研究”是教育评价的催生剂六、数学教育测量与评价理论的发展第三节数学教育测量与评价的学科地位和作用一、数学教育测量与评价是现代教育科学研究的三大领域之一二、数学教育测量与评价在教育改革中具有重要的作用三、教育改革呼唤数学教育测量与评价更加科学化四、数学教育测量与评价是教师的专业素养和能力[课堂训练、作业思考题][1]数学教育测量与评价有什么联系与区别?[2]教育评价与教育评估有什么联系与区别?[3]在学科专业分类中,“数学教育测量与评价”放在哪一个类别中比较合适?[4]试分析一下,狭义、中义与广义的教育评价概念有何区别?[5]怎样使用数学教育测量与评价这个概念?[6]为什么说数学教育测量与评价在教育中有重要的作用?[7]为什么说数学教育测量与评价是教师必备的知识技能修养?[8]基础教育课程改革对考试评价制度改革提出哪些要求?第二章数学教育测量与评价的类型和功能[教学目的与要求]掌握数学教育测量与评价的不同标准的分类,了解形成性、诊断性和总结性测验(评价)之间的区别和联系,初步了解常模参照测验和标准参照测验的意义与区别,认识潜力参照测量与评价的意义和特点、最佳行为评价和典型行为评价的意义及其区别,初步领会计算机自适应测验的理念,能够分别阐述数学教育测量与评价在实现教育判断、改进教师教学、促进学生学习、行使等教育管理方面的功能。
教育测量与评价课程教学标准
《教育测量与评价》课程教学标准第一部分:课程性质、课程目标与教学要求《教育测量与评价》课程,是教育科学与技术学院学校教育本科专业的必修课程。
教育测量与评价是当今世界教育科学研究的三大领域之一。
它不仅在教育科学体系中占有显赫的地位,而且在教育教学过程中具有重要而广泛的应用价值。
由于教育测量与评价在实践中具有强烈的导向作用,因此,教育测量与评价常常成为教育改革的突破口,也往往成为课程改革的支撑点之一。
《教育测量与评价》课程目标是促进学习者理解和掌握教育测量与评价的基本概念、基本知识、基本原理和基本方法;传导教育测量与评价的新理念;提高学习者从事考试设计和学生评价的技能;培养与提高学习者的研究考试与研究教育评价的能力;发展学习者的科学研究能力与批判性思维;增进学习者从事教育研究与改革创新的能力。
《教育测量与评价》课程是应用基础性学科,在内容上与教育学、心理学、统计学等有关联,在应用上与当前学校教育改革紧密联系。
所以,学习本课程,必须要先学习《教育学原理》、《心理学》、《教育统计学》等一些基础课程,同时,学习者要关注教育改革尤其是基础教育考试评价改革。
只有这样,才能更好地理解和掌握课程内容与方法。
第二部分:关于教材与学习参考书的建议本课程拟采用华东师范大学出版社2002年8月出版的、由黄光扬教授主编的(面向21世纪高等师范教育教材)《教育测量与评价》一书,作为本课程的主教材。
为了更好地理解和学习课程内容,建议学习者可以进一步阅读以下几本重要的参考书:1、王汉澜主编:《教育测量学》,河南大学出版社,1987年版。
2、[美]格朗兰德著:《教学测量与评价》,河北教育出版社,1991年版。
3、黄光扬主编:《教育统计与测量评价综合教程》,福建科学技术大学出版社,2003年版。
第三部分:课程教学内容纲要第一章教育测量与评价的学科发展本章主要探讨教育测量与评价的基本问题,包括教育测量与评价的基本概念、教育测量与评价的学科地位、教育测量与评价的应用价值、教育测量与评价的类型和功能等问题。
教育测量与评价课件(7)(第七章 教育测验“标准”及其建立方法)
(3)英国GCSE模式
① 简介或引言; ② 目的; ③ 评价目标 ④ 内容或核心内容; ⑤ 评价目标和内容的关系; ⑥ 评价技术; ⑦ 等级描述。
编写测验内容领域规范的方法(二)
(4)我国高中毕业会考标准的建立模式
① 制定各学科考试大纲; ② 使用参照试卷进行取样测试,建立高中毕业会考的标准分量表: T 85 15Z ; ③ 根据分数,把高中毕业会考成绩确定为五个等级; ④ 编制与参照试卷大体平行的会考试卷; ⑤ 在保密的状态下,抽取有代表性的样本,随机分成两组,分别用会考试卷和参 照试卷进行测试,取得数据; ⑥ 在会考试卷原始分数和参照考试卷原始分数建立等值对应关系; ⑦ 根据每位高中生的会考成绩,经分数转换表,便可得知会考的等级分数。
相对照,不仅能给出学生等级分数,而且还能具体描述学生会做什么,不会
做什么的问题。
标准参照测验定性标准的含义
标准参照测验定性标准是指测试的内容或行为的范围, 而这个范围是测验分数所参照的,它将通过“内容领域规范” 得到明确。
编写测验内容领域规范的方法(一)
(1)汉布莱顿模式
① 说明:对能力所包括的内容和行为作简明的描述。 ② 实例指导与题目样本:一个测验指导的例子和一个测量能力的典型例题。 ③ 内容范围:一个对能力测量中的内容和行为的详细说明以及一个关于试题库 的结构和内容的详细说明。 ④ 答案范围:必须预先准备好备择的不正确的答案的说明。
教育测验标准的含义 标准参照测验分数的解释
标准参照测验的定性标准——测验内容领域规范
标准参照测验的定量标准——合格分数线
标准参照测验的定义
心理学家波帕姆对“标准参照测验”的定义是使用最为广泛的。他认为, 标准参照测验是依据事先明确规定的知识能力标准而制定,并据此标准可以对 被试的测验成绩作出解释的一类测验。标准参照测验主要关心的问题是要获得 严格而精确的领域规范或行为领域规范。 对于波帕姆的这个定义,我们需要从以下几个方面作进一步认识。 ① 在这个领域规范中像目标、能力及技巧这样的术语可以互相换用; ② 标准参照测验所测的内容、行为目标或能力技巧等,必须是规定明确 而详细的; ③ 在一次测验中测量几种不同的能力时,通常更好、更科学的解释应当 是分别按每种能力进行; ④ 波帕姆的标准参照测验定义并不以某个切断分数为参照,通常是将标 准参照测验的每项能力定出一个最低的要求,然后把被试的成绩同这最低要求 进行比较。但是,在利用标准参照测验成绩进行“掌握—未掌握”或“合格— 不合格”分类决策时,那么,提供个合宜的切断点是很必要的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
标准参照测验分数解释方法之二:掌握分数
无论是针对每一教学单元的形成性测验,还是针对一门课程的终结性测 验,如果要了解与判断学生是否掌握所学的内容,我们就要编制一份有内容效 度的教育测验,并且事先定出一个可接受的最低标准。这个标准是人为确定的, 它可以是百分制评分量尺上的某一人点,也可以是80%-90%的正确反应 所对应的分数,作为最低通过标准。这个分数就是所谓的掌握分数。以它作为 判断标准,把所有的学生区分为掌握和未掌握两类。 对于掌握分数,应注意以下几点: ① “掌握”与“未掌握”是人为确定的。 ② 从知识的掌握状态来讲,事实上更应该是一种连续模型。因此,把学 生区分为“掌握”与“未掌握”两类,在许多情况下的确是迫不得已的办法。 ③ “掌握”、“及格”或“合格”的概念类似,但有区别。 ④ 当利用测验的掌握分数给学生进行二分类时,对于不同的年级、不同 的课题内容、不同的测验乃至同一测验中不同的分测验,人为规定的掌握分数 也未必相同。
(2)美国IOX模式
① 一般描述:是对测量的领域进行一般性的、简明扼要的描述。 ② 样本题目:是给出一个带有指导性与限制性的测验题目的具体例子。 ③ 刺激的界定:是对题目的内容、素材、难度、广度等因素作出更为明确的规
定。
④ 反应的界定:是对被试者如何作答题目的方式,包括正确答案与错误答案的 区分准则等方面作出规定。 ⑤ 其他补充说明:若有必要时,对界定测验内容领域所涉及的有关问题作出交 待或补充说明。
(② 目的; ③ 评价目标 ④ 内容或核心内容; ⑤ 评价目标和内容的关系; ⑥ 评价技术; ⑦ 等级描述。
编写测验内容领域规范的方法(二)
(4)我国高中毕业会考标准的建立模式
① 制定各学科考试大纲; ② 使用参照试卷进行取样测试,建立高中毕业会考的标准分量表: T 85 15Z ; ③ 根据分数,把高中毕业会考成绩确定为五个等级; ④ 编制与参照试卷大体平行的会考试卷; ⑤ 在保密的状态下,抽取有代表性的样本,随机分成两组,分别用会考试卷和参 照试卷进行测试,取得数据; ⑥ 在会考试卷原始分数和参照考试卷原始分数建立等值对应关系; ⑦ 根据每位高中生的会考成绩,经分数转换表,便可得知会考的等级分数。
掌握测验
掌握测验是建立一组教学和行为目标上的测验,主要用于判断学生是否掌握某 组给定的教育目标。掌握测验的题目要根据它们与目标的一致性和对教学处理的灵 活度来加以选择。这种以目标为出发点来选择题目、构建试卷的测验,其内容范围 相对不够精确。从这个意义上讲,掌握测验类似于目标参照测验,均可用于某一行 为目标或教学目标的形成性评价。
时,难免从客观上需要确定一个切断点作为分类决策的依据。当然,这里的
切断点可能是分数连续尺子上的一个切断分数点,也可能是采用正确作答题 目数量的百分比。不管是哪一类切断点,它在一定程度上体现“标准”一词
的在测量评价功能的定量标准。
几个与标准参照测验相关的概念
领域参照测验
领域参照测验是建立在一套完善的题目汇编或内容领域规范汇编基础上用以检 查被试的素质及发展水平的测验。如果按照波帕姆提出的标准参照测验的定义,那 么标准参照测验和领域参照测验这两个概念和术语没有本质的区别。
(5)我国高等教育自学考试标准的建立模式
① 课程性质与设置目的; ② 各章节的课程内容与考核目标要求。这是考试大纲的主体部分,是自学考试标 准的规定; ③ 考试说明与实施的要求。包括对能力目标层次的界定与说明、选用教材版本及 参考书的说明、自学方法的指导、对社会助学的建议以及命题考试方面的若干要求; ④ 样题或样卷。
标准参照测验分数解释方法之三:内容等级分数
为了更好地解释教育测验的分数,人们把内容参照和常模参照结合起来。
在编制测验过程中,不仅要明确内容范围具体任务,而且把成就分成若干差
别明显的等级水平,标明不同等级水平的成就特征与问题类型,建立起内容 等级分数及其评定量表。这样,将任一学生的测验结果与内容等级评定量表
标准参照测验定量标准的含义
标准参照测验定量标准是指测验成绩的最低合格分数线 (切断点),它是人们利用标准参照测验成绩进行分类决策 的依据。当然,这里的切断点可能是分数连续尺子上的一个 切断分数点,也可能是采用正确作答题目数量的百分比。
确定标准参照测验合格分数线的方法(一)
(1)基于题目分类下的经验判断方法
基于题目分类下的经验判断方法,就是利用课任教师对成就测验标准的“格式塔” 心理现象和教师具备的考评经验来分析测验题目并做出分类与判断的思想方法。 具体一点讲,就是要求课任老师在编好测验之后,认真审察测验中的每一个题目, 分别把测验中所有的题目按特定课程的教学要求分成三类,第一类称为“基本要求 的”;第二类称为“中等要求的”;第三类称为“高要求的”。接着,要求课任教师 假想一组“最低能力的且恰是可接受”的被试,对他们在作答以上三类题目时提出具 体标准,即决定在第一类题目中他们每个人至少应答对多少(比如90%);在第二类题 目中他们每个人至少应答对多少(比如60%);在第三类题目中他们每个人至少应答对 多少(比如说30%)。最后,根据上述判断结果进行加权计算。
(2)基于题目双基度指标下的经验评判法
标准参照测验题目的双基度指的是题目的考查内容和测量目标对体现特定学科 “基础知识、基本技能”双基教学要求的适切性程度。 假设一份测验卷中有N个题目,它们的双基度值及其分数值可用(b1,x1),(b2, x2),…,(bN,xN)来表示,则该测验的合格线分数: E b1 x1 b2 x2 bN xN
答:
教育测验标准的含义
教育测验的“标准”指的是教育测验的成就标准,它对于编制标准参照
测验以及解释标准参照测验的分数具有重要的意义。从对波帕姆 “标准参照 测验”的定义的分析来看,我们可以从以下两个方面来认识“标准”一词的
含义:
① 从定性方面讲,“标准”一词指的是测试的内容或行为的范围,而 这个范围是测验分数所参照的,它将通过“内容领域规范”得到明确。 ② 从定量方面看,每当人们利用标准参照测验成绩进行有关评价决策
第七章
教育测验的“标准”及其建立方 法
教育测验标准的含义 标准参照测验分数的解释
标准参照测验的定性标准——测验内容领域规范
标准参照测验的定量标准——合格分数线
标准参照测验的定义
心理学家波帕姆对“标准参照测验”的定义是使用最为广泛的。他认为, 标准参照测验是依据事先明确规定的知识能力标准而制定,并据此标准可以对 被试的测验成绩作出解释的一类测验。标准参照测验主要关心的问题是要获得 严格而精确的领域规范或行为领域规范。 对于波帕姆的这个定义,我们需要从以下几个方面作进一步认识。 ① 在这个领域规范中像目标、能力及技巧这样的术语可以互相换用; ② 标准参照测验所测的内容、行为目标或能力技巧等,必须是规定明确 而详细的; ③ 在一次测验中测量几种不同的能力时,通常更好、更科学的解释应当 是分别按每种能力进行; ④ 波帕姆的标准参照测验定义并不以某个切断分数为参照,通常是将标 准参照测验的每项能力定出一个最低的要求,然后把被试的成绩同这最低要求 进行比较。但是,在利用标准参照测验成绩进行“掌握—未掌握”或“合格— 不合格”分类决策时,那么,提供个合宜的切断点是很必要的。
相对照,不仅能给出学生等级分数,而且还能具体描述学生会做什么,不会
做什么的问题。
标准参照测验定性标准的含义
标准参照测验定性标准是指测试的内容或行为的范围, 而这个范围是测验分数所参照的,它将通过“内容领域规范” 得到明确。
编写测验内容领域规范的方法(一)
(1)汉布莱顿模式
① 说明:对能力所包括的内容和行为作简明的描述。 ② 实例指导与题目样本:一个测验指导的例子和一个测量能力的典型例题。 ③ 内容范围:一个对能力测量中的内容和行为的详细说明以及一个关于试题库 的结构和内容的详细说明。 ④ 答案范围:必须预先准备好备择的不正确的答案的说明。
思考题 如何理解“标准参照测验”的概念?
标准参照测验是依据事先明确规定的知识能 力标准而制定,并据此标准可以对被试的测验成绩作出 解释的一类测验。标准参照测验主要关心的问题是要获 得严格而精确的领域规范或行为领域规范。对于这一定 义,我们需要从以下几个方面作进一步认识: (1)在这个领域规范中像目标、能力及技巧这 样的术语可以互相换用; (2)标准参照测验所测的内容、行为目标或能 力技巧等,必须是规定明确而详细的; (3)在一次测验中测量几种不同的能力时,通 常更好、更科学的解释应当是分别按每种能力进行; (4)这一定义并不以某个切断分数为参照,通 常是将标准参照测验的每项能力定出一个最低的要求, 然后把被试的成绩同这最低要求进行比较。
标准参照测验分数解释方法之一:正确百分数
正确百分数是以学生在标准参照测验中答对题目的比例来解释测验分数或 描述学生取得成就的方法。正确百分数的计算公式: 正确百分数 答对题目数 100 总题目数 使用正确百分数时,要注意以下几个问题: ① 测验所要测定的内容(成就)范围必须明确,而且测验题目组能够成 为这个内容(成就)范围的代表性良好的样本。 ② 在标准参照中,可以针对整个测验为每一个学生确定其答案的正确百 分数,对学生的内容掌握程度作出判断。 ③ 在课堂教学评价及其他有关资格证书测验中,为了对多层次的测验结 果分别做出解释和描述,就需要分别对每一教育目标或内容板块去选择题目组, 构成总测验。在解释测验结果时,既可以针对整个测验确定一个正确百分数, 也可以根据测验的内容层次,分别计算不同内容层次的正确百分数。 ④ 在许多情形下,测验中不同内容的题型是不一样的,用公式 答对题目数 ( 正确百分数 总题目数 100)计算出正确百分数有些情况就不够客观。因此,我们可 以利用公式( 得分百分数 测验原始得数 100 )来计算学生个人的得分百分数。 测验原始总分
目标参照测验
目标参照测验是包含和目标相适应的一组题目所构成的测验。如果对于事先确 定好的测量目标,测验设计者能够为每一测量目标定出许多能充分体现该目标的内 容范围或题目领域,然后分别从各个目标名下的内容领域中进行科学抽样来设计测 验,那么,在这种情形下的目标参照测验实际上和标准参照之间并没有本质区别。 但是,如果目标测验的设计者随意地编写题目并组成测验,尔后再分析题目所测的 行为目标,那么,这样的目标参照就不能看作是标准参照测验。