第四章 教育测验编制的一般步骤与方法
教育测验编制的一般步骤与方法
缺点:
1.不易编制,且花费时间较多。 2.易受考生阅读能力的影响。 3.难以排除考生对试题的随机猜测。 (二)客观题命题的一般原则 1.试题能反映教学内容的重点或知识 点。
2.题目之间的相关性越低越好。 3.试题的文字力求浅显易懂、题意明 确。
2020/3/27 4.答案应该是明确、唯一的。
(三)不同类型选择题的命题原则
3
1
1
1
0
第四章 溶液 6
3
3
1
8
第五章酸碱盐 4
3
3
5
2
合计
26 12 13 14 18
评价
2 2 2 6 5 17
合计
22 21 8 22 22 100
由上图可见,命题双向细目表由3个要素组成:
测验目标、测验内容以及二者的比例,即权重。权
重代表了这部分内容的相对重要性。
2020/3/27
◆在真实的命题中,一般遵循如下顺序:
内容范围 3 1 5 3 2 2 2 15
内容范围 4
3444
15
内容范围 5 1 6 2 3 3 2 17
合计
6 32 24 16 14 8 100
2020/3/27
例 1 初中化学内容与教学目标细目表
测验目的 测验内容
知识 理解 运用 分析 综合
第一章 氧
6
3
4
4
3
第二章 氢
7
2
2
3
5
第三章 碳
① 测验材料要适合测验目的
② 测验材料要能够代表该科教材的全部 内容(测验材料要有合理的覆盖面,突出 基本内容及重点内容,比例参照命题双向 细目表)
③ 测验材料要有普遍性(要依据统一的 教学大纲)
教育测量与评价复习资料 (1)
第一章教育测量与评价的学科发展1. 测量的三要素:量具、测量的单位、测量的参照点。
2. 教育测量是为了了解学生的发展,尤其是为评价学习成绩而进行的测量活动。
这是教育测量活动最原始的动机,也是教育测量学科发展最早的立足点。
3. 教育测量的特点:间接性和推断性、测量对象的模糊性和测量误差的不可避免性、量表具有多样性以及结果具有相对抽象性。
4. 史蒂文斯根据测量的精确度将量表分为:称名量表、顺序量表、等距量表和比率量表四种水平。
称名量表是用来对事物活人的心理现象进行分类,指派的数值没有数量意义,只是表明事物的类别和性质不同;顺序量表也用于对事物活人的心理现象进行分类,这种分类基于所测属性在数量大小基础上进行的有序得分类,四等级评分法和五分法都是顺序量表;等距量表不但能在一个连续体上表示事物量的大小,而且具有形同的测量单位,但她的零点是相对的,是人为规定的;比率量表是最高水平的量表,除了具有量的大小和相同的单位,还具有绝对的零点。
5.教育评价的概念:格兰朗德:评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的系统过程,评价=测量(定量描述)+非测量(定性描述)+价值判断斯塔费尔比姆:评价是一种划定、获取和提供叙述性和判断性信息的过程,评价最重要的不是为了证明,而是为了改进。
泰勒:评价过程本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程。
日本桥本重治:评价师与教育的目标和价值有明确关系的概念,是按照教育目标和价值观对学生学习成果及教育计划的效果等进行测量的过程。
因此,评价的概念重点在于以教育目标为标准的价值判断。
布鲁姆:评价是为了某个目的而进行的,对各种想法、作品、解答、方法、资料等的价值作出判断的活动。
所谓教育评价,是指按照一定的价值标准和教育目标,利用测量和非测量的各种方法系统的收集资料信息,对学生的发展变化和影响学生发展变化的各种要素进行价值分析和价值判断,并未教育决策提供依据的过程。
第四章 教育测验的编制
• (二)题目分析
• 1.定量分析(略) • 2.定性分析
– (1)均衡性:试题所测量的内容能够代表学生学习 中要求掌握的学习任务吗?
– (2)相关性:试题是否再现相关的学习任务? – (3)简明性:试题的语言是否简单、明了?
26
• (4)合理性:试题的难度适中吗?是否有错误?是否存在 有争议的答案?
34
一、常见题型及其编制
• (一)选择题(multiple-choice items)及其编制原则 – 1.选择题的结构:题干(stem)和选项(alternatives) – 2.选择题的优缺点 – 优点: • (1)选择题可以测量被试各种不同层次的学习结果。 • (2)正确答案唯一。
35
• (3)可以加大试题容量,扩大试题覆盖的知识面。 • (4)有利于考察被试思维的敏捷性和准确的判断力。 • (5)通过对学生对干扰项(distracters)的选择,教师可
某种具体的目的,它明确规定测验所要达到的预 期结果或标准。它是编制测验的出发点和依据。
13
(1)测验目标与教育目标分类
• 测验目标的确定是以教育目标分类理论为基础的。 – 布卢姆等人的教育目标分类法 – 加涅的教育目标分类法 – 梶田叡一的教育目标分类法 – 我国认知目标的分类
14
15
16
我国认知目标的分类
19
3 .填写双向细目表
• 准备一个含有教学目标与教学内容两个维度的双向细目 表 – 横向设计 • 各个知识在整个测验的知识范围内的相对地位和 重要程度(确定各部分知识所占的比重)。这种 相对重要性可由该内容项目的教学课时的多少来 体现。
20
– 纵向设计 即决定每一目标层次所占比例。这一比例应与测验编制 者认为这个目标对受测学生的水平所具有的重要性相符。 一般主要是参考专家或有经验教师的意见而定。
教育测验编制原理与方法4
作文题
➢ 对人的逻辑思维、形象思维、书面表达等 多种能力的一种综合考查
分类
➢ 命题作文和条件作文 ➢ 记叙文、议论文、说明文等 ➢ 缩写型、改写型、续写型等
编制原则
➢ 根据考试目的、考试对象来确定作文文体和要 求
➢ 根据社会需要、现实生活和学生实际设计命题 ,作文命题要直接测量语文素养和书面表达能 力
25
45
第47页/共52页
应用
5 10 5 10
30
总体百分数
20 30 20 30
100
(一)设计测验的操作细目表
➢ 3. 使用单向归类系统(阅读理解技能)
阅读技能
识别文章中的细节 概括出文章的中心思想 判断文中事件出现的先后顺序 辨别文中所表述的关系 对文中内容进行推论 总体百分数
题目数
10 10 10 10 10 50
➢ B.气温
➢ 1.测量并报告气温;2.影响气温的因素;3.气温与天气形成的关系
➢ C.湿度和降水量
➢ 1.测量并报告湿度;2.影响湿度的因素;3.降水的形式;4.测量并报 告降水量
➢ D.风
➢ 1.测量风速和风向;2.影响风速和风向的因素;3.说出代表风速和风 向的符号
➢ E.云
➢ ……
➢ F.锋面
1
1
1
7
5
15
25
水量
云
2
2
2
6
12
20
题目总数 6
6
6
30
12
60
题目 10
10
10
50
20
100
百分比
第46页/共52页
(一)设计测验的操作细目表
现代教育测量与评价 简答论述题 历年考题分章节汇总
06231《现代教育测量与评价学》-- 简答论述题知识点第一章教育测量与评价的学科发展1.简述教育测量的特点。
P3 (2015年4月简答、2008年4月简答)①间接性和推断性。
②测量对象的模糊性和测量误差的不可避免性。
③量表具有多样性,结果具有相对抽象性。
2.如何理解教育测量的间接性和推断性? P3 (2011年4月简答)物理测量大多是直接性的。
虽然教育测量无一例外地关注到人类自身,但测量的内容主要是关于人的种种非物质属性。
目前,我们只能通过人的外显的行为或通过人对外界的一些刺激作出的反应,对人的知识技能、智力水平、思维品质、创造能力、心理素质、情感态度、道德品质等作出间接性的、推断性的测量。
3.教育测量与教育评价的区别与联系。
P7 2005年4月简答教育测量是针对教育效果或针对学生各方面的发展予以测量和描述的过程,旨在获得有一定说服力的数量事实,是一种以量化为主要特征的事实判断。
教育评价是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实的基础上,作出价值分析和价值判断。
教育测量为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;教育评价是教育测量过程的延续,是对教育测量结果的解释与应用,并朝着价值判断与释放教育功能的方向拓展。
4.简述教育测量与评价在教育改革中的作用。
P25 2012年4月简答当我们根据教育目标和计划,把教育方案、课程、教学等因素作用于学生身上,需要参照教育目标和计划,对教育效果进行测量评估、价值分析和判断。
所以教育评价在教育系统中对实现教育目标起着十分重要的作用。
(3 分)教育改革常常以教育测量与评价的改革作为突破口。
俗话说“考试是根指挥棒“就是这个意思。
(2分)考试与评价改革成为基础教育新课程改革的重要内容。
5.为什么说教育测量与评价是教师必备的知识技能修养? (专业素养和能力)P27 2018年4月论述(1)正确评价学生的发展是教师职业能力的重要组成部分;(4分)(2)在教书育人过程中,需要教师采用教育测量与评价多种方法,以弥补教师非正式观察的不足;(3分)(3)现代教自测量与评价的思想方法对于教师创造性地教学、因材施教、提高教学质量具有重要的作用;(3分)(4)国外教师教有普遍开设"教育测量与评价”这类课程。
教育测验的编制与实施
5、平波型分布 即中低高分人数差不多。学生的学业成 绩呈平波型分布,表明大中小几种难度 的试题比较接近,或学生的基础相差不 大,试题区分度低,需要提高区分度。 6、陡峭型分布 即中分人数很多,低高分人数极少。学 生的学业成绩呈陡峭型分布,表明难度 中等的试题比例过大,缺乏区分度或学 生的基础相差不大,要提高试题的区分 度。
布氏上述六类目标是有层次、有顺序的, 知识是最低层次,是最基本的要求。其 余依次是理解、应用、分析、综合、评 价。评价为认知领域的最高层次,是前 面五种目标的综合并增加了价值标准。 这六类目标,由简单到复杂,由低级到 高级依次排列,组成层次结构。
情感领域
接受:觉察到某一事物的存在,愿意接受某种 特定刺激和有选择的注意这个事物。 反应:受到动机的充分驱动,积极注意某种观 念,并伴随着主动参与行为。 价值评价:接纳并赋予某一客体、现象和行为 以价值。 组织:将各种不同的价值结合起来,解决它们 之间的冲突并开始建立内在的、一致的价值体 系。 由价值或价值复合体形成的性格化:形成的价 值体系在相当长的时间内控制个体行为,形成 内化的加之行为,产生性格化的人生模式。
606 × 308 × - 568 - 287 ———— ———— 168 181
×
√
835 - 217 ———— 618
√
(四)明确测验对象
应考虑被试的年龄特征、教育水 平和文化社会背景等因素
(五)确定测验内容
测验内容的确定,实际上也就是内容抽样 的决定和测验目标的确立相结合而成。 这一结合过程必须通过命题双向细目表来 确定。 命题双向细目表由3个要素构成:p106 测验目标 测验内容 测验目标和测验内容的比例
(六)测验的编制与组织
第四讲 测验编制的一般程序与实施
2020/10/17
6
举例2:创造力测验 发散思维能力,即对规定的刺激产生大量的、变化
的、独特反应的能力。
流通性 独创性 变通性
2020/10/17
7
(三)测验的用途
◦ 描述:人格测验 ◦ 诊断: 精神病的鉴别、学习困难的鉴别 ◦ 选拔:高考、公务员考试 ◦ 预测: 智力测验
2020/10/17
2020/10/17
4
2020/10/17
5
举例1:瑟斯顿-基本心理能力测验
◦ 语文理解——阅读时了解文义的能力 ◦ 语词流畅——正确迅速拼字与敏捷联想词义的能力 ◦ 数字运算——正确而迅速使用数字解答算术问题的能力 ◦ 空间关系——运用感觉器官及知觉经验正确判断空间方向及各种关
系的能力 ◦ 机械记忆——对事物强记的能力 ◦ 知觉速度——迅速而正确地观察与辨别事物的能力 ◦ 一般推理——根据已知条件推理判断的能力
主讲:马晓辉
2020/10/17
1
确定测验目的
制定编题计划
编辑题目
测验的标准化
合成测验
预测和对预测 的结果进行分
析
鉴定测验
编写测验说明 书
2020/10/17
2
(一)测量对象 ➢ 年龄 ➢ 智力水平 ➢ 社会经济与文化背景(包括阅读能力)
2020/10/17
3
(二)测量目标 ➢ 能力、人格、学业成就? ➢ 将目标具体化-操作性定义 回顾以往的研究成果 考虑时代特点 了解受测群体实际情况 向有关专家、资深者咨询和请教
2020/10/17
24
测题的来源
直接选自国内外优秀的相关测验 修改前人的测验中有关测题 自己编写 项目说明书
2020/10/17
编制教育测验的一般原理与方法
对于多部分测验,需要将各部分分数 合成为总分数,可以采用加权平均、 非加权平均等方法进行合成。
分数的解释与应用
要点一
分数解释
根据分数的分布、标准差、百分等级等指标,对分数进行 解释,以评估学生的知识、技能和能力水平。
要点二
分数应用
将测验分数应用于教育决策,如学生分班、教学改进、教 育资源分配等,以提高教育教学的针对性和有效性。
测验的质量指标
信度
测验的一致性程度,即 多次施测的结果是否稳
定可靠。
效度
测验的有效性程度,即 测验是否真实反映所要
测量的心理特质。
难度
测验的整体难度水平, 以及不同题目难度的分
布。
区分度
测验题目对不同水平学 生的区分能力。
02 测验编制的心理学基础
CHAPTER
心理测量学的概念
心理测量学是研究心理现象的测量和 评估的科学,它涉及到如何运用数学 和统计学的方法来量化个体的心理特 质、行为和认知水平。
来源
主要来源于测验的设计、施测过程、评分标准、被试 者的心理因素等方面。
测验误差的控制与减少
01
提高测验设计的科学性 和合理性,减少设计误 差。
02
确保施测环境、设备、 时间等因素的一致性, 减少环境误差。
03
制定明确的评分标准和 客观的评分方法,减少 评分误差。
04
培训施测人员,提高其 专业素养和责任心,减 少人为误差。
心理测量学的应用
心理测量学在教育领域的应用广泛,包括学生评估、教师评价、课程设计等方面。 心理测量学在职业领域也有广泛应用,如人才选拔、职业规划、职业培训等方面。
此外,心理测量学还应用于临床心理学、心理咨询、人格评估等多个领域。
教育测验的编制与实施
按照测验的形式,可以将教育测验分为笔试测验、口试测验和实操测验。笔试测验主要通 过书面形式进行,口试测验则通过口头形式进行,实操测验则需要学生实际操作来展示自 己的技能和能力。
测验编制的基本原则
目的性原则
科学性原则
测验编制应紧扣教学目标和学习要求,确 保测验内容与教学和学习目标相一致。
激励学生进步
测验结果可以作为学生自我比较和 进步的动力,激励学生不断努力提 高自己的成绩。
教师专业发展与教学改进
教师专业培训
改进教学方法
Hale Waihona Puke 教育测验的编制和实施需要教师具备 一定的专业知识和技能,因此可以促 进教师的专业培训和进修。
根据学生的表现和反馈,教师可以调 整自己的教学方法和策略,提高教学 效果和质量。
确定测验目的
明确测验的目标和用途,如评估学生的学习水平、选拔优秀学生等。
设计测验蓝图
根据测验目的,确定测验的内容、题型、难度和时间分配等,确保测 验能够全面、准确地反映学生的能力。
制定评分标准
为每个题目制定详细的评分标准,确保评分过程客观、公正。
培训施测人员
对施测人员进行培训,确保他们了解测验的目的、内容、施测流程和 评分标准。
猜测因素等属性。通过项目分析可以对题目进行筛选和改进,提高测验
的整体质量。
02
难度系数
难度系数是指被试者在该题目上的通过率,难度系数过高或过低都会影
响测验的鉴别力和可靠性。在编制测验时,应合理设置题目的难度系数,
以使测验结果更加准确可靠。
03
区分度
区分度是指题目对不同水平被试者的鉴别能力,高区分度的题目能够更
测验的类型
按照测验目的分类
第四章 编制教育测验的一般原理与方法
客观性试题
客观性试题的功用
客观性试题主要是因为评分客观而得名,它的正确答案在测验前就
已准备好,不同评分者各自独立评分,所得结果基本上是相同的。客观 性试题一般适用于测量知识的掌握、理解、应用、分析几个层次的教学 目标。客观性试题的答案明确,作答简便,因而在限定的时间内测验可 以包含足够数量的试题,能保证对知识内容的覆盖。 客观性试题的类型 常用的类型有: (1)选择题 ; (2)是非题; (3)配合题 ; (4)填空题;(5)简答题。
(2)空白处所填写的应是关键词语,并且要和上下 文有密切的关系,使被试不至于填写困难。 例:1996年我国科技界有 新发明。
填空题
(3)题目中空白地方不能太多,以免句子变 得支离破碎,不利于被试理解题意。
例:连接 市与 的是 河
(4)尽量将空白放在句子的后面或中间,而 不要放在句子开头。
例: 发明了蒸汽机
填空题
(5)所有空白处的线段长度应当一致,不能 随正确答案文字的多少而长短不一,以免 产生暗示作用。
(6)若答案是数字,应指明单位和数字的精 确程度。
简答题
较适合于测量被试被基本知识、概念和原理
的掌握、记忆情况。 1. 优点
编制较为简单、灵活; 增加知识考核的准确度和深度; 不受猜测因素的影响
解释性测验题
在典型选择题的基础上,经教育测验专家改良
后,发展成解释性测验题(interpretiveexercise question)。解释性测验题一般是先 提供一段文章、一幅图画、一种情境、一张表 格等引导性材料,然后以此为基础提出一系列 客观性问题。
比较适合测量富有结构的知识、理解能力以及
作文题
2. 编制原则
(1)根据考试目的、考试对象来确定作文文体和 要求; (2)根据社会需要、现实生活和学生实际设计命 题,作文命题要直接测量语文素养和书面表达能 力; (3)作文命题不能过于抽象,要让学生有话可说 ,有内容可写,有思路可走,有发挥的余地; (4)避免材料或话题出现测验偏倚,在确定选材 和写作意图时,要考虑对所有被试都是公平的, 并且试题应符合被试的心理特征。
测验编制的方法和步骤
随着个性化教育的发展,测验编制将更加注重个 性化评估,针对不同学生的特点和需求进行定制 化设计。
智能化评估
随着人工智能技术的发展,测验编制将更加注重 智能化评估,利用大数据和算法提高评估的准确 性和效率。
THANKS FOR WATCHING
感谢您的观看
提高测验的信度
通过增加题目的重复性和相似性,提高测验的一致性 和可靠性。
增强测验的效度
通过与教学目标紧密结合,确保测验能够真实反映学 生的学习成果和能力水平。
06 测验编制的应用和发展
在教育领域的应用
01
评估学生知识水平
通过测验编制,评估学生对学科 知识的掌握程度,为教学提供反 馈。
Hale Waihona Puke 02诊断学习困难测验编制的方法和步骤
目录
• 测验编制概述 • 测验编制的准备阶段 • 测验编制的实施阶段 • 测验编制的评估阶段 • 测验编制的优化阶段 • 测验编制的应用和发展
01 测验编制概述
测验编制的定义
测验编制是指根据测验目的和要求, 选择适当的测验题目,经过合理的组 合和编排,形成具有特定结构和内容 的测验的过程。
测验编制的结果可以为决策者提 供参考依据,辅助制定教育政策、 课程设置等。
测验编制的基本原则
目的性原则
测验编制应具有明确的目的性和针对性, 针对特定的目的和要求进行设计。
有效性原则
测验编制应确保测验的有效性,即能 够准确、全面地评估被试者的能力水
平。
客观性原则
测验编制应遵循客观性原则,确保测 验内容的公正、客观,避免主观性和 偏见。
03
02
选择题型
根据测验目的选择适当的题型,如 选择题、简答题、论述题等。
测验编制和实施的步骤
测验编制和实施的步骤1. 确定测验目标•确定测验目的,如评估学生的知识掌握程度、促进学习等。
•确定测验内容范围,包括知识点、技能、理解程度等。
2. 设计测验结构•确定测验形式,如选择题、填空题、简答题等。
•设计测验题型和题量,根据测验目标和内容确定不同题型的比例和数量。
•编写测验题目,确保题目清晰准确,并与测验目标相符。
3. 制定测验准备工作•确定测验时间和地点,根据学生的日程和教室安排合理安排测验时间和地点。
•准备测验材料,如试卷、答题卡等。
4. 实施测验•发放试卷和答题卡,确保每位学生都能得到试卷和答题卡。
•提醒学生仔细阅读试卷上的注意事项和答题要求。
•严格管理考场,避免作弊和干扰行为的发生。
•控制测验时间,确保学生能在规定时间内完成试卷。
•收集答卷,确保每个学生的答卷都被收集到。
5. 批改和分析测验结果•根据设定的评分体系对学生答卷进行批改。
•分析学生的得分情况,了解学生在不同知识点和题型上的表现。
•对学生答卷进行合理的评价和反馈,帮助他们了解自己的不足和改进方向。
6. 总结和改进测验•总结测验的优点和不足,包括测验的难易程度、有效性等方面。
•根据总结的结果,调整测验的设计和实施方法,以提高测验的质量。
•参考学生的表现和反馈,对教学内容和方法进行改进,以更好地帮助学生提高。
7. 反思和反馈•对测验过程进行反思,包括准备工作、实施过程等方面的问题和改进。
•向学生反馈测验结果,包括总体的成绩和个人的表现,鼓励学生继续努力。
以上就是测验编制和实施的基本步骤,通过合理的设计和实施,可以提高测验的准确性和有效性,帮助教师评估学生的学习情况,并指导后续的教学。
教育测量与评价期末复习题
第一章教育测量与评价的学科发展一、测量与评价基本问题1、教育测量①测量三要素②教育测量概念:针对学校教育影响下学生各方面的发展,从量的规定性上予以确定和描述的过程。
③教育测量的特点问题:教育测量与物理测量的区别是什么?④量表的概念,按测量精确程度分为哪四种。
2、教育评价①教育评价概念:按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。
②著名的测量与评价领域人及名言格兰朗德(N.E.Gronlund)认为,评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的(课堂)系统过程;评价包括对学生的定量描述(测量)和定性描述(非测量)两方面。
“教育测量与评价是所有成功教学的基础”。
斯塔费尔比姆说,“评价最重要的意图不是为了证明,而是为了改进。
”3、相关概念①教育测量与评价关系②测验与考试二、历史发展1、著名的测量与评价领域人及名言①桑代克“无论什么东西,只要存在的,总存在于数量之中。
”②麦柯尔(W.A.Mecall)“任何东西,存在于数量中的,都可以被测量。
”问题:请列举教育测量与评价领域三个重要人物及名言三、学科地位和作用1、当今教育科学研究的三大领域2、教育测量与评价在教育改革中的作用①教育系统②改革突破口3、教育测量与评价是教师的专业素养和能力第二章教育测量与评价的类型和功能一、从不同的角度分为哪些类型例如:1、从运用时机分为-------?2、形成性测量与评价?3、形成性测量、诊断性测量与评价和总结性测量与评价区别?二、教育测量与评价四大功能教育判断的功能、改进教师教学的功能、促进学生学习的功能、行使教育管理的功能第三章质量特性1、教育测量与评价包括哪四度?考虑方案的可用性。
(P86)一、信度1、概念、分类2、模型 X=T+E,反映的是误差信度反映的是()A、高低分B、误差C、难易程度D、有效性3、具体估算⑴异质性信度:重测、复本概念⑵同质性信度:分半信度克龙巴赫(cronbach)系数①概念②区别③相关系数⑶百分比一致性(标准参照测验的信度)⑷评分者信度(相关系数)4、信度运用⑴测量标准误概念⑵通过与标准误关系估算真分数范围(计算题)二、效度1、包括哪些?① APA:1974年美国心理学会为了规范效度研究,把效度分为三类内容效度、结构效度和效标关联效度。
第四章--教育测验编制的一般步骤与方法
创造
综合运用
分析综合
简单应用
应用
理解
理解
识记
知识
*加涅的教育目标分类法
加涅将教育目标分为认知领域、态度领域 和技能领域,其中,他将认知领域的目标又分
为三类:
1.言语/视觉信息:以言语或视觉形式存 储在记忆中的事实性知识;
2.智力技能:指用符号操纵环境的能力。 由分辨、概念学习和规则学习三种能力组成;
1.每一题只能包含一个核心概念。
例10:北京是我国最大的政治、文化和经济中心。
2.试题应是非界限分明,避免模棱两可的语 句。
例11:我国南方的天气很热。
3.避免使用具有暗示性的字词和特殊点限定 性词句,如全都、绝不、都、可能、大概等。
例12:所有作家都会写诗。
4.题目陈述应简单明了,避免使用复杂的 句式结构,以减少因被试阅读能力而对测验产 生不利影响。应尽量采用正面叙述,避免用否 定,特别是双重否定句。
7.诱惑项与题干之间应有一定的相似性。
例8:英国的首都是:
①北京 ②伦敦 ③美国 ④墨西哥
8.选项之间应该避免意义相同或重叠。
例9:2×3=?
①大于4 ②小于10 ③6 ④8
9.应尽量避免“以上皆是”或“以上皆非” 的选项。只要举一个反例就能推翻这一选项。
10.正确答案应以随机方式安排在各个选项 里,不要有明显的位置趋势,以避免猜测因素的 影响。
1.列出教学目标清单 ①了解基本术语:写出每一个术语的定义、
识别代表每种天气的术语、确定最适合描述给 定天气的术语
②了解天气符:将每一种符号与它所代表的 天气相对应、画出每种天气的符号
③了解具体事实 ④理解天气形成的影响因素 ⑤解释气象图 ⑥测量相关的天气特性
教育测验的编制工作与实施方法
第二节 编制测验的一般步骤
(三)选择题 是由一个“题干”和几个“选项”所组成的试题,其功能是迷惑那 些无法确定正确答案的考生,测量学生对问题的理解、再认、 比较与辨别能力,以及思维的敏捷性和准确的判断力。一般又 分为单项选择题和多项选择题。 单项选择题——是一道试题中有几个可供选择的答案,要求考 生只能从中选择一个答案。又分为正误式和比较式两种。正误 式指一道试题中有几个答案,其中只有一个是正确的,其余都 是错误的。比较式指一道试题中有几个答案,要求考生通过比 较而作出最佳答案的选择。 多项选择题——是一道试题有几个答案,要求考生作两项或两 项以上的正确答案的选择。全选对才满分,否则不给分。
教育测验的编制工作与实施方法
第二节 编制测验的一般步骤
有实验证明布氏的六个类别中“分析”、“综合”是处于 同一层次水平的类别。
一些专家认为,布氏的“知识”“理解”“应用”的信度和 效度都比较高,而“分析”“综合”“评价”三个层次的信 度和效度都不明显。
我国教育工作者在吸收布卢姆目标分类法合理部分的 基础上提出的认知领域目标有五分法(识记、理解、 应用、分析综合、创造)和四分法(识记、理解、简 单应用、综合运用)。
教育测验的编制工作与实施方法
第二节 编制测验的一般步骤
3.行为目标 行为目标是教学设计中一种更具体的、可观察的教学 目标,亦称学习目标。 “是对学习者通过教学以后将能做什么的一种明确的、 具体的表述。” 主要描述学生通过学习以后预期产生的行为变化。
教育测验的编制工作与实施方法
第二节 编制测验的一般步骤
教育测验的编制工作与实施方法
测验的技术分析与鉴定——信度、效度、难度和区分度
例2:以上海高校二年级基础英语摸底测验中的四个例题为例,样本总数为 178人。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.填写双向细目表(排列各部分所占的比例) 准备一个含有教学目标与教学内容两个维 度的双向细目表,并具体说明测验题目和评 价任务样本的特点 ①横向设计:各个知识在整个测验的知识 范围内的相对地位和重要程度(确定各部分 知识所占的比重) ②纵向设计:了解各组知识在不同学习水 平中的具体要求,从而决定相应的比例 ③汇总与调整
5.说明书 ①目的、功能 ②选题的依据 ③实施程序、时限和注意事项 ④测验的评分标准 ⑤分数解释的依据 ⑥信度、效度资料
第二节
测验题目编制技术
一、客观性测验题目的编制
(一)客观题的优、缺点 客观题因其评分客观而得名。
优点:
1.适于测量知识、理解、应用、分析几个 层次的认知目标;不适和测量综合、评价两级认 知目标。 2.答案明确、回答简便,在一个测验中的 数量较多,可保证对知识内容的覆盖率。 3.有明确的标准答案,评分准确、简单、 可靠,利用计算机阅卷可节省人力、物力、财力。
0.94 0.16 0.57 0.30
0.15 0.13 0.45 -0.06
◆测验的标准化
一、标准化测验
学业成就测验分为教师自编测验和标准化测 验两类,二者的区别为: 1.标准化测验采用标准化程序来编制考题, 有通用性和可比性,而前者就个别班级命题,在 班际和校际之间缺乏通用性和可比性; 2.标准化测验对准确性和可靠性的要求较 高,然而教师自编测验限于条件达到这样的标准 比较困难,可低于0.6-0.8的信度要求。
其次,了解教育目标的分类: 纵向分类: 1.终极教育目标:用来指导教育政策、设 计教育方案; 2.中程教育目标:对终极教育目标的细化; 3.具体教育目标:对具体教育目标的细化。
横向分类: *美国心理学家、教育学家布鲁姆(Bloom, K. S)1956年提出的“教育目标分类法”。 他把教育目标分成了认知目标、情感目标 和运动技能目标,每项目标又分成不同的层次, 排列成由低到高的阶梯。 1.认知领域:知识、理解、运用、分析、 综合、评价 2.情感领域:接受、反应、赋予价值、组 织、形成品格 3.动作技能领域:知觉、模仿、操作、准 确、连贯和习惯化
收集相应的测验内容应遵循的原则: ① 测验材料要适合测验目的 ② 测验材料要能够代表该科教材的全部内容 (测验材料要有合理的覆盖面,突出基本内容及 重点内容,比例参照命题双向细目表) ③ 测验材料要有普遍性(要依据统一的教学 大纲) ④ 测验材料要适合学生的程度,并能鉴别学 生的学习水平(难度、区分度适中) ⑤ 测验材料要能激发学生的进取心(要有合 理的难度分布)
(三)测验设计 ① 测验形式的确定 纸笔测验、操作测验、口头测验 ② 测验题目形式的确定 客观性题目、主观性题目 ③ 测验具体题型的确定与题目编制 客观题包括选择题、是非题、匹配题、填空 题、简答题; 主观题包括论述题、操作题 ④ 测题数量的确定 原则:1.规定的测验时间 2.测验所用题型(客观题省时,主观 题费时)
(二)确定教育测验的内容 教育内容和测验内容不是同一关系,测验内容 只是教育内容一个很小的抽样。 编制“命题双向细目表”
测验目的 测验内容 内容范围 1 内容范围 2 内容范围 3 内容范围 4 内容范围 5 合计 知识 1 3 1 1 6 理解 13 5 5 3 6 32 运用 9 6 3 4 2 24 分析 4 3 2 4 3 16 综合 3 2 2 4 3 14 评价 2 2 2 2 8 合计 32 21 15 15 17 100
是非题的编制 是非题又叫做二项选择题,它通常给被试一个 句子要被试作出正、误的判断。这类题目适合考察 对基本概念、性质、原理、定则等的认知和判断。 编制题目需遵循的原则: 1.每一题只能包含一个核心概念。 例10:北京是我国最大的政治、文化和经济中心。 2.试题应是非界限分明,避免模棱两可的语 句。 例11:我国南方的天气很热。 3.避免使用具有暗示性的字词和特殊点限定 性词句,如全都、绝不、都、可能、大概等。 例12:所有作家都会写诗。
第一节
教育测验的编制
一、教育测验编制的基本程序 (一)确定测验的目的和目标 首先,要确定以下几个问题: 1.教育测验所要测量的是哪一种属性?是智力还 是学科成绩? 2.测验的对象是儿童还是成人?是幼儿、小学生、 中学生还是大学生? 3.测验的内容和范围,是语文还是数学? 4.测验的性质与用途,是选拔录取测验还是成绩 测验?是目标参照测验还是常模参照测验?是速 度测验还是难度测验都要一一加以明确。
我国测验目标的分类较多的采用布卢姆的 教育目标分类法,在吸收其合理部分的基础上 创造了认知领域目标五分法和四分法。 创 造 分析综合 应 用 理 解 综运用 简单应用 理 解 识 记
知 识
*加涅的教育目标分类法 加涅将教育目标分为认知领域、态度领域 和技能领域,其中,他将认知领域的目标又分 为三类: 1.言语/视觉信息:以言语或视觉形式存 储在记忆中的事实性知识; 2.智力技能:指用符号操纵环境的能力。 由分辨、概念学习和规则学习三种能力组成; 3.认知策略 :指统设学习者观察、思考 和解决问题能力的内在控制过程。
例 1 初中化学内容与教学目标细目表 测验目的 测验内容 第一章 氧 第二章 氢 第三章 碳 第四章 溶液 第五章酸碱盐 合计 知识 6 7 3 6 4 26 理解 3 2 1 3 3 12 运用 4 2 1 3 3 13 分析 4 3 1 1 5 14 综合 3 5 0 8 2 18 评价 2 2 2 6 5 17 合计 22 21 8 22 22 100
2.题干要尽量简洁,避免赘述。 例4:一个等边三角形,三角相等,均为60度;三边 相等,均为2厘米,周长6厘米,请问其面积为多 少? ①2 ②根号下3 ③6 ④1+根号下3 3.题干中尽可能用正面的方式来叙述。 例4:下面式中哪个不等于3/5? ①6/10 ②15/25 ③6/16 ④27/45 4.在考察理解和应用能力时,最好用新材料。 例5:下列哪种物质在体内新陈代谢时产生的热量大? ①1克脂肪 ②1克糖 ③1克淀粉 ④1克蛋白质
4.题目陈述应简单明了,避免使用复杂的 句式结构,以减少因被试阅读能力而对测验产 生不利影响。应尽量采用正面叙述,避免用否 定,特别是双重否定句。 例13:中国人几乎不可能没有一个人不曾走过曲 折的人生道路。 5.应避免直接抄课本,而应重新组织语句。 6.正确答案为“是”与“非”的题目数量 大致相等,且应以随机方式排列,避免被试猜 测。
3.阅读、计算、书写量 4.测验内容的覆盖面:总结性测验和大 规模统一考试的题量应多一些 5.测验的性质:常模参照测验应保证规 定时间内75%学生做完;目标参照测验应保证 规定时间内90%以上的学生做完。 ⑤ 测验时间的确定 速度测验要有严格的时间限制;难度测验应 以充分发挥考生能力而不致疲劳为原则。具体时 间可由专家或有经验的教师估计,或抽取部分考 生进行预测验(高度保密性:提前、分散) ⑥ 测验题目的编排 总原则:先按试题的形式及内容分类,再参 照试题难度,由易到难排列。
(四)测验的技术分析与鉴定 ◆信度、效度、难度和区分度的计算。 例2:以84年上海高校二年级基础英语摸底测验中 的四个例题为例,样本总数为178人。
题 序 52 79 87 91 组别 高分组 低分组 高分组 低分组 高分组 低分组 高分组 低分组 a 48* 45* 10 9 38* 18* 1 3 四个题分析结果 选答人数 b c d 0 0 0 1 0 2 18 0 20* 25 6 4* 3 1 6 10 4 12 15 19 13* 11 7 17* 难度 未做 0 0 0 4 0 4 0 10 区分度
目标 内容 知道 理解 解释 气象图 3 2 2 5 题目总数 9 15 9 15 12 12 20 60 100 题目比例 15 25 15 25 20
基本术语 天气符号 具体事实 影响天气形成因素 气压 风 温度 湿度和降水量 云 题目总数 题目百分比 1 1 1 1 2 6 10 1 1 1 1 2 6 10 1 1 1 1 2 6 10 3 10 4 7 6 30 50
(三)不同类型选择题的命题原则 选择题的编制 要求被试从测验所提供的选项中选出正确 答案的测题成为选择题。选择题在结构上包括 两部分:题干和选项。 目前主要的选择题型有:比较、因果、类推、 多项、多选、多项多选、最佳、最差等 编制题目需遵循的原则: 1.每个题干仅问一个明确的问题。 例3:三角几何共八角,三角三角,几何几何? ①2角 ②3角 ③4角 ④5角
8.选项之间应该避免意义相同或重叠。 例9:2×3=? ①大于4 ②小于10 ③6 ④8 9.应尽量避免“以上皆是”或“以上皆非” 的选项。只要举一个反例就能推翻这一选项。 10.正确答案应以随机方式安排在各个选项 里,不要有明显的位置趋势,以避免猜测因素的 影响。 以上原则均针对单选题,若编制多选题时,除 遵循以上原则外,还应注意:1.不要指名正确 选项的个数;2.正确选项数一般不要多于错误 选项数。
缺点:
1.不易编制,且花费时间较多。 2.易受考生阅读能力的影响。 3.难以排除考生对试题的随机猜测。 (二)客观题命题的一般原则 1.试题能反映教学内容的重点或知识点。 2.题目之间的相关性越低越好。 3.试题的文字力求浅显易懂、题意明确。 4.答案应该是明确、唯一的。 5.试题应按教育目标的要求,内容不能超 过超过受测团体的知识和能力。
2.列出教学内容要点
①气压:测量和报告气压;影响气压的因 素;气压与天气改变的关系 ②气温:测量并报告气温;影响气温的因 素;气温与天气形成的关系 ③湿度和降水量:测量并报告湿度;影响 湿度的因素;降水的形式;测量并报告降水量 ④风:测量风速和风向;影响风速和风向 的因素;说出代表风速和风向的符号 ⑤云 ⑥锋面
由上图可见,命题双向细目表由3个要素组成: 测验目标、测验内容以及二者的比例,即权重。权 重代表了这部分内容的相对重要性。
◆在真实的命题中,一般遵循如下顺序:
例:天气单元的教学目标 1.列出教学目标清单 ①了解基本术语:写出每一个术语的定义、 识别代表每种天气的术语、确定最适合描述给 定天气的术语 ②了解天气符:将每一种符号与它所代表的 天气相对应、画出每种天气的符号 ③了解具体事实 ④理解天气形成的影响因素 ⑤解释气象图 ⑥测量相关的天气特性