第四章 编制教育测验的一般原理与方法
教育测量与评价考试重点
第一章教育测量与评价的学科发展第一节教育测量与评价的基本问题1.测量:所谓测量,从广义上讲,就是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。
2.测量的要素(基本条件):测量的量具、测量的单位、测量的参照点。
3.教育测量就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
4.量表的特点:称名数据:不具有实在的数量意义,只是表明事物的类别或不同性质顺序数据:是以所测属性的数量大小为基础进行的等距量表:表示事物量的大小,而且具有相同的测量单位比率量表:除了具有量的大小和相等单位外,还具有绝对的零点5.教育测量与教育评价的联系与区别:测量是按照一定的法则和程序,对事物或现象在量上的规定性加以确定和描述的过程,旨在获得有一定说服力的数量事实;教育评价是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实(定性资料与定量资料)基础上,做出价值分析和价值判断。
因此,从这个意义上说,教育测量可以为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;而教育评价往往是教育测量过程的延续,是对测量结果的解释与应用。
第二节教育测量与评价的发展历史1.1864年法国费舍《作业量表集》,作为教师以后评定学生各科成绩的参照标准2.美国桑代克于1904年出版《精神与社会测量导论》,首次较系统地介绍了教育统计方法及编制测验的基本原理,它标志着以科学理论(包括统计学、教育学、心理学、哲学等)为指导的教育测量理论的诞生3.桑代克“无论什么东西,只要存在的,总存在与数量之中”4.麦柯尔“任何东西,存在于数量中的,都可以被测量”5.法国的比纳等人在1905年创编并发表了世界上第一个标准化智力测验第三节教育测量与评价的学科地位和作用1.新课改即《基础教育课程改革纲要》(试行)提出的要求:(1)建立促进学生全面发展的评价体系(2)发挥评价的教育功能,促进学生在原有水平上的发展(3)建立促进教师不断提高的评价体系。
第四章 教育测验的编制
• (二)题目分析
• 1.定量分析(略) • 2.定性分析
– (1)均衡性:试题所测量的内容能够代表学生学习 中要求掌握的学习任务吗?
– (2)相关性:试题是否再现相关的学习任务? – (3)简明性:试题的语言是否简单、明了?
26
• (4)合理性:试题的难度适中吗?是否有错误?是否存在 有争议的答案?
34
一、常见题型及其编制
• (一)选择题(multiple-choice items)及其编制原则 – 1.选择题的结构:题干(stem)和选项(alternatives) – 2.选择题的优缺点 – 优点: • (1)选择题可以测量被试各种不同层次的学习结果。 • (2)正确答案唯一。
35
• (3)可以加大试题容量,扩大试题覆盖的知识面。 • (4)有利于考察被试思维的敏捷性和准确的判断力。 • (5)通过对学生对干扰项(distracters)的选择,教师可
某种具体的目的,它明确规定测验所要达到的预 期结果或标准。它是编制测验的出发点和依据。
13
(1)测验目标与教育目标分类
• 测验目标的确定是以教育目标分类理论为基础的。 – 布卢姆等人的教育目标分类法 – 加涅的教育目标分类法 – 梶田叡一的教育目标分类法 – 我国认知目标的分类
14
15
16
我国认知目标的分类
19
3 .填写双向细目表
• 准备一个含有教学目标与教学内容两个维度的双向细目 表 – 横向设计 • 各个知识在整个测验的知识范围内的相对地位和 重要程度(确定各部分知识所占的比重)。这种 相对重要性可由该内容项目的教学课时的多少来 体现。
20
– 纵向设计 即决定每一目标层次所占比例。这一比例应与测验编制 者认为这个目标对受测学生的水平所具有的重要性相符。 一般主要是参考专家或有经验教师的意见而定。
教育测验编制原理与方法4
作文题
➢ 对人的逻辑思维、形象思维、书面表达等 多种能力的一种综合考查
分类
➢ 命题作文和条件作文 ➢ 记叙文、议论文、说明文等 ➢ 缩写型、改写型、续写型等
编制原则
➢ 根据考试目的、考试对象来确定作文文体和要 求
➢ 根据社会需要、现实生活和学生实际设计命题 ,作文命题要直接测量语文素养和书面表达能 力
25
45
第47页/共52页
应用
5 10 5 10
30
总体百分数
20 30 20 30
100
(一)设计测验的操作细目表
➢ 3. 使用单向归类系统(阅读理解技能)
阅读技能
识别文章中的细节 概括出文章的中心思想 判断文中事件出现的先后顺序 辨别文中所表述的关系 对文中内容进行推论 总体百分数
题目数
10 10 10 10 10 50
➢ B.气温
➢ 1.测量并报告气温;2.影响气温的因素;3.气温与天气形成的关系
➢ C.湿度和降水量
➢ 1.测量并报告湿度;2.影响湿度的因素;3.降水的形式;4.测量并报 告降水量
➢ D.风
➢ 1.测量风速和风向;2.影响风速和风向的因素;3.说出代表风速和风 向的符号
➢ E.云
➢ ……
➢ F.锋面
1
1
1
7
5
15
25
水量
云
2
2
2
6
12
20
题目总数 6
6
6
30
12
60
题目 10
10
10
50
20
100
百分比
第46页/共52页
(一)设计测验的操作细目表
现代教育测量与评价 简答论述题 历年考题分章节汇总
06231《现代教育测量与评价学》-- 简答论述题知识点第一章教育测量与评价的学科发展1.简述教育测量的特点。
P3 (2015年4月简答、2008年4月简答)①间接性和推断性。
②测量对象的模糊性和测量误差的不可避免性。
③量表具有多样性,结果具有相对抽象性。
2.如何理解教育测量的间接性和推断性? P3 (2011年4月简答)物理测量大多是直接性的。
虽然教育测量无一例外地关注到人类自身,但测量的内容主要是关于人的种种非物质属性。
目前,我们只能通过人的外显的行为或通过人对外界的一些刺激作出的反应,对人的知识技能、智力水平、思维品质、创造能力、心理素质、情感态度、道德品质等作出间接性的、推断性的测量。
3.教育测量与教育评价的区别与联系。
P7 2005年4月简答教育测量是针对教育效果或针对学生各方面的发展予以测量和描述的过程,旨在获得有一定说服力的数量事实,是一种以量化为主要特征的事实判断。
教育评价是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实的基础上,作出价值分析和价值判断。
教育测量为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;教育评价是教育测量过程的延续,是对教育测量结果的解释与应用,并朝着价值判断与释放教育功能的方向拓展。
4.简述教育测量与评价在教育改革中的作用。
P25 2012年4月简答当我们根据教育目标和计划,把教育方案、课程、教学等因素作用于学生身上,需要参照教育目标和计划,对教育效果进行测量评估、价值分析和判断。
所以教育评价在教育系统中对实现教育目标起着十分重要的作用。
(3 分)教育改革常常以教育测量与评价的改革作为突破口。
俗话说“考试是根指挥棒“就是这个意思。
(2分)考试与评价改革成为基础教育新课程改革的重要内容。
5.为什么说教育测量与评价是教师必备的知识技能修养? (专业素养和能力)P27 2018年4月论述(1)正确评价学生的发展是教师职业能力的重要组成部分;(4分)(2)在教书育人过程中,需要教师采用教育测量与评价多种方法,以弥补教师非正式观察的不足;(3分)(3)现代教自测量与评价的思想方法对于教师创造性地教学、因材施教、提高教学质量具有重要的作用;(3分)(4)国外教师教有普遍开设"教育测量与评价”这类课程。
教育测验编制的一般原理与方法23
试论述灵魂是否存在 ?并说明其理由
4,编制原
-则(4)当有多个论 述题时,可以设置 一个必答的论述题 ,剩下的题目可允
-许被试选择作答 右例
待补充
-4,编制原
则(5)最好在
题目中给出回 答本题所需的
-参考时间 右例
待补充
作文题
对人的逻辑思维、形象思维、书 面表达等多种能力的一种综合考查
第二节
测验蓝图设计与测验 编制要领
一、设计测验的基本考虑
1、确定测验目标 2、确定测验的属性是学科测验或是智力测验、人格测验 3、明确测验的性质和用途 4、明确测验对象 5、分析测验目标
二、设计测验蓝图 (一)测验蓝图的作用
1、保证样本的代表性和恰当性
2、确保题目合适的比例、难度
(二) 设计测验蓝图的步骤
-5,编写原
则(4)诱答项
-应具有似真性 右例
在下列元素中,哪一 种元素存在于蛋白质 中,而不存在于碳水 化合物或脂肪中? A.二氧化碳 B.氧 C.水 D.氮
-增加干扰选项似真性的具体方 -法有:
a.使用学生共同的错误观念
-或过失作为诱答项 b.以学生惯用的模糊性用语
-叙述诱答项 c.在正确选项和诱答项中使用 同样的“精确的”“重要的”等堂
白放在句子的 后面或中间, 而不要放在句
-子开头 右例
( 汽机
)发明了蒸
3,编写原
-则(5)所有空白处 的线段长度应当一 致,不能随正确答 案文字的多少而长 短不一,以免产生
-暗示作用 右例
待补充
-3,编写原
则(6)若答案
是数字,应指 明单位和数字
-的精确程度 右例
3除以10等于( )
编制教育测验的一般原理与方法
对于多部分测验,需要将各部分分数 合成为总分数,可以采用加权平均、 非加权平均等方法进行合成。
分数的解释与应用
要点一
分数解释
根据分数的分布、标准差、百分等级等指标,对分数进行 解释,以评估学生的知识、技能和能力水平。
要点二
分数应用
将测验分数应用于教育决策,如学生分班、教学改进、教 育资源分配等,以提高教育教学的针对性和有效性。
测验的质量指标
信度
测验的一致性程度,即 多次施测的结果是否稳
定可靠。
效度
测验的有效性程度,即 测验是否真实反映所要
测量的心理特质。
难度
测验的整体难度水平, 以及不同题目难度的分
布。
区分度
测验题目对不同水平学 生的区分能力。
02 测验编制的心理学基础
CHAPTER
心理测量学的概念
心理测量学是研究心理现象的测量和 评估的科学,它涉及到如何运用数学 和统计学的方法来量化个体的心理特 质、行为和认知水平。
来源
主要来源于测验的设计、施测过程、评分标准、被试 者的心理因素等方面。
测验误差的控制与减少
01
提高测验设计的科学性 和合理性,减少设计误 差。
02
确保施测环境、设备、 时间等因素的一致性, 减少环境误差。
03
制定明确的评分标准和 客观的评分方法,减少 评分误差。
04
培训施测人员,提高其 专业素养和责任心,减 少人为误差。
心理测量学的应用
心理测量学在教育领域的应用广泛,包括学生评估、教师评价、课程设计等方面。 心理测量学在职业领域也有广泛应用,如人才选拔、职业规划、职业培训等方面。
此外,心理测量学还应用于临床心理学、心理咨询、人格评估等多个领域。
教育测量与评价复习资料
第一章教育测量与评价的学科发展1.测量的三要素:量具、测量的单位、测量的参照点。
2.教育测量是为了了解学生的发展,尤其是为评价学习成绩而进行的测量活动。
这是教育测量活动最原始的动机,也是教育测量学科发展最早的立足点。
3.教育测量的特点:间接性和推断性、测量对象的模糊性和测量误差的不可避免性、量表具有多样性以及结果具有相对抽象性。
4.史蒂文斯根据测量的精确度将量表分为:称名量表、顺序量表、等距量表和比率量表四种水平。
称名量表是用来对事物活人的心理现象进行分类,指派的数值没有数量意义,只是表明事物的类别和性质不同;顺序量表也用于对事物活人的心理现象进行分类,这种分类基于所测属性在数量大小基础上进行的有序得分类,四等级评分法和五分法都是顺序量表;等距量表不但能在一个连续体上表示事物量的大小,而且具有形同的测量单位,但她的零点是相对的,是人为规定的;比率量表是最高水平的量表,除了具有量的大小和相同的单位,还具有绝对的零点。
5.教育评价的概念:格兰朗德:评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的系统过程,评价=测量(定量描述)+非测量(定性描述)+价值判断斯塔费尔比姆:评价是一种划定、获取和提供叙述性和判断性信息的过程,评价最重要的不是为了证明,而是为了改进。
泰勒:评价过程本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程。
日本桥本重治:评价师与教育的目标和价值有明确关系的概念,是按照教育目标和价值观对学生学习成果及教育计划的效果等进行测量的过程。
因此,评价的概念重点在于以教育目标为标准的价值判断。
布鲁姆:评价是为了某个目的而进行的,对各种想法、作品、解答、方法、资料等的价值作出判断的活动。
所谓教育评价,是指按照一定的价值标准和教育目标,利用测量和非测量的各种方法系统的收集资料信息,对学生的发展变化和影响学生发展变化的各种要素进行价值分析和价值判断,并未教育决策提供依据的过程。
6.桑代克在《精神与社会测量导论》中提到:无论什么东西,只要存在的,总存在与数量之中。
教育测验编制的一般原理与方法2
-试题的编制比较容易,受猜 测的影响比较小
待补充
3,编写原则
-(6)正句和误句 的排列要随机化,
-且数量应大致相等 右例
待补充
填空题
填空题用来考查被试对知识的记忆和理解 能力,在诊断性测验中特别适用。
-1,优点 - 受被试猜测的影响小,评分
比较客观
-2,缺点 - 填空题偏重于测量被试的
知识记忆成程度,使用过多 容易养成死记硬背的习惯
3,编写原则
-(1)题意要明确 ,限定要严密,空 白处应填的答案是
-唯一的 右例
只有(
),才能
在考试中获得好成绩
3,编写原则
-(2)空白处所填 写的应是关键词语 ,并且要和上下文 有密切的关系,使 被试不至于填写困
-难 右例
1996年我国科技界有( )新发明
3,编写原则
-(3)题目中空白 地方不能太多,以 免句子变得支离破 碎,不利于被试理
可以加大试题容量,抽取广泛有效的代表性样本,使试题覆盖的知识范围 广
-有利于考查被试思维的敏捷性和准确的判断力; -采用大量的似真选择项使结果易于诊断
-3,缺点 -编制良好的选择题较花费时 -间,且要有专门的命题技巧
难以考核被试完全的推理能 力、综合运用所学知识的能 力、有效的总结能力、严密 的表述能力和写作能力,对 被试的发散思维能力则更是
编制教育测验的一般原理与方法
第一节 测验题目类型与测量功能
一、客观题试题的特点及其 编写技巧
选择题 匹配题 供答题
选择题
-1,结构:题干+选项 -2,优点: -可以用来测量学生各种不同层次的学习结果,应用广泛; -评分标准统一、客观,不受评分人主观因素和答卷人提出的意料之外的答 -案等影响,可利用电脑迅速评卷;
教育测量与评价期末复习题
第一章教育测量与评价的学科发展一、测量与评价基本问题1、教育测量①测量三要素②教育测量概念:针对学校教育影响下学生各方面的发展,从量的规定性上予以确定和描述的过程。
③教育测量的特点问题:教育测量与物理测量的区别是什么?④量表的概念,按测量精确程度分为哪四种。
2、教育评价①教育评价概念:按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。
②著名的测量与评价领域人及名言格兰朗德(N.E.Gronlund)认为,评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的(课堂)系统过程;评价包括对学生的定量描述(测量)和定性描述(非测量)两方面。
“教育测量与评价是所有成功教学的基础”。
斯塔费尔比姆说,“评价最重要的意图不是为了证明,而是为了改进。
”3、相关概念①教育测量与评价关系②测验与考试二、历史发展1、著名的测量与评价领域人及名言①桑代克“无论什么东西,只要存在的,总存在于数量之中。
”②麦柯尔(W.A.Mecall)“任何东西,存在于数量中的,都可以被测量。
”问题:请列举教育测量与评价领域三个重要人物及名言三、学科地位和作用1、当今教育科学研究的三大领域2、教育测量与评价在教育改革中的作用①教育系统②改革突破口3、教育测量与评价是教师的专业素养和能力第二章教育测量与评价的类型和功能一、从不同的角度分为哪些类型例如:1、从运用时机分为-------?2、形成性测量与评价?3、形成性测量、诊断性测量与评价和总结性测量与评价区别?二、教育测量与评价四大功能教育判断的功能、改进教师教学的功能、促进学生学习的功能、行使教育管理的功能第三章质量特性1、教育测量与评价包括哪四度?考虑方案的可用性。
(P86)一、信度1、概念、分类2、模型 X=T+E,反映的是误差信度反映的是()A、高低分B、误差C、难易程度D、有效性3、具体估算⑴异质性信度:重测、复本概念⑵同质性信度:分半信度克龙巴赫(cronbach)系数①概念②区别③相关系数⑶百分比一致性(标准参照测验的信度)⑷评分者信度(相关系数)4、信度运用⑴测量标准误概念⑵通过与标准误关系估算真分数范围(计算题)二、效度1、包括哪些?① APA:1974年美国心理学会为了规范效度研究,把效度分为三类内容效度、结构效度和效标关联效度。
第四章--教育测验编制的一般步骤与方法
创造
综合运用
分析综合
简单应用
应用
理解
理解
识记
知识
*加涅的教育目标分类法
加涅将教育目标分为认知领域、态度领域 和技能领域,其中,他将认知领域的目标又分
为三类:
1.言语/视觉信息:以言语或视觉形式存 储在记忆中的事实性知识;
2.智力技能:指用符号操纵环境的能力。 由分辨、概念学习和规则学习三种能力组成;
1.每一题只能包含一个核心概念。
例10:北京是我国最大的政治、文化和经济中心。
2.试题应是非界限分明,避免模棱两可的语 句。
例11:我国南方的天气很热。
3.避免使用具有暗示性的字词和特殊点限定 性词句,如全都、绝不、都、可能、大概等。
例12:所有作家都会写诗。
4.题目陈述应简单明了,避免使用复杂的 句式结构,以减少因被试阅读能力而对测验产 生不利影响。应尽量采用正面叙述,避免用否 定,特别是双重否定句。
7.诱惑项与题干之间应有一定的相似性。
例8:英国的首都是:
①北京 ②伦敦 ③美国 ④墨西哥
8.选项之间应该避免意义相同或重叠。
例9:2×3=?
①大于4 ②小于10 ③6 ④8
9.应尽量避免“以上皆是”或“以上皆非” 的选项。只要举一个反例就能推翻这一选项。
10.正确答案应以随机方式安排在各个选项 里,不要有明显的位置趋势,以避免猜测因素的 影响。
1.列出教学目标清单 ①了解基本术语:写出每一个术语的定义、
识别代表每种天气的术语、确定最适合描述给 定天气的术语
②了解天气符:将每一种符号与它所代表的 天气相对应、画出每种天气的符号
③了解具体事实 ④理解天气形成的影响因素 ⑤解释气象图 ⑥测量相关的天气特性
3_教育测验的编制原理与方法
识材料意义的能力。领会超越了单纯的记忆,
代表着最低水平的理解,它又可分为转化、 解释和推断三种。
认知领域目标分类
3、运用
指在具体的情境中使用抽象概念,这些抽象概 念包括一般的概念、程序的规则或概括化的方法, 以及专门性的原理、观念和理论。运用代表了较高
水平的理解,比如用二元一次方程解答工程性质的
应用题,又如把其它文献中已经提出来的新论点用
D.风
1.测量风速和风向;2.影响风速和风向的因素;3.说出代表风速和风 向的符号
E.云
……
F.锋面
……
(一)设计测验的操作细目表
1.编写细目表
填写双向细目表(排列各部分所占的比例)
准备一个含有教学目标与教学内容两个维度的双向 细目表,并具体说明测验题目和评价任务样本的特 点
对布鲁姆教育目标分类的评价
布鲁姆的教育目标分类便于全面描述教
学目标和评定教学,但未揭示各级层次
的智力技能的心理机制,因而无法指导
教师用什么方法或提供什么学习条件来
实现教学目标。
对布鲁姆教育目标分类的评价
总结:教育目标分类系统对认知领域中的
教学目标由低到高进行划分,符合能力由 简单到复杂发展原则。认知领域分类标准
来引证自己类似的实验结果。
认知领域目标分类
4、分析
指将一种传播内容(现象、事物、过程) 分解成为它的组成因素和组成部分,以便弄 清各种观念的有关层次,或者弄清所表述的 各种观念之间的关系。分析比运用的智能水 平更高,可分为要素分析、关系分析和组织 原则分析三种。
认知领域目标分类
5、综合
指将各种要素及组成部分组成一个整体,
纵向设计 各个知识在整个测验的知识范围内的相对地位和重 要程度(确定各部分知识所占的比重) 横向设计 了解各组知识在不同学习水平中的具体要求,从而 决定相应的比例 汇总与调整
教育测验的编制工作与实施方法
第二节 编制测验的一般步骤
(三)选择题 是由一个“题干”和几个“选项”所组成的试题,其功能是迷惑那 些无法确定正确答案的考生,测量学生对问题的理解、再认、 比较与辨别能力,以及思维的敏捷性和准确的判断力。一般又 分为单项选择题和多项选择题。 单项选择题——是一道试题中有几个可供选择的答案,要求考 生只能从中选择一个答案。又分为正误式和比较式两种。正误 式指一道试题中有几个答案,其中只有一个是正确的,其余都 是错误的。比较式指一道试题中有几个答案,要求考生通过比 较而作出最佳答案的选择。 多项选择题——是一道试题有几个答案,要求考生作两项或两 项以上的正确答案的选择。全选对才满分,否则不给分。
教育测验的编制工作与实施方法
第二节 编制测验的一般步骤
有实验证明布氏的六个类别中“分析”、“综合”是处于 同一层次水平的类别。
一些专家认为,布氏的“知识”“理解”“应用”的信度和 效度都比较高,而“分析”“综合”“评价”三个层次的信 度和效度都不明显。
我国教育工作者在吸收布卢姆目标分类法合理部分的 基础上提出的认知领域目标有五分法(识记、理解、 应用、分析综合、创造)和四分法(识记、理解、简 单应用、综合运用)。
教育测验的编制工作与实施方法
第二节 编制测验的一般步骤
3.行为目标 行为目标是教学设计中一种更具体的、可观察的教学 目标,亦称学习目标。 “是对学习者通过教学以后将能做什么的一种明确的、 具体的表述。” 主要描述学生通过学习以后预期产生的行为变化。
教育测验的编制工作与实施方法
第二节 编制测验的一般步骤
教育测验的编制工作与实施方法
测验的技术分析与鉴定——信度、效度、难度和区分度
例2:以上海高校二年级基础英语摸底测验中的四个例题为例,样本总数为 178人。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
客观性试题
客观性试题的功用
客观性试题主要是因为评分客观而得名,它的正确答案在测验前就
已准备好,不同评分者各自独立评分,所得结果基本上是相同的。客观 性试题一般适用于测量知识的掌握、理解、应用、分析几个层次的教学 目标。客观性试题的答案明确,作答简便,因而在限定的时间内测验可 以包含足够数量的试题,能保证对知识内容的覆盖。 客观性试题的类型 常用的类型有: (1)选择题 ; (2)是非题; (3)配合题 ; (4)填空题;(5)简答题。
(2)空白处所填写的应是关键词语,并且要和上下 文有密切的关系,使被试不至于填写困难。 例:1996年我国科技界有 新发明。
填空题
(3)题目中空白地方不能太多,以免句子变 得支离破碎,不利于被试理解题意。
例:连接 市与 的是 河
(4)尽量将空白放在句子的后面或中间,而 不要放在句子开头。
例: 发明了蒸汽机
填空题
(5)所有空白处的线段长度应当一致,不能 随正确答案文字的多少而长短不一,以免 产生暗示作用。
(6)若答案是数字,应指明单位和数字的精 确程度。
简答题
较适合于测量被试被基本知识、概念和原理
的掌握、记忆情况。 1. 优点
编制较为简单、灵活; 增加知识考核的准确度和深度; 不受猜测因素的影响
解释性测验题
在典型选择题的基础上,经教育测验专家改良
后,发展成解释性测验题(interpretiveexercise question)。解释性测验题一般是先 提供一段文章、一幅图画、一种情境、一张表 格等引导性材料,然后以此为基础提出一系列 客观性问题。
比较适合测量富有结构的知识、理解能力以及
作文题
2. 编制原则
(1)根据考试目的、考试对象来确定作文文体和 要求; (2)根据社会需要、现实生活和学生实际设计命 题,作文命题要直接测量语文素养和书面表达能 力; (3)作文命题不能过于抽象,要让学生有话可说 ,有内容可写,有思路可走,有发挥的余地; (4)避免材料或话题出现测验偏倚,在确定选材 和写作意图时,要考虑对所有被试都是公平的, 并且试题应符合被试的心理特征。
作文题
对人的逻辑思维、形象思维、书面表达等多
种能力的一种综合考查
1. 分类
(1)根据提供题目或提供材料的角度,可分为命题作 文和供料作文(或称条件作文); (2)根据文体可以分为记叙文、议论文、说明文、应 用文等; (3)根据所供材料的处理方式可以分为:缩写型、改 写型、撮写型、填空型、续写型。
论述题
2. 缺点
取样范围比较小且不均匀,所使用的试卷无法
有效地代表学科的全部主要,所测结果无法真 正代表被试的学习成就,从而影响测验的效度 ; 评分的主观性强; 因被试回答过于自由,回答方向又不尽相同, 难于测得预期结果,重点容易失控; 被试作答和评分阅卷都相当费时
论述题
3. 编制原则
(1)试题应该用来测量较高层次的教学目标 (2)要明确而系统地陈述问题,使被试能清楚地 了解题目的要求 (3)一般应采用答案具有统一定论的试题 (4)当有多个论述题时,可以设臵一个必答的论 述题,剩下的题目可允许被试选择作答 (5)最好在题目中能给出回答本题所需的参考时 间
选择题(二)
选择题的类型 常用的类型有: ① 辨识选择; ② 阅读选择; ③ 最佳选择; ④ 图解选择; ⑤ 归类选择;
⑥ 承接选择;
⑦ 排序选择; ⑧ 填空选择。
选择题(二)
编写原则
(1)题干意义完整并能表达一个确定的问题 例:比较下面两题,哪一题“题干”较为合适?
1. 一个命题双向细目表 A. 指出一个测验如何用来促进学 习 B. 可提供一个更平衡的内容取样 C. 须依据教学目标重要的顺序来 排列 D. 确定一个所使用的计分方法 2.当拟订一个成就测验的编制计 划时,使用细目表的主要目标是 A. B. C. D. 减少所需的时间 改进内容的取样 使试题编制更容易 增强测验的客观性
(2)题干简明
例:“当缺乏与中心观念有关联的似真但非正 确的选项时,则在编制下述哪一类型的试题时会 遇到困难?” “编制哪类试题时,如果缺乏似真而非正确的选 项时,会遇到最大的困难? A.简答题 B.是非题 C.选择题 D. 论述题
(3)题干不要滥用否定结构,要尽可能地采用正面陈 述 例:在耳的下列结构中,哪种与听力无关? 在耳的下列结构中,哪种有助于保持平衡? A.鼓膜 B.卵形窗 C. 半规管 D.耳蜗
是非题(二项选择题)
3. 编写原则
(1)考核的内容应是重要的知识,应有考核价值; (2)题目应多时测量理解能力,而不应测验记忆性的知识 ; (3)一个题目中只能有一个中心问题,或一个重要概念; (4)试题应做到是非界限分明,用词准确,避免模棱两可 的语句; (5)题目陈述应简单明了,避免使用复杂的句子结构;尽 量采用正面叙述,避免用否定和双重否定的语句; (6)正句和误句的排列要随机化,且数量应大致相等。
二、主观性试题的类型及其编写要领
论述题 作文题 表现性测验题
主观性试题
主观性试题的功用 主观性试题鼓励被试积极地组织所学资料,表达自己的观点。因此 ,主观性试题适合于测量较高层次的教学目标,尤其是适合于测量综合 、评价等目标层次。但被试在作答时,耗费的时间较长,在限定的时间 内,试题数量不可能太多,对知识的覆盖面较小;由于没有明确统一的 标准答案,评分易受主观因素的影响,因而误差较大。 主观性试题的类型 常用的类型有: (1)论述题; (2)作文题; (3)操作题。
选择题(一)
缺点: ① 由于选择题的数量多,每一个试题中除正确答案外,还要有 足够多的干扰答案,而且要求这些干扰答案与题干应有相当的逻 辑联系和似真性,所以编制良好的选择题较花费时间,且要有专 门的命题技巧; ② 难以考核被试完全的推理能力、综合运用所学知识的能力、 有效的总结能力、严密的表述能力和写作能力,对于被试的发散 思维(或求异思维)能力则更是如此; ③ 无法测量被试的思维(解题)过程; ④ 被试能仅凭猜测而选中正确答案。
论述题
较好地测量被试的组织、归纳和综合所学知识的能力
,运用掌握知识解决问题以及探讨问题和创新的能力
1. 优点
用来进行高层次的、复杂的学习结果的测量,可以用
在各种学科领域,特别适用于社会科学、人文科学等 ; 可以增进学生的思考、应用及解决问题的能力,对于 被试的学习态度和学习方式可以产生积极的影响; 可以增进学生的写作能力; 试题的编制比较容易,受猜测因素的影响很小
模拟情境的表现性测验 工作样本的表现性测验
表现性测验题
2. 编制原则 (1)测验材料和要求应与日常教学内容和目标有关 联,关注重要的学习结果 (2)将考查重点放在测量负责和高层次能力上 (3)将干扰测验目的的无关困难降到最低 (4)测验尽可能选择真实性的情境或问题 (5)提供必要的操作指导语,让学生了解作业任务 和期望内涵 (6)指导语简单清晰,向被试明确说明实际的情境 、任务以及评价的标准 (7)确定科学合理的计分方法
是非题(二项选择题)
这类题通常用于测量被试对基本概念、性质、原理 、原则的认识和判断区别事实与观点、认识事物因 果关系,以及一些简单的逻辑推理能力 1. 优点
编制容易,可适用于各种教材 记分客观,取样广泛
2. 缺点
仅能测量知识层次中最基本的结果,而无法测量高层
次的学习结果 受猜测因素的影响很大
选择题(一)
选择题的结构
选择题是由一个“题干”和几个“选项” 所组成。“题干”一般是提出问题或是待完 成的句子,“选项”是供被试选择的几个真 假不明的答案,让被试从中选出正确的答案 。
选择题(一)
优点: ① 可以用来测量学生各种不同层次的学习结果,不仅可以测量 学生掌握所学知识的程度,而且可以用来测量学生对所学知识的 理解、分析、判断、应用和综合的能力; ② 评分标准统一、客观,不受评分人主观因素和答卷人提出意 想之外的答案等影响,并且可以利用电脑迅速评卷,从而大大提 高测验的信度,提高评卷的速度和自动化水平; ③ 可以加大试题容量,抽取广泛有效的代表性样本,使试题覆 盖的知识范围广,可以克服传统考试中主观题目由于试题量少、 抽样窄而造成的测量效度不高的缺点; ④ 有利于考查被试思维的敏捷性和准确的判断力; ⑤ 采用大量的似真选择项使得结果易于诊断,通过对学生错误 选项的选择反应这个线索,教师便于发现、分析学生在学习中存 在的问题,以便及时的纠正。
第二节 测验目标与教育目标研究
(4)诱答项应具有似真性 例: 在下列元素中,那一种元素存在于蛋白质中 ,而不存在于碳水化合物或脂肪中? A.二氧有: a. 使用学生共同的错误观念或过失来作为诱答项。 b. 以学生惯用的模糊性用语叙述诱答项。 c. 在正确选项和诱答项中使用同样的“精确的”、 “重要的”等堂皇的用语来描述。 d. 诱答项长度和措辞的复杂性与正确性选项相似。 e. 在诱答项中使用额外的线索。如固定的用词,具 有科学味道的答案,以及和题干有语义上的联系 等。 f. 保持选项之间的同质性。
现代教育测量与评价学
第二学历小学教育、学前教育专业 泉州师范学院
2017/6/8
第四章
编制教育测验的一般原理与方法
测验题目类型与测量功能
测验目标与教育目标分类
测验蓝图设计与测验编制要领
第一节 测验题目类型与测量功能
测验题目的分类
(1)根据要求被试是选择答案还是自己提供答案来分, 测验题目可分为选择型试题和供答型试题。 (2)根据被试作答的范围和评分方法来分,测验题目可 分为主观性试题和客观性试题。
表现性测验题
所谓表现性测验题(performance test),
是指以行动、作品、表演、展示、口头回 答、操作、写作、科学研究、制作等更真 实的行为表现,来测量与评价学生在真实 情境或模拟真实情境下的所知与所能的一 种测验类型。
表现性测验题