教育测验编制原理与方法
教育测验编制的一般步骤与方法
缺点:
1.不易编制,且花费时间较多。 2.易受考生阅读能力的影响。 3.难以排除考生对试题的随机猜测。 (二)客观题命题的一般原则 1.试题能反映教学内容的重点或知识 点。
2.题目之间的相关性越低越好。 3.试题的文字力求浅显易懂、题意明 确。
2020/3/27 4.答案应该是明确、唯一的。
(三)不同类型选择题的命题原则
3
1
1
1
0
第四章 溶液 6
3
3
1
8
第五章酸碱盐 4
3
3
5
2
合计
26 12 13 14 18
评价
2 2 2 6 5 17
合计
22 21 8 22 22 100
由上图可见,命题双向细目表由3个要素组成:
测验目标、测验内容以及二者的比例,即权重。权
重代表了这部分内容的相对重要性。
2020/3/27
◆在真实的命题中,一般遵循如下顺序:
内容范围 3 1 5 3 2 2 2 15
内容范围 4
3444
15
内容范围 5 1 6 2 3 3 2 17
合计
6 32 24 16 14 8 100
2020/3/27
例 1 初中化学内容与教学目标细目表
测验目的 测验内容
知识 理解 运用 分析 综合
第一章 氧
6
3
4
4
3
第二章 氢
7
2
2
3
5
第三章 碳
① 测验材料要适合测验目的
② 测验材料要能够代表该科教材的全部 内容(测验材料要有合理的覆盖面,突出 基本内容及重点内容,比例参照命题双向 细目表)
③ 测验材料要有普遍性(要依据统一的 教学大纲)
教育测量与评价复习资料 (1)
第一章教育测量与评价的学科发展1. 测量的三要素:量具、测量的单位、测量的参照点。
2. 教育测量是为了了解学生的发展,尤其是为评价学习成绩而进行的测量活动。
这是教育测量活动最原始的动机,也是教育测量学科发展最早的立足点。
3. 教育测量的特点:间接性和推断性、测量对象的模糊性和测量误差的不可避免性、量表具有多样性以及结果具有相对抽象性。
4. 史蒂文斯根据测量的精确度将量表分为:称名量表、顺序量表、等距量表和比率量表四种水平。
称名量表是用来对事物活人的心理现象进行分类,指派的数值没有数量意义,只是表明事物的类别和性质不同;顺序量表也用于对事物活人的心理现象进行分类,这种分类基于所测属性在数量大小基础上进行的有序得分类,四等级评分法和五分法都是顺序量表;等距量表不但能在一个连续体上表示事物量的大小,而且具有形同的测量单位,但她的零点是相对的,是人为规定的;比率量表是最高水平的量表,除了具有量的大小和相同的单位,还具有绝对的零点。
5.教育评价的概念:格兰朗德:评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的系统过程,评价=测量(定量描述)+非测量(定性描述)+价值判断斯塔费尔比姆:评价是一种划定、获取和提供叙述性和判断性信息的过程,评价最重要的不是为了证明,而是为了改进。
泰勒:评价过程本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程。
日本桥本重治:评价师与教育的目标和价值有明确关系的概念,是按照教育目标和价值观对学生学习成果及教育计划的效果等进行测量的过程。
因此,评价的概念重点在于以教育目标为标准的价值判断。
布鲁姆:评价是为了某个目的而进行的,对各种想法、作品、解答、方法、资料等的价值作出判断的活动。
所谓教育评价,是指按照一定的价值标准和教育目标,利用测量和非测量的各种方法系统的收集资料信息,对学生的发展变化和影响学生发展变化的各种要素进行价值分析和价值判断,并未教育决策提供依据的过程。
第四章 教育测验的编制
• (二)题目分析
• 1.定量分析(略) • 2.定性分析
– (1)均衡性:试题所测量的内容能够代表学生学习 中要求掌握的学习任务吗?
– (2)相关性:试题是否再现相关的学习任务? – (3)简明性:试题的语言是否简单、明了?
26
• (4)合理性:试题的难度适中吗?是否有错误?是否存在 有争议的答案?
34
一、常见题型及其编制
• (一)选择题(multiple-choice items)及其编制原则 – 1.选择题的结构:题干(stem)和选项(alternatives) – 2.选择题的优缺点 – 优点: • (1)选择题可以测量被试各种不同层次的学习结果。 • (2)正确答案唯一。
35
• (3)可以加大试题容量,扩大试题覆盖的知识面。 • (4)有利于考察被试思维的敏捷性和准确的判断力。 • (5)通过对学生对干扰项(distracters)的选择,教师可
某种具体的目的,它明确规定测验所要达到的预 期结果或标准。它是编制测验的出发点和依据。
13
(1)测验目标与教育目标分类
• 测验目标的确定是以教育目标分类理论为基础的。 – 布卢姆等人的教育目标分类法 – 加涅的教育目标分类法 – 梶田叡一的教育目标分类法 – 我国认知目标的分类
14
15
16
我国认知目标的分类
19
3 .填写双向细目表
• 准备一个含有教学目标与教学内容两个维度的双向细目 表 – 横向设计 • 各个知识在整个测验的知识范围内的相对地位和 重要程度(确定各部分知识所占的比重)。这种 相对重要性可由该内容项目的教学课时的多少来 体现。
20
– 纵向设计 即决定每一目标层次所占比例。这一比例应与测验编制 者认为这个目标对受测学生的水平所具有的重要性相符。 一般主要是参考专家或有经验教师的意见而定。
第三章_教育测验的编制与实施
布卢姆的分类法 加涅的分类法 梶田叡一的教育
评价
认 综合 知 分析
领 应用 域 理解
知识
认知策略(问题解决)
高级规则
智力技能
规则 概念
智力技能
辨别
言语信息
精神运动领域目标
体验 目标
情感领域目标
认知领域目标
技 适应 能 练习 领 模仿 域 观察
运动技能
精神运动领域目标 提高 目标 情感领域目标
认知领域目标
两可的语句,以免引起对正确答案的争议。
? (5)题目陈述应简单明了,避免使用复杂 的句子结构,应尽量采用正面叙述,避免 用否定和双重否定的语句。
? 综合(将知识各部分重新组合,形成一个新的整体)编写、写作、创造、 设计、提出、组织、计划、综合、归纳、总结
? 评价(根据一定标准进行判断)鉴别、比较、评定、判断、总结、证明、 说出……价值
C:条件的表述
? C:学习者表现行为时所处的环境
? 环境因素(空间、光线、温度、气候、室内、室外、安 静等)
等堂皇的用语来叙述。
? 诱答项的长度和措辞的复杂性与正确性与正确选项相 似。
? 在诱答项中使用额外的线索。如固定的用词,具有科 学味道的答案,以及和题干有语义上的联系等。
? 保持选项之间的同质性。
? 5、不能对正确答案有任何暗示。无意的暗 示有:
? 1)语法结构上的不一致;
? 2)各选项在逻辑上不同,如正确答案中加以 “如”、“有时”、“通常”等修饰词,诱答 项中加以“总是”、“从未”、“所有”、 “绝对”、“准”等修饰词,或正确答案使用 与题干相同的词;
2)学习目标
? 学习目标:“是对学习者通过教学以后将能做什么的一种明确的、具 体的表述”。
教育测验编制原理与方法4
作文题
➢ 对人的逻辑思维、形象思维、书面表达等 多种能力的一种综合考查
分类
➢ 命题作文和条件作文 ➢ 记叙文、议论文、说明文等 ➢ 缩写型、改写型、续写型等
编制原则
➢ 根据考试目的、考试对象来确定作文文体和要 求
➢ 根据社会需要、现实生活和学生实际设计命题 ,作文命题要直接测量语文素养和书面表达能 力
25
45
第47页/共52页
应用
5 10 5 10
30
总体百分数
20 30 20 30
100
(一)设计测验的操作细目表
➢ 3. 使用单向归类系统(阅读理解技能)
阅读技能
识别文章中的细节 概括出文章的中心思想 判断文中事件出现的先后顺序 辨别文中所表述的关系 对文中内容进行推论 总体百分数
题目数
10 10 10 10 10 50
➢ B.气温
➢ 1.测量并报告气温;2.影响气温的因素;3.气温与天气形成的关系
➢ C.湿度和降水量
➢ 1.测量并报告湿度;2.影响湿度的因素;3.降水的形式;4.测量并报 告降水量
➢ D.风
➢ 1.测量风速和风向;2.影响风速和风向的因素;3.说出代表风速和风 向的符号
➢ E.云
➢ ……
➢ F.锋面
1
1
1
7
5
15
25
水量
云
2
2
2
6
12
20
题目总数 6
6
6
30
12
60
题目 10
10
10
50
20
100
百分比
第46页/共52页
(一)设计测验的操作细目表
现代教育测量与评价 简答论述题 历年考题分章节汇总
06231《现代教育测量与评价学》-- 简答论述题知识点第一章教育测量与评价的学科发展1.简述教育测量的特点。
P3 (2015年4月简答、2008年4月简答)①间接性和推断性。
②测量对象的模糊性和测量误差的不可避免性。
③量表具有多样性,结果具有相对抽象性。
2.如何理解教育测量的间接性和推断性? P3 (2011年4月简答)物理测量大多是直接性的。
虽然教育测量无一例外地关注到人类自身,但测量的内容主要是关于人的种种非物质属性。
目前,我们只能通过人的外显的行为或通过人对外界的一些刺激作出的反应,对人的知识技能、智力水平、思维品质、创造能力、心理素质、情感态度、道德品质等作出间接性的、推断性的测量。
3.教育测量与教育评价的区别与联系。
P7 2005年4月简答教育测量是针对教育效果或针对学生各方面的发展予以测量和描述的过程,旨在获得有一定说服力的数量事实,是一种以量化为主要特征的事实判断。
教育评价是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实的基础上,作出价值分析和价值判断。
教育测量为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;教育评价是教育测量过程的延续,是对教育测量结果的解释与应用,并朝着价值判断与释放教育功能的方向拓展。
4.简述教育测量与评价在教育改革中的作用。
P25 2012年4月简答当我们根据教育目标和计划,把教育方案、课程、教学等因素作用于学生身上,需要参照教育目标和计划,对教育效果进行测量评估、价值分析和判断。
所以教育评价在教育系统中对实现教育目标起着十分重要的作用。
(3 分)教育改革常常以教育测量与评价的改革作为突破口。
俗话说“考试是根指挥棒“就是这个意思。
(2分)考试与评价改革成为基础教育新课程改革的重要内容。
5.为什么说教育测量与评价是教师必备的知识技能修养? (专业素养和能力)P27 2018年4月论述(1)正确评价学生的发展是教师职业能力的重要组成部分;(4分)(2)在教书育人过程中,需要教师采用教育测量与评价多种方法,以弥补教师非正式观察的不足;(3分)(3)现代教自测量与评价的思想方法对于教师创造性地教学、因材施教、提高教学质量具有重要的作用;(3分)(4)国外教师教有普遍开设"教育测量与评价”这类课程。
教育测验编制的一般原理与方法23
试论述灵魂是否存在 ?并说明其理由
4,编制原
-则(4)当有多个论 述题时,可以设置 一个必答的论述题 ,剩下的题目可允
-许被试选择作答 右例
待补充
-4,编制原
则(5)最好在
题目中给出回 答本题所需的
-参考时间 右例
待补充
作文题
对人的逻辑思维、形象思维、书 面表达等多种能力的一种综合考查
第二节
测验蓝图设计与测验 编制要领
一、设计测验的基本考虑
1、确定测验目标 2、确定测验的属性是学科测验或是智力测验、人格测验 3、明确测验的性质和用途 4、明确测验对象 5、分析测验目标
二、设计测验蓝图 (一)测验蓝图的作用
1、保证样本的代表性和恰当性
2、确保题目合适的比例、难度
(二) 设计测验蓝图的步骤
-5,编写原
则(4)诱答项
-应具有似真性 右例
在下列元素中,哪一 种元素存在于蛋白质 中,而不存在于碳水 化合物或脂肪中? A.二氧化碳 B.氧 C.水 D.氮
-增加干扰选项似真性的具体方 -法有:
a.使用学生共同的错误观念
-或过失作为诱答项 b.以学生惯用的模糊性用语
-叙述诱答项 c.在正确选项和诱答项中使用 同样的“精确的”“重要的”等堂
白放在句子的 后面或中间, 而不要放在句
-子开头 右例
( 汽机
)发明了蒸
3,编写原
-则(5)所有空白处 的线段长度应当一 致,不能随正确答 案文字的多少而长 短不一,以免产生
-暗示作用 右例
待补充
-3,编写原
则(6)若答案
是数字,应指 明单位和数字
-的精确程度 右例
3除以10等于( )
最新第三章-教育测验的编制与实施新1分解课件PPT
难易度: A.较易 B.中等 C.较难 D.难度较大 认知度: Ⅰ识记 Ⅱ理解 Ⅲ简单应用 Ⅳ综合运
用
一般双向细目表纵向为要考查的内容即 知识点,横向列出的各项是要考查的能力, 或说是在认知行为上要达到的水平,通常采 用识记、理解、应用、分析、综合、评价六 个等级。这是按美国教育家布鲁姆(B.Bloom) 目标分类划分的,是从最简单的、基本的到 复杂的、高级的认知能力。每前一目标都是 后面目标的基础。即没有识记,就不能有理 解,没有识记与理解,就难以应用。
第一,考试作为一种常用的评价方法,世 界各国在经历过种种考试评价改革之后, 越来越多的发达国家和地区都觉悟到,考 试以及学科成就测验毕竟是一种最实在的 评价方法。对我们国家来讲,考试堪称是 一种具有中国传统优势和鲜明特色的评价 方法。教育改革绝对不能抛弃历史传承下 来的优秀文化。推进素质教育应该更加重 视考试改革。重视考试改革,一要继承, 二要创新。
试题需要改革创新,既可以在教材和 教辅中首次出现,也可以在关键性选拔考 试中首次出现,但要务必要有利于稳定教 学秩序,避免考前各个学校教师猜测捉迷 藏以及搞题海战术。
第二部分 考试命题双向细目表
考试命题双向细目表是一种考查目标 (能力)和考查内容之间的列联表。制作 考试命题双向细目表,是命题工作的一个 重要环节。双向细目表可以使命题工作避 免盲目性而具有计划性;使命题者明确测 验的目标,把握试题的比例与份量,提高 命题的效率和质量。同时,它对于审查试 题的效度也有重要的指导意义。
二、试题改革是推进素质教育 的切入点
全面推进素质教育,要有先进的教育思 想方法,按照教育规律办事;要脚踏实地以 及站在自己祖国坚实的文化土壤上。最关键, 还是要加大教育投入,对基层学校实施素质 教育的要加强教师专业能力建设和教学基本 条件设施建设,深化教育改革,寻找素质教 育的切入点。试题改革是我国推进素质教育 改革的最佳切入点。
教育测验的编制与实施
5、平波型分布 即中低高分人数差不多。学生的学业成 绩呈平波型分布,表明大中小几种难度 的试题比较接近,或学生的基础相差不 大,试题区分度低,需要提高区分度。 6、陡峭型分布 即中分人数很多,低高分人数极少。学 生的学业成绩呈陡峭型分布,表明难度 中等的试题比例过大,缺乏区分度或学 生的基础相差不大,要提高试题的区分 度。
布氏上述六类目标是有层次、有顺序的, 知识是最低层次,是最基本的要求。其 余依次是理解、应用、分析、综合、评 价。评价为认知领域的最高层次,是前 面五种目标的综合并增加了价值标准。 这六类目标,由简单到复杂,由低级到 高级依次排列,组成层次结构。
情感领域
接受:觉察到某一事物的存在,愿意接受某种 特定刺激和有选择的注意这个事物。 反应:受到动机的充分驱动,积极注意某种观 念,并伴随着主动参与行为。 价值评价:接纳并赋予某一客体、现象和行为 以价值。 组织:将各种不同的价值结合起来,解决它们 之间的冲突并开始建立内在的、一致的价值体 系。 由价值或价值复合体形成的性格化:形成的价 值体系在相当长的时间内控制个体行为,形成 内化的加之行为,产生性格化的人生模式。
606 × 308 × - 568 - 287 ———— ———— 168 181
×
√
835 - 217 ———— 618
√
(四)明确测验对象
应考虑被试的年龄特征、教育水 平和文化社会背景等因素
(五)确定测验内容
测验内容的确定,实际上也就是内容抽样 的决定和测验目标的确立相结合而成。 这一结合过程必须通过命题双向细目表来 确定。 命题双向细目表由3个要素构成:p106 测验目标 测验内容 测验目标和测验内容的比例
(六)测验的编制与组织
教育测验的编制与实施
按照测验的形式,可以将教育测验分为笔试测验、口试测验和实操测验。笔试测验主要通 过书面形式进行,口试测验则通过口头形式进行,实操测验则需要学生实际操作来展示自 己的技能和能力。
测验编制的基本原则
目的性原则
科学性原则
测验编制应紧扣教学目标和学习要求,确 保测验内容与教学和学习目标相一致。
激励学生进步
测验结果可以作为学生自我比较和 进步的动力,激励学生不断努力提 高自己的成绩。
教师专业发展与教学改进
教师专业培训
改进教学方法
Hale Waihona Puke 教育测验的编制和实施需要教师具备 一定的专业知识和技能,因此可以促 进教师的专业培训和进修。
根据学生的表现和反馈,教师可以调 整自己的教学方法和策略,提高教学 效果和质量。
确定测验目的
明确测验的目标和用途,如评估学生的学习水平、选拔优秀学生等。
设计测验蓝图
根据测验目的,确定测验的内容、题型、难度和时间分配等,确保测 验能够全面、准确地反映学生的能力。
制定评分标准
为每个题目制定详细的评分标准,确保评分过程客观、公正。
培训施测人员
对施测人员进行培训,确保他们了解测验的目的、内容、施测流程和 评分标准。
猜测因素等属性。通过项目分析可以对题目进行筛选和改进,提高测验
的整体质量。
02
难度系数
难度系数是指被试者在该题目上的通过率,难度系数过高或过低都会影
响测验的鉴别力和可靠性。在编制测验时,应合理设置题目的难度系数,
以使测验结果更加准确可靠。
03
区分度
区分度是指题目对不同水平被试者的鉴别能力,高区分度的题目能够更
测验的类型
按照测验目的分类
《教育测量学(第二版)》第三章 教育测验的编制与实施
新编21世纪教育学系列教材
第三章 教育测验的编制与实施 《 教 育 测 量 学 》
第二节 教育测验的项目编制技术
二、客观题的编制
特 点: 优 点:(一)其形态短小精悍,所占试题空间较小。
(二)是考查目标集中,便于教师对学生进行有针对性的指导。 (三)节省学生答题时间。 不 足:(一)容易导致学生机械记忆行为的产生,限制学生的想象力。 (二)考查的知识点过于聚焦,导致考查时容易遗漏部分知识点。 (三)无法对学生的高阶能力进行考查,使用范围上限制较大。 编制要求: (一)题目留空要恰当,空缺处应当是重要或关键的内容。 (二)每个空缺处应当有明确且唯一的正确答案。 (三)空缺处答案如果是数字,应指明单位和数字的精确程度。 (四)一个题目的空缺处不能太多,以免使句子变得支离破碎,不易于理解题意。 (五)避免对答案形式或内容的暗示。
新编21世纪教育学系列教材
第三章 教育测验的编制与实施 《 教 育 测 量 学 》
第二节 教育测验的项目编制技术
三、主观题的编制
2 特 点: 优 点:(一)受推断猜测的影响小。
(二)能够考查学生的实操能力。 不 足:(一)题目对测验内容的覆盖率较小,难以考查到每个知识点。
(二)测验准备和实施比较费时费事,且测验条件和无关变量不易控制。 (三)只能观察到学生操作的结果,不利于后期教育教学工作的改进。 编制要求: (一)明确测量目标,将测验内容操作化,对操作设定最低标准。 (二)选择合适的真实性程度。 (三)编写简洁明确的指导语 (四)确定计分的方法,通常有作品量表法、检核表和评定量表两种评定法。
新编21世纪教育学系列教材
第三章 教育测验的编制与实施 《 教 育 测 量 学 》
第一节 教育测验的基本编制程序
现代教育测量与评价学 名词解释 知识点
06231《现代教育测量与评价学》-- 名词解释知识点第一章教育测量与评价的学科发展测量:根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。
P2 2013年4月教育测量:教育测量就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
P3 2005年4月量表(量尺):是确定了测量单位和参照点并具有取值系统的测量工具。
P4 2016年4月称名量表:是最低水平的一种量表,用来对事物或人的心理现象进行分类。
顺序量表:也是用来对事物或人的心理现象进行分类,但这种分类是以所测属性的数量大小为基础进行的。
等距量表:不但能在一个连续体上表示事物量的大小,而且具有相同的测量单位。
等距量表的零点是相对的,即人为确定的相对零点。
比率量表:除了具有量的大小和相等单位外,还具有绝对零点。
比率量表是最高水平的量表。
评价:广义地讲,评价泛指衡量、判断人物或事物的价值。
P5教育评价:(广义的)是指按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。
P7 2010年4月考试:(广义的)泛指人类社会一切测度和甄别人的身心各个方面之群体或个体差异的活动。
P9考试:(狭义的)指由主试根据一定社会的要求,在一定场所,采取一定的方式方法,选择适当的内容,对应试者的德、学、才、体诸多方面或某方面所进行的有组织、有目的的测度或甄别的活动。
教育考试:在学校教育与人才选拔的过程中,教育考试是根据教育内容和目标,选择有代表性的内容和问题,按照一定的方式,对应试者的知识、技能等进行测量与评价的过程。
第二章教育测量与评价的类型和功能形成性测量与评价:是在教学过程中经常实施的,在性质上大致相当于现在的中小学单元测验。
P34 2012年4月诊断性测量与评价:是对经常表现出学习困难的学生所做的测量与评价,它的目的是对个人的问题行为及其原因进行诊断。
自学考试现代教育测量与评价网络课堂答案
教育测量与评价现代教育测量与评价学第一章教育测量与评价概述一、教育测量的含义(33分)本节测验题:智力测量属于A. 物理测量B. 心理测量C. 生理测量D. 社会测量二、教育测量的特点、教育评价的含义(35分)提出“凡物之存在必有其数量”命题的是谁?A. 麦柯尔B. 孟子C. 桑戴克D. 孔子三、教育评价的特点、教育测量与评价的产生(35分)现代教育评价产生的标志是A. 《比纳.西蒙量表》B. 科举考试C. T.B.C.F制D. “八年研究”四、现代教育测量与评价的发展(30分)第四代教育评价”的创立者是A. 枯巴和林肯B. 比纳和西蒙C. 桑代克和麦柯尔D. 泰勒与布鲁姆五、教育测量与教育评价相关概念辨析(30分)我国教育法规定的两项基本教育制度:一是教育督导制度,二是A. 教育评价制度B. 教育考试制度C. 教育测量制度D. 教育评估制度第二章教育测量与评价的信度一、信度概述(31分)样本统计量与总体参数越接近,说明测验的信度A. 越低B. 无法判断C. 越高D. 需要验证二、重测信度、复本信度、同质性信度(一)(35分)用同一个量表对同一组被试先后施测两次,所得结果的一致性程度是A. 等值性信度B. 等值稳定性信度C. 分半信度D. 重测信度三、同质性信度(二)、评分者的信度(一)(31分)若2个评分者评阅N份试卷,计算评分者的信度可用A. 斯皮尔曼等级相关系数公式B. 斯皮尔曼-布朗公式C. 积差相关系数公式D. 肯德尔和谐系数公式四、评分者的信度(二)、标准参照测验的信度(33分)估计标准参照测验的信度需要预先确定A. 淘汰的人数B. 达标的比例C. 通过的人数D. 决断的分数第三章教育测量与评价的效度一、效度概述、内容效度的含义(30分)下列适合于内容效度的测验是A. 能力倾向测验B. 成就测验C. 人格测验D. 性格测验二、内容效度的估计方法、结构效度(38分)下面哪种测验的效度不属于结构效度?A. 智力测验B. 焦虑测验C. 动机测验D. 学科测验三、效标关联效度(44分)效标关联效度也称为A. 实证效度B. 预测效度C. 同时效度D. 逻辑效度第四章教育测量与评价题目的难度和区分度一、难度及其计算、区分度及其计算(一)(40分)最适宜的难度系数是A. 0.50B. 0.00C. 1.00D. -1.00二、区分度的计算(二)、区分度与信度和难度的关系(31分)难度系数越接近何值,题目的区分度越大?A. 0.50B. 1.00C. 0.00D. -1.00第五章教育测量与评价分数的整理和转换一、教育测量与评价分数的整理(32分)被试者只有连续通过一次又一次的不同测验取舍分数线,才能最终获得成功。
第七章 测验编制的方法和步骤
11 3 2
5 0 1 1 0 2 2 2 3
P 0.9
0.65 0.55
0 . 12 5
D 0.2
0.3 0
0
0 .2 5
第二节 试测和测题筛选
(二)测题难度和区分度的应用 尽可能选择区分度在0.3以上的测题。 尽可能选择区分度在0.3以上的测题。 0.3以上的测题 根据测验的目的选择不同难度的题目。 根据测验的目的选择不同难度的题目。常模参照测 验一般难度应在0.2 0.8之间 难度分布接近正态分布。 0.2— 之间, 验一般难度应在0.2—0.8之间,难度分布接近正态分布。 为此,可将测题难度和区分度列成双向表, 为此,可将测题难度和区分度列成双向表,与测验难度 分布计划进行比较,决定测题的筛选。 分布计划进行比较,决定测题的筛选。 根据测验的双向细目表考查所选测题是否符合测验 内容和目标层级的分布要求。 内容和目标层级的分布要求。
拟定测验编制计划 试测和测题筛选 测验的评价
第七章 测验编制的步骤和方法
第一节 拟定测验编制计划
教育测验多种多样,编制测验的方法, 教育测验多种多样,编制测验的方法,也相应依测验 的性质而异。但是,不管什么样的教育测验, 的性质而异。但是,不管什么样的教育测验,其编制过程 一般均遵循类似的基本程序:测验目标与测验内容的确定; 一般均遵循类似的基本程序:测验目标与测验内容的确定; 测验的设计;测验的技术分析; 测验的设计;测验的技术分析;测验的鉴定或称测验的评 价。
第三节 测验的评价
一、评定测验的信度和效度 二、建立测验量表 三、编写测验说明书 测验说明书是测验能正确、合理地实施与应用的保证。 测验说明书是测验能正确、合理地实施与应用的保证。测验说明书 应包括以下内容: 应包括以下内容: 测验的编制人、编制时间、 (1)测验的编制人、编制时间、测验的法定权益 (2)测验的目的和功能 (3)测验选题的依据 测验的实施程序、 (4)测验的实施程序、时限及注意事项 (5)测验的评分标准 (6)测验分数解释的依据 测验的信度、效度资料,包括信度系数、 (7)测验的信度、效度资料,包括信度系数、效度系数及其估计 方法。 方法。
教育测验的编制与实施
针对120份调查问卷的分析可知,义务教育阶段数学教师对“错题”的正确识别状况令人担忧: 概念 错误(初中被调查者之中能够识别者占23%、小学被调查者之中能够识别者占87%);设计不当(初 中被调查者之中能够识别者占77.3%);表述不当(小学被调查者之中能够识别者占90.7%);超出 学生知识能力范围(初中被调查者之中能够识别者占79%、小学被调查者之中能够识别者占23%); 试题类型不当(初中被调查者之中能够识别者占17%、小学被调查者之中能够识别者占9%);与试题 编制要求相悖(初中被调查者之中能够识别者占74%);试题考查目标不明确(小学被调查者之中能 够识别者占19%)。
(1)教育测验目的直接影响着测验的编制; (2)明确不同教育测验目的的多重性、差异性; (3)充分考虑测验对象的教育基础与心理特点;
小学儿童思维以具体形象思维为主逐步向抽象逻辑思维主过渡
第一节 教育编制测验的一般原则
二、典型性与一致性原则(高信效度)
内容抽样具有代表性: (1)知识面的涵盖要广 (2)考核层次与教学要求相符合 (3)难度水平符合要求
(6)按测验的功能分类
• 调查测验 • 诊断性测验:主要用来测查学生在各个具体教学内容、
教学目标上学习的长处和不足,鉴别被试在学习功课方 面的困难,分析学生学习困难的原因,并提出相应的补 救措施。 • 水平测验 • 预测性测验 • 准备性测验
(7)按测验的用途分类 • 总结性测验:以测量成绩作为最终产物,目的是
基本方法:动宾结构的短语法,行为动词说明行为的类型,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
测验题目的编制
➢ 一、简答题与填空题
➢ 3.编制简答题的一些建议
➢题目措辞时,应使要求的答案简洁具体
➢以其他动物的肉为食的动物是
(
)
➢以其他动物的肉为食的动物属于
(
)类
➢不要直接引用教材上的陈述作为简答题的基 础
➢直接提问通常比不完整的陈述效果更好
第8页/共52页
➢如果答案要以数字单位的形式表示, 请标明要求的答案类型
第17页/共52页
➢除非某种重要的学习结果需要,一般 不使用否定式的题干 ➢下面哪个州不位于回归线以北? ➢下面哪个州位于回归线以南?
➢全部的选项都应与题干在语法上保持 一致
➢除非说明是多选题,否则一个题目应 该只有一个正确或者明显的最佳答案
第18页/共52页
测验题目编制
➢ 三、选择题 ➢ 3.设计选择题的建议 ➢用来测量理解力的题目应该具有一定的新 颖性,但也不要过于新颖 ➢所有的干扰项都应该是似是而非的 ➢选择题中应该有多少个选项?
➢给题目答案留的空白长度应该一样而 且都放在题目的右端
➢使用填空题时,需要学生填的空不要 太多
第9页/共52页
测验题目的编制
➢ 二、是非题 ➢ 1.基本特点 ➢用于测量事实性陈述、术语定义以及 定律表述是否正确的辨认能力
第10页/共52页
➢ 2.优点和局限性
➢优点:
➢效率高 ➢可以获得课程内容的大样本
和方法等重要问题
谁该接受批评?
测验?还是测验的使用者?
第1页/共52页
内容概要
➢ 测验题目的类型及其功能 ➢ 测验题目的编制 ➢ 测验的设计及编制要领
第2页/共52页
测验题目类型与测量功能
➢ 测验题目分类:选择型和供答型。
➢ 选择型一般要求被试在几个选项中选择正确的 答案,如是非题、匹配题、选择题等,后者要 求被试自己提供答案,如论文题、简答题、填 空题等。
➢ 若根据被试作答的范围和评分方法不同, 又可分为主观性试题和客观性试题。
第3页/共52页
➢ 客观性试题主要是因为评分客观而得名,它的正确 答案在测验前就已准备好,不同评分者各自独立评 分,所得结果基本上是相同的。
➢ 客观性试题一般适用于测量知识的掌握、理解、应 用、分析几个层次的教学目标。
➢ 客观性试题的答案明确,作答简便,因而在限定的 时间内测验可以包含足够数量的试题,能保证对知 识内容的覆盖。
➢干扰项在形式上与题干平行,在语 法上与题干一致
➢使干扰项与正确答案在长度、词汇、 句子结构和内容的复杂程度上相似
第21页/共52页
测验题目的编制
➢ 三、选择题 ➢ 3.设计选择题的建议 ➢避免使题干与正确答案之间存在语言联系 ➢不要通过选项的相对长度来提供答案的线索 ➢正确答案出现在选项重的位置应该大致平均 而且是随机的 ➢少用诸如“以上都不对”、“以上都对”的 选项 ➢如果其他题型更合适,就不要使用选择题
第19页/共52页
➢编制具有迷惑性的干扰项的方法 ➢使用学生最常见的错误 ➢使用与题干听起来重要的词,但不要过分 ➢使用那些在口语中与题干相联系的词 ➢使用课本上的语言或者其他具有真理性的 措辞
第20页/共52页
➢使用那些由于学生误解或者是粗心 大意而造成的错误答案➢干扰在内容上与正确答案同质或 者相似
第15页/共52页
➢局限性: ➢局限于对言语水平的测量 ➢难以找到足够多的似是而非的干扰项
第16页/共52页
测验题目的编制
➢ 三、选择题 ➢ 3.设计选择题的建议 ➢题干本身具有意义并以一个确定的问题呈现 ➢南美( ) ➢大多数居住在南美的殖民者来自于( ) ➢题干应包括尽可能多的内容,但与题干无关的 材料应该删去 ➢大多数南美国家的居民是来自西班牙的殖民 者。你将如何解释大量的西班牙殖民者定居 在那里呢?
第5页/共52页
测验题目的编制
➢ 一、简答题与填空题 ➢ 1.基本特点 ➢根据呈现的问题,学生以一个词、短 语、数字或者符号做出回答 ➢适合测量各种相对简单的学习结果 ➢问题答案可以由数字或符号表示的数 学和科学领域(此类问题用选择题的 方式进行测试,可能会不能达到测试 的目的)
第6页/共52页
➢ 2.优点和局限性 ➢优点: ➢容易编制 ➢学生必须提供答案,减少了通过 猜测获得答案的可能 ➢局限性: ➢不适合测量复杂的学习结果 ➢记分的难度
第4页/共52页
➢ 主观性试题主要包括论述题、操作题和作 文题等。
➢ 它们适合于测量较高层次的教学目标,尤 其适合于测量综合、评价等目标层次。
➢ 主观性试题鼓励被试积极地组织所学的资 料,表达自己的观点。被试在作答时,耗 费的时间较长,在限定的时间内,试题数 量不可能太多,对知识的覆盖面较小。由 于没有明确统一的标准答案,评分易受评 阅者的主观因素影响,因而误差较大。
如何正确看待测验?
如果没有测验,将会……
➢ 测验对学生的影响
– 对个人学习努力实施奖赏会更
➢ 产生焦虑
加困难
➢ 把学生分类,并贴上标
– 教育项目中的“优秀”作为目 标更加不可行,并难以实现
签
– 教育的公平性问题将加剧
➢ 预先期望直接影响自我 实现
– 社会阶级屏障更加不可逾越
– 缺少可靠证据,难以决定课程
➢局限性:
➢测量的学习结果种类有限(大多 为知识领域)
➢具有猜测性
第11页/共52页
测验题目的编制
➢ 二、是非题
➢ 3.编制是非题的一些建议
➢要判断正误,应避免过于宽泛的判断
➢美国总统是选举产生的(
)
➢美国总统通常是选举产生的
(
)
➢避免琐碎的陈述
➢避免使用否定句式,尤其是双重否定
➢避免使用长的复杂句型
第14页/共52页
➢ 2.优点和局限性 ➢优点: ➢较强的灵活性,可以用来测量多种类型的知识 和理解水平的学习内容 ➢在测量各种类型的学业成绩方面有广泛的应用 性 ➢摆脱了其他类型的客观题的局限性 ➢与填空题相比:呈现一个更加明确的问题 ➢与匹配题相比:不需要同质性的材料 ➢与判断题相比:减少了线索和猜测的可能性
第12页/共52页
➢如果不是测量因果关系,应避免在一 个判断中包含两个观点
➢避免使用没有任何来源的观点,除非 要测的是判断观点的能力
➢避免使用长度不一的正确判断和错误 判断
➢避免正确判断和错误判断地数量不合 比率
第13页/共52页
测验题目的编制
➢ 三、选择题
➢ 1.基本特点 ➢由一个问题和一列选项组成 ➢学生答题方式是选择正确的或者最佳 的选项 ➢错误的选项叫干扰项,目的在于干扰 那些知识掌握不牢固的学生答题