教育测验编制原理与方法4

合集下载

教育测验编制的一般步骤与方法

教育测验编制的一般步骤与方法

缺点:
1.不易编制,且花费时间较多。 2.易受考生阅读能力的影响。 3.难以排除考生对试题的随机猜测。 (二)客观题命题的一般原则 1.试题能反映教学内容的重点或知识 点。
2.题目之间的相关性越低越好。 3.试题的文字力求浅显易懂、题意明 确。
2020/3/27 4.答案应该是明确、唯一的。
(三)不同类型选择题的命题原则
3
1
1
1
0
第四章 溶液 6
3
3
1
8
第五章酸碱盐 4
3
3
5
2
合计
26 12 13 14 18
评价
2 2 2 6 5 17
合计
22 21 8 22 22 100
由上图可见,命题双向细目表由3个要素组成:
测验目标、测验内容以及二者的比例,即权重。权
重代表了这部分内容的相对重要性。
2020/3/27
◆在真实的命题中,一般遵循如下顺序:
内容范围 3 1 5 3 2 2 2 15
内容范围 4
3444
15
内容范围 5 1 6 2 3 3 2 17
合计
6 32 24 16 14 8 100
2020/3/27
例 1 初中化学内容与教学目标细目表
测验目的 测验内容
知识 理解 运用 分析 综合
第一章 氧
6
3
4
4
3
第二章 氢
7
2
2
3
5
第三章 碳
① 测验材料要适合测验目的
② 测验材料要能够代表该科教材的全部 内容(测验材料要有合理的覆盖面,突出 基本内容及重点内容,比例参照命题双向 细目表)
③ 测验材料要有普遍性(要依据统一的 教学大纲)

第四章教育测验编制的一般步骤与方法

第四章教育测验编制的一般步骤与方法

〔三不同类型选择题的命题原则 选择题的编制
要求被试从测验所提供的选项中选出正确 答案的测题成为选择题.选择题在结构上包括两 部分:题干和选项.
目前主要的选择题型有:比较、因果、类推、 多项、多选、多项多选、最佳、最差等
编制题目需遵循的原则: 1.每个题干仅问一个明确的问题. 例3:三角几何共八角,三角三角,几何几何? ①2角 ②3角 ③4角 ④5角
第二节 测验题目编制技术
一、客观性测验题目的编制
〔一客观题的优、缺点
客观题因其评分客观而得名. 优点:
1.适于测量知识、理解、应用、分 析几个层次的认知目标;不适和测量综合、
评价两级认知目标.
2.答案明确、回答简便,在一个测验 中的数量较多,可保证对知识内容的覆盖率.
3.有明确的标准答案,评分准确、简 单、可靠,利用计算机阅卷可节省人力、物
缺点: 1.不易编制,且花费时间较多. 2.易受考生阅读能力的影响. 3.难以排除考生对试题的随机猜测. 〔二客观题命题的一般原则 1.试题能反映教学内容的重点或知识点. 2.题目之间的相关性越低越好. 3.试题的文字力求浅显易懂、题意明确. 4.答案应该是明确、唯一的. 5.试题应按教育目标的要求,内容不能超过 超过受测团体的知识和能力.
察对基本概念、性质、原理、定则等的认知和判断.
编制题目需遵循的原则:
1.每一题只能包含一个核心概念.
例10:北京是我国最大的政治、文化和经济中心.
2.试题应是非界限分明,避免模棱两可的语句.
例11:我国南方的天气很热.
3.避免使用具有暗示性的字词和特殊点限定 性词句,如全都、绝不、都、可能、大概等.
1
1
7
5

2
2

第四章 教育测验的编制

第四章 教育测验的编制
25
• (二)题目分析
• 1.定量分析(略) • 2.定性分析
– (1)均衡性:试题所测量的内容能够代表学生学习 中要求掌握的学习任务吗?
– (2)相关性:试题是否再现相关的学习任务? – (3)简明性:试题的语言是否简单、明了?
26
• (4)合理性:试题的难度适中吗?是否有错误?是否存在 有争议的答案?
34
一、常见题型及其编制
• (一)选择题(multiple-choice items)及其编制原则 – 1.选择题的结构:题干(stem)和选项(alternatives) – 2.选择题的优缺点 – 优点: • (1)选择题可以测量被试各种不同层次的学习结果。 • (2)正确答案唯一。
35
• (3)可以加大试题容量,扩大试题覆盖的知识面。 • (4)有利于考察被试思维的敏捷性和准确的判断力。 • (5)通过对学生对干扰项(distracters)的选择,教师可
某种具体的目的,它明确规定测验所要达到的预 期结果或标准。它是编制测验的出发点和依据。
13
(1)测验目标与教育目标分类
• 测验目标的确定是以教育目标分类理论为基础的。 – 布卢姆等人的教育目标分类法 – 加涅的教育目标分类法 – 梶田叡一的教育目标分类法 – 我国认知目标的分类
14
15
16
我国认知目标的分类
19
3 .填写双向细目表
• 准备一个含有教学目标与教学内容两个维度的双向细目 表 – 横向设计 • 各个知识在整个测验的知识范围内的相对地位和 重要程度(确定各部分知识所占的比重)。这种 相对重要性可由该内容项目的教学课时的多少来 体现。
20
– 纵向设计 即决定每一目标层次所占比例。这一比例应与测验编制 者认为这个目标对受测学生的水平所具有的重要性相符。 一般主要是参考专家或有经验教师的意见而定。

现代教育测量与评价 简答论述题 历年考题分章节汇总

现代教育测量与评价 简答论述题 历年考题分章节汇总

06231《现代教育测量与评价学》-- 简答论述题知识点第一章教育测量与评价的学科发展1.简述教育测量的特点。

P3 (2015年4月简答、2008年4月简答)①间接性和推断性。

②测量对象的模糊性和测量误差的不可避免性。

③量表具有多样性,结果具有相对抽象性。

2.如何理解教育测量的间接性和推断性? P3 (2011年4月简答)物理测量大多是直接性的。

虽然教育测量无一例外地关注到人类自身,但测量的内容主要是关于人的种种非物质属性。

目前,我们只能通过人的外显的行为或通过人对外界的一些刺激作出的反应,对人的知识技能、智力水平、思维品质、创造能力、心理素质、情感态度、道德品质等作出间接性的、推断性的测量。

3.教育测量与教育评价的区别与联系。

P7 2005年4月简答教育测量是针对教育效果或针对学生各方面的发展予以测量和描述的过程,旨在获得有一定说服力的数量事实,是一种以量化为主要特征的事实判断。

教育评价是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实的基础上,作出价值分析和价值判断。

教育测量为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;教育评价是教育测量过程的延续,是对教育测量结果的解释与应用,并朝着价值判断与释放教育功能的方向拓展。

4.简述教育测量与评价在教育改革中的作用。

P25 2012年4月简答当我们根据教育目标和计划,把教育方案、课程、教学等因素作用于学生身上,需要参照教育目标和计划,对教育效果进行测量评估、价值分析和判断。

所以教育评价在教育系统中对实现教育目标起着十分重要的作用。

(3 分)教育改革常常以教育测量与评价的改革作为突破口。

俗话说“考试是根指挥棒“就是这个意思。

(2分)考试与评价改革成为基础教育新课程改革的重要内容。

5.为什么说教育测量与评价是教师必备的知识技能修养? (专业素养和能力)P27 2018年4月论述(1)正确评价学生的发展是教师职业能力的重要组成部分;(4分)(2)在教书育人过程中,需要教师采用教育测量与评价多种方法,以弥补教师非正式观察的不足;(3分)(3)现代教自测量与评价的思想方法对于教师创造性地教学、因材施教、提高教学质量具有重要的作用;(3分)(4)国外教师教有普遍开设"教育测量与评价”这类课程。

教育测验编制的一般原理与方法23

教育测验编制的一般原理与方法23
-题 右例
试论述灵魂是否存在 ?并说明其理由
4,编制原
-则(4)当有多个论 述题时,可以设置 一个必答的论述题 ,剩下的题目可允
-许被试选择作答 右例
待补充
-4,编制原
则(5)最好在
题目中给出回 答本题所需的
-参考时间 右例
待补充
作文题
对人的逻辑思维、形象思维、书 面表达等多种能力的一种综合考查
第二节
测验蓝图设计与测验 编制要领
一、设计测验的基本考虑
1、确定测验目标 2、确定测验的属性是学科测验或是智力测验、人格测验 3、明确测验的性质和用途 4、明确测验对象 5、分析测验目标
二、设计测验蓝图 (一)测验蓝图的作用
1、保证样本的代表性和恰当性
2、确保题目合适的比例、难度
(二) 设计测验蓝图的步骤
-5,编写原
则(4)诱答项
-应具有似真性 右例
在下列元素中,哪一 种元素存在于蛋白质 中,而不存在于碳水 化合物或脂肪中? A.二氧化碳 B.氧 C.水 D.氮
-增加干扰选项似真性的具体方 -法有:
a.使用学生共同的错误观念
-或过失作为诱答项 b.以学生惯用的模糊性用语
-叙述诱答项 c.在正确选项和诱答项中使用 同样的“精确的”“重要的”等堂
白放在句子的 后面或中间, 而不要放在句
-子开头 右例
( 汽机
)发明了蒸
3,编写原
-则(5)所有空白处 的线段长度应当一 致,不能随正确答 案文字的多少而长 短不一,以免产生
-暗示作用 右例
待补充
-3,编写原
则(6)若答案
是数字,应指 明单位和数字
-的精确程度 右例
3除以10等于( )

(完整版)教育测量与评价考试重点整理版

(完整版)教育测量与评价考试重点整理版

(完整版)教育测量与评价考试重点整理版课程性质和教学要求课程的性质:《教育测量与评价》是教育测量学与教育评价学内容的整合并侧重于教育测量的一门综合性教育课程,它着力探讨对教育教学效果进行测量、评价的原理和方法,是一门带有综合性、技术性、实践性、应用性等特征的应用性学科,是实现教育科学研究与教育管理科学化所必须借助的一门科学,也是教育学专业和小学教育专业所开设的一门必修专业基础课程。

教学目标和要求:理解《教育测量与评价》的基本概念、原理和方法,能正确使用各类标准化的教育测验、会作测验质量分析、能正确解释分数的含义,并学会运用这些知识,对学校教育、教学和研究实践中的实际问题,做出比较正确与合理的判断和评价,以促进教育管理现代化、教育研究科学化。

第一章教育测量与评价的学科发展教育测量与评价的基本问题教育测量与评价的发展历史教育测量与评价的学科地位和作用1.测量的定义史蒂文斯曾对测量作出以下定义:“就其广义来说,测量是按照法则给事物指派数字。

”我国有些学者认为:“测量是对客观事物进行某种数量化的测定”,“测量是按照一定的法则,用数字方式对事物的属性进行描述的过程”。

本书的观点:从广义上讲,测量就是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。

从以上对测量所下的各种定义可以看出,这种对事物进行区分的过程,必须是按照一定法则的,区分的结果必须能够用数字的方式进行描述的。

2.测量的要素(1)测量的量具测量的量具是指依据某些科学原理和法则,发展出合适的量具或制定出科学的测量方案。

(2)测量的单位不同的测量所采用的单位是不同的。

理想的测量单位必须符合两个条件:①要有确定的意义;②要有相等的价值。

教育测量的单位不够完善,既无统一的单位,也不符合等距的要求。

(3)测量的参照点量的参照点系测量的起点。

要确定事物的量,必须有一个测量的起点,这个起点就叫做测量的参照点。

参照点有两种类型:①绝对参照点(绝对零点);②相对参照点(相对零点)。

教育测验的编制与实施

教育测验的编制与实施

5、平波型分布 即中低高分人数差不多。学生的学业成 绩呈平波型分布,表明大中小几种难度 的试题比较接近,或学生的基础相差不 大,试题区分度低,需要提高区分度。 6、陡峭型分布 即中分人数很多,低高分人数极少。学 生的学业成绩呈陡峭型分布,表明难度 中等的试题比例过大,缺乏区分度或学 生的基础相差不大,要提高试题的区分 度。
布氏上述六类目标是有层次、有顺序的, 知识是最低层次,是最基本的要求。其 余依次是理解、应用、分析、综合、评 价。评价为认知领域的最高层次,是前 面五种目标的综合并增加了价值标准。 这六类目标,由简单到复杂,由低级到 高级依次排列,组成层次结构。
情感领域
接受:觉察到某一事物的存在,愿意接受某种 特定刺激和有选择的注意这个事物。 反应:受到动机的充分驱动,积极注意某种观 念,并伴随着主动参与行为。 价值评价:接纳并赋予某一客体、现象和行为 以价值。 组织:将各种不同的价值结合起来,解决它们 之间的冲突并开始建立内在的、一致的价值体 系。 由价值或价值复合体形成的性格化:形成的价 值体系在相当长的时间内控制个体行为,形成 内化的加之行为,产生性格化的人生模式。
606 × 308 × - 568 - 287 ———— ———— 168 181
×

835 - 217 ———— 618

(四)明确测验对象
应考虑被试的年龄特征、教育水 平和文化社会背景等因素
(五)确定测验内容
测验内容的确定,实际上也就是内容抽样 的决定和测验目标的确立相结合而成。 这一结合过程必须通过命题双向细目表来 确定。 命题双向细目表由3个要素构成:p106 测验目标 测验内容 测验目标和测验内容的比例
(六)测验的编制与组织

编制教育测验的一般原理与方法

编制教育测验的一般原理与方法
分数合成
对于多部分测验,需要将各部分分数 合成为总分数,可以采用加权平均、 非加权平均等方法进行合成。
分数的解释与应用
要点一
分数解释
根据分数的分布、标准差、百分等级等指标,对分数进行 解释,以评估学生的知识、技能和能力水平。
要点二
分数应用
将测验分数应用于教育决策,如学生分班、教学改进、教 育资源分配等,以提高教育教学的针对性和有效性。
测验的质量指标
信度
测验的一致性程度,即 多次施测的结果是否稳
定可靠。
效度
测验的有效性程度,即 测验是否真实反映所要
测量的心理特质。
难度
测验的整体难度水平, 以及不同题目难度的分
布。
区分度
测验题目对不同水平学 生的区分能力。
02 测验编制的心理学基础
CHAPTER
心理测量学的概念
心理测量学是研究心理现象的测量和 评估的科学,它涉及到如何运用数学 和统计学的方法来量化个体的心理特 质、行为和认知水平。
来源
主要来源于测验的设计、施测过程、评分标准、被试 者的心理因素等方面。
测验误差的控制与减少
01
提高测验设计的科学性 和合理性,减少设计误 差。
02
确保施测环境、设备、 时间等因素的一致性, 减少环境误差。
03
制定明确的评分标准和 客观的评分方法,减少 评分误差。
04
培训施测人员,提高其 专业素养和责任心,减 少人为误差。
心理测量学的应用
心理测量学在教育领域的应用广泛,包括学生评估、教师评价、课程设计等方面。 心理测量学在职业领域也有广泛应用,如人才选拔、职业规划、职业培训等方面。
此外,心理测量学还应用于临床心理学、心理咨询、人格评估等多个领域。

教育测验的编制与实施

教育测验的编制与实施
按照测验形式分类
按照测验的形式,可以将教育测验分为笔试测验、口试测验和实操测验。笔试测验主要通 过书面形式进行,口试测验则通过口头形式进行,实操测验则需要学生实际操作来展示自 己的技能和能力。
测验编制的基本原则
目的性原则
科学性原则
测验编制应紧扣教学目标和学习要求,确 保测验内容与教学和学习目标相一致。
激励学生进步
测验结果可以作为学生自我比较和 进步的动力,激励学生不断努力提 高自己的成绩。
教师专业发展与教学改进
教师专业培训
改进教学方法
Hale Waihona Puke 教育测验的编制和实施需要教师具备 一定的专业知识和技能,因此可以促 进教师的专业培训和进修。
根据学生的表现和反馈,教师可以调 整自己的教学方法和策略,提高教学 效果和质量。
确定测验目的
明确测验的目标和用途,如评估学生的学习水平、选拔优秀学生等。
设计测验蓝图
根据测验目的,确定测验的内容、题型、难度和时间分配等,确保测 验能够全面、准确地反映学生的能力。
制定评分标准
为每个题目制定详细的评分标准,确保评分过程客观、公正。
培训施测人员
对施测人员进行培训,确保他们了解测验的目的、内容、施测流程和 评分标准。
猜测因素等属性。通过项目分析可以对题目进行筛选和改进,提高测验
的整体质量。
02
难度系数
难度系数是指被试者在该题目上的通过率,难度系数过高或过低都会影
响测验的鉴别力和可靠性。在编制测验时,应合理设置题目的难度系数,
以使测验结果更加准确可靠。
03
区分度
区分度是指题目对不同水平被试者的鉴别能力,高区分度的题目能够更
测验的类型
按照测验目的分类

《教育测量学(第二版)》第三章 教育测验的编制与实施

《教育测量学(第二版)》第三章 教育测验的编制与实施

新编21世纪教育学系列教材
第三章 教育测验的编制与实施 《 教 育 测 量 学 》
第二节 教育测验的项目编制技术
二、客观题的编制
特 点: 优 点:(一)其形态短小精悍,所占试题空间较小。
(二)是考查目标集中,便于教师对学生进行有针对性的指导。 (三)节省学生答题时间。 不 足:(一)容易导致学生机械记忆行为的产生,限制学生的想象力。 (二)考查的知识点过于聚焦,导致考查时容易遗漏部分知识点。 (三)无法对学生的高阶能力进行考查,使用范围上限制较大。 编制要求: (一)题目留空要恰当,空缺处应当是重要或关键的内容。 (二)每个空缺处应当有明确且唯一的正确答案。 (三)空缺处答案如果是数字,应指明单位和数字的精确程度。 (四)一个题目的空缺处不能太多,以免使句子变得支离破碎,不易于理解题意。 (五)避免对答案形式或内容的暗示。
新编21世纪教育学系列教材
第三章 教育测验的编制与实施 《 教 育 测 量 学 》
第二节 教育测验的项目编制技术
三、主观题的编制
2 特 点: 优 点:(一)受推断猜测的影响小。
(二)能够考查学生的实操能力。 不 足:(一)题目对测验内容的覆盖率较小,难以考查到每个知识点。
(二)测验准备和实施比较费时费事,且测验条件和无关变量不易控制。 (三)只能观察到学生操作的结果,不利于后期教育教学工作的改进。 编制要求: (一)明确测量目标,将测验内容操作化,对操作设定最低标准。 (二)选择合适的真实性程度。 (三)编写简洁明确的指导语 (四)确定计分的方法,通常有作品量表法、检核表和评定量表两种评定法。
新编21世纪教育学系列教材
第三章 教育测验的编制与实施 《 教 育 测 量 学 》
第一节 教育测验的基本编制程序

4编制教育测验的一般原理与方法

4编制教育测验的一般原理与方法

• 教育目标的表述
– 以学生为行为主体 – 表述明确、具体 – 反映学习结果的层次性 – 表达教育工作者的意图
终极教育目标
中程教育目标
具体教育目标
二、教育目标分类研究
• 布卢姆的教育目标分类
– 认知领域
– 情感领域
– 动作技能领域(辛普森的分类)
• 我国关于教育目标分类的研究
– 李秉德“教育目标分类的三维结构模型”
• 填空题 填空题可用来考查被试对知识的记忆和理解 能力,在诊断性测验中特别适用。
1. 优点
– 受被试猜测的影响小,评分比较客观;
2. 缺点
– 填空题偏重于测量被试的知识记忆程度,使用 过多容易养成被试死记硬背的习惯。
3. 编制原则 (1)题意要明确,限定要严密,空白处应填的 答案是唯一的; 例:只有 ,才能在考试中获得 好成绩 (2)空白处所填写的应是关键词语,并且要和 上下文有密切的关系,使被试不至于填写困难。 例:1996年我国科技界有 新发明。
1. 优点 强化学生解释、分析、应用资料的能力; 测量较复杂和高层次的认知能力; 诊断复杂学习结果的认知过程; 变主观性为客观性; 把问题设计得更加符合测量目标 2. 缺点 不能测量创造性思维能力和文字统整与表达能 力
3. 编制原则 (1)选择与教学目标或考试目标关系紧密的引导资 料; (2)选择适合学生学习经验与阅读能力的引导资料; (3)选择新的但又不是太另类的引导资料; (4)选择简短而又有信息量的引导材料; (5)问题设计要明确,容易作答; (6)问题的测量目标要符合测验目的; (7)问题要测量有意义的学习目标,不考无关紧要 的内容; (8)问题数量要适当,而且每个问题不要互相提示
2. 编制原则
(1)根据考试目的、考试对象来确定作文文体和要 求; (2)根据社会需要、现实生活和学生实际设计命题, 作文命题要直接测量语文素养和书面表达能力; (3)作文命题不能过于抽象,要让学生有话可说, 有内容可写,有思路可走,有发挥的余地; (4)避免材料或话题出现测验偏倚,在确定选材和 写作意图时,要考虑对所有被试都是公平的,并 且试题应符合被试的心理特征。

教育测量与评价复习资料

教育测量与评价复习资料

第一章教育测量与评价的学科发展1.测量的三要素:量具、测量的单位、测量的参照点。

2.教育测量是为了了解学生的发展,尤其是为评价学习成绩而进行的测量活动。

这是教育测量活动最原始的动机,也是教育测量学科发展最早的立足点。

3.教育测量的特点:间接性和推断性、测量对象的模糊性和测量误差的不可避免性、量表具有多样性以及结果具有相对抽象性。

4.史蒂文斯根据测量的精确度将量表分为:称名量表、顺序量表、等距量表和比率量表四种水平。

称名量表是用来对事物活人的心理现象进行分类,指派的数值没有数量意义,只是表明事物的类别和性质不同;顺序量表也用于对事物活人的心理现象进行分类,这种分类基于所测属性在数量大小基础上进行的有序得分类,四等级评分法和五分法都是顺序量表;等距量表不但能在一个连续体上表示事物量的大小,而且具有形同的测量单位,但她的零点是相对的,是人为规定的;比率量表是最高水平的量表,除了具有量的大小和相同的单位,还具有绝对的零点。

5.教育评价的概念:格兰朗德:评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的系统过程,评价=测量(定量描述)+非测量(定性描述)+价值判断斯塔费尔比姆:评价是一种划定、获取和提供叙述性和判断性信息的过程,评价最重要的不是为了证明,而是为了改进。

泰勒:评价过程本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程。

日本桥本重治:评价师与教育的目标和价值有明确关系的概念,是按照教育目标和价值观对学生学习成果及教育计划的效果等进行测量的过程。

因此,评价的概念重点在于以教育目标为标准的价值判断。

布鲁姆:评价是为了某个目的而进行的,对各种想法、作品、解答、方法、资料等的价值作出判断的活动。

所谓教育评价,是指按照一定的价值标准和教育目标,利用测量和非测量的各种方法系统的收集资料信息,对学生的发展变化和影响学生发展变化的各种要素进行价值分析和价值判断,并未教育决策提供依据的过程。

6.桑代克在《精神与社会测量导论》中提到:无论什么东西,只要存在的,总存在与数量之中。

教育测量ppt课件

教育测量ppt课件

3.2.5项目与测验的信息函数
• 某个试题j的信息函数值的大小直接反映这种估计就越精确。因而 信息函数可作为衡量测验试题是否有效的 工具。在项目反应理论中,某个测验项目j 的信息函数定义为:
I
j (Q)

Pj 2 PjQ j
4 教育测验的编制与实施
• 迷惑性答案的效力,是指多项选择题中用的非 正确答案被考生选中的可能性,所以这项指标 只对多项选择题有意义。对这项指标的计算比 较困难,通常是用一次测验中选中某答案的次 数来估计该答案的迷惑效力。如果在考试中某 一选项无一人挑选,则说明改选项没有迷惑力; 如果选用的人数多且低分组的选用多于高分组, 则说明改选项的迷惑力强;如果高、低分组选 择某选项的人数都较少且人数接近,则说明该 选项的迷惑力较弱。显然,在测验组卷时应尽 量少用或不用迷惑力弱的试题,以免影响测验 效果。
• 准则关联效度 :准则关联效度是根据测验所作的 预测是否能被证实来衡量测验的有效性。如果测 验所作的预测与未来实际发生的事情很接近,这 个测验就是一个有效的好测验。在这种场合,被 预测行为是用来衡量测验是否有效的标准,因此 被称之为“准则”。准则关联效度就是要考察测 验得分与准则之间有什麽样的关系。例如用“模 拟考试”来预测高考的成绩,模拟考试在这里就 是一个准则。如果预测的准确性高,该模拟考试 就是一个有效的好测验。
3.2.1 项目反映理论
• 项目反映理论(IRT)正是针对经典测量理 论的上述局限提出来的。它的最大优点就 是,项目参数(CTT中的质量指标对应)的 估计值与被试样本的选择无关;对被试能 力水平的估计值与施测所用试题无关;同 时还能给出测验项目对被试实际能力估计 值的精度。
3.2.2 项目反映理论的假设
是指,该题被能力强者答对的可能性大,被能

现代教育测量与评价学 名词解释 知识点

现代教育测量与评价学 名词解释 知识点

06231《现代教育测量与评价学》-- 名词解释知识点第一章教育测量与评价的学科发展测量:根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。

P2 2013年4月教育测量:教育测量就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。

P3 2005年4月量表(量尺):是确定了测量单位和参照点并具有取值系统的测量工具。

P4 2016年4月称名量表:是最低水平的一种量表,用来对事物或人的心理现象进行分类。

顺序量表:也是用来对事物或人的心理现象进行分类,但这种分类是以所测属性的数量大小为基础进行的。

等距量表:不但能在一个连续体上表示事物量的大小,而且具有相同的测量单位。

等距量表的零点是相对的,即人为确定的相对零点。

比率量表:除了具有量的大小和相等单位外,还具有绝对零点。

比率量表是最高水平的量表。

评价:广义地讲,评价泛指衡量、判断人物或事物的价值。

P5教育评价:(广义的)是指按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。

P7 2010年4月考试:(广义的)泛指人类社会一切测度和甄别人的身心各个方面之群体或个体差异的活动。

P9考试:(狭义的)指由主试根据一定社会的要求,在一定场所,采取一定的方式方法,选择适当的内容,对应试者的德、学、才、体诸多方面或某方面所进行的有组织、有目的的测度或甄别的活动。

教育考试:在学校教育与人才选拔的过程中,教育考试是根据教育内容和目标,选择有代表性的内容和问题,按照一定的方式,对应试者的知识、技能等进行测量与评价的过程。

第二章教育测量与评价的类型和功能形成性测量与评价:是在教学过程中经常实施的,在性质上大致相当于现在的中小学单元测验。

P34 2012年4月诊断性测量与评价:是对经常表现出学习困难的学生所做的测量与评价,它的目的是对个人的问题行为及其原因进行诊断。

教育测量与评价课件(4)(第四章 编制教育测验的一般原理与方法)

教育测量与评价课件(4)(第四章 编制教育测验的一般原理与方法)

选择题的结构
选择题(一)
选择题是由一个“题干”和几个“选项”所组成。“题干”一般是提出问题或是 待完成的句子,“选项”是供被试选择的几个真假不明的答案,让被试从中选出正确 的答案。 选择题的优缺点 优点:① 可以用来测量学生各种不同层次的学习结果,不仅可以测量学生掌握所 学知识的程度,而且可以用来测量学生对所学知识的理解、分析、判断、应用和综合 的能力; ② 评分标准统一、客观,不受评分人主观因素和答卷人提出意想之外的答 案等影响,并且可以利用电脑迅速评卷,从而大大提高测验的信度,提高评卷的速度 和自动化水平;③ 可以加大试题容量,抽取广泛有效的代表性样本,使试题覆盖的知 识范围广,可以克服传统考试中主观题目由于试题量少、抽样窄而造成的测量效度不 高的缺点;④ 有利于考查被试思维的敏捷性和准确的判断力;⑤ 采用大量的似真选 择项使得结果易于诊断,通过对学生错误选项的选择反应这个线索,教师便于发现、 分析学生在学习中存在的问题,以便及时的纠正。 缺点:① 由于选择题的数量多,每一个试题中除正确答案外,还要有足够多的干 扰答案,而且要求这些干扰答案与题干应有相当的逻辑联系和似真性,所以编制良好 的选择题较花费时间,且要有专门的命题技巧;② 难以考核被试完全的推理能力、综 合运用所学知识的能力、有效的总结能力、严密的表述能力和写作能力,对于被试的 发散思维(或求异思维)能力则更是如此;③ 无法测量被试的思维(解题)过程;④ 被试能仅凭猜测而选中正确答案。
⑧ 应尽量避免“以上皆是”、“以上皆非”的选项。
是非题
是非题的功用 是非题(二项选择题)通常是给被试一个句子要被试作出正误的判断。这类试题 通常用于测量被试对基本概念、性质、原理、原则的认识和判断区别事实与观点、 认识事物因果关系,以及一些简单的逻辑推理能力。 是非题的优缺点 优点:① 编制容易,可适用于各种教材;② 记分客观,取样广泛。 缺点:① 仅能测量知识层次中最基本的结果,而无法测量高层次的学习结果; ② 受猜测因素的影响很大。 是非题的编写原则 ① 考核的内容应是重要的知识,应有考核价值。不要为了设计试题方便而考核 一些无关紧要、细枝末节的内容。 ② 题目应多是测量理解能力,而不应测验记忆必的知识,更不要直接抄录教科 书中的句子,以免引导被试死记硬背而不求理解。 ③ 一个题目中只能有一个中心问题,或者一个重要概念,避免两个以下的概念 在同一题中出现。否则将会导致“半对半错”或“似是而非”的情形。 ④ 试题应做到是非界限分明,用词准确,避免模棱两可的语句,不致引起对正 确答案的争议。 ⑤ 题目陈述应简单明了,避免使用复杂的句子结构,以减少因被试的阅读能力 而对测量产生不良影响,应尽量采用正面叙述,避免用否定和双重否定的语句。 ⑥ 正句和误句的排列要随机化,且数量应大致相等。

教育测验的编制与实施

教育测验的编制与实施
义务教育阶段数学测试中三类常见“错题”: (1)科学性错误,包括概念错误、试题设计不当、表述不当; (2)超出学生知识能力范围; (3)命题技术错误,包括试题类型不当、与试题编制要求相悖以及试题考查目 标不明确。
针对120份调查问卷的分析可知,义务教育阶段数学教师对“错题”的正确识别状况令人担忧: 概念 错误(初中被调查者之中能够识别者占23%、小学被调查者之中能够识别者占87%);设计不当(初 中被调查者之中能够识别者占77.3%);表述不当(小学被调查者之中能够识别者占90.7%);超出 学生知识能力范围(初中被调查者之中能够识别者占79%、小学被调查者之中能够识别者占23%); 试题类型不当(初中被调查者之中能够识别者占17%、小学被调查者之中能够识别者占9%);与试题 编制要求相悖(初中被调查者之中能够识别者占74%);试题考查目标不明确(小学被调查者之中能 够识别者占19%)。
(1)教育测验目的直接影响着测验的编制; (2)明确不同教育测验目的的多重性、差异性; (3)充分考虑测验对象的教育基础与心理特点;
小学儿童思维以具体形象思维为主逐步向抽象逻辑思维主过渡
第一节 教育编制测验的一般原则
二、典型性与一致性原则(高信效度)
内容抽样具有代表性: (1)知识面的涵盖要广 (2)考核层次与教学要求相符合 (3)难度水平符合要求
(6)按测验的功能分类
• 调查测验 • 诊断性测验:主要用来测查学生在各个具体教学内容、
教学目标上学习的长处和不足,鉴别被试在学习功课方 面的困难,分析学生学习困难的原因,并提出相应的补 救措施。 • 水平测验 • 预测性测验 • 准备性测验
(7)按测验的用途分类 • 总结性测验:以测量成绩作为最终产物,目的是
基本方法:动宾结构的短语法,行为动词说明行为的类型,
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

作文题
➢ 对人的逻辑思维、形象思维、书面表达等 多种能力的一种综合考查
分类
➢ 命题作文和条件作文 ➢ 记叙文、议论文、说明文等 ➢ 缩写型、改写型、续写型等
编制原则
➢ 根据考试目的、考试对象来确定作文文体和要 求
➢ 根据社会需要、现实生活和学生实际设计命题 ,作文命题要直接测量语文素养和书面表达能 力
25
45
第47页/共52页
应用
5 10 5 10
30
总体百分数
20 30 20 30
100
(一)设计测验的操作细目表
➢ 3. 使用单向归类系统(阅读理解技能)
阅读技能
识别文章中的细节 概括出文章的中心思想 判断文中事件出现的先后顺序 辨别文中所表述的关系 对文中内容进行推论 总体百分数
题目数
10 10 10 10 10 50
➢ B.气温
➢ 1.测量并报告气温;2.影响气温的因素;3.气温与天气形成的关系
➢ C.湿度和降水量
➢ 1.测量并报告湿度;2.影响湿度的因素;3.降水的形式;4.测量并报 告降水量
➢ D.风
➢ 1.测量风速和风向;2.影响风速和风向的因素;3.说出代表风速和风 向的符号
➢ E.云
➢ ……
➢ F.锋面
1
1
1
7
5
15
25
水量

2
2
2
6
12
20
题目总数 6
6
6
30
12
60
题目 10
10
10
50
20
100
百分比
第46页/共52页
(一)设计测验的操作细目表
➢ 2. 细目表的其他例子(分数和十进制)
教学目标
内容范围 程序性技能 理解
单分数
5
10
带分数
5
15
十进制
5
10
十进制与分
10
10
数的关系
总体百分数
合适
第51页/共52页
(五)关注学习和教学的改善
➢ 如果测验注意到了测量的内容及学习成果的 广度和深度,那么它对学生的学习将会带来 积极的影响
➢ 设计能促进教学的测验,从而也间接地改善 学生的学习
➢ 如果学生认为测验是测量学习成就的公平、 有用的工具,测验将有助于改善师生关系 (对学生的学习有着积极的影响)
第34页/共52页
对布鲁姆教育目标分类的评价
➢ 从教育目标划分标准来看,布鲁姆所用 的标准是测量学的,无论是知识、领会、 应用、分析、综合还是评价每一个教育 目标都是围绕着如何测量或操作的角度 提出的。
第35页/共52页
对布鲁姆教育目标分类的评价
➢ 布鲁姆提出的教育目标分类目的主要时为 了指导教学结果的测量与评价。但由于该 分类系统中未涉及到知识的本质,并未阐 明知识和智慧技能时怎样习得的,所以用 它来指导学习和教学是有困难的。
和期望内涵 ➢ 指导语简单明晰,向被试明确说明实际的情境
、任务及评价标准 ➢ 确定科学合理的计分方法
布鲁姆的教育目标分类
➢ 测验应该真实地反映教育教学目标,所以 编制测验时应该首先选定测验想要测量的 教学目标。在分析并陈述教学目标是最有 影响、最适当的参考资料是布鲁姆等人的 教育目标分类。
第26页/共52页
➢ 获得题目的代表性样本 ➢ 减少妨碍表现的无关因素 ➢ 避免客观题中的无意线索
第50页/共52页
(四)编写测验题目的一般建议
➢ 用细目表指导测验的编制 ➢ 编写的题目数多于所需的题目数 ➢ 尽早将测验题目编出来 ➢ 写出每道题目,避免题目之间的相互提
示 ➢ 编制题目适合一定的阅读水平 ➢ 使每道题目的答案得到专家的一致赞同 ➢ 重新修改测验题目时,要检查它们是否
分类
➢ 纸笔的表现性测验 ➢ 辨认的表现性测验 ➢ 结构化的表现性测验 ➢ 模拟情境的表现性测验 ➢ 工作样本的表现性测验
编制原则
➢ 测验材料和要求与日常教学内容和目标有关联 ,关注重要的学习结果
➢ 将考查重点放在高层次能力上 ➢ 将干扰测验目的的无关困难降到最低 ➢ 测验尽可能选择真实性的情境或问题 ➢ 提供必要的操作指导语,让学生了解作业任务
第38页/共52页
测验的设计与编制要领
➢ 一、设计测验的注意事项
➢ 确定测验的目的 ➢ 确定测验的属性 ➢ 明确测验的性质和用途 ➢ 明确测验对象 ➢ 分析测验目标
第39页/共52页
测验的目的
➢ 教学前的测验 ➢ 学生是否具备学习所必需的技能(以确定其准备状态) ➢ 学生已达到计划中的教学目标的程度(给学生定位或者 调整教学)
第52页/共52页
第36页/共52页
对布鲁姆教育目标分类的评价
➢ 布鲁姆的教育目标分类便于全面描述教 学目标和评定教学,但未揭示各级层次 的智力技能的心理机制,因而无法指导 教师用什么方法或提供什么学习条件来 实现教学目标。
第37页/共52页
对布鲁姆教育目标分类的评价
➢ 总结:教育目标分类系统对认知领域中的 教学目标由低到高进行划分,符合能力由 简单到复杂发展原则。认知领域分类标准 是测量学的,有利于指导学习结果的测量 与评价。
第41页/共52页
(一)设计测验的操作细目表
➢ 1.编写细目表
➢ 列出教学目标清单
➢按照陈述教学目标的方法,描述某单元的一般性教学目 标及具体的学习成果
第42页/共52页
➢例:天气单元的教学目标
➢1)了解基本术语
➢写出每一个术语的定义、识别代表每种天 气的术语、确定最适合描述给定天气的术 语……
➢ 横向设计 ➢ 了解各组知识在不同学习水平中的具体要求,从而 决定相应的比例
➢ 汇总与调整
第45页/共52页
(一)设计测验的操作细目表
目标
知道
理解 解释
内容 气压
基本术语 1
天气符号 1
具体实施 1
影响天气 形成因素
3
气象图 3
题目总数 题目比例
9
15

1
1
1
10
2
15
25
温度
1
1
1
4
2
9
15
湿度和降
编制原则
➢ 试题应该用来测量较高层次的教学目标
➢ 如:联系中学教学实际,试论述成败归因 理论及其教育意义?
编制原则
➢ 要明确而系统的陈述问题,使被试清楚的 了解题目的要求
➢ 一般应采用答案具有统一定论的试题 ➢ 当有多个论述题时,可以设置一个必答的
论述题,剩下的题目可允许被试选择作答 ➢ 最好在题目中给出回答本题所需的参考时
第49页/共52页
(三)准备测验题目时应考虑的问题
➢ 将题目与预期的成果匹配 ➢ 知识性学习成果:……的名字(位置、特征、功能)是什 么? ➢ 理解性学习成果:……的原因是什么?……和……的关系 是什么?哪一个是……的例子?哪一个最恰当地概括 了……? ➢ 应用性学习成果:对于……来说哪一种方法最好?设 计……的步骤是什么?下面哪一项指明了……的正确应用? 下面哪一种解决方法对……来说是正确的?
➢ ……
第44页/共52页
(一)设计测验的操作细目表
➢ 1.编写细目表
➢ 填写双向细目表(排列各部分所占的比例)
➢准备一个含有教学目标与教学内容两个维度的双向 细目表,并具体说明测验题目和评价任务样本的特 点
➢ 纵向设计 ➢ 各个知识在整个测验的知识范围内的相对地位和重 要程度(确定各部分知识所占的比重)
➢布鲁姆的教育目标分类系统把教育 目标分成三个领域:
1、认知领域 2、情感学习领域 3、动作技能领域
第27页/共52页
认知领域目标分类
➢布卢姆把认知领域的教育目标分为 六级:知道、领会、运用、分析、综 合、评价。
第28页/共52页
认知领域目标分类
1、知道:
指对先前学习过的知识材料的回忆,包括具 体事实、方法、过程、理论等的回忆。“知道” 又叫“知识”,是认知领域中最低水平的认知结 果,它所要求的心理过程主要是记忆。知识又分 为具体的知识、处理具体事物的方式方法的知识 和某一领域普遍和抽象的知识。
指将各种要素及组成部分组成一个整体, 以构成更为清楚的模式或结构。综合强调的 是创造能力,包括进行独特的交流、制定计 划或操作步骤和推导出一套抽象关系三方面 的内容。
第33页/共52页
认知领域目标分类
6、评价
指为了一定的目的,对某些观念和 方法等的价值作出判断。评价是最高 水平的认知学习结果,包含根据内部 准则判断和依据外部准则判断两方面 的内容。
➢ 教学中的测验 ➢ 监测学习进步、检测学习中的错误,为学生和教师提供 反馈
➢ 教学结束时的测验 ➢ 学生与预期的学习成果和表现标准相比,达到的程度 ➢ 也可作为下一个教学单元的预备测验
第40页/共52页
测验的设计与编制要领
➢ 二、测验的基本步骤
目标:改善学习和教学
8.使用结果 7.评定测验 6.实施测验 5.汇编试题 4.设计有关的题目 3.选择合适的题型 2.编制测量细目表 1.确定测量目的
➢ 作文命题不能过于抽象,要让学生有话可说, 有内容可写,有思路可走,有发挥的余地
➢ 避免材料或话题出现测验偏倚,在确定选材和 写作意图时,要考虑对被试都是公平的,并且 试题应符合被试的心理特征
表现性测验题
➢ 以行动、作品、表演、展示、口头回答、 操作、写作、科学研究、制作等更真实的 行为表现,来测量与评价学生在真实情境 下的所知与所能的一种测验类型
第31页
指将一种传播内容(现象、事物、过程) 分解成为它的组成因素和组成部分,以便弄 清各种观念的有关层次,或者弄清所表述的 各种观念之间的关系。分析比运用的智能水 平更高,可分为要素分析、关系分析和组织 原则分析三种。
相关文档
最新文档