第二章教育测量的质量指标2
教育测量与评价 第二章 教育测验的编制.
• 一、确定测验的目的
• 1、确定测量对象
• 2、确定测量目标(一般要将目标转 化成可操作的术语)
• 3、确定测量的功用(常与评价目标 结合在一起)
•
如是诊断性测验还是选拔性测验。
•
• 二、分析测量目标并制定编题计划
• 美国心理学家布鲁姆(Bloom) 最早 提出教育目标的分类问题。他把学习的 心理活动过程分成认知、情感二个领域。 又把认知领域具体分为知识(记忆事实、 条件、方法、原理等的能力)、理解、 应用、分析、综合、评价六个层次。
• 1.2 愿意承受特定刺激的行为 • 1.3 控制或选择的注意,是指有意识或
半意识的从内容或情境中辩别某种特定 的刺激.
2 反应所关心的是学生受到动机的充分驱 动,积极地注意学习内容
• 2.1 默认的反应,这种反应强调行为的 被动性,一般产生遵从或顺从.
• 2.2 愿意的反应,学生完全致力于表现 自己的行为,是自己想做或自愿去做.
• 9、所提问题应避免涉及社会禁忌与隐私。
• 10、施测与评分省时。
• 二、测题的种类及编制要领
• 根据应答方式,测题的种类分为两大类, 即自由应答型和固定应答型。自由应答 型题目是让受测者用自己的语言或行动 来对某一问题做出回答,包括填充题、 简答题、应用题、论文题、联想题、操 作题等。固定应答型题目又称客观性题 目,是让受测者从测验编制者事先定好 的答案中辩认出一个正确答案,包括了 多选题、是非题、匹配题等。
气象 宇宙 地球 合计
识记
3 2 2 5 2 2 2 18
理解
5 3 3 6 4 5 2 28
应用 分析 综合
632 311 420 832 322 410 211 30 13 8
第二章-教育测量与评价的类型和功能
思考题
我们当前的期末考试属于什么类型的测量与评价? 这样的评价在素质教育背景下,有存在的必要吗?为什么?
教育测量与评价的类型(四)
按测量与评价的内容分类,教育测量与评价可分为:
(1)智力测量与评价:智力测量与评价的目的在于测 量被试的智力并对被试的智力发展水平和特点做出评价。
一般能力 (2)能力倾向测量与评价:能力倾向测量与评价的目
的在于测量与评价个人的潜在才能,预测个人的能力发 展倾向。能力倾向测量与评价一般可分为两种:一种是 关于一般能力倾向的测量与评价,旨在探测个人多方面 的潜能;另一种是特殊能力倾向测量与评价,旨在探测 个人某方面的特殊潜在能力。
特殊能力:音乐能力倾向,机械能力倾向……
教育测量与评价的类型(四)
按测量与评价的内容分类,教育测量与评价可分为: (3)成就测量与评价:成就测量与评价的目的在于测量并 评价个人在接受教育或训练后的成就。成就测量与评价有两 种类型: 一是学科成就测验,旨在测量与评价被试在某一科目上的学习成就;
教育测量与评价的类型(五)
按测量与评价的对象分类,教育测量与评价可分为: (1)个别测量与评价:个别测量与评价是指同一主试在同 一时间内只能测量一个被试。 这种形式的测量与评价,主试对被试行为反应有较多的观察 和控制机会,主试与被试有更多的交流,这可让主试获得更多 的信息,也可以建立较融洽的主被试合作关系,有利于测量与 评价的进行。 但是个别测量与评价费时、费力,特别是主试必须经过严格 的训练才能胜任。
(3)潜力参照测量与评价:潜力参照测量与评价是将被试实际水平与 其自身潜在水平(潜力)相比较,以评价被试有无充分发挥自身潜力为目的 。在强调人性化、动态化和个别化的现代教育测评潮流下,潜力参照测量与 评价理应发挥更大的作用。
教育数据类别与测量质量指标
教育数据类别与测量质量指标引言近年来,随着信息技术的迅猛发展和教育领域信息化的推进,教育数据的收集、分析和利用逐渐成为教育研究和决策的重要工具。
教育数据的分类与测量质量指标是教育数据分析的基础,对于教育领域的决策、政策制定和教育评价具有重要作用。
本文将介绍教育数据的常见分类和测量质量指标的相关概念和方法。
教育数据的分类教育数据的分类主要根据数据的来源、类型和涵义进行划分,以下是常见的几种教育数据的分类:1. 学生基本信息数据学生基本信息数据包括学生的个人信息、家庭背景信息等,常见的有学生的性别、年龄、籍贯、父母的教育程度、家庭收入等。
这些数据对于分析学生的学习表现、学业发展和影响因素具有重要意义。
2. 教师信息数据教师信息数据包括教师的个人信息、教育背景、工作经验等,常见的有教师的性别、年龄、教育程度、所教学科、授课年级等。
这些数据对于分析教师的教学效果、教学经验和教育资源分配具有重要作用。
3. 学生成绩数据学生成绩数据是指学生在各个学科或课程中的表现和成绩情况。
这些数据包括学生的考试成绩、作业成绩、平时表现评价等,常见的有学科成绩、总评成绩、排名等。
这些数据对于评价学生的学业水平、学科素养和学习能力具有重要意义。
4. 学生行为数据学生行为数据是指学生在学习和生活中的行为表现和习惯。
这些数据包括学生的出勤情况、课堂参与度、作业完成情况、违纪记录等,常见的有缺勤次数、迟到次数、旷课次数、课堂互动次数等。
这些数据对于分析学生的学习态度、行为习惯和学习方式具有重要作用。
5. 教育资源数据教育资源数据包括学校的师资力量、教育设备、教育经费等。
这些数据对于评价学校的教学质量、教育资源配置和教育投入产出效益具有重要意义。
测量质量指标教育数据的测量质量指标是衡量数据质量高低的重要标准。
以下是常用的几种教育数据的测量质量指标:数据准确性指数据与事实之间的一致性和准确性程度。
数据准确性的评价可以通过数据比对、数据验证和数据校验等方式进行。
教学测量与评价
3、被试同时接受性质相似的两个测验,可能减少完成测验的积极性;
4、虽然两个复本测验的题目材料不同,但被试一旦掌握了解题的某一模式,就能触类旁通,有可能失去复本的意义。
3、折半信度(分半信度)
就是将测验分半,再求被试在每一半测验上所得分数的相关系数。
这一阶段教育评价仍然受泰勒模式的影响,注重教育目标的研究;
迅速发展时期(1958—1972年)
这一阶段泰勒模式受到挑战,出现了不少新的教育评价理论与模式;
专业化发展阶段(1973年以后)
这时期教育评价发展具有一个显著特点:就是走向专业化。
第二章 教育测量的质量指标
衡量教育测量的质量,可采用四个指标:
以教学为对象的教育评价,只是教育评价的一个方面,用逻辑学术语讲,教育评价是一个上位概念,而教学评价仅是一个下位概念。
区别:
教育评价的范围比教学评价要广得多,它不仅关注教学评价,还有学校管理评价、教师评价、学生评价、课程评价、总务评价等等。
3、教育评价与教育督导
联系:
两者皆以党和国家的教育方针、政策、法规为依据;
目的都是为了加强对教育工作的科学管理,全面提高教育质量;
督导工作过程主要有监督、检查、评价、指导、反馈若干环节,评价是诸环节的核心,无论是监督和检查,还是指导和反馈,都离不开评价这个手段。
区别:
评价只是督导工作内容的一部分,只构成督导工作的前提和基础,而不是其全部;
首先根据内容、形式、题数、平均数、标准差、难度、测题间相关以及分布形态相等的原则,将试题分成两半,或者将从易到难排列的测题,按照测题序号,奇数测题为一组,偶数测题为一组,分成两半;
教育数据类别与测量质量指标
第二节 教育测量的质量特性
教育数据类别与测量质量指标
一、教育测量的信度和效度
n 一个高质量的测验,它的结果是可靠而 且是有效的;
n 可靠性(信度)和有效性(效度)是评 价测验质量的两个重要指标。
教育数据类别与测量质量指标
n 当一个测验多次测量的结果一致时,它 就被认为是可靠的;
n 估计测量一致性程度的指标被称为信度。
6
90
97
85
97
7
80
89
48
89
r
0.91
0.26
教育数据类别与测量质量指标
相关系数与相关程度表一览表表
|r|
相关 程度
0 ≤0.3
零相 关
微相关
0.3<|r| ≤0.5
切实相关
0.5< |r| ≤0.8
密切相关
>0.8
1.0
高度相 完全相
关
关
教育数据类别与测量质量指标
八、差异显著性检验
★假设检验的基本原理 1.假设 n 虚无假设(零假设):是关于当前样本所属的 总体(指参数)与假设总体(指参数)无区别 的假设,一般H0表示。 n 备择假设(研究假设):是关于当前样本所属 的总体(指参数)与假设总体(指参数)相反 的假设,一般用H1表示。 由于直接检验备择假设的真实性困难,假设检 验一般都是从虚无假设出发,通过虚无假设的 不真实性来证明备假设的真实性。
2. 标准差(σ或S)
标准差概念:标准差是指离差平方和后平均的 方根。
教育数据类别与测量质量指标
问题1:某班甲乙两组在一次测验中的
成绩分别为65,68,71,72,74 (均分为70分)和 30,50,86, 90,94(均分为70分)。如何评 价两组的学习情况?
教育测量的质量指标
教育测量的质量指标引言教育测量是评估学生学习成果和教学效果的重要手段。
通过对学生的能力、知识、技能等方面进行测量,可以了解他们的学习状况以及教学的有效性。
然而,要确保教育测量的质量,需要依据一系列的指标进行评价和监控。
本文将介绍教育测量的质量指标,并讨论其意义和应用。
1. 可靠性可靠性是指测量工具在重复使用中能够得到相似结果的程度。
一个可靠的测量工具应该在不同的时间、不同的场合和不同的评估者之间产生一致的结果。
常用的衡量可靠性的指标包括内部一致性、重测信度和等价性。
内部一致性(Cronbach’s Alpha)内部一致性是指测量工具中各项指标之间相互关联的程度。
通过计算各项指标的相关系数,可以评估测量工具内部一致性的高低。
一般来说,Cronbach’s Alpha系数在0.7以上被认为是可接受的,越接近1表示内部一致性越高。
重测信度(Test-Retest Reliability)重测信度是指在不同时间进行相同测量的结果之间的相关性。
通过将同一测量工具在两个不同时间点进行测试,并计算其相关系数,可以评估测量工具的重测信度。
一般来说,相关系数应该大于0.7才被认为是可靠的。
等价性(Parallel Forms Reliability)等价性是指在不同测量工具中相同或类似的项目之间的一致性。
通过将不同但具有相似性质的测量工具同时应用于被测对象,并计算其相关系数,可以评估测量工具的等价性。
一般来说,相关系数应该大于0.7才被认为是等价的。
2. 效度效度是指测量工具能够准确地衡量所要测量的内容的程度。
一个有效的测量工具应该与被测对象所具有的实际水平或其他标准进行相关。
常用的衡量效度的指标包括内容效度、构造效度和效标关联效度。
内容效度(Content Validity)内容效度是指测量工具中各项指标是否能够全面、恰当地反映所要测量的内容。
通过专家评价、内容分析等方法,可以评估测量工具的内容效度。
一般来说,测量工具应该包含全面的内容领域,并且各项指标与内容领域高度相关。
现代教育测量与评价 简答论述题 历年考题分章节汇总
06231《现代教育测量与评价学》-- 简答论述题知识点第一章教育测量与评价的学科发展1.简述教育测量的特点。
P3 (2015年4月简答、2008年4月简答)①间接性和推断性。
②测量对象的模糊性和测量误差的不可避免性。
③量表具有多样性,结果具有相对抽象性。
2.如何理解教育测量的间接性和推断性? P3 (2011年4月简答)物理测量大多是直接性的。
虽然教育测量无一例外地关注到人类自身,但测量的内容主要是关于人的种种非物质属性。
目前,我们只能通过人的外显的行为或通过人对外界的一些刺激作出的反应,对人的知识技能、智力水平、思维品质、创造能力、心理素质、情感态度、道德品质等作出间接性的、推断性的测量。
3.教育测量与教育评价的区别与联系。
P7 2005年4月简答教育测量是针对教育效果或针对学生各方面的发展予以测量和描述的过程,旨在获得有一定说服力的数量事实,是一种以量化为主要特征的事实判断。
教育评价是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实的基础上,作出价值分析和价值判断。
教育测量为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;教育评价是教育测量过程的延续,是对教育测量结果的解释与应用,并朝着价值判断与释放教育功能的方向拓展。
4.简述教育测量与评价在教育改革中的作用。
P25 2012年4月简答当我们根据教育目标和计划,把教育方案、课程、教学等因素作用于学生身上,需要参照教育目标和计划,对教育效果进行测量评估、价值分析和判断。
所以教育评价在教育系统中对实现教育目标起着十分重要的作用。
(3 分)教育改革常常以教育测量与评价的改革作为突破口。
俗话说“考试是根指挥棒“就是这个意思。
(2分)考试与评价改革成为基础教育新课程改革的重要内容。
5.为什么说教育测量与评价是教师必备的知识技能修养? (专业素养和能力)P27 2018年4月论述(1)正确评价学生的发展是教师职业能力的重要组成部分;(4分)(2)在教书育人过程中,需要教师采用教育测量与评价多种方法,以弥补教师非正式观察的不足;(3分)(3)现代教自测量与评价的思想方法对于教师创造性地教学、因材施教、提高教学质量具有重要的作用;(3分)(4)国外教师教有普遍开设"教育测量与评价”这类课程。
《教育测量与评价》复习资料
《教育测量与评价》复习资料教育测量与评价第⼀章教育测评概述第⼀节教育测量概述⼀、什么是测量(⼀)测量的定义⼀般认为,测量是根据法则给事物分派数字。
具体来说,是指根据⼀定的法则和程序,对事物或现象在数量上的规定性加以描述和确定的过程。
这⾥包含了测量应有的三个特性:1、法则。
2、事物。
3、数字。
(⼆)测量的三要素1、单位。
2、参照点。
3、量表。
⼆、什么是教育测量(⼀)教育测量的定义教育测量是根据测量学的原理和⽅法对教育现象及其属性从量的规定性上予以确定和描述的过程。
(⼆)教育测量的特点1、测量结果的间接性。
2、度量单位的相对性。
3、测量对象的复杂性。
4、测量⽬的的针对性。
第⼆节教育评价概述⼀、什么是评价评价就是根据某种价值观对事物及其属性进⾏判断、衡量,或者说是衡量、判断⼈或事物的价值。
⼆、什么是教育评价教育评价是根据⼀定的价值观或价值标准,运⽤可⾏的科学⼿段(包括测量或⾮测量),通过系统地搜集信息、分析解释,对教育现象进⾏价值判断,从⽽为不断优化教育和教育决策提供依据的过程。
三、教育评价与教育测量的关系测量是依据⼀定的法则和程序,对事物或现象在数量上的规定性加以描述和确定的过程;评价是泛指根据⼀定的观念和标准衡量、判断⼈物或事物的价值。
测量的结果只有通过评价的解释才能揭⽰其实际意义。
测量是依据,评价是测量的具体体现。
测量关⼼的是数量的多少,评价关⼼的是价值的⾼低;测量是纯客观的,评价带有主观性;测量是⼀种单⼀的活动,评价则是⼀种综合的活动。
教育测量就是借助⼀定的⼯具,给教育现象赋值,来获取评价对象数量的⽅法。
教育测量是教育评价获得数据资料的重要⼿段。
教育测量可以为教育评价提供价值判断的基本数量事实,是教育评价的基础;教育评价是教育测量过程的延续,是对教育测量结果的解释与应⽤。
值得指出的是,教育评价并⾮⼀定以教育测量为基础,有时教育评价和教育测量是同义词。
⽐如,当教师对学⽣的成绩进⾏测验时,可以说是测量学⽣的成绩或评价学⽣的成绩。
第二章教育测量与评价的类型和功能
教育测量与评价的类型(五)
按测量与评价的对象分类,教育测量与评价可分为: (1)个别测量与评价:个别测量与评价是指同一主试在同 一时间内只能测量一个被试。 这种形式的测量与评价,主试对被试行为反应有较多的观察 和控制机会,主试与被试有更多的交流,这可让主试获得更多 的信息,也可以建立较融洽的主被试合作关系,有利于测量与 评价的进行。 但是个别测量与评价费时、费力,特别是主试必须经过严格 的训练才能胜任。
按测量与评价在教学中运用的时机分类,教育测量 与评价可分为:
(3)终结性测量与评价 终结性测量与评价是用于教学结束后。 其目的 其一,在教学目标之下,检查学生一学期的学业达到 了什么样程度,从而判断教学效果的得失; 其二,根据终结性测量与评价的结果,评定学生的学 业成绩,并将评定结果通知学生家长或记入档案。
的在于测量与评价个人的潜在才能,预测个人的能力发 展倾向。能力倾向测量与评价一般可分为两种:一种是 关于一般能力倾向的测量与评价,旨在探测个人多方面 的潜能;另一种是特殊能力倾向测量与评价,旨在探测 个人某方面的特殊潜在能力。
特殊能力:音乐能力倾向,机械能力倾向……
教育测量与评价的类型(四)
按测量与评价的内容分类,教育测量与评价可分为: (3)成就测量与评价:成就测量与评价的目的在于测量并 评价个人在接受教育或训练后的成就。成就测量与评价有两 种类型: 一是学科成就测验,旨在测量与评价被试在某一科目上的学习成就;
教育测量与评价的类型(一)
按测量与评价在教学中运用的时机分类,教育测量与评价 可分为:
(2)诊断性测量与评价 诊断性测量与评价是对经常表现出学习困难的学生所作的测 量与评价。 它的目的是对个人的问题行为及其原因进行诊断。 诊断性测量与评价多半是在形成性测量与评价之后实施。
第二章-教育测量与评价的类型和功能
教育测量与评价的类型(五)
按测量与评价的对象分类,教育测量与评价可分为: (1)个别测量与评价:个别测量与评价是指同一主试在同 一时间内只能测量一个被试。 这种形式的测量与评价,主试对被试行为反应有较多的观察 和控制机会,主试与被试有更多的交流,这可让主试获得更多 的信息,也可以建立较融洽的主被试合作关系,有利于测量与 评价的进行。 但是个别测量与评价费时、费力,特别是主试必须经过严格 的训练才能胜任。
教育测量与评价的类型(一)
按测量与评价在教学中运用的时机分类,教育测量与评价 可分为:
(2)诊断性测量与评价 诊断性测量与评价是对经常表现出学习困难的学生所作的测 量与评价。 它的目的是对个人的问题行为及其原因进行诊断。 诊断性测量与评价多半是在形成性测量与评价之后实施。
教育测量与评价的类型(一)
(3)潜力参照测量与评价:潜力参照测量与评价是将被试实际水平与 其自身潜在水平(潜力)相比较,以评价被试有无充分发挥自身潜力为目的 。在强调人性化、动态化和个别化的现代教育测评潮流下,潜力参照测量与 评价理应发挥更大的作用。
教育测量与评价的类型(三)
按测量与评价被试行为表现的性质分类,教育测量与评价可分为: (1)最佳行为测量与评价:最佳行为测量与评价是以测量最佳行为表 现为目的。凡是以成就或能力的高低为评价基础的,都属于最佳行为测量与 评价。 (2)典型行为测量与评价:典型行为测量与评价的目的不在测量与评 价被试能力的高低,而是测量与评价其是否具备某种(或某些)典型行为。 在这些测量过程,希望被试以其平常的典型状况来回答,无所谓正确与错误 之分。在重视学生个性发展和全人教育的现代教育理念下,典型测量与评价 的方法具有特殊的意义。
教育测量与评价的类型(六)
按测量与评价的材料(测验材料)分类,教育测量与评价 可分为:
现代教育测量与评价
第一章:教育测评概述第一节:教育测量概述★1、从广义上来讲,测量是根据法则给事物分派数字。
此定义包含了三个方面的特性:法则、事物、数字。
2、法则是测量的标准,也就是测量的依据和准则,即我们根据什么来进行测量。
事物是测量的对象,也就是对什么进行测量。
数字是测量结果的表现形式。
★3、测量的三个要素:单位(如米、克,教育测量的单位不能直接加减乘除);参照点(计算的起点,有绝对零点和相零点);量表(测量工具)。
★4、将量表从低级到高级排列主要有四种量表水平:类别量表水平、顺序量表水平、等距量表水平、比率量表水平。
★5、教育测量是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。
它主要包括对学生的内在精神属性的测量,教育测量主要是一种间接的测量。
6、教育测量的特点有测量结果的间接性,度量单位的相对性,测量对象的复杂性,测量目的的针对性。
★7、教育测量过对象的复杂性:首先,他是内在的,不能直接测量;其次它是多变的;另外,有些主客观因素也会影响测量的结果。
第二节:教育评价概述★1、评价是根据某种价值观对事物及其属性进行判断、衡量。
★2.、哲学史上三种价值观:①客观主义价值观;②主观主义价值观;③辩证唯物主义价值观。
★3、教育评价是指根据一定的教育价值观或教育目标,运用可行的科学手段,通过系统地收集信息、分析解释,对教育现象进行价值判断,从而为不断优化教育和教育决策提供依据的过程。
4、国外学者关于教育评价的观点:①泰勒:确定教育目标在实际上被理解到何种程度的过程;②克龙巴赫:评价是为决策提供信息的过程;③斯克里文和豪斯:评价是一种对优缺点和价值的评估,是一种既有描述又有判断的活动;④大桥正飞夫:教育评价就是对照教育目标,对教育行为产生的变化进行价值上的判断。
★4、教育评价与教育测量的关系:教育测量不是教育评价,但是两者有密切的联系。
教育测量是教育评价获得数据资料的重要手段。
测量是评价的依据,评价是测量的具体体现。
教育测量的质量指标--信度概述
ΣX=280 ΣY=286 ΣX2=6594 ΣY2=6912 ΣXY= 6420
n 判别两组数据谁好谁差,不能只靠对平均数的 统计和比较,关键是确定这两组数据偏离各
自的平均数的大小。为了消除数据容量的影 响,我们借鉴研究加权平均数的方法,选用 各个偏差的平方的平均数,来描述一组数据
偏离其平均数的大小,这就是方差。
n 根据假设,实得分数的方差应等于真分数的方差加上 测量误差的方差。即:
(二)信度指统计量与参数之间的接近程度
❖统计量是指样本上的各种数字特征。(如样本平均数 、标准差等);参数是总体上的各种数字特征(如总体 平均数、标准差等)。 ❖在统计学中,统计量越接近参数,这个统计量的可靠 性越高。而要知道统计量与参数的接近程度,可以对参 数进行区间估计。
(二)信度指统计量与参数之间的接近程度
把多次测量的实测值的平均值作为真值的近似
值),E表示误差。
n
)
E=x-T
(公式1-2
(一)信度指实测值和真值相差的程度
n 1、试比较以下两次测量结果(只进行 一次)的信度:
n 用尺子量100cm高的一个儿童,得到1cm 的绝对误差;量185cm高的一位运动员 ,也得得到1cm的绝对误差。
•要比较两种测量结果的信度,一定要看误差分数( E)对于真分数(T)所占的百分数是多少。这个百 分数表示该实得分数(x)的相对误差。其计算式如 下:
一、信度的概念
➢ 信度(reliability):指的是测量结果的 稳定性和可靠的程度,亦即测量的结果是否 真实、客观地反映了考生的实际水平,可记 为rxx。
➢ 具体而言,可以从以下三方面来理解测量的 信度:
教育数据类别与测量质量指标
四、集中量
2. 加权平均数( ) 是不同比重数据(或平均数)的平均数
或. N表示各组的频数;X 表示各组的平均数。
教育数据类别与测量质量指标
n 例1:一个学生某门课期中考试成绩为 72分,期末考试成绩为86分,而期考试 占总成绩的40%,期末占60%,这个 学生的学期总分是多少?
教育数据类别与测量质量指标
教育数据类别与测量质量指标
n 问题3:设某考区已录取高中学生语文平 均分为69分,标准差为12.5分,而未录 取高中的学生语文平均分为40分,标准 差为12.5分。比较他们语文成绩的离散 程度。
CV1=12.5/69 *100%=18.12%;
CV2=12.5/40 *100%=31.25%。
未录取学生的离散程度大。
程度。
教育数据类别与测量质量指标
要获得较高的构想效度:
n 理论构思必须结构严谨,符合逻辑,层次分明, 形成某种“构思网络”;
n 对研究的各种变量作出明确、严格的说明; n 给变量下明确的操作定义,并制定相应的、客
观的测量指标; n 消除或控制影响构思效度的因素。
教育数据类别与测量质量指标
影响构思效度的因素
正态分布:是一种连续型随机变量的概率
分布。
二项式分布中当
p=q
时,且n很大时,二项式分布接近于正态分布
表2:一个学生做10题正误题做对不同题数的概率分布
(做对每题的概率p=1/2;做错的概率为1/2)
做对题数
012
3
4
5
6
78
9 10
出现方式数
1 10 45 120 210
252 210 120 45 10
n 效度不仅受随机误差的影响,还受系统 误差的影响。
第二章 教育测量的质量指标2(效度)
式中S x是刚入学的测验各题答对题数的标准差,
S
=
x
f (x x)2 / N
x是刚入学的测验中答对1道题到10道题的人数的平均数,
x=(1 2+2 4+310 +9 5+10 2)103=5.55
S x [2(1 5.55)2 4(2 5.55)2 2(10 5.55)2 ] /103 1.94 y是期末测验中103人得分平均数,
rpb
Xp St
Xq
pq
公式(2 - 6)
X
或
p
X
q是二分名称变量中“1”或“0”相对应的连续变量的平均数。
X
p
67
10 +35+23=33.67 9
Xq
44
60 10 5
23 30
33.40
St是该例连续变量全部变量值的标准差。 St=18.125
p是二分称名量表中一种的次数占总次数的百分比,q=1-p。
依据公式〔2-2〕和〔2-3〕,可将效度与信度的关 系图解于后:
σV2
σI2
σE2
高效度、高信度
σV2
σI2
σE2
低效度、高信度
σV2
σI2
σE2
低效度、低信度
依据剖析,可得结论如下:1)高信度是高效度的必要条件, 而非充沛条件。2)效度系数不会大于信度系数的平方根。 可以用下式表示:
rxy rxx 公式(2 4)
• 这里的结构的含义是心思学实际所触及的笼统而属 假定性的概念、设想、特性或变量,如智力、焦虑、 机械才干倾向、成就、动机等。
• 结构效度主要用于智力检验、人格检验等一些心思 检验方面。
• 例如:人的发明力可以分解为人的思想流利性、灵 敏性和发明性三大特性,并依据这三大特性编制检 验,假定有足够的证据来证明该检验确实可以测到 这些特性,那么以为该检验是个结构效度较高的发 明力检验。
第二章教育测量的质量指标1
PPT文档演模板
第二章教育测量的质量指标1
(二)等值性系数( coefficient of equivalence )
n 以A、B两型英语复本测验对初中三年级10个学 生施测,为避免由测验施测顺序所造成的误差, 其中5个学生先做A型测验,休息15分钟后,再 做B型测验;而另5个学生先做B型测验,休息15 分钟后,再做A型测验。10个学生A型测验结果 记为X,B型测验结果记为Y,其测验的复本信度 如何?
PPT文档演模板
第二章教育测量的质量指标1
(二)等值性系数( coefficient of equivalence )
n 缺点:
n 1、编制两个完全相等的测验是很困难的,如果 两个复本过分相似,则变成再测形式,而过分不 相似,又使等值的条件不存在;
n 2、两个复本测验有可能在某种程度上测量了不 同的性质,这就会低估测验的信度;
n 估计方法有两种: n 1、分半法(Split-half method):是将一次测验分成两
个假定相等而独立的两部分来记分。通常是以题目的奇数 为一组,偶数为一组,计算两级的相关系数,最后用斯皮 尔曼-布朗公式校正,求得整个测验的信度系数。
n 斯皮尔曼-布朗公式为:
rxy 为两组测验分数的相关系数, rtt表示整个测验的 信度系数。
PPT文档演模板
第二章教育测量的质量指标1
•问题:为什么不直接用奇数题总分与偶数 题的部分计算出的相关系数作为整个测验 的信度系数而要加以校正?
•这是因为测验的长度(指量表中所包含的题目 数)对信度的大小有一定的影响,测验越长,信 度越高。
•而用分半法,实际上等于把整个测验长度减小 了一半,所以按分成两半的资料求出的信度必然 低于整个测验的信度。
现代教育教育测量
教育测量与评价要点第一章 教育评价概述一、基本概念1. 测量:根据法则给事物分派数字,法则为标准,事物为对象,数字为结果。
P32. 教育测量:根据测量学的基本原理和方法对教育现象及其属性进行数量化得研究过程,教育测量具有间接性。
P63.评价:根据某种价值观对于物质其属性进行判断、衡量,评价的本意是评论货物的价格。
P94. 教育评价:根据一定的教育价值观或教育目标,运用可行的科学手段,通过系统地搜索信息、分析解释,对教育现象进行价值判断,从而为不断优化教育和教育决策提供依据过程。
P11二、基本知识1. 测量的三个要素:单位(如米、克,教育测量的单位不能直接加减乘除);参照点(计算的起点,有绝对零点和相零点);量表(测量工具)。
P52. 量表的四种类别:类别量表、顺序量表、等距量表、比率量表。
P63. 教育测量的特点:①测量结果的间接性;②度量单位的相对性(数据要转换);③测量对象的复杂性;④测量目的的针对性。
P64. 哲学史上三种价值观:①客观主义价值观;②主观主义价值观;③辩证唯物主义价值观。
P95. 国外学者关于教育评价的观点:①泰勒:确定教育目标;②克龙巴赫:为决策提供信息;③斯克里文和豪斯:对优缺点和价值的评估;④大桥正飞夫:对行为产生变化的价值判断。
P106. 教育测量的历史知识:① 《学记》记载中国在西周实行了教育考评;② 科举制(606-1905)具有代表性;③ 1702年英国剑桥大学首先用笔试代替口试;④ 1845年美国在初等教育中以笔试代替口试;⑤ 1864年英国费舍收集学生成绩样本汇成《量表集》开启了标准化测量的萌芽;⑥ 1897年莱斯的拼字测验推动教育测验的发展;⑦ 冯特的测量方法和高尔顿的统计方法对教育测量产生重大影响;⑧ 1905年法国比纳-西蒙智力量表具有经典型;⑨ 1904年美国的桑代克为教育测量之父,其名言:“凡是存在的东西都有数量,凡是有数量的东西都可以测量”。
⑩ 教育测量分三个时段,1904-1915开拓期,1915-1930为兴盛期,1930-1940为批判期。
第二章 教育测量概
而教育测量则是运用测验为工具,达到了解教育
规律的实践活动,它主要在“动词”意义上使用。
因此,相对而言,教育测量的意义范围更广 一些。 能被应用于实际教育测量的教育测验才是真 正有效的测验工具。
二、教育测验的定义
测验:是用来描述事物数量特征、测定个别差异
的工具。
教育测验:是对人的知识、技能和能力以及其他
教育测量属于哪一水平的测量?
四、教育测量的水平
1.从所使用的参照点来说,教育和心理测量的参照
点均为相对参照点。
2.从所使用的单位来说,教育和心理测量所使用的
单位意义不太明确, 单位常常不等值。
从本质上讲,教育和心理测量的量表属
于等级量表。
无论是对智力,还是对能力倾向或人格
的测量,都只具有等级量表的特征。
类别数据
无
无
有区分性 无顺序性 无可加性
有区分性 有顺序性 无可加性
不 能 加 减 乘 计算次数、百分比、 0( 男) 除 , 不 能 排 列联相关、χ2检验、1(女) 序 比率差异检验。
可 以 排 序 , 还可求中位数、百 第1名 不 能 加 减 乘 分位数、斯皮尔曼 第2名 除 相关系数、肯德尔 和谐系数、符号检 验、等级方差分析。 可以加减 不可乘除 还可求平均数、标 准差、方差、积差 相关、作Z检验、 T检验、方差分析。 还可几何平均数、 差异系数。 温度
3.教育测量属于哪一水平的测量?
学习能力测验量表
特殊能力能力测验量表
希-内学习能力测验 学前儿童语言学习能
中国职业兴趣量表
职业兴趣调查表
OPT职业体验测验 工作知觉量表 军队汽车驾驶员职业适 宜性测验 机械能力成套测验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
PPT文档演模板
第二章教育测量的质量指标2
•表2-1:
(答对的题数) 1 2 3 4 5 6 7 8 9 10
A5
所B 4
评 的 等
C D
3 2
级E 1
1 3 10 5 4 2 1 6 8 8 4 31 2459831 1 13211 11211
• 基本计算公式:
• 例:有一位教师自编了一套测验题,用来预测学生 一年后的某科成绩,自编测验按百分制评分,一年 后考试评分只把学生分为及格者和不及格者。试就 所获资料估计自编测验的预测效度。
• 解:1)把两次测验成绩成对排列:
被试者
1 2 3 4 5 6 7 8 9 10 11 12 13 14
PPT文档演模板
第二章教育测量的质量指标2
1、用积差相关系数的方法估计效度
• 积差相关,是计算两个变量线性相关的一种方法,由英国统计 学家皮尔逊提出,因此也称为皮尔逊(Pearson)相关。要使用 积差相关必须同时具备如下几个条件:
• ①两个变量都是由测量获得的连续性数据,即等距或等比数据。 • ②两个变量的总体都呈正态分布,或接近正态分布,至少是单
内容效度主要应用于成就测验、学科测验、选拔和分类 职业测验。
内容效度不适合用于能力倾向和人格测验。
PPT文档演模板
第二章教育测量的质量指标2
(二)效标关联效度
• 又可称为经验效度或统计效度,是以测验分数和 效标之间的相关系数来表示测验效度的高低的。
• 效标就是足以显示测验所欲测量的特性的变量或 足以显示测验所欲预测的特性的变量。它是用来 检验测验效度的外在的、客观的标准和尺度。
32 9
级E1 1 1 2 1 1
6
合计
PPT文档演模板
2 4 10 14 20 20 17 9 5 2 103
第二章教育测量的质量指标2
•(2)用积差相关系数公式计算效度系数:
PPT文档演模板
第二章教育测量的质量指标2
PPT文档演模板
第二章教育测量的质量指标2
PPT文档演模板
第二章教育育测量的质量指标2
四、提高效度的方法
• (一)各种效度系数的要求 • (二)影响效度的因素
– 测验的构成(要素) – 测验实施方面(过程) – 被试主观状态方面 – 估计效度所依循的效标 – 样本方面
PPT文档演模板
第二章教育测量的质量指标2
四、提高效度的方法
• (三)提高效度的方法:
峰对称分布,当然样本并不一定要正态。
• ③必须是成对的数据,而且每对数据之间是相互独立的,即各 自互不影响,本条件是难以检验的。
• ④两个变量之间呈线性关系。一般用描绘散点图的方式来观察, 最好是先各自转化为Z分数,单位会统一些。
PPT文档演模板
第二章教育测量的质量指标2
•例:
• 某中学数学教研组的教师积多年的教学法经验,认为刚 入高中的学生学习立体几何感到困难的主要原因是空间想像 力弱。
•2、主观题难度的计算
PPT文档演模板
第二章教育测量的质量指标2
二、难度的计算
•例1:在100个学生中,答对第一题的30人,答对 第二题的60人,求第一、二道题的难度?比较这 两道题谁比谁难?
•例2:某道论述题满分12分,所有考生在这道题 上的平均得分为3.6分,求该题的难度?
•例3:语文测验第五题最高得分为12分,这道题 考生的平均得分是8.5分,求该题难度?
性的程度,亦即测量是否达到了预期的目的。 • 第一,效度是一个相对的概念。
– 1.测量的效度始终是对一定的测量目的而言的。 – 2.测量的效度是相对于测量的结果而言的。 • 第二,一种测验的效度只是高或低的问题。 • 第三,在教育测量中,效度问题比在其他领域的 测量中更为重要。
PPT文档演模板
第二章教育测量的质量指标2
•例4:60人参加考试,某题满分为12分,正确得 分累积是480分,求该题难度?
PPT文档演模板
第二章教育测量的质量指标2
(二)用极端分组法计算试题的难度
• 1、用极端分组法计算客观题的难度 • 具体步骤如下: • 1)先按测验总分的高低,按由高到低的顺序依次排
的各种因素是否成立。
PPT文档演模板
第二章教育测量的质量指标2
(3)结构效度的估计
• A、因素分析法 • 其目的是把一些具有错综复杂关系的因素归结
为数量较少的几个综合因素或称共同因素,并 以此测验所测之特质对测验分数作出解释。 • B、多元特质多重方法矩阵法 • 是由肯贝尔和菲斯克1959年提出的最受欢迎的 一种结构效度的评估方法。 • 这种方法的设想:若采用两种方法以上的方法 去测量两种以上的特质,那么这些测量结果之 间可以形成一个多元特质多重方法矩阵。
二列相关
• 适用于两个变量就其实际含义而言是 等距或等比数据,它们服从正态分布, 其中一列人为地划分为两类。
PPT文档演模板
第二章教育测量的质量指标2
点二列相关
• 适用于一列数据为等距或等比且总体服从正态分布(实 际上只需要单峰对称分布,如T分布),另一列变量是 按事物的性质划分为两类的变量,也可以是一个双峰分 布,人为划分为两类,如文盲与非文盲。这种相关系数 多用于测验中评价题目的区分度。对选择题、判断题在 整个测量中作用作出判断。
容本身的难易程度有关以外,还与测 验的编制技术和被试的知识经验有关。 • 这就是说测验的难度具有相对性,正 因为此,必须让试题通过实践来对难 度作出检验。
PPT文档演模板
第二章教育测量的质量指标2
二、难度的计算
• (一)计算难度的基本公式 • 1、客观题难度的计算
•P表示难度指标,N表示参加考试的总 人数,R表示答对某道客观题的人数。
• 结构效度是指一个测量能实际测量出理论上的构想或 心理特性的程度。它的目的在于从心理学的理论观点 就测验的结果加以解释和探讨。
• 这里的结构的含义是心理学理论所涉及的抽象而属假 设性的概念、构想、特性或变量,如智力、焦虑、机 械能力倾向、成就、动机等。
• 结构效度主要用于智力测验、人格测验等一些心理测 验方面。
估计内容效度的方法:
(1)逻辑分析的方法。其工作思路是请有关专家对测 验题目与原定内容范围的吻合程度作出判断。
(2)统计分析法。从同一个教学内容总体中抽取两套 独立的平行测验,用这两个测验来测同一批被试,求其 相关。若相关高,表明测验内容效度较高;若相关低, 表示测验的内容效度较低。
采用求统计量的公式进行计算,其公式有以下三种形式:
第二章教育测量的质量 指标2
PPT文档演模板
2020/12/10
第二章教育测量的质量指标2
第二节 效度
一、效度的概念 二、效度的统计学原理及其与信度的关系 三、效度的估计 四、提高效度的方法
PPT文档演模板
第二章教育测量的质量指标2
一、效度的概念
• 效度(Validity)是指测量结果的准确性和有效
480
48
0.300 0.462 0.562 0.720 0.837 0.911 0.954
0.400 0.496 0.548 0.619 0.668 0.679 0.713
PPT文档演模板
第二章教育测量的质量指标2
第三节 难度及其计算
• 一、难度的概念
• 难度是指测量试题的难易程度。 • 一个题目的难度大小,除了所测的内
PPT文档演模板
第二章教育测量的质量指标2
•解:(1)设期末考试的等第为y,空间想像力测 验答对的题数为x,列出二重交叉次数分布表:
X(答对的题数) 1 2 3 4 5 6 7 8 9 10
Y A5
1 3 10 5 4 2 25
所B 4
1 6 8 8 4 31
31
评 的 等
C D
3 2
2459831 1 13211
自编测验 67 10 20 44 60 43 61 10 26 23 30 18 35 23 的成绩(X)
一年后考 1 1 1 0 0 1 1 0 1 0 0 1 1 1 试成绩(Y)
•2)计算出二列相关公式所需统计量:
PPT文档演模板
第二章教育测量的质量指标2
(三)结构效度(Construct validity)
PPT文档演模板
第二章教育测量的质量指标2
PPT文档演模板
第二章教育测量的质量指标2
2、效度与信度的关系
•根据公式(2-2)和(2-3),可将效度与信度的 关系图解于后:
σV2
σI2
σE2
•高效度、高信度
σV2
σI2
σE2
•低效度、高信度
σV2
σI2
σE2
•低效度、低信度
•根据分析,可得结论如下:1)高信度是高效度的必要条 件,而非充分条件。2)效度系数不会大于信度系数的 平方根。可以用下式表示:
PPT文档演模板
第二章教育测量的质量指标2
二、效度的统计学原理及其与信度的关系 1、效度的统计学原理
在实际测量中,影响效度的主要因素是系统误差。 因而在讨论效度时,还必须把真分数方差分解为两 个部分,一是潜在真分数方差(σV2),另一部分 是系统误差分数方差(σI2) ,它与由随机误差引 起的变异(σE2)不同。
• 为了证明这个论点,他们让刚入高中的103名学生作10道 题,测量其空间想像力。为避免知道了某些学生的刚入高中 时的成绩影响以后考试的评分,试卷暂不评阅。立体几何学 完后,进行考试,按得分多少把成绩分为五等(A、B、C、D、 E)分别得5、4、3、2、1分。这时才评阅入学时的试卷,统 计出期末得5、4、3、2、1分者在入学测验中分别答对1道题 至10道题的人数(见表2-1)。