第七、八章信度与难度
自学考试现代教育测量与评价网络堂答案
教育测量与评价现代教育测量与评价学第一章教育测量与评价概述一、教育测量的含义(33分)本节测验题:智力测量属于A. 物理测量B. 心理测量C. 生理测量D. 社会测量二、教育测量的特点、教育评价的含义(35分)提出“凡物之存在必有其数量”命题的是谁?A. 麦柯尔B. 孟子C. 桑戴克D. 孔子三、教育评价的特点、教育测量与评价的产生(35分)现代教育评价产生的标志是A. 《比纳.西蒙量表》B. 科举考试C. T.B.C.F制D. “八年研究”四、现代教育测量与评价的发展(30分)第四代教育评价”的创立者是A. 枯巴和林肯B. 比纳和西蒙C. 桑代克和麦柯尔D. 泰勒与布鲁姆五、教育测量与教育评价相关概念辨析(30分)我国教育法规定的两项基本教育制度:一是教育督导制度,二是A. 教育评价制度B. 教育考试制度C. 教育测量制度D. 教育评估制度第二章教育测量与评价的信度一、信度概述(31分)样本统计量与总体参数越接近,说明测验的信度A. 越低B. 无法判断C. 越高D. 需要验证二、重测信度、复本信度、同质性信度(一)(35分)用同一个量表对同一组被试先后施测两次,所得结果的一致性程度是A. 等值性信度B. 等值稳定性信度C. 分半信度D. 重测信度三、同质性信度(二)、评分者的信度(一)(31分)若2个评分者评阅N份试卷,计算评分者的信度可用A. 斯皮尔曼等级相关系数公式B. 斯皮尔曼-布朗公式C. 积差相关系数公式D. 肯德尔和谐系数公式四、评分者的信度(二)、标准参照测验的信度(33分)估计标准参照测验的信度需要预先确定A. 淘汰的人数B. 达标的比例C. 通过的人数D. 决断的分数第三章教育测量与评价的效度一、效度概述、内容效度的含义(30分)下列适合于内容效度的测验是A. 能力倾向测验B. 成就测验C. 人格测验D. 性格测验二、内容效度的估计方法、结构效度(38分)下面哪种测验的效度不属于结构效度?A. 智力测验B. 焦虑测验C. 动机测验D. 学科测验三、效标关联效度(44分)效标关联效度也称为A. 实证效度B. 预测效度C. 同时效度D. 逻辑效度第四章教育测量与评价题目的难度和区分度一、难度及其计算、区分度及其计算(一)(40分)最适宜的难度系数是A. 0.50B. 0.00C. 1.00D. -1.00二、区分度的计算(二)、区分度与信度和难度的关系(31分)难度系数越接近何值,题目的区分度越大?A. 0.50B. 1.00C. 0.00D. -1.00第五章教育测量与评价分数的整理和转换一、教育测量与评价分数的整理(32分)被试者只有连续通过一次又一次的不同测验取舍分数线,才能最终获得成功。
自学考试现代教育测量与评价网络课堂答案
教育测量与评价现代教育测量与评价学第一章教育测量与评价概述一、教育测量的含义(33分)本节测验题:智力测量属于A. 物理测量B. 心理测量C. 生理测量D. 社会测量二、教育测量的特点、教育评价的含义(35分)提出“凡物之存在必有其数量”命题的是谁?A. 麦柯尔B. 孟子C. 桑戴克D. 孔子三、教育评价的特点、教育测量与评价的产生(35分)现代教育评价产生的标志是A. 《比纳.西蒙量表》B. 科举考试C. T.B.C.F制D. “八年研究”四、现代教育测量与评价的发展(30分)第四代教育评价”的创立者是A. 枯巴和林肯B. 比纳和西蒙C. 桑代克和麦柯尔D. 泰勒与布鲁姆五、教育测量与教育评价相关概念辨析(30分)我国教育法规定的两项基本教育制度:一是教育督导制度,二是A. 教育评价制度B. 教育考试制度C. 教育测量制度D. 教育评估制度第二章教育测量与评价的信度一、信度概述(31分)样本统计量与总体参数越接近,说明测验的信度A. 越低B. 无法判断C. 越高D. 需要验证二、重测信度、复本信度、同质性信度(一)(35分)用同一个量表对同一组被试先后施测两次,所得结果的一致性程度是A. 等值性信度B. 等值稳定性信度C. 分半信度D. 重测信度三、同质性信度(二)、评分者的信度(一)(31分)若2个评分者评阅N份试卷,计算评分者的信度可用A. 斯皮尔曼等级相关系数公式B. 斯皮尔曼-布朗公式C. 积差相关系数公式D. 肯德尔和谐系数公式四、评分者的信度(二)、标准参照测验的信度(33分)估计标准参照测验的信度需要预先确定A. 淘汰的人数B. 达标的比例C. 通过的人数D. 决断的分数第三章教育测量与评价的效度一、效度概述、内容效度的含义(30分)下列适合于内容效度的测验是A. 能力倾向测验B. 成就测验C. 人格测验D. 性格测验二、内容效度的估计方法、结构效度(38分)下面哪种测验的效度不属于结构效度?A. 智力测验B. 焦虑测验C. 动机测验D. 学科测验三、效标关联效度(44分)效标关联效度也称为A. 实证效度B. 预测效度C. 同时效度D. 逻辑效度第四章教育测量与评价题目的难度和区分度一、难度及其计算、区分度及其计算(一)(40分)最适宜的难度系数是A. 0.50B. 0.00C. 1.00D. -1.00二、区分度的计算(二)、区分度与信度和难度的关系(31分)难度系数越接近何值,题目的区分度越大?A. 0.50B. 1.00C. 0.00D. -1.00第五章教育测量与评价分数的整理和转换一、教育测量与评价分数的整理(32分)被试者只有连续通过一次又一次的不同测验取舍分数线,才能最终获得成功。
信度、效度、区分度、难度的使用
信度、效度、难度、区分度及其在试卷分析中的使用教学测量(instructional measurement)是考核教学成效的一种方法。
这是借助于一定的手段与方式,对学生的学习成绩(简称学绩)进行探察,并以一定的数量来表示的考核办法。
2. 在教学测量中应注意什么(1)教学测量的目的在于考核教学成效,也就是考察教学目标的完成情况。
因此,教学测量的目标应以教学目标为依据,测量目标应与教学目标一致,而不能偏离教学目标(2)教学测量的对象是学生内在的能力与品德等的形成状况,它不可能像物理测量那样直接进行,只能借助于一定的手段与方式间接进行。
(3)教学成效是通过量化的学绩进行考察的。
也就是说,教学成效是以学生的学习成绩为直接考察依据的,而学绩是以一定的数量来表示的,因此命题的合理性与评分的客观性是有效教学测量的一个重要影响因素教学评价(instructional evaluation)就是依据教学目标,对学绩测验所得测量结果进行分析及解释。
它主要包含以下两个方面的工作。
(1)教学评价必须对学绩测验数据所表明的教学成效作出确切的诊断。
(2)教学评价必须对教学的成败原因进行分析,并对今后教学工作的改进方面作出明确的规定。
评价(估)的功能:为家长提供信息,为选拔提供信息,为学生提供信息,为教师提供信息,为学校(间)提供信息教学目标,有时也称为行为目标,是指对学生在一段时间教学后应该掌握的技能与概念的陈述。
信度信度指的是测量结果的稳定性程度,信度是衡量一个量表质量高低的重要指标。
信度不高的量表是不能使用的。
3.常见的信度种类(1)重测信度(2)复本信度(3)分半信度(4)同质信度(内部一致性信度)(5)评分者信度影响信度的因素♦被试♦主试者♦施测情境♦测量工具信度是指考试的可靠性,即考试结果的可信程度。
信度高的试题很少受到外部因素的影响,对任何学生的多次测定都会产生比较稳定的、前后一致的结果。
提高试卷信度的因素大致可包括以下几种情况:(1)使用ABC卷随机抽取试题。
信度、效度、难度、区分度
信度、效度、难度、区分度一、信度(稳定性)信度是表明评价工具质量的又一重要指标,主要指测验结果的前后一致性程度。
(多次测量的一致性)根据影响信度的不同因素,可以把信度分为以下几类,信度指标通常用相关系数表示。
1.再测信度用同一种测验在不同时间里两次测验同一组学生,然后统计两次测试成绩的相关,求得的相关系数即为再测信度系数。
信度系数的最大值为1,表示再测信度最高;最小值为0,表示再测信度最低。
2.分半信度将一个测验分为等质量的两半,求这对半分的两半测验所得分数的一致性程度,即为分半信度。
3.评分者信度把相同的测验结果提供给不同的评分者打分,若不同评分者给的分数大致相同,说明该测验有较高的信度。
二、效度(准确性)效度是指一个测验或测量工具能真实地测量出所要测量的事物的程度。
一次测验是否有效,主要看其是否能准确地测量所要测量的东西。
测验的效度有多种类型,主要有内容效度、构想效度和预测效度。
根据不同的需要,一个测验可以采用一种或几种效度。
1.内容效度所谓测验的内容效度,是指它从需要测验的教材中提取样本的适当程度。
内容效度的高低,取决于测验题目的代表性,要看选出的题目能否包含所测量内容范围的主要方面,并使各方面题目比例适当。
2.构想效度所谓测验的构想效度,是指一个测验能够测量理论上的构想或内在心理特性的程度。
3.预测效度所谓测验的预测效度,是指一个测验能够预测学生将来某种特定行为或表现的程度。
预测得越准,效度就越高。
例:在小学低年级的某次测验中,由于数学试卷中试题的文字表述过于复杂,学生不能完全理解题干的要求,也不能正确的解答题目,以至于该试卷无法正确测量学生数学学习的状况。
据此可以判断这次数学测验是( )A.高信度的B.低信度的C.低效度的D.高效度的【答案】C。
解析:信度强调某一次测验前后多次测量所得结果的一致程度。
效度强调某一测验的测量结果的有效性和准确性。
该试卷无法准确测量学生学习的状况,说明这次教学测验是低效度的。
信度效度难度区分度分析
信度效度难度区分度分析在教育测量和评估领域,信度、效度、难度和区分度是四个非常重要的概念。
它们对于衡量测试的质量、评估学生的学习成果以及改进教学方法都具有至关重要的意义。
接下来,让我们逐一深入探讨这四个概念。
信度,简单来说,就是指测试结果的稳定性和可靠性。
如果我们对同一批学生在相同的条件下进行多次相同的测试,得到的结果应该是相近的。
就好比用同一把尺子去测量一个物体的长度,每次测量的结果都应该差不多。
信度主要包括重测信度、复本信度和内部一致性信度等。
重测信度是在不同时间对同一批被试进行重复测量。
比如,今天对一群学生进行了一次数学测验,一周后再用相同的测验对他们进行测试,如果两次测试的成绩相近,说明这个测验的重测信度较好。
然而,重测可能会受到记忆、练习等因素的影响。
复本信度则是使用两个平行的测验(即内容、形式、难度等方面都相似)对同一批被试进行测量。
如果两个测验的结果一致性高,就表明复本信度良好。
但要编制两个高质量的平行测验并非易事。
内部一致性信度通常通过计算测验内部各个项目之间的相关程度来衡量。
例如,一份试卷中的各个题目,如果它们在测量同一个知识点或能力方面表现出较高的一致性,那么这份试卷的内部一致性信度就比较高。
常用的计算方法有克朗巴赫α系数等。
效度是指测试能够准确测量出所要测量的东西的程度。
好比射箭要射中靶心,测验也要准确测量到我们期望测量的内容。
效度主要包括内容效度、结构效度和效标关联效度。
内容效度关注的是测验内容是否涵盖了所要考查的知识和技能范围。
比如,一场语文考试如果能够全面考查学生的字词、语法、阅读理解和写作能力,那么它在内容效度方面就表现较好。
为了确保内容效度,出题者需要对教学大纲和课程目标有清晰的理解。
结构效度考察的是测验是否能够反映出所假设的理论结构或心理特质。
比如,一个智力测验是否真正测量了智力的各个方面,而不仅仅是某些表面的表现。
这需要通过复杂的统计分析和理论研究来验证。
效标关联效度则是将测验结果与一个外在的标准进行比较。
《教育学》笔记第七~八章-教学(上)
第七~八章教学(一)教学的意义和任务一、教学的概念、意义和任务1. 概念:教学是教育目的规范下的、教师的教与学生的学共同组成的一种活动。
(1)教学以培养全面发展的人为根本目的,是学校进行素质教育的基本途径。
(2)教学由教与学两方面活动组成(3)教学具有多种形态,是共性与多样性的统一2. 意义:是学校教育中最基本的活动,智育的主要途径,在学校教育系统中居中心地位。
(1)教学是社会经验得以再生产的一种主要手段(2)教学为个人全面发展提供科学的基础和实践(3)教学是教育工作构成的主体部分,又是教育的基本途径。
3. 任务:教学任务指明各教育阶段、各科教学应实现的目标要求。
教学的根本任务是促进学生德、智、体、美等方面全面发展,一般任务为:(1)传授系统的科学基础知识和基本技能(2)发展学生智力、体力和创造才能智力指人们认识客观事物的基本能力,主要包括注意力、观察力、记忆力、思维力和想象力,其中思维力是智力的核心。
(3)培养社会主义品德和审美情趣,奠定学生的科学世界观基础其原因在于:教学始终具有教育性(4)关注学生个性发展。
通过教学,激励发展每个学生的主体能动性。
(二)教学过程一、教学过程的基本概念1. 概念:教师根据教学目的、任务和学生身心发展的特点,通过指导学生有目的、有计划地掌握系统的科学文化基础知识和基本技能,发展学生智力和体力,形成科学世界观及培养道德品质、发展个性的过程。
教学过程的理论是教学的基本理论。
(1)孔子:学-思-行的统一过程,重在说明学习过程。
(2)夸美纽斯:个体认识论为基础的教学论,“一切知识都从感官的知觉开始”。
(3)赫尔巴特:“统觉理论”原理,认为教学过程是新旧观念的联系和系统化的过程。
(4)杜威:“从做中学”,教学过程是学生直接经验的不断改造和增大意义的过程。
(5)凯洛夫:教学过程是一种认识过程。
2. 本质:教学过程是一种特殊的认识活动,是实现学生身心发展的过程。
(1)教学过程首先主要是一种认识过程。
三种效度之间的关系(信度,效度与难度)
二、难度对测验的影响
1、影响测验分数的分布状态。 、影响测验分数的分布状态。 2、影响测验的鉴别能力。 、影响测验的鉴别能力。
三、影响题目难度的因素
1、考查知识点的多少 、 2、考查能力的复杂程度或层次的高低 、 3、考生对题目的熟悉程度 、 4、命题的技巧 、 5、利用经验判断或者通过预测调整难度 、
第四节
区分度
一、关于区分度
区分度指测验或量表题目区别被试水平能力的量度, 区分度指测验或量表题目区别被试水平能力的量度, 记为D。 记为 。区分度的计算 (1)相关法。区分度的实质是题分与总分的相关。 )相关法。区分度的实质是题分与总分的相关。 计算方法: 计算方法: 点双列相关系数(适应用于0\1计分的题目或二分变 点双列相关系数(适应用于 计分的题目或二分变 量,总分是连续变量) 总分是连续变量) 二列相关系数(适用于两个变量都是正态连续变量, 二列相关系数(适用于两个变量都是正态连续变量, 但其中一个变量被人为分为两类) 但其中一个变量被人为分为两类) 积差相关系数(适应于非二分变量项目) 积差相关系数(适应于非二分变量项目) (2)高低分组法。 )高低分组法。
测验的适宜难度
0≤P≤1,P=0难度最大,P=1难度最小。 , 难度最大, 难度最小。 难度最大 难度最小 在常模参照性测验中, 在常模参照性测验中,大多数题目难度介于 0.3~0.7之间,平均难度为0.5左右 0.3~0.7之间,平均难度为0.5左右。 左右。 之间 在不同的测验中,对难度的要求不同。 在不同的测验中,对难度的要求不同。
三种效度之间的关系
存在差异, 存在差异,各有侧重 内容效度、效标关联效度是结构效度的特例。 内容效度、效标关联效度是结构效度的特例。
(三)提高效度的方法 A、效度系数 、
信度、效度、难度、区分度
信度、效度、难度、区分度在全国统考教师资格考试中,对于备考的考生而言,无论是教育学还是心理学都存在一些学习方面的难点,这对于自己备考的考生而言是非常困难的。
中公讲师结合自己的教学经验与深厚的专业知识,将中学《教育知识与能力》的教学难点进行专题讲解,希望能够对各位考生的笔试备考提供一些帮助。
1、测量指标的含义信度、效度、难度、区分度是中学教学部分的考试内容,主要是用来检验测验质量本身的重要指标。
所谓信度指的是多次测量结果额一致性与稳定性。
它本身强调是测量结果是不是一样的,例如:小明第一次测量得分是80分,第二次测量得分也是80分,说明两次结果一样,则说明两次测量的信度高。
反之,第一次测量得分80分,第二次测量得分40分,两次结果不一样,说明信度低。
所谓效度指的是测量的正确性,是指一个测量所要测量的结果的程度。
效度所关注的是测量到对象多少程度?比如:假如小明本身的真实成绩是80分,第一次测量得分是正常发挥得分是80分,说明本次测量的效度高,如果失常发挥,高于80分或者低于80分,本次测量的效度低。
所谓难度主要指的是测量的难易程度,测量的难度系数值的范围是0—1,难度系数值越小,则反映试卷难度越大,难度系数值越大,则反映试卷难度越小。
所谓区分度,指的是测量对不同考生的区分程度,也就是可以理解为通过测验能够将好的选出来,差的筛下去。
比如高考的就是区分度很高的测验,否则就难以将好生、差生进行区分。
2、测量指标之间的关系信度与效度的十大关系:信度高,效度不一定高(或效度不一定低)信度低,效度一定低效度高,信度一定高效度低,信度不一定低(或信度不一定高)信度是效度的必要条件效度是信度的充分条件信度是效度的必要不充分条件效度是信度的充分不必要的条件有效度,一定有信度有信度,不一定有效度难度与区分度的关系:难度越大或难度越小,区分度越小难度中等,区分度越大以上是信度、效度、难度、区分度,祝各位考生顺利通过考试!拿到敲开教师行业的敲门砖!中公讲师解析。
《数学教育测量与评价》第 8 章 数学测验的质量分析
等值,但测验的信度较高。
平均值差别较大的原因可以有两种:一是,两次测验的难
度的确有所不同,从而导致平均值差别较大;二是,由于两次
测验时间间隔较短,但数学测验的计算量较大,所以被测产生
了厌倦心理而导致第二次测验的平均成绩明显低于第一次测验
的平均成绩。
使用复本法计算信度系数可以避免重测法受时间间隔影响
度量的。因此这些相关系数也称为信度系数。信度系数 越大,
则测验的信度越高;反之,信度系数越小,则测验的信度越低。
在数学教育测量中,常用的信度系数有三种:再测信度系
数、复本信度系数、内部一致性系数。另外,当有多位评分者
对同一个测试进行评分,或一位评分者对同一个测试先后多次
评分时, (特别是当评分者以等级进行评分时)需要对评分者评分
间隔可以是几天也可以是几个月,具体时间需要施测者根据实
际情况来确定。重测法是一种反映两次测验结果是否一致的方
法。
再测信度系数一般用积差相关系数的公式来计算,具体如下:
r1,2
n
(Xi
i 1
X )(Yi Y )
i 1 ( X i X )2 i 1 (Yi Y )2
复本信度系数计算示例
编号 i
Xi
Yi
Xi2
Yi2
XiYi
1
98
51
9604
2601
4998
2
126
109
15876
11881
13734
3
135
113
18225
12769
15255
4
114
99
12996
9801
11286
第7章测量信度
(二)使用的前提条件
测量的心理特质必须是稳定的;遗忘和练习的效 果基本可抵消;在重测的时间间隔内被试没有联 系和训练的机会。
二、复本信度(等值性系数)
(一)含义与计算 1.复本信度的含义:指的是两个平行的测验测量同一批被 试所得结果的一致性程度。 2.对复本信度的计算 复本信度的大小等于同一批被试在两个复本测验上所得分 数的皮尔逊积差相关系数
信度系数要达到多高才可以接受呢?一般原则是: ①r <0.7不能用于对个人做出评价、预测,也不能
做团体比较。 ② 0.7<r <0.85可用于团体比较。 ③ r>0.85时个人、团体均可用。 ④能力、成就测验在0.9以上,人格、兴趣测验要
求在0.8—0.85。
第三节 提高测量信度的方法
一、影响测量信度的主要因素(见讲义)
(二)使用前提条件 :有复本;有条件接受两个测验。
三、分半信度
(一)含义
1.分半信度的含义:分半信度指的是将一个测验分成对等的 两半后,所有被试在这两半上所得分数的一致性程度。分半 的情况:奇偶分半、前后分半、难度分半、内容分半。所以 同一测验的分半信度很多。
因为分半信度描述的是两半题目间的一致性,所以它有时也 被称作内部一致性系数。
=(7/7-1)[1-(0.81+0.82+0.79+0.83+0.85+0.76+0.77)
效度、信度和难度
试卷质量的评估一套试卷设计好了,并且对学生进行了测试,如何知道这份试卷的质量呢?评估的主要标准是什么?一般情况下看它的效度(validity)、信度(reliability)、难度(difficulty)、区分度(discrimination)1、效度效度,又称有效性。
它指一套试题所考的是否就是命题人想要考的内容。
或者说在多大程度上考了想要考的内容。
效度的高低是衡量一次考试最重要的指标,或者说是这次考试的基本出发点。
一次效度很低的考试是没有意义的。
比如我们把Is Architecture an Art or Science?作为题目考查高中学生的书面表达能力就显得很不合适,或者说是无效的。
因为这个题目要求学生首先要懂得建筑学,其次,还要对艺术和科学的范畴也有一个比较清晰的了解才有写作的表达。
因此,题目太难,内容超出了高中毕业生的知识范围的考试就谈不上有效。
如何确定考试的有效性?我们可以根据考试大纲从三个方面进行判断:①考试内容是否和考试的目标有关。
(听力、语法、词汇、语句、阅读、写作)②考试内容(试题)是否具有代表性。
比如考查词汇能力时不可能考查学生学过的所有词汇,只能从中抽取一部分作为样本来考查;这个样本的代表性如何直接影响考试效度的高低。
样本是否全面地、充分地体现了要考查的全部内容,也就是说试卷中是否有足够的题目去体现要考查的各方面的内容。
③考试内容是否适合考试对象(学生)。
即题目不能太难,也不能太易。
那么,如何保证考试内容的高效度呢? 第一,命题前要根据考纲、教学内容和教学目标拟定好考试的内容,并一一罗列出来。
这个内容细目表越详细、越明确越好。
然后再按照这个表去命制具体的题目。
第二,题目编好后,要请有经验的老师审定,这样可以保证测试内容的全面和合理。
2、信度试卷的信度是指考试结果的可靠性和稳定性。
换句话说就是拿一份试卷对同一组学生进行两次或多次测试,如果测试结果很一致,那就说明该试卷的信度较高。
如何区分信度、效度、难度、区分度?
如何区分信度、效度、难度、区分度?
设计和编制任何一种测验,都必须使其在效度、信度、难度和区分度方面达到一定要求,即起码达到有效、可信,具有一定难度和区分度。
一、效度
效度是指一个测验或测量工具能真实地测量出所要测量的事物的程度(测得对不对)(比如用称测身高)。
一次测验是否有效,主要看其是否能准确地测量所要测量的东西。
例如:老师想要测量小学二年级学生的语文水平如何,拿来一张适合二年级水平的试卷进行测试,说明该测试具有(效度)
二、信度
信度是表明评价工具质量的又一重要指标,主要指测验结果的前后一致性程度。
也就是说多次测量结果相似或者相近。
多次测试结果稳定性的体现。
例如:老师拿同一张试卷测试所教两个班级,测试结果相似,那么说明该测试具备(信度)
三、难度
难度指测验的难易程度。
在教学测量中,通常用答对或通过测验的人数比例作为难度值。
四、区分度
区分度有时也称鉴别力,主要指测验对于不同水平的被试加以区分的能力。
例如:能够测试出学生真实水平的高低,体现该测试具备(区分度)
以上是介绍了教师招聘备考:衡量测验题目的质量指标如何区分信度、效度、难度、区分度,希望能对您的备考有所帮助。
中公教师网祝您考试成功!。
教育测量与评价期末复习题
第一章教育测量与评价的学科发展一、测量与评价基本问题1、教育测量①测量三要素②教育测量概念:针对学校教育影响下学生各方面的发展,从量的规定性上予以确定和描述的过程。
③教育测量的特点问题:教育测量与物理测量的区别是什么?④量表的概念,按测量精确程度分为哪四种。
2、教育评价①教育评价概念:按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。
②著名的测量与评价领域人及名言格兰朗德(N.E.Gronlund)认为,评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的(课堂)系统过程;评价包括对学生的定量描述(测量)和定性描述(非测量)两方面。
“教育测量与评价是所有成功教学的基础”。
斯塔费尔比姆说,“评价最重要的意图不是为了证明,而是为了改进。
”3、相关概念①教育测量与评价关系②测验与考试二、历史发展1、著名的测量与评价领域人及名言①桑代克“无论什么东西,只要存在的,总存在于数量之中。
”②麦柯尔(W.A.Mecall)“任何东西,存在于数量中的,都可以被测量。
”问题:请列举教育测量与评价领域三个重要人物及名言三、学科地位和作用1、当今教育科学研究的三大领域2、教育测量与评价在教育改革中的作用①教育系统②改革突破口3、教育测量与评价是教师的专业素养和能力第二章教育测量与评价的类型和功能一、从不同的角度分为哪些类型例如:1、从运用时机分为-------?2、形成性测量与评价?3、形成性测量、诊断性测量与评价和总结性测量与评价区别?二、教育测量与评价四大功能教育判断的功能、改进教师教学的功能、促进学生学习的功能、行使教育管理的功能第三章质量特性1、教育测量与评价包括哪四度?考虑方案的可用性。
(P86)一、信度1、概念、分类2、模型 X=T+E,反映的是误差信度反映的是()A、高低分B、误差C、难易程度D、有效性3、具体估算⑴异质性信度:重测、复本概念⑵同质性信度:分半信度克龙巴赫(cronbach)系数①概念②区别③相关系数⑶百分比一致性(标准参照测验的信度)⑷评分者信度(相关系数)4、信度运用⑴测量标准误概念⑵通过与标准误关系估算真分数范围(计算题)二、效度1、包括哪些?① APA:1974年美国心理学会为了规范效度研究,把效度分为三类内容效度、结构效度和效标关联效度。
什么是试题的难度、信度、区分度
什么是试题的难度、信度、区分度什么是试题的难度、信度、区分度⼀.试题的难度(⼀)什么是难度难度是指试题的难易程度,是评价考试的⼀个⾮常重要的⼀个指标。
⼀个题⽬,如果⼤部分考⽣都能答对,那么这个题⽬的难度就⼩;如果⼤部分考⽣都不能答对,那么这个题⽬的难度就⼤。
(⼆)难度的计算1.单个选择题⽬的难度计算单个选择题的难度通常以通过率表⽰,即以答对或通过该题⽬的⼈数占考⽣⼈数的百分⽐表⽰。
计算公式为:P=R/N.其中P代表题⽬的通过率,R为答对或通过该题⽬的⼈数,N为全体考⽣⼈数。
P值越⼤,题⽬难度越⼩,答对⼈数越多。
2.单个⾮选择题⽬的难度计算此类题⽬考试结果不是只有答对或答错两种,⽽是具有从满分到零分之间多种结果。
计算公式为:P= X/W.其中P为难度,X为考⽣在某⼀题⽬上的平均得分,W为该题⽬的满分。
3.整个试题的难度计算(常⽤)计算公式为:P= X/W.其中P为难度,X为样本平均得分,W为试卷总分。
如满分150分的试题,考⽣平均得分108分,则难度为108/150=0.72如考⽣⼈数太多时,可先将考⽣总分从⾼到低排列,然后将总分最⾼的27%考⽣定为⾼分组,总分最低的27%考⽣定为低分组,分别计算两组考⽣的难度值,然后求它们的平均值即可。
(三)试题难度的⼀般要求就⾼考来说,难度以适中为宜,单个试题的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
⼀般将难度值⼤于和等于0.7的试题定为容易题;⼤于0.4和⼩于0.7的定为中档题;⼩于和等于0.4的试题定为难题。
命题时难度⼀般要按⼀定⽐例分配,如3:6:1或3:5:2,⼀般说来,容易题、难度系数为0.95-0.75,中档题为0.74-0.6,难题为0.59-0.20。
⼆.试题的区分度(⼀)什么是区分度区分度是指考试题⽬对考⽣⼼理特征的区分能⼒。
区分度⾼的试题能将不同⽔平的考⽣区分开来,⽔平⾼的考⽣得⾼分,⽔平低的考⽣得低分。
区分度⾼的考试,优秀、⼀般、差三个层次的学⽣都有⼀定⽐例,如果某⼀分数区间学⽣相对集中,⾼分太多或不及格太多的考试,区分度则低。
难度、区分度、信度和效度的一般说明
其中:XH为高分组的平均得分(前27%),XL为低分组的平均得分(后27%)o (2)客观性试题的难度
A、基本公式法:P=1-R∕N 其中:R为答对人数,N为全体人数。 B极端分组法:P=I-(PH+PL)/2
其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n为总人数的前27%。PL=RL∕n叫低分组通过率,RL 为低分组答对人数。
②客观性试题:D=PH-PL,或D=RH-RL/n
③一般也可以用D=XH—XL/X满计算。
其中:XH为高分组某试题的平均分,XL为低分组某试题的平均分,X满为该题的满分。
三、信度
信度是指测得结果的一致性或稳定性,稳定性越大,意味着测评结果越可靠。相反,如果用某套试题对同一应 试者先后进行两次测试,结果第一次得80分,第二次得50分,结果的可靠性就值得怀疑了。
二、区分度 区分度是区分应试者能力水平高低的指标。试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者 得高分,低水平者得低分。而区分度低则反映不出不同应试者的水平差异。 试题的区分度与试题的难度直接相关。通常来说,中等难度的试题区分度较大。另外,试题的区分度也与应试 者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。 1、区分度指标的评价 -1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。一般认为,区分度指数高于0.3,试题便可以被接受。
信度通常以两次测评结果的相关系数来表示。相关系数为1,表明测评工具如试卷完全可靠;相关系数为0,则表 明该试卷完全不可靠。一般来说,要求信度在0.7以上。
1、评价信度的方法
(1)再测信度。它是指将同一试卷在相同的条件下,对同一组考生先后实施两次,两次测评结果的相关系数。
教学测验中的信度、效度、难度和区分度
山东教师招聘网教学测验中的信度、效度、难度和区分度
编制教学测验必须在信度、效度、难度和区分度四个指标上达到一定要求,即起码达到有效、可信,具有一定难度和区分度。
很多考生在这四个概念的理解上有些混淆,结合例子帮助大家梳理一下:
1.信度与效度:信度指的是测验结果一致、分数稳定。
比如今天用一套试卷测试小明的成绩是80分,一个星期后再用来测小明还是考80分,那么这套测验的信度就是高的。
效度指的是测验工具能够真实地测出所要测量的事物的程度。
比如老师想要测量学生的英语口语水平,但是拿了一套笔试试卷让学生作答,那么这套试题的效度就是低的;再如一个数学测验试题的文字难度太大,超过学生自身水平,那么这套测验试题的效度是低的,没有测出想要测的学生数学水平。
信度与效度可以简单的概括为“两斤白糖”,两斤是信度,白糖是效度。
如果测出来的是一斤半或者是两厘米,那就说明信度有问题。
如果测出来的是盐巴或者大米,不是我们想要的白糖,那就是效度的问题。
2.难度与区分度:难度指测验的难易程度,难度值P=答对人数/总人数×100%。
比如全班总人数为30人,一道数学应用题只有6个人答对了,那么这道测验题目的难度值=20%,P值越大难度越小,P
值越小难度越大。
区分度用来鉴别不同水平的学生,高水平者得高分,低水平者得低分。
考生在备考这个知识点的时候,只需要把这四个概念理解清楚、做好区分即可。
此外,更抽象一点的关系是:信度是效度的必要条件,即高信度不一定高效度,但高效度必定高信度。
更多教师资格证备考信息关注山东教师招聘考试网。
信度、效度、难度、区分度之间有何不同-
信度、效度、难度、区分度之间有何不同?衡量测验质量的四个指标,即信度、效度、难度、区分度,在考试中通常以客观题的形式出现,具体来说主要包括概念反选、例子反选题或判断题。
而一直以来由于知识内容有一定的相似性和关联度,考生们常常区分不清产生混淆。
因此,为了帮助考生们解决这一问题,我们就一同来梳理一下该知识点。
信度是指测验结果的稳定性或可靠性,即某一测验在多次进行后所得到的分数的稳定、一致程度。
它即包括在时间上的一致性,也包括内容和不同评分这之间的一致性。
如,在不同时间测两次相同的试卷,如果成绩基本相当,那么我们就认为测验的信度较高。
效度是指测量的正确性,即一个测验能够策略出其索要测量的东西的程度,也就是我们常说的准确度。
故而通常效度考虑的问题是:测验测量什么?测验对测量目标的策略精确性和真实性有多大?就一个测验的优劣而言,效度是一个比信度更为重要的指标。
如,我想测量初一年级的数学成绩,但是给他们做了一套小学四年纪的数学试卷,此时不能测量出我原本想要测量的东西,我们认为测验的效度不高。
难度是指测验包含的试题难易程度。
一般来说,难度可以用:“P(通过率)=通过人数/总人数”的公式来表示,可见P(通过率)值越低难度越大,两者间呈反比关系。
区分度是指测验对考生的不同水平能够区分的程度,即具有区分不同水平考生的能力。
如,一次测验之后,能够明确分清不同学生的水平,我们就认为该测验的区分度较高。
在我们明确了这四个指标的含义之后,我们会发现这四个指标都是用来衡量测验质量高低的,那么它们之间有没有什么关系呢?那当然是有的,四个指标之间既有联系又有区别,考生们既要能够区分有得了解他们之间的相互影响关系:首先是区别,重点在于信度与效度之间的区别,要明确信度是衡量测验的可信程度而非试题内容的质量,因而才会运用多次测验的方式;而效度是衡量测验的有效程度更加注重试题内容的有效性,是评价试题是否能达到预期效果。
因此,我们认为在衡量测验本身质量时,效度是比信度更重要的指标。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
D大,方差大,项目鉴别能力大,质量好。 在划分组的27%时计算的项目鉴别力比50%时大,一般 情况下当D为0.20~0.29时,说明项目尚可,仍需修改。 当D为0.19以下时,说明项目劣,必须淘汰。可见,三门 考试科目按27%来分析的话,1,3门尚可,2劣,必须淘汰 方差法计算的结果和项目鉴别指数估计最后得的结论一 致。
科目 鉴别力D(27%) 鉴别力D(50%) 方差
0.25 0.2 0.15 0.1 0.05 0 通信系统仿真
通信系统仿真 0.22 0.15 125.52
现代通信原理 0.07 0.05 11.11
现代信号处理 0.22 0.15 89.23
鉴别力D(27%) 鉴别力D(50%)
现代通信原理
现代信号处理
现代信号处理
总分
0.12
0.78
0.28
0.52
1
0.69
项目的组间相关越大,测验的内在一致性信度越高,各个科目项 目间的成绩相关性均在0.3以下,说明考生在某一科成绩好不代表 另外一科成绩也好,内在一致性信度低。 通信系统原理与总分的相关性最高,说明该科目和总分一致性最 好,对总分的鉴别力最高。现代通信原理对总分的鉴别力最低
难度
0.82
0.83
0.77
可见,各科考试难度均不大,考生考试成绩也相对较高
实验效度
效度是指试卷的有效性,即试卷的使用是否达到了考试的目的,主要 包含内容效度,校标关联效度。
• 内容效度:指一套测试题是否测试了应该测试的内容或者说所测试的 内容是否反映了测试的要求,即测试的代表性和覆盖面的程度。为此, 命题人员在命制试题之前, 必须完成下列工作:
最后用斯皮尔曼-布朗(Spearman-Brown)公式: rtt=(2*rhh)/(1+rhh) 求出整个量表的信度系数rtt 。
rtt 0.80 0.60 0.40 0.20 0.00 通信系统仿真 现代通信原理 现代信号处理 rtt
信度值越高,成绩内在一致性越高,三门课的各自的 内在一致性信度相似,其中现代通信原理成绩的信度为 最高0.63,现代信号处理的信度为0.62,通信系统仿真 为最低0.52
实验的鉴别力
项目的鉴别力又称区分度,项目鉴别能力强,水平高的得 分高,水平度的得分低。难度在0.5时,项目的鉴别力最大。 常用方法:项目鉴别指数估计,方差法,相关系数法 项目鉴别指数估计:被试分按高低排列,然后取得分最高 的27%高分组,最低的27%低分组答对该题的比率。
D Ph P l
当分数是正态分布时,宜采用“27%规则”;一般情况下,取上下25%~33% 均可;样本少时,可以取50%。 本实验分别取27%,50%进行对比
方差法:方差大,数据分散,鉴别力越大。 相关系数法:即计算题目通过率与试卷总分的相关。 计算 的方法有点二列相关、 二列相关、 积差相关等。相关系 数高于0.20的题目一般可以保留, 如果接近于零或负数时, 应作重大修改或删除。
谢谢
项目之间及项目与总分的相关性
对于非二值计分的项目,计算相关采用pearson积距相关公式:无量纲指数, 反映了两个数据集合之间的线性相关程度。 而使用相关系数correl可以确定两种属性之间的关系
科目 通信系统仿真 现代通信原理 通信系统仿真 1 0.26 现代通信原理 0.26 1 现代信号处理 0.12 0.28
试验难度
实验的难度是表示实验的测验题目的难易程度的指标。 难度的公式为
P=x/y
当测题为二值计分时(答对给分),分子为通过率,分母 为全体考生人数. 当测题为非二分法题目时,分子为全体考生在该考试科目 所得的平均分,分母为该科目的满分分数。在此考察整体 分数选第二种难度方法。
科目 通信系统仿真 现代通信原理 现代信号处理
(1) 定义好内容总体, 描绘出有关知识与技能的大体范围; (2) 划分细纲目, 根据其重要程度确定加减比例; (3) 确定每道题所考的内容。以上三个步骤体现为各学科试卷 “ 双向 细目表”的制定。
准则关联效度:在此称校标关联效度,效标是衡量试卷是否有效的参 照物, 亦即根据考试对象的状况确定试卷是否有效。常见的效标有: 学 生的学业成绩、 等级评定、 特殊训练成绩、 学习表现等。效标关联 效度就是考察试卷得分与学生的平时表现, 从而确定试卷的有效程度
硕士专业基础课考试信度与难 度评定
试验说明
1 实验素材:中国传媒大学信息工程学院工硕的研 一上学期的36人考试成绩。每个科目满分为100分
科目 通信系统仿真 现代通信原理 现代信号处理
授课老师
张莉
王京玲
牛力丕,姜秀华
2 试验目的:分析某考试的信度,难度,鉴别力。 根据此可以适当调整考试题型,从而使考试题型能 够更好的表现学生的学习能力。
ቤተ መጻሕፍቲ ባይዱ
实验信度
信度指实验结果的可靠性程度,大多数情况下是对测量结 果一致性程度的估计。信度估计方法有5种,本实验采用内 在一致性信度估计。
折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而 估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题 项得分间的一致性。 将实验按奇偶分半,计算二者的相关系数(rhh,即半个量表的信度系 数)