教育测量与评价第三章tzs
《教育测量与评价》第03章在线测试
第一题、单项选择题(每题1分,5道题共5分)1、如果用同一测量工具反复测量同一种特质对象,则多次测量结果间的一致性程度就叫(C)A、A 准确度B、B 复本信度C、C 信度D、D 内部一致性信度2、用同一量表(测验或评价表)对同一组被试施测两次所得结果的一致性程度,叫做(A)A、A 重测信度B、B 复本信度C、C同质性信度D、D评分者信度3、内部一致性系数,是指测验内部所有题目间的一致性程度,也叫做(C)A、A 重测信度B、B 复本信度C、C同质性信度D、D评分者信度4、一个测验分数和效标之间的相关程度,叫做(D)A、A 内容效度B、B 结构效度C、C 测量误差D、D 效标关联效度5、已知测验的分半信度为0.6,原测验的信度为 ( C)A、A 0.85B、B 0.80C、C 0.75D、D 0.70第二题、多项选择题(每题2分,5道题共10分)1、根据信度计算的不同方法,可将信度分为(ABC)A、A 重测信度B、B复本信度C、C同质性信度D、D结构信度2、效度的主要包括以下类型(ABD)A、A 内容效度B、B 结构效度C、C 评分者效度D、D 效标关联效度3、以下哪些是常用的效标(ABC)A、A 学业成就B、B 临床诊断C、C 实际工作表现D、D 智力4、一般说来,影响题目难度的主要因素有那些(BCD)A、A命题的多少B、B 考察能力的复杂程度或层次的高低C、C 考生对题目的熟悉态度D、D 考察知识点的多少5、难度和区分度的关系叙述正确的是(AD)A、A 难度达0.5时,区分度可达最大B、B 区分度达0.5时,难度最大C、C 难度越小,区分度越大D、D 难度为0时,区分度也为0第三题、判断题(每题1分,5道题共5分)1、效度高的测验信度也一定高 T正确错误2、一道选择题,50人参加测验,40人通过,该题的难度为0.8 T正确错误3、5某道论述题满分12分,所有考生在此题上的平均得分为3.6分,此题的难度为0.3 T 正确错误4、在常模参照测验中,试题的难度一般在0.3~0.7之间,试卷的平均难度为0.5左右最好 T 正确错误5、某个题目的难度等于1时,其区分度最大 F正确错误。
现代教育测量与评价学 名词解释 知识点
06231《现代教育测量与评价学》-- 名词解释知识点第一章教育测量与评价的学科发展测量:根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。
P2 2013年4月教育测量:教育测量就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
P3 2005年4月量表(量尺):是确定了测量单位和参照点并具有取值系统的测量工具。
P4 2016年4月称名量表:是最低水平的一种量表,用来对事物或人的心理现象进行分类。
顺序量表:也是用来对事物或人的心理现象进行分类,但这种分类是以所测属性的数量大小为基础进行的。
等距量表:不但能在一个连续体上表示事物量的大小,而且具有相同的测量单位。
等距量表的零点是相对的,即人为确定的相对零点。
比率量表:除了具有量的大小和相等单位外,还具有绝对零点。
比率量表是最高水平的量表。
评价:广义地讲,评价泛指衡量、判断人物或事物的价值。
P5教育评价:(广义的)是指按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。
P7 2010年4月考试:(广义的)泛指人类社会一切测度和甄别人的身心各个方面之群体或个体差异的活动。
P9考试:(狭义的)指由主试根据一定社会的要求,在一定场所,采取一定的方式方法,选择适当的内容,对应试者的德、学、才、体诸多方面或某方面所进行的有组织、有目的的测度或甄别的活动。
教育考试:在学校教育与人才选拔的过程中,教育考试是根据教育内容和目标,选择有代表性的内容和问题,按照一定的方式,对应试者的知识、技能等进行测量与评价的过程。
第二章教育测量与评价的类型和功能形成性测量与评价:是在教学过程中经常实施的,在性质上大致相当于现在的中小学单元测验。
P34 2012年4月诊断性测量与评价:是对经常表现出学习困难的学生所做的测量与评价,它的目的是对个人的问题行为及其原因进行诊断。
教育测量与评价
3.填空题类型
(1)简释题就是通常的名词解释题,要求被试用简单,明了的词语将名词或概念解释清楚。
(2)直接问答题就是让被试对所提出的问题进行解答。例如,“文化大革命”的实质是什么?
(3)列举题就是要求被试根据要求范围列举出事或物,并略作说明。例如,请列出教育测验中常见的选择题型。
简答
制定教育评价表的方法
(1)确定教育评价的对象和目标
(2)初拟评价指标
(3)筛选评价指标
(4)确定评价指标权重
第六章、教育测验的常模及其建立方法
名词解释
1、常模:它是指一个有代表性的样组在某种测验上的表现情况,或者说,是一个与被试同类的团体在相同测验上得分的分布情况与结构模式。
填空
测验的常模可分成两类,一是发展常模,二是组内常模。
第一章、教育测量与评价的学科发展
填空
用数字对事物在量上的规定性予以确定,就需要有一个测量或计算的起点,这个起点叫参照点。
量表,指的是确定了测量单位和参照点并具有取值系统的测量工具。
泰勒指出
英国剑桥大学直到1720年才开始使用笔试。20世纪初,在桑代克的影响下
名词解释
教育测量:就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
2为了帮助学生达到教育目标,应当提供什么学习经验,即怎样帮助学生学习预期的东西。
3怎样组织学习经验,以使这些经验的累计效果最大,即怎样的学习顺序和学习经验的整体计划会有助于学生内化他们所学之物,并将其应用于适当的环境。
4怎样评价方案效果,即随后采取什么步骤,以不断检查期望的学习活动所发生的变化。
美国的“八年研究”对传统的教育测验提出的一些批评
(完整版)教育测量与评价考试重点整理版
(完整版)教育测量与评价考试重点整理版课程性质和教学要求课程的性质:《教育测量与评价》是教育测量学与教育评价学内容的整合并侧重于教育测量的一门综合性教育课程,它着力探讨对教育教学效果进行测量、评价的原理和方法,是一门带有综合性、技术性、实践性、应用性等特征的应用性学科,是实现教育科学研究与教育管理科学化所必须借助的一门科学,也是教育学专业和小学教育专业所开设的一门必修专业基础课程。
教学目标和要求:理解《教育测量与评价》的基本概念、原理和方法,能正确使用各类标准化的教育测验、会作测验质量分析、能正确解释分数的含义,并学会运用这些知识,对学校教育、教学和研究实践中的实际问题,做出比较正确与合理的判断和评价,以促进教育管理现代化、教育研究科学化。
第一章教育测量与评价的学科发展教育测量与评价的基本问题教育测量与评价的发展历史教育测量与评价的学科地位和作用1.测量的定义史蒂文斯曾对测量作出以下定义:“就其广义来说,测量是按照法则给事物指派数字。
”我国有些学者认为:“测量是对客观事物进行某种数量化的测定”,“测量是按照一定的法则,用数字方式对事物的属性进行描述的过程”。
本书的观点:从广义上讲,测量就是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。
从以上对测量所下的各种定义可以看出,这种对事物进行区分的过程,必须是按照一定法则的,区分的结果必须能够用数字的方式进行描述的。
2.测量的要素(1)测量的量具测量的量具是指依据某些科学原理和法则,发展出合适的量具或制定出科学的测量方案。
(2)测量的单位不同的测量所采用的单位是不同的。
理想的测量单位必须符合两个条件:①要有确定的意义;②要有相等的价值。
教育测量的单位不够完善,既无统一的单位,也不符合等距的要求。
(3)测量的参照点量的参照点系测量的起点。
要确定事物的量,必须有一个测量的起点,这个起点就叫做测量的参照点。
参照点有两种类型:①绝对参照点(绝对零点);②相对参照点(相对零点)。
教育测量与评价复习资料
第一章教育测量与评价的学科发展1.测量的三要素:2.教育测量3.教育测量的特点4.史蒂文斯根据测量的精确度将量表分为:5.教育评价的概念6.桑代克在《精神与社会测量导论》中提到:无论什么东西,只要存在的,总存在与数量之中。
7.八年研究的四条基本原则:8.八年研究中泰勒提出了以全面发展的教育目标为核心和依据的两条原理:课程编制原理和评价活动原理。
9.教育测量与评价理论的发展:统计模型提供强有力的支持,20世纪60年代以来:经典测量理论(CTT),项目反应理论(IRT)和概化理论(GT)。
第二章教育测量与评价的类型和功能1.教育测量与评价的主要类型:1)按运用时机分:形成性测量与评价;诊断性测量与评价;终结性测量与评价2)按解释测量结果或评价结果时的参照点分类:常模参照测量与评价;标准参照测量与评价3)按测量与评价被试行为表现的性质分类:最佳行为测量与评价;典型行为测量与评价4)按量表的标准化程度可分为标准化测验和非标准化测验2.教育测量与评价的主要功能: 1)实现教育目标的功能2)改进教师教学的功能3)促进学生学习的功能4)行使教育管理的功能第三章教育测量与评价的质量特性1.信度2.重测信度3.复本信度、内部一致性信度(同质信度)、异质测验4.效度、应注意以下几点5.结构效度验证的四个步骤6.教育测量方案的可用性第四章编制教育测验的一般原理和方法1.选择题的优缺点2.选择题的编写原则:1)题干意义完整并能表达一个确定的问题;2)题干简明;3)题干不要滥用否定结构,要尽可能地采取正面陈述;4)诱答项(干扰项)应具有似真性;5)不能对正确答案有任何暗示;6)统一测验中每一个测验试题之间应相互独立避免牵连;7)选项的文字表达,力求简短精炼;8)尽量避免“以上皆是”“以上皆非”的选项3.填空题的编制原则:1)题意要明确、限定要严密,使空白处应填的答案是唯一的;2)空白处所填写的应是关键词语,并且要和上下文有密切的关系,使被试不至于填写困难;3)题目中空白地方不能太多,以免句子变得支离破碎,不利于被试理解题意;4)尽量将空白放在句子的后面或中间,而不要放在句子开头;5)所有空白处的线段长度应当一致,不能随正确答案文字的多少而长短不一,以免产生暗示作用;6)若答案是数字,应指明单位和数字的精确程度。
自编教育测量与评价第一、三章试卷
2010—2011第一学期《教育测量与评价》第一、三章试题一、名词解释(每小题3分,本大题共15分)1.教育测量:从广义来说,教育测量就是对于教育领域内的事物或现象,根据一定客观标准,作缜密的考核,并根据一定的规则将考核的结果予以量化的描述。
从狭义的角度来说,教育测量是对学生某些学科学习和训练之后,所获得的知识,技能的测量,又称成就测量、学业成绩测量或学科测量。
2.教育评价:所谓教育评价是指在系统地、科学地和全面地搜集、整理、处理和分析教育信息的基础上,对教育的价值作出判断的过程,目的在于促进教育改革,提高教育质量。
3.信度:所谓测量的信度就是同一个测验(或相等的两个、多个测验)对同一组被试实测两次或多次,所得结果的一致性程度,也即测验的可靠性。
4.效度:效度加油测量实际测出所要测的心理特质的程度。
5.区分度:区分度是指测验项目对被试心理品质水平差异的区分能力或鉴别能力。
二、填空题(每一个空1分,本大题共35分)6.所谓测量,从广义上讲,就是根据某些(法则)与程序,用(数字)对事物在量上的规定性予以确定和描述的过程。
7.史蒂文斯根据对测量结果数量化描述的不同水平,将数据分成四种不同水平:(类别数据)、(等级数据)、(等距数据)、(比率数据)。
8.按教育测量的属性可以把测验分为(智力测验)、(能力倾向测验)、人格测验、(教育测验)。
9.根据测验解释结果是的参照点可以把测验分为(常模参照测验)、(标准参照测验)和潜力参照测验。
10.测验的三个基本要素是(行为样本)、(测验的标准化)、(测验评价的客观性)。
11.评价的基本要素:(价值准则)、(判断规则)、(判断基准)。
12.按评价的时间和作用教育评价被分为(诊断性评价)、(形成性评价)和(总结性评价)13.(相对评价)是在被评价对象的集合总体中选取一个或若干个对象为标准,然后将其余评价对象与该标准进行比较,或者是用某种方法把所有评价对象排成先后顺序的评价。
《教育测量与评价》教案
《数学教育测量与评价》教案第一章数学教育测量与评价的学科发展[教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系,了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求,认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。
[重点与难点]重点:数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。
难点:数学教育测量和教育评价的含义及二者之间的关系。
[教学时数]讲授2课时,课堂讨论、学生自主学习1课时[教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合第一节数学教育测量与评价的基本问题一、数学教育测量与评价的含义二、教育评价的基本问题三、教育评价相关概念辨析第二节数学教育测量与评价的发展历史一、中国是考试制度的发源地二、中国科举制度的世界地位三、数学教育测量学科的诞生四、数学教育测量运动的蓬勃开展五、美国的“八年研究”是教育评价的催生剂六、数学教育测量与评价理论的发展第三节数学教育测量与评价的学科地位和作用一、数学教育测量与评价是现代教育科学研究的三大领域之一二、数学教育测量与评价在教育改革中具有重要的作用三、教育改革呼唤数学教育测量与评价更加科学化四、数学教育测量与评价是教师的专业素养和能力[课堂训练、作业思考题][1]数学教育测量与评价有什么联系与区别?[2]教育评价与教育评估有什么联系与区别?[3]在学科专业分类中,“数学教育测量与评价”放在哪一个类别中比较合适?[4]试分析一下,狭义、中义与广义的教育评价概念有何区别?[5]怎样使用数学教育测量与评价这个概念?[6]为什么说数学教育测量与评价在教育中有重要的作用?[7]为什么说数学教育测量与评价是教师必备的知识技能修养?[8]基础教育课程改革对考试评价制度改革提出哪些要求?第二章数学教育测量与评价的类型和功能[教学目的与要求]掌握数学教育测量与评价的不同标准的分类,了解形成性、诊断性和总结性测验(评价)之间的区别和联系,初步了解常模参照测验和标准参照测验的意义与区别,认识潜力参照测量与评价的意义和特点、最佳行为评价和典型行为评价的意义及其区别,初步领会计算机自适应测验的理念,能够分别阐述数学教育测量与评价在实现教育判断、改进教师教学、促进学生学习、行使等教育管理方面的功能。
教育测量与评价
目录分析
这一章重点探讨了学生评价的各个方面,包括学生知识技能的评估、情感态 度价值观的评价以及学生综合素质的评价等。通过科学的评价,可以更好地了解 学生的学习状况和需求,为进一步的教学提供依据。
目录分析
这一章通过具体的案例分析,展示了教育测量在实践中的应用。这些案例涵 盖了不同领域和层次的教育,有助于读者更好地理解和应用教育测量的知识。
这一章重点介绍了教育评价的各种方法和技术,如量表评价法、观察法、问 卷调查法等。通过了解这些方法和技术,读者可以更好地选择适合的评价工具来 评估学生的学习成果。
目录分析
这一章主要讨论了课程评价和教师评价的相关内容,包括课程目标的制定、 课程实施的评价以及教师教学质量的评估等。这些内容对于提高教学质量和优化 课程设计具有指导意义。
阅读感受
阅读这本书还让我认识到教育测量与评价的重要性和必要性。教育测量与评 价不仅可以帮助我们了解学生的学习状况和表现,还可以帮助我们评估自己的教 学效果和水平。通过教育测量与评价,我们还可以发现自己的不足和缺点,及时 进行反思和改进。因此,教育测量与评价是教育教学过程中必不可少的一部分, 它可以帮助我们更好地实现教学目标和提高教育质量。
目录分析
这一章对教育评价的未来发展趋势进行了展望,包括评价理念的更新、评价 技术的创新以及跨学科领域的融合等。通过了解这些趋势,读者可以把握教育评 价的发展方向,为进一步的研究和实践提供指导。
目录分析
通过对《教育测量与评价》这本书的目录分析,我们可以看到其内容涵盖了 教育测量与评价的基本概念、原理、方法和技术以及应用案例等多个方面。这本 书不仅为读者提供了丰富的理论知识,还通过具体的案例展示了教育测量的实际 应用价值。因此,对于从事教育领域的工作者、研究者以及学生来说,《教育测 量与评价》是一本非常有价值的参考书籍。
《教育测量与评价》期末考试指导(带答案)
《教育测量与评价》期末考试指导(带答案)二、复习重点内容第一章教育测量与评价的学科发展1. 测量的含义所谓测量,就是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程测量的要素测量的量具、测量的单位和测量的参照点,是测量的三个基本要素或三个基本条件。
2. 教育测量和教育评价教育测量:就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
教育评价:按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。
3.“行为目标评价模式”和“当代教育评价之父”桑代克的论著《精神与社会测量导论》一书标志着教育测量理论的诞生。
泰勒在1940年的“八年研究”报告书中,首次提出“教育评价”的概念,被称为“当代教育评价之父”。
他认为:教育评价在本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程,并提出“行为目标评价模式”。
第二章教育测量与评价的类型和功能1. 教育测量与评价的类型(1)按测评在教学中运用的时机分类:形成性测量与评价、诊断性测量与评价、终结性测量与评价。
(2)按解释测评结果时的参照点分类:常模参照测量与评价、标准参照测量与评价、潜力参照测量与评价。
(3)按测量与评价的内容分类:智力测量与评价、能力倾向测量与评价、成就测量与评价、人格测量与评价。
(4)按照测量与评价被试行为表现的性质分类:最佳行为测量与评价、典型行为测量与评价。
(5)其它分类:按测量对象可分为个别测量与评价和团体测量与评价;按测验材料可分为文字测验和非文字测验;按量具的标准化程度可分为标准化测验和非标准化测验。
标准化测验是指由测量专家严格按照测验编制程序而编成的一种测验。
第三章教育测量与评价的质量特性1. 衡量测验质量的四个指标从教育测量的理论上来讲,一个良好的测验应该具备恰当的难度和区分度,具备较高的信度和效度,也就是说,测验的信度、效度、难度和区分度是衡量测验质量的基本指标。
教育测量与评价
第一章、教育测量与评价的学科发展教育测量与评价一.教育测量1、测量:根据法则给事物赋予数量。
(史蒂文斯)测量:客观事物及其属性;所依据的规则或方法;数量化的结果。
2、教育测量:广义:对于教育领域内的事物或现象,根据一定的客观标准,作缜密地考核,并依据一定的规则将考核的结果予以数量的描述。
第一,测量是对事物数量特征的获得。
而教育评价则是对教育现象客体的价值进行判断。
第二,教育测量是一种纯客观的过程,其突出特点是客观性。
而教育评价则具有两种属性,即客观性和主观性第三,测量的任务是对事物的量的认识,而评价作为一种认识活动,是人的意识对实践活动及其结果的综合反映,它反映的是活动的过程和终点,又是新的实践活动的起点。
教育测量与评价的产生与发展过程:一.教育测量的产生1904年以前(教育测量的萌芽期)中国的科举制(隋炀帝大业二年,公元606年)科举制的特征:逐级考核、制度完备、考场严格、命题规范科举制的考核方法:口试、贴经、墨义、策间、诗赋产生在中国、发展在西方美国贺拉斯曼1845年将“笔试”引入美国英国费舍在1864年《作业量表集》美国赖斯在1897年的《拼字实验》1904—1915年教育测量的开拓期:美国桑代克的巨着《精神与社会测量导论》问世。
标志着以科学理论为指1、教育评价产生的社会背景:1929—1933年席卷美国、波及全球的经济大萧条社会与教育危机四起生产过剩、工厂倒闭、工人下岗学校因经济不景气,部分学校关闭,有些学校的班级减少。
整个社会和教育皆处于反省之中1930年美国有25%的失业,青年近乎100%找不到工作,1910年14—17岁的青年17%上大学,而到1930年上升到51%。
有相当一部分人上高中并不想上大学,而当时的美国高中设课就是为了上大学服务的,为此中学设课与失业青年的需求就产生了尖锐的矛盾2、教育评价的起源:美国进步主义联盟负责人艾钦于1933—1940年领导了中学课程改革实验研究,其中课程评价委员会由俄亥俄州的州立大学教授泰勒主持,这就是美国教育历史上着名的“八年研究”,也是教育评价问世的开始。
《教育测量与评价》教案
《教育测量与评价》教案第一章:教育测量与评价概述1.1 教育测量与评价的定义1.2 教育测量与评价的目的和意义1.3 教育测量与评价的基本类型1.4 教育测量与评价的发展历程第二章:教育测量与评价的基本理论2.1 教育测量理论2.2 教育评价理论2.3 教育测量与评价的方法论2.4 教育测量与评价的信度和效度第三章:教育测量与评价的设计与实施3.1 教育测量与评价的设计原则3.2 教育测量与评价的设计流程3.3 教育测量与评价的实施步骤3.4 教育测量与评价的数据收集与分析第四章:学生评价4.1 学生评价的定义和意义4.2 学生评价的类型和方法4.3 学生评价的指标体系4.4 学生评价的实施与反馈第五章:课程与教学评价5.1 课程评价的定义和意义5.2 课程评价的类型和方法5.3 教学评价的定义和意义5.4 教学评价的类型和方法第六章:教师评价6.1 教师评价的定义和意义6.2 教师评价的类型和方法6.3 教师评价的指标体系6.4 教师评价的实施与反馈第七章:教育政策与法规7.1 教育政策的定义和意义7.2 教育政策的基本类型和制定过程7.3 教育法规的定义和意义7.4 教育法规的制定和实施第八章:教育测量与评价的应用8.1 教育测量与评价在教育决策中的应用8.2 教育测量与评价在教育质量保障中的应用8.3 教育测量与评价在教育研究中的应用8.4 教育测量与评价在教育公平与均衡发展中的应用第九章:现代教育测量与评价技术9.1 现代教育测量与评价技术的概述9.2 计算机化教育测量与评价技术9.3 网络化教育测量与评价技术9.4 大数据在教育测量与评价中的应用第十章:教育测量与评价的发展趋势10.1 教育测量与评价的国际发展趋势10.2 我国教育测量与评价的发展现状与挑战10.3 教育测量与评价的未来发展趋势10.4 教育测量与评价的发展策略与建议重点和难点解析一、教育测量与评价的定义及目的意义:重点关注教育测量与评价的概念区分及其在教育实践中的重要性。
教育测量与评价[精选多篇]
教育测量与评价[精选多篇]第一篇: 教育测量与评价第一章1.什么是评价?什么是教育评价?答: 评价是指主体按照一定的标准对客体的价值进行判断的过程。
标准是指主体根据自己的价值观以及事物发展的规律形成的对客体发展变化的一种期望, 是判断客体的属性及发展变化达到主体期望的尺度, 是主体对客体价值判断的依据。
陈玉琨:教育评价就是按照一定的价值标准和教育目标, 借助各种方法系统地收集资料信息, 对学生的发展变化及其影响学生变化的各种要素进行价值分析和价值判断, 并为教育决策提供依据的过程。
沈玉顺:教育评价是指通过系统地采集和分析信息, 对教育活动满足预期需要的程度作出判断, 以期达到教育价值增值的过程。
2.什么是发展性教育评价?答:发展性教育评价是一种以促进教育活动价值增值为目的, 着重于教育对象和教育事业发展的目标、条件、进程以及策略方法的建设性评价。
3.简述发展性教育评价的一般过程。
答: ㈠准备阶段⒈明确需要评价的问题⒉确定评价的目的⒊确定评价对象与评价内容⒋确定信息的搜集范围与分析的方法㈡搜集、分析信息阶段;㈢帮助评价对象制定改进方案;㈣再评价阶段4.比较教育评价和教育测量, 教育督导的联系与区别?答: 、教育测量与评价的关系关系: 教育测量就是指根据一定的理论、规则, 运用一定的测量工具对教育现象进行数量化描述的过程。
教育评价是对教育现象状态和价值的判断, 这一判断是以对评价对象的客观描述为前提的, 没有对评价对象的客观描述, 就不会有对评价对象价值的客观判断教育测量是教育评价的基础, 教育评价要在教育测量所获得的客观信息的基础上进行, 同时, 教育测量的结果要通过评价才能获得实际意义区别: (教育测量与评价的)第一, 测量是对事物数量特征的获得, 纯属于对事物客观存在真理性的认识。
而教育评价则是对教育现象客体的价值进行判断, 是对教育现象的价值关系的认识。
第二, 教育测量是一种纯客观的过程, 其突出特点是客观性。
教育测量与评价考试重点版
教育测量与评价考试重点版文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]课程性质和教学要求课程的性质:《教育测量与评价》是教育测量学与教育评价学内容的整合并侧重于教育测量的一门综合性教育课程,它着力探讨对教育教学效果进行测量、评价的原理和方法,是一门带有综合性、技术性、实践性、应用性等特征的应用性学科,是实现教育科学研究与教育管理科学化所必须借助的一门科学,也是教育学专业和小学教育专业所开设的一门必修专业基础课程。
教学目标和要求:理解《教育测量与评价》的基本概念、原理和方法,能正确使用各类标准化的教育测验、会作测验质量分析、能正确解释分数的含义,并学会运用这些知识,对学校教育、教学和研究实践中的实际问题,做出比较正确与合理的判断和评价,以促进教育管理现代化、教育研究科学化。
第一章教育测量与评价的学科发展教育测量与评价的基本问题教育测量与评价的发展历史教育测量与评价的学科地位和作用1.测量的定义史蒂文斯曾对测量作出以下定义:“就其广义来说,测量是按照法则给事物指派数字。
”我国有些学者认为:“测量是对客观事物进行某种数量化的测定”,“测量是按照一定的法则,用数字方式对事物的属性进行描述的过程”。
本书的观点:从广义上讲,测量就是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。
从以上对测量所下的各种定义可以看出,这种对事物进行区分的过程,必须是按照一定法则的,区分的结果必须能够用数字的方式进行描述的。
2.测量的要素(1)测量的量具测量的量具是指依据某些科学原理和法则,发展出合适的量具或制定出科学的测量方案。
(2)测量的单位不同的测量所采用的单位是不同的。
理想的测量单位必须符合两个条件:①要有确定的意义;②要有相等的价值。
教育测量的单位不够完善,既无统一的单位,也不符合等距的要求。
(3)测量的参照点量的参照点系测量的起点。
要确定事物的量,必须有一个测量的起点,这个起点就叫做测量的参照点。
教育测量与评价课程教学标准
《教育测量与评价》课程教学标准第一部分:课程性质、课程目标与教学要求《教育测量与评价》课程,是教育科学与技术学院学校教育本科专业的必修课程。
教育测量与评价是当今世界教育科学研究的三大领域之一。
它不仅在教育科学体系中占有显赫的地位,而且在教育教学过程中具有重要而广泛的应用价值。
由于教育测量与评价在实践中具有强烈的导向作用,因此,教育测量与评价常常成为教育改革的突破口,也往往成为课程改革的支撑点之一。
《教育测量与评价》课程目标是促进学习者理解和掌握教育测量与评价的基本概念、基本知识、基本原理和基本方法;传导教育测量与评价的新理念;提高学习者从事考试设计和学生评价的技能;培养与提高学习者的研究考试与研究教育评价的能力;发展学习者的科学研究能力与批判性思维;增进学习者从事教育研究与改革创新的能力。
《教育测量与评价》课程是应用基础性学科,在内容上与教育学、心理学、统计学等有关联,在应用上与当前学校教育改革紧密联系。
所以,学习本课程,必须要先学习《教育学原理》、《心理学》、《教育统计学》等一些基础课程,同时,学习者要关注教育改革尤其是基础教育考试评价改革。
只有这样,才能更好地理解和掌握课程内容与方法。
第二部分:关于教材与学习参考书的建议本课程拟采用华东师范大学出版社2002年8月出版的、由黄光扬教授主编的(面向21世纪高等师范教育教材)《教育测量与评价》一书,作为本课程的主教材。
为了更好地理解和学习课程内容,建议学习者可以进一步阅读以下几本重要的参考书:1、王汉澜主编:《教育测量学》,河南大学出版社,1987年版。
2、[美]格朗兰德著:《教学测量与评价》,河北教育出版社,1991年版。
3、黄光扬主编:《教育统计与测量评价综合教程》,福建科学技术大学出版社,2003年版。
第三部分:课程教学内容纲要第一章教育测量与评价的学科发展本章主要探讨教育测量与评价的基本问题,包括教育测量与评价的基本概念、教育测量与评价的学科地位、教育测量与评价的应用价值、教育测量与评价的类型和功能等问题。
教育测量与评价教案
教育测量与评价教案第一章:教育测量与评价概述1.1 教育测量的概念与分类1.2 教育评价的定义与功能1.3 教育测量与评价的关系1.4 教育测量与评价的发展历程第二章:教育测量与评价的方法2.1 测验法2.2 观察法2.3 调查法2.4 等级评定法第三章:教育测量与评价的设计3.1 教育测量与评价的设计原则3.2 教育测量与评价的设计步骤3.3 教育测量与评价的实施与反馈3.4 教育测量与评价的改进与完善第四章:学生评价4.1 学生评价的内涵与方法4.2 学生评价的内容与标准4.3 学生评价的实施与注意事项4.4 学生评价案例分析第五章:课程评价5.1 课程评价的概念与作用5.2 课程评价的内容与方法5.3 课程评价的实施与改进5.4 课程评价案例分析第六章:教师评价6.1 教师评价的意义与目的6.2 教师评价的内容与标准6.3 教师评价的方法与工具6.4 教师评价的实施与反馈第七章:教学活动评价7.1 教学活动评价的定义与重要性7.2 教学活动评价的内容与方法7.3 教学活动评价的实施与注意事项7.4 教学活动评价案例分析第八章:教育测量与评价的数据分析8.1 数据分析的概念与意义8.2 数据分析的方法与技术8.3 数据分析在教育测量与评价中的应用8.4 数据分析案例分析第九章:教育测量与评价的伦理与法律问题9.1 教育测量与评价的伦理问题概述9.2 教育测量与评价中的隐私与保密问题9.3 教育测量与评价中的公平性与歧视问题9.4 教育测量与评价的法律规范与案例分析第十章:教育测量与评价的未来发展趋势10.1 教育测量与评价的发展趋势概述10.2 教育测量与评价技术的创新与挑战10.3 教育测量与评价在教育改革中的作用与影响10.4 教育测量与评价的国际发展趋势与比较研究重点和难点解析一、教育测量与评价的概述:理解教育测量的概念与分类,以及教育评价的定义与功能是理解后续内容的基础。
掌握教育测量与评价的关系以及发展历程对于全面理解该领域至关重要。
教育测量与评价课件(3)(第三章-教育测量与评价的质量特性)
如果一个测验有实证效度,则可以拿该测验所预测的效标的性质与种类作为该 测验的结构效度指标,至少可以从效标的性质与种类来推论测量的结构效度。主要 方法有差异被试比较法和先后测试分析法。
效标关联效度
效标关联效度的含义、种类及适用范围 效标关联效度是指一个测验对于处于特定情境中的个体行为进行预测时的有效性。 根据效标资料获得的时间不同及测验使用的目的不同,效标关联效度可以分为: ① 同时效度:测验分数与效标资料的取得约在同一时间内连续完成,计算这两种资
③ 命中率:当测验用取舍决策时,常使用命中率这一指标。因为这类测验效度高不 高,就是看其取舍是否与实际一致。命中率包括总命中率、正命中率和负命中率三种。
思考题 试比较内容效度、结构效度、效标关联
效度的异同?
答: 相同点:三者都是作为检验测验有效程度的指标,都可以作为
评价一个测验优劣的标准。 不同点:① 考察的角度不同。内容效度是指测验题目样本对于应测内容
信度的统计定义
定义1:信度是一个被测团体真分数方差与观察分数方差之 比。即:rXX=σ2T / σ2X
定义2:信度是一个被试团体的真分数与观察分数的相关系 数的平方。即:rXX=ρ2TX
定义3: 信度是一个被试团体在测验X(A卷)上的观察分 数与在测验X的任意一个“平行测验” X´(B卷)上观察分数的
① 测验内部寻找证据法
这种方法是通过研究测验内部结构来验证测验的结构效度。它主要包括内容效 度、作答过程分析、测验的同质性和因素分析等四个方面。
② 测验之间寻找证据法
这一方法的特点是同时考察两个或多个测验间的相互关系,从而来验证测验的 结构效度。它包括相容效度、聚合效度、区分效度和“多种特质-多种方法矩阵法” 等具体方法。
教育测量与评价第三章tzs
(2)建立结构效度的步骤
• A、提出理论假设; • B、根据假定结构拟定测题,编制测验; • C、以测验结果为根据来验证假设结构中 的各种因素是否成立。
(3)结构效度的估计
• 1、内容效度;2;作答过程分析;3、测验 的同质性(p61) • 4、因素分析法 • 其目的是把一些具有错综复杂关系的因素 归结为数量较少的几个综合因素或称共同 因素,并以此测验所测之特质对测验分数 作出解释。 • 考察测验的实证效度 • 1、差异被试比较法 • 2、先后测试分析法
例三
• 对初中一年级学生进行地理成绩测验,每答对1题得1分,答错1 题得0分,其测验结果如下表,试估计该测验的折半信度? • 学生序号 题 序 • 1 2 3 4 5 6 • 1 1 0 0 0 0 0 • 2 0 0 0 1 0 0 • 3 1 0 1 0 0 0 • 4 1 1 0 0 1 0 • 5 1 0 0 1 0 0 • 6 1 1 1 0 1 1 • 7 1 1 1 1 0 1 • 8 1 1 0 1 1 0 • 9 0 1 1 0 0 1 • 10 1 1 1 1 1 1
缺点:
• 1、编制两个完全相等的测验是很困难的,如 果两个复本过分相似,则变成再测形式,而过 分不相似,又使等值的条件不存在; • 2、两个复本测验有可能在某种程度上测量了 不同的性质,这就会低估测验的信度; • 3、被试同时接受性质相似的两个测验,可能 减少完成测验的积极性; • 4、虽然两个复本测验的题目材料不同,但被 试一旦掌握了解题的某一模式,就能触类旁通, 有可能失去复本的意义。
例一
• 在《社会发展史》某一单元教学之前, 对学生进行有关这一单元内容的测验。 教学之后,再以复本测验施测,两次测 验分数如下,试检定测验的内容效度? • 学生序号 1 2 3 4 5 6 7 8 9 10 • 教学前X 34 40 32 30 31 35 44 33 42 36 • 教学后Y 52 64 50 54 58 63 72 62 62 50
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• • • •
4、标准参照测验的信度分析 百分比一致性指标 5、测量标准误 测验信度的一个重要应用,反应测量结果 精确性和可靠性的一个指标,正确解释测 验分数的科学依据。
• 6、评分者信度 • 含义:多个评分者给同一批人的答卷进行 评分的一致性程度。(主观题) • 计算方法: • (1)两个人时,两个人所给分数的相关系 数。 • (2)多人评分是,肯德尔和谐系数
3、折半信度(分半信度)
• 就是将测验分半,再求被试在每一半测验上所 得分数的相关系数。 • 首先根据内容、形式、题数、平均数、标准差、 难度、测题间相关以及分布形态相等的原则, 将试题分成两半,或者将从易到难排列的测题, 按照测题序号,奇数测题为一组,偶数测题为 一组,分成两半; • 然后计算每个被试在两个分半测验分数的积差 相关系数,再用斯皮尔曼—布朗公式加以校正。 • 斯皮尔曼—布朗公式为
• 与内容效度不同,结构效度主要用于智 力测验、人格测验等一些心理测验方面。
3、效标关联效度
• 是以测验分数和效标之间的相关系数来表示测 验效度高低的方法。 • 例如:某年全国高考物理学科的测验效度,可 用大学一年级物理学科的测验分数为效标,然 后求同一组学生高考物理得分与大一物理得分 之间的相关,此相关系数就是该年高考物理测 验的效标关联效度系数。当这个相关系数与总 体零相关有显著性差异时,相关系数的值(正 值)越大,效度就越高;相关系数的值越小, 效度就越低。
(三)提高信度的方法
• • • • • • 1、影响测量信度的主要因素 (1)被试方面 (2)主试方面 (3)施测情境方面 (4)测量工具方面 (5)两次施测的间隔时间方面
2、提高测量信度的常用方法
• • • • • • (1)适当增加测验的长度 (2)测验的难度要适中 (3)测验的内容应尽量同质 (4)测验的程序应统一 (5)测验的时间要充分 (6)测验的评分要尽量做到客观化,减 少评分误差
• • • • •
内容效度: 教学目标、教材要求——测验试题样本 适用于:教育测量(学业成就测验) 用于选拔和分类的职业测验。 不适用于:心理测验,如智力、创造性、 人格等。
2、内容效度的估计
• (1)逻辑分析法 • 其工作思路是请有关专家对测验题目与原定内 容范围的吻合程度作出判断。(命题双向分类 表——题目双向分类表) • (2)统计分析法 • 从同一个教学内容总体中抽取两套独立的平行 测验,用这两个测验来测同一批被试,求其相 关。若相关高,表明测验内容效度较高;若相 关低,表示测验的内容效度较低。
例三
• 对初中一年级学生进行地理成绩测验,每答对1题得1分,答错1 题得0分,其测验结果如下表,试估计该测验的折半信度? • 学生序号 题 序 • 1 2 3 4 5 6 • 1 1 0 0 0 0 0 • 2 0 0 0 1 0 0 • 3 1 0 1 0 0 0 • 4 1 1 0 0 1 0 • 5 1 0 0 1 0 0 • 6 1 1 1 0 1 1 • 7 1 1 1 1 0 1 • 8 1 1 0 1 1 0 • 9 0 1 1 0 0 1 • 10 1 1 1 1 1 1
例一
• 在《社会发展史》某一单元教学之前, 对学生进行有关这一单元内容的测验。 教学之后,再以复本测验施测,两次测 验分数如下,试检定测验的内容效度? • 学生序号 1 2 3 4 5 6 7 8 9 10 • 教学前X 34 40 32 30 31 35 44 33 42 36 • 教学后Y 52 64 50 54 58 63 72 62 62 50
缺点:
• 1、编制两个完全相等的测验是很困难的,如 果两个复本过分相似,则变成再测形式,而过 分不相似,又使等值的条件不存在; • 2、两个复本测验有可能在某种程度上测量了 不同的性质,这就会低估测验的信度; • 3、被试同时接受性质相似的两个测验,可能 减少完成测验的积极性; • 4、虽然两个复本测验的题目材料不同,但被 试一旦掌握了解题的某一模式,就能触类旁通, 有可能失去复本的意义。
(二)效度的估计
• 效度估计就是多方寻找证据来证明一个测验的 有效性程度的过程。 • 1、内容效度 • 就是指测验内容对所要测量的内容的代表性程 度。也就是说,测验的内容范围、材料与所要 测量的内容范围、教育目标是否相符合;测验 中测题所引起的行为是否是所要测量的属性的 明确反应;测验的结果是否是一个有代表性的 行为样本。 • 为了使测验的内容具有有效性,成为所欲测量 内容的一个具有代表性的行为样本,在编制测 验时,就要考虑建立内容效度的问题。
结论
• 教学前后学生在两个复本测验上得分的 平均数有极显著性差异,从而可以作出 判断,《社会发展史》中该单元测验的 内容具有有效性,或内容效度较高。
• 内容效度主要应用于成就测验、学科测 验、选拔和分类职业测验。 • 内容效度不适合用于能力倾向和人格测 验。
2、结构效度
• 是指测验对于人的心理特性或理论概念 测量到的程度。通常用某种操作来定义, 并用测验来测量。 • 例如:人的创造力可以分解为人的思维 流畅性、灵活性和创造性三大特性,并 根据这三大特性编制测验,若有足够的 证据来证明该测验确实可以测到这些特 性,则认为该测验是个结构效度较高的 创造力测验。
(1)结构效度的特点
• 结构效度的大小完全取决于事先假定的心理特 质理论,一旦人们对同一种心理特质有着不同 的定义或假设,则会使得关于特质测验的结构 效度的研究结果无法比较。 • 当实际测量的资料无法证实我们的理论假设时, 并不一定就表明该测验结构效度高。因为还有 可能出现理论假设不成立,或者该实验设计不 能对该假设作适当的检查等情况,这就使得结 构效度的获取更为困难。
主要对测量的项目(题目)而言。
• 难度区
第一节
教育测量与评价的信度
Байду номын сангаас
• 一、什么是信度 • 信度是指测量结果的稳定性或可靠性程度。 • 即:用同一量表测量同一特质对象,多次测量间 的一致性程度。 • 一般地说,一个好的测量必须具有较高的信度, 也就是说,一个好的测量工具,只要遵守操作规 则,其结果就不应随工具的使用者或使用时间等 方面的变化而发生较大的变化。 • 必须从以下两个方面去理解测量的信度: • 信度指实测值(X)和真值(T)相差的程度; • 信度指两次重复测量或等值测量之间的关联程度。
• 2、对10名应试者先进行某种测验X,隔 适当时间后(半年),再进行内容、范 围、难度类似的第二次测验Y,试求测验 的复本信度? • 应试者 1 2 3 4 5 6 7 8 9 10 • X 9 10 10 6 10 8 4 8 9 4 • Y 4 9 7 9 4 3 5 3 2 4
• 3、有一个由100题构成的量表施行于10个 高三学生(分数见下表)。测验一次后, 学生即毕业离校,现怎样评价测验结果的 信度? • 学生序号 1 2 3 4 5 6 7 8 9 10 • 奇X 38 37 38 41 40 36 38 39 40 35 • 偶Y 37 37 36 39 39 34 38 39 39 36
作业
• 1、用某量表测验10名学生,得分记为X, 为了考察结果的可靠性,于15天后用原量 表对这10个学生重测一次,得分记为Y,问 测验结果是否可靠? • 学生序号 1 2 3 4 5 6 7 8 9 10 • X 8 10 9 6 10 7 5 7 9 4 • Y 9 10 10 6 10 8 4 8 9 4
在使用重测法计算稳定性系数时,应 注意以下问题:
• 1、信度的取值范围为[0,1],当信度值较大时, 说明前后两次测量结果比较一致; • 2、两次测验之间的时间间隔要适宜。应由测 验的性质、测题类型、测题数量和被试特点所 决定; • 3、重测法适用于速度测验而不适用于难度测 验; • 4、适用于运动技能的测验,如跑、跳,较少 受重复测量的影响。
• 第一、第二种定义为理论定义,不具有实 际操作意义,第三种可以实际操作。因为 真分数很难确定,不可得。
三、信度的估计方法
• (一)重测信度 • 指的是同一个量表对同一组被试施测两次 所得结果的一致性程度。 • 其大小等于同一组被试在两次测验上所得 分数的相关系数,一般采用皮尔逊积差相 关的公式来计算。
(二)复本信度
• 指的是两个平等的测验测量同一批被试 所得结果的一致性程度。 • 其大小等于同一批被试在两个复本测验 上所得分数的相关系数。 • 所谓复本测验(也称平行测验)是指在 性质、内容、题型、题数、难度等方面 都一致(或相等)的两份或多份测验。 但试题不相同。
• 实施复本测验的两种方式:P49 • 复本测验不仅适用于难度测验,也是估计 速度测验信度的好方法。 • 在作追踪研究或探讨某些影响测验因素成 绩的因素时,大多使用复本测验,分析复 本信度。
二、信度的统计定义
• X=T+E • 误差E的平均数为零,且与真分数T之间是
相互独立的,及相关系数是零。 • 公式推导、两边求方差。 • 方差、相关系数
• 信度的三种统计定义: • 1、真分数方差与观察分数方差之比: • 测验的信度一般在0和1之间取值(?), 信度越接近1,考试的信度越高。 • 2、被试团体的真分数与观察分数的相关系 数的平方。 • 3、被试团体在测验X(A卷)的观察分数 与在测验X的任意一个“平行测验”X’(B 卷)上的观察分数的相关系数。
例二
• 以A、B两型英语复本测验对初中三年级10个学生施 测,为避免由测验施测顺序所造成的误差,其中5个 学生先做A型测验,休息15分钟后,再做B型测验; 而另5个学生先做B型测验,休息15分钟后,再做A 型测验。10个学生A型测验结果记为X,B型测验结 果记为Y,其测验的复本信度如何? • 学生序号 1 2 3 4 5 6 7 8 9 10 • X 19 19 18 17 16 15 15 14 13 12 • Y 20 17 18 18 17 15 13 15 12 12
(2)建立结构效度的步骤