教育测量与评价(期末复习重点)
教育测量与评价期末总复习资料
测量(measurement):根据某些法则和程序,用数字对事物在量上的规定性予以确定和描述的过程。
教育测量:针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
评价:泛指衡量、判断人物或事物的价值。
评价活动的过程是对人物或事物的价值进行分析、衡量和判断的过程。
教育评价:按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。
名人名言:1.“教师应该成为人类优秀文化的拥有者”2.“教师应该拥有教育测量与评价的理念与能力”3.“评价最重要的意图不是为了证明,而是为了改进”格兰朗德:(N. E.Gronlund)他认为评价是为了确定学生达到教学目标的程度、收集、分析和解释信息(课堂)系统过程;评价包括对学生的定量描述(测量)和定性描述(非测量)两方面。
评价=测量(定量描述)+非测量(定性描述)+价值判断。
世界性名言:评价是所有成功教学的基础。
斯塔费尔比姆:(L.D.Stufflebeam)评价是一种划定、获取和提供叙述性和判断性信息的过程。
CIPP评价模式,亦称决策导向或改良导向评价模式,是美国教育评价家斯塔弗尔比姆倡导的课程评价模式。
它认为评价就是为管理者做决策提供信息服务的过程。
背景评价(Context Evaluation)、输入评价(Input Evaluation)、过程评价(Process Evaluation)、结果评价(Product Evaluation)构成了CIPP评价模式。
(具有灵活性)CIPP模式的基本观点是:评价最重要的目的不在证明,而在改进。
(他的名言)它主张评价是一项系统工具,为评价听取人提供有用信息,使得方案更具成效。
CIPP评价模式的优势是回答了泰勒模式中部分疑难问题,突出了评价的发展性功能,整合了诊断性评价、形成性评价和终结性评价,提高了人们对评价活动的认可程度。
教育测量与评价期末复习题
逻辑效度:内容效度又称逻辑效度、表面效度,是指项目对欲测的内容或行为范围取样的代表性程度,即测量内容的适当性和相符性。成就测验和熟练测验特别注重这种效度。
统计效度:是指实验数据确实表示自变量与因变量的因果关系,这种关系不是偶然的。
2、内容效度(概念、结合测验蓝图编制:双向细目表)
3、效标关联效度
②著名的测量与评价领域人及名言
格兰朗德(N.E.Gronlund)认为,评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的(课堂)系统过程;评价包括对学生的定量描述(测量)和定性描述(非测量)两方面。
“教育测量与评价是所有成功教学的基础”。
斯塔费尔比姆说,“评价最重要的意图不是为了证明,而是为了改进。”
复本信度:在试题格式、题数、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但测试又不是相同的测试。也称作平行测验。
⑵同质性信度(内部一致性信度):测验内部所有题目间的一致性程度,即一个测验所测内容或特质的相同程度。
分半信度:讲一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
3、相关概念
①教育测量与评价关系
②测验与考试:测验是测量的工具。测验的概念比考试的概念更广泛,教育测验包括教育考试。测验或考评价领域人及名言
①桑代克“无论什么东西,只要存在的,总存在于数量之中。”
②麦柯尔(W.A.Mecall)“任何东西,存在于数量中的,都可以被测量。”
第三章质量特性
1、教育测量与评价包括哪四度?考虑方案的可用性。(P86)信度、效度、难度、区分度
一、信度
1、概念、分类
2、模型X=T+E,反映的是误差
信度反映的是()
教育测量与评价考试重点
第一章教育测量与评价的学科发展第一节教育测量与评价的基本问题1.测量:所谓测量,从广义上讲,就是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。
2.测量的要素(基本条件):测量的量具、测量的单位、测量的参照点。
3.教育测量就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
4.量表的特点:称名数据:不具有实在的数量意义,只是表明事物的类别或不同性质顺序数据:是以所测属性的数量大小为基础进行的等距量表:表示事物量的大小,而且具有相同的测量单位比率量表:除了具有量的大小和相等单位外,还具有绝对的零点5.教育测量与教育评价的联系与区别:测量是按照一定的法则和程序,对事物或现象在量上的规定性加以确定和描述的过程,旨在获得有一定说服力的数量事实;教育评价是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实(定性资料与定量资料)基础上,做出价值分析和价值判断。
因此,从这个意义上说,教育测量可以为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;而教育评价往往是教育测量过程的延续,是对测量结果的解释与应用。
第二节教育测量与评价的发展历史1.1864年法国费舍《作业量表集》,作为教师以后评定学生各科成绩的参照标准2.美国桑代克于1904年出版《精神与社会测量导论》,首次较系统地介绍了教育统计方法及编制测验的基本原理,它标志着以科学理论(包括统计学、教育学、心理学、哲学等)为指导的教育测量理论的诞生3.桑代克“无论什么东西,只要存在的,总存在与数量之中”4.麦柯尔“任何东西,存在于数量中的,都可以被测量”5.法国的比纳等人在1905年创编并发表了世界上第一个标准化智力测验第三节教育测量与评价的学科地位和作用1.新课改即《基础教育课程改革纲要》(试行)提出的要求:(1)建立促进学生全面发展的评价体系(2)发挥评价的教育功能,促进学生在原有水平上的发展(3)建立促进教师不断提高的评价体系。
教育测量与评价重点 ()
1、教育测量的含义与特点是什么?含义:针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
教育测量学是一门发展较早、应用较多、内容较丰富的教育科学分支。
特点:(1)间接性和推断性(2)测量对象的模糊性和测量误差的不可避免性(3)量表具有多样性,结果具有相对抽象性2、教育测量与评价在教育系统中有哪些作用?(1)教育测量与评价在教育系统中的作用:教育本身是一个系统。
在教育系统中,学生、教师、学生、教育方案、课程、教材、教学训练、考试等都是这个系统的组成部分。
当根据教育目标和计划、把教育方案、课程、教学等因素作用于学生身上后,需参照教育目标和计划,对教育效果及其输入条件的妥当性予以测量评估、价值分析和判断。
然后,把这一测量与评价过程所获得的信息反馈给教育者、学习者以及有关教育决策者,以便改进教育的策略与方案,更有效地答道教育目的。
(2)在教育系统运转过程中,除了对教育效果要进行测量与评价外,还要针对影响教育效果的诸因素进行客观的分析和评价。
教育测量与评价在教育系统中对实现教育目标起着重要的作用。
(2)教育改革常常以教育测量与评价的改革作为突破口。
27、教育测量与评价的学科地位和作用:①教育测量与评价是现代教育科学研究的三大领域之一;②教育测量与评价在教育改革中具有重要的作用;③教育改革呼唤教育测量与评价更加科学化;④教育测量与评价是教师的专业素养和能力教育测量与评价的主要功能:①实现教育判断的功能;②改进教师教学的功能;③促进学生学习的功能;④行驶教育管理的功能5.试述教育测量与教育评价之间的关系测量与评价既有联系又有区别。
从句法意义上讲,测量是按照一定的法则和程序,对事物或现象在量上的规定性加以确定和描述的过程。
教育测量则是对教育效果或者学生各方面的发展予以测量和描述的过程,旨在获得有一定说服力的数量事实,是一种以量化为主要特征的事实判断。
而教育评价是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实(定性资料与定量资料)基础上,作出价值分析和价值判断。
教育测量与评价期末考试重点
教育测量与评价重点一、定义1、测量:从广义上讲,是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。
2、教育测量:根据一定的理论、规则,运用一定的测量工具对教育现象进行数量化描述的过程。
3、教育评价:按照一定的价值标准和教育目标,利用测量和非测量的方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为就决策提供依据的过程。
4、信度:是指测量结果的可信程度和稳定性程度,指用同一测量工具反复测量同一种物质对象所得多次测量结果间的一致性程度。
5、重测信度:又称稳定性系数,指用同一个量表(测验或评价表)对同一组被试施测两次所得结果的一致性程度6、复本信度:又称为平行测验,指在试题格式、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同的测验。
7、等值性系数:在同一时间连续施测,反映测验内容造成的误差是多少8、同质性信度:又称为内部一致性信度,指测验内部所有题目间的一致性程度。
9、评分者信度:指多个评分者给同一批人的答卷进行评分的一致性程度10、效度:是指一个测验或量表实际能测出其所要测量的特性的程度。
11、内容效度:又称合理效度或逻辑效度,是测验题目样本对于应测内容与行为领域的代表性程度。
12、难度:被试完成题目或项目任务时遇到的困难程度13、区分度:是指题目区别被试水平能力的量度,区分度的高低直接影响到测验的信度和效度14、领域参照测验:是建立在一套完善的题目汇编或内容领域规范汇编基础上用以检查被试的素质及发展水平的测验。
15、目标参照测验:是由和目标相适应的一组题目所构成的测验。
16、掌握测验:是建立一组教学和行为目标上的测验,主要用于判断学生是否掌握某组给定的教育目标。
17、正确百分数:是以学生在标准参照测验中答对题目的比例来解释测验分数或描述学生取得成就的方法。
18、常模:指一个有代表性的样组在某种测验上的表现情况19、参照测验的常模:对测验的分数进行解释与评价的测验20、参照测验的“常模”,对测验的分数进行解释与评价的测验,称为常模参照测验21、参照测验的“标准”,对测验的分数进行解释与评价的测验,称为标准参照测验22、标准分数:是以平均数为参照点,标准差为单位的一种量表分数,它将原始分与平均数的距离以标准差为单位来表示23、想象:是在原有的感性材料的基础上,经过重组联合等加工改造而创造出新形象的活动24、能力倾向:是指一个人获得新的知识、能力和技能的内在潜力。
《教育测量与评价教案》复习要点
《教育测量与评价》考点测量的三要素1、单位。
2、参照点。
3、量表。
由于制订量表的单位和参照点不同,量表的种类也不同,一般从低到高,分为四种水平:类别量表水平(称名量表)、顺序量表水平(等级量表)、等距量表水平(等距量表)、比率量表水平(比率量表)。
教育评价与教育测量的关系测量是依据一定的法则和程序,对事物或现象在数量上的规定性加以描述和确定的过程;评价是泛指根据一定的观念和标准衡量、判断人物或事物的价值。
测量的结果只有通过评价的解释才能揭示其实际意义。
测量是依据,评价是测量的具体体现。
测量关心的是数量的多少,评价关心的是价值的高低;测量是纯客观的,评价带有主观性;测量是一种单一的活动,评价则是一种综合的活动。
教育测量就是借助一定的工具,给教育现象赋值,来获取评价对象数量的方法。
教育测量是教育评价获得数据资料的重要手段。
教育测量可以为教育评价提供价值判断的基本数量事实,是教育评价的基础;教育评价是教育测量过程的延续,是对教育测量结果的解释与应用。
教育评价的功能(1)导向功能。
(2)监督检查功能。
(3)激励功能。
(4)筛选择优功能。
(5)诊断改进功能。
1940年,泰勒教授提出了第一个报告,第一次提出了“教育评价”这个概念。
教育评价产生的标志是“八年研究”;泰勒被称为“教育评价鼻祖”。
(一)稳定性系数(重测信度)指用同一测验试卷,在先后两个不同时间内对同一组被试进行测验,两次测验实得分数的相关系数。
这是最简单的估量信度的方法。
其大小等于同一组被试在两次测验上所得分数的积差相关系数。
∑∑-∑∑-∑∑∑-=n X X n X X n X X X X tt/)(/)(/))((222221212121γ练习题:对12名学生的英语听力先后进行施测,一个月内的两次测验成绩如下表,试估计测验的信度系数。
∑∑-∑∑-∑∑∑-=n X X n X X n X X X X tt /)(/)(/))((222221212121γ =0.94(二)等值性系数(复本信度)练习题:用A 、B 两份等值的英语听力难度测验,分别在上下午对10个学生进行测验,其测验结果如下表,试估计测验的信度系数。
(完整版)教育测量与评价考试重点整理版
课程性质和教学要求课程的性质:《教育测量与评价》是教育测量学与教育评价学内容的整合并侧重于教育测量的一门综合性教育课程,它着力探讨对教育教学效果进行测量、评价的原理和方法,是一门带有综合性、技术性、实践性、应用性等特征的应用性学科,是实现教育科学研究与教育管理科学化所必须借助的一门科学,也是教育学专业和小学教育专业所开设的一门必修专业基础课程。
教学目标和要求:理解《教育测量与评价》的基本概念、原理和方法,能正确使用各类标准化的教育测验、会作测验质量分析、能正确解释分数的含义,并学会运用这些知识,对学校教育、教学和研究实践中的实际问题,做出比较正确与合理的判断和评价,以促进教育管理现代化、教育研究科学化。
第一章教育测量与评价的学科发展教育测量与评价的基本问题教育测量与评价的发展历史教育测量与评价的学科地位和作用1.测量的定义史蒂文斯曾对测量作出以下定义:“就其广义来说,测量是按照法则给事物指派数字。
”我国有些学者认为:“测量是对客观事物进行某种数量化的测定”,“测量是按照一定的法则,用数字方式对事物的属性进行描述的过程”。
本书的观点:从广义上讲,测量就是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。
从以上对测量所下的各种定义可以看出,这种对事物进行区分的过程,必须是按照一定法则的,区分的结果必须能够用数字的方式进行描述的。
2.测量的要素(1)测量的量具测量的量具是指依据某些科学原理和法则,发展出合适的量具或制定出科学的测量方案。
(2)测量的单位不同的测量所采用的单位是不同的。
理想的测量单位必须符合两个条件:①要有确定的意义;②要有相等的价值。
教育测量的单位不够完善,既无统一的单位,也不符合等距的要求。
(3)测量的参照点量的参照点系测量的起点。
要确定事物的量,必须有一个测量的起点,这个起点就叫做测量的参照点。
参照点有两种类型:①绝对参照点(绝对零点);②相对参照点(相对零点)。
《教育测量与评价》期末考试指导(带答案)
《教育测量与评价》期末考试指导(带答案)二、复习重点内容第一章教育测量与评价的学科发展1. 测量的含义所谓测量,就是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程测量的要素测量的量具、测量的单位和测量的参照点,是测量的三个基本要素或三个基本条件。
2. 教育测量和教育评价教育测量:就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
教育评价:按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。
3.“行为目标评价模式”和“当代教育评价之父”桑代克的论著《精神与社会测量导论》一书标志着教育测量理论的诞生。
泰勒在1940年的“八年研究”报告书中,首次提出“教育评价”的概念,被称为“当代教育评价之父”。
他认为:教育评价在本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程,并提出“行为目标评价模式”。
第二章教育测量与评价的类型和功能1. 教育测量与评价的类型(1)按测评在教学中运用的时机分类:形成性测量与评价、诊断性测量与评价、终结性测量与评价。
(2)按解释测评结果时的参照点分类:常模参照测量与评价、标准参照测量与评价、潜力参照测量与评价。
(3)按测量与评价的内容分类:智力测量与评价、能力倾向测量与评价、成就测量与评价、人格测量与评价。
(4)按照测量与评价被试行为表现的性质分类:最佳行为测量与评价、典型行为测量与评价。
(5)其它分类:按测量对象可分为个别测量与评价和团体测量与评价;按测验材料可分为文字测验和非文字测验;按量具的标准化程度可分为标准化测验和非标准化测验。
标准化测验是指由测量专家严格按照测验编制程序而编成的一种测验。
第三章教育测量与评价的质量特性1. 衡量测验质量的四个指标从教育测量的理论上来讲,一个良好的测验应该具备恰当的难度和区分度,具备较高的信度和效度,也就是说,测验的信度、效度、难度和区分度是衡量测验质量的基本指标。
教育测量与评价
《教育测量与评价》期末复习重点一、名词解释1.教育测量:指针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
2.教育评价:教育评价是指按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。
3.常模参照:常模参照测量与评价是将被试水平与测验常模相比较,以评价被试在团体中的相对地位的一种测量与评价类型。
4.标准参照(标准参照测验):在一定的行为领域上按照具体的行为标准水平对被试的测验结果作出直接解释的测验。
标准参照测量与评价是将被试的表现与既定的教育目标或行为标准相比较,以评价被试在多在大程度上达到该标准。
5.典型行为:典型行为测量与评价要求被试按通常的习惯方式做出反应(即典型行为),其目的不在于测量与评价被试能力的高低,而是测量与评价是否具备某种典型行为。
6.最佳行为:最佳行为测量与评价是以测量被试的最佳行为表现为目的。
如以成就或能力的高低作为评价基础。
7.重测信度:指用同一个量表对同一组被试施测两次所得结果的一致性程度。
8.复本信度:指两个平行测验测量同一批被试所得结果的一致性程度。
9.同质性信度:指测验内部所有题目间的一致性程度。
10.内容效度:指一个测验实际测到的内容与所要测量的内容之间的吻合程度。
包括欲测的知识范围,以及该范围内各知识点所要求掌握的程度两个方面。
11.结构效度:指一个测验实际测到所要测量的理论结构和特质的程度,或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。
12.实证(效标关联)效度:指一个测验对处于特定情境中的个体的行为进行估计的有效性。
13.区分度:指测验项目对被试心理品质水平差异的区分能力或鉴别能力。
项目的区分度是测验是否有效的“指示器”。
常记为D。
14.评价指标:指根据评价的目标,由评价指标的设计者分解出来的,能够反映评价对象某方面本质特征的具体化、行为化的主要因素,它是对评价对象进行价值判断的依据。
教育测量与评价学期末复习提纲
1,教育评价:教育评价是根据一定的教育价值观或教育目标(或以个体发展与社会发展为目标),运用可行的科学手段,通过系统地收集信息、资料和分析整理,对教育活动(计划)、教育过程和教育结果进行价值判断,从而为不断自我完善和教育决策提供依据的过程。
2 评价心理:指评价者和被评价者的大脑对评价过程的反映,既包括评价者及被评价者反映评价现实的心理现象,也包括他们对评价现实反映的行为方式。
3,狭义的“课程评价”:特指对课程计划、课程目标、教材在改进学生学习方面的价值作出判断的活动或过程,包括对课程目标体系的评价,对课程计划的评价,对课程标准的评价,对教材的评价等核心内容。
4, 指标:指综合反映某种社会现象状况的一些数字,把这些数字与反映对象某一方面的因素结合起来,就构成了指标。
5,教育测量:教育测量就是对于教育领域内的事物或现象,根据一定的客观标准,按照一定的规则将考核结果以数量的描述。
6,定性分析方法:是用语言描述形式以及哲学思辨、逻辑分析揭示被评价对象特征的信息收集分析、处理的方法。
7.指标系统:任何一指标都不反映全部的目标,它只反映目标的一个方面。
或者说,它只反映目标的一个局部,只有系统化的,具有紧密联系的一群指标,才反映全部的目标,称之为指标体系。
8,CIPP模式:CIPP模式亦称决策类型模式,创立人是斯塔弗尔比姆。
它认为评价就是为管理者做决策提供信息服务的过程。
背景评价、输入评价、过程评价、结果评价构成了CIPP评价模式。
9,定量分析方法:是指用数值形式以及数学、统计方法反映被评价对象特征的信息分析、处理的方法。
10,教学评价:指根据一定的教学目的和标准,对教师的教和学生的学进行系统检测,并评定其价值及优缺点以求改进的过程11.简述泰勒原则的四个步骤.答:确定目标、选择经济、组织经验、评价效果1)学校应该达到哪些教育目标2)提供哪些教育经验才能实现这些目标3)怎样才能有效地组织这些教育经验4)我们怎样才能确当这些目标正在得到实现12.完整的评价方案包括哪些内容答:完整的评价方案包括:评价目的、评价的内容和目的要求;评价准则(指标体系、概括性问题);评价方法;评价的时间安排、注意事项。
教学评价与测量考试复习重要知识点总结
教学评价与测量考试复习重要知识点总结一、教学评价概述1.教学评价的定义与目的:明确教学评价的概念、目的及其在教育教学中的作用。
2.教学评价的类型:了解形成性评价、总结性评价、诊断性评价等不同类型的特点及应用场景。
3.教学评价的原则:掌握教学评价应遵循的客观性、公正性、科学性等原则。
二、学生学业评价1.学业评价的方法:熟悉测验、作业、课堂表现、作品展示等学业评价方法的优缺点及适用范围。
2.学业评价的标准:理解学业评价标准的制定依据,掌握如何根据教学目标和学生特点设定合理的评价标准。
3.学业评价的实施与反馈:学会如何有效地实施学业评价,并及时给予学生反馈,促进其学习进步。
三、教师教学评价1.教师教学评价的内容:了解教师教学态度、教学方法、教学效果等方面的评价内容。
2.教师教学评价的方法:掌握同行评价、学生评价、自我评价等教师教学评价方法的操作要点。
3.教师教学评价的改进:学会根据评价结果进行教学反思和改进,提升教学质量。
四、教学评价的技术与工具1.教学评价量表的设计:了解如何根据评价目的和内容设计合理的评价量表。
2.教学评价软件的使用:熟悉常用教学评价软件的功能及操作方法,提高评价效率。
3.数据收集与分析方法:掌握问卷调查、访谈、观察等数据收集方法,以及数据分析的基本技巧。
五、教育测量基础知识1.教育测量的概念与特点:理解教育测量的定义、特点及其在教育教学中的作用。
2.教育测量的类型:了解常模参照测量、标准参照测量等不同类型的测量方式。
3.教育测量的信度与效度:掌握信度、效度等测量学基本概念及其在教育测量中的应用。
六、教育测量工具编制与使用1.测验题目的编制:了解测验题目的编写原则、题型设计及难度控制。
2.测验的实施与管理:学会如何有效地组织、实施测验,确保测验结果的准确性和公正性。
3.测验结果的解释与应用:掌握如何对测验结果进行统计分析,并据此为教育教学提供有针对性的建议。
以上是教学评价与测量考试复习的重要知识点总结,考生在复习过程中应注重理论与实践的结合,掌握各种评价方法和测量工具的操作技巧,同时关注教育评价领域的最新动态和研究成果。
教育测量与评价(期末复习重点)
• 板书公式
• 请阅读,并解释公式含义。
•
例4
• 用一个包含6个论文式试题的测验,测5个被试,结果如下,试求 该测验的信度? • 题序 学生序号 • 1 2 3 4 5 某题得分方差 • 1 3 6 1 6 5 • 2 4 3 3 2 3 • 3 3 4 1 2 1 • 4 2 5 2 1 2 • 5 1 4 4 5 4 • 6 4 6 5 3 2 • 总分 17 28 16 19 17
2、复本信度
• 指的是两个平等的测验测量同一批被试 所得结果的一致性程度。 • 其大小等于同一批被试在两个复本测验 上所得分数的相关系数。 • 所谓复本测验是指在格式、内容、题型、 题数、难度、指导语说明、施测要求等方 面都一致(或相等)的两份或多份测验。
例二
• 以A、B两型英语复本测验对初中三年级10个 学生施测,为避免由测验施测顺序所造成的误差, 其中5个学生先做A型测验,休息15分钟后,再做 B型测验;而另5个学生先做B型测验,休息15分 钟后,再做A型测验。10个学生A型测验结果记 为X,B型测验结果记为Y,其测验的复本信度如 何? • 学生序号 1 2 3 4 5 6 7 8 9 10 • X 19 19 18 17 16 15 15 14 13 12 • Y 20 17 18 18 17 15 13 15 12 12
复本信度的优缺点表现:
• 优点: • 1、两个复本在同时使用时,可以避免再测信 息的一些缺点如首测对再测在记忆、练习、效果 的影响,间隔期间获得新知识的影响,两次施测 的环境不同和被试主观状态不同的影响,以及为 了应付测验所作训练的影响等。反映究竟是不是 真正的平行测验;换言之,反映了测验内容造成 的误差。
第二节 效度
• 一 、什么是效度 • 效度是指测量结果的准确性和有效性的程度。 也可以说是测量是否达到了预期的目的。 • 1、效度是一个相对的概念。 • 测量的效度是相对一定的测量目的而言的 • 2、一种测量的效度只是高或低的问题 • 测量结果总是有一定效度的,只是效度高低不 同罢了。 • 3、教育领域的效度问题比其他领域的测量更 重要。
教育测量与评价 复习要点 附试卷
教育测量与评价复习要点总结第一章教育测量与评价的学科发展1.测量的三要素:2.教育测量3.教育测量的特点4.史蒂文斯根据测量的精确度将量表分为:5.教育评价的概念6.桑代克在《精神与社会测量导论》中提到:无论什么东西,只要存在的,总存在与数量之中。
7.八年研究的四条基本原则:8.八年研究中泰勒提出了以全面发展的教育目标为核心和依据的两条原理:课程编制原理和评价活动原理。
9.教育测量与评价理论的发展:统计模型提供强有力的支持,20世纪60年代以来:经典测量理论(CTT),项目反应理论(IRT)和概化理论(GT)。
第二章教育测量与评价的类型和功能1.教育测量与评价的主要类型:1)按运用时机分:形成性测量与评价;诊断性测量与评价;终结性测量与评价2)按解释测量结果或评价结果时的参照点分类:常模参照测量与评价;标准参照测量与评价3)按测量与评价被试行为表现的性质分类:最佳行为测量与评价;典型行为测量与评价4)按量表的标准化程度可分为标准化测验和非标准化测验2.教育测量与评价的主要功能: 1)实现教育目标的功能2)改进教师教学的功能3)促进学生学习的功能4)行使教育管理的功能第三章教育测量与评价的质量特性1.信度2.重测信度3.复本信度、内部一致性信度(同质信度)、异质测验4.效度、应注意以下几点5.结构效度验证的四个步骤6.教育测量方案的可用性第四章编制教育测验的一般原理和方法1.选择题的优缺点2.选择题的编写原则:1)题干意义完整并能表达一个确定的问题;2)题干简明;3)题干不要滥用否定结构,要尽可能地采取正面陈述;4)诱答项(干扰项)应具有似真性;5)不能对正确答案有任何暗示;6)统一测验中每一个测验试题之间应相互独立避免牵连;7)选项的文字表达,力求简短精炼;8)尽量避免“以上皆是”“以上皆非”的选项3.填空题的编制原则:1)题意要明确、限定要严密,使空白处应填的答案是唯一的;2)空白处所填写的应是关键词语,并且要和上下文有密切的关系,使被试不至于填写困难;3)题目中空白地方不能太多,以免句子变得支离破碎,不利于被试理解题意;4)尽量将空白放在句子的后面或中间,而不要放在句子开头;5)所有空白处的线段长度应当一致,不能随正确答案文字的多少而长短不一,以免产生暗示作用;6)若答案是数字,应指明单位和数字的精确程度。
教育测量与评价期末复习题.doc
教育测量与评价期末复习题.doc第一章教育测量与评价的学科发展一、测屋与评价基木问题1、教育测量①测量三要素:量具、测量的单位、测量:的参照点②教育测量概念:针对学校教育影响下学生各方面的发展,从量的规定性上予以确定和描述的过程。
③教育测量的特点:间接性和推断性:对人的知识技能、智力水平、思维品质、创造能力、心理索质、情感态度、思想道德等作出间接性的推断性的测量测量对彖的模糊性和测量误差的不可避免性:凭借学牛Z间成绩的微笑差异,判定或排列学生的能力高低名次,其证据是不充分的。
问题:教育测量与物理测量的区別是什么?物理测量:通过发展粘良的测量工具,按照科学的测量方法和规范的测量程序,我们完全有可能吧物理量的测量谋差控制在人次那个的谋差范围内。
而教育测量则不然。
④量表的概念,按测量精确程度分为哪四种。
心理学家史蒂文斯根据测量的精确度,吧量农从低级到髙级分成称名量表、顺序量表、筹距量表、比率量表四中水平。
教育测量:一方而不像物理特性那样明确,领一方而他们有一立受人心理活动的影响,同时他们的测量只能是对外线行为和反应的取样分析加以推断,这就使教冇测量的对象具有模糊性和不确定性。
量表具有多样性,结果具有相对抽彖性:在教育测量中,按照标准化程序命制的试卷就是教冇测量的一种量表。
由于教冇测量对象的复杂性和多样性,以及制定教冇测量量表的类型和精确度不同,使得教育测量量表具有多样性。
2、教育评价①教育评价概念:按照一定的价值标准和教育li标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。
②著名的测量与评价领域人及名言格兰朗徳(N.E.Gronlund)认为,评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的(课堂)系统过程;评价包括对学生的定量描述(测量)和定性描述(非测最)两方而。
“教冇测量与评价是所有成功教学的基础覽斯塔费尔比姆说,“评价最重要的意图不是为了证明,而是为了改进。
教育测量与评价复习提纲
教育测量与评价复习提纲1.教育评价的类型(按参与主体、作用分类)按主体分类,自我评价、他人评价按作用功能分类,诊断性评价、形成性评价、终结性评价2.教育测量与教育评价的概念教育测量,依据一定的法则(标准)用数值来描述教育领域内事物的属性,是事实判断的过程。
教育评价,在系统地、科学地和全面地搜集、整理、处理和分析教育信息的基础上,对教育的价值作出判断的过程,目的在于促进教育改革,提高教育质量。
3.教育测量与教育评价的区别与联系P7教育测量本质上是一个事实判断过程,而教育评价实质上是一种价值判断过程。
由于教育测量是对实实做判断,在判断的法则确定后4.教育评价的功能P18导向、鉴定、改进、调控、服务5.科举制度P42科举制度是用一套较完整的考试制度和考试方法来挑选人才。
6.西周的选士制度P41西周的选士制度是世界上最早的评价选拔人才的制度,有三个方面组成:乡里选士、诸侯贡士、学校选士。
7.我国教育评价的发展趋势P51评价范围逐步扩大;评价结果与物质奖惩挂钩逐步转向与物质奖惩不挂钩;越来越重视发挥为教育决策服务的功能;教育评价工作制度化将会得到进一步发展;注重定性和定量的结合;在教育评价工作中将越来越广泛使用电子计算机。
8.教育评价中有待进一步研究的主要问题P541.教育评价的基本原理许多基本原理的研究停留在表层不够深入。
2.9.八年研究P37为了促进和保证课程改革的进行,美国进步主义教育协会进行了一项课程内同改革的实验研究,从1932年到1940年历经八年完成,史称“八年研究”。
10.被评价者在接受评价时,常常会出现的心理现象P8811.评价者在实施评价时,常常会出现的心理现象P7912.整理评价信息P6913.教育目标的结构P9614.布鲁姆等人对教育目标的分类P10115.克龙巴赫提出的指标体系设计P10516.指标权重P11117.问卷法P13418.测验法的优缺点P13919.访谈法的主要缺点P145 20.信度P12421.效度P12722.等距抽样、分层抽样23.定量数据有类别24.中位数平均数。
如何备考教育测量与评价备考重点
如何备考教育测量与评价备考重点教育测量与评价是教育学专业的重要课程之一,它涉及到教育评价的理论、方法、实践等方面的知识。
备考教育测量与评价需要掌握一定的理论知识和实践技能,下面将介绍备考教育测量与评价的重点内容。
一、了解教育测量与评价的概念及其作用教育测量与评价是指用科学的方法和技术对学生、教师、课程、教学媒体和教育环境等进行测量和评价,以便了解教育工作的现状和成效,进而作出改进和决策。
备考教育测量与评价前,首先要对其概念及作用进行明确理解,以确保在备考过程中不会出现概念混淆或误解。
二、掌握教育测量的基本原理和方法教育测量的基本原理包括测量要素的明确、测量工具的选择与设计、测量结果的分析和解释等。
备考教育测量与评价时,要对这些基本原理进行充分的理解和掌握。
此外,还需学习和掌握教育测量的常用方法,如问卷调查、观察法、成绩分析等,以便在实际工作中能够正确地选择和应用相应的方法。
三、了解教育评价的多维度特点教育评价是对教育工作的反馈和综合判断过程,其特点包括多维度、多层次、多元化等。
备考教育测量与评价时,应了解和掌握教育评价的多维度特点,以便能够应对复杂和多样化的评价需求。
四、熟悉教育测量与评价的常见工具和指标备考教育测量与评价时,需要熟悉教育测量与评价的常见工具和指标。
常见的工具包括问卷、观察表、成绩记录表等,常见的指标包括平均分、标准差、得分率等。
掌握这些工具和指标,可以帮助备考者在实际工作中更加准确地进行教育测量与评价。
五、学习教育测量与评价的实践经验和案例备考教育测量与评价时,可以学习一些相关的实践经验和案例。
这些实践经验和案例可以帮助备考者更好地理解和应用教育测量与评价的知识和方法,同时也能够提供一些实际操作中的参考和借鉴。
六、注重解决实际问题的能力培养备考教育测量与评价不仅要掌握理论知识和技术方法,还需要注重解决实际问题的能力培养。
备考者可以通过实践、讨论、案例分析等方式,培养自己解决实际问题的能力,提高教育测量与评价的实践水平。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 衡量教育测量的质量,可采用四个指标: • 信度 主要对整个测量而言。 • 效度 • 难度 主要对测量的项目而言。 • 区分度
第一节 信度
• 一、信度概念 • 信度是指测量结果的稳定性或可靠性程度。用 同一种工具反复测同一种特质对象,结果的一致 性程度就叫信度 • 一般地说,一个好的测量必须具有较高的信度, 也就是说,一个好的测量工具,只要遵守操作规 则,其结果就不应随工具的使用者或使用时间等 方面的变化而发生较大的变化。 • 或者说,测验的抗干扰能力强,误差因素控制 得好,测值的一致性高,就叫信度高,人们感觉 可靠。
四、提高信度的方法
• 1、影响测量信度的主要因素自行阅读 P34-35,请同学们讨论、解释。 • (1)测量工具方面(对照教材重点解释) • (2)主试、施测情境方面(对照教材举 例) • (3)被试方面(同上) • (4)两次施测的间隔时间方面
2、提高测量信度的常用方法
• 阅读p36-37,请学生解释: • (1)适当增加测验的长度 • (2)测验的难度要适中 • (3)测验的内容应尽量同质(不同质是 如何影响信度的?) • (4)测验的程序应统一 • (5)测验的时间要充分 • (6)测验的评分要尽量做到客观化,减 少评分误差
2、内容效度的估计
• 逻辑分析法 • 其工作思路是请有关专家对测验题目与应测内 容范围的吻合程度作出判断。
• 把所有题目按考试内容和考查目标分布进行双 向分类,形成实际的“题目双向分类表”。与事 先预定的“命题双向分类表”作比较,看是否偏 离了原命题计划。
• 内容效度主要应用于成就测验、学科测 验。 • 内容效度不适合用于能力倾向和人格测 验。
(2)建立结构效度的步骤
• A、提出理论假设; • B、根据假定结构,导出各项关于心理功 能或行为的基本假设。拟定测题,编制测 验; • C、以测验结果为根据来验证假设结构中 的各种因素是否成立。 • 例如智力P42
• 测量甲与其他理论上认为应该与之有关 的其他测量有显著相关。与其他理论上认 为不应该与之有关的其他测量没有显著相 关。
• 积差相关的使用条件: • 两个变量的总体都呈正态分布,至少是 单峰对称的分布。作此判断需要总体分布 的卡方检验。 • 必须是成对数据,每对数据之间相互独 立 • 两个变量之间呈线性关系,可由散布图 的形状来决定。
例一
• 用一个算术四则的速度测验12个小学生, 得分记为X,为了考察测量结果的可靠性, 于3个月后再测一次,得分记为Y,问测验 结果是否可靠? • 学生序号 1 2 3 4 5 6 7 8 9 10 11 12 • X 20 20 21 22 23 23 232425262627 • Y 20 21 21 20 23 23 252526262729
(二)结构效度
• 结构:心理学或社会学上的一种理论构 想或特质。本身观察不到,也无法直接测 量,但学术理论假设它是存在的。 • 举例:
• 结构效度:测量能测出这种结构的程度
(1)结构效度的特点
• 结构效度的大小完全取决于事先假定的心理特 质理论,一旦人们对同一种心理特质有着不同的 定义或假设,则会使得关于特质测验的结构效度 的研究结果无法比较。比如智力
• 请比较两个公式所算出来的值
• 当测验中所有的试题难度都一样,或平 均难度接近0.50时,两个公式所估计出来 的信度值将相等。但是,当测验中所有试 题难度值极不相同时,差距将较大。一般 KR21比KR20信度值小。
• 4、论文式测验信度
• 论文没有严格评分标准,同样题目,不同应试 者回答与得分不一样,可用克龙巴赫阿尔法系数 公式。P34 • 该公式适用于:测验题型多并非都是2分计分 题时。
复本信度的优缺点表现:
• 优点: • 1、两个复本在同时使用时,可以避免再测信 息的一些缺点如首测对再测在记忆、练习、效果 的影响,间隔期间获得新知识的影响,两次施测 的环境不同和被试主观状态不同的影响,以及为 了应付测验所作训练的影响等。反映究竟是不是 真正的平行测验;换言之,反映了测验内容造成 的误差。
• 可以从以下三个方面去理解测量的信度P29:
• 信度指实测值(X)和真值(T)相差的程度
• 信度是指统计量与参数之间的接近程度
• 信度指两次重复测量或等值测量之间的关联程 度。
三、信度的估计方法(信度类型)
• 1、重复信度(再测信度) • 指的是同一个量表对同一组被试施测两 次所得结果的一致性程度。 • 其大小等于同一组被试在两次测验上所 得分数的相关系数,一般采用积差相关的 公式来计算。(板书、推导该公式)
• 与内容效度不同,结构效度主要用于智 力测验、人格测验等一些心理测验方面。
(三)效标关联效度
• 是以测验分数和效标之间的相关系数来表示测 验效度高低的方法。 • 什么是效标? • 例如:某年全国高考物理学科的测验效度,可 用大学一年级物理学科的测验分数为效标,然后 求同一组学生高考物理得分与大一物理得分之间 的相关,此相关系数就是该年高考物理测验的效 标关联效度系数。
• 分半后,计算每个被试在两个分半测验分数 的积差相关系数,由于只是半个测验之间的信度, 故,再用斯皮尔曼—布朗公式加以校正。
• 3.2 同质信度之库德尔-理查森信度 • 适合于全部二分计分题测验的内部一致性信度 分析。 • 常用的两个公式有:(板书,P33)
例三
• 对初中一年级学生进行地理成绩测验,每答对1题得1分,答错1题 得0分,其测验结果如下表,试估计该测验的库德-理查森信度? • 学生序号 题 序 • 1 2 3 4 5 6 总分 • 1 1 0 0 0 0 0 1 • 2 1 0 0 1 0 0 2 • 3 0 0 0 0 1 1 2 • 4 1 1 1 0 0 0 3 • 5 0 1 0 0 1 1 3 • 6 1 1 1 0 0 0 3 • 7 1 1 1 1 0 0 4 • 8 1 1 1 1 0 0 4 • 9 1 1 0 1 1 1 5 • 10 1 1 1 1 1 1 6 • p • q • pq
• 2、对10名应试者先进行某种测验X,隔 适当时间后(半年),再进行内容、范围、 难度类似的第二次测验Y,试求测验的复 本信度? • 应试者 1 2 3 4 5 6 7 8 9 10 • X 9 10 10 6 10 8 4 8 9 4 • Y 4 9 7 9 4 3 5 3 2 4
• 3、有一个由100题构成的量表施行于10 个高三学生(分数见下表)。测验一次后, 学生即毕业离校,现怎样评价测验结果的 信度? • 学生序号 1 2 3 4 5 6 7 8 9 10 • 奇X 38 37 38 41 40 36 38 39 40 35 • 偶Y 37 37 36 39 39 34 38 39 39 36
在使用重测法计算稳定性系数时,应 注意以下问题:
• 1、信度的取值范围为[0,1],当信度值 较大时,说明前后两次测量结果比较一致; • 2、两次测验之间的时间间隔要适宜。太 长,身心发展、遗忘、环境改变等使信度 降低;太短,练习与记忆等提高了成绩, 信度降低。
• 3、重测法适用于速度测验而不适用于难 度测验;因被试很难记忆第一次,而难度 测验相反。还适用于运动技能的测验。 • 4、适用于异质测验,即一个测验包含几 个不同的部分,分别测量不同的心理特质。 因为这种测试不适于计算内部一致性信度。 • 4、应注意提高被试者的积极性。
缺点:
• 1、编制两个完全相等的测验是很困难的,如 果两个复本过份相似,则变成再测形式,而过分 不相似,又使等值的条件不存在; • 2、两个复本测验有可能在某种程度上测量了 不同的性质,这就会低估测验的信度;(因内容 造成的误差)。 • 3、被试同时接受性质相似的两个测验,可能 减少完成测验的积极性; • 4、虽然两个复本测验的题目材料不同,但被 试一旦掌握了解题的某一模式,就能触类旁通, 有可能失去复本的意义。
2、复本信度
• 指的是两个平等的测验测量同一批被试 所得结果的一致性程度。 • 其大小等于同一批被试在两个复本测验 上所得分数的相关系数。 • 所谓复本测验是指在格式、内容、题型、 题数、难度、指导语说明、施测要求等方 面都一致(或相等)的两份或多份测验。
例二
• 以A、B两型英语复本测验对初中三年级10个 学生施测,为避免由测验施测顺序所造成的误差, 其中5个学生先做A型测验,休息15分钟后,再做 B型测验;而另5个学生先做B型测验,休息15分 钟后,再做A型测验。10个学生A型测验结果记 为X,B型测验结果记为Y,其测验的复本信度如 何? • 学生序号 1 2 3 4 5 6 7 8 9 10 • X 19 19 18 17 16 15 15 14 13 12 • Y 20 17 18 18 17 15 13 15 12 12
• • • •? 学科测验0.9以上; 智力测验0.8以上; 品德测验,达到0.6就不错了。
作业
• 1、用某量表测验10名学生,得分记为X, 为了考察结果的可靠性,于15天后用原量 表对这10个学生重测一次,得分记为Y, 问测验结果是否可靠? • 学生序号 1 2 3 4 5 6 7 8 9 10 • X 8 10 9 6 10 7 5 7 9 4 • Y 9 10 10 6 10 8 4 8 9 4
• 2、测验的两个复本,如果在不同的时间使用, 其信度既可以反映被试在不同时间的稳定性,又 可以反映测验内容的一致性。换言之,既反映了 时间影响,又反映了测验内容的抽样误差。 • 这种同时兼顾试题抽样与时间影响的信度, 称为等值稳定性系数,与其他信度系数相比,该 系数最小,也就是说,此种复本信度是对信度最 严格的检验。 • 3、在追踪研究或探讨某些影响测验成绩的因 素时,大多使用复本测验,分析复本信度。
第二节 效度
• 一 、什么是效度 • 效度是指测量结果的准确性和有效性的程度。 也可以说是测量是否达到了预期的目的。 • 1、效度是一个相对的概念。 • 测量的效度是相对一定的测量目的而言的 • 2、一种测量的效度只是高或低的问题 • 测量结果总是有一定效度的,只是效度高低不 同罢了。 • 3、教育领域的效度问题比其他领域的测量更 重要。