现代教育测量与评价学 名词解释 知识点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
06231《现代教育测量与评价学》-- 名词解释知识点
第一章教育测量与评价的学科发展
测量:根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。
P2 2013年4月
教育测量:教育测量就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。
P3 2005年4月
量表(量尺):是确定了测量单位和参照点并具有取值系统的测量工具。
P4 2016年4月
称名量表:是最低水平的一种量表,用来对事物或人的心理现象进行分类。
顺序量表:也是用来对事物或人的心理现象进行分类,但这种分类是以所测属性的数量大小为基础进行的。
等距量表:不但能在一个连续体上表示事物量的大小,而且具有相同的测量单位。
等距量表的零点是相对的,即人为确定的相对零点。
比率量表:除了具有量的大小和相等单位外,还具有绝对零点。
比率量表是最高水平的量表。
评价:广义地讲,评价泛指衡量、判断人物或事物的价值。
P5
教育评价:(广义的)是指按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。
P7 2010年4月
考试:(广义的)泛指人类社会一切测度和甄别人的身心各个方面之群体或个体差异的活动。
P9
考试:(狭义的)指由主试根据一定社会的要求,在一定场所,采取一定的方式方法,选择适当的内容,对应试者的德、学、才、体诸多方面或某方面所进行的有组织、有目的的测度或甄别的活动。
教育考试:在学校教育与人才选拔的过程中,教育考试是根据教育内容和目标,选择有代表性的内容和问题,按照一定的方式,对应试者的知识、技能等进行测量与评价的过程。
第二章教育测量与评价的类型和功能
形成性测量与评价:是在教学过程中经常实施的,在性质上大致相当于现在的中小学单元测验。
P34 2012年4月诊断性测量与评价:是对经常表现出学习困难的学生所做的测量与评价,它的目的是对个人的问题行为及其原因进行诊断。
2011年4月
终结性测量与评价:是用于教学结束后,在性质上相当于现在学校中所举行的期末考试。
P35 2009年4月
常模参照测量与评价:是将被试水平与测验常模相比较,以评价被试在团体中的相对地位的一种测量与评价类型。
标准参照测量与评价:是将被试的表现与既定的教育目标或行为标准相比较,以评价被试在多大程度上达到该标准。
2014年4月
潜力参照测量与评价:是将被试实际水平与其自身潜在水平(潜力)相比较,以评价被试有无充分发挥自身潜力为目的。
最佳行为测量与评价:是以测量被试的最佳行为表现为目的的。
凡是以成就或能力的高低作为评价基础的,都属于最佳行为测量与评价。
学校教学后的考试和升学考试都属干最佳行为测量与评价。
P36 2009年4月
典型行为测量与评价:典型行为测量与评价的目的不在测量与评价被试能力的高低,而是测量与评价其是否具备某种(或某些)典型行为。
如态度、人格、兴趣测量等,都属于典型行为测量。
2015年4月
智力测量与评价:目的在于测量被试的智力并对被试的智力发展水平和特点做出评价。
能力倾向测量与评价:目的在于测量并评价个人的潜在才能,预测个人的能力发展倾向。
成就测量与评价:目的在于测量并评价个人在接受教育或者训练后的成就。
常见的有两种类型,一是学科成就测验,二是综合成就测验。
2010年4月
人格测量与评价:也称为个性测量与评价,目的在于测量与评价被试的人格心理特征。
个别测量与评价:是指同一主试在同一时间内只能测量一个被试。
团体测量与评价:是指同一时间内由一位主试测量许多位被试。
这种形式的测量与评价突出的优点是节省时间,可以在短期内收集到大量的测量数据。
2015年4月
文字测验:文字测验的内容是以文字的形式表现的,被试也用文字作答,也常称为“纸笔测验”,是最为普通的一种测量与评价方式。
非文字测验:内容是通过图形、仪器、工具、实物、模型等形式表现的,被试通过指认、手工操作向主试提供答案,所以也称为操作测验。
标准化测验:是指由测量专家严格按照测验编制程序而编成的一种测验。
2013年4月
非标准化测验:这类测验的编制相对自由,没有严格按照测验编制程序进行。
第三章教育测量与评价的质量特性
信度:测量结果的可信程度,或测量结果的稳定性程度。
P46 2007年4月
重测信度:指的是用同一个量表(测验或评价表)对同一组被试施测两次所的结果的一致性程度,其大小等同于同一组被试在两次测验上所得分数的相关系数。
复本测验:也称作平行测验,是指在试题格式、题数、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同的测验。
P49
复本信度:指的是两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。
同质性信度:也叫内部一致性信度,是指测验内部所有题目间的一致性程度。
P50
分半信度:指的是将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。
评分者信度:指的是多个评分者给同一批人的答卷进行评分的一致性程度。
P55
效度:一个测验或量表实际能测出其所要测量的特性的程度。
P56 2006年4月
内容效度:就是测验题目样本对于应测内容与行为领域的代表性程度。
P59
结构效度:结构是指心理学或社会学上的一种理论构想或特质。
P60
校标关联效度:校标关联效度的验证方法是指一个测验对于处于特定情境中的个体行为进行预测时的有效性。
它是以实践的效果来作为检验测验是否有效的标准,所有也被称为实证效度。
同时效度:测验分数与校标资料的取得约在同一时间内连续完成,计算这两种资料的相关系数即代表测验的同时效度。
预测效度:在测验分数取得一段时间后才获得效标资料,计算这两种资料间的相关系数即代表测验的预测效度。
难度:就是被试完成题目或项目任务时所遇到的困难程度。
P64 2018年4月
题目区分度:就是题目区分被试水平能力的量度,常记为D。
第四章编制教育测验的一般原理与方法
表现性测验:是指以行动、作品、表演、展示、口头回答、操作、写作、科学研究、制作等更真实的行为表现,来测量与评价学生在真实情境或模拟真实情境下的所知与所能的一种测验类型。
P94
目标:是从人的需要出发所规定的行为目的,是人们争取达到的某种意想结果的标准、规格或状态。
P96
教育目标:是人类社会根据自身的需要确定的教育活动的标准、方向和要求,亦就是人们在教育活动之前,预先设想和确定的关于教育活动最终期望达成的结果。
测验蓝图:测验蓝图可以看作是一份工程蓝图,它是编制测验试题的指导和依据。
只要测验编制者严格按照测验计划编制试题,就能保证测验内容的代表性,实现测验目标。
P105 2011年4月
第五章制定教育评价表的一般方法和步骤
量表:是对客体进行评价的尺度,是测量与评价活动据以进行进行的标准物,离开了一定的量表和尺度,测量以至评价活动就无法进行。
P112
教育评价表:是根据教育教学的特性编制而成的,它由评价指标、评价项目(条目)、评价标准、评定等级、指标权重等构成,是进行教育测量与评价的工具。
概括性问题教育评价表:是根据评价目标概括提出一系列问题加以系统了解的评价表式。
P113
指标结构性教育评价表:是根据评价目标逐层分解评价指标,形成具有评价指标体系、指标权重结构以及定性定量具体评价标准的教育评价表。
评价指标:就是根据评价的目标,由评价指标的设计者分解出来的,能够反映评价对象某方面本质特征的具体化、行为化的主要因素,它是对评价对象进行价值判断的依据。
P115
指标权重:就是表示每项评价指标在指标体系中所占的重要程度,并赋予相应的值,这个数值就叫作对应指标的权数,或叫权重。
P117 2008年4月
加权:确定权数的过程叫加权。
评价标准:是针对每个评价指标的分类作出具体规定,提出具体要求和说明。
它是衡量评价对象达到评价指标要求的尺度,对什么是好、什么是较好、什么是一般、什么是差等作出明确具体的描述和规定。
2017年4月、2012年4月
第六章教育测验的常模及其建立方法
常模参照测验:是将被试水平与测验常模相比较,以评价被试在团体中的相对低位的一种测量类型。
2018年4月对测验的分数进行解释与评价的测验,称为常模参照测验。
P125
参照测验的“标准”,对测验的分数进行解释与评价的测验,称为标准参照测验。
常模:是指一个有代表性的样组在某种测验上的表现情况。
或者说是一个与被试同类的团体在相同测验上得分的分布状况与结构模式。
2015年4月
发展常模:是某类个体正常发展过程中各个特定阶段的一般水平。
发展常模有年龄常模和年级常模之别。
P127 2012年4月
组内常模:组内常模是关于一个与被试同类的群体,在某种测验所测特性上的一般表现水平的常模资料,可以反映每一个体在其同类群体中的相对位置。
组内常模又有百分等级常模和标准分数常模两种。
2014年4月
年龄常模:人的某些能力特性,在某个年龄阶段可能随着年龄的增长而逐渐地发展提高,也可能随着年龄的增加而不断衰老。
如果不同年龄组其变化的差异具有统计学上的显著差异,我们就可以为不同年龄组建立起一个有意义的常模。
2011年4月
年级常模:是不同年级学生在某种测验上的正常的一般的表现水平。
P128 2016年4月
百分等级:是一个地位数量,能够反映某个测验分数在一个次数分布中的相对地位。
P131
百分等级常模:就是基于某个常模集团,为某种测验的原始分数与百分等级之间建立起对应关系的组内常模类型。
标准分数:是以标准差为单位表示测验成绩与评价分数之间的距离。
标准分数常模:就是以常模团体在某一测验上的实测数据为基础,把原始分数转化成基本标准分数Z或转换到更大的标准分数T量表上,能够揭示每个测验分数在常模团体测验分数中的相对地位的一种组内常模。
P137
高考标准分数制度:是根据教育统计、教育测量、教育评价等科学原理,按照一定规则把原始分数转化为具有相同意义、相同单位和共同参照点并能刻画考试分数在总体中位置的分数制度。
由常模量表分数和等值量表分数组成。
P143
高考综合分:反映考生高考总成绩的指标是综合分,它是综合了各个学科标准分之后形成的高考总体成绩,是录取的主要指标。
第七章教育测验的标准及其建立方法
教育测验的标准:指的是教育测验的成就标准,它对于编制标准参照测验以及解释标准参照测验的分数具有重要的意义。
P148
领域参照测验:是建立在一套完善的题目汇编或内容领域规范汇编基础上用以检查被试的素质及发展水平的测验。
P150
目标参照测验:是由和目标相适应的一组题目所构成的测验。
掌握测验:建立一组教学和行为目标上的测验,主要用于判断学生是否掌握某组给定的教育目标。
2007年4月、2005年4月
正确百分数:是以学生在标准参照测验中答对题目的比例来解释测验分数或描述学生取得成就的方法。
P152
标准参照测验题目的双基度:指的是题目的考察内容和测量目标对体现特定学科“基础知识、基本技能”双基教学要求的适切性程度。
P161
第八章学生课业发展的测量与评价
课业考评:是指对学生的课程学业所取得的发展进步进行考核评价。
在课业考评过程中,考试是最基本也是最常用的一种测量和评价手段。
P168 2013年4月、2017年4月
课程目标参照:是各个内容领域所涵盖的行为目标或素质目标的有机结合,相互促动,功能放大以及从量变到质变的结果。
P183 2006年4月
教育常模:就是有代表性的学生团体在通常的教育环境下实际所达到的成绩水平,如平均分数等。
P185
评定量表:在教育与心理测量方法中,评定量表是用来量化观察所得印象的一种测量工具。
是表现性评价的常用方法之一。
P193
数字等级评定量表:是用圈画数字的形式来确定所列行为特性的等级的,并对数字等级作简答的文字说明。
P194 图示等级评定量表:是在每个行为特性项目的下边或右边给出水平图尺的等级刻度。
档案袋评价:是教师依据教学目标和计划,请学生持续一段时间主动收集、组织与省思学生成果的档案,以评定其努力、进步、成长情形的一种评价方法。
P196 2018年4月
成果型档案袋:主义展现学生的优秀作品与学习成果。
过程型档案袋:重点是呈现与展示学生学习进步、探索、努力、进取、反思、达成目标与成就的历程。
综合型档案袋:指的是兼具成果型和过程型,或者是兼具多个主题的学习档案袋。
结构型档案袋:是指学生在制作档案袋之前,教师或教研人员就已对档案袋的生产给予结构性较强的设计。
非结构型档案袋:是指教师仅告知学习档案袋的主体,而未给学生确定重点的档案项目以及未给学生提供学习评价单,使学生在制作档案袋之前,未形成明显的结构设计。
半结构型档案袋:是介于结构型档案袋和非结构型档案袋之间的类型。
动态评价法:动态评价法有两层含义:其一,是跨越多个时间点观察评估学生的进步与改变情形,了解学生动态认知历程与认知能力变化的特点和潜能;其二,是评价者与被评价者之间产生大量的互动,强调评价与教学结合,实施个体化的诊断评价与教学补救。
P199 2008年4月
绝对评价等级制:按照既定的课业标准把学生的学习成绩与表现划定为若干等级。
P202
教师综合评价法:由教师对每位学生的学习情况,包括平时的作业、课堂提问与讨论、形成性测验结果、学生的作品等多方面学习表现与成果作全面考察,进行综合评价,并给出等级分数。
测量结果转换法:在举行正式测验或考试之后,把测量得到的分数按照事先规定的分数段转换成等级分数。
核心内容参照法:在编制的课程标准和考试指导文件中对该课程的学习和考核标准进行明确的界定,规定每一成绩等级的核心内容,并按照这种标准对学生的学习成绩作出等级评定。
相对评价等级制:是根据学生的卷面成绩在同类考试团体中所处的相对位置来确定成绩等级分数的评分体制。
P204
第九章学生智能发展的测量与评价
观察:是一种有目的、有计划、持久的知觉活动,是知觉的高级形态,是认知过程的基本环节,是从事任何一种专业活动都必须具备的能力。
P210
思维:是一个心理过程,通常包括分析、综合、比较、抽象和概括。
P216
想象:是在原有的感性材料的基础上,经过重组联合等加工改造而创造出新形象的活动。
创新意识:是驱使个体创新行为或创新活动的心理觉醒和动机。
P236
创新精神:是创新活动的非智力个性因素,即属于个性心理品质范畴。
广义的创新能力:是指实现完整的创新过程所需的创新精神、创新素质和能力。
狭义的创新能力:是指从事创新行为或创新活动的心智能力。
能力倾向:是指一个人获得新的知识、能力和技能的内在潜力。
P240
能力倾向测验:是一种旨在预测未来成功可能性的一种测验,是一种关于个人潜能的探测性测验。
学习能力倾向测验:旨在测量一般的学习能力和潜能,即是否具备较好的学习与研究的潜在能力,而不是已在学校中学到了多少知识。
2014年4月
职业能力倾向测验:是通过测量人的某种职业活动潜能,从而预测人在一定职业领域取得成功可能性的心理测验。
第十章学生人格心理发展的测量与评价
人格心理测量:就是采用专业的人格测验或人格心理量表对被试的性格、气质、态度、兴趣和内在行为倾向等心理品质进行测量与评价。
P253
人格测量:是以测量人格为目的,测验涉及人的心理状态、情感或行为的非智力方面人格因索,通常包括对性格、情绪状态、人际关系、动机、兴趣和态度的测量。
P257 2017年4月
第十二章学生体育展的测量与评价
体能:体能又称身体索质,是指人体在运动、劳动和生活中所表现出来的力量、速度、耐力灵敏及柔韧等累质能力。
P291 2009年4月。