中学生学业质量监测评价办法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
温州市教育教学研究院吴建军
目前,中学生学业质量评价主要采用平均分、优秀率、及格率三个指标。
实践证明,这种指标系统简明扼要,通俗易懂,较好地体现了“抓两头,带中间,促全局”的管理思路,但一定程度上也引发了“数位迷信”和“唯量化”。
为了让学业质量的量化,既简捷直观,又能发挥“精细管理”和“竞争机制”的作用,让“质”与“量”成为学业质量管理的两翼,本文提出中学生学业质量OAR评价模型,以均差值O,优秀值A和后进值R三个评价参数,分别取代平均分、优秀率和及格率三个评价指标,用以反映样本学业质量的整体水平、优秀水平和后进水平,以期优化并加强学业质量评价在面向全体学生、培养优秀学生和教育后进学生三个方面的激励改进、诊断反馈功能。
一、评价参数——均差值O,优秀值A,后进值R的操作定义及其作用
1.均差值O()作为反映样本整体水平的评价参数,是指样本平均分与标准差S的差值,其作用与平均分类似,都可用以刻画样本的整体水平。
平均分作为某样本参评学生成绩总和与样本参评人数的比值,在一定程度能够反映样本的集中趋势,但在人数较少或出现极端数据的情况下,其代表性就会受到不同程度的影响。
譬如甲乙两班平均分都是75分,甲班学生成绩集中在75分上下,而乙班学生成绩分布呈现严重两极分化。
显然,在这种情况下,平均分难以真实反映甲乙两班学生学业质量的整体水平,无法体现甲乙两班学生学业成绩的差异程度。
样本均差值O的大小不仅取决于样本平均分的高低,也与样本标准差S(反映学生学业成绩离散程度的统计量)的大小有关。
要想取得较高均差值,我们不仅需要努力提高样本中每位学生的学业成绩,以提高平均分;而且还必须致力改进后进生的学习,从而降低标准差S。
因此,以均差值O取代平均分作为样本整体水平的评价参数,由平均分和标准差S共同制约均差值O,有望增强课堂教学的针对性和有效性,更好地体现并落实面向全体学生的素质教育要求。
近年来,世界经合组织PISA项目的评价报告也显示,学生平均成绩比较高的国家也是成绩分化小的国家和地区(譬如芬兰、中国香港),过早对学生分流会导致两极分化,而不是带来平均水平的提高。
这促使德国重新审视自己的分流教育体制,也促使各国致力于在研究如何提高学生学业质量平均水平的同时,注重提高后进生成绩,努力降低标准差,以减少分化程度,提高集体教学的效能。
2.优秀值A()作为反映样本优秀水平的评价参数,是样本优秀率U与优秀离差均值Ea的乘积,这与优秀率反映样本优秀比例的价值取向相似,都是为了奖掖和鼓励先进。
样本优秀率U作为该样本优秀学生人数与样本人数的比率,只能反映样本的优秀比例,并不能体现样本的优秀程度。
譬如甲乙两班人数相等,各有15人达到优秀水平,但甲班15名学生成绩只是略高于优秀分数线,而乙班15名学生则远远超过了优秀分数线。
可见,优秀率难以全面反映甲乙两班学生学业质量的优秀水平。
样本的优秀值A既与反映样本优秀比例的U成正比,又与体现样本优秀程度的Ea(指该样本所有优秀生成绩与优秀分数线B的离差和除以样本参评学生人数N所得的商数()成正比。
对于某一个特定的年级(即总体)来说,这个年级所属各个班级(即样本)的参评人数N是相对稳定的常数。
由公式可得,各班级的优秀值A既与该班级优秀生人数Na成正比,也与该班级所有优秀生成绩与优秀分数线B的离差和成正比。
要想取得较高的优秀值A,我们不仅要努力增加优秀生的数量Na,还要设法提高优秀生成绩与优秀分数线B的差距之和。
因此,以优秀值A取代优秀率U作为样本优秀水平的评价参数,既需要在“量”上致力提高样本的优秀比例,又必须在“质”上注重提高样本的优秀程度,这有利于在培养学科优秀生方面发挥更加科学合理的导向作用。
3.后进值R()作为反映样本后进水平的评价参数,是样本后进率H与后进离差均值Er的乘积,这与及格率反映达标水平的基本着眼点相类似,都是为了鞭策和扶助后进。
样本的后进率H作为该样本后进学生人数与样本人数的比率,只能反映后进学生的后进比例,并不能体现样本的后进程度。
譬如甲乙两班人数相等,各有25人为后进水平,但甲班25名学生是略低于后进分数线,而乙班25名学生则远远低于后进分数线。
可见,后进率也难以全面反映甲乙两班学生学业质量的后进水平。
后进值R的绝对值既与反映样本后进比例的H成正比,又与体现样本后进程度的Er(指该样本所有后进生成绩与后进分数线C的离差和除以样本参评学生人数所得的商数)的绝对值成正比。
对于某一个特定的年级(即总体)来说,这个年级所属各个班级(即样本)的参评人数N是相对稳定的常数。
由公式可得,各班级的后进值R的绝对值既与该班级后进生人数Nr成正比,也与该班级所有后进生成绩与后进分数线C的离差和的绝对值成正比。
鉴于后进值R是负数,其绝对值越小,后进值R就越大,样本的后进水平就越高——即该样本的后进生质量水平就相对越高。
要想使后进值R变大,我们不仅要降低后进生的数量比例H,还要设法缩小后进生成绩与后进分数线C的差距,使后进生成绩与后进分数线C的离差和的绝对值变小。
因此,后进值R作为样本后进水平的评价参数,既需要在“量”上努力降低样本的后进比例,又必须在“质”上致力缩小样本的后进程度,这有助于增强学科教学在促进后进生转化方面的自觉性、针对性和有效性,在学业质量监测评价中体现并落实“不让一个孩子掉队”的教育理念。
二、评价参数的标准Z分数与标准T分数
均差值O,优秀值A和后进值R,作为基于测试原始分数统计所得的评价参数,其三者之间并不具有可加性和可比性,不同学科、不同测试之间的均差值O,优秀值A和后进值R均不具有可加性和可比性。
譬如某班第一次测试均差值为70,第二次为75,如果两次测试难易程度和评分标准要求不同,两次测试所得的均差值O就没有可加性和可比性。
1.标准Z分数是以1个标准差为单位表示一个成绩分数在群体中所处相对位置的量数。
当数据在总体上接近于正态分布时,标准Z分数的主要作用有二:一是能够比较分属性质不同的数值
在各自数据分布中相对位置的高低。
二是能够合成不同质的数据。
所以,均差值O,优秀值A,后进值R只有转化成标准Z分数Zo,Za,Zr才具有可加性和可比性。
评价参数O,A,R分别转化成Zo,Za,Zr分数后,它们的平均分均为0,标准差均为1。
这样,每个样本的评价参数在总体中的相对位置就十分清楚了。
以优秀值A为例,某班级的标准Za
分数是1,说明该班级的优秀值Za比所在年级优秀值的平均数高出1个标准差;某班级的标准Za分数是0,说明该班级的优秀值Za刚好处于所在年级优秀值的平均水平;某班级的标准Za 分数为-,说明该班级的优秀值Za比所在年级优秀值的平均数低•个标准差。
2.标准T分数是为了避免出现负数和使用方便而对标准Z分数作一次线性变换所得的标准分数。
这是国际上应用比较广泛的标准分数。
如美国大学入学考试(CEEB)T分数的平均数定为500,标准差定为100(T=500+100Z);托福(TOEFL)考试则把T分数的平均数定为500,标准差定为70(T=500+70Z)。
为了使标准T分数符合中国人对百分制的理解习惯,本办法设定均差值O,优秀值A,后进值R三个评价参数标准T分数的平均数为70,标准差为15。
其计算公式是:T=70+15Z(Z>2时取2)。
譬如,某班级均差值的标准To分数大于70,说明该班级均差值高于所在年级的平均水平;某班级优秀值的标准Ta分数等于70,说明该班级优秀值刚好达到所在年级的平均水平;某班级后进值的标准Tr分数小于70,说明该班级后进值低于所在年级的平均水平。
三、界定样本参评学生人数N的意义
为了预防因学业质量监测评价而出现排斥后进生、抢招优秀生和学籍管理失范等问题,尽量淡化区域、学校、班级之间因办学条件、教学环境、师资配备等差异引发无序竞争,避免极端数据对学业质量监测评价的干扰影响,我们需要对样本的参评学生人数N进行界定。
各样本的参评学生人数N在同一总体中建议统一按以下公式界定:
某样本参评学生人数
式中:为上次测试各学科优秀生人数的平均数;为上次测试各学科后进生人数的平均数。
对于某班级来看,不参评的优秀生人数(按上次测试成绩由高分到低分确定)和不参评的后进生人数(按上次测试成绩由低分到高分确定)分别占前测各科优秀生和后进生平均人数的10%和10%;但就所在年级而言,不参评的优秀生人数和不参评的后进生人数均只占该班级注册在校生总数的2%。
四、标准To,Ta,Tr分数的权重与评价系数K
1.标准To,Ta,Tr分数的权重是采用特尔斐法分配的。
近年基于中学校长、教务主任问卷咨询所达成的意见是:中学一年级学科教学应侧重于提高后进生学业质量水平;中学二年级学科教学应侧重于提高全体学生学业质量水平,着力避免两极分化;中学三年级学科教学可适当侧重于提高优秀生学业质量水平。
中学各年级水平指数W建议采用以下公式计算:
一年级水平指数;
二年级水平指数;
三年级水平指数;
中学各年级标准To,Ta,Tr分数赋予不同的权重,其主要目的在于促使学校管理者和学科教师明确本年级学科教学不同的重点和难点,进一步强化中学生学业质量监测评价体系的目标导向作用。
各校在参照本办法开展校内学科教学质量评价时,可采用相应的问卷调查,确定符合本校实际的各年级权重。
2.评价系数K=法定周课时数/实际周课时数(时取1),在区域和学校层面评价时由教育行政部门审核确定,在校内评价时可由学校自行确定,其目的是规范办学行为,提高教学效益。
如果各样本均按规定安排课时,可统一设定为1。
五、评价指标——水平指数W与效能指数的功能
普及教育后,学业质量评价的功能应从强调结果的终结性评价向注重过程的诊断性评价、形成性评价转变,学业质量评价的定位应从认定筛选(裁判员)向诊断反馈(教练员)、激励改进(运动员)转化。
为此,中学生学业质量OAR评价模型在均差值O,优秀值A和后进值R三项评价参数的基础上,设立水平指数W、效能指数两项评价指标,并在区域、学校两个层面推出了相应的OAR评价模型操作软件(网址:)。
其中,水平指数W指样本均差值、优秀值、后进值三项评价参数T分数的加权和与评价系数K 的乘积,用于横向比较不同样本、不同学科同一时期学业质量的综合水平;效能指数指样本本次测试水平指数与前次测试水平指数的差值,用于纵向比较同一样本、同一学科不同时期学业质量综合水平的增值效能。
如果说低效的教育源自评价系统的缺失,那么异化的教育则因为评价指标的不科学。
如果我们以考试代替评价,以考纲架空课标,把平时测验当成选拔考试,把频繁增减课程当成教育核心改革,我们不仅不可能拥有科学的评价系统,而且难以拥有真正高质量的基础教育。
所以,今年10月我们在省内率先引进“教育部中小学生学业质量分析反馈指导项目”,试图通过建立可与全国各地参照的本市数据常模,逐步建立健全包括与他人比较、与自己比较、与标准比较三个维度的中学生学业质量测评机制,对中小学学生学业质量是否达到课程标准进行问题分析和诊断反馈,并在纵向比较和横向比较的坐标上,有针对性地指导改进教育教学工作,规范质量管理,减轻课业负担,推进有效教学,以适应基础教育内涵发展的需要。
附:中学生学业质量监测评价办法(试用稿)
中学生学业质量监测评价办法
(试用稿)
第一章总则
第一条为加强中学生学业质量监测评价工作,促进学校规范管理,正确评价教师的教和学生的学,调动广大师生教学积极性,特制定本办法。
第二条本办法以区域或学校、班级为样本,遵循统一性、客观性和整体性原则,按学科监测评价中学生学业质量。
第二章评价参数与指标
第三条本办法设立均差值、优秀值和后进值三项评价参数,分别反映样本的整体水平、优秀水平和后进水平。
1.均差值O是指样本的平均分与标准差S的差值。
均差值
式中:为样本平均分,;S为样本标准差,;为样本中所有参评学生的成绩总和;N为样本参评学生人数(当N<30时以N-1代入计算);为该样本中每位参评学生测试成绩与平均分的离差平方和。
2.优秀值A是样本的优秀率U与优秀离差均值的乘积。
优秀值
式中:U为样本优秀率,,为样本的优秀生人数;为样本的优秀离差均值,。
B为优秀分数线,按总体(指所有样本)学生成绩排序占前20%的人数比例划定,也是总体所有优秀生成绩的下界;为样本中每位优秀生测试成绩与优秀分数线B的离差和,为样本参评学生人数。
3.后进值R是样本的后进率H与后进离差均值的乘积。
后进值
式中:H为样本后进率,,为参评后进生人数;为样本的后进离差均值,。
C为后进分数线,按总体(指所有样本)学生成绩排序占后20%的人数比例划定,也是总体所有后进生成绩的上界;为样本中每位后进生测试成绩与后进分数线C的离差和,为样本参评学生人数。
第四条本办法设立水平指数和效能指数两项评价指标。
1.水平指数W为样本的均差值、优秀值、后进值三项评价参数T分数的加权和与评价系数K
的乘积,用于横向比较不同样本、不同学科同一时期学业质量的综合水平。
各年级水平指数W可分别采用以下计算公式:
一年级水平指数;
二年级水平指数;
三年级水平指数;
式中:K为评价系数=法定周课时数/实际周课时数(时取1),区域或学校为样本时由教育行政部门审核确定,班级为样本时由学校审核确定;为样本均差值的标准T分数,(Z>2时取2);Zo为样本均差值的标准Z分数,;为总体均差值的平均数;为总体均差值的标准差,;M为样本总数(当M<30时以M-1代入计算)。
优秀值T分数和后进值T分数计算方法同理。
2.效能指数为样本本次测试水平指数与前次测试水平指数的差值,用于纵向比较同一样本、同一学科不同时期学业质量综合水平的增值效能。
第三章监测评价程序
第五条按学科统一命题,各样本根据统一规范组织测试。
第六条评卷、登分、录入、核查,并提供教学质量监测评价OAR系统软件用户名、密码及相应评价用表。
第七条按下列公式统一计算确定各样本的参评人数N。
式中:为上次测试各学科优秀生人数的平均数;为上次测试各学科后进生人数的平均数。
第八条汇总所有样本数据统计分析,并按学科形成中学生学业质量监测评价报告。
分析反馈样本监测评价结果时,按评价数据公布规范仅向各样本单位提供总体常模和样本数据。
第四章附则
第九条优秀生和后进生所占比例及其对应的临界分数线,样本的参评人数N、评价系数K、评价参数T分数的权重,可根据总体实际相应调整。
第十条本办法解释权归属OAR,凡实施中出现新情况,可适时增删修正。