学生成绩的统计分析.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
·!!·
学生成绩的统计分析
楼裕胜
(浙江金融职业学院,浙江杭州"#$$%$)
摘要:在以往的考试中,教师对学生成绩的分析,方法上比较单一,内容上比较模糊。
这不利于教学信息的发掘和反馈,从而也影响了教学决策。因此,我们需要借鉴统计分析的方法,科学、严谨、定量地分析学生的考试成绩,从中找出有利于教学的信息,推动教学工作的不断进步。
关键词:学生成绩;统计;分析
考试的目的是为了检测、评价教学效果,推动和促进教学水平的不断提高。为充分发挥考试的功能,使考试真正为提高素质教育服务,建立科学合理的考试评价体系是关键所在。这种学生成绩的评价体系建立在统计理论的基础上,运用各种统计分析指标对考试的结果予以评价和监控,然后提出教学及考试中存在的不足。
一、考试试卷的统计分析
(一)试卷难度的分析
所谓难度是指考试中试题或者试卷的难易程度,是考试题目对学生知识和能力水平适合程度的指标。
1.难度的计算
以往教师在考试中对试题难度的测定大部分是凭感觉。这种方法本身比较模糊,对有经验的教师也并不是非常有效。根据难度的概念,得到如下公式。以.x.a表示第i题的成绩均值和满分值,则:第i题的难度:
d=1-x/a
若第i题全部答对,则d=0;若第/题全部答错,则d=1;当d=0.5,说明此题难度适中。
试卷难度:试卷难度的测定建立在试题难度的基础上,以试题难度为变量,以试题满分值为权数的加权算数平均数。
一般而言,试卷都是以#$$分为满分,于是
对于学校的常规考试,目的在于测量个体差异。当d=0或1时,即试题全部答对或答错,该题便无法提供个体差异的信息。而只有当d=0.5时,题目才能做最大程度的区分度。但在实际工作中要使每题难度均达到0.5有一定的困难。因此,一般要求试卷平均难度为0.5左右,各试题的难度控制在0.5±0.2之间。
2.难度的比较
按以上公式计算的试题及试卷难度,只能看出不同试题或不同试卷的难易程度,但却不能分析题目或试卷之间的相对难度。如某试卷中,第一,第二,第三题的难度分别是0.3,0.4,0.5。从难度数据中可以看出,第一题相对较容易,第三题较难。但第二题与第一题的难度差和第三题与第二题的难度差是否相等?这却不一定。原因是不同试题的难度位于不同的等距量表,因而不具有可比性。为解决试题及试卷之间难度的相互对比,需要将以上公
式计算的难度,通过正态分布表,转化为标准分。如:1 2$(",4 2,#(&&;1 2$(!,4 2,#()*;
1 2$(*,4 2$。显然,第二题与第一题的难度差为$(#",第三题与第二题的难度差为#()*,难度差并不相等。
(二)试卷区分度的分析
区分度也叫鉴别力,就是通过一次考试将不同程度,不同能力的学生区分开来的重要指标。比如一道题目,水平高、能力好的同学都答对,而水平低、能力差的同学都答错,那么这道题就有好的区分度。
计算公式:
1.试题的区分度:·!"·
式中:h为班级中高分组同学第$题的平均成绩($为班级中低分组同学第$题的平均成绩(一般而言,高分组与低分组的同学人数是以班级同学人数*+,—*",确定)当高分组平均成绩与低分组平均成绩差距较大时,#$较大,这时对试题的区分度评价就比较好。
2.试卷区分度
区分度的评价标准:
二、学生考试成绩的统计分析
(一)对学生成绩分布曲线的描述和分析
1.学生成绩分布曲线的描绘方法
学生成绩分布曲线的描绘方法是:首先将学生的成绩进行适当的分组,同时统计出各组中的学生人数;其次以每组的组中值为横坐标,每组的学生人数为纵坐标建立直角坐标系;最后在所建立的直角坐标系中描绘各组所对应的点,并用光滑的曲线连接这些点,成为学生成绩分布曲线。在一般的考试中,由于每班的学生只有数十人,因而成绩分组不可能太细,否则会出现有的组别的学生人数为零,从而不能更好的显示出学生成绩分布的规律性,也不能描绘出光滑的学生成绩分布曲线。
2.学生成绩分布曲线的类型
根据教育学与统计学的理论,一次难度适中信度可靠的考试,学生的成绩应接近正态分布。也就是说,当学生的成绩接近于正态分布时,则说明此次考试基本达到了教学要求。判断成绩是否接近正态分布,最直观,最有效的方法是将成绩分布曲线与均值和方差相同的正
态分布曲线加以比较。一般地说,学生成绩分布曲线有以下几种类型:
(1)正态分布
自然界或社会经济中许多现象的发展都呈现出正态分布,其特征为“两头小,中间大”,即特别大或特别小的现象数量少,而处于平均水平周围的现象数量较多。如:人的身高等。教育统计学家经过研究发现,对于难度适中的试题,其学生人数与成绩应该呈现正态分布。其图形为:
当然,学生成绩呈现正态分布是理想化状态。考试成绩完全呈正态分布有一定的困难,也不现实。但我们要以正态分布为标准模式,加以对比,找出不足。
(2)负偏态分布
如果学生人数与成绩呈现这种分布形态,说明试题总体难度偏高。
(3)正偏态分布
如果学生人数与成绩分布呈现这种形态,说明试题总体难度过低。
(4) 陡峭型
如果学生成绩分布呈现这种形态,说明试卷中难度中等的度量所占比重太大。
(二)学生平均成绩的测定方法与评价
平均成绩是指全班同学在某一次考试中所达到的一般水平。它将全班同学成绩的差异抽象化,反映同学成绩的集中趋势。因而,教师计算平均成绩,一方面是反映同学在学业上达到的一般水平;另一方面也是为了不同班级间学习水平的对比。学生平均成绩的测定方法:(1)算数平均数
算数平均数是我们最常用的计算平均成绩的方法,其公式为:
5
其中x代表第1个同学的成绩,n是全班同学人数。
如果已经对全班同学的成绩进行了统计分组,则采
用公式
其中#$代表第$组组中值,%$为第$组的人数。算数平均数具有科学、严密、可靠、易于计算和理解、在抽样调查中具有良好的稳定性等优点。缺点是容易受极端值的影响,从而影响代表性大小;当成绩的分布呈偏态分布时,平均数则不能适当描述分布情况。
(&)中位数
中位数是把全班同学的成绩按从低到高的顺序排列,处于中间位置同学的成绩就是中位数。若同学人数为偶数,则中位数为处于中间位置二个同学成绩的平均
数。如果已经对同学的成绩进行了分组,则中位数是:
其中*为中位数所在组的下限;%’为中位数所在组的次数;%’,-为中位数所在组以前各组次数的累计值;/为中位数所在组的组距。中位数具有意义明确,不受极端值的影响,一旦平均数受到极端值的影响而失去代表性时,中位数可作为全班同学成绩的代表值,反映其一般水平。但中位数的缺点是缺乏灵敏度,不如平均数可靠,计算也不如算数平均数方便。(0)众数
众数是指全班同学成绩中出现最多的这个分数。在一般的常规考试中,由于班级考生人数较少,可能会没有众数或有两个及两个以上的众数。这种情况往往随着考生人数的增加而减少。众数的优点是易于计算,易于理解,反映考生成绩的集中趋势。&1平均成绩的评价平均成绩是把全班同学成绩的差异抽象化,反映出了全班同学在学业上的一般水平和成绩分布的集中趋势,具有一定的代表性。但全班每个同学的成绩是参差不齐的,它们分布在平均数的周围,呈现出了离散的趋势。学生成绩的离散指标正是反映全班同学考试成绩的离散程度。当离散指标值越大,则学生成绩的离散趋势越强,集中趋势越弱,表明了平均成绩代表性越差。此时教师再用平均成绩来评价同学学业水平,就显得欠妥当;反之亦然。当然离散指标并非越小越好。离散指标越小,说明学生的成绩十分接近,没有拔尖的,也没有太差的,也说明这套试卷难度过大或过小,未能反映学生在学业中的真实差距。
(-)全距
全距又称极差,是全班同学最高分与最低分的高差,即2)全班最高分,最低分。全距反映了全班同学在学业上的最大差距,具有计算简单,意义明确的优点。但由于全距只取决于二个极端值的大小而忽略了二者之间成绩的差异状况,因此,用全距只能粗略估计同学成绩的离散趋势。
(&)标准差
标准差又称均方差,是目前最常用,最科学的测量成绩离散程度的指标。公式为:
其中#$为第$个同学的成绩,#全班同学的平均成绩,3为全班人数。