试卷分析常用统计指标
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
试卷分析常用统计指标 Revised by Jack on December 14,2020
试卷分析常用统计数据
一、平均分
平均分是反映学生成绩集中趋势最主要的测量指标,一般在Excel中可快捷求得。
二、标准差
标准差是反映每个学生成绩与平均分的平均差异程度,是学生成绩离散程度最广泛的测量指标,其值越大,说明成绩越分散。在Excel中,点击函数工具选择“STDEVP”并确定计算范围(如:B2:B500)即可。
三、分数段人数
按分数段统计学生人数,一般可按5分或10分为一段进行统计,根据各分数段的人数可绘制出学生成绩分布的曲线或直方图,以“中间高、两头低”来衡量成绩是否符合正态分布的程度。统计规律表明,考生的智力水平,包括学习能力,实际动手能力等呈正态分布,因此正常的考试成绩分布应基本服从正态分布。综合考察标准差与平均分以及成绩分布的曲线,可以了解学生成绩的分化程度、分布密度等情况。
统计分析中,通常还计算各分数段人数占总人数的比率,以及满分率,零分率。在列表叙述相关数据中还应列出最高分、最低分。
四、难度系数
难度指试卷(题目)的难易程度。一般用试卷(题目)的得分率或答对率表示,所以难度事实上是容易度或通过率。其值在0~1之间,数值越大,说明试卷(题目)越容易。一般计算方法:
1、客观性试题难度P(这时也称通过率)计算公式:P=k/N。
其中,k为答对该题的人数,N为参加测验的总人数。
例:第1小题选择题满分是4分,全班50名学生中有20名学生答对,则第1小题的难度计算:平均分=4×20÷50=,P=平均分÷满分值=÷4=。
2、主观性试题难度P计算公式:P=X/M。
其中,X为试题平均得分;M为试题满分。
3、适用于主、客观试题的计算公式:P=(PH+PL)/2
其中,PH、PL分别为试题针对高分组和低分组考生的难度值。
在大群体标准化中,此法较为方便。具体步骤为:①将考生的总分由高至低排列;
②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的
27%作为低分组;④按上面的公式计算。例:一次生物测试中,在100名学生中,高低分组各有27人,其中高分组答对第一题有20人,低分组答对第一题的有5分,这道题的难度为:
PH=20/27=,PL=5/27=,P=(+)/2=。
4、整个试卷的难度等于所有试题难度之平均值(包括主、客观试题),或用公式P=X/M计算。
难度值在0至1之间。P>试题太易;P<时,试题太难。一份试卷应该由不同难度按一定比例组成。一般地说,P> 、P<的试题各占10%;P=~,和P=~0.8的试题各占20%;P>、P <的中等难度试题应占60%。整套试卷平均难度在~之间。
五、区分度
区分度是指试题对被试者情况的分辨能力的大小,它反映试题区分不同水平受试者的程度,即考出学生的不同水平,把优秀、一般、差三个层次的学生真正分别开。区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。区分度也是衡量题目质量的主要指标之一,是筛选题目的依据。
一般的教学测验分析中,通常采用极端分组法,具体方法:先将被测学生按其总分由高到低的顺序依次排列,然后取其上端一部分为高分组,取其下端一部分为低分组。各组的人数应占多大比例,要视被测学生总体的具体情况而定。一是学生人数不太多,可把前50%的考生为高分组,后50%为低分组。二是学生人数多,如果测验总分的分布符合正态分布,最适当的比例是高分组和低分组各占27%;如果分数分布较正态分布平坦,高、低分组人数比率要略高于27%;一般情况下,其比率介于25%—33%之间即可。计算公式:
1、客观性试题区分度D:D=PH-PL
其中,PH、PL分别为试题高分组和低分组考生的难度值,PH、PL的计算方法同上。
例:一次生物测试中,在100名学生中,高低分组各有27人,其中高分组答对第一题有20人,低分组答对第一题的有5分,这道题的区分度为:
D=PH-PL=、主观试题(非选择题)区分度D:D=(XH-XL)/N(H-L)
其中,XH表示接受测验的高分段学生的总得分数,XL表示接受测验的低分段学生的总得分数,N表示接受测验的学生总数,H表示该题的最高得分,L表示该题的最低得分。
3、整个试卷的区分度,是所有试题区分度的平均值。
六、信度
信度是反映测量工具可靠性的指标。试题的信度主要是指测量结果的可靠性或一致性。常见的试题信度多用相关系数来表示,即用同一组被测学生样本对两组项目的反应之间的相关,作为反映两组项目测量的一致性程度的指标,称作信度系数,简称信度。几种常用信度的意义及计算方法:
1、再测信度
用同一份试题对同一组学生前后实施两次测试,计算两次测验分数之间的相关系数,即得再测信度。这种信度能表示两次测验结果有无变化,反映测验分数的稳定程度,所以又称为稳定性系数。再测信度一般用皮尔逊积差相关公式计算。
2、复本信度
如果用两份等值平行的试题测量同一组学生,再求两次测验分数的相关,其结果就是复本信度。用皮尔逊积差相关公式计算。
3、分半信度
在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根据学生在这两半测验中所得的分数计算相关系数,即得分半信度。计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高。
4、同质性信度
同质性是指试题中所有项目之间的一致性。若测验中各个项目得分相关较高时,不论项目的内容或形式有何差别,测验都为同质;相反,即使所有项目看起来都好像是测量同一特性,但项目得分之间的相关很低,测验仍然是异质的。测验越同质,同质性信度的值也越大,则说明试题的内部一致性程度越高。因而,同质性信度又称作内部一致性系数。常用计算同质性信度的方法如下:当项目采用二分法(项目只有通过或未通过两种分数)计分时,可用库德-理查逊公式;当项目属于论文式类型,采用连续分数计分时,可用克龙巴赫所创的a系数公式。