有关试卷分析的几个问题一、试卷分析目的及主要内容试卷分析是
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有关试卷分析的几个问题
一、试卷分析目的及主要内容
试卷分析是考试管理中一项重要工作,开展试卷分析一是为了评
价考试的质量。
一次考试之后,它的成绩可靠不可靠,有多大的可靠
性?它的目标达到了没有,实现到何种程度?哪些试题的质量较好,好
在哪里?哪些试题较差,差在何处?这些问题我们就可以通过试卷的分
析来评价。
特别是,由于试卷提供的材料详尽具体,除可供定性分析
外,还可以进行定量分析,从而得出比其他方法更精确的评价。
因而,
试卷分析就成为我们评价考试质量的最重要、最有效的方法。
二是
为了做好今后的考试工作。
首先,它能够为改进考试设计工作,使之
更符合考生实际提供重要信息。
其次,它能够为改进命题工作提供大
量信息,提高试题和试卷的编制质量。
再次,如果考试使用的是题库
中的试题,那么,对于题库的提高和完善来说,它就是一次理想的试测,试卷分析对于改进试题的试卷编制工作的作用将更直接,价值也更大。
同时,试卷分析也是对评卷等工作的一次检查,有利于提高组织管理
的工作质量。
三是为了改进教学工作。
试卷分析是对试卷中储存的
信息进一步发掘和利用,这信息不仅对检查和改进考试工作有重要的
价值,对于改进教学工作,提高教学质量是大有益处的。
试卷分析的主要内容。
试卷分析主要包括:考试成绩分布的统
计、试题的难度分析、试题的区分度分析、考试的信度分析、考试
的效度分析等。
对于上述质量指标,虽有评定优劣的标准,它只适合
于标准化考试为前提的选拔性考
试,但不完全适用于以评定学业成绩为主的目标性考试的试卷质量。
二、考试成绩分布的统计
1.平均数和标准差
平均数是某门课程在某个年级或某个班级的平均分数。
它说明学生对所学内容掌握的平均水平。
可以给人一个简明概括的印象,
用以教学单位的比较。
比如两个班级同考一门课程,1班平均分为70分和2班平均分为85分,很显然我们可能直接得出结论,即2班的成绩要好于1班。
而标准差表示每个学生试卷得分与平均分的离散程度,用于说明平均分的代表性。
一门课程考试成绩的标准差小,意味学生测试成绩集中在平均分数附近,成绩分布均匀,平均数
代表性就好,标准差大则相反。
但标准差不能太小。
因标准差小,
则表示试题的区分能力差。
在我们学校成绩的标准差值达在6-14较为理想。
如果偏离这个范围则要分析原因。
2.观察学生成绩分布的频数分布。
学生成绩统计完成后,编制频数分布表,绘制直方图,观察分布,以判断是否为正态分布。
由于考试命题和评分标准都根据教学大纲的要求制定的,试题本身又有一定的难易,所以在正常情况下,符合教育客观规律的考试成绩应呈正分布。
即一般程度占多数,而学习成绩特别好的和特别差的占少数。
这种分布能客观的反映学生获得知识的程度和智力水平;客观的反映教学情况和所存在的问题,有利于对学生成绩找出差距和教
师有的放矢地改进教学。
此外,学生成绩分布还可呈偏态分布,包括正偏态和负偏态。
负偏态是学生成绩集中在高分侧,正偏态为成绩集中在低分侧。
无论正、负偏态都不能客观的反映学生的学习成绩,应进一步分析原因。
下面以我院试卷分析系统的多边图为例来显示一下三种状态(在这里我们说一般程度指的是70-80分之间,80-90分为较好状态90分以上为成绩特别好状态,70分以下为成绩较差状态。
):
频率直方图(或频率多边图)
(图A.正态分布)
频率克方图(或频率多边图)
(图B,正偏态)
频率立方图(或频率多边图)
—♦—人教
-•一百分比
(图C.负偏态)
三、试题的区分度(一般用D表示)。
试题的区分度表示试题区分能力的指标,试题的区分能力就是试题在用于考试时使水平高的考生得分高,水平低的考生得分低的倾向力。
它是评价试卷质量和筛选试题的主要指标和依据。
我院试题区分度(识别度)计算方法和步骤为:
①将试卷分为70分以上(含70分)和70分以下两部分。
②分别统计70分以上、70分以下学生正确回答某道试题的人数,并计算比值。
③按下列公式计算题目区分度(识别度):
D=Pp-Pn
Pp为70分以上学生正确回答某道试题的比率,Pn为70分以下学生中正确回答该道试题的比率。
一般认为,试题的区分度指数在0.3-0.6之间,其区分度较高。
分析试题的区分度,可以对照下面所列标准。
•0.40以上优秀
•0.30-0.39良好,如能修改更好
•0.20〜0.29尚可,仍须修改
•0.19以下劣,必须淘汰
但在我院考试中,试题难度一般较小,因为这类考试是按照教学大纲要求,让绝大多数学生都能通过,准予及格这一原则设计的,计算所得识别度指数不会太高。
题目识别度指数达到0.25以上,即是一个有良好识别作用的试题,题目识别度指数达到0以下,应为淘汰试题。
四、试题的难度分析
难度是衡量试题的难易程度的指数,一般来讲试题的难度值即实测难度值(用P表示)用考生对该题的得分率或失分率来表示的,得分率计算公式是:P二霁客,失分率计算公式是:P=1-祟冬,在
该题炳分该题炳分
我们学校采用的是后者,即P值越小,试题难度值越小,反之试题越难。
试题的难度,并不完全由试题本身的复杂程度决定的,还与考生对该题的适应程度有关。
有的题本身较复杂,但考生大都准备好了,结果得分率很高;有的试题本身很简单,但考生大都没准备,结果得分率很低。
实际上,试题的难度所反映的是特定一组考查对该题作答的困难程度。
由于难度与区分度有关,难度越接近0.5,区分度越高,难度与区分度的关系大致如下表所示:
试卷难度试题区分度
00
0.10.2
0.20.4
0.30.6
0.40.8
0.51
0.60.8
0.70.6
0.80.4
0.90.2
1.00
从上图可以看出,调整试题的难度是改变区分度的有效方式。
五、试卷的效度
是指一个测验测量所要测的东西达到多么好的程度。
它反映了与预期要达到的目标的符合程度。
考试的效度高表明考试所考的内容正好是需要考的内容,而试卷的效度低,则表明需要考查的内容没有或完全没有考查到。
考试内容的安排不当及科学性不强、考试方法选择不恰当都可以影响考试的效度。
目前,关于效度还没有较
好的量化方法。
但我们可以对试卷是否符合大纲要求,能否体现出 教学目的,做出评价。
六、试卷的信度
信度就是试卷的可靠性,即考试能否反映考生的真实水平。
因 为考试本身作为一项测量手段,其必定存在测量误差,测量误差的 大小可直接影响测量结果的可信程度。
在我校,信度是按如下办法 计算的:
将全部试题按奇、偶数分成相等的两半,然后计算每个受试者 在两半考试的总得分,并求出这两半的相关系数,即为“内部一致 性量数”,表明两半考试的等值程度。
但这里测得的相关系数仅是半 个考试的信度系数。
因此,我们采用卢氏修正公式,它不必假定两 半分数的变异数相等,也不用相关系数便可接计算:
孔,S 2d
俯T 一胡其中S 材为两半分数差的变异数,S"为总分的变异数,艮S 2d = S'(a-b) =----------2——H
£(0 3)2 _
S 2t = S 2(a + h) =-------------——n
式中,a 为奇数题得分,b 为偶数题得分,a-b 为该学生差异分 数,&b 为该学生总分,n 为试卷份数。
因为同大多数高校一样,我们的考试更倾向于目标性或合格性, 对试题的区分度要求降低,对信度的要求也可适当放宽,一般在
0.6以上即可。
如果试卷的信度不高我们可以从以下方面查找原因:
1.试题量大小。
试题量加大,取样就趋于适当,覆盖面加大,
考生受猜测答案的影响也越小,考试信度也越高。
因此,为提高信度,出题时要尽量多出一些题目并且使大题化为小题。
2.各类题型的比例。
客观题较主观题人为因素少,评分较准确。
因此,应有适当量的客观题。
3.评分者的影响。
是否有标准答案,以及评分者的经验多少和水平高低也影响信度。
因此,事先做好标准答案,组织经验多,水平高的教师阅卷以及流水阅卷可提高信度。
4.试卷的难度和题量,题目的难度过多或过易,都易造成考试分数的分布变窄,降低试卷的信度。
5.提高试题的区分度。
试题的区分度越高,它对提高试题信度的贡献越大,试题的质量就越好。
七、关于定性分析。
主要从以下几个方面着手:
1.试卷质量分析,对考试结果做出定性分析主要是:试卷是否符合教学大纲要求;试卷内容是否覆盖教学计划各章节知识;试卷设计制作是否规范;试卷的题型、题量是否合适等。
2.考试成绩分析,对考试结果做出定量分析:参加考试班级、
人数,是否有缺考、缓考、舞弊现象;试卷的难度、标准差、全距、区分度、信度、效度等评价指标分析;分数分布状态;成绩分布图不等。
3.教学效果分析及改进措施:主要包括教学效果分析;对该课程教学及考核的改革意见与对策等。