如何计算一份试卷的难度与区分度

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如何计算一份试卷的难度与区分度

如何计算一份试卷的难度与区分度

如何计算试卷的难度和试卷的区分度。

1、

难度的计算

(1)

难度是指正确答案的比例或百分比。这个统计量称为试题的难度或容易度。难度一般用字母P表示,P越大表示试题越简单,P越小表示试题越难。试题要有梯度,因此各试题的难度应有不同,这是命制试题时要加以特别考虑的。

(2)

计算公式:P平均分/满分值例如:第一题平均分为8.5分,此题的满分值为10分,则第一题的难度P8.5÷100.85例:第1小题选择题满分是4分,全班50名学生中有20名学生答对,则第1小题的难度为,P正确答案的比例或百分比20÷500.4或

平均分4×20÷501.6P平均分÷满分值1.6÷40.4

(3)

关于难度的几个问题难度水平的确定是为了筛选题目。平时测验难度要利于学生的学习,但一定的难度能增加区分度,这对全面了解、掌握学生学习情况有十分重要的作用。难度水平的确定要考虑及格率,防止损伤学困生的自尊心。难度水平的确定要考虑对分数分布的影响,一般以偏正态分布为前提,有时偏正态分布更能激发学生的学习积极性.2、区分度的计算区分度是指试题对被试者情况的分辨能力的大小。一般在-1~+1之间,值越大区分度越好。试题的区分度在0.4以上表明此题的区分度很好,0.3 ~0.39表明此题的区分度较好,0.2

~0.29表明此题的区分度不太好需修改,0.19以下表明此题的区分度不好应淘汰。计算区分度的方法很多,特别需要注意的是对同一个试题的考试成绩采用不同的方法所得到的区分度的值是不同的。

我们可以使用下面的两种方法计算区分度:

(1)先将分数排序,P127﹪高分组的难度

,P2

27﹪低分组的难度

区分度D

P1-

P2或区分度

D

(27﹪高分组的平均分-

27﹪低分组的平均分)÷满分值

(2)利用积差系数r

计算区分度D当两个变量都是正态连续变量,而且两者之间呈线性关系,表示这两个变量之间的相关成为积差相关。积差相关的使用条件a、两个变量都是由测量获得的连续性数据。如百分制分数。b、两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称的分布。c、必须是成对的数据,而且每对数据之间是相互独立的。d

、两个变量之间呈线性关系。

积差相关系数r的计算在计算机上是很容易进行的。积差相关系数r的公式如下:r(无法显示)原谅!下面我们利用Excel表来演示一下具体的操作方法。3、试卷分析的几个特

殊问题(1)

选择题反应模式分析。

即:被试者对备选答案的反应情况。若备选答案应选项被全体应试者所选,题过易或有某种暗示;若未被一人所选,题太难;若干扰项无一人所选,说明迷惑性不足,若全体学生同选一个干扰项,可能定错了答案,也可能教学出了问题。若高分组答案集中在两个答案上,且选择率相近,说明可能有两个答案或另一个答案也有道理。若高分组与低分组选择选项接近或稍低。说明该题与被试水平无关。若题目未答人数太多,或选择所有备选答案人数相近,说明题目过难或题目本身出错,被试无法解答或凭猜测作答。

试卷分析的四个度:难度、区分度、信度、效度

一、难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。

1、难度的两种定义:

(1)P1—x/w

x为某题得分的平均分数,w为该题的满分。这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。

(2)Px/w

这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。

2、难度的计算:

(1)主观性试题的难度A

基本公式法:P1—x/wB

极端分组法P1—(XH+XL)2W

XH :高分组的平均得分(前27%),XL:低分组的平均得分(后27%)。

(2)客观性试题的难度A

基本公式法

:P1—R/N

R

为答对人数,N

为全体人数。B

极端分组法:P1—(PH+PL)2

PHRH/n

叫高分组通过率,RH:高分组答对人数,n:总人数的前27%。PLRL/n

叫低分组通过率,RL:低分组答对人数。

二、区分度区分度是区分应试者能力水平高低的指标。

试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分,而区分度低则反映不出不同应试者的水平差异。试题的区分度与试题的难度直接相关,通常来说,中等难度的试题区分度较大。另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。

区分度指标的评价:-1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。一般认为,区分度指数高于0.3,试题便可以被接受。

2、

区分度的计算方法:基本公式法

:D=(H-L)÷N(D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和)。

极端分组法:(1)主观性试题:DSH—SLn(WH-WL)SH:高分组得分总数,SL:低分组得分总数,WH:该题的最高得分,WL:该题的最低得分,n为高分组(或低分组)的人数,即总人数的27%。

(2)

客观性试题:D

PH—PL ,或D RH—RLn

(3)

一般也可以用DXH—XLX满

计算。XH:高分组某试题的平均分,XL:低分组某试题的平均分,X满:该题的满分。

三、信度

信度是指测得结果的一致性或稳定性,稳定性越大,意味着测评结果越可靠。相反,如果用某套试题对同一应试者先后进行两次测试,结果第一次得80分,第二次得50分,结果的可靠性就值得怀疑了。信度通常以两次测评结果的相关系数来表示。相关系数为1,表明测评工具如试卷完全可靠;相关系数为0,则表明该试卷完全不可靠。一般来说,要求信度在0.7以上。

1、评价信度的方法:

(1)重测法,

(2)复本法—副题,

(3)折半法,或者说:用再测信度、复本信度和内部一致信度三种方法来进行评估。再测信度是指将同一试卷在相同的条件下对同一组考生先后实施两次,两次测评结果的相关系数。复本信度是指用两份或几份在构想、内容、难度、题型和题量等方面都平行的试卷进行测试,测评结果之间的相关系数。内部一致信度是指试卷内部各题之间的一致性,通常是将试卷一分为二,然后计算一半试卷与另一半试卷之间的相关系数。

2、

信度系数

γxxST2SX2

ST2

叫真分数方差,SX2

为获得分数方差。信度系数的最大值为1,表示测验的可靠性高,最小值为0,表示测验的信度低。当γxx≥0.70时,测验可用于团体间的比较。当γxx≥0.85时,测验可用于个体之间的比较。

四、效度效度是一个测试能够测试出它所要测试的东西的程度,即测试结果与测试目标的符合程度.任何测试工具,无论其它方面有多好,若效度太低,测试的结果不是它要测试的东西(如用英语试卷测试学生的数学能力),那么,对目前所要测试的东西,这个测试将是无价值的。由于心理现象本身的特点,测评的效度尤为重要。心理属于精神方面的东西,目前人们还无法直接观察它,只能通过一个人的行为模式或者对测试题目的反应,来推论其心理特质。如智力水于主要是借助于个体对一些问题的反应及正误等结果来推断的。效度是一个相对概念,即效度只有高低之分,没有全部有效和全部无效之分。效度从种类上可分为卷面效度、内容效度、构想效度、预测效度和共时效度。

相关文档
最新文档