信度、效度、区分度、难度的使用
试题的难度区分度信度和效度
试卷的难度、区分度、信度和效度一.试卷的难度一什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标;一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大;客观题难度计算公式:P难度指数=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分;试卷难度计算公式:P=为平均分,K为试卷满分值;易、中、难的标准为:易:P≥,中:≤P≤,难:P≤;P值越大,难度越低,P值越小,难度越高;一般来说,难度值平均在最佳,难度值过高或过低,都会降低测验的信度;二难度的计算1客观性试卷难度P这时也称通过率计算公式:P=k/Nk为答对该题的人数,N为参加测验的总人数2主观性试卷难度P计算公式:P=X/MX为试卷平均得分;M为试卷满分3适用于主、客观试卷的计算公式:P=PH +PL/2PH、PL分别为试卷针对高分组和低分组考生的难度值步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算;三试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以之间为好,整卷以之间为最佳;一般将难度值大于和等于的试卷定为容易题;大于和小于的定为中档题;小于和等于的试卷定为难题;命题时难度一般要按一定比例分配,如3:6:1或3:5:2;二.试卷的区分度一什么是区分度区分度是指考试卷目对考生心理特征的区分能力;区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分;区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低;二区分度的计算1.单个选择题目区分度的计算将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度又叫鉴别指数;计算公式为:D=PH -PL. PH和PL分别为高分组和低分组的通过率;2.整个试卷的区分度计算常用计算公式为:D=2XH —XL/W,其中D为试卷区分度,XH为27%高分组平均分,XL为27%低分组平均分,W 为试卷总分;一般也将全体考生总分从高到低排列,将总分最高的27%的考生定为高分组,总分最低的27%考生定为低分组,再分别计算各组的平均分;三试卷区分度的一般要求区分度D的取值范围介于至+之间;通常D为正值,称为积极区分;D为负值称为消极区分;D值为0称为无区分作用;具有积极区分作用的试卷,其D值越大,区分的效果越好;试卷的区分度在以上表明此题的区分度很好,~表明此题的区分度较好,~表明此题的区分度不太好需要修改,以下表明此题的区分度不好应淘汰,高考的区分度一般要求在以上;三.试卷的信度信度是指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得测验分数的一致性和稳定性程度;信度除了要说明成绩的真实性之外,还要说明题目涉及的内容与教学的相关程度;信度系数愈高即表示该测验的结果愈一致、稳定与可靠;系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性;反之,随机误差可能导致不致性,从而降低信度;信度可以定义为随机误差R影响测量值的程度;如果R=0,就认为测量是完全可信的,信度最高;信度主要是指测量结果的可靠性、一致性和稳定性,即测验结果是否反映了被测者的稳定的、一贯性的真实特征;和信度相关的一个概念是,信度是效度的前提条件;信度只受随机误差的影响,随机误差越大,信度越低;因此,信度可以视为测试结果受随机误差影响的程度;系统误差产生恒定效应,不影响信度;四.试卷的效度效度是指考试有效性或正确性的质量指标,即是否考了要考的内容,试卷难度、区分度是否适宜,考试最终是否达到了它的预定目的等;测试效度test validity亦称测试的有效性,指一套测试对应该测试的内容所测的程度;也就是说,一套测试是否达到了它预定的目的以及是否测量了它要测量的内容;测试的效度一般可分为以下几类:1表面效度face validity;指测试应达到的卷面标准,即一套测试卷从表面看来是否是合适的;例如,若一次阅读理解力的测试包括许多受试者没有学过的方言词汇,则可认为这次测试缺乏表面效度;表面效度是测试出受试者正常水平的一种保证因素;2内容效度content validity;指测试卷是否测试了应该测试的内容或者说所测试的内容是否反映了测试的要求,即测试的代表性和覆盖面的程度;3编制效度construct validity;指测试卷的诸项目对编制该测试所依据的理论的各个基本方面的反映程度;4经验效度empirical validity;经验效度是一种衡量测试有效性的量度,通过把一次测试与一个或多个标准尺度相对照而得出;一般来说,对某次测试的效度进行检验时,除了要根据教学大纲的要求和观念有效性的理论对试卷的内容进行考查以外,还须采用计算相关系数的定量方法,即计算出本次试卷与另一份已被确定能正确反映受试者水平的试卷之间的相关系数;系数高则有效性大;课堂测试的效度应在之间,规模较大的测试其效度应在以上;五、高考题的信度、效度、难度和区分度高考的性质最主要的在两个方面:首先、高考是一种选拔性考试,高考成绩是高等学校录取新生的依据,这是高考的选拔性质;其次、高考是一种导向性考试,高考是中学教学的指挥棒,起着对中学教学的引导作用,这是高考的引导性质;高考性质的这两方面决定了高考试卷应有的信度、效度、难度和区分度,而这些是我们进行高考复习首先要清楚的,能够避免我们在复习时的盲目;。
试卷分析信度效度难度和区分度
附件6、难度、区分度、信度和效度的一般说明一、难度难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。
一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。
1、难度的两种定义(1)P=1-x/w其中:x为某题得分的平均分数,w为该题的满分。
这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。
(2)P=x/w这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。
2、难度的计算(1)主观性试题的难度A、基本公式法:P=1-x/wB、极端分组法P=1-(XH+XL)/2W其中:XH为高分组的平均得分(前27%),XL为低分组的平均得分(后27%)。
(2)客观性试题的难度A、基本公式法:P=1-R/N其中:R为答对人数,N为全体人数。
B 极端分组法:P=1-(PH+PL)/2其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n 为总人数的前27%。
PL=RL/n 叫低分组通过率,RL为低分组答对人数。
二、区分度区分度是区分应试者能力水平高低的指标。
试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分。
而区分度低则反映不出不同应试者的水平差异。
试题的区分度与试题的难度直接相关。
通常来说,中等难度的试题区分度较大。
另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。
1、区分度指标的评价-1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。
一般认为,区分度指数高于0.3,试题便可以被接受。
2、区分度的计算方法(1)基本公式法:D=(H-L)/N其中:D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和。
试卷分析:信度、效度、难度和区分度
附件6、难度、区分度、信度和效度的一般说明一、难度难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。
一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。
1、难度的两种定义(1)P=1-x/w其中:x为某题得分的平均分数,w为该题的满分。
这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。
(2)P=x/w这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。
2、难度的计算(1)主观性试题的难度A、基本公式法:P=1-x/wB、极端分组法P=1-(XH+XL)/2W其中:XH为高分组的平均得分(前27%),XL为低分组的平均得分(后27%)。
(2)客观性试题的难度A、基本公式法:P=1-R/N其中:R为答对人数,N为全体人数。
B 极端分组法:P=1-(PH+PL)/2其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n为总人数的前27%。
PL=RL/n 叫低分组通过率,RL为低分组答对人数。
二、区分度区分度是区分应试者能力水平高低的指标。
试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分。
而区分度低则反映不出不同应试者的水平差异。
试题的区分度与试题的难度直接相关。
通常来说,中等难度的试题区分度较大。
另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。
1、区分度指标的评价-1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。
一般认为,区分度指数高于0.3,试题便可以被接受。
2、区分度的计算方法(1)基本公式法:D=(H-L)/N其中:D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和。
试卷分析:信度、效度、难度和区分度
附件6、难度、区分度、信度和效度的一般说明一、难度难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。
一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。
1、难度的两种定义〔1〕P=1-x/w其中:x为某题得分的平均分数,w为该题的满分。
这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。
〔2〕P=x/w这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。
2、难度的计算〔1〕主观性试题的难度A、基本公式法:P=1-x/wB、极端分组法P=1-(XH+XL)/2W其中:XH为高分组的平均得分〔前27%〕,XL为低分组的平均得分〔后27%〕。
〔2〕客观性试题的难度A、基本公式法:P=1-R/N其中:R为答对人数,N为全体人数。
B 极端分组法:P=1-〔PH+PL〕/2其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n 为总人数的前27%。
PL=RL/n 叫低分组通过率,RL为低分组答对人数。
二、区分度区分度是区分应试者能力水平高低的指标。
试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分。
而区分度低则反映不出不同应试者的水平差异。
试题的区分度与试题的难度直接相关。
通常来说,中等难度的试题区分度较大。
另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。
1、区分度指标的评价-1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。
一般认为,区分度指数高于0.3,试题便可以被接受。
2、区分度的计算方法〔1〕基本公式法:D=〔H-L〕/N其中:D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和。
试卷的难度、区分度、信度与效度
5
试卷的效度
效度是指考试有效性或正确性的质量指标,即是否考了要考的内容,试卷难度、区分度是否适宜, 考试最终是否达到了它的预定目的等。
测试效度(test validity)亦称测试的有效性,指一套测试对应该测试的内容所测的程度。也就是 说,一套测试是否达到了它预定的目的以及是否测量了它要测量的内容。
3
试卷的信度
信度是指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得测验分数的一致 性和稳定性程度。信度除了要说明成绩的真实性之外,还要说明题目涉及的内容与教学的相关程度。 信度系数愈高即表示该测验的结果愈一致、稳定与可靠。
常用Cronbach’s alpha系数:
Cronbach ' s
内容效度(content validity)
经验效度(empirical validity)
指测试卷是否测试了应该测试的内容或者说所测试的内容是 否反映了测试的要求,即测试的代表性和覆盖面的程度。
经验效度是一种衡量测试有效性的量度,通过把一次测试与 一个或多个标准尺度相对照而得出
D vH vL SDp
题型
计算公式
单个选择题区分度
D=2(高分组平均分-低分组平均)平均分)/试卷总分
注:前27%为高分组,后27%为低分组; 区分度(D)的取值范围介于-1.00至+1.00之间。通常D为正值,称为积极区分;D为负值称为消极区分;
D值为0称为无区分作用。具有积极区分作用的试卷,其D值越大,区分的效果越好。
题型 客观题 主观题
整份试卷
计算公式
P=试卷答对人数/考生数 P=试卷平均得分/满分
P=(高分组难度值+低分组难度值)/2 注:前27%为高分组,后 27%为低分组
教学测验中的信度、效度、难度和区分度
山东教师招聘网教学测验中的信度、效度、难度和区分度
编制教学测验必须在信度、效度、难度和区分度四个指标上达到一定要求,即起码达到有效、可信,具有一定难度和区分度。
很多考生在这四个概念的理解上有些混淆,结合例子帮助大家梳理一下:
1.信度与效度:信度指的是测验结果一致、分数稳定。
比如今天用一套试卷测试小明的成绩是80分,一个星期后再用来测小明还是考80分,那么这套测验的信度就是高的。
效度指的是测验工具能够真实地测出所要测量的事物的程度。
比如老师想要测量学生的英语口语水平,但是拿了一套笔试试卷让学生作答,那么这套试题的效度就是低的;再如一个数学测验试题的文字难度太大,超过学生自身水平,那么这套测验试题的效度是低的,没有测出想要测的学生数学水平。
信度与效度可以简单的概括为“两斤白糖”,两斤是信度,白糖是效度。
如果测出来的是一斤半或者是两厘米,那就说明信度有问题。
如果测出来的是盐巴或者大米,不是我们想要的白糖,那就是效度的问题。
2.难度与区分度:难度指测验的难易程度,难度值P=答对人数/总人数×100%。
比如全班总人数为30人,一道数学应用题只有6个人答对了,那么这道测验题目的难度值=20%,P值越大难度越小,P
值越小难度越大。
区分度用来鉴别不同水平的学生,高水平者得高分,低水平者得低分。
考生在备考这个知识点的时候,只需要把这四个概念理解清楚、做好区分即可。
此外,更抽象一点的关系是:信度是效度的必要条件,即高信度不一定高效度,但高效度必定高信度。
更多教师资格证备考信息关注山东教师招聘考试网。
试题的难度、区分度、信度和效度
试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。
试卷难度计算公式:P=为平均分,K 为试卷满分值。
易、中、难的标准为:易:P≥,中:≤P≤,难:P≤;P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在最佳,难度值过高或过低,都会降低测验的信度。
(二)难度的计算(1)客观性试卷难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试卷难度P计算公式:P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:P=(PH +PL)/2(PH、PL分别为试卷针对高分组和低分组考生的难度值)步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。
(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以之间为好,整卷以之间为最佳。
一般将难度值大于和等于的试卷定为容易题;大于和小于的定为中档题;小于和等于的试卷定为难题。
命题时难度一般要按一定比例分配,如3:6:1或3:5:2。
二.试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。
区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。
区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
(二)区分度的计算1.单个选择题目区分度的计算将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。
试卷分析:信度、效度、难度和区分度
附件6、难度、区分度、信度和效度的一般说明一、难度难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性.一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多.1、难度的两种定义〔1〕P=1-x/w其中:x为某题得分的平均分数,w为该题的满分.这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1.〔2〕P=x/w这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1.2、难度的计算〔1〕主观性试题的难度A、基本公式法:P=1-x/wB、极端分组法P=1-<XH+XL>/2W其中:XH为高分组的平均得分〔前27%〕,XL为低分组的平均得分〔后27%〕.〔2〕客观性试题的难度A、基本公式法:P=1-R/N其中:R为答对人数,N为全体人数.B 极端分组法:P=1-〔PH+PL〕/2其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n为总人数的前27%.PL=RL/n 叫低分组通过率,RL为低分组答对人数.二、区分度区分度是区分应试者能力水平高低的指标.试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分.而区分度低则反映不出不同应试者的水平差异.试题的区分度与试题的难度直接相关.通常来说,中等难度的试题区分度较大.另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来.1、区分度指标的评价-1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强.一般认为,区分度指数高于0.3,试题便可以被接受.2、区分度的计算方法〔1〕基本公式法:D=〔H-L〕/N其中:D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和.〔2〕极端分组法:①主观性试题:D=SH-SL/n<WH-WL>其中:SH为高分组得分总数,SL为低分组得分总数,WH为该题的最高得分,WL为该题的最低得分,n为高分组〔或低分组〕的人数,即总人数的27%.②客观性试题:D= PH-PL ,或D= RH-RL/n③一般也可以用D=XH-XL/X满计算.其中:XH为高分组某试题的平均分,XL为低分组某试题的平均分,X满为该题的满分.三、信度信度是指测得结果的一致性或稳定性,稳定性越大,意味着测评结果越可靠.相反,如果用某套试题对同一应试者先后进行两次测试,结果第一次得80分,第二次得50分,结果的可靠性就值得怀疑了.信度通常以两次测评结果的相关系数来表示.相关系数为1,表明测评工具如试卷完全可靠;相关系数为0,则表明该试卷完全不可靠.一般来说,要求信度在0.7以上.1、评价信度的方法〔1〕再测信度.它是指将同一试卷在相同的条件下,对同一组考生先后实施两次,两次测评结果的相关系数.〔2〕复本信度.它是指用两份或几份在构想、内容、难度、题型和题量等方面都平行的试卷进行测试,测评结果之间的相关系数.〔3〕内部一致信度.它是指试卷内部各题之间的一致性,通常是将试卷一分为二,然后计算一半试卷与另一半试卷之间的相关系数.2、信度系数的计算γxx=ST2/SX2其中:ST2 叫真分数方差,SX2 为获得分数方差.信度系数的最大值为1,表示测验的可靠性高,最小值为0,表示测验的信度低.当γxx≥0.70时,测验可用于团体间的比较.当γxx≥0.85时,测验可用于个体之间的比较.四、效度效度是一个测试能够测试出它所要测试的东西的程度,即测试结果与测试目标的符合程度.任何测试工具,无论其它方面有多好,若效度太低,测试的结果不是它要测试的东西<如用英语试卷测试学生的数学能力>,那么,对目前所要测试的东西,这个测试将是无价值的.由于心理现象本身的特点,测评的效度尤为重要.心理属于精神方面的东西,目前人们还无法直接观察它,只能通过一个人的行为模式或者对测试题目的反应,来推论其心理特质.如智力水于主要是借助于个体对一些问题的反应与正误等结果来推断的.效度是一个相对概念,即效度只有高低之分,没有全部有效和全部无效之分.效度从种类上可分为卷面效度、内容效度、构想效度、预测效度和共时效度.。
信度、效度和区分度
信度、效度、区分度和难度(一)教学测验的信度、效度、区分度及难度设计和编制任何一种测验,都必须使其在效度、信度、难度和区分度方面达到一定要求,即达到有效、可信,具有一定难度和区分度。
1.效度效度是指一个测验或测量工具能真实地测量出所要测量的事物的程度。
一次测验是否有效,主要看其是否能准确地测量所要测量的东西。
效度是评价工具最重要的必备条件,一个缺乏效度的评价工具是没有什么使用价值的。
同时,效度又是一个相对概念,任何一种评价工具只是对一定的目的来说才是有效的。
有效,就是测验能不能用,有没有用。
假的没办法用,只有真的才有用。
2.信度信度是指测验结果的稳定性或可靠性,即某一测验在多次施测后所得到的分数的稳定、一致程度。
它既包括在时间上的一致性,也包括内容和不同评分者之间的一致性。
几次测验的结果稳定而没有剧烈的上下浮动,那么就是信度高;几次测验结果相差太多,则为信度低。
3.难度难度指测验的难易程度。
在教学测量中,通常用答对或通过测验的人数比例作为难度值。
难度值(P)=答对人数(R)/被试总人数(N)×100%P值越大,难度越低;P值越小,难度越高。
一般来说,难度值平均在0.5最佳;难度值过高或过低,都会降低测验的信度。
通过的人少,则难度高,通过的人少则难度低。
4.区分度区分度有时也称鉴别力,主要指测验对于不同水平的被试加以区分的能力。
能够有效区分出水平不同的测验。
二、掌握方法1.效度在掌握效度时,大家可以抓住关键点“正确性/准确性”。
它所指的就是看一个测验能否正确测出想要的东西。
即“一个测验或测量工具能真实地测量出所要测量的事物的程度。
”例如:现在想测学生的英语成绩,但是拿了一张语文卷子给学生做。
那么这个测验的效度就是很低的,因为不能准确地测出学生的数学成绩。
2.信度在掌握信度时,大家可以抓住关键点“稳定性或可靠性”。
它所指的就是一个测验的结果是否可信。
举个例子:现在拿了一张数学卷子给小明做,小明做了90分。
试题的难度、区分度、信度和效度
试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。
试卷难度计算公式:P=为平均分,K 为试卷满分值。
易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。
(二)难度的计算(1)客观性试卷难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试卷难度P计算公式:P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:P=(PH +PL)/2(PH、PL分别为试卷针对高分组和低分组考生的难度值)步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。
(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题。
命题时难度一般要按一定比例分配,如3:6:1或3:5:2。
二.试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。
区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。
区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
(二)区分度的计算1.单个选择题目区分度的计算将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。
难度、区分度、信度和效度的一般说明
其中:XH为高分组的平均得分(前27%),XL为低分组的平均得分(后27%)o (2)客观性试题的难度
A、基本公式法:P=1-R∕N 其中:R为答对人数,N为全体人数。 B极端分组法:P=I-(PH+PL)/2
其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n为总人数的前27%。PL=RL∕n叫低分组通过率,RL 为低分组答对人数。
②客观性试题:D=PH-PL,或D=RH-RL/n
③一般也可以用D=XH—XL/X满计算。
其中:XH为高分组某试题的平均分,XL为低分组某试题的平均分,X满为该题的满分。
三、信度
信度是指测得结果的一致性或稳定性,稳定性越大,意味着测评结果越可靠。相反,如果用某套试题对同一应 试者先后进行两次测试,结果第一次得80分,第二次得50分,结果的可靠性就值得怀疑了。
二、区分度 区分度是区分应试者能力水平高低的指标。试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者 得高分,低水平者得低分。而区分度低则反映不出不同应试者的水平差异。 试题的区分度与试题的难度直接相关。通常来说,中等难度的试题区分度较大。另外,试题的区分度也与应试 者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。 1、区分度指标的评价 -1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。一般认为,区分度指数高于0.3,试题便可以被接受。
信度通常以两次测评结果的相关系数来表示。相关系数为1,表明测评工具如试卷完全可靠;相关系数为0,则表 明该试卷完全不可靠。一般来说,要求信度在0.7以上。
1、评价信度的方法
(1)再测信度。它是指将同一试卷在相同的条件下,对同一组考生先后实施两次,两次测评结果的相关系数。
难度、区分度、信度、效度
试卷分析的四个度:难度、区分度、信度、效度一、难度难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。
一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。
1、难度的两种定义:(1)P=1—x/w x为某题得分的平均分数,w为该题的满分。
这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。
(2)P=x/w这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。
2、难度的计算:(1)主观性试题的难度A基本公式法:P=1—x/wB极端分组法P=1—(XH+XL)∕2W XH :高分组的平均得分(前27%),X L:低分组的平均得分(后27%)。
(2)客观性试题的难度A基本公式法:P=1—R/N R 为答对人数,N 为全体人数。
B极端分组法:P=1—(PH+PL)∕2PH=RH/n 叫高分组通过率,RH:高分组答对人数,n:总人数的前27%。
PL =RL/n 叫低分组通过率,RL:低分组答对人数。
二、区分度区分度是区分应试者能力水平高低的指标。
试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分,而区分度低则反映不出不同应试者的水平差异。
试题的区分度与试题的难度直接相关,通常来说,中等难度的试题区分度较大。
另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。
区分度指标的评价:-1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。
一般认为,区分度指数高于0.3,试题便可以被接受。
2、区分度的计算方法:基本公式法:D=(H-L)÷N(D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和)。
试题的难度、区分度、信度和效度
试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。
试卷难度计算公式:P=为平均分,K 为试卷满分值。
易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39; P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。
(二)难度的计算(1)客观性试卷难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试卷难度P计算公式:P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:P=(PH +PL)/2(PH、PL分别为试卷针对高分组和低分组考生的难度值)步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。
(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题。
命题时难度一般要按一定比例分配,如3:6:1或3:5:2。
二.试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。
区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。
区分度高的1考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
(二)区分度的计算1.单个选择题目区分度的计算将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。
试题的难度、区分度、信度和效度
试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。
试卷难度计算公式:P=为平均分,K 为试卷满分值。
易、中、难的标准为:易:P≥,中:≤P≤,难:P≤;P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在最佳,难度值过高或过低,都会降低测验的信度。
(二)难度的计算(1)客观性试卷难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试卷难度P计算公式:P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:P=(PH +PL)/2(PH、PL分别为试卷针对高分组和低分组考生的难度值)步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。
(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以之间为好,整卷以之间为最佳。
一般将难度值大于和等于的试卷定为容易题;大于和小于的定为中档题;小于和等于的试卷定为难题。
命题时难度一般要按一定比例分配,如3:6:1或3:5:2。
二.试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。
区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。
区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
(二)区分度的计算1.单个选择题目区分度的计算将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信度、效度、难度、区分度及其在试卷分析中的使用教学测量(instructional measurement)是考核教学成效的一种方法。
这是借助于一定的手段与方式,对学生的学习成绩(简称学绩)进行探察,并以一定的数量来表示的考核办法。
2. 在教学测量中应注意什么(1)教学测量的目的在于考核教学成效,也就是考察教学目标的完成情况。
因此,教学测量的目标应以教学目标为依据,测量目标应与教学目标一致,而不能偏离教学目标(2)教学测量的对象是学生内在的能力与品德等的形成状况,它不可能像物理测量那样直接进行,只能借助于一定的手段与方式间接进行。
(3)教学成效是通过量化的学绩进行考察的。
也就是说,教学成效是以学生的学习成绩为直接考察依据的,而学绩是以一定的数量来表示的,因此命题的合理性与评分的客观性是有效教学测量的一个重要影响因素
教学评价(instructional evaluation)就是依据教学目标,对学绩测验所得测量结果进行分析及解释。
它主要包含以下两个方面的工作。
(1)教学评价必须对学绩测验数据所表明的教学成效作出确切的诊断。
(2)教学评价必须对教学的成败原因进行分析,并对今后教学工作的改进方面作出明确的规定。
评价(估)的功能:为家长提供信息,为选拔提供信息,为学生提供信息,为教师提供信息,为学校(间)提供信息
教学目标,有时也称为行为目标,是指对学生在一段时间教学后应该掌握的技能与概念的陈述。
❖信度
信度指的是测量结果的稳定性程度,信度是衡量一个量表质量高低的重要指标。
信度不高的量表是不能使用的。
3.常见的信度种类(1)重测信度(2)复本信度(3)分半信度(4)同质信度(内部一致性信度)(5)评分者信度
影响信度的因素
♦被试
♦主试者
♦施测情境
♦测量工具
信度是指考试的可靠性,即考试结果的可信程度。
信度高的试题很少受到外部因素的影响,对任何学生的多次测定都会产生比较稳定的、前后一致的结果。
提高试卷信度的因素大致可包括以下几种情况:(1)使用ABC卷随机抽取试题。
(2)教师考前没有划定考试范围。
(3)试题效度高,质量可靠。
(4)考试保密措施可靠。
(5)严格执行考试纪律。
(6)阅卷标准严格、规范、统一。
(7)集体阅卷且实行流水作业,复核认真。
❖效度
测验的效度指的是测量的正确性和有效性,即它能够测出所要测量的心理特质与行为特征的程度。
换言之,效度指测验能在多大程度上达到测量目的。
2.效度的类型:内容效度、构想效度、实证效度效度指考试的准确性,反映的是考试内容与教学大纲或考试大纲的吻合程度。
效度高的试卷,能够较准确地测试出学生掌握和运用所学知识的真实度。
根据教学大纲或考试大纲进行命题,且各单元试题分数分配与学时数分配基本保持一致,成正比关系,这是保证考试效度的基础。
其它影响效度的因素有:是否在命题的同时制订了试题参考答案与评分标准;是否集体阅卷且实行流水作业;复核是否认真;分数是否真实等。
❖难度
难度反映试题的难易程度,即考生在一个试题或一份试卷中的失分程度。
一道试题,如果大部分被试都能答对,则该题的难度就小;如果大部分被试都不能答对,则该题的难度就大。
一个题目的难度大小,除了所测的内容本身的难易程度有关以外,还与测验的编制技术和被试的知识经验有关,由于学得不清楚或者因被试没学过,一个本
来容易的题可能变难。
这就是说测验的难度具有相对性,正因为此,必须让试题通过实践来对难度作出检验。
(一)基本公式
1、客观题难度的计算(当人数较少时)
P=R/N
R为答对该试题人数,N为参加测验总人数
适用范围:客观题,只有答对与答错两种可能。
(即二分)
♦例1:在100个学生中,答对第一题的30人,答对第二题的60人,求第一、二道题的难度?比较这两道题谁比谁难?
2.极端分组法
当被试人数较多时,则可以先将被试依照测验总分从高到低排列,分成三组,总分最高的27%的为高分组(NH)总分最低的27%为低分组。
分别计算出高分组与低分组的通过率,然后求项目的难度。
公式为
P=(PH+PL)/2
♦PH为高分组答对该题的百分比;
♦PL为低分组答对该题的百分比。
某区域1000人参加考试,试卷第一题高分组180人答对,低分组60人答对,求该题难度?
3.非二分法记分的项目的难度
如论述题
公式
P=某题平均得分/该题满分
如满分100分的试题,考生平均得分76分,平均失分24分,则难度系数为0.24。
其计算公式为:
L=1—X/W
其中,L为难度系数,X为分析组平均得分,W为试卷总分(一般为100分)
❖区分度
♦(一)区分度的含义
♦指测验题目对考生实际水平的区分程度或鉴别能力。
♦如一道题,学业水平、实际能力都较高的考生都答对了;而学业水平、实际能力都较低的考生都答错了,则可认为该题目有好的区分度。
♦区分度分析主要以效能为依据,考察考生在每个题目上反应与其在效标上的表现之间的相关程度。
♦区分度(D)的取值范围介于- 1.00—+1.00之间,值越大,区分度的效果越佳。
♦区分度D>0为正区分,D<0为负区分,D=0为零区分
(二)区分度的计算
♦1、极端分组法
♦(1)客观性试题D=PH-PL
Ph与pl分别为高分组与低分组在该项目上的通过率
例6:有道试题,高分组有70%学生通过,低分组有30%的学生通过;而另一道题,高分组有40%学生通过,低分组有70%学生通过,求两题的各自区分度?
例7一次生物测试中,在100名学生中,高低分组各有27人,其中高分组答对第一题有20人,低分组答对第一题的有5人,这道题的区分度为多少?
♦2)主观题D=(XH-XL)/N(H-L)
♦XH为高分组得分的总分
♦XL为低分组得分的总分
♦H为该道题的最高分
♦L为该道题的最低分
♦N为应试总人数的27%。
区分度反映试题区分不同水平受试者的程度,即考出学生的不同水平,把优秀、一般、差三个层次的学生真正分别开。
区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
如果把成绩从高往低排序,前50%的考生为高分组,后50%为低分组,其计算公式为:
D=2(X H—X L)/W
其中,D为区分度,X H为高分组平均分,X L为低分组平均分,W 为试卷总分(一般为100分)。
(三)现代学生评价制度的基本特征
♦1、学生评价的功能重点逐步从总结性功能向形成性功能转移;
♦2、评价内容从对学生的认知评价扩展为对学生全面综合性的评价;
♦3、学生在评价过程中由被动等待评价向主动参与评价发展;
♦4、学生评价从关注结果向重视过程发展;
♦5、在评价方法上,从仅强调测验分数向评价方法的主体、综合、多层次、全方位发展。
附:
试卷评估等级指标
注:仅供参考。