试卷效度等

合集下载

【最新精选】试题的难度、区分度、信度和效度

【最新精选】试题的难度、区分度、信度和效度

试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。

一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。

客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。

试卷难度计算公式:P=为平均分,K 为试卷满分值。

易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。

一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。

(二)难度的计算(1)客观性试卷难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试卷难度P计算公式:P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:P=(P H+P L)/2(P H、P L分别为试卷针对高分组和低分组考生的难度值)步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。

(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。

一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题。

命题时难度一般要按一定比例分配,如3:6:1或3:5:2。

二.试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。

区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。

区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。

试题设计的五个标准分别是:效度,信度,区分度,实用性,

试题设计的五个标准分别是:效度,信度,区分度,实用性,

试题设计的五个标准分别是:效度,信度,区分度,实用性,及影响。

一.效度是指测量的有效性,也就是看考试是否考查了想要考查的内容。

二.信度是指考试结果准确,稳定,可靠的程度。

这要求有不同的评卷人阅卷,所得分数大致相同;同一评卷人在不同的时间阅卷,分数大致相同。

三.区分度就是可以进行比较。

四.实用性是指要便于使用。

试题清晰,醒目,措辞简洁,避免拼法错误或遗漏,尽量少涉及各种器材设备。

五.影响分为积极和消极两种。

积极影响:帮助学生发现问题,积极督促。

消极影响:会造成考什么学什么的结果。

试题要体现新一轮基础教育课程改革的基本理念,落实《英语课程标准》所确立的考试指导思想。

考试要有利于全面贯彻国家教育方针,推进素质教育;有利于体现九年义务教育的性质,全面提高教育质量;有利于英语课程改革,提高英语教学质量, 培养学生的创新精神和实践能力,减轻学生过重的课业负担,促进学生生动活泼、主动学习。

英语试题要落实知识与能力、过程与方法、情感态度与价值观三维课程目标,要依据《英语课程标准》来确定考查内容和标准,既重视考查学生对英语基础知识与基本技能的掌握情况,更重视考查学生在具体情境中综合运用语言的能力,考试内容不应与任何教材的具体内容直接挂钩。

在试卷设计上要遵循教育测量的基本原理,坚持以交际语言测试为主,分离测试、综合测试等多种测试并存,力求在语篇层次上,在尽可能真实情景中,以互动的形式测试学生的综合语言运用能力;不仅要关注试卷信度,更要注重试卷的效度;在力求试卷结构简约的同时,确保考查内容的覆盖面,杜绝繁、偏、旧试题,科学控制题量和难度。

要坚持“以能力立意为主、知识立意为辅”的原则,根据语言实际使用情形命题,适当增大主观性、开放性试题的比重,尽可能避免命制以词或句为语言单位的试题,不应在脱离语境的情况下单独考查微观语言知识。

在选择语言素材时,要充分考虑学生的实际生活和身心发展水平、地域以及文化差异,选用真实、地道、形式多样的语言素材。

试卷分析:信度、效度、难度和区分度

试卷分析:信度、效度、难度和区分度

附件6、难度、区分度、信度和效度的一般说明一、难度难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。

一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。

1、难度的两种定义(1)P=1-x/w其中:x为某题得分的平均分数,w为该题的满分。

这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。

(2)P=x/w这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。

2、难度的计算(1)主观性试题的难度A、基本公式法:P=1-x/wB、极端分组法P=1-(XH+XL)/2W其中:XH为高分组的平均得分(前27%),XL为低分组的平均得分(后27%)。

(2)客观性试题的难度A、基本公式法:P=1-R/N其中:R为答对人数,N为全体人数。

B 极端分组法:P=1-(PH+PL)/2其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n为总人数的前27%。

PL=RL/n 叫低分组通过率,RL为低分组答对人数。

二、区分度区分度是区分应试者能力水平高低的指标。

试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分。

而区分度低则反映不出不同应试者的水平差异。

试题的区分度与试题的难度直接相关。

通常来说,中等难度的试题区分度较大。

另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。

1、区分度指标的评价-1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。

一般认为,区分度指数高于0.3,试题便可以被接受。

2、区分度的计算方法(1)基本公式法:D=(H-L)/N其中:D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和。

试卷效度等

试卷效度等

与试题编制相关的概念----难度系数、区分度、信度与效度教研之窗2008-03-14 11:25:00阅读21 评论0 字号:大中小订阅一、试题的难度:试题的难度指的是试题的难易程度。

试卷的难度指的是试题的平均难度。

难度系数计算方法:1、客观试题难度系数计算方法(二分法计分题目的难度):P=R/N,其中P为难度系数,R为答对人数,N为总人数。

2、主观性试题的难度系数计算方法(非二分法计分题目的难度):难度系数=平均分/总分。

中考试题平均难度系数:0.55~0.60之间,不能超过0.79。

二、试题的区分度:试题的区分度是指题目对考生实际水平的区分程度。

区分度高的题目,能够较好地区分学生的实际水平。

在这样的题目上,能力高的学生得高分,能力低的学生得低分。

区分度低的题目,不同能力的学生得分差别不大。

如果在某些题目上,能力高的学生得低分,能力低的学生得高分,那么这样的题目非但没有区分度,反而干扰了整个试卷的有效性和可靠性。

区分度主要用与评价以选择为目的的试题。

用于评价学业成就的试题则无需考虑区分度,即使区分度很低,只要教育者认为是重要的内容也可以选用。

对于学业考试,并不是所有的题都要求有区分度。

需要对学生能力鉴别的题目才需要有区分度。

鉴别率指数:鉴别率指数是高分组的通过率与低分组的通过率的差值。

D值越高,区分度越大。

-1≤D≤1,当D=1时,说明高分组的同学100%通过,低分组的同学通过率为0.当D=0时,高分组好低分组的学生通过率相同,试题没有区分度。

一般情况下,试题的区分度D值大于0.3时,题目可以接受了。

高低分数组的划分:一般情况下,根据试卷总分将考生排队,从高分端好低分端分别取27%的考生组成高分组好低分组,其余46%的考生不作分析。

当样本团体过小时,划分的比例可以适当提高。

三. 信度是指其可信度,既是在多大程度上是正确的,效度是指能够多有效的表示所需表达的含义。

以一份量表(测量智力,记忆力之类的标准化试卷)为例,其信度就是指同一个人在几次参加同一份试卷的考试(假设此人并未有改变)分数不会有大的差异,而效度是指这份试卷能够多大程度测量你的智力水平。

试卷效度等

试卷效度等

与试题编制相关的概念----难度系数、区分度、信度与效度教研之窗 2008-03-14 11:25:00 阅读21 评论0 字号:大中小订阅一、试题的难度:试题的难度指的是试题的难易程度。

试卷的难度指的是试题的平均难度。

难度系数计算方法:1、客观试题难度系数计算方法(二分法计分题目的难度):P=R/N,其中P为难度系数,R为答对人数,N为总人数。

2、主观性试题的难度系数计算方法(非二分法计分题目的难度):难度系数=平均分/总分。

中考试题平均难度系数:0.55~0.60之间,不能超过0.79。

二、试题的区分度:试题的区分度是指题目对考生实际水平的区分程度。

区分度高的题目,能够较好地区分学生的实际水平。

在这样的题目上,能力高的学生得高分,能力低的学生得低分。

区分度低的题目,不同能力的学生得分差别不大。

如果在某些题目上,能力高的学生得低分,能力低的学生得高分,那么这样的题目非但没有区分度,反而干扰了整个试卷的有效性和可靠性。

区分度主要用与评价以选择为目的的试题。

用于评价学业成就的试题则无需考虑区分度,即使区分度很低,只要教育者认为是重要的内容也可以选用。

对于学业考试,并不是所有的题都要求有区分度。

需要对学生能力鉴别的题目才需要有区分度。

鉴别率指数:鉴别率指数是高分组的通过率与低分组的通过率的差值。

D值越高,区分度越大。

-1≤D≤ 1,当D=1时,说明高分组的同学100%通过,低分组的同学通过率为0.当D=0时,高分组好低分组的学生通过率相同,试题没有区分度。

一般情况下,试题的区分度D值大于0.3时,题目可以接受了。

高低分数组的划分:一般情况下,根据试卷总分将考生排队,从高分端好低分端分别取27%的考生组成高分组好低分组,其余46%的考生不作分析。

当样本团体过小时,划分的比例可以适当提高。

三. 信度是指其可信度,既是在多大程度上是正确的,效度是指能够多有效的表示所需表达的含义。

以一份量表(测量智力,记忆力之类的标准化试卷)为例,其信度就是指同一个人在几次参加同一份试卷的考试(假设此人并未有改变)分数不会有大的差异,而效度是指这份试卷能够多大程度测量你的智力水平。

期末试卷分析报告(含信度、效度、难度、区分度)

期末试卷分析报告(含信度、效度、难度、区分度)

期末试卷分析报告(含信度、效度、难度、区分度)本次学年末五年级数学考试使用了乌市教研室统一命题,全市统一监考、阅卷的方式。

试卷包含了判断题、选择题、填空题、计算题和解决问题等五个部分。

总体来说,学生的检测成绩属于正常水平,班级之间的差别不大,但也存在许多问题。

学生的基础概念掌握情况不够扎实,失分率相对较高,个别学生读题不够仔细。

对于一些稍微灵活和比较灵活的知识点,学生失分则相对较多。

数据统计表一按低中高不同分数段划分,表二则是按题型划分。

从表一可以看出,总体上学生的成绩比较平均,但也有一些人成绩较低。

从表二可以看出,学生在判断、选择和填空题方面表现较好,但在计算和解决问题方面存在较多问题。

具体分析中,判断、选择、填空题部分学生完成情况较为理想,但仍有一些错误。

而在计算和解决问题部分,学生的失分率较高,主要集中在计算和规范答题的问题上。

对于解决问题部分,大部分学生的失分较少,但在处理稍微灵活和比较灵活的知识点时,学生失分则相对较多。

例如,对于“第三题有一张长方形的纸,长70厘米,宽50厘米。

如果要剪成同样大小的正方形而没有剩余,剪出的正方形的边长最大是多少”这道题,学生缺乏全面思考的能力,不能够灵活处理,给自己的解答造成了一定的困扰。

总之,本次考试中,学生的基础概念掌握情况需要加强,口算能力也需要提高。

在解决问题方面,学生需要加强对知识点的理解,提高思维灵活性。

中发现问题,思考解决方法,培养创新思维。

6、加强家校合作,让家长了解学生的研究情况,及时与教师沟通,共同关注学生的研究进展。

7、在教学中注重基础概念的讲解和理解,通过例题和练巩固学生对基础概念的掌握,提高学生的严谨性和扩展性。

8、在考试中加强监考,严格执行考试纪律,防止作弊和抄袭现象的发生,保证考试的公平性和公正性。

9、在日常教学中,注重培养学生的研究惯和思维惯,引导学生形成良好的研究态度和惯,为学生的未来发展打下坚实的基础。

在教育中,我们需要引导学生发现问题、提出问题并解决问题,以提高他们的思考能力和培养创新精神。

考卷效度等

考卷效度等

考卷效度等文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]与试题编制相关的概念----难度系数、区分度、信度与效度教研之窗 2008-03-14 11:25:00 阅读21 评论0 字号:大中小订阅一、试题的难度:试题的难度指的是试题的难易程度。

试卷的难度指的是试题的平均难度。

难度系数计算方法:1、客观试题难度系数计算方法(二分法计分题目的难度):P=R/N,其中P为难度系数,R为答对人数,N为总人数。

2、主观性试题的难度系数计算方法(非二分法计分题目的难度):难度系数=平均分/总分。

中考试题平均难度系数:~之间,不能超过。

二、试题的区分度:试题的区分度是指题目对考生实际水平的区分程度。

区分度高的题目,能够较好地区分学生的实际水平。

在这样的题目上,能力高的学生得高分,能力低的学生得低分。

区分度低的题目,不同能力的学生得分差别不大。

如果在某些题目上,能力高的学生得低分,能力低的学生得高分,那么这样的题目非但没有区分度,反而干扰了整个试卷的有效性和可靠性。

区分度主要用与评价以选择为目的的试题。

用于评价学业成就的试题则无需考虑区分度,即使区分度很低,只要教育者认为是重要的内容也可以选用。

对于学业考试,并不是所有的题都要求有区分度。

需要对学生能力鉴别的题目才需要有区分度。

鉴别率指数:鉴别率指数是高分组的通过率与低分组的通过率的差值。

D值越高,区分度越大。

-1≤D≤ 1,当D=1时,说明高分组的同学100%通过,低分组的同学通过率为0.当D=0时,高分组好低分组的学生通过率相同,试题没有区分度。

一般情况下,试题的区分度D值大于时,题目可以接受了。

高低分数组的划分:一般情况下,根据试卷总分将考生排队,从高分端好低分端分别取27%的考生组成高分组好低分组,其余46%的考生不作分析。

当样本团体过小时,划分的比例可以适当提高。

三. 信度是指其可信度,既是在多大程度上是正确的,效度是指能够多有效的表示所需表达的含义。

试卷效度等

试卷效度等

与试题编制相关的概念----难度系数、区分度、信度与效度教研之窗2008-03-1411:25:00阅读21评论0字号:大中小订阅一、试题的难度:试题的难度指的是试题的难易程度。

试卷的难度指的是试题的平均难度。

难度系数计算方法:1、客观试题难度系数计算方法(二分法计分题目的难度):P=R/N,其中P为难度系数,R为答对人数,N为总人数。

2、主观性试题的难度系数计算方法(非二分法计分题目的难度):难度系数=平均分/总分。

中考试题平均难度系数:0.55~0.60之间,不能超过0.79。

二、试题的区分度:试题的区分度是指题目对考生实际水平的区分程度。

区分度高的题目,能够较好地区分学生的实际水平。

在这样的题目上,能力高的学生得高分,能力低的学生得低分。

区分度低的题目,不同能力的学生得分差别不大。

如果在某些题目上,能力高的学生得低分,能力低的学生得高分,那么这样的题目非但没有区分度,反而干扰了整个试卷的有效性和可靠性。

区分度主要用与评价以选择为目的的试题。

用于评价学业成就的试题则无需考虑区分度,即使区分度很低,只要教育者认为是重要的内容也可以选用。

对于学业考试,并不是所有的题都要求有区分度。

需要对学生能力鉴别的题目才需要有区分度。

鉴别率指数:鉴别率指数是高分组的通过率与低分组的通过率的差值。

D值越高,区分度越大。

-1≤D≤ 1,当D=1时,说明高分组的同学100%通过,低分组的同学通过率为0.当D=0时,高分组好低分组的学生通过率相同,试题没有区分度。

一般情况下,试题的区分度D值大于0.3时,题目可以接受了。

高低分数组的划分:一般情况下,根据试卷总分将考生排队,从高分端好低分端分别取27%的考生组成高分组好低分组,其余46%的考生不作分析。

当样本团体过小时,划分的比例可以适当提高。

三. 信度是指其可信度,既是在多大程度上是正确的,效度是指能够多有效的表示所需表达的含义。

以一份量表(测量智力,记忆力之类的标准化试卷)为例,其信度就是指同一个人在几次参加同一份试卷的考试(假设此人并未有改变)分数不会有大的差异,而效度是指这份试卷能够多大程度测量你的智力水平。

考试成绩评价的区分度、信度、效度等概念

考试成绩评价的区分度、信度、效度等概念

目录考试成绩评价的区分度、信度、效度等概念 (1)高一化学备课组 2009.3.26 (4)考试成绩评价的区分度、信度、效度等概念1、试卷的区分度试卷的区分度指测试题目对被测试者实际水平的区分能力。

区分度高的试题,能将不同水平的被试者区分开来;区分度低的试题则对被试者水平不能很好地鉴别。

区分度是指试题对被试者情况的分辨能力的大小。

一般在-1~+1之间,值越大区分度越好。

试题的区分度在0.4以上表明此题的区分度很好,0.3 ~0.39表明此题的区分度较好,0.2 ~0.29表明此题的区分度不太好需修改,0.19以下表明此题的区分度不好应淘汰。

计算区分度的方法很多,特别需要注意的是对同一个试题的考试成绩采用不同的方法所得到的区分度的值是不同的。

我们可以使用下面的两种方法计算区分度:(1)先将分数排序,P1=27﹪高分组的难度,P2= 27﹪低分组的难度区分度D =P1-P2或区分度 D = (27﹪高分组的平均分-27﹪低分组的平均分)?/font>满分值(2)利用积差系数r 计算区分度D当两个变量都是正态连续变量,而且两者之间呈线性关系,表示这两个变量之间的相关成为积差相关。

积差相关的使用条件a、两个变量都是由测量获得的连续性数据。

如百分制分数。

b、两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称的分布。

c、必须是成对的数据,而且每对数据之间是相互独立的。

d 、两个变量之间呈线性关系。

积差相关系数r的计算在计算机上是很容易进行的。

积差相关系数r的公式如下:r=(无法显示)原谅!2、试卷的信度试卷的信度主要从两个方面进行分析,一方面是考试成绩期望值与实际成绩平均值的差异,考试成绩期望值一般应以平时成绩的平均值为依据确定.另一方面是考试成绩的预期及格率与实际及格率的差异,考试成绩及格率的预期值同样以平时成绩的及格率为确定依据.两个方面的差异性较小,说明试卷信度较高.考试信度,简单地说是考试结果的可信程度,是推测考试可信与否的最重要的量化指标。

试卷的难度、区分度、信度与效度

试卷的难度、区分度、信度与效度

5
试卷的效度
效度是指考试有效性或正确性的质量指标,即是否考了要考的内容,试卷难度、区分度是否适宜, 考试最终是否达到了它的预定目的等。
测试效度(test validity)亦称测试的有效性,指一套测试对应该测试的内容所测的程度。也就是 说,一套测试是否达到了它预定的目的以及是否测量了它要测量的内容。
3
试卷的信度
信度是指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得测验分数的一致 性和稳定性程度。信度除了要说明成绩的真实性之外,还要说明题目涉及的内容与教学的相关程度。 信度系数愈高即表示该测验的结果愈一致、稳定与可靠。
常用Cronbach’s alpha系数:
Cronbach ' s
内容效度(content validity)
经验效度(empirical validity)
指测试卷是否测试了应该测试的内容或者说所测试的内容是 否反映了测试的要求,即测试的代表性和覆盖面的程度。
经验效度是一种衡量测试有效性的量度,通过把一次测试与 一个或多个标准尺度相对照而得出
D vH vL SDp
题型
计算公式
单个选择题区分度
D=2(高分组平均分-低分组平均)平均分)/试卷总分
注:前27%为高分组,后27%为低分组; 区分度(D)的取值范围介于-1.00至+1.00之间。通常D为正值,称为积极区分;D为负值称为消极区分;
D值为0称为无区分作用。具有积极区分作用的试卷,其D值越大,区分的效果越好。
题型 客观题 主观题
整份试卷
计算公式
P=试卷答对人数/考生数 P=试卷平均得分/满分
P=(高分组难度值+低分组难度值)/2 注:前27%为高分组,后 27%为低分组

试卷分析:信度、效度、难度和区分度

试卷分析:信度、效度、难度和区分度

试卷分析:信度、效度、难度和区分度附件6、难度、区分度、信度和效度的一般说明一、难度难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。

一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。

1、难度的两种定义1)P=1-x/w其中:x为某题得分的平均分数,w为该题的满分。

这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为,最大值为1.2)P=x/w这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为,最大值为1.2、难度的计算1)主观性试题的难度A、基本公式法:P=1-x/wB、极端分组法P=1-(XH+XL)/2W其中:XH为高分组的平均得分(前27%),XL为低分组的平均得分(后27%)。

2)客观性试题的难度A、基本公式法:P=1-R/N其中:R为答对人数,N为全体人数。

B极度分组法:P=1-(PH+PL)/2其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n为总人数的前27%。

PL=RL/n叫低分组通过率,RL为低分组答对人数。

二、区分度区分度是区分应试者本领水平高低的目标。

试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分。

而区分度低则反映不出不同应试者的水平差异。

试题的区分度与试题的难度直接相关。

通常来说,中等难度的试题区分度较大。

另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。

1、区分度指标的评价1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。

一般认为,区分度指数高于0.3,试题即可以被承受。

2、区分度的计算方法1)基本公式法:D=(H-L)/N其中:D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和。

试题的难度、区分度、信度和效度

试题的难度、区分度、信度和效度

试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。

一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。

客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。

试卷难度计算公式:P=为平均分,K 为试卷满分值。

易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。

一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。

(二)难度的计算(1)客观性试卷难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试卷难度P计算公式:P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:P=(PH +PL)/2(PH、PL分别为试卷针对高分组和低分组考生的难度值)步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。

(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。

一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题。

命题时难度一般要按一定比例分配,如3:6:1或3:5:2。

二.试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。

区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。

区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。

(二)区分度的计算1.单个选择题目区分度的计算将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。

试卷的效度名词解释

试卷的效度名词解释

试卷的效度名词解释试卷作为一种常见的评估工具,被广泛应用在学校教育和职业培训等领域。

然而,要确保试卷能够准确、公正地评估被测试者的能力和知识水平,就需要依靠有效的试卷效度。

试卷的效度是指试卷测量某个特定领域的程度,即试卷能否真实地反映被测者的相应能力或特征。

在本文中,我们将深入解释试卷的效度以及试卷效度的不同类型,以增进对此概念的理解。

一、内容效度内容效度是试卷效度的一种重要形式,主要关注试卷内容与被测试领域之间的关系。

内容效度要求试题必须涵盖被测试领域的核心知识和技能,以确保试卷具有足够的代表性和公正性。

例如,在一份测试学生英语水平的试卷中,如果试题仅涵盖了听力和口语方面的考察,而完全忽略了阅读和写作的能力,这份试卷就缺乏内容效度。

为了评估试卷的内容效度,可以采用专家评审、相关性分析、项目特征曲线分析等方法。

通过这些方法,我们可以确定试卷是否全面、准确地反映了被测试领域的核心内容。

二、表面效度表面效度是试卷效度的另一种形式,重点关注试卷的外观和被测者对试题的直观感受。

试卷的表面效度要求试题能够引起被测者的兴趣,并且与被测试领域的实际情境相吻合,以增加试卷的动机性和接受度。

例如,在一份测试驾驶技能的试卷中,如果试题设计得生动有趣,与实际驾驶场景相匹配,那么被测者更愿意参与测试并全力以赴完成试卷。

评估试卷的表面效度可以通过问卷调查、个别访谈以及被测者的反馈意见等方法。

这些方法可以从被测者的角度出发,了解他们对试题是否有足够的理解和认同。

三、预测效度预测效度指试卷对被测试者未来表现的预测能力。

例如,在招聘考试中,如果一份试卷能够很好地预测应聘者在工作岗位上的表现,那么它具有较高的预测效度。

预测效度是试卷效度中较为重要和有挑战性的一种形式,因为它需要长期观察和数据分析,才能确定试卷与被测试领域的关联程度。

评估试卷的预测效度可以采用追踪研究、对照组研究、据次分析等方法。

这些方法可以帮助我们了解试卷对被测试者未来表现的预测能力,并从数据中获取准确的信息。

试题设计的五个标准

试题设计的五个标准

试题设计的五个标准
(一)效度(validity)
效度就是测量的有效性,也就是看考试是否考查了想要考查的内容。

(二)信度(reliability)
信度指考试结果准确、稳定、可靠的程度。

要求由不同的评卷人阅卷,所得分数大致相同;同一个评卷人在不同时间阅卷,分数也大致相同。

(三)区分度(discrimination)
区分的目的主要是为了比较。

(四)实用性(practicality)
试题便于使用,试卷印制清晰醒目,措辞简洁、避免拼法错误或遗漏,尽量少涉及各种器材设备。

因为设备不一定处处都有,而且质量也不完全一样。

(五)影响(back-wash effect)
积极影响:发现问题,积极督促。

消极影响:考什么,学什么;不考就不学。

试题的难度、区分度、信度和效度

试题的难度、区分度、信度和效度

试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷‎的难易程度,是评价考试的‎一个非常重要‎的一个指标。

一个题目,如果大部分考‎生都能答对,那么这个题目‎的难度就小;如果大部分考‎生都不能答对‎,那么这个题目‎的难度就大。

客观题难度计‎算公式:P(难度指数)=试卷答对人数‎/考生人数;主观题难度计‎算公式:P=试卷平均得分‎/试卷满分。

试卷难度计算‎公式:P=为平均分,K 为试卷满分‎值。

易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。

一般来说,难度值平均在‎0.5最佳,难度值过高或‎过低,都会降低测验‎的信度。

(二)难度的计算(1)客观性试卷难‎度P(这时也称通过‎率)计算公式:P=k/N(k为答对该题‎的人数,N为参加测验‎的总人数)(2)主观性试卷难‎度P计算公式‎:P=X/M(X为试卷平均‎得分;M为试卷满分‎)(3)适用于主、客观试卷的计‎算公式:P=(P H+P L)/2(P H、PL分别为试‎卷针对高分组‎和低分组考生‎的难度值)步骤为:①将考生的总分‎由高至低排列‎;②从最高分开始‎向下取全部试‎卷的27%作为高分组;③从最低分开始‎向上取全部试‎卷的27%作为低分组;④计算。

(三)试卷难度的一‎般要求就高考来说,难度以适中为‎宜,单个试卷的难‎度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳‎。

一般将难度值‎大于和等于0‎.7的试卷定为‎容易题;大于0.4和小于0.7的定为中档‎题;小于和等于0‎.4的试卷定为‎难题。

命题时难度一‎般要按一定比‎例分配,如3:6:1或3:5:2。

二.试卷的区分度‎(一)什么是区分度‎区分度是指考‎试卷目对考生‎心理特征的区‎分能力。

区分度高的试‎卷能将不同水‎平的考生区分‎开来,水平高的考生‎得高分,水平低的考生‎得低分。

区分度高的考‎试,优秀、一般、差三个层次的‎学生都有一定‎比例,如果某一分数‎区间学生相对‎集中,高分太多或不‎及格太多的考‎试,区分度则低。

信度、效度、难度、区分度之间有何不同-

信度、效度、难度、区分度之间有何不同-

信度、效度、难度、区分度之间有何不同?衡量测验质量的四个指标,即信度、效度、难度、区分度,在考试中通常以客观题的形式出现,具体来说主要包括概念反选、例子反选题或判断题。

而一直以来由于知识内容有一定的相似性和关联度,考生们常常区分不清产生混淆。

因此,为了帮助考生们解决这一问题,我们就一同来梳理一下该知识点。

信度是指测验结果的稳定性或可靠性,即某一测验在多次进行后所得到的分数的稳定、一致程度。

它即包括在时间上的一致性,也包括内容和不同评分这之间的一致性。

如,在不同时间测两次相同的试卷,如果成绩基本相当,那么我们就认为测验的信度较高。

效度是指测量的正确性,即一个测验能够策略出其索要测量的东西的程度,也就是我们常说的准确度。

故而通常效度考虑的问题是:测验测量什么?测验对测量目标的策略精确性和真实性有多大?就一个测验的优劣而言,效度是一个比信度更为重要的指标。

如,我想测量初一年级的数学成绩,但是给他们做了一套小学四年纪的数学试卷,此时不能测量出我原本想要测量的东西,我们认为测验的效度不高。

难度是指测验包含的试题难易程度。

一般来说,难度可以用:“P(通过率)=通过人数/总人数”的公式来表示,可见P(通过率)值越低难度越大,两者间呈反比关系。

区分度是指测验对考生的不同水平能够区分的程度,即具有区分不同水平考生的能力。

如,一次测验之后,能够明确分清不同学生的水平,我们就认为该测验的区分度较高。

在我们明确了这四个指标的含义之后,我们会发现这四个指标都是用来衡量测验质量高低的,那么它们之间有没有什么关系呢?那当然是有的,四个指标之间既有联系又有区别,考生们既要能够区分有得了解他们之间的相互影响关系:首先是区别,重点在于信度与效度之间的区别,要明确信度是衡量测验的可信程度而非试题内容的质量,因而才会运用多次测验的方式;而效度是衡量测验的有效程度更加注重试题内容的有效性,是评价试题是否能达到预期效果。

因此,我们认为在衡量测验本身质量时,效度是比信度更重要的指标。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

与试题编制相关的概念----难度系数、区分度、信度与效度教研之窗2008-03-14 11:25:00 阅读21 评论0 字号:大中小订阅一、试题的难度:试题的难度指的是试题的难易程度。

试卷的难度指的是试题的平均难度。

难度系数计算方法:1、客观试题难度系数计算方法(二分法计分题目的难度):P=R/N,其中P为难度系数,R为答对人数,N为总人数。

2、主观性试题的难度系数计算方法(非二分法计分题目的难度):难度系数=平均分/总分。

中考试题平均难度系数:0.55~0.60之间,不能超过0.79。

二、试题的区分度:试题的区分度是指题目对考生实际水平的区分程度。

区分度高的题目,能够较好地区分学生的实际水平。

在这样的题目上,能力高的学生得高分,能力低的学生得低分。

区分度低的题目,不同能力的学生得分差别不大。

如果在某些题目上,能力高的学生得低分,能力低的学生得高分,那么这样的题目非但没有区分度,反而干扰了整个试卷的有效性和可靠性。

区分度主要用与评价以选择为目的的试题。

用于评价学业成就的试题则无需考虑区分度,即使区分度很低,只要教育者认为是重要的内容也可以选用。

对于学业考试,并不是所有的题都要求有区分度。

需要对学生能力鉴别的题目才需要有区分度。

鉴别率指数:鉴别率指数是高分组的通过率与低分组的通过率的差值。

D值越高,区分度越大。

-1≤D≤1,当D=1时,说明高分组的同学100%通过,低分组的同学通过率为0.当D=0时,高分组好低分组的学生通过率相同,试题没有区分度。

一般情况下,试题的区分度D值大于0.3时,题目可以接受了。

高低分数组的划分:一般情况下,根据试卷总分将考生排队,从高分端好低分端分别取27%的考生组成高分组好低分组,其余46%的考生不作分析。

当样本团体过小时,划分的比例可以适当提高。

三. 信度是指其可信度,既是在多大程度上是正确的,效度是指能够多有效的表示所需表达的含义。

以一份量表(测量智力,记忆力之类的标准化试卷)为例,其信度就是指同一个人在几次参加同一份试卷的考试(假设此人并未有改变)分数不会有大的差异,而效度是指这份试卷能够多大程度测量你的智力水平。

信度指的是测量结果的稳定性和可靠性。

由于一个人的知识和能力水平是相对稳定的,在相当一段时间内不会发生太大的变化,所以一份试卷若能够真实反映学生的知识和能力水平的话,那么考试结果也应该是稳定的。

信度高的试卷就好比一把尺子,只要操作方法得当,无论何时、何人去测量同一张桌子的高度,所得到的结果应该是基本一致的。

如果所用的是一种具有较大弹性的皮尺,则不同的人或同一个人在不同的时候去测同一张桌子的高度,其结果会有较大的差异。

所以,为避免试卷中出现此类误差,必须检验其信度。

四、效度试题的难度系数与区分度分析教研之窗2010-11-26 22:05:04 阅读35 评论1 字号:大中小订阅一、试题的难度分析:难度系数(P)=该题平均分/该题满分,P值越大,题目越容易,难度越低。

当考生的人数较多时,可以根据时间的总分分成三组:分数最高的27%为高分组,分数最低的27%为低分组,中间的46%为中间组。

例如:某同学想用一只开关控制两只灯泡,要求开关闭合时,只有一只灯泡发光,断开开关时两只灯泡均发光,则下面的电路图正确的是(B)组别各选项选择百分数(%)A B C D总体7 80 2 11高分组0 100 0 0低分组7 57 4 32该组有80%的人通过,表明这道题目偏容易(难度系数为0.8),选项分析的结果表明,对正确选项B,高分组的选择率为100%,低分组的选择率与高分组有一定的差距;而且对D 选项,高分组每人选,而低分组有32%的人选择,说明D选项对低分组的学生很有迷惑性,对高分组不具有迷惑性。

总体来看,该题是可以接受的,如果能对C选项进行适当的修改提高试题的迷惑性的话,该题更有效。

二、试题的区分度:主要用于评价以选拔为目的的考题。

鉴别力指数:D=高分组通过率(PH)-低分组通过率(PL)。

D值越高,题目越有效。

鉴别力指数高于0.4以上区分度很好,0.3~0.39良好。

0.2~0.29,尚可,须改进。

小于0.2区分度很差。

下面的例子说明如何对题目进行区分度分析:按照提示,填出课文原文:1、开发大西北,我们实施了退耕还林、退耕还草的绿色生态战略。

可以料想,不久的将来,古人吟唱的“_____,______,_____________”的良好生态环境必将在大西北重现。

(用《敕勒歌》中词句填写)2、美国大唱所谓的“人权”,其实是_______________,目的在于干涉他国内政。

(用《醉翁亭记》中的一句话填写)区分度结果分析上面两个小题的区分度(鉴别力指数)都达到了非常优良的水平,能够很好地对不同能力的考生进行区分。

难度与区分度、信度、效度浏览量:15277 发表日期: 2008-3-7 来自: 市教育局办公室【字体:大中小】平均分(mean)表示考试分数的集中趋势的一种统计量,也是教育测量中使用最为广泛的一种统计指标。

平均分一般计算公式:(公式01)式中,为平均分;为学生I的考试分数;N为参加考试的学生数。

平均分的基本作用在于它可以作为一组分数的典型代表,其代表性优于中数、众数。

平均分数具有下列基本性质:平均分是由全部分数求出的。

●每个分数与平均分的离差之和等于零,说明平均分数是各个分数的中心。

●当分数分布呈正态时,平均分位于分布曲线的中点并和曲线的最高点相对应。

●各个分数与平均分数的离差的平方和比各个分数与其他任何集中量数的离差的平方和都小。

难度(difficulty)难度与区分度、信度、效度并称为“考试四度”,是控制考试质量的一个重要指标,也是试卷编制中特别关注的一个要素。

难度又有试题难度和考试难度之分,前者是反映题目难易程度的量化指标,有时也称作试题难度系数,通常用该题目的答对率或平均得分率表示,而后者则是所有试题难易的综合反映,在考试分数控制、成绩解释上更为重要。

●试题难度试题难度值与试题实际难易程度正好相反,越大表示试题越容易,而难度制越小则试题越难。

试题越难(试题难度值越小),说明能够正确解答该题的学生越少,或该题的得分越低。

主观题(答对得分、答错不得分)的试题难度用答对题目的人数与参加考试总人数的比值表示:(公式02)式中:为i试题难度,为答对该题人数,为总人数。

而试题使用连续分数计分时,试题难度则用参加考试的全体学生在该题的平均得分与该题满分的比值表示:(公式03)式中:为i试题难度,为该题平均得分,为该题满分值。

在试卷编制中,不同难度的试题在考试中扮演着不同的角色,不同难度试题的组和不但直接影响试卷难度和平均分数,进而影响对考生成绩的解释,还对成绩分布具有重要影响,从而影响考试深层的质量特性。

为了确保每一道试题在考试中发挥应有的作用,一般将试题难度值控制在一定的范围内,通常是在0.50.2之间。

考试难度又称试卷平均难度或加权试卷平均难度,其计算公式:(公式04)式中:P为考试难度,为i题的加权系数,为i题的试题难度。

因为, ,可以证明:(公式05)因此,计算考试平均分数后,可以通过上式方便地算出考试难度。

标准差(standard)它是描述一组分数离散情况的最常用、最可靠的统计量数,标准查核平均分一样,也是计算其他统计量数时常用的基本数据之一。

计算公式:(公式06)式中各符号与公式01意义相同。

利用标准差对试题质量进行初步评价时,主要是看学生考试分数的离散情况是否与学生以往学习成绩的实际分布一致。

如果学生学习成绩比较整齐,考试结果分数分布应相对集中,此时分数的标准差较小才符合学生的实际情况;相反,如果学生成绩参差不齐,考试分数的标准差较大才符合学生的实际情况。

只有当标准差表明的考试分数的离散情况与被测学生群体的实际情况一致时,试题质量才有可能是合格的。

区分度(discrimination)测量理论对考试的区分度十分重视,称之为判断考试是否有效的指示器,并作为评价试题质量、对试题进行筛选的主要依据。

●区分度概念指考试对学业水平不同的学生区分程度或鉴别能力。

某一道试题在学业水平、实际能力较高的学生都能答对,而学业水平、实际能力较低的学生都答错,则认为该题目有好的区分度(试题区分度)。

具有良好区分度的试题组成的试卷,实际水平高的学生应该能够获得较好的成绩,实际水平低的学生应该不能通过获得分较低。

研究发现:当考试是以选拔为主要目的时,具备良好的区分度的考试才会满足考试效度要求;考试的信度随考试区分度的提高而增加,且前者的增加速率更快;试题的难度与区分度关系密切,在难度接近于0.5时,区分度量值接近最大,但区分度相同的考试其难度值可能不同。

在编制是卷时,难度小的试题主要区分低分组学生,难度大的试题区分高分组学生,为适应对全部参考学生都能区分,需要对试卷中全部试题的难度、区分度做综合考虑。

试题区分度与试题难度一样,属于试题库建设题目优化的控制指标,本文仅提及而不做讨论。

●区分度计算最常用的计算方法是极端分组法,该方法计算简单,适合一般考试的总体区分度分析。

该方法是通过比较两个极端效标组(高分组和低分组)的差异来估计试题区分度的。

计算如下:(公式07)式中,为区分度,和分别为高分组、低分组学生的平均得分,M为该次考的满分值。

高分组和低分组的划分是将考试学生的成绩由高到低的顺序依次排序,然后取其上端一部分为高分组,取其下端一部分为低分组。

对于极端分组的人数应占全部被测学生多大比例要视成绩分布的具体情况而定,如果考试成绩分布符合正态分布,则高分组和低分组最佳比例均为27%;如果考试成绩分布较平坦则比例应略高于27%;反之比例可低一些;一般情况下,其比例值介于25%—33%之间。

●测量结果的评价使用上述算法,通常考试区分度数值应大于0.2。

考试信度(reliability)评价考试结果的稳定性是用考试信度(或测验信度)估计的。

由于任何考试结果都因考试误差的客观存在而受到或多或少的影响,因此百分之百可信的考试几乎无法得到。

考试信度就是推测考试可信与否的最重要量化指标。

实际测量中多采用分半信度和同质性信度两种算法。

●分半信度采用分半法(split-half reliability)考试信度是将考试施测于某被试总体,然后将考试分半,再求被试在每一半考试上的分数的一致性程度。

具体方法是将奇数题组成一个部分,偶数题构成奇数题的复本。

计算两半考试得分的皮尔逊相关系数(Pearson’s product moment correlation)(公式08),再采用Spearman-brown公式(公式09)矫正。

(公式08)(公式09)为皮尔逊相关系数(又称为分半信度),为矫正后的信度估计值,为配对后某对奇数题、偶数题得分值,为成对试题数目。

相关文档
最新文档