难度与区分度分析 42页PPT文档

合集下载

教育测量与评价的质量特性 难度与区分度课件

教育测量与评价的质量特性 难度与区分度课件

PPT学习交流
19

需进行显著性检验,才能确定其是否具有显著性意义
(1)对点双列相关公式中的 和 进行差异显著性检验,若差异显著, 表明 显著; (2)采用积差相关系数显著性检验的方法进行检验; (3)如果样本量较大(n>50),也可用下面近似方法:
, 认为 在0.05水平上显著;
,认为 在0.01水平上显著。
答对该题目的人数 被试人数
PPT学习交流
3
• 多值记分题的难度值计算
某题的平均得分 该题的满分
PPT学习交流
4
练习
• 题1:在100个学生中,答对第一题的30人,答 对第二题的60人,求第一、二道题的难度?比 较这两道题谁比谁难?
• 题2:某道论述题满分12分,所有考生在这道题 上的平均得分为3.6分,求该题的难度?
6
练习
题5:某区域1000人参加考试,试卷第一题高分组 180人答对,低分组60人答对,求该题难度?
如果该题满分为10分,高分组得分总数为2100分交流
7
二、难度指标的等距变换
• 运用标准分数(Z分数)作为题目难度的指标
PPT学习交流
8
例:某校学生在一次测验中,第一题的答对率为 15%,第二题的答对率为25%,第三题的答对率为 35%,假定这三题所测量的能力近似正态分布,问
信度
0.00 0.42 0.63 0.84 0.915 0.949
要达到理想的测验信度,提高区分度是一个好办法
PPT学习交流
16
难度
1.00 .90 .70 .50 .30 .10 .00
区分度的最大值
.00 .20 .60 1.00 .60 .20 00
难度适中,可使区分度达到最大值

难度与区分度分析

难度与区分度分析

2、内部一致性系数
区分度的实质是试题得分与总分的相 关,因此,用相关系数表示区分度。
(1)点二列相关系数
①条件:适用于一类变量属二分称名变量
,另一类变量属连续变量。
pq ② rpb
Xp Xq .
St
③对用点二列相关计算出的数值需进行显著性检验 ,才能确定其意义。
r 其一,可以用 XP和 Xq进行差异显著性检验;
CP = (kP 1) (k 1)
k表示每个测题中可供选择的答案数目
例题:10名学生参加一个测验,有一道 题是五选一的选择题,有6人答对,请计算 这道题校正后的难度系数。
P=R/N=0.6,CP=(kP-1)/(k-1)=0.5
(2)主观性试题:得分率
①P= X Xmax
②适用范围:填空题、简答题、论述题、 计算题、作文题等。
3、标准参照测验:教师应该依据教材内容和实际 教学情况来命题或选题。
(四)难度对测验分数分布形态的影响
正偏态——难度值越接近0,测验 分数越集中于低分端;
负偏态——难度值越接近1,测验 分数越集中于高分端;
若测验的难度适当,则测验分数的 分布 正态分布;
(五)基于难度的题目分析
1、难度过低与过高的题目,原则上要淘 汰,但属于必考的知识点,需重新命题, 提高命题的难度;
(二)计算 1、以全体被试得分率为难度系数
(1)客观性试题:通过率 P=R/N
适用题型:选择题、判断题等。
例题:在100个学生中,答对第一题的30人, 答对第二题的60人,这两试题的难度值分别为:
P1
30 100
0.30
P2
60 100
0.60
难度值越小,试题越有难做;难度值越大, 试题越容易。

2.3难度和区分度

2.3难度和区分度

第三节难度和区分度一个测验的信度和效度在很大程度上取决于该测验的题目参数(难度和区分度),编制和筛选具有适当参数的题目是改善测验信度和效度的前提。

在通常情况下只要讨论常模参照测验中题目的难度和区分度。

一、难度受测团体中被试者在答案范围内回答题目的程度称为难度。

一般用难度指数p表示题目的难度。

1.题目难度的计算当题目的评分为多值时,受测者的得分可能是x(x=1,2,…,n,n为该题满分数)。

所谓难度指数(有时也称得分率),就是该题平由此可见,平均分越高,p值越大,题目的难度越小;平均分越低,p值越小,题目的难度越大。

当题目为二值评分(即0、1评分)时,上式可变形为其中,N是答题人数,R是答对人数。

这种难度指数也称为通过率,一般用于是非题或多项选择题。

由通过率可知,答对人数越多,p值越大,题目的难度越小;答对人数越少,p值越小,题目的难度越大。

形式为多选一的选择题有多个可能的答案供受测者选择。

选择正确答案的人数可能会受猜测机遇的影响,可供选择的答案越少,这种机遇的影响就越大。

对此,可以用公式对难度指数p进行校正。

其中,C是校正后的难度指数,p是校正前的难度指数,k是每个p题目可供选择的答案数。

2.题目难度的等距量表在进行测量时,用来表示一些对象和事件的某些特征的指标称作量表。

根据不同的单位和参照点,从低级到高级,从模糊到精确,可以用不同的量表表示。

用平均得分比率或答对人数比率表示难度,仅说明事物含有某种属性的多少,它是无相等单位,不具有等距性和可加性的顺序量表。

这种量表只能表示事物间的大小、次序关系,不能反映两个比率间的数量差异。

我们可以把这种量表转换成不仅有大小关系,而且有相等单位和规定参照点的等距量表,使其能表示题目之间难度差异的大小。

美国教育测验服务处(ETS)采用的难度指数为Δ=13+4Z,其中,Δ是正态化的等距难度指数,13是平均数,4是标准差,Z是标准正态曲线下的面积(即p值)所对应的值。

信度效度难度区分度分析

信度效度难度区分度分析

信度效度难度区分度分析在教育测量和评估领域,信度、效度、难度和区分度是四个非常重要的概念。

它们对于衡量测试的质量、评估学生的学习成果以及改进教学方法都具有至关重要的意义。

接下来,让我们逐一深入探讨这四个概念。

信度,简单来说,就是指测试结果的稳定性和可靠性。

如果我们对同一批学生在相同的条件下进行多次相同的测试,得到的结果应该是相近的。

就好比用同一把尺子去测量一个物体的长度,每次测量的结果都应该差不多。

信度主要包括重测信度、复本信度和内部一致性信度等。

重测信度是在不同时间对同一批被试进行重复测量。

比如,今天对一群学生进行了一次数学测验,一周后再用相同的测验对他们进行测试,如果两次测试的成绩相近,说明这个测验的重测信度较好。

然而,重测可能会受到记忆、练习等因素的影响。

复本信度则是使用两个平行的测验(即内容、形式、难度等方面都相似)对同一批被试进行测量。

如果两个测验的结果一致性高,就表明复本信度良好。

但要编制两个高质量的平行测验并非易事。

内部一致性信度通常通过计算测验内部各个项目之间的相关程度来衡量。

例如,一份试卷中的各个题目,如果它们在测量同一个知识点或能力方面表现出较高的一致性,那么这份试卷的内部一致性信度就比较高。

常用的计算方法有克朗巴赫α系数等。

效度是指测试能够准确测量出所要测量的东西的程度。

好比射箭要射中靶心,测验也要准确测量到我们期望测量的内容。

效度主要包括内容效度、结构效度和效标关联效度。

内容效度关注的是测验内容是否涵盖了所要考查的知识和技能范围。

比如,一场语文考试如果能够全面考查学生的字词、语法、阅读理解和写作能力,那么它在内容效度方面就表现较好。

为了确保内容效度,出题者需要对教学大纲和课程目标有清晰的理解。

结构效度考察的是测验是否能够反映出所假设的理论结构或心理特质。

比如,一个智力测验是否真正测量了智力的各个方面,而不仅仅是某些表面的表现。

这需要通过复杂的统计分析和理论研究来验证。

效标关联效度则是将测验结果与一个外在的标准进行比较。

难度和区分度

难度和区分度

难度和区分度以便考后对试题质量进行分析。

要求填写客观准确。

这样组卷的优点不仅在于对考题的能力有卷时发给同学填写。

填写时,让学生了解表2,所要求,避免了选题盲目性和随意性,更重要的即清楚试卷的能力分布。

然后填人自己解答情是它作为教学过程一个重要的窗口,可以有效况(详见表3说明)。

填此表的过程,也是学生地对教学进行监控。

自我能力了解的一个过程。

表3是学生数学试卷能力调查表,教师评在教育改革浪潮强有力的撞击下,必须进行改革!1999年的高考命题变知识立意为能力立意。

从考后综合情况分析,是一次成功的实践。

首先,它突出了能力的考查。

比如:第(1)题考查观察抽象、概括能力,第(5)题考查推理能力,第(18)题考查符号语言的转换能力,很多题目对创新意识、概括、推理以及语言转换进行考核,从结构上看,完全体现了能力体系。

就是(22)题应用题,也充分注重了阅读理解,分析提取,变实际问题为数学语言,然后通过概括整理,通过推理运算得到解决的能力考查。

九九高考命题以能力立意组卷,打破了传统命题方式的栓桔,为开拓学生的能力,迈出了非常可喜的一步。

二、数学能力的划分命题工作必须着眼于能力!这就对我们认识数学能力提出了较高的要求。

八十年代中期高考为走出高分低能的怪圈,响亮地提出了出活题、考能力、锐意进取的口号。

从那时起,对数学能力的探索、界定便纷纷出台,各种划分层出不穷。

譬如,有人把数学能分为:1、认识能力;2、思维能力;3、应用能力;4、现代能力。

而每一能力下又分为若干能力,如思维能力又分为:分析能力,判断能力,批判能力,创造能力四个方面。

现代能力划分为:社交能力、信息能力、竞争应变能力、审美鉴赏能力以及抗挫进取能力五个方面。

最有权威性的是数学教学大纲把能力分为1、运算能力;2、逻辑思维能力;3、空间想象能力;4、分析解决问题力〔‘1。

这些对能力的探索与界定,都是极富有见解的。

为了我们能较为准确地以能力立意进行数学命题,根据数学知识的特点,以及数学问题的能力界定,兼顾知识对能力的要求与解决问题所需要的能力,较为准确方便起见,我们把能力分为:1、运算能力;2、抽象能力;3、概括能力;4、推理能力;5、语言转换能力;6、空间想象能力这六个方面。

心理测验的难度与区分度课件

心理测验的难度与区分度课件

目标人群的各种情况。
难度与区分度在心理测验修订中的应用
定期修订心理测验
根据实践反馈和理论依据,定期对测验进行修订,以保持其效度 和信度。
难度与区分度的调整
根据修订结果,对测验的难度和区分度进行必要的调整,以优化测 验性能。
验证修订后的测验
对修订后的测验进行充分验证,以确保其能够有效地评估目标人群 的心理特质和行为表现。
高区分度的题目能够更好地识 别被试的优点和不足,有助于
指导个体的发展和干预。
低区分度的题目则难以准确区 分被试的不同水平,影响测验
的有效性和可靠性。
区分度是编制心理测验的重要 指标之一,对于评估和改进心
理测验具有重要意义。
04
心理测验的难度与区分度 关系
难度与区分度的关系
难度和区分度是心理测验中两 个重要的指标,它们之间存在 密切的关系。
难度与区分度在心理测验解释中的应用
1 2 3
解释测验分数
根据测验的难度和区分度,为个体提供准确的分 数解释,以帮助他们了解自己的心理特质和行为 表现。
提供反馈和建议
根据个体的情况,为个体提供有针对性的反馈和 建议,以帮助他们改善自己的心理状态和行为表 现。
应用于实践
将心理测验及其解释结果应用于实际情境中,如 选拔、培训、心理咨询等,以支持个体的职业发 展和个人成长。
通过实测数据统计、专家评审等方 法,对测验题目的难度水平进行评 估,以保证测验质量。
03
心理测验的区分度分析
区分度概念的界定
区分度是指测验题目对被试心理 品质的鉴别能力。
区分度是衡量题目质量的主要指 标之一,也是编制心理测验的重
要环节。
区分度高的题目能够较好地区分 被试的心理品质,低区分度的题

难度、区分度、信度和效度的一般说明

难度、区分度、信度和效度的一般说明

其中:XH为高分组的平均得分(前27%),XL为低分组的平均得分(后27%)o (2)客观性试题的难度
A、基本公式法:P=1-R∕N 其中:R为答对人数,N为全体人数。 B极端分组法:P=I-(PH+PL)/2
其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n为总人数的前27%。PL=RL∕n叫低分组通过率,RL 为低分组答对人数。
②客观性试题:D=PH-PL,或D=RH-RL/n
③一般也可以用D=XH—XL/X满计算。
其中:XH为高分组某试题的平均分,XL为低分组某试题的平均分,X满为该题的满分。
三、信度
信度是指测得结果的一致性或稳定性,稳定性越大,意味着测评结果越可靠。相反,如果用某套试题对同一应 试者先后进行两次测试,结果第一次得80分,第二次得50分,结果的可靠性就值得怀疑了。
二、区分度 区分度是区分应试者能力水平高低的指标。试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者 得高分,低水平者得低分。而区分度低则反映不出不同应试者的水平差异。 试题的区分度与试题的难度直接相关。通常来说,中等难度的试题区分度较大。另外,试题的区分度也与应试 者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。 1、区分度指标的评价 -1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。一般认为,区分度指数高于0.3,试题便可以被接受。
信度通常以两次测评结果的相关系数来表示。相关系数为1,表明测评工具如试卷完全可靠;相关系数为0,则表 明该试卷完全不可靠。一般来说,要求信度在0.7以上。
1、评价信度的方法
(1)再测信度。它是指将同一试卷在相同的条件下,对同一组考生先后实施两次,两次测评结果的相关系数。

难度、区分度的概念讲解

难度、区分度的概念讲解

难度?区分度?
项目鉴别力指数与评价标准
鉴别指数D 0.4以上 0.3—0.39 0.2—0.29 0.19以下 项目评价标准 很好 良好,修改后更好 尚可,但需要修改 差,必量的判断指标 了解人员测评项目质量的判断指标 理解难度 区分度、信度、 难度、 理解难度、区分度、信度、效度的概念 熟悉测评误差的来源以及相应的控制方法 掌握测评分数合并的方法
古 代 人 员 测 评 指 标 : • 日常言行---孔子认为,“视其所以,观其所 由,查其所安,人焉痩哉?” • 特定情况下的言行---诸葛亮的“七观法”是 “ 问之以是非,以观其志;穷之以辞,以观 其变;咨之以计谋,以观其识;告之以祸难, 以观其勇;醉之以酒,以观其性;临之以利, 以观其廉;期之以事,以观其信。”
难度?区分度?
一、难度:测评成功与否的关键
• 地板效应---难度过高, 所有被测者的得分都很低 • 天花板效应---难度过低, 所有人得分都很高
难度?区分度?
(一)是非题 被测者在该题上的通过率 R/N× P= R/N×100% R通过的人数,N参加测评的总人数 当参加测评的人数较多时:总分最 高的 27%为高分组,总分最低的27%为低分组。 总体通过率/难度为 P=( P=(PH+PL)/2 PH高分组的通过率,PL低分组的通过率
本素材 由hi-hoo提供
难度?区分度?
• • • •
工作绩效 生理因素及其特征 服饰等外在客观因素 从五行阴阳等中介标志
本素材 由hi-hoo提供
难度?区分度?
第一节 测评项目质量的测评方法
人员测评的目的: 人员测评的目的: 区分很能干的人和能力一般 很能干的人和能力一般的人 区分很能干的人和能力一般的人 如何判断一个测评的质量? 如何判断一个测评的质量?

第四章-心理测验的难度与区分度(ppt文档)

第四章-心理测验的难度与区分度(ppt文档)

心理测量学
江西师大心理与教育统计测量中心
第四章 心理测量的难度与区分度
3 第三节 题目的猜测度与控制
心理测量学
一、猜测度的定义
猜测度是指被试全凭随机猜测而答对题 目的概率。猜测行为主要出现在客观题 (如选择题、是非判断题、配对题等)
心理测量学
江西师大心理与教育统计测量中心
二、猜测度的控制
①增加选择题选择项的个数(一般不少于 四个) 。
是评价试题质量,筛选试题的主要指标与依据
区分度的分类
正区分(D>0)
称积极区分,指实际水平高的考生得了高分, 实际水平低的考生得了低分
负区分(D<0),
称消极区分,实际水平高的考生得了低分,实 际水平低的学生得了高分
零区分(D=0)
指实际水平高低与得分之间没有太大的关系, 呈现出零相关
心理测量学
江西师大心理与教育统计测量中心
三、项目分析实例
心理测量学
江西师大心理与教育统计测量中心
三、项目分析实例
③选项分析:
第1题,正确答案和干扰项的两组平均选答率都 基本正常,在正确答案上高分组的被试选择人 数要多于低分组被试,且在非正确选项上,高 分组的被试选择人数要少于低分组被试,这符 合实际情况,四个选项的设置均较合理;
主要考察高分组和低分组被试在正确答案上 的选答率是否是正差,及这一差距是否足够大。 只有当高分组和低分组被试在正确答案上的选 答率是正差,且这一差距足够大时,这时题目 质量较佳。
心理测量学
江西师大心理与教育统计测量中心
二、选项分析的方法及选项修改原则
3、对于干扰项
考察高分组和低分组被试在干扰项上的选答率 是否是负差,及这一差距是否足够大。只有当 高分组和低分组被试在正确答案上的选答率是 负差,且这一距差足够大时,这时干扰项的设 置比较合理,否则干扰项设置不合理,应对干 扰项进行删除或修改。

关于“难度”与“区分度”的一点解释

关于“难度”与“区分度”的一点解释

关于“难度”与“区分度”的一点解释前一阶段,在参加继续教育培训课程——《有效学业评价——思想品德命题问题诊断与分析》的交流时,几位老师谈到了衡量试卷质量的四个系数标准:难度、区分度、信度和效度。

这几个系数大多数同行应该在大学阶段都学习过,但因为使用频次过低,我真的说不清楚了,特别是对“难度”和“区分度”,我想很多同行可能与我有相同的感受。

在交流的当时,我感觉我们的思维多少都有点混乱。

那时那刻,我深深地感悟到:看了不一定会了,会了不一定得了,得了不一定永久了!这几天,特意查了查关于“难度”和“区分度”的资料,在此与同行们共享。

一、难度1.“难度系数”反映试题的难易程度,“难度系数”也可以理解成“容易度系数”。

2.难度一般用字母P表示,P越大表示试题越简单,P越小表示试题越难。

试题要有梯度,因此各试题的难度应有不同,这是命制试题时要加以特别考虑的。

一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度指数最好掌握在0.5左右,高于0.7和低于0.3的试题不能太多。

3.难度系数计算公式为:P=平均分÷满分值例:第1小题选择题满分是4分,全班50名学生中有20名学生答对,则第1小题的难度计算:平均分=4×20÷50=1.6,P=平均分÷满分值=1.6÷4=0.44.注意:(1)难度水平的确定是为了筛选题目。

平时测验难度要利于学生的学习,但一定的难度能增加区分度,这对全面了解、掌握学生学习情况有十分重要的作用。

(2)难度水平的确定要考虑及格率,防止损伤学困生的自尊心。

(3)难度水平的确定要考虑对分数分布的影响,一般以偏正态分布为前提,有时偏正态分布更能激发学生的学习积极性。

二、区分度1.区分度是指试题对被试者情况的分辨能力的大小,主要用于评价以选拔为目的的选题。

2.试卷区分度反映试题区分不同水平受试者的程度,即考出学生的不同水平,把优秀、一般、差三个层次的学生真正分别开。

难度与区分度分析共44页文档

难度与区分度分析共44页文档

谢谢!
1、不要轻言放弃,否则对不起自己。
2、要冒一次险!整个生命就是一场冒险。走得最远的人,常是愿意 去做,并愿意去冒险的人。“稳妥”之船,从未能从岸边走远。-戴尔.卡耐基。
梦 境
3、人生就像一杯没有加糖的咖啡,喝起来是苦涩的,回味起来却有 久久不会退去的余香。
难度与区分度分析4、守业的最好办法就是不断的发展。 5、当爱不能完美,我宁愿选择无悔,不管来生多么美丽,我不愿失 去今生对你的记忆,我不求天长地久的美景,我侈 。——CocoCha nel 62、少而好学,如日出之阳;壮而好学 ,如日 中之光 ;志而 好学, 如炳烛 之光。 ——刘 向 63、三军可夺帅也,匹夫不可夺志也。 ——孔 丘 64、人生就是学校。在那里,与其说好 的教师 是幸福 ,不如 说好的 教师是 不幸。 ——海 贝尔 65、接受挑战,就可以享受胜利的喜悦 。——杰纳勒 尔·乔治·S·巴顿

第三章 教育测验的难度和区分度

第三章  教育测验的难度和区分度
答案:0.5
三、区分度与信度的关系
区分度(D) 0.1225 0.16 0.20 0.30 0.40 0.50
信度 0.00 0.42 0.63 0.84 0.95 0.949
信度随着区分度的增加而增加,增长的 速度更快。因此,提高区分度是提高信度的 一种有效方法。
四、区分度与难度的关系
难度(P) 1.00 0.90 0.70 0.50 0.30 0.10 0.00
二、计算
用相关法计算区分度
1.客观性题目
测题分数为二分变量-测验总分为定距变量, 所以用点二列相关、二列相关计算;若将测验总 分认为划分为合格和不合格(二分变量),则用 Φ相关、四分相关。
2.主观性题目
测题分数和测验分数均为定距变量,故采 用积差相关系数。
用极端分组法计算
1.客观性题目
D(鉴别指数)=PH-PL PH:高分组通过率 PL:低分组通过率 2.主观性题目
D
XH XL
NH L
X H :高分组得分和
XL :低分组得分和
N:极端组人数 H:该题最高得分 L:该题最低得分
3.鉴别指数的评价标准:
D≥0.40
非常优良
0.30~0.39 良好,可以改进
0.20~0.29 尚可,需改进
D≤0.19

例4:某道测题的满分为12分,学生在这一测 题上的得分为10 7 9 5 7 4 6 5;而这些 学生的语文总成绩为78 72 66 63 61 59 55 52。求该测题的区分度?
主观题计算方法
1.基本公式:
P X X MAX
X :全体被试的平均得分
XMAX :题目满分
例3: 一组被试在某道题上的得分分别为:

难度与区分度PPT课件

难度与区分度PPT课件

-
5
1、难度
1.2 难度的计算 02)极端分组法 当被试人数较多时,以两端组被试得分率的均值为难度系数 步骤: 公式: P=(PH+PL)/2 PH为高分组答对该题的百分比; PL为低分组答对该题的百分比。
例:某区域1000人参加考试,试卷第一题高分组180人答对,低分组60 人答对,求该题难度?
-
4
1、难度
1.2 难度的计算
01)基本公式
2. 用项目得分的平均值计算难度(当题目分数是多分值时)
当项目是用连续分数计分时,难度一般用参加测验的全体学生在该项目的平 均得分与该项目的满分的比值为指标,即:P=X/W(P为项目难度;X为 该项目的平均得分;W为该项目的满分。)
例,一组被试在某题目上得分分别为:2,5,9,10,4,8,7,5,3,0 该题目满分为10 分,则该题目的难度X/W=2+5+9+10+4+8+7+5+3+0/100=0.53
-
3
1、难度
1.2 难度的计算 01)基本公式
1、用通过率计算难度。
当项目以二分法计分(答对得分、答错不得分)时,难度一般用正确回答项 目的人数与参加测验总人数的比值为指标, 即:P =R/N(P 为项目难度; R 为答对该项目的人数;N 为参加测验的总人数。)
例:在100个学生中,答对第一题的30人,答对第二题的60人,求第一、二 道题的难度?比较这两道题谁比谁难?
>0.4 非常良好
0.3-0.4 良好, 如能改进更好
0.2-0.29尚可,用时需做改进
<0.19 劣,需淘汰或改进
-
19
本章小结

第六章测验项目的难度与区分度

第六章测验项目的难度与区分度
第六章 测验项目的难度与区分度
[内容提示]
一、难度 二、区分度
第一节 项目的难度分析
一、难度的定义 1、难度:是指项目的难易程度。
2、难度的指标:
R P N
R:答对该题的人数;N:参加测验的总人数以 通过率表示难度时,通过人数越多,即P值越 大,难度就越低;P值越小,难度越高。因为P 值大小与难度高低成反比,有人将其称作易度。
B、为了使整个测验项目的潜在区分度最大,似乎应该 使每个项目的难度处于0.50水平,但事实并非如此简单。 如果每一个项目的难度均处于0.50,由于项目难度相同, 有可能大多趋向于有关的内容或技能,结果造成项目同 质性提高。
在极端情况下,有可能50%的被试全部通过各项目得满 分,另外50%的被试全部为0分,形成U形分布,这样 反而降低总分的区分能力。如果测验的所有项目都是中 等难度,只有项目的内在相关为0时,整个测验才能产生 常态分布。考虑到一般测验项目之间具有某种程度的相 关难度的分布要广一些,梯度多一些,是合乎需要的。
说明: XH:高分组所得总分;XL:低分组 所得总分;H:该题最高分;L:该题最低分; N:考生总人数的25% 步骤:按测验总分由高到低排序;分别确定 测验总分的25%、25%作为高低分组;列 出试题分析表;将数据带入以上公式加以计 算
2、相关法
以项目分数与效标分数(效标分数不易得到时, 以测验总分代替)的相关作为项目区分度的指标 相关越高,区分能力越好
三、难度对测验的影响
1、难度对测验分数分布的影响 (1)P值越小 →测验项目越难→测验分数集 中在低分端→分数分布呈正偏态分布。 (2)P值越大→测验项目越易→ 测验分数集 中在高分端→分数分布呈负偏态分布。 即:测验项目过份容易或过份难,都会造 成测验分数偏离正态分布,而使测验分数的 离散程度变小。

关于“难度”与“区分度”的一点解释

关于“难度”与“区分度”的一点解释

关于“难度”与“区分度”的一点解释关于“难度”与“区分度”的一点解释前一阶段,在参加继续教育培训课程——《有效学业评价——思想品德命题问题诊断与分析》的交流时,几位老师谈到了衡量试卷质量的四个系数标准:难度、区分度、信度和效度。

这几个系数大多数同行应该在大学阶段都学习过,但因为使用频次过低,我真的说不清楚了,特别是对“难度”和“区分度”,我想很多同行可能与我有相同的感受。

在交流的当时,我感觉我们的思维多少都有点混乱。

那时那刻,我深深地感悟到:看了不一定会了,会了不一定得了,得了不一定永久了!这几天,特意查了查关于“难度”和“区分度”的资料,在此与同行们共享。

一、难度1.“难度系数”反映试题的难易程度,“难度系数”也可以理解成“容易度系数”。

2.难度一般用字母P表示,P越大表示试题越简单,P越小表示试题越难。

试题要有梯度,因此各试题的难度应有不同,这是命制试题时要加以特别考虑的。

一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度指数最好掌握在0.5左右,高于0.7和低于0.3的试题不能太多。

3.难度系数计算公式为:P=平均分÷满分值例:第1小题选择题满分是4分,全班50名学生中有20名学生答对,则第1小题的难度计算:平均分=4×20÷50=1.6,P=平均分÷满分值=1.6÷4=0.44.注意:(1)难度水平的确定是为了筛选题目。

平时测验难度要利于学生的学习,但一定的难度能增加区分度,这对全面了解、掌握学生学习情况有十分重要的作用。

(2)难度水平的确定要考虑及格率,防止损伤学困生的自尊心。

(3)难度水平的确定要考虑对分数分布的影响,一般以偏正态分布为前提,有时偏正态分布更能激发学生的学习积极性。

二、区分度1.区分度是指试题对被试者情况的分辨能力的大小,主要用于评价以选拔为目的的选题。

2.试卷区分度反映试题区分不同水平受试者的程度,即考出学生的不同水平,把优秀、一般、差三个层次的学生真正分别开。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其二,可根据 pb 值查“积差相关系数显著性

2
界值表”;
r pb
其三,当N>50时Biblioteka 若>Nr pb

r 3
r pb
在0.05水平上显著;若

N
pb ,在
0.01水平上显著。
④适用题型:选择题、判断题等(例题)
(2)二列相关系数
①适用条件:两个变量都是正态变量,一
列是连续的,另一列是人为划分的二分变
2、内部一致性系数
区分度的实质是试题得分与总分的相 关,因此,用相关系数表示区分度。
(1)点二列相关系数
①条件:适用于一类变量属二分称名变量
,另一类变量属连续变量。
② rpb

Xp Xq .
St
pq
③对用点二列相关计算出的数值需进行显著性检验 ,才能确定其意义。
r 其一,可以用 X P和 X q 进行差异显著性检验;
采用统计方法分
析试题的品质,

定量分析 主要包括难度、

区分度等分析


分析试题的内容
定性分析 分析试题文字的
合适性等
一、难度的分析 (一)含义 (二)估算方法 1、得分率 2、失分率 3、极端分组法 4、卷面难度 5、难度的取值范围 (三)测验题目的适宜难度 (四)难度对测验分数分布形态的影响 (五)基于难度的题目分析
二、区分度的分析
(一)定义
1、概念 2、取值范围 3、鉴别指数的评价标准 (二)计算方法
1、极端分组法 2、内部一致性系数 (1)点二列相关系数 (2)二列相关系数 (3)积差相关系数 (三)标准参照测验题目区分度的其他研究方法
(四)区分度与难度的关系
SPSS操作法
一、难度分析 (一)含义
测验的难易程度,即被试完成项目任务时所 遇到的困难程度。难度系数用符号P表示。
2、由于出现科学性错误而导致难度不符 ,需重新命题;
3、命题、内容均无大问题但难度不符的 题目需进行详细分析找出原因所在。
二、区分度分析
(一)定义
1、测验题目对学业水平不同的考生的区分 程度或鉴别能力,用符号D表示。
具有良好区分度的测验,实际水平高的学 生应得高分,水平低的学生应得低分。
2、取值范围介于-1至1 之间。 若D>0时,则为积极区分; 若D=0时,则说明题目无区分能力; 若D<0时,则为消极区分
⑤把 P
系数。
H
和PL
代入以上公式,计算这个题目的难度
例题:在100名学生中,高分组与低分组各有 27人。其中高分组答对第一题的有20人, 低分组答对第一题的有10人。这道试题的 难度系数为:
PH2/027 0.7 4,PL1/027 0.3 7,
P ( 0 .4 7 0 .7 3 ) 2 0 .56
例题
2、以全体被试失分率为难度系数 q=1-P
3、极端分组法 P= (PHPL) 2
具体计算步骤:
①按被试的总分,将全体被试从高到低进行排序;
②从高分往下找,找出高分组;由低分往上找,找 出低分组。两组人数分别占总人数的27%;
③分别计算高分组、低分组的被试在该题目上的平 均得分;
④代入以上公式分别计算高分组和低分组被试在同 一题目上的难度系数;
3、鉴别指数的评价标准
鉴别指数(D) 区分度评价
0.40以上 0.30-0.39 0.20-0.29 0.19以下
非常优良
良好,如能改进更好
尚可,用时需作改进
劣,必须淘汰或改进以提高 区分度
(二)计算方法 1、极端分组法
(1)适用范围:被试人数太多时测验的区分 度的估计
P (2)公式D= PH - L ,
(二)计算 1、以全体被试得分率为难度系数
(1)客观性试题:通过率 P=R/N
适用题型:选择题、判断题等。
例题:在100个学生中,答对第一题的30人, 答对第二题的60人,这两试题的难度值分别为:
P1
300.30 100
P2
600.60 100
难度值越小,试题越有难做;难度值越大, 试题越容易。
分组通过的比率,然后在 交叉处查得r值。
PH
、PL
相应的
例题
(3)积差相关系数
①适用条件:非二分法记分的项目,题目
分数分布接近正态分布,测验总分为连续 变量。

XY X Y
r N
S X SY
③显著性检验: 当N>50时,采用正态分布检验,
r N -1
量(例如,把学习成绩分为及格和不及格
等)。
② rb

X p X q . pq
St
Y
③显著性检验: Z
rb
1 pq
Y
N
当Z> Z 0.05 =1.96时,未达到显著性水平;
当Z> Z 0.05 =1.96时,达到显著性水平。
④求二列相关也可用费拉南根的项目分析表
直接查得r值。其步骤为:分别计算高、低
(3)步骤: ①排序 ②分组 ③分别计算两组的通过率 ④按以上公式计算试题区分度。
例题:高中物理测验的被试共18人,高 分组和低分组若各取总人数的27%,则两 组各为5人。第五题为是非题,高分组5个 人全部答对,低分组5个人中有1个人答对 ,根据公式,该题的鉴别指数为:
D=
5 5

1 5

0.80>0.40
校正难度:
CP = (kP 1)(k1)
k表示每个测题中可供选择的答案数目
例题:10名学生参加一个测验,有一道 题是五选一的选择题,有6人答对,请计算 这道题校正后的难度系数。
P=R/N=0.6,CP=(kP-1)/(k-1)=0.5
(2)主观性试题:得分率
①P= X Xmax
②适用范围:填空题、简答题、论述题、 计算题、作文题等。
4、卷面难度:试卷包含的所有试题难度 的平均数
5、难度系数的取值范围是在0—1之间
(三)测验题目的适宜难度
1、常模参照测验:整个测验所有题目的难度系数 分布在0.30~~0.70之间,并且整个测验的难度系 数在0.50左右时,可使测验对被试有较大的鉴别 力,而且可以使测验分数接近正态分布。
2、如果测验的目的在于选拔人才,那么,测题难 度指数的平均数,应由录取率而定。
3、标准参照测验:教师应该依据教材内容和实际 教学情况来命题或选题。
(四)难度对测验分数分布形态的影响
正偏态——难度值越接近0,测验 分数越集中于低分端;
负偏态——难度值越接近1,测验 分数越集中于高分端;
若测验的难度适当,则测验分数的 分布 正态分布;
(五)基于难度的题目分析
1、难度过低与过高的题目,原则上要淘 汰,但属于必考的知识点,需重新命题, 提高命题的难度;
相关文档
最新文档