第六章测验项目的难度与区分度
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3、难度与测验目的的关系
项目难度应根据测验目的来确定,不能认为 测验项目都必须保持值等于0.50最好。事实 上,一方面,如果每个项目的难度都等于 0.50,测验项目之间存在高度相关,会使测 验分数的分布呈双峰状态,即有5%的人所 有题目都答对,得满分,另外5%的人全部 答错,得0分。
为此,难度水平的确定应根据测验的目的,性质及 题目的形式。 (1)对于一般的常模、参照测验而言,其目的在于 测量个体差异,一般只要求测验题目的平均难度为 0.50,而个题难度可在0.50+0.20之间 。 (2)当测验用与选拔或诊断时,题目的难度值应更 多地接近录取率。
X H X L 2 NL P 2 N ( H L)
XH:高分组所得总分; XL:低分组所得总分;H:该题最高分;L:该题最低分;N:考生总人数的25%
例:200人参加某测验,该测验最后一题作文 题总分30分,该题最高得分29分,最低得分 13分,高分组平均分24分,低分组平均分18 分,请计算该题的难度?
说明: XH:高分组所得总分;XL:低分组 所得总分;H:该题最高分;L:该题最低分; N:考生总人数的25% 步骤:按测验总分由高到低排序;分别确定 测验总分的25%、25%作为高低分组;列 出试题分析表;将数据带入以上公式加以计 算
2、相关法
以项目分数与效标分数(效标分数不易得到时, 以测验总分代替)的相关作为项目区分度的指标 相关越高,区分能力越好
例:100人参加某测验,高分组与低分组各 取27人,其中第一题高分组20人答对,低 分组10人答对。这道题的难度系数是多少?
(2)主观题的极端分组法
步骤: A、按测验总分由高到低排序 B、从高分段向下选出全部试卷的25%作为 高分组 C、从低分段向上选出全部试卷的25%作为 低分组 D、按照上述公式计算项目难度值
这两种情况,都表示试题没有鉴别考生水平高低的能力。 所以,调整试题难度是提高试题区分度的重要方法。右 表可说明难度与区分度的关系。
A、假如样本中通过某一项目的人数比率为1.00或 0,说明高分组与低分组在通过率上不存在差异,因 此D为0;假如项目的通过率为0.50,则可能是高 分组的所有人都通过了Байду номын сангаас而低分组却无人通过,这 样D的最大值可能达到1.00。
通常用D表示,取值范围为+1.00至-1.00
D越高时,试题的质量越好,D值范围在-1.00和 +1.00之间,值越大,试题的区分能力越强。
当D为正值时,说明试题是积极区分,即高分组通过 率高,低分组通过率低。为D负值时,说明试题有消 极区分,高组通过率低,低组通过率高。D为0时, 说明试题无区分度。
三、难度对测验的影响
1、难度对测验分数分布的影响
2、难度对测验鉴别力的影响
测验的主要功效之一就是鉴别考生实际水平 的高低。适量难度可以加大考生得分的差异, 从而提高测验的鉴别力。 P值越接近0.50,试题的鉴别能力就越高; 相反,P值越接近1.00或0,试题的鉴别能 力就越低。
第六章 测验项目的难度与区分度
[内容提示]
一、难度 二、区分度
第一节 项目的难度分析
一、难度的定义 1、难度:是指项目的难易程度。
2、难度的指标:
R P N
R:答对该题的人数;N:参加测验的总人数以 通过率表示难度时,通过人数越多,即P值越 大,难度就越低;P值越小,难度越高。因为P 值大小与难度高低成反比,有人将其称作易度。
三、难度对测验的影响
1、难度对测验分数分布的影响 (1)P值越小 →测验项目越难→测验分数集 中在低分端→分数分布呈正偏态分布。 (2)P值越大→测验项目越易→ 测验分数集 中在高分端→分数分布呈负偏态分布。 即:测验项目过份容易或过份难,都会造 成测验分数偏离正态分布,而使测验分数的 离散程度变小。
二、区分度计算方法
1、项目鉴别指数法 (1)客观性试题区分度的计算公式: D=PH-PL
按测验总分从高到低排序 确定测验总分最高的27%的被试作为高分组,最低的 27%的被试为低分组 分别求出这两组被试通过试题的百分比
(2)主观性试题区分度的计算公式:
XH XL D N ( H L)
(3)就选择题而言,P值应大于概率水平。P值若 等于概率,说明被试纯粹凭猜测作答;P值若小于概 率,说明题目很可能存在问题。 (4)整个测验的难度水平取决于组成测验的题目的 难度。
第二节、项目的区分度 一、区分度的概念
区分度是测验对被试实际水平的区分程度。是测 验项目分析的重要内容 是作为评价项目质量、筛选项目的主要指标与依 据
1
2 3
4
5
6
7
8 9 10 11 12 13 14 15
65 70 31 49 80 50 35 16 81 69 78 55 77 90 42 0 1 0 1 1 0 1 0 0 1 1 0 1 1 0
rφ
升级 留级 合计 通过 6(a) 2(b) 8(a+b) 未通过 2(c) 5(d) 7(c+d) 合计 8(a+c) 7(b+d) 15(N)
区分度的评价标准
以上标准仅作参考,不是绝对的。事实上,项目区分 度的要求应根据测验目的而定,若测验目的在于选人, 主要评判被试的个别差异,那么区分度要求高些;若测 验只是考察被试对所学知识的掌握情况,可不过多考虑 区分度。
三、区分度对测验的影响
1.区分度与难度的关系
试题的区分度与难度有密切关系。试题难度过大或过小, 其区分度都较低。当难度值为1.00或0时,高分组和低 分组或全部通过得满分,或全部未通过得0分,这时区分 度都为0分。
B、为了使整个测验项目的潜在区分度最大,似乎应该 使每个项目的难度处于0.50水平,但事实并非如此简单。 如果每一个项目的难度均处于0.50,由于项目难度相同, 有可能大多趋向于有关的内容或技能,结果造成项目同 质性提高。
在极端情况下,有可能50%的被试全部通过各项目得满 分,另外50%的被试全部为0分,形成U形分布,这样 反而降低总分的区分能力。如果测验的所有项目都是中 等难度,只有项目的内在相关为0时,整个测验才能产生 常态分布。考虑到一般测验项目之间具有某种程度的相 关难度的分布要广一些,梯度多一些,是合乎需要的。
具体方法:积差相关法,点二列相关 二列相关,Φ相关
①点二列相关:适用于一类变量为二分名义变量, 另一类变量为连续变量的成对变量的相关计算。 ②二列相关:适用于两个连续变量,但其中一个 变量被人为分成两类。 ③ Φ相关:适用于两个变量均为二分名义变量。
学生序号
效标分数 第1题得分
二、难度的计算
1、原始定义法 (1)客观试题(二分法记分):
R P N
由于选择题允许猜测,所以通过率可能因机遇作用 而变大。备选答案的数目越少,机遇的作用越大, 越不能真正反映测验的难度。
为此,吉尔福特提出了一个P值校正公式。
KP 1 CP K 1
CP:校正后的难度值;P:实际得到的通过 率;K:选项数目
例题:假定某题有75%的被试通过,若该题 有5个备选答案,则校正后的通过率为:
当有4个备选答案时,CP=0.67; 当有3个备选答案时,CP=0.63; 当有2个备选答案时,CP=0.54。
(2)主观题的平均数法
X P max
非二分法记分:例如某一数学能力测验题的 满分为20分,全体被试在该题上的平均分数 为15分,则该题的难度为: P=15/20= 0.75
2、极端分组法
(1)客观题的极端分组法
根据测验分数按高低排序,用两个极端组在某项目 上的平均通过率表示项目的难度
PH PL P 2
PH、PL分别为高分组与低分组的通过率。
步骤:
A、按测验总分由高到低排序 B、从高分段向下选出全部试卷的27%作为 高分组 C、从低分段向上选出全部试卷的27%作为 低分组 D、按照上述公式计算项目难度值
2.区分度与信度的关系
一个良好的测验,信度必须要高。测验的信度与项目的 区分度有着密切的关系,事实上,由试题的区分度还可 以估计测验的信度。整个测验中各试题的区分度值的平 均数越高,测验的信度就越高。值的平均数与信度的关 系如表。