教育测量与评价的难度与区分度

合集下载

教育测量与评价的质量特性 难度与区分度课件

教育测量与评价的质量特性 难度与区分度课件

PPT学习交流
19

需进行显著性检验,才能确定其是否具有显著性意义
(1)对点双列相关公式中的 和 进行差异显著性检验,若差异显著, 表明 显著; (2)采用积差相关系数显著性检验的方法进行检验; (3)如果样本量较大(n>50),也可用下面近似方法:
, 认为 在0.05水平上显著;
,认为 在0.01水平上显著。
答对该题目的人数 被试人数
PPT学习交流
3
• 多值记分题的难度值计算
某题的平均得分 该题的满分
PPT学习交流
4
练习
• 题1:在100个学生中,答对第一题的30人,答 对第二题的60人,求第一、二道题的难度?比 较这两道题谁比谁难?
• 题2:某道论述题满分12分,所有考生在这道题 上的平均得分为3.6分,求该题的难度?
6
练习
题5:某区域1000人参加考试,试卷第一题高分组 180人答对,低分组60人答对,求该题难度?
如果该题满分为10分,高分组得分总数为2100分交流
7
二、难度指标的等距变换
• 运用标准分数(Z分数)作为题目难度的指标
PPT学习交流
8
例:某校学生在一次测验中,第一题的答对率为 15%,第二题的答对率为25%,第三题的答对率为 35%,假定这三题所测量的能力近似正态分布,问
信度
0.00 0.42 0.63 0.84 0.915 0.949
要达到理想的测验信度,提高区分度是一个好办法
PPT学习交流
16
难度
1.00 .90 .70 .50 .30 .10 .00
区分度的最大值
.00 .20 .60 1.00 .60 .20 00
难度适中,可使区分度达到最大值

教育测量与评价的质量特性难度与区分度

教育测量与评价的质量特性难度与区分度

难度的影响因素
测验项目的性质
测验目的
测验项目的性质不同,难度也会有所 不同。例如,记忆类的题目通常比分 析类的题目更容易。
测验目的不同,难度也会有所不同。 例如,选拔性测验通常比水平性测验 更难。
被试群体的水平
被试群体的水平越高,测验项目的难 度通常越低。反之,被试群体的水平 越低,测验项目的难度通常越高。
案例二:某评价体系的区分度评估
总结词
该案例介绍了如何通过区分度指标来评估某评价体系的区分度,以确定评价结果是否准确反映学生的 实际水平。
详细描述
首先,选取两个水平不同的学生群体作为参照样本。然后,根据评价体系对两个样本进行测试,并记 录每个样本在各个评价指标上的得分。接着,计算每个评价指标的区分度值,并分析其分布情况。最 后,根据区分度值的大小和分布情况,评估该评价体系的区分度是否良好。
案例三:难度与区分度的综合应用
总结词
该案例探讨了如何将难度和区分度两个 质量特性结合起来,以优化教育测量与 评价体系的设计。
VS
详细描述
首先,分析现有教育测量与评价体系的难 度和区分度情况。然后,根据分析结果, 调整试题难度和区分度指标,以提高评价 体系的准确性和可靠性。最后,通过实际 应用和验证,评估优化后的教育测量与评 价体系的效果。
难度的计算方法
通过率
通过率是指被试在测验项目上的 通过人数与总人数之比,可以直
观地反映测验项目的难度。
难度指数
难度指数是指被试在测验项目上的 平均得分与该测验项目的满分之比, 可以更准确地反映测验项目的难度。
难度曲线
难度曲线是以难度为横轴,通过率 为纵轴绘制的曲线,可以更全面地 反映测验项目的难度分布。
因素分析法

3-教育测量与评价的难度与区分度

3-教育测量与评价的难度与区分度

教育测量与评价中题目(项目)的区分度
例:100名考生参加主观性试题测验,按高、低分各占人数
的25%分组,其中第四题试题分析表如下所示,求该题目的 区分度。 X XL D H N ( H L)
X f 10 6 fx 120 60 低分组 X 12 10 f 0 4 fx 0 40 高分组 12 10

只关心研究对象的顺序,不问津间距是否一致 如:合格与否、优良中差等
3. 等距量表

间距量表,在赋值时有相等的度量单位,采用相对零点,被测所对应的 测量值由明确的距离关系 原始测验分数经过统计处理后推导出一种新的量表分数,此分数的“零
点”是一个相对零点
4. 比率量表 具有等距量表的一切性质,采用绝对零点。 针对总体而不是样本 不但能确定一个被测比另一个被测大(小)多少,而且还能得出其间的 倍数关系

步骤:

PH PL P 2
按测验总分由高到低排序 从高分段向下选出全部试卷的27%作为高分组 从低分段向上选出全部试卷的27%作为低分组 按照上述公式计算项目难度值

例:100人参加某测验,高分组与低分组各取27人,其中第 一题高分组20人答对,低分组10人答对。这道题的难度系 数是多少?
二列相关计算区分度
测验总分与项目分数均为连
续变量,其中一个被人为地 分成两个类别,
X p X q pq rb St Y
生 总 作 类
1 2 3 4 5 6 7 8 9 10 11
公式的说明: p为二分变量中某一类别在全 部变量中所占的比例,q为另 一类别所占的比例(q=1-p) St为全部连续变量的标准差 Y表示正态曲线下与P相对应 的纵线高度。

小自考-教育测量和教育评价

小自考-教育测量和教育评价

三.难度1、难度的意义:难度就是测验项目的难易程度。

通常以试题的“通过率”作为难度指标。

难度是分析测验项目的重要指标之一2、难度的计算:(1)二分法记分项目的难度计算:P=R/N (2)多分值记分项目的难度计算:P=X/Xman3、难度对测验的影响:测验难度影响测验分数的分布形态(难度大呈正偏态,难度小呈负偏态。

难度适中呈正态分布)。

测验难度影响测验分数的离散程度(难度偏大或偏小,离散程度小,分数较集中。

难度适中,离散程度大,分数分布范围大)。

4、测验难度水平的确定:(1)测验的平均难度应接近0.50左右 即0.50±0.20(2)测验的难度应该由测验的目的确定(选拔性测验)四:区分度1.区分度的意义:(1)区分度是指测验对被试实际水平的区分程度或能力(2)测量专家们把试题的区分度称为测验是否具有效度的“指示器”,并作为评价项目质量,筛选项目的主要指标与依据。

(3)区分度D 取值范围: -1.00——+1.00(D 为正值 ——积极区分;D 为负值 ——消极区分;D 为0 ——零区分。

具有积极区分作用的项目,其D 值越大,区分的效果越好。

)2、区分度(鉴别指数D )的计算:(1)二分法记分的测验项目:极端分组,从总分分数分布的两端各选择27%的被试组成高分组和低分组,分别计算出每道题目上的各自的通过率,二者之差就是鉴别度指数: (2)多分值记分的测验项目:极端分组,从总分分数分布的两端各选择25%的被试组成高分组和低分组,分别计算各自总分和最高分、最低分。

再按下列公式计算: 五:测验编制的基本程序:(1)确定测验目的:1.明确测量对象2.明确测量目标3.明确测量用途(2)制定编制计划:1.测验内容的确定:全面而且具有代表性的测验内容范围—“边界”。

各内容点的相对比重权重—“结构”.2.测验形式的确定:个体测验、团体测验、口头测验、书面测验、操作测验。

3.测验题目形式及题型的确定(客观题、主观题)4.测验时间及题量的确定:(测验内容的覆盖面。

信度效度难度区分度分析

信度效度难度区分度分析

信度效度难度区分度分析在教育测量和评估领域,信度、效度、难度和区分度是四个非常重要的概念。

它们对于衡量测试的质量、评估学生的学习成果以及改进教学方法都具有至关重要的意义。

接下来,让我们逐一深入探讨这四个概念。

信度,简单来说,就是指测试结果的稳定性和可靠性。

如果我们对同一批学生在相同的条件下进行多次相同的测试,得到的结果应该是相近的。

就好比用同一把尺子去测量一个物体的长度,每次测量的结果都应该差不多。

信度主要包括重测信度、复本信度和内部一致性信度等。

重测信度是在不同时间对同一批被试进行重复测量。

比如,今天对一群学生进行了一次数学测验,一周后再用相同的测验对他们进行测试,如果两次测试的成绩相近,说明这个测验的重测信度较好。

然而,重测可能会受到记忆、练习等因素的影响。

复本信度则是使用两个平行的测验(即内容、形式、难度等方面都相似)对同一批被试进行测量。

如果两个测验的结果一致性高,就表明复本信度良好。

但要编制两个高质量的平行测验并非易事。

内部一致性信度通常通过计算测验内部各个项目之间的相关程度来衡量。

例如,一份试卷中的各个题目,如果它们在测量同一个知识点或能力方面表现出较高的一致性,那么这份试卷的内部一致性信度就比较高。

常用的计算方法有克朗巴赫α系数等。

效度是指测试能够准确测量出所要测量的东西的程度。

好比射箭要射中靶心,测验也要准确测量到我们期望测量的内容。

效度主要包括内容效度、结构效度和效标关联效度。

内容效度关注的是测验内容是否涵盖了所要考查的知识和技能范围。

比如,一场语文考试如果能够全面考查学生的字词、语法、阅读理解和写作能力,那么它在内容效度方面就表现较好。

为了确保内容效度,出题者需要对教学大纲和课程目标有清晰的理解。

结构效度考察的是测验是否能够反映出所假设的理论结构或心理特质。

比如,一个智力测验是否真正测量了智力的各个方面,而不仅仅是某些表面的表现。

这需要通过复杂的统计分析和理论研究来验证。

效标关联效度则是将测验结果与一个外在的标准进行比较。

教育测量与评价的难度与区分度

教育测量与评价的难度与区分度

况如下表。计算该选择题的区分度。
生 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
总 86 52 94 72 65 22 76 83 80 75 76 73 62 91 47 74 81 88 62 58 题1 0 0 1 1 0 0 1 1 1 1 0 1 1 0 1 1 0 0 0
6
5
30
4
2
8
4
10
40
教育测量与评价中题目(项目)的区分度
三、区分度计算方法
相关法 考虑中间数据 以项目分数与效标分数的相关作为项目区分度的指标 (效标分数不易得到时,以测验总分代替) 相关越高,区分能力越好 具体方法:
▪ 积差相关法 ▪ 点二列相关 ▪ 二列相关 ▪ Φ相关
积差相关法计算区分度
主观性试题区分度的计算公式: D X H X L
▪ 说明:
N(H L)
▪ XH:高分组所得总分;XL:低分组所得总分;H:该题最高分;L:该 题最低分;N:考生人数(总人数的25%)
▪ 步骤:
▪ 按测验总分由高到低排序;分别确定测验总分的25%、25%作为高低分 组;列出试题分析表;将数据带入以上公式加以计算
个标准差的位置,由0.84-0.50=0.34去查Z值,Z=-1σ 若一个项目的难度位0.16,则这个项目的难度在平均数以上
一个标准差的位置,由0.50-0.16=0.34去查Z值,Z=σ 若某个项目有50%的学生通过,这个项目的难度落在下图0
的位置上
0.13% 2.14% 13.59% 34.13% 34.13% 13.59% 2.14% 0.13%
分等级、位 1 2 3 4 次、排列顺

难度与区分度

难度与区分度



1、难度
1.2 难度的计算
01)基本公式

2. 用项目得分的平均值计算难度(当题目分数是多分值时) 当项目是用连续分数计分时,难度一般用参加测验的全体学生在该项目的平 均得分与该项目的满分的比值为指标,即:P=X/W(P为项目难度;X为 该项目的平均得分;W为该项目的满分。) 例,一组被试在某题目上得分分别为:2,5,9,10,4,8,7,5,3,0 该题目满分为10 分,则该题目的难度X/W=2+5+9+10+4+8+7+5+3+0/100=0.53
2.区分度
2.3 提高区分度的方法 01) 使题目的难度适中,使整个考试难度适中

题目的难度适中可使区分度达到最大值,因此,使难度适中是提高区分度的 重要方法。 使高能学生得高分或低能学生得低分,使分数尽量分布在整个分数量尺上。
02) 着重考察复杂的学习结果

03) 掌握区分度的评价标准(极端分组法计算的区分度评价标准)
D=(XH-XL)/N(H-L) XH为高分组得分总数 XL为低分组得分总数 H为该道题的最高分 L为该道题的最低分 N为应试总人数的25%。
2.区分度
2.2 区分度的计算
02)内部一致性系数
标准化的或大规模的测验中,多采用相关法分析试题的区分度,通过计 算某一题目得分与测验总得分或效标分数的相关系数来判定。相关越 大,区分度越高。 点二列相关:适用于二分变量(0,1记分),测量总分连续 二列相关:两个变量都是正态连续,其中一个被认为分为两类(及格、不 及格) 积差相关:非二分变量,得分具有连续性,被试团体较大时,可认为 服从正态分布。题目得分与测验总分求积差相关系数得到区分度。

【教师资格考试资料】信度、效度、难度、区分度

【教师资格考试资料】信度、效度、难度、区分度

临近考试,为考生整理了信度、效度、难度、区分度,希望对大家有所帮助。

(考生可提前注册,考试结束当天11月5日,直接登录即可进行在线估分)在全国统考教师资格考试中,对于备考的考生而言,无论是教育学还是心理学都存在一些学习方面的难点,这对于自己备考的考生而言是非常困难的。

结合自己的教学经验与深厚的专业知识,将中学《教育知识与能力》的教学难点进行专题讲解,希望能够对各位考生的笔试备考提供一些帮助。

1、测量指标的含义信度、效度、难度、区分度是中学教学部分的考试内容,主要是用来检验测验质量本身的重要指标。

所谓信度指的是多次测量结果额一致性与稳定性。

它本身强调是测量结果是不是一样的,例如:小明第一次测量得分是80分,第二次测量得分也是80分,说明两次结果一样,则说明两次测量的信度高。

反之,第一次测量得分80分,第二次测量得分40分,两次结果不一样,说明信度低。

所谓效度指的是测量的正确性,是指一个测量所要测量的结果的程度。

效度所关注的是测量到对象多少程度?比如:假如小明本身的真实成绩是80分,第一次测量得分是正常发挥得分是80分,说明本次测量的效度高,如果失常发挥,高于80分或者低于80分,本次测量的效度低。

所谓难度主要指的是测量的难易程度,测量的难度系数值的范围是0—1,难度系数值越小,则反映试卷难度越大,难度系数值越大,则反映试卷难度越小。

所谓区分度,指的是测量对不同考生的区分程度,也就是可以理解为通过测验能够将好的选出来,差的筛下去。

比如高考的就是区分度很高的测验,否则就难以将好生、差生进行区分。

2、测量指标之间的关系信度与效度的十大关系:信度高,效度不一定高(或效度不一定低)信度低,效度一定低效度高,信度一定高效度低,信度不一定低(或信度不一定高)信度是效度的必要条件效度是信度的充分条件信度是效度的必要不充分条件效度是信度的充分不必要的条件有效度,一定有信度有信度,不一定有效度难度与区分度的关系:难度越大或难度越小,区分度越小难度中等,区分度越大以上是信度、效度、难度、区分度,祝各位考生顺利通过考试!拿到敲开教师行业的敲门砖!。

测验评价的难度与区分度

测验评价的难度与区分度

难度与区分度
在测验评价过程中常有一个难度和区分度的问题,通常所说的难度是指试题或试卷难易程度的指标,而且相对于被试的该批考生而言,其计算方法如下:
(1)客观性试题的难度计算:通常用通过率来衡量。

P=R/N×100%(P为通过率,R为答对或通过该题目的人,N为全体考生数)
(2)主观性试题的难度计算:
P=X/W×100%(P为通过率,X为被试在某一试题上的平均分,W为该题的满分)
(3)整个试卷的难度计算:试卷的难度是指一份试卷的总体难易程度,其由试卷中每道题的难度决定。

其计算办法为:将每道题目的难度与满分值相乘的积相加,然后将其总和除以试卷的满分值,所得的商即为整个试卷的难度。

区分度是指区分测验试题对考生实际水平的区分程度,其取值范围介于−1.00和+1.00之间。

(1)客观性试题的区分度计算:
D=Ph-Pl(D为区分度,Ph为高分组通过率,Pl为低分组通过率。

注:将被试依照总分从高到低排列,然后将总分最高的27%和最低的27%的被试分别定为高分组和低分组。


(2)主观性试题的区分度计算:
D=(XH-XL)/N(H-L)(XH为高分组总分, XL为低分组总分,H为该题最高分,L为该题最低分,N为考生总人数的25%)
(3)整个试卷的区分度计算:试卷的区分度是指一份试卷总体对学生的区分程度。

其计算办法为:将每道题目的区分度与满分值相乘的积相加,然后将其总和除以试卷的满分值,所得的商即为整个试卷的区分度。

上述标准也常是在设计测验试卷过程中所要考虑的。

3-3教育测量与评价的质量特性难度与区分度

3-3教育测量与评价的质量特性难度与区分度

全体被试总分 的标准差
例: 有一测验向8名学生施测,其中两个题目的题分和测验 总分如表3-11所示,请计算这两题的区分度。

积差相关系数的显著性检验方法 (1)当样本容量n>50时,采用正态分布检验; (2)当样本容量n<50时,采用t分布检验; (3)直接查“积差相关系数(r)显著性临界值表
• 高低分组法
• 题4:60人参加考试,某题满分为12分,正确 得分累积是480分,求该题难度?
– 难度值的其他计算方法
(1)以全体被试失分率为难度系数
(2)以两端组被试得分率的均值为难度系数
练习
题5:某区域1000人参加考试,试卷第一题高分组 180人答对,低分组60人答对,求该题难度?
如果该题满分为10分,高分组得分总数为2100分, 低分组得分总数为830分,求该题难度?
– 测验难度影响测验的鉴别能力。在测验中,考生之
间相互配对比较的可能性越多,就越有利于准确地鉴 别考生的不同能力。
• 难度的影响因素及其控制
– 主要因素:
• 考察知识点的多少; • 考察能力的复杂程度或层次的高低; • 考生对题目的熟悉态度; • 命题的技巧。
– 难度控制:
• 正确估计考生水平; • 弄清弄懂各知识点; • 掌握命题技巧。
教育测量与评价的质量特性
第三பைடு நூலகம் 难度与区分度
一、难度与难度系数的计算
• 概念
– 难度:被试完成题目或项目任务时遇到的困难 程度
– 难度系数:定量刻画被试作答一个题目所遇到 的困难程度的量数,叫做题目的难度系数,也 常称为难度值,用符号P表示
• 计算方法
– 二值记分题的难度值计算
答对该题目的人数 被试人数

3-3 教育测量与评价的质量特性 难度与区分度

3-3 教育测量与评价的质量特性 难度与区分度

要达到理想的测验信度,提高区分度是一个好办法
.
难度
1.00 .90 .70 .50 .30 .10 .00
区分度的最大值
.00 .20 .60 1.00 .60 .20 00
难度适中,可使区分度达到最大值
.
二、区分度的计算
• 相关法
– 点双列相关系数
通过该项目的被 试的平均总分
全体被试总 分的标准差
.
Hale Waihona Puke • 测验难度对分数分布的影响
– 测验难度影响分数的分布形态。难度值越接近 0,测验的难度就越大,测验分数就越是集中 在低分端,其分数分布越呈现正偏态;反之, 难度值越接近1.00,其难度就越小,测验分数 越集中在高分端,分数分布呈负偏态。
– 测验难度影响测验分数的离散程度。测验难度 过大过小,都会造成测验分数偏离正态分布, 从而使分数的全距缩小,使测验分数的离散程 度变小。
.
二、难度指标的等距变换
• 运用标准分数(Z分数)作为题目难度的指 标
.
例:某校学生在一次测验中,第一题的答对率为 15%,第二题的答对率为25%,第三题的答对率为 35%,假定这三题所测量的能力近似正态分布, 问第一、第二、第三题的难度差异怎么样?
.
值越大,表示试题越难; 值越小,表示试题难度越容易
未通过该项目的 被试的平均总分
未通过该项目的 被试人数占总人
数的百分比
通过该项目的 被试人数占总 人数的百分比
.
例. 某班15名学生参加一次测验的总分及第一题 的得分情况如表3-10所示,计算第一题的区分度
.

需进行显著性检验,才能确定其是否具有显著性意义
(1)对点双列相关公式中的 和 进行差异显著性检验,若差异显著, 表明 显著; (2)采用积差相关系数显著性检验的方法进行检验; (3)如果样本量较大(n>50),也可用下面近似方法:

教育测量与评价教案 第5次课 难度 区分度

教育测量与评价教案  第5次课 难度 区分度
对于其它类型的测验,目的不同对难度的要求不同,如选拔性的测验难度就应小,而选择补习功课的学生困难就应大。
五、控制题目难度的方法
一般说来影响题目难度的主要因素有:
(1)考查知识点的多少;
(2)考查能力的复杂程度或层次的高低;
(3)考生对题目的熟悉程度(如本来比较容易的题目会因考生均未注意而造成很难,或者本来较难的题目会因考生普遍练习而变得容易);
一、概念
难度指测验试题的难易程度。
在教育测量中,客观题的难度一般用正确回答试题的人数与参加测验的总人数的比值来表示。
即P=R/N。R为答对的人数,N为参加测验的人数。
因此,这里难度实际代表的是易度。
难度是试题对学生知识和能力水平的适合程度的指标。试题难度不但对题目的区分度有影响,而且对试卷的信度和效度也有较大影响。
区分度自然越高越好,但要做到这一点较难。一般说来,可参照以下标准,对于有些要求不高的测验,有些试题的区分度低一些是容许的。
教学资源
朱德全.教育测量与评价[M].北京:高等教育出版社.2016
讨论、思考题、作业:
思考题:如何控制测验的难度?
教后小结
第五节区分度
一、概念
区分度指测验对考生实际水平的区分程度,用符号D来表示。具有良好的区分度的测验,实际水平高的应该得高分,实际水平低的应该得低分,所以区分度又叫鉴别力。它是评价试题质量,筛选试题的主要指标和依据。
区分又分为正区分(D>0)、零区分(D=0)和负区分(D<0),正区分又叫积极区分,负区分又叫消极区分。
很明显,难度是一个相对概念,难度的高低与被试的水平直接相关。一种测量对这一组被试是高难度的,可能对另一组被试是低难度的。也就是说,难度是由参与测量的被试群体的整体水平决定的。

教育测量与评价模拟及答案

教育测量与评价模拟及答案

教育测量与评价模拟及答案《教育测量与评估》模拟试卷考试形式:闭卷考试时间:90分钟一、概念辨析(5×8)1、测量与评价测量——按照一定的法则,给事物及其属性指派数字。

从中,可以看到测量的三个要素:法则、事物及其属性、数字。

评价——从事物的内在品质和外部功效出发,对有价值事物所作的调查研究,以判断价值的实现程度,进而考虑提高价值的可能性。

2、难度与区分度项目的难度是项目或试题难易程度的指标。

一般,难度系数P就是项目的通过率。

区分度是项目对受测者心理特质的区分能力的指标,它反映了项目鉴别好、坏受测者的能力程度,也在一定程度上反映了测验项目的有效性。

3、信度与效度信度是反映测验成绩在不同条件下的一致性、连续性程度的指标,定义为真分数方差与所得分数方差的比例,即为信度系数。

所谓效度就是测验对于所要测量的心理特质进行评定的有效程度,即测验测到所想测量的特质的程度。

一个效度低的测验,其得分在很大程度上受到其他心理特质的影响,尽管它反映了受测者的某种特点,但很大程度上反映的并不是所要测量的心理特质。

测验的效度分析,其实质是实践标准对测验进行检验的过程,测验本身是一种通过行为瓜对心理特质的检验,因此,效度分析则是检验的检验。

4、准则与标准评价的准则。

它规定评价的方面和内容,也就是说它规定评什么,不评什么。

所谓标准是指事物资变的临界点,即事物资变过程中量的划定性。

评价标准是对评价内容或方面量的划定,即要求或完成的程度或水平。

评价标准表示达到什么程度才是合乎要求的,大概能被称为优良的。

5、价值与需要价值——主体与客体之间的效益关系,即主体需要被客体属性所满意,或客体属性满意主体需要的一种特殊的效益关系。

由此,“价值”与“需要”密切相联。

需要——主体在生存和发展过程中,由于某种欠缺所处的一种摄取状态。

需要有三方面的特点:第一,需如果一种摄取状态,是主体有目标活动的动力,是主体行动的源泉。

正是需要激励了人的行动。

第四章 教育测验的难度和区分度

第四章 教育测验的难度和区分度

(2)关于校正问题的争议 围绕校正问题,存在着两种不同的看法: ◆支持者:应校正,排除猜测对难度的影响 理由:①猜测存在会高估测验的信度 ②校正可以反映题目的真实难度 ③校正可以培养被试诚实的美德 ◆反对者:反对进行校正 理由:①猜测并非完全是盲目的 ②不校正对难度的影响不大,约4%左右 (黄国彦,1997),可增加试题数目来解决 ③通过部分知识,合理猜测是值得培养的
主观题计算方法 1.基本公式:
P X X MAX
X :全体被试的平均得分
X
MAX
:题目满分
例3: 一组被试在某道题上的得分分别为:
2、5、9、10、4、8、7、5、3、0
该题满分为10分,则测题难度为多少?
2.极端值公式:
1 P 2
XH X X MAX
L

三、难度值的等距处理 1.P值是反顺序量表,只能表示次序,但不能判 断难度间差异的大小,需将其转化为Z分数。 2.转化方法: 若P 〉0.5,则先求P-0.5,再查表 若P〈 0.5,则先求0.5-P,再查表 若P=0.5,则Z=0 一般,P=0.84,则Z=-1;P=0.16,则Z=1 3.美国教育测验服务社(ETS)的转化 ∆=13+4Z (13,4) ∆量表是以25为上限,1位下限的等距量表。 ∆值越大,难度越高 注:一般情况下,难度的这种转化是非必需的。
3.选择题难度的校正 选择题的一个特点就是容易受猜测的影响, 这就使得答对的比例增加了,使得计算出来的 难度系数增加,高估难度。 (1)校正方法 CP=(KP-1)/(K-1) K:代表测题中可供选择的答案总数 例3:一个测题未经校正前的难度指数为0.5, 可供选择答案为5个,另一题目未经校正的难 度指数为0.53,可供选择答案为4个,试比较 两题的难度。 答案:CP1=0.38 CP2=0.37

教育测量与评价的难度与区分度

教育测量与评价的难度与区分度

况如下表。计算该选择题的区分度。
生 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
总 86 52 94 72 65 22 76 83 80 75 76 73 62 91 47 74 81 88 62 58 题1 0 0 1 1 0 0 1 1 1 1 0 1 1 0 1 1 0 0 0
X
f
fx
X
f
fx
高分组 10
10
100 低分组 10
0
0


8
8
64
8
5
40

7
6
42
7
8
56


5
1
5
5
2
10
4
0
0
4
10
40
问题:
◦ 有3道试题(A、B、C),它们的难度P值分别为0.85、 0.75 、0.65,试比较这三 道题目的难度差异情况。
◦ 我们能说:
◦ 我们不能说:
◦ 如何进行差异比较?
◦ 步骤:
P PH PL 2
◦ 按测验总分由高到低排序
◦ 从高分段向下选出全部试卷的27%作为高分组
◦ 从低分段向上选出全部试卷的27%作为低分组
◦ 按照上述公式计算项目难度值
◦ 例:100人参加某测验,高分组与低分组各取27人,其中第一题 高分组20人答对,低分组10人答对。这道题的难度系数是多少?
A=B或A≠B 1 23
符号化
男1女2;男 生喜欢11、男
生不喜欢
10……
断定: A>B A=B
分等级、位 1 2 3 4 次、排列顺

3-教育测量与评价的难度与区分度

3-教育测量与评价的难度与区分度

教育测量与评价中题目(项目)的区分度
例:100名考生参加主观性试题测验,按高、低分各占人数
的25%分组,其中第四题试题分析表如下所示,求该题目的 区分度。 X XL D H N ( H L)
X f 10 6 fx 120 60 低分组 X 12 10 f 0 4 fx 0 40 高分组 12 10
教育测量与评价பைடு நூலகம்题目(项目)的难度
二、难度的计算 主观题的平均数法
X P W


主观题的极端分组法 公式: X
P
H

步骤 按测验总分依次排序,确定比例各为 25%的高分组和低分组 为高分组、低分组分别编制每题得分的分析表(试题分析表) 用上述难度公式计算难度值
X L (2 NL) 2 N ( H L)
试 题 分 析 表
8
6 4
4
3 2
32
18 8
8
6 4
6
5 10
48
30 40
教育测量与评价中题目(项目)的区分度
三、区分度计算方法 相关法 考虑中间数据 以项目分数与效标分数的相关作为项目区分度的指标 (效标分数不易得到时,以测验总分代替) 相关越高,区分能力越好 具体方法:
80 75 76 73 46 39 40 41 合 合 合 合
Ф相关法计算区分度
测验的两个变量都是二分变量,可用计算Φ相关系数来表示
某项目的区分度 以测验总分划分为合格、不合格两类的被试在某一题目上通 过、未通过的人数列成四格表来计算
AD BC r A BC D A C B D
平均数上下各一个标准差的范围分别包含了全部人数的34%

区分度名词解释教育评价与测量

区分度名词解释教育评价与测量

区分度名词解释教育评价与测量
区分度是教育评价与测量中一个重要的概念,指的是某个事物或活动在群体中的相对重要性,以及其在评价与测量中的重要性。

本文将介绍区分度的概念及其在教育评价与测量中的应用。

什么是区分度?
区分度是指某个事物或活动在群体中的相对重要性,以及其在评价与测量中的重要性。

具体来说,区分度是指某个事物或活动相对于其他事物或活动的重要性,以及相对于整个群体的重要性。

例如,一个人的学习成果相对于他所在的班级和其他学生来说,是相对重要的,并且相对于整个班级来说,也是相对重要的。

区分度在教育评价与测量中有何应用?
在教育评价中,区分度可以帮助评估不同教学方法和策略的有效性。

例如,在评估学生的学习成果时,可以通过比较学生的学习成果与班级平均水平的区分度来确定教学方法和策略的有效性。

在测量中,区分度可以帮助评估不同测量工具的准确性。

例如,在评估学生的认知水平时,可以通过比较学生使用不同工具的正确率来确定哪种工具更准确。

在教育评价与测量中,区分度还可以帮助确定评估者的贡献。

例如,在评估教师的教学质量时,可以通过比较教师使用不同教学方法和策略的区分度来确定哪些教学方法和策略更有效。

此外,区分度还可以帮助确定评估结果的可靠性。

例如,在评估学生的学习成果时,可以通过比较评估者对评估结果的准确性和可靠性的区分度来确定评估结果的可靠性。

区分度在教育评价与测量中具有重要的应用。

它可以帮助评估不同教学方法和策略的有效性,帮助确定评估者的贡献,帮助确定评估结果的可靠性。

因此,在
教育评价与测量中,我们应该重视区分度的概念及其应用。

教育测量与评价重难点

教育测量与评价重难点

教育测量与评价重难点引言:1.统计学是关于数据的收集、整理、描述和推断(以获得有关研究对象特征及规律)的一种方法论科学。

2.心理和教育研究大致可以分为两大类:定性研究和定量研究,两者的区别主要在于研究方法和研究范式。

定性研究:主要用文字来描述现象和叙述结果,目的是理解和解释现象,如心理分析主要采用定性研究。

定量研究:采用比较科学的方法,通过收集数据和统计分析,借助数字和地图表来呈现结果,目的是了解现象的数量特征或现象之间的关系,并做出解释或推断,如实验心理主要采用定量研究。

3.选定了一个研究问题后,定量研究的主要步骤如下:1)文献检索与文献综述。

2)研究设计。

3)前期研究。

彩排。

4)收集数据。

5)数据登录和整理。

6)统计分析。

7)解释统计结。

8)呈现结果,得出结论。

第一章第一节一、总体与样本1.研究对象的全体成为总体(population),组成总体的基本单元成为个体。

2.被抽到的个体成为样品(case),在心理和教育研究中,通常将样品称为被试(subject)。

3.样品的全体称为样本(sample),样本所包含的样品个数成为样本容量(sample size),通常用n或者N来表示。

二、变量1.在一项研究中,研究者感兴趣的不是研究对象本身,而是与研究目的有关的变量。

所谓变量(variable),是指研究对象的个体之间在性质和数量上可以变化并可以直接或间接测量的条件、现象或特征。

2.对于一个变量,每一个个体都有一个确定的取值,称为变量值(value)。

样本中所有样品(被试)的变量值全体称为样本数据(sample data)。

三、数据来源1.在心理研究与教育中,主要通过调查(survey)(包括问卷、访谈、观察)、实验(experiment)或测验(testing)来收集数据。

四、变量命名和编码1.对于确定的变量,每个个体都对应着一个变量值。

2.如果变量的取值不是数值,要用数值进行编码。

五、反向题的重新编码1.在调查或测验中,研究者为了控制被试的反应误差,有时会在问卷或者量表中加入所谓的反向题(negative item)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

只关心研究对象的顺序,不问津间距是否一致 如:合格与否、优良中差等
3. 等距量表

间距量表,在赋值时有相等的度量单位,采用相对零点,被测所对应的 测量值由明确的距离关系 原始测验分数经过统计处理后推导出一种新的量表分数,此分数的“零
点”是一个相对零点
4. 比率量表 具有等距量表的一切性质,采用绝对零点。 针对总体而不是样本 不但能确定一个被测比另一个被测大(小)多少,而且还能得出其间的 倍数关系
另一类数据 Ⅰ 一类 数据 合计 Ⅰ Ⅱ A C A+C Ⅱ B D B+D
合计 A+B C+D N
Ф相关法计算区分度
例:45名学生考取大学的人数和在某题上通过的人数由下
表所示。若以升学为效标,此题对学生是否有区分能力?
考取 未考取
通过
未通过
13 5
7
20
检验计算出的rФ值是否达到显著性水平,还需将rФ值
X f 10 8 6 fx 100 64 42 低分组 X 10 8 7 f 0 5 8 fx 0 40 56 高分组
X X (2 NL)
试 题 分 析 表
10 8 7
5
4
1
0
5
0
5
4
2
10
10
40
问题:
有3道试题(A、B、C),它们的难度P值分别为
0.85、 0.75 、0.65,试比较这三道题目的难度差异 情况。
0.13% -3
2.14% -2
13.59% -1
34.13% 0
34.13% 1
13.59% 2
2.14% 3
0.13%
教育测量与评价中题目(项目)的难度
三、难度的转换 P向Z的转换 假定每个试题所要测量地潜在特质或能力是呈正态分布的, 可将P值作为正态曲线下的概率面积,以此转换成Z分数 问题:三道题目的难度系数为0.65、 0.55 、0.45,比较其差 异。
13 4 z
转换为:平均数为13,标准差为4的标准分数 目的:消除负数,便于计算 转换之后可用所得的Δ值计算整个测验中所有项目的平均难度
教育测量与评价中题目(项目)的难度
四、难度对测验的影响 难度对测验分数分布的影响 过易、过难会造成测验分数偏离正态分布,使测验分数离散程 度变小
转换成χ2值,再进行χ2检验。
Nr
2
2
练习:
20名学生的期末成绩如下表,为考查第一题是否有
区分能力,将该题用二分法记分,答对记1分,答错 记0分。试计算该题的区分度。
生 总 一
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 86 90 54 89 50 44 43 28 75 82 60 70 75 81 70 80 76 77 79 50 1 1 0 1 0 0 0 0 1 1 0 1 1 1 0 1 1 1 1 0
四种量表的比较
量表 水平
名称量表
特性
文字表达
同一性 区分性
图示
功能

符号表达
断定: A=B或A≠B 分类、命名、 准考证号码; 符号化 男1女2;男 3 生喜欢11、男 生不喜欢 10…… 分等级、位 3 4 次、排列顺 序 学习成绩: 好=3 中=2 差=1 温度
1
2
等级量表
等级性、位 次性、大于 或小于
题号 1 2
P 0.65 0.55
难度Z值 -0.385 -0.125
难度差异 - 0.26
3
0.45
0.125
0.25
两个项目之间的P值之差相等,但Z值之差不等 将P值转换为Z值之后,它们之间的单位相等,可以比较差异
教育测量与评价中题目(项目)的难度
三、难度的转换 Z分数向Δ分数的转换:
二列相关计算区分度
测验总分与项Βιβλιοθήκη 分数均为连续变量,其中一个被人为地 分成两个类别,
X p X q pq rb St Y
生 总 作 类
1 2 3 4 5 6 7 8 9 10 11
公式的说明: p为二分变量中某一类别在全 部变量中所占的比例,q为另 一类别所占的比例(q=1-p) St为全部连续变量的标准差 Y表示正态曲线下与P相对应 的纵线高度。
教育测量与评价中题目(项目)的难度


L 公式的含义: P H XH:高分组所得总分; 2 N ( H L) XL:低分组所得总分;H:该题最高分;L:该题最低分;N: 考生总人数的25% 例: 100名学生参加论文式测验,按高、低分各占总人数的 25%分 组,其中第6题的得分统计表如下所示。求该题目的难度。
r
X p Xq S
pq
况如下表。计算该选择题的区分度。 生 总 题
1 86 1 2 52 0 3 94 0 4 72 1 5 65 1 6 22 0 7 76 0 8 83 1 9 80 1 10 75 1 11 76 1 12 73 0 13 62 1 14 91 1 15 47 0 16 74 1 17 81 1 18 88 0 19 62 0 20 58 0
积差相关法 点二列相关 二列相关 Φ相关
积差相关法计算区分度
非二分法记分的项目,可将题目得分与测验总分求积差相关
系数以得到题目的区分度
rxy
X X Y Y X X Y Y
i i 2 i i
2
积差相关的另一计算公式:
rxy

难度对测验鉴别力的影响 测验的主要功效是鉴别考生实际水平的高低 适宜难度可以加大考生得分的差异,从而提高测验的鉴别力 项目难度的适宜值为0.5左右时,测验得分的方差才可达最大值

难度与测验目的的关系 项目难度应根据测验目的来确定 常模参照评价:区分学生能力或成就的高低 标准参照评价:了解学生达到教学目标规定的掌握程度
断定: A>B A=B A<B 确定 (A-B)+ (B-C)= A-C 设A=KB, B=lC,则A 0 =KlC成立
1 2
等距量表
单位相等 有人定参照 点,无绝对 零点 有绝对零点
1 2 3 4
求等距的度 数,决定差 异
比率量表
1 2
从绝对零点 3 4 开始求等距 的度数、决 定比率
体重 身高
正态分布的特征
指派数字 1. 名称量表


类别量表,最低层次的量表,用于分类,表示事物的不同类别和性质
用数字表示每一个研究个体:学号、准考证号 用数字代表事物的类别:“1”、“0”表示“好”、“坏”
2. 顺序量表(等级量表)

也称位次量表,根据事物的特性和设定的法则在分类的基础上确定同类 客体中各元素之间的相对顺序
试 题 分 析 表
12 10
8
6 4
4
3 2
32
18 8
8
6 4
6
5 10
48
30 40
教育测量与评价中题目(项目)的区分度
三、区分度计算方法 相关法 考虑中间数据 以项目分数与效标分数的相关作为项目区分度的指标 (效标分数不易得到时,以测验总分代替) 相关越高,区分能力越好 具体方法:
S S S 2S X SY
2 X 2 Y
2 D
Sx为全体被试在某道题目上得分的标准差;Sy为全体被试
总分的标准差;SD是由被试总分减去某题目得分而得到的新 变量的方差
点二列相关计算区分度
测验的一个变量是连续变量,另一个变量是二分变量时,
要用点二列相关系数表示某项目的区分度
公式的说明: p为答对某题人数占全体人数 pb 的比例 t q为答错此题人数所占全体人 数的比例 (q=1-p) St为全体考生的标准差 20个学生参加语文测验,总分与某一个选择题的得分情
kP 1 CP k 1

CP:校正后的难度值;P:实际得到的通过率;K:选项数目
例:某次测验中,20个学生中有15人答对了某一选择题,分别计算此题有
四个选项、三个选项、两个选项时的难度值
教育测量与评价中题目(项目)的难度
二、难度的计算 客观题的极端分组法 根据测验分数按高低排序,用两个极端组(高分、低分)在 某项目上的平均通过率表示项目的难度

D为负时,试题消极区分

教育测量与评价中题目(项目)的区分度
二、区分度计算方法

极端分组法

客观性试题区分度的计算公式: D=PH-PL
按测验总分从高到低排序 确定测验总分最高的27%的被试作为高分组,最低的27%的被试为低分组 分别求出这两组被试通过试题的百分比 将算得的有关数据带入上公式

步骤:

PH PL P 2
按测验总分由高到低排序 从高分段向下选出全部试卷的27%作为高分组 从低分段向上选出全部试卷的27%作为低分组 按照上述公式计算项目难度值

例:100人参加某测验,高分组与低分组各取27人,其中第 一题高分组20人答对,低分组10人答对。这道题的难度系 数是多少?
12
13 14 15 62 91 47 38 52 21 合 合 不
16 17 18 19 74 81 88 62 39 42 48 29 不 合 合 不
20 58 27 不
86 52 94 72 65 22 76 83 47 37 55 27 22 10 35 42 合 合 合 不 不 不 不 合
教育测量与评价中题目(项目)的区分度
例:100名考生参加主观性试题测验,按高、低分各占人数
的25%分组,其中第四题试题分析表如下所示,求该题目的 区分度。 XH XL D N ( H L)
相关文档
最新文档