第四章-心理测验的难度与区分度(ppt文档)
合集下载
难度与区分度分析课件

THA合理安排测验的整体难度和 时间限制,提高测验的区分度。
难度与区分度的关系
难度与区分度的关联性
难度与区分度相互影响
难度较高的题目可能具有较好的区分度,而简单题目往往区 分度较低。
难度与区分度的平衡
在评估试卷或测试的总体效果时,需要平衡难度与区分度, 以确保评估的有效性和可靠性。
优化建议
根据难度分析结果,提出优化任 务或题目的建议,以提高测验的 信度和效度。
区分度分析概述
区分度的定义与计算
区分度的定 义
区分度是指测验题目对不同水平被试 的区分程度,即题目对高水平和低水 平被试的鉴别能力。
区分度的计算方法
常见的计算方法有极端分组法、相关 系数法和回归系数法等。
区分度的影响因素
个性化教学中的应用
随着个性化教学的需求增加,难度与区分度分析的结果可 以应用于教学策略的调整和个性化学习资源的推荐。
与其他指标的综合分析
可以考虑将难度与区分度分析与其他教学质量评价指标相 结合,如信度、效度等,以更全面地评估试题或课程的质 量。
跨文化比较研究
可以开展跨文化比较研究,探讨不同文化背景和教育体系 下难度与区分度分析的共性和差异,以促进国际间的教育 交流和合作。
评估的准确性和可靠性。
实际应用案例
案例一:数学试卷的难度与区分度分析
总结词
2. 区分度分析
通过数学试卷的难度与区分度分析, 可以评估试卷的质量和考生的水平。
通过对比不同水平考生的答题情况, 可以判断试题的区分度,从而鉴别优 秀和一般考生。
1. 难度分析
根据考生答题的正确率,可以判断试 题的难易程度,进而调整试题难度, 提高试卷质量。
难度的影响因素
第四章-心理测验的难度与区分度教案资料

其基本假设是测验得高分的被试即为高能力 被试,测验得低分的被试即为低能力被试。
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(1)点二列相关法
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(2)积差相关法
心理测量学
江西师大心理与教育统计测量中心
2、极端分组法(鉴别指数法)
二、区分度的计算
1、相关系数法
点二列相关 积差相关
2、用极端分组法计算区分度:
D表示区分度 PH表示高分组的难度 PL表示低分组的难度
D=PH—PL
1、相关系数法
该方法的基本思想是,若题目有好的区分度, 则高能力的被试在该题上应得高分,低能力 被试应得低分,即被试在题目上的得分应与 测验总分相一致。
(把 和 代入P=(PH+PL)/2 ,计算这个题目的难度系数。
难度计算实例
例4-1 下表是随机抽取22名被试在某数学测验中四道题目的得分情况,每 题的满分分别为1分、2分、3分和4分,请分析其难度。
哪道题最难?
三、难度系数变换
上述所得难度系数,不论是得分率还是失 分率,都属于顺序变量,不具有相等的单 位,因此,通过p值比较并不能客观指出题 目难度之间的差异大小 。
好坏的成分 不同测验,目的不同,难度值不同。
奥林匹克测验?选择补习功课的学生?
第四章 心理测量的难度与区分度
2 第二节 项目的区分度
心理测量学
一、区分度的定义
定义:
指测验对考生实际水平的区分程度或测验对被 试特质差异的区分能力,用符号D表示。
具有良好区分度的测验,实际水平高的应该得高 分,实际水平低的应该得低分。所以,区分度又 叫鉴别力。
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(1)点二列相关法
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(2)积差相关法
心理测量学
江西师大心理与教育统计测量中心
2、极端分组法(鉴别指数法)
二、区分度的计算
1、相关系数法
点二列相关 积差相关
2、用极端分组法计算区分度:
D表示区分度 PH表示高分组的难度 PL表示低分组的难度
D=PH—PL
1、相关系数法
该方法的基本思想是,若题目有好的区分度, 则高能力的被试在该题上应得高分,低能力 被试应得低分,即被试在题目上的得分应与 测验总分相一致。
(把 和 代入P=(PH+PL)/2 ,计算这个题目的难度系数。
难度计算实例
例4-1 下表是随机抽取22名被试在某数学测验中四道题目的得分情况,每 题的满分分别为1分、2分、3分和4分,请分析其难度。
哪道题最难?
三、难度系数变换
上述所得难度系数,不论是得分率还是失 分率,都属于顺序变量,不具有相等的单 位,因此,通过p值比较并不能客观指出题 目难度之间的差异大小 。
好坏的成分 不同测验,目的不同,难度值不同。
奥林匹克测验?选择补习功课的学生?
第四章 心理测量的难度与区分度
2 第二节 项目的区分度
心理测量学
一、区分度的定义
定义:
指测验对考生实际水平的区分程度或测验对被 试特质差异的区分能力,用符号D表示。
具有良好区分度的测验,实际水平高的应该得高 分,实际水平低的应该得低分。所以,区分度又 叫鉴别力。
第四章 教育测验的难度和区分度

(2)关于校正问题的争议 围绕校正问题,存在着两种不同的看法: ◆支持者:应校正,排除猜测对难度的影响 理由:①猜测存在会高估测验的信度 ②校正可以反映题目的真实难度 ③校正可以培养被试诚实的美德 ◆反对者:反对进行校正 理由:①猜测并非完全是盲目的 ②不校正对难度的影响不大,约4%左右 (黄国彦,1997),可增加试题数目来解决 ③通过部分知识,合理猜测是值得培养的
主观题计算方法 1.基本公式:
P X X MAX
X :全体被试的平均得分
X
MAX
:题目满分
例3: 一组被试在某道题上的得分分别为:
2、5、9、10、4、8、7、5、3、0
该题满分为10分,则测题难度为多少?
2.极端值公式:
1 P 2
XH X X MAX
L
三、难度值的等距处理 1.P值是反顺序量表,只能表示次序,但不能判 断难度间差异的大小,需将其转化为Z分数。 2.转化方法: 若P 〉0.5,则先求P-0.5,再查表 若P〈 0.5,则先求0.5-P,再查表 若P=0.5,则Z=0 一般,P=0.84,则Z=-1;P=0.16,则Z=1 3.美国教育测验服务社(ETS)的转化 ∆=13+4Z (13,4) ∆量表是以25为上限,1位下限的等距量表。 ∆值越大,难度越高 注:一般情况下,难度的这种转化是非必需的。
3.选择题难度的校正 选择题的一个特点就是容易受猜测的影响, 这就使得答对的比例增加了,使得计算出来的 难度系数增加,高估难度。 (1)校正方法 CP=(KP-1)/(K-1) K:代表测题中可供选择的答案总数 例3:一个测题未经校正前的难度指数为0.5, 可供选择答案为5个,另一题目未经校正的难 度指数为0.53,可供选择答案为4个,试比较 两题的难度。 答案:CP1=0.38 CP2=0.37
第四章 测量信度

五、评分者信度
评分者信度(Scorer
Reliability)指的是
多个评分者给同一批被试作答情况进行评分
的一致性程度。它主要用于主观性作品的评
价过程中,如论述题评分、作文题评分、歌
唱比赛的评分、设计作品的评分等。
评分者信度的计算方法
1、当评分者人数为2时,评分者信度等于两者 评分的相关系数(积差相关或等级相关)。 2、当评分者人数大于2时,评分者信度采用肯 德尔和谐系数计算。 W = 12 [∑R2i –(∑Ri)2 / N] / [ K2 ( N3–N )] 其中K是评分者人数,N是被评的对象数,Ri 是第i个被评对象的被评等级之和。
采用复本信度的条件
要构造出2份或2份以上真正平行的测验。 被试有条件接受两次以上的测验。
复本信度的优缺点
优点:
1、减少了记忆效应和练习效应。 2、适用于追踪研究的多次测量。 3、减少了辅导的可能性。
缺点:
1、编制复本测验的难度较大。 2、被试要有接受两次以上测验的条件和意愿。
三、分半信度
第一节 信度的定义
一、什么是信度
信度指测量结果的稳定性、一致性程度。一个好的 测量工具必须具备好的信度,也就是说它多次测量 的结果应该相对的稳定、一致。
信度反映的是测量中随机误差的大小,随机误差小, 则信度高;反之,则信度低。
测验题目本身并不能提供信度的估计值,信度统计 来自于测验分数。也就是说,在检验信度之前必须 要实施心理测验,以获得测验分数。
遗忘和练习的效果基本相互抵消;(3)在两次施测 的间隔期内,被试所要测查的心理特质没有获得更多 的学习和训练;(4)被试有条件接受两次相同的测 验,取决于时间、经费等因素。
最新心理测量之能力测验教学讲义PPT课件

Holland's theory argued that "the choice of a vocation is an expression of personality" and that the six factor typology he articulated could be used to describe both persons and work environments.
(1)起源:
在1940年代,美国发展综合性职业性向测验作为 分类和咨商之用,最著名的为所发展出来的普通 性向测验组合
(2)适用对象:
初三到高三的学生及成人,由政府提供给各州就 业辅导处、各学校及其他非营利机构的辅导人员 使用
(3)测验内容:
十二个分测验,测量九种基本因素,这些因 素分别为一般智力(G),语文性向(V),数的 性向(N),空间性向(S),图形知觉(P),文书 知觉(Q),动作协调(K),手指灵巧(F)和手 部灵活(M)。
5.创造能力测验(托浪思创造思考、图形创 造思考)
……...等
不是找出最好的艺术家,而是要找出最原 创,最多的观点。
具有故事情节,传达某种情绪,从不同角 度看待问题,或是有动感的绘画也会得到 较高的分数。
如果反应平庸,分数就会很低。
(2)一般性向测验
1. (General Aptitude Test Battery, GATB)
因素分析得到1.Speed, 2. Verbal/ Math, 3.Techanical Knowledge 另有七种不同组合分数:Academic ability, Verbal, Math, Mechanical
and crafts, Business and Clerical, Electronics and Electrical, Health, Social, and Technology
(1)起源:
在1940年代,美国发展综合性职业性向测验作为 分类和咨商之用,最著名的为所发展出来的普通 性向测验组合
(2)适用对象:
初三到高三的学生及成人,由政府提供给各州就 业辅导处、各学校及其他非营利机构的辅导人员 使用
(3)测验内容:
十二个分测验,测量九种基本因素,这些因 素分别为一般智力(G),语文性向(V),数的 性向(N),空间性向(S),图形知觉(P),文书 知觉(Q),动作协调(K),手指灵巧(F)和手 部灵活(M)。
5.创造能力测验(托浪思创造思考、图形创 造思考)
……...等
不是找出最好的艺术家,而是要找出最原 创,最多的观点。
具有故事情节,传达某种情绪,从不同角 度看待问题,或是有动感的绘画也会得到 较高的分数。
如果反应平庸,分数就会很低。
(2)一般性向测验
1. (General Aptitude Test Battery, GATB)
因素分析得到1.Speed, 2. Verbal/ Math, 3.Techanical Knowledge 另有七种不同组合分数:Academic ability, Verbal, Math, Mechanical
and crafts, Business and Clerical, Electronics and Electrical, Health, Social, and Technology
心理测量4 项目分析

24
注意事项
当测验用于选拔或诊断时,应该多选择难度 值接近录取率的项目。 测验为选择题时,难度值应大于随机猜测概 率水平。
难度等于概率水平,说明题目可能太难;或题意 不清,被试凭猜测作答。 难度(通过率)低于概率水平,说明题目有系统 偏差。 是非题难度值0.75时最合适,四选一题目0.63时 最合适。
16
鉴别指数的判断
因为高分组条目总得分上高于低分组,理论上他们每 个条目的通过率也要高于低分组。
D>0时,D越大,说明该条目区分两种水平(组)的 能力越强
D<0则反映高分组的得分反而低于低分组,说明该条 目有问题。
伊贝尔(L. Ebel, 1965)关于鉴别指数评价项目性能 的标准:
鉴别指数(D) 0.40以上 0.30~0.39 0.20~0.29 0.19及以下
11
测验的难度 测验的难度取决于组成测验项目的难度 通过观察测验分数的分布,可以进行直观检验。 如果测验难度适中,分数的分布应当接近常 态分布; 如果测验偏难,分布呈正偏态(图13-4,A) 如果测验偏容易,分布呈负偏态(图13-4,B) 测验偏难或偏容易时,可以通过增加或减少不同 难易程度的条目来解决。
公式:
rpq
Xp Xq St
pq
rpq 点二列相关系数 X p 为与二分变量通过组相对应的连续变量的平均数
X q 为与二分变量未通过组相对应的连续变量的平均数
St 为连续变量的标准差 p 通过组人数与总人数之比(通过率)
q 未通过组人数与总人数之比(未通过率)
举例(例9):
19
二列相关
适用于两个连续变量,但其中一个变量被人为分 成两类。
理论上最大区分度(以总分对半划分高、低分组时)
注意事项
当测验用于选拔或诊断时,应该多选择难度 值接近录取率的项目。 测验为选择题时,难度值应大于随机猜测概 率水平。
难度等于概率水平,说明题目可能太难;或题意 不清,被试凭猜测作答。 难度(通过率)低于概率水平,说明题目有系统 偏差。 是非题难度值0.75时最合适,四选一题目0.63时 最合适。
16
鉴别指数的判断
因为高分组条目总得分上高于低分组,理论上他们每 个条目的通过率也要高于低分组。
D>0时,D越大,说明该条目区分两种水平(组)的 能力越强
D<0则反映高分组的得分反而低于低分组,说明该条 目有问题。
伊贝尔(L. Ebel, 1965)关于鉴别指数评价项目性能 的标准:
鉴别指数(D) 0.40以上 0.30~0.39 0.20~0.29 0.19及以下
11
测验的难度 测验的难度取决于组成测验项目的难度 通过观察测验分数的分布,可以进行直观检验。 如果测验难度适中,分数的分布应当接近常 态分布; 如果测验偏难,分布呈正偏态(图13-4,A) 如果测验偏容易,分布呈负偏态(图13-4,B) 测验偏难或偏容易时,可以通过增加或减少不同 难易程度的条目来解决。
公式:
rpq
Xp Xq St
pq
rpq 点二列相关系数 X p 为与二分变量通过组相对应的连续变量的平均数
X q 为与二分变量未通过组相对应的连续变量的平均数
St 为连续变量的标准差 p 通过组人数与总人数之比(通过率)
q 未通过组人数与总人数之比(未通过率)
举例(例9):
19
二列相关
适用于两个连续变量,但其中一个变量被人为分 成两类。
理论上最大区分度(以总分对半划分高、低分组时)
难度、区分度的概念讲解

难度?区分度?
项目鉴别力指数与评价标准
鉴别指数D 0.4以上 0.3—0.39 0.2—0.29 0.19以下 项目评价标准 很好 良好,修改后更好 尚可,但需要修改 差,必量的判断指标 了解人员测评项目质量的判断指标 理解难度 区分度、信度、 难度、 理解难度、区分度、信度、效度的概念 熟悉测评误差的来源以及相应的控制方法 掌握测评分数合并的方法
古 代 人 员 测 评 指 标 : • 日常言行---孔子认为,“视其所以,观其所 由,查其所安,人焉痩哉?” • 特定情况下的言行---诸葛亮的“七观法”是 “ 问之以是非,以观其志;穷之以辞,以观 其变;咨之以计谋,以观其识;告之以祸难, 以观其勇;醉之以酒,以观其性;临之以利, 以观其廉;期之以事,以观其信。”
难度?区分度?
一、难度:测评成功与否的关键
• 地板效应---难度过高, 所有被测者的得分都很低 • 天花板效应---难度过低, 所有人得分都很高
难度?区分度?
(一)是非题 被测者在该题上的通过率 R/N× P= R/N×100% R通过的人数,N参加测评的总人数 当参加测评的人数较多时:总分最 高的 27%为高分组,总分最低的27%为低分组。 总体通过率/难度为 P=( P=(PH+PL)/2 PH高分组的通过率,PL低分组的通过率
本素材 由hi-hoo提供
难度?区分度?
• • • •
工作绩效 生理因素及其特征 服饰等外在客观因素 从五行阴阳等中介标志
本素材 由hi-hoo提供
难度?区分度?
第一节 测评项目质量的测评方法
人员测评的目的: 人员测评的目的: 区分很能干的人和能力一般 很能干的人和能力一般的人 区分很能干的人和能力一般的人 如何判断一个测评的质量? 如何判断一个测评的质量?
最新第四章-心理测验的难度与区分度ppt课件

理论分析的意义 ①从经验数据中抽象出理论概念、概括现象的本质特征 ②通过对调查数据或统计分析结果的深入分析,发现问题的症结
所在,找出问题的关键点、从而提出解决问题的思路和对策。
理论分析的特征
理论分析的突出特点有:
(1)概括性和揭示性。 (2)解释性和系统性。 (3)间接性和抽象性。
二、理论分析在社会调查中的作用
四、区分度与测验信度、难度的关系
区分度与难度关系
难度(P)
1.00 0.90 0.70 0.50 0.30 0.10 0.00
区分度的最大值 0.00 0.20 0.60 1.00 0.60 0.20 0.00
由上表可知,难度适中,可使区分度达到 最大值。
五、影响题目区分度的因素
(1)题目难度 (2)被试群体的同质性 (3)全卷各题所测心理品质的一致性。 (4)题目本身的文字与内容的质量也会
四、题目的难度分布
P的取值范围为:0≤P≤1 当P=0时,试题的实际困难程度最大(所有
的考生都得0分) 当P=l时,试题的实际难度最小(所有的考生
都全对)。
常模参照测验难度分布
要尽可能地区分被试的个别差异,测验结 果就尽可能拉开距离 。
P值尽量接近0.50 为宜
思考:P等于1或0时,以为着什么,是否还可以 区分被试?
Eg:三个题目难度系数分别为0.5、0.6、0.7, 三个题目之间难度差是否相等?
• 可知第一题最难,第二题次之,第三题最容易 • 难度系数相差都是10%,但并不代表第一题 与
第二题难度只差等于第二题与第三题难度之差
难度系数变换办法
假设每个试题所要测量的潜在特质或能力是呈正 态分布的,然后就可以根据正态分布曲线,将试题 的难度系数P作为正态曲线下的概率面积,转换 成具有相等单位的等距量表,即Z分数(标准分数) 量表。
所在,找出问题的关键点、从而提出解决问题的思路和对策。
理论分析的特征
理论分析的突出特点有:
(1)概括性和揭示性。 (2)解释性和系统性。 (3)间接性和抽象性。
二、理论分析在社会调查中的作用
四、区分度与测验信度、难度的关系
区分度与难度关系
难度(P)
1.00 0.90 0.70 0.50 0.30 0.10 0.00
区分度的最大值 0.00 0.20 0.60 1.00 0.60 0.20 0.00
由上表可知,难度适中,可使区分度达到 最大值。
五、影响题目区分度的因素
(1)题目难度 (2)被试群体的同质性 (3)全卷各题所测心理品质的一致性。 (4)题目本身的文字与内容的质量也会
四、题目的难度分布
P的取值范围为:0≤P≤1 当P=0时,试题的实际困难程度最大(所有
的考生都得0分) 当P=l时,试题的实际难度最小(所有的考生
都全对)。
常模参照测验难度分布
要尽可能地区分被试的个别差异,测验结 果就尽可能拉开距离 。
P值尽量接近0.50 为宜
思考:P等于1或0时,以为着什么,是否还可以 区分被试?
Eg:三个题目难度系数分别为0.5、0.6、0.7, 三个题目之间难度差是否相等?
• 可知第一题最难,第二题次之,第三题最容易 • 难度系数相差都是10%,但并不代表第一题 与
第二题难度只差等于第二题与第三题难度之差
难度系数变换办法
假设每个试题所要测量的潜在特质或能力是呈正 态分布的,然后就可以根据正态分布曲线,将试题 的难度系数P作为正态曲线下的概率面积,转换 成具有相等单位的等距量表,即Z分数(标准分数) 量表。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Eg:三个题目难度系数分别为0.5、0.6、0.7, 三个题目之间难度差是否相等?
• 可知第一题最难,第二题次之,第三题最容易 • 难度系数相差都是10%,但并不代表第一题 与
第二题难度只差等于第二题与第三题难度之差
难度系数变换办法
假设每个试题所要测量的潜在特质或能力是呈正 态分布的,然后就可以根据正态分布曲线,将试题 的难度系数P作为正态曲线下的概率面积,转换 成具有相等单位的等距量表,即Z分数(标准分数) 量表。
P值尽量接近0.50 为宜
思考:P等于1或0时,以为着什么,是否还可以 区分被试?
实验表明:
所有题目的难度系数分布在0.30至0.70之间, 并且整个测验的平均难度系数在0.50左右时, 测验对被试有较大的鉴别力,测验分数也 接近正态分布
标准参照测验难度分布
目的是检验被试是否已达到教学目标规定的掌握程度 教师期望学生都能够在教学之后掌握所有的教学内容 通过率达到1.00时,所有学生都掌握了教学内容。 如果教学是有效的,多数试题的难度系数P值都会很大, 难度系数反映的是教学质量的好坏的成分多于试题质量的
二、区分度的计算
1、相关系数法
点二列相关 积差相关
2、用极端分组法计算区分度: D=PH—PL
D表示区分度 PH表示高分组的难度 PL表示低分组的难度
1、相关系数法
该方法的基本思想是,若题目有好的区分度, 则高能力的被试在该题上应得高分,低能力 被试应得低分,即被试在题目上的得分应与 测验总分相一致。
第四章 项目分析
第四章 项目分析
1
第一节 项目的难度
2 第二节 项目的区分度
3 第三节 题目的猜测度与控制
4 第四节 选择题选项分析与修改
心理测量学
第四章 项目
1
第一节 项目的难度
心理测量学
P X / X max
一、难度的定义
难度定义
难度difficulty:指项目的难易程度,即就是 被试完成题目或项目任务时所遇到的困难程度
第5题:Δ=13+4*(-0.25)=12
第6题:Δ=13+4*(-0.59)=9.64
四、题目的难度分布
P的取值范围为:0≤P≤1 当P=0时,试题的实际困难程度最大(所有
的考生都得0分) 当P=l时,试题的实际难度最小(所有的考生
都全对)。
常模参照测验难度分布
要尽可能地区分被试的个别差异,测验结 果就尽可能拉开距离 。
以两端组被试得分率的均值为难度系数
P=(PH+PL)/2
((12))两按从组被高人试分数的往分总下别分找占,,总将找人全出数体高的被分2试组7PPP%:HL者;::。题从由低高目分高低分难组组到分度被被低往试试进高的的行找得得排,分分序找率率。出低分组 (3)分别计算高分组、低分组的被试在该题目上的平均得分。 (4)代入公式分别计算高分组和低分组被试在同一个题目上
难度等距转换实例
题号 1 2 3 4 5 6
答对率 0.15 0.25 0.35 0.40 0.60 0.70
难度Z值 1.04 0.67 0.39 0.25 -0.25 -0.84
难度差异 --
0.37 0.28 0.14 0.50 0.59
思考:
Z分数为负值时,说明 试题难还是容易?
难度等距转换公式
的难度系数。
(5)把 和 代入P=(PH+PL)/2 ,计算这个题目的难度系数。
难度计算实例
例4-1 下表是随机抽取22名被试在某数学测验中四道题目的得分情况,每 题的满分分别为1分、2分、3分和4分,请分析其难度。
哪道题最难?
三、难度系数变换
上述所得难度系数,不论是得分率还是失 分率,都属于顺序变量,不具有相等的单 位,因此,通过p值比较并不能客观指出题 目难度之间的差异大小 。
难度系数 :p
定量刻画被试作答一个题目所遇到的困难程度 的量数,就叫题目的难度系数,也常称为难度
值,用符号P表示。
二、难度系数计P:算题目难方度 法 X拔:被试在某题目上 的平均得分
Xmax:该题目的满分
以全体被试得分率为难度系数
以全体被试通过率为难度系数
P=K/N
P:题目难度
K:答对人数 N:全体被试人数
Z值存在负值不易理解,因此做如下转换
难度Z值转换公式:Δ=13+4Z
Δ:题目难度;Z:由p转换来的标准分数
第1题:Δ=13+4*1.04=17.16
思第考2题::ΔΔ=的13取+4值*0范.67围=1?5.68
第 13-题--:-2Δ5=13+4*0.39=14.56
第4题:Δ=13+4*0.25=14
是评价试题质量,筛选试题的主要指标与依据
区分度的分类
正区分(D>0)
称积极区分,指实际水平高的考生得了高分, 实际水平低的考生得了低分
负区分(D<0),
称消极区分,实际水平高的考生得了低分,实 际水平低的学生得了高分
零区分(D=0)
指实际水平高低与得分之间没有太大的关系, 呈现出零相关
其基本假设是测验得高分的被试即为高能力 被试,测验得低分的被试即为低能力被试。
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(1)点二列相关法
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(2)积差相关法
心理测量学
江西师大心理与教育统计测量中心
2、极端分组法(鉴别指数法)
基本思想:
心理测量学
江西师大心理与教育统计测量中心
3、题目区分度计算实例
例4-2 下表是随机抽取22名被试在某语文测验中四道题目 的得分情况,四题满分分别为1分、3分、5分和60分,其 中第4题为作文题,请计算四心
3、题目区分度计算实例
好坏的成分 不同测验,目的不同,难度值不同。
奥林匹克测验?选择补习功课的学生?
第四章 心理测量的难度与区分度
2 第二节 项目的区分度
心理测量学
一、区分度的定义
定义:
指测验对考生实际水平的区分程度或测验对被 试特质差异的区分能力,用符号D表示。
具有良好区分度的测验,实际水平高的应该得高 分,实际水平低的应该得低分。所以,区分度又 叫鉴别力。
• 可知第一题最难,第二题次之,第三题最容易 • 难度系数相差都是10%,但并不代表第一题 与
第二题难度只差等于第二题与第三题难度之差
难度系数变换办法
假设每个试题所要测量的潜在特质或能力是呈正 态分布的,然后就可以根据正态分布曲线,将试题 的难度系数P作为正态曲线下的概率面积,转换 成具有相等单位的等距量表,即Z分数(标准分数) 量表。
P值尽量接近0.50 为宜
思考:P等于1或0时,以为着什么,是否还可以 区分被试?
实验表明:
所有题目的难度系数分布在0.30至0.70之间, 并且整个测验的平均难度系数在0.50左右时, 测验对被试有较大的鉴别力,测验分数也 接近正态分布
标准参照测验难度分布
目的是检验被试是否已达到教学目标规定的掌握程度 教师期望学生都能够在教学之后掌握所有的教学内容 通过率达到1.00时,所有学生都掌握了教学内容。 如果教学是有效的,多数试题的难度系数P值都会很大, 难度系数反映的是教学质量的好坏的成分多于试题质量的
二、区分度的计算
1、相关系数法
点二列相关 积差相关
2、用极端分组法计算区分度: D=PH—PL
D表示区分度 PH表示高分组的难度 PL表示低分组的难度
1、相关系数法
该方法的基本思想是,若题目有好的区分度, 则高能力的被试在该题上应得高分,低能力 被试应得低分,即被试在题目上的得分应与 测验总分相一致。
第四章 项目分析
第四章 项目分析
1
第一节 项目的难度
2 第二节 项目的区分度
3 第三节 题目的猜测度与控制
4 第四节 选择题选项分析与修改
心理测量学
第四章 项目
1
第一节 项目的难度
心理测量学
P X / X max
一、难度的定义
难度定义
难度difficulty:指项目的难易程度,即就是 被试完成题目或项目任务时所遇到的困难程度
第5题:Δ=13+4*(-0.25)=12
第6题:Δ=13+4*(-0.59)=9.64
四、题目的难度分布
P的取值范围为:0≤P≤1 当P=0时,试题的实际困难程度最大(所有
的考生都得0分) 当P=l时,试题的实际难度最小(所有的考生
都全对)。
常模参照测验难度分布
要尽可能地区分被试的个别差异,测验结 果就尽可能拉开距离 。
以两端组被试得分率的均值为难度系数
P=(PH+PL)/2
((12))两按从组被高人试分数的往分总下别分找占,,总将找人全出数体高的被分2试组7PPP%:HL者;::。题从由低高目分高低分难组组到分度被被低往试试进高的的行找得得排,分分序找率率。出低分组 (3)分别计算高分组、低分组的被试在该题目上的平均得分。 (4)代入公式分别计算高分组和低分组被试在同一个题目上
难度等距转换实例
题号 1 2 3 4 5 6
答对率 0.15 0.25 0.35 0.40 0.60 0.70
难度Z值 1.04 0.67 0.39 0.25 -0.25 -0.84
难度差异 --
0.37 0.28 0.14 0.50 0.59
思考:
Z分数为负值时,说明 试题难还是容易?
难度等距转换公式
的难度系数。
(5)把 和 代入P=(PH+PL)/2 ,计算这个题目的难度系数。
难度计算实例
例4-1 下表是随机抽取22名被试在某数学测验中四道题目的得分情况,每 题的满分分别为1分、2分、3分和4分,请分析其难度。
哪道题最难?
三、难度系数变换
上述所得难度系数,不论是得分率还是失 分率,都属于顺序变量,不具有相等的单 位,因此,通过p值比较并不能客观指出题 目难度之间的差异大小 。
难度系数 :p
定量刻画被试作答一个题目所遇到的困难程度 的量数,就叫题目的难度系数,也常称为难度
值,用符号P表示。
二、难度系数计P:算题目难方度 法 X拔:被试在某题目上 的平均得分
Xmax:该题目的满分
以全体被试得分率为难度系数
以全体被试通过率为难度系数
P=K/N
P:题目难度
K:答对人数 N:全体被试人数
Z值存在负值不易理解,因此做如下转换
难度Z值转换公式:Δ=13+4Z
Δ:题目难度;Z:由p转换来的标准分数
第1题:Δ=13+4*1.04=17.16
思第考2题::ΔΔ=的13取+4值*0范.67围=1?5.68
第 13-题--:-2Δ5=13+4*0.39=14.56
第4题:Δ=13+4*0.25=14
是评价试题质量,筛选试题的主要指标与依据
区分度的分类
正区分(D>0)
称积极区分,指实际水平高的考生得了高分, 实际水平低的考生得了低分
负区分(D<0),
称消极区分,实际水平高的考生得了低分,实 际水平低的学生得了高分
零区分(D=0)
指实际水平高低与得分之间没有太大的关系, 呈现出零相关
其基本假设是测验得高分的被试即为高能力 被试,测验得低分的被试即为低能力被试。
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(1)点二列相关法
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(2)积差相关法
心理测量学
江西师大心理与教育统计测量中心
2、极端分组法(鉴别指数法)
基本思想:
心理测量学
江西师大心理与教育统计测量中心
3、题目区分度计算实例
例4-2 下表是随机抽取22名被试在某语文测验中四道题目 的得分情况,四题满分分别为1分、3分、5分和60分,其 中第4题为作文题,请计算四心
3、题目区分度计算实例
好坏的成分 不同测验,目的不同,难度值不同。
奥林匹克测验?选择补习功课的学生?
第四章 心理测量的难度与区分度
2 第二节 项目的区分度
心理测量学
一、区分度的定义
定义:
指测验对考生实际水平的区分程度或测验对被 试特质差异的区分能力,用符号D表示。
具有良好区分度的测验,实际水平高的应该得高 分,实际水平低的应该得低分。所以,区分度又 叫鉴别力。