第四章-心理测验的难度与区分度(ppt文档)

合集下载

难度与区分度分析课件

难度与区分度分析课件

THA合理安排测验的整体难度和 时间限制,提高测验的区分度。
难度与区分度的关系
难度与区分度的关联性
难度与区分度相互影响
难度较高的题目可能具有较好的区分度,而简单题目往往区 分度较低。
难度与区分度的平衡
在评估试卷或测试的总体效果时,需要平衡难度与区分度, 以确保评估的有效性和可靠性。
优化建议
根据难度分析结果,提出优化任 务或题目的建议,以提高测验的 信度和效度。
区分度分析概述
区分度的定义与计算
区分度的定 义
区分度是指测验题目对不同水平被试 的区分程度,即题目对高水平和低水 平被试的鉴别能力。
区分度的计算方法
常见的计算方法有极端分组法、相关 系数法和回归系数法等。
区分度的影响因素
个性化教学中的应用
随着个性化教学的需求增加,难度与区分度分析的结果可 以应用于教学策略的调整和个性化学习资源的推荐。
与其他指标的综合分析
可以考虑将难度与区分度分析与其他教学质量评价指标相 结合,如信度、效度等,以更全面地评估试题或课程的质 量。
跨文化比较研究
可以开展跨文化比较研究,探讨不同文化背景和教育体系 下难度与区分度分析的共性和差异,以促进国际间的教育 交流和合作。
评估的准确性和可靠性。
实际应用案例
案例一:数学试卷的难度与区分度分析
总结词
2. 区分度分析
通过数学试卷的难度与区分度分析, 可以评估试卷的质量和考生的水平。
通过对比不同水平考生的答题情况, 可以判断试题的区分度,从而鉴别优 秀和一般考生。
1. 难度分析
根据考生答题的正确率,可以判断试 题的难易程度,进而调整试题难度, 提高试卷质量。
难度的影响因素

第四章-心理测验的难度与区分度教案资料

第四章-心理测验的难度与区分度教案资料
其基本假设是测验得高分的被试即为高能力 被试,测验得低分的被试即为低能力被试。
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(1)点二列相关法
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(2)积差相关法
心理测量学
江西师大心理与教育统计测量中心
2、极端分组法(鉴别指数法)
二、区分度的计算
1、相关系数法
点二列相关 积差相关
2、用极端分组法计算区分度:
D表示区分度 PH表示高分组的难度 PL表示低分组的难度
D=PH—PL
1、相关系数法
该方法的基本思想是,若题目有好的区分度, 则高能力的被试在该题上应得高分,低能力 被试应得低分,即被试在题目上的得分应与 测验总分相一致。
(把 和 代入P=(PH+PL)/2 ,计算这个题目的难度系数。
难度计算实例
例4-1 下表是随机抽取22名被试在某数学测验中四道题目的得分情况,每 题的满分分别为1分、2分、3分和4分,请分析其难度。
哪道题最难?
三、难度系数变换
上述所得难度系数,不论是得分率还是失 分率,都属于顺序变量,不具有相等的单 位,因此,通过p值比较并不能客观指出题 目难度之间的差异大小 。
好坏的成分 不同测验,目的不同,难度值不同。
奥林匹克测验?选择补习功课的学生?
第四章 心理测量的难度与区分度
2 第二节 项目的区分度
心理测量学
一、区分度的定义
定义:
指测验对考生实际水平的区分程度或测验对被 试特质差异的区分能力,用符号D表示。
具有良好区分度的测验,实际水平高的应该得高 分,实际水平低的应该得低分。所以,区分度又 叫鉴别力。

第四章 教育测验的难度和区分度

第四章 教育测验的难度和区分度

(2)关于校正问题的争议 围绕校正问题,存在着两种不同的看法: ◆支持者:应校正,排除猜测对难度的影响 理由:①猜测存在会高估测验的信度 ②校正可以反映题目的真实难度 ③校正可以培养被试诚实的美德 ◆反对者:反对进行校正 理由:①猜测并非完全是盲目的 ②不校正对难度的影响不大,约4%左右 (黄国彦,1997),可增加试题数目来解决 ③通过部分知识,合理猜测是值得培养的
主观题计算方法 1.基本公式:
P X X MAX
X :全体被试的平均得分
X
MAX
:题目满分
例3: 一组被试在某道题上的得分分别为:
2、5、9、10、4、8、7、5、3、0
该题满分为10分,则测题难度为多少?
2.极端值公式:
1 P 2
XH X X MAX
L

三、难度值的等距处理 1.P值是反顺序量表,只能表示次序,但不能判 断难度间差异的大小,需将其转化为Z分数。 2.转化方法: 若P 〉0.5,则先求P-0.5,再查表 若P〈 0.5,则先求0.5-P,再查表 若P=0.5,则Z=0 一般,P=0.84,则Z=-1;P=0.16,则Z=1 3.美国教育测验服务社(ETS)的转化 ∆=13+4Z (13,4) ∆量表是以25为上限,1位下限的等距量表。 ∆值越大,难度越高 注:一般情况下,难度的这种转化是非必需的。
3.选择题难度的校正 选择题的一个特点就是容易受猜测的影响, 这就使得答对的比例增加了,使得计算出来的 难度系数增加,高估难度。 (1)校正方法 CP=(KP-1)/(K-1) K:代表测题中可供选择的答案总数 例3:一个测题未经校正前的难度指数为0.5, 可供选择答案为5个,另一题目未经校正的难 度指数为0.53,可供选择答案为4个,试比较 两题的难度。 答案:CP1=0.38 CP2=0.37

第四章 测量信度

第四章  测量信度

五、评分者信度
评分者信度(Scorer
Reliability)指的是
多个评分者给同一批被试作答情况进行评分
的一致性程度。它主要用于主观性作品的评
价过程中,如论述题评分、作文题评分、歌
唱比赛的评分、设计作品的评分等。
评分者信度的计算方法
1、当评分者人数为2时,评分者信度等于两者 评分的相关系数(积差相关或等级相关)。 2、当评分者人数大于2时,评分者信度采用肯 德尔和谐系数计算。 W = 12 [∑R2i –(∑Ri)2 / N] / [ K2 ( N3–N )] 其中K是评分者人数,N是被评的对象数,Ri 是第i个被评对象的被评等级之和。
采用复本信度的条件

要构造出2份或2份以上真正平行的测验。 被试有条件接受两次以上的测验。
复本信度的优缺点
优点:
1、减少了记忆效应和练习效应。 2、适用于追踪研究的多次测量。 3、减少了辅导的可能性。
缺点:
1、编制复本测验的难度较大。 2、被试要有接受两次以上测验的条件和意愿。
三、分半信度
第一节 信度的定义
一、什么是信度

信度指测量结果的稳定性、一致性程度。一个好的 测量工具必须具备好的信度,也就是说它多次测量 的结果应该相对的稳定、一致。

信度反映的是测量中随机误差的大小,随机误差小, 则信度高;反之,则信度低。
测验题目本身并不能提供信度的估计值,信度统计 来自于测验分数。也就是说,在检验信度之前必须 要实施心理测验,以获得测验分数。
遗忘和练习的效果基本相互抵消;(3)在两次施测 的间隔期内,被试所要测查的心理特质没有获得更多 的学习和训练;(4)被试有条件接受两次相同的测 验,取决于时间、经费等因素。

最新心理测量之能力测验教学讲义PPT课件

最新心理测量之能力测验教学讲义PPT课件
Holland's theory argued that "the choice of a vocation is an expression of personality" and that the six factor typology he articulated could be used to describe both persons and work environments.
(1)起源:
在1940年代,美国发展综合性职业性向测验作为 分类和咨商之用,最著名的为所发展出来的普通 性向测验组合
(2)适用对象:
初三到高三的学生及成人,由政府提供给各州就 业辅导处、各学校及其他非营利机构的辅导人员 使用
(3)测验内容:
十二个分测验,测量九种基本因素,这些因 素分别为一般智力(G),语文性向(V),数的 性向(N),空间性向(S),图形知觉(P),文书 知觉(Q),动作协调(K),手指灵巧(F)和手 部灵活(M)。
5.创造能力测验(托浪思创造思考、图形创 造思考)
……...等
不是找出最好的艺术家,而是要找出最原 创,最多的观点。
具有故事情节,传达某种情绪,从不同角 度看待问题,或是有动感的绘画也会得到 较高的分数。
如果反应平庸,分数就会很低。
(2)一般性向测验
1. (General Aptitude Test Battery, GATB)
因素分析得到1.Speed, 2. Verbal/ Math, 3.Techanical Knowledge 另有七种不同组合分数:Academic ability, Verbal, Math, Mechanical
and crafts, Business and Clerical, Electronics and Electrical, Health, Social, and Technology

心理测量4 项目分析

心理测量4 项目分析
24
注意事项
当测验用于选拔或诊断时,应该多选择难度 值接近录取率的项目。 测验为选择题时,难度值应大于随机猜测概 率水平。
难度等于概率水平,说明题目可能太难;或题意 不清,被试凭猜测作答。 难度(通过率)低于概率水平,说明题目有系统 偏差。 是非题难度值0.75时最合适,四选一题目0.63时 最合适。
16
鉴别指数的判断
因为高分组条目总得分上高于低分组,理论上他们每 个条目的通过率也要高于低分组。
D>0时,D越大,说明该条目区分两种水平(组)的 能力越强
D<0则反映高分组的得分反而低于低分组,说明该条 目有问题。
伊贝尔(L. Ebel, 1965)关于鉴别指数评价项目性能 的标准:
鉴别指数(D) 0.40以上 0.30~0.39 0.20~0.29 0.19及以下
11
测验的难度 测验的难度取决于组成测验项目的难度 通过观察测验分数的分布,可以进行直观检验。 如果测验难度适中,分数的分布应当接近常 态分布; 如果测验偏难,分布呈正偏态(图13-4,A) 如果测验偏容易,分布呈负偏态(图13-4,B) 测验偏难或偏容易时,可以通过增加或减少不同 难易程度的条目来解决。
公式:
rpq
Xp Xq St
pq
rpq 点二列相关系数 X p 为与二分变量通过组相对应的连续变量的平均数
X q 为与二分变量未通过组相对应的连续变量的平均数
St 为连续变量的标准差 p 通过组人数与总人数之比(通过率)
q 未通过组人数与总人数之比(未通过率)
举例(例9):
19
二列相关
适用于两个连续变量,但其中一个变量被人为分 成两类。
理论上最大区分度(以总分对半划分高、低分组时)

难度、区分度的概念讲解

难度、区分度的概念讲解

难度?区分度?
项目鉴别力指数与评价标准
鉴别指数D 0.4以上 0.3—0.39 0.2—0.29 0.19以下 项目评价标准 很好 良好,修改后更好 尚可,但需要修改 差,必量的判断指标 了解人员测评项目质量的判断指标 理解难度 区分度、信度、 难度、 理解难度、区分度、信度、效度的概念 熟悉测评误差的来源以及相应的控制方法 掌握测评分数合并的方法
古 代 人 员 测 评 指 标 : • 日常言行---孔子认为,“视其所以,观其所 由,查其所安,人焉痩哉?” • 特定情况下的言行---诸葛亮的“七观法”是 “ 问之以是非,以观其志;穷之以辞,以观 其变;咨之以计谋,以观其识;告之以祸难, 以观其勇;醉之以酒,以观其性;临之以利, 以观其廉;期之以事,以观其信。”
难度?区分度?
一、难度:测评成功与否的关键
• 地板效应---难度过高, 所有被测者的得分都很低 • 天花板效应---难度过低, 所有人得分都很高
难度?区分度?
(一)是非题 被测者在该题上的通过率 R/N× P= R/N×100% R通过的人数,N参加测评的总人数 当参加测评的人数较多时:总分最 高的 27%为高分组,总分最低的27%为低分组。 总体通过率/难度为 P=( P=(PH+PL)/2 PH高分组的通过率,PL低分组的通过率
本素材 由hi-hoo提供
难度?区分度?
• • • •
工作绩效 生理因素及其特征 服饰等外在客观因素 从五行阴阳等中介标志
本素材 由hi-hoo提供
难度?区分度?
第一节 测评项目质量的测评方法
人员测评的目的: 人员测评的目的: 区分很能干的人和能力一般 很能干的人和能力一般的人 区分很能干的人和能力一般的人 如何判断一个测评的质量? 如何判断一个测评的质量?

最新第四章-心理测验的难度与区分度ppt课件

最新第四章-心理测验的难度与区分度ppt课件
理论分析的意义 ①从经验数据中抽象出理论概念、概括现象的本质特征 ②通过对调查数据或统计分析结果的深入分析,发现问题的症结
所在,找出问题的关键点、从而提出解决问题的思路和对策。
理论分析的特征
理论分析的突出特点有:
(1)概括性和揭示性。 (2)解释性和系统性。 (3)间接性和抽象性。
二、理论分析在社会调查中的作用
四、区分度与测验信度、难度的关系
区分度与难度关系
难度(P)
1.00 0.90 0.70 0.50 0.30 0.10 0.00
区分度的最大值 0.00 0.20 0.60 1.00 0.60 0.20 0.00
由上表可知,难度适中,可使区分度达到 最大值。
五、影响题目区分度的因素
(1)题目难度 (2)被试群体的同质性 (3)全卷各题所测心理品质的一致性。 (4)题目本身的文字与内容的质量也会
四、题目的难度分布
P的取值范围为:0≤P≤1 当P=0时,试题的实际困难程度最大(所有
的考生都得0分) 当P=l时,试题的实际难度最小(所有的考生
都全对)。
常模参照测验难度分布
要尽可能地区分被试的个别差异,测验结 果就尽可能拉开距离 。
P值尽量接近0.50 为宜
思考:P等于1或0时,以为着什么,是否还可以 区分被试?
Eg:三个题目难度系数分别为0.5、0.6、0.7, 三个题目之间难度差是否相等?
• 可知第一题最难,第二题次之,第三题最容易 • 难度系数相差都是10%,但并不代表第一题 与
第二题难度只差等于第二题与第三题难度之差
难度系数变换办法
假设每个试题所要测量的潜在特质或能力是呈正 态分布的,然后就可以根据正态分布曲线,将试题 的难度系数P作为正态曲线下的概率面积,转换 成具有相等单位的等距量表,即Z分数(标准分数) 量表。

心理测验的难度与区分度课件

心理测验的难度与区分度课件

目标人群的各种情况。
难度与区分度在心理测验修订中的应用
定期修订心理测验
根据实践反馈和理论依据,定期对测验进行修订,以保持其效度 和信度。
难度与区分度的调整
根据修订结果,对测验的难度和区分度进行必要的调整,以优化测 验性能。
验证修订后的测验
对修订后的测验进行充分验证,以确保其能够有效地评估目标人群 的心理特质和行为表现。
高区分度的题目能够更好地识 别被试的优点和不足,有助于
指导个体的发展和干预。
低区分度的题目则难以准确区 分被试的不同水平,影响测验
的有效性和可靠性。
区分度是编制心理测验的重要 指标之一,对于评估和改进心
理测验具有重要意义。
04
心理测验的难度与区分度 关系
难度与区分度的关系
难度和区分度是心理测验中两 个重要的指标,它们之间存在 密切的关系。
难度与区分度在心理测验解释中的应用
1 2 3
解释测验分数
根据测验的难度和区分度,为个体提供准确的分 数解释,以帮助他们了解自己的心理特质和行为 表现。
提供反馈和建议
根据个体的情况,为个体提供有针对性的反馈和 建议,以帮助他们改善自己的心理状态和行为表 现。
应用于实践
将心理测验及其解释结果应用于实际情境中,如 选拔、培训、心理咨询等,以支持个体的职业发 展和个人成长。
通过实测数据统计、专家评审等方 法,对测验题目的难度水平进行评 估,以保证测验质量。
03
心理测验的区分度分析
区分度概念的界定
区分度是指测验题目对被试心理 品质的鉴别能力。
区分度是衡量题目质量的主要指 标之一,也是编制心理测验的重
要环节。
区分度高的题目能够较好地区分 被试的心理品质,低区分度的题

题目的区分度分析ppt课件

题目的区分度分析ppt课件

▪ (二)区分度的计算方法
▪ 1.鉴别指数法
▪ (1)按测验总分的高低排列答卷;
▪ (2)确定高分组和低分组,各取27%;
▪ (3)分别计算出两组的通过率
▪ (4)按下面公式计算

D= ph pl
▪ 其范围在-1.00~+1.00之间。+1.00表示鉴别指 数最高,—1.00表示鉴别指数最低。鉴别指数越 高,题目的鉴别性能即区分能力越好。
应得分数x)
P值越大,难度越小。
▪ (3)极端分组法:以高低分组(27%)平均通过率表示的难度。


P= ph pl
2

(ph =高分组的通过率; pl =低分组的通过率)
▪ 例1:200人参加某项测验,在一填空题上高分组48人通 过,低分组23人通过。试问该题的难度值是多少?

P=0.66
▪ 例2:在一次测试中,高分组与低分组各有27人。其中高 分组答对第一题的有20人,低分组答对第一题的有10人。 试问该题的难度是多少?
▪ 1)点二列相关 r pbi 系数(客观题)
▪ 2)二列相关(主观题) ▪ 3)Φ相关(两个二分变量)
三、项目区分度与难度的关系
▪ 难度是区分度的必要条件。一般来说,难度越接近0.50, 项目的区分度越大,难度越接近1.00或0时,项目的区分度 越小。
▪ 难度和区分度都是相对的,是针对一定的团体而言的,绝 对的难度和区分度是不存在的。
▪ 一般而言,使项目的平均难度接近0.50,而各个项目的 难度在0.50± 0.20之间变化。
▪ (二)测验的难度
▪ 测验的难度依赖于顶目的难度。 ▪ 测验难度影响测验分数的分布形态。如果受测样本具有代
表性,对于中等难度的测验,其分布应接近常态。

第四章 测验信度、效度、区分度及难度

第四章 测验信度、效度、区分度及难度

课堂教学规范化培训内容之三教学测验及其分析河南中医学院教务处2005-5-25第一部分测验题目类型及编制测验总是由一系列的题目构成的,测验题目可以说是测验的基本构成元素。

在一个测验中,题目编制恰当与否直接关系到整个测验的质量与效果。

只有正确地掌握不同类型试题的测试功能及命题方法,才能根据考试的目的和要求,正确地选择合适的题型并编制出高质量的试题,组成高质量的测验试卷。

教师的工作就是进行教学,善于利用测验的教师才是更好的教师。

有效的测验能改善一位教师的教学效果。

测验题目基本上分为两大类:选择――反应型和建构――反应型。

前者一般要求被试者在几个选项中选择正确的答案,如是非题、匹配题、选择题等,后者要求被试者自己提供答案,如作文题、简答题、填空题等。

若根据被试作答的范围和评分方法不同,又可称为主观性试题和客观性试题。

客观性试题是因为客观评分而得名,在测验前就已准备好了正确答案,不同评分者的独立评分,所得结果基本上是相同的。

主观性试题主要包括论述题、操作题和作文题等。

它们适合于测量较高层次的教学目标,尤其是适合于测量综合、评价等目标层次的内容。

一、选择――反应性试题测验总是与题目有关,教师选择的题目类型一定切合他们打算做的推论,同时也要确保这些推论和教师的教育决策直接相关。

编制选择――反应测验题目的方法主要涉及编写选择题、判断题、多重判断题、匹配题等。

这些题型可以帮助教师有效地了解学生的认知状态――也就是对所教授的知识和技能的掌握情况。

选择――反应性试题一般就是我们所说的客观性试题。

从客观性试题角度来看,一般适用于测量知识的掌握、理解、应用、分析几个层次的教学目标。

客观性试题的答案明确,作答简便,因而在限定的时间内测验可以包含足够数量的试题,能保证对知识内容的覆盖。

㈠选择题选择测验题(multiple-choice test item)一直主导着各个国家的学业成就测验。

选择题可以用来考查学生知识的掌握或更高层次的思维能力。

心理测量:测验题目的难度与难度分布控制

心理测量:测验题目的难度与难度分布控制

控制试卷难度分布是在控制题目难度的前提下进行的,它主要是通过控制不同难 度题目的比例来达到所需的难度分布。
选拔性测验 常模参照测验 标准参照测验
难、易题目所占比例应充分考虑选拔的比例
中等难度题目的比例要高, 而偏难偏易的题目比例要低
不同难度题目的比例应结合“目标”本身来确定
三、合理难度分布及其控制
二、难度的计算方法
二、难度的计算方法
(一)得分率法 得分率指所有被试在该题目上的平均得分占题目满分的百分比。 计算公式为:
二、难度的计算方法
的取值范围为[0,1] 的值越大,题目越容易;值越小,题目越难。
二、难度的计算方法
(二)极端分组法 根据测验总分排序 高低分组 高分组和低分组的得分率 两组得分率的均值
2.对试卷难度分布的控制
控制试卷难度分布是在控制题目难度的前提下进行的,它主要是通过控制不同难 度题目的比例来达到所需的难度分布。
共同学习,未来可期
3 难度对题目区分度的影响
题目过难或过易均会导致题目的区分度很低, 只有题目难度适中时才可能有较高的区分度。
三、合理难度分布及其控制
(二)合理难度及合理难度分布
取决于测验的目的及所测特质的性质等多方面因素。 在常模参照测验中,对所有被试而言,合理项目难度为0.5左右,
分布范围应控制在0.3至0.7之间。 在标准参照测验中,对于恰好合格的被试而言。难度为0.5左右,

过难
过易
三、合理难度分布及其控制
2 难度对测验分数离散程度的影响
测验过难或过易,被试间的差异较小,即测验分数的离散程度很小。 只有当测验趋近中等难度时,测验分数分布范围较广,离散程度才会较大。 分数分布范围较广,测验信度较高,反之信度较低。 题目难度集中在0.5附近最佳,集中在两端最差。

测验评价的难度与区分度

测验评价的难度与区分度

难度与区分度
在测验评价过程中常有一个难度和区分度的问题,通常所说的难度是指试题或试卷难易程度的指标,而且相对于被试的该批考生而言,其计算方法如下:
(1)客观性试题的难度计算:通常用通过率来衡量。

P=R/N×100%(P为通过率,R为答对或通过该题目的人,N为全体考生数)
(2)主观性试题的难度计算:
P=X/W×100%(P为通过率,X为被试在某一试题上的平均分,W为该题的满分)
(3)整个试卷的难度计算:试卷的难度是指一份试卷的总体难易程度,其由试卷中每道题的难度决定。

其计算办法为:将每道题目的难度与满分值相乘的积相加,然后将其总和除以试卷的满分值,所得的商即为整个试卷的难度。

区分度是指区分测验试题对考生实际水平的区分程度,其取值范围介于−1.00和+1.00之间。

(1)客观性试题的区分度计算:
D=Ph-Pl(D为区分度,Ph为高分组通过率,Pl为低分组通过率。

注:将被试依照总分从高到低排列,然后将总分最高的27%和最低的27%的被试分别定为高分组和低分组。


(2)主观性试题的区分度计算:
D=(XH-XL)/N(H-L)(XH为高分组总分, XL为低分组总分,H为该题最高分,L为该题最低分,N为考生总人数的25%)
(3)整个试卷的区分度计算:试卷的区分度是指一份试卷总体对学生的区分程度。

其计算办法为:将每道题目的区分度与满分值相乘的积相加,然后将其总和除以试卷的满分值,所得的商即为整个试卷的区分度。

上述标准也常是在设计测验试卷过程中所要考虑的。

难度值区分度计算(共17张PPT)

难度值区分度计算(共17张PPT)
第2页,共17页。
一、难度计算和难度的计算方法
1.难度计算
难度是衡量试卷难易程度的指标,即试题 的通过率作为难度的指标。用字母P表示。
检测题目的难易度就能测出试卷的难易度。 要测出试卷的难度,先要测出试题的难度。整 个试卷的难度等于所有试题难度的平均值.8试题太易,P<0.2太难。一份 试卷应该由不同的难度按一定的比例组成,一般: (1)P>0.8、P<0.2的试题各占5%,
难度值区分度计算
第1页,共17页。
试卷的难度和区分度及其计算方法
平时的测验,主要是检测学生对章节知识的掌握情况,着 重基础知识的巩固与应用,难度小。期中,期未考试就不同 了,考察的知识覆盖半学期或一学期所学的内容,试题综合 性较强、较活,比平时试验难度大。初中阶段终结性考试- --中考,既是毕业水平考试,又是选拨考试,为高中学校 提供一个招生的重要依据。这样试卷就有一定的难度,题多 面广且灵活,各试题的难度不同,要面向大多数学生,难度 要适中,即要给学生以得分的基础,又要给学生可以充分发 挥的空间。那么怎么把握好试度的难易度呢?又怎样检测试 卷的难易度为较好呢?
:D=(27%高分组3的平均分-27完%低形分组填的空平均分)÷满分值0.462
0.629
0.589
0.4812
平时的测验,主要是检测学生对章节知识的掌握情况,着重基础知识的巩固与应用,难度小。
难让度好是 生衡更量优试,卷差难生4易进程步度,的中指等标生阅上,即档试读次题。理的通解过率作为难度的0指.标51。6
对一个试题的考试成绩采用不同的方法计算所得到的 区分度的值是不同的。整个试卷的区分度是所有试题 区分度的平均值。
第10页,共17页。
2004年中考英语
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Eg:三个题目难度系数分别为0.5、0.6、0.7, 三个题目之间难度差是否相等?
• 可知第一题最难,第二题次之,第三题最容易 • 难度系数相差都是10%,但并不代表第一题 与
第二题难度只差等于第二题与第三题难度之差
难度系数变换办法
假设每个试题所要测量的潜在特质或能力是呈正 态分布的,然后就可以根据正态分布曲线,将试题 的难度系数P作为正态曲线下的概率面积,转换 成具有相等单位的等距量表,即Z分数(标准分数) 量表。
P值尽量接近0.50 为宜
思考:P等于1或0时,以为着什么,是否还可以 区分被试?
实验表明:
所有题目的难度系数分布在0.30至0.70之间, 并且整个测验的平均难度系数在0.50左右时, 测验对被试有较大的鉴别力,测验分数也 接近正态分布
标准参照测验难度分布
目的是检验被试是否已达到教学目标规定的掌握程度 教师期望学生都能够在教学之后掌握所有的教学内容 通过率达到1.00时,所有学生都掌握了教学内容。 如果教学是有效的,多数试题的难度系数P值都会很大, 难度系数反映的是教学质量的好坏的成分多于试题质量的
二、区分度的计算
1、相关系数法
点二列相关 积差相关
2、用极端分组法计算区分度: D=PH—PL
D表示区分度 PH表示高分组的难度 PL表示低分组的难度
1、相关系数法
该方法的基本思想是,若题目有好的区分度, 则高能力的被试在该题上应得高分,低能力 被试应得低分,即被试在题目上的得分应与 测验总分相一致。
第四章 项目分析
第四章 项目分析
1
第一节 项目的难度
2 第二节 项目的区分度
3 第三节 题目的猜测度与控制
4 第四节 选择题选项分析与修改
心理测量学
第四章 项目
1
第一节 项目的难度
心理测量学
P X / X max
一、难度的定义
难度定义
难度difficulty:指项目的难易程度,即就是 被试完成题目或项目任务时所遇到的困难程度
第5题:Δ=13+4*(-0.25)=12
第6题:Δ=13+4*(-0.59)=9.64
四、题目的难度分布
P的取值范围为:0≤P≤1 当P=0时,试题的实际困难程度最大(所有
的考生都得0分) 当P=l时,试题的实际难度最小(所有的考生
都全对)。
常模参照测验难度分布
要尽可能地区分被试的个别差异,测验结 果就尽可能拉开距离 。
以两端组被试得分率的均值为难度系数
P=(PH+PL)/2
((12))两按从组被高人试分数的往分总下别分找占,,总将找人全出数体高的被分2试组7PPP%:HL者;::。题从由低高目分高低分难组组到分度被被低往试试进高的的行找得得排,分分序找率率。出低分组 (3)分别计算高分组、低分组的被试在该题目上的平均得分。 (4)代入公式分别计算高分组和低分组被试在同一个题目上
难度等距转换实例
题号 1 2 3 4 5 6
答对率 0.15 0.25 0.35 0.40 0.60 0.70
难度Z值 1.04 0.67 0.39 0.25 -0.25 -0.84
难度差异 --
0.37 0.28 0.14 0.50 0.59
思考:
Z分数为负值时,说明 试题难还是容易?
难度等距转换公式
的难度系数。
(5)把 和 代入P=(PH+PL)/2 ,计算这个题目的难度系数。
难度计算实例
例4-1 下表是随机抽取22名被试在某数学测验中四道题目的得分情况,每 题的满分分别为1分、2分、3分和4分,请分析其难度。
哪道题最难?
三、难度系数变换
上述所得难度系数,不论是得分率还是失 分率,都属于顺序变量,不具有相等的单 位,因此,通过p值比较并不能客观指出题 目难度之间的差异大小 。
难度系数 :p
定量刻画被试作答一个题目所遇到的困难程度 的量数,就叫题目的难度系数,也常称为难度
值,用符号P表示。
二、难度系数计P:算题目难方度 法 X拔:被试在某题目上 的平均得分
Xmax:该题目的满分
以全体被试得分率为难度系数
以全体被试通过率为难度系数

P=K/N
P:题目难度
K:答对人数 N:全体被试人数
Z值存在负值不易理解,因此做如下转换
难度Z值转换公式:Δ=13+4Z

Δ:题目难度;Z:由p转换来的标准分数
第1题:Δ=13+4*1.04=17.16
思第考2题::ΔΔ=的13取+4值*0范.67围=1?5.68
第 13-题--:-2Δ5=13+4*0.39=14.56
第4题:Δ=13+4*0.25=14
是评价试题质量,筛选试题的主要指标与依据
区分度的分类
正区分(D>0)
称积极区分,指实际水平高的考生得了高分, 实际水平低的考生得了低分
负区分(D<0),
称消极区分,实际水平高的考生得了低分,实 际水平低的学生得了高分
零区分(D=0)
指实际水平高低与得分之间没有太大的关系, 呈现出零相关
其基本假设是测验得高分的被试即为高能力 被试,测验得低分的被试即为低能力被试。
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(1)点二列相关法
心理测量学
江西师大心理与教育统计测量中心
1、相关系数法
(2)积差相关法
心理测量学
江西师大心理与教育统计测量中心
2、极端分组法(鉴别指数法)
基本思想:
心理测量学
江西师大心理与教育统计测量中心
3、题目区分度计算实例
例4-2 下表是随机抽取22名被试在某语文测验中四道题目 的得分情况,四题满分分别为1分、3分、5分和60分,其 中第4题为作文题,请计算四心
3、题目区分度计算实例
好坏的成分 不同测验,目的不同,难度值不同。
奥林匹克测验?选择补习功课的学生?
第四章 心理测量的难度与区分度
2 第二节 项目的区分度
心理测量学
一、区分度的定义
定义:
指测验对考生实际水平的区分程度或测验对被 试特质差异的区分能力,用符号D表示。
具有良好区分度的测验,实际水平高的应该得高 分,实际水平低的应该得低分。所以,区分度又 叫鉴别力。
相关文档
最新文档