项目反应理论
[心理测验]IRT理论(ItemResponseTheory)
IRT理论(Item Response Theory)IRT理论概述IRT理论即项目反应理论(Item Response Theory, IRT),又称题目反应理论、潜在特质理论(Item Response Theory)是一系列心理统计学模型的总称。
IRT是用来分析考试成绩或者问卷调查数据的数学模型。
这些模型的目标是来确定的潜在心理特征(latent trait)是否可以通过测试题被反应出来,以及测试题和被测试者之间的互动关系。
目前广泛应用在心理和教育测量领域。
项目反应理论的意义在于可以指导项目筛选和测验编制。
项目反应理论假设被试有一种“潜在特质”,潜在特质是在观察分析测验反应基础上提出的一种统计构想,在测验中,潜在特质一般是指潜在的能力,并经常用测验总分作为这种潜力的估算。
项目反应理论认为被试在测验项目的反应和成绩与他们的潜在特质有特殊的关系。
通过项目反应理论建立的项目参数具有恒久性的特点,意味着不同测量量表的分数可以统一。
项目反应理论通过项目反应曲线综合各种项目分析的资料,使我们综合直观地看出项目难度、鉴别度等项目分析的特征,从而起到指导项目筛选和编制测验比较分数等作用。
项目反应理论的特点(1)独立性。
被试特质水平不依赖于被试样本的代表性;被试水平参数不依赖于测验项目组;项目特征参数不依赖于所测被试组的参数不变测验项目组。
(2)项目理论中被试水平和项目难度可以直接比较;(3)正视了测量误差和项目性能是否与被试水平相关这一事实;(4)提供了计算机化自适应测验这一策略;(5) 从计量学角度提出了自己的新观点与新技术。
历史发展IRT理论发端于20世纪50年代,它同时被丹麦统计学家Georg Rasch和美国心理统计学家Frederic M. Lord在各自的国家发展起来。
尽管采取的研究方法不同,但是他们的结果却非常相似。
F. Lord在1951年从普林斯顿大学毕业时的博士论文《A Theory of Test Scores》被认为是IRT 理论的开端之作。
项目反应理论简介
项目反应理论简介摘要:项目反应理论(IRT)是近三十年发展起来的一种比较先进的心理与教育测验理论,受到国内外许多学者和专家的关注。
与经典测验理论相比,项目反应理论在较强的前提假设下,有更多的优越性。
关键词:经典测验理论;项目反应理论;项目特征曲线;罗氏模型一、引言目前,考试系统题库的建立主要基于两种指导理论:经典测验理论(Classical Test Theory, CTT)和项目反应理论(Item Response Theory, IRT)。
二者都有一套完整的试题分析指标体系和评价标准。
但经过长期实践,经典测验理论显示出某些难以克服的缺点,如由不同测试项组成的测验其结果无法比较,数据没有等距性,测量结果容易受到样本的影响,以及多个变量不易同时处理等。
针对这些,现代测验理论应运而生。
在国外已广泛应用于教育测验领域,如GRE,GMAT,TOEFL等测验,近年来也扩展应用到其他学科领域的测验评估。
Baker (2001)认为,在经典测验理论指导下,测试学家关心的是被试的测试得分,即每个正确测试项的分值总和。
而项目反应理论的关注重点则是被试是否答对每个测试项,而不是被试的测试总分。
项目反应理论和经典测验理论在数学模式、基本假设和测验可靠程度的估计指标等方面都存在着明显的差别。
与经典测验理论相比,项目反应理论在较强的前提假设下,有更多的优越性。
二、项目反应理论项目反应理论,也称潜在特质理论、潜在特质模型、强真值理论,是一种现代心理测量理论,是一系列心理统计学模型的总称,是针对经典测量理论的局限性提出来的。
项目反应理论是用来分析考试成绩或者问卷调查数据的数学模型,这些模型的目标是来确定潜在心理特征(latent trait)是否可以通过测试题被反应出来,以及测试题和被试之间的互动关系。
项目反应理论假设被试对项目的反应能体现他的潜在特质(Baker, 2001)。
根据被试回答测试项的情况,通过对项目特征函数的运算,来推测被试的能力。
项目反应理论的形成与基本理论假设
项目反应理论的形成与基本理论假设项目反应理论(Item Response Theory, IRT)是针对测试和评价领域中的一种方法和理论,旨在解决测量数据分析过程中的一系列问题,如测验题目类型、人群不同表现和不同测量精度等等。
该理论由多位统计学家和心理学家共同发展而来,包括Lord和Novick(1968), Hambleton、Swaminathan和Rogers (1991), Kolen 和Brennan(2014)等人。
项目反应理论早期起源于功效曲线(曲线上(Y-坐标)表示试题难度,X-坐标表示受试水平)。
1927年,美国心理学家Thurstone对于智力测验中的单项选择题目进行了功效曲线的研究。
1933年,Lazarsfeld和Henry对于记忆实验数据的分析中提出了多因素问题的解决方案(在Lazarsfeld和Henry的研究中最初称为Comparative-Quality Scale Technique Method)。
而当广义线性模型(GLM)在20世纪70年代发明出来之后,它便成为了许多现代IRT方法的基础。
IRT理论在假设中有一些基本前提,其包含了三个主要部分:1. 题目模型。
IRT模型的第一个基本假设是关于题目模型的,即问卷或试卷的测量者需要选择一种反映题目表现的模型。
IRT中最著名的四个模型是二维常识模型(2PLM),一维常识模型(1PLM),三维常识模型(3PLM)和一维等角模型(1PLU)等,试卷数据可以使用这些模型进行模型拟合和解释。
2.人群模型。
IRT的第二个基本假设是关于受试者或群体模型的,即每个被试的特定水平对于含有该要素的题目反应是有效的,以及这种特定水平可以准确地衡量被试者的表现水平,和题目的等级和难度水平有一定的相关性。
3.数据模型。
IRT的第三个基本假设是关于数据模型的,即用户可以基于现有数据拟合合适的IRT模型,通过分析测试中正确答案的项分布情况来优化题目的构成,以适应用户的需求。
项目反应理论简介
尽管存在以上缺点,CTT仍在广泛地应用。 CTT、IRT和概化理论是当今最有影响的三 种测验理论。 简单地说,IRT在处理微观问题(即被试水 平与答题目之间的实质性关系)时优势明显, CTT在处理中观问题(如处理常见的标准化 考试等)时方便易懂,GT则在处理宏观问题 (如对结果作推论)时更显出色。 三种测验理论体系有内在联系,各有长短, 应相互促进,互相补充。
理论方法体系相对完整 前提假设比较弱 所涉及到的数学模型以及参数的概念和估 计方法易理解和掌握 标准化技术在控制测验误差等方面有明显 的效果
2、CTT在理论体系和方法体系方面存在许多 其本身难以克服的缺点,具体表现为:
基本假设难以成立:①真分数与观测分数间 存在线性关系的假定不合理;②平行测验的 假设难以成立;③误差与真分数独立的假设 难以满足。
不同的是,CTT是以被试对所有测验项目的 反应总和(测验总分)为显变量来预测被试 的潜在特质的,并不认为被试对单个项目的 反应 与其特质间有任何有意义的联系。
IRT则认为被试的能力与其对某一特定项目的 反应(以正确或错误反应概率表示)有某种函 数关系存在,确定这种关系就是IRT的基本思 想和出发点。
二、IRT的基本理论体系
(一)、概念 (二)、基本思想及基本思路 (三)、基本理论假设
(一)、概念
项目反应理论(Item Response Theory,简称 IRT),又称潜在特质理论(Latent Trait Theory) 或项目特征曲线理论(Item Characteristic Curse Theory),是为了克服经典测验理论(CTT)的局 限而提出的现代测验理论。 从测验的内部或微观方面入手,采取数学建模和 统计调整的方法,重点讨论被试的能力水平与测 验项目之间的实质性关系,测验的每一个项目都 有自己的项目特征曲线,描述了每一个特定能力 水平的被试答对或答错该项目的概率。
项目反应理论
项目反应理论任何一种理论都不可能是完美无缺的,作为测量初期发展起来的理论更是不可避免地存在着一些缺陷。
项目反应理论(Item Response Theory, IRT)则是在反对和克服传统测量理论的不足之中发展起来的一种现代测量理论。
无论是CTT还是GT,其测验内容的选择、项目参数的获得和常模的制定,都是通过抽取一定的样本(行为样本或被试样本),因此可以说二者都建立在随机抽样理论基础之上。
它们的局限性主要表现在以下几个方面:(1)信度估计的精确性不高测量的重要目标就是降低测量误差,提高测量的精度。
在经典测量理论中,信度被定义为真分数的方差与实得分数(原始分数)的方差之比。
然而,在此定义中,真分数的方差和误差的方差都无法求取。
为了估计信度,CTT又提出了平行测验的概念,并在此基础上推演出了若干个信度估计公式。
但是严格的平行测验是不存在的,等价测验也很难获得的,在此基础上估计的测验信度很难达到比较高的精确程度。
另外,经典测量理论中的信度估计值也是一个笼统值,即假定对不同能力水平的被试来说,测量的误差是相同的。
而事实是,一份测验只有在施测于能力水平与测验难度相当的被试时容易获得比较高的测量精确度。
当测验施测于能力水平高于(或低于)测验难度的被试时就容易产生较大的测量误差。
而且测量误差值会随着被试水平与测验难度距离的增加而变大。
(2)各种测量参数的估计依赖于被试样本经典测量理论构造了一个完整的理论体系,同时设计了一套参数指标来刻划测量各方面的特性。
如信度、效度、项目的难度、区分度等。
但是这些参数的估计对样本的依赖性是很大的。
如项目难度,对于同一题目,若样本的群体水平较低,就有较高的难度估计值。
测验的信度和效度采用相关分析法,同样受到样本的影响。
为避免抽样误差对参数估计的影响,经典测量理论特别强调样本对总体的代表性。
但经典理论所用的是随机抽样,随机抽样总有一定偏差存在。
何况在实际工作中,由于客观条件的限制,还不能做到随机抽样。
项目反应理论与认知诊断的统计推断方法
1、跨领域应用:将项目反应理论和认知诊断方法应用到更多领域,如医学、 社会调查、人力资源等领域,拓展其应用范围和使用价值。
2、精细化建模:针对不同领域和实际问题的特点,开发更加精细化和个性 化的统计推断模型,以更好地满足实际需求。
3、数据科学方法:结合数据科学领域的新方法和新技术,如机器学习、深 度学习等,提高统计推断的精度和效率,为实践提供更加可靠的支持。
3、结果解释方面,需要对模型结果进行充分解释,以便更好地理解和利用 模型结果。可以结合实际问题和数据的特点,制定合理的解释方式和指标,对模 型结果进行深入分析,以便更好地指导实践和应用。
五、结论与展望
本次演示介绍了项目反应理论与认知诊断的统计推断方法及其应用,包括项 目反应模型、认知诊断模型、参数估计与检验等,并通过例题和数据讲解了方法 的具体应用。还分析了统计推断方法面临的挑战和相应的解决方案。随着技术的 发展和应用领域的扩展,未来研究可以以下几个方面:
3、参数估计与检验
在应用项目反应理论和认知诊断模型时,需要对模型参数进行估计和检验。 常见的参数估计方法包括最大似然估计、期望最大化算法等,检验方法则包括拟 合度检验、模型稳定性检验等。参数估计与检验可以确保模型的适用性和精度。
三、方法应用
1、考试成绩分析
通过应用项目反应理论,可以对考试成绩进行全面分析。例如,教育机构可 以利用项目反应理论对试题难度、区分度等进行分析,以便更好地设计试题和评 估学生的学习水平。此外,项目反应理论还可以用于学生的能力估计和学科优势 识别等方面。
项目反应理论与认知诊断的统计推 断方法
目录
01 一、项目反应理论与 认知诊断的简介
02 二、统计推断方法
03 三、方法应用
04 四、挑战与解决方案
IRT项目反应理论
主题研究背景
早期研究
早期研究主要集中在理论 模型的建立和验证。
当前研究
当前研究更加关注实际应 用,如在线测验、自适应 测验等。
未来展望
未来研究将进一步探索IRT 与其他技术的结合,如人 工智能、大数据等。
02
IRT项目反应理论概述
定义与概念
定义
IRT项目反应理论,也称为潜在特质理论或潜在特质模型,是一种心理测量理 论,用于描述个体在特定测验项目上的潜在特质水平与其行为表现之间的关系。
概念
IRT假设个体在某个潜在特质上的水平是连续的,并且个体在某个测验项目上的 表现是由其潜在特质水平决定的。
发展历程
起源
IRT起源于20世纪50年代,由美国心理学家伯恩斯和 金纳德提出。
THANKS
感谢观看
IRT通过建立与能力水平相对应的难度参数,能够准确地衡量学生在不同 学科领域的能力水平,从而为个性化教学和辅导提供依据。
IRT还可以用于评估学生的认知能力、学习能力和情感能力等,帮助教师 全面了解学生的发展状况,为制定教学计划和干预措施提供依据。
课程设计与优化
IRT在课程设计与优化方面也具有重要应用。通过分析学生的能力分布和项目难度参数,教师可以对课 程进行针对50年代, 随着计算机技术的发展而 逐步完善。
应用领域
广泛应用于教育、心理学、 人力资源等领域。
主题重要性
提高测验精度
IRT可以帮助研究者更准确地测量个体的能力水平, 从而提高测验的精度。
个性化教学
通过IRT,教师可以了解学生的学习需求和能力水 平,从而进行个性化教学。
人才选拔
03
项目反应理论【精选文档】
项目反应理论随着心理学的发展, 心理测量无论是在理论上, 还是在方法上都逐步地提高.目前,心理测量有三大理论派别:经典测量理论(Classical Test Theory , 简称CTT) ,项目反应理论(Item Response Theory ,简称IRT) 和概化理论(Generalizability Theory , 简称GT).项目反应理论是一种先进的测量理论,它是针对经典测量理论的不足而提出来的, 其理论基础是潜在特质理论。
项目反应理论的基本思路是确定考生的心理特质值和他们对于项目的反应之间的关系, 这种关系的数学形式就是“项目反应模型”。
下面主要对项目反应的理论假设和数学模型做一下简要概述。
一、项目反应理论的基本假设任何一种数学模型都有一定的前提,任何一种测量都有一定的假设,在项目反应理论中也有三条最基本的假设:潜在特质空间的单维性假设、测验项目间的局部独立性假设、项目特征曲线假设.有的学者还增加了“知道—-答对"假设和非速度限制假设。
在此仅说明前面三条最基本的假设.1、潜在特质空间的单维性假设潜在特质空间是指由心理学中的潜在特质组成的抽象空间。
如果考生在测验项目上的反应是有K种潜在特质所决定的,那么这些潜在特征就定义了一个K维潜在空间,考生的各个潜在特质分数综合起来,就决定了该考生在该潜在空间的位置。
如果影响考生测验分数的所有重要的心理特质都被确定了,那么该潜在空间就称为完全潜在空间。
目前比较成熟的大多数项目反应模型都假设完全潜在空间是单维的,即只有一种潜在特质决定了考生对项目的反应,也就是说组成某个测验的所有项目都是测量的同一个心理变量,例如知识、能力、态度或人格。
当然,这一假设往往不可能得到严格的满足,因为总有其他因素会影响到考生在测验上的反应,这些因素包括认知的、人格的和施测时的客观条件,以及考生的动机水平、焦虑程度、反应速度和考试技巧等。
因此在项目反应理论中,只要所预测量的心理特质是影响考生对项目作出反应的主要因素,那么就认为这组测验数据是满足单维假设的.2、测验项目间的局部独立性假设所谓局部独立性假设是指某个考生对于某个项目的正确概率不会受到他对于该测验中其他项目反应的影响,也就是说只有考生的特质水平和项目的特性会影响到考生对该项目的反应.在实际的教育和心理测量问题中, 如果前一个项目的内容为后一个项目的正确反应提供暗示或其它有效的信息,局部独立性的假设就会遭到破坏,例如所谓的链状试题就会出现这种情况.局部独立性是建立在统计的意义上的,用统计学的语言,局部独立性是指对每一个测验者来说, 对整个试题作出某种反应的概率等于对组成试卷的每个项目的反应的概率的乘积.3、项目特征曲线假设项目反应理论的一个关键就是在被试者对项目作出的反应或作出反应的概率与被测试者的潜在特质之间建立某种函数关系。
项目反应理论简介
( x0 , f ( x0 ))
注意:迭代过程不可能无休止地进行下去,必须设定一个终止规则, 常用的终止规则是,当相邻的两个迭代近似值之间的差异小于某个预
先设定值(如0.01)时,迭代过程终止。
x0 x1 r
. ..
x
解方程
lnL(u | ) n f ( ) ( ui Pi ( )) 0 i 1
项目反应的基 本模型
双参数模型:
三参数模型:
eDai ( bi ) Pi ( ) ci (1 ci ) 1 eDai ( bi )
其中,b表示试题的难度参数,a表示试题的区分度参数,c表示试题的猜测系数,D是常量,D=1.7。
2
项目反应理论简介
项目特征曲线
(-3,3)
单参数逻辑斯蒂模型的项目特征曲线
4
计算机自适应测试的编制过程
1.ONE 题库建设
2.TWO
3.THREE 参数估计
4.FOUR 测试终止条件
选题策略
4
计算机自适应测试的编制过程
题目的搜集
1.ONE
题库建设
试题参数的获取
4
计算机自适应测试的编制过程
初始能力参数估计选题策略
2.TWO 选题策略
能力参数精确估计选题策略
初始能力参数估计选题策略
lnL(u | ) n f '( ) Pi ( ) ( Pi ( ) 1) 2 i 1
2
f (0 ) 1 =0 ' f (0 )
f ( n ) n 1 = n ' f ( n )
...
(| n1 n | 0.01)
4
项目反应理论的模型
项目反应理论的模型项目反应理论是心理学领域中的一种模型,用于量化测试者的能力水平。
该模型基于测验者对测试项目的反应,通过一些统计模型来衡量被测试者的能力水平。
项目反应理论的模型是一种非常有效的评估个人能力的工具,尤其是在教育、招聘等领域。
项目反应理论的模型是基于以下基本假设来构建的:1.每个测试项目都有一个固定的潜在难度水平,被称为难度参数。
2.每个被测试者也有一个能力水平,被称为斯洛班参数。
3.测试项目的正确反应由被测试者的能力和测试项目的难度水平共同决定。
基于这些假设,项目反应理论的模型将测试项目和被测试者的参数结合在一起,来推断受试者的能力水平。
该模型的核心是估计被试者的斯洛班参数,也称为能力水平,并将其与测试项目的难度参数进行比较。
为了实现这一目标,项目反应理论的模型采用了以下几个主要方程式:1.二项式分布方程式:用于计算测试项目正确的可能性。
2.逻辑斯蒂回归方程式:用于计算斯洛班参数和测试项目的难度参数之间的关系。
3.变异斯特林公式:用于比较测试项目的难度参数和斯洛班参数。
通过这些公式,项目反应理论的模型可以在测试被试者时精确地预测他们的能力水平。
这种方法可以应用于各种不同测试,从标准化考试到心理测试,以便评估特定领域或技能中被试者的表现。
但是,需要注意的是,项目反应理论的模型仅适用于具有可测量性的特定领域或技能。
如果测试测量的特定领域或技能不常规或难以厘定,那么这种模型是不可行的。
总的来说,项目反应理论的模型可以为教育、招聘等领域提供极具价值的工具,以量化被试者的能力水平。
这个模型的关键是能够将-test项目和被测试者的参数结合在一起,从而逐步推导出能力水平。
如果能够正确地实现这一目标,那么这种模型可以作为应用于许多各种测试和评估中的可靠而有效的工具。
项目分析及项目反应理论
项目分析及项目反应理论项目分析是项目管理中非常重要的一部分,它通过对项目的各个方面进行深入的研究和分析,为项目实施提供有效的指导和决策依据。
项目反应理论则是研究项目在实施过程中各种外部因素对项目结果的影响,以及项目团队如何应对和适应这些变化的理论框架。
一、项目分析的概念和目的项目分析是指对项目进行全面的、综合性的分析,以评估项目的可行性和可行性,为项目的实施提供决策依据。
项目分析的目的是充分了解项目的背景、目标和需求,明确项目的范围、目标、资源和计划。
通过项目分析,可以有效地减少项目风险,提高项目成功的几率。
项目分析包括对项目的市场和竞争环境进行分析,对项目的技术可行性和经济可行性进行评估,对项目的组织和管理进行规划等。
通过对项目的各个方面进行详细的研究,可以为项目实施提供科学的依据和指导。
二、项目分析的方法和步骤项目分析通常包括项目需求分析、项目范围分析、项目目标分析、项目资源分析等。
1. 项目需求分析项目需求分析是确定项目所需资源和功能的过程。
在项目需求分析阶段,需要明确项目的业务目标、用户需求、功能需求和性能需求,以便能够准确地制定项目计划和资源分配。
2. 项目范围分析项目范围分析是明确项目的边界和范围,确定哪些工作和活动包含在项目中,哪些不包含在项目中的过程。
通过项目范围分析,可以明确项目的具体目标和任务,确保项目团队的工作重点和方向。
3. 项目目标分析项目目标分析是对项目的目标和关键绩效指标进行分析和评估的过程。
在项目目标分析阶段,需要明确项目的终极目标和里程碑目标,制定合理的目标达成计划和时间表。
4. 项目资源分析项目资源分析是对项目所需资源进行评估和分析的过程。
项目资源包括人力资源、财务资源、技术资源等。
通过项目资源分析,可以合理评估项目的资源需求和资源投入,确保项目实施的顺利进行。
三、项目反应理论的原理和应用项目反应理论是指研究项目在实施过程中受到各种外部因素影响并做出相应反应的理论框架。
项目反应理论简介
项目反应理论的挑
05
战与未来发展
挑战与问题
01
模型参数的识别和估 计
项目反应理论依赖于对模型参数的准 确识别和估计,然而在实际应用中, 由于数据质量、样本大小等因素的影 响,可能会出现参数估计不准确的问 题。
02
模型的假设条件
项目反应理论是基于一些假设条件, 如局部独立性和正态分布等,然而在 实际应用中,这些假设条件可能会被 违反。
02
心概念
刺激与反应
1 2
刺激
指能够引起和激发个体反应的外部环境因素。
反应
指个体对刺激做出的行为或心理上的回应。
3
反应规则
指在特定刺激下,个体如何做出反应的规律。
反应者与环境
01
反应者
指受到外部刺激并做出反应的个 体或系统。
02
03
环境
交互作用
指反应者所处的外部条件和影响 因素。
指反应者和环境之间的相互影响 和作用。
更具有广泛适用性。
模型的适用性
03
未来研究可以开发适用于更广泛任务或测验的模型,论与实践的结合
要点一
针对具体应用场景进行模型设计 和优化
项目反应理论在教育、心理学、医学等领域都有广泛的应 用,未来研究可以针对这些具体应用场景进行模型设计和 优化,以提高模型的适用性和实用性。
项目反应理论简介
汇报人: 2023-11-29
目 录
• 项目反应理论概述 • 项目反应理论的核心概念 • 项目反应理论的应用领域 • 项目反应理论的研究与发展 • 项目反应理论的挑战与未来发展
01
项目反应理论概述
定义与背景
项目反应理论是一种心理测量理论,它为理解和描述个体在特定测验项目上的反应行为提供了一个框 架。该理论是心理测量学领域的重要支柱之一,被广泛应用于教育和临床诊断等领域。
项目反应理论111.pptx
在项目反应理论中,常用一般的统计依存 性和统计独立性概念来讨论项目间关系。
Pi(+):表示正确回答第i个项目的概率 Pi(-):表示答错第个i项目的概率 Pj(+):表示正确回答第j个项目的概率 Pj(-) :表示答错第j个项目的概率
P(+,+)表示正确回答第i和第j个项目的概率 同理,其它的见课本。
大量事实证明,对两级记分的项目,被试的 能力水平与他对项目的反应之间呈S型的曲线 关系,而且这一关系具有相当的普遍性。
S型ICC具有一些共同点,即都有一条Y=1的 上渐近线和一条Y=c(c≥0)的下渐进线,且是 严格单调上升的,一条ICC的形状取决于三 个变量:下渐近线的高度,曲线拐点的位置 及拐点处的斜率。 这三个变量恰好相当于三个项目参数:猜测 参数ci,难度参数bi和区分度参数ai。
1.00
项目1
Pi(θ)
0.50
项目2
0.00
b θ
图 区分度参数ai对正确反应概率的影响
ai越大,曲线在bi附近就会越陡,项目在bi 附近的区分能力就越大,但在远离bi的区 域,曲线就会变得越平坦,项目的区分能 力就越低。 也就是说,区分度参数ai大的项目对能力 水平接近bi的被试有较大的区分能力,而 对能力水平远大于或小于bi的被试区分能 力小。 相反,区分度参数ai小的项目则在能力分 布更广泛范围内对被试都有一定的区分能 力。
上渐近线
1.00
Pi(θ)
1 c 2
0.50
拐点 切线 下渐近线
c
0.00
b
θ
(1)难度参数bi 在一条ICC中,bi等于曲线在拐点处的θ值。 当猜测参数ci=0(曲线的下渐近线为0) 时,bi等于Pi(θ)=0.50时的θ值,因为对一 条完整的ICC,拐点恰好是曲线的中点和 对称点。 当ci>0时, P(θ)=(1+c)/2
项目反应理论
项目反应理论随着心理学的发展, 心理测量无论就是在理论上, 还就是在方法上都逐步地提高。
目前, 心理测量有三大理论派别: 经典测量理论(Classical Test Theory , 简称CTT) , 项目反应理论( Item Response Theory , 简称IRT) 与概化理论( Generalizability Theory , 简称GT)。
项目反应理论就是一种先进的测量理论,它就是针对经典测量理论的不足而提出来的, 其理论基础就是潜在特质理论。
项目反应理论的基本思路就是确定考生的心理特质值与她们对于项目的反应之间的关系, 这种关系的数学形式就就是“项目反应模型”。
下面主要对项目反应的理论假设与数学模型做一下简要概述。
一、项目反应理论的基本假设任何一种数学模型都有一定的前提,任何一种测量都有一定的假设,在项目反应理论中也有三条最基本的假设:潜在特质空间的单维性假设、测验项目间的局部独立性假设、项目特征曲线假设。
有的学者还增加了“知道——答对”假设与非速度限制假设。
在此仅说明前面三条最基本的假设。
1、潜在特质空间的单维性假设潜在特质空间就是指由心理学中的潜在特质组成的抽象空间。
如果考生在测验项目上的反应就是有K种潜在特质所决定的,那么这些潜在特征就定义了一个K维潜在空间,考生的各个潜在特质分数综合起来,就决定了该考生在该潜在空间的位置。
如果影响考生测验分数的所有重要的心理特质都被确定了,那么该潜在空间就称为完全潜在空间。
目前比较成熟的大多数项目反应模型都假设完全潜在空间就是单维的,即只有一种潜在特质决定了考生对项目的反应,也就就是说组成某个测验的所有项目都就是测量的同一个心理变量,例如知识、能力、态度或人格。
当然,这一假设往往不可能得到严格的满足,因为总有其她因素会影响到考生在测验上的反应,这些因素包括认知的、人格的与施测时的客观条件,以及考生的动机水平、焦虑程度、反应速度与考试技巧等。
项目反应理论模型应用中需要注意的几个问题
项目反应理论模型未来发展趋势与展望
模型改进与发展
随着研究的深入和技术的进步, 项目反应理论模型将不断改进和 发展,以更好地适应不同领域和
情境的研究需求。
多维度的模型拓展
未来研究可以进一步拓展项目反 应理论模型的应用范围,将其应 用于多维度、多层次的评估和分 析中,以更全面地揭示个体能力
的特点和规律。
项目反应理论模型应用中需 要注意的几个问题
汇报人: 2023-12-21
目录
• 项目反应理论模型概述 • 模型应用中需要注意的几个问
题 • 模型应用中的关键技术与方法 • 实际应用案例分析 • 总结与展望
01
项目反应理论模型概述
定义与特点
01
02
03
04
05
项目反应理论模型是一 种用于研究心理测试和 心理测量的数学模型, 它能够描述被试者在测 试中的反应行为,并根 据被试者的反应结果进 行数据分析和解释。
模型选择与适用性
在应用项目反应理论模型时,应根据研究目的、数据特点 等因素选择合适的模型,并确保模型适用于特定情境。
参数估计的准确性
模型参数的准确估计是模型应用的关键,应采用适当的统 计方法和技术对参数进行估计,并确保估计结果的可靠性
和有效性。
模型的解释与应用
在应用项目反应理论模型时,应充分理解模型的假设和限 制条件,正确解释模型结果,并将其应用于实际问题解决
该模型具有以下特点
针对个体差异:项目反 应理论模型关注个体差 异,认为每个被试者的 能力、特征和背景都会 影响其测试表现。
考虑题目特性:模型将 测试题目视为一个变量 ,并考虑其难度、区分 度等特性对被试者反应 的影响。
量化分析:项目反应理 论模型采用数学方法对 被试者的反应数据进行 建模和分析,从而使得 数据分析更加精确和客 观。
多维项目反应理论
Gibbs抽样
谢谢观看
பைடு நூலகம்
2、项目反应理论——从单维到多维
从因子分析发展的背景可以看出 , 一些计量学家 意识到传统因子分析的一些缺陷 , 提出了利用完 整信息的项目反应矩阵 , 对被试心理特质与项目 反应之间的关系利用非线性概率模型来表达 , 建 立了 FA 与 IRT 之间的连接 , 甚至产生了实质上的 MIRT 模型。但是, 他们关注的重点仍然是数据降 维, 即进行因子分析而不是被试或项目特征 , 而 IRT 关注的重点则是被试和测验项目之间的交互 作用, 因而完整的 MIRT 概念框架必然少不了 IRT 的特征。
多维项目反应理论
IRT
项 目 反 应 理 论 ( Item Response Theory , 简 称 IRT ) , 又 称 潜 在 特 质 理 论 ( Latent Trait Theory) 或 项 目 特 征 曲 线 理 论 ( Item Characteristic Curse Theory) ,是为了克服经 典测验理论(CTT)的局限而提出的现代测验理论。 从测验的内部或微观方面入手,采取数学建模和 统计调整的方法,重点讨论被试的能力水平与测 验项目之间的实质性关系,测验的每一个项目都 有自己的项目特征曲线,描述了每一个特定能力 水平的被试答对或答错该项目的概率。
1981 年, Bock 和 Aitkin (1981) 建立了 IRT 和FA 之间的直接联系, 从而导致了 MIRT 的雏形。他们为多维特质空间定义的正态肩形模型 包括了 FA与 IRT 两者的特征。模型如下
a, θ, d 参数相当于目前 MIRT 表达式中所使用的参数, a 是区分度参 数向量, θ 是特质向量, d是难度参数。尽管这个模型实质上是个 MIRT 模型, 但是, 与完整的 MIRT 概念框架相比, 唯一缺乏的是没有把项目 参数作为被试和项目交互作用的描述性测量来解释。
项目反应理论简介
项目反应理论简介一、项目反应理论的概念项目反应理论(Item Response Theory, IRT)是一系列心理统计学模型的总称,是针对经典测量理论(Classical Test Theory,简称CTT) 的局限性提出来的。
IRT 是用来分析考试成绩或者问卷调查数据的数学模型,这些模型的目标是来确定的潜在心理特征(latent trait)是否可以通过测试题被反应出来,以及测试题和被测试者之间的互动关系。
目前广泛应用在心理和教育测量领域,基于IRT理论的计算机自适应测试(CAT)是CAA常用的测试方法。
潜在特质模型(latent trait mode l)认为,在被试样本可观察到的测试成绩和基于该成绩不可观察的特质或能力之间存在着联系。
二、IRT的理论体系(三条基本假设)–假设一:能力单维性假设——指组成某个测验的所有项目都是测量同一潜在特质;–假设二:局部独立性假设——指对某个被试而言,项目间无相关存在;–假设三:项目特征曲线假设——指对被试某项目的正确反映概率与其能力之间的函数关系所作的模型。
IRT最大的优点是题目参数的不变性,即题目参数的估计独立于被试组。
它假定,被试在某一试题上的成绩不受他在测验中其他试题上的成绩影响;同时,在试题上各个被试的作答也是彼此独立的,仅由各被试的潜在特质水平所决定,一个被试的成绩不影响另一被试的成绩,这就叫做局部独立性假设。
IRT理论所做出的一切推论都必须以局部独立性假设为前提。
三、IRT常用的模型IRT根据受测者回答问题的情况,通过对题目特征函数的运算,来推测受测者的能力。
IRT的题目参数有:难度(difficulty index)、区分度(discriminative powder index)和猜测系数(guessing index)。
根据参数的不同,特征函数可分为单参数模型(难度)、双参数模型(难度、区分度)和三参数模型(难度、区分度、猜测参数)等。
第9章项目反应理论及其应用
项目反应理论的含义
项目反应理论也称项目特征曲线理论 或潜在特质理论,它是依据一定的数学模 型,用项目特征参数估计潜在特质的一种 测量理论。该理论中最重要的两个基本概 念是“潜在特质”和“项目特征曲线”。
项目反应理论的含义
项目特征曲线
项目反应理论的发展
虽然早期的项目反应模型主要是单维度 模型而且更强调双岐项目模式(如拉希模型 和三参数逻辑斯蒂模型),而如今一些多维 度项目反应模型也逐步发展起来,向其他项 目模式的拓展使得它能应用于更多的领域。 今天,项目反应理论模型已发展出了等级量 表模型、分部评分模型和多重选项计分模型 等等。
经典测量理论认为人的测验总分是这个人在些 特质上的真分数和测量误差之和。
经典测验理论多是使用匹配和随机化来进行误 差控制 。
项目反应理论的产生
2.项目反应理论的产生 自1904年斯皮尔曼首次提出经典测量理
论以来,经典测量理论为心理与教育测验的 发展很好地服务了100多年,可其自身的不 足和缺陷使得人们在某些测量的实际问题前 束手无策。
种: 自动组卷的选题策略 自适应测验的选题策略。
题目参数等值
题库的题量很大,项目参数的估计都 要分批进行,在不同批次获得的参数值, 一定要使用等值技术转换到同一量表系 统上去。在项目反应理论中,由于题目 参数估计具有跨群体不变性和潜在特质 参数估计具有可选择性,使来自不同群 体施测的题目参数可以用参数等值方法 将它们统一于同一个单位系统中,这就 保证了题目参数的准确性。
第9章 项目反应理论及其应用
中国水利水电出版社
目录
9.1 项目反应理论概述 9.2 项目反应模型的参数估计 9.3 项目和测验的信息函数 9.4 项目反应理论的应用
9.1 项目反应理论概述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
测验等值
概念:对测量同一种心理特质的不同测 验分数或项目参数,通过一定的数学模 型,转换成同一单位系统中的量数,以 有利于相互比较的方法。
测验等值的条件
进行等值的测验必须是测量同一心理特 质
只有信度相等或两个信度都较高的测验 之间才能等值,测验等值是指参照系统 的转换,它实际上找出了一系列对应等 价的分数和参数,且这个等价关系是客 观存在的。
第一节 项目难度
题目难易程度的指标
项目难度
定义
估计项目难度的方法
(1)以答对的百分比(或比率)来估计难 度
①二值记分(即只有答对和答错两种情况, 记为1或0)的测题。
P R N
P:试题的难度;R:答对该 题的人数;N:总人数。
P值越大,则难度越小。
估计难度的方法(cont.)
②当测题不是二值记分时,计算难度的公式
操作步骤
分析步骤
选择样本组进行测量 按测验总分排序,取高分组和低分组 计算高分组和低分组的通过比率 分别求出难度和鉴别力指数 比较高分组和低分组在测题不同答案上
的反应 根据测题统计分析的结果,修改或选择
合适的测题
实例(P270)
鉴别力:0.30以上的项目是比较好的。 难度:一般在0.35~0.65之间,对整个
项目特征曲线假设(ICC) 反映了被试对某一测验项目的正确反应概率与该 项目所对应的能力或特质水平之间的函数关系。
项目反应模型
二级评分IRT模型 例:逻辑斯蒂模型 单参数模型(拉希模型);双参数模型 和三参数模型。
多级评分IRT模型 连续型IRT模型
优点及运用
能力参数估计的不变性。 即个体独立于测验
测验等值的设计
1. 共同考生设计
测验X
﹜ }组1’
组1
﹜ }组2 ’
}组3 ’
组2
测验Y
测验等值的设计(cont.)共同测ຫໍສະໝຸດ 设计 n种扩展的测验设计 混合设计
第二节 项目的鉴别力
对不同水平被试反应的区分程度
项目鉴别力
定义 估计方法
1. 项目鉴别指数
D PH PL
0.40以上,优良;0.30~0.39,良好,如能 修改更好;0.20~0.29,尚可,仍需修改; 0.19以下,劣,必须淘汰。
估计方法(cont.)
2. 方差法(测题的方差) 条件? 3. 项目与总分相关 说明项目与总分有一致性 点二列相关;二列相关;皮尔逊积差相关。 4. 项目的组间相关 四项(格)相关;Φ相关;皮尔逊积差相关。 5. 项目与外部准则的相关:项目效度分析
难度与测验分数的分布
由一个标准化样组所构成的测验分数 的分布,一般来说是常态分布。
出现偏态分布的情况:左偏态;右偏 态。
试题难度和测验目的有关。
项目难度范围对信度系数的影响
rtt
1
Se2 St 2
rtt
n ×St2 n 1
St 2
pq
项目的组间相关大,则测验的信度高。而项 目组间相关高,那么它们的难度也越接近。
IRT的特点
基本思想:潜在特质 基本思路
确定被试的心理特质值和他们对于项目 的反应之间的关系,这种关系的数学形 式就是“项目反应模型”。IRT的核心就 是数学模型的建立以及对模型中各个参 数的估计。
IRT的基本假设
潜在特质空间的单维性假设 大多数项目反应模型都假设完全潜在空间是单维 的。
局部独立性假设 被试对一个测验项目的反应不受他们对其他测验 项目反应情况的影响。
Ch8 项目分析及项目反应理论
浙江师大心理系 李新宇 xyli@
/eduxin/oblog
项目分析概述
项目分析就是对组成测验的每个测题进 行分析。
质的分析 量的分析 应用:测题选择和编制(经典测量理
论);测验等值、试题库、计算机自适 应考试(现代测量理论)。
测验来说,0.50的难度题应该居多。 选项:选项分析的异常情况。
正确答案无人选择或少于其它选项的选 择;错误选项上低分组的人数少于高分 组;选项无人选择;未答人数较多。 找出原因,对各题进行修改。
第四节 项目反应理论
理论及应用
经典测量理论的局限性
抽样变动大 能力难比较 复本难实施 缺乏预测力 等测量标准误差
项目难度、鉴别力、组间相关与测验 信度、预测效度的关系
组间相关、信度和效度的矛盾 项目难度、组间相关对测验总分分布的
影响 P268 图7.4 结论:这几者之间的关系十分复杂,甚 至相互矛盾 妥协的方法:组间相关在0.10~0.60之 间;项目与测验总分相关为0.3~0.8。
第三节 项目反应的实例
CP:矫正后的难度;P:未矫 的难度;K:选项的数目。
(3)项目难度的等距量表
通过标准正态分布曲线进行转化
避免负号的两种方法
项目的平均数与方差(变差)
项目的平均数 项目的方差和标准差 总分方差
St2 piqi 2 rij
项目的方差与难度的关系 P=0.5时,S2有极大值。
piqi p jq j
P X X max
X :全体考生在该题上的平
均分;X max :该题的满分。
③分组法
重要前提:将被试按总分高低排列。一般
标准为27%。 计算公式:
P PH PL 2
估计难度的方法(cont.)
(2)项目难度受机遇影响的矫正
对考生由于猜测而答对某些题目致使P值增大 的可能性。
CP KP 1 K 1
项目参数估计的不变性。 即测验独立于个体
提供被试能力估计值的精确度指标 被试能力和项目难度在同一量表上,为
测验编制、测题分数的报告和解释提供 了便利。
应用篇:测验等值
参考:张敏强(教育测量学) 项目反应理论的重要特点:
1. 项目的难易度的估计不因样本不同而不同; 2. 被试能力的估计不因测验的改变而改变; 3. 测量误差的估计对每一位被试单独给出。 要为项目参数建立一个指标体系 要为被试的能力建立一个指标体系
测量等值的作用
使同学科不同时间、地点的测验分数具 有可比性
促进测验的科学化及现代化,有利于题 库建设
测验等值的假设
公平性 如果测验x和测验y的等值对每一个被试 都是公平的,则对每一定水平的被试, 无论他接受的是测验x或者测验y都不会 低估或高估其实际水平。
模跨群体的不变性 测验的一维性