项目反应理论
项目反应理论与经典测验理论之比较
项目反应理论与经典测验理论之比较一、本文概述在心理学、教育学和统计学等领域,测验理论一直扮演着至关重要的角色。
它们为我们提供了一种评估个体能力、知识、技能或情感状态的方法。
在众多的测验理论中,项目反应理论(Item Response Theory,简称IRT)和经典测验理论(Classical Test Theory,简称CTT)尤为引人注目。
本文旨在深入探讨这两种测验理论的核心概念、主要特点和应用场景,并通过比较分析来揭示它们的优势和局限性。
通过本文的阐述,读者将能更全面地理解项目反应理论与经典测验理论的基本原理,以及它们在不同实践领域的适用性。
在概述部分,我们将首先对项目反应理论和经典测验理论进行简要介绍,包括它们的起源、发展历程以及核心假设。
随后,我们将阐述本文的主要目的和研究问题,即比较这两种测验理论在理论框架、模型构建、参数估计、测量精度以及应用领域的异同。
通过这一概述,读者可以对本文的整体结构和内容有一个初步的了解,为后续深入探讨打下基础。
二、项目反应理论与经典测验理论的基本框架项目反应理论(Item Response Theory,简称IRT)与经典测验理论(Classical Test Theory,简称CTT)是心理测量学中的两大基本理论,它们各自构建了独特的理论框架和应用体系。
经典测验理论,起源于20世纪初,它基于真分数模型,认为测验的得分是由真分数和误差分数两部分组成的。
真分数反映了被试者的实际能力,而误差分数则是由测量过程中的随机误差引起的。
CTT 的主要假设包括测验的内部一致性、测验与测验之间的等价性和样本的代表性。
它主要关注测验的整体特性,如信度、效度和难度等,而忽略了单个项目的特性。
项目反应理论,则是在20世纪50年代后期逐步发展起来的。
与CTT不同,IRT将焦点放在了单个项目(即题目)的反应概率上,认为每个项目都有其独特的难度参数和区分度参数。
IRT模型,如二参数逻辑斯蒂克模型(2PL)、三参数逻辑斯蒂克模型(3PL)等,详细描述了项目参数与被试者能力之间的关系,并可以预测被试者在不同项目上的反应概率。
项目反应理论的形成与基本理论假设
项目反应理论的形成与基本理论假设项目反应理论(Item Response Theory, IRT)是针对测试和评价领域中的一种方法和理论,旨在解决测量数据分析过程中的一系列问题,如测验题目类型、人群不同表现和不同测量精度等等。
该理论由多位统计学家和心理学家共同发展而来,包括Lord和Novick(1968), Hambleton、Swaminathan和Rogers (1991), Kolen 和Brennan(2014)等人。
项目反应理论早期起源于功效曲线(曲线上(Y-坐标)表示试题难度,X-坐标表示受试水平)。
1927年,美国心理学家Thurstone对于智力测验中的单项选择题目进行了功效曲线的研究。
1933年,Lazarsfeld和Henry对于记忆实验数据的分析中提出了多因素问题的解决方案(在Lazarsfeld和Henry的研究中最初称为Comparative-Quality Scale Technique Method)。
而当广义线性模型(GLM)在20世纪70年代发明出来之后,它便成为了许多现代IRT方法的基础。
IRT理论在假设中有一些基本前提,其包含了三个主要部分:1. 题目模型。
IRT模型的第一个基本假设是关于题目模型的,即问卷或试卷的测量者需要选择一种反映题目表现的模型。
IRT中最著名的四个模型是二维常识模型(2PLM),一维常识模型(1PLM),三维常识模型(3PLM)和一维等角模型(1PLU)等,试卷数据可以使用这些模型进行模型拟合和解释。
2.人群模型。
IRT的第二个基本假设是关于受试者或群体模型的,即每个被试的特定水平对于含有该要素的题目反应是有效的,以及这种特定水平可以准确地衡量被试者的表现水平,和题目的等级和难度水平有一定的相关性。
3.数据模型。
IRT的第三个基本假设是关于数据模型的,即用户可以基于现有数据拟合合适的IRT模型,通过分析测试中正确答案的项分布情况来优化题目的构成,以适应用户的需求。
项目反应理论与题库建设
国%i-(指标库、赋史端 必图格 普文岸、笛国库? L —1、建库与维护干系统建库与维护子系统的功能是将已经选定的题目按属性指标、题文、附图、答文、答图 等项目,将有关信息准确方便地送入各子库中,并对库中的有关信息进行增、册h 修改、I 换以及按题号排序和查对等。
由于物理学科的特点,图形和特殊字符在题库中占有较大比重,所以物理题库系统需 要有绘制图形与特殊符号的功能,这项功能应在建库和维护子系统中实现。
另外,由于试题 中有图形,答案中也可能有图形,所以一个题目记录要由属性指标、题目正文(简称题文)、 附图、答文、答图等五部分组成。
考虑存储和管理的方便,试题的这些信息不统一存放在 个库中,而分别存放在指标库、题文库。
附图库、答文库和答图库等五个子库中。
同属一道试题的各项信息通过题目序号联系起来。
此外,按照课程的内容把所有题目分类, 按类存放,这样各子库相应地分成若干分库,每一分库存放某一类的试题。
接用库维护成二后请\瘠标原破K峦层加抗计机区地里统H-分布正L自动布卷模式匹醍组卷快速自动荆卷Mi 目।一个题库将存放大量的题目这些题目在计算机内如何存储将直接影响题库系统的工作效率和效果,因此题库结构的设计是题库系统设计开发的关键一环。
一般地说,一个大型题库应该具有这样的特征:(1)题库中的题目按学科领域分类,每一学科领域的题目又细分为若干个题目组合,这些题目组合可用于特定的教学目标,或测验特定的概念或能力。
(2)题库中的每一题目由两部分组成,即题目属性指标和题目本身。
题目属性指标有多项,反映有关题目的多种信息,这些信息将某一题目与库中的其它题目区别开,同时标记着题目使用的历史和使用情况(如使用次数、被高分学生答对的次数和被低分学生答对的次数等)。
(3)题库具有构成和结出等价形式测验的能力。
等价形式的测验是由不同的题目组合构成的,但每个测验的统计结果具有等效性,即这些不同的题目组合却测验相同的目标或概念,并用相同的统计方法来区分学生学习的好与差。
项目反应理论简介
尽管存在以上缺点,CTT仍在广泛地应用。 CTT、IRT和概化理论是当今最有影响的三 种测验理论。 简单地说,IRT在处理微观问题(即被试水 平与答题目之间的实质性关系)时优势明显, CTT在处理中观问题(如处理常见的标准化 考试等)时方便易懂,GT则在处理宏观问题 (如对结果作推论)时更显出色。 三种测验理论体系有内在联系,各有长短, 应相互促进,互相补充。
理论方法体系相对完整 前提假设比较弱 所涉及到的数学模型以及参数的概念和估 计方法易理解和掌握 标准化技术在控制测验误差等方面有明显 的效果
2、CTT在理论体系和方法体系方面存在许多 其本身难以克服的缺点,具体表现为:
基本假设难以成立:①真分数与观测分数间 存在线性关系的假定不合理;②平行测验的 假设难以成立;③误差与真分数独立的假设 难以满足。
不同的是,CTT是以被试对所有测验项目的 反应总和(测验总分)为显变量来预测被试 的潜在特质的,并不认为被试对单个项目的 反应 与其特质间有任何有意义的联系。
IRT则认为被试的能力与其对某一特定项目的 反应(以正确或错误反应概率表示)有某种函 数关系存在,确定这种关系就是IRT的基本思 想和出发点。
二、IRT的基本理论体系
(一)、概念 (二)、基本思想及基本思路 (三)、基本理论假设
(一)、概念
项目反应理论(Item Response Theory,简称 IRT),又称潜在特质理论(Latent Trait Theory) 或项目特征曲线理论(Item Characteristic Curse Theory),是为了克服经典测验理论(CTT)的局 限而提出的现代测验理论。 从测验的内部或微观方面入手,采取数学建模和 统计调整的方法,重点讨论被试的能力水平与测 验项目之间的实质性关系,测验的每一个项目都 有自己的项目特征曲线,描述了每一个特定能力 水平的被试答对或答错该项目的概率。
8.项目反应理论简介
IRT则认为被试的能力与其对某一特定项目 的反应(以正确或错误反应概率表示)有 某种函数关系存在,确定这种关系就是IRT 的基本思想和出发点。
所以IRT可以被理解为一种探讨被试对项目 的反应与其潜在特质间关系的概率性方法。
用θ(theta)表示被试的潜在特质或能力, 用Pi(θ)表示其对项目i正确反应概率,项目 反应理论的关键就是确定θ与Pi(θ)间的函数 关系。
(二)项目反应理论的发展
由于项目特征曲线(ICC)对项目反应理论 的产生具有重要意义,所以在讲项目反应 理论的产生和发展问题时,一般都追溯到 1905年比奈和西蒙编制第一个智力量表时 的工作,他们当时所使用的作业成绩随年 龄增长而提高的散点图与现在的ICC曲线十 分类似。
IRT的真正创立者是美国心理测量学家洛德 (Lord)。1952年,洛德发表博士论文《一个 测验分数的理论》,提出了IRT的第一个数 学模型(Two-parameter Normal Ogive Model,双参数正态卵形曲线模型)及其参 数的估计方法,并把该模型应用到了学业 成绩和态度测量工作之中。
如何理解局部独立性假设呢? 由于这种独立性是针对特定的θ值的被试而 言的,所以称为“局部”。
例:假设1000名能力相同的被试参加某一能 力测验,600名被试答对了项目i,400名答 错了;这1000名被试对项目j的正确反应概 率与对项目i的正确反应概率统计上是独立 的。 总之,同一特质水平的被试回答某一项目时 不受其他项目的影响。
1.00
正确 反应 的概 率: Pi(θ)
0.50
0.00
潜在特质: θ
表1
某个项目假设的项目特征曲线
项目反应理论
项目反应理论任何一种理论都不可能是完美无缺的,作为测量初期发展起来的理论更是不可避免地存在着一些缺陷。
项目反应理论(Item Response Theory, IRT)则是在反对和克服传统测量理论的不足之中发展起来的一种现代测量理论。
无论是CTT还是GT,其测验内容的选择、项目参数的获得和常模的制定,都是通过抽取一定的样本(行为样本或被试样本),因此可以说二者都建立在随机抽样理论基础之上。
它们的局限性主要表现在以下几个方面:(1)信度估计的精确性不高测量的重要目标就是降低测量误差,提高测量的精度。
在经典测量理论中,信度被定义为真分数的方差与实得分数(原始分数)的方差之比。
然而,在此定义中,真分数的方差和误差的方差都无法求取。
为了估计信度,CTT又提出了平行测验的概念,并在此基础上推演出了若干个信度估计公式。
但是严格的平行测验是不存在的,等价测验也很难获得的,在此基础上估计的测验信度很难达到比较高的精确程度。
另外,经典测量理论中的信度估计值也是一个笼统值,即假定对不同能力水平的被试来说,测量的误差是相同的。
而事实是,一份测验只有在施测于能力水平与测验难度相当的被试时容易获得比较高的测量精确度。
当测验施测于能力水平高于(或低于)测验难度的被试时就容易产生较大的测量误差。
而且测量误差值会随着被试水平与测验难度距离的增加而变大。
(2)各种测量参数的估计依赖于被试样本经典测量理论构造了一个完整的理论体系,同时设计了一套参数指标来刻划测量各方面的特性。
如信度、效度、项目的难度、区分度等。
但是这些参数的估计对样本的依赖性是很大的。
如项目难度,对于同一题目,若样本的群体水平较低,就有较高的难度估计值。
测验的信度和效度采用相关分析法,同样受到样本的影响。
为避免抽样误差对参数估计的影响,经典测量理论特别强调样本对总体的代表性。
但经典理论所用的是随机抽样,随机抽样总有一定偏差存在。
何况在实际工作中,由于客观条件的限制,还不能做到随机抽样。
项目反应理论与认知诊断的统计推断方法
1、跨领域应用:将项目反应理论和认知诊断方法应用到更多领域,如医学、 社会调查、人力资源等领域,拓展其应用范围和使用价值。
2、精细化建模:针对不同领域和实际问题的特点,开发更加精细化和个性 化的统计推断模型,以更好地满足实际需求。
3、数据科学方法:结合数据科学领域的新方法和新技术,如机器学习、深 度学习等,提高统计推断的精度和效率,为实践提供更加可靠的支持。
3、结果解释方面,需要对模型结果进行充分解释,以便更好地理解和利用 模型结果。可以结合实际问题和数据的特点,制定合理的解释方式和指标,对模 型结果进行深入分析,以便更好地指导实践和应用。
五、结论与展望
本次演示介绍了项目反应理论与认知诊断的统计推断方法及其应用,包括项 目反应模型、认知诊断模型、参数估计与检验等,并通过例题和数据讲解了方法 的具体应用。还分析了统计推断方法面临的挑战和相应的解决方案。随着技术的 发展和应用领域的扩展,未来研究可以以下几个方面:
3、参数估计与检验
在应用项目反应理论和认知诊断模型时,需要对模型参数进行估计和检验。 常见的参数估计方法包括最大似然估计、期望最大化算法等,检验方法则包括拟 合度检验、模型稳定性检验等。参数估计与检验可以确保模型的适用性和精度。
三、方法应用
1、考试成绩分析
通过应用项目反应理论,可以对考试成绩进行全面分析。例如,教育机构可 以利用项目反应理论对试题难度、区分度等进行分析,以便更好地设计试题和评 估学生的学习水平。此外,项目反应理论还可以用于学生的能力估计和学科优势 识别等方面。
项目反应理论与认知诊断的统计推 断方法
目录
01 一、项目反应理论与 认知诊断的简介
02 二、统计推断方法
03 三、方法应用
04 四、挑战与解决方案
IRT项目反应理论
主题研究背景
早期研究
早期研究主要集中在理论 模型的建立和验证。
当前研究
当前研究更加关注实际应 用,如在线测验、自适应 测验等。
未来展望
未来研究将进一步探索IRT 与其他技术的结合,如人 工智能、大数据等。
02
IRT项目反应理论概述
定义与概念
定义
IRT项目反应理论,也称为潜在特质理论或潜在特质模型,是一种心理测量理 论,用于描述个体在特定测验项目上的潜在特质水平与其行为表现之间的关系。
概念
IRT假设个体在某个潜在特质上的水平是连续的,并且个体在某个测验项目上的 表现是由其潜在特质水平决定的。
发展历程
起源
IRT起源于20世纪50年代,由美国心理学家伯恩斯和 金纳德提出。
THANKS
感谢观看
IRT通过建立与能力水平相对应的难度参数,能够准确地衡量学生在不同 学科领域的能力水平,从而为个性化教学和辅导提供依据。
IRT还可以用于评估学生的认知能力、学习能力和情感能力等,帮助教师 全面了解学生的发展状况,为制定教学计划和干预措施提供依据。
课程设计与优化
IRT在课程设计与优化方面也具有重要应用。通过分析学生的能力分布和项目难度参数,教师可以对课 程进行针对50年代, 随着计算机技术的发展而 逐步完善。
应用领域
广泛应用于教育、心理学、 人力资源等领域。
主题重要性
提高测验精度
IRT可以帮助研究者更准确地测量个体的能力水平, 从而提高测验的精度。
个性化教学
通过IRT,教师可以了解学生的学习需求和能力水 平,从而进行个性化教学。
人才选拔
03
项目反应理论简介
( x0 , f ( x0 ))
注意:迭代过程不可能无休止地进行下去,必须设定一个终止规则, 常用的终止规则是,当相邻的两个迭代近似值之间的差异小于某个预
先设定值(如0.01)时,迭代过程终止。
x0 x1 r
. ..
x
解方程
lnL(u | ) n f ( ) ( ui Pi ( )) 0 i 1
项目反应的基 本模型
双参数模型:
三参数模型:
eDai ( bi ) Pi ( ) ci (1 ci ) 1 eDai ( bi )
其中,b表示试题的难度参数,a表示试题的区分度参数,c表示试题的猜测系数,D是常量,D=1.7。
2
项目反应理论简介
项目特征曲线
(-3,3)
单参数逻辑斯蒂模型的项目特征曲线
4
计算机自适应测试的编制过程
1.ONE 题库建设
2.TWO
3.THREE 参数估计
4.FOUR 测试终止条件
选题策略
4
计算机自适应测试的编制过程
题目的搜集
1.ONE
题库建设
试题参数的获取
4
计算机自适应测试的编制过程
初始能力参数估计选题策略
2.TWO 选题策略
能力参数精确估计选题策略
初始能力参数估计选题策略
lnL(u | ) n f '( ) Pi ( ) ( Pi ( ) 1) 2 i 1
2
f (0 ) 1 =0 ' f (0 )
f ( n ) n 1 = n ' f ( n )
...
(| n1 n | 0.01)
4
项目反应理论的模型
项目反应理论的模型项目反应理论是心理学领域中的一种模型,用于量化测试者的能力水平。
该模型基于测验者对测试项目的反应,通过一些统计模型来衡量被测试者的能力水平。
项目反应理论的模型是一种非常有效的评估个人能力的工具,尤其是在教育、招聘等领域。
项目反应理论的模型是基于以下基本假设来构建的:1.每个测试项目都有一个固定的潜在难度水平,被称为难度参数。
2.每个被测试者也有一个能力水平,被称为斯洛班参数。
3.测试项目的正确反应由被测试者的能力和测试项目的难度水平共同决定。
基于这些假设,项目反应理论的模型将测试项目和被测试者的参数结合在一起,来推断受试者的能力水平。
该模型的核心是估计被试者的斯洛班参数,也称为能力水平,并将其与测试项目的难度参数进行比较。
为了实现这一目标,项目反应理论的模型采用了以下几个主要方程式:1.二项式分布方程式:用于计算测试项目正确的可能性。
2.逻辑斯蒂回归方程式:用于计算斯洛班参数和测试项目的难度参数之间的关系。
3.变异斯特林公式:用于比较测试项目的难度参数和斯洛班参数。
通过这些公式,项目反应理论的模型可以在测试被试者时精确地预测他们的能力水平。
这种方法可以应用于各种不同测试,从标准化考试到心理测试,以便评估特定领域或技能中被试者的表现。
但是,需要注意的是,项目反应理论的模型仅适用于具有可测量性的特定领域或技能。
如果测试测量的特定领域或技能不常规或难以厘定,那么这种模型是不可行的。
总的来说,项目反应理论的模型可以为教育、招聘等领域提供极具价值的工具,以量化被试者的能力水平。
这个模型的关键是能够将-test项目和被测试者的参数结合在一起,从而逐步推导出能力水平。
如果能够正确地实现这一目标,那么这种模型可以作为应用于许多各种测试和评估中的可靠而有效的工具。
项目分析及项目反应理论
项目分析及项目反应理论项目分析是项目管理中非常重要的一部分,它通过对项目的各个方面进行深入的研究和分析,为项目实施提供有效的指导和决策依据。
项目反应理论则是研究项目在实施过程中各种外部因素对项目结果的影响,以及项目团队如何应对和适应这些变化的理论框架。
一、项目分析的概念和目的项目分析是指对项目进行全面的、综合性的分析,以评估项目的可行性和可行性,为项目的实施提供决策依据。
项目分析的目的是充分了解项目的背景、目标和需求,明确项目的范围、目标、资源和计划。
通过项目分析,可以有效地减少项目风险,提高项目成功的几率。
项目分析包括对项目的市场和竞争环境进行分析,对项目的技术可行性和经济可行性进行评估,对项目的组织和管理进行规划等。
通过对项目的各个方面进行详细的研究,可以为项目实施提供科学的依据和指导。
二、项目分析的方法和步骤项目分析通常包括项目需求分析、项目范围分析、项目目标分析、项目资源分析等。
1. 项目需求分析项目需求分析是确定项目所需资源和功能的过程。
在项目需求分析阶段,需要明确项目的业务目标、用户需求、功能需求和性能需求,以便能够准确地制定项目计划和资源分配。
2. 项目范围分析项目范围分析是明确项目的边界和范围,确定哪些工作和活动包含在项目中,哪些不包含在项目中的过程。
通过项目范围分析,可以明确项目的具体目标和任务,确保项目团队的工作重点和方向。
3. 项目目标分析项目目标分析是对项目的目标和关键绩效指标进行分析和评估的过程。
在项目目标分析阶段,需要明确项目的终极目标和里程碑目标,制定合理的目标达成计划和时间表。
4. 项目资源分析项目资源分析是对项目所需资源进行评估和分析的过程。
项目资源包括人力资源、财务资源、技术资源等。
通过项目资源分析,可以合理评估项目的资源需求和资源投入,确保项目实施的顺利进行。
三、项目反应理论的原理和应用项目反应理论是指研究项目在实施过程中受到各种外部因素影响并做出相应反应的理论框架。
项目反应理论简介
项目反应理论的挑
05
战与未来发展
挑战与问题
01
模型参数的识别和估 计
项目反应理论依赖于对模型参数的准 确识别和估计,然而在实际应用中, 由于数据质量、样本大小等因素的影 响,可能会出现参数估计不准确的问 题。
02
模型的假设条件
项目反应理论是基于一些假设条件, 如局部独立性和正态分布等,然而在 实际应用中,这些假设条件可能会被 违反。
02
心概念
刺激与反应
1 2
刺激
指能够引起和激发个体反应的外部环境因素。
反应
指个体对刺激做出的行为或心理上的回应。
3
反应规则
指在特定刺激下,个体如何做出反应的规律。
反应者与环境
01
反应者
指受到外部刺激并做出反应的个 体或系统。
02
03
环境
交互作用
指反应者所处的外部条件和影响 因素。
指反应者和环境之间的相互影响 和作用。
更具有广泛适用性。
模型的适用性
03
未来研究可以开发适用于更广泛任务或测验的模型,论与实践的结合
要点一
针对具体应用场景进行模型设计 和优化
项目反应理论在教育、心理学、医学等领域都有广泛的应 用,未来研究可以针对这些具体应用场景进行模型设计和 优化,以提高模型的适用性和实用性。
项目反应理论简介
汇报人: 2023-11-29
目 录
• 项目反应理论概述 • 项目反应理论的核心概念 • 项目反应理论的应用领域 • 项目反应理论的研究与发展 • 项目反应理论的挑战与未来发展
01
项目反应理论概述
定义与背景
项目反应理论是一种心理测量理论,它为理解和描述个体在特定测验项目上的反应行为提供了一个框 架。该理论是心理测量学领域的重要支柱之一,被广泛应用于教育和临床诊断等领域。
项目反应理论111.pptx
在项目反应理论中,常用一般的统计依存 性和统计独立性概念来讨论项目间关系。
Pi(+):表示正确回答第i个项目的概率 Pi(-):表示答错第个i项目的概率 Pj(+):表示正确回答第j个项目的概率 Pj(-) :表示答错第j个项目的概率
P(+,+)表示正确回答第i和第j个项目的概率 同理,其它的见课本。
大量事实证明,对两级记分的项目,被试的 能力水平与他对项目的反应之间呈S型的曲线 关系,而且这一关系具有相当的普遍性。
S型ICC具有一些共同点,即都有一条Y=1的 上渐近线和一条Y=c(c≥0)的下渐进线,且是 严格单调上升的,一条ICC的形状取决于三 个变量:下渐近线的高度,曲线拐点的位置 及拐点处的斜率。 这三个变量恰好相当于三个项目参数:猜测 参数ci,难度参数bi和区分度参数ai。
1.00
项目1
Pi(θ)
0.50
项目2
0.00
b θ
图 区分度参数ai对正确反应概率的影响
ai越大,曲线在bi附近就会越陡,项目在bi 附近的区分能力就越大,但在远离bi的区 域,曲线就会变得越平坦,项目的区分能 力就越低。 也就是说,区分度参数ai大的项目对能力 水平接近bi的被试有较大的区分能力,而 对能力水平远大于或小于bi的被试区分能 力小。 相反,区分度参数ai小的项目则在能力分 布更广泛范围内对被试都有一定的区分能 力。
上渐近线
1.00
Pi(θ)
1 c 2
0.50
拐点 切线 下渐近线
c
0.00
b
θ
(1)难度参数bi 在一条ICC中,bi等于曲线在拐点处的θ值。 当猜测参数ci=0(曲线的下渐近线为0) 时,bi等于Pi(θ)=0.50时的θ值,因为对一 条完整的ICC,拐点恰好是曲线的中点和 对称点。 当ci>0时, P(θ)=(1+c)/2
项目反应理论
项目反应理论随着心理学的发展, 心理测量无论就是在理论上, 还就是在方法上都逐步地提高。
目前, 心理测量有三大理论派别: 经典测量理论(Classical Test Theory , 简称CTT) , 项目反应理论( Item Response Theory , 简称IRT) 与概化理论( Generalizability Theory , 简称GT)。
项目反应理论就是一种先进的测量理论,它就是针对经典测量理论的不足而提出来的, 其理论基础就是潜在特质理论。
项目反应理论的基本思路就是确定考生的心理特质值与她们对于项目的反应之间的关系, 这种关系的数学形式就就是“项目反应模型”。
下面主要对项目反应的理论假设与数学模型做一下简要概述。
一、项目反应理论的基本假设任何一种数学模型都有一定的前提,任何一种测量都有一定的假设,在项目反应理论中也有三条最基本的假设:潜在特质空间的单维性假设、测验项目间的局部独立性假设、项目特征曲线假设。
有的学者还增加了“知道——答对”假设与非速度限制假设。
在此仅说明前面三条最基本的假设。
1、潜在特质空间的单维性假设潜在特质空间就是指由心理学中的潜在特质组成的抽象空间。
如果考生在测验项目上的反应就是有K种潜在特质所决定的,那么这些潜在特征就定义了一个K维潜在空间,考生的各个潜在特质分数综合起来,就决定了该考生在该潜在空间的位置。
如果影响考生测验分数的所有重要的心理特质都被确定了,那么该潜在空间就称为完全潜在空间。
目前比较成熟的大多数项目反应模型都假设完全潜在空间就是单维的,即只有一种潜在特质决定了考生对项目的反应,也就就是说组成某个测验的所有项目都就是测量的同一个心理变量,例如知识、能力、态度或人格。
当然,这一假设往往不可能得到严格的满足,因为总有其她因素会影响到考生在测验上的反应,这些因素包括认知的、人格的与施测时的客观条件,以及考生的动机水平、焦虑程度、反应速度与考试技巧等。
项目反应理论简介
项目反应理论简介一、项目反应理论的概念项目反应理论(Item Response Theory, IRT)是一系列心理统计学模型的总称,是针对经典测量理论(Classical Test Theory,简称CTT) 的局限性提出来的。
IRT 是用来分析考试成绩或者问卷调查数据的数学模型,这些模型的目标是来确定的潜在心理特征(latent trait)是否可以通过测试题被反应出来,以及测试题和被测试者之间的互动关系。
目前广泛应用在心理和教育测量领域,基于IRT理论的计算机自适应测试(CAT)是CAA常用的测试方法。
潜在特质模型(latent trait mode l)认为,在被试样本可观察到的测试成绩和基于该成绩不可观察的特质或能力之间存在着联系。
二、IRT的理论体系(三条基本假设)–假设一:能力单维性假设——指组成某个测验的所有项目都是测量同一潜在特质;–假设二:局部独立性假设——指对某个被试而言,项目间无相关存在;–假设三:项目特征曲线假设——指对被试某项目的正确反映概率与其能力之间的函数关系所作的模型。
IRT最大的优点是题目参数的不变性,即题目参数的估计独立于被试组。
它假定,被试在某一试题上的成绩不受他在测验中其他试题上的成绩影响;同时,在试题上各个被试的作答也是彼此独立的,仅由各被试的潜在特质水平所决定,一个被试的成绩不影响另一被试的成绩,这就叫做局部独立性假设。
IRT理论所做出的一切推论都必须以局部独立性假设为前提。
三、IRT常用的模型IRT根据受测者回答问题的情况,通过对题目特征函数的运算,来推测受测者的能力。
IRT的题目参数有:难度(difficulty index)、区分度(discriminative powder index)和猜测系数(guessing index)。
根据参数的不同,特征函数可分为单参数模型(难度)、双参数模型(难度、区分度)和三参数模型(难度、区分度、猜测参数)等。
第9章项目反应理论及其应用
项目反应理论的含义
项目反应理论也称项目特征曲线理论 或潜在特质理论,它是依据一定的数学模 型,用项目特征参数估计潜在特质的一种 测量理论。该理论中最重要的两个基本概 念是“潜在特质”和“项目特征曲线”。
项目反应理论的含义
项目特征曲线
项目反应理论的发展
虽然早期的项目反应模型主要是单维度 模型而且更强调双岐项目模式(如拉希模型 和三参数逻辑斯蒂模型),而如今一些多维 度项目反应模型也逐步发展起来,向其他项 目模式的拓展使得它能应用于更多的领域。 今天,项目反应理论模型已发展出了等级量 表模型、分部评分模型和多重选项计分模型 等等。
经典测量理论认为人的测验总分是这个人在些 特质上的真分数和测量误差之和。
经典测验理论多是使用匹配和随机化来进行误 差控制 。
项目反应理论的产生
2.项目反应理论的产生 自1904年斯皮尔曼首次提出经典测量理
论以来,经典测量理论为心理与教育测验的 发展很好地服务了100多年,可其自身的不 足和缺陷使得人们在某些测量的实际问题前 束手无策。
种: 自动组卷的选题策略 自适应测验的选题策略。
题目参数等值
题库的题量很大,项目参数的估计都 要分批进行,在不同批次获得的参数值, 一定要使用等值技术转换到同一量表系 统上去。在项目反应理论中,由于题目 参数估计具有跨群体不变性和潜在特质 参数估计具有可选择性,使来自不同群 体施测的题目参数可以用参数等值方法 将它们统一于同一个单位系统中,这就 保证了题目参数的准确性。
第9章 项目反应理论及其应用
中国水利水电出版社
目录
9.1 项目反应理论概述 9.2 项目反应模型的参数估计 9.3 项目和测验的信息函数 9.4 项目反应理论的应用
9.1 项目反应理论概述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
项目反应理论
随着心理学的发展,心理测量无论是在理论上,还是在方法上都逐步地提高。
目前,心理测量有三大理论派别:经典测量理论(Classical Test Theory ,简称CTT),项目反应理论(Item Response Theory ,简称IRT)和概化理论(Generalizability Theory , 简称GT)。
项目反应理论是一种先进的测量理论,它是针对经典测量理论的不足而提出来的,其理
论基础是潜在特质理论。
项目反应理论的基本思路是确定考生的心理特质值和他们对于项目的反应之间的关系,这种关系的数学形式就是“项目反应模型”。
下面主要对项目反应的理论假设和数学模型做一下简要概述。
项目反应理论的基本假设
任何一种数学模型都有一定的前提,任何一种测量都有一定的假设,在项目
反应理论中也有三条最基本的假设:潜在特质空间的单维性假设、测验项目间的局
部独立性假设、项目特征曲线假设。
有的学者还增加了“知道一一答对”假设和非速度限制假设。
在此仅说明前面三条最基本的假设。
1、潜在特质空间的单维性假设
潜在特质空间是指由心理学中的潜在特质组成的抽象空间。
如果考生在测验项目上的
反应是有K种潜在特质所决定的,那么这些潜在特征就定义了一个K维潜在空间,考生
的各个潜在特质分数综合起来,就决定了该考生在该潜在空间的位置。
如果影响考生测验分数的所有重要的心理特质都被确定了,那么该潜在空间就称为完全潜在空间。
目前比较成熟的大多数项目反应模型都假设完全潜在空间是单维的,即只有一种潜在
特质决定了考生对项目的反应,也就是说组成某个测验的所有项目都是测量的同一个心理变量,例如知识、能力、态度或人格。
当然,这一假设往往不可能得到严格的满足,因为总有其他因素会影响到考生在测验上的反应,这些因素包括认知的、人格的和施测时的客观条件,以及考生的动机水平、焦虑程度、反应速度和考试技巧等。
因此在项目反应理论中,只要所预测量的心理特质是影响考生对项目作出反应的主要因素,那么就认为这组测验数据是满足单维假设的。
2、测验项目间的局部独立性假设
所谓局部独立性假设是指某个考生对于某个项目的正确概率不会受到他对于该测验中其他项目反应的影响,也就是说只有考生的特质水平和项目的特性会影响到考生对该项目的反应。
在实际的教育
和心理测量问题中,如果前一个项目的内容为后一个项目的
正确反应提供暗示或其它有效的信息,局部独立性的假设就会遭到破坏,例如所谓的链
状试题就会出现这种情况。
局部独立性是建立在统计的意义上的,用统计学的语言,局
部独立性是指对每一个测验者来说,对整个试题作出某种反应的概率等于对组成试卷的每个项目的反应的概率的乘积。
3、项目特征曲线假设
项目反应理论的一个关键就是在被试者对项目作出的反应或作出反应的概率与被测
试者的潜在特质之间建立某种函数关系。
可谓的项目特征曲线,就是相应函数关系的图
象。
项目反应理论之所以要作出项目特征曲线形式的假设,是因为项目反应理论的建立
不是首先从理论上推导出函数关系的存在,而是先假定有某种形式的项目特征曲线,然
后找出满足相应曲线的函数形式。
所以,关于项目特征曲线的特征形式的假设实际上就
是对未来函数关系的假设。
项目特征曲线的假设主要有三点:第一、曲线的下端渐近线。
如果一个项目的猜测参数值为C o,即这个项目能够凭猜测作出
正确反应的概率为C o,那么项目特征曲线的下端渐近线为Y= C o如果假设在测验中不存在
猜测因素的作用或我们不去考虑猜测因素的作用,则取G=0,即项目特征曲线以丫=0为其
下端渐近线。
第二、曲线的上端渐近线。
通常假定曲线的上端渐近线为丫=1,即假定对B值足够大的
被试者,对项目或试卷作出正确反应的概率是趋于1的。
第三、曲线的升降性。
项目反应理论假定曲线严格单调上升,即仅存在一个曲变点(又
称拐点,曲线在此处的一阶导数等于零)。
、项目反应模型
IRT模型是一种数学模型,它的特点是以概率的概念来解释应试者对试题的反应和其潜在能力特质之间的关系。
IRT的模型有20余种,但比较常用的有洛德提出的著名的正态卵形模型和伯恩鲍姆提出的逻辑斯蒂模型(Logistic模型)。
这两种函数模型在计算结
果上并无大的区别,所绘制的曲线也大体相同,然而,在实际中大多采用后者。
其中主要有以下两个方面的原因:首先是它形式上的简洁,更具数学模型的特点;其次是它便于用对数关系作处理,因而模型的项目质量参数和能力参数估计起来较为方便。
1、逻辑斯蒂模型(Logistic 模型)
由于Logistic 模型相对比较简单,准确性较高,计算量较其他模型小,因此在建立
自适应考试系统时,常采用Logistic 模型。
由于参数的不同,分为单参数、双参数和三参数,其中以三参数的Logistic模型最为常用,由于计算机和网络技术的发展,对考试
的准确性的要求也越来越高,对三参数的Logistic 模型的研究也比较成熟,现在逐步趋向使用三参数模型。
函数表达式如下:
’严1+盘时)
0表示受测者的能力,a(a € R)表示区分度,b(b € R)表示难度,c表示猜测的系数,受测者答对试题的概率是B的函数,记为P( 0 ),称之为项目反应函数。
一般地,对某一测验项目的质量,我们可采用项目难度、项目区分度和猜测参数三个指标来描述,据特征函数可画出题目的特征曲线(Item Characteristic Curve,ICC),
图1为典型的三参数模型的特征曲线:
图1典型三参数模型特征曲线
从图1可以看出,项目特性曲线下部的渐近线离坐标轴的零点有一定的距离。
这表明由于存在猜测因素,能力或物质水平很低的被试仍有可能答对该项目的猜测参数值,一般用c 来表示,它是凭猜测答对该题的概率。
项目特性曲线是一条以拐点为中心的曲线,因而其拐点在纵轴上的投影正好落在c与1的中点上,即拐点的纵坐标为(1+c)/2 。
这表明物
质水平为b(拐点在横轴上的投影)的被试与答对该项目的概率,排除猜测因素不计,恰好彼此相等,所以b通常被定义为项目的难度参数。
项目特性曲线拐点处的斜率刻了曲线
的陡峭程度,这与项目区分被试物质水平的能力有关。
很显然,曲线越陡峭,答对概率
P( 0 )对物质水平0的变化就越敏感,即项目区分被试水平的能力就越强。
因此,曲线拐点处的斜率被称为项目的区分度参数,一般用a来表示。
2、正态卵形模型
和logistic 模型一样,根据模型中包含的条目参数的个数,正态卵形模型被命名为双参
数模型和三参数模型。
在项目反应理论中最早得到实际应用的是双参数正态卵形模型。
参数
与双正态卵形模型相比三参数模型增加了参数C,其数学表达式如下:
『a】(9 -1)()
P, ( 0) - c;+ < 1 - c, ) 1 厂汐2
J5/ 2ir dt
C表示项目特征曲线下端渐近线的高度;b表示和项目特征曲线拐点相对应的能力水平,该点处的正答概率为(1+c)/2 ;a表示和拐点处的斜率成正比的值,因为拐点处的斜率
)/\/ 所以尉二/ 2 A/ ( 1—口).
由此可见,三参数正太卵形曲线的形状和位置是由三个因素决定的:曲线的下端渐近线、斜率和拐点。
下端渐近线的位置越高,表示B值低的考生猜对该项目的概率越大,拐点的位置越靠右边,表示项目的难度越大,拐点处曲线的斜率越大,表示项目的区分度越高。
三、项目反映理论的发展前景
项目反应理论的理论假设是建立在严谨的数学统计模式基础上的,它借助于电脑科技在近一、二十年取得了突飞猛进的进展。
在过去的十余年中,不断有新的项目反应模式诞生,有
新的项目参数估计方法提出,国内也有一些学者对项目反应理论进行了一系列的应用研究。
但总的说来,目前我国对IRT的理论和应用研究尚处于起步阶段,IRT的推广应用更要受
到一些客观条件的限制。
IRT对模式参数的估计,必须要有电脑的辅助,没有电脑,其繁琐的
运算过程几乎无法完成。
IRT的应用推广,还需要应用者有较深厚的数学功底,或至少在数理统计方面训练有素,这是国内一般的心理学者所缺乏的,因而推广应用的步履相当缓慢。
然而,IRT在理论架构、项目参数的估计、可信度指标的获得等方面都比CCT更为精确和有效,因此,IRT取代CCTB成为必然趋势。
我们有理由相信,随着电脑技术的进一步普及,随
着心理学者、教育学者知识结构的更新,IRT在我国的普及推广也只是时间问题。
IRT最终必将取代而成为心理测量学的一大主流。