项目反应理论简介

合集下载

[心理测验]IRT理论（ItemResponseTheory）

IRT理论（Item Response Theory）IRT理论概述IRT理论即项目反应理论(Item Response Theory, IRT)，又称题目反应理论、潜在特质理论（Item Response Theory）是一系列心理统计学模型的总称。

IRT是用来分析考试成绩或者问卷调查数据的数学模型。

这些模型的目标是来确定的潜在心理特征(latent trait）是否可以通过测试题被反应出来，以及测试题和被测试者之间的互动关系。

目前广泛应用在心理和教育测量领域。

项目反应理论的意义在于可以指导项目筛选和测验编制。

项目反应理论假设被试有一种“潜在特质”，潜在特质是在观察分析测验反应基础上提出的一种统计构想，在测验中，潜在特质一般是指潜在的能力，并经常用测验总分作为这种潜力的估算。

项目反应理论认为被试在测验项目的反应和成绩与他们的潜在特质有特殊的关系。

通过项目反应理论建立的项目参数具有恒久性的特点，意味着不同测量量表的分数可以统一。

项目反应理论通过项目反应曲线综合各种项目分析的资料，使我们综合直观地看出项目难度、鉴别度等项目分析的特征，从而起到指导项目筛选和编制测验比较分数等作用。

项目反应理论的特点(1)独立性。

被试特质水平不依赖于被试样本的代表性；被试水平参数不依赖于测验项目组；项目特征参数不依赖于所测被试组的参数不变测验项目组。

(2)项目理论中被试水平和项目难度可以直接比较；(3)正视了测量误差和项目性能是否与被试水平相关这一事实；(4)提供了计算机化自适应测验这一策略；(5) 从计量学角度提出了自己的新观点与新技术。

历史发展IRT理论发端于20世纪50年代，它同时被丹麦统计学家Georg Rasch和美国心理统计学家Frederic M. Lord在各自的国家发展起来。

尽管采取的研究方法不同，但是他们的结果却非常相似。

F. Lord在1951年从普林斯顿大学毕业时的博士论文《A Theory of Test Scores》被认为是IRT 理论的开端之作。

项目反应理论简介

• 区分度指标（鉴别力指数D或相关系数r） D＝ PH－PL
经典测量理论的测验编制
• 假设被试的特质是正态分布，从而测验总分的分布也是正态
• 测验分数尽可能区分被试，因此测验总分的变异程度越大越好
• 测验中试题的难度中等为好，区分度越大越好
经典测量理论的缺陷
• 参数依赖于样本 • 能力量表与难度量表不统一 • 对于所有被试的测量误差相等 • 无法反应潜在特质与被试作答之
参数估计时标尺的建立
P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2) =P(2;2.0,-0.15,0.2)
P

0.2

1
1 0.2 e 1.710.5( 0.8)

0.2

1
1 0.2 e 1.71( 2 0.7 )
间的关系 • 在测验编制问题上的困惑
准备知识
• 标准分数
Z XX S
• Z>0，高于平均，Z<0，低于平均 • P(-1.96<Z<1.96)=0.950 • P(-3<Z<3)=0.997
A1 1 1 0 1 0 0 0 1 16 B0 1 0 1 1 1 1 0 1 0 6 C1 0 1 0 1 1 0 1 1 1 7 D1 1 1 0 0 0 0 0 0 14 E11110110107 F11000010115 G1 1 1 0 1 1 0 0 1 17 H0 1 1 1 1 0 1 1 1 18 I 10001001104 J 01100010014 总7 8 7 3 6 4 5 3 8 7

1

c3

1
1 c3 e1.7a3 ( b3 )

项目反应理论简介

项目反应理论简介摘要：项目反应理论（IRT）是近三十年发展起来的一种比较先进的心理与教育测验理论，受到国内外许多学者和专家的关注。

与经典测验理论相比，项目反应理论在较强的前提假设下，有更多的优越性。

关键词：经典测验理论；项目反应理论；项目特征曲线；罗氏模型一、引言目前，考试系统题库的建立主要基于两种指导理论：经典测验理论（Classical Test Theory, CTT）和项目反应理论（Item Response Theory, IRT）。

二者都有一套完整的试题分析指标体系和评价标准。

但经过长期实践，经典测验理论显示出某些难以克服的缺点，如由不同测试项组成的测验其结果无法比较，数据没有等距性，测量结果容易受到样本的影响，以及多个变量不易同时处理等。

针对这些，现代测验理论应运而生。

在国外已广泛应用于教育测验领域，如GRE，GMAT，TOEFL等测验，近年来也扩展应用到其他学科领域的测验评估。

Baker (2001)认为，在经典测验理论指导下，测试学家关心的是被试的测试得分，即每个正确测试项的分值总和。

而项目反应理论的关注重点则是被试是否答对每个测试项，而不是被试的测试总分。

项目反应理论和经典测验理论在数学模式、基本假设和测验可靠程度的估计指标等方面都存在着明显的差别。

与经典测验理论相比，项目反应理论在较强的前提假设下，有更多的优越性。

二、项目反应理论项目反应理论，也称潜在特质理论、潜在特质模型、强真值理论，是一种现代心理测量理论，是一系列心理统计学模型的总称，是针对经典测量理论的局限性提出来的。

项目反应理论是用来分析考试成绩或者问卷调查数据的数学模型，这些模型的目标是来确定潜在心理特征(latent trait）是否可以通过测试题被反应出来，以及测试题和被试之间的互动关系。

项目反应理论假设被试对项目的反应能体现他的潜在特质（Baker, 2001）。

根据被试回答测试项的情况，通过对项目特征函数的运算，来推测被试的能力。

项目反应理论的形成与基本理论假设

项目反应理论的形成与基本理论假设项目反应理论（Item Response Theory, IRT）是针对测试和评价领域中的一种方法和理论，旨在解决测量数据分析过程中的一系列问题，如测验题目类型、人群不同表现和不同测量精度等等。

该理论由多位统计学家和心理学家共同发展而来，包括Lord和Novick（1968), Hambleton、Swaminathan和Rogers （1991), Kolen 和Brennan（2014）等人。

项目反应理论早期起源于功效曲线（曲线上（Y-坐标）表示试题难度，X-坐标表示受试水平）。

1927年，美国心理学家Thurstone对于智力测验中的单项选择题目进行了功效曲线的研究。

1933年，Lazarsfeld和Henry对于记忆实验数据的分析中提出了多因素问题的解决方案（在Lazarsfeld和Henry的研究中最初称为Comparative-Quality Scale Technique Method）。

而当广义线性模型（GLM）在20世纪70年代发明出来之后，它便成为了许多现代IRT方法的基础。

IRT理论在假设中有一些基本前提，其包含了三个主要部分：1. 题目模型。

IRT模型的第一个基本假设是关于题目模型的，即问卷或试卷的测量者需要选择一种反映题目表现的模型。

IRT中最著名的四个模型是二维常识模型（2PLM），一维常识模型（1PLM），三维常识模型（3PLM）和一维等角模型（1PLU）等，试卷数据可以使用这些模型进行模型拟合和解释。

2.人群模型。

IRT的第二个基本假设是关于受试者或群体模型的，即每个被试的特定水平对于含有该要素的题目反应是有效的，以及这种特定水平可以准确地衡量被试者的表现水平，和题目的等级和难度水平有一定的相关性。

3.数据模型。

IRT的第三个基本假设是关于数据模型的，即用户可以基于现有数据拟合合适的IRT模型，通过分析测试中正确答案的项分布情况来优化题目的构成，以适应用户的需求。

项目反应理论(irt)在小学数学成就测验中的应用

项目反应理论(irt)在小学数学成就测验中的应用项目反应理论(IRT)作为一种效度理论，源于美国心理学家Augustus Damien和Anne Angoff等人于1960年，在心理学领域中是一种基于潜在变量结构想像的测量模型，它利用因变量和自变量之间的概率关系得到的线性模型，从而研究人的知识水平以及相关测试的描述。

近几十年来，IRT在教师测试评价领域用的非常多，而其在小学数学成就测验中的应用也是相当有趣的研究主题。

首先，需要明确数学成就测验和IRT之间的关系。

传统数学成就测验是传统教育测试评价的一种，主要通过给出多道题来测量孩子的数学水平。

但是传统的测试评价方法有许多不足，如：对于不同水平的学生来说，相对密集的考题结构不够灵活；成绩的白化假定太强；拟合模型的复杂性，等等，这些制约了传统数学成就测验的发展。

这时，IRT的出现为数学成就测验提供了新机会和新思路，可以有效地改进和完善数学成就测验。

其次，要正确应用IRT，需要考虑到IRT时常用于衡量涉及个体差异的测验。

若是应用于数学成就测验中的每一道题型的话，由于每道题型的能力评价更加准确，模型估计的准确性也会提高。

此外，IRT还可以被应用于诸如校本测验和比较测验等，用来衡量年级成就水平及学校之间的差异，从而更好地进行教育评价。

最后，应用IRT改进和完善数学成就测验，还需要考虑实际运用中的一些技术性问题，比如：遗传结构本质属性的建模；非参数模型在数据缺失的情况下的缩放；参数链接的多层模型的应用；判分头等及后置，等等。

如果能够在解决技术性问题的基础上，通过对数学成就测验中imerst得分优势的深入分析，有助于深入理解全面评价孩子数学学习情况和更好地指导教学。

总之，IRT在解决数学成就测验具有重要意义。

它不仅可以改进评价的准确度，而且可以更加准确地评估孩子的数学水平，有效地指导学校和教师的数学教学工作，为促进小学生在数学学习上的学习积极性提供有效的指导。

项目反应理论

项目反应理论任何一种理论都不可能是完美无缺的，作为测量初期发展起来的理论更是不可避免地存在着一些缺陷。

项目反应理论（Item Response Theory, IRT）则是在反对和克服传统测量理论的不足之中发展起来的一种现代测量理论。

无论是CTT还是GT，其测验内容的选择、项目参数的获得和常模的制定，都是通过抽取一定的样本（行为样本或被试样本），因此可以说二者都建立在随机抽样理论基础之上。

它们的局限性主要表现在以下几个方面：（1）信度估计的精确性不高测量的重要目标就是降低测量误差，提高测量的精度。

在经典测量理论中，信度被定义为真分数的方差与实得分数（原始分数）的方差之比。

然而，在此定义中，真分数的方差和误差的方差都无法求取。

为了估计信度，CTT又提出了平行测验的概念，并在此基础上推演出了若干个信度估计公式。

但是严格的平行测验是不存在的，等价测验也很难获得的，在此基础上估计的测验信度很难达到比较高的精确程度。

另外，经典测量理论中的信度估计值也是一个笼统值，即假定对不同能力水平的被试来说，测量的误差是相同的。

而事实是，一份测验只有在施测于能力水平与测验难度相当的被试时容易获得比较高的测量精确度。

当测验施测于能力水平高于（或低于）测验难度的被试时就容易产生较大的测量误差。

而且测量误差值会随着被试水平与测验难度距离的增加而变大。

（2）各种测量参数的估计依赖于被试样本经典测量理论构造了一个完整的理论体系，同时设计了一套参数指标来刻划测量各方面的特性。

如信度、效度、项目的难度、区分度等。

但是这些参数的估计对样本的依赖性是很大的。

如项目难度，对于同一题目，若样本的群体水平较低，就有较高的难度估计值。

测验的信度和效度采用相关分析法，同样受到样本的影响。

为避免抽样误差对参数估计的影响，经典测量理论特别强调样本对总体的代表性。

但经典理论所用的是随机抽样，随机抽样总有一定偏差存在。

何况在实际工作中，由于客观条件的限制，还不能做到随机抽样。

项目反应理论与认知诊断的统计推断方法

1、跨领域应用：将项目反应理论和认知诊断方法应用到更多领域，如医学、社会调查、人力资源等领域，拓展其应用范围和使用价值。
2、精细化建模：针对不同领域和实际问题的特点，开发更加精细化和个性化的统计推断模型，以更好地满足实际需求。
3、数据科学方法：结合数据科学领域的新方法和新技术，如机器学习、深度学习等，提高统计推断的精度和效率，为实践提供更加可靠的支持。
3、结果解释方面，需要对模型结果进行充分解释，以便更好地理解和利用模型结果。可以结合实际问题和数据的特点，制定合理的解释方式和指标，对模型结果进行深入分析，以便更好地指导实践和应用。
五、结论与展望
本次演示介绍了项目反应理论与认知诊断的统计推断方法及其应用，包括项目反应模型、认知诊断模型、参数估计与检验等，并通过例题和数据讲解了方法的具体应用。还分析了统计推断方法面临的挑战和相应的解决方案。随着技术的发展和应用领域的扩展，未来研究可以以下几个方面：
3、参数估计与检验
在应用项目反应理论和认知诊断模型时，需要对模型参数进行估计和检验。常见的参数估计方法包括最大似然估计、期望最大化算法等，检验方法则包括拟合度检验、模型稳定性检验等。参数估计与检验可以确保模型的适用性和精度。
三、方法应用
1、考试成绩分析
通过应用项目反应理论，可以对考试成绩进行全面分析。例如，教育机构可以利用项目反应理论对试题难度、区分度等进行分析，以便更好地设计试题和评估学生的学习水平。此外，项目反应理论还可以用于学生的能力估计和学科优势识别等方面。
项目反应理论与认知诊断的统计推断方法
目录
01 一、项目反应理论与认知诊断的简介
02 二、统计推断方法
03 三、方法应用
04 四、挑战与解决方案

项目反应理论【精选文档】

项目反应理论随着心理学的发展, 心理测量无论是在理论上, 还是在方法上都逐步地提高.目前，心理测量有三大理论派别：经典测量理论（Classical Test Theory , 简称CTT) ，项目反应理论（Item Response Theory ，简称IRT) 和概化理论（Generalizability Theory , 简称GT）.项目反应理论是一种先进的测量理论,它是针对经典测量理论的不足而提出来的, 其理论基础是潜在特质理论。

项目反应理论的基本思路是确定考生的心理特质值和他们对于项目的反应之间的关系, 这种关系的数学形式就是“项目反应模型”。

下面主要对项目反应的理论假设和数学模型做一下简要概述。

一、项目反应理论的基本假设任何一种数学模型都有一定的前提，任何一种测量都有一定的假设,在项目反应理论中也有三条最基本的假设：潜在特质空间的单维性假设、测验项目间的局部独立性假设、项目特征曲线假设.有的学者还增加了“知道—-答对"假设和非速度限制假设。

在此仅说明前面三条最基本的假设.1、潜在特质空间的单维性假设潜在特质空间是指由心理学中的潜在特质组成的抽象空间。

如果考生在测验项目上的反应是有K种潜在特质所决定的,那么这些潜在特征就定义了一个K维潜在空间，考生的各个潜在特质分数综合起来，就决定了该考生在该潜在空间的位置。

如果影响考生测验分数的所有重要的心理特质都被确定了，那么该潜在空间就称为完全潜在空间。

目前比较成熟的大多数项目反应模型都假设完全潜在空间是单维的,即只有一种潜在特质决定了考生对项目的反应，也就是说组成某个测验的所有项目都是测量的同一个心理变量，例如知识、能力、态度或人格。

当然，这一假设往往不可能得到严格的满足,因为总有其他因素会影响到考生在测验上的反应，这些因素包括认知的、人格的和施测时的客观条件,以及考生的动机水平、焦虑程度、反应速度和考试技巧等。

因此在项目反应理论中,只要所预测量的心理特质是影响考生对项目作出反应的主要因素，那么就认为这组测验数据是满足单维假设的.2、测验项目间的局部独立性假设所谓局部独立性假设是指某个考生对于某个项目的正确概率不会受到他对于该测验中其他项目反应的影响，也就是说只有考生的特质水平和项目的特性会影响到考生对该项目的反应.在实际的教育和心理测量问题中, 如果前一个项目的内容为后一个项目的正确反应提供暗示或其它有效的信息，局部独立性的假设就会遭到破坏，例如所谓的链状试题就会出现这种情况.局部独立性是建立在统计的意义上的,用统计学的语言，局部独立性是指对每一个测验者来说, 对整个试题作出某种反应的概率等于对组成试卷的每个项目的反应的概率的乘积.3、项目特征曲线假设项目反应理论的一个关键就是在被试者对项目作出的反应或作出反应的概率与被测试者的潜在特质之间建立某种函数关系。

项目反应理论简介

f '( x1 )
( x0 , f ( x0 ))
注意：迭代过程不可能无休止地进行下去，必须设定一个终止规则，常用的终止规则是，当相邻的两个迭代近似值之间的差异小于某个预
先设定值（如0.01）时，迭代过程终止。
x0 x1 r
. ..
x
解方程
lnL(u | ) n f ( ) ( ui Pi ( )) 0 i 1
项目反应的基本模型
双参数模型：
三参数模型：
eDai ( bi ) Pi ( ) ci (1 ci ) 1 eDai ( bi )
其中，b表示试题的难度参数，a表示试题的区分度参数，c表示试题的猜测系数，D是常量，D=1.7。
2
项目反应理论简介
项目特征曲线
（-3,3）
单参数逻辑斯蒂模型的项目特征曲线
4
计算机自适应测试的编制过程
1.ONE 题库建设
2.TWO
3.THREE 参数估计
4.FOUR 测试终止条件
选题策略
4
计算机自适应测试的编制过程
题目的搜集
1.ONE
题库建设
试题参数的获取
4
计算机自适应测试的编制过程
初始能力参数估计选题策略
2.TWO 选题策略
能力参数精确估计选题策略
初始能力参数估计选题策略
lnL(u | ) n f '( ) Pi ( ) ( Pi ( ) 1) 2 i 1
2
f (0 ) 1 =0 ' f (0 )
f ( n ) n 1 = n ' f ( n )
...
(| n1 n | 0.01)
4

项目分析及项目反应理论

项目分析及项目反应理论项目分析是项目管理中非常重要的一部分，它通过对项目的各个方面进行深入的研究和分析，为项目实施提供有效的指导和决策依据。

项目反应理论则是研究项目在实施过程中各种外部因素对项目结果的影响，以及项目团队如何应对和适应这些变化的理论框架。

一、项目分析的概念和目的项目分析是指对项目进行全面的、综合性的分析，以评估项目的可行性和可行性，为项目的实施提供决策依据。

项目分析的目的是充分了解项目的背景、目标和需求，明确项目的范围、目标、资源和计划。

通过项目分析，可以有效地减少项目风险，提高项目成功的几率。

项目分析包括对项目的市场和竞争环境进行分析，对项目的技术可行性和经济可行性进行评估，对项目的组织和管理进行规划等。

通过对项目的各个方面进行详细的研究，可以为项目实施提供科学的依据和指导。

二、项目分析的方法和步骤项目分析通常包括项目需求分析、项目范围分析、项目目标分析、项目资源分析等。

1. 项目需求分析项目需求分析是确定项目所需资源和功能的过程。

在项目需求分析阶段，需要明确项目的业务目标、用户需求、功能需求和性能需求，以便能够准确地制定项目计划和资源分配。

2. 项目范围分析项目范围分析是明确项目的边界和范围，确定哪些工作和活动包含在项目中，哪些不包含在项目中的过程。

通过项目范围分析，可以明确项目的具体目标和任务，确保项目团队的工作重点和方向。

3. 项目目标分析项目目标分析是对项目的目标和关键绩效指标进行分析和评估的过程。

在项目目标分析阶段，需要明确项目的终极目标和里程碑目标，制定合理的目标达成计划和时间表。

4. 项目资源分析项目资源分析是对项目所需资源进行评估和分析的过程。

项目资源包括人力资源、财务资源、技术资源等。

通过项目资源分析，可以合理评估项目的资源需求和资源投入，确保项目实施的顺利进行。

三、项目反应理论的原理和应用项目反应理论是指研究项目在实施过程中受到各种外部因素影响并做出相应反应的理论框架。

项目反应理论简介

项目反应理论的挑
05
战与未来发展
挑战与问题
01
模型参数的识别和估计
项目反应理论依赖于对模型参数的准确识别和估计，然而在实际应用中，由于数据质量、样本大小等因素的影响，可能会出现参数估计不准确的问题。
02
模型的假设条件
项目反应理论是基于一些假设条件，如局部独立性和正态分布等，然而在实际应用中，这些假设条件可能会被违反。
02
心概念
刺激与反应
1 2
刺激
指能够引起和激发个体反应的外部环境因素。
反应
指个体对刺激做出的行为或心理上的回应。
3
反应规则
指在特定刺激下，个体如何做出反应的规律。
反应者与环境
01
反应者
指受到外部刺激并做出反应的个体或系统。
02
03
环境
交互作用
指反应者所处的外部条件和影响因素。
指反应者和环境之间的相互影响和作用。
更具有广泛适用性。
模型的适用性
03
未来研究可以开发适用于更广泛任务或测验的模型，论与实践的结合
要点一
针对具体应用场景进行模型设计和优化
项目反应理论在教育、心理学、医学等领域都有广泛的应用，未来研究可以针对这些具体应用场景进行模型设计和优化，以提高模型的适用性和实用性。
项目反应理论简介
汇报人： 2023-11-29
目录
• 项目反应理论概述 • 项目反应理论的核心概念 • 项目反应理论的应用领域 • 项目反应理论的研究与发展 • 项目反应理论的挑战与未来发展
01
项目反应理论概述
定义与背景
项目反应理论是一种心理测量理论，它为理解和描述个体在特定测验项目上的反应行为提供了一个框架。该理论是心理测量学领域的重要支柱之一，被广泛应用于教育和临床诊断等领域。

项目反应理论111.pptx

在项目反应理论中，常用一般的统计依存性和统计独立性概念来讨论项目间关系。
Pi(+)：表示正确回答第i个项目的概率 Pi(-)：表示答错第个i项目的概率 Pj(+)：表示正确回答第j个项目的概率 Pj(-) ：表示答错第j个项目的概率

P(+,+)表示正确回答第i和第j个项目的概率同理，其它的见课本。

大量事实证明，对两级记分的项目，被试的能力水平与他对项目的反应之间呈S型的曲线关系，而且这一关系具有相当的普遍性。
S型ICC具有一些共同点，即都有一条Y=1的上渐近线和一条Y=c(c≥0)的下渐进线，且是严格单调上升的，一条ICC的形状取决于三个变量：下渐近线的高度，曲线拐点的位置及拐点处的斜率。这三个变量恰好相当于三个项目参数：猜测参数ci，难度参数bi和区分度参数ai。
1.00
项目1
Pi(θ)
0.50
项目2
0.00
b θ
图区分度参数ai对正确反应概率的影响
ai越大，曲线在bi附近就会越陡，项目在bi 附近的区分能力就越大，但在远离bi的区域，曲线就会变得越平坦，项目的区分能力就越低。也就是说，区分度参数ai大的项目对能力水平接近bi的被试有较大的区分能力，而对能力水平远大于或小于bi的被试区分能力小。相反，区分度参数ai小的项目则在能力分布更广泛范围内对被试都有一定的区分能力。
上渐近线
1.00
Pi(θ)
1 c 2
0.50
拐点切线下渐近线
c
0.00
b
θ
(1)难度参数bi 在一条ICC中，bi等于曲线在拐点处的θ值。当猜测参数ci=0（曲线的下渐近线为0）时，bi等于Pi(θ)=0.50时的θ值，因为对一条完整的ICC，拐点恰好是曲线的中点和对称点。当ci>0时， P(θ)=(1+c)/2

项目反应理论

项目反应理论随着心理学的发展, 心理测量无论就是在理论上, 还就是在方法上都逐步地提高。

目前, 心理测量有三大理论派别: 经典测量理论(Classical Test Theory , 简称CTT) , 项目反应理论( Item Response Theory , 简称IRT) 与概化理论( Generalizability Theory , 简称GT)。

项目反应理论就是一种先进的测量理论,它就是针对经典测量理论的不足而提出来的, 其理论基础就是潜在特质理论。

项目反应理论的基本思路就是确定考生的心理特质值与她们对于项目的反应之间的关系, 这种关系的数学形式就就是“项目反应模型”。

下面主要对项目反应的理论假设与数学模型做一下简要概述。

一、项目反应理论的基本假设任何一种数学模型都有一定的前提,任何一种测量都有一定的假设,在项目反应理论中也有三条最基本的假设:潜在特质空间的单维性假设、测验项目间的局部独立性假设、项目特征曲线假设。

有的学者还增加了“知道——答对”假设与非速度限制假设。

在此仅说明前面三条最基本的假设。

1、潜在特质空间的单维性假设潜在特质空间就是指由心理学中的潜在特质组成的抽象空间。

如果考生在测验项目上的反应就是有K种潜在特质所决定的,那么这些潜在特征就定义了一个K维潜在空间,考生的各个潜在特质分数综合起来,就决定了该考生在该潜在空间的位置。

如果影响考生测验分数的所有重要的心理特质都被确定了,那么该潜在空间就称为完全潜在空间。

目前比较成熟的大多数项目反应模型都假设完全潜在空间就是单维的,即只有一种潜在特质决定了考生对项目的反应,也就就是说组成某个测验的所有项目都就是测量的同一个心理变量,例如知识、能力、态度或人格。

当然,这一假设往往不可能得到严格的满足,因为总有其她因素会影响到考生在测验上的反应,这些因素包括认知的、人格的与施测时的客观条件,以及考生的动机水平、焦虑程度、反应速度与考试技巧等。

多维项目反应理论

Gibbs抽样
谢谢观看
பைடு நூலகம்
2、项目反应理论——从单维到多维
从因子分析发展的背景可以看出 , 一些计量学家意识到传统因子分析的一些缺陷 , 提出了利用完整信息的项目反应矩阵 , 对被试心理特质与项目反应之间的关系利用非线性概率模型来表达 , 建立了 FA 与 IRT 之间的连接 , 甚至产生了实质上的 MIRT 模型。但是, 他们关注的重点仍然是数据降维, 即进行因子分析而不是被试或项目特征 , 而 IRT 关注的重点则是被试和测验项目之间的交互作用, 因而完整的 MIRT 概念框架必然少不了 IRT 的特征。
多维项目反应理论
IRT
项目反应理论（ Item Response Theory ，简称 IRT ），又称潜在特质理论（ Latent Trait Theory) 或项目特征曲线理论（ Item Characteristic Curse Theory) ，是为了克服经典测验理论（CTT）的局限而提出的现代测验理论。从测验的内部或微观方面入手，采取数学建模和统计调整的方法，重点讨论被试的能力水平与测验项目之间的实质性关系，测验的每一个项目都有自己的项目特征曲线，描述了每一个特定能力水平的被试答对或答错该项目的概率。
1981 年, Bock 和 Aitkin (1981) 建立了 IRT 和FA 之间的直接联系, 从而导致了 MIRT 的雏形。他们为多维特质空间定义的正态肩形模型包括了 FA与 IRT 两者的特征。模型如下
a, θ, d 参数相当于目前 MIRT 表达式中所使用的参数, a 是区分度参数向量, θ 是特质向量, d是难度参数。尽管这个模型实质上是个 MIRT 模型, 但是, 与完整的 MIRT 概念框架相比, 唯一缺乏的是没有把项目参数作为被试和项目交互作用的描述性测量来解释。

项目反应理论简介

项目反应理论简介一、项目反应理论的概念项目反应理论(Item Response Theory, IRT)是一系列心理统计学模型的总称,是针对经典测量理论(Classical Test Theory,简称CTT) 的局限性提出来的。

IRT 是用来分析考试成绩或者问卷调查数据的数学模型,这些模型的目标是来确定的潜在心理特征(latent trait)是否可以通过测试题被反应出来,以及测试题和被测试者之间的互动关系。

目前广泛应用在心理和教育测量领域,基于IRT理论的计算机自适应测试(CAT)是CAA常用的测试方法。

潜在特质模型(latent trait mode l)认为,在被试样本可观察到的测试成绩和基于该成绩不可观察的特质或能力之间存在着联系。

二、IRT的理论体系(三条基本假设)–假设一:能力单维性假设——指组成某个测验的所有项目都是测量同一潜在特质;–假设二:局部独立性假设——指对某个被试而言,项目间无相关存在;–假设三:项目特征曲线假设——指对被试某项目的正确反映概率与其能力之间的函数关系所作的模型。

IRT最大的优点是题目参数的不变性,即题目参数的估计独立于被试组。

它假定,被试在某一试题上的成绩不受他在测验中其他试题上的成绩影响;同时,在试题上各个被试的作答也是彼此独立的,仅由各被试的潜在特质水平所决定,一个被试的成绩不影响另一被试的成绩,这就叫做局部独立性假设。

IRT理论所做出的一切推论都必须以局部独立性假设为前提。

三、IRT常用的模型IRT根据受测者回答问题的情况,通过对题目特征函数的运算,来推测受测者的能力。

IRT的题目参数有:难度(difficulty index)、区分度(discriminative powder index)和猜测系数(guessing index)。

根据参数的不同,特征函数可分为单参数模型(难度)、双参数模型(难度、区分度)和三参数模型(难度、区分度、猜测参数)等。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

尽管存在以上缺点，CTT仍在广泛地应用。 CTT、IRT和概化理论是当今最有影响的三种测验理论。简单地说，IRT在处理微观问题（即被试水平与答题目之间的实质性关系）时优势明显， CTT在处理中观问题（如处理常见的标准化考试等）时方便易懂，GT则在处理宏观问题（如对结果作推论）时更显出色。三种测验理论体系有内在联系，各有长短，应相互促进，互相补充。
理论方法体系相对完整前提假设比较弱所涉及到的数学模型以及参数的概念和估计方法易理解和掌握标准化技术在控制测验误差等方面有明显的效果

2、CTT在理论体系和方法体系方面存在许多其本身难以克服的缺点，具体表现为：

基本假设难以成立：①真分数与观测分数间存在线性关系的假定不合理；②平行测验的假设难以成立；③误差与真分数独立的假设难以满足。

不同的是，CTT是以被试对所有测验项目的反应总和（测验总分）为显变量来预测被试的潜在特质的，并不认为被试对单个项目的反应与其特质间有任何有意义的联系。

IRT则认为被试的能力与其对某一特定项目的反应（以正确或错误反应概率表示）有某种函数关系存在，确定这种关系就是IRT的基本思想和出发点。
二、IRT的基本理论体系
（一）、概念（二）、基本思想及基本思路（三）、基本理论假设

（一）、概念

项目反应理论（Item Response Theory，简称 IRT），又称潜在特质理论（Latent Trait Theory) 或项目特征曲线理论（Item Characteristic Curse Theory)，是为了克服经典测验理论（CTT）的局限而提出的现代测验理论。从测验的内部或微观方面入手，采取数学建模和统计调整的方法，重点讨论被试的能力水平与测验项目之间的实质性关系，测验的每一个项目都有自己的项目特征曲线，描述了每一个特定能力水平的被试答对或答错该项目的概率。
所以IRT可以被理解为一种探讨被试对项目的反应与其潜在特质间关系的概率性方法。

用θ(theta)表示被试的潜在特质或能力，用 Pi(θ)表示其对项目i正确反应概率，项目反应理论的关键就是确定θ与Pi(θ)间的函数关系。
1.00
正确反应的概率： Pi(θ)
0.50
0.00
潜在特质： θ
Pi(θ)
1 c 2
0.50
拐点切线下渐近线
c
0.00
b
θ
(1)难度参数bi 在一条ICC中，bi等于曲线在拐点处的θ值。当猜测参数ci=0（曲线的下渐近线为0）时，bi 等于Pi(θ)=0.50时的θ值，因为对一条完整的 ICC，拐点恰好是曲线的中点和对称点。当ci>0时， P(θ)=(1+c)/2

1 e 2
y2 2
dy
ai、bi、ci，y为正态曲线纵线的高度，dy表示对y积分，∫为积分符号，上下角表示积分的范围，求从z=-∞到z=ai(θ -bi)范围内正态曲线下的累积面积。
(2)双参数正态卵形模型当猜测参数为0时，三参数变成了双参数。
(3)单参数正态卵形模型当ci=0，ai=1时，双参数变成了单参数。

在IRT中， bi表示一个项目的难度，其取值范围一般在-3.0到+3.0之间。 bi越大，表示项目的难度越大。
1.00
项目1
Pi(θ)
0.50
项目2
0.00
b1
θ
b2
从上图可以看出，项目2比项目1更难些，因为能力相同的同一组被试对项目1的正确反应概率要大于对项目2的正确反应概率。在其他条件不变的情况下，增大项目的难度会使ICC向右平移。
（二）、逻辑斯蒂模型(Logistic Models)

由于正态卵形模型中的积分运算不易进行，伯恩鲍姆(Birnbaum,1957)在洛德正态卵形模型的基础上提出了逻辑斯蒂模型。逻辑斯蒂模型避免了复杂的积分运算，在估计能力和项目参数时要简便得多。逻辑斯蒂模型是使用最广的模型，其次是正态卵形模型。

pi ( )
1 1 e
1.7 ai ( bi )
(3)单参数逻辑斯蒂模型当ci=0，ai=1时，就得到单参数逻辑斯蒂模型。

pi ( )
1 1 e
1.7 ( bi )

单参数逻辑斯蒂模型又称拉什模型，是丹麦数学家拉什(Rasch,G.,1960)从一个不同的角度独立提出的心理测验模型。在IRT的发展历史上，拉什模型占有重要的地位，有诸多研究者认为IRT的创立者是两位，一位是洛德，一位就是拉什。
（三）、基本理论假设
1、潜在特质空间的单维性假设 2、局部独立性假设 3、项目特征曲线假设 4、非速度性假设

1、潜在特质空间的单维性假设(unidimensionality)

潜在特质空间单维性指测验测量的是单一的特质而非多元特质，即被试对测验中任一项目的反应是其单一特质θ的函数。
(2)区分度参数ai 在一条ICC中，ai的大小决定曲线在拐点bi 处的陡度。 ai很大时，在bi附近能力θ的增加会导致正确反应概率Pi(θ)有很快的增长； ai很小时，在bi附近能力θ的等量增加不会导致正确反应概率Pi(θ)有明显的增长。 ai的取值范围通常在0.30~2之间。
表1
某个项目假设的项目特征曲线
潜在特质空间（Latent Trait Space）
对于某一特殊行为的发展起作用的所有潜在特质的集合。
维度
在潜在特质空间中互相独立的潜在特质的个数。一个K维的潜在特质空间可以表示为： H =(θ1， θ2， θ3，...，θk)
总之，潜在特质理论是一切心理测量理论研究的基础。

如何判断是否满足单维性假设？因素分析的方法当因素分析抽取的第一个公共因素解释的变异远大于第二个公共因素时，就可认为测验是单维的。

但严格的单维性是大多数测量工具都难以满足的，这也是IRT受到批评的主要原因。

所以，解决测验的单维性问题及建立多维反应模型是IRT将要研究的任务之一。

如果四个等式中的任何一个不成立，则这两个项目在统计上就是依存的。

例：如果 Pi(+)=.8 Pi(-)=.2 Pj(+)=.6 Pj(-)=.4 P(+, -)=.32 P( -, -)=.08
那么当且仅当 P(+,+)=.48 P( -,+)=.12 时两个项目才独立。

实际就是指，如果两个项目的每种反应模式的概率，仅仅根据对每个项目正确与不正确反应的概率就能计算出来，那么项目之间便是独立的。

逻辑斯蒂模型也包括三参数、双参数和单参数模型三种。
(1)三参数逻辑斯蒂模型的表达式：
pi ( ) ci (1 ci )
1 1 e
1.7 ai ( bi )
ai、bi、ci分别为区分度参数、难度参数、猜测参数，含义与正态卵形模型相同。
(2)双参数逻辑斯蒂模型当猜测参数ci=0时，三参数就变成了双参数模型。

（二）、项目反应理论的发展

由于项目特征曲线（ICC）对项目反应理论的产生具有重要意义，所以在讲项目反应理论的产生和发展问题时，一般都追溯到 1905年比奈和西蒙编制第一个智力量表时的工作，他们当时所使用的作业成绩随年龄增长而提高的散点图与现在的ICC曲线十分类似。

IRT的真正创立者是美国心理测量学家洛德 (Lord)。1952年，洛德发表博士论文《一个测验分数的理论》，提出了IRT的第一个数学模型（Two-parameter Normal Ogive Model，双参数正态卵形曲线模型）及其参数的估计方法，并把该模型应用到了学业成绩和态度测量工作之中。
心理测量学
第十八讲项目反应理论简介
内容提要：

项目反应理论的发展：
IRT的基本理论体系项目反应模型
计算机程序
IRT的应用、优点与不足
一、项目反应理论的发展：

（一）、经典测验理论

（二）、项目反应理论的发展
（一）、经典测验理论
1、CTT的理论体系很完善，是其他测验理论赖以产生的基石。优点有：

项目统计量严重依赖于测验所实施的被试样组。

被试测验分数依赖于所施测项目的难度。

测验信度观存在严重问题。CTT的信度是针对被试全体的，只代表平均测量精度，假设所有被试测量标准误相等，而实际上，不同能力水平的被试不可能具有同样的测量标准误。
缺乏预测力对测验等值、适应性测验、标准参照性测验的编制等问题不能给以满意的解决。
1.00
项目1
Pi(θ)
0.50
项目2
0.00
b θ
图区分度参数ai对正确反应概率的影响
ai越大，曲线在bi附近就会越陡，项目在bi 附近的区分能力就越大，但在远离bi的区域，曲线就会变得越平坦，项目的区分能力就越低。也就是说，区分度参数ai大的项目对能力水平接近bi的被试有较大的区分能力，而对能力水平远大于或小于bi的被试区分能力小。相反，区分度参数ai小的项目则在能力分布更广泛范围内对被试都有
IRT假定正确反应概率Pi(θ)与θ间存在规律性的变化关系，这种关系可以用一个数学函数的形式表示出来，这一函数称为项目反应函数(Item Response Function)，项目特征曲线就是这一函数的图像。
大量事实证明，对两级记分的项目，被试的能力水平与他对项目的反应之间呈S型的曲线关系，而且这一关系具有相当的普遍性。