项目反应理论111.pptx

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
项目反应理论
概念

项目反应理论(Item Response Theory,简称 IRT),又称潜在特质理论(Latent Trait Theory) 或项目特征曲线理论(Item Characteristic Curse Theory),是为了克服经典测验理论(CTT)的局 限而提出的现代测验理论。 从测验的内部或微观方面入手,采取数学建模和 统计调整的方法,重点讨论被试的能力水平与测 验项目之间的实质性关系,测验的每一个项目都 有自己的项目特征曲线,描述了每一个特定能力 水平的被试答对或答错该项目的概率。

在项目反应理论中,常用一般的统计依存 性和统计独立性概念来讨论项目间关系。
Pi(+):表示正确回答第i个项目的概率 Pi(-):表示答错第个i项目的概率 Pj(+):表示正确回答第j个项目的概率 Pj(-) :表示答错第j个项目的概率


P(+,+)表示正确回答第i和第j个项目的概率 同理,其它的见课本。
在IRT中, bi表示一个项目的难度,其取值 范围一般在-3.0到+3.0之间。 bi越大,表示项目的难度越大。

1.00
项目1
Pi(θ)
0.50
项目2
0.00
Leabharlann Baidu
b1
θ
b2
从上图可以看出,项目2比项目1更难些, 因为能力相同的同一组被试对项目1的正确 反应概率要大于对项目2的正确反应概率。 在其他条件不变的情况下,增大项目的难 度会使ICC向右平移。

pi ( )
1 1 e
1.7 a i ( bi )
(3)单参数逻辑斯蒂模型 当ci=0,ai=1时,就得到单参数逻辑斯蒂模型。

pi ( )
1 1 e
1.7 ( bi )

项目反应理论也称项目特征曲线理论 或潜在特质理论,它是依据一定的数学模 型,用项目特征参数估计潜在特质的一种 测量理论。该理论中最重要的两个基本概 念是“潜在特质”和“项目特征曲线”。
潜在特质: 把表现在一个人身上所特有的相对稳定 的行为方式称为心理特质(trait),由于 这种心理特质是隐含于其行为之中的, 所以也称做潜在特质。 潜在特质空间(Latent Trait Space) 对于某一特殊行为的发展起作用的所有潜 在特质的集合。
1.00
项目1
Pi(θ)
0.50
项目2
0.00
b θ
图 区分度参数ai对正确反应概率的影响
ai越大,曲线在bi附近就会越陡,项目在bi 附近的区分能力就越大,但在远离bi的区 域,曲线就会变得越平坦,项目的区分能 力就越低。 也就是说,区分度参数ai大的项目对能力 水平接近bi的被试有较大的区分能力,而 对能力水平远大于或小于bi的被试区分能 力小。 相反,区分度参数ai小的项目则在能力分 布更广泛范围内对被试都有一定的区分能 力。

如何理解局部独立性假设呢?
由于这种独立性是针对特定的θ值的被试而言 的,所以称为“局部”。
例:假设1000名能力相同的被试参加某一能力 测验,600名被试答对了项目i,400名答错了; 这1000名被试对项目j的正确反应概率与对项目 i的正确反应概率统计上是独立的。 总之,同一特质水平的被试回答某一项目时不 受其他项目的影响。

大量事实证明,对两级记分的项目,被试的 能力水平与他对项目的反应之间呈S型的曲线 关系,而且这一关系具有相当的普遍性。
S型ICC具有一些共同点,即都有一条Y=1的 上渐近线和一条Y=c(c≥0)的下渐进线,且是 严格单调上升的,一条ICC的形状取决于三 个变量:下渐近线的高度,曲线拐点的位置 及拐点处的斜率。 这三个变量恰好相当于三个项目参数:猜测 参数ci,难度参数bi和区分度参数ai。
基本理论假设
1、局部独立性假设 2、潜在特质空间的单维性假设

局部独立性假设(local independence): 所谓局部独立性是指能力参数θ一定时,被试 对各个项目的应答是统计上的独立。即对一 个问题的回答不影响对另一个问题的回答。 设 x j表示对项目j 应答的二值变量, 即当被试的应答是正确时: x j =1, 若是错误的: x j =0。 这时,局部独立性的假设可由下式所表示

所以,解决测验的单维性问题及建立多维 反应模型是IRT将要研究的任务之一。
项目反应模型

项目反应理论模型是一种数学模型, 它的特点 是以概率来解释被试对项目的反应和其潜在 能力特质之间的关系。
(一)、正态卵形模型(Normal Ogive Model)
正态卵形模型将项目特征曲线视为一条S 形正态累积函数曲线,相应的数学模型即 是正态累积分布函数。 可分为三参数、双参数和单参数模型三种。

(3)猜测参数ci 被试完全凭机遇答对项目i的概率即是该项 目的猜测参数ci。 注意:IRT引入此概念是为了提高对能力估 计的精度。 对包含m个选择项的选择题,其猜测参数ci 一般接近1/m。 ci的取值范围一般在0~0.50之间。

曲线越平直,区别就越小,因为低能力水平 正确回答的概率接近于高能力水平正确回答 的概率。
(1)三参数正态卵形模型 表达式为:
pi ( ) ci (1 ci )
ai ( bi )

1 e 2
y2 2
dy
式中:a为区分度; b 为难度; c 为猜测参数; θ为被试潜在特质水平; P(θ)为被试对某一测验项目的正确反应概率
(2)双参数正态卵形模型 当猜测参数为0时,三参数变成了双参数。
上渐近线
1.00
Pi(θ)
1 c 2
0.50
拐点 切线 下渐近线
c
0.00
b
θ
(1)难度参数bi 在一条ICC中,bi等于曲线在拐点处的θ值。 当猜测参数ci=0(曲线的下渐近线为0) 时,bi等于Pi(θ)=0.50时的θ值,因为对一 条完整的ICC,拐点恰好是曲线的中点和 对称点。 当ci>0时, P(θ)=(1+c)/2

例:如果 Pi(+)=0.8 Pi(-)=0.2 Pj(+)=0.6 Pj(-)=0.4 P(+, -)=0.32 P( -, -)=0.08
那么当且仅当 P(+,+)=0.48 P( -,+)=0.12 时两个项目才独立。


实际就是指,如果两个项目的每种反应模式的概 率,仅仅根据对每个项目正确与不正确反应的概 率就能计算出来,那么项目之间便是独立的。
基本思想及基本思路

IRT认为被试的能力与其对某一特定项目的 反应(以正确或错误反应概率表示)有某种 函数关系存在,确定这种关系就是IRT的基 本思想和出发点。

所以IRT可以被理解为一种探讨被试对项目 的反应与其潜在特质间关系的概率性方法。
项目反应理论的基本思想

假定被试对于测验项目的反应受某种心理特 质的支配,那么首先就要对这种特质进行界 定,然后估计出该被试这种特质的分数,并 根据该分数的高低来预测和揭示被试对于项 目或测验的反应。它主要研究被试在测验项 目上的反应与测验所测特质之间的关系。项 目反应理论的基本原理是通过建立合适的数 学模型来解释被试特质水平与其在项目作答 表现之间的关系。



逻辑斯蒂模型也包括三参数、双参数 和单参数模型三种。
(1)三参数逻辑斯蒂模型的表达式:
pi ( ) ci (1 ci )
1 1 e
1.7 a i ( bi )
ai、bi、ci分别为区分度参数、难度参数、猜测参 数,含义与正态卵形模型相同。
(2)双参数逻辑斯蒂模型 当猜测参数ci=0时,三参数就变成了双参数模 型。



潜在特质空间的单维性假设(unidimensionality)

指测验测量的是单一的特质而非多元特质, 即被试对测验中任一项目的反应是其单一 特质θ的函数。
即测试出来的能力变量是处在单维空间 中, 可在一个量表中表示, 不同的被试之 间可以相互比较。 潜在特质空间维度, 又称能力维度, 是指 被测量的测验成绩是由若干种能力 θ1 , θ2, ……θn所决定的, 这一n 维空间称为 潜在空间。假设潜在空间是一维的, 就 是说被测量的测验结果只取决于一种能 力, 其它能力的影响都可以忽略, 这就是 所谓的能力单维性。

(2)区分度参数ai 在一条ICC中,ai的大小决定曲线在拐点bi 处的陡度。 ai很大时,在bi附近能力θ的增加会导致正 确反应概率Pi(θ)有很快的增长; ai很小时,在bi附近能力θ的等量增加不会 导致正确反应概率Pi(θ)有明显的增长。 ai的取值范围通常在0.30~2之间。


根据以上定义,在下列条件下,两个项目 得分在统计上是独立的。
P(+,+)= Pi(+) Pj(+) P(+, -)= Pi(+) Pj(-) P( -,+)= Pi(-) Pj(+) P( -, -)= Pi(-) Pj(-)


如果四个等式中的任何一个不成立,则这 两个项目在统计上就是依存的。
维度
在潜在特质空间中互相独立的潜在特质的 个数。 一个K维的潜在特质空间可以表示为: H =(θ1, θ2, θ3,...,θk)
总之,潜在特质理论是一切心理测量理论研 究的基础。
项目特征曲线



IRT假定正确反应概率Pi(θ)与θ间存在规律性的 变化关系,这种关系可以用一个数学函数的形 式表示出来,这一函数称为项目反应函数(Item Response Function),项目特征曲线就是这一 函数的图像。 项目特征曲线, 就是表征被试的能力或特质水平 与其对一个测验项目的正确反应概率之间关系 的二维曲线图。 也称为“项目回答曲线”,或“项目反应函 数”,或ICC。


当测试满足局部独立性假设时,该测试 是一种单维的测试,即测试是一种仅由θ 这种单因子决定的一维测试。反之,测 试在θ一定时,是一种多维性的测试。它 表示在测试过程中,不仅被试的能力参 数影响其应答的结果,还存在着除θ以外 的其他能力和因子影响被试的应答。

但严格的单维性是大多数测量工具都 难以满足的,这也是IRT受到批评的主 要原因。
(3)单参数正态卵形模型 当ci=0,ai=1时,双参数变成了单参数。
(二)、逻辑斯蒂模型(Logistic Models)

由于正态卵形模型中的积分运算不易进行, 伯恩鲍姆(Birnbaum,1957)在洛德正态卵形 模型的基础上提出了逻辑斯蒂模型。
逻辑斯蒂模型避免了复杂的积分运算,在估计 能力和项目参数时要简便得多。 逻辑斯蒂模型是使用最广的模型,其次是正态 卵形模型。
相关文档
最新文档