项目反应理论与题库建设
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
项目反应理论与题库建设
项目反应理论(IRT)
项目反应理论是针对经典测量理论的不足而提出来的一种新的测量理论。它的最大优点是项目参数和被试能力参数的不变性。即项目参数的估计值与被试样组的选择无关;被试能力的估计值与所施测的试题无关。同时能够提供各被试能力估计值的精确度指标,而且在施测前就可以知道各个测验项目对于不同被试的能力估计的精确度。项目反应理论的这些优点对于题库的建设、测验的编制十分重要。
项目反应理论包含很多内容,限于篇幅,下面仅就其核心内容加以简单的讨论。
1、项目反应模型
项目反应模型是用以表示被试能力和被试者对测验项目“正答概率”之间关系的数学函数,这个函数是单调递增的,被称为项目特征函数(ICF: Item Charateriseic Function)或项目反应函数( IRF: Item Response Function)。它包含一定数目的项目参数(如难度参数、区分度参数、猜测参数等),这些参数值可以通过一定的方法估计出,在项目参数值确定后,利用项目反应模型就可以计算出各被试的能力估计值。
在IRT的研究发展中,人们提出了多种项目反应模型,这些模型主要分为两大类:静态模型和动态模型。静态模型描述考生某个时刻的潜在特质水平,不包含时间因素;动态模型用来测量考生潜在特质随时间变化的程度。目前发展比较成熟且得到广泛应用的是静态模型。下面我们主要介绍在题库建设中常使用的几种静态模型。
静态模型也有多种,它们可分为单维的和多维的;二值记分的和多值记分的;正态卵型的和逻辑斯谛型的,等等。在题库建设中最常用的是单维的二值记分的逻辑斯谛模型。单维是指模型假设只有一种潜在特质对测验反应数据起作用;二值记分是与二值反应相联系的记分方式。在成就和能力测验中,考生对项目反应的“正确”与“错误”,通常用0和1表示(0表示错,l表示对),所形成的测验数据就是二值的。二值记分表明模型所能处理的测验数据是二值的。
逻辑斯谛模型的数学表达式为:
式中,e为自然对数的底;x为一个任意符号。当x用不同的代数式表示时,就形成了各种不同参数的逻辑斯谛模型,如双参数逻辑斯谛模型、单参数和三参数逻辑斯谛模型等。
1、项目反应模型
⑴双参数逻辑斯谛模型
双参数逻辑斯谛模型的数学表达式为:
式中,Pi(θ)表示某个随机选出的能力值为的考生正答项目 i的概率;ai和bi是项目i的两个不同的参数;n为项目数;D是量表因子,通常取值为1.7。
在双参数模型中蕴含这样一个假设,即考生在对项目作出反应时并不受到猜测因素的影响,能力值极低的考生,其正确回答概率接近于零。
⑵三参数逻辑斯谛模型
三参数逻辑斯谛模型的数学表达式为:
它是在双参逻辑斯谛模型中增加了参数C后得到的。式中,Ci是和能力极低考生的正答概率有关的参数,称为猜测参数,或伪随机水平参数;其它各字母的意义与双参数模型数学表达式中的一致。
如图所示的是一个典型的三参数逻辑斯谛模型项目特征曲线。图中横坐标表示考生的能力值,被称为能力量表;纵坐标表示考生的正答概率,称为概率量表。从图中可以看出各个参数的涵义。参数bi等于项目特征曲线(项目特征函数的图象称为项目特征曲线,简称ICC)上斜率最大处在能力量表上对应的值,对应于bi点的ICC的斜率为0.425ai·(1-Ci)。式中ai为项目区分度,ai值越大,ICC越陡,参数Ci是在概率量表上度量的,它表示能力极低考生的正答概率。
显然,由于该模型中包含了参数Ci,即意味着能力极低的考生也有可能答对该项目,因此,这一模型适合于多项选择题的成就测验或能力测验。
⑶单参数逻辑斯谛模型
单参数逻辑斯谛模型可以看作是三参模型的特例。其数学表达式为:
式中,θj为考生j的能力水平值;bi为项目i的难度,随项目的不同,bi值是变化的;pi(θj)为第j个考生答对项目i的概率。
从式中可以看出,当考生的能力θj强于项目难度bi时,即θj>bi时,(θj-bi)为正值,此时,该考生成功的概率将大于0.5;当(θj-bi)的值越大,考生成功的概率就越接近于l。当考生能力值低于项目难度值时,即θj<bi 时,(θj-bi)为负值,此时,该考生成功的概率将小于0.5;考生能力越低,项目难度越高,该考生成功的概率越接近于零。
虽然单参模型可以看作双参和三参模型的特例,但由于它本身还有一些独特性质,所以对于测验使用者仍有相当的吸引力。首先该模型只有较少的项目参数,比较容易处理;其次,在进行参数估计时,它比其它模型遇到的问题要少些;第三,它可以使对项目参数和能力参数的估计完全分开,达到某种特定的客观性。这就意味着:只要测验项目是符合该模型的,对于考生能力参数的估计就是独立于所使用的测验项目和无偏的;只要考生是符合于该模型的,对项目参数的估计就独立于考生样组的能力分布和无偏的。单参模型的这一特点可以使我们对该模型中的项目难度参数和考生能力参数分别进行估计而不相互干扰。
1、项目反应模型
以上介绍的三种逻辑斯谛模型都是最常用的项目反应模型。但是,由于参数设置和模型中的假设不同,它们各自适用于特定的测验数据。也就是说,在实际应用中要进行模型的选择。选用哪一种模型要考虑许多因素,通常主要考虑测验数据能够满足模型的假设情况。例如,单参数和双参数模型假设被试在对项目作出反应时不存在猜测成分,三参模型允许被试凭猜测作出反应。如果测验数据是从一组多项选择题或是非题所得到的,那就不能排除被试作答时的猜测因素。对于这种测验数据,选择三参数模型比较合适。再如,单参数模型假设各项目具有相同的区分度,而双参和三参模型允许各项目具有不同的区分度,在无法保证或无法确定测验的各项目具有相同的区分度时,就不能采用单参数模型。因此,一般认为,三参数模型适用于由多项选择题和是非题组成的测验,双参数模型适用于其它一些不存在猜测因素的测验,在测验结果既不受猜测因素影响,测验中各项目又具有相同区分度的情况下,再选用单参模型。当然这并不意味着单参模型的实用性差。实验研究证明,项目反应模型具