项目反应理论简介

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

项目反应理论简介

摘要:项目反应理论(IRT)是近三十年发展起来的一种比较先进的心理与教育测验理论,受到国内外许多学者和专家的关注。与经典测验理论相比,项目反应理论在较强的前提假设下,有更多的优越性。

关键词:经典测验理论;项目反应理论;项目特征曲线;罗氏模型一、引言

目前,考试系统题库的建立主要基于两种指导理论:经典测验理论(Classical Test Theory, CTT)和项目反应理论(Item Response Theory, IRT)。二者都有一套完整的试题分析指标体系和评价标准。但经过长期实践,经典测验理论显示出某些难以克服的缺点,如由不同测试项组成的测验其结果无法比较,数据没有等距性,测量结果容易受到样本的影响,以及多个变量不易同时处理等。针对这些,现代测验理论应运而生。在国外已广泛应用于教育测验领域,如GRE,GMAT,TOEFL等测验,近年来也扩展应用到其他学科领域的测验评估。Baker (2001)认为,在经典测验理论指导下,测试学家关心的是被试的测试得分,即每个正确测试项的分值总和。而项目反应理论的关注重点则是被试是否答对每个测试项,而不是被试的测试总分。项目反应理论和经典测验理论在数学模式、基本假设和测验可靠程度的估计指标等方面都存在着明显的差别。与经典测验理论相比,项目反应理论在较强的前提假设下,有更多的优越性。

二、项目反应理论

项目反应理论,也称潜在特质理论、潜在特质模型、强真值理论,是一种现代心理测量理论,是一系列心理统计学模型的总称,是针对经典测量理论的局限性提出来的。项目反应理论是用来分析考试成绩或者问卷调查数据的数学模型,这些模型的目标是来确定潜在心理特征(latent trait)是否可以通过测试题被反应出来,以及测试题和被试之间的互动关系。项目反应理论假设被试对项目的反应能体现他的潜在特质(Baker, 2001)。根据被试回答测试项的情况,通过对项目特征函数的运算,来推测被试的能力。

项目反应理论的产生是以经典测验理论为前提的,其自身的发展结合了多人的努力。理查森于1936年首次提出了IRT的参数估计方法;劳勒于1944年提出了一系列关于IRT领域中基本的理论问题,推出了很有价值的参数估计方法;格特曼于1944年提出了“无误差模型”(一种确定性模型,即理想量表项目),这是后来IRT中项目特征曲线(item characteristic curve, ICC)的雏形(胡维芳,2005)。项目特征曲线是IRT的核心,IRT其他理论都是建立在ICC之上(Baker, 2001)。ICC是由塔克于1946年首次提出,他把被试的某些纬度(如能力、年龄)看作是自变量,考生对于某个测验项目的反应看作是因变量,在直角坐标系中作出散点图,然后用一条光滑的曲线拟合这些数据,这样就得到了ICC。当然,对于IRT贡献最大的是美国测量专家洛德。1952年洛德在其博士论文《关于测验分数的一个理论》中,第一次对项目反应理论作了系统的阐述(当时他称其为项目特征曲线理论,后改名为项目反应理论)。通常将此看作是项目反应理论诞生

的标志。1968年洛德和诺维克在伯恩波姆的名著《心理测验分数的统计理论》中以四章的篇幅详细地阐述了项目反应理论中具有二、三参数的罗吉斯模型和正态卵形模型的数学问题,至此,构成了项目反应理论的基本体系。20世纪70、80年代,项目反应理论获得迅猛发展,不论是基础理论与方法的研究,还是解决重大测验问题的应用研究,抑或是更实用的计算机程序的编制都取得了巨大的新成果。

项目反应理论的基本思想是确定被试的潜在特质和他们对于项目的反应之间的关系,被试的表现和这组潜在特质之间的关系,可通过一条连续严格递增的函数来加以诠释,此函数称为项目特征函数,而把不同能力的被试在某测试项的得分期望连结成线,此曲线称为项目特征曲线(ICC)。这种关系的数学表现形式就是“项目反应模型”。但这种模型是概率性模型。确切地讲,项目反应模型表示的是被试潜在能力和被试能正确答对测试项的概率之间关系的数学形式。从这个角度来讲,项目反应理论的核心就是数学模型的建立和对模型中各个参数的估计。为了定量地描述被试对于测试项的反应,测量学家们提出了各种各样的模型。一般认为,罗吉斯模型和正太卵形模型是得到普遍应用的两个模型。下面以罗吉斯模型为例,简单介绍以罗吉斯数学模型为基础的三种不同模型。IRT有三个项目参数,即难度(difficulty)、区分度(discrimination)和猜测系数(guessing)。根据不同参数,特征函数可分为三种参数模型:

第一,单参数模型(one-parameter model),也称罗氏模型(Rasch model),在这个模型下只包括难度,且区分度恒定为1。

第二,双参数模型(two-parameter model),包括难度和区分度。

第三,三参数模型(three-parameter model),包括难度、区分度和猜测参数。

若观察ICC图表,我们可以看到:

与经典测验理论相比,项目反应理论是建立在强假设基础上的。IRT 有三个基本假设:第一,潜在特质空间的单维性假设,是指组成某个测验的所有测试项都是测量同一潜在特质(俞晓琳,1998);第二,项目特征曲线假设,是指被试对项目的正确反应概率与其潜在能力之间存在函数关系,其基本模型为罗吉斯函数(logistic function)。第三,局部独立性假设,是指项目参数的估计值独立于被试,即多个被试的不同能力水平不影响项目参数;同时,被试潜在能力与测试项的难易度无关,即不同难度的测试项都能测量出同一个被试的同一潜在能力。

基于这些基本假设,项目反应理论表现出了比经典测试理论更大的优越性。第一,IRT在估计被试能力时,更考虑被试的反应组型,因此对于原始得分相同但反应组型不同的被试,得到的往往是不同的能力估计值,这一特性是CTT所无法比拟的。在CTT中,原始得分相同的被试,其能力估计值也被认为相同。第二,项目反应模型的项目参数都是不变的。项目参数不会因被试样本或项目库的变化而发生改变,但CTT提供的项目统计量、项目难度和鉴别力等都是依赖于被试样组。第三,IRT可以针对每个被试提出其能力估计值的测量误差指标,而不是以一个笼统的标准误来代表测量误差,因此能够比较精

相关文档
最新文档