项目反应理论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

项目反应理论

随着心理学的发展, 心理测量无论是在理论上, 还是在方法上都逐步地提高。目前, 心理测量有三大理论派别: 经典测量理论(Classical Test Theory , 简称CTT) , 项目反应理论( Item Response Theory , 简称IRT) 和概化理论( Generalizability Theory , 简称GT)。

项目反应理论是一种先进的测量理论,它是针对经典测量理论的不足而提出来的, 其理论基础是潜在特质理论。项目反应理论的基本思路是确定考生的心理特质值和他们对于项目的反应之间的关系, 这种关系的数学形式就是“项目反应模型”。下面主要对项目反应的理论假设和数学模型做一下简要概述。

一、项目反应理论的基本假设

任何一种数学模型都有一定的前提,任何一种测量都有一定的假设,在项目反应理论中也有三条最基本的假设:潜在特质空间的单维性假设、测验项目间的局部独立性假设、项目特征曲线假设。有的学者还增加了“知道——答对”假设和非速度限制假设。在此仅说明前面三条最基本的假设。

1、潜在特质空间的单维性假设

潜在特质空间是指由心理学中的潜在特质组成的抽象空间。如果考生在测验项目上的反应是有K种潜在特质所决定的,那么这些潜在特征就定义了一个K维潜在空间,考生的各个潜在特质分数综合起来,就决定了该考生在该潜在空间的位置。如果影响考生测验分数的所有重要的心理特质都被确定了,那么该潜在空间就称为完全潜在空间。

目前比较成熟的大多数项目反应模型都假设完全潜在空间是单维的,即只有一种潜在特质决定了考生对项目的反应,也就是说组成某个测验的所有项目都是测量的同一个心理变量,例如知识、能力、态度或人格。当然,这一假设往往不可能得到严格的满足,因为总有其他因素会影响到考生在测验上的反应,这些因素包括认知的、人格的和施测时的客观条件,以及考生的动机水平、焦虑程度、反应速度和考试技巧等。因此在项目反应理论中,只要所预测量的心理特质是影响考生对项目作出反应的主要因素,那么就认为这组测验数据是满足单维假设的。

2、测验项目间的局部独立性假设

所谓局部独立性假设是指某个考生对于某个项目的正确概率不会受到他对于该测验中其他项目反应的影响,也就是说只有考生的特质水平和项目的特性会影响到考生对该项目的反应。在实际的教育和心理测量问题中, 如果前一个项目的内容为后一个项目的

正确反应提供暗示或其它有效的信息, 局部独立性的假设就会遭到破坏, 例如所谓的链状试题就会出现这种情况。局部独立性是建立在统计的意义上的,用统计学的语言, 局部独立性是指对每一个测验者来说, 对整个试题作出某种反应的概率等于对组成试卷的每个项目的反应的概率的乘积。

3、项目特征曲线假设

项目反应理论的一个关键就是在被试者对项目作出的反应或作出反应的概率与被测试者的潜在特质之间建立某种函数关系。可谓的项目特征曲线, 就是相应函数关系的图象。项目反应理论之所以要作出项目特征曲线形式的假设, 是因为项目反应理论的建立不是首先从理论上推导出函数关系的存在, 而是先假定有某种形式的项目特征曲线, 然后找出满足相应曲线的函数形式。所以, 关于项目特征曲线的特征形式的假设实际上就是对未来函数关系的假设。项目特征曲线的假设主要有三点:

第一、曲线的下端渐近线。如果一个项目的猜测参数值为C0, 即这个项目能够凭猜测作出正确反应的概率为C0, 那么项目特征曲线的下端渐近线为Y= C0如果假设在测验中不存在猜测因素的作用或我们不去考虑猜测因素的作用, 则取C0=0,即项目特征曲线以Y=0为其下端渐近线。

第二、曲线的上端渐近线。通常假定曲线的上端渐近线为Y=1, 即假定对θ值足够大的被试者, 对项目或试卷作出正确反应的概率是趋于1的。

第三、曲线的升降性。项目反应理论假定曲线严格单调上升, 即仅存在一个曲变点(又称拐点, 曲线在此处的一阶导数等于零)。

二、项目反应模型

IRT 模型是一种数学模型, 它的特点是以概率的概念来解释应试者对试题的反应和其潜在能力特质之间的关系。IRT 的模型有20 余种, 但比较常用的有洛德提出的著名的正态卵形模型和伯恩鲍姆提出的逻辑斯蒂模型( Logistic模型)。这两种函数模型在计算结果上并无大的区别, 所绘制的曲线也大体相同, 然而, 在实际中大多采用后者。其中主要有以下两个方面的原因: 首先是它形式上的简洁, 更具数学模型的特点; 其次是它便于用对数关系作处理, 因而模型的项目质量参数和能力参数估计起来较为方便。

1、逻辑斯蒂模型( Logistic模型)

由于Logistic 模型相对比较简单, 准确性较高,计算量较其他模型小, 因此在建立自适应考试系统时, 常采用Logistic 模型。由于参数的不同, 分为单参数、双参数和三参数,其中以三参数的Logistic模型最为常用, 由于计算机和网络技术的发展, 对考试

的准确性的要求也越来越高, 对三参数的Logistic 模型的研究也比较成熟, 现在逐步趋向使用三参数模型。函数表达式如下:

θ表示受测者的能力, a(a∈R) 表示区分度, b(b∈R) 表示难度, c表示猜测的系数,受测者答对试题的概率是θ的函数, 记为P(θ), 称之为项目反应函数。

一般地, 对某一测验项目的质量, 我们可采用项目难度、项目区分度和猜测参数三个指标来描述, 据特征函数可画出题目的特征曲线( Item Characteristic Curve,ICC) ,图1 为典型的三参数模型的特征曲线:

从图1 可以看出, 项目特性曲线下部的渐近线离坐标轴的零点有一定的距离。这表明由于存在猜测因素, 能力或物质水平很低的被试仍有可能答对该项目的猜测参数值, 一般用c 来表示, 它是凭猜测答对该题的概率。项目特性曲线是一条以拐点为中心的曲线, 因而其拐点在纵轴上的投影正好落在c 与1 的中点上, 即拐点的纵坐标为( 1+c) /2。这表明物质水平为b(拐点在横轴上的投影) 的被试与答对该项目的概率, 排除猜测因素不计, 恰好彼此相等,所以b 通常被定义为项目的难度参数。项目特性曲线拐点处的斜率刻了曲线的陡峭程度, 这与项目区分被试物质水平的能力有关。很显然, 曲线越陡峭, 答对概率P( θ) 对物质水平θ的变化就越敏感, 即项目区分被试水平的能力就越强。因此, 曲线拐点处的斜率被称为项目的区分度参数, 一般用a 来表示。

2、正态卵形模型

和logistic 模型一样,根据模型中包含的条目参数的个数,正态卵形模型被命名为双参

相关文档
最新文档