项目反应理论模型及参数估计方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

的反应概率乘起来; 要估计题目参数, 就要把若干被试 对一 个题目的若干反应概率乘 起来; 当题 目和能 力参 数都不 知 道时, 我们要对这两类参数做联合估计, 即要把若干被 试对 若干题目的反应的若干个概率乘在一起。当我们要把 这些 事件的概率乘在一起时, 必须先假定它们是相互 独立的, 否 则, 就不能这样做。
2. 潜在特质 空间 ( La tent Trait Space) 和完 全潜 在特 质 空间
潜在特质的集合被称作潜在特质空间, 也就 是说, 如果 被试的行为受 k个潜在特质 (能 力 ) 所决定, 则此 k维空 间 就称为 / 潜在特 质空 间 0。 假定 每个 项目 对每 个被 试施 行 一次, 并考虑对任何固定 H值的所有 项目分数 yg 的条件 联 合次数 分布 (对所有人 ), 如果这种 (不 可观测的 )分布 对所 有这些被试总体不相同, 那么在 H1, H2, , Hk 之外, 就还 有一 个或多 个能鉴别到有关总体的心理维度。这样, 通过定义, 在完全潜在空间中, 项目分数对于特定 H的条件 分布来说, 对所有 有关总体是相同的。潜在特质理论当 k很小时 是最 有用的 。简单地 说就是, 模型所解释的能力, 仅仅是影 响被 试反应的那些因素, 这组能力代表了完全的潜在 特质空间。 当单维性假 设成 立 时, 完 全 潜 在 空间 就 只 由 一种 能 力 构 成 [ 5]。
文章编号: 1006- 5342( 2009) 02- 0065- 03
Vo.l 29, No. 2 Apr. 2009
项目反应理论模型及参数估计方法*
李传益
(咸宁学院 外国语学院, 湖北 咸宁 437005)
摘 要: 为了克服经典测量理论中题目参数等指标的变异 性, 项 目反应理 论得到 了发展, 现已 产生了很 多估计 题
在项目上的正确作答概率对潜在特质分数的回归曲 线。这
样, 我们就可以根据不 同的反 应数据 选择相 应的 模型来 估
计参数。
三、项目反应理论模型
用来描述 ICC的项目反应模型有很多种。我们主 要讨
论单维二ห้องสมุดไป่ตู้反应 (评分 )模型。
1. 正态拱形 曲线模型
1952年, Lord提出了双 参数正 态拱形曲 线模 型 ( two-
式 中符号代表的意义同正态拱形曲线模型中符号 的意
义。从 表达式可以看出, R asch模型 中只有一 个项 目参数, 因而该模型又称作单参数模型, 简称 1- PL模型。
3. Logistic模型
针对被试在客观多项选择题和是非判断题上可能 出现
的猜测现 象, B irnbaum 增 加了 猜测 参数 c, 并于 1957年 到
* 收稿日期: 2008211226
66
咸宁学院学报
第 29卷
因于一个单一的能 力或特 质, 其 它潜在 特质或 能力 均可忽 略。或者说, 项目测的是 一个变 量 (知 识、能 力、属性、人格 特质等 )。单维潜在空间假设是最常见的, 因为测验 编制者 通常希望编制单维的测验, 以提高一组测验分数的 解释力。 测验使用者也 往往 想要单 一的 分数 (如 成套 测验 的总 分 ) 而不管其解释力如 何。当然, 这个 单维 假设是 不能 严格满 足的, 因为总会有一些认 知的、人格 的、测验中 的因 素如测 验动机、测验焦 虑、表现 速度、测 验的 复杂 程度 ( 或测 验误 导 ), 以及其他认知技能 等影响 测验表 现, 或至少 会在某种 程度上影响。但只要 有一个主 导成 分或主 导因 素即可 , 这 个主导成分或因素就 被认为是测验所测的能力 [ 6] 。
bi 与能力 H定义在同一量表上, 为难度参数, 也称为曲 线的 定位参数; 而 ai 则被 称为区 分度 参数, 是 曲线 拐点 处的 切 线斜率的函数, ai 越 大, 曲线越 陡峭, 反之 亦然。 双参数 正 态拱形 曲线模型对于帮助理解项目反应理论模型的特 性以
及模型参数的意义都是非常有作用的。但由于它采用 积分
一、项目反应理论的发展过程 项目反应理论 ( IRT)是 20世纪 80年 代测量 专家们研 究的主题之一。它建 立在潜在 心理 特质理 论基 础之上 , 不 再以整个测验而是 以单个 测验项目 为考 察对象, 以 要研究 的被试的潜在心理特 质和被试在测验项目上的反应之间的 关系作为自己的核 心内容, 并用 某种数 学形式 来表 示这种 关系 [ 1] 。 其实, 这种基于项目的测验思想 最早出现在 B inet和 S i2 mon编制的世界上第一个智力量表中。他们分析了不同年龄 的儿童对测验项目的不同反应情况, 画出了被试年龄与正确反 应水平之间的散点图。只要用一条光滑的曲线对图中的散点 拟合一 下, 就 能得 到一 条项 目 反应 曲线 ( Item Character istic Curve, ICC)。因此, 这一图形通常被认为是最早的项目反应 曲线图。 1946年 Tucker提出了项目特征曲线的概念。所谓项 目特征曲线, 就是被试对一个测验项目的正确反应概率与被试 能力或特质水平之间的一种二维曲线图。这种曲线图可以用 特定的数学 模型 表示, 这就是 项目 反应 模型 [ 2] 。 1952年 和 1953年 Lord提出了双参数正态拱形模型 ( two- Parameter Nor2 ma lOgiveM odel), 并提出了与此相关的参数估计方法, 使 IRT 可被用来解决实际的二值计分的测验问题。这是 IRT发展史 上的重要里程碑, 它标志着这一理论的正式诞生 [ 3] 。但是, 由 于 IRT数学上的复杂性以及缺乏有效的计算机程序的支持, 一 直到六十年代末, IRT的发展始终都是缓慢的。随着计算机技 术的发展, 以及参数估计方法及相应计算机程序的出现, 七十 年代以后, IRT逐渐成为心理与教育测验理论的研究重点。 二、项目反应理论的假设 项目反应理论的 几个假设 是估 计 IRT 参数 所必 需的。 要估计被试的能力 参数, 我们就 要把特 定被试 对若 干题目
1958年将 Lord的双参数正态拱 形曲线 模型改 成了 Logistic
模型, 其表达式 为: Pi ( H) =
ci +
1+
1- ci exp[ - Da i ( H-
bi ) ] , 其
中 D 为 1. 7, 参数 a i、bi 与正态拱形曲线模型 中的定义 完全
一样, 这就是三参数 Logistic模型 [简称 3- PL模型 ] [ 8]。
目参数和能力的 模型。本 文简要介绍了项目反应理论中单维潜在特质假设下的几种二值记分 ( 评定 )模型及参数
估计方法。
关键词: 项目反应理论; 单 维性; 局部独立性; 模型; 参数估计方法
中图分类号: G424. 74
文献标识码: A
由于经 典测 量理 论在 测量 过程 中暴 露的 问 题越 来越 多, 心理测量理论家和实 践者都 注意到 组成测 验的 项目与 测验分数的分离现象, 他们认为, 测验理 论应该注重对组成 测验的项目和它所刻 画的心理特质之间关系的研究而不应 该把测验总分作为最终的裁决 。正是为 了克服经典测量理 论的各种局限性而发 展了一种全新的测量理论 )) ) 项目反 应理论。
虽然测量学专家们也看出从严格意义上来说并不能保证所测特质的单维性但他们又都希望所考察的特质是单维的因为只有这样能力和各种参数才能定义在同一个量表上才能利用所开发的模型进行参数估计从而也才能对分数或能力进行有效的解释和预测
第 29卷第 2期 2 0 0 9年 4月
咸宁学院学报 Journa l of X iann ing U n iver sity
( 二 )局部独立性假设 罗德和诺维克 [ 7]认为 当几个 项目被 同时处 理时, 局部 独立性假设 通常 是有 效地 解决 项目 特征 函数 问 题所 必要 的。局部独立意味着在由相同的 H1, H2, , Hk 值所刻画的任 何被试群 体内 部, 项 目分 数 的 (条 件 ) 分布 都 是相 互 独立 的。 H am bleton[ 7] 认为这一假设说的是 , 如 果考虑 到被试的 能力水平, 那么一个被试 对一测 验各个 项目的 各个 反应就 在统计上是独立的。 要让这个 假设 成立, 一被 试在 一个项 目上的表现就不能 影响到 他对另一 项目 的反应, 不 论是往 好里影响还是往坏 里影响。例 如, 一个 项目不 能为 回答另 一项目提供线索。因此, 这个假设的意思是, 只有被试能力 和测验项目的特性是影响表现 的因素。当局部独立性假设 得到满足时, 任一被试 得到任一组分数 (如 100110)的总概 率就等于每一项目概率的乘积 。每个项 目的概率依赖于对 项目和被试能力的 统计。换句 话说, 当 一被试 的反 应模式 的概率等于他在各 项目上 反应概率 的乘 积时, 局部 独立性 假设得到满足。 张凯则认为 / 局部独立性 0可以在 两个意 义上为 真: 一 是题目之间不要有连 带关系 (即 无干扰 ), 二是被 试不要作 弊。当这两 条 都 满 足时 , 被 试的 反 应 就 都是 相 互 独 立的 了 [ 7] 。 因此, 从局部独立性方 面来 说, 任何一 个项 目, 被试对 它的答对概率只取决 于被试的特质水平和该项目的技术质 量, 与其他被试和项目无关。另外, 单维 性和局部独立性并 不是等价的概念, 一个单 维或多 维的测 验都能 保证 或不保 证其项目之间具有 独立性, 因此, 我 们毫 无理由 断言, 如果 一个测验测的是单 一的特 质, 其 项目之 间就一 定局 部独立 了; 或者说, 一个多维的测验项目之间就 一定不具备局部独 立性。 ( 三 )项目特征函数的假设 项目反应理论的 最大特点就是建立了被试能力和项目 参数之间的 函数 关系, 并 且用 项目 特征 函数 ( Item Charac2 ter istic Function) ( 或称数学模型 )来描述, 它实质上是被试
(一 )潜在特质单维性假设 1. 特质 ( Tra it) 特质是指一个人所具有 的稳 定、持久而 又独 立于情 境
的心理 特征, 如推理能力、创造性、社会性、注意力的稳 定性 等。在 心理测验中, 特 质是心 理测 量的期 望对 象。在语 言 测验中, 特质一般指语言能力, 又因为能力或特质只能 根据 行为表现来推 断或估计, 无法直 接测量到, 故称 为 / 潜 在特 质 0[ 4] 。
param ete r norm a l ogive m ode l), 其表达式为:
Pi ( H)
=
a i( H- bi) -]
1
e-
z2 2
dz
2P
Pi ( H)表示 能力 为 H的被 试在 项目 i上的 正确 作答 概 率。项 目特征曲线为 S形, 因为 它形 同累积 分布 函数且 是 中心对称的, 自然假设曲线可用正态分布的形式 来描绘它。
3. 单维性假 设 一般来说, IRT假 设被 试做 出正 确反 应的 概率 可归 因 于被试 在某些潜在特质或能力 ( k 个 )上 的地位。用几 何术 语说, 就是个体在每个潜 在特 质上的 地位 可以看 成是 k 维 空间上的一个点。就 IRT的 大多 数实际 应用 而言, 潜在 特 质空间被假设成单维的。单 维性 意味着, 被 试的 表现被 归
函数形式, 不利于进一步的分析计算, 因此这个模型只 具备
优良的理论意义而不实用。
2. R asch模型
R asch模型是丹麦学 者 R asch于 1960年 提出的测 量模
型。该 模型的特点是完全根据被试的能力水平和项目 难度
的关系而推导出的正确作答概率公式, 其表达式为 :
Pi ( H)
=
exp( H- bi ) 1 + exp( H- bi )
由此可见, 潜在特质空间既可以是单维的, 也可以是多 维的。虽然测量学专 家们也看 出, 从严 格意义 上来 说并不 能保证所测特质的 单维性, 但他 们又都 希望所 考察 的特质 是单维的, 因为只有这样, 能力和各种参 数才能定义在同一 个量表上, 才能利用所开发的模型进行参数估计, 从而也才 能对分数或能力进行 有效的解释和预测。
如果答题过程中没有猜测因 素, 亦即当猜 测参数 c= 0
时, 该模型就成了双参数 Logistic模 型 [简 称 2- PL模 型 ]; 如果双参数 Logistic模型中 a i = 1, 该模型就成了单参数 Lo2 gistic模型, 其形式与 R asch模型完全一样。
相关文档
最新文档