项目反应理论与计算机化自适应考试研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

科技论坛

项目反应理论与计算机化自适应考试研究

张墨

(燕山大学,河北秦皇岛066004)

1概述随着社会的不断进步,社会对劳动者的知识和能力水平要求越来越高。考试这一衡量人才能力的重要手段,在现代社会占有举足轻重的地位,而且已经深入到了社会生活的诸多方面。同时,随着科技的进步,考试的手段和媒介也在发生变化。怎样运用高新技术,客观、准确的评估人的能力水平,已成为重要课题。2考试理论的发展2.1传统考试理论传统考试理论是指以真分数理论为代表的

经典测试理论(ClassicalTestTheory,简称CTT)

。它对试题的难度、区分度等参数采用直接测算的办法,这比较符合人们的思维习惯和一般教师的操作习惯,是当前考试理论的主流。

经过了近百年的发展,经典测试理论建立了一系列题目分析的公式,对建立试卷、考分转换与等值等均有一套较为完整的方法。但此理论仍有不够完善的地方:考生分数和题目难度有着密切关系,即题目难度是相对于考生而言的,这使得题目参数不够稳定,易受测试样本的影响;考查的项目较多;考试时间必须固定;数据分析十分不方便;不同测验的测验分

数没有可比性;另外,不论考生水平高低全部要接受同一批题目的测验,测验信息量与各题目的信息量不能取得统一,很大一部分试题由于信息量不够,事实上并没有达到测验目的,而是被浪费了。[1]

2.2项目反应理论针对经典测试理论的上述不足,一种全新的考试指导理论逐步发展起来,这就是项目反应理论(ItemResponseTheory,简称IRT)

。该理论是指不根据以往的得分进行评价(总分/平均分/偏差值),而采用不依赖于考试团体及考试问题的「绝对评价尺度」的新型考试理论。从大量的采样考试数据中算出各问题的特性值(难易度、

识别力等),据此对新参加考试者的能力用绝对尺度进行推

定。

项目反应理论的最大优越性在于,试题参数的估计独立于被试样本,而能力参数的估计又独立于试题样本。

也就是说,项目反应理论中的这些参数具有不变性,它们不随被试的样本而变化。另外,项目反应理论提出了题目信息量和测验信息量的概念,测验信息量是各题信息量之和,各题的信息量与题目难度有直接的关系,当题目难度与考生能力水平接近时题目的信息量最大。

因此,利用项目反应理论的题库构造测验时,选择难度与考生能力水平相当的试题就可以用最少的题量获得目标要求的信息量,这就是自适应考试的理论基础。

3项目反应理论的特征函数3.1基本概念题目难度:难度是指应试者解答试题的难易程度,它是衡量测评试题质量的一个重要指标参数,它和区分度共同影响并决定人才测评的鉴别性。在项目反应理论中,题目难度是独立于受测试者的,而题目难度的选

择则与受测者的能力有关,所选择的题目难度一般是适合受测者,能够最好的测试出受

测者的能力值。

题目的区分度:区分度是反映测评试题区分应试者能力水平高低的指标。试题区分度高,可以有效拉开不同水平应试者分数的距离。试题的区分度与试题的难度直接相关,通常来说,中等难度的试题区分度较大。另外,试题的区分度也与应试者的水平密切相关。在项目反应理论中,试题的区分度也是独立于受测试者的。

题目的猜测系数:猜测系数是指受测试者猜对本道题目的概率,它的值越大,受测试者的能力对测试结果的影响就越小。题目的信息量也就越

小。

与经典测量理论相比,项目反应理论(IRT)是建立在强假设的基础上的。主要有以下假设:

a.潜在特质空间的单维性假设:就是说被测量的测验结果只取决于一种能力,其他能力的影响都可以忽略。b.局部独立性假设:

即假设考生在某一题目上答对的概率独立于其他题目的概率。c.试题特征曲线假设:假设考生对某试题的正确反应概率与其能力之间的关系可以用一个单调上升的函数表示。

3.2项目反应理论的特征函数项目反应理论是以受测者回答问题的情况,经题目特征函数的运算,推测受测者的能力。公式

如下:

三参数模式(logistic模型):其中:D=1.702;

θ:受测者能力值;a:题目的区分度;b:题目的难度;c:题目的猜测系数;:能力为θ的人答对此题目的概率。根据特征函数可画出题目的特征曲线,图1为典型的三参数模式的特征曲线:a参数:题目的区分度,即特征曲线的斜率。b参数:

题目的难度,即特征曲线在横坐标上的投影。c参数:

题目的猜测系数,即特征曲线的截距。项目反应理论同经典测试理论相比,

具有以下优点:a.题目参数估计更为准确。

b.全面解决考试等值问题。c.定义了信息函数这一综合质量指标,作为更科学地挑选题目的标准。d.适合编制自适应性考试系统。4计算机化自适应考试计算机化自适应考试

(CAT)是指在以项目反

应理论(IRT)为基础建立的题库之上,不断地根据题目的各方面信息和受测者的答题情况估计受测

者的能力,然后从题库中选取符合受测者能力的题目进行测试,

直到达到预定的测试精度要求,即可结束考试。

计算机化自适应考试在近年来测验理论研究及实践应用中取得了引人注目的发展,在这里计算机不仅是媒体工具,而且是智能化的决策者,它依托大型题库,采用现代测量理论———项目反应理论,

自行去适应被测者水平,灵活选择难度最恰当的题目,

从而实现对被测者的高质量的测试。在测试过程中,计算机要实时进行复杂计算,立即估计被测者水平,并针对这种水平迅速从题库中选出最适合的题目,

继续进行测试,以达到最精确测试的目的。

整个测试过程见图2。下面对CAT系统进行测试的各个环节加以详细描述。

4.1建立题库题库是进行测试的基础,高质量的题库应具有优质、量大、等值、动态可扩充等特点。CAT题库的建立有以下几个步骤:4.1.1选择模型,首先应选择适应的IRT模型,如常用的三参数logistic模型。在此模型的基础上,建立题库中题目的规格标准。4.1.2题目的开发,开发应按题库命题的规格标准进行,应注重不同知识内容与能力层次、不同难度和不同题型的结合,

对开发的试题应组织审查,确保题目的质量。

4.1.3题目参数的确定,主要是对题目IRT各参数值的确定。4.1.4题库的动态维护,基于IRT的题库由于IRT理论具有参数不变性等优点,题库的扩充变的更为容易,只需安排一些新题目与旧有题目相混合进行测试,就可以将新题目的参数值与旧题目的参数值统一到一张量表中来。

4.2参数初始化摘

要:针对传统考试理论的不足之处,项目反应理论被提出并逐渐实用化。详细分析了这一理论及基于这一理论的计算机化自适应考试的基

本概念以及设计理念,并简要介绍了计算机化自适应考试系统的具体实现方法。

关键词:考试;项目反应理论;计算机化自适应

Abstract:Contraposing the shortcomings of the traditional theory of test,item response theory has been proposed and increasingly practical.This article detailedly analysed this theory and the basic concepts and design concepts of computerized adaptive tests based on this theory,brief the method of design and achieve of computerized adaptive test system.

Key words:Exam ;Item Response Theory ;Computerized Adaptive Test 图1三参数特征曲线

[2]

相关文档
最新文档