项目反应理论与经典测验理论的比较共70页
自学考试现代教育测量与评价网络课堂答案
教育测量与评价现代教育测量与评价学第一章教育测量与评价概述一、教育测量的含义(33分)本节测验题:智力测量属于A. 物理测量B. 心理测量C. 生理测量D. 社会测量二、教育测量的特点、教育评价的含义(35分)提出“凡物之存在必有其数量”命题的是谁?A. 麦柯尔B. 孟子C. 桑戴克D. 孔子三、教育评价的特点、教育测量与评价的产生(35分)现代教育评价产生的标志是A. 《比纳.西蒙量表》B. 科举考试C. T.B.C.F制D. “八年研究”四、现代教育测量与评价的发展(30分)第四代教育评价”的创立者是A. 枯巴和林肯B. 比纳和西蒙C. 桑代克和麦柯尔D. 泰勒与布鲁姆五、教育测量与教育评价相关概念辨析(30分)我国教育法规定的两项基本教育制度:一是教育督导制度,二是A. 教育评价制度B. 教育考试制度C. 教育测量制度D. 教育评估制度第二章教育测量与评价的信度一、信度概述(31分)样本统计量与总体参数越接近,说明测验的信度A. 越低B. 无法判断C. 越高D. 需要验证二、重测信度、复本信度、同质性信度(一)(35分)用同一个量表对同一组被试先后施测两次,所得结果的一致性程度是A. 等值性信度B. 等值稳定性信度C. 分半信度D. 重测信度三、同质性信度(二)、评分者的信度(一)(31分)若2个评分者评阅N份试卷,计算评分者的信度可用A. 斯皮尔曼等级相关系数公式B. 斯皮尔曼-布朗公式C. 积差相关系数公式D. 肯德尔和谐系数公式四、评分者的信度(二)、标准参照测验的信度(33分)估计标准参照测验的信度需要预先确定A. 淘汰的人数B. 达标的比例C. 通过的人数D. 决断的分数第三章教育测量与评价的效度一、效度概述、内容效度的含义(30分)下列适合于内容效度的测验是A. 能力倾向测验B. 成就测验C. 人格测验D. 性格测验二、内容效度的估计方法、结构效度(38分)下面哪种测验的效度不属于结构效度?A. 智力测验B. 焦虑测验C. 动机测验D. 学科测验三、效标关联效度(44分)效标关联效度也称为A. 实证效度B. 预测效度C. 同时效度D. 逻辑效度第四章教育测量与评价题目的难度和区分度一、难度及其计算、区分度及其计算(一)(40分)最适宜的难度系数是A. 0.50B. 0.00C. 1.00D. -1.00二、区分度的计算(二)、区分度与信度和难度的关系(31分)难度系数越接近何值,题目的区分度越大?A. 0.50B. 1.00C. 0.00D. -1.00第五章教育测量与评价分数的整理和转换一、教育测量与评价分数的整理(32分)被试者只有连续通过一次又一次的不同测验取舍分数线,才能最终获得成功。
经典测验理论和项目反应理论的区别与联系
第1卷 4ຫໍສະໝຸດ 第2 期 经典测验理论和项 目反应理论的区别与联 系
李夏妍
( 东金融学院 , 东 广州 广 广 50 2 ) 15 1
[ 摘
要] 经典测验理论与项 目反应理论是 现代 测量 学的基本理论 。这 两种理论 既有 区另 又有联 1
系, 在理论基础 、 基本假设、 学模式、 数 信度估计、 目参数 等几个方 面经典测验理论 和项 目反应理论 有 项
心理 与教育测验是用于测量人 的心理特质和学业成就 的主要方法之一。 随着心理与教育研 究的 日益科学化 , 心理 和 对
教育测验 的要求越来越高 , 心理与教育测验 的理论也随之不 断发 展。 当今 存在着三种 主要 的测验理论 , 包括经 典测验理论 ( lsia T sT er, v )概 化理论 ( e eai blyT er , T 和项 目反应理论(tm R so s T er,R ) 其 中, Cascl et h oy c r 、 G n rl ait hoy G ) z i I epne h o IT 。 e y 概 化理论是对经典测验理 论的扩展 , 它们都属于随机抽样理论 , 而且都 建立在真分数模式的理论基础上 。 但是, 目反应理 项 论无论在理论基础 、 基本假设、 数学模式 , 还是在信度估 计、 目参数上都 与经典测验 理论 有 明显 的区别 , 项 本文 主要讨论这
・
7 ・ 5
维普资讯
一
维性假设 的合理性 ; 局部独立主要通过统计独立 的方法来进行 检验 ; 建立 的数 学模 型与实测 数据 的拟合要求 较高 , 容 不
易做到。 13 数学模式 .
经典测验理论 是建 立在真分数模 式的基础上 , 即任何测量值都由真分数和误差分数两部分 组成, 这两部分 之间互相独 立, 数学公 式是 : = T+ 被试的某种潜在特质无法 由某次测验的分数来表示, X 。 必须在无数次测验的基础上求平均值才能
项目反应理论与经典测验理论之比较
项目反应理论与经典测验理论之比较一、本文概述在心理学、教育学和统计学等领域,测验理论一直扮演着至关重要的角色。
它们为我们提供了一种评估个体能力、知识、技能或情感状态的方法。
在众多的测验理论中,项目反应理论(Item Response Theory,简称IRT)和经典测验理论(Classical Test Theory,简称CTT)尤为引人注目。
本文旨在深入探讨这两种测验理论的核心概念、主要特点和应用场景,并通过比较分析来揭示它们的优势和局限性。
通过本文的阐述,读者将能更全面地理解项目反应理论与经典测验理论的基本原理,以及它们在不同实践领域的适用性。
在概述部分,我们将首先对项目反应理论和经典测验理论进行简要介绍,包括它们的起源、发展历程以及核心假设。
随后,我们将阐述本文的主要目的和研究问题,即比较这两种测验理论在理论框架、模型构建、参数估计、测量精度以及应用领域的异同。
通过这一概述,读者可以对本文的整体结构和内容有一个初步的了解,为后续深入探讨打下基础。
二、项目反应理论与经典测验理论的基本框架项目反应理论(Item Response Theory,简称IRT)与经典测验理论(Classical Test Theory,简称CTT)是心理测量学中的两大基本理论,它们各自构建了独特的理论框架和应用体系。
经典测验理论,起源于20世纪初,它基于真分数模型,认为测验的得分是由真分数和误差分数两部分组成的。
真分数反映了被试者的实际能力,而误差分数则是由测量过程中的随机误差引起的。
CTT 的主要假设包括测验的内部一致性、测验与测验之间的等价性和样本的代表性。
它主要关注测验的整体特性,如信度、效度和难度等,而忽略了单个项目的特性。
项目反应理论,则是在20世纪50年代后期逐步发展起来的。
与CTT不同,IRT将焦点放在了单个项目(即题目)的反应概率上,认为每个项目都有其独特的难度参数和区分度参数。
IRT模型,如二参数逻辑斯蒂克模型(2PL)、三参数逻辑斯蒂克模型(3PL)等,详细描述了项目参数与被试者能力之间的关系,并可以预测被试者在不同项目上的反应概率。
项目反应理论简介
项目反应理论简介摘要:项目反应理论(IRT)是近三十年发展起来的一种比较先进的心理与教育测验理论,受到国内外许多学者和专家的关注。
与经典测验理论相比,项目反应理论在较强的前提假设下,有更多的优越性。
关键词:经典测验理论;项目反应理论;项目特征曲线;罗氏模型一、引言目前,考试系统题库的建立主要基于两种指导理论:经典测验理论(Classical Test Theory, CTT)和项目反应理论(Item Response Theory, IRT)。
二者都有一套完整的试题分析指标体系和评价标准。
但经过长期实践,经典测验理论显示出某些难以克服的缺点,如由不同测试项组成的测验其结果无法比较,数据没有等距性,测量结果容易受到样本的影响,以及多个变量不易同时处理等。
针对这些,现代测验理论应运而生。
在国外已广泛应用于教育测验领域,如GRE,GMAT,TOEFL等测验,近年来也扩展应用到其他学科领域的测验评估。
Baker (2001)认为,在经典测验理论指导下,测试学家关心的是被试的测试得分,即每个正确测试项的分值总和。
而项目反应理论的关注重点则是被试是否答对每个测试项,而不是被试的测试总分。
项目反应理论和经典测验理论在数学模式、基本假设和测验可靠程度的估计指标等方面都存在着明显的差别。
与经典测验理论相比,项目反应理论在较强的前提假设下,有更多的优越性。
二、项目反应理论项目反应理论,也称潜在特质理论、潜在特质模型、强真值理论,是一种现代心理测量理论,是一系列心理统计学模型的总称,是针对经典测量理论的局限性提出来的。
项目反应理论是用来分析考试成绩或者问卷调查数据的数学模型,这些模型的目标是来确定潜在心理特征(latent trait)是否可以通过测试题被反应出来,以及测试题和被试之间的互动关系。
项目反应理论假设被试对项目的反应能体现他的潜在特质(Baker, 2001)。
根据被试回答测试项的情况,通过对项目特征函数的运算,来推测被试的能力。
论《经典测量理论、项目反应理论、概化理论的理论观点及相互比较》
论《经典测量理论、项目反应理论、概化理论的理论观点及相互比较》学校:学院:班级:学号:姓名:论《经典测量理论、项目反应理论、概化理论的理论观点及相互比较》心理与教育测量理论的发展经历了两个时期:50年代之前只有真分数理论起作用,称为经典测量理论阶段;50年代至今,除经典测量理论外,还有项目反应理论、概化理论等,可称为多重理论并存阶段。
经典测量理论在测验发展中有着特殊的地位,它既是历史上的第一个测验理论,也是测验的最一般、最基本的理论,并且目前仍具有很强的生命力,应用极为广泛。
现代测验理论大多是在经典测验理论的研究基础上,针对它在某个方面存在的问题发展起来的。
如项目反应理论,就是为了克服经典测验理论的信度问题发展起来的。
在目前这个多种理论并存阶段,我们应该看到各种理论都有其合理之处,同时也各有其局限性。
一般将测量理论分为经典测量理论、概化理论和项目反应理论三大类,或称三种理论模型。
人们将以真分数理论(True Score Theory)•为核心理论假设的测量理论及其方法体系,统称为经典测验理论(Classical Test Theory,CTT),•也称真分数理论。
一、经典测量理论真分数理论是最早实现数学形式化的测量理论。
它从十九世纪末开始兴起,二十世纪30年代形成比较完整的体系而渐趋成熟。
50年代格里克森的著作使其具有完备的数学理论形式,而1968年洛德和诺维克的《心理测验分数的统计理论》一书,将经典真分数理论发展至颠峰状态,并实现了向现代测量理论的转换。
所谓真分数是指被测者在所测特质(如能力、知识、个性等)上的真实值,即(True Score)真分数。
而我们通过一定测量工具(如测验量表和测量仪器)进行测量,在测量工具上直接获得的值(读数),叫观测值或观察分数。
由于有测量误差存在,所以,观察值并不等于所测特质的真实质,换句话说,观察分数中包含有真分数和误差分数。
而要获得对真实分数的值,就必须将测量的误差从观察分数中分离出来。
经典测试理论&项目反映理论
经典测试理论_项目分析指标
库理法(只适用于客观性测试)
经典测试理论_项目分析指标
用克伦巴赫 系数公式估测主观性测试信 度:
经典测试理论_项目分析指标
6. 效度_测试的有效性或测试结果的正确 程度,是指测试在多大程度上测量到了所 要测的东西。
内容效度_测试内容与所要测量的内容之 间的一致性程度。
经典测试理论&项目反应理论
王佩&汪灿灿
经典测试理论
形成: 出现于20世纪初,到了50年代形成了完 整的体系。 基本思想:把测试的得分(observed score)看 作是真分数和误差分数的线性组合。
数学模型:X=T+E(X为观测分数,T为真分数, E为误差分数)
经典测试理论_项目分析指标
项目反应理论
形成: 1. 雏形在本世纪四十年代中期出现,由丹 麦学者拉什(Geoge Rasch)提出。
2. 但直到60-70年代,由于计算机的广泛 应用和普及,计算机程序BICAL的出现, 才使得项目反应理论的应用成为现实。
项目反应理论
基本思想:在心理测验中寻找一个相对 “恒定”的度量标准,从而更加客观的描 述和评价测试手段中被测试对象的特征。
项目反应理论_模型
单参数模型 三参数逻辑斯蒂模型 (three parameter logistic models)
项目反应理论_模型
三参数模式的特征曲 线:
项目反应理论_模型
5. 信度_测试结果的一致或者稳定程度。换句话 说,有信度的试题在任何时间、地点下通过测 试都能得到一致的结果。
8.项目反应理论简介
IRT则认为被试的能力与其对某一特定项目 的反应(以正确或错误反应概率表示)有 某种函数关系存在,确定这种关系就是IRT 的基本思想和出发点。
所以IRT可以被理解为一种探讨被试对项目 的反应与其潜在特质间关系的概率性方法。
用θ(theta)表示被试的潜在特质或能力, 用Pi(θ)表示其对项目i正确反应概率,项目 反应理论的关键就是确定θ与Pi(θ)间的函数 关系。
(二)项目反应理论的发展
由于项目特征曲线(ICC)对项目反应理论 的产生具有重要意义,所以在讲项目反应 理论的产生和发展问题时,一般都追溯到 1905年比奈和西蒙编制第一个智力量表时 的工作,他们当时所使用的作业成绩随年 龄增长而提高的散点图与现在的ICC曲线十 分类似。
IRT的真正创立者是美国心理测量学家洛德 (Lord)。1952年,洛德发表博士论文《一个 测验分数的理论》,提出了IRT的第一个数 学模型(Two-parameter Normal Ogive Model,双参数正态卵形曲线模型)及其参 数的估计方法,并把该模型应用到了学业 成绩和态度测量工作之中。
如何理解局部独立性假设呢? 由于这种独立性是针对特定的θ值的被试而 言的,所以称为“局部”。
例:假设1000名能力相同的被试参加某一能 力测验,600名被试答对了项目i,400名答 错了;这1000名被试对项目j的正确反应概 率与对项目i的正确反应概率统计上是独立 的。 总之,同一特质水平的被试回答某一项目时 不受其他项目的影响。
1.00
正确 反应 的概 率: Pi(θ)
0.50
0.00
潜在特质: θ
表1
某个项目假设的项目特征曲线
项目反应理论【精选文档】
项目反应理论随着心理学的发展, 心理测量无论是在理论上, 还是在方法上都逐步地提高.目前,心理测量有三大理论派别:经典测量理论(Classical Test Theory , 简称CTT) ,项目反应理论(Item Response Theory ,简称IRT) 和概化理论(Generalizability Theory , 简称GT).项目反应理论是一种先进的测量理论,它是针对经典测量理论的不足而提出来的, 其理论基础是潜在特质理论。
项目反应理论的基本思路是确定考生的心理特质值和他们对于项目的反应之间的关系, 这种关系的数学形式就是“项目反应模型”。
下面主要对项目反应的理论假设和数学模型做一下简要概述。
一、项目反应理论的基本假设任何一种数学模型都有一定的前提,任何一种测量都有一定的假设,在项目反应理论中也有三条最基本的假设:潜在特质空间的单维性假设、测验项目间的局部独立性假设、项目特征曲线假设.有的学者还增加了“知道—-答对"假设和非速度限制假设。
在此仅说明前面三条最基本的假设.1、潜在特质空间的单维性假设潜在特质空间是指由心理学中的潜在特质组成的抽象空间。
如果考生在测验项目上的反应是有K种潜在特质所决定的,那么这些潜在特征就定义了一个K维潜在空间,考生的各个潜在特质分数综合起来,就决定了该考生在该潜在空间的位置。
如果影响考生测验分数的所有重要的心理特质都被确定了,那么该潜在空间就称为完全潜在空间。
目前比较成熟的大多数项目反应模型都假设完全潜在空间是单维的,即只有一种潜在特质决定了考生对项目的反应,也就是说组成某个测验的所有项目都是测量的同一个心理变量,例如知识、能力、态度或人格。
当然,这一假设往往不可能得到严格的满足,因为总有其他因素会影响到考生在测验上的反应,这些因素包括认知的、人格的和施测时的客观条件,以及考生的动机水平、焦虑程度、反应速度和考试技巧等。
因此在项目反应理论中,只要所预测量的心理特质是影响考生对项目作出反应的主要因素,那么就认为这组测验数据是满足单维假设的.2、测验项目间的局部独立性假设所谓局部独立性假设是指某个考生对于某个项目的正确概率不会受到他对于该测验中其他项目反应的影响,也就是说只有考生的特质水平和项目的特性会影响到考生对该项目的反应.在实际的教育和心理测量问题中, 如果前一个项目的内容为后一个项目的正确反应提供暗示或其它有效的信息,局部独立性的假设就会遭到破坏,例如所谓的链状试题就会出现这种情况.局部独立性是建立在统计的意义上的,用统计学的语言,局部独立性是指对每一个测验者来说, 对整个试题作出某种反应的概率等于对组成试卷的每个项目的反应的概率的乘积.3、项目特征曲线假设项目反应理论的一个关键就是在被试者对项目作出的反应或作出反应的概率与被测试者的潜在特质之间建立某种函数关系。
项目反应理论简介
( x0 , f ( x0 ))
注意:迭代过程不可能无休止地进行下去,必须设定一个终止规则, 常用的终止规则是,当相邻的两个迭代近似值之间的差异小于某个预
先设定值(如0.01)时,迭代过程终止。
x0 x1 r
. ..
x
解方程
lnL(u | ) n f ( ) ( ui Pi ( )) 0 i 1
项目反应的基 本模型
双参数模型:
三参数模型:
eDai ( bi ) Pi ( ) ci (1 ci ) 1 eDai ( bi )
其中,b表示试题的难度参数,a表示试题的区分度参数,c表示试题的猜测系数,D是常量,D=1.7。
2
项目反应理论简介
项目特征曲线
(-3,3)
单参数逻辑斯蒂模型的项目特征曲线
4
计算机自适应测试的编制过程
1.ONE 题库建设
2.TWO
3.THREE 参数估计
4.FOUR 测试终止条件
选题策略
4
计算机自适应测试的编制过程
题目的搜集
1.ONE
题库建设
试题参数的获取
4
计算机自适应测试的编制过程
初始能力参数估计选题策略
2.TWO 选题策略
能力参数精确估计选题策略
初始能力参数估计选题策略
lnL(u | ) n f '( ) Pi ( ) ( Pi ( ) 1) 2 i 1
2
f (0 ) 1 =0 ' f (0 )
f ( n ) n 1 = n ' f ( n )
...
(| n1 n | 0.01)
4
基于经典测量理论和项目反应理论的中文版CFS-CM量表的评价
目 录一、摘 要中文论著摘要 (1)英文论著摘要 (3)二、英文缩略语表 (6)三、论文前言1 研究背景 (7)2 研究目的 (10)3 研究方法 (10)4 研究意义 (11)5 技术路线 (11)第一部分 基于经典测量理论分析CFS-CM量表1 研究对象与方法 (13)2 结果 (17)3 讨论 (24)4 结论 (26)第二部分 基于项目反应理论分析CFS-CM量表1 研究对象与方法 (27)2 结果 (30)3 讨论 (40)4 结论 (44)四、 本研究的局限性及未来展望 (45)五、 本研究创新性的自我评价 (46)六、 参考文献 (47)七、 附录综述 (52)在学期间科研成绩 (58)致谢 (59)个人简介 (60)附件一 (61)·中文论著摘要·基于经典测量理论和项目反应理论的中文版CFS-CM量表的评价目的引进英文版关怀因素调查—护士长关怀(Caring Factor Survey–Caring of Manager, CFS-CM)进行汉化,结合经典测量理论和项目反应理论,评价CFS-CM 量表在护士群体中的适用性,以期为护理管理者关怀护士的研究,提供标准化测量工具。
方 法采用定量研究方法,汉化关怀因素调查-护士长关怀量表。
采用横断面研究,对北京市一所三甲医院1168名护士进行调查。
结合经典测量理论与项目反应理论,评价该量表的测量学特性。
采用SPSS 17.0以及AMOS 20.0统计学软件进行经典测量理论分析。
采用内部一致性Cronbach’s α系数和重测信度对量表信度进行检验;内容效度的检测采用内容效度指数;采用探索性因子分析和验证性因素验证分析结构效度。
采用Winsteps3.72.3 软件和RUMM2020统计学软件进行项目反应理论分析。
采用个体作答行为真实性检验、特质空间维度检验、局部独立性假设检验、项目特征曲线形式检验、测验速度性检验查看数据与模型的拟合程度。
项目反应理论与经典测验理论的比较
讲述人:宋慧鹏 2012年10月
提纲
经典测量理论(CTT)及其信度观
项目反应理论(IRT)及其信度观
从CTT到IRT的比较
第一部分 经典测量理论(CTT)及其信度观
经典测量理论(Classical TestTheory,CTT)
项目参数
理论架构 信度
2 2 0 0 0.80 0.60
2 0
2 1 2 2 0.83 0.50
16 13
14 11 12 13
学生ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
T01 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1
T03 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Rasch 模型(Rasch, 1960)是由丹麦数学家和统计学 家 Georg Rasch (1901~1980)基于项目反应模型提出 的一个潜在特质模型。 最早的拉希模型实际上包括拉希在20世纪50年代所创 建的三个项目反应模型:泊松模型、测验项目的结构 模型、拉希模型。现在最广泛应用的项目反应Rasch 模型形式为:
a = 1.002 1.0 b = -0.144
c = 0.117
Item Char acter istic Cur ve: MATH05
0.8
Probability
0.6
在项目上恰有 0.5正确作答概 率的那些个体 的能力值为该 项目的难度值。
0.4
c 0.2 b 0
-3
-2
-1
0 Ability
项目参数
项目难度
CTT_IRT和GT三种测验理论之比较_吴静 (1)
2008年12月第27卷第12期黑龙江教育学院学报Journa l o fH e ilong ji ang Coll ege o f Educati on D ec .2008V o.l 27N o .12收稿日期:2008-10-20作者简介:吴静(1982-),女,陕西黄龙人,助教,硕士,从事健康心理学方向研究。
CTT 、I RT 和GT 三种测验理论之比较吴 静(西安医学院人文科学系,西安710021)摘 要:当前经典测量理论(CTT )、项目反应理论(I RT )与概化理论(GT )这三种心理测量派别理论并存,并各有优点与不足。
随着测量理论的进一步发展,未来我国的测验理论发展的新趋向将是以IRT 为主体,其他理论并存的一种局面。
关键词:经典测验理论;概化理论;项目反应理论;心理测验中图分类号:B841.7 文献标志码:A 文章编号:1001-7836(2008)12-0077-02随着心理学的发展,心理测量无论是在理论上,还是在方法上都在逐步地提高。
目前,心理测量有三大派别理论:经典测量理论(C lassical T est Theory ,简称CTT )、项目反应理论(Item R esponse Theory ,简称I RT )和可概括性理论(G ene r -a li zab ili ty T heory ,简称GT )。
这三种理论并存,改变了过去经典测验理论一统测量领域的格局,也促进了心理测量的发展。
本文拟对这三种教育和心理测量理论作一比较,以便研究与使用者能更好地了解不同的方法在测验结果上的差别,从而在相关研究和实践中选择合适的方法。
一、三种理论的主要内容11CTT 主要是指真分数理论,虽然它是编制心理测验常用的方法,而且在不断地完善自身,但作为一种理论,其不足之处不是修修改改就能够解决的。
CTT 的基本思想是:把测验的得分(通常称为测验的观察分)看做真分数和误差分数的线性组合,可归结为如下简单数学模型:X =T +e ,X 是观测分数,T 是真分数,e 是误差分。
项目反应理论
项目反应理论随着心理学的发展, 心理测量无论就是在理论上, 还就是在方法上都逐步地提高。
目前, 心理测量有三大理论派别: 经典测量理论(Classical Test Theory , 简称CTT) , 项目反应理论( Item Response Theory , 简称IRT) 与概化理论( Generalizability Theory , 简称GT)。
项目反应理论就是一种先进的测量理论,它就是针对经典测量理论的不足而提出来的, 其理论基础就是潜在特质理论。
项目反应理论的基本思路就是确定考生的心理特质值与她们对于项目的反应之间的关系, 这种关系的数学形式就就是“项目反应模型”。
下面主要对项目反应的理论假设与数学模型做一下简要概述。
一、项目反应理论的基本假设任何一种数学模型都有一定的前提,任何一种测量都有一定的假设,在项目反应理论中也有三条最基本的假设:潜在特质空间的单维性假设、测验项目间的局部独立性假设、项目特征曲线假设。
有的学者还增加了“知道——答对”假设与非速度限制假设。
在此仅说明前面三条最基本的假设。
1、潜在特质空间的单维性假设潜在特质空间就是指由心理学中的潜在特质组成的抽象空间。
如果考生在测验项目上的反应就是有K种潜在特质所决定的,那么这些潜在特征就定义了一个K维潜在空间,考生的各个潜在特质分数综合起来,就决定了该考生在该潜在空间的位置。
如果影响考生测验分数的所有重要的心理特质都被确定了,那么该潜在空间就称为完全潜在空间。
目前比较成熟的大多数项目反应模型都假设完全潜在空间就是单维的,即只有一种潜在特质决定了考生对项目的反应,也就就是说组成某个测验的所有项目都就是测量的同一个心理变量,例如知识、能力、态度或人格。
当然,这一假设往往不可能得到严格的满足,因为总有其她因素会影响到考生在测验上的反应,这些因素包括认知的、人格的与施测时的客观条件,以及考生的动机水平、焦虑程度、反应速度与考试技巧等。
自学测验考试现代教育测量与评价网络课堂答案
⾃学测验考试现代教育测量与评价⽹络课堂答案教育测量与评价现代教育测量与评价学第⼀章教育测量与评价概述⼀、教育测量的含义(33分)本节测验题:智⼒测量属于A. 物理测量B. ⼼理测量C. ⽣理测量D. 社会测量⼆、教育测量的特点、教育评价的含义(35分)提出“凡物之存在必有其数量”命题的是谁?A. 麦柯尔B. 孟⼦C. 桑戴克D. 孔⼦三、教育评价的特点、教育测量与评价的产⽣(35分)现代教育评价产⽣的标志是A. 《⽐纳.西蒙量表》B. 科举考试C. T.B.C.F制D. “⼋年研究”四、现代教育测量与评价的发展(30分)第四代教育评价”的创⽴者是A. 枯巴和林肯B. ⽐纳和西蒙C. 桑代克和麦柯尔D. 泰勒与布鲁姆五、教育测量与教育评价相关概念辨析(30分)我国教育法规定的两项基本教育制度:⼀是教育督导制度,⼆是A. 教育评价制度B. 教育考试制度C. 教育测量制度⼀、信度概述(31分)样本统计量与总体参数越接近,说明测验的信度A. 越低B. ⽆法判断C. 越⾼D. 需要验证⼆、重测信度、复本信度、同质性信度(⼀)(35分)⽤同⼀个量表对同⼀组被试先后施测两次,所得结果的⼀致性程度是A. 等值性信度B. 等值稳定性信度C. 分半信度D. 重测信度三、同质性信度(⼆)、评分者的信度(⼀)(31分)若2个评分者评阅N份试卷,计算评分者的信度可⽤A. 斯⽪尔曼等级相关系数公式B. 斯⽪尔曼-布朗公式C. 积差相关系数公式D. 肯德尔和谐系数公式四、评分者的信度(⼆)、标准参照测验的信度(33分)估计标准参照测验的信度需要预先确定A. 淘汰的⼈数B. 达标的⽐例C. 通过的⼈数D. 决断的分数第三章教育测量与评价的效度⼀、效度概述、内容效度的含义(30分)下列适合于内容效度的测验是A. 能⼒倾向测验B. 成就测验C. ⼈格测验D. 性格测验⼆、内容效度的估计⽅法、结构效度(38分)下⾯哪种测验的效度不属于结构效度?A. 智⼒测验B. 焦虑测验三、效标关联效度(44分)效标关联效度也称为A. 实证效度B. 预测效度C. 同时效度D. 逻辑效度第四章教育测量与评价题⽬的难度和区分度⼀、难度及其计算、区分度及其计算(⼀)(40分)最适宜的难度系数是A. 0.50B. 0.00C. 1.00D. -1.00⼆、区分度的计算(⼆)、区分度与信度和难度的关系(31分)难度系数越接近何值,题⽬的区分度越⼤?A. 0.50B. 1.00C. 0.00D. -1.00第五章教育测量与评价分数的整理和转换⼀、教育测量与评价分数的整理(32分)被试者只有连续通过⼀次⼜⼀次的不同测验取舍分数线,才能最终获得成功。
项目反应理论与经典测验理论的比较共72页文档
36、如果我们国家的法律中只有某种 神灵, 而不是 殚精竭 虑将神 灵揉进 宪法, 总体上 来说, 法律就 会更好 。—— 马克·吐 温 37、纲纪废弃之日,便是暴政兴起之 时。— —威·皮 物特
38、若是没有公众舆论的支持,法律 是丝毫 没有力 量的。 ——菲 力普斯 39、一个判例造出另一个判例,它们 迅速累 聚,进 而变成 法律。 ——朱 尼厄斯
Thank you
40、人类法律,事物有规律,这是不 容忽视 的。— —爱献 无力。——斯宾诺莎 7、自知之明是最难得的知识。——西班牙 8、勇气通往天堂,怯懦通往地狱。——塞内加 9、有时候读书是一种巧妙地避开思考的方法。——赫尔普斯 10、阅读一切好书如同和过去最杰出的人谈话。——笛卡儿
项目反应理论与经典测验理论之比较_俞晓琳
南京师大学报(社会科学版)1998年第4期项目反应理论与经典测验理论之比较俞晓琳摘要 本文介绍了项目反应理论(IRT)与经典测验理论(C TT)的主要内容,就两者的优缺点展开讨论,并对它们的应用前景作一预测分析。
关键词 项目反应理论 经典测验理论 心理测验 心理测验是测量人的心理特质的主要方法之一。
随着心理学的日益科学化,对心理测验的要求也越来越高。
这需要心理测验理论不断更新与发展。
心理测验理论是对心理测验中诸如误差、样本容量、测量单位等问题进行研究,并设计方法加以解决的理论研究。
它与心理学的发展紧密相联。
心理学中的个别差异的研究引起了心理测验运动,高尔顿、卡特尔、皮尔逊等人对此作出了杰出的贡献。
在此研究基础上,本世纪初,斯皮尔曼发表了《认知的规律和智慧的本质》与《人类的能力》等文,提出因素分析的方法后,经典测验理论CT T(Classic T est T heor y)研究开始蓬勃发展,至今已有九十余年。
C T T主要是指真分数理论,虽然它是编制心理测验常用的方法,而且在不断地完善自身,但作为一种理论,其不足之处不是修修改改就能够解决的。
针对这些,现代测验理论应运而生。
在项目分析部分,主要出现了项目反应理论IR T(Item Respo nse The-o ry)。
美国测量专家洛德1952年在其博士论文中首次提出了项目反应模型,即双参数正态卵形模型,并提出了与此相关的参数估计方法,使得IR T可被用于解决实际的二值记分的测验问题。
它标志着I RT 的正式诞生。
在这之后,IR T得到了充分发展,尤其七、八十年代在大多数发达国家得到测量专家的关注,在心理学研究中的使用频率大幅度上升,超过经典理论和概化理论。
IR T解决了CT T未能解决的许多问题,但其本身也有许多缺点,阻碍其推广。
本文拟对CT T与IR T(尤其后者)进行概括介绍,比较两者之长短,并对它们的运用前景作一简要预测。
一、CT T与IRT的主要内容 CT T是心理学研究者所熟悉的,其基本思想是把测验的得分(通常称为测验的观察分)看作真分数和误差分数的线性组合,可归结为如下简单数学模型:X=T+e X是观测分数,T是真分数,e是误差分。
经典测验理论与项目反应理论之异同比较
对主观题作题目分析时, 项目反应理论束手无策, 而经典 测 验 理 论 仍 可 以 提 供 难 度 、区 分 度 等 统 计 量 。尽 管 经 典 测 验 理 论对主观题分析的精确度不太高, 但仍不失为一种有效的分 析方法。目前, 项目反应理论还只适用于二级计分模型, 对多 级计分模型, 也都是将其转化为二级计分模型才能处理。这使 项目反应理论的应用囿于客观题的范畴, 极大地限制了项目 反应理论应用的空间。
这两个信息函数与被试潜在特质的永平直接有关所以得数据很好地拟合这时题目参数固定不变不受取样变化不但能求出全体被试的测量误差更有意义的是还可以对不的影响
○ 出类拔萃 2007年第33期
周刊
经典测验理论与项目反应理论之异同比较
黄丹媚
(湛江教育学院 教育Biblioteka 学研究室, 广东 湛江 524000)
摘 要: 本文主要从理论基础、题目分析和误差估计三方 面对经典测验理论与项目反应理论的异同作一比较, 并提出 现阶段这两大测量理论仍将互补长短, 共存发展。
1 理论基础的异同 1.1 理论基础的相同点 人的心理特质具有内在且无法直接测量的特点, 所以在 心理与教育测量中只能使用间接测量的方法。经典测验理论 与项目反应理论使用的都是间接测量方法, 透过被试外在可 观察的行为反应估计被试内在的心理特质水平。 1.2 理论基础的不同点