测验题目性能与题目编制
如何编制数学测试题
数学测试题的编制一、命题者应有的素质二、测试的类型和测试题质量的测量学指标(一)测试的类型1.按照测试的目的来分类(1)常模参照测试——以学生团体测试的常模为参照物,为说明某一个体在团体中的相对位置,目的是将个体划分等级,考察个体之间的差别。
(2)标准参照测试——以体现教育教学目标的标准为参照物,看个体是否达到标准以及达成标准的程度。
目的是为了考察个体与标准之间的差别。
2.按照测试的功能来分(1)形成性测试形成性测试是在教学过程中,为了获取反馈信息,促进教学方案、计划、课程等的形成所进行的测试。
比如章节单元测试、期中考试、期末考试等。
其功能在于了解学生的学习情况和学科的教学情况,为进一步改进教学和更好地促进学生的发展提供信息。
(2)终结性测试终结性测试是在教学活动的某个阶段结束后,为整体效益作全面鉴定所进行的考试。
其目的在于总结整个教学阶段的成果,其作用是鉴定教学效益或成果,提供升学和发展的决策信息。
这类测试又可分为:①水平性测试水平性测试一般是指:小学、初中毕业考试和高中会考。
其主要功能是检测学生是否达到小学或中学毕业的水平。
②选拔性测试选拔性测试一般是指:中考、高考。
其主要功能是为高一级学校选拔学生提供依据。
一般来说:选拔性测试是常模参照性测试;形成性测试和终结性测试中的水平测试是目标参照性测试 (二)测试题的测量学指标 难度、区分度、信度、效度 1、难度 ·难度指学生完成题目和项目任务时所遇到的困难程度。
难度值以P 表示。
公式1:通过率P = ,R 表示答对某题的人数,N 表示测试的总人数。
公式2:得分率P = ,X 表示某题的平均分,W 表示某题总分。
·注意:通常对客观题计算难度时选择公式1; 通常对主观题计算难度时选择公式2。
全卷难度用加权难度平均数公式计算 高考难度要求(校本测试应该难度降低): 全卷难度为0.5~0.6;各试题难度取在0.3~0.7,接近正态分布; 各类题的比是——易题:中题:难题=3:5:2即30%的试题难度P 值为 0.7以上,50%试题的P 值为0.5~0.7,20%的试题P 值为0.3~0.5。
教育测验编制的一般步骤与方法
缺点:
1.不易编制,且花费时间较多。 2.易受考生阅读能力的影响。 3.难以排除考生对试题的随机猜测。 (二)客观题命题的一般原则 1.试题能反映教学内容的重点或知识 点。
2.题目之间的相关性越低越好。 3.试题的文字力求浅显易懂、题意明 确。
2020/3/27 4.答案应该是明确、唯一的。
(三)不同类型选择题的命题原则
3
1
1
1
0
第四章 溶液 6
3
3
1
8
第五章酸碱盐 4
3
3
5
2
合计
26 12 13 14 18
评价
2 2 2 6 5 17
合计
22 21 8 22 22 100
由上图可见,命题双向细目表由3个要素组成:
测验目标、测验内容以及二者的比例,即权重。权
重代表了这部分内容的相对重要性。
2020/3/27
◆在真实的命题中,一般遵循如下顺序:
内容范围 3 1 5 3 2 2 2 15
内容范围 4
3444
15
内容范围 5 1 6 2 3 3 2 17
合计
6 32 24 16 14 8 100
2020/3/27
例 1 初中化学内容与教学目标细目表
测验目的 测验内容
知识 理解 运用 分析 综合
第一章 氧
6
3
4
4
3
第二章 氢
7
2
2
3
5
第三章 碳
① 测验材料要适合测验目的
② 测验材料要能够代表该科教材的全部 内容(测验材料要有合理的覆盖面,突出 基本内容及重点内容,比例参照命题双向 细目表)
③ 测验材料要有普遍性(要依据统一的 教学大纲)
心理测量学第六章-测验题目性能与题目编写(项目分析).PPT
③选择题适合考查较低层次的能力,如识记能 力、较低的理解能力等,而不宜考查较高层 次的能力,如综合能力、创造性和独立思维 能力。
一、区分度的定义
(一)定义 ❖ 测验项目对所测量的心理特性水平差异的区分能力或鉴别。 (二)作用 ❖ 测验是否有效度的“指示器”。 ❖ 若区分度高,则水平高者得分高,水平低者得分低;若区分
⑤行为情景判断题设问方式一般有四种形式: 一是要求受测者选择最优行为项,二是要求 受测者选择最差行为项,三是要求受测者同 时选择最优和最差行为项,四是要求受测者 针对每一行为项的有效性做出评价。应根据 实际选择具体方式。
第二节 测验题目的难度与难度控制
一、难度的定义 二、难度的计算 三、测验难度水平的确定 四、难度的等距变换 五、测验的难度对测验分数分布的影响
的差异等于第2题和第3题间的差异。 (二)解决方式:等距变换,即把难度P转换成标准分数Z。 ❖ Z分数(0,+1σ)约占全体人数的34%,(1σ,2σ)间占全体人数的
13.5%。 ❖ 项目A通过率为84%(难度为0.84),难度值为-1σ。 ❖ 项目B通过率为16%(难度为0.16),难度值为+1σ。 ❖ 项目C通过率为50%(难度为0.50),其难度为0。
②论述题和计算题不仅能够考查考生较低层次的能 力目标,而且能够比较好地考查较高层次的能力 目标。
③论述题和计算题能够反映考生的思维过程,因而能 比较有效地考查考生接受信息、鉴别和选择信息的 能力,分析、推理、综合应用知识的能力,能鉴别 出考生对问题解决的程度。
《心理测量学》复习思考题
《心理测量学》复习思考题一第一章心理测量概论1.为什么说人的心理是可测的?2.同是间接测量,测人的心理与测温度有什么不同?3.心理测量量表有什么特点?4.心理测量误差的类型与来源各有哪些?4.说说标准化测验的“标准”要求有哪些?5.说说常模参照测验与标准参照测验的不同之处。
6.心理测验编制的一般步骤有哪些?7.你从心理测量发展的历史中感悟到了什么?第二章测量信度与随机误差控制1.测量信度的概念和作用是什么?2.有哪些主要的测量信度估计方法?3.测量信度的影响因素有哪些?如何进行控制?第三章测量效度与系统误差控制1.测量效度的概念和作用是什么?2.有哪些主要的效度证据采集方法?3.测量效度的影响因素有哪些?如何进行控制?第四章测验题目性能与题目编写1. 对测验题目性能分析的目的是什么?如何对测验题目性能进行分析?2. 下表是11名考生在某测验6道题目上的得分及总分情况,请计算每题的难度及区分度。
题号一二三四五六总分满分 1 25343238104379153452534102462753651433834782292584214010112 252580 5 5 3 3 3 3 101525608 5 1013195212 8 14194610133620 18 2247 38 45第五章常模参照测验的设计与编制1. 什么是常模参照测验?主要有哪些编制原则?2. 什么是标准化样本?选取标准化样本时需要注意些什么?3. 什么是常模?常模有哪些种类?如何编制?4. 常模资料的主要呈现方法有哪些?第六章标准参照测验的设计与编制1.简述标准参照测验的编制过程。
2.标准参照测验的区分度分析有几种情况,它们之间有什么关系?3.什么是分类一致性信度,如何计算?4.举例说明标准参照测验几种划界分数的设置方法。
5.试比较标准参照测验与常模参照测验效度分析的异同。
第七章测验分数的可比性与测验等值1.应用例7.1的数据使用等百分位等值方法完成下面的等值对应表。
测验的编排和组织
测验的编排和组织一、合成测验(一)选择与审定试题1、选择试题形式在大多数情况下,任何题目都可以有多种形式,关键是如何选择“最优”形式。
是纸笔测验还是操作测验,是只要受测者认出正确答案,还是需要他自己做出正确的答案,这是测验编制必须确定的。
在选择题目形式时,需要考虑如下三点:(1)测验的目的和材料的性质。
如果要考虑受测者对概念和原理的记忆,适用于简答题;要考虑对事物的辨别和判断,适用于用选择题;而要考虑综合运用能力,适合于用论述题。
(2)接受测验的的团体的特点。
如对幼儿易用口头测验,对于文盲和识字不多的的人不宜采用要求读和写的项目,而对于有言语缺陷的人(如聋哑、口吃)则要尽量采用操作。
(3)各种实际因素。
例如,当受测者人数过多、测验时间和经费又有限,易用选择题进行笔纸测验;而人数少,时间充裕,又有某些实验仪器和设备时,则用操作测验。
2、审定题目在这个过程中,编制者和有关专家要对题目进行反复审查修订;改正意义不明确的词语,取消一些重复的不合理的题目。
然后将初步满意的题目汇集起来组成一个预备测验。
审定试题要注意如下四个问题:(1)题目的范围与测验计划所列的内容技能双向细目表一致,即材料内容以及所测验的认知技能上的比率与计划相符,必要时亦可适当调整。
(2)题目的数量要比最后所需要的书目多一倍至多倍,以备筛选和编制复本。
(3)题目的难度必须符合测验的目的。
(4)题目的说明必须清楚明白。
(5)对测题的审定除考虑题目本身的性质外,还应考虑各类题目的适当比例,再看看每一个备选中的题目叙述是否清楚、是否提供了额外的线索。
另外,要检查测题是否适合施测对象和施测条件、题目的难度和区分度是否恰当以及题目是否相对独立,没有重叠。
(二)测题的编排测题的编排选出后,必须根据测验的目的与性质,并考虑受测者作答时的心理反应方式,加以合理安排。
当然,测验多种多样,编排也会因人因测验而异,但如下三点是应当测验编排的一般原则:第一,测验的难度宜逐步上升。
教育测验题目类型与编写技术
第一节教育测验题目类型与编写技术一、客观性试题的类型及其编写技术二、主观性试题的类型及其编写技术第二节教育测验编制的基本程序一、设计测验的基本考虑二、设计测验蓝图三、测验编制与组织教学目标:1.理解各类测验项目的优缺点,掌握各类项目的编制原则。
2.理解教育测验编制的基本程序,并能在实践中运用。
项目编写“五戒”1.在向学生说明如何作答时,一定不要使用晦涩的语言(指导语);2.一定不要在项目中使用模棱两可的陈述。
3.一定不要无意中给学生正确答案的线索。
4.项目中一定不要使用太复杂的句型。
5.一定不要使用超纲的词汇。
测验项目的类型Popham认为语言(文字)测验的项目形式有两种:1.要求被试选择的(选择型)2.要求被试回答的(供应型)(供答型)。
成就测验中,分为客观性试题和非客观性(主观性)试题。
这两种测验项目形式的最大区别是:前者给被试提供被选答案,后者让被试自己写出答案。
A.选择型项目常用形式:选择题、是非题(判断题)、匹配题(连线题)B.供答型项目常用形式:填空题、简答题、论述题、作文题等。
【因此供答型项目范围要比主观性项目范围大】一、是非题及其编写(一)定义:是非题又称正误题,通常是给被试一个句子要求被试做出是与非(对与错)的判断。
以此也叫二项选择题。
这类测题通常用于测量被试对基本概念、性质、原理的认识与判断区别事实与观点、认识事物因果关系、以及一些简单的逻辑推理能力。
例如:判断下列命题的正误,正确的在括号里打√,错误的在括号里打×。
三角形内角和等于360度。
()(二)是非题编写的优缺点优点:1.取样广泛2.测题编制相对容易。
(当然可能是因为可以照着教材原句抄下来或稍做正反改正,但这恰恰是不良是非题的特征)3.评分客观。
缺点:1.是非题一般只能测量低层次的教学目标。
2.易于强调知识的死记硬背。
3.受猜测因素的影响较大(猜对概率大于50%)。
如何减少猜测带来的危害?1.鼓励所有被试在他们不知道正确答案的情况下进行猜测,因为事实上不可能避免一部分被试猜测答案。
第四章 教育测验的编制
• (二)题目分析
• 1.定量分析(略) • 2.定性分析
– (1)均衡性:试题所测量的内容能够代表学生学习 中要求掌握的学习任务吗?
– (2)相关性:试题是否再现相关的学习任务? – (3)简明性:试题的语言是否简单、明了?
26
• (4)合理性:试题的难度适中吗?是否有错误?是否存在 有争议的答案?
34
一、常见题型及其编制
• (一)选择题(multiple-choice items)及其编制原则 – 1.选择题的结构:题干(stem)和选项(alternatives) – 2.选择题的优缺点 – 优点: • (1)选择题可以测量被试各种不同层次的学习结果。 • (2)正确答案唯一。
35
• (3)可以加大试题容量,扩大试题覆盖的知识面。 • (4)有利于考察被试思维的敏捷性和准确的判断力。 • (5)通过对学生对干扰项(distracters)的选择,教师可
某种具体的目的,它明确规定测验所要达到的预 期结果或标准。它是编制测验的出发点和依据。
13
(1)测验目标与教育目标分类
• 测验目标的确定是以教育目标分类理论为基础的。 – 布卢姆等人的教育目标分类法 – 加涅的教育目标分类法 – 梶田叡一的教育目标分类法 – 我国认知目标的分类
14
15
16
我国认知目标的分类
19
3 .填写双向细目表
• 准备一个含有教学目标与教学内容两个维度的双向细目 表 – 横向设计 • 各个知识在整个测验的知识范围内的相对地位和 重要程度(确定各部分知识所占的比重)。这种 相对重要性可由该内容项目的教学课时的多少来 体现。
20
– 纵向设计 即决定每一目标层次所占比例。这一比例应与测验编制 者认为这个目标对受测学生的水平所具有的重要性相符。 一般主要是参考专家或有经验教师的意见而定。
第三章_教育测验的编制与实施
布卢姆的分类法 加涅的分类法 梶田叡一的教育
评价
认 综合 知 分析
领 应用 域 理解
知识
认知策略(问题解决)
高级规则
智力技能
规则 概念
智力技能
辨别
言语信息
精神运动领域目标
体验 目标
情感领域目标
认知领域目标
技 适应 能 练习 领 模仿 域 观察
运动技能
精神运动领域目标 提高 目标 情感领域目标
认知领域目标
两可的语句,以免引起对正确答案的争议。
? (5)题目陈述应简单明了,避免使用复杂 的句子结构,应尽量采用正面叙述,避免 用否定和双重否定的语句。
? 综合(将知识各部分重新组合,形成一个新的整体)编写、写作、创造、 设计、提出、组织、计划、综合、归纳、总结
? 评价(根据一定标准进行判断)鉴别、比较、评定、判断、总结、证明、 说出……价值
C:条件的表述
? C:学习者表现行为时所处的环境
? 环境因素(空间、光线、温度、气候、室内、室外、安 静等)
等堂皇的用语来叙述。
? 诱答项的长度和措辞的复杂性与正确性与正确选项相 似。
? 在诱答项中使用额外的线索。如固定的用词,具有科 学味道的答案,以及和题干有语义上的联系等。
? 保持选项之间的同质性。
? 5、不能对正确答案有任何暗示。无意的暗 示有:
? 1)语法结构上的不一致;
? 2)各选项在逻辑上不同,如正确答案中加以 “如”、“有时”、“通常”等修饰词,诱答 项中加以“总是”、“从未”、“所有”、 “绝对”、“准”等修饰词,或正确答案使用 与题干相同的词;
2)学习目标
? 学习目标:“是对学习者通过教学以后将能做什么的一种明确的、具 体的表述”。
教育测验编制的一般原理与方法23
试论述灵魂是否存在 ?并说明其理由
4,编制原
-则(4)当有多个论 述题时,可以设置 一个必答的论述题 ,剩下的题目可允
-许被试选择作答 右例
待补充
-4,编制原
则(5)最好在
题目中给出回 答本题所需的
-参考时间 右例
待补充
作文题
对人的逻辑思维、形象思维、书 面表达等多种能力的一种综合考查
第二节
测验蓝图设计与测验 编制要领
一、设计测验的基本考虑
1、确定测验目标 2、确定测验的属性是学科测验或是智力测验、人格测验 3、明确测验的性质和用途 4、明确测验对象 5、分析测验目标
二、设计测验蓝图 (一)测验蓝图的作用
1、保证样本的代表性和恰当性
2、确保题目合适的比例、难度
(二) 设计测验蓝图的步骤
-5,编写原
则(4)诱答项
-应具有似真性 右例
在下列元素中,哪一 种元素存在于蛋白质 中,而不存在于碳水 化合物或脂肪中? A.二氧化碳 B.氧 C.水 D.氮
-增加干扰选项似真性的具体方 -法有:
a.使用学生共同的错误观念
-或过失作为诱答项 b.以学生惯用的模糊性用语
-叙述诱答项 c.在正确选项和诱答项中使用 同样的“精确的”“重要的”等堂
白放在句子的 后面或中间, 而不要放在句
-子开头 右例
( 汽机
)发明了蒸
3,编写原
-则(5)所有空白处 的线段长度应当一 致,不能随正确答 案文字的多少而长 短不一,以免产生
-暗示作用 右例
待补充
-3,编写原
则(6)若答案
是数字,应指 明单位和数字
-的精确程度 右例
3除以10等于( )
《心理测量》-课程教学大纲
《心理测量学》教学大纲一、课程基本信息课程代码:16091303课程名称:心理测量英文名称:Psychometrics课程类别:专业必修课学时:48学分: 3适用对象: 应用心理学专业大三本科生考核方式:考试先修课程:无二、课程简介《心理测量学》介绍了当今心理学研究中主要的测量方法,包括测量的信度、效度、以及测量中随机误差和系统误差的控制方法;测验的难度、区分度,以及试题难度分布的控制技术和提高试题区分度的技术;介绍了各种著名测验,除了要求了解编制原理,还要求掌握实际使用方法;本书还介绍了标准参照测验教育成就测验的技术和理论。
还引进了题库建设、测验等值、项目功能差异、评价中心技术、行为情境判断测验、内隐联想测验等较为新近或更为实用的测量理论和技术。
除了介绍经典测量理论,还介绍了发展前景更为诱人的项目反应理论和概化理论,以及认知诊断理论。
为将来准备从事心理学应用、教育考试、人员测评等工作的本科生学习使用。
Psychometrics program introduce some measure methods which are widely used in psychological research. Those methods are reliability, validity and control methods of random measurement error and systematic error; difficulty, discrimination and How to control the degree of difficulty and improve the distinction; introduced a variety of well-known tests, in addition to understand the principle, but also required to master the practical use; besides introducing classical measurement theory, also introduced a more attractive prospect item response theory and generalizability theory, and the theory of cognitive diagnosis.三、课程性质与教学目的心理测量学课程是心理学各专业共同必修的一门应用与方法课程。
4编制教育测验的一般原理与方法
• 教育目标的表述
– 以学生为行为主体 – 表述明确、具体 – 反映学习结果的层次性 – 表达教育工作者的意图
终极教育目标
中程教育目标
具体教育目标
二、教育目标分类研究
• 布卢姆的教育目标分类
– 认知领域
– 情感领域
– 动作技能领域(辛普森的分类)
• 我国关于教育目标分类的研究
– 李秉德“教育目标分类的三维结构模型”
• 填空题 填空题可用来考查被试对知识的记忆和理解 能力,在诊断性测验中特别适用。
1. 优点
– 受被试猜测的影响小,评分比较客观;
2. 缺点
– 填空题偏重于测量被试的知识记忆程度,使用 过多容易养成被试死记硬背的习惯。
3. 编制原则 (1)题意要明确,限定要严密,空白处应填的 答案是唯一的; 例:只有 ,才能在考试中获得 好成绩 (2)空白处所填写的应是关键词语,并且要和 上下文有密切的关系,使被试不至于填写困难。 例:1996年我国科技界有 新发明。
1. 优点 强化学生解释、分析、应用资料的能力; 测量较复杂和高层次的认知能力; 诊断复杂学习结果的认知过程; 变主观性为客观性; 把问题设计得更加符合测量目标 2. 缺点 不能测量创造性思维能力和文字统整与表达能 力
3. 编制原则 (1)选择与教学目标或考试目标关系紧密的引导资 料; (2)选择适合学生学习经验与阅读能力的引导资料; (3)选择新的但又不是太另类的引导资料; (4)选择简短而又有信息量的引导材料; (5)问题设计要明确,容易作答; (6)问题的测量目标要符合测验目的; (7)问题要测量有意义的学习目标,不考无关紧要 的内容; (8)问题数量要适当,而且每个问题不要互相提示
2. 编制原则
(1)根据考试目的、考试对象来确定作文文体和要 求; (2)根据社会需要、现实生活和学生实际设计命题, 作文命题要直接测量语文素养和书面表达能力; (3)作文命题不能过于抽象,要让学生有话可说, 有内容可写,有思路可走,有发挥的余地; (4)避免材料或话题出现测验偏倚,在确定选材和 写作意图时,要考虑对所有被试都是公平的,并 且试题应符合被试的心理特征。
作为未来教师如何编制一份合格的测验试题
作为未来教师如何编制一份合格的测验试题
作为未来的教师,编制一份合格的测验试题时,要考虑到对学生基础知识、基本技能的理解与掌握的考查和学习能力的考查等诸多方面,要正确反映学生的学习水平。
所以,试题取样要有代表性,要既全面又有所侧币,科学合理:试题编排要有梯度,难易比例要适当,编排试题一股由易到难编排。
试卷编好后要认真复查,避免重复、遗漏,甚全出现数据上的差错。
最后还要制定评分标准(在编题月时就块考虑评分标准),对计算题(操桥题)、解决问题、综合应用题等主规型试感一般采用分步评分法,除此之外,编制试卷还须注意以下几点:
一是要严格按课程标准的要求和教材的范围命趣,不山偏趣、怪趣和毫无意义的题月;
二是试题内容必须止确无误符合科学性,在衣述题目的含义时,问题必须明确,指导语要清呀,用语要简明,避免引起歧义;
三是试题中提出的问题或设置的工务是教材中的实:质性内容,并尽量贴近学生的生活际;
四是试题中问题的今义要明确,彼此要灿立,不可连坏、暗示,表述要清楚、明确,不能模楼两可,用语要简;
五是问题的正确答案是定论的,但不排拆一题多解。
总而言之,小学数学试卷命题要体现学科的特点,注重考查基本识、基本技能,以及学提出问题、理解问题、获取数学信息配决问题
的能力,突出数学思想方法的理解与应用,努力创造学生探索思考的机会与空间。
在命题的创新上要有所布为,既利用各种传统题型,又适当采用新颖的题型,使“识与技能、过程与方法、情感态度与价值观”的三维月标更多融入到试卷之中,使小学数学命题能充分发挥考试的导向作用,从而促进学生的全面发展。
心理测量学【复习资料】
心理测量学第一章心理测量的定义:依据一定的心理学理论使用测验对热的心理品质进行定量描述的活动心理测量的工具:斯蒂文斯将量表分为四个水平,由低到高分别为:命名量表、顺序量表、等距量表、等比量表。
1)命名量表只是用数字来代表事物或对事物进行分类,不能加减乘除,乘方开方;2)顺序量表比命名量表高,它表明类别的大小或表明某种属性的多少,顺序量表中没有单位也没有绝对零点,也不能加减乘除3)等距量表又比顺序量表高一级;它不仅有大小关系,而且有相等的单位,因此可以加减,但没有绝对零点,所以不能乘除4)等比量表是最精确的测量,既有相等的单位,又有绝对零点,能加减乘除,乘方开方心理测量的性质1)心理测量的间接性:只能通过测量人的外显行为,来推论出他的内部心理特征;2)心理测量的相对性:没有绝对的标准,也没有绝对的零点,结果都是与所在团体或人群的大多数人的行为或某种人为确定的标准相比较而言的;3)心理测量的客观性:心理测验都是在标准化下进行,测得结果较为可靠和客观;心理测验编制的过程1、确定测验的目的2、设计测验编制方案、指定测验编制计划3、题目编写4、测试分析5、组卷6、信、效度调查7、编制测验分数系统8、编写测验使用手册9、编制测验备份测验的实施1、选择测验2、实际施测3、评分4、测验结果解释第二章测量信度与随机误差信度:值得是相同被试在不同时间或不同场合下重复用同一测量工具或等价工具测量所得结果的一致性程度。
信度的作用1.信度是评价测验质量的重要指标之一。
2.信度是测量过程中所存在的随机误差大小的反映。
3.信度可以用来解释个人测验分数的意义——测量标准误。
4.信度可以帮助进行不同测验分数的比较。
信度的种类重测信度:同一个测量工具在两个不同时间对同一组被试施测所得结果的一致性程度。
重测信度主要考察了一个测量工具是否能够保证在不同时间测量结果的一致性,他反映了测量工具的结果受到时间间隔因素影响的大小。
一般来说,重测的时间间隔越短,那么各种施测情境的变化就越小,重测信度系数就会越大。
测验题目性能与题目编写
测验题目性能与题目编写
第二节 测验题目的难度与难度分布控制 • 一、难度的定义及计算方法 • (一)难度的定义 • 难度是表示项目难易程度的指标。在最优作业测验 中,称为“难度”,而在典型反应测验中,则指 “通俗性”。两者都是指在总体中,能够正确或确 切回答某项目的人数比。 • 难度是一个相对性的指标,是题目性质和被试群体 水平共同作用的结果,须通过实践来对难度进行检 验。测验题Fra bibliotek性能与题目编写
第二节 测验题目的难度与难度分布控制 • • • • 一、难度的定义及计算方法 (二)难度的计算方法 2 极端分组法 当被试人数较多时,可以先将被试依照测验总分从 高到低排列,分成三组,将总分最高的27%和最低 的27%的被试分别定为高分组(NH)和低分组 (NL),分别计算两组在该题的通过率,然后用下 式计算该题的难度:P=(PH+PL) /2 PH、PL分别为高分组与低分组的通过率。
测验题目性能与题目编写
第一节 测验题目类型、功能与题目编写 • • • • • • • • 二、测验题目的编写 (一) 编写选择题的注意事项: 1题干要描述清楚,避免出现与考核内容无关的材料 2 设问要尽量正向; 3 字体一致; 4 避免出现逻辑上的包含关系; 5 备选项的长度、结构、语言表达要尽量一致; 6 增加干扰项的迷惑性,且干扰项的设置能反映出 被试缺乏特定的知识或技能。
测验题目性能与题目编写
第一节 测验题目类型、功能与题目编写 • • • • • • • • 一、测验题目类型及其功能 (一)测验题目类型 4 是非判断题 判断所提供的陈述是对是错。 5 名词解释 对专业名词作出科学的解释。最好不用复词。 6 简单题 对相关陈述性知识或简单原理知识作出简要回答。
测验题目性能与题目编写
第6讲编制测验(题目)的原理与方法
第六讲编制测验(题目)的一般原理与方法介绍客观性试题的类型及编写技巧、主观性试题的类型及编写要领、测验蓝图设计、测验编制与组织要领。
重点内容是客观题、主观题的优缺点,编写选择题的技术要领,论述题的编写原则,操作测验题的编写原则、测验的命题双向细目表编制。
第一节测验题目类型与测量功能(一)题目编制的意义:测验题目是测验的基本构成元素,题目编制恰当与否直接关系到整个测验的质量。
只有正确地掌握不同类型试题的测试功能及命题方法,才能根据考试的目的和要求,正确地选择合适的题型并编制出高质量的试题,组成高质量的测验试卷。
(二)测验题目分类:1、选择型和供答型试题。
前者一般要求被试在几个选项中选择正确的答案,如是非题、匹配题、选择题等,后者要求被试自己提供答案,如论述题、简答题、填空题等。
2、客观性试题与主观性试题:客观性试题主要是因为评分客观而得名,它的正确答案在测验前就已准备好,不同评分者各自独立评分,所得结果基本上是相同的。
客观性试题一般适用于测量知识的掌握、理解、应用、分析几个层次的教学目标。
客观性试题的答案明确,作答简便,因而在限定的时间内测验可以包含足够数量的试题,易保证对知识内容的覆盖。
主观性试题主要包括论述题、操作题和作文题等。
它们适合于测量较高层次的教学目标,尤其是适合于测量综合和评价等目标层次。
主观性试题鼓励被试积极地组织所学的资料,表达自己的观点。
被试在作答时,耗费的时间较长,在限定的时间内,试题数量不可能太多,对知识的覆盖面较小。
由于没有明确统一的标准答案,评分易受评阅者的主观因素影响,因而误差较大。
一、客观性试题类型及其编写技巧客观性试题主要包括选择题、填空题、简答题等。
(一) 选择题1.选择题结构客观性试题中运用最多的是选择题。
心理测量第八章测验的编制与实施
通常由易到难 并列直进式/混合螺旋式
编制复本 复本等值要求:
-测同一心理特质 -相同内容范围
-题型、题数相同、难度分布相当
-各测验分数分布平均数标准差大致相等
第六步、测验的标准化
标准化:控制无关因素对测验目的的影响的过程。
标准化包括:编制标准化(符合要求) 使用标准化 (操作规范)
不同的人做的是不同的题目 不同的人做测验的时间不同 测验题目的加权值不同 作答不允许被试跳过一些项目,不可返回前面
的题目
主试职责
准备工作 遵从指导语 对特殊情况灵活处理
三、测验的计分和分数解释
计分的一般程序
测验分数的解释
Don’t…
询问事实
使用每个人都会赞同 或不同意的陈述
使用“如果可能”
使用双重否定
使用全称命题(所 有…)
分析:这些题有什么毛病?
当上级布置任务时,不是说不能接受的。
我不相信我们的所有法律对公民都是有益的。
如果你去问的话,人们不会告诉你他们大多数时间都在 想什么。
有多少人居住在香港? A 超过三百万 B 超过四百万 C 超过五百万 D 超过六百万
应用 对某个单元 多项选择测量 测验指导语 猜测的校正, 难度和区分度
编制一个具 理解、应用、
(2)
体说明
分析、综合和
(4)
(1)
评价能力的例子 (4)
总计 8
13
7
置信加权,
选项的分布
(4)
指标计算,错误
11
11
第三步:编制题目
搜集资料 代表性、普遍性
选择形式
文字/非言语 客观/论述 纸笔 /操作
求“快”或求“精确”的反应定势 偏好正面叙述的反应定势 偏好特殊位置的反应定势 偏好较长选项的反应定势 猜测的反应定势
测试题编写方法
测试题编写方法在进行各种考试或测试时,编写一套合适的测试题目是至关重要的。
好的测试题目不仅能准确地测量被测试者的知识和技能水平,还能提供有价值的反馈和评估。
本文将介绍一些编写测试题目的方法和技巧。
一、确定测试目标在编写测试题目之前,首先需要明确测试的目标。
测试目标可以是检查学生对某一特定主题的了解程度,也可以是评估学生的技能或能力。
测试目标的明确定义将有助于编写相关的测试题目。
二、选择适当的题型根据测试目标选择适当的题型是至关重要的。
常见的题型包括选择题、填空题、简答题和论述题等。
不同的题型适用于不同的测试目标和考查内容。
例如,选择题适用于考察对知识点的记忆和理解,而论述题则适合考察学生的分析和解决问题的能力。
三、注意语言清晰简洁不论是选择题还是简答题,题目的语言都应该清晰简洁,没有歧义。
避免使用过于复杂的句子结构和生僻的词汇,以免给被测试者带来困惑。
另外,尽量使用正面语言,避免使用否定词,以免给被测试者带来误导。
四、避免歧义和偏见在编写测试题目时,要特别注意避免出现歧义和偏见。
避免使用模棱两可的语言,确保每道题目只有一个正确答案或解释。
如果有必要,可以提供明确的上下文或场景,确保被测试者正确理解题目的意思。
五、考虑题目的难易程度测试题目的难易程度需要与被测试者的知识和技能水平相匹配。
过于简单的题目可能无法准确地区分不同水平的学生,而过于困难的题目则可能使大部分学生无法回答正确。
根据被测试者的水平和测试的目的,合理地选择题目的难易程度。
六、保持题目的多样性为了提高测试的准确性和有效性,题目应该具有一定的多样性。
可以在题目中涵盖不同的知识点或技能要求,以保证测试的全面性。
适当使用图表、案例或实际问题等形式,使题目更具实际应用性。
七、撰写答案解析对于选择题等有固定答案的题目,需要编写相应的答案解析。
答案解析应该清晰地解释为什么某个答案是正确的,为什么其他选项是错误的。
答案解析不仅可以给出正确答案,还可以帮助被测试者理解和巩固相关知识。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
心理测量学
❖②论述题和计算题不仅能够考查考生较 低层次的能力目标,而且能够比较好地 考查较高层次的能力目标。
江西师大心理与教育统计测量中心
心理测量学
❖③论述题和计算题能够反映考生的思 维过程,因而能比较有效地考查考生接 受信息、鉴别和选择信息的能力,分析、 推理、综合应用知识的能力,能鉴别出 考生对问题解决的程度。
江西师大心理与教育统计测量中心
心理测量学
❖计算题指主要是通过计算或运算来解答 的题目。计算题内容量有大有小,常常 用于考查被试的应用能力。一般要求给 出条件完备无冗余,答案唯一。
江西师大心理与教育统计测量中心
心理测量学
❖2、特点功能: ❖ ①论述题有利于考生独立地、创造性
地解题。试题的能力考查涉及的知识面 可以比较大,而且要求考生通过分析去 找出所涉及的知识并找出它们的内在联 系。试题从定性分析到定量计算,工作 量一般比较大。
第 一
测验题目的类型功能与编制
节
心理测量学
第一节
❖一、测验题目类型
❖题目主要可分为客观题和主观题两大类。 ❖客观题一般有标准唯一的答案,被试的作答只
有与标准答案完全一致才视为答对,否则视为 答错。 ❖主观题无标准唯一答案,只有一个参考答案, 被试的作答与参考答案相近或基本一致就可视 为答对。
江西师大心理与教育统计测量中心
一致 ❖增加干扰项的迷惑性 ❖干扰项的设置应能反应考生缺乏特定的
知识或技能
江西师大心理与教育统计测量中心
心理测量学
❖三、填空题 ❖1、特点功能: ❖①考查的能力层次范围比较广,主要
考核识记和理解能力。 ❖②填空题要求考生把问题的最后答案
或结论正确无误地表达出来,在一定程 度上是对考生的严谨、严密、认真、细 致的工作作风和科学态度的检查。
能太多。 ❖ 空格部分统一用下划线表示,长度应能满足
答题需要 ❖ 若空格处考核计算能力并要求填写数字,应
在空格后标明数字的单位
江西师大心理与教育统计测量中心
心理测量学
❖三、论述题与计算题 ❖1、定义: ❖论述题指对某一问题或议题进行综合
论述的题目。它用于考查被试分析、综 合、评价直至创新、创造等高层次能力。
心理测量学
❖ 3、选择题编制 ❖ 题干要描述清楚。应让答题者明白问
题是什么,希望答题者解决什么 ❖ 题干中应尽量避免出现与考核内容无
关的材料 ❖ 设问应尽量正向,尽量少出现如“下
面哪个是不对的?”的设问
江西师大心理与教育统计测量中心
心理测量学
❖题干文字的字体应尽量一致(,以减轻 考生的阅读负担
❖备选项应避免出现逻辑上的包含关系 ❖备选项的长度、结构、语言表达要尽量
❖计算题 ❖证明题 ❖论述题 ❖案例分析题 ❖组合题 ❖行为情景判断题
江西师大心理与教育统计测量中心
心理测量学
❖二、选择题
❖1、定义:选择题指给出题干及备选项,要 求被试根据题干从备选项中选出正确选项的 题目。单项选择题指只有唯一正确选项的选 择题。
❖2、特点功能: ❖①评分标准明确,评分客观,有利于减少评
江西师大心理与教育统计测量中心
心理测量学
❖④论述题和计算题可以根据试题相应情 境进行不同层次、不同角度的设问,如 可以是单问,可以是多问,也可以是分 步设问,使试题的考查目标比较明确。
江西师大心理与教育统计测量中心
心理测量学
❖ ⑤论述题、计算题在评分过程具有一 定的主观性。
❖ ⑥论述题、计算题的最大缺点是阅卷 评分的工作量比较大,对阅卷人员的要 求比较高,阅卷工作的费用较大。同时 论述题、计算题评分误差较难控制,在 控制不好的情况下,评分误差可能会很 大。
江西师大心理与教育统计测量中心
心理测量学
❖四、行为情景判断题 ❖1、定义: ❖行为情景判断题多见于心理测验中,
它指给出一个日常生活中或工作中的具 体情景,并针对该情景提供若干解决这 一情景下具体问题的行为选项,并要求 受测者进行选择/评价的题型。
江西师大心理与教育统计测量中心
心理测量学
❖2、特点功能: ❖①与一般认知能力有较强的相关,平均
分带来的评分误差。 ❖②有利于对基础知识和基本技能进行考查。
江西师大心理与教育统计测量中心
心理测量学
❖③选择题适合考查较低层次的能力,如 识记能力、较低的理解能力等,而不宜 考查较高层次的能力,如综合能力、创 造性和独立思维能力。
❖④选择题的命题技术要求较高,尤其是 干扰项的设置。
江西师大心理与教育统计测量中心
心理测量学
❖客观题主要包括选择题(含自陈式选择 题)、填空题、是非判断题、匹配题、 行为情景判断题Байду номын сангаас。
❖主观题主要包括名词解释、简答题、计 算题、证明题、论述题、案例分析题、 作文题等。
江西师大心理与教育统计测量中心
心理测量学
❖ 单项选择题 ❖ 多项选择题 ❖ 自陈式选择题 ❖ 是非判断题 ❖ 名词解释题 ❖ 简答题
达0. 54 ❖②跟大五人格因素的多项因素有中度以
上的相关,如跟责任心的相关为0. 26 , 跟情绪稳定性的相关为0. 32 ,跟宜人 性的相关为0. 25
江西师大心理与教育统计测量中心
心理测量学
测验题目性能与题目编制
1 测验题目类型、功能与题目编制 2 测验题目的难度与难度分布控制 3 测验题目的区分度与区分度的提高 4 测验题目的猜测度与猜测控制 5 选择题的选项分析与选项修改 6 题目功能差异与测量偏差控制
江西师大心理与教育统计测量中心
第四章测验题目的性能与题目编制
第四章 测验题目性能与题目编制
江西师大心理与教育统计测量中心
心理测量学
引子
心理测量的工具是测验,而题目则 是构成测验的基石,因此研究题目的性 能及其编制至关重要,它直接影响测量 工具(即测验)的信度及效度,进而影响 测量的准确性。在实际工作中,人们应 如何来编制测验题目?如何评价测验题 目质量的好差呢?本章将对这些问题做 出回答。
江西师大心理与教育统计测量中心
心理测量学
❖③评分简单,误差也相对要小。 ❖④填空题只要求考生写出最后答案,而
不必写出解题的具体过程,因此,从试 卷上看不出考生的推理、分析等思考过 程
江西师大心理与教育统计测量中心
心理测量学
❖ 2、填空题编制 ❖ 试题的空格处应考查有意义的关键性内容或
词语。 ❖ 每小题的空格数不宜过多,填写的字数也不