编制测验的一般程序
教育测验编制的一般步骤与方法
缺点:
1.不易编制,且花费时间较多。 2.易受考生阅读能力的影响。 3.难以排除考生对试题的随机猜测。 (二)客观题命题的一般原则 1.试题能反映教学内容的重点或知识 点。
2.题目之间的相关性越低越好。 3.试题的文字力求浅显易懂、题意明 确。
2020/3/27 4.答案应该是明确、唯一的。
(三)不同类型选择题的命题原则
3
1
1
1
0
第四章 溶液 6
3
3
1
8
第五章酸碱盐 4
3
3
5
2
合计
26 12 13 14 18
评价
2 2 2 6 5 17
合计
22 21 8 22 22 100
由上图可见,命题双向细目表由3个要素组成:
测验目标、测验内容以及二者的比例,即权重。权
重代表了这部分内容的相对重要性。
2020/3/27
◆在真实的命题中,一般遵循如下顺序:
内容范围 3 1 5 3 2 2 2 15
内容范围 4
3444
15
内容范围 5 1 6 2 3 3 2 17
合计
6 32 24 16 14 8 100
2020/3/27
例 1 初中化学内容与教学目标细目表
测验目的 测验内容
知识 理解 运用 分析 综合
第一章 氧
6
3
4
4
3
第二章 氢
7
2
2
3
5
第三章 碳
① 测验材料要适合测验目的
② 测验材料要能够代表该科教材的全部 内容(测验材料要有合理的覆盖面,突出 基本内容及重点内容,比例参照命题双向 细目表)
③ 测验材料要有普遍性(要依据统一的 教学大纲)
心理测量学第六节 心理测验的编制程序
❖ 常用的心理测验常模有百分位常模,标 准分常模,发展常模及商数等。
例:16PF成人的男常模
编制测验说明书
❖ 测验的目的与功用 ❖ 测验的理论依据 ❖ 测验实施方法 ❖ 测验的标准答案和计分方法 ❖ 常模资料 ❖ 测验的基本特征(信度、效度等)
瑞文标准推理测验(目的与功用)
❖ (Raven's Standard Progressive Matrices简称 SPM)是英国心理学家瑞文(J.C.Raven)1938年设 计的非文字智力测验。
能力。 ❖ (5)机械记忆——对事物进行强记的能力。 ❖ (6)知觉速度——准确迅速观察和识别事物的能力。 ❖ (7)一般推理——根据已知判断推出未知判断的能力。
目标分析三种情况
❖ 工作分析 ❖ 对特定概念下定义 ❖ 确定测验的具体内容
描述性的显示 测验,目标分 析的主要任务 是确定显示的 内容和技能, 从中取样。
二、预测和项目分析
❖ (一)预测 ❖ (二)项目分析
预测应注意问题
❖ (1)预测对象应取自将来正式测验时准备施用 的群体,虽然人数不必太多,但要具有代表 性。
❖ (2)预测的情境应力求同正式测验的情境一致。 ❖ (3)预测的时限可以适当延长,以便每一受测
者都能将题目做完。 ❖ (4)施测者应对受测者的反应加以记录。
目标分析三种情况
对于选拔和预测功
❖ 工作分析 (job analysis)
用 的预测性测验. 两个步骤:一是确 定哪些心理特征和
行为可能使要预测
❖ 对特定概念下定义 的活动成功,二是
建立衡量被试是否
❖ 确定测验的具体内容 成功的标准。
目标分析三种情况
❖ 工作分析 ❖ 对特定概念下定义 ❖ 确定测验的具体内容
第九章量表编制
2.选择题:结构上包括两部分:题干和选
项
请你选择一种喜欢的颜色? 绿色 茶色 紫色 蓝色 红色 橘色 白色 黄色 智力测验(主要是测量推理能力)编制中使用 的选择题 (1)猫头鹰是鸟正如白鲨是—— a 动物 b 鱼类 c 鸟类 d 爬行动物 (2)平地与土丘的关系就如同峡谷与——的 关系。 a 沟壑 b 山谷 c 丛林 d 河流 e 高山
优点:适用范围广,既可以适用于文字 和数字的材料,也可以适用于图形的材 料;评分简单、省时、客观;相比于判 断题更少受猜测因素的影响。 缺点:编拟迷惑答案比较困难;无法测 量出被试的言语表达能力和概括、组织 能力,这与简答题、论述题相比是不足 的;尽管选择题减少了机遇的影响,但 猜测的影响仍然不能完全排除。
(三)初步组成测题 测验编制经验丰富者在编制测题时,往 往会考虑以下几个测题的来源: 直接选自国内外优秀的相关的测验; 修改前人的测验中的有关的测题; 自己编写
1.编写测验项目时应注意以下几点 (1)测验项目的取样应当具有代表性
(2)测验项目的取材范围要同编题计划所列 项目范围一致。 (3)测验项目的难度应该有一定的分布范围 (4)编写测验项目的用语要力求精练简短, 浅显明了。 (5)初编题目的数量要多于最终所需要的数 量,以便筛选和编制复本
3 2 1 3 2 1 1 13
2 1 0 2 2 0 1 8
1 0 1 1 0 0 0 3
20 10 12 25 13 12 8 100
编制计划有三个用途:
1.在测验的编制阶段,可以知道每个项 目应该编多少题目,编哪些种类的题目 2.题目编好后,可以用来核对,测题是 否全面,是否真正代表了所要测量的领 域,核对重要的方面有没有遗漏 3.根据表中百分比确定每类项目的分数 back
测验编制的一般程序
测验编制的一般程序1、测验编制的一般程序:测验项目的分析(测验的对象、用途和目标)、测量的编写(搜集资料、命题原则和编制要领)、测验的编排和组织(合成测验、测验的预试、信度与效度的考察、常模制订、编写指导手册)。
2、测验的目标的三种情况:工作分析;对特定概念下定义;确定测验的具体内容。
3、搜集资料题目的来源:已出版的标准测验、理论和专家的经验、临床观察和记录。
4、命题原则内容方面:符合测试目的;内容取样有代表性;题目之间的内容相互独立。
文字方面:使用准确的当代语言;语句简明扼要;最好使一句话说明一个概念。
理解方面:题目内容不要超出受测团体知识水平和推理能力;题目不可令人费解。
社会敏感性方面:假定受测者具有某种行为;命题时假定规范不一致;指出该行为虽违规,但常见。
5、选择题的编制要领:题干所提的问题必须准确,尽量使用简单词语;选项切忌冗长,要简明扼要;每道题只给一个正确答案,其他属诱答;各选项长度应相等,尽量不要有长有短;避免题干用词与选项和词一致;选项最好用同一形式。
6、是非题的编制要领:内容以有意义概念、事实或基本原则为基础,不要照抄原文;每道题只能包含一个概念;尽量避免否定的叙述,最好直接采用肯定的叙述;表达意见的题目,最好说明意见的来源和根据;是非题的数目应有适当比例,基本相等,且要随机排列。
7、简答题的编制要领:最好采用问句形式;如果是填充形式,空格不宜太对;每道题应只有一个正确答案,且答案要简短而具体。
8、操作题的编制要领:明确所要测量的目标,并将其操作化;尽量选择逼真度较高的项目;指导语简明扼要;制订评分标准,确定记分方法。
9、测题的排列:并列直进式和混合螺旋式。
第七节心理测验的使用1、主测者的资格:在技术上要求具备一定的知识结构、心理测验专业理论和相应的专业技能;在道德上要求恪守职业道德,测验保密与控制使用和隐私保护。
2、测验选择:适合测量的目的和符合心理测量学要求。
3、测验前的准备工作:预告测验、准备测验材料、熟悉测验指导语、熟悉测验的具体程序。
成绩测验的编制
级别:先知成绩测验的编制2004年9月12日成绩测验的编制一般按以下程序进行:(一)确定测验目的编制测验,首先要明确测验目的,不同的测验目的决定不同的测验种类和题型。
评价学生对一门学科是否达到了教学大纲的基本要求,可以采取团体笔试的方式;进行诸如高考一类的选拔式的考试,可采用建立常模的标准化考试;检查学生学科知识的掌握,理解能力、判断能力和推理能力的发展可以选用客观性试题;考核学生的材料组织能力,则宜选用非客观性的试题。
确定了测评的目的,才能确定测验的形式和试题的类型。
(二)明确测验的范围和内容测验的内容是教学内容的抽样,全面地反映教学内容。
当测验的目的确定后,首先考虑的是测验要测什么,测到什么程度即测验的范围和内容,这时既要考虑使测验所要测量的知识、技能和能力有所反映(涉及到教学目标),又要划定测验的内容(涉及到测验内容的覆盖面、代表性),还要确定各部分测验内容的权重和分值(涉及到各部分内容所占的比重)。
这些工作以前主要是依据对教学大纲和教科书的理解来构思,现在很多教师都在尝试用“双向细目表”的方法来进行设计。
所谓“双向细目表”,实际上就是教材内容和学习结果两个维度,其中一维反映教学的内容,另一维反映学生的学习水平。
目前在“学习水平”这一维,普遍采用布卢姆等人关于认知领域教育目标的分类,即把学习结果或认知水平分为“知识、理解、应用、分析、综合、评价”六种水平。
教材内容这一维则根据具体学科内容加以确定。
表以小学自然常识测验的双向细目表为例作一说明。
表9-1小学自然常识测验编题双向细目表知识理解应用分析综合评价合计生物世界3 5 6 3 2 1 2 0资源利用2 3 3 1 1 0 1 0动力机械 2 3 4 2 0 1 1 2物质、能量5 6 8 3 2 1 2 5气象 2 4 3 2 2 0 1 3宇宙 2 5 4 1 0 0 1 2地球2 2 2 1 1 0 8合计18 28 30 13 8 3 100上表有三点要说明:(1)学科教材内容即知识目标,一般按教材的章节记入,但必须是讲述过或要求学生自学并列入考试范围的内容。
心理测验的编制与分析
4、问题序列的设计
⑴根据问题的功能安排序列。一般说来,接触性问题安 排在最前面,继之以实质性问题,在实质性问题的前 后,根据需要穿插各种功能问题。如设置过滤性问题 和校正性问题,则要注意不能让它们与实质性问题靠 得太近,以免因调查对象的察觉而失去其意义。 ⑵敏感性问题和开放性问题放在卷末。如果将信仰问题、 同事关系、家庭生活等敏感性问题放在卷首,则可能 引起调查对象的反感。而开放性问题需要调查对象作 较多的考虑和书写,颇费时间,调查对象很可能产生 畏难情绪。
回答问卷时请注意: ⑴请您认真读懂每句话的意思,然后根据该句话与您 自己的实际情况相符合的程度,在答题纸上圈选一 个相应的字母。具体如下:A——非常不符合 B——比较不符合 C——不确定 D——比较符合 E——非常符合 ⑵如果没有合适的答案,请选择您认为正确的答案。 ⑶虽然没有时间限制,但对每个问题你不必反复考虑, 可凭第一印象做答。 ⑷请认真回答每一个题,每题只能选择一个选项。 ⑸本卷要反复使用,请您不要在上面做任何记号或写 字,答案只能做在答题纸上。谢谢!
③设计开放式问卷,作试探性的小规模调查, 构建问卷框架。 ④此外,还可通过查阅文献、个案研究方式 收集资料,构建问卷框架。
(二)指导语的功能与设计
指导语即问卷的开场白,它在较大的程度 上决定着调查对象是否愿意真正作答,因 此,必须给予足够重视。
指导语的三项功能:
⑴建立初步的心理融洽,引起调查对象回答的意 向与动机。 ◆说明调查者的身份(研究者身份),强调是为 了进行科学研究,而非其他私人目的,以取得 调查对象的信任。 ◆说明研究的目的和价值,对其价值的阐述最好 能与调查对象的个人利益联系起来,以激发其 回答的动机。 ◆说明需要调查对象的协作的重要性。
(三)问卷格式的选择与设计
测验编制的一般程序考试试题及答案解析
测验编制的一般程序考试试题及答案解析一、单选题(本大题7小题.每题1.0分,共7.0分。
请从以下每一道考题下面备选答案中选择一个最佳答案,并在答题卡上将相应题号的相应字母所属的方框涂黑。
)第1题在编制测验过程中,目标分析的主要目的是( )。
A 确定测验的对象B 拟定测验的计划C 确定测验的用途D 确定测验的具体内容【正确答案】:D【本题分数】:1.0分【答案解析】[解析] 目标分析是指对测验目标加以分析,将其目标转换成可操作的术语。
即确定测验的具体内容的过程。
第2题测验编制的一般程序不一定需要( )。
A 测验的目标分析B 测验的编写C 制定常模D 测验的编排和组织【正确答案】:C【本题分数】:1.0分【答案解析】[解析] 按照参照标准的不同,测验可以分为常模参照测验和目标参照测验。
制定常模是常模参照测验的程序,但目标参照测验则不需要制定常模。
第3题在拟定测验编制计划时,通常需要制定一个( )。
A 单向细目表B 双向细目表C 三向细目表D 四向细目表【正确答案】:B【本题分数】:1.0分【答案解析】[解析] 拟定测验编制计划通常就是制定双向细目表的过程。
双向细目表是一个由测量的内容材料维度和行为目标维度所构成的表格,它能帮助测验的编制者决定应该选择哪些方面的题目以及各题目所占的比例。
第4题编制简答题的原则不包括( )。
A 将其操作化B 宜用问句形式C 填充形式的空格不宜太多D 每题应只有一个正确答案【正确答案】:A【本题分数】:1.0分【答案解析】[解析] 操作化是编制操作题的原则之一。
第5题心理测验的目标是指编制的测验是测什么的,即用来测量什么样的( )或行为特征。
A 心理对象B 心理用途C 心理动机D 心理变量【正确答案】:D。
教育测验的编制与实施
5、平波型分布 即中低高分人数差不多。学生的学业成 绩呈平波型分布,表明大中小几种难度 的试题比较接近,或学生的基础相差不 大,试题区分度低,需要提高区分度。 6、陡峭型分布 即中分人数很多,低高分人数极少。学 生的学业成绩呈陡峭型分布,表明难度 中等的试题比例过大,缺乏区分度或学 生的基础相差不大,要提高试题的区分 度。
布氏上述六类目标是有层次、有顺序的, 知识是最低层次,是最基本的要求。其 余依次是理解、应用、分析、综合、评 价。评价为认知领域的最高层次,是前 面五种目标的综合并增加了价值标准。 这六类目标,由简单到复杂,由低级到 高级依次排列,组成层次结构。
情感领域
接受:觉察到某一事物的存在,愿意接受某种 特定刺激和有选择的注意这个事物。 反应:受到动机的充分驱动,积极注意某种观 念,并伴随着主动参与行为。 价值评价:接纳并赋予某一客体、现象和行为 以价值。 组织:将各种不同的价值结合起来,解决它们 之间的冲突并开始建立内在的、一致的价值体 系。 由价值或价值复合体形成的性格化:形成的价 值体系在相当长的时间内控制个体行为,形成 内化的加之行为,产生性格化的人生模式。
606 × 308 × - 568 - 287 ———— ———— 168 181
×
√
835 - 217 ———— 618
√
(四)明确测验对象
应考虑被试的年龄特征、教育水 平和文化社会背景等因素
(五)确定测验内容
测验内容的确定,实际上也就是内容抽样 的决定和测验目标的确立相结合而成。 这一结合过程必须通过命题双向细目表来 确定。 命题双向细目表由3个要素构成:p106 测验目标 测验内容 测验目标和测验内容的比例
(六)测验的编制与组织
测验编制步骤
测验编制步骤:8步1、目得、对象2、确定结构、确定测验结构,①根据理论、智力测验有几个因素;人格特质,一个特质就是一个维度。
②因子分析,大致有个设想,初步构思,先就是探索,验证,样本不一样,好得测验要做几次。
首先检查共同度,低于0、5或0、3得题目去除,与其她项目之间得共同成分。
认知能力有两种,斯皮尔曼理论。
G因素与S因素,好得0、5以上。
碎石图拐点因素负荷,各因子负荷分数,能区分、旋转后也不能把负荷集中,去掉、如两个因子上都就是0。
4,结构不明确,某一题目属于谁不确定、题目多时做验证性因素分析A、首先做单维检验,一个维度属于一个ξ,如12道题,B、4个一加,4个一加,原始分相加,变成三个指标,指标太少,验证性因素分析做不出来。
项目超过100个,旋转不出来,探索性因素分析旋转不出来。
③分配权重:30分常识60分词汇满分相差很大,通过转换成量表分,变成Z分,转换成量表10分制。
麦卡锡幼儿量表分多得每个维度转换成30分左右。
有得分测验重要得,权重较大。
3、记分方法4、常模:用到什么地方,抽样如何抽A、一种瞧成就是正态分布,知道S与就可以。
转化为Z分。
B、非正态数据,根据常模样本频数分布确定,累积百分数,您得分数一边就是分数,以下就是百分之多少。
累积百分比算出来了,某一分数对应P,累积百分率多少。
根据常模样本确定每一点得累积百分数。
常模样本分数分布,例如:艾森克一般T20~80分最多90分,一般做到80分艾森克远远超出80分,偏态、5、设计项目:数据与资料,与测验相关理论、相关测验。
A、很多测验相互参考,很多人格测验用MMPI题目,有些就是参考,有些就是搬过来,16PF没有效度量表,187道题,有些被试在人才招聘时都选好得答案,用其它测验效度量表加进去,MMPI或艾森克测谎量表,20个题目,分散开,统计时就是单独一个量表。
题目量要大,准备用50道,编100道,最好多一倍,有得就是1:1、5,至少要多1/2得题目,便于淘汰。
测验的编制实施和评分
孙海龙
第一节 编制测验的一般程序
一、确定编制测验的目的 (一)确定测量对象 • 年龄 • 教育水平 • 文化背景
(二)分析测量目标
1、确定能表征所欲测量的心理结构的行为 • 如何使我们所选择的行为样本更具代表性: (1)回顾以往的研究成果 (2)考虑时代特点 (3)了解受测者的实际情况 (4)向专家和资深者质询、请教 2、确定每一类行为的项目比例
五、合成测验
(一)项目的选择 • 好题目的标准:只测定所需要的特征,并能对该特征加 以有效区分的、难度合适的题目。
(二)项目的编排
1、逐类直进式 2、混合螺旋式
(三)编制复本
• 测验的各份复本必须等值,所谓等值必须符合下列条件: (1)各份测验测量的是同一种心理特性。 (2)各份测验具有相同的内容和形式。 (3)各份测验的题目不应有重复的地方。 (4)各份测验题目数量相等,有大体相同的难度和区分度。 (5)各份测验的分数分布(平均分和差异度)大致相等。
2、编写题目时要注意:
(1)题目范围要与测验计划所列一致。 (2)题目的数量要比最后所需的数目多一至几倍。 (3)题目的难度必须符合测验目的的需要。 (4)题目的说明必须清楚明白。
四、预测和项目分析
(一)预测 • 注意: (1)预测对象应取自将来正式测验准备应用的群体,取样 要具有代表性。 (2)预测的实施过程与情境应力求与将来正式测验时的情 况相近似。 (3)预测的时限可稍宽一些。 (4)在预测过程中应对受试者的反应情形随时加以记录。
• A.被试样本要有代表性,尤其要注意包括待测属性各种可能 值的个体,例如:夫妻关系中各种夫妻关系 的样本都应具备 • B.适合的样本容量,对于一个区域性常模,一般的心理特质 采样应在1200人左右,试验性采样的大小约为常模样本的 25%.
第6节测验编制的一般程序
第6节测验编制的一般程序测验编制是测试和评价学习的一个重要环节。
在教学中,测验编制常常是教师衡量学生学习成果的重要方法之一,也是学生评估自己学习成果的一种有效手段。
测验编制的一般程序包括以下几个步骤:1. 确定测验的类型和形式首先,需要确定测验的类型和形式。
测验的类型可以根据各种不同的分类标准来进行划分,比如根据测验的内容可以划分为知识点测验、技能性测验、应用性测验等等;根据测验的目的可以划分为诊断性测验、预测性测验、评估性测验等等。
测验的形式可以根据教学要求来确定,可以是选择题、填空题、简答题、论述题等等。
在确定测验的类型和形式时,需要考虑到测验的目的、教学内容和教学目标等因素。
2. 设计测验的结构和内容根据测验的类型和形式,需要设计测验的结构和内容。
例如,设计选择题时需要确定选项的个数、正确选项的位置、干扰项的种类和数量等等。
设计填空题时需要确定答案的字数、填空的位置、是否需要提示等等。
设计简答题时需要确定答题的字数、是否需要给出指导语等等。
在设计测验的结构和内容时,需要注意题目的难易度和体裁的风格问题,保证测验的质量和有效性。
3. 编制测验的题目和材料在确定测验的结构和内容之后,该步骤的重点就是编制测验的题目和材料。
根据测验的形式和目的,需要编制一定数量的试题和题目材料。
在编制试题和题目材料时,需要注意以下几个方面:•题目的准确性和完整性。
编制试题时需要确保试题的正确性和完整性,避免出现错别字和句子不通顺的情况。
•材料的真实性和可信度。
编制题目材料时需要保证其真实性和可信度,尽量避免编造材料来制造虚假情境。
•试题和材料的难度适宜。
编制试题和材料时需要考虑到学生的认知水平和能力水平,保证试题和材料的难度适宜。
4. 试卷的排版和上传在编制完试题之后,需要进行试卷的排版和上传。
试卷的排版需要注意以下几个方面:•试题的版面布局。
试题的版面布局需要符合教学要求和审美要求,保证试卷整齐、清晰、易于阅读。
测验编制2012-4-7
第三单元
测验的编排和组织
㈡、测题的编排 测验题目选出之后,必须根据测验的 目的与性质,并考虑被试作答时的心理反应 方式,加以合理安排。如下几点应当是测验 编排的一般原则: 1.测题的难度排列宜逐步上升。 2.尽可能将同类型的测题组合在一起。 3.注意各种类型测题本身的特点。避免引 起被测的定势反应。
第七节 心理测验的使用
第一单元 主试的资格
主试资格包含技术和道德两方面的要求。在技术方面 要求主试必须具备一定的知识结构、心理测验专业理论知识 和相应的专业技能,在道德方面则要求主试恪守测验工作者
的职业道德。
第一单元 主试的资格
一、知识结构
主试者的知识结构是指开展心理测验工作所必须
具备的基础知识和专业知识。在基础知识方面,主要包 括普通心理学、发展心理学、社会心理学等广泛的心理 学基础知识,以及扎实的心理统计学的基本知识。在专 业知识方面,除了精通人格心理学、能力心理学、变态 心理学外,还应根据自己的工作领域具备相应的本行业 的专业知识
第三单元
测验的编排和组织
常见的排列方式。 1.并列直进式:此种方式是将整个测验按试题材 料的性质归为若干分测验,在同一分测验的试题则依 其难度由易到难排列。 2.混合螺旋式:此种方式是先将各类试题依难度 分成若干不同的层次,再将不同性质的试题予以组合, 作交叉式的排列,其难度则渐次升进。
测验的编排和组织
测题的编写 ㈠、选择题:由两部分构成:题干(stem)和选项 (options,alternatives) 1.题干所提的问题必须明确,尽量使用简单而且明晰 的词语。 2.选项切忌冗长,要简明扼要。 3.每题只给一个正确答案,其它属诱答。若是找最合 适的答案 4.各选项长度应相等,尽量不要有长有短。 5.避免题干用词与选项用词一致,否则成了选择答案 的线索。 6.选项最好用同一形式
测验编制的一般程序
测验的对象分析
在编制测验前首先要明确测验的对象, 在编制测验前首先要明确测验的对象, 即测验的适用团体。 即测验的适用团体。 对测验对象的分析包括:年龄、 对测验对象的分析包括:年龄、受教育 程度、社会经济地位、阅读水平、 程度、社会经济地位、阅读水平、文化 背景等。 背景等。 韦氏成人智力测验中国修订版( 韦氏成人智力测验中国修订版(WAISCR)有两个形式:城市式和农村式。 )有两个形式:城市式和农村式。
研究证明编排方式对测验得分影响不大。 研究证明编排方式对测验得分影响不大。
预测
预测对象应取自将来正式测验准备应用 的群体; 的群体; 预测的实施过程与情境应力求与将来正 式测验时的情况相近似; 式测验时的情况相近似; 预测的时限可稍宽一些, 预测的时限可稍宽一些,最好使每个被 试都能将题目做完。 试都能将题目做完。 在预测过程中, 在预测过程中,应对被试的反应情形随 时加以记录。 时加以记录。
– 命题时假定被试具有某种行为,使他不得不在确实 命题时假定被试具有某种行为, 没有该行为时才否定,可避免否定答案过多的倾向; 没有该行为时才否定,可避免否定答案过多的倾向; – 命题时假定规范不一致; 命题时假定规范不一致; – 指出行为是常见的,虽然是违规的。 指出行为是常见的,虽然是违规的。
测题的编制要领
ቤተ መጻሕፍቲ ባይዱ 是非题的编制要领
内容应以有意义的概念、 内容应以有意义的概念、事实或基本原则为基 础; 每道题只能包含一个概念; 每道题只能包含一个概念; 尽量避免否定的叙述, 尽量避免否定的叙述,尤其要避免用双重否定 的叙述; 的叙述; 若是表达意见的题目,最好说明意见的来源和 若是表达意见的题目, 根据; 根据; 题的数目应基本相等, “是”、“非”题的数目应基本相等,且要随 机排列。 机排列。
心理测量-第八章-测验的编制与实施
11
第三步:编制题目
搜集资料 代表性、普遍性
选择形式
文字/非言语 客观/论述 纸笔 /操作
编写和修订题目
测验题目的编制技术
命题的一般原则:
范围,代表性,难度,数量,简明
不同题型的编写规则
分类1:选择题/是非题/匹配题/填空和简答题/论述题 应用题/操作题/联想题/排列题/改错题
第七步:测验的修改和鉴定
根据项目分析结果,删除、修改和重新 编制题目。这是一个多次往复的过程
对成型的测验进行标准化,收集测量学 证据或资料,包括信度与效度等
信度(可靠性或一致性) 效度(有效性或正确性)
第八步:编写测验手册
手册应包括以下内容: 1.测验的目的、功用 2.理论依据 3.实施方法 4.标准答案和计分方法 5.常模表或其它分数转化与解释的资料 6.测验的信度、效度资料及说明
分类2:全开放型/开放—单一反应型/多重选择/双级等级评定 利克特型/排序/投射/绩效项目/分类信息
编题举例1:多择一题型
Do…
Don’t…
使用一个直接的问题或一 个不完整的陈述作为题干
选项或题目在语法和形式 上保持一致
尽量使所有错误选项看起 来是可能的
否定性题目,尤其是在题 干是否定性的(双重否定)
使用技术上的行话
反应之间相互重叠
使用“以上所有”
例2:主观题——人格
是非题
我喜欢去干有冒险性的工作
利克特评定量表:5点或7点评定
朋友们通常把我看成是一个潇洒的人
1 23
使用特殊符号
很不象我
用于态度调查
你对XXX电视节目有什么看法?
45
心理测验的编制,
编制复本 为增加实际的效用,有时一个测验需有等 值的复本。 复本的编制要符合下列条件:
(1)测量的是同一种心理特质; (2)测题的内容和形式相同,但不应有重复; (3)题型相同、数量相等并有大体相同的难 度和区分度。
可先将所有题目按难度排列,标上序号, 然后依序按“蛇型”将各题安排至各复本 中(P.21)。 复本编好后,应再测验一次,以确定各份 测验是否等值。
2. 第二章
心理测验的编制
本章主要内容:
2.1 编制测验的一般程序
2.2 测验项目的分析
2.1 编制测验的一般程序
编制好的测验是实现心理测量的基本前提。 不同性质、用途的心理测验,其编制的具体 技术、过程和方法有所不同,但基本程序是一 致的。 一般要经过以下几个步骤:
2.2 测验项目的分析
对测验项目的分析,主要是对项目难度 和区分度等指标进行分析。可帮助我们筛选 和修订项目,提高测验的可靠性和有效性。
2.2.1 测验项目的难度指标 难度指测验项目的难易程度。通过者多, 难度小。通过者少,难度大。 测验的记分方法不同,项目难度的计算 方法有所不同。
二分法记分项目-难度的计算 (1) 对于二分法记分的项目,如是非题、 选择题等,其难度通常用通过率(P)来 表示。即用答对该题人数的百分比作为指 标。P值越大其难度越小。 P= R / N (2-1) P -通过率,R -答对人数,N -总人数
(4)施测者应对受测者的反应加以记录。 如在同一时限内,一般被试所完成的题数、 题意不清之处等,以便修改项目时参考。
项目分析(详见 2.2) 试测完成后,可以根据试测结果进行项 目分析。项目分析主要确定测题的难度、 区分度、备选答案的合适度等数量指标。 依分析结果取舍项目。 由于试测的样本小可能会存在取样误差, 由此获得的项目分析结果未必完全可靠, 需对来自同一总体的两个样本施测,然后 分别进行项目分析,看两次分析结果是否 一致(复核)。若相差较大,说明该项目 的性能值得怀疑。
[教育学]心理测量 第九章 心理测验的编制
3.题项内容不能用土语、专有名词或双 重否定句来表达。 4.题项内容Байду номын сангаас避免社会禁忌和爱好,应 避免难以启齿的问题。 5.题项应避免暗示和诱导作用。 6.题项内容最好应避免易引起强烈的情 绪联想。
3 .不要用假设或猜测的语句提问。 4 .项目内容不应超过被试知识水平和能 力范围。 在编写题项的用词造句上还应考虑以 下几点:(1)是提一般的问题还是提有 针对性的问题。(2)是直接提问还是间 接提问。(3)是问个人的还是问集体的。 (4)是长句好还是短句好。
(三)问卷的编辑
1、问卷的顺序 (1) 时间顺序。 有时间顺序的问题,应依次排列, 不要杂乱,以免使受测者的记忆受到干 扰,而无法理出正确的时间观念。 (2)内容顺序。 内容顺序安排要考虑三个方面:属 于一般的或通论性的,放在问卷的前面,
优点:
① 回答是标准化的,便于比较,统计
和编码。 ② 被试对问题的含义通常是清楚的。 ③ 回答具体可用,不会产生不相干的 回答。 ④ 回答简便,不需化更多时间思考, 不需要较高的撰写技能。
缺点:
① 易产生不可信的回答。
② 不能发现意想不到的资料。
③ 难以发现被试回答上的细微差异。
④ 被试可能对提供的答案不满或不同
(二)项目分析 对项目的分析,包括质的分析和量 的分析。 前者是从内容取样的适切性、题目 的思想性以及表达是否清楚等方面加以 评鉴。 后者是对预测结果进行统计分析, 确定题目的难度、区分度、备选答案的 合适度等。
五.合成测验 (一)项目的选择 最好的题目,就是只测定所需要的 特征,并能对该特征加以有效区分的难 度适合的题目。 (二)项目的编排 测验一般有三种编排方式: 1.并列直进式 2.螺旋式 3.混合式
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、确定测验目的一)测量对象在编制测验前首先要明确测量对象,也就是该测验编成后要用于何种团体。
惟独对受测者的年龄、智力水平、文化背景以及阅读水平等做到心中有数,编制测验时才干有的放矢。
二)测量目标所编的测验用来测量什么,是测能力、人格,还是学业成就,也是必须首先考虑的问题。
非但要明确测量的目标,还要对测量目标加以分析,将此目标转换成可操作的术语,即将目标具体化。
如美国著名测验学家瑟斯顿通过因素分析,将智力分解为七种基本心理能力:语文理解──阅读时了解文字意义的能力;语词流畅──正确迅速拼字与敏捷联想词义的能力;数字运算──正确而迅速使用数字解答算术问题的能力;空间关系──运用感觉器官及知觉经验正确判断空间方位及各种关系的能力;机械记忆──用重复感知的方法记住事物的能力;知觉速度──迅速而正确地观察与辨别事物的能力;普通推理──根据已知条件推出新判断的能力。
瑟斯顿根据上述七种因素于年编成为了“基本心理能力测验”。
三)测验用途所编出的测验是要对被试做描述,还是做诊断,抑或者是选拔和预示,这一点也是在测验编制前就应明确的。
目的不同,编制测验时的取材范围以及试题难度等也不尽相同。
二、拟定编制计划编制计划,实际上就是对测验的总体设计,指出测验的内容结构和项目形式等,以及对每一个内容、目标的相对重视程度。
不同的测验有不同的编制计划。
例如成就测验的编制计划通常是一张双维细目表,其中一个维度是内容,就是某一学科教材中的各个课题,另一维度是在教学中要达到的行为目标。
美国心理学家布卢姆最早提出教育目标的分类问题。
他把学习的心理活动分成认知、精神运动和情感三个领域,又把认知领域具体分为知识、理解、应用、分析、综合、评价六个层次。
在布卢姆等人编的《教育目标的分类》一书中,为每个认知层次提供了许多题目范例。
后来人们普通就依据布鲁姆的认知性行为目标编拟学科试题,以测量学生的学习结果。
表是一个小学高年级自然常识测验的编制计划。
表中的数字代表每一类题目所占的百分比,这些比例反映着每一个内容及目标的相对重要性。
测验计划有两个用途。
①在编制阶段,测验计划指出应该编多少和编哪些种类的项目;项目编好后,可将项目的实际分布情况与测验计划对照,以确定测验项目是否恰当地代表了所要测量的领域,核对重要方面的内容是否有遗漏。
②在记分时可按表中百分比确定每类项目的分数。
三、设计测试项目一)搜集有关资料测验计划编好后,就要搜集有关资料作为设计项目的依据。
一个测验的好坏和测验材料的选择适当与否有密切关系,为此要注意以下几个问题。
资料要丰富制人格测验,搜集的资料应包括:人格的主要理论,用于描述人格的术语,临床观察的资料,以及其他人格测验的项目等。
资料要有普遍性所选择的材料对测验对象要尽可能公平,即被试都有相等的学习机会。
譬如,编制标准化的学科成就测验时,要以统一的教学大纲和统编教材作为题目来源,不能只考虑个别教师的意见,要考虑大多数教师和专家的意见。
在编制智力测验时则要尽量避免特殊知识经验和文化水平的影响。
二) 选择项目形式测验编制者还必须确定测验内容的表现方式,是纸笔测验还是操作测验;是只要被试认出正确答案,还是需要他自己做出正确答案。
在大多数情况下,任何内容都可以用几种形式呈现,问题是如何选择“最优的”表现方式。
在一个测验中,可以采用一种题型,也可以采用几种题型。
在选择项目形式时,要考虑以下几点。
测验的目的和材料的性质如果要考查学生对概念和原理的记忆,宜用简答题;要考查对事物的辨别和判断的能力,宜用选择题;要考查综合运用知识的能力,宜用论文题。
接受测验的团体的特点如对幼儿宜用口头测验,对于文盲或者识字不多的人不宜采用要求读和写的项目,而对有言语缺陷的人如聋哑、口吃则要尽量采用操作项目。
各种实际因素譬如,当被试人数过多,测验时间和经费又有限时,宜用选择题进行团体纸笔测验,而人数少,时间充裕,又有某些实验仪器和设备时,则可用操作测验。
廖世承、陈鹤琴先生几十年前曾经提出以下几条选择测验形式的原则:使被试者容易明了测验做法;在做测验时不会弄错;做法简明、省时;计分省时省力;经济。
三) 编写和修订项目制订项目的过程包括写出、编辑、预试和修改等一系列过程。
在获得一个令人满意的项目之前,这些步骤是不断重复的。
在这个过程中,编制者和有关方面专家要对项目反复审查修订,改正意义不明确的词语,取销一些重复的和不合用的项目。
然后将初步选定的项目汇集起来组成一个豫备测验。
编写项目要注意以下几个问题:①项目的范围要与测验计划相一致;②项目的数量要比最后所需的数目多一倍至几倍,以备筛选和编制复本;③项目的难度必须符合测验目的的需要;④项目的说明必须清晰。
四、项目的试测和分析初步筛选出的项目虽然在内容和形式上符合要求,但是否具有适当的难度与鉴别作用,必须通过实践来检验,也就是要通过预测进行项目分析,为进一步筛选项目提供客观依据。
一) 试测项目性能之优劣,不能仅凭测验编制者主观臆测来决定,必须将初步筛选出的项目组合成一种或者几种豫备测验,经过实际的试测而获得客观性资料。
预测应注意以下几个问题。
①预测对象应取自将来正式测验准备应用的群体。
例如,对于一个成就测验来说,进行预测的学生必须和以后的测验对象属于同一个年级,并且具有相同的课程背景,取样时应注意其代表性,人数不必太多,亦不可过少。
②预测的实施过程与情境应力求与将来正式测试时的情况相近似。
③预测的时限可稍宽一些,最好使每一个被试都能将项目做完,以搜集较充分的反应资料,使统计分析的结果更为可靠。
④在预测过程中,应随时记录被试的反应情形,如在不同时限内普通被试所完成的题数、题意不清之处及其他有关问题。
预测的目的在于获得被试对项目如何反应的资料,它既能提供哪些项目意义不清、容易引起误解等质量方面的信息,又能提供关于项目好坏的数量指标,而且通过预测还可以发现一些原来想不到的情况,如检验时限多长合适,在施测过程中还有哪些条件需要进一步控制等。
二) 项目分析对项目的分析包括质的分析和量的分析两个方面。
前者是从内容取样的适当性、题目的思想性以及表达是否清晰等方面加以分析,后者是对预测结果进行统计分析,确定项目的难度、区分度、备选答案的适宜性等。
编制一套测验,只依据一次预测的结果所作的项目分析是不够的。
由于预测的被试样本可能会有取样误差,故由此得到的项目分析结果未必彻底可靠。
为了检验所选出的项目的性能是否真正符合要求,有时需选取来自同一总体的另一样本再测一次,并根据结果进行第二次项目分析,看两次分析结果是否一致。
如果某个项目的测试结果先后相差较大,说明该项目的性能值得怀疑。
这种在两个独立样本中进行项目分析的过程叫做复核。
五、合成测验经过试测和项目分析,对各个项目的性能已有可靠的资料作为评价的根据,下一步就可以选出性能优良的项目,加以适当的编排,组合成测验。
一) 项目的选择在选择项目时,非但要考虑项目分析所提供的资料,还要考虑测验的目的、性质与功能。
最好的项目,就是只测定所需要的特征,并能对该特征加以有效区分的难度合适的项目。
普通说来,项目的区分度越高越好,这是选择项目的一条重要标准。
特殊是对于选拔测验,此标准尤其重要。
选择项目的另一个指标是难度。
难度多大为合适并无一个绝对标准,而要根据测验目的来确定。
有的要求难一些,有的则要求容易一些,有的可不考虑难度。
就是同一张试卷,题目难度也可以不同,只要整个测验的难度分布符合要求即可。
根据项目分析资料选出的项目,还要与测验计划再次对照,看看材料内容以及所测量的行为目标是否与计划相符,必要时加以适当调整。
此外项目的数量还必须适合于所限定的时间。
二) 项目的编排项目选出之后,必须根据测验的目的与性质,并考虑被试作答时的心理反应,加以合理安排。
在测验开头应该有一两个十分容易的项目,以使被试熟悉作答程序,解除紧张情绪,建立信心,进入测验情境。
对项目的总的编排原则是由易到难,这样可以避免被试在难题上担搁时间太多,而影响对后面问题的解答。
在测验最后可有少数难度较大的项目,以测出被试的最高水平。
下面是两种常见的罗列方式。
并列直进式此种方式是将整个测验按项目内容或者形式分为若干分测验,属同一分测验的项目,则依其难度由易到难罗列。
混合螺旋式此种方式是先将各类项目依难度分成若干不同的层次,再将不同性质的项目予以组合,作交叉式的罗列,其难度则渐次上升。
此种罗列的优点是,被试对各类项目循序作答,从而维持作答的兴趣。
三)编造复本为增加实际的效用,一种测验有时需要有两个以上的等值型,称做复本,复本越多,使用起来愈便利。
例如,我们要用测验来考察一班学生在一学期中的进步,必须测量两次,一次在开学初,一次在学期末,两次结果的差别代表一学期中成绩的提高。
如果测验惟独一份,用两次就难免有练习的影响,两次测验结果的差异不能彻底代表进步的大小。
要是这个测验有几个复本替换使用,就可以免掉这种艰难。
测验的各份复本必须等值,所谓等值需符合下列几个条件:①各份测验测量的是同一种心理特质;②各份测验包含相同的内容范围,但题目不应有重复;③各份测验题型相同,题目数量相等,并且有大体相同的难度分布。
只要有足够数量的题目,编造复本的手续是很简单的。
先将所有合用的题目按难度罗列,其次序为、、、、、……如果要分成两个等值的测验本,可采用下面的分法:本:、、、、、、、、、……本:、、、、、、、、、……如果要分成三个等值的测验本,可采用下面的分法:A本:、、、、、、、……B本:、、、、、、、……C本:、、、、、、、……采用上面的分法可使复本之间在难度上基本相等,从而获得大体相同的分数分布。
复本编好后,应该再试测一次,以判定各本究竟是否等值。
六、测验使用的标准化一套好的题目并不一定是一个好的测验。
对于测验的基本要求是准确、可靠。
为了减少误差,就要控制无关因素对测验目的的影响。
这个控制的过程,称做标准化,包括测验编制的标准化和测验使用的标准化两方面。
制作过程的标准化可保证量具本身符合要求,而使用过程的标准化可保证操作规范,使用得当。
测验使用的标准化又可分为施测过程标准化、评分计分标准化、分数解释标准化三个环节。
(一)施测过程尽管对于所有的被试使用了相同的题目,如果在施测时各行其是,所得的分数便不能进行比较。
为了使测验条件相同,必须有统一的指导语和时间限制。
指导语给被试的指导语属于测验刺激的一部份,它的内容通常包括对测验目的的说明和被试应该如何反应的指示包括如何选择反应、记录反应以及时限等。
对于纸笔测验来说,这些指示普通印在测验的开始部份,也可以印在此外一张纸上。
要求简单明确,不引起误解。
如果题目形式对被试是生疏的,还应该有一些例题。
指导语会直接影响被试的反应态度与方法。
有人以不同的指导语对几组被试实施同一个能力测验,结果表明,将该测验说成“智力测验”的一组,成绩较高;将该测验说成“日常测验”的一组,成绩较低。