教育测验的标准及其建立方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 为求客观,可利用学生测验的原始分数和测验 总分数之间的关系,计算学生个人的得分百分 数
二、掌握分数
• 掌握分数用于判断学生是否掌握所学的内 容,分数的标准是人为确定的,可以是百 分之评分量尺上的某一个点,也可以是 80%-90%的正确反应所Βιβλιοθήκη Baidu应的分数,作为 最低通过标准。 • 以掌握分数为判断标准,可将学生区分为 掌握和为掌握两类
四、我国高中考试毕业会考标准的 建立模式:浙江的模式
• 定性描述学科标准,形成学科考试大纲规范性文件 • 编制有良好内容效度的参照试卷,取样抽测,建立高中毕 业会考的标准份数量 • 将高中毕业会考的成绩确定为五个等级,与T分数的关系 如下表:
• 编制一份与参照试卷大体平行的学科会考试卷,准备用于 实际的高中毕业会考 • 在保密状态下,在省内或省外抽取一批高中生(其水平应 与浙江省高中生的总体水平相当),随机分成两组后,分 别用会考试卷和参照试卷进行测验,取得数据 • 利用百分等级的等值技术或线性标准分数的等值技术,在 会考试卷原始分数Y和参照试卷原始分数X之间建立等值 对应关系,从而在X-Y-T之间建立对应关系的转换表 • 把会考试卷正式用于高中会考,每个学生都得到自己的会 考原始分数Xi,通过X-Y-T分数转换表,得到每位高中生的 毕业会考学科量分表。根据表7-2,得到高中毕业会考的 等级分数。
第三节 标准参照测验的定性标准 ——测验内容领域规范
• 内容领域规范是标准参照测验最重要的一 环:
– 为试题编写人员准备试题时提供内容和技术上 的指导; – 向内容方面或测量方面的专家提供每种能力所 包括的内容和行为的清晰描述; – 帮助解释被试个体的能力水平; – 向用户提供能力广度和范围的明确规定
三、英国GCSE模式
• 英国中等教育普通证书(简称GCSE考试) 是面向校内外举办的英国国家证书制度, 其显著特点之一是有全国统一考试标准。 • 包含“总标准”和“学科具体标准” • 不同科目的测验编写结构大同小异。一般 包含:简介或引言、目标、评价目标、内 容或核心内容、评价目标和内容的关系、 评价技术、等级描述
一、汉布莱顿模式
• 内容领域规范的四个组成部分:
– 说明 – 实例指导与题目样本 – 内容范围 – 答案范围
二、美国IOE模式
• IOE (Instructional Objectives Exchange): 教学目标交流所。其所运用 的标准参照测验格式由以下五部分组成:
– 一般描述 – 样本题目 – 刺激的界定 – 反应的界定 – 其他补充说明
• 来自GCSE考试的启发
– 考试大纲应强调与鼓励学生理解本学科与其他学科、生活、 政治、经济、社会、环境等方面的联系 – 考试大纲必须包括对课程学习所期望达到的教育目标的描述 – 考试大纲必须包括足够的知识覆盖面,使考试能充分表现出 学生对某一知识和技能的掌握程度 – 考试大纲都应有一定的学科知识考查深度,而不应以牺牲技 能和理解力的考查为代价去追求学科知识内容的考查广度 – 考试大纲不仅应包括某一学科所要测试的内容范围,也要介 绍测试方法,提供样卷(题)以及一些必要的指导性材料
• 思考:领域参照测验、目标参照测验和掌 握测验有何异同?
– 若将“标准参照测验”视作“依据某种特定操 作标准可以直接解释测量结果的及测验”,上 述三种测验在本质上无多大差别。 – 领域参照测验可以看成标准参照测验的同义词, 目标参照测验和掌握参照测验是标准参照测验 的变式。
第二节 标准参照测验分数的解释
一、正确百分数
• 正确百分数是以学生在标准参照测验中答 对题目的比例来解释测验分数或描述学生 取得成就的方法。
使用百分数,应注意:
– 测验所要测定的内容(成就)范围必须明确,而且测 验题目能够组成成为这个内容(成就)范围的代表性 良好的样本 – 在标准参照测验中,可以针对整个测验为每一个学生 确定其答案的正确百分数,对学生的内容掌握作出判 断。 – 在课堂教学评价及其他有关资格证书的测验中,为了 对多层次的测验结果分别作出解释和描述,就需要分 别针对每一教育目标或内容板块去选择题目组,构成 总测验。
三、内容等级分数
• 为了更好地解释教育测验的分数,人们把 内容参照和常模参照结合起来。在编制测 验的过程中,不仅要明确内容范围、具体 任务,而且要把成就分成若干差别明显的 等级水平,标明不同等级水平的成就特征 与问题类型,建立起内容等级分数及其评 定量表。 • 内容等级分数体现了相对评价与绝对评价 的相结合
• 常模参照测验与标准测验的对比
二、几个与标准参照测验相关的概念
• 领域参照测验(或内容参照测验,domainreferenced test)是建立在一套完善的题目 汇编或内容领域规范汇编基础上用以检查 被试的素质及发展水平的测验 • 目标参照测验是由和目标相适应的一组题 目所构成的测验 • 掌握测验是建立一组教学和行为目标上的 测验,主要用于判断学生是否掌握某组给 定的教育目标
第一节 教育测验标准的含义
一、对标准参照测验及其标准的再认识
• 心理学家波帕姆认为标准参照测验是依据 实现明确规定的知识能力标准而制订,并 据此标准可以对被试的测验成绩做出解释 的一类测验。 • 标准测验主要关心的问题是要获得严格而 精确的领域规范(specifications for domains)或行为领域规范。 • 上述定义的缺陷:“切断点”(cut-off point)
– “掌握”与“未掌握”是人为确定的; – 从知识的掌握状态来讲,事实上更应该是一种 连续模型; – “掌握”、“及格”或“合格”的概念类似, 但有区别。 – 当利用测验的掌握分数给学生进行二分类时, 对于不同的年级、不同的课程内容、不同的测 验乃至同一测验中不同的分测验,人为规定的 掌握分数也未必相同。
• 标准的内涵
– 从定性方面讲,标准一词指的是测验的内容或 行为的范围,而这个范围是测验分数所参照的, 它将通过内容领域规范得到明确; – 从定量方面讲,每当人们利用标准参照测验成 绩进行有关评价决策时,客观上需要一个切断 点作为分类决策的依据。切断点在一定程度上 体现了标准一词在测量评价功能上的定量标准。