教育测量与评价基本原理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
根据测验目标来划分
能力倾向测验:介于成就测验和能力测验 之间,目的在于测量学生的潜在学习能力 及学术发展趋向。潜在能力是指个体从未 来教育或训练中可能受益的能力。
这类测验主要用于预测学生的未来成就和 能力,从而可以帮助决策者和学生自己选 择合适的学校、专业及最佳职业
根据测验目标来划分
• 能力倾向测验分为:
常模参照性测验多采用选择题,题目分散在全学科 的全部知识领域内,每一个学习结果的题数较少, 题目按从易到难的顺序排列;
标准参照性测验较少依赖选择题,题目分别分布在 一定目标中,考试包括的学习结果面窄,每一个 学习结果题数较多,题目按教学目标顺序排列即 可。
常模参照测验与标准参照测验的比较
4、从考试及考题的质量要求来看,它们都 按照标准化考试的编制原则,保证考试 有较高的信度和效度;
常模参照性测验题目要求难易适中,强调 题目的鉴别力,测验信度的估计适合用 统计方法;
标准参照性测验的题目和学习结果直接联 系,不强调题目的鉴别力,测验信度的 估计不适合用统计方法。
常模参照测验与标准参照测验的比较
5、从解释考试结果的依据及分数的意义 来看,两种考试各有其依据;
常模参照性测验的常模是解释分数的标准, 用地位量数表示考生在团体中的相对位 置;
终结性评价:指对教育活动的效果进 行的评价。如:期末考试
按评价参照的标准来划分
相对评价:根据评价对象的实际状况 设定评价标准的评价。评价标准在被 评对象群体内部产生。
绝对评价:依据某种需要或要求设定 评价标准的评价。评价标准在被评对 象群体外部产生,且标准固定。
个体内差异评价:以评价对象某一状 况作为设定评价标准依据的评价。可 以比较个体状况前后的变化
二wk.baidu.com教育测量的分类
根据测验目标来划分
成就测验:目标都在于测量学生在各学 习阶段学到了什么,旨在检测教育目 标希望学生能达到的具体行为。
如:学科测验 如:教学阶段测验(诊断和总结性测验)
根据测验目标来划分
能力测验:旨在测量个体的不因 外界环境的影响而轻易改变的、 较稳定的、表现在认知能力方面 的心理特质,比如观察力、记忆 力、理解力、概括力、空间能力、 判断推理能力等等。也被称为 “智力测验”。
第二章
教育测量与评价的基本原理
教育评价与测量的类型
一、教育评价的分类
根据评价对象的层次和内容来划分
宏观评价: 指对影响到全社会的那些指导、 规范教育活动的各种因素进行的评价。
微观评价:指对某项具体的教育活动过程, 对实施、管理教育活动的组织与个人.对教 育活动指向的具体对象等内容进行的评价。
标准参照性测验中教学目标是解释分数的 标准,以考生完成题目数量的百分比来 表示考生的学习效果。
根据教育测量的标准化程度来划分
标准化测验:指测验的编制、实施、记 分、分数的解释有统一标准和严格规定 的大规模的测验
标准化测验的程序:根据社会需要确定考试目 的;编制考试蓝图(命题双向细目表);命题、 组卷、试测、入库;实测;评分,统计分析; 写出指导书。
功能:区分性、顺序性 数量化结果的含义:比较大小,不能进行
运算。 适用的统计方法:中位数、百分位数、等
级相关系数、肯德尔和谐系数以及秩次的 方差分析。
按评价主体来划分
他人评价:由活动实施者以外的人 作为评价主体进行的评价。
自我评价:由活动实施者作为评价 主体进行的评价。
按评价方法来划分
定性评价:采用开放的形式来获取评价 信息、对评价结果的性质进行说明的评 价活动。
定量评价:采用结构式的方法,预先设 定操作化的评价内容,收集评价对象可 以量化的信息,得出数量化结果的评价 活动。
常模 常模团体
总体要明确 常模团体必须是被试总体的一个代表性样
本 样本的大小要适当 注意常模团体的更新 测验手册中必须详尽描述取样过程
常模参照测验与标准参照测验的比较
1、从考试的目的和用途来看,它们 都通过测量学生的学习成绩,考查 其优劣,但常模参照性测验将考生 成绩做横向比较,着眼于个别差异, 主要用于选拔性测验和总结性测验 等。
教师自编测验:教师根据教学情况自己 编制测题对学生进行的测验。
以测量人数多少来划分
团体测验 个人测验
根据所使用的材料和形式来划分
语言文字测验 非语言文字测验
二、教育测量与评价量表
心理学家史蒂文斯根据测量的精确 程度把量表从低级到高级分成名 称量表、顺序量表、等距量表和 比率量表。
名称量表
常模参照测验与标准参照测验的比较
2、从考核目标的陈述来看,都明确 具体,为编制测验提供依据,但常 模参照性测验可采用一般目标或具 体目标,而标准参照性测验必须采 取非常具体且详细的目标。
常模参照测验与标准参照测验的比较
3、 从题型的选择和题目的分配来看,都需采用各 种不同题型,试题必须是教学目标的有代表性的 样本;
意义:依照某种法则给事物及属性指派 名称或类别的量表。
功能:区分性。用于对事物或人的心理 现象进行分类。
数量化结果的含义:不具有数的意义, 不能比较大小。
适用的统计方法:次数的统计,如次数、 众数、百分比、离散相关、卡方检验等。
顺序量表
含义:依照某种法则给事物或人的心理现 象指派名称或类别,还可以将分类结果按 数量大小进行排序。
按评价内容的复合程度来划分
单项评价:指针对教育评价对象的 某一方面状况进行的评价。
综合评价:指对评价对象的状况的 方方面面作整体评价。
按评价的功能及用途来划分
诊断性评价:为使教育活动的形式、 内容、过程等更适合活动对象的自身 条件及需要而进行的评价。如:摸底 考试。
形成性评价:在教育活动过程中为不 断了解活动进行的状况以便能及时对 活动进行调整,进而提高活动质量进 行的评价。如:单元测验。
• 一般学习能力测验 • 特殊能力倾向测验
根据测验分数的解释标准来划分
常模参照测验:目的在于考查被试的 个体差异的测验,一般用于衡量被试 相对水平的,以选拔为目的的大规模 测验中 。
标准参照测验:目的在于考查被试是 否已达到某种标准的测验。一般用于 以教学目标为标准考查学生实际水平 的测验。
常模参照测验