教育学 教育测验与评价
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十二章教育测验与评价
【学习目的与要求】
通过本章的学习,要掌握教育测验与教育评价两个概念的含义,了解良好测验的标准是什么,编制测验的方法与要求,懂得如何进行教育评价。
第一节中小学教育测验
一、教育测验的概念
(一)概念界说
1.测量
严格地讲,测量是给事物的某种属性给定数值的过程,回答了“有多少”的问题。
2.测验
测验是对于知识水平、情意状态、运动技能等的数量化测定,有广义和狭义之分。狭义的测验仅指一份测验卷子,而广义的测验指编制试题、施测、评分到报告成绩的全过程。 3.考试
规范的考试是教师在教学过程中编制试题、评定学生学业成绩的过程。它与测验的区别有两种看法。第一种是从教育测量学中引出,认为测验更为规范,从试题编制、实施测验到评分过程都有严格的程序。另一种观点与第一种正好相反,认为测验比较随意。
4.评价
评价是对某种教育活动的价值判断。评价包含定性描述或价值判断,更多的时候是两者兼而有之。测量结果能够给评价提供依据,但评价还可以借助其他非测量工具。
(二)测验的功能
1.激励功能
测验能够推动教师努力工作,也能激发学生的学习热情。测验可以使教学目标更明确,令教和学更有针对性。测验还使学生提前接受着挑战,有利于他们适应毕业后的竞争环境。
2.诊断功能
诊断性测验主要考察两个方面,一个是看基础打得好不好,另一个是看理解和掌握上有什么错误及其原因所在,它为教学提供了丰富的反馈信息,使教师能及时调整教学。
3.区分和选拔功能
测验能够把学生的学业成绩分成多个等级,为选拔提供了依据,使选拔更为公平可靠。
4.评定功能
二、测验的类型
依划分标准的不同,测验可以分成不同的类型。从测验目的上考虑,可以分成安置性测验、形成性测验、诊断性测验和总结性测验。从测验内容上考虑,可以分成成就测验和学能
测验。从规范程度上区分,司以分成标准化测验和教师自编测验。从结果解释所参照的标准区分,又可以分成常模参照性测验和标准参照性测验。
三、良好测验的标准
(一)实用性
实用性反映了试题的基本质量,其基本要求是便于组织,便于实施,节时省力。
(1)便于组织。题意及答题要求清晰,文字浅显,题型不复杂。
(2)测验便于实施。试题由浅入深,分量合理,便于填答,测验时间适当。
(3)容易评分。评分标准合理,易于掌握。
(4)结果要容易解释。评出来以后,要容易解释。
(二)可信度
可信度又称信度,指测验结果的前后一致程度,表示了分数的稳定性和可靠性。具体要求是,先后两次用同样的试卷测查同一批学生,则两次测验的分数应该比较相近;对同样的答卷组织两次评分,评分结果相近。如果上述评分结果相差悬殊,就表示试卷可信度很低。信度低的测验是没有用的。
(三)有效性
有效性在测量学上也称为测验的效度,指一个测验能测到预先想测的知识和能力的程度。效度是针对测验目的而言的,测验结果只有和测验目标相比较才能了解其针对性和有效性。估计测验效度的方法主要有两种:(1)内容效度,反映了题目对所考察内容的代表性问题;(2)效标关联效度,反映了测验分数和所选择的效标分数之间的一致程度。
(四)难度
难度即测验的难易程度,提供了试题平均通过率的信息。
(五)区分度
区分度是测验能否拉开分数距离的指标。试题的区分度也称为鉴别力,表示某道题目能够将不同程度的学生鉴别开来的能力。中等难度的试题的区分度比较高,难度为0.5的题目,区分度最大。
四、测验的编制和实施
(一)确定试题内容
在选择试题内容时,应设计测验蓝图。测验蓝图包括确定测验目的、测验内容以及编制双向细目表等内容。
(1)确定知识点。教学内容总可以分析为一个个独立的知识点。
(2)确定认知水平。
(3)设计双向细目表。双向细目表是由教学内容和教学目标构成的。
(二)选择试题类型
课堂测验的题型有客观题和论文题两种。客观题包括填空、判断正误和多项选择等题型。客观题要求学生从已知的选项中挑选答案,其特点是题目多,但学生没有做答自由,更无法
用自己的语言答出自己的风格。在阅卷方面,客观题有很大优势,评阅时,速度快,准确率也很高。论文题是向学生提出问题或叙述句,要求学生用自己的语言做答。论文题包括论述题和简答题。论述题允许考生自由做答,对答题篇幅没有限制。客观题的局限是不能反映学生选择素材、组织内容和统整观点的能力。论文题的弱点是题目覆盖面小,评分也难以客观,同一份试卷,由不同的老师评分,给分差异较大,甚至同一个老师在不同时间评分,给分也会不同。因为客观题和论文题各具优缺点,所以搭配使用效果最佳。
(三)评分。计分方法可分为等级分和百分制两类。
(四)测验分数的解释。解释分数时,既可以和其他同学的学习表现相比较,也可以和考核标准相对照。在常模参考性测验中,考生的成绩要和群体中其他成员相比较,而在标准参照性测验中,考生的成绩要和预先规定的标准相比较。无论是和其他考生比较,还是和规定的标准比较,分数的意义是在比较中获得的。
第二节中小学教育评价
一、中小学教育评价概述
最早的有组织的教育评价可以回溯到中国的科举考试。西方直到l9世纪末期才开始实行正规的教育评价活动,早期评价研究主要集中在美国。20世纪初,教育评价和教育测验发展很快,此期最有影响力的桑代克被称为现代教育测验之父。到了20世纪30年代,这一时期研究成为教育评价的里程碑。这一时期研究对一系列学校教育成果进行了评定,并使人们认识到,为了使评价能够达到预期目标,关键要明确每种教育活动的目标。20世纪50年代,布鲁姆建立了教育目标分类学。直到现在,布鲁姆的教育目标分类学仍然是测验的重要指标体系。
目前教育评价的概念有广义和狭义两种。广义的教育评价包括对于教育活动一切方面的评价,狭义的教育评价主要是对学生发展的评价,又称为学生评定。广义的评价较为笼统,狭义的评价关注教育效果而不看过程。
二、中小学教育评价的类型
从评价的严格程度上考虑,可以分成正式评价和非正式评价。从解释评价结果的标准上考虑,可以分成相对评价和绝对评价。从评价的功能上区分,可以分成形成性评价和总结性评价。
(一)相对评价和绝对评价
对应于常模参照性测验和标准参照性测验,评价可分为相对评价和绝对评价。相对评价是在群体中进行对比,这时衡量标准是相对的。绝对评价要和预定的标准相比较,只要达到了标准,就称为合格。
(二)形成性评价和总结评价
对应于形成性测验和总结性测验,评价可分为形成性评价和总结性评价。形成性评价是指在活动过程中,以改进工作为目的而开展的评价。总结性评价是对活动结果的评价,它的