小学数学评价方式的策略与技巧
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
小学数学评价方式的策略与技巧
一、专题简介
评价的基本方法是教育评价的核心内容。
其中,纸笔测验、表现评价、成长档案是中小学教师最常用的评价方式。
本专题围绕纸笔测验、表现评价、成长档案这三种评价方式,理论结合教学实际,系统、深入地介绍了各评价方式的本质(特点)、优缺点、具体应用等内容。
通过学习本专题,可以更加科学、规范地使用三种评价方式,从而为教育教学服务。
二、学习目标
1、在把握纸笔测验优缺点的基础上,掌握编制纸笔测验的基本程序,并编制一个高质量的纸笔测验。
2、正确认识表现性评价的本质,能够根据实际情况,科学地使用对话、面试、情境测试等表现性评价方式。
3、从基本概念上了解档案袋评价的本质及优缺点,在日常教育教学实践中正确使用档案袋评价。
评价方式
评价的基本方法是教育评价中最核心的内容。
教育评价的方法有多种,对中小学教师来说,最常用的教学评价有三种:纸笔测验(书面考试)、表现评价(面试,答辩)、成长档案。
评价方式之一:纸笔测验
一、纸笔测验的优点和局限性
纸笔测验,又称为书面考试。
指把测试题做成试卷印在纸上,学
生根据考试题,在试卷上用笔作书面回答的测量方式。
用纸笔测验需满足的条件是:
1、该测量的项目问题(试题)可以用文字、图表、符号等方式在试卷上印刷呈现,并加以说明。
2、该测量的实施可以让被试(学生)用笔在纸上作答,并且对这种答案是可以做出判断的。
(一)纸笔测验的优点
由于上述基本特征,纸笔测验具有规模大、效能高、稳定性好、机会均等、可复查、可比较等优点。
1、规模大指一次测量的规模可以无限放大,只需在考卷、考场、阅卷等环节安排好,从理论上讲这种测量可以做到不受规模大小的影响。
大到全国范围内组织同一时间同一试卷的高考。
这是任何其他测量方法无法替代的。
因此纸笔测验效能最高,投入成本只包括试卷编制、印刷、监考、阅卷等环节,是低投入高产出的评价工具。
2、稳定性好、机会均等是指纸笔测验由于试卷的定制性,呈现在每位学生面前的项目问题(试题)都是一样的,表现的机会在形式上人人均等,把人为因素产生测量误差的可能性降到了最低。
3、可复查、可比较则是指纸笔测验的文档一旦做出就不会变化,可以长期保留备查。
由于所有被试的项目问题都是一样的,而答案则取决于每位学生的不同水平,所以可以通过对每位学生不同各自答案的分析,比较出不同学生水平的高低。
(二)纸笔测验的局限性
纸笔测验的最大问题有二:
1、容量有限。
2、项目问题(试题)的局限性。
由于纸笔测验需要被试在规定时间完成规定的任务,所以容量受到时间的限制。
大多数纸笔测验的时间在1至2个小时左右,项目问题只能控制在50个以内,这给测量内容的覆盖程度上带来了一定的局限性。
同时,纸笔测验的项目问题和答案都只能用文字、图表、符号等形式来表述,看不到被试的实践操作,所以能检测到内容也是有局限性的。
测量作为教育评价中搜集数量化信息的手段,可分成直接测量与间接测量两种。
1、直接测量指可以直接用点数或工具测得数据的方法进行的测量。
比如:学生人数、男女生比例、班级学生的视力状况、身高分布曲线等等。
2、间接测量指对相对比较宏观或抽象的对象,用工具无法直接测得结果,只能通过学生对某种“投射”刺激的反应表现来间接推测学生水平的测量。
从测量的直接性与间接性来讲,纸笔测验内容的多少直接决定了项目问题能否做到对测验内容的全覆盖。
假如能做到全覆盖的,就是直接测量;假如不能做到全覆盖的,就是间接测量。
学校最常用的单元小测验,教学目标有限,大多在20个以内。
每个目标都可用一个或几个试题覆盖,因此可以看作是对单元学习结果的全部检查与测量,看作一种直接测量。
而期中、期末、学年、学段考试,由于时间积累,课堂的直接教学目标可能会累积到几十甚到几百个。
这在一次测验中是无法做到全覆盖的,需要对每一个教学目标进行抽样或抽象,抽样或抽象的方法也是不同的。
对有较强逻辑结构知识体系的学科来说,如数学、物理、化学等,可通过对课堂具体教学目标的逐级抽象,用少量的上位目标覆盖大量的下位目标,在一个学期结束的时候,整个学期的教学目标控制在一次测验一张试卷范围内。
这种测验可以被认为是对某学科学期、学年、学段学习结果的直接测量。
假如学科的知识结构比较松散,不能逐级抽象,那只能用抽样的办法选择部分教学目标测量。
这种由抽样决定的学科测验结果,只能是间接测量,其结果的解释性会有一定的局限,要防止以偏概全。
抽样误差主要反映在样本对学科某学期、某学段学习内容的代表性程度上。
所以,对纸笔测验来说,有一个问题很重要,从测验目标的拟定到试题对学科测验目标的对应程度,是衡量测验编制水平高低的最关键因素。
从理论上讲,测量目标抽离的个数越小,就越能够用试题做到全覆盖,测验目标对教学目标的覆盖性越好,测验结果对学科学习水平的解释性就越强。
反之,测验目标不能有效覆盖全体教学目标,则该测验结果对学科学习水平的解释性就相对较弱。
二、针对纸笔测验局限性的解决策略
纸笔测验的质量高低还取决于项目问题(试题)与目标的对应水平。
具体单一的课堂教学目标,如:字词、语法、概念、定义、定理、公式、知识点等,很容易用选择、是非、填充、配对等题型与之对应。
有了这种对应,很容易从学生的答题情况判断其相应学习内容的学习水平。
大多数教学目标到了学期、学段的时候都变得抽象综合,比如说,我们能不能在政治课上解释某一种社会现象,我们能不能在历史课上解释某一个历史事件的历史价值,我们能不能解释元素周期表在化学中怎么运用其解释化学现象等等。
这种抽象综合的教学目标,纸笔测验很难用客观性试题与之对应,只能用论述、解答等方式的主观性试题,既增加了试题与目标的对应难度,又造成复杂问题阅卷的精准性。
这是纸笔测验最难回避的两难问题。
所以,纸笔测验从形式上决定了它的优点与局限性。
如何放大它的优点,克服它的局限性,需要我们在实践中多探索研究。
(一)组合式测验
发展的趋势是用组合式纸笔测验替代综合式纸笔测验,就是把一次测验按时间分成几次小测验的组合。
每次小测验只测一种学习结果,然后把几次测验的结果综合在一起呈现、分析和判断,可以克服一次性纸笔测验带来的两难问题。
组合式纸笔测验代替综合式测验的最常用方法就是两分法,既要兼顾测验试卷对学过知识内容的覆盖性,又要检查学生对这部分学习的深度,把一次测验分成两个分测验。
比如,对一个小时的测验来说,做两张卷子,第一张卷子半小时,第二张卷子半小时。
第一个分测验全部用选择题增加题量,半小时全部做选择题,假如说一分钟做一个的话,那就是30个选择题,30个选择题涵盖量就比较大,读一个选一个,半小时内,做题速度快的学生可以做到40至45个题。
提高测验对教学目标的覆盖程度,用在规定时间完成试题的数量检查学生对学科知识的掌握程度,称为速度测验。
主要考察学生的熟练程度。
第二个分测验用1至2个综合性难题,让学生有足够的时间思考解答,检查学生对学科知识的理解深度,称为难度测验。
把一个测验分解为一半速度考试,检查学生对知识面的掌握情况,另外一半难度考试,检查学生对知识掌握深度的掌握情况。
这种两试法,不仅可以缓解纸笔测验的两难问题,还可增加测验的分析程度。
常用的组合式纸笔测验代替综合式测验,以增强测验的诊断性模式有:
理科——速度测验(知识面测验)+难度测验(能力测验)
英语——词汇+阅读理解+口试+听力(纸笔测验在试题显示和回答方式上的拓展)
语文——语言学基础知识+阅读+写作
(二)增加被试的背景调查
纸笔测验还有一个发展趋势就是在试题前面增加一段被试的背
景情况调查。
如:性别、父母职业情况、家庭学习条件、藏书多少、对就读学校的喜欢度、师生关系、在同类学生中百分位、每天用于作业的时间、睡眼时间、课外阅读情况等等。
三、纸笔测验的基本编制程序
纸笔测验的基本编制程序是:
1、测验蓝图设计。
根据测验容量和要求设计测验蓝图。
2、命题。
根据测验蓝图选题。
3、组卷,确定评分标准。
4、实测。
5、阅卷。
6、考后分析。
测验蓝图是一张双向细目表,从能力与内容两方面进行设计。
一般测验蓝图的设计单位是得分点。
所以,拿到一张双向细目表后,现在最右下角把测验的总分填好。
比如,下面这个期末考试的测验蓝图。
这个测验是100分,总共六个单元,根据不同山内容的权重分配,然后根据不同水平的权重分配。
大多采用布鲁姆的教育目标分类学的六个水平,识记、理解、应用、分析、评价、创新,前三种叫做基础性学习水平,或者叫做常规性学习水平:分析,一般叫做中等难度的学习水平;综合、评价就是比较难的学习水平。
老师当中有一个俗称,组织考卷就是721,即70%的基础题,20%的中等难度题,10%的难度题,这也不是固定的,可以根据要求设计。
如下这个卷子,基础题定在65%,中等难度的风险题定
在20%,难题定在15%,这样的比例比721更难一些。
综合分配好以后,就可以把题目放进去,总共有五大类型的题目,一代表判断题,二代表选择题,三代表问答题,四代表计算题,五代表综合题。
注:表中一代表判断题,10题20分。
二代表选择题,10题20分。
三代表问答题,5题25分。
四代表计算题,2题20分。
五代表综合题,15分。
有这张测验蓝图以后,有两个好处:第一,老师知道每个单元的题目要不要出,要出的话出几个,出什么题型。
第二,有助于教导处审查一张卷子在内容丰富上的合理性。
看看卷子在每个单元的丰富上是否和教学实施相对应,能力的分布上是否合理,然后判定卷子是否可行。
所以,测验蓝图是帮教师编好一次纸笔考试的重要工具。
四、小结
纸笔测验作为最古老的评价工具之一已经存在几百年。
从最早的科举考试到现代的标准化测验,尽管在形式、试题、阅卷方式等方面都发生了很大的变化,但其基本性质没变,仍然是中小学使用最广泛的评价工具,也是教师教学能力的重要方面。
作为教师的一项基本功,教师一定要完成三件事:第一,从基本概念上了解什么是纸笔测验。
第二,要知道怎样判断一个纸笔测验的好或不好。
第三,如何编出一个好的纸笔测验。
用纸笔测验,使其更好地为教师教学服务。
思考题:
1、说出纸笔测验的优缺点。
2、纸笔测验还可以有哪些改进,使其功能更大。
作业:
设计一个你所教学科期末考试的测验蓝图和考题前的背景调查问卷,并说明这样设计的意图。
评价方式之二:表现评价
一、表现评价的本质及特征
表现评价是指评价者与评价对象在同一场合,由评价者提出任务,评价对象根据评价者布置的任务做出反映,评价者根据评价对象完成任务的表现,对评价对象某些方面做出评价。
最常用的范式是面试。
用表现评价需满足的条件是:
1、评价者与评价对象同在现场,或者评价者有评价对象的录像资料、轶事记录、作品等表现性资料。
2、评价对象完成的任务或提供的材料确实能反映评价内容。
这跟纸笔测验不一样,纸笔测验给出一个题目,答案一定是根据题目而来的,但表现评价给的一个任务,学生在完成这个任务时是不是一定就根据任务而来呢?这是我们需要考察的内容。
因为上述这些表现评价的这些特征跟纸笔测验是不一样的。
基于上述基本特征,表现评价具有直观性强、能完成诸如解决实际问题的能力、处理人际关系、组织指挥协调等纸笔测验无法测到的评价任务。
1、直观性强是表现评价的最大优势。
它通过评价者与评价对象的面对面,直接得到评价者想知道的有关信息,因此其可靠度、评价的深入程度是其他评价方法不能比拟的。
但这种评价的成本高,对考官要求也高,基本上是考官的主观判断。
为保证评价的准确性,往往采用多对一的方式,是一种高成本的评价方法。
2、实施表现评价最难的是可重复、可比较性做不好。
尽管采用所有的被试提前集中候场的办法可以做到每位学生的试题都相同,表现机会人人均等,具有一定的可比性。
但考官对被试的个人喜恶倾向、有意注意的持久性、判断能力的稳定性等等都是影响评价结果客观公正性的重要因素。
现在很多参加大学自主招生的学生都有这种体验。
所以这类评价大多用在经纸笔测验初试后,为了对出线对象作进一步深入考察而进行的复试阶段,或者竞赛、选拔等场合。
表现评价的组织实施方式:
表现评价(面试)的组织实施方式可以有多种。
按评价者与评价对象分有:一对一,多对一,多对多。
按表现种类分有:面试、对话、情景测试。
还有不设现场,基于录像资料、轶事记录、被试作品等写实性材料的分析表现评价等等。
由于表现评价涉及到的人力资源远比纸笔测验多,所以在中小学的使用程度比纸笔测验要少得多。
便由于其直观性,且能测到纸笔测验所测不到的许多特性,所以正在被越来越多的中小学教师所关注。
比如:模拟联合国、头脑奥林匹克、CI竞赛、创意大奖赛、演讲比赛等中小学校际或国际间的竞赛,用的都是表现性评价的方法。
这类比赛在中小学比较普遍,需要知道它们的共同特征,这类比赛的共同特征就是通过对学生完成某项规定任务的现场表现,来评出优胜。
因此组织者往往会提前公布任务,但是所有题目没有标准答案,只有更好的答案,所以最终获胜不完全取决于竞赛者自己的水平,还取决于对手的强弱。
除了任务完成的质与量,还要看参赛者的现场表现、团队精神、合作协调等方面。
面试是中小学最常用的表现评价,在教师招聘、学生选拔中经常被采用。
面试有一个基本程序。
面试需事先准备好试题。
可以是同一批对象只用一个试题,以增加不同对象之间的可比性。
用这种方式面试,为了防止先后被试之间泄题,可以采用全体集中候场,抽签决定
面试顺序,面试完毕从另一方向离场,杜绝先后被试相遇的机会,但人力资源比较大。
也可以采用一组试题,由评价对象抽签决定回答哪一个。
由于抽签的随机性,被试可以不要集中候场。
所有题目的难易程度都是差不多的,有的题目简单,有的题目难,这也是不行的。
这就是我们今天讲的部分内容,什么是表现性评价,表现性评价有哪些特征,有哪些优缺点,如何防止它的这些缺点,发扬它的优点。
二、表现评价的应用
怎么把面试做得客观、公正。
(一)多对一面试
面试可以由一位考官主持,也可以由多位考官集体主持,每人单独自主打分,由工作人员对考官的分数按事先约定的方式处理后,交考官集体讨论或投票决定评价结论,以增加客观公正性。
现在学校估面试的时候,往往因为程序做得不规范、不准确,或者讲,没有确定性,所以人为因素影响比较大,大家对面试的准确性、客观公正性、公正公平性往往信任度比较低。
面试的质量很大程度上取决于对这场考试的程序的规定性和每一个操作要点的规定性。
如果是多位考官的面试,打分很重要,相互之间是不能通气的,而且独立打完分之后,可以把分秘密地交给工作人员,工作人员可以匿名对所有考官的分数进行处理,处理后跟考官见面,进行讨论,如果处理不合适可以进行调整,但要有充分的理由。
(二)多对多面试
除了这种多对一的之外,还有多对多的面试,特别是在企业中,
特别流行。
多对多的面试称为小组活动式面试。
由多位被试组成一个面试小组,按试题规定的任务或话题开展活动。
比如八个人或六个人一个小组,给出一个共同任务,比如讨论这礼拜六领导给了一个加班任务,我们要不要来加班,有几个游戏规则:第一,每个人必须对这件事发表态度及理由,等到每个人讲完自己的理由之后,你对人家的理由提出赞成或者反对的意见,最后整个团队要做出一个结果,有这么几个要点之后,这个小组就可以独立活动了。
考官在边上围成一圈进行观察,独立打分,按照打分的方式汇总对每一个被试的能力表现。
这种面试的最大好处除了能观察每位被试观点的独特性、深刻性和创新性之外,还能看到这个人在群体中的协同工作能力,处理人际关系的能力。
人际关系的处理能力,以及对工作中事情揭示、反映的敏捷性、深刻性、创新性,都是对每一个人工作能力考核的重要内容。
平常要加强对学生的这种训练。
(三)对话
对话是什么?对话是指考官和被试一对一,用谈话的方式就某个话题开展交谈。
由于此场合没有考官与被试的身份,容易让被试放松心情自由发挥,表现出最高水平。
目前在职场的高级人才招聘中,常用这种方法。
中小学招聘高端教师、资深校长也可采用这种方法。
比如讨论处理好教师积极性和给予老师合理劳动报酬这么一对关系,大家一起讨论,也可以由几位考官与一群被试围坐在一起,用座谈会对话的方式就某个话题开展讨论与交流。
这种方式同样让被试放松,容易发挥出水平。
考官则根据每人的表现打分。
所以,对话可以是一对
一,也可以是多对一,也可以多对多。
它与面试最大的不同是,它没有固定的考题,能更大程度地检查个人能力。
(四)情景测试
情景测试则是利用专门布置的情景,让被试置身其中,考官通过隐蔽手段观察其表现,做出评价。
心理学中有一个投射技术,利用联想(要求被试在刺激呈现之际以最先想到的东西做出反应)、解释(要求被试依照指导语解释某事物)、完成(续完故事、补充讨论)、选择、排列、表达(想象画、即兴表演)等手段,让被试在不知不觉中把自己的动机、需要、生活方式等内隐的人格特征表现出来,从而做出评价。
投射技术是情景测试中的核心技术,情景测验中的情景创设很重要,既要让被试在此情境中有表现才能的机会,又不能有暗示、变相压力、厚此薄彼等因素。
较好的办法是事前先设计好情景问题。
比如评价教师的情景问题可设置为:对一位单亲家庭的学业不良学生进行家访,你准备怎样说服家长有效帮助自己孩子的学业。
评价学生的情景问题可设置为:春节拿到一笔压岁钱,你准备去买每一台向往已久的游戏机,老师要求利用理财课学到的知识对压岁钱进行理财实践,怎么办?也就是说创造一些教师和学生常见的情景,观察教师及学生的反应。
由于表现评价要从学生的表现中即时做出判断,所以评价的判据是考官能否做出正确评价的关键,需事先认真准备。
(五)表现评价的判据
表现评价的判据主要有两种:一种是绝对判据,即考前官们先根据试题拟出被试必须要有的表现作为评分点。
考试时被试有这方面的表现就给分,没有就不给分。
另一种是相对判据,即考官们对一群被试表现的优劣排出先后位置顺序,再给不同位置的被试赋予不同的分值。
大多数情况需要把这两种判据综合起来使用。
如:免费师范生的面试。
试题有:
1、2分钟自我介绍。
2、8分钟模拟讲课(包括讲授、板书、答、评价等环节)
3、5分钟答辩。
4、暗设一个情景问题(如礼仪、面试结束能否主动把黑板擦干净、能否主动捡起地上废纸等等。
考官需依据试题先设计好评分点,如:自我介绍中需有对当教师的看法;模拟讲课中需有表情、肢体语言的得分;答辩中需考察反应的敏捷性与针对性;情景问题中哪些方面要记分等等。
免费师范生面试评分表
表现评价的表现还有一层意思就是评教师或学生的某方面表现,如教师的工人表现、师生关系方面的表现等。
学生各门学科的学业表现、遵守纪律、团结友爱、乐于助人方面的表现等等。
这类表现评价往往从两方面获取评价信息:
1、档案袋或专门的轶事记录、大事记。
2、开展自评、互评、他评,从不同角度聚焦出评价结果。
由于评价涉及的工作量大,参与人数多,所以这类评价只能做到一定精准度。
导向的作用更大,判定的功能有限。
表现评价从最早的殿试到今天也已经有几百年的历史了。
从最早的相面到今天的各种模拟活动在形式、任务、评分等环节都发生了很大的变化,但其对评价对象深入直接了解的基本特性没变,仍然是可以作为中小学常用的评价工具之一,更是校长评价教师的重要方法。
广大校长与教师一定要从基本概念上了解表现评价的本质是什么?怎样才能做好表现评价,使其更好地为学校教育服务。
思考题:
1、学校有哪些方面可以使用表现评价?
2、表现评价的操作要点是什么?
作业:设计一个学生演讲比赛的评价方案,并说明使用方法。
评价方式之三:成长档案
一、档案袋评价的优缺点及起源
成长档案又称档案袋评价,是指对评价对象在一个周期或一段时间内的表现、成就做出的全面的记实性评价。
它的特征是对评价对象。