语文教学评价的方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语文教学评价的方法
(主讲教师李华平)
《全日制义务教育语文课程标准》的“评价建议”对语文教学评价方法有这样的要求:“定性评价和定量评价相结合,更应重视定性评价。
学校和教师要对学生的语文学习档案资料和考试结果进行分析,客观地描述学生语文学习的进步和不足,并提出建议。
用最有代表性的事实来评价学生。
对学生的日常表现,应以鼓励、表扬等积极的评价为主,采用激励性的评语,尽量从正面加以引导。
”这里的“定性评价”和“定量评价”是评价方法的主要类别,定性评价又叫质性评价,就是用描述的方式去揭示对象的意义和价值;定量评价是用数量的方式去评价对象的意义和价值。
如何进行定性、定量评价是当前语文界迫切关注的问题。
我们认为,语文教学评价价值的多向、评价主体的多元、评价目标的多维决定了评价方法的多种,评价方法的多种对应了评价目标的多维。
长期以来,我们进行语文教学评价的方法仅靠纸笔测验这种单一的方法进行,大大地局限了对学生语文素质的评价。
在纸笔测验中为了便于甄别和选拔,我们又迷信定量方法的一种——标准化考试。
标准化考试对学生较高的认知和技能的评价能力非常有限,于是人们不断地探索着能进行定性评价的更好方法。
“如何最好地评价学生的理解能力是一个非常复杂的任务,它要求运用多种表现来进行评估”(Azwell & Schmar, 1995)。
根据阿则维尔(Azwell)的观点:“直到最近评价和评估体系才发生了一些变化,这反映了我们对学习连续体和各种教学策略的新的理解。
除了运用客观的测验测量学生的学习情况外,现在教师往往通过动态的、多元化的方法来收集学生学习的相关信息,这包括对学生学习过程、学习结果以及学生的自我评价等方面的观察等。
”1于是,一种新型的评价方法——语文档案袋评价法由西渐东在我国当前的一线教学中受到广大师生的一致推崇。
这样,我们认为要把“定性评价与定量评价结合起来,又以定性评价为主”这个评价方法的理念落实下来,可以通过主要的三种评价方法完成:情境性评价、语文档案袋和纸笔测验。
一、情境性评价
情境性评价是在学生语文学习日常活动和真实情境中进行的随机的质性评价。
情境性评价又叫真实性评价(authentic assessment),真实性评价暗含的意思是:评价是学习的一部分,是不断发展变化的,成功或失败只能用学生在新的环境中应用知识和技能的能力的具体事实说明。
2情境性评价既指课堂上作为教学环节的情境性评价又指课外语文综合实践课上对学生行为的情境性评价。
教学活动中教师的鼓励性评语,学生由衷的喜悦赞同或反驳的语言、作文批改中的旁批或总结性评语、课堂上的掌声、颁发小红花授予“阅读星”“小作家”荣誉等方法都是情境性评价。
情境性评价要坚持的原则:
1、情境性评价的原则
第一,即时性原则
课堂上的教学活动是一个流动过程,在教学活动中随机性、生成性、偶发性教学行为都为教师的点评提供了契机。
即时性原则就是要求对教学事件不能进行延时评价,要有实效性,要及时调控、指正、辩驳,达成协议并形成共识。
课堂上教师的点评属情境性评价,情境性评价为激励学生进行创新思维提供了机会,课堂上呈现的不同言论,尽管有的是错误的或是不全面的,但反映了学生真实的思维活动,教师进行即时性评价就能达到为他们拨开云雾、识别真伪、提高认知能力的目的。
一位老师执教《哀江南》一课时就运用了即时性评价原则。
在进行写作训练“借鉴创造”环节,该老师当堂在学生的对联中随机选了副“秦淮罢灯鬼悲灯静悲声换不回昔日舆图,
1[美] Kathleen Montgomery.《真实性评价》国家基础教育课程改革“促进教师发展与学生成长的评价研究”项目组译北京:中国轻工业出版社,2004,第88页。
2[美] Kathleen Montgomery.《真实性评价》国家基础教育课程改革“促进教师发展与学生成长的评价研究”项目组
废垒临风水冷风残冷秋免不了玉碎冰消”,他巧妙地进行了点评、修改,仅移动了词语位置,就创造出顶真带来的特殊效果——“秦淮罢灯灯静鬼悲悲声换不回昔日舆图,废垒临风风残水冷冷秋免不了玉碎冰消”赢得了学生和听课教师的满堂喝彩(该老师课后还反思到根据课文内容,这副对联的上下句该互换位置),从这个例子可以看出,教师的即时评价发挥了增值功能。
第二,针对性原则
课堂教学是有组织的语文学习,是在“提出问题——分析问题——寻找方法——解决问题”的问题情境中进行的。
因此教师进行情境性评价一定要有针对性。
要有针对性教师就一定要吃透教学目标,把握住一节课的教学目标与一篇课文教学目标的区别。
围绕目标通过有的放矢的针对性评价培养学生的发散思维能力和聚合思维能力。
教师在点评中既要关注学生回答问题本身又要关注学生的认知水平,充分发挥教师作为拥有知识量多、视野开阔、理解深刻的为师角色。
教师在进行情境性评价尤其是课堂点评时一定要针对目标一语中的,见解入木三分。
对学生的回答或肯定或补充或升华,都要“刺刀见红”,不能“王顾左右而言他”。
第三,激励性原则
评价具有导向功能,导向功能是指导教学评价对教学活动(或教学过程)中学生的思维、情感、认知有定向引导的作用。
我们常说教师要发挥引导作用,要体现“平等中的首席”,情境性评价就能展现一位教师的学识和情感。
课堂点评是在真实情境中进行的,激发学生的兴趣和探索精神才能让教学活动有动力,才能充分发挥学生的主动性和创造性。
对学生的探索精神要肯定,对他们在评价中的积极表现要多从正面表扬。
激励性原则要求我们在情境性评价中既要做到公正、全面,又要满腔热情,同时更要关注个体差异,关注学生的实际进步,比如说对基础较差的同学回答问题时只要有闪光的地方就要热情洋溢鼓励。
第四,适度性原则
由于新课标强调“对学生的日常表现,应以鼓励、表扬等积极的评价为主,采用鼓励性的评语,尽量从正面加以引导”,于是我们在观公开课时,注意到这样一个现象:不少教师课堂点评时表扬的频率和程度过高过腻。
在课堂教学过程中,表扬能促进学生外部学习动机,学生从老师的认可和赞许中赢得自尊和地位,但是对学生学习的主动性、积极性的调动主要在于内部动机的激发,它是学生的认知内驱力,学生对学习活动本身趣味盎然就会驱使学生去思考、探求。
就课堂而言,内部动机的激发和满足是保持学习持久动力的根本。
事实上,真实客观评价学生与爱护其自尊心并不矛盾。
对学生回答问题的评价客观真实是第一位的。
表扬鼓励应实事求是、恰到好处,还要因人而异、因地制宜,“度”太高则烫人,“度”太低则凉心。
课堂上学生的情绪、兴奋状态、思维紧张度主要并不取决于老师的一些浅俗表扬:“你好聪明”、“你离真理只有一步”……尤其是高中生对这些评价不会高兴、感谢,反而会认为是一种浅薄表扬,自己并不是真正在同学面前“有面子”。
评价的语言要明确准确,鼓励的语言宜亲切含蓄,表扬的语言宜得当真诚,在情境性评价中把一种表扬方式演变成一种“表扬公式”不仅让学生厌倦,更显示教师出点评能力的捉襟见肘。
2、情境性评价的实施
第一,对“锚”与“舟”的观察与记录
以创设含有真实事件或真实问题为特征的情境教学以教学事件或真实性任务为师生活动的焦点。
这些教学事件或真实任务尤如一个个“锚”,把学生的思想之舟紧紧维系在知识的海洋之中。
如一位高三老师在对毕业班学生的诊断测验中,命制了一道好题:
根据情境和上联对出下联:
相传,清初文学批评家金圣叹的儿子自幼聪慧,惹人疼爱。
一次,他去参加童子试,途中,看见篱笆下开着一朵鲜花,连忙跑去采下,边走边闻,不知不觉到了考场。
见老宗师(主考官)坐在堂上,他赶紧将花藏入袖中,谁知老宗师早已看得一清二楚,随口吟道:小童子暗藏春色。
他一听,知道事情无法隐瞒,于是对道:(1)
老师听了,大笑了起来。
后来,金圣叹因抗粮一案被判为死刑,临刑前,与其子相对良久。
金圣叹看着儿子说:
儿子洒泪答道:(2)。
第二,寓评价于情境化的活动中
“情境教学不需要独立于问题解决过程(教学过程)的测验,而是采用与教学过程和教学情境融为一体的评估……‘场合驱动评价’(context-driven evaluation)。
因为在学习中,对具体问题的解决过程本身就反映了学习的效果,教师只需要随时观察并记录学生的表现即可。
”3美国一位教师给高中学生出了一道试题,就是运用情境性评价的方法:
试题“诗是什么”,并别出心裁地要求学生先把一张白纸剪裁或折叠成某一特定式样后再发表看法。
答案五花八门——有的将纸剪成两个“心形”,并解释说,诗必须由作者的心通往读者的心;有的将纸叠成螺旋形,并解释说,诗是心情的螺旋上升;有的索性将白纸剪碎,然后说,诗是从破碎的心中滚出来的;更有的将白纸原封不动地送回说:什么是诗,只能由写在上面的东西自己来解释。
这样的答卷不比死记硬背的诗的定义更有价值吗?它表达了学生各自内心对“诗”的不同感悟,发挥了学生的想像力,作诗本来就应是展开想像的翅膀,学生对这种评价方法很欢迎。
二、语文档案袋评价
长期以来,“定性”评价与“定量”评价在语文教学评价领域是人们争鸣的热点。
与量子物理的“测不准原理”一样,企图把学生的能力水平绝对地量化尤其是作为人文学科、母语学科的语文是不科学的、不现实的。
20世纪70年代,教育学家桑迪提出了现代人才评价原理4,其基本内容是:
第一,过去那种带有惩罚性的考试,今后要成为引导、刺激学生继续学习和发展的评价;
第二,过去那种以书面考试为基础的评测,今后要发展为以观察法为重点,采取多样化方法的评价;
第三,过去那种以记忆为中心的考试,今后要发展成为以创造性及问题意识为中心的评价;
第四,过去那种单纯在课程结束时进行考试的评测,今后要成为与课程同时进行的合作性评价;
第五,过去那种只着眼于狭窄范围的测验能力的考试,今后要变为考察认识、感悟及应用能力的全面的综合评价;
第六,过去那种只由国家进行的入学资格考试,今后应由大学与高中合作寻求一种更稳妥的评价方法;
第七,过去那种只由教师进行的评价,今后应当提倡同时由学生进行自我评价。
桑迪的评价原理中贯穿着这样一些重要理念:评价的过程性,评价的多样性,评价的自主性。
这样,能将人才的思维、情感、个性、创新等特性包含在内的评价方法——档案袋评价法便应运而生。
档案袋(成长记录袋)的主要意义在于它为学生自己做学习的主人,判断自己的进步提供了平台,它将评价、教学和评估联系起来,让教师和家长能及时全面了解学生的学习情况,同时,它又有利于评价多元主体的积极参与,还真正为学生个性化学习提供了机会。
档案袋评价法引入我国后,也有一些反对意见:“‘成长记录袋评价法’工作量太大,教师负担过重。
”“如果各科都建‘学生成长记录袋’,学生也会觉得烦。
”“不适于大班额评价用。
”“内容太多,不好选择,不好整理、分析。
”……我们辨证地看,任何一种评价方法都有它的一定局限性,但“档案袋”评价作为一种形成性、质性评价方式的表现,它有明显的优点,有论者指出:“‘成长记录袋评价法’最重要的意义在于个性化地关注学生的成长过程,使学生在体验成功、感受进步中得到激励”。
“学生成长记录袋应该在教师指导下,由学生自己来建设,培养学生的自我反思能力和对自己的学习负责任的意识。
”“把握‘成长记录袋评价法’的思想精髓,灵活地使用‘成长记录袋’的形式,避免形式化倾向。
”5因此,“档案袋”评价法运用的关键在我们对其扬长避短,充分发挥其积极功能。
3张华《课程与教学论》上海:上海教育出版社, 2000,第471页。
1、语文档案袋的类型
第一,以不同的功能为标准——五分法
美国献罗来纳大学心理学教授格莱德勒(Margaret E. GredLer)根据档案袋在功能、构成和使用目的上的区别和特点,提出了五分法:理想型(ideal)、展示型(showcase)、文件型(documentation)、评价型(evaluation)、课堂型(class),其中以理想型档案袋最具代表性。
理想型档案袋设计和建立的目的是帮助学生成为自己学习的历史具有思考能力和进行非正式评价的人。
理想型档案袋主要由二部分组成,即:A.作品产品过程的说明(biographers of works)。
是对主要学习计划产生的编制过程的文件记录。
B.系列作品,是学生在完成某一学习计划的过程中创作的各种类型的作品集,它表明学生取得成就的广度和范围,对语文学科而言,一个档案袋里就可收入学生被杂志录用的文章、论文、诗歌以及课堂表现录音等。
C.学生的反思记录。
在一学期的不同时间。
教师要求学生充当专门的批评家或传记作家的角色,让学生描述自己作品的特征,自己在成长过程中的进步,已经实现的目标等。
这些都可作为反思记录的内容。
反思记录有利于培养学生自我反思和自我教育的习惯。
理想型档案袋的重要性在于能有效帮助学生把讨论评定作为学习的机会,评定由此实现了与课程、教学的整合。
第二,以入选材料性质为标准——三分法
美国比尔·约翰逊根据入选材料性质的不同,提出了三分法:最佳成果型、精选型和过程型。
A.最佳成果档案型(best-works portfolio)。
通过收集学生在学科某一领域的最佳成果来进行在这一领域的水平评定。
如测评语言艺术,就可选学生写作类型的最佳作品,如学生发表在最有影响报刊上的作品。
B.精选型档案袋(selection portfolio)。
要求学生提交的不只是标志他们已经达到的最高水平的成果例证,还包括他们感到最困难的典型成果例证,这样可以深刻反映学生成长的概要。
C.过程型档案袋(process portfolio)。
要求学生一步一步地收集能够反映他们在一定领域中从起始阶段到完成阶段所取得的进步的成果证据。
如从事写作的教师要求学生提交头脑风暴记录、第一份提纲、早期的草稿、修改过或再次修改的草稿以及最终的作品等。
实际上,大多数学科档案袋都属混合型档案袋,是最佳成果型、精选型和过程型的混合体。
第三,以内容为标准——二分法
语文学科档案袋从内容上可分成综合型与分项型。
A.综合型。
广东省中山市设计的“初中语文学习成长记录表”6供全市所有初中使用,经过实践,“初中语文学习成长记录表”成为取得良好效果的档案袋评价方法,他们的做法是:“初中语文学习成长记录表”由六个方面内容组成:
①“学生语文学习原始资料”,主要项目由学生姓名、出生日期、小学毕业学校、普通话、写字、口语交际、入学摸底成绩、语文特长等。
②“入学前家长评价”,主要项目由语文学习习惯养成情况、语文学习时间安排情况、语文特长情况、推荐课文书、语文综合能力评价等。
③“学生月进步记录表”主要项目由学习方式记录、课堂效率检查、作业完成情况、单元测验情况、语文特长发展等。
④“学生自查表”,主要项目有预习、听课、自主合作探究、阅读作业、作文、写字、课前演讲、课外练习笔、背诵、自编小报、单元小测、对老师的建议等。
⑤“家长月反馈表”,主要项目由学生进步情况、学生不足之处,家长对老师的建议等。
⑥“学期语文素养综合评价表”,主要项目有预习、课堂发言、自主合作探究、写字、朗诵、背诵、课外练笔、读书笔记、自编小报、课内作文、课前演讲、阅读作业、单元测验、期末考试、语文特长、综合评价等。
B.分项型。
如学生课外阅读卡可以以下格式设计,7一学期或一学年的集中在一起就是学生
6张宝华《“初中语文学习成长记录表”设计与效果》,《语文建设》2004,(1)
7国家基础教育课程改革“促进教师发展与学生成长的评价研究”项目组.《成长记录袋的基本原理与应用》西安:陕西师范大学出版社,2002,第97页。
.
2、语文档案袋方案的制订及实施
第一,明确评价目的。
评价目的制约着档案袋的类型及用途。
如要达到展示目的可用最佳成果档案型,要反映学生进步的目的可用过程型档案袋或精选型档案袋类型。
第二,收集材料。
收集材料要以评价目的为依据,收集材料的类型要与评价内容结合起来。
下面以“学生的阅读和写作档案录的具体内容”为例:8
学生的阅读和写作档案录的具体内容
第三,档案袋的评价。
师生共同制订评价的规则,可采用分数评价和等级评价的方法:A.分项评分,在收集材料时分项评分。
B.综合评分,在材料收集完以后总体评分。
等级评价用描述性的标准(不用带情感倾向的优良中差方法)作为等级评定的指标:A=超过预订目标,B=接近或达到目标,C—D=在实现或靠近目标的过程中,F=远离目标或没有实现预定目标。
8周卫勇编著《走向发展性课程评价》北京:北京大学出版社, 2002,第70页。
三、纸笔测验
纸笔测验是常规教学评价的重要方法(或形式),测验作为一种兼具鉴别性、导向性的评价方法指平时的单元测验、期末测验、学年测验等,初中毕业会考、高中毕业会考和高考是权威性的测验。
1、测验的原则
测验的质量特性由试卷的信度、效度、难度和区分度来决定,测验的试卷(或评价方案)制订的原则要做到:
第一,针对性原则与区分性原则统一
测验试卷的编制首先要基于评价的目的,对语文学科而言,测验按时间阶段分可以是单元测验,也可以是学期测验,这就要针对一般时间内的教学内容,如古文单元测验必须涉及几篇课文(包括必读篇目和自学篇目)段落的识记(默写),实词、虚词的用法和课内篇目的阅读考查以及课外古文(往往是选段)的考查等等。
这些就是测验的针对性原则。
评价具有诊断和选拔功能,因此测验试卷的编制要坚持区分性原则。
区分性原则是指试卷的内容、单项指标、评价标准要符合学科的特点,能够测评学生在某项指标的达成度(或学习水平)。
要做到针对性原则与区分性原则的统一就必须做到在试卷编制上把握好试卷的难度系数和区分度。
如果一个题目难度大,学生得高分可能性就小,如果一个题目的难度小,学生得高分的可能性就大。
国内外通常用得分率来作为难度系数的指标,计算公式为:P=max X X
(P 代表题目难度,
X 为被试在某题目上的平均得分,X max 为该题目的满分)。
大量研究与实践证明,如整个测验所有题目的难度系数分布在0.30至0.70之间,并且整个测验的难度系数在0.50左右时,可使测验对学生有较大鉴别力,并且可以使测验分数接近正态分布。
区分度就是题目区别学生水平能力的量度,常记为D ,题目区分度是测验性能的一个重要指标,在所测特质上,如果水平高的学生在测验题目上能得高分,而低水平的只能得低分,那么测验的题目区分被测学生水平的能力就强。
区分度的值域范围在-1.00至+1.00之间,通常D 为正值,称作积极区分;D 为负值,称作消极区分。
D 为0,称作无区分作用。
具有积极区分作用的项目,其D 值越大,区分的效果越好,区分度的计算方法较多。
在使用时应根据测验的目的以及题目记分和测验总分的两个变量的性质不同,从而选择不同的计算方法。
在实际应用中,常采用高低分组法来计算题目的区分度:用高分组在特定题目的得分率和低分组在相同题目上的得分率之差作为题目区分度的指标(高分组、低分组人数比例各占总人数的27%),被称为鉴别度指数,记为D 。
计算公式为:D=P H -P L (D 代表项目鉴别度指数,P H 、P L 分别表示高分组和低分组在该题目上的得分率)。
为方便起见,还可采用公式:D=F
X X L H (D 代表题目鉴别度指数;X H 表示高分组在特定题目上的平均得分;X L 表示低分组在该项目上的平均得分;F 表示该题目的满分值。
)D 值是鉴别题目测量有效性的指标,D 值越高,题目越是有效。
1965年,美国测验专家艾贝尔
(R.L.Ebel )根据长期经验提出用鉴别指数评价题目性能的标准9并以图示之:
第二,科学性原则与可行性原则的统一
只有坚持科学性原则与可行性原则的统一才能保证测验的公正、公平。
科学性原则是指测验成绩准确反映学生的真实学业水平,试卷要有较高的效度和信度。
信度(reliability)指的是测量结果的稳定性程度;效度(validity)指的是一次测验能测出学生实际水平的程度。
信度高是效度高的必要条件。
要保证测验的效度,要做到:“从内容效度来说,所拟问题具有代表性。
如要测量学生某一学科的学业成就,所拟试题要有足够的覆盖面,能够反映学生对各部分、各种特质知识的掌握情况。
从结构效度来说,测量与评价方案要确实能反映所要测量的心理结构要素。
从效标关联效度来说,不同测验的要求标准不一样。
” 10
2、测验的类型
测验的类型一般有三种:第一,形成性测验。
就是每一课之后或一个单元之后的练习。
第二,成绩性测验(或叫阶段性测验)。
即通常的期中测验、期末测验、学年测验。
第三,选拔性测验。
如中考、高考。
测验的类型体现出不同的评价功能,决定着测验试题的编制。
第一,形成性测验
形成性测验体现的是目标评价模式和形成性评价模式的特点。
目标评价模式是在泰勒的“评价原理”和“课程原理”的基础上形成的,它是以泰勒的课程理论为依据,围绕目标而构建的评价模式。
它的特点是把评价看作是教学计划或教学结果与预定教学目标相对照的过程,强调用明确的、具体的教学环节和教学内容来陈述目标。
目标评价模式是目标教学法理念的产物,它的长处是根据单元和课文内容确定教学目标,课堂的教学行为有的放矢,我们耳熟能详的“一课一得”就是其表现。
不足之处在于由于目标评价模式追求评价的“客观性”和“科学化”,忽略了教师、学生在教学活动中的主体能动性、发展性和不可预测性,尤其是缄默知识很难用目标来测评。
尽管目标评价模式有其局限,但不能在评价中把目标搁在一边去寻找所谓各种实际效果,语文教学目标的设立和评价就应以“三维”(知识与能力、过程与方法、情感态度和价值观)目标为核心,是“三维”目标各个层面的展开和细化。
形成性评价模式针对的是“三维”目标中的“过程与方法”,特点是重视学生能力的形成过程,通过及时的反馈、调节、矫正来对语文教学过程的展开策略和学习方法进行评价。
形成性评价的主要目的不是给学生评定成绩或作证明,而是帮助师生把注意力集中在达到掌握程度所必须具备的特定知识上。
针对学生最近发展区,形成性评价关注的就是如何“跳一跳摘到苹果”。
布洛克研究发现,形成性评价测试中掌握程度在接近85%时,学生分数会攀升,若高于85%则兴趣和效果会下降。
那么85%就是学生认知水平的最近发展区,形成性评价就是对此的关注。
形成性评价最重要的价值在于向学生提供学习每个单元的帮助。
主要表现为:对每个单元进行形成性测验时都用两套同质的试题。
首次测试时可能少数学生达到掌握程度,多数学生需要一个改正(修正)过程,因此,过几天后,用另一套试题再测试一次,学生可只答首次测试中那些答错了的题目(以试题中的序号为准),通过修正,在第二次测试中将会有更多的学生达到掌握程度; 形成性评价还为学生的学习起到了确定学习进度的作用,特别是那些循序渐进的学科和学习内容比较多的学科(如语文),一个单元一个单元地过关,显然能把复杂、繁重的任务分解为比较简单、轻松的任务;对那些已经达到或接近达到某一学习单元掌握程度的学生来说,形成性评价可以起到诊断作用,让学生弄清自己的问题所在并及时予以补救。
第二,成绩性测验
成绩性测验体现的是诊断性评价模式的特点。
语文诊断性评价模式是在语文教学活动开始时进行的评价,它诊断的是“三维”目标中的“知识与能力”,目的是对教学对象知识储备、认知能力等进行了解,以便为教学目标的确立和教学过程诸环节的实施提供依据,进行因材施教。
成绩性测验的内容:语文基础知识、写作水平、口语交际能力。
语文基础知识:语音、文字、词语的积累和运用。
文学常识和阅读能力等,是开展语文教学。