欧洲语言测试标准与我国外语测试改革_王京平

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2012年第1期
外语测试与教学
Foreign Language Testing and Teaching
Jan2012
[中图分类号]H319[文献标识码]A[文章编号]2095-1167(2012)01-0050-07
欧洲语言测试标准与我国外语测试改革
王京平
提要:当前国内各种外语考试存在标准不统一、等级模糊、可信度差的问题,本文将结合《欧洲语言共同参照框架:学习、教学和评价》(Common European Framework of Reference for Languages:Learning,Teaching,Assess-ment),探讨它对我国外语测试改革的借鉴意义,提出具体的改革思路,主张外语测试改革要结合我国的国情,把外语测试从“真空”中解放出来,让它回归社会实践,提高我国外语测试的效度和信度。

关键词:外语教学;外语测试
Abstract:The tests of foreign languages in China have such problems as no standard criteria,no clear classification and low reliability.This report,on basis of analyzing aspects in“Common European Framework of Reference for Lan-guages:Learning,Teaching,Assessment”(CEFR),discovers the ideas and experiences that can be used as a source of reference to the reform of foreign language tests in China.This report introduces the guideline to the reform of foreign language test.It also suggests that the foreign language test should be released from a state of“vacuum”and return to a practical environment.Reform should be introduced to the foreign language tests in China,so that the validity and reliability can be improved.
Key words:foreign language teaching;foreign language testing
计量标准是公平、公正的基本保证,如果没有科学的计量标准和手段,计量结果就没有证明力。

外语测试也同样如此。

衡量外语测试的质量有两个重要指标:效度(validity)和信度(reliability)。

效度是“测试的有效性,指一套测试对应该测试的内容所测的程度。

也就是说,一套测试是否达到了他预定的目的以及是否测量了他要测量的内容。

”(张国扬,朱亚夫1998:153)测试的信度是“测试的可靠性,指的是测试结果是否稳定可靠。

也就是说,测试的成绩是不是反映了受试者的实际语言水平。

”(张国扬,朱亚夫1998:154)要检测出外语学习者的语言水平,就要讲究测试的效度和信度。

而在这两项上,我国外语考试亟待规范,必须进行有力度的改革。

本文将从我国外语测试中存在的问题、欧洲语言测试标准、我国外语专业四级考试与欧洲语言测试对比和改革思路四个方面阐述。

一、我国外语测试中存在的问题
说到我国外语水平的测试,国内权威考试有专业四级、专业八级、公共四级、公共六级,各个语种还有引进的国际考试,英语有托福、雅思,德语有德福、DSH等等。

国内的考试,在效度和信度上存在一定的问题:1.各个语种都有自己的等级考试(例如:专业四级),但是各个语种没有统一的衡量标准,且难易程度不一,比如,英语的四级只对英语等级有效,并不对应其他语种的四级水平,而且各个语种的考试项目及内容难易程度极不统一。

2.就一个语种而言,专业四级和专业八级之间缺少科学的认定依据,没有说明哪些知识和能力是四级水平应该具备的,哪些是八级应该具备的;既然有四级、八级,就应该有八级以内的其他等级,而这些等级该如何界定?查看外语专业大纲,尽管有对各个等级水平的描述,例如:掌握词汇3000个,听懂语速为150·
05
·
词/分钟的电台广播,但是这些量化指标没有可行性的考查手段,不能证明考生的词汇量到底有多大,对150词/分钟的语速没有科学检测方法。

3.有些考试同一种考试的测试项目的命题范围、内容难度没有明确的描述,题目的类型和内容随意性很大,出现各年难易不等的现象。

特别是当更换命题组的成员时,试题思路和测试项目也可能随之变化,备考人员为此苦不堪言。

4.考试的技能项目不完整,多数专业的统考和几乎所有的公共考试都没有口试,而口语能力是外语交际能力的重要方面,致使出具的证书并不能充分说明被考者全面的语言能力。

“外语测试的目的是提供一种科学的测试工具,对学生的外语语言能力进行客观的、准确的、公平的评价,反映教学中的长处和短处,为提高教学质量服务。

”(钱汝敏等2008:61)
作为评价手段,外语测试在当代外语教学中起着重要的作用,不可低估考试在外语教学中的导向作用,正因为教与学质量的高低要靠考试成绩来证明,考试就成为教学的中心,一切围绕考试而进行,甚至还有备考突击班。

由于外语考试的重点仍然主要是语言知识,而非实际的语言交际能力,所以出现“高分低能”的普遍现象:语言知识的“分数高”,而语言交际的“能力低”。

胡文仲指出:“交际能力大致包括了两方面的能力:语言能力和社交能力。

”(胡文仲1998)语言能力是运用语言规则说出正确话的能力,交际能力是在社会规范的制约下说出得体话的能力。

现在的考试不能考查学生的实际语言交际能力,过于强调学生对语言知识的掌握数量,这和社会对外语人才模式的需求相比的确存在很大差距。

二、欧洲语言测试标准
在语言测试方面,欧洲走在了前面。

他们推出了一个适合各个语种的统一的语言测试纲领,这个纲领的全称是:《欧洲语言共同参考框架:学习、教学和评价》,英文版的原名为:Common European Framework of Refer-ence for Languages:Learning,Teaching,Assessment(CEFR),为简化起见,本文简称其为CEFR测试标准。

欧盟委员会下属的文化合作委员会出台这个语言测试标准的目的是促进欧洲各国人民相互间的沟通,实现和睦相处,维护欧洲语言文化的多元化格局,推进欧洲一体化的进程。

该测试标准于2000年在欧洲问世后得到迅速普及,现在,CEFR推荐的测试等级标准在欧洲已经扎根,各个国家纷纷推出CEFR语言等级的测试。

比如,位于德国的TELC语言测试中心已经为九种欧洲语言(英、法、德、俄、意大利、葡萄牙、西班牙、捷克、土耳其)设立了五个等级(A1、A2、B1、B2、C1)的测试①,颁发的证书在全世界得到承认,证书在求职、申请留学中对语言能力具有公认的证明力。

对这六个能力等级的总体描述见下表(Glaboniat et al.2005):
等级描述
A1能够理解用简单语言表达的日常所熟悉的句子,并使用简单的句子,完成简单的交际;可以自我介绍,并介绍他人,询问有关某人的情况,例如:他们住在哪里,认识什么样的人,有什么样的东西,并且回答同类问题;在对方语速慢、发音清晰的前提下,可以和对方沟通。

A2能够理解与日常生活直接相关(例如:有关某人、家庭、购物、工作、周围环境)的句子和常见表达方式;在日常环境中交流熟悉事物的简单信息;可以用简单的方式表达自己的籍贯、学历,描述周围环境,表达自己的需求。

B1能够理解用标准语言清晰表达的有关工作、学习、业余生活的主要内容;能够基本应付旅途中多数场合对语言的要求;可以用简单的语言连贯表达自己熟悉主题的或感兴趣领域的内容;可以讲述个人的经验、经历,描述愿望和目的,对计划和主张简短地说明理由或给予解释。

·
15
·
欧洲语言测试标准与我国外语测试改革
①有兴趣者可以登录TELC的网站www.telc.net,上面公布了九种语言的试题样本,全面测试语言的各个技能,并且给出
了评分标准。

(续表)
B2能够理解关于具体或抽象主题的复杂语篇的主要内容;可以听懂本专业的讨论;可以与母语者进行即兴的、流利的谈话;可以对比较宽泛的话题清楚、详细地表达自己的立场,说明利弊。

C1能够理解话题范围广泛、有难度、比较长的语篇;可以即兴流利地表达,语言连贯,没有停顿;在社会交往、职业生活、或者学习中能够有效、灵活地运用外语;能够就复杂的话题作清晰、自如的表达,得体地运用各种连接文章的手段。

C2能够轻松理解所听到和读到的全部内容;能够归纳各种书面和口头信息,连贯地复述理由和说明;能够即兴流利、准确地表达自己的想法,对复杂的内容能够准确辨析语言意义的微小差别。

这些标准清楚地表明,欧洲文化合作委员会非常明确地把语言交际能力作为衡量学习语言能力的标准,该标准并不追求学习者的表面指标,例如:单词量、学时数、语法体系的完整性,而强调运用外语去满足外语环境对学习者的要求,这是检验学习者外语能力的唯一标准。

相对于我国外语测试,CEFR测试标准具有以下优势:
1.以语言交际能力为导向:从社会语言实践出发,描述各个语言级别的交际能力,考查学生在对象国特有的文化环境中的语言能力和社会交际能力,他们的考查内容与社会对外语人才的需要完全吻合。

2.通用性:就像通用的度量衡标准一样,这份语言大纲的测试体系适用于所有欧洲语言,语言等级对应,测试标准统一,从而解决了标准不一致而造成的信度差的问题,使跨语种之间具有语言水平的可比性。

就同一语种而言,测试标准可以为各种测试目的服务:外语专业、公共外语、职称职务考试和人才市场招聘。

3.体系性:欧洲语言测试标准包括从低到高的三个大等级、六个小等级,可以检测各个程度的外语水平,各个等级的评价依据都有具体详细的描述。

4.科学性:《欧洲语言共同参考框架》对测试等级作了严格的科学界定,以交际主题和交际领域为衡量坐标,对各个等级作了对应的规定,各级定义明确、等级之间衔接严密,等级递进合理,没有重合、矛盾和空白区。

5.开放性:《欧洲语言共同参考框架》只规定衡量语言水平的标准,不限制达到标准的途径,不规定使用何种教材和教学方法,各个教学机构可以根据各自的实际情况决定教学内容和教材,各个外语教学机构的学习者都可以“殊途同归”,参加统一的水平测试。

6.可操作性:对所有等级语言能力的描述十分具体。

例如对听力测试,要求初级1水平:“能够听懂学习者熟悉范围内含有时间及地点说明的信息”;对初级2水平的要求是:“能够理解简短文章中的日常主题和个人所需的简要信息”。

这样梯度明确的具体描述有利于各个考试机构为考试命题做出准确的定位。

CEFR测试标准充分体现了信度和效度,对我国的语言水平测试具有示范作用。

笔者曾经让同一批学生做同一等级的二套试题,测试结果完全一致,足以说明这个标准的科学性。

三、我国外语专业四级测试与CEFR测试对比
为了进一步了解欧洲测试标准与我国外语专业考试的情况,笔者将英语和德语专四考试与CEFR-B1等级的笔试测试项目以及分值归纳在下面的表格中(从课时数来说,专四和CEFR-B1测试相当,具有可比性)。

测试项目以及分值:
测试名称听力阅读语法词汇写作听写总计
CEFR-B133%33%14%20%0100%
英语专四15%20%25%25%15%100%
德语专四20%20%35%15%10%100%·
25
·
外语测试与教学2012年第1期
欧洲语言测试标准与我国外语测试改革
从测试项目的比值分配来看,CEFR-B1在所有语言能力的项目中(听力、阅读、写作)都给予了足够的比例,而对语言知识结构本身只有很小的分量(不足1/5),充分体现了欧洲语言测试重点关注的是语言能力,不是语言知识,而我国的专四考试中语言知识仍然占有较大比重,在德语专四中甚至占了三分之一强。

在听力和阅读测试项目中,欧洲测试标准也有值得我们借鉴之处:两项试题立足于语言实践,测试三种理解能力:
●粗略理解(Globalverstehen):大致了解所听到或读到的文章的主题以及主要信息,这种方法在日常生活中经常用到,例如:获取文章梗概、搜集遴选文献、讨论时了解对方的态度。

●详细理解(Detailverstehen):这种方法是我国外语考试中较常见的传统方法,要求学生详细理解文章每个细节,深入理解全文。

●选择理解(Selektives Verstehen):这种理解也是经常使用的方法,例如:读报选择感兴趣的栏目、有重点地听新闻、天气预报、车站的广播。

相比之下,我国的外语教学和测试并没有训练,或者没有系统地训练和考查学生的这三种与日常语言实践密切相关的理解信息的能力,这大概就是“真空”教学导致的高分低能的原因所在。

我国外语教学有很长的历史,改革开放前外语工作多与文献资料有关,没有很多语言交际任务,教学的重点主要是语言知识层面。

但是改革开放以后情况变了,我们的外语教学思想却没有做相应的改变,大致沿袭了过去的教学思想和模式,和它紧密相关的测试也没有根本性变化,以致测试重点与实践要求存在严重的“错位”,学生在考试指挥棒下过多地在语言结构上下功夫,忽略了语言实践对他们的能力要求。

为了让学生把学习的注意力转移到语言实践能力上,我们就必须对测试项目和分值比重加以调整,并对教材也做相应的改进。

四、我国外语测试改革的思路
为了推进我国外语测试改革,提高测试质量,笔者认为,欧洲语言测试标准为我们提供了以下改革思路:
1.把测试重点转移到语言能力上
语言首要的社会功能是进行语言交际。

作为人类交际的工具,语言具有双重性,即形式和功能。

语言形式指包括词汇语法在内的语言结构,它是交际的基本材料,是使对方能够听懂的前提,但是还不够,在语言实践中,交际双方要根据不同的文化社会习俗,顾及具体的场合和对象,懂得恰当地运用外语进行交际,才能使交际成功。

而我国传统的外语水平测试把语法、词汇作为考查重点,测试语言功能的题目很少,测试题多数是脱离交际场景的单一的句子。

这种测试实际上是把语言架空,使学生忽视语言与社会的交替功能,只去关注语言形式。

测试结果虽然证明了受试者对语言结构的掌握程度,却不能说明他在语言实践中的实际交际能力,这就是导致学生高分低能毕业后难以立即胜任外语职业的问题所在。

CEFR测试把受试者看成实实在在的“社会人”,考查他们的三种能力:语言能力,社会交际规范能力和语言使用能力。

《欧洲语言共同参考框架》认为,语言作为交流工具,要靠这三种能力才能完成社会交际任务,而不仅是语言知识。

语言教学要立足于培养三种能力,测试内容也不能只局限于语言知识,还必须包括语言交际规范和具体语境下与对方得体交际的能力。

我们要进行测试改革,就应以实践为本,让测试从“真空”状态中走出来,回到语言实践中,在测试中加大语言功能的试题比例,使测试目的接近社会对外语人才的需求,提高测试的有效性。

2.建立完整的水平测试等级体系
目前,尽管外语专业和公共外语的多个语种已经开设了全国统一的四级、六级或八级测试,但是其间还空缺一、二、三级和五级、七级测试,即使不举行这些等级的考试,也应对它们有相应的等级定位和描述,否则四级、六级或八级考试就失去了信度。

建立完整的水平等级测试体系是个系统工程,需要统筹规划和研究。

其中,作为等级基础的是课时数量。

CEFR六个等级对学生课时数量有如下认定(Hunold2009):
·
35
·
水平等级课时数A1155-200
A2310-400
B1620-800
B21000
C11200
C21400
我国通常以学期为单位,一个学期为一级,外语专业四年后就被认定为八级。

这样定级不够合理,因为,各个学期的外语课时不等,学期越高,课时越少。

相比之下,CEFR以课时数定等级的做法比较合理。

我国外语教学可以粗略分为两类:专业外语和公共外语,由于它们的培养目标不一致,对课时要求也应该有区别,例如专业四级与公外四级水平测试的定义及内涵(主要指测试内容、语言结构与语言运用的比例)不同,建议根据各个等级的能力目标确定应该完成的课时数量,以这样的课时体系作为测试等级的基础参数。

笔者认为,CEFR水平测试标准的课时规定对我国公共外语的等级更
具参考性,这两种测试的目的比较接近,更强调受试者的语言交际能力,而外语专业由于以培养外语职业为目标,它对语言形式(语法、词汇)的准确性有更高的要求,因此建议适当提高达到各个等级所要求的课时数,至于具体多少为宜,要根据培养目标、学生的认知能力等有关因素确定。

3.用二维坐标确保各级水平测试的信度
CEFR测试标准的科学性表现在根据二个维度确定测试内容:
(1)交际领域
根据外语学习的规律,交际领域由小到大,把它划分为四个领域:私人领域、公共领域、学习领域、工作领域:
●私人领域是指家庭、亲朋好友的往来范围;
●公共领域包括一般的社会交往,例如:购物、看病、办理签证等的公共场合;
●学习领域是指在学校进行各类学习的环境;
●工作领域包括职业活动的一切场合。

这四个领域以递进形式对应于不同的语言水平等级。

(2)交际主题
CEFR测试标准按照交际主题的难易程度描述学习者的语言交际能力,例如:初级水平的学习者能够自我介绍,完成寄信、问路的交际任务;高级水平的学习者能够参加专业讨论会、作报告。

评判依据是学习者能否采取合适的交际策略,运用合适的文体形式完成交际任务的能力,对此有宽泛、灵活的标准,没有唯一正确的答案。

以上二维坐标实际上早已体现在由近到远、从易到难的外语教学中,我们的外语测试也应该按照这两个维度探讨由浅入深的能力等级。

在描述各个等级的语言能力时,很值得参考《欧洲语言共同参考框架》(CE-FR)对各个等级的描述。

如果有些欧洲国家已经出台了适合该国语言的更加详细的描述,则更有利于我们参考借鉴。

德国就制定了分纲领《德语测试框架》(Profile Deutsch),它对每一等级的语言实践能力分别进行了两个层面的描述,即总体能力描述和具体能力描述,在每个具体能力描述之后又配有3个实例。

总体能力描述的内容是说明语言实践能力的总体水平如何(质量描述),具体能力描述的内容是总体能力水平的具体表现,说明达到这种能力的人会做什么。

这样的描述体系清晰明白、易于操作,避免了等级指标的重复和空缺,有利于实现效度。

在科学合理的语言等级体系的基础上建设试题库,严格遵照等级描述设计具体的试题,并由试题组统一把关审核后才可以用于考试,就能有效避免试题时难时易的现象了,从而保证测试的信度。

4.提高测试语言技能的效度
语言能力是总称,传统语言教学把它细分为听、说、读、写四个技能,高年级还增加翻译,这与《欧洲语言共同参考框架》所规划的语言技能基本对应,不同的是,欧洲框架以语言交际为核心,把它分解为四个方面:理解、表达、互动和语言中介。

每个交际活动再分为口头和书面形式,以这四种交际活动为基础产生出评定语言能力的八项语言技能(Glaboniat et al.2005):
·
45
·
外语测试与教学2012年第1期
交际活动语言行为方式语言技能
1.2.互动
口头交流信息听+说
书面交流信息读+写
3.4.理解
口头接受信息听
书面接受信息阅读
5.6.表达
口头发出信息说
书面发出信息写
7.8.语言中介
口头传达信息口译
书面传达信息笔译
CEFR这样划分语言技能立足于交际活动的本质,考查的关注点和内容都与交际能力挂钩,而语言知识(语法、单词量)处于次要地位。

笔者目前所见到的CEFR试题主要围绕前六项技能,笔试包括听、读、语法词汇、作文,其中测试语言结构的部分比例只占10%-16%,语言运用能力的测试占极大比例。

听力和阅读部分都考查三种理解技巧:粗略理解、选择性理解和详细理解;口试以对话形式(考官与学生、学生之间)进行,不论是哪个等级,都设置了实际的交际场景,在15分钟的测试中考查学生的口头理解、表达和互动能力。

CEFR各级测试题目直接服务于所测技能,测试目的明确,没有测试内容和方式与所测技能不符的情况,例如测试写作能力时不会出现难度大的阅读任务,测试听力使用的基本是判断和选择题,没有考查表达能力的大量书写任务。

CEFR试题对我们提高试题效度具有示范作用。

我们在设计试题时,首先要明确所测试的语言技能,然后选择适当的题型范围,例如只有一种正确答案的客观题主要用于测试理解技能,有发挥空间的主观题用于测试表达技能。

以上是结合《欧洲语言共同参考框架》对我国外语测试改革的粗浅思考。

为了统一语种之间的测试标准,很有必要成立一个多语种的外语水平测试标准课题组,共同研究,制定一套符合我国外语培养目标的多语种测试标准。

最后,笔者就《欧洲语言共同参考框架》本土化问题也做了一些思考。

是否将CEFR本土化首先要看它是否能够“洋为中用”,完全照搬甚至取代我国现有的考试显然是不行的,因为我国所举办的各类外语水平测试都有其特定的目的,不是CEFR所能达到的。

CEFR测试至少不能取代外语专业测试,笔者为了搞清楚两种考试的差距就曾经做过试验,让二年级学生在同一学期先后参加CEFR-B1测试和专四考试,测试结果令人吃惊,无论是通过率,还是优秀率,CEFR的成绩都远远高于专四,究其原因有二:专四对语言知识的测试一方面比重大,另一方面要求学生自己表达的比例高,而CEFR测试题型中多数是只要求学生进行选择判断的客观题。

笔者完全赞成专业测试对语言知识有比较高的要求,作为以外语职业为培养目标的测试当然需要学生不仅能够用外语交流,而且还要求准确、地道,这就需要他们有足够的语言知识。

综上所述,欧洲语言测试标准对我国外语测试具有重要的借鉴作用,尤其是CEFR的思路、原则框架和模式更加符合水平测试要求的信度和效度,值得我们参考学习,它对加速我国外语测试改革,提高外语测试质量必然具有重要的推动作用,但是不可盲目效仿,甚至全盘接受。

参考书目
[1]Europarat/Council of Europa:Gemeinsamer europ ischer Referenzrahmen für Sprachen:lernen,lehren,beurteilen [Z].München:Langenscheidt,2001
[2]Glaboniat M,Müller M,Schmitz H,Rusch P&Wertenschlag L.Profile Deutsch[M].Berlin:Langenscheidt,
·
55
·
欧洲语言测试标准与我国外语测试改革。

相关文档
最新文档