英语专业四级考试阅读理解内容效度研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Vol.10No.1
2013年1月
第10卷第1期
Journal of Hubei University of Economics(Humanities and Social Sciences)
湖北经济学院学报(人文社会科学版)
Jan.2013一、引言
阅读作为听说读写四项基本技能,在语言学习中占有十分重要的地位。
从某种程度上讲,提高阅读能力,是提高听、说、读、写、译的关键(陶加辉、邬小琴,2009:134)。
作为大规模标准化考试的英语专业四级考试(Test for English Majors -Band 4,简称TEM-4),是我国最具影响力的考试之一,引发了外语教学研究领域的专家学者从各个角度对其进行深入研究。
阅读理解作为TEM-4的重要题型之一,其命题质量也备受关注。
为了适应我国高等教育新的发展形势,深化教学改革,提高教学质量,考试委员会以《高等学校英语专业英语教学大纲》(以下简称《教学大纲》)为指导,于2004年修改了《高校英语专业四级考试大纲》(以下简称《考试大纲》),其中“阅读理解”部分不再分快速阅读和一般阅读,“阅读理解”部分考试时间由30分钟缩短为25分钟(2004:1)。
这反映了《考试大纲》对“阅读理解”的重视。
那么,改革后的英语专业四级考试,其“阅读理解”部分的考试内容效度究竟如何?这就是本文亟待分析和解决的问题。
二、研究设计
(一)研究目的
测试效度是衡量语言测试最重要的指标,或者说是语言测试的基本出发点。
“根据评价方法的不同,效度是指测试是否靠了考试大纲规定要考的,或者说考试的题目在多大程度上能代表它所要测量的内容。
”(Heaton ,2000:159)Alderson 等人将效度分为三种类型:(1)内部效度(internal validity ),包括内容效度(content validity )和构卷效度(construct validity );(2)外部效度(external validity ),又称标准效度(criterion validity );(3)使用效度(use validity )(Alderson ,1995:164)。
由于篇幅的限制,本文仅从内容效度的角度来分析TEM-4“阅读理解”测试的有效性,总结其成功与不足,并在此基础上提出一些建议,旨在提高命题的科学性和有效性,促进其对教学的积极反拨作用。
(二)研究样本
本研究选取了《考试大纲》修订后的2006~2010年五年
的TEM-4试题“阅读理解”部分为样本,共计5套试卷,20篇文章,100道题目。
(三)研究方法
内容效度指测试内容包含了它意欲测试的语言技能、语言结构等方面有代表性的因素(Hughes ,1989:132)。
“一项测试的内容效度越大,它就越可能达到它意欲测试的目的。
”(Hughes ,1989:132)本研究分析采用的是根据Bechman 和Palmer 提出的考试任务特点框架,并结合阅读考试的实际情况进行综合评析。
Bechman 和Palmer 认为,任务特征包括情景特征、测试指令特征、语篇输入特征和预期回答特征,其中涉及语篇内容分析的是后两个特征,即语篇输入(包括体裁、题材、文章长度、文章阅读速度和篇章难度)和预期回答(阅读能力的考查、题项的设计)(辜向东,2008:106)。
结合《教学大纲》和《考试大纲》在阅读方面的要求,对TEM-4阅读理解部分的内容效度进行了分析。
三、分析与讨论(一)语篇输入1.体裁
《考试大纲》明确规定了阅读理解部分的选材原则:体裁多样,包括记叙文、描写文、说明文、议论文、广告、说明书、图表等。
笔者在统计时将其归纳为叙述文、说明文、议论文、应用文。
部分文章夹叙夹议,在此统计为议论文。
统计结果见表1。
表1:2006~2010年TEM-4试卷阅读理解体裁统计表(单位:篇
)
表1反映了2006~2010年TEM-4试卷阅读理解部分体裁的分布情况。
从整体上来看,阅读材料的体裁主要以议论文为主,叙述文和说明文较少,未出现应用文。
从单卷来看,体裁
英语专业四级考试阅读理解内容效度研究
徐
晶
(新华学院外国语学院,安徽合肥230088)
摘
要:阅读理解是高校英语专业四级考试的重要组成部分,其命题质量一直以来备受关注。
本文以2006~2010
年五年的英语专业四级考试“阅读理解”部分为研究样本,基于Bechman 和Palmer 提出的考试任务特点框架,结合《高等学校英语专业英语教学大纲》和《高校英语专业四级考试大纲》,分析了其内容效度。
分析结果表明,英语专业四级考试阅读理解测试具有一定的内容效度,其命题是比较成功的,但也存在一定的不足之处:如体裁、题材的选择不够广泛,缺乏分布的合理性;个别单卷篇章长度与《考试大纲》要求出入较大;阅读速度和篇章易读度的控制上有待加强;部分单卷阅读能力考查存在缺失。
基于上述研究结果,对英语专业四级考试阅读理解部分的命题提出了一些建议:在阅读材料的选择上注意题材、体裁的多样性和分布的合理性;进一步控制篇章长度、阅读速度和篇章易读度;平衡阅读能力的考查。
关键词:英语专业四级考试;阅读理解;内容效度
的分布存在不平衡的状况。
在同一试卷中各体裁篇数比例不一,呈现单一的特点,甚至某一种体裁比例达到75%,如2007年卷、2008年卷及2010年卷。
这与《考试大纲》体裁多样的原则不太相符。
建议在今后的命题中,应考虑选择应用文体裁,并注意各体裁在同一试卷中的比例分配,做到体裁的多样性和分布的合理性。
2.题材
《考试大纲》规定,阅读材料的选择应题材广泛,包括社会、科技、文化、经济、日常知识、人物传记等。
综观2006~2010年TEM-4的阅读理解材料,其题材涉及科普知识、社会、文化、教育及个人经历的小故事等。
在此,为了便于统计,将教育归入文化中,将日常生活中的个人经历和小故事纳入日常知识中。
统计结果如表2所示。
表2:2006~2010年TEM-4
试卷阅读理解题材统计表
从表2可以看出,TEM-4试卷的阅读理解部分的题材涉猎广泛,基本涵盖了社会、科技、文化等方面,符合《考试大纲》的规定。
同时,由于题材广泛,涉及领域较多,在考查考生阅读能力的同时,又体现了《教学大纲》的要求:“向学生提供广泛的语言和文化素材,扩大学生的知识面,增强学生的英语语感,培养学生的阅读兴趣。
”(2000:10)其中,文化类的题材最多,如2006年卷TEXT A 论述了手机对文化的影响;2008年卷TEXT A 介绍了阿姆斯特丹的文化、TEXT B 介绍了几个来源于神话传说的词语的词源故事;2009年卷TEXT D 的“节日小费”的故事等。
社会、科普和个人经历的小故事等在整个选材中的比例差别不大。
从单卷来看,每一套试卷的阅读材料选材基本涵盖了几个不同的方面(除了2010年只涉及了科技和文化)。
但是,经济题材,这五年的试卷中都未涉及,因此,在今后的选材中,可以适当融入经济类的阅读材料,并注意平衡各题材在同一份试卷中的比例。
3.篇章长度及阅读速度
根据《考试大纲》对测试形式的要求,TEM-4阅读理解部分应采用多项选择题,由数篇阅读材料构成,阅读材料共长
1800个单词左右。
而由表3的统计数据可知,2007~2010年的篇章长度超出标准单词量的比例基本控制在-10%~10%之间,符合《考试大纲》(1800词)的要求。
且2007年和2009年的超出标准单词量比例分别为-0.5%和0.5%,词数控制非常准确。
但是2006年的单词量是五年中最少的,超出标准单词量的比例达-17.6%,这表明,2006年卷的阅读理解部分在单
词量上没有严格遵照《考试大纲》的规定。
表3:2006~2010年TEM-4试卷阅读理解篇章长度
及阅读速度分析表
阅读速度方面,从表3我们可以看出,2007年、2008年、2009年三年的阅读速度差不多持平,分别为102词/分钟、103词/分钟、104词/分钟,这三年的阅读速度控制得较为稳定,但是这与《考试大纲》规定的“阅读速度为每分钟120个单词”还有一定的差距。
特别是2006年和2010年平均阅读速度为86词/分钟、92词/分钟,与大纲规定相差甚远。
由此可知,这五年的阅读理解在阅读速度的设计上偏低,没有达到《考试大纲》的要求。
在今后的命题中,应注意提高试卷整体的阅读速度。
4.篇章难度
在阅读材料的难度方面,《考试大纲》规定,“阅读材料的语言难度中等”。
阅读材料的难度是抽象的概念,受多种因素的影响,目前没有直接的办法来测量。
语言研究者一般使用SMOG 指数,Fry 易读度估算和Flesch 易读度公式等来计算。
本文采取Flesch 易读度来衡量阅读材料的难度。
在Flesch 易读度的测量上,笔者借助Microsoft Office Word 2003对文章进行“完成拼写和语法检查”,然后选择显示有关文档的可读性级别信息的方法获取Flesch 易读度数据。
统计结果见表4。
表4:2006~2010年TEM-4
试卷阅读理解篇章易读度统计表
表5为易读度参考量表。
表5:
易读度参考量表
参照表5,分析表4的统计结果可知,易读度30~50、50~60、60~70、70~80即属于“Difficult ”、“Fairly difficult ”、“Standard ”、“Fairly Easy ”的篇章各占25%、25%、20%、25%,2007年的TEXT
C 的易读度竟为82.2,属于“Easy ”的范围。
整体来说,低于《考
试大纲》“难度中等”的要求,但易读度的平均值比较接近,如此可见TEM-4命题的科学性和严谨性。
同时,我们也可以看出各单卷的易读度相差较大,2006年的四篇文章易读度波动幅度达到了38.9之高。
根据理想模式,每一篇阅读材料都应该符合一定的易读度,差距过大会影响测试的真实性,从而降低测试的效度。
因此,在控制易读度方面,还需要进一步努力。
根据《考试大纲》的要求,对照表5,建议易读度在50~70之间,即“Fairly Difficult ”和“Standard ”之间比较合适,属于难度适中的文章。
(二)预期回答
预期回答主要指阅读技能方面。
阅读理解测试旨在测试学生的阅读能力。
李筱菊认为:“阅读理解测试考核的应该是受试对材料传达的多层次、多范畴信息的理解能力。
”(李筱菊,1999:86)《考试大纲》要求:“能掌握所读材料的主旨大意,了解说明主旨大意的事实和细节;既理解字面意思,又能根据所读材料进行判断和推理;既能理解个别句子的意义,也理解上下文的逻辑关系”。
据此,笔者将TEM-4考查的阅读技能分为细节辨认、判断推理、主旨分析、语义理解,并以此对2006~
2010年TEM-4试卷阅读理解材料后的题目进行分类统计,
结果见表6。
表6:2006~2010年TEM-4
试卷阅读理解材料考查能力统计表从表6我们可以看出,TEM-4的阅读理解部分对阅读能
力的考查是全面且符合大纲要求的,具有较高的内容效度。
综合这五年的试卷,细节辨认题和判断推理题共有86题,占整个阅读理解考查部分的86%。
从整体来看,细节辨认和判断推理是TEM-4阅读理解部分对阅读能力考查的主要内容。
而主旨分析题和语义理解题则每卷只占1或2题。
总体来说,各种能力的考查在试卷中所构成的比例是合理的。
但是,个别年份的单卷其考查的能力有缺失,如2009年卷并未出现明确考查主旨分析的题目。
四、结论与建议
本文通过对2006~2010年TEM-4试题中阅读理解部分的统计与分析发现,其阅读材料的体裁以议论文为主,叙述文和说明文较少,未出现应用文;题材涉猎广泛,基本涵盖了社会、科技、文化等方面,但经济题材并未涉及,部分单卷题材选择较为集中;篇章长度超出标准单词量的比例基本控制在-10%~10%之间,但2006年卷单词量偏低程度较大;在阅读速度和易读度的控制上有待加强;阅读能力的考查较为全面,结构合理,但部分单卷能力考查有缺失。
总体来说,这五套阅读理解试题基本符合《教学大纲》和《考试大纲》的要求,其测试具有一定的内容效度,对英语专业教学具有很好的导向作用,其命题是比较成功的。
针对命题中存在的一些不足之处,为了更好地提高TEM-4考试的内容效度,笔者提出以下建议:(1)材料选择上应注意题材和体裁的多样性和分布的合理性,适当考虑经济类阅读材料和应用文体裁的选择,并注意平衡各题材体裁在同一份试卷中的比例;(2)注意个别单卷的单词量控制,提高试卷整体的阅读速度;(3)在阅读难度的控制方面也需要进一步努力,将易读度的波动幅度控制在较小范围内,尽量使每篇阅读材料的易读度在50~70之间;(4)阅读能力考查上要平衡考查技能,使阅读测试能考查受试者全面的阅读能力。
参考文献:
[1]陶加辉,邬小琴.大学英语新四级阅读理解内容效度研究[J].重庆
交通大学学报(社科版),2009,(12):136-140.
[2][8][10][12]高校英语专业四级考试大纲修订小组.高校英语专业四
级考试大纲(2004年新版)[M].上海外语教育出版社,2004.
[3]Heaton,J.B.Writing English Language Tests[M].Beijing:Foreign Lan-
guage Teaching and Research Press,2000.
[4]Alderson,J.C.,Clapham,Caroline,Wall,nguage Test Con-
struction and Evaluation[M].Cambridge University Press,1995. [5][6]Hughes,A.Testing for Language Teachers[M].Cambridge University
Press,1989.
[7]辜向东.高考英语全国卷与各省市自主命题卷共时与历时研究[M].
成都:四川大学出版社,2008.
[9]高等学校外语专业教学指导委员会英语组.高等学校英语专业英语
教学大纲[M].上海外语教育出版社,2000.
[11]李筱菊.语言测试科学与艺术[M].长沙:湖南教育出版社,1999.。