如何利用语料库辅助语言教学与研究(BNC)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如何利用语料库辅助语言教学与研究(BNC)
一、绪言
语料库是专门用于语言材料检索和统计的工具,包括为某一目的而收集的大量电子文本(加标注或未加标注)和专门的语料检索和管理程序。
其最大的特点是能快速提供大量真实的语言材料并进行相关统计(如词频和搭配词等),已广泛运用于词典、教材、语法书和词汇表等的编纂及语言研究中。
然而,语料库在日常外语课堂教学和学生自主学习中并没有得到广泛运用,至少在中国是如此。
这一方面是由于对语料库在教学中的运用缺乏有力推广,加价格、市场等因素使得购买商用语料库有难度,自己建设语料库又需花费较大精力,另一方面人们对如何获取网上免费语料库资源缺乏了解。
语料库在日常英语课堂教学和学生自主学习中能够起到多种作用。
作为一种高效的语言检索工具,它所提供的大量真实语言实例能提示从构词、词短语到句法结构乃至语篇几乎所有语言单位的语言生态(language ecology),包括语境、搭配规律、使用频率、语义和语用等。
语料库的获得和个人建设虽然面临诸多困难,但幸运的是,开放的互联网为广大英语教师和英语学习者提供了接触和使用语料库的机会。
二、网络语料库的运用
1.英语单语语料库
目前,语料库运用于日常英语课堂教学的主要还是英语单语语料库,互联网上的情况也是如此。
网上有许多大型通用语料库(单语)提供在线检索,其免费服务虽功能有所限制,但已能满足中学英语教学和学生自主学习的需求。
如1亿词次的英语国家语料库(BNC)(/)和5600万词次的柯林斯在线词库(Collins Wordbanks Online)(www. Collins.
/corpus/CorpusSearch.aspx)。
二者均是当今较权威的英语语料库,其语料语域广泛,有较好代表性,且均做了词性赋码(Part-of-speech tags)。
这些在线检索提供通配符功能(wildcard)、连续和非连续的词组或搭配检索功能
(word combination),并能指定检索词词性,功能强大,检索方便,可在日常中学英语教学中加以运用。
1)提供语用实例
语料库在线检索在日常英语课堂教学中最常见的用途是提供大量典型语例。
当传统方法(如词典)无法提供足够的典型例句时就可检索网上语料库。
如“wet”一词语义很丰富,而其动词用法在教学中关注不多,词典也没有提供足够的语用信息。
利用以上语料库在线检索(此处指柯林斯,检索表达式为“wet/VERB”,详细用法参见检索页使用说明),便可呈现它作动词时的大量语用实例,下面是部分检索行实例(concordance line)(经过整理):
对于词汇的某一具体用法,如该词的“wet the / one’s bed”,词典就更缺少语用信息。
为了解其实际使用状况,如语境、使用频率等可用该结构做检索词进一步检索,通过大量真实的语例使学习者感性地认识到本族语者确实广泛地使用该用法,这能提高学习者语言输出的信心和质量。
下面是从柯林斯检索获取的部分例子:
(1) Even dry children may wet the bed under stress, like a change of school, a divorce or moving house.
(2) 1982 found that one-third of normal 3-year-olds still wet three or more times a week.
2) 揭示搭配规律
展示语言搭配规律是语料库最主要的特色。
搭配也是目前中学英语教学中常
常被忽视的地方,这和教师对语言的认识、对搭配的敏感程度及自身拥有的搭配能力密切相关。
语料库的运用正好能提供大量的搭配信息,弥补英语非母语教师搭配能力的不足。
其呈现形式也有助于提高教师和学生的搭配意识(collocational awareness)。
从语料库运用于语言教学的角度,最直接的方法是根据检索词的特点将检索行排序以突显检索词左边或右边的搭配规律(谢家成,2004)。
不过,由于网上语料库检索行缺乏排序功能,可将检索行拷贝下来进行手工整理归纳,限于篇幅,本文不便例示。
除了通过检索行直接观察语言实例以发现和归纳语言搭配外,利用语料库提供的基于统计方法自动获取的搭配词也有助于搭配学习。
最为有效的是一个称为“词语素描”(Word Sketches)的网站(/sampler/)(免费申请帐号即可)。
该网络语料库同样基于英语国家语料库,除了提供检索功能(concordance)外,还提供基于语法关系(grammatical relations)的分类搭配词统计。
以“job”为例,其提供的主要语法搭配类型有:①该名词做主语时的动词搭配(subject-of),如go (The job goes to somebody.);②做宾语时的动词搭配(object-of),如lose, create, get, quit, find, offer;③修饰该名词的形容词搭配(a-modifier),如good, part-time, full-time, temporary, well-paid, low-paid;④该名词修饰其它词时搭配(modifies),如loss, creation, vacancy, prospects, interview等等。
该网站提供搭配词的同时,点击某一搭配词,还能查看该搭配的所有检索行。
不同语法类别之间的搭配很有规律,对于中学英语学习应特别关注以下常用词类之间的搭配:“动词+名词”、“形容词/名词+名词”、“名词+动词”以及“动词+副词”等。
这些丰富的搭配词不仅有助于语言学习,还能丰富词汇百科知识,甚至揭示词汇文化信息。
语言搭配常常和结构密切相关,对语言搭配应特别注意框架结构(framework),即前后评语相对固定,中间可插入一个或多个语言项,如“a ____ or two”。
这可通过BNC在线检索的通配符功能进行检索(符号“*”代表一个或
多个任意字符串或一个单词),如检索关键词“a * or two”能检索到100多个这样的搭配,如a (day, thing, word, mile, step, glass, drop, line, generation, pound, page, friend) or two等。
对这些搭配分类将更有助于语言吸收,如“a +(时间、事物、距离、货币名词等)+ or two”,这也应是语言教师的一项经常性的工作。
3)揭示构词规律
利用BNC在线检索通配符功能还可以展示构词规律及其实例。
如考察“good-looking”是否有其它“good + V-ing”的构词,通过查询表达式
(good-*ing)检索到如下类似用例:good-sounding (guitar), good-paying (position), good-tasting, good-thinking等。
当然,英语单语语料库还能用于其它课堂教学活动,如通过大量语用实例帮助辨析同义词;通过检索某一具有语法结构的表达,如“be gong to”,以呈现语法运用或引导学生归纳,甚至可通过检索某些结构尝试寻求写作或口头陈述(life is…)等更广的信息。
总之,我们只要掌握了网络语料库的基本功能,在教学实践中就能根据具体需求创造性地加以运用。
2.英汉平行语料库
除了单语语料库,网上还有英汉平行语料库(parallel Corpora)。
平行语料库能对源语文本和其译语文本进行检索,并对照显示。
大量语境充分的双语对照语言实例是单语语料库和词典(包括双语词典)无法比拟的。
这为了解语言规律,特别是从汉语角度看汉英转换,提供了全新的视角。
中科院计算所软件研究室开发的网上双语句对数据库(mtgroup.ict. ac. cn/corpus/query_process.php)有18万对已对齐的中英文句子,提供简单中英文查询服务,能帮助学习者查询翻译时(尤其是汉译英)的疑难表达,并往往能提供某一词语或结构在语际转换时的多种表达,这为翻译时根据不同语境选择最佳对等词,提高英语表达的灵活
性和得体性等都大有裨益。
我们以“相形见绌”为例:
1)他游得这么好,真叫我相形见绌。
He’s such a good simmer that he makes me look sick.
2) 我原以为自己画得不错,可比起你的画儿来未免相形见绌。
I think I am quite a good artist, but your painting put mine in the shade.
3) 他的成功使我相形见绌。
His success overshadowed mine.
三、搜索引擎的运用
搜索引擎是“信息检索”的工具。
对于英语学习,人们一般利用google或Yahoo查找背景知识或主题/话题等(Eastment, 2003)。
人们很少意识到,由于搜索结果提供两至三行包括关键词所在语境的网页内容,可将其巧妙用作语料库,尤其适合两个或两个词以上搭配用法的查询(连续和非连续搭配均可)。
搜索引擎用作语料库有自己的优势,如语料量极大。
专门语料库虽然也很宠大,但相对于丰富多彩的实际语言运用,有时难免会有局限。
另外,搜索引擎检索的语料是动态的,更新、更快、更容易提供接近时代、接近生活的语言实例。
这样的语言输入更有信息量,更能使学习者将其与自己的语言运用联系起来(personalizing),从而引起学生关注(noticing),促进语言输入(input)顺利转化为语言吸收(intake)。
这种查询往往需使用高级检索技巧,如加引号能将整个表达式当成一个整体进行精确查询。
人教版普通高中课程新标准实验教科书《英语》第五册第四单元有这样一句话:“Have you ever had a case where somebody accused your reporters of getting the wrong end of the stick?”划线部分可视为一个固定搭配(结构)。
要想提供更多该结构用例,词典自然无能为力,上面提到的两个在线语料库也检索不到任何实例,这时搜索引擎便显示了它的优势。
如将这一结构作为检索词(注意加双引号),可检索到如下例句:
1)Have you ever had a case where you thought the probability of a
certain outcome was high, say 90%, but the market went otherwise from your expectation? What did you do then?
2) Have you ever had a case where you did not know occurred and had to seek other’s advice?
搜索引擎不仅可用于揭示语言运用规律,也可用于查询没有把握的英语表达,观察该表达是否被母语者广泛使用。
如汉语“小雨”,当不能肯定其对应英语表达是“small rain”或“light rain”,或者两者皆可时,我们便可以在网上搜索。
不过我们应充分认识到开放的互联网语料库自身的不足,为保证语料的可靠性,需要查看网址来源、文章作者等以判断某一语料是否来自英语本族语者。
当然,前文提到的网络语料库也可以用来验证有疑问的英语表达,如“light rain”在BNC中检索到47个语例,而“small rain”则只有一个语例,哪个更地道就显而易见了。
由此可见,专门的语料库和直接利用网络资源的开放语料库各有优势和局限,适合不同类型问题的查询。
一般在专门的语料库无法满足需要时,我们可求助规模更大的开放语料库;二者也可相互补充。
四、结语
充分且真实地道的语言输入是外语学习的重要条件,网上各种语料库工具正是提供这种资源的有效途径之一。
这些丰富而典型的实例无论是教师归纳讲解,或是课堂实时演示,或是改编成练习,或是学生自主检索和探索学习,都能极大促进语言教学与学习效率,促进所学语言内化。
由于语料库的语料对中学生难免会有一些难度,教师对语例的选择和归纳应是不可或缺的工作。
教师和学习者均应具备强烈的语用实证意识,对任何语言疑难问题、语用和搭配规律等都应尽可能利用多种工具查询,尽力寻求客观而充分的解释。
参考文献:
1.Eastment, D. (2003) Googling. ELT Journal, (1): 91-94)
2. 谢家成“个人英语教学语料库的运用”,《电化教学》2004年第2期。