基于语料库的词语搭配研究与对外汉语词汇教学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于语料库的词语搭配研究与对外汉语词汇教学
中高级阶段的对外汉语词汇教学中,留学生在词语搭配方面所犯的错误比较突出。
出现词语搭配偏误的原因在于汉语缺乏形态变化、教师教学的疏漏和学生的个体差异三个方面。
本文基于语料库的对外汉语词汇教学,采用定量和定性相结合的方法,概括出词语的搭配特征和范围,帮助学生构建词语的搭配模式,并加以训练,以便形成学生的词汇网络。
标签:语料库词语搭配对外汉语词汇教学
一、问题的提出
词语搭配是指词的横向组合关系或共现关系,即哪些词可以与另一些词搭配使用或共现在一个句子中。
英国语言学家Firth是最早注意到语言中的搭配现象并提出“搭配”这一概念的专家之一。
他曾说:“You shall know a word by the company it keeps.”(1957)。
张志公先生也曾指出:“在任何语言里,词语搭配都是一个重要问题,在汉语里,尤其突出。
”(张寿康、林杏光主编《现代汉语实词搭配词典》)。
从客观角度讲,汉语缺乏形态变化,词与词搭配起来无语法形式的约束,只要意义上、逻辑上说得过去就可以搭配,很自由、很灵活,所以搭配的结果也就异常丰富,因此,无论是在汉语作为母语还是作为第二语言的习得中,关于词语搭配的教学都显得非常重要。
我们知道,语言由大量的板块构成,汉语的语言板块尤其丰富,以虚词为出发点,可以组成大量的语言板块。
但以往的研究和教学,对由虚词构成的语言板块尤为重视,教学中也常常以此作为重点;另外,汉语的固定短语也异常丰富。
如成语、俗语、惯用语,都是作为一个词块进行教学的。
汉语中还有另外一块,即实词与实词的搭配,这是一个很大的类,包括形名、数量名、动名、形动、副动、副形等许多子类,并且每一类涉及的词语非常丰富,尤其是动名、形名的搭配。
在实词的搭配方面,以往的研究缺乏可操作性。
教师大多数时候都是在不自觉地培养学生的语感,在词汇教学中没有将其作为一个语言训练项目。
对外汉语教学的教学对象是来自海外的留学生,他们缺乏汉语语感。
尽管中高级阶段的留学生已经掌握了相当数量的语汇,但用某一词语时也常常会遇到不知道该用哪个词与之搭配的问题,或出现搭配偏误。
二、偏误语料分析
笔者曾对中高级阶段的20位留学生的词语搭配使用做过详细的记录和分析。
他们分别来自韩国(16人)、泰国(3人)和日本(1人)。
其中男生9名、女生11名;年龄分布在18~40岁之间,20~28岁的占总数的四分之三,有15人。
语料来源是他们一个学期的综合课作业,包括造句、看图写话和话题作文,凡是有语病的句子都抄录了下来,共抽样得到1000个句子,总字数为17000字左右。
我们将词语搭配模式概括为四种类型:语法搭配、语义搭配、语音搭配和语
用搭配。
语法搭配指词语之间按照语法规则进行的搭配。
这是关于词类关系的一种高级抽象,如V+N、ADV+V等。
如:
病(26):人们的平均寿命越来越增加。
“越来越”之后的共现词应该为形容词。
如“越来越好”“越来越快”。
也可以是心理动词。
如“越来越高兴”,但不能是其他词类。
“增加”是普通动词,所以应改为“寿命越来越长”或者“寿命不断增加”。
语义搭配是指共现词之间在语义上要具有合理性。
如:
病(405):为什么我的爸爸选拔妈妈做新娘?
这是同义词“选”“选择”与“选拔”使用不当的例子。
“选拔”的意义是“挑选提拔”,其语义重心在“提拔”,常与“人才”或“干部”搭配。
对“妻子”“丈夫”“新娘”“新郎”都是“挑选”“选择”,而没有“提拔”的意思。
因此,“选拔”应改为“选”或“选择”。
语音搭配是指共现词之间音节节奏韵律要和谐。
如:
病(115):国庆节即将来。
汉语的音节具有声韵调统一的特点。
音节之间具有相同的音长,通常每两个音节构成一个音步,两两搭配,节奏匀称,和谐流畅。
“即将”是双音节词,一般应与双音节词搭配,所以“即将来”就不如“即将到来”或“即将来临”好。
语用搭配是指共现词要符合语境的一致性,包括背景信息、语体风格等。
如:
病(162):自然是万物的妈妈。
整句是书面语色彩,而“妈妈”是口语词,所以应改成“母亲”。
统计发现,属于搭配不当的有158例,各种搭配不当所占比例如下表:
表1:词语搭配类型
搭配类型数量比例
语法搭配57 36.07%
语义搭配81 51.27%
语音搭配14 8.86%
语用搭配 6 3.80%
由此可见,在这四种搭配模式中,语义和语法搭配不当的占了将近90%,语义搭配不当的占了50%还要多。
如:
病(702):韩国总统树立了交通法案。
很显然,此句中“树立”和“法案”语义上不搭配。
再如:
病(294):我的钱包里一股脑儿有十块钱。
病(255):我只有一股脑儿七块钱。
病(263):你们放心吧,今天我请客,你们一股脑儿吃吧。
这几句的错误在于对“一股脑儿”一词的用法没有掌握好。
“一股脑儿”不能和“有”这样的动词搭配;虽然它能和“吃”搭配,但整个句子不完整。
“一股脑儿”一词在使用上有语义搭配上的限制。
后文有详细分析。
有的句子还并存了几种搭配错误。
如:
病(927):我盼“成千上万的失学青少年”的现象遥远地消失。
此句并存了语义搭配和语音搭配两种错误。
此句的意思是“希望这种现象不再存在”,所以是时间上的问题,并且是表示将来的时间。
“遥远”既可以表示过去,又可以表示将来,此句的“遥远”应该为“永远”。
另外,在音节上也不和谐,“盼”使用上常常对举,如“我盼星星、盼月亮,终于等到你了。
”如果单独使用,或者后边加“着”或者改为双音节“盼望”,因此,此句应改为“我盼望‘成千上万的失学青少年’的现象永远地消失。
”
三、纠正偏误的思路
通过以上分析发现,语音、语用、语法搭配相对来说比较容易把握,学生学习起来也比较容易。
语义搭配灵活多样,要想概括出搭配特征不是件很容易的事,况且这方面的研究成果不是很多,尤其是对词语搭配特征进行概括的成果很少。
在这方面,《现代汉语实词搭配词典》为我们提供了一个典范,但缺乏概括性,更没有根据频度做出系统的分析。
另外,汉语的近义词非常多,近义词可区别的角度很多,意义、用法都有不同,用法的不同很重要的一个方面是搭配的不同。
很多工具书对近义词的辨析往往是解释性的,缺乏在充分的语料基础上的对比分析。
在丰富灵活的搭配和缺乏可借鉴的工具的情况下,留学生要掌握词汇大纲中的5000常用词的“形、音、义、用”是需要时间和过程的,因此,发生偏误就不足为怪了。
所以,本文的研究重点就是实
词的语义搭配和形近词的搭配特征。
焦点在于我们在现有成果和技术条件下,如何帮助学生减少这方面的错误、扩大词汇量、增加用词的准确性。
(一)词语搭配体现的是词与词的组合关系,但并非所有的词都可以组合,呈现出类聚性特征,因此,可以概括出词语的搭配特征。
在没有大规模语料库之前,词语搭配研究的语料有限,基本上是基于定性的分析。
在有了大规模语料库之后,词语搭配研究的手段更新,可以基于语料库把定量和定性分析相结合,因此,我们提出了基于语料库的方法。
语料库为北大CCL现代汉语语料库,内容涵盖了文学、历史、法律、新闻、词典、口语等各种题材,总字数为264444436个字。
从语料库中检索出某一词语的所有搭配词,然后概括出搭配特征,建立词语的搭配模式。
重点建立实词与实词的搭配模式,尤其是动词、形容词、部分名词、副词、量词的搭配模式。
具体操作如下:从语料库中检索出某一词语的符合条件的搭配词,然后将搭配词按词频统计,并归纳出它的义类,描写出它的搭配特征,再按词频由高到低给出例证。
如果将这样概括出的搭配特征告诉学生,帮助学生建立起词语的搭配模式,就能减少学生的错误,遇到错误时也能做出解释,而不是仅凭语感和经验。
根据这个方法,可以对病句(702)中“树立法案”做出全面的解释。
我们从语料库中分别检索出和“树立+名”“动+法案”中的名词和动词,结果如下:
表2:“树立”的搭配词及频数
中心词搭配词(名) 频数
树立+ 观念意识1809
形象419
榜样236
风气168
信心161
理想125
丰碑97
典型82
道德68
权威57
牌子43
表3:“法案”的搭配词及频数
搭配词(动) 中心词频数
通过+法案234
提出33
否决24
制订21
签署18
提交15
推出15
调整9
执行9
修改9
讨论 6
由以上分析可知,“树立”的搭配词具有[+抽象]的语义特征,和具体事物搭配时仅限于标志、招牌等;而“法案”具有[-抽象]的语义特征,并且它的搭配词一般限于表“提出、制订、通过、签署、否决、推出”等动词,它不和“树立”共现。
根据此句的意思,应改成“签署、制订、否决”等动词。
副词的用法主要表现在和它搭配的动词上,学生作业病句中“一股脑儿”一词,我们从语料库中检索出它的索引共有125条。
通过分析发现,和“一股脑儿”搭配的动词一般动作性很强,动词后通常要有宾语或补语,要给表述对象一个处所、趋向、结果等。
极少的情况可用“动+了”或单个动词,单个动词往往是表动补关系的动词。
如“勾销、揭露、推翻、毁灭”,具体情况见下表:
表4:“一股脑儿”的搭配词及频数
中心词搭配词频数
一股脑儿+ 单个动词 4
动作性动词+ 趋向补语40
结果补语 6
处所宾语40
间接宾语14
了 2
“有”不是动作性动词,所以不能和“一股脑儿”共现;而“吃”动作性很强,但只是用了单个动词,没有表补充关系的词和它共现,所以表达不完整。
近义词的搭配特征和范围也可用语料库的方法加以区分,构建它们不同的搭配模式。
如“选拔”和“选择”,它们在动词的用法上除词义的不同之外,就是搭配的不同了。
我们从语料库中分别检索出二词的索引,“选拔”为1546条,“选择”为8847条,得出如下统计特征。
表5:“选拔”的搭配词及频数
中心词搭配词(名) 频数
选拔+ 干部677
人才175
领导92
选手53
学生47
佼佼者30
能人19
某个人18
非人 6
表6:“选择”的搭配词及频数
中心词搭配词(名) 频数
选择+ 具体事物1350
抽象内容979
机构660
道路655
方式619
地点454
人436
职业242
时间165
通过分析可知,“选拔”的对象一般为从事某种职业的人或某类人才,极少和表示作品的词搭配,在统计中,只发现29例。
“选拔”本身有[+提拔]的语义特征,并且其搭配词带有[+优秀]的语义特征,或者前面有表示“优秀”的定语。
“选择”本身为[-提拔]的语义特征,并且搭配词为[-优秀],选择的对象为事物、机构、方式、道路、地点、人、职业等,搭配范围较广,和“选拔”的区别非常明显。
病(405)中的“妈妈”一词为[+人,-优秀],所以和“选拔”搭配不恰当。
(二)在采用语料库的方法统计概括之后,教师对词语的搭配模式了然于心了,应加强对学生的训练,将词语搭配模式落到实处。
首先,将词语搭配教学即“词块”教学作为词汇教学的一个重要方面,多呈现词块,并有意识地引导学生注意。
教师可用演绎法,概括出某词的搭配范围和特征,并在例句中呈现其典型搭配,帮助学生建立词语的搭配模式。
如病(688)“由于付出了很多贡献,所以他当老板是当之无愧的。
”此句中学生把“付出”与“做出”两词的搭配混淆。
“付出”常和“代价、努力、劳动、心血、生命、汗水”等词搭配,而“做出”常和“贡献、努力、决定、成绩、选择、反应”等词搭配。
明确了典型搭配后,就要给学生感性的认识,即在例句中出现,而不是枯燥地使用几个搭配结构,帮助学生构建词的搭配模式。
有的搭配词非常少,也可以用归纳法,给出例句,让学生自己概括,最后由教师总结,并告诉他们属于有限的搭配。
如“从容”一词表“宽裕”的义项,在检索到的所有包含“从容”的索引中,只有6例,其中4例是时间~,1例是手
头~,1例是生意~。
可见,“从容”的搭配词包括“时间、手头、生意”等有限的几个。
通过自己的概括,学生头脑中就建立了它的搭配模式,即“时间从容、手头从容、生意从容”。
其次,加强训练,多做词语搭配方面的练习。
这样做有助于将典型的频率高的搭配结构在学生的头脑中固化,让学生看到一个词的时候能联想起它习惯上跟哪些词在一起,从而使它们变成一个词块,而不是一个一个孤立的词。
如学生在练习中出现了“承担信息”“承受责任”这样的搭配,就是由于不了解“承担、承受”的典型搭配方式。
鉴于此,我们可以把从语料库中检索出的典型搭配方式呈现给学生,让学生记诵。
按词频由高到低排列,“承担、承受”二词的搭配词分别为:承担+责任、风险、义务、费用、任务、工作;承受+压力、费用、风险、价格、负担、痛苦。
为了加深印象,可以用这些搭配后的词块做造句练习,具体方式为:让学生先在它们后边填上搭配词,然后用整个词块造句。
另外,修改病句也是一种很好的练习方式。
把一些错误的词语搭配呈现在句中,让学生指出错误并改正。
为了调动学生的积极性,可以做集中练习,并将学生分组,以比赛的方式激发学生学习的兴趣。
也可以将词语搭配练习放置在语段中。
具体操作方式为将几个相近的词放在一起,然后让学生根据语义和搭配词选择填空,这在高级阶段汉语水平考试中很常见。
如:
农村孩子,尤其是偏远山区的孩子,要上大学是多么不容易,家庭要_______过重的读书费用,学生本人要_______巨大的心理压力,为了达到同一目标,农村孩子要比城里孩子付出更多的代价和汗水。
A.承担承受
B.承受承担
不管选择何种操练方式,都应该尽量在句中或段落篇章中实现,而不是孤立的一个一个的词块。
通过以上训练,看似学的是一个一个的词,实则是在构建学生头脑中的词汇网络,建立起词汇的横向联系,将语言板块固定在他们的头脑中,以便提取时作为一个整体,而不是一个一个孤立的词。
四、结语
词语搭配研究与教学中暴露出的问题应引起我们足够的重视。
对外汉语教师在词汇教学中应当兼顾词的形、音、义、用,特别要构建词的搭配模式,并进行充分合理的训练,以求取得更好的教学效果。
在上述个案分析的基础上,在条件成熟的情况下,建立基于语料库的词语搭配数据库。
具体方式为选择词汇大纲中的常用实词,逐个分类进行搭配模式的构建,并且举出典型用例,构建一个词语搭配的集合,实现资源共享。
参考文献:
[1]徐子亮.对外汉语教学的模式构建[J].华东师范大学学报,1999,
(4).
[2]徐子亮.对外汉语教学的模式匹配[J].汉语学习,2000,(2).
[3]濮建忠.英语词汇教学中的类联结、搭配及词块[J].外语教学与研究,2003,(6).
[4]卫乃兴.基于语料库和语料库驱动的词语搭配研究[J].当代语言学,2002,(2).
[5]林杏光.论词语搭配及其研究[J].语言教学与研究,1994,(4).
[6]李子云.词语搭配的制约因素[J].安徽教育学院学报,1995,(3).
[7]李葆嘉.汉语词语搭配和义征的提取辨析[J].兰州大学学报, 2003,(6).
[8]李晓琪.关于建立词汇——语法教学模式的思考[J].语言教学与研究,2004,(1).
[9]Firth.J.R..Papers in linguistics 1934-1951[M].London:
Oxford University Press,1957.
(刘凤芹青岛大学汉语言学院266071)。