建立在语料库基础上的汉语本体研究与对外汉语教学_以现代汉语离合词研究为例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解。钱先生的评价,就“排印、打电报、打字”来说,基本合理;只是对汉字的总体评价显得“以偏盖全”,“攻其一点而不计其余”和“矫枉过正”。但20世纪最后二三十年汉字处理电脑化成功实现后,他们论断的失当就显得非常明显。在汉字成功适应信息新技术的今天,仍然把这些论断视为至理名言,完全无视活生生事实,就真让人匪夷所思了。
参考文献
[1]周有光《汉字的技术性和艺术性》,刊于《科学地评价汉语汉字》(尹斌庸,苏培成选编,华语教学出版社,1994)12—16页
[2]高等院校文字改革委员会筹备组《语文现代化》71页,1980
[3]钱玄同《汉字革命》,《国语月刊》(汉字改革号),1923
[4]王开扬《汉字现代化研究》,齐鲁书社,2004
[5]苏培成《语言文字应用探索》,商务印书馆,2004
[6]潘钧《汉字研究文集》,云南大学出版社,2007
[7]马克思、恩格斯《马克思恩格斯全集》第7卷382页,人民出版社,1979
[8]马克思、恩格斯《马克思恩格斯全集》第30卷318页,人民出版社,1974
[9]许寿椿《文字处理技术的历史发展》见《文字编辑与电脑打字》(许寿椿编著,中央民族学院出版社,1989年)第一章[10]许寿椿《文字信息处理技术的三个历史时代和汉英文字比较》见《文字比较研究散论》(许寿椿编著,中央民族学院出版社,1993年,50—66页)
—文字信息处理技术的历史通观》,《中国计算机报》1992年,No.2,37,41版[11]许寿椿《电脑打字的历史文化意义——
[12]许寿椿《文字处理技术与汉字文化兴衰》,《现代与传统》第九辑74—79页,1995
[13]林立勋《电脑风云五十年》,电子工业出版社,1998
[14]王蒙《新世纪讲稿》,上海文艺出版社,2005
(作者为中央民族大学教授)
建立在语料库基础上的汉语本体研究与对外汉语教学
—以现代汉语离合词研究为例
——
王海峰王铁利
1.语料库与本体研究和语言教学
1.1语料库的作用
上世纪60年代初,世界上第一个机读语料库在美国布朗大学建成,此后大量的语料库陆续建成。我国的语料库建设开始于上世纪80年代,近些年来取得了长足的发展。
随着语料库的不断建设,人们的语言学理念也因之不断更新。Halliday(2004)指出,语料库最主要的优点是语料的真实性,真实的自然的语料之所以重要,是因为理想中的语言与实际运用中的语言是不完全相同的,本族语者的直觉并不总是准确的。
利用语料库进行语言研究的经验启示我们,通过对语料库进行大规模的语料调查,我们会发现一些习焉不察的语言规律。在语言教学上,语料库产生了巨大的影响,语言现象的分布和频率等信息可以用来指导教师确定哪些是教学重点和难点。
—以离合词为例
1.2语料库在汉语研究和教学中的必要性——
现代汉语离合词是当前汉语教学和研究的重点和难点。多年来人们对离合词的性质、用法、语法规律等各方面进行了许多有益的探索,但许多问题我们仍然没有得出一致的结论。
我们认为主要原因之一是,人们在讨论离合词问题时忽视了语言的客观实际,多凭语感去主观设想,因而一些问题众说纷纭,莫衷一是。“说到离合词,一般的语法书都指出可以在离合词中插入‘了、着、过’可以插入补语和定语。如果直接把这些规律搬到对外汉语教学中就显得线条太粗、太笼统。”(饶勤1997)由此看来,解决现代汉语离合词的教学与研究的难题首先要从摸清离合词的“底细”做起,而这个工作仅凭语感是不够的,必须借助于大型的语料库进行定量研究。
2.利用语料库考察离合词的基本理念及步骤
2.1基本理念
本研究主要借鉴语料库驱动的研究方法(corpus-driven approach)。这种方法主张语言学家要关注语料库本身,语言描述必须全面关照语料库提供的证据。理论陈述应完全和语料证据相符,即理论直接从语料证据中归纳出来并反映这些证据,语料必须保持原貌,不经任何加工。出现频率较高的型式及其分布是语法范畴的最基本证据。
语言表达的可能性与典型性应区分开,有些表达尽管在理论上有可能,但在实际使用中很少出现或几乎不出现;而另外一些表达上不但理论上可能,而且在实际使用中出现的频率很高,这是典型的表达。语料库驱动的研究方法关注的是后者。(参见Hunston&Francis2000,Tognini-Bonelli2001,王勇2008)2.2选定语料库
本文考察统计主要使用北京大学汉语语言学研究中心语料库(简称CCL语料库)网络版现代汉语部分,约1.15亿字。
2.3确定考察范围及理由
对《汉语水平词汇与汉字等级大纲》(国家汉办1992,以下简称《大纲》)中的离合词进行考察,摸清离合词家族的底细,进行深入研究。理由是:离合词问题不仅是理论问题,更是实践问题。我们的思路是在理论探讨的基础上,以满足对外汉语教学的实际需要为目标。
3.离合词及其离析形式考察统计结果及分析
3.1离合词的鉴定及其离析情况考察统计分析
3.1.1离合词的甄别鉴定
《大纲》中有392个可离析双音结构,经过分析甄别,392个双音结构中,有45个双音结构没有出现离析现象(44个述宾结构,1个述补结构),我们认为,这些结构不具备离合词的典型特征,我们姑且不将其作为重点考察对象;29个述补结构也不宜看作离合词①。还有111个双音结构,如:干活、办事、送礼、降价等,经过分析鉴定,它们意义上基本是A和B的简单相加,因此接近或属于词组。这样我们认定的离合词就只有207个(见文后附录)。
3.1.2离合词的离析情况统计
3.1.2.1离析频率分析
为了更加准确地反映离合词的离析情况,我们要分析统计每个离合词的离析频率。离析频率公式如下(参照任海波等2005):
离析例数
——
离合词的离析频率(F)=——
——
—
——
——
有效例句总量
离析例数就是我们从语料中得到的含有离合词离析形式的例句数。所谓有效例句总量,是指出现该离合词的有效例句量和出现该离合词离析形式的例句量之和。
3.1.2.2离合词离析频率分布特点
离合词家族各成员离析频率不一样,有些离析频率高,有些离析频率低甚至基本不产生离析现象。请看表1: