“从来”语法化的语料库驱动研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“从来”语法化的语料库驱动研究
“从来”在现代汉语里作为一个表加强否定的语气副词使用。我国当前从汉语词典编纂到汉英词典编纂再到对外汉语词汇制定及其英文翻译,对“从来”一词的解释及应用存在一些弊端。本文对汉外词典编纂和对外汉语词汇教学提出了建议,并从汉语史的角度,应用语法化理论探讨了“从来”由名词向语气副词的演变历程,提出了“从来”的语法化斜坡(cline):动词>地点名词>时间名词>时间副词>语气副词>零(zero)。
标签:语料库从来语法化词汇化演变
一、介绍
梁银峰(2009)指出,“从来”由“所从来”演变而来,此过程大约自南北朝时期开始。我们的分析与该结论基本一致,但观察到演变始于东汉。为了本文的完整性,我们约略保存这部分论述。然而,其“语言经济性原则”难以清楚地解释“所”脱落的原因。因此本文历时部分的一个新问题是:“所”为什么脱落?另外一个问题是:“从来”为什么多与否定词搭配?
二、“从来”的语法化共时研究
(一)现代汉语中“从来”的语义和语法特征
《现代汉语词典》(2005)对“从来”的注释是:“从过去到现在(多用于否定句)”。我们发现:第一,多数“从来”句与否定结构搭配,往往只加强了否定意味,不重在表时间,因此语义上不符合时间副词的定义。第二,“从来”在语法上也不符合时间副词的定义。“从来”与否定副词连用时,二者并不是平行关系,“从来”修饰否定副词,然后再与否定副词共同修饰谓词性结构,如“他的一号工作服[[[从来]不]系扣]”。既然单纯修饰否定形式的“决”可以划入语气副词,那么也应该把一部分“从来”划入语气副词。这样分类有利于认识副词的个性,有利于把握词汇系统的不同时间层次。第三,作为时间副词的“从来”主要出现在近代汉语中,它与现代汉语中的“从来”相比语法位置灵活得多,其主要结构有三种:a.从来+NP+(Neg.)+VP;b.NP+从来+(Neg.)+VP;c.NP+从来+VP1+Neg.+VP2 (1)从来幽并客,皆向沙场老。(唐·王昌龄《塞下曲》)
(2)侍者回举似师。师云。我从来疑着这汉。(唐·慧然《镇州临济慧照禅师语录》)
(3)后主谓曰:“我从来待卿不先余人,今日见卿,可谓岁寒知松柏后凋也。”(唐·李延寿《南史·卷二十六》)
唐为群(2007)指出,“从来”有表“时态”的作用,并分五点论述。其中第三点,“从来”有时也指向“将来”,第五点,“‘从来’能加强说话人或叙事者的主观性”,一并在表“时态”的框架下探讨不合适。其实,这两点所描述的“从来”是语法化为表强调尤其表加强否定的语气副词的典型例子,第五点更是主观化的表现。即便是第二条,作者分为隐含的和明确的时间起点或终点也甚牵强。
(4)他从来没有对任何人讲过他的隐私。
(5)四十岁以后,他遇到事情就从来没有惊慌失措过。(张炜《秋天的愤怒》)
对于上面两个例句,问题不在于第一句“从来”所指的时间起点是隐含的,第二句所指的时间起点是明确的,关键在于“从来”已虚化为表加强语气的副词。为了进一步证明该判断,我们利用北大现代汉语语料库(网络版)①:兰卡斯特汉
语语料库(The Lancaster Corpus of Mandarin Chinese,下文称LCMC)②:进行调查统计。北大现代汉语语料库汉字总字数③是264444436,汉字字种数是9552。在此语料库检索系统中输入“从来”,共出现15073条结果。通过仔细观察发现,“从来”后面常跟“没”“没有”“不”“也不”“不曾”“未”“就不”“就没有”“都不”“都没”“都是不”等这类表否定的词或短语,即它们的共现频率很高。
表1:否定式“从来”词组的频次表
短语频次
从来不 3537
从来没 7264
从来未 163
从来只 62
从来也只0
从来也没646
从来也未15
从来就不271
从来就没425
从来就是不8
从来就是没 2
从来都不171
从来都没164
从来都只13
从来都是只 2
从来都是没 3
从不7583
从没3119
从未7618
“从来”否定结构频次之和除以“从来”的频次便可得出一个百分比P,从这个百分比的大小可以看出“从来”与加强否定意味功能的密切程度有多大。P=(3537+7264+163+62+0+646+15+271+425+8+2+171+164+13+2+3)/15073=0.84561799≈85%。显然,85%这个百分比是很大的。而我们所调查的也只是部分否定短语,肯定有疏漏,因此这个数字是相当保守的。唐为群(2007:83)通过200万字的语料调查发现:否定句占“从来”句总数的92%。两则数据相近,也就共同证明了我们一开始的判断:“从来”在现代汉语中主要并不表示“从过去到现在”,而早已被语法化为这样一个起加强否定意味的副词。作为语法化的特征之一,“一个实词的语法化过程往往会导致其语音形式的弱化”(石毓智、李讷,2001:3)。由于“从来不”和“从来没”的使用频率很高,因此它们很容易进一步语音弱化,漏掉中间的“来”而词汇化为“从不”“从没”。“从来未”的使用频率虽然相对较低,但也可能受到前两个结构词汇化的影响,在类推机制下变为“从未”。现在,两种形式并存,但新起的形式有很大的优越性,符合汉语双音节的特点,因而在使用频率上后来居上。下面来探讨一下不同题材范畴中的“从来”的语法化程度问题。
“LCMC语料库是一个100万词次(按每1.6个汉字对应一个英文单词折算)的现代汉语书面语通用型平衡语料库”(许家金,2007)。该语料库可按题材范畴的不同来检索,非常方便统计。下面是LCMC分别对“从来”“从来不”的自动统
计结果,为保持原貌,我们根据许家金(2007)LCMC的取样范畴表做了必要的翻译。表2:LCMC里“从来”的分类词频统计表④
File name Raw frequency Frequency per 10K words
新闻报道 5 0.595238095238095
社论0 0
新闻评论0 0
宗教0 0
技术、贸易0 0
通俗社会生活 1 0.4
传记和杂文15 2.11267605633803
报告和公文0 0
学术、科技 1 0.357142857142857
一般小说 6 1.46341463414634
侦探小说 6 0.705882352941177
科幻小说8 1.33333333333333
武侠小说 1 0.181818181818182
爱情小说10 1.49253731343284
幽默故事 1 0.303030303030303
Total 54 0.786026200873362
表2显示,“从来”在传记和杂文中词频最高,接下来从高到低排列分别是爱情小说、一般小说、科幻小说、侦探小说、新闻报道、通俗社会生活、学术科技、幽默故事、武侠小说(武侠小说虽是小说,但有些地方喜用浅近文言,故口语程度不及其他小说),在其余的取样类型中没有出现,如社论、新闻评论、宗教、技术商贸、报告和公文等,它们口语化程度都不高。由此,可以看出,“从来”是口语词,在愈是口语程度高的文献里,它的词频就越高。在表3中,口语化的“从来不”的词频分布大致和表2相同:如“从来不”的最高词频还是在爱情小说、一般小说、传记杂文、幽默故事、侦探小说里,只是次序稍有不同。我们推测类似“从来不”的表达是“从来”进一步语法化的新兴结构,它们还没有全面反映在我们语言中,或者该语料库由于规模较小、各类型文本比例不够合理而使其代表性欠佳。要证实这个推测,需要系统地进行溯源,对“从来”的语法化历程进行研究。
表3:LCMC里“从来不”的分类词频统计表⑤
File name Raw frequency Frequency per 10K words
新闻报道0 0
社论0 0
新闻评论0 0
宗教0 0
技术、贸易0 0
通俗社会生活0 0
传记和杂文 3 0.422535211267606
报告和公文0 0
学术、科技0 0
一般小说 4 0.975609756097561
侦探小说 2 0.235294117647059
科幻小说 1 0.166666666666667