《语料库数据驱动专业文本语义韵研究》评介

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《语料库数据驱动的专业文本语义韵研究》评介

摘要:语义韵是语料库语言学开辟的一个新研究方向,成为语言学领域一个重要的研究对象。它正在得到西方语言学家越来越多的重视。然而在中国,这还不为大多数语言研究者所熟悉。本文以上海交通大学卫乃兴教授于2002年发表于《当代语言学》刊物第2

期中的一篇名为《语料库数据驱动的专业文本语义韵研究》的文章为例进行分析总结,以期对语义韵研究的范围,方法及其研究意义有初步的了解。

关键词:语义韵研究方法意义评介

中图分类号:h030 文献标识码: a 文章编号:1672-1578(2013)01-0033-02

1 文章的研究内容、方法及语料来源总结

研究对象:专业文本中的语义韵

研究方法:计算搭配词和随机提取词语索引两种方法。

(1)提取节点词在跨距内的搭配词并确定显著搭配词(significant collocates)概括语义韵。节点词即笔者欲研究其搭配行为的关键词。文中取词形(word form)为基本研究单位,包括“cause, incurred, utterly probability, career”等。搭配跨距将界定为-5/+5,即在节点词左右各取5个词为其语境;所有落入跨距内的词形将被视为节点词的搭配词(collocates)。统计测量采用z值,凡是与节点词共现之z值达2.0者将确定为显著搭配词。使用的主要工具有wordsmith等检索软件。

(2)随机提取一定数量的词语索引(concordances),参照类联接,描述语义韵。文中提到的类联接即词语搭配出现于其中的句法结构(mitchell1975)。

语料来源:拥有400万词容量的上海交通大学jdest语料库。并参照cobuild语料库数据,进行对比研究。

2 文章具体研究过程概述

作者明确了各操作定义。如语义韵(semantic prosody),即关键词项的典型搭配词在其语境中营造起的语义氛围(sinclair 1988, 1991; louw 1993; stubbs 1996)。以及语义韵大体可分为积极语义韵(positive prosody),中性语义韵(neutral prosody)或错综语义韵(mixed prosody)等类别(stubbs 1996:176)。其中各类的定义将在下面论述中提及。

文章基于语料库证据,采用两种常规方法,以“cause,incurred, utterly,probability,career”等为例研究专业文本中的三类语义韵特点。现将各研究过程论述如下:

2.1“cause”的强烈消极语义韵

作者用wordsmith 检索,词形“cause”在jdest中共出现949次。按照-5/+5的跨距提取搭配词,可提取9490个。通过z值检验,可提取显著搭配词,同时排出因偶然因素落入跨距的,对节点词并无预见力的词项。统计数据显示,达到显著标准的搭配词有“damage ,failure, problem, trouble”等52个。得到所有搭配词的共性是都具有消极语义特点。对比cobuild中“cause”

的语义特点,得知“cause”在两个语料库中的语义特点相同,不同点在于语域差异。另外用wordsmith统计显著搭配词的距位分布位置和次数等信息,得到“cause”的消极语义氛围极为浓重。并对比cobuild中“cause”的索引显示,普通文本中“cause”的消极语义氛围远没有专业文本中的浓重。

简评:作者是以怎样的标准对比得出的“cause”在普通文本中远没有其在专业文本中的浓重,是消极搭配词词形数量少,还是使用频率低,又存在多大程度上的差别才称的上“远”都没有给出明确说明。

2.2“incurred”和“utterly”的消极语义韵

作者指出jdest中的证据表明,相当多的准技术词具有消极语义韵。并列表显示“incurred”的显著搭配词数据。得出结论“incurred”具有消极语义韵。另外,查询cobuild中对“incur”一词的定义,认为定义中的“unpleasant, as a loss, cause it o happen”等词同样揭示了“incurred”具有消极语义韵。

采用随即提取词语索引的方法研究词性形“utterly”的语义韵。其在jdest的一个子库里出现了78次。每隔3行取词1,共提取20行词语索引。分析数据得到:①节点词在 adv+abj 类联接中的绝大多数搭配词都具有消极语义特点。极少数显示中性语义特点的例子中,节点词在其扩张语境中仍与消极词项联系。②“utterly”在 adv+v 类联接中具有消极语义特点。

简评:首先,作者在对比“cause”一词在普通文本中的语义

韵时,参考了词汇定义。词汇定义固然能够在一定程度上反映词汇使用的语境,但是缺少翔实的使用情况分析,笔者认为不足以说明某词形的语义韵。否则是否所有词汇的语义韵都可以通过cobuild 语料库中所给出的定义加以判断呢?另外,作者指出jdest中,“相当多”的准技术词具有消极语义韵。但并没有指明有何依据。第三,作者只研究“utterly”在jdest一个子库中的使用情况,是哪一子库,能否代表该词在专业英语中的语义韵略有争议。第四,作者并没有指出 adv+abj和 adv+v 是“utterly”唯一两种类联接还是其主要类联接,是总结全部78次出现语句得出的还是提取20行索引后总结的也没有说明。

2.3 “probability”的错综语义韵

错综语义韵即节点词既吸引具有积极语义特点的搭配词也吸引

消极和中性语义特点的搭配词。作者指出,jdest证据显示,大部分准技术词具有错综语义韵。并以“probability”为例展开说明。该词在库中出现277次,其中115次用于n+of+n 和 n+of+v-ing

两个类联接。每隔3行取1,共提取30行词语索引。分析索引归纳“probability of”的名词搭配大致可分为3类:⑴具有中性涵义。该类搭配词有26个,占全部搭配词总数的23%;⑵具有明显的积极语义特点。共有搭配词11个,占搭配词总数的9%;⑶具有明显消极语义特点。作者将此类词放在n+of+n和 n+of+v-ing 两个类联接中进行了细致分析。结果:两组消极搭配词共有78个,占68%。该类搭配词中,“failure”和“error”的频数最高,分别出现了

相关文档
最新文档