基于语料库的《月亮与六便士》检索分析与研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
作者简介:宋晨曦,硕士研究生在读。
研究方向:应用语言学研究。
2基于语料库的《月亮与六便士》的检索结果及分析
2.1语言特点
本文主要采用定量与定性分析相结合的方法。
量化分析必定涉及文本的数据收集、整理与统计。
语料库软件AntConc的生成词表功能可以提供文本的统计数据,有助于分析文本的语言特点。
生成词表所具有的主要功能有类符数(word types)、形符数(word tokens)和频率表(frequency)。
类符数即是语料库中不同的词形,形符数则包括语料库出现的所有词语。
类符数或形符数本身并不能从本质上反映文本的语言特点。
但是二者的比率即类符形符比却能在一定程度反映用词的变化性。
类符形符比的计算方式是类符数/形符数×100%。
类符形符比值越大,也就说明用词变化性越大,用词越丰富,更具有多样性;反之则更少。
利用AntConc软件中的生成词表功能,笔者发现《月亮与六便士》共包括6840词类、76248词次,计算得出类符形符比为8.97,说明文章的用词变化量不大,整体难度不大,故事情节易于把握。
除此之外,生成词表中的频率表功能还可以迅速计算出语料库中的所有词类并按频率以降序排列。
我们利用生成词表功能对自建的小说《月亮与六便士》语料库进行检索后生成小说的高频词表信息,出现频率前50的词语分别是:the、I、to、and、a、of、he、was、that、in、it、you、his、had、she、with、him、her、for、not、but、me、at、on、Strickland’s、is、my、have、they、their、which、as、said、an、what、there、when、be、were、no、would、so、all、do、by、could、one、know、we和our。
这些高频率的词汇表明文中多次出现人称代词,词汇较为简单。
笔者发现去除语法虚词之后,词表中出现频率最高的实词是第一人称“I”,出现了2576次,且利用检索情节工具,笔者不难发现“I”贯穿全文始终,分布非常密集,如图1所示。
检索情节工具的检索结果以条形码的形式展示,能清楚地看到检索结果在目标文本中出现的位置。
“I”在全文中的密集分布,表明该小说采用第一人称视角的写作手法,即小说全文故事由“我”来叙述。
这样的叙事方法在小说创作中极为常见,可以使叙事接受者在理解故事情节时采取类似立场,并直接参与情节的安排,从而使虚构的小说故事更加可信(曹波,2001)。
以第一人称的视角描述可以吸引读者,代入感强,更能引起读者的共鸣。
另外,第二人称代词“you”位于第12位,根据检索情节图可知,“you”也贯穿全文,反复出现,证明该小说主要是以对话为主。
除此之外,在频率最高的50个词汇中,动词分别为:was、had、is、have、said、be、were、would和could。
“was”出现了1527次,排在第8位,是出现频率最高的动词,而动词“is”却未出现在频率最高的前20词汇中。
“was、had、have、said、were、would和could”均为过去式,这说明小说主要利用过去时态展开故事情节。
“said”作为频率最高的前50词汇中唯一的实义动词也是过去式,同时根据检索情节功能,“said”在文本中同样分布密集,人称代词也都多
次出现,进一步说明小说全文以对话为主。
第三人称单数“he,his,him”分别出现1771次、
925次和700次,而“she”和“her”则出现756次和695
次。
这表明小说主要是围绕男性角色展开。
“he,his,
him”出现的总次数(3396次)远远高于“she”和
“her”出现的次数(1451次)。
频率最高的前50词中有
且仅有的一个专有名词且为男性人名Strickland,说明小
说围绕思特里克兰德展开。
词表中的that和which分别
位列第9位和第32位,这两者均属于频率较高的词汇,
说明小说中从句比较普遍。
图
1
通过以上数据笔者可以得出小说文本篇幅中等,词
汇变化量较少、句子偏长、阅读难度中等偏上等写作特
点。
要想综合分析作者的行文特点,对字词的分析是远
远不够的。
探索整部小说的语言特点和风格,还需结合
原文进行仔细斟酌。
2.2故事情节
利用语料库检索软件AntConc的生成词表功能,笔
者可以得出每个词所出现的频率,这有助于了解小说的
词语表达。
了解文本的故事情节还需借助检索软件
AntConc的主题词表功能。
主题词表是指与参照语料库
对比后得出的具有超高频率的词汇表,可以帮助筛选主
要信息。
本研究所采用的参照语料库是Crown-CLOB中
的“Fiction”部分。
用主题词表功能对自建的语料库和
参照语料库进行对比检索后,得到的主题词表如图2所
示。
在图2的主题词表中,男性名字“Strickland”排在
第一位,其关键值为1926.74,远远高于排在其后的其他
主题词。
通过语料库的检索情节功能查看这一词,笔者发现
该词遍布小说始终,因此可以再次断定小说的主人公是
思特里克兰德。
在主题词表的检索结果中,除去主人公
思特里克兰德,关键值较大的人名还有“Dirk Stroeve”
“Ata”“Blanche”。
由此可以表征小说的故事情节主要发
生在思特里克兰德、戴尔克·施特略夫、爱塔和勃朗什
之间。
根据语料库检索软件AntConc中的生成词表、检
索情节和主题词表只能检索出一些语言的符号形式,但
是语境共现却能使这些符号串联起来变成具有意义和功
能的文本信息(何安平,2001)。
根据语境共线功能可
知,“Stroeve”是一个以发现美为己任的滑稽人物。
“Blanche”是他的妻子。
关键值最大的名词是“pic-
tures”。
收稿日期:2019-10-29
45
另外,“studio ”和“painter ”均与画画有关。
可知全文围绕思特里克兰德的画画展开。
关键值最大的地名是“Paris ”和“Tahiti ”。
检索可知,“Paris ”是思特里克兰德离开英国去画画的地方,那是他的梦开始的地方。
“Tahiti ”是思特里克兰德终生用来寻找适合作画的世外桃源,也是主人公的归属地。
这也是小说发生的两个主要地点。
同时,这两个地点也代表了主人公思特里克兰德追求画画梦想的两个不同阶段。
图
2
通过AntConc 软件中的语境共线功能结合关键词表
以“Strickland ”为检索词就可以得到有关“Strickland ”的索引行。
结合上下文分析,笔者可以了解小说的主要故事情节。
经过检索,共得到468个检索结果,如图3。
细致分析后笔者可知全文大意。
思特里克兰德是一个英国证券交易所的经纪人,他拥有着别人羡慕的生活,稳当的职业和美满的家庭。
但这一切都因他的离去而瓦解。
他像被“魔鬼附体”一样迷恋上了画画。
他离家出走,远赴巴黎追求自己的绘画理想。
他在异国他乡穷困潦倒,为寻找表现手法,生活上和精神上都饱受折磨。
经过一番遭遇后,他终究找到了适合自己创作的氛围。
他与土著女子爱塔在塔希提同居,创作出惊人的伊甸园之作。
后来,他染上了麻风病双目失明。
但在去世之前,他却命令爱塔在他死后将画作付之一炬。
毛姆延续他一贯的特点,以第一人称进行冷静客观的描写,挖掘人物内心深处的活动,却不去评判人性,一切交由读者定夺。
图
3
2.3角色刻画
通过主题词表功能可以检索出思特里克兰德是小说的主人公,结合语境共现功能可以检索出主人公出现时的所有上下文,由此可以分析作者对于人物的刻画。
以小说中的关键人物思特里克兰德和第三人称代词he 为关键词进行数据提取,可以更好地看出作者塑造人物的过程。
以下是通过语境共现功能搜索到的具有代表性的句子。
通过对检索出的微型语料库进行分析,可以分析毛姆笔下的主人公思特里克兰德的人物形象。
由于全文对话较多,本文截取内容多以对话为主。
“I tell you I ’ve got to paint.I can ’t help myself.When a man falls into the water it doesn ’t matter how he swims,well or badly:he ’s got to get out or else he ’ll drown.”
这是一段发生在毛姆与思特里克兰德之间的对话。
面对毛姆对自己抛弃妻子的指责,思特里克兰德说他必须画画。
也许这正是思特里克兰德与众不同的地方。
世人大多“死于二十五,葬于七十五”。
人到中年,普通人大多初心已改,在自己的青春里沦落或阵亡。
思特里克兰德却放弃自己证券经纪人的工作追求起了画画。
当毛姆问及妻子儿女怎么办时,思特里克兰德的一句“必须画画”足以见证他个体生命里对画画的那种疯狂状态。
“必须画画”也从另一个角度证明了思特里克兰德是个十足的天才。
他内心里对画画的向往,他所体会到的悸动,是别人无法感同身受的。
这是世世代代的理想与现实之间的矛盾,毛姆并未给我们确切的答案,而是延续他一贯的风格,用冷峻的笔触在描写。
“I don ’t want love.I haven ’t time for it.It ’s weak-ness.I am a man,and sometimes I want a woman.When I ’ve satisfied my passion I ’m ready for other things.I can ’t overcome my desire,but I hate it;it imprisons my spirit;I look forward to the time when I shall be free from all de-sire and can give myself without hindrance to my work.Because women can do nothing except love,they ’ve giv-en it a ridiculous importance.They want to persuade us that it ’s the whole of life.It ’s an insignificant part.I know lust.”
“The soul of man wanders through the uttermost re-gions of the universe,and she seeks to imprison it in the circle of her account-book.”
毛姆笔下的思特里克兰德先生不是传统意义上的画家。
他道德堕落,当戴尔克的妻子勃朗什因他而死,他仍冷漠以对,毫无人性,从不在乎别人感受。
他与勃朗什在一起,仅仅是因为他需要画一幅裸体画。
等他画完之后,他就对她不感兴趣了。
笔者也能从他的话语中看出她对女性的偏见。
“男人的灵魂在宇宙的最遥远的地方遨游,女人却想把它禁锢在家庭收入账簿里。
”通过“universe ”和“account-book ”的对比可以看出思特里克兰德对女人的偏见与厌恶。
“Don ’t you want fame?It ’s something that most art-ists haven ’t been indifferent to.”
“Children.How can you care for the opinion of the crowd,when you don ’t care two pence for the opinion of
作者简介:姜敏,本科。
研究方向:商务英语。
胡明珠,硕士,讲师。
研究方向:翻译与外语教学。
基金项目:福建省中青年教师教育科研项目(高校外语教改科研专项)“翻译写作学视角下英语写作的中式英语研究”
(JZ180102)。
47。