《炉边蟋蟀》的语料库分析田原

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《炉边蟋蟀》的语料库分析田原
发布时间:2023-06-29T09:31:41.150Z 来源:《时代教育》2023年8期作者:田原[导读] 为了研究《炉边蟋蟀》的内在涵义,作者对《炉边蟋蟀》的英文文本进行语料库分析,包括统计分析、词频分析和词汇聚类分析。

四川师范大学外国语学院四川成都 610068
摘要:为了研究《炉边蟋蟀》的内在涵义,作者对《炉边蟋蟀》的英文文本进行语料库分析,包括统计分析、词频分析和词汇聚类分析。

关键词:语料分析炉边蟋蟀词频分析
The Corpus Analyses of the Text of The Cricket on the Hearth
TIAN Yuan
(School of Foreign Languages,Sichuan Normal University,Chengdu,Sichuan 610068,China)
Abstract:For the potential implications of The Cricket on the Hearth,corpus analyses of the text are performed:statistics analysis,Word frequency analysis and Word cluster analysis.
Key words:corpus analysis,The Cricket on the Hearth,Word frequency
《炉边蟋蟀》秉承了狄更斯对小人物喜乐忧愁的一贯关注,通过讲述一场对爱情的考验、一段对真爱的追求,一次对家庭的守卫,用充满幽默感的文字讲述了一个关于爱与宽容的故事,传递了一种对于真善美的坚定信心。

我们对《炉边蟋蟀》的英文文本进行了语料库分析。

一,统计分析使用统计工具WordSmith Tools,我们得到了《炉边蟋蟀》的文本统计数据。

以下是统计结果的部分摘要。

N Overall 1 text file The Cricket on the Hearth.txt 1-letter words 1,261 2-letter words 5,139 3-letter words 8,073 4-letter words 6,479 5-letter words 3,627 6-letter words 2,458 7-letter words 1,962 8-letter words 1,191 9-letter words 849 10-letter words 406二,词频分析词频分析(Word Frequency Analysis)是文本分析的重要手段,它的基本原理是通过词出现频次多少的变化,来确定热点及其变化趋势。

因此,我们对文本进行了词频分析。

诸如the,and,to等功能词具有高频率,因此省略了这些功能词。

以下是按照降序排列的高频率的主要实义词。

N Word Freq.%
8 HER 476 1.49
9 IT 470 1.47
11 THAT 365 1.14
12 YOU 359 1.13
13 HIS 345 1.08
14 HE 329 1.03
15 SHE 302 0.95
20 SAID 235 0.74
21 HA VE 228 0.72
29 JOHN 161 0.50
31 LITTLE 148 0.46
34 TACKLETON 128 0.40
40 CARRIER 111 0.35
从这个频率表中,我们可以看到:出现频率最高的四个实义词是HER,IT,THAT,YOU,而这正是《炉边蟋蟀》的一大特点:全书采用第三人称叙事,以多特与约翰之间险些溃败但却最终甜蜜如初的爱情、爱德华与梅之间长久的等待与勇敢的抉择、贝莎与凯里卜之间被虚构的阴翳笼罩下恒常如新且愈来愈浓烈的亲情,勾勒出爱与宽容是多么伟大而美好的力量,它在现实之中如此容易被错过,却又如此被人惦念渴求。

另外,炉边的蟋蟀与炉上长久嘶鸣着的水壶都体现了对爱情的坚贞,故事中总有小蟋蟀的回响,而炉上水壶那蟋蟀般的歌声也具有永不止息的生命力。

三,词汇聚类分析
词聚类分析是通过文献聚类统计的方法,计算词之间的联系密切程度,并将距离较近的主题词聚集在一起,“形成一个个概念相互独立的类团,使得类团内属性相似性最大(Ullmann,1957:30)”。

使用单词聚类分析,我们发现出现频率最高的四个动词是was、said、know 和think。

N Word Freq.
10 WAS 394
20 SAID 235
58 KNOW 81
94 THINK 54
was出现了394次,是出现频率最高的动词;said出现了235次,是出现频率最二高的动词。

查询发现,was主要起语法结构上的作用,而said主要用在人物的对话中,两者都对于主题刻画的意义不大,因此暂不考虑。

词汇类聚分析能够揭示出作者的写作特征。

仔细查看数据,我们发现:know和think除了具有陈述事实的常规作用之外,还传递了小说中人物的主观愿望,也间接地反映了狄更斯希望人间充满爱与宽容的理想。

下面是动词know和think的同现集(concordance set)的一些样本。

N Concordance Set of KNOW
1 Ah dear! I don't know whether to laugh or cry,
2 we would choose.I don't know how young,and how hands
3 May was very pretty.You know sometimes,when you are N Concordance Set of THINK
1 surprise,and wanting time to think of what she did,she
2 loved my little Dot like me,I think!' He paused,and softly
3 in his mind;and he could think more soberly of what
总之,《炉边蟋蟀》是一部现实与奇幻完美结合的小说,其富有节奏感的叙事方式和生动入微的描写充分体现了狄更斯引人入胜的幽默感以及高超的艺术概括水平。

参考文献:
[1]S.Ullmann.The Principles of Semantics.Glasgow:Jackson,1957
[2]Charles Dickens,The Cricket On The Hearth,Kessinger Publishing,2004
作者简介:田原(1977―),男,汉族,四川内江人,四川师范大学外国语学院副教授,英语语言文学硕士,研究方向为英语语言学、文本分析。

相关文档
最新文档