语料库与语料库建设

语料库与语料库建设
语料库与语料库建设

语料库和语料库建设

一、什么叫语料库

1、定义

语料库,通俗意义上指的是语言材料库。严格意义上的语料库(corpus)是指按照一定的

语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片

断而建成的具有一定容量的大型电子文本库。

目前,语言学家对于语料库的定义不尽相同,如辛克莱(Sinclair)认为语料库是“按照明确的语言学标准选择并排序的语言运用材料汇集,旨在用作语言的样本”。阿特金斯等(Atkins & Clear)认为语料库是“按照明确的设计标准,为某一具体目的而集成的大型文本库”。赫努(Renouf)认为语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库”。我们看到,以上关于语料库的几种定义相同之处在于都谈到语料库是语言

材料的汇集;不同之处在于前两个定义指出语料库的设计是有明确的设计标准

的,赫努的定义明确指出语料库“通过计算机储存和处理”这一特点。

语料库不同于电子文档,语料库的建设有特定的研究目的和具体用途,因此在语料抽样范围和文类覆盖方面都力求取得平衡,在收集语料时需要考虑到每一文类、体裁、语域、主题类型等的抽样比例。而大型文档目标在于搜集任何可获得的语言材料或所限定的数种文类语

料,其语言材料之间的关系较为松散。

语料库具有以下特征:1、语料库的设计与建设有系统的语言学理论指导,语料库的开发具

有明确而又具体的目的;如,布朗语料库用于对20世纪60年代的美国英语的研究,LOB是与布朗语料库对齐的同时期的英国英语语料库,可用以对英国英语进行研究,也可与布朗语料库加以对比进行美国英语和英国英语的对比研究。2、语料库的语料是按照明确的语言学

原则采用随机抽样的方法得到的语言运用的自然语料,不是随意的语言材料的堆积,更不是由某个个人杜撰出来的。语料库的容量和语料采用随机抽样方式都保证了语料具有代表性,

由此保证基于语料库的语言研究的科学性、客观性。3、语料文本是连续的文本或话语片断,

而不是孤立的句子或词汇,可以借以获得语法关系、用法、词语搭配以及语篇信息。4、语料库以当代先进的计算机技术为技术手段,语料库语料通过电子文本形式储存并且是通过计

算机处理的,具有资源优势和处理速度优势。5、基于语料库的研究以量化研究为基石,以

概率统计为手段,以数据驱动为基本理念。6、语料库既是一种研究方法,又代表着一种新

的研究思维。

二、语料库产生的背景及发展历史

对真实语言材料的搜集与研究是语言学研究的优秀传统。尤其是在20世纪50年代中期,

在语言研究中占主导地位的是重语言材料的经验主义。这种学术氛围无疑促进了对语料的重视。1959年夸克(R.Quirk)等人着手进行的“英语用法调查”(Survey of English Usage)通过系统的调查建立了第一个现代英语语料库,在此基础上

完成的《现代英语语法》( A Grammar of Contemporary English)和《英语语法大全》(A Comprehensive Grammar of the English Language)对现代英语进行了系统全面的描写,在英语语言学界产生了广泛的影响。但在当时这项浩大的工程是通过手工的方式完成的。

20世纪六十年代后,语言学研究主流从经验主义转向理性主义,乔姆斯基

的语言能力说被广泛接受,转换生成语法学派批评语料库研究方法,认为,1、基于语料库的方法有误。乔姆斯基等认为语言学应当以人脑的语言机制即语言能

力为研究对象,语料库收集的只是人们的语言运用,语言运用会因超语言因素的

影响而发生变化,它并不能确切的反映语言能力。2、语料的不充分性。他们认

为自然语言句子的数量是无限的,语料库的规模即使再大也无法穷尽所有可能的

句子,因此“任何自然语料都是偏颇的”。在此后的长达20年的时间里理性主义在欧美一直占有统治地位,语料库研究一度陷入低谷。但在此期间仍有些语言学家凭着非凡的勇气继续不懈地从事语料库研究。最早的计算机语料库布朗语料

库(Brown Corpus),1961年由纳尔逊(F. Nelson)和库切拉(H. Kucera)建立。布朗语料库容量为100万词,收集了60年代有代表性的美国英语语料,语

料选自各种出版物,建库时照顾到了各种文体的平衡,严格按照随机原则抽样,

是一个标准语料库。布朗语料库是第一个现代语料库,它对于后来的语料库的发

展具有重要的影响。1975年,Jan Svartvik开始创建伦敦——隆德语料库(London —Lund Corpus),这两个语料库堪称现代语料库的开山鼻祖。

20世纪80年代以来,在相对沉寂了近20年之后,语料库研究重新萌发了

生机,迅速得到发展。

语料库研究的迅速发展基于以下三个方面的原因:首先,具有语言学基础。在英国语言学研究中,实证主义从弗斯到韩礼德再到辛克莱一直被传承了下来,

实证主义的基石是对可观察的对象进行研究,作为人们外部行为的语言运用是可

观察的、可靠的依据,而人们内在的语言能力是不可直接观察的,只能通过语用实例进行推断。语料库是在随机采样的基础上收集的有代表性的真实语言材料的

集合,是语言运用的样本。如果样本具有代表性,采样具有随机性,且样本的量

又足够大,则可以认为样本就是总体的真实代表;样本具有总体的统计特征,研究语料库中的语言材料即近似于研究语言本身。语料库中的语言材料都是人们实

际使用的语言材料,因此语料库语言的研究结果具有可靠性和真实性。强大的技术支持是语料库迅速发展的又一原因。主要体现在以下三个方面:一、以计算机为主导的硬件技术的发展。PC机的兴起、计算机计算速度的高速增长、存储介

质的开发、存储容量的剧增都为计算机语料库的建设发展提供了技术保障。二、

计算机网络的发展为语料库的发展和应用提供了有利条件。首先,大量的文献和文件具有电子文本形式在网上传播,为语料库语料的获得提供了便利条件;其次,大量语料库成为在线语料库,允许用户在网上实时使用;再者,研究者和用户能够在网上就语料库及时交流经验和看法。三、可以共享的语料库索引软件的开发。如今的索引软件大多已不是专为某一个语料库单独设计与开发的,而是能够应用于各种类型甚至不同语种的语料库。语料库迅速发展的第三个原因是需求的增长。在语料库的应用领域,不断增长的用户群体和不断扩大的应用领域进一步体

现了语料库的应用价值。其应用包括传统领域、扩展领域和新兴领域。传统领域包括自然语言处理、语法分析和辞典编纂等,扩展领域包括教材的组织编写、机器翻译、语言识别和语言对比;新兴领域包括语言教学、数据驱动语言学习、中

间语对比分析研究、多媒体计算机辅助教学、在线语料库。

在上述因素促动下,语料库建设迅速发展,相继出现了一批语料库,如,LOB 语料库(Lancaster-Oslo-Bergen Corpus)、COBUILD语料库、国际英语语料库(The International Corpus of English,简称ICE)、赫尔辛基历史英语

语料库(The Helsinki Corpus of Historical English)及各不同语种、不同用途类型的语料库。

三、语料库的建设与开发

(一)总体设计

首先语料库的建设目的要明确,建库的目的决定着语料的选取。

如由广东外语外贸大学桂诗春教授和上海交通大学杨惠中教授等主持建设

的中国学习者英语语料库(CLEC)建库目的是:1、通过分析中国英语学习者写作中典型错误及其与学习者中间语发展的内在关系,为中国外语教学,尤其是英语写作教学,提供积极反馈;2、对学习者语料库与英语本族语语料库进行对比

分析。

语料库的规模设计。在规模上,只要条件允许,应该是语料库的规模越大越好。就语料库发展趋势来看,建立固定规模的语料库并非语料库发展的大趋势,

因为语言本身是动态发展的,语料库也应当是动态的,可以不断扩充的。

语料库的内容。如果说规模是针对量的问题,那么,内容就是要解决质的问题。对于内容,最根本的是要真实,它包括两个方面,1、要收集实际使用中的文本,而不能是研究者杜撰的;2、要收集符合条件的文本。如要建立的是学习

者语料库,要分析的是学生的真实语言能力,就不能把学生抄袭书本的东西收进来。

(二)具体实施

1、语料的搜集

现代计算机技术和网络资源使得语料库语料的获得变得方便容易。传统的语料库建设,

语料输入工作极为浩繁,基本上靠手工键盘输入和扫描输入,费时费力,且容易出现错误,需要校对。如今大量的在线语料资源、光盘资料、因特网资源,包括

新闻、邮件列表、电子邮件等,使语料库的建设和扩充变得非常快捷方便。

当然,用于不同研究目的的语料库对其语料来源可能要求不同,会影响到语料的采集。

2、抽样

语料库在语料抽样范围和文类覆盖方面都要尽可能取得平衡,要考虑每一文类、体裁、

语域、主题类型等的抽样比例。乔姆斯基曾经批评语料库不过是试图用很小的样

本代表巨量的甚至无限的实际语言材料,其结果必然存在偏差,缺乏代表性。目前,计算机语料库可以通过控制抽样过程和语料比例关系来缩小偏差,增强语料的代表性。决定语料代表性的主要因素是样本的抽样过程和语料量的大小。语料库一般采用随机抽样方法。一种做法是在抽样前首先确定抽样的范围,再就是确定语料的分层结构,进行分层抽样,如把语料按文类(如小说、新闻报道、科学

论文、法律文书、诗歌、散文等)和信道(如书面语和口语)进行分层抽样。在

抽取比例上可根据需要采用平均比例均衡抽样或不等比例的塔式抽样。

3、语料库的加工

文本输入计算机后,一般需要进行一些加工,主要包括语料的标识和语料的赋码。

1)语料库的标识

标识主要分两类:一类是对文本的性质和特征进行标识,另一类是对文本中的符号、格式等进行标识。如CLEC语料库标注了以下主要信息,包括学生类型、性别、累计学习年限、自然年龄、作文完成方式、是否是用词典、作文类型、所

在学校、作文得分、作文标题、大学英语四、六级试卷作文编码。第一类标识是

必要的,因为它们可以用来对文本进行必要的分类,为灵活提取文本进行各类目

的研究提供便利,而且它们可以标注在文本开头或者作为另一个文件保存,丝毫不破坏语料的完整性和原始性。至于第二类标识可以视研究和应用的目的而定。

但不管怎样,保存一份未标识的原文本是很有必要的。

2)赋码

一些研究不需要赋码语料库,而有些研究需要赋码语料库。

当前,语料库的赋码主要有两类:一类是词类码,又称语法码;另一类是句

法码。

词类赋码就是对文本中每一个词标注词类属性,这项工作通常是在传统语法

对词类的划分的基础上进行的,只是分类适应要求做得更细。如在LOB语料库中以NN代表普通名词的单数形式,以NNP代表以大写字母开头的普通名词的单数

形式,如Englishman,以NNS代表普通名词的复数形式,如desks,以VB代表动词的基本形式,如write、see,以VBD代表动词的过去式,如wrote、saw,以VBG代表动词的现在分词形式,如reading、eating,以VBN代表动词的过去分词形式,如written、seen,等等。目前自动词类赋码技术已

经基本成熟,对英语基本上可以通过计算机自动赋码,且赋码正确率在96%—97%左右。

句法赋码就是对文本中的每一个句子进行句法标注。以UCREL概率句法赋码系统为例,其句法赋码系统分三个步骤:第一步,对文本中每一个词赋以可能的

句法码。该步骤主要依赖于一部标明每一可能词类码对子的句法符的词典。第二步,寻找一些特殊的语法码形式和句法片断,对句法结构作必要的修改。最后,

完成每一可能的句法分析,并逐一赋值,从中选出可能性最大,即值最大的句法分析作为每句的分析结果。

词类赋码和句法赋码为语言的量化研究创造了条件,为进一步研究自然语言的概率性特征提供了方便,为进一步的语义、语法和语用分析等打下了基础。

4、语料库引擎

通常意义上的计算机语料库一般包括语料库本体(即语料库电子文本)和语料库引擎(即

语料库索引程序)两个部分。

索引工具的基本功能包括词频统计、词表生成、语篇统计、关键词索引、排序、搭配词统计、词语型式统计、主题词提取、词丛统计、词图统计等等。

网上提供了一些可以利用的工具软件,包括MicroConcord、Wordsmith Tools、TACT、Concordance 1.1.3、TEC Concordancing Tools具有提供词

语索引、搭配词表以及各词语索引行的扩展语境的功能,允许用户把索引结果存储在自己的硬盘上。

MicroConcord可进行带语境的关键词索引。利用它可以观察关键词所在语篇,获得左右搭配词表。

Wordsmith Tools具有下列功能:1)生成词表、可按词频、字母顺序分别排列,并提供各种统计信息;2)关键词提取。可进一步统计分析关键词在语篇

中的分布,再生成该语料库的主要关键词,还可以查出某一关键词的联想词汇。

3)提供词汇词语型式表和搭配词位置分布等极有价值的信息,使研究者可以从

多种角度对词汇运用进行分析。4)查询结果可以很方便地转换为表格形式,并

读入到MS Access、Excel等数据库中进行相关的分析统计。

TACT是一个语料库索引软件包,它具有全文索引、语境中的关键词索引、

词表生成、词频统计、搭配词自动提取、语料比较等强大的功能。

Concordance除了一般文本索引软件所具有的功能外,其独特之处是能够

把索引结果自动生成HTML网页,供在线浏览。它是一个独立软件,可利用它对

任何语料库文本进行索引分析。

四、目前语料库发展中存在的问题

1、书面语语料库和口语语料库发展不平衡。

大量在线电子语料以及各种以电子媒介发行的电子文本为书面语语料库提

供了丰富的语

料资源,使得书面语语料库的建设变得便利起来。相比较起来,口语语料库要落后许多。原因之一是自然语言的口头运用形式需通过一定的技术手段才能够获

得,其转写与存储需耗费大量的人力物力。

2、语料库的标注和赋码系统在适用性和统一性方面需要进一步的探讨

现行的赋码系统一般是基于传统语法中对于词类的分析成果,不同研究者的分析结果存

在一定的分歧,采用任何一种分类方案都可能存在偏颇。理想的赋码应是基于语料库自身的统计信息。在赋码格式上各语料库也缺乏标准化和统一化。

3、语料库资源共享困难重重

一个语料库的价值应当是与其被利用的程度成正比的关系。而目前除了有限的几个语料

库能够提供在线索引外,绝大多数已经建成的语料库只在语料库研究者这个小群

体中使用,圈外人只闻其名,难见其形,使得花费了大量时间与财力的语料库不能真正实现其价值。许多语言研究者只得自己动手建语料库,这种重复建设造成人力物力资源的极大浪费。而且语料库只有在使用过程中才能发现问题,不断地加以改进。

4、语料库工具软件和文本分析软件的开发与语料库的发展不相适应

语料库工具软件包括词类自动赋码和句法分析软件,文本分析软件指与语料库本体相对

独立的索引软件。目前存在的问题是,各种索引软件重复开发,功能单一,软件

的升级速度慢,自由软件少。其原因主要是,1)语料库软件开发不像其它计算

机软件那样有巨大的商业利益驱动,缺少专业的软件开发人员。目前的语料库软件基本上是靠精通计算机编程技术的语言学家研发的,其技术难以跟上计算机技术发展的步伐。2)大多数语料库软件研究是靠单独作战,缺少团队合作,所以

研发周期长,研发的产品难免滞后。

解决这些问题需要语言学和计算机等学科之间的密切合作。

主要参考文献

1.《语料库语言学导论》杨惠中主编上海外语教育出版社2002年

2.《语料库语言学》黄昌宁杨涓子著商务印书

馆2002年

3.《语料库、检索与搭配》(Corpus Concordance Collocation)John

Sinclair上海外语教育出版社4.语料库语言学的发展及研究现状丁信善《当代语言学》1998年

1期

5.关于大规模真实文本语料库的几点理论思考张普《语言文字与应

用》1999年1期

6.《索引软件:语料库语言学的有利工具》王建新《当代语言学》1998年1期(同上篇,也是近十年前所写作业)

富不贵只能是土豪,你可以一夜暴富,但是贵气却需要三代以上的培养。孔子说“富而不骄,莫若富而好礼。” 如今我们不缺

土豪,但是我们缺少贵族。

高贵是大庇天下寒士俱欢颜的豪气与悲悯之怀,高贵是位卑未敢忘忧国的壮志与担当之志高贵是先天下之忧而忧的责任之心。

精神的财富和高贵的内心最能养成性格的高贵,以贵为美,在不知不觉中营造出和气的氛围;以贵为高,在潜移默化中提升我们的素质。以贵为尊,在创造了大量物质财富的同时,精神也提升一个境界。

一个心灵高贵的人举手投足间都会透露出优雅的品质,一个道德高贵的社会大街小巷都会留露出和谐的温馨,一个气节高贵的民族一定是让人尊崇膜拜的民族。别让富而不贵成为永久的痛。

分享一段网上流传着改变内心的风水的方法,让我们的内心高贵起来:

喜欢付出,福报就越来越多;喜欢感恩,顺利就越来越多;喜欢助人,贵人就越来越多;喜欢知足,快乐就越来越多;喜欢逃避,失败就越来越多;喜欢分享,朋友就越来越多。

喜欢生气,疾病就越来越多;喜欢施财,富贵就越来越多;喜欢享福,痛苦就越来越多;喜欢学习,智慧就越来越多。

雅思写作语料库--人们如何保障饮食健康

Scientists believe that eating fast food is harmful to one’s health. Some people think that education can help them change that bad habit. Others, however, argue that education does not work.Discuss both these views and give your own opinion. 科学家认为吃快餐有害健康,有人认为教育可以帮助人们改变这个不良习惯,有人认为教育不起作用,讨论两种观点。(2010年12月11日雅思考试题目) 【名师点评】讨论两种观点,可以使用第一人称口吻,也可以使用第三人称口吻。【作家立场】保障健康饮食,教育是起到一定的积极作用,但是,健康饮食不能仅仅依靠教育。 【思路拓展】 ①青少年是快餐的主要消费者,快餐含有过多的糖分、脂肪、热量,长期食用有害健康。所以,青少年应该成为教育的主体。 ②为了减少快餐对于消费者的不良影响,除了教育以外,政府也该承担责任。例如,美国政府已经限制肯德基捆绑销售儿童套餐的商业行为。 【范文赏析】 【首段】背景介绍+ 作家立场 So prevailing are the fast foods that some teenagers are in the habit eating junk foods nearly every week. From the perspective of some

nutritionists, too much intake of sugar, calorie and fat is undoubtedly health-threatening, for fast food, in most cases, is low in nutritional value. People differ greatly in their views as to how to foster wholesome dietary habit. As I see it, educating the public about the dangers of unhealthy eating, regulating baneful sales and food advertisements to children and lowering the price of healthy foods should be used together to help people keep fit. 【二段】 Granted, one effective way to promote a healthy diet is to educate people about the potential risks of unhealthy diet. Modern people might opt for healthier meals and snacks if they are taught that fast foods are high in salt, fat and sugar. To illustrate, I myself changed my unwholesome eating habits after watching television programs on how to preserve health. Also, while it is of great significance to educate adult eater, schoolchildren should be main target for education because they are not only in their formative years but also the regular eaters of fast foods. 【三段】 In addition to education, other ways to promote healthy eating are not far to seek. First, methods should be adopted to strictly censor those

顾家北手把手教你雅思写作全文翻译表格

本文档配合《顾家北手把手教你雅思写作(剑10)》版使用使用方法:每句话下面预留两行空格, 第一行写自己的翻译,第二行写顾家北的翻译与批阅。 全文翻译1:遵守规则论述类题目写作要点 Some people think that children should obey the rules or do what their parents and teachers want them to do. Other people think children controlled too much cannot deal with problem themselves in adulthood. Discuss both views and state your own opinion.

全文翻译2:老龄化社会+观点类( advantage/disadvantage ) +段落的数量In many countries, the proportion of older people is steadily increasing. Does this trend have positive or negative effects on society?

全文翻译3:看电视学习+观点类( agree/disagree ) +写作要点

Some people believe that children can learn effectively by watching TV and they should be encouraged to watch TV both at home and at school. To what extent do you agree or disagree?

国家级精品课程《高级英语》课程建设方案

国家级精品课程《高级英语》课程建设方案 一、建设目标:用五年时间,把高级英语建设成为一门充分践行“学生本位”、“素质本位”思想,人文色彩浓郁,时代内涵丰富,教学方法创新,教学手段先进,教学环境信息化特色突出,课程评价体系完善,自我革新能力强的高年级“核心”课程。 二、建设步骤:本课程建设将在多项“分目标”同时并举的基础上,采取分层次、有优先、有重点、逐年推进的建设方略。具体规划如下: 1.人文及时代内涵建设 (1)本课程组刚刚编写、出版的《新编高级英语教程》取材广泛,选材新颖,时代性强,人文内涵丰富,这为本课程实现未来5年的“人文及时代内涵”建设目标打下了坚实的基础。 (2)适时引入、编写一批教辅、学辅材料,进一步扩充本课程人文内涵,保持其时代性。 (3)在课堂教学中,充分挖掘现有教材的人文内涵,探索有利于培养学生人文素养和科学创新精神的授课形式。 (4)将对学生人文、科学精神的培养作为设计、开展实践课教学的基本要求之一。 2.教学环境信息化建设 (1)“高英”课堂教学网建设:A. 完善并适时更新现有的电子资料库——CAI课件,背景知识、作者简介、语言知识点、文本赏析、注释、相关话题导引、习题、试题等教辅、学辅材料;B. 逐步实现课程全部模块授课录像并上网;C. 在现有朗文、韦氏、金山词霸等在线词典的基础上,再投放几部高质量的网络词典;D. 建设网上学习资料下载平台。

(2)校园网、局域网建设与利用:A. 进一步拓展校园网的“资源”功能;B. 开展网上资源利用研讨活动;C. 进一步发掘Internet网上学习资源,提供具体链接地址。 (3)在线语料库建设:A. 探索能充分利用现有BNC、BROWN,LOB,LDC等在线语料库的教学新形式;B.适时购进1-2个切合“高英”(及其它课程)教学、科研需要的国、内外语料库(尤其是英、汉平行语料库);C.力争自主建设1-2个切合本课程及其它多门课程教学、科研需要的校本语料库。 3.教学过程建设 (1)课堂教学建设:A. 教学理念与方法:开展对学生期望的理想教学形式的调查分析,进一步探索能充分实践启发、体验式、发现式、研究式、合作式等现代教学理念的有效授课形式,拓展其内涵。B. 教学资源:探索能有效利用现有多功能教学资源形式的途径和方法;开辟新的资源形式;加强网络教学资源的动态性、再创性、多样性、结构合理性研究。C. 教学手段:探索能增强课堂感染力、提高教学效果的各种传统及信息化教学手段。D. 加强信息化学习方式(如适应性学习、WebQuest 学习,探险性学习)及其影响因素的研究。E.加强课堂教学评估指标研究。 (2)在线辅助教学建设:A. 创建网上学习社区,构筑学生自主学习平台。B. 创设BBS电子布告板系统,增加师生互动。C. 建立师生个人电子档案,探索在线教学规律。D.加强网上教学实践技术培训。 (3)实践课建设:A. 融高年级学生毕业论文写作与实践课教学于一体;B.通过实践课培养学生的体验式、探究式学习能力以及人文素养和科学创新精神;C.通过实践课为学生提供就业、创业的体验和能力训练;D.探索一切行之有效的实践课形式,培养学生获取知识的能力、创新能力,交流能力、协作能力、适应工作的能力、知人处事的能力以及灵活应变的能力。 4.革新能力建设

雅思写作词句语料库(双页)

adolescent(s)/juvenile(s)/youngster(s)/youth(s) n.青少年 adolescent adj.青春期的 parenting/upbringing n.家庭教育,教养 schooling n. 学校教育 aptitude/talent (for) n.(有……的)天赋 cultivate/foster/nurture v. 培养 specialist n.专才 generalist n.(有多方面知识和经验的)通才 all-rounded/well-rounded/versatile adj.全面的,多面的,多才多艺的awareness/sense/recognition n.意识 the development of students’personality and values 学生个性和价值观的发展mould (or mold美式拼写) one’s character塑造某人的性格 mould (or mold美式拼写) sb. into sth. 把某人塑造成…… a (or the ) sense of responsibility (or duty/obligation)责任感 improve moral standard 提高道德标准

小、

,例如色情和

delete/eliminate/excise v. 删除evaluate v. 评价、评估 the evaluation on 对……的评价或评估 be ?ooded (or ?lled/awash/saturated/inundated) with... 充斥着 excessive and gratuitous violent and pornographic contents 过多的、无端的暴力与色情内容 at the expense/cost of 以……为代价 media hype 媒体炒作advertising hype 广告炒作 hype n. 炒作,大肆吹捧 v. 对 ……大肆宣传,吹捧commercial(s) n. 商业广告public service advertising 公益广告 evoke (or stimulate) impulse buying 刺激冲动性购物shopaholic(s) n. 购物狂promotion n. 促销 marketing tool 市场营销手段 induce sb. to do sth. 诱导或引诱某人做某事 target audience 目标受众sensationalise (or sensationalize 美式拼写) /exaggerate v. 耸人听闻地夸大某事,大肆渲染 over-report...to hook viewers and maximise pro ?ts 为了利益最大化,从而过度报道……来吸引公众的眼球 道德规范(尤指职业的) 良好的/较强的/无懈可击的职业道德adj. 无所不在的,普遍存在的……的流行或盛行对……有着深远的影响 揭露社会问题 监督非常详尽地报道…… 如实的描述、报道adj. 有新闻价值的,有报道价值的adj. 最新的,及时的adj. 客观公正的adj. 不客观的,有偏见的 adj. 可信的,可靠的 adj. 令人误导的,不如实报道的,曲解的adj. 虚假的adj. 欺骗性的 adj. 信息量大的,增长见闻的adj. 娱乐性的,令人愉快的 v. & n. 审查n. 审查制度 对……实施审查 v. 影响,左右 (e.g. sway sb./sb. be swayed by... 影响某人或者某人受到影响)

语料库与语料库建设

语料库和语料库建设 一、什么叫语料库 1、定义 语料库,通俗意义上指的是语言材料库。严格意义上的语料库(corpus)是指按照一定的 语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片断而建成的具有一定容量的大型电子文本库。 目前,语言学家对于语料库的定义不尽相同,如辛克莱(Sinclair)认为语料库是“按照明确的语言学标准选择并排序的语言运用材料汇集,旨在用作语言的样本”。阿特金斯等(Atkins & Clear)认为语料库是“按照明确的设计标准,为某一具体目的而集成的大型文本库”。赫努(Renouf)认为语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库”。我们看到,以上关于语料库的几种定义相同之处在于都谈到语料库是语言材料的汇集;不同之处在于前两个定义指出语料库的设计是有明确的设计标准的,赫努的定义明确指出语料库“通过计算机储存和处理”这一特点。 语料库不同于电子文档,语料库的建设有特定的研究目的和具体用途,因此在语料抽样范围和文类覆盖方面都力求取得平衡,在收集语料时需要考虑到每一文类、体裁、语域、主题类型等的抽样比例。而大型文档目标在于搜集任何可获得的语言材料或所限定的数种文类语料,其语言材料之间的关系较为松散。 语料库具有以下特征:1、语料库的设计与建设有系统的语言学理论指导,语料库的开发具有明确而又具体的目的;如,布朗语料库用于对20世纪60年代的美国英语的研究,LOB是与布朗语料库对齐的同时期的英国英语语料库,可用以对英国英语进行研究,也可与布朗语料库加以对比进行美国英语和英国英语的对比研究。2、语料库的语料是按照明确的语言学原则采用随机抽样的方法得到的语言运用的自然语料,不是随意的语言材料的堆积,更不是由某个个人杜撰出来的。语料库的容量和语料采用随机抽样方式都保证了语料具有代表性,由此保证基于语料库的语言研究的科学性、客观性。3、语料文本是连续的文本或话语片断,而不是孤立的句子或词汇,可以借以获得语法关系、用法、词语搭配以及语篇信息。4、语料库以当代先进的计算机技术为技术手段,语料库语料通过电子文本形式储存并且是通过计算机处理的,具有资源优势和处理速度优势。5、基于语料库的研究以量化研究为基石,以概率统计为手段,以数据驱动为基本理念。6、语料库既是一种研究方法,又代表着一种新的研究思维。 二、语料库产生的背景及发展历史 对真实语言材料的搜集与研究是语言学研究的优秀传统。尤其是在20世纪50年代中期, 在语言研究中占主导地位的是重语言材料的经验主义。这种学术氛围无疑促进了对语料的重视。1959年夸克(R.Quirk)等人着手进行的“英语用法调查”(Survey of English Usage)通过系统的调查建立了第一个现代英语语料库,在此基础上完成的《现代英语语法》( A Grammar of Contemporary English)和《英语语法大全》(A Comprehensive Grammar of the English Language)对现代英语进行了系统全面的描写,在英语语言学界产生了广泛的影响。但在当时这项浩大的工程是通过手工的方式完成的。

【CN110110336A】一种面向藏汉机器翻译的藏语句法语料库的构建方法【专利】

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910368324.3 (22)申请日 2019.05.05 (71)申请人 西北民族大学 地址 730030 甘肃省兰州市城关区西北新 村1号 (72)发明人 万福成  (74)专利代理机构 西安研创天下知识产权代理 事务所(普通合伙) 61239 代理人 杨凤娟 (51)Int.Cl. G06F 17/28(2006.01) G06F 17/27(2006.01) (54)发明名称 一种面向藏汉机器翻译的藏语句法语料库 的构建方法 (57)摘要 本发明公开了一种面向藏汉机器翻译的藏 语句法语料库的构建方法,包括以下步骤:A、将 具有句对齐结构的平行语料库中的藏语句子进 行词性标记;B、利用词对齐工具将藏语句子中的 词汇进行词对齐,形成藏语词、汉语词对齐匹配 形式;C、利用树库制作工具,将具有词性标记和 词对齐信息的藏语词逐个进行短语标记;D、运用 自增模式,扩展藏语句法语料库。本发明能够解 决藏语句法语料库稀缺的问题,从而提高翻译质 量。权利要求书1页 说明书3页CN 110110336 A 2019.08.09 C N 110110336 A

权 利 要 求 书1/1页CN 110110336 A 1.一种面向藏汉机器翻译的藏语句法语料库的构建方法,其特征在于,包括以下步骤: A、将具有句对齐结构的平行语料库中的藏语句子进行词性标记; B、利用词对齐工具将藏语句子中的词汇进行词对齐,形成藏语词、汉语词对齐匹配形式; C、利用树库制作工具,将具有词性标记和词对齐信息的藏语词逐个进行短语标记,并逐层进行合并直至形成一个完整的句法树; D、运用自增模式,扩展藏语句法语料库。 2.根据权利要求1所述的一种面向藏汉机器翻译的藏语句法语料库的构建方法,其特征在于,所述步骤B中将藏语句子中的词汇进行词对齐的方法包括以下步骤: a、运用词对齐工具训练双语句对齐平行语料库; b、以词对齐中间结果作为藏语汉语词匹配形式,并形成具有类似括号匹配的形式; c、将词对齐的结果以及词性标注的结构统一处理成具有括号匹配形式的内容,提供下一步处理作为输入。 3.根据权利要求1所述的一种面向藏汉机器翻译的藏语句法语料库的构建方法,其特征在于,所述步骤C中逐层进行合并直至形成一个完整的句法树的方法包括以下步骤: a、将具有括号匹配形式的带有词性标记和词对齐信息的各个单元输入到树库制作工具中; b、以词性为基础,逐个将以词为单元的内容合并,并以短语标记结尾; c、逐个合并短语结构标记为新的短语结构标记,最终合并成一个句子,并标注以句子标记结尾。 4.根据权利要求1所述的一种面向藏汉机器翻译的藏语句法语料库的构建方法,其特征在于,所述步骤D中运用自增模式扩展藏语句法语料库的方法包括以下步骤: a、将人工制作的藏语句法语料库作为训练语料库,运用BerkerleyParser句法分析器作为句法分析工具; b、解码测试语料库,得到待人工校对的藏语句法树; c、人工校对藏语句法树的结果,将校对后的结果加入到训练语料库中,继续步骤a,以这种模式扩展藏语短语句法树库。 2

2020年雅思写作语料库:科技时代传统教育是否还有价值

2020 年雅思写作语料库:科技时代传统教育是否还有 价值 考试真题(2020 年 9 月 12 日): Some people think that students at schools and universities learn far more from teachers than from other resources(the Internet or television). To what extent do you agree or disagree? 有人认为:对于其他的学习渠道,例如网络教育或者电视教育,学生在学校和大学能够和老师学习更多,是否认同 类似题目】: Some people think that computers and the Internet are more important for a child's education than going to school. But others believe that schools and teachers are essential for children to learn effectively. Discuss both views and give your own opinion. 有人认为计算机和互联网对于孩子的教育比去学校有效,有认为老师和学校对于孩子的高效学习更加重要,讨论两种观点 ? 薛鹏点评】: 如果雅思备考仅练习一篇文章,本题首选,关于网络教育和课堂 教育的比较,每年必考。练习本篇,教育类话题融会贯通。 薛鹏感言】: 我是如何做出预测的:对 20 年考试题库的整理、分类、考频统计。归类考题类型、核心母题、边缘考题。无论考试如何变化,我相信热题恒热、遗漏太久、必然回补。网络教育和课堂教育每年的考频 1-2 次,必然会考,意料之中。仅仅,不知你是否还信赖小鹏哥:惯性阅

关于汉语中介语语料库建设研究报告

汉语中介语语料库建设研究 沈锐1,黄薇2 (1.红河学院教育技术系2.红河学院国际合作与交流处XX蒙自661100) 【摘要】本文探讨母语非汉语学习者的汉语中介语语料库建设的主要思路以及具体实现方法,重点介绍了汉语中介语语料的加工方法以及语料数据库的设计思路,并阐明了该语料库在对外汉语教学和研究中的应用价值。 【关键词】语料库;中介语;汉语教学 语料库是指按一定的语言学原则收集的语言文本或话语片断而建立的电子资料库。本文所述汉语中介语料库是基于语言学中中介语理论设计与实施的。中介语是心理语言学中第二语言习得的一种研究模式,其将语言学习者置于观察中心,去研究他们如何有意识地向目的语的正确形式迁移的各种动态表现。中介语理论自20世纪60年代末出现并发展至今,虽然时间并不长,但越来越受到语言学家以及一线教师的关注。无论是进行中介语研究还是使用中介语理论进行第二语言教学都需要收集分析大量的语料,因而通过信息化手段收集和整理语料变得十分迫切。在对外汉语教学中,通过建设和使用母语非汉语学习者的汉语中介语语料数据库,可以收集不同背景和不同学习阶段外国学生及少数民族学生的汉语书面语和用文字转写的口语语料,并对语料属性、词汇、语法等单位进行计算机处理,以实现对各种条件和要求下的语料数据进行便捷的机器检索和提取,可以为研究母语非汉语学生学习和习得汉语的规律提供大量的各种单项的或综合的资料和信息。因此,我们提出了建设汉语中介语语料库的课题,由于语料库建设是一项浩大的工程,限于人力物力条件,本文讨论的是中

小规模的语料库。 一、需求分析和框架设计 语料库建设不能盲目进行,首先要进行调研,对语料库的应用需求进行分析。半自动化的语料库构建是目前语料库建设的主流技术,目的是在确保语料库质量的前提下,减少人工参与的比例,增加自动化程度,目标是在较短时间内建设一个有一定规模,质量可靠、可扩充、成本低,能够全面、细致地记录母语非汉语学习者在汉语学习过程中的语言表征和研究他们汉语习得过程的语料库。依照软件工程的方法,建立数据库首先需要进行需求分析,在需求分析过程中要注意汉语中介语语料库主要是服务于对外汉语教学的一线教师,以及辅助母语非汉语学生自学,因此主要注重以上二类服务对象的应用需求,确保建成的语料库能够对第二语言教学、研究以及教材的编写提供持续支持。基于以上要求,在对中介语语料库的建设思路及框架做了总体考虑,基本归纳为以下三个方面: 1、中介语语料库为专门用途语料库,主要目的为研究母语非汉语的学生在学习汉语过程中的中介语现象而设计制作的。 2、中介语现象存在于母语非汉语的学生在学习汉语过程中的书面语料及口语语料中,由于口语语料的收集、分析和标注都较为困难,因此在建库的第一阶段只考虑收录书面语料,这有利于语料库的快速建设与使用。 3、语料标注的加工标准使用中科院计算所汉语词性标记集V3.0。 二、语料收集与加工

雅思写作语料库--小组学习和自己学习

Some people believe that students should study in groups. Others think that they should study alone. What are the benefits of studying in groups and studying alone? Which way is more effective? 有人认为学生们应该小组学习,有人认为学生们应该自己学习,小组学习和自己学习利好各在哪里,你认为何种方式有效? 【思路拓展】 小组学习的利好: 1. 小组讨论,集思广益,例证展开:小组讨论数学题的解题思路,小组讨论作文的头脑风暴。 2. 有良好的学习氛围,可以帮助缺乏自律性的孩子们专注于学习,提高学习效率。 3. 有效的方式结实新朋友,锻炼人的口才,交流能力以及团队精神。 自己学习的利好: 1. 培养了自己的独立思考以及解决问题的能力,学习上不会对他人产生过度的依赖。 2. 小组学习更加容易培养人的分析性思维,理性思维和辩证思维的能力。 点评:论据支持可以学习历史和哲学,以及中学生学习国际新闻 【作者立场】

小组学习和自己学习各有优势,选择应该由个人做出,我过去常常一个人学习,虽然可以独立思考,但是未能感知小组讨论和交流的乐趣,因此,有机会,我更加渴望小组学习。 点评:主题观点是模仿雅思考官男女分校的范文 【原创语料库】 1. group study 小组学习 2. to study with a group of fellow classmates 和同龄人一起学习 拓展:a group of fellow classmates = peers 同龄人 3. focus on self-improvement 专注于自我提高 4. zero in on academic study = concentrate on learning专注学习(写作亮点) 5. a great many self-leaner 很多的自学者 6. achieve academic success 取得学习的成功 7. enhance the efficiency of learning 提高学习效率 8. face-to-face communication could …… 面对面交流可以…… 9. positive interaction w ith …… 和…… 积极的互动

如何从根本上提升雅思写作水平之逻辑篇

如何从根本上提升雅思写作水平之 逻辑篇 写作老师经验分享, 如何从根本上提升雅思写作水平之逻 辑篇,今天给大家带来如何从根本上提升雅思写作水平之逻辑篇,希望可以帮助到大家,下面就和大家分享,来欣赏一下吧。 写作老师经验分享如何从根本上提升雅思写作水平之逻辑篇 我们来拿一个真题和一个类似于真题的题进行说明: 20XX0328 Some people say that communication by using computers and phones will have side effects on young people’s writing and reading skills. To what extent do you agree or disagree? 改编题: Some people say that the use of using computers and phones will have side effects on young people’s communication. To what extent do you agree or disagree?

请各位同学想一想,这两个问题是一样的么?劳烦各位思考个3分钟,然后继续往下翻~如果你觉得并没有很大差别,那估计真的碰到这个题目的话,6.5分是很勉强的。 ------------------------------------------------------------------------------ 我们先来说改编题: side effects: 1. face-to-face communication减少,感情可能变淡 positive effects: 1. be able to contact people without geographical limitation; in the past, it may be impossible to say Hi to a foreign friend. 2. be able to contact friends or partners quickly, no need to wait for responses; in the past, writing letters really wastes a lot of time and sometimes letters may be lost. 我们再来说真题: side effects: 1. writing abilities会下降,因为写信的频率降低了,handwriting当然变差

浅谈语料库语言学在的应用以及在中国的发展趋势

浅谈语料库语言学在的应用以及在中国 的发展趋势 一、语料库语言学的兴起与发展 语料库语言学是基于大量真实的语言资料,从调查语言信息的分布频率入手来研究语言在现实使用中的规律和模式。自20世纪中后期,电脑被大量使用在语料的存储上,兴起了专门针对大规模储存于计算机里的语料库所进行的研究,自此语料库语言学进入了现代语料库语言学时期。由于电脑语料库容量大、语料真实、检索快捷,它在现代语言学研究和语言教育中正发挥着越来越重要的作用。 在我国,从20世纪20年代开始,有学者为制定基础汉字字表开始建立文本语料库;70年代末以来,汉语现代文学作品语料库(1979年)、现代汉语语料库(1983年)等机器可读语料库开始建设。90年代后,以《人民日报》光盘数据库、北大语料库为代表的大型汉语语料库日益发展,语料库成为研究中文信息处理的基本语言资源。在英语语料库建设方面,杨惠中教授80年代主持建成的上海交通大学科技英语语料库(JDEST),是当时世界上第一个同类语料库,也是国内最大最完备的英语语料库之一。1996年广州外国语学院开始建立中国学生交际英语语料库。此外由广东外语外贸大学桂诗春教授和上海交通大学杨惠中教授牵头开发的“中国学习者语料库”(CLEC)于1999年建成,该语料库广泛收集了包括我国中学生、大学生在内的一百多万词的各种书面语资料,并对所有的语料进行语法标注和言语失误标注,对研究中国学习者的英语特点具有开创性意义。

二、语料库语言学发展趋势 语料库语言学研究的发展总是以语料库的建设为基础的。没有语料库的建设,语料库语言学所进行的研究只能是纸上谈兵。近十多年来,国内语料库的建设取得了一定的成就,主要建设的语料库有英语学习者语料库、平行语料库、特殊英语语料库、汉语语料库四种类型。 (一)英语学习者语料库。其中包括书面语和口语。有广东外语外贸大学和上海交通大学合作建设的中国学习者英语语料库CLEC,100万词次;上海交通大学建设的大学英语学习者口语语料库COLSEC,5万词次;香港科技大学建设的香港科技大学学习者语料库HKUST Learner Corpus;南京大学建设的中国英语专业语料库CEMC,148万词次;南京大学建设的中国英语学习者口语语料库SECCL,100万词次;华中科技大学建设的硕士 写作语料库MWC,12万词次。 (二)平行语料库。有北京外国语大学建设的汉英平行语料库PCCE;南京大学建设的南大———国关平行语料库;外语 教学与研究出版社建设的英汉文学作品语料库,冯友兰《中国哲学史》汉英对照语料库,李约瑟(Joself Needham)《中国科学技术史》英汉对照语料库;北京大学计算语言学研究所建设的双语语料库,5万多对;香港城市理工大学建设的对比语料库LIVAC;台湾建设的平衡语料库Sinica Corpus和树图语料库Sinica Treebank;国家语言文字工作委员会应用研究所建设的计算机专业的双语语料库,柏拉图(Plato)哲学名著《理想国》的双语语料库;中国科学院软件研究所建设的英汉双语语料库,15万对;中国科学院自动化研究所建设的英汉双语语料库,包含LDC香港新闻硬汉双语对齐语料36 294段以及香港法律英汉双语对齐

雅思写作小作文必备语料库

雅思写作小作文必备语料库 动态图形词汇 上升 -rise, increase, grow, climb, jump,go up, an upward trend shoot up (informal),ascend -rocket, soar, swell, surge, skyrocket, mushroom, escalate, on the rise,on the increase 相关单词用法 下降 -drop, decrease, go down, decline, fall, descend, sink, dip, an downward trend., -plummet, Plunge, slump, dive, nosedive 相关单词用法 不变、平稳等 -keep/remain/stay stable/steady/unchanged/constant(不变) -maintain the same level -experience a stable trend, -level off at(上升或下降之后)/ level out at(上升之后)/ -hover at/ stabilize at/ reached a plateau at 波动 fluctuate/rise and fall, vary, undulating; be volatile/ variable; 高点、低点: ?reach the highest point,reach(arrive at/hit) a peak(summit) at+数字(用hit 时动作较剧烈),peak at+数字 ?reach/fall to/arrive at/hit the bottom/the lowest point at数字,bottom out at数字,(用hit时动作较剧烈) 其他点 ?起始点: n. starting point v. start/begin/end at ?交叉点: It is worth/deserves mentioning that 1).A和B在...处拥有相同数值 A and B share the same amount/number in 2).A在...处超过B A outstrip/overtake/outnumber/go beyond B in... ?表示达到了多少数量的及物动词或词组 Reach/arrive at/ amount to / hit/ register/ stand at

雅思写作语料库父母角色差异的原因及未来作用

In some countries,the role of a mother differs in some ways from the role of a father. Why do you think these differences exist? How might parental roles develop in the future? 在一些国家,父母在教育孩子中扮演的角色,和很多方面,是不同的,为何存在这种差异,在未来父母的角色会有哪些变化? 【名师点评】 新题出现,恒热教育,谈及父母对于孩子成长中影响差异的原因,展望父母在孩子未来成长中作用的不同,不属分析问题解决问题话题,考察头脑风暴,写作有一定难度。 预测题目中的寒门贵子还是将门虎子,是否所有的父母都应该学习育儿课程,和本场考试都有交集。 【思路拓展】 男性比较理性和阳刚,女性比较感性和温柔,因此,他们对于孩子成长的影响自然不同,一般而言,孩子会从爸爸身上学到坚毅和勇敢,会从妈妈身上学会善良和孝道。骨血相连,血浓于水,无论父母,对于孩子的教育和引导都是积极的善意的。爸爸努力赚钱,是为孩子赢一个成长环境,妈妈努力育儿,是让孩子明辨是非、行为规范。 教育这个词的本源是说将一个人从一种蒙昧的无知的状态中引导出来,教育应该涉及道德教育、性格培养、学术教育等。

教育不能颠覆:道德教育和性格培养应该优先于学术成长,先重品质和品行,后重成绩和选择。如果可以畅想未来,父爱如山,为人父,应该树立标杆,让孩子学会志存高远,不懈奋斗。母爱如水,为人母,应该树立标杆,让孩子学会海纳百川,清澈纯净。 【范文赏析】 【首段】背景介绍+ 写作目的 Parents are the initial teachers of their children, thereby, their speeches and behaviors, to a larger extent, exert a subtle influence on children’s character-training and future development. The impacts that parents impose on their kids might differ greatly due to various reasons. This essay aims to explore where the differences lie in and how parental roles will change in the future. 【解析】 1. Their speeches and behaviors, to a larger extent, exert a subtle influence on children’s character-training and future development. 父母的言行举止,在很大程度上,对于孩子的性格培养和未来发展有潜移默化的影响。

语料库与语料库建设

语料库与语料库建设 语料库和语料库建设 一、什么叫语料库 1、定义 语料库,通俗意义上指的是语言材料库。严格意义上的语料库(corpus)是 指按照一定的 语言学原则,运用随机抽样方法,收集自然出现的连续的语言运用文本或话语片断而建成的具有一定容量的大型电子文本库。 口前,语言学家对于语料库的定义不尽相同,如辛克莱(Sinclair)认为语料库是“按照明确的语言学标准选择并排序的语言运用材料汇集,旨在用作语言的样本”。阿特金斯等(Atkins & Clear)认为语料库是“按照明确的设计标准,为某一具体目的而集成的大型文本库”。赫努(Renouf)认为语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库”。我们看到,以上关于语料库的儿种定义相同之处在于都谈到语料库是语言材料的汇集;不同之处在于前两个定义指出语料库的设讣是有明确的设计标准的,赫努的定义明确指出语料库“通过计算机储存和处理”这一特点。语料库不同于电子文档,语料库的建设有特定的研究LI 的和具体用途,因此在语料抽样范围和文类覆盖方面都力求取得平衡,在收集语料时需要考虑到每一文类、体裁、语域、主题类型等的抽样比例。而大型文档U标在于搜集任何可获得的语言材料或所限定的数种文类语料,其语言材料之间的关系较为松散。 语料库具有以下特征:1、语料库的设讣与建设有系统的语言学理论指导,语料库的开发具有明确而乂具体的U的;如,布朗语料库用于对20世纪60年代的美国英语的研究,LOB是与布朗语料库对齐的同时期的英国英语语料库,可用以对英国英语进行

研究,也可与布朗语料库加以对比进行美国英语和英国英语的对比研究。 2、语料库的语料是按照明确的语言学原则采用随机抽样的方法得到的语言运用的自然语料,不是随意的语言材料的堆积,更不是由某个个人杜撰出来的。语料库的容量和语料采用随机抽样方式都保证了语料具有代表性,山此保证基于语料库的语言研究的科学性、客观性。 3、语料文本是连续的文本或话语片断,而不是孤立的句子或词汇,可以借以获得语法关系、用法、词语搭配以及语篇信息。 4、语料库以当代先进的计算机技术为技术手段,语料库语料通过电子文本形式储存并且是通过讣算机处理的,具有资源优势和处理速度优势。5>基于语料库的研究以量化研究为基石,以概率统汁为手段,以数据驱动为基本理念。6、语料库既是一种研究方法,乂代表着一种新的研究思维。 二、语料库产生的背景及发展历史 对真实语言材料的搜集与研究是语言学研究的优秀传统。尤其是在20世纪 50年代中期, 在语言研究中占主导地位的是重语言材料的经验主义。这种学术氛圉无疑促进了对语料的重视。1939年夸克(R. Quirk)等人着手进行的“英语用法调查” (Survey of English Usage)通过系统的调查建立了笫一个现代英语语料库,在此基础上完成的《现代英语语法》(A Grammar of Contemporary English )和《英语语法大全》(A Comprehensive Grammar of the English Language)对现代英语进行了系统全面的描写,在英语语言学界产生了广泛的影响。但在当时这项浩大的工程是通过手工的方式完成的。 20世纪六十年代后,语言学研究主流从经验主义转向理性主义,乔姆斯基的语言能力说被广泛接受,转换生成语法学派批评语料库研究方法,认为,1、基于语料库的方法有误。乔姆斯基等认为语言学应当以人脑的语言机制即语言能力为研究对象,语料库收集的只是人们的语言运用,语言运用会因超语言因素的影响而发生变化,它并

雅思写作必背短语以及精彩句型

雅思写作核心语料库 Part 1 1 offer a sense of job satisfaction and security 带来工作的满意感和安全感2lay a solid professional working experience 积累扎实的工作经验 3 reduce/cut down expenditure 削减支出 4increase/generate job opportunities 创造就业机会 6promote talent introduction and exchange 促进人才的引进与交流 7keep skills fresh and up-to-date 保证技术的不落伍 9lay a solid foundation for 奠定坚实的基础 10 pave the way for the future/development 为未来铺平了道路 11foster a sense of competition and cooperation 培养合作感与竞争感 12cultivate the spirit of team working 培养团队合作精神 13master interpersonal skills 掌握人及关系技巧 14widen one’s knowledge 拓宽知识面 15enrich one’s social and life experience 丰富社会与人生经历 16enlarge one’s view/broaden one’s horizon 拓宽视野 17realize the value of life 实现人生价值 18surmount /overcome / win over /master difficulties 克服困难 19grasp good communication skills 掌握人际交流技巧 20remove misunderstanding and discrimination 消除误解与歧视 21keep balance between work and family 保持事业与家庭的平衡 22raise the standard of living提高生活水平 25enrich people’s spiritual life 丰富人们的精神生活 26promote social skills and competence 提高社交技巧与能力 27strengthen the family ties促进家庭团结 28cultivate a strong sense of responsibility 培养强烈的责任感 29bring joys and comforts to sb带来愉悦与舒适 30usher in a brand-new life-style引入全新的生活方式 31relieve the pressure of 缓解压力 32maintain the community stability 保持社会的稳定

相关文档
最新文档