中外学术英语语料库

合集下载

学术英语阅读 语料库

学术英语阅读 语料库

学术英语阅读语料库学术英语阅读对于非英语母语的学生来说常常是一项具有挑战性的任务。

为了克服这个难题,语料库是一个强大的工具,可以提供丰富的英文语料和学术资源,帮助学生提高阅读理解和写作能力。

本文将探讨学术英语阅读语料库的定义、功能和使用方法。

一、语料库的定义和功能语料库是一个用来收集、存储和组织大量实际语言材料的数据库。

学术英语阅读语料库是面向学术领域的语料库,包含了各个学科的学术文献、期刊文章、论文、报告等。

它的功能主要体现在以下几个方面:1. 提供真实语言样本:语料库中的文本是真实的、自然的语言材料,可以反映真实的学术写作风格和表达习惯。

学生通过接触大量真实的学术文本,可以更好地理解学术语言的特点和规范。

2. 支持研究和分析:学术英语阅读语料库可以提供丰富的数据资源,用于研究语言的使用、结构和变化。

研究者可以通过对语料库中的文本进行分析,揭示学术写作的规律和特点。

3. 提高阅读和写作能力:通过使用语料库,学生可以积累大量的词汇和短语,提高阅读理解能力。

同时,他们还可以学习到学术写作的技巧和表达方式,提高自己的写作能力。

4. 培养语境意识:语料库可以帮助学生理解单词和短语的多种使用方式和语境。

学生可以通过查找相关的实例文本,了解单词的准确含义和用法,避免翻译错误或语用不当的问题。

二、语料库的使用方法学术英语阅读语料库的使用方法多种多样,下面介绍几种常用的方法:1. 检索词汇和短语:学生可以通过输入关键词来检索语料库,获取与词汇或短语相关的实例文本。

这样可以帮助学生理解单词或短语的多种用法和语境,并学习如何正确运用它们。

2. 阅读相关文献:学生可以选择感兴趣的主题或领域,在语料库中搜索相关的学术文献。

通过阅读这些文献,他们可以了解研究的最新进展、学术观点和实证数据,提高自己对该领域的理解和认知水平。

3. 分析语言用法:学生可以选择一篇学术文章或论文,在语料库中搜索类似的文章,比较它们的语言用法和句式结构。

学术期刊论文摘要汉英双语语料库构建研究-英语论文-语言学论文

学术期刊论文摘要汉英双语语料库构建研究-英语论文-语言学论文

学术期刊论文摘要汉英双语语料库构建研究-英语论文-语言学论文——文章均为WORD文档,下载后可直接编辑使用亦可打印——论文摘要指以提供文献内容梗概为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文。

(国家标准GB 47) 学术论文摘要概括论文的主要信息,对研究的目的、方法、结果和最终结论有一个比较完整的说明,对于论文的发表、收录、检索及科研人员的学术交流等起着重要的作用。

当今时代,英语已成为国际交往的世界性语言,英文学术论文摘要的重要性日益显现。

近年来,不少中外学者(如Swales1990、段平2002、滕延江2008、邓军涛2013 等) 对论文摘要的语言特点与翻译进行了比较广泛深入的分析,其成果无疑有利于该领域的实践与发展。

然而,大多数相关研究都是基于研究者个人的经验,选取的例句和掌握的语料比较有限。

不少学习者和研究人员撰写及翻译摘要的能力还比较欠缺。

鉴于此,本课题组决定建设学术期刊论文摘要汉英双语语料库,一方面从大的语料基础上客观描述英文摘要的文体特征和进行汉英翻译研究,同时将该语料库用作翻译教学平台,试验并总结数据驱动的教学方法,推动学术研究与翻译教学共同发展。

一、学术期刊论文摘要汉英双语语料库的建设(一) 语料库与双语语料库语料库是指按照一定的语言学原则,运用随机抽样方法,收集自然出现的连续语言运用文本或话语片段而建成的具有一定容量的大型电子文本库(杨惠中,2002) 。

语料库具有语料真实、丰富、代表性强以及融合了计算机技术等特点,在语言研究和教学方面具有较大的优势与应用价值。

按照语料的语种,语料库可以分成单语、双语和多语语料库。

双语和多语语料库还可分为平行语料库和可比语料库。

平行语料库收集原文与译文双语对照的文本,按设定的标准对语料进行句子或段落的对齐。

可比语料库收集具有可比性的语料,分别放置于不同的文本库,主要用于语言对比研究。

关于双语语料库的作用,不少专家从不同角度进行了探讨。

常用的英语语料库

常用的英语语料库

常用的英语语料库English corpora, or language corpora, are collections of text samples that are used for linguistic research and analysis. These corpora serve as valuable resources for studying language patterns, trends, and usage in various contexts. In this article, we will explore some of the commonly used English language corpora and their applications.1. British National Corpus (BNC)The British National Corpus is one of the most widely used language corpora for studying contemporary British English. It contains a diverse range of texts, including spoken conversations, written documents, and academic papers. Researchers can access the BNC to examine language usage in different genres and domains, such as science, politics, and fiction. The BNC provides valuable insights into the changes in the English language over time.2. Corpus of Contemporary American English (COCA)The Corpus of Contemporary American English is a comprehensive corpus that provides a vast collection of English texts from different genres, including spoken, written, and academic. It offers researchers the opportunity to investigate various aspects of American English, including vocabulary, syntax, and discourse patterns. The COCA is frequently used in linguistic research, language teaching, and corpus-based language analysis.3. Google Books Ngram ViewerThe Google Books Ngram Viewer is a powerful tool that allows researchers to analyze the frequency of words or phrases in the vast collection of books digitized by Google. It provides a visual representation of the usage of specific terms over time, offering insights into the historical development and popularity of certain expressions. This tool is useful for investigating language change and cultural shifts through the lens of published literature.4. Corpus Linguistics Toolkit (CLAWS)The Corpus Linguistics Toolkit, also known as CLAWS, is a suite of programs specifically designed for corpus analysis. It provides researchers with tools for processing, annotating, and analyzing text corpora. CLAWS allows for the extraction of linguistic features, such as part-of-speech tags and named entities, which can be utilized for various linguistic studies. The toolkit's versatility makes it a valuable resource for researchers in the field.5. International Corpus of English (ICE)The International Corpus of English is a collection of English language corpora from different countries and regions. It aims to capture the linguistic variations within the English language across different cultures and contexts. The ICE provides researchers with valuable data for studying dialectal differences, language contact phenomena, and sociolinguistic aspects of English.6. Oxford English Corpus (OEC)The Oxford English Corpus is a corpus of contemporary English texts that serves as a reference for the analysis of language usage and trends. Itincludes a wide range of written and spoken materials from various sources, such as books, newspapers, and online platforms. The OEC is frequently used for linguistic research, lexicography, and language teaching purposes.7. Corpus Query Language (CQL)Corpus Query Language is a specialized language used to search and retrieve specific linguistic patterns within corpora. It enables researchers to formulate complex queries and retrieve relevant linguistic data for analysis. CQL is widely used in corpus linguistics and facilitates the exploration of language patterns and structures within corpora.In conclusion, English language corpora play a vital role in linguistic research and analysis. The aforementioned corpora, including the British National Corpus, Corpus of Contemporary American English, Google Books Ngram Viewer, Corpus Linguistics Toolkit, International Corpus of English, Oxford English Corpus, and Corpus Query Language, provide valuable resources for investigating language usage, trends, and patterns in various contexts. These corpora aid in the understanding of language change, societal influences, and cultural shifts, making them invaluable tools for language researchers, educators, and language enthusiasts.。

近十年来语料库在学术英语研究中的应用

近十年来语料库在学术英语研究中的应用

外语外文1472017年 第15期一、引言随着语料库语言学在中国的发展以及语料库知识的日渐普及, 越来越多的学者开始利用语料库来做研究。

特别是近几年来,语料库已成为语言学实证研究的一个重要手段,基于语料库的实证研究逐年增加,成为语言研究的一个热点。

语料库方法近十年来在学术英语研究中被广泛使用,该类研究以语料库为基础,以真实的语料为研究对象,以数据统计和理论分析为研究方法,依据语言学相关理论,分析学术英语的语体特点、学术写作等,直接受益于语料库语言学和描写性语言学研究。

笔者以检索摘要含有“语料库”和“学术英语”为关键词在中国知网上共检索到1318篇文章,其中被引频次为10以上的文章数量为172篇。

笔者结合被引频次和是否发表在外语类核心期刊上,进行分析总结,发现使用语料库为研究方法进行学术英语研究主要集中在体裁分析和元话语研究中。

二、语料库在学术英语领域的应用Stenfanowitsch 和Gries(2006:1)提到:在过去的15年中,语料库分析法已经成为语言学研究中的一个重要的实证范式,推动了词汇和语法的深入研究,并用于分析语言结构的几乎所有层面。

笔者以2006-2016年国际刊物Journal of Pragmatics 以及English for Specific Purposes.1. 语料库在体裁分析中的应用国外对学术英语的体裁分析 (genre analysis)的重要性得到广泛认可并取得了很大的进展(Swales,1990;Bhatia,1993; Bhatia, 1993;Henry&Roseberry,1998;Johns,2002;Williams & Hasan,1996)。

近年来在学术英语领域,运用基于体裁分析和语料库分析的研究方法已经引起了学者们越来越多的关注(Santos 1996;Huckin 2001;Martin 2003;Samraj 2005;Cross & Oppenheim 2006)。

中科院自动化所的中英文新闻语料库

中科院自动化所的中英文新闻语料库

中科院自动化所的中英文新闻语料库【引言】随着互联网的迅猛发展和全球化的加速,语言数据在各领域的应用越来越广泛。

作为我国顶级科研机构,中科院自动化所敏锐地捕捉到这一趋势,积极构建中英文新闻语料库,以满足各行业对高质量语言数据的需求。

本文将详细介绍中科院自动化所中英文新闻语料库的特点、应用领域以及在我国的现实意义与价值。

【中英文新闻语料库的特点与优势】1.数据来源与采集方式:中英文新闻语料库主要来源于国内外知名新闻网站、报纸、杂志等,采用自动化爬虫技术与人工筛选相结合的方式进行数据采集。

这保证了数据的权威性和准确性。

2.数据规模与类别:截至目前,中英文新闻语料库已收录千万级规模的新闻文本,涵盖政治、经济、科技、文化等多个领域。

丰富的数据类别为各类研究提供了广泛的素材。

3.实时更新与多样性:为保持数据的时效性,中英文新闻语料库采用实时更新的策略,确保研究人员可以获取最新的新闻文本。

同时,通过多种采集渠道,丰富了数据来源,提高了数据的多样性。

【中英文新闻语料库的应用领域】1.自然语言处理研究:中英文新闻语料库为自然语言处理领域的研究提供了丰富的数据支持。

研究人员可以利用这些数据开展文本分类、情感分析、实体识别等任务,推动我国自然语言处理技术的发展。

2.媒体监测与舆情分析:通过对中英文新闻语料库的分析,企业、政府等相关机构可以实时掌握舆论动态,发现并处置负面舆情,提高品牌形象。

3.智能推荐与信息检索:中英文新闻语料库可以为搜索引擎和推荐系统提供内容支持,实现精准的信息检索与推荐,提高用户体验。

【中英文新闻语料库在我国的现实意义与价值】1.促进我国媒体发展:中英文新闻语料库为媒体行业提供了丰富的素材,有助于提高新闻报道的质量和深度。

2.提高语言智能技术水平:借助中英文新闻语料库,我国科研机构可以开展更多关于自然语言处理技术的研究,推动我国在该领域的竞争力。

3.服务国家战略需求:在中英文新闻语料库的基础上,相关研究成果可应用于国防、外交、经济等国家战略领域,为国家决策提供有力支持。

SCI写作助手“Academic Phrasebank”,全网广泛推荐的学术语料库!

SCI写作助手“Academic Phrasebank”,全网广泛推荐的学术语料库!

SCI写作助手“Academic Phrasebank”,全网广泛推荐的学术语料库!假如说学术界是一个舞台,良好的论文写作就是你的入场券,特别是中国学者的Chi-english,尤其让文章逊色不少。

如果能有英文语句写作模板的话,这个问题也就引刃而解了,不过,模板和套路一样,虽然来源于文献却高于文献,要认真总结下来,总归要花费大量的时间和精力。

在此向大家安利一个神奇的网站——Academic Phrasebank,专治英文SCI写作的各种水土不服。

一、网站简介Academic Phrasebank网站是由曼彻斯特大学的博士John Morley创办的,里面提供了大量的SCI写作句型和短语,参考材料都是来自于英语母语者的文章。

通过您的灵魂注入和添加,一篇SCI文章就完成啦!网址:/二、操作指南1、导航栏介绍这个网站的操作方法很简单,导航栏中的各个选项分别对应着论文引言(Introduction)、引文部分如何引用、实验方法如何描述(Methods)、实验结果(Results)、讨论(Discussion)和总结(Conclusions)。

每个标签下面都会指导你,哪个部分该如何写、该利用什么动词时态……真正做到了文章写到哪指导到哪,是不是超级简单!2、详细解读论文关键部分以“Describing Methods”为例,如下图所示,清晰详细的描述了论文方法的部分,方便了其他研究学者重复研究并且复现结果,也详细的指出了这个部分的撰写中动词应该用过去时态。

、神奇宝典万能句式模板点击第一个选项“Describing previously used research methods ”,就会出现下面图中的万能句式模板,这对于缺乏写作经验和英语不在行的学者来说,可谓是神奇4、轻松搞定论文写作框架这个网站还有另外一个神奇之处,它不只是单一的给每一部分的撰写例句,还给作者搭建好了写作框架,简直是良心到不行。

显然,这个网站为大家提供了大量的黄金模板,不过,小编仍建议大家不要直接套用这些万能句式,引用句式的时候,应该对其做出相应的改动,这样可以规避查重风险。

语言学常用语料库

语言学常用语料库

语言学常用语料库
语言学常用语料库有很多,以下是一些常用的语料库:
1. Brown语料库:美国布朗大学语言学部于1960年代编制的语料库,是英语语料库中最早的、最著名的语料库之一。

2. Penn Treebank语料库:由宾夕法尼亚大学开发的语料库,主要用于句法分析和语言学研究。

3. CoNLL语料库:共享任务(Conference on Computational Natural Language Learning)所使用的语料库,包括各种语言的语料。

4. Europarl语料库:包括欧洲议会会议的多种语言翻译版本,用于机器翻译和跨语言研究。

5. Google语料库:由Google搜索引擎收集的大规模网络文本语料库,可用于研究自然语言处理和文本挖掘等领域。

6. Corpus of Contemporary American English (COCA):包括当代美国英语的语料库,涵盖了各种不同类型的文本。

7. British National Corpus (BNC):出版物、广播和会话等来源的英国英语语料库,是英国英语的重要资源。

这些语料库提供了大量的文本数据,可用于研究不同语言的语
言学现象,如词汇使用、语法结构和语义等。

它们对于语言学研究和自然语言处理的发展起着重要作用。

英语句子语料库

英语句子语料库

英语句子语料库
英语句子语料库是用于自然语言处理和机器学习的文本数据集,其中包含大量英语句子。

以下是一些常用的英语句子语料库:
1. Brown Corpus:布朗语料库,包含一百万个单词,涵盖了多种文体和主题。

2. Penn Treebank:宾州树库,包含大量的英语句子和词性标注信息。

3. CoNLL 2003:用于命名实体识别和词性标注的语料库。

4. OntoNotes:多语言语料库,包含英语、中文、阿拉伯语等多种语言的文本和标注信息。

5. BERT Corpus:BERT模型使用的语料库,包含大量的英语句子和预训练模型。

6. OpenWebText Corpus:开源的Web文本语料库,包含大量的英语句子和网络用语。

7. Common Crawl Corpus:公共爬虫语料库,包含大量的英语句子和网页内容。

8. News Crawl Corpus:新闻爬虫语料库,包含大量的英语新闻文章和句子。

9. WikiText-103:维基百科文本语料库,包含大量的英语维基百科文章和句子。

10. BookCorpus:书籍语料库,包含大量的英语书籍和句子。

以上是一些常用的英语句子语料库,可以根据需要进行选择和使用。

这些语料库可以用于自然语言处理、机器学习、文本挖掘等领域的研究和应用。

常用的英语语料库

常用的英语语料库

常用的英语语料库有以下几个:
英国国家语料库(BNC):是目前世界上非常有代表性的当代英语语料库之一,收录了1亿字的电子资源,涉及口语和书面英语。

美国当代英语语料库(COCA):是目前最大的免费英语语料库,包含5.2亿词的文本,由口语、小说、流行杂志、报纸以及学术文章五种不同的文体构成。

密歇根大学学术口语语料库(MICASE):专注于学术口语,收集了大量学术讨论和讲座的语音转录。

密西根高阶学生论文语料库(MICUSP):主要收录高年级学生的论文,对于研究学术写作风格和习惯很有帮助。

台湾清大自然语言处理语料库(Linggle):结合大数据分析,提供了丰富的语料和语言统计信息。

这些语料库各具特色,可以根据具体的研究需求选择合适的语料库。

中外语料库语言学源流PPT课件

中外语料库语言学源流PPT课件
• Corpus-informed/related ‘grammars’
– Pattern grammar (local grammar) – Collostruction – Lexical grammar (natural grammar, real grammar) – Lexical priming (textual colligation) – Longman grammar: Biber et al. grammar register
• @be • #n •*
returns all inflectional forms of ‘be’ returns all nouns refers to any single word
14
• a * of => a * of • It be ADJ that => It @be #adj that • Noun noun compound => #n #n • Bi-nominal => #n and #n • Passive =>
3
PowerConc
• Size: 1.5MB, compressed package less than 1MB
• Installation: Doesn’t require any installation. • OS: Works only on Windows now.
4
Design principles for PowerConc
\S+_VB\S+\s(\S+_[RXPJDN]\S+\s)*\S+_V\S*N
15
Limitation
• speed • A concordancer without applying indexing • can't process texts larger than a few million

语言学常用语料库

语言学常用语料库

语言学常用语料库
以下是一些语言学常用的语料库:
- Brown语料库:这是一个基于英语的语料库,包含了1961年至1979年间推广的1,000,000个单词的样本,覆盖了各种文体和题材。

- COCA(Corpus of Contemporary American English):这是一
个覆盖美国当代英语的语料库,包含了1990年至今的一亿多
个单词样本。

- BNC(British National Corpus):这是一个覆盖英国英语的
语料库,包含了1980年代至1993年间的一亿个单词样本。

- CHILDES(Child Language Data Exchange System):这是一
个收集婴儿和儿童语言数据的数据库,用于研究儿童语言发展。

- Penn Treebank:这是一个标注了句法和语义信息的英语语料库,用于自然语言处理研究。

- EuroParl语料库:这是一个包含欧洲议会会议记录的多语言
语料库,可以用于研究多语言对比和机器翻译。

- COrE(Corpus of English):这是一个以英语为基础的多样
化语料库,包含了来自不同国家和地区的语言样本,用于研究语言变体和语言接触。

- WALS(World Atlas of Language Structures):这是一个收集了世界各地不同语言结构的数据库,可以用于跨语言比较和语言学理论研究。

这些语料库可以通过在线平台或特定的研究机构访问和获取。

使用语料库可以帮助语言学家进行语言研究、语言分析和理论构建。

英汉语料库汇总

英汉语料库汇总

1.英语学习者语料库(书面语及口语)中国学习者语料库 CLEC(100万)广外、上海交大2.大学英语学习者口语语料库 COLSEC (5万) 上海交大3.香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学4.中国英语专业语料库 CEME (148万) 南京大学5.中国英语学习者口语语料库 SECCL (100万) 南京大学6.国际外语学习者英语口语语料库中国部分 LINSEI-China (10万) 华南师大7.硕士写作语料库 MWC (12万) 华中科技大学9.平行语料库汉英平行语料库 PCCE 北外10.南大-国关平行语料库南京大学11.英汉文学作品语料库;外研社12.冯友兰《中国哲学史》汉英对照语料库13.李约瑟(Joself Needham)《中国科学技术史》英汉对照语料库14.计算机专业的双语语料库;国家语言文字工作委员会语言文字应用研究所15.柏拉图(Plato)哲学名著《理想国》的双语语料库16.英汉双语语料库(15万对) 中科院软件所17.英汉双语语料库:LDC香港新闻英汉双语对齐语料36294段以及香港法律英汉双语对齐语料31万句子对中国科学院自动化研究所18.英汉双语语料库(100万),网上英汉语段电子词典及网上电子英汉搭配词典(1000万) 东北大学19.英汉双语语料库(40-50万句子对) 哈尔滨工业大学20.双语语料库(5万多对) 北京大学计算语言学研究所21.对比语料库 LIVAC(Linguistic variety in Chinese communities) 香港城市理工大学22.平衡语料库(Sinica Corpus);树图语料库(Sinica Treebank) 台湾23.特殊英语语料库中国英语(China English)语料库河南师范大学24.军事英语语料库(Corpus of Military Texts) 解放军外语学院25.新视野大学英语教材语料库上海交通大学26.汉语语料库汉语现代文学作品语料库(1979年,527万字) 武汉大学27.现代汉语语料库(1983年,2000万字) 北京航空航天大学28.中学语文教材语料库(1983年,106万8000字) 北京师范大学29.现代汉语词频统计语料库(1983年,182万字) 北京语言学院30.国家级大型汉语均衡语料库(2000万字) 国家语言文字工作委员会31.《人民日报》语料库(2700万字) 北京大学计算机语言学研究所32.大型中文语料库(5亿字,10分库) 北京语言文化大学33.现代汉语语料库(1亿字) 清华大学34.汉语新闻语料库;(1988年,250万字) 山西大学35.标准语料库(2000年,70万字)36.生语料库(3000万字);《作家文摘》的标注语料库(100万字) 上海师范大学37.现代自然口语语料库中国社会科学院语言所38.旅游咨询口语对话语料库和旅馆预定口语对话语料库中国科学院自动化所39.北京大学汉语语言学研究中心的三个语料库现代汉语语料库/yuliao.asp?item=1古代汉语语料库/yuliao.asp?item=2汉英双语语料库/yuliao.asp?item=3/printthread.php?t=2742汉语语料库使用权限国家语委语料库(http://219.238.40.213:8080/CpsQrySv.srf)”虽说是通用型平衡语料库,但不能完全免费使用;北京语言大学的汉语语料库(http://202.112.195.8)语料产出时间较早,且不能完全免费使用;北京大学汉语语言学研究中心语料库(现代汉语子库)”(/YuLiao_Contents.Asp)规模最大,逾亿字,但取样极不均衡,多半为文学作品;台湾“中央研究院”Sinica Corpus也是可免费使用的平衡汉语语料库。

免费的英语语料库汇总

免费的英语语料库汇总

免费的英语语料库汇总Some are not corpora, but (I think) they are corpus-related. The list is incomplete and just let me know if I omit any corpora.1. The best corporaCOCA:/BNC-BYU:/bnc/TIME-BYU:/time/JustTheWord:http://193.133.140.102/JustTheWord/index.html BNCweb:/bncwebSignup/user/login.php Jukuu(句酷):/ for learnersLeeds: /internet.htmlLextutor: http://www.lextutor.ca/Web Concordancer: 2. General CorporaJiaoda(上海交大): /WebCast/click on “guest”Brown/lob Corpus: http://www.lextutor.ca/concordancers/concord_e.html Corpuseye: http://corp.hum.sdu.dk/cqp.en.htmlCorpus swb : /cgi-bin/?&corpus=swb BNC: //lookup.ht mlBank of English: /Corpus/CorpusSearch.aspx ANC: /OANC/index.htmlICE Corpora /english-usage/i...load/index.htm3. English-Chinese Parellel Corpora(英汉双语语料库)CEO:/ceo/Babel:.sg/cgi-bin/babel/paraconc.plThe Dream Of Red Chamber(红楼梦): .sg/hlm/index.htmHK Poly U(香港理工大学):.hk/Co...ts/default.htmLaozi(老子): .sg/laozi/index.htmXiamen U(厦门大学): /ec-corpus/query.asp 4. Textbook CorporaCollege English:/corpora/COLEN.rarNew Horizon College English(NHCE):New Concept English:/oechw/hanyu/da...e/framconc.aspFamily Album USA:/oechw/hanyu/da...m/framconc.asp5. Business and Financial CorporaBusiness English Corpus (BEC): http://users.utu.fi/micnel/BEC/PolyU BusinessCorpus: .hk/en...ng=1&corpus=30Business Letter Corpus: /concordancer Financial Corpus: .hk/hkfsc/6. Literary CorporaThe Online Corpus of Old English Poetry(OCOEP):http://www.oepoetry.ca/Shakespeare's SonnetsCorpus: /ecorpus/sonnets/framconc.aspBlues Lyric Poetry Corpus: / (search Catalog). Canadian Poets Anthology Corpus: / (search Catalog). CAPA (contemporary American PoetryArchive): /Claremont Corpus of Elizabethan Verse: / (search Catalog)Late Modern English Prose Corpus: / (search Catalog) New Dragon Book of Verse Corpus : / (search Catalog).Northwest Coast Indian mythology Corpus: / (search Catalog).Online Classics Horror and PhantasyFiction: http://home.swipnet.se/~w-60478/SETIS Australian Literary and HistoricalTexts: .au/ozlit/Corpus of Middle English Prose andVerse: /c/cme/Harry Potter Corpus:/oechw/hanyu/da...r/framconc.aspTowneley Plays Corpus: / (search Catalog)Web Concordances Site: /english/wics/wics.htm York Miracle Play Cycle Corpus: / (search Catalog) ME Texts Anthology Corpus: / (search Catalog) 7. Web As CorpusWeb As Corpus :/searchwac.htmWeb Corp: /WebCONC: http://www.niederlandistik.fu-berlin...=en&art=google8. Learner CorporaChinese Learners of English(中国英语学习者): /corpus/EngSearchEngine.aspxCorpus of Hungarian students' essays:/2008/06...subcorpus.htmlThe Multimedia Adult English Learner Corpus:/maelc_access.htmlThe Uppsala Student English Corpus (USE):Dowloadable data at /headers/2457.xml Michigan Corpus of Upper-level StudentPapers: /eli/eli1/micusp/Contact.htmIWILL Corpus: /project/bncrce/default.htm Wordneighbours:t.hk/PICLE Corpus:.pl/~kprzemek/conc...h_adv_new.html EV A Corpus:http://kh.hd.uib.no/eva/PolyU Language Bank Concordancer:.hk/en...ng=1&corpus=16The Montclair Electronic Language Learners' Database under construction)/linguistics/MELD/Singapore Corpus of Research in Education:.sg/score/index.htmBirkbeck Spelling Error Corpus: / (search Catalog) Open Mind Commonsense Corpus: / Corpus for Higher Education:.hk/en...ng=1&corpus=11National Taiwan Normal University Corpora:.tw/English/search/Default.htm.tw/English/search/tag.htm.tw/English/search/tag2.htmhttp://140.122.83.246/cwb/http://140.122.83.246/cwb2/ELISA corpus: http://www.uni-tuebingen.de/elisa/html/elisa_index.html VLC: .hk/9. News CorporaReuters Corpus: /researchandstandards/corpus/ arpers Magazine 1879-1880 Corpus: / (search Catalog).Hong Kong South China Morning PostCorpus: / (search Catalog)New York Newspaper Advertisements and News Items1777-1779: /VOA Special EnglishCorpus: /voa/sentences.htmVOA Special English audio and textcorpus: /voanews.html.American News Stories Corpus: / (search Catalog). MPQA Opinion Corpus: /mpqa/databaserelease/。

语言翻译必备:国内外23个语料库推荐

语言翻译必备:国内外23个语料库推荐

语言翻译必备:国内外23个语料库推荐语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。

经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。

下面推荐一些优质的语料库资源。

国内语料库资源1. 国家语委现代汉语语料库 现代汉语通用平衡语料库现在重新开放网络查询了。

重开后的在线检索速度更快,功能更强,同时提供检索结果下载。

现代汉语语料库在线提供免费检索的语料约2000万字,为分词和词性标注语料。

2. 国家语委古代汉语语料库 网站现在还增加了一亿字的古代汉语生语料,研究古代汉语的也可以去查询和下载。

同时,还提供了分词、词性标注软件、词频统计、字频统计软件,基于国家语委语料库的字频词频统计结果和发布的词表等,以供学习研究语言文字的老师同学使用。

3. 北京大学“《人民日报》标注语料库”4. 北大语料库——北京大学中国语言学研究中心 北大语料库由“现代汉语语料库”、“古代汉语语料库”、“汉英双语语料库”三个语料库组成。

其中,北大计算语言学研究所的双语语料库,英汉对齐的句子已有5万多对,并开发了相应的对齐工具和双语语料库管理软件。

正在此基础上做汉英对照短语库,预计规模将达数十万条。

(汉英双语语料库目前仅对北大校内用户开放)5. 北京语言大学高翻学院的“高翻记忆库”6. 清华大学汉语均衡语料库TH-ACorpus7. 中央研究院“现代汉语平衡语料库” 专门针对语言分析而设计的,每个文句都依词断开,并标示词类。

语料的搜集也尽量做到现代汉语分配在不同的主题和语式上,是现代汉语无穷多的语句中一个代表性的样本。

现有语料库主要针对语言分析而设计,由中央研究院信息所、语言所词库小组完成,内含有简介、使用说明,现行的语料库是4.0的版本。

8. 中央研究院“近代汉语标记语料库”9. 中央研究院汉籍电子文献(瀚典全文检索系统) 包含整部25史整部阮刻13经、超过2000万字的台湾史料、1000万字的大正藏以及其他典籍。

语料库在中外合作办学英语教学中的应用研究--以英国学术英语写作语料库(BAWE)为例

语料库在中外合作办学英语教学中的应用研究--以英国学术英语写作语料库(BAWE)为例

外语翻译摘要从本质上来说,中外合作办学英语教学主要是为了解决学生“如何学”的问题,即教师如何把行之有效的学习方法传授给学生,让学生懂得“如何学”,从而增强其自主学习能力。

语料库语言学正是解决学生“学之道”之匙。

本文以英国学术英语写作语料库(BAWE)为例来探讨语料库在中外合作办学英语教学中的应用,学生可以在教师的指导下,利用语料库开展自主学习。

关键词语料库大学英语数据驱动学习模式Research on the Application of Corpus to English Teach原ing in Sino-Foreign Cooperative Education:Taking British Academic Written English Corpus(BAWE)as an Example//Chen YongbinAbstract Essentially speaking,English teaching in Sino-foreign cooperative education mainly aims to solve the problem of how students learn,namely,how teachers impart effective learning methods to students so that students can understand how to learn and enhance their ability to learning independently.Corpus lin-guistics is the key to solving the problem of students'"learning methods".This paper uses English Academic Written English Corpus(BAWE)as an example to explore the application of cor-pus to English teaching in Sino-foreign cooperative education. Students can use the corpus to carry out autonomous learning under the guidance of teachers.Key words corpus;college English;data-driven learning mode1引言2003年颁布的《中华人民共和国中外合作办学条例》中明确指出,中外合作办学是中国教育事业的组成部分。

sci英语语料库

sci英语语料库

sci英语语料库
SCI英语语料库是用于学术研究的英语文本集合,它包含了大量科学论文和文献,有助于研究人员分析和研究专业英语的使用情况。

SCI(Science Citation Index)英语语料库通常指的是那些收录了大量科学引文索引的英语语料库,这些语料库主要用于分析和研究科学技术领域的英语使用情况。

以下是一些可用于研究的英语语料库:
Corpus of Contemporary American English (COCA):这是一个大型且“平衡”的美国英语语料库,可能是目前使用最广泛的英语语料库之一。

British National Corpus (BNC):这是英国国家语料库,包含了广泛的英国英语文本。

Webcorp:这是一个专业的语料库,提供了大量在线文本数据。

DEAP Corpus:这个语料库旨在收集在高影响力国际期刊上发表的英语研究文章,覆盖了20多个学科。

这些语料库对于语言学家、研究人员以及学习者来说是宝贵的资源,它们可以用来研究语言模式、词汇使用、语法结构等。

此外,语料库还可以帮助翻译人员和写作者提高他们的英语水平,了解专业领域中的术语和表达方式。

学术英语语料库beijing care简介

学术英语语料库beijing care简介

学术英语语料库beijing care简介全文共3篇示例,供读者参考篇1IntroductionBeijing Care Academic English Corpus is a large-scale language resource designed for researching and analyzing academic English in the context of Beijing. The corpus contains a variety of texts, including academic papers, research articles, conference presentations, and other scholarly works. It serves as a valuable tool for linguists, educators, and students interested in studying English language use in academic settings.Corpus CompositionThe Beijing Care Academic English Corpus is comprised of texts written by scholars, researchers, and students in various academic disciplines. The corpus includes content from fields such as science, technology, engineering, mathematics, social sciences, humanities, and more. The texts in the corpus cover a wide range of topics, including but not limited to, biology, chemistry, physics, computer science, sociology, economics, literature, and history.The corpus consists of both native and non-native English texts, allowing researchers to analyze and compare language use by different groups of writers. Additionally, the corpus includes texts at different proficiency levels, from beginner to advanced, providing a comprehensive view of academic English writing.Corpus FeaturesThe Beijing Care Academic English Corpus offers a range of features that make it a valuable resource for language analysis and research. Some of the key features of the corpus include:1. Search and retrieval functions: Users can search for specific words, phrases, or patterns in the corpus to analyze how they are used in academic English texts.2. Concordance lines: The corpus provides concordance lines for search results, allowing users to see texts in context and analyze language patterns.3. Frequency lists: The corpus generates frequency lists of words and phrases, helping users identify common language patterns in academic English writing.4. Part-of-speech tagging: The corpus includespart-of-speech tagging for each token, allowing users to analyze grammatical structures and language patterns.Applications of the CorpusThe Beijing Care Academic English Corpus can be used for a variety of research purposes, including:1. Linguistic research: Scholars and researchers can use the corpus to study language variation, discourse analysis, and language use in academic settings.2. Teaching and learning: Educators and students can use the corpus to analyze language patterns, improve writing skills, and develop teaching materials for academic English courses.3. Corpus-based language studies: The corpus serves as a valuable resource for corpus linguistics studies, enabling researchers to analyze language use in academic texts and compare language use across different disciplines.ConclusionOverall, the Beijing Care Academic English Corpus is a valuable resource for studying and analyzing academic English language use in the context of Beijing. With its diverse range of texts, search functions, and analytical tools, the corpus provides researchers, educators, and students with a comprehensive view of academic English writing. By using the corpus, researchers can gain valuable insights into language patterns, discoursestructures, and writing styles in academic texts, leading to a deeper understanding of academic English language use.篇2Beijing CARE (Corpus of Academic Research English) is a comprehensive academic English corpus that focuses on research articles produced by scholars in Beijing, China. The corpus is designed to help researchers, students, and educators study and analyze academic English language use in a specific regional context. This paper provides an introduction to Beijing CARE, discussing its background, features, and potential applications.BackgroundBeijing CARE was established in 2019 by a team of researchers from Beijing Language and Culture University. The corpus is based on a large collection of academic research articles written in English by scholars affiliated with universities and research institutions in Beijing. The articles cover a wide range of disciplines, including but not limited to science, technology, engineering, medicine, social sciences, and humanities.FeaturesBeijing CARE contains a wealth of data on academic English language use in the Beijing context. The corpus is annotated with part-of-speech tags, syntactic information, and other linguistic features to facilitate linguistic analysis. It also includes metadata such as author information, publication details, and keywords to help researchers navigate and search the corpus effectively.One of the key features of Beijing CARE is its focus on regional variation in academic English language use. By analyzing the corpus, researchers can gain insights into the linguistic characteristics and conventions that are specific to academic writing produced in Beijing. This can be particularly useful for scholars studying cross-cultural communication, English for academic purposes, and English language teaching.ApplicationsBeijing CARE has a wide range of potential applications for researchers, students, and educators. Researchers can use the corpus to study academic English language use in the Beijing context, compare it with other academic English varieties, and explore patterns and trends in language use across different disciplines. The corpus can also be used to develop teaching materials and resources for English for academic purposes courses.Students can benefit from Beijing CARE by using it to improve their academic English writing skills. By studying examples of academic research articles written by scholars in Beijing, students can learn about the conventions of academic writing in their field of study and develop their own writing proficiency. The corpus can also be used to analyze and compare the language use of high-impact vs. low-impact publications in order to improve the quality of their own research articles.Educators can use Beijing CARE to design curriculum and assessment materials for English for academic purposes courses. By incorporating authentic academic research articles from the corpus into their teaching, educators can provide students with real-world examples of academic writing and help them develop the language skills necessary for success in their academic careers.ConclusionIn conclusion, Beijing CARE is a valuable resource for studying academic English language use in the Beijing context. The corpus provides researchers, students, and educators with a wealth of data on academic writing produced by scholars in Beijing, allowing them to analyze linguistic patterns, explore regional variations, and improve their own writing skills. Byleveraging the rich data and features of Beijing CARE, users can gain a deeper understanding of academic English language use in the Beijing context and advance their research and teaching in the field of English for academic purposes.篇3Beijing Care is a valuable academic English corpus that focuses on the field of healthcare in Beijing, China. It is a comprehensive collection of written and spoken texts related to medical research, patient care, healthcare policies, and other aspects of the healthcare industry in Beijing. This corpus is designed to assist researchers, scholars, and students in studying and analyzing English language data in the healthcare domain.The Beijing Care corpus consists of a wide range of texts, including research articles, medical reports, patient records, healthcare guidelines, and publications from healthcare organizations in Beijing. It provides a wealth of information on various medical topics, such as disease prevention, treatment protocols, medical technologies, and healthcare services available in Beijing.One of the main features of the Beijing Care corpus is its linguistic diversity. The texts in this corpus cover a variety ofEnglish language styles, including formal academic writing, technical medical jargon, patient communication, and healthcare administration. This linguistic diversity enables researchers and students to study language use in different healthcare contexts and improve their English language skills in the field of healthcare.Another key aspect of the Beijing Care corpus is its size and scope. With thousands of texts and millions of words, this corpus offers a vast amount of data for linguistic analysis and research. Researchers can examine language patterns, vocabulary usage, discourse structures, and other linguistic features in the healthcare domain to gain insights into how language is used in the field of healthcare in Beijing.The Beijing Care corpus is also a valuable resource for language teachers and learners who are interested in healthcare English. The texts in this corpus can be used to develop teaching materials, create language learning exercises, and facilitate classroom discussions on healthcare topics. By studyingreal-world healthcare texts, students can enhance their English language proficiency and gain a better understanding of healthcare terminology and concepts.In conclusion, the Beijing Care corpus is an invaluable resource for anyone interested in studying English language data in the field of healthcare in Beijing. This corpus provides a rich and diverse collection of texts that can be used for research, teaching, and learning purposes. By exploring the language of healthcare in Beijing through this corpus, researchers, scholars, and students can gain valuable insights into the linguistic features of the healthcare domain and enhance their understanding of healthcare communication in English.。

bcc语料库学术语言

bcc语料库学术语言

bcc语料库学术语言
bcc语料库是一个开放的学术语料库,用于研究领域内的语言学问题。

它包含了来自不同学科领域和语言背景的文章、论文、报告等学术文献,提供了大量的语言数据供研究者进行语言分析和研究。

bcc 语料库的数据来源广泛,包括了学术期刊、会议论文、学位论文等,覆盖了多个学科领域,如自然科学、社会科学、人文学科等。

其中,各类文章的单篇词数以万计,是一个非常宝贵的研究资源。

在研究语言问题时,bcc语料库可以帮助研究者进行定量分析和实证研究。

其丰富的语言数据不仅可以用于分析词汇、句法结构、语用等方面的语言问题,还可以用于研究各种语言现象,如语域、语言变体等问题。

更重要的是,bcc语料库的数据可以从多个角度研究同一问题,帮助研究者更全面地理解语言现象和规律,丰富我们对语言的认识。

然而,bcc语料库并不仅仅是一个语言数据的仓库,还是研究者共同探讨学术问题的平台。

在bcc语料库的网站上,人们可以通过在线交流和讨论,分享自己对语言问题的研究成果、见解和经验,从而促进彼此之间的学术交流和合作。

这为学术研究者提供了一个非常重要的交流平台,可以极大地促进学术研究的发展和进步。

综上所述,bcc语料库是一个非常宝贵的学术资源,对于研究不同领域的语言问题有着非常重要的作用。

通过分析bcc语料库的语言数据,研究者可以更全面地认识语言问题,并通过交流平台获得更多的学术研究成果和经验分享。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中外学术英语语料库
中外学术英语语料库是一个大型的语料库,主要用于学术研究,特别是语言学、文学、翻译等领域。

该语料库包含了大量的学术论文、期刊文章、会议论文等资源,涵盖了各个学科领域。

中外学术英语语料库的建立,旨在为学者们提供一个全面、权威的学术资源平台,方便他们进行学术研究、论文写作、翻译等工作。

该语料库不仅提供了大量的语料资源,还提供了各种分析工具和统计数据,帮助学者们更好地分析和理解语言现象。

此外,中外学术英语语料库还注重学术诚信和版权保护,确保所有资源都经过严格的筛选和审核,确保学术研究的公正性和权威性。

同时,该语料库还提供了一些学术规范和指导,帮助学者们更好地遵守学术道德和规范。

总之,中外学术英语语料库是一个非常有价值的学术资源平台,为学者们提供了全面的学术支持和帮助。

相关文档
最新文档