可以免费使用的大型英语语料库资源

合集下载

常用在线语料库使用简介

常用在线语料库使用简介

字串查询区
图5-1
COCA
5. COCA界面简介(图5-1)
语料库分类区
图5-1
COCA
5. COCA界面简介(图5-1)
查询结果排列 方式区
图5-1
COCA
5. COCA界面简介(图5-1)
查询结果数据显示区
图5-1
COCA
5. COCA界面简介(图5-1)
例句显示区/帮助信息显示区
图5-1
结果如图6.5-2
图6.5-1
图6.5-2
COCA
7. 新增功能 7.1 Words and Phrases (图7.1-1)
/
图7.1-1
COCA
7. 新增功能 7.1 Words and Phrases 7.1.1 Frequency List (图7.1.1-1)
COCA语料库规模大,涵盖美国1990-2012年间
口语(spoken)、小说(fiction)、流行杂志(pop magzine)、报纸(newspaper)和学术期刊 (academic)五大类型的文本 使用界面友好,检索速度快 时效性强,不断更新功能
COCA
5. COCA界面简介 三大功能区:
图6.1.1-4
COCA
6.1.2 检索某一词性的单词
输入“feature.[v*]”,可得到“feature”做动词时的使
用情况 (图6.1.2-1) “.”表示feature不与其后的字符串组成短语 “[v*]”代表所有形式的动词 点击POS LIST后的问号,可了解具体词性代码
在搜索结果区可得到“feature”的频数 (图6.1.1-2 )
点击该词,可在例句显示区看到含有“feature”的词条

国外个主流语料库使用

国外个主流语料库使用

1. The Complete Lexical Tutorhttp://www.lextutor.ca/参考期刊网上刘玉山,胡志军的介绍。

是一个语料库中心词索引软件(concordancer),加拿大魁北克大学Tom Cobb the University of Quebec at Montreal (UQAM), 开发三部分:learners, researchers, teachers自我学习,研究,教师命题。

特别是concordance中有13个语料库为检索对象。

还可以用来对学生作文中的用词分析。

http://www.lextutor.ca/concordancers/concord_e.html可以同时提供多个语料库的在线搜索,但缺点是每次只能对一个文本加工。

2.BNC2014年开始,免费获得,通过BYU的申请。

British National Corpus一亿词,书面语90%,口语10%,共4124篇文本,从1980到1993年的语料英国牛津出版社﹑朗文出版公司﹑钱伯斯—哈洛普出版公司﹑牛津大学计算机服务中心、兰卡斯特大学英语计算机中心以及大英图书馆等联合开发建立的大型语料库共有七类口语spoken,小说fiction,流行杂志magazine,报纸newspaper和学术期刊academic还有COCA分类中没有的两类non-academic, miscellaneoussecond edition BNC World (2001)third edition BNC XML Edition (2007)extracts from regional and national newspapers, specialist periodicals and journals for all ages and interests, academic books and popular fiction, published and unpublished letters and memoranda, school and university essays, among many other kinds of text通常可进入的那个链接是BYU, 美国杨百翰大学提供的BYU大学在2012年对语料库经行了重新附码,用的CLAWS 73. COCA: the corpus of contemporary American EnglishBrigham Young University 美国犹他州杨百翰大学Doctor Mark Davies3.6亿,1990-2007年间,美国国内各种语料口语spoken,小说fiction,流行杂志magazine,报纸newspaper和学术期刊academic共五类语料来源且持续更新中,每年以2000万词递增,目前到1990-2012,共4.5亿词Display:显示方式,compare选项可以用来比较两个词的搭配区别,排列方式选择relevance 相关度标记了语料的时间,便于研究语言历时与共时的变化教学中相关用法查找同义词,如[=scold].[V*]表示查找所有scold的同义词查找某一话题的词汇,如flower.[N*],表示查找与花有关的词汇,如果需要查找更为专业的词汇,就利用互信息。

可以免费使用的大型英语语料库资源

可以免费使用的大型英语语料库资源

英语语料库#参考2012-03-02 22:29:26■BNC=The British National Corpus英国国家语料库/(备用)/bnc/■ANC = The American National Corpus美国国家语料库/■COCA = Corpus of Contemporary American English 美国当代英语语料库/■COHA = Corpus of Historical American English 美国近当代英语语料库/coha/■BOE=Bank of English 柯林斯英语语料库/wordbanks/■NMC=New Model Corpus 新规范语料库/■ARC=ACL Anthology Reference Corpus (ARC) 文选参考语料库/auth/preloaded_corpus/aclarc/ske/first_form■BAWE=British Academic Written Eng Corpus (BAWE) 英国学术书面语语料库/auth/preloaded_corpus/bawe2/ske/first_form/AcaDepts/ll/app_ling/internal/bawe/sketch_engine_bawe.htm download■BASE= British Academic Spoken English Corpus (BASE) 英国学术口语语料库/fac/soc/celte/research/base/■SCTS=Scottish Corpus Of Texts and Speech苏格兰口语与书面语语料库/■SCTS=Corpus Of Modern Scottish Writing 当代苏格兰语实库/cmsw/Slang/ (American, English, and Urban slang)/slang/ (UK)//cybereng/slang///可以免费使用的大型英语语料库资源常用语料库资源链接汇集(语料天涯)/time/http://www.lextutor.ca/concordancers/concord_e.html 常用语料库资源链接汇集(语料天涯)http://202.204.128.82/sweccl/Corpus//netprints/Corporalink/Corporalink.htm1. BNC-World Simple Search ☆☆☆/lookup.html But no more than 50 hits will be displayed, with a fixed amount of context.2. Brown, LOB, BNC sampler ☆☆☆Here are a few links for searching corpora online, including monolingual corpora like Brown, LOB, and BNC sampler and also some parallel English-Chinese corpora.English: /concordance/WWWConcappE.htmEnglish: http://www.lextutor.ca/concordancers/concord_e.htmlParallel: /concordance/paralleltexts/3. Collins Cobuild Corpus Concordance Sampler☆☆☆☆☆/Corpus/CorpusSearch.aspxThe Collins WordbanksOnline English corpus is composed of 56 million words of contemporary written and spoken text.4. New BNC interface - VIEW: ☆☆☆☆☆/5. Samples (about 2 million words) from the British National Corpus: both written and spoken ☆☆☆The Brown Corpus and many others - native, learner... Go tohttp://www.lextutor.ca/concordancers/concord_e.html6. MICASE ☆☆☆☆/m/micase/There are currently 152 transcripts (totaling 1,848,364 words) available at the site.7. CLEC online concordancing ☆☆☆☆/corpus/EngSearchEngine.aspxCLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。

最全面的英语学习资源大盘点

最全面的英语学习资源大盘点

最全面的英语学习资源大盘点在如今全球化的时代,掌握一门优秀的外语已成为职场和学术界必不可少的技能之一。

而英语由于其广泛的使用范围和全球化的影响力,成为了最受欢迎的外语之一。

然而,英语学习的途径和资源千差万别,如何找到最全面的英语学习资源,是每个英语学习者的共同难题。

本篇文章将为大家盘点最全面的英语学习资源,帮助各位英语爱好者更快速、有效地提高英语水平。

一、英语学习网站1. Duolingo:Duolingo是一款非常受欢迎的语言学习网站,它提供了一个轻松、有趣、互动的学习环境,可以让学生通过各种活动和语音练习来学习英语单词、语法等内容。

2. BBC Learning English:BBC Learning English提供了许多英语学习资源,包括听力、口语、阅读、写作等,非常适合初学者和进阶学习者。

3. British Council:British Council是英国政府官方机构,旨在促进英语文化和教育。

它的网站提供了各种英语学习资源,包括学习指南、视频、语法规则等。

4. VOA Learning English:VOA Learning English提供了大量的英语学习资源,包括新闻、音频、视频、习题和练习等,它的特色是以美国英语为主。

5. English Central: English Central是一个在线英语学习平台,提供了数千个视频资源和习题,通过这些资源帮助学生提高英语听力、口语和发音等技能。

二、英语学习应用1. HelloTalk:HelloTalk是一款社交应用,它允许用户与全球范围内的母语人士交流和练习口语。

该应用提供了语音、文字和视频聊天等功能,鼓励学生在真实的语言环境中学习英语。

2. Memrise:Memrise是一款基于记忆科学的学习应用,它通过各种互动的游戏和挑战帮助学生快速有效地学习英语单词和短语。

3. Lingbe:Lingbe是一款提供无限制的语言交流的应用,用户可以与全球各地的人进行语音聊天。

常用免费外文全文数据库

常用免费外文全文数据库

常用免费外文全文数据库1.SpringerLINK数据库德国施普林格(Springer-Verlag)是世界上著名的科技出版集团, 通过SpringerLink系统提供其学术期刊及电子图书的在线服务。

2002年7月开始,Springer公司和EBSCO/Metapress 公司在国内开通了SpringerLink服务。

访问方式:镜像服务器(本校读者无需登录)、国外站点(用户需登录出国并自付国际网络通信费)。

访问权限:校园网IP地址范围。

访问全文:(PDF格式)需要使用Acrobat Reader软件,如需安装,可由此下载Acrobat Reader。

2.EBSCOhost数据库EBSCO公司通过国际专线提供检索服务,校园网的用户检索、下载无需支付国际网络通信费。

采用IP控制访问权限,不需要帐号和口令。

3.WorldSciNet数据库WorldSciNet为新加坡世界科学出版社(World Scientific Publishing Co.)电子期刊发行网站,该出版社委托EBSCO / MetaPress 公司在清华大学图书馆建立了世界科学出版社全文电子期刊镜像站.4.Ptics ExpressOptics Express由美国光学学会创办,刊登光学技术领域方面的报告和新进展。

提供1997年创刊以来的全部文献,以平均49天一期的速度出版,并支持彩色图像和多媒体文件。

网站地址:/创建者:Optical Society 0f America5.New Journal 0f PhysicsNew Journal 0fPhysics由英国皇家物理学会和德国物理学会出版,提供1998年创刊以来的全部文献。

所有用户可免费获取电子版文章。

网站地址:创建者:Institute of Physics & German Physical Society6.The Journal of Machine Learning ResearchThe Journal of Machine Learning Research由麻省理工学院出版,是机械研究领域的优质学术性论文的平台,用户可下载2000年创刊以来的全部文章。

免费的英语语料库汇总

免费的英语语料库汇总

免费的英语语料库汇总Here is a list of free English language corpora:1. British National Corpus (BNC): One of the most widely used corpora, it includes spoken and written texts from a range of genres and registers.2. Corpus of Contemporary American English (COCA): Contains over 520 million words of American English from a variety of sources, including fiction, non-fiction, newspapers, academic journals, and spoken language.3. Corpus of Historical American English (COHA): Covers American English from 1810 to 2024 and includes over 400 million words from a variety of genres.4. Corpus of Global Web-Based English (GloWbE): A web-based corpus that contains over 1.9 billion words from websites around the world. It includes texts from different countries and regions, allowing for the study of global variation in English.5. International Corpus of English (ICE): A collection of corpora representing different varieties of English, including British, American, Indian, Australian, and Hong Kong English.6. TIME Magazine Corpus: Contains articles from TIME Magazine published between 1923 and 2024. It is a useful resource for studying the use of language in news and current affairs.7. Open American National Corpus (OANC): A wide-ranging corpus that includes a variety of written and spoken texts from different sources, including newspapers, fiction, academic journals, and interviews.8. Santa Barbara Corpus of Spoken American English: A corpus of spoken American English that includes conversations between native speakers from different regions of the United States.9. EnTenTen Corpus: A web-based corpus that has over 20 billion words of English from a wide range of online sources. It is useful for studying contemporary English usage.10. BYU-BNC: A version of the British National Corpus that has been cleaned and lemmatized, making it easier to analyze.11. The Corpus of Contemporary American English under COCA: Similar to COCA, this corpus includes 560 million words of American English, allowing for detailed analysis of language use in various contexts.12. The Corpus of Contemporary American English under COCA-Spoken: Specifically focuses on spoken American English, with over 200 million words from conversations, interviews, and other spoken sources.13. The Hansard Corpus: Contains transcripts of parliamentary debates in the United Kingdom from 1803 to thepresent day. It is a valuable resource for studying political discourse and language change.14. TIMIT Corpus: A widely used speech database that contains recordings of speech from speakers of eight major American English dialects.15. The New York Times Annotated Corpus: An extensive collection of articles from The New York Times, allowing for analysis of language use in journalistic writing.。

美国当代英语语料库(COCA)使用介绍

美国当代英语语料库(COCA)使用介绍

POS LIST





pron.INDF 不定代词 pron.PERS 人称代词 pron.WH 疑问代词 pron.REFL 反身代词 adj.CMP 形容词比较级 (comparative) adj.SPRL 形容词最高级 (superlative) adv.particle 副词小品词 adv.WH 疑问副词
规则: 若要得到某种词性且词中带有部分带有某些字母的形 式时,如要得到以 un- 开头、 -ed 结尾的所有形容词的所有形 式,那么输入: un*ed.[j*]; 若要得到动词 + 任何词 +ground 的所有词组 , 那么输入 : [v*]*[ground]即可。 前者用来研究词汇,后者用来查询特定词性的搭配。
查询结果
筛选出“应用”和“增加”作主谓搭配的例句
• The annual application of fertilizers has increased by 5.48% on average since 1980, and that of pesticide… • In ten Member States, average application of nitrogen increased almost 400% between 1950 and 1981. • Finally, studies have shown that application of biosolids increases the water holding capacity as well as reduces the potential of(wildcards) ,如分别输入 un*ly 和r?n*,结果如图。
? 代替一个字母 * 代替任意数量字母

英语资料网址大全

英语资料网址大全

英语资料网址大全1、搜索网站:全球最强大的搜索网站。

在语言学习中,它的功能至少包括:搜索新词可用之语境、确认某种搭配或用法是否准确、通过同时输入中文及"English"寻找可能存在的双语介绍、查询文学作品译本、了解某一类事物的相关知识等。

雅虎分类检索。

2、汉英、英汉、英英、汉汉词典:/ 金山词霸网站,可以下载部分字典软件的共享版,英汉之间各种转换都有。

词条数一般在百万以上。

建议还是直接去买软件好,作为案头常备工具,还可随点随译。

/ 太阳雨汉英英汉词典,内容丰富,可以添加词汇,并有水平不错的论坛。

/ 韦氏大词典,英英,韦氏字典家族尽览。

/ 综合词典,同义词/反义词,分类,英英。

rs.fr/dico/en/search 同义词电子词典,英英。

3、百科辞典/reference/ 美国最大的免费在线参考网站。

下有Columbia Encyclopedia, Roget's Thesauri, American Heritage Dictionary, Columbia History of English and American Literature等众多参考词典。

更新快,内容丰富。

英文。

在线简明哥伦比亚百科全书,有5万多词条。

英文。

/reference/encyclopedia/index.html 在线简明牛津百科全书。

英文。

/biography/search.html 人名词典,可通过名字、关键词或时间查询28,000位世界著名人物的简要介绍。

英文。

/research/tools/vocabulary/tgn/index.html 地名大词典。

英文。

/index.shtm 新近开通的知识在线,号称网上最大中文知识库,有世界知识、中国文物、音乐、体育、历史等百科全书。

需要注册。

/fxd/lookup.htm 六合一佛学大词典,每个词条都有详介及英语译法。

/encyclopedia/index.html 英文伊斯兰教百科全书。

美国当代英语语料库(COCA)使用介绍精品名师资料

美国当代英语语料库(COCA)使用介绍精品名师资料
美国当代英语语料库(COCA)使用说明
/
免费的英语语料库资源
• /static/worldcorpora.htm
• /index.html
• /m/micase/ • http://lextutor.ca/conc/eng/ • /
COCA界面简介
COCA界面简介
• 字串查询区:
• Ⅰ、WORDS:输入字符串。 • Ⅱ、COLLOCATES:上下文限定。 • Ⅲ、POS LIST:词性列表
COCA界面简介
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
• 功能:此区可以对查询的字符串限定语料类型 (Genre)和时段(Year) ,并且可以明确到查询某一 个子语料库,时段也可以查询任何一年的某个字词 的使用情况。
POS LIST





pron.INDF 不定代词 pron.PERS 人称代词 pron.WH 疑问代词 pron.REFL 反身代词 adj.CMP 形容词比较级 (comparative) adj.SPRL 形容词最高级 (superlative) adv.particle 副词小品词 adv.WH 疑问副词
图2.1.2-1
图2.1.2-2
Whiten*];动词: [v*]; 形容词: [j*]; 副词: [r*];代词:[p*];连词:[c*]……
POS LIST 词性列表
noun.ALL=名词 noun.SG=单数名词 noun.PL=复数名词 noun.CMN=普通名词 noun.+PROP=专有名词 noun.-PROP=非专有名词
COCA语料库简介

COCA简介

语料库网站网址

语料库网站网址

中央研究院近代汉语标记语料库:
语料库语言学在线:(搜LOCNESS就能出来LOCNESS)
北京大学中国语言学研究中心,简称CCL语料库检索系统(包括:现代汉语语料库、古代汉语语料库、汉英双语语料库)
闽南语典藏:.tw/

中国科学院计算所的双语语料库:/corpus/query_process.php
每个邮箱可以注册一次,免费期是一个月,免费期过了就再注册一个邮箱,再注册一次。

其中汉语语料库是没有加工的生语料库,使用价值不大。

关键是其中的英语语料库实际上是原来要付费才能使用的BNC,可以好好利用。

The Lancaster Corpus of Mandarin Chinese/scripts/download.php?otaid=2474
【在线字典、工具类】
爱词霸汉语词典/(有汉字笔顺Flash的演示,不错。

PS:爱词霸的其它链接也不错)
韩国21世纪世宗计划语料库(21세기세종계획)http://www.sejong.or.kr/ 【计算语言学里面使用最广的汉语树库】
Chinese PropBank (By U of Colorado) /chinese/cpb/。

COCA

COCA

COCA———美国当代英语语料库(Corpus of Contemporary A2merican English)(2011-05-13 10:53:38)转载▼标签:分类:每周一推美国当代英语语料库coca英语教学研究平台免费教育COCA———美国当代英语语料库(Corpus of Contemporary A2merican English)/由美国B righam Young University的M ark Davies教授开发的高达3.6亿词汇的美国最新当代英语语料库,是当今世界上最大的英语平衡语料库。

与其它语料库不同的是它是免费在线供大家使用,给全世界英语学习者带来了福音,是不可多得的一个英语学习宝库,也是观察美国英语使用和变化的一个绝佳窗口。

COCA美国当代英语语料库于2008年2月20日在互联网上正式推出。

在来自全球25个国家和地区有140余位专家学者参会的AACL22008(American Association for Corpus Linguis2tics)学术会议上,会议的组织者M ark Davies教授介绍了自己开发的COCA美国当代英语语料库,此外在此学术会议上还有部分学者对研究使用这一语料库进行了交流,获得了热烈反响。

为让更多中国的英语教师和学习者从大型语料库的知识海洋中受益,现积极向国内读者作介绍。

1优点许多语言学习者对普通网络搜索引擎有偏好,那是无法获取免费语料库的无奈之举。

但网络信息作为语料库的问题就是用户无法限定要查询字词的词性,无法作词与词的对比,无法限定要查找的语料类型,也无法确切地查找某一时段的字词使用信息,更无法限定要查找的字词间的距离,也就没有办法确定字词互信息的值。

而其它专业点的英语语料库又需要较贵的注册费或软件购买费用,让普通使用者望尘莫及。

COCA美国当代英语语料库是一个大型在线并免费供大家使用的语料库,为英语研究者和英语学习者共享美国英语资源提供了一个良好平台。

英文文献免费下载网站地址集锦

英文文献免费下载网站地址集锦

国外免费期刊全文数据库1.香港科技大学图书馆Dspace包括香港科技大学的学术论文、学位论文、研究报告等内容,均可免费获取全文。

Openj-gate/提供4350种开放获取的期刊的数百万期刊全文文献。

加利福尼亚大学国际和区域数字馆藏/escholarship/加利福尼亚大学国际和区域数字馆藏研究项目。

eScholarshipRepository主要提供已出版的期刊论文、未出版的研究手稿、会议文献以及其他连接出版物上的文章1万多篇,均可免费阅读。

剑桥大学机构知识库/由Cambridge University Library和University Computing Service维护,提供剑桥大学相关的期刊、学术论文、学位论文等电子资源。

发展中国家联合期刊库.br/非营利的电子出版物服务机构,提供来自发展中国家(如巴西、古巴、印度、印尼、肯尼亚、南非、乌干达、津巴布韦等)的开放获取的多种期刊的全文。

美国密西根大学论文库/index.jsp美国密西根大学论文库2万多篇期刊论文、技术报告、评论等文献全文。

包含艺术学、生物学、社会科学、资源环境学等学科的相关论文,另还有博硕士论文。

标识为OPEN的可以打开全文。

jfgCERN Document Serverhttp://cdsweb.cern.ch/主要覆盖物理学(particle physics)及相关学科,提供360,000多篇全文文献,包括预印文献、期刊论文、图书、图片、学位论文等等。

klArXiv/ArXiv是属于Cornell University的非盈利教育机构,面向物理学、数学、非线性科学、计算机科学和定量生物学等学科提供16种免费电子期刊的访问。

NASA Technical Reports Server/?method=browse主要是关于航空航天领域研究的科技报告和会议论文。

National Service Center for Environmental Publications/ncepihom/National Service Center for Environmental Publications提供的是美国环境保护总署(EPA)出版物。

可以免费使用的英语语料库资源

可以免费使用的英语语料库资源

可以免费使用的大型英语语料库资源常用语料库资源链接汇集(语料天涯)http://202.204.128.82/sweccl/Corpus//netprints/Corporalink/Corporalink.htm1. BNC-World Simple Search ☆☆☆/lookup.htmlBut no more than 50 hits will be displayed, with a fixed amount of context.2. Brown, LOB, BNC sampler ☆☆☆Here are a few links for searching corpora online, including monolingual corpora like Brown, LOB, and BNC sampler and also some parallel English-Chinese corpora. English: /concordance/WWWConcappE.htmEnglish: http://www.lextutor.ca/concordancers/concord_e.htmlParallel: /concordance/paralleltexts/3. Collins Cobuild Corpus Concordance Sampler☆☆☆☆☆/Corpus/CorpusSearch.aspxThe Collins WordbanksOnline English corpus is composed of 56 million words of contemporary written and spoken text.4. New BNC interface - VIEW: ☆☆☆☆☆/5. Samples (about 2 million words) from the British National Corpus: both written and spoken ☆☆☆The Brown Corpus and many others - native, learner...Go to http://www.lextutor.ca/concordancers/concord_e.html6. MICASE ☆☆☆☆/m/micase/There are currently 152 transcripts (totaling 1,848,364 words) available at the site.7. CLEC online concordancing ☆☆☆☆/corpus/EngSearchEngine.aspxCLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。

分享丨翻译和语言研究必备:国内外23个语料库推荐

分享丨翻译和语言研究必备:国内外23个语料库推荐

分享丨翻译和语言研究必备:国内外23个语料库推荐点击上方“能源舆情”可以订阅哦!书到用时方恨少,还不赶快来收藏?!国内语料库资源1. 国家语委现代汉语语料库现代汉语通用平衡语料库现在重新开放网络查询了。

重开后的在线检索速度更快,功能更强,同时提供检索结果下载。

现代汉语语料库在线提供免费检索的语料约2000万字,为分词和词性标注语料。

2. 国家语委古代汉语语料库/login.aspx网站现在还增加了一亿字的古代汉语生语料,研究古代汉语的也可以去查询和下载。

同时,还提供了分词、词性标注软件、词频统计、字频统计软件,基于国家语委语料库的字频词频统计结果和发布的词表等,以供学习研究语言文字的老师同学使用。

展开剩余92%3. 北京大学“《人民日报》标注语料库”/icl_res4. 北大语料库——北京大学中国语言学研究中心/corpus.asp北大语料库由“现代汉语语料库”、“古代汉语语料库”、“汉英双语语料库”三个语料库组成。

其中,北大计算语言学研究所的双语语料库,英汉对齐的句子已有5万多对,并开发了相应的对齐工具和双语语料库管理软件。

正在此基础上做汉英对照短语库,预计规模将达数十万条。

(汉英双语语料库目前仅对北大校内用户开放)5. 北京语言大学高翻学院的“高翻记忆库”6. 清华大学汉语均衡语料库TH-ACorpus/ainlp/source.htm(似乎在改版,一直上不去)7. 中央研究院“现代汉语平衡语料库”/SinicaCorpus专门针对语言分析而设计的,每个文句都依词断开,并标示词类。

语料的搜集也尽量做到现代汉语分配在不同的主题和语式上,是现代汉语无穷多的语句中一个代表性的样本。

现有语料库主要针对语言分析而设计,由中央研究院信息所、语言所词库小组完成,内含有简介、使用说明,现行的语料库是4.0的版本。

8. 中央研究院“近代汉语标记语料库”/kiwi/pkiwi/index.html9. 中央研究院汉籍电子文献(瀚典全文检索系统)包含整部25史整部阮刻13经、超过2000万字的台湾史料、1000万字的大正藏以及其他典籍。

免费的英语语料库汇总

免费的英语语料库汇总

免费的英语语料库汇总Some are not corpora, but (I think) they are corpus-related. The list is incomplete and just let me know if I omit any corpora.1. The best corporaCOCA:/BNC-BYU:/bnc/TIME-BYU:/time/JustTheWord:http://193.133.140.102/JustTheWord/index.html BNCweb:/bncwebSignup/user/login.php Jukuu(句酷):/ for learnersLeeds: /internet.htmlLextutor: http://www.lextutor.ca/Web Concordancer: 2. General CorporaJiaoda(上海交大): /WebCast/click on “guest”Brown/lob Corpus: http://www.lextutor.ca/concordancers/concord_e.html Corpuseye: http://corp.hum.sdu.dk/cqp.en.htmlCorpus swb : /cgi-bin/?&corpus=swb BNC: //lookup.ht mlBank of English: /Corpus/CorpusSearch.aspx ANC: /OANC/index.htmlICE Corpora /english-usage/i...load/index.htm3. English-Chinese Parellel Corpora(英汉双语语料库)CEO:/ceo/Babel:.sg/cgi-bin/babel/paraconc.plThe Dream Of Red Chamber(红楼梦): .sg/hlm/index.htmHK Poly U(香港理工大学):.hk/Co...ts/default.htmLaozi(老子): .sg/laozi/index.htmXiamen U(厦门大学): /ec-corpus/query.asp 4. Textbook CorporaCollege English:/corpora/COLEN.rarNew Horizon College English(NHCE):New Concept English:/oechw/hanyu/da...e/framconc.aspFamily Album USA:/oechw/hanyu/da...m/framconc.asp5. Business and Financial CorporaBusiness English Corpus (BEC): http://users.utu.fi/micnel/BEC/PolyU BusinessCorpus: .hk/en...ng=1&corpus=30Business Letter Corpus: /concordancer Financial Corpus: .hk/hkfsc/6. Literary CorporaThe Online Corpus of Old English Poetry(OCOEP):http://www.oepoetry.ca/Shakespeare's SonnetsCorpus: /ecorpus/sonnets/framconc.aspBlues Lyric Poetry Corpus: / (search Catalog). Canadian Poets Anthology Corpus: / (search Catalog). CAPA (contemporary American PoetryArchive): /Claremont Corpus of Elizabethan Verse: / (search Catalog)Late Modern English Prose Corpus: / (search Catalog) New Dragon Book of Verse Corpus : / (search Catalog).Northwest Coast Indian mythology Corpus: / (search Catalog).Online Classics Horror and PhantasyFiction: http://home.swipnet.se/~w-60478/SETIS Australian Literary and HistoricalTexts: .au/ozlit/Corpus of Middle English Prose andVerse: /c/cme/Harry Potter Corpus:/oechw/hanyu/da...r/framconc.aspTowneley Plays Corpus: / (search Catalog)Web Concordances Site: /english/wics/wics.htm York Miracle Play Cycle Corpus: / (search Catalog) ME Texts Anthology Corpus: / (search Catalog) 7. Web As CorpusWeb As Corpus :/searchwac.htmWeb Corp: /WebCONC: http://www.niederlandistik.fu-berlin...=en&art=google8. Learner CorporaChinese Learners of English(中国英语学习者): /corpus/EngSearchEngine.aspxCorpus of Hungarian students' essays:/2008/06...subcorpus.htmlThe Multimedia Adult English Learner Corpus:/maelc_access.htmlThe Uppsala Student English Corpus (USE):Dowloadable data at /headers/2457.xml Michigan Corpus of Upper-level StudentPapers: /eli/eli1/micusp/Contact.htmIWILL Corpus: /project/bncrce/default.htm Wordneighbours:t.hk/PICLE Corpus:.pl/~kprzemek/conc...h_adv_new.html EV A Corpus:http://kh.hd.uib.no/eva/PolyU Language Bank Concordancer:.hk/en...ng=1&corpus=16The Montclair Electronic Language Learners' Database under construction)/linguistics/MELD/Singapore Corpus of Research in Education:.sg/score/index.htmBirkbeck Spelling Error Corpus: / (search Catalog) Open Mind Commonsense Corpus: / Corpus for Higher Education:.hk/en...ng=1&corpus=11National Taiwan Normal University Corpora:.tw/English/search/Default.htm.tw/English/search/tag.htm.tw/English/search/tag2.htmhttp://140.122.83.246/cwb/http://140.122.83.246/cwb2/ELISA corpus: http://www.uni-tuebingen.de/elisa/html/elisa_index.html VLC: .hk/9. News CorporaReuters Corpus: /researchandstandards/corpus/ arpers Magazine 1879-1880 Corpus: / (search Catalog).Hong Kong South China Morning PostCorpus: / (search Catalog)New York Newspaper Advertisements and News Items1777-1779: /VOA Special EnglishCorpus: /voa/sentences.htmVOA Special English audio and textcorpus: /voanews.html.American News Stories Corpus: / (search Catalog). MPQA Opinion Corpus: /mpqa/databaserelease/。

学英语的好网站

学英语的好网站

以下20个英语学习网站上都有许多免费的mp3和视频,你可以自己选择一下:1.(24小时学习网)2.(英文荟萃)(内含口语8000句)3.英语听力资源汇总4.(英语听力mp3下载)5.(英语之声)6.(英语听力特区)7.(普特英语听力)8.(大学英语精渎听力下载)9.(爱鸽英语)10.(万千英语族)11.真题网)12.(我爱英语网)13.(英语精华网)14.(清剑精品资料)15.(美诺学习网)16.大学英语四级考试听力MP3 100篇17.(学生大考试站)18.(教育学习网)19.(学程无忧)20.(goo学网)另附:1.个外国英文网站强力推荐)2.英语学习网站超级大全)3.英语学习网站大全)4.二十个学英语的网站)5.(外语学习网址大全)关于语法:1.(真题网)2.高考英语语法)3.英语精华网)4.英迪网)5.(我爱英语网)6.(点点英语——语法大全)关于词汇:1. (四级词汇mp3)2.(英语单词常见前后缀总结)3.(英语单词词根词典)关于音标:1.美音听力及发音小技巧)2.英语口语学习资源)3. 学习网页4. 学习软件5.大耳朵英语——国际音标与语音 )6.(国际音标下载)关于翻译网站:有两个比较好的多语言在线翻译网:(用左边)再给你介绍一个好的中英日韩在线翻译网。

这个网站翻译方法是:中文(或英文)翻成日文,由日文再翻成韩文。

纯粹的中日文翻译可以利用:中文日文在线翻译)再提供一个信息,没事的时候多打开看看,一定有许多收获,比如你打开第一个看看!!!关于流行语翻译的资源:1.(非凡英语——各专业类别英语翻译词汇资源目录——)2.(词汇分类汇总文章列表)3.(万千英语族——翻译文化频道)关于新概念英语的学习网站:1.视频)2.视频)3.(需先注册—mp3)4.(mp3)5.(mp3)6.7.8.辅导学习)有些人所谓的英语网站首推:我爱英语网首页英语屋首页英语俱乐部首页旺旺英语首页如何学英语,每个人学习的方法不同,只有你自己才最清楚你驾驭语言的能力。

普通人也能用的9个语料库网站,做研究、学外语的来看看

普通人也能用的9个语料库网站,做研究、学外语的来看看

普通人也能用的9个语料库网站,做研究、学外语的来看看提到语料库,很多人脑中浮现出这样的画面——或者这样的——但其实,语料库可以是我们做(语言)研究、学外语的好帮手。

比如,你可以在某些语料库查到最地道的英语表达,也可以听到世界各地的英语口音。

今天就为大家介绍9个语料库网站——1. 语言结构世界地图集Word Atlas of Language Structure知道阿伯卡茨语有多少元音和辅音?波罗罗语的词缀有几种形态?恰卡通戈米斯特克语有几种声调?想回答这些问题?你需要的只是登陆这个名为The World Atlas of Language Structures Online(语言结构世界地图册,简称WALS)的网站这里有各类语言分布的详细地图,有对于世界上2600多种语言192个语言学特征的详细记录,非常适合语言爱好者。

嗯,妈妈再也不用担心我被多语狂魔们实力嘲讽了,随便选出一个语言了解一下,足以技惊四座!详细的使用指南以及更多精彩内容,午餐早已备好,我不会这门语言,但我可以查到关于它的一切 | 语言学午餐2. 语言口音档案馆the Speech Accent Archive大家学英语这么多年,基本上属于身经百战了,哪个地方的英语口音没听过,什么纯正伦敦音,印度咖喱腔,苏格兰懵逼腔,布鲁克林街头腔,那是如数家珍。

但是,你听过刚果金非洲小哥的英语口语嘛?你了解玻利维亚大妈的英语口音嘛?喏,这个名为the Speech Accent Archive 的网站绝对可以满足各位英语语音控的猎奇愿望。

该数据库搜集了几百名来自世界各地,不同民族语言背景的人们针对同一段文字的录音资料,每段录音都详细记录了音频提供者的详细背景资料,每段语音也很详细的进行了转写。

对于研究者来说,可视之为研究英语使用者发音特征的独门利器;对普通人来说,则是一个了解各地英语口音的难得窗口。

3. 当代美国英语语料库COCA想知道某个单词在新闻和小说中的使用有什么差异?英文写作的时候想知道自己写出来的英语搭配够不够地道?想知道背下多少单词就可以流利阅读各类小说报纸?嗯,你需要的只是一个语料容量巨大的英语语料库,COCA恰好可以满足你的这些需求。

英文分词语料库

英文分词语料库

英文分词语料库
1. Penn Treebank (PTB):这是一个广泛使用的英文分词语料库,由宾夕法尼亚大学创建。

它包含了大量的文本,包括新闻、小说、论文等,并已经进行了精细的分词和词性标注。

2. British National Corpus (BNC):BNC 是一个大型的英国英语语料库,包含了各种类型的文本,如报纸、杂志、小说、论文等。

它也提供了分词和词性标注等信息。

3. Brown Corpus:这是一个早期的英文分词语料库,由布朗大学创建。

它包含了不同领域的文本,如新闻、小说、科技文献等,并已经进行了分词处理。

4. Wall Street Journal Corpus (WSJ):WSJ 是一个基于《华尔街日报》的分词语料库,包含了大量的商业、金融和经济领域的文本。

它对于处理金融和经济相关的自然语言处理任务非常有用。

5. Google Books Ngram Corpus:这是一个由谷歌创建的大型语料库,涵盖了多个语言,包括英语。

它包含了数十亿个单词,并提供了分词信息,可以用于研究词汇的使用和趋势。

这些英文分词语料库提供了丰富的文本资源和分词信息,可以用于各种自然语言处理任务,如词性标注、命名实体识别、句法分析等。

在使用这些语料库时,需要根据具体需求选择适合的语料库,并结合相关的工具和技术进行处理和分析。

英语翻译器

英语翻译器

英语翻译器英语翻译器:Google Translate、Bing Translator、沪江小D、Trados、Deacute;jagrave; Vu X、Transmate、Urban Dictionary、Online Slang Dictionary、Word Spy、COCA语料库。

1. Google Translate适用人群:翻译工作者,语言爱好者。

主要特点:Google Translate是语言爱好者必备利器,有网页版和APP等多个界面,支持多种语言互翻。

Google机器翻译起步较早,在通过采用谷歌神经机器翻译系统,大幅提升翻译速度和准确度。

Google Translate的APP版本,在语音翻译和图像翻译方面做的很方便。

沪江君推荐:Google翻译可以极大提升翻译效率,在科技文、商务文方面尤为出色,但在文学、艺术领域还有待提高。

总之,它是有力的机器翻译辅助工具。

现在,Google翻译的APP版本可以直接把图像翻译成文字。

点击相机图标,即可识别图像中的文字信息,实时转化为我们所需的语言,甚至不用联网!2. Bing Translator适用人群:所有人、语言爱好者、翻译人群。

主要特点:Bing Translator 是Microsoft提供的一项文段和网页全文翻译功能网站,作为Bing服务品牌的一部分。

与google翻译类似的是,Bing翻译同样采用统计机器翻译技术。

Bing Translator借助微软强大的语料库资源,翻译质量高,同时还提供翻译对比,还贴心提供了微软商务翻译工具小应用,沪江君特别爱用!沪江君推荐:Bing Translator 可以说是微软最受欢迎且最具实用性的移动应用之一,既有OCR识别技术,还有语言翻译功能。

对翻译要求高,翻译速度快的学生、办公室白领可以使用这款翻译软件。

3. 沪江小D适用人群:外语学习爱好者、翻译人群。

主要特点:多语种学词工,小而美,边查边学沪江君推荐:如果你初学翻译,这款炒鸡好用的查词工具一定不能错过。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

可以免费使用的大型英语语料库资源
/time/
http://www.lextutor.ca/concordancers/concord_e.html
常用语料库资源链接汇集(语料天涯)
http://202.204.128.82/sweccl/Corpus/
/netprints/Corporalink/Corporalink.htm
1. BNC-World Simple Search ☆☆☆
/lookup.html
But no more than 50 hits will be displayed, with a fixed amount of context.
2. Brown, LOB, BNC sampler ☆☆☆
Here are a few links for searching corpora online, including monolingual corpora like Brown, LOB, and BNC sampler and also some parallel English-Chinese corpora. English: /concordance/WWWConcappE.htm
English: http://www.lextutor.ca/concordancers/concord_e.html
Parallel: /concordance/paralleltexts/
3. Collins Cobuild Corpus Concordance Sampler☆☆☆☆☆
/Corpus/CorpusSearch.aspx
The Collins WordbanksOnline English corpus is composed of 56 million words of contemporary written and spoken text.
4. New BNC interface - VIEW: ☆☆☆☆☆
/
5. Samples (about 2 million words) from the British National Corpus: both written and spoken ☆☆☆
The Brown Corpus and many others - native, learner...
Go to http://www.lextutor.ca/concordancers/concord_e.html
6. MICASE ☆☆☆☆
/m/micase/
There are currently 152 transcripts (totaling 1,848,364 words) available at the site.
7. CLEC online concordancing ☆☆☆☆
/corpus/EngSearchEngine.aspx
CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。

For an introduction of the corpus, its error tagset and some statistics, see
/baseinfo/achievement/Achievement1.htm
8. Business Letter Corpus Online KWIC Concordancer ☆☆☆
1 MILLION WORDS BUSINESS LETTER CORPUS (US & UK) AND OTHER CORPORA seek.co.jp/
9. Virtual Language Centre ☆☆☆
/concordance
The Starr Report, Brown, LOB, The Times (Jan, Feb, Mar) 3 files, SCMP, Business & Economy, Computing etc
10. Time Magazine archive ☆☆☆, 1923-2007 (100+ million words)
/time/ and more at /
11. Just the word
http://193.133.140.102/JustTheWord/
书店可以买到的语料库相关书籍
Austermühl, F. 2001. Electronic Tools for Translators《译者的电子工具》. Manchester: St.
Jerome Publishing. (外研社引进)
Biber, Douglas, Stig Johansson, Geoffrey Leech, Susan Conrad & Edward Finegan. 1999.
Longman Grammar of Spoken and Written English. Longman Publications Group.
(外研社引进)
Biber, Douglas, Susan Conrad & Randi Reppen. 1998. Corpus Linguistics. Cambridge: Cambridge University Press. (外研社引进)
Granger, S. et al. (eds.). 2003. Corpus-based Approaches to Contrastive Linguistics and Translation Studies《基于语料库的语言对比和翻译研究》. Amsterdam: Rodopi. (外研社引进)
Gries, Stefan Thomas. 2004. Multifactorial Analysis in Corpus Linguistics: A Study of Particle Placement. Beijing: Peking University Press. (北大出版社引进)Hunston, Susan. 2002. Corpora in Applied Linguistics. Cambridge: Cambridge. University Press. (世界图书出版社引进)
Kennedy, Graeme. 1998. An Introduction to Corpus Linguistics. London: Longman. (外研社引进)
Nattinger, James R. & Jeanette S. DeCarrico. 1992. Lexical Phrases and Language Teaching. Oxford: Oxford University Press. (外教社引进)
Sinclair, John. 1991. Corpus, Concordance, Collocation. Oxford: Oxford University Press.
(外教社引进)
Thomas, Jenny & Mick Short. 1996. Using Corpora for Language Education. London: Pearson Education. (外研社引进)
Zanettin, F., et al. (eds.). 2003. Corpora in Translator Education《语料库与译者培养》.
Manchester: St. Jerome Publishing. (外研社引进)
蔡金亭,2003,《语言因素对英语过渡中使用——一般过去时的影响》。

北京:外语教学与研究出版社。

何安平(主编),2004,《语料库在外语教育中的应用:理论与实践》。

广州:广东高等教育出版社出版。

何安平,2004,《语料库语言学与英语教学》。

北京:外语教学与研究出版社。

华南师范大学外国语学院编,2005,《语料库语言学的研究与应用》。

长春:东北师范大学出版社。

黄昌宁,李涓子著,2002,《语料库语言学》。

北京:商务印书馆。

濮建忠,2003,《学习者动词行为:类联接、搭配及词块》。

开封:河南大学出版社。

王建新,2005,《计算机语料库的建设与应用》。

北京:清华大学出版社。

王克非等,2004,《双语对应语料库研制与应用》。

北京:外语教学与研究出版社。

王立非、梁茂成等,2007,《计算机辅助第二语言研究方法与实用》。

北京:外语教学与研究出版社。

卫乃兴,2002,《词语搭配的界定与研究体系》。

上海:上海交通大学出版社。

卫乃兴,李文中,濮建忠等,2005,《语料库应用研究》。

上海:上海外语教育出版社。

文秋芳、王立非、梁茂成,2005,《中国学生英语口笔语语料库》。

北京:外语教学与研究出版社。

【含SWECCL语料库光盘】
杨达复,2000,《英语错误型式分析》。

西安:陕西人民出版社。

杨惠中、桂诗春,2003,《中国学习者英语语料库》。

上海:上海外语教育出版社。

【含CLEC 语料库光盘】
杨惠中、卫乃兴,2005,《中国学习者英语口语语料库建设与研究》。

上海:上海外语教育出版社。

【含COLSEC语料库光盘】
杨惠中等(主编),2005,《基于CLEC语料库的中国学习者英语分析》。

上海:上海外语教育出版社。

杨惠中主编,2002,《语料库语言学导论》。

上海:上海外语教育出版社。

2022年4月25日星期一。

相关文档
最新文档