美国当代英语语料库使用说明

合集下载

布朗标准美式英语语料库

布朗标准美式英语语料库

布朗标准美式英语语料库一、新闻报道布朗标准美式英语语料库中的新闻报道涉及各种题材和来源。

这些报道来自美国的主要新闻媒体,包括报纸、电视和网络。

报道的日期涵盖了近几十年来的主要历史事件和日常新闻。

这些新闻报道可以帮助您了解美国英语的语言风格、措辞、语法和拼写等方面的变化。

二、社论评论布朗标准美式英语语料库中的社论评论主要是针对某些特定事件或政治立场的文章。

这些文章通常由报纸和杂志的专业撰稿人撰写,表达他们对时事、政策或社会问题的看法。

社论评论可以帮助您了解不同观点的交锋、论证技巧和语言风格。

三、小说故事布朗标准美式英语语料库中的小说故事选自各种流派和文学时期的小说作品。

这些小说代表了美国文学的多样性,包括现实主义、浪漫主义、超现实主义等。

这些小说可以帮助您了解英语的叙述技巧、情节安排和人物描写等方面的艺术。

四、人物对话布朗标准美式英语语料库中的人物对话是来自各种场合和人物的对话记录,包括访谈、演讲、课堂讨论等。

这些对话展示了美国英语口语交流的特点,包括口音、发音、语法和措辞等方面的变化。

人物对话可以帮助您提高英语口语表达能力,并更好地理解不同场合和文化背景下的交流习惯。

五、科学论文布朗标准美式英语语料库中的科学论文选自各种学科领域的学术期刊和研究报告。

这些论文涵盖了自然科学、社会科学和人文学科等领域,展示了科学研究的专业性和严谨性。

科学论文可以帮助您了解科学语言的特殊性和学术写作的风格。

六、演讲致辞布朗标准美式英语语料库中的演讲致辞是来自各种场合和人物的演讲记录,包括政治演讲、商业演讲和学术演讲等。

这些演讲展示了英语演讲技巧和表达能力,包括语言组织、逻辑结构、修辞手法等方面的应用。

演讲致辞可以帮助您提高英语演讲能力和说服力。

七、商业广告布朗标准美式英语语料库中的商业广告是来自各个时期和不同行业的广告作品。

这些广告展示了市场营销和品牌推广的策略,包括产品介绍、促销活动和品牌形象等方面的宣传。

商业广告可以帮助您了解英语广告的语言特点和文化背景,提高对市场推广的理解和应用能力。

语料库视角下的中学英语教学——以短语thanksto为例

语料库视角下的中学英语教学——以短语thanksto为例

- 169 -校园英语 / 基础教育研究语料库视角下的中学英语教学——以短语thanks to为例江苏师范大学/王婷婷【摘要】随着计算机技术的发展,语料库逐渐进入教师的视野,特别是英语语料库的出现大大改善了语言学习的真实性,语料库在英语教学中也越来越多的受到重用。

本文以短语thanks to为例,介绍了语料库辅助下的教学活动设计,希望能给教师们有所帮助。

【关键词】语料库 中学英语教学 thanks to 美国当代语料库(COCA)一、语料库在中学英语教学中的应用1.语料库简介。

语料库(corpus 或corpora),顾名思义就是用计算机储存的语言信息资源库。

例如把一种或多种教科书或词典输入电脑,然后运用计算机快速便捷的检索手段提取关键词,可以找出一组含有该词的例句(concordance),通过对这些话语的分析可以揭示某些规律或传递某种信息。

2.语料库在英语教学中的应用优势。

对于教师而言,语料库是为教师提供了大量的真实材料,极大的补充了教学资源。

传统的教学资源包括教学大纲、教科书和练习册,教师备课能参考有限的教学资源,语料库的出现和发展无疑为教师教学提供了可靠的教学参考,有利于教师教学技能和教学效果的提高,同时教师自身知识也得以充实。

二、语料库辅助下的英语教学过程1.准备与预演。

准备工作主要包括环境准备、材料准备和应对一些意外情况的预案准备。

其中环境准备即要落实使用语料库的场所及相关设备条件;材料准备主要包括硬件和软件的准备,必须清楚哪些材料是现成的,哪些还需要制作的;预案是希望能够保障教师在最基本的教学条件下顺利完成教学任务的候补方案。

正式上课之前进行的预演使我们对准备工作进行检查并预测语料库在课堂教学中的使用情况以保证每个教学环节都能充分地展示出来并时时做出反思。

2.课堂展示。

课堂展示是具体的教学过程,教师在利用实施教学过程前要明确是教学目标、教学重难点等等,以词组thanks to 为例来看如何使用语料库设计的教学过程:1)明确教学目标。

美国当代英语语料库(COCA)使用介绍

美国当代英语语料库(COCA)使用介绍

选择学习COCA的原因
• 1. COCA免费且在线方便。 • 2. 规模大(4.5亿,1990-2012)、速度快 (一般几秒)、词性标注易于理解。 • 3.时效性强——每年至少更新两次,并且每 年新增2000万词汇。
COCA界面简介
主要包括三大功能区:
Ⅰ 显示及查询条件界定区,包括:显示方式区, 字串查询区,语料库分类区,查询结果排列方式 区。 Ⅱ 查询结果数据显示区 Ⅲ 例句显示区
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
二、COCA主要搜索功能
• 2.1 搜索words、phrases、lemmas(单 词的所有形式)、wildcards(通配符)和 其他更加复杂的字词。
图2.1.5-1
图2.1.5-2
动词+任何词+ground的所有词组
COCA主要搜索功能(二)
• 2.2 搜索搭配词和出现的频率
• 如“thick后跟的名词” (图2.2-1)
图2.2-1
规则:在collocates里输入[n*] 后选择4,表示在thick4后面(4跨距范 围内)出现的任何名词
COCA主要功能(一)
• 例 3. 输入通配符 (wildcards) ,如分别输入 un*ly 和r?n*,结果如图。
? 代替一个字母 * 代替任意数量字母
EXAMPLE 3
EXAMPLE 3
COCA主要搜索功能
• 例 4. 输入 lemmas (即一个单词的单复数、时态等 所有形式),若要得到 sing 这个单词的所有形式, 可以如下图所示。

美国当代英语语料库在英语词汇学习中的应用

美国当代英语语料库在英语词汇学习中的应用
学 习 者 习得 地 道 纯 正 的 美 语 。 [ 关键词 ] COC A 语料库
引 言 Biblioteka 搭 配 同 义词 一

2 O 世纪8 O 年代 以来 , 基 于语料库 的语言学 及其相关研究越来 越受 到重视 。语 料库将大量 语言使用者 的语言直 觉汇集起来 , 从而使 语言 分析 更为客观。 自然发生 的语 言数据的最大优势是可 观察性和可检验 性, 基 于 语 料库 的观 察 本 质 上 比 内省 式 的 判断 更 经 得起 实证 检 测 ( Mc E n e r y&Wi l s o n . 2 0 0 1 : 1 4 ) 。 近年来 语 教学 中学 习者逐 渐处 于学 习的主体地 位 , 语料 库作为一种 辅助性工 具应用于语 言教学成 为必然 的趋势。语料库辅助教 学的主要思想是指引语 言学 习者充分利用 网络 和语料库 资源 , 通过观察 和分析大量客观 真实的语料, 发现语 言语法规 则、 意 义表达及语用 特征 , 积极主动地解决 问题 。有 助于提高学 习者 的 语言直觉 , 从而 掌握 准确地道 的语言 , 而且能培养 学习者 的思 考 、 推理 能力 , 使学习者“ 通过发现来学 习” ( T r i b b l e &J o n e s 1 9 9 0: 1 2 ) 。 二、 美国 当代英语语料库 ( COCA) 美国当代英语语料库 ( C o r p u s o f C o n t e mp o r a r y A me r i c a n E n g l i s h , C O - C A) 于2 0 0 8 年在互联 网上推 出 , 是迄今 为止 网上最 大 的免 费英语语料 库, 也是 当今世界上最大 的英语平衡语料 库。C O C A是 由美 国杨伯翰大 学( B r i g h a mYo u n gU n i v e r s i t y ) Ma r kD a v i e s 教授 开发 的 , 库容高 达 4 . 5 亿 词汇是美 国最新 当代英语 语料库 , 每月有 近 1 O 万人使 用该 语料库 以及 D a v i s 开发 的其他 几个 语料库用于学 习或科研 , 是使 用者不可多得 的一 个英语 参考资源 , 也是查询 和观察美 国英语使用 和变化 的一个极好 窗 口。 ( 汪兴富等 , 2 0 0 8 : 2 7 ) D a v i e s ( 2 0 0 5 ) 指 出, C O C A具备 了一个 好语 料库 的三项 最基 本条 件: 规模( s i z e ) 、 速度 ( s p e e d ) 以及 词性标注 ( a n n o t a t i o n ) 。C O C A的在线 查询速 度依据查 询内容差异 及复杂度 、 网络状况 和联 网计算 机配置而 定, 高达4 . 5 亿词 汇库容在 8 个2 . 4 G H z 的服务器上 同时计算 , 因此绝大 多数查询 都能在 几秒 内呈现 结果 ; 词性 标注使用 的是英语语 料广泛采 用的 C L AWS 7 软件 。C OC A已收集过去 2 0多年( 1 9 9 0年起 ) 美 国境 内多 个领域 的语料 , 涵盖美国 口语 、 小说 、 流行杂 志 、 报纸和学术期刊五大类 型的语料 , 并且 在这 五个类型方面基本呈均 匀分 布 , 在每五年 的时段 中

coca等级词汇

coca等级词汇

coca等级词汇一、什么是COCA词汇等级COCA(Corpus of Contemporary American English)词汇等级是根据词汇在当代美国英语中的使用频率划分的。

COCA等级词汇分为五个等级,分别是:最常用词汇(Level 1)、较常用词汇(Level 2)、中等常用词汇(Level 3)、较少用词汇(Level 4)和极少用词汇(Level 5)。

二、COCA词汇等级的划分标准COCA词汇等级是根据词汇在COCA语料库中的出现频率划分的。

COCA 语料库包含了大量的当代美国英语文本,包括书籍、杂志、报纸、网络文章和口语等。

词汇等级的划分标准如下:1.最常用词汇(Level 1):在日常生活中、书籍、文章等方面频繁出现的词汇。

2.较常用词汇(Level 2):在一般阅读材料中经常出现的词汇。

3.中等常用词汇(Level 3):在特定领域或专业文章中出现的词汇。

4.较少用词汇(Level 4):在较为生僻的文章或专业领域中使用的词汇。

5.极少用词汇(Level 5):非常生僻、罕见的词汇。

三、COCA等级词汇的应用场景COCA等级词汇对于英语学习者和使用者具有很高的指导意义。

通过掌握不同等级的词汇,可以基本满足日常生活和学习中的阅读需求。

在学习过程中,可以根据自己的实际需求选择相应等级的词汇进行学习。

此外,COCA等级词汇还可以用于以下场景:1.英语考试:了解COCA等级词汇有助于提高英语考试的阅读理解和写作能力。

2.英语写作:掌握高级词汇可以提升写作水平,使文章更具深度和说服力。

3.专业领域:在特定领域的研究中,熟练运用COCA等级词汇有助于展现专业素养。

四、如何提高COCA等级词汇量1.制定学习计划:根据自己的英语水平和需求,制定合适的学习计划,逐步提高COCA等级词汇量。

2.使用教材和词汇书:选用适合自己的教材和词汇书进行学习,如《新概念英语》、《英语词汇的奥秘》等。

3.多读多写:通过阅读书籍、文章、新闻等,积累COCA等级词汇,并尝试在写作中运用。

美国当代英语语料库(COCA)在词汇教学中的应用价值

美国当代英语语料库(COCA)在词汇教学中的应用价值

美国当代英语语料库(COCA)在词汇教学中的应用价值张仁霞【摘要】本研究介绍了美国当代英语语料库(COCA)在英语词汇教学中的利用价值:充实单词语义,建立图式;学习单词搭配,归纳语义偏好;培养学生语体意识,学会恰当使用单词;发现单词的同义词近义词;真实语料和语境中习得词汇,培养观察归纳思维能力。

COCA对于学生进行英语词汇网络自主学习是很有价值的语料库资源和工具。

【期刊名称】齐齐哈尔大学学报(哲学社会科学版)【年(卷),期】2015(000)004【总页数】4【关键词】语料库;COCA;词汇教学□学科教学研究近年来,计算机和网络技术的迅猛发展为英语教学创造了新的条件,大大提高了英语教学的效率。

教学中引入网络语料库手段,将极大丰富英语教学的手段。

COCA—美国当代英语语料库 (Corpus of Contemporary American English) 是美国最新当代英语语料库,是当今世界上最大的英语平衡语料库。

关于其系统介绍,可以参考《美国当代英语语料库(COCA)——英语教学与研究的良好平台》[1]专业语料库需要购买昂贵的软件或者注册费用,繁忙的教学使得教师们无暇自建语料库,所以提到语料库,很多英语教师望而却步,加上多数具有“技术恐惧症”,认为语料库望尘莫及。

英语教师和学习者要观察当今美语使用变化的情况,COCA 提供了在线免费使用的良好平台。

它是由杨伯翰大学 Mark Davies 教授开发的高达 4.5 亿词汇库容的美国最新当代英语语料库,是当今世界上最大的英语平衡语料库。

其界面主要是为语言学家和语言学习者了解单词、短语以及句子结构的频率及进行相关信息比较而设计。

它具备了一个好语料库的三项最基本条件:规模、速度以及词性标注。

[2] 它收集的数据涵盖了最近22 年(1990 年到2012 年)美国的口语、小说、流行杂志、报纸和学术期刊五大类型的语料,并且每种类型基本呈均匀平衡分布。

值得一提的是,COCA 具有其它语料库不可企及的突出优势,它是一种动态的语料库资源,没有最后的版本,处于不断更新与发展中,每年约2000 万词汇,而且今后每年至少更新两次。

当代英语教材语料库的创建与应用研究

当代英语教材语料库的创建与应用研究

当代英语教材语料库的创建与应用研究一、本文概述随着全球化进程的加速和英语作为国际通用语言的地位日益巩固,英语教育在我国教育体系中的重要性不断上升。

英语教材作为英语教学的核心资源,其质量直接关系到教学效果。

传统英语教材在内容更新、语言地道性、文化贴近性等方面存在一定的局限性。

为此,本文提出构建一个当代英语教材语料库,以期为英语教学和研究提供更为丰富、实用、地道的语言素材。

本文首先分析了当代英语教材语料库构建的必要性和可行性,探讨了其在英语教学、教材编写、语言研究等方面的应用价值。

接着,详细阐述了语料库的构建过程,包括语料的采集、整理、标注和数据库的设计。

同时,本文还探讨了语料库在实际应用中可能遇到的问题和挑战,并提出相应的解决方案。

二、文献综述在当代英语教材语料库的创建与应用研究领域,已有大量的研究文献。

这些文献不仅涵盖了语料库的构建技术、语料的选择和处理方法,还包括了语料库在英语教学中的应用策略和效果评估。

本节将对这些文献进行综述,旨在梳理现有研究的成果与不足,为本研究提供理论依据和启示。

关于英语教材语料库的构建,许多研究者探讨了语料的选择标准、采集方法和技术处理过程。

例如,Bolitho et al.(1993)强调了语料库应该反映真实语言使用的重要性,提出应选择多样化的、自然的语言材料。

Johns(1991)则探讨了语料库在英语教学中的应用,强调了语料库作为一种教学资源的重要性。

研究者们还探讨了语料库的标注和检索技术,如Sinclair(1991)提出的词汇大纲和搭配概念,为语料库的深度应用提供了可能。

语料库在英语教学中的应用也是一个重要的研究领域。

研究者们探讨了语料库如何帮助学习者提高词汇学习(如Nesselhauf,2003)、语法学习(如Moon,1998)和听力理解能力(如Taylor,2000)。

同时,语料库也被用于促进学习者自主学习和批判性思维能力的发展(如Flowerdew Peacock,2001)。

美国当代英语语料库(COCA)使用介绍要点

美国当代英语语料库(COCA)使用介绍要点

COCA语料库简介
COCA简介
– COCA美国当代英语语料库涵盖美国这一时期 的口语(spoken)、小说(fiction)、流行杂志(pop magzine)、报纸(newspaper)和学术期刊 (academic)五大类型的语料库,并且在这五个类 型方面基本呈均匀平衡分布。
– 网址:/coca
• 例1. 输入单词“mysterious” (图2.1.1-1):得 到相关结果(图2.1.1-2):在各子库中的频率,每 百万词使用的频率。
• 若对图2中的相应条块进行点击,那么就可以看到 KWIC,如图2.1.1-3 (以点Fiction的条块为例):
图2.1.1-1
图2.1.1-2
使用CHART显示
POS LIST
det.GEN 类指限定词 det.POS 物主限定词 num.CARD 基数词 num.ORD 序数词 conj.CRD 并列连词 conj.SUB 从属连词 Interj. 叹词 PUNC 标点
词性列表的使用
• 1)查询多义词特定的词性 • 2)某个词前或者后面特定词性的若干搭配
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
二、COCA主要搜索功能
• 2.1 搜索words、phrases、lemmas(单 词的所有形式)、wildcards(通配符)和 其他更加复杂的字词。
POS LIST
pron.INDF 不定代词 pron.PERS 人称代词 pron.WH 疑问代词 pron.REFL 反身代词 adj.CMP 形容词比较级 (comparative) adj.SPRL 形容词最高级 (superlative) adv.particle 副词小品词 adv.WH 疑问副词

COCA语料库在英语写作课堂教学中的应用-6页精选文档

COCA语料库在英语写作课堂教学中的应用-6页精选文档

COCA语料库在英语写作课堂教学中的应用一、引言写作一直是中国学生英语学习的短板,问题主要集中在两个方面:一是不知道“写什么”,主要表现在内容上无从下手、无话可说;二是不知道“怎么写”,不能准确地把自己的想法表达出来。

通过分析学生写作的语言错误,发现主要集中在词汇、语法方面,表现在词性和词的形式不正确,搭配和用法不当,对同义词之间的区别及各自的内在含义不了解等(叶云屏)。

语料库在词汇、语法使用、监控和验证语言输出的正确性方面有着突出表现(董洪学)。

滕延江(2006)等讨论了将语料库应用于写作教学的可能性。

虽然语言学家一直强调语料库对教学的作用,在实际教学中语料库的使用并没有像人们预期的那样普遍,原因可能是因为缺少一个界面友好、能够每天使用的语料库。

如果教师习惯了使用语料库,他们就会乐于在教学中引入语料库。

笔者对语料库应用于写作教学进行了一些尝试,发现COCA语料库可以帮助学生解决写作中“怎么写”的问题,教师只要教会学生基本的使用该语料库的方法,学生就可以自己去发现作文中的错误并进行修改,极大地提高自主学习能力。

本文主要介绍COCA在英语写作课堂教学中的具体应用方法。

二、语料库应用于写作教学的实现方式董洪学(2010)、陈伟(2008)等认为将语料库应用于写作教学通常包括以下几个步骤:第一,有合适、可用的语料库;第二,对学生进行如何使用语料库、写作策略、学习动机等方面的培训;第三,学生自主训练;第四,有效的学生作品评价。

合适、可用的语料库通常有两种实现方式,一是建立语料库写作系统,二是利用网络语料库。

目前已有的基于语料库的写作系统非常多,比如杨永林的“体验英语写作平台”以及戈玲玲的“大学英语教学平台”等。

这些写作平台一般具有以下几个功能:第一,包含大量的范文;第二,能对学生作文进行自动批改;第三,能够将学生作文输入系统,建立学生作文库;第四,允许对平台进行扩容;第五,鼓励师生、生生之间的互动。

已有实证研究证明这些写作平台能够有效提高学生的写作水平,不过这些平台通常需要购买,或者有容量大、下载慢等问题,存在使用限制。

美国当代英语语料库在英语词汇学习中的应用

美国当代英语语料库在英语词汇学习中的应用

美国当代英语语料库在英语词汇学习中的应用
迟秋玲
【期刊名称】《科技信息》
【年(卷),期】2013(000)004
【摘要】本文从词汇的扩展、搭配以及同义词查询和语体查询几个角度简单介绍
了美国当代英语语料库的使用,阐明学习者通过观察和分析大量客观真实的语料,能发现语言语法规则、意义表达及语用特征,能培养学习者的思考、推理能力,减少语用失误,有助于学习者习得地道纯正的美语。

【总页数】2页(P241-241,242)
【作者】迟秋玲
【作者单位】青岛农业大学
【正文语种】中文
【相关文献】
1.美国当代英语语料库(COCA)在词汇教学中的应用价值
2.语料库在大学生英语词
汇学习与写作中的应用3.美式英语中Like作为连词的用法:一项基于美国当代英语语料库(COCA)的研究4.从语义韵看《道德经》中\"玄\"之英译——基于《道德经》英译本语料库和美国当代英语语料库的分析5.语料库在大学生英语词汇学习与写
作中的应用
因版权原因,仅展示原文概要,查看原文内容请购买。

美国当代英语语料库(COCA)在词汇教学中的应用价值

美国当代英语语料库(COCA)在词汇教学中的应用价值

Application Value of American COCA in Vocabulary
Teaching
作者: 张仁霞
作者机构: 广东技术师范学院大学英语部,广东广州501665
出版物刊名: 齐齐哈尔大学学报:哲学社会科学版
页码: 175-178页
年卷期: 2015年 第4期
主题词: 语料库;COCA;词汇教学
摘要:本研究介绍了美国当代英语语料库(COCA)在英语词汇教学中的利用价值:充实单词语义,建立图式;学习单词搭配,归纳语义偏好;培养学生语体意识,学会恰当使用单词;发现单词的同义词近义词;真实语料和语境中习得词汇,培养观察归纳思维能力。

COCA对于学生进行英语词汇网络自主学习是很有价值的语料库资源和工具。

在美国当代英语语料库(COCA)如何查词

在美国当代英语语料库(COCA)如何查词

在美国当代英语语料库(COCA)如何查词.doc 在美国当代英语语料库(COCA)如何查词摘要:美国当代英语语料库(Corpus of Contemporary American English,COCA)由美国Brigham Young University 的Mark Davies教授开发,目前单词容量在4.5亿,是美国当前最新的当代英语语料库,也是当今世界上最大的英语平衡语料库。

该语料库的语料来自1990-2012年,每年更新,检索功能强大,是最佳的英语学习助手。

本文以sorry为例介绍了如何在美国当代英语语料库中查询单词及对单词sorry的检查与研究结果。

关键词:美国当代英语语料库,平衡语料库,sorryAbstract: The Corpus of Contemporary American English (COCA) is the largest freely-available corpus of English,and the only large and balanced corpus of American English.The corpus was created by Mark avies of Brigham Young University,and it is used by tens of thousands of sers every month (linguists,teachers,translators,and other searchers).COCA is also related to other large corpora that we have created.The corpus contains more than 450 million words of text and isqually divided among spoken,fiction,popular magazines,newspapers,and academic texts.It includes 20 million words each year from 1990-2012.Key words: the Corpus of Contemporary American English,parallel corpus,sorry中图分类号:H319.3文献标识码:A文章编号:1006-026X(2013)12-0000-02一、引论美国当代英语语料库(Corpus of Contemporary American English,COCA)由美国Brigham Young University 的Mark Davies教授开发,目前单词容量在4.5亿以上,是美国当前最新的当代英语语料库,也是当今世界上最大的英语平衡语料库,且与其他所建语料库相连。

当代英语语料库20000词频表 详细说明

当代英语语料库20000词频表 详细说明

当代英语语料库20000词频表详细说明Contemporary English Language Corpus 20000 Word Frequency Table – Detailed ExplanationIntroductionThe Contemporary English Language Corpus, also known as the CELEX database, is a comprehensive collection of language data that is widely used by linguists, language researchers, and scholars for various purposes. One of the key features of the CELEX database is the word frequency table, which provides information on how frequently different words occur in the English language. In this article, we will delve into the CELEX 20000 Word Frequency Table and offer a detailed explanation of its significance and utility.Overview of the CELEX 20000 Word Frequency TableThe CELEX 20000 Word Frequency Table is a compilation of the 20000 most frequently used words in the English language, based on data extracted from a variety of sources such as written texts, transcribed speech, and other forms of language data. The table provides information on the frequency of each word, including the number of times it appears in the corpus, its rank interms of frequency, and additional linguistic information such as part of speech, lemma, and grammatical category.Significance of the CELEX 20000 Word Frequency TableThe CELEX 20000 Word Frequency Table offers valuable insights into the patterns and structures of the English language, allowing researchers to analyze and understand how words are used in different contexts. By studying word frequencies, linguists can uncover important information about the core vocabulary of the language, the distribution of words across different genres and registers, and the ways in which words are combined to create meaning.Furthermore, the frequency table can be used to identify key lexical items in the English language, providing a basis for language teaching, vocabulary building, and text analysis. By focusing on the most common words in the language, educators can help learners develop a solid foundation of vocabulary that is essential for communication and comprehension.Utility of the CELEX 20000 Word Frequency TableThe CELEX 20000 Word Frequency Table is a valuable resource for a wide range of applications, including corpus linguistics, computational linguistics, natural languageprocessing, and language teaching. Researchers can use the frequency table to conduct quantitative analyses of language data, explore patterns of word usage, and investigate linguistic phenomena such as collocations, word associations, and semantic relations.In addition, the frequency table can be used to develop language models, linguistic resources, and computational tools that support various language processing tasks, such as information retrieval, machine translation, text mining, and sentiment analysis. By leveraging the information provided in the frequency table, researchers can build sophisticated language models that accurately reflect the structure and dynamics of the English language.ConclusionIn conclusion, the CELEX 20000 Word Frequency Table is a valuable resource for researchers, educators, and language enthusiasts who are interested in exploring the nuances of the English language. By providing a detailed breakdown of word frequencies and linguistic properties, the frequency table offers important insights into the core vocabulary of the language, the distribution of words in different contexts, and the patterns of word usage across varied genres and registers.Overall, the CELEX 20000 Word Frequency Table serves as a comprehensive reference for studying language data, investigating linguistic phenomena, and developing language resources and tools that enhance our understanding of the English language. By leveraging the valuable information provided in the frequency table, researchers can gain a deeper appreciation of the intricacies of language and its role in communication, expression, and cognition.。

杨百翰大学BNC语料库使用说明

杨百翰大学BNC语料库使用说明
•规则:输入名词的话用正则表 达式: [n*];动词: [v*]; 形容词: [aj*]; 副词: [av*]……
图2.1.2-2
White+名词的短语
• 2.1.3 输入通配符 输入通配符(wildcards),如分别输入 un*ly和r?n*,结果如图2.1.3-1和.2.1.3-2
图2.1.3-1
• 2.4.3 搜索近义词 • 如:搜索beautiful的所有近义词(如图 2.4.3-1)
规则:在words的方格里输入[=beautiful],表示和beautiful语义相 近的所有形容词。
• 再如:搜索动词clean的所有近义词,如下 图:
图2.4.3-2
• 当然可以进一步搜索与clean语义相近的动 词+the+名词的词组,[[=clean]].[v*] the [n*] 如下图:
杨百翰大学BNC语料库使用说明
杨百翰大学BNC语料库简介
• 1. 简介 • 1.1 通过这个网址,可以搜索到100 million 词的British National Corpus (1970s1993). (当然现在Corpus of Contemporary American English(19902009)能在线免费提供 400+ million 词,在 线网址为: /)
图2.3-1
图2.3-2
• 但是也可以之间对两者子语料库中它们出 现频率的对比,操作:分别选择section 1&2,如下图(图2.3-3):
图2.3-3
• 2.4 进行语义倾向比较 • 2.4.1 比较近义词 • 如:近义形容词hot和warm后面所跟名词的 区别(如图2.4.1):
图2.4.1

美国当代英语语料库COCA在自主翻译学习中的应用探索

美国当代英语语料库COCA在自主翻译学习中的应用探索

美国当代英语语料库COCA在自主翻译学习中的应用探索吴偲(沈阳师范大学辽宁沈阳110000)㊀㊀摘要:目前大多数翻译学习者仍采用传统的依靠词典和工具书的翻译方法进行翻译工作ꎬ无法适应市场需求ꎮ本文以笔者的部分翻译实践实例为例ꎬ基于互联网ꎬ探索如何从同义词检索㊁词汇搭配及句法检索三方面将美国当代英语语料库COCA应用在自主翻译学习中ꎮ希望通过研究ꎬ为各翻译学习者提供有益的参考与借鉴ꎬ提高翻译工作效率ꎮ关键词:语料库COCA翻译自主学习中图分类号:H319㊀文献标识码:A㊀文章编号:1009-5349(2018)07-0210-02㊀㊀语料库将大量语言使用者的语言直觉汇集起来ꎬ从而使语言分析更为客观ꎮ帮助使用者分析和研究语言规律ꎬ检测和验证语言词汇㊁语法㊁语义ꎮ随着计算机网络技术的发展ꎬ语料库为使用者提供了更多便利ꎮ而传统的纸质词典查询和大海捞针式的网络搜索大大削弱翻译学习效果ꎮ本文试探索美国当代英语语料库(COCA)在翻译自主中的应用方法ꎬ以期帮助翻译学习者提高学习效率ꎬ培养自主学习能力ꎮ一㊁美国当代英语语料库(COCA)美国当代英语语料库(CorpusofContemporaryAmericanEnglish)由美国杨百翰大学的MarkDavis教授开发ꎬ并于2008年上线ꎬ是当今世界上最大的英语平衡语料库(ht ̄tp://corpus byu edu/coca/)ꎮ该语料库每年不断更新语料内容ꎬ以扩大库容ꎬ保证时效性ꎮ现该语料库已覆盖5 2亿单词ꎮ该语料库的信息由口语㊁小说㊁流行杂志㊁报纸和学术文章五个板块组成ꎬ规模庞大ꎬ均衡分布ꎮ这些因素决定了它可作为单语语料库的典范ꎬ辅助翻译实践与学习ꎮ二㊁美国当代英语语料库(COCA)在自主翻译学习中的应用美国当代英语语料库以其庞大的语料信息库容量为广大翻译学习者提供了高效平台ꎮ下面笔者将从三个方面介绍该语料库在自主翻译学习中的应用ꎮ本文中例句选自笔者的翻译实践ꎮ(一)同义词检索在汉译英译文中ꎬ为避免重复使用同一单词ꎬ找替代词不失为一个提高译文质量的一个好方法ꎮ如:居民消费价格上涨2%ꎬ工业企业利润增长8 5%ꎮ这句话中有两个动词出现了语义重复ꎬ即 上涨 和 增长 ꎮ常见的英文对应词为increaseꎬ现在来用美国当代英语语料库来检索increase的同义词ꎮ检索框中输入 [=increase].[v∗] (表示 动词 增长 的同义词 )ꎬ由于是政治类翻译ꎬ为保证译文严谨ꎬ笔者又在板块复选框中选中 ACADEM ̄IC 选项ꎬ得出以下结论ꎮ(见表1)即语料库中使用频率最高的increase的9个同义词从前往后依次为:improveꎬenhanceꎬaddꎬraiseꎬboostꎬaug ̄mentꎬmultiplyꎬenlargeꎬamplifyꎮ笔者根据汉语原文意思ꎬ选取raise查询其是否包含 增长ꎬ上涨 意义ꎮ点击 CONTEXT ꎬ笔者得到如下例句:Disciplinaryliteracyisarguedasawaytoraiseadolescentliteracyratesꎮ从词频和语境来看ꎬraise一词最符合要求ꎬ所以raise一词可用在此句译文中ꎮ因此整句中文可译为:TheCPIroseby2percentꎬwithan8 5percentincreaseinindustrialenterprisesprofitsꎮ(译文仅供参考)ꎮ表1frequencyincrease15203improve14000enhance6842add5781raise4759boost562augment491multiply422enlarge319amplify285㊀㊀(二)查搭配在翻译实践和翻译学习中ꎬ翻译学习者常无法确定所用短语搭配是否符合英文地道表达ꎮ此时ꎬ语料库就能提供相对可靠的解决方法ꎮ在翻译 工业生产总值 时ꎬ笔者初步译为了 totalindustrialproduction ꎬ但是不确定是否可以将 total 一词替换为 gross ꎬ即是否可以译为 grossindustrialproduction ꎮ笔者利用美国当代英语语料库的Collocates功能进行查询比对ꎮ笔者先在Word/Phrase检索框中键入 industrialproduction ꎬ再于Collocates检索框中键入 [j∗] ꎬ最后在下方选定左边的数字 1 ꎬ表示 查找 industrialproduction 短语搭配的形容词ꎬ该形容词为该短语前面的一个单词距离之内的词汇 ꎮ笔者得到如下反馈:满足条件的形容词按搭配使用频率排名ꎬ排名第一的形容词为totalꎬ totalindustrialproduc ̄tion 这种搭配5次出现在报刊和学术文章中ꎬ而 grossindustrialproduction 搭配仅出现过一次ꎬ且出现该搭配的报刊出版年份为1992年ꎬ距今已过去了25年ꎮ相比之下ꎬtotal在此次查询中为最佳搭配词ꎬ但是ꎬ笔者发现ꎬ所得例句中 totalindustrialproduction 前面多有share等表示 份额 的词ꎬ所以 totalindustrialproduction 并不能直接表示 总值 ꎮ如:Heavyindustry'sshareoftotalindustrialproductionrosebyhalfꎮ要完全译出 总值 的意义ꎬ还必须在末尾加上 value 等符合该意义的单词ꎮ经过以上查询和判断ꎬ笔者最终将译文改为 totalindustrialproduc ̄012现代交际 2018年7期㊀㊀作者简介:吴偲ꎬ沈阳师范大学外国语学院16级在读研究生ꎬ研究方向:英语口译ꎮtionvalue ꎮ(三)查句法美国当代英语语料库也可以为句法学习提供可信度高的表达借鉴和对比参考ꎮ下面以笔者在翻译实践中译过的例句进行说明ꎮ如:这样的社会趋向于家庭农场ꎬ这是因为谷物和豆类都是小规模生产经济的特征ꎮ这一句后半句是说 小规模生产经济包含了 谷物 和 豆类 两个特征 ꎮ如果直接译为: Suchsocietiesgravitatedtowardfamilyfarmsbecausegrainsandlegumesarethemajorcharacteristicsofthemodestscaleeconomiesinproduction. ꎬ语法上没有错误ꎬ但似乎不符合英文地道表达ꎬ尤其是整句句意及句法的核心 是 的特征 的译文为 arethemajorcharacteristicsof ꎮ笔者将 arethemajorcharacteristicsof 键入到 CHART 搜索框中ꎬ搜索其在整个语料库中的各个板块的使用频率ꎮ搜索后得ꎬ arethemajorcharacteristicsof 在所有报刊㊁学术文章上出现的次数仅为一次ꎮ美国的Hemisphere杂志在其2004年春季刊中收录了一篇题为In ̄visibleImmigration的文章ꎬ文章中这样写道: WhyaresomanyMexicanimmigrantschoosingFloridaasadestination?Whatarethemajorcharacteristicsofthisunderstudiedpopula ̄tion? ꎮ在这里含有 arethemajorcharacteristicsof 成分的句子是一个信息量较少的短问句ꎬ不具有代表性ꎬ无法说明该句式是否适用于其他语境ꎮ从使用频率和使用语境来看ꎬ不宜选用 arethemajorcharacteristicsof 这一句式ꎮ笔者转换思维ꎬ将characterizedby输入查询区ꎬ发现该句式仅在学术文章中的出现次数就达3513次ꎮ通过阅读比较ꎬ笔者发现许多例句与上述源语例句语境非常相似ꎬ所以 characterizedby 适用ꎮ最后笔者将整句话译为:Suchsocietiesgravitatedtowardfamilyfarmsbecausegrainsandlegumesarecharacterizedbymodestscaleeconomiesinpro ̄duction. ꎮ三㊁结语经过实例研究ꎬ表明美国当代英语语料库在同义词检索㊁词汇搭配和句法检索三方面ꎬ可有效辅助翻译学习者进行英汉和汉英翻译实践ꎬ提高翻译质量和效率ꎮ不可否认ꎬ语料库的作用功能确是其他翻译工具无法替代的ꎬ它能够使翻译学习者更细微㊁更深刻㊁更具体地探究翻译这一复杂现象ꎮ从而增强翻译学习者的自主学习和研究能力ꎮ参考文献:[1]杨梅ꎬ白楠.国内语料库翻译研究现状调查 基于国内学术期刊的数据分析(1993-2009)[J].中国翻译ꎬ2010(6):46-50.[2]方玲ꎬ汪兴富.美国当代英语语料库(COCA)的自主学习应用[J].中国外语ꎬ2010(6):79-84+91. [3]王克非ꎬ秦洪武.论平行语料库在翻译教学中的应用[J].外语教学与研究ꎬ2015(5):763-772+801.责任编辑:景㊀辰(上接第212页)当形容词作定语的时候ꎬ需不需要带 的 也要受音节数的影响ꎮ(1)当定语为单音节形容词的时候ꎬ后面一般不带 的 :小白兔好朋友(2)当两个或两个以上的音节形容词作定语的时候ꎬ后面一般要带 的 :努力的学生漂亮的妈妈(五)当定语和中心语关系为固定短语(1)由定中关系而形成的固定词语ꎬ那么定语和中心语之间是不需要用 的 的:语文老师领导阶级(2)当定中词组带有熟语性的词语时ꎬ定中之间不需要用 的 :捣蛋鬼小人物以上我总结的规律只是在大多数情况下使用ꎬ当然不排除有些特殊的结构助词 的 的现象的出现ꎮ三㊁教学策略(1)是否使用结构助词 的 与教师是否深入地研究了汉语有着很大的关系ꎮ教师应该深刻地研究汉语以及语法ꎬ从而为学生分析和归纳总结出 的 的使用方法:什么语境下要用ꎬ什么语境下不需要用ꎬ以及什么语境下用不用都可以ꎬ并且在向留学生进行讲解的时候一定要借助于使用例句来阐明这个规则ꎮ(2)要在教学过程中具有针对性ꎮ那么我们所说的针对性主要是根据外国学生在学习汉语语法点中结构助词 的 字结构过程中容易产生偏误的情况ꎬ认真归纳偏误形成的来源ꎬ然后总结相应的规则ꎬ最后针对这些问题ꎬ总结出不同的教学方法ꎮ(3)要组织学生进行科学的练习ꎮ在我们汲取知识的过程中ꎬ反复练习永远都是掌握它们最为有效并且最快的方式ꎬ在 的 字结构的教学中ꎬ练习也同样非常重要ꎮ那么详细的教学做法ꎬ第一是借助于语境ꎮ就是将自己设身处地地放在一种情况中来练习ꎮ二是我们应该将必须运用 的 字和不需要运用的结构助词 的 字的情况进行一个对比分析ꎮ三是我们应该设计一些生活中比较自然的情景ꎬ从而能够真正地掌握 的 的使用方法ꎮ四㊁结语通过归纳与分析结构助词 的 出现的偏误类型与现象ꎬ我总结了何时用 的 ㊁何时不用 的 ㊁何时用不用的 都可以的规律ꎬ以及在教师教学方面应该采取什么样的策略ꎮ在总结了他们的偏误类型之后ꎬ我们应该具体问题具体分析ꎬ根据每个学生不同的特点来进行指导ꎬ尽可能多地采用各种学习方法来让留学生进行大量的操练ꎬ争取能够促使他们更好地学习汉语ꎮ参考文献:[1]杨庆蕙.对外汉语教学中的语法难点剖析[M].北京:北京师范大学出版社ꎬ1996:226-248. [2]高霞ꎬ英语国家学生学汉语结构助词 的 的偏误分析[J].楚雄师范学院学报ꎬ2005(2):110-114. [3]周美英.关于留学生汉语结构助词 的 和 地 的习得考察[D].福建师范大学ꎬ2011. [4]雷娟.英语为母语的汉语学习者习得结构助词 的㊁地㊁得 偏误研究[D].湖南大学ꎬ2014. [5]洪凯云.韩国学生结构助词 的 偏误分析及教学对策[J].沈阳师范大学学报:社会科学版ꎬ2015(3):89-91.责任编辑:刘㊀健112美国当代英语语料库COCA在自主翻译学习中的应用探索。

英语语料库及词频表介绍

英语语料库及词频表介绍

英语语料库及词频表介绍
英语语料库是收集英语书面和口语等各类英文表述方式的语言材料集合,涵盖了英语词汇的各个方面。

其中,目前主流的有三个语料库,分别是GBC(Google Book's Corpus)、BNC(British National Corpus)和COCA(Corpus of Contemporary American English)。

COCA(Corpus of Contemporary American English)是由美国伯翰大学(Brigham Young University)的Mark Davies教授开发的美国最新当代英语语料库,是当今世界上最大的英语平衡语料库。

它涵盖了美国这一时期的口语、小说、流行杂志、报纸和学术期刊五大类型的语料库,并且这五个方面基本上成均匀平衡分布。

COCA词频表基于COCA的5亿单词语料库,利用算法提取出来最高的前5000和20000的高频词,并注释了搭配,解决了单词最实际的实用问题。

如需更多关于英语语料库及词频表的信息,建议咨询英语专业人士或查阅相关文献资料。

常用在线语料库使用简介分析

常用在线语料库使用简介分析

频数
图2.1-2
BNC
2.2 其他可下载的BNC产品
➢ BNC XML edition:BNC全库 ➢ BNC Baby:BNC子库,包含小说、新闻、科技、口语四
类文本各100万词 ➢ BNC sampler:BNC 子库,包含书面语、口语两类文本
各100万词 ➢ 注:以上语料库采用XML格式,需使用XAIRA软件检索
➢ 输入“feature”(图6.1.1-1)
图6.1.1-1
COCA
6.1.1 检索某一词形
➢ 在搜索结果区可得到“feature”的频数 (图6.1.1-2 ) ➢ 点击该词,可在例句显示区看到含有“feature”的词
条(图6.1.1-3)
图6.1.1-2
图6.1.1-3
COCA
6.1.1 检索某一词形
图5.3-1
COCA
5.3 语料库分类区
➢ 42个子语料库 (图5.3-2)
图5.3-2
COCA
5.3 语料库分类区
➢ 42个子语料库 (图5.3-3)
图5.3-3
COCA
5.4 查询结果排列方式区
➢ Sort by:检索结果的排列方式,可按频率、关联度、 或字母顺序排列,一般默认按频率排列 (图5.4-1)
➢ 在显示方式区选择KWIC 并再次点击search, 可得含有“feature”的词语 索引(图6.1.1-4)
Sketch Engine: 在线语料库管理及检索工具,可有 效总结词汇的语法及搭配行为。
BNC
1. BNC官网主界面(图1-1)
基本信息及 功能介绍区
简单搜索区 进入简单搜索功能介绍
图1-1
BNC
2. BNC在线检索功能介绍 2.1 BNC simple search
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

COCA界面简介
COCA界面简介
• 显示方式区:
• 1.LIST——列表显示 • 2.CHART——图表显示,可以显示在各语料库类型中的使 用频率和各时间段内的使用情况。 • 3.KWIC——Key word in context,上下文关键词显示 • PARE——单词比较显示,比较两个不同词或短语 的搭配情况。
EXAMPLE 4
规则:若要得到某个单词的所有单复数和时态形式,那么 就要在输入时,在这个单词外加 [ ]。
EXAMPLE 4
形容词early的原形,比较级和最高级三种形式一次性检索出来检索
COCA主要功能(一)
• 例 5.输入某种词性且部分带有某些字母的命令, 如要得到以 un- 开头、 -ed 结尾的所有形容词的所 有 形 式 ( 见 图 2.1.5-1 ) 和 得 到 动 词 + 任 何 词 +ground的所有词组(见图2.1.5-2):
POS LIST





pron.INDF 不定代词 pron.PERS 人称代词 pron.WH 疑问代词 pron.REFL 反身代词 adj.CMP 形容词比较级 (comparative) adj.SPRL 形容词最高级 (superlative) adv.particle 副词小品词 adv.WH 疑问副词
结论
• Application可以和 increase作主谓搭配,但 多用于学术期刊中,口语中出现很少。
图2.1.1-3
例句显示区使用的是KWIC显示
KWIC显示方式
KWIC显示方式
• • • • • •
蓝色——名词 紫色——动词 绿色——形容词 棕色——副词 灰色——代词 黄色——介词
COCA主要搜索功能
• 例2. 输入词组 “white+名词” (图2.1.2-1),得到 的结果都是white 后面跟的名词短语 (图2.1.2-2),检索 表达式为:white [n*]。
POS LIST





det.GEN 类指限定词 det.POS 物主限定词 num.CARD 基数词 num.ORD 序数词 conj.CRD 并列连词 conj.SUB 从属连词 Interj. 叹词 PUNC 标点
词性列表的使用
• 1)查询多义词特定的词性 • 2)某个词前或者后面特定词性的若干搭配 词,如confidence前的形容词 • 3)词性附码放置的位置——WORDS或 COLLOCATES处
规则: 若要得到某种词性且词中带有部分带有某些字母的形 式时,如要得到以 un- 开头、 -ed 结尾的所有形容词的所有形 式,那么输入: un*ed.[j*]; 若要得到动词 + 任何词 +ground 的所有词组 , 那么输入 : [v*]*[ground]即可。 前者用来研究词汇,后者用来查询特定词性的搭配。
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
二、COCA主要搜索功能
• 2.1 搜索words、phrases、lemmas(单 词的所有形式)、wildcards(通配符)和 其他更加复杂的字词。
• 2.3 搜索在子语料库内(或之间)出现的频率 (或比较)(不同语域中的用法)
• 如在Fiction和Newspaper子语料库中passionate 后面可以跟任何名词的词及频率,分别如两图 (2.3-1和2.3-2)。
图2.3-1
图2.3-2
COCA主要功能(三)
• 但是也可以之间对两者子语料库中它们出现频率 的对比,操作:分别选择section 1&2,如下图(图 2.3-3):
• 例1. 输入单词“mysterious” (图2.1.1-1):得 到相关结果(图2.1.1-2):在各子库中的频率,每 百万词使用的频率。 • 若对图2中的相应条块进行点击,那么就可以看到 KWIC,如图2.1.1-3 (以点Fiction的条块为例):
图2.1.1-1
图2.1.1-2
使用CHART显示
COCA界面简介
COCA界面简介
• 字串查询区:
• Ⅰ、WORDS:输入字符串。 • Ⅱ、COLLOCATES:上下文限定。 • Ⅲ、POS LIST:词性列表
CO类型语料库共包括42个 子语料库)。
• 功能:此区可以对查询的字符串限定语料类型 (Genre)和时段(Year) ,并且可以明确到查询某一 个子语料库,时段也可以查询任何一年的某个字词 的使用情况。
POS LIST

verb base=动词原形 verb.INF=动词不定式 verb MODAL=情态动词 verb 3SG=动词第三人称单数 verb ED=过去式 verb EN=过去分词 verb ING=现在分词 verb.LEX=lexical verb实意动词 verb.[BE]=系动词 verb.[DO]=do verb.[HAVE]=have
• 2.4.2 比较反义词 • 如:woman和man前面所跟的形容词的区 别(如图2.4.2)
图2.4.2
规则:在words的方格里分别输入woman和man,再在 collocates方框里输入[j*],选在左3,表示前面3个跨距内所有的形 容词。当然也可以比较在某个子语料库中出现的频率比较。
图2.1.5-1
图2.1.5-2
动词+任何词+ground的所有词组
COCA主要搜索功能(二)
• 2.2 搜索搭配词和出现的频率
• 如“thick后跟的名词” (图2.2-1)
图2.2-1
规则:在collocates里输入[n*] 后选择4,表示在thick4后面(4跨距范 围内)出现的任何名词
查询结果
筛选出“应用”和“增加”作主谓搭配的例句
• The annual application of fertilizers has increased by 5.48% on average since 1980, and that of pesticide… • In ten Member States, average application of nitrogen increased almost 400% between 1950 and 1981. • Finally, studies have shown that application of biosolids increases the water holding capacity as well as reduces the potential of the.
图2.1.2-1
图2.1.2-2
White+名词的短语
规则:输入名词的话用正表达式: [nn*];动词: [v*]; 形容词: [j*]; 副词: [r*];代词:[p*];连词:[c*]……
POS LIST 词性列表
POS LIST



noun.ALL=名词 noun.SG=单数名词 noun.PL=复数名词 noun.CMN=普通名词 noun.+PROP=专有名词 noun.-PROP=非专有名词
COCA主要功能(一)
• 例 3. 输入通配符 (wildcards) ,如分别输入 un*ly 和r?n*,结果如图。
? 代替一个字母 * 代替任意数量字母
EXAMPLE 3
EXAMPLE 3
COCA主要搜索功能
• 例 4. 输入 lemmas (即一个单词的单复数、时态等 所有形式),若要得到 sing 这个单词的所有形式, 可以如下图所示。
美国当代英语语料库(COCA)使用说明
/coca
一、COCA语料库简介
• COCA简介
– COCA:美国当代英语语料库(Corpus of Contemporary American English)是由美国杨 伯翰大学(Brigham Young University)的 Mark Davies 教授开发的美国最新当代英语语 料库,是当今世界上最大的英语平衡语料库。
选择学习COCA的原因
• 1. COCA免费且在线方便。 • 2. 规模大(4.5亿,1990-2012)、速度快 (一般几秒)、词性标注易于理解。 • 3.时效性强——每年至少更新两次,并且每 年新增2000万词汇。
COCA界面简介
主要包括三大功能区:
Ⅰ 显示及查询条件界定区,包括:显示方式区, 字串查询区,语料库分类区,查询结果排列方式 区。 Ⅱ 查询结果数据显示区 Ⅲ 例句显示区
• 2.4.3 搜索近义词 • 如:搜索beautiful的所有近义词(如图 2.4.3-1)
规则:在words的方格里输入[=beautiful],表示和beautiful语 义相近的所有形容词。
• 再如:搜索动词clean的所有近义词,如下 图:
图2.4.3-2
Question
• Application和increase能否作主谓搭配?
COCA主要功能(四)
• 2.4 进行语义倾向比较 • 2.4.1 比较近义词 • 如:近义形容词hot和warm后面所跟名词的 区别(如图2.4.1):
图2.4.1
规则:在words的方格里分别输入hot和warm,再在collocates 方框里输入[nn*],表示后面所跟任何名词。当然也可以比较在 某个子语料库中出现的频率比较。
COCA语料库简介

COCA简介
– COCA美国当代英语语料库涵盖美国这一时期 的口语(spoken)、小说(fiction)、流行杂志(pop magzine)、报纸(newspaper)和学术期刊 (academic)五大类型的语料库,并且在这五个类 型方面基本呈均匀平衡分布。 – 网址:/coca
相关文档
最新文档