美国当代英语语料库 COCA 使用介绍

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
➢ Ⅱ 查询结果数据显示区 ➢ Ⅲ 例句显示区
COCA界面简介
• 显示方式区:
• 1.LIST——列表显示 • 2.CHART——图表显示,可以显示在各语料库类型中的使
用频率和各时间段内的使用情况。 • 3.Concordances——Key word in context (KWIC),上下
文关键词显示 • 4.COMPARE——单词比较显示,比较两个不同词或短语
White+名词的短语
规则:名词: [n*];动词: [v*]; 形容词: [j*]; 副词: [r*];代词:[p*]; 连词:[c*]
POS LIST 词性列表
POS LIST
noun.ALL=名词 noun.SG=单数名词 noun.PL=复数名词 noun.CMN=普通名词 noun.+PROP=专有名词 noun.-PROP=非专有名词
Concordances显示方式
• 蓝色——名词 • 紫色——动词 • 绿色——形容词 • 棕色——副词 • 灰色——代词 • 黄色——介词
COCA主要搜索功能
• 例:输入词组 “excuse+名词” 得到的结果都是 excuse后面跟的 名词短。检索表达 式为:white [n*]。
图2.1.2-2
COCA界面简介
• 语ห้องสมุดไป่ตู้库分类区(五大类型语料库共包括42个 子语料库)。
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
COCA主要搜索功能(一)
• 搜索words、phrases、lemmas(单词的所 有形式)、wildcards(通配符)和其他更 加复杂的字词。
• 如:跟在 “名词smile前面的形容词”
规则:在words里输入: smile.[n*],表示作为名词的smile。
COCA主要功能(三)
• 搜索在子语料库内(或之间)出现的频率(或 比较)(不同语域中的用法)
• Dwell是个文学色彩词吗?
• COCA主要功能(四) • 搜索近义词 • 如:搜索beautiful的所有近义词
POS LIST
det.GEN 类指限定词 det.POS 物主限定词 num.CARD 基数词 num.ORD 序数词 conj.CRD 并列连词 conj.SUB 从属连词 Interj. 叹词 PUNC 标点
词性列表的使用
• 某个词前或者后面特定词性的若干搭配词, 如confidence前的形容词
? 代替一个字母 * 代替任意数量字母
EXAMPLE
• 例:输入某种词性且部分带有某些字母的命令, 如要得到以un-开头、-ed结尾的所有形容词的所 有形式,以及得到动词+任何词+ground的所有词 组。
规则: 若要得到某种词性且词中带有部分带有某些字母的形
式时,如要得到以un-开头、-ed结尾的所有形容词的所有形 式,那么输入: un*ed.[j*];
若要得到动词+任何词+ground的所有词组,那么输入: [v*] * [ground]即可。
前者用来研究词汇,后者用来查询特定词性的搭配。
un-开头、-ed结尾的所有形容词
动词+任何词+ground的所有词组
COCA主要搜索功能(二)
• 搜索搭配词和出现的频率
• 如“go后跟的形容词”
规则:在collocates里输入[n*] 后选择4,表示在thick4后面(4跨距范 围内)出现的任何名词
的搭配情况。
COCA界面简介
• 字串查询区:
• Ⅰ WORDS:输入字符串。 • Ⅱ POS LIST:词性列表
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
• 功能:此区可以对查询的字符串限定语料类型 (Genre)和时段(Year) ,并且可以明确到查询某一 个子语料库,时段也可以查询任何一年的某个字词 的使用情况。
COCA语料库简介
– 涵盖美国这一时期的口语(spoken)、小说(fiction)、 流行杂志(pop magzine)、报纸(newspaper)和学术期 刊(academic)五大类型的语料库,并且在这五个类型 方面基本呈均匀平衡分布。
COCA界面简介
➢主要包括三大功能区:
➢ Ⅰ 显示及查询条件界定区,包括:显示方式区, 字串查询区,语料库分类区,查询结果排列方式 区。
规则:在words的方格里输入[=beautiful],表示和beautiful语 义相近的所有形容词。
THANK YOU!
美国当代英语语料库(COCA)使用说明
http://corpus.byu.edu/coca
一、COCA语料库简介
• COCA简介
– COCA:美国当代英语语料库(Corpus of Contemporary American English)是由美国杨 伯翰大学(Brigham Young University)的 Mark Davies 教授开发的美国最新当代英语语 料库,是当今世界上最大的英语平衡语料库。
POS LIST
pron.INDF 不定代词 pron.PERS 人称代词 pron.WH 疑问代词 pron.REFL 反身代词 adj.CMP 形容词比较级 (comparative) adj.SPRL 形容词最高级 (superlative) adv.particle 副词小品词 adv.WH 疑问副词
COCA主要搜索功能
• 例:输入lemmas(即一个单词的单复数、时态等 所有形式)。若要得到get这个单词的所有形式, 可以如下图所示。
EXAMPLE
规则:若要得到某个单词的所有单复数和时态形式,那么 就要在输入时,在这个单词外加 [ ]。
• 例:输入通配符(wildcards),输入un*ly,结果 如图。
POS LIST
verb base=动词原形 verb.INF=动词不定式 verb MODAL=情态动词 verb 3SG=动词第三人称单数 verb ED=过去式 verb EN=过去分词 verb ING=现在分词 verb.LEX=lexical verb实意动词 verb.[BE]=系动词 verb.[DO]=do verb.[HAVE]=have
相关文档
最新文档