美国当代英语语料库(COCA)使用介绍
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
POS LIST
verb base=动词原形 verb.INF=动词不定式 verb MODAL=情态动词 verb 3SG=动词第三人称单数 verb ED=过去式 verb EN=过去分词 verb ING=现在分词 verb.LEX=lexical verb实意动词 verb.[BE]=系动词 verb.[DO]=do verb.[HAVE]=have
POS LIST
det.GEN 类指限定词 det.POS 物主限定词 num.CARD 基数词 num.ORD 序数词 conj.CRD 并列连词 conj.SUB 从属连词 Interj. 叹词 PUNC 标点
词性列表的使用
• 某个词前或者后面特定词性的若干搭配词, 如confidence前的形容词
COCA界面简介
• 字串查询区:
• Ⅰ WORDS:输入字符串。 • Ⅱ POS LIST:词性列表
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
• 功能:此区可以对查询的字符串限定语料类型 (Genre)和时段(Year) ,并且可以明确到查询某一 个子语料库,时段也可以查询任何一年的某个字词 的使用情况。
COCA界面简介
• 显示方式区:
• 1.LIST——列表显示 • 2.CHART——图表显示,可以显示在各语料库类型中的使 用频率和各时间段内的使用情况。 • 3.Concordances——Key word in context (KWIC),上下 文关键词显示 • 4.COMPARE——单词比较显示,比较两个不同词或短语 的搭配情况。
? 代替一个字母 * 代替任意数量字母
EXAMPLE
• 例:输入某种词性且部分带有某些字母的命令, 如要得到以 un- 开头、 -ed 结尾的所有形容词的所 有形式,以及得到动词 + 任何词 +ground 的所有词 组。
规则: 若要得到某种词性且词中带有部分带有某些字母的形 式时,如要得到以 un- 开头、 -ed 结尾的所有形容词的所有形 式,那么输入: un*ed.[j*]; 若要得到动词 + 任何词 +ground 的所有词组 , 那么输入 : [v*] * [ground]即可。 前者用来研究词汇,后者用来查询特定词性的搭配。
POS LIST
pron.INDF 不定代词 pron.PERS 人称代词 pron.WH 疑问代词 pron.REFL 反身代词 adj.CMP 形容词比较级 (comparative) adj.SPRL 形容词最高级 (superlative) adv.particle 副词小品词 adv.WH 疑问副词
美国当代英语语料库(COCA)使用说明
http://corpus.byu.edu/coca
一、COCA语料库简介
• COCA简介
– COCA:美国当代英语语料库(Corpus of Contemporary American English)是由美国杨 伯翰大学(Brigham Young University)的 Mark Davies 教授开发的美国最新当代英语语 料库,是当今世界上最大的英语平衡语料库。
规则:在words里输入: smile.[n*],表示作为名词的smile。
COCA主要功能(三)
• 搜索在子语料库内(或之间)出现的频率(或 比较)(不同语域中的用法)
• Dwell是个文学色彩词吗?
• COCA主要功能(四) • 搜索近义词 • 如:搜索beautiful的所有近义词
规则:在words的方格里输入[=beautiful],表示和beautiful语 义相近的所有形容词。
Biblioteka Baidu
Concordances显示方式
• • • • • •
蓝色——名词 紫色——动词 绿色——形容词 棕色——副词 灰色——代词 黄色——介词
COCA主要搜索功能
• 例:输入词组 “excuse+名词” 得到的结果都是 excuse后面跟的 名词短。检索表达 式为:white [n*]。
图2.1.2-2
White+名词的短语
规则:名词: [n*];动词: [v*]; 形容词: [j*]; 副词: [r*];代词:[p*]; 连词:[c*]
POS LIST 词性列表
POS LIST
noun.ALL=名词 noun.SG=单数名词 noun.PL=复数名词 noun.CMN=普通名词 noun.+PROP=专有名词 noun.-PROP=非专有名词
COCA语料库简介
– 涵盖美国这一时期的口语(spoken)、小说(fiction)、 流行杂志(pop magzine)、报纸(newspaper)和学术期 刊(academic)五大类型的语料库,并且在这五个类型 方面基本呈均匀平衡分布。
COCA界面简介
主要包括三大功能区:
Ⅰ 显示及查询条件界定区,包括:显示方式区, 字串查询区,语料库分类区,查询结果排列方式 区。 Ⅱ 查询结果数据显示区 Ⅲ 例句显示区
un-开头、-ed结尾的所有形容词
动词+任何词+ground的所有词组
COCA主要搜索功能(二)
• 搜索搭配词和出现的频率
• 如“go后跟的形容词”
规则:在collocates里输入[n*] 后选择4,表示在thick4后面(4跨距范 围内)出现的任何名词
• 如:跟在 “名词smile前面的形容词”
COCA主要搜索功能
• 例:输入 lemmas (即一个单词的单复数、时态等 所有形式)。若要得到get这个单词的所有形式, 可以如下图所示。
EXAMPLE
规则:若要得到某个单词的所有单复数和时态形式,那么 就要在输入时,在这个单词外加 [ ]。
• 例:输入通配符 (wildcards) ,输入 un*ly ,结果 如图。
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
COCA主要搜索功能(一)
• 搜索words、phrases、lemmas(单词的所 有形式)、wildcards(通配符)和其他更 加复杂的字词。