语料库语言学术语汇编A glossary of corpus linguistics
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
短语单位/序列
Plain text
纯文本
POSgram
赋码序列、码串
POS sequence
赋码序列、码串
POS tagging/Part-of-Speech tagging
词性赋码、词性标注、词性附码
POS tagger
词性赋码器、词性赋码工具
Prefab
预制语块
Probabilistic
(基于)概率的、概率性的、盖然的
同现词列、框合结构
Concord
索引(行)(简略形式)
Concordance (line)
索引(行)
Concordance plot
(索引)词图
Concordancer
索引工具
Concordancing
索引分析
Context
语境、上下文
Context word
语境词
Contextual prosody
NLP/Natural Language Processing
自然语言处理
Node (word)
节点(词)
Normalization
标准化、(翻译)规范化、泛化
Normalized frequency
标准化频率、标称频率、归一频率
Observed corpus
观察语料库
Ontology
知识本体、本体
随机的
Stop list
停用词表、过滤词表
Stop word
停用词、过滤词
Synchronic corpus
共时语料库
Syntagmatic
横组合(关系)的
T score
T值
T-universals
目标语型共性(特征)
元元信息
MF/MD approach/multi-feature/multi-dimensional analysis
多特征/多维度分析法
Misuse
误用
Monitor corpus
(动态)监察语料库
Monolingual corpus
单语语料库
Multilingual corpus
多语语料库
Multimodal corpus
Discourse prosody
话语韵律
Documentation
文检报告、备检文件、说明文档
EAGLES/Expert Advisory Groups on Language Engineering Standards
EAGLES文本规格
Empirical linguistics
实证语言学
Empiricism
句法标注的语料库、树库
Parser
句法分析器
Parsing
句法标注、句法分析
Pattern/patterning
型式、模式
Pattern grammar
型式语法
Pattern matching
模式匹配
Pedagogic corpus
教学语料库
Phraseology
短语、短语学
Phraseological unit/sequence
美国信息交换标准码
Associates (of keywords)
(主题词的)联想词
AWL/academic word list
学术词表
Balanced corpus
平衡语料库
Base list/baselist
底表、基础词表
Bigram
二元组、二元序列、二元结构
Bi-text/bitext
双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后的文本)
源语型共性(特征)
Samplen./v.
样本;取样、采样、抽样
Sampling
取样、采样、抽样
Sanitization
净化
Search term
检索项
Search word
检索词
Segmentation
切分、分词
Semantic association
语义联想
Semantic preference
语义倾向、语义趋向
Annotated text/corpus
标注文本/语料库、赋码文本/语料库
Annotation
标注(名词)
Annotation scheme
标注方案
ANSI/American National Standards Institute
美国国家标准学会
ASCII/American Standard Code for Information Exchange
文内标注、行内标注
Interlanguage
中介语、过渡语
Inter-coder agreement/reliability
标注者间一致性/信度
Introspection/introspective
内省(式)(的)
Intuition
直觉
Key keywords
关键主题词
Keyness
主体性、关键性
Keywords
Regex/RE/RegExp/regular expressions
正则表达式、正则式
Register variation
语域变异
Relative frequency
相对频率
Representative/representativeness
代表性(的)
Rule-based
基于规则的
S-universals
Probabilistic grammar
概率语法、概率性语法、盖然语法
Probability
概率
Query
查询、检索
Range
分布(范围)、跨度
Rationalism
理性主义
Raw frequency
原始频数、生频数
Raw text/corpus
生文本/生语料
Reference corpus
参照语料库
Lexical profile
词汇分布概貌
Lexical richness
词汇丰富度
Lexico-grammar
词汇语法
Lexis
词语、词项、词语学
Log-likelihood ratio
对数似然比、对数似然率
Longitudinal/developmental corpus
跟踪语料库、发展语料库、历时语料库
一次词
Header/corpus head
文本头、头标、头文件
Hidden Markov model (HMM)
隐马尔科夫模型、隐马模型
Idiom principle
习语原则、成语原则
Idiomaticity
习语性、地道程度
Implicitation
隐化
Index/indexing
(建)索引
In-line annotation
Open choice principle
开放选择原则
Orthographic
Orthography
正字法
Overuse
过多使用、超用、使用过度、过度使用
Paradigmatic
纵聚合(关系)的
Parallel corpus
平行语料库、对应语料库
Parole linguistics
言语语言学
Parsed corpus
Bi-hapax
两次词
Bilingual corpus
双语语料库
Bootcamp debate/discourse/discussion
(新手)训练营大辩论/话语/大探讨
CA/Contrastive Analysis
对比分析
Case-sensitive/case sensitivity
大小写敏感、区分大小写
语境韵律
Contingency table
连列表、联列表、列连表、列联表
Co-occurrence/Co-occurring
共现、同现
Corpus Linguistics
语料库语言学
Corpus,pl. corpora
语料库
Corpus-based
基于语料库的
Corpus-based translation studies
Lexical bundle
词束
Lexical density
词汇密度
Lexical frequency profile
词频概貌
Lexical grammar
词汇语法
Lexical item
词项、ቤተ መጻሕፍቲ ባይዱ语项目
Lexical patterning
词语型式、词汇型式
Lexical priming
词汇触发理论、词汇启动理论
共选(机制)
Co-text
共文
Data mining
数据挖掘
DDL/Data Driven Learning
数据驱动学习
Dependency
(句法)依存关系
Dice coefficient
Dice系数
Disambiguation
消歧
Diachronic corpus
历时语料库
Discourse
话语、语篇
CLAWS词性赋码系统
Clean text policy
干净文本原则
Cluster
词簇、词丛
Colligation
类联接、类连接、类联结
Collocaten./v.
搭配词;搭配
Collocability
搭配强度、搭配力
Collocation
搭配、词语搭配
Collocational strength
搭配强度
专用语料库、专门用途语料库、专题语料库
Standardized type/token ratio
标准化类符/形符比、标准化类/形比、标准化型次比
Standardized TTR/STTR
标准化类符/形符比、标准化类/形比、标准化型次比
Stand-off annotation
分离式标注
Stochastic
Semantic prosody
语义韵
Sentence alignment
句对齐、句级对齐
SGML/Standard Generalized Markup Language
标准通用标记语言
Simplification
简化
Skipgram
跨词序列、跨词结构
Span
跨距
Specialized corpus
经验主义
Encoding
字符编码
Error-tagging
错误标注、错误赋码
Explicitation
显化
Extended unit of meaning
扩展意义单位
File-based search/concordancing
批量检索
Firthian (linguistics)
弗斯(语言学)、弗斯学派的(语言学)
基于语料库的翻译研究、语料库翻译学、基于语料库的译学研究
Corpus-driven
语料库驱动的
Corpus-informed
语料库指导下的、参考了语料库的
Corpus size
库容
Corpus stylistics
语料库文体学
Co-select/co-selection/co-selectiveness
Category-based approach
基于类(范畴)的方法
Chi-square test/χ2
卡方检验
Chunk
词块
CIA/Contrastive Interlanguage Analysis
中介语对比分析
CLAWS/Constituent Likelihood Automatic Word-tagging System
Collocational framework/frame
搭配框架
Collocational profile
搭配概貌
Collocational network
搭配网络
Comparable corpora
类比语料库、可比语料库
Computational Linguistics
计算语言学
ConcGram/concgram
Formulaic sequence
程式化序列、套语
Frequency
频数、频率
Frequency list
词频表
General (purpose) corpus
通用语料库
Genre
语体、体裁
Grammatical patterning
语法型式
Granularity
颗粒度
Hapax legomenon/hapax
Machine-readable
机读的
Machine translation
机器翻译
Manual annotation
手工标注
Markup/mark-up
标记、置标
MDA (Multi-dimensional analysis/approach)
多维度分析法
Metadata
元信息
Meta-metadata
多模态语料库
MWU/multiword unit
多词单位
MWE/multiword expression
多词表达
MI/mutual information
互信息、互现信息
N-gram
N元组、N元序列、N元结构、N元词、多词序列
Neo-Firth (school)
新弗斯学派
Neo-Firthian
新弗斯学派的
主题词
KWIC/Key Word in Context
语境中的关键词、语境共现(方式)
KWIC sort
语境共现排序、索引行排序
Learner corpus
学习者语料库
Lemma,pl. lemmata/lemmas
词目、原形词、词元
Lemmatization
词形还原、词元化
Lemmatizer
词形还原工具、词元化工具
语料库语言学术语汇编(V2.0)
Last updated2012-10-08by许家金
Aboutness
所言之事
Absolute frequency
绝对频数
Alignment (of parallel texts)
(平行或对应)语料的对齐
Alphanumeric
字母数字构成的
Annotate
标注(动词)
Plain text
纯文本
POSgram
赋码序列、码串
POS sequence
赋码序列、码串
POS tagging/Part-of-Speech tagging
词性赋码、词性标注、词性附码
POS tagger
词性赋码器、词性赋码工具
Prefab
预制语块
Probabilistic
(基于)概率的、概率性的、盖然的
同现词列、框合结构
Concord
索引(行)(简略形式)
Concordance (line)
索引(行)
Concordance plot
(索引)词图
Concordancer
索引工具
Concordancing
索引分析
Context
语境、上下文
Context word
语境词
Contextual prosody
NLP/Natural Language Processing
自然语言处理
Node (word)
节点(词)
Normalization
标准化、(翻译)规范化、泛化
Normalized frequency
标准化频率、标称频率、归一频率
Observed corpus
观察语料库
Ontology
知识本体、本体
随机的
Stop list
停用词表、过滤词表
Stop word
停用词、过滤词
Synchronic corpus
共时语料库
Syntagmatic
横组合(关系)的
T score
T值
T-universals
目标语型共性(特征)
元元信息
MF/MD approach/multi-feature/multi-dimensional analysis
多特征/多维度分析法
Misuse
误用
Monitor corpus
(动态)监察语料库
Monolingual corpus
单语语料库
Multilingual corpus
多语语料库
Multimodal corpus
Discourse prosody
话语韵律
Documentation
文检报告、备检文件、说明文档
EAGLES/Expert Advisory Groups on Language Engineering Standards
EAGLES文本规格
Empirical linguistics
实证语言学
Empiricism
句法标注的语料库、树库
Parser
句法分析器
Parsing
句法标注、句法分析
Pattern/patterning
型式、模式
Pattern grammar
型式语法
Pattern matching
模式匹配
Pedagogic corpus
教学语料库
Phraseology
短语、短语学
Phraseological unit/sequence
美国信息交换标准码
Associates (of keywords)
(主题词的)联想词
AWL/academic word list
学术词表
Balanced corpus
平衡语料库
Base list/baselist
底表、基础词表
Bigram
二元组、二元序列、二元结构
Bi-text/bitext
双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后的文本)
源语型共性(特征)
Samplen./v.
样本;取样、采样、抽样
Sampling
取样、采样、抽样
Sanitization
净化
Search term
检索项
Search word
检索词
Segmentation
切分、分词
Semantic association
语义联想
Semantic preference
语义倾向、语义趋向
Annotated text/corpus
标注文本/语料库、赋码文本/语料库
Annotation
标注(名词)
Annotation scheme
标注方案
ANSI/American National Standards Institute
美国国家标准学会
ASCII/American Standard Code for Information Exchange
文内标注、行内标注
Interlanguage
中介语、过渡语
Inter-coder agreement/reliability
标注者间一致性/信度
Introspection/introspective
内省(式)(的)
Intuition
直觉
Key keywords
关键主题词
Keyness
主体性、关键性
Keywords
Regex/RE/RegExp/regular expressions
正则表达式、正则式
Register variation
语域变异
Relative frequency
相对频率
Representative/representativeness
代表性(的)
Rule-based
基于规则的
S-universals
Probabilistic grammar
概率语法、概率性语法、盖然语法
Probability
概率
Query
查询、检索
Range
分布(范围)、跨度
Rationalism
理性主义
Raw frequency
原始频数、生频数
Raw text/corpus
生文本/生语料
Reference corpus
参照语料库
Lexical profile
词汇分布概貌
Lexical richness
词汇丰富度
Lexico-grammar
词汇语法
Lexis
词语、词项、词语学
Log-likelihood ratio
对数似然比、对数似然率
Longitudinal/developmental corpus
跟踪语料库、发展语料库、历时语料库
一次词
Header/corpus head
文本头、头标、头文件
Hidden Markov model (HMM)
隐马尔科夫模型、隐马模型
Idiom principle
习语原则、成语原则
Idiomaticity
习语性、地道程度
Implicitation
隐化
Index/indexing
(建)索引
In-line annotation
Open choice principle
开放选择原则
Orthographic
Orthography
正字法
Overuse
过多使用、超用、使用过度、过度使用
Paradigmatic
纵聚合(关系)的
Parallel corpus
平行语料库、对应语料库
Parole linguistics
言语语言学
Parsed corpus
Bi-hapax
两次词
Bilingual corpus
双语语料库
Bootcamp debate/discourse/discussion
(新手)训练营大辩论/话语/大探讨
CA/Contrastive Analysis
对比分析
Case-sensitive/case sensitivity
大小写敏感、区分大小写
语境韵律
Contingency table
连列表、联列表、列连表、列联表
Co-occurrence/Co-occurring
共现、同现
Corpus Linguistics
语料库语言学
Corpus,pl. corpora
语料库
Corpus-based
基于语料库的
Corpus-based translation studies
Lexical bundle
词束
Lexical density
词汇密度
Lexical frequency profile
词频概貌
Lexical grammar
词汇语法
Lexical item
词项、ቤተ መጻሕፍቲ ባይዱ语项目
Lexical patterning
词语型式、词汇型式
Lexical priming
词汇触发理论、词汇启动理论
共选(机制)
Co-text
共文
Data mining
数据挖掘
DDL/Data Driven Learning
数据驱动学习
Dependency
(句法)依存关系
Dice coefficient
Dice系数
Disambiguation
消歧
Diachronic corpus
历时语料库
Discourse
话语、语篇
CLAWS词性赋码系统
Clean text policy
干净文本原则
Cluster
词簇、词丛
Colligation
类联接、类连接、类联结
Collocaten./v.
搭配词;搭配
Collocability
搭配强度、搭配力
Collocation
搭配、词语搭配
Collocational strength
搭配强度
专用语料库、专门用途语料库、专题语料库
Standardized type/token ratio
标准化类符/形符比、标准化类/形比、标准化型次比
Standardized TTR/STTR
标准化类符/形符比、标准化类/形比、标准化型次比
Stand-off annotation
分离式标注
Stochastic
Semantic prosody
语义韵
Sentence alignment
句对齐、句级对齐
SGML/Standard Generalized Markup Language
标准通用标记语言
Simplification
简化
Skipgram
跨词序列、跨词结构
Span
跨距
Specialized corpus
经验主义
Encoding
字符编码
Error-tagging
错误标注、错误赋码
Explicitation
显化
Extended unit of meaning
扩展意义单位
File-based search/concordancing
批量检索
Firthian (linguistics)
弗斯(语言学)、弗斯学派的(语言学)
基于语料库的翻译研究、语料库翻译学、基于语料库的译学研究
Corpus-driven
语料库驱动的
Corpus-informed
语料库指导下的、参考了语料库的
Corpus size
库容
Corpus stylistics
语料库文体学
Co-select/co-selection/co-selectiveness
Category-based approach
基于类(范畴)的方法
Chi-square test/χ2
卡方检验
Chunk
词块
CIA/Contrastive Interlanguage Analysis
中介语对比分析
CLAWS/Constituent Likelihood Automatic Word-tagging System
Collocational framework/frame
搭配框架
Collocational profile
搭配概貌
Collocational network
搭配网络
Comparable corpora
类比语料库、可比语料库
Computational Linguistics
计算语言学
ConcGram/concgram
Formulaic sequence
程式化序列、套语
Frequency
频数、频率
Frequency list
词频表
General (purpose) corpus
通用语料库
Genre
语体、体裁
Grammatical patterning
语法型式
Granularity
颗粒度
Hapax legomenon/hapax
Machine-readable
机读的
Machine translation
机器翻译
Manual annotation
手工标注
Markup/mark-up
标记、置标
MDA (Multi-dimensional analysis/approach)
多维度分析法
Metadata
元信息
Meta-metadata
多模态语料库
MWU/multiword unit
多词单位
MWE/multiword expression
多词表达
MI/mutual information
互信息、互现信息
N-gram
N元组、N元序列、N元结构、N元词、多词序列
Neo-Firth (school)
新弗斯学派
Neo-Firthian
新弗斯学派的
主题词
KWIC/Key Word in Context
语境中的关键词、语境共现(方式)
KWIC sort
语境共现排序、索引行排序
Learner corpus
学习者语料库
Lemma,pl. lemmata/lemmas
词目、原形词、词元
Lemmatization
词形还原、词元化
Lemmatizer
词形还原工具、词元化工具
语料库语言学术语汇编(V2.0)
Last updated2012-10-08by许家金
Aboutness
所言之事
Absolute frequency
绝对频数
Alignment (of parallel texts)
(平行或对应)语料的对齐
Alphanumeric
字母数字构成的
Annotate
标注(动词)