语料库语言学术语汇编V20-CORPUSnplcorpora

合集下载

语料库术语汇编

语料库术语汇编

语料库术语汇编语料库术语汇编:Aboutness 所言之事Absolute frequency 绝对频数Alignment (of parallel texts) (平行或对应)语料的对齐Alphanumeric 字母数字类的Annotate 标注(动词)Annotation 标注(名词)Annotation scheme 标注方案ANSI/American National Standards Institute 美国国家标准学会ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) (主题词的)联想词A WL/Academic word list 学术词表Balanced corpus 平衡语料库Base list 底表、基础词表Bigram 二元组、二元序列、二元结构Bi-hapax 两次词Bilingual corpus 双语语料库CA/Contrastive Analysis 对比分析Case-sensitive 大小写敏感、区分大小写Chi-square (χ2) test 卡方检验Chunk 词块CIA/Contrastive Interlanguage Analysis 中介语对比分析CLA WS/Constituent Likelihood Automatic Word-tagging System CLA WS词性赋码系统Clean text policy 干净文本原则Cluster 词簇、词丛Colligation 类联接、类连接、类联结Collocate n./v. 搭配词;搭配Collocability 搭配强度、搭配力Collocation 搭配、词语搭配Collocational strength 搭配强度Collocational framework/frame 搭配框架Comparable corpora 类比语料库、可比语料库ConcGram 同现词列、框合结构Concordance (line) 索引(行)Concordance plot (索引)词图Concordancer 索引工具Concordancing 索引生成、索引分析Context 语境、上下文Context word 语境词Contingency table 连列表、联列表、列连表、列联表Co-occurrence/Co-occurring 共现Corpora 语料库(复数)Corpus Linguistics 语料库语言学Corpus 语料库Corpus-based 基于语料库的Corpus-driven 语料库驱动的Corpus-informed 语料库指导的、参考了语料库的Co-select/Co-selection/Co-selectiveness 共选(机制)Co-text 共文DDL/Data Driven Learning 数据驱动学习Diachronic corpus 历时语料库Discourse 话语、语篇Discourse prosody 话语韵律Documentation 备检文件、文检报告EAGLES/Expert Advisory Groups on Language Engineering Standards EAGLES文本规格embedded annotation 嵌入式标注Empirical Linguistics 实证语言学Empiricism 经验主义Encoding 字符编码Error-tagging 错误标注、错误赋码Extended unit of meaning 扩展意义单位File-based search/concordancing 批量检索Formulaic sequence 程式化序列Frequency 频数、频率General (purpose) corpus 通用语料库Granularity 颗粒度Hapax legomenon/hapax 一次词Header/Text head 文本头、头标、头文件HMM/Hidden Markov Model 隐马尔科夫模型Idiom Principle 习语原则Index/Indexing (建)索引In-line annotation 文内标注、行内标注Key keyword 关键主题词Keyness 主题性、关键性Keyword 主题词KWIC/Key Word in Context 语境中的关键词、语境共现(方式)Learner corpus 学习者语料库Lemma 词目、原形词、词元Lemma list 词形还原对应表Lemmata 词目、原形词、词元(复数)Lemmatization 词形还原、词元化Lemmatizer 词形还原(词元化)工具Lexical bundle 词束Lexical density 词汇密度Lexical item 词项、词语项目Lexical priming 词汇触发理论Lexical richness 词汇丰富度Lexico-grammar/Lexical grammar 词汇语法Lexis 词语、词项LL/Log likelihood (ratio) 对数似然比、对数似然率Longitudinal/Developmental corpus 跟踪语料库、发展语料库、历时语料库Machine-readable 机读的Markup 标记、置标MDA/Multi-dimensional approach 多维度分析法Metadata 元信息Meta-metadata 元元信息MF/MD (Multi-feature/Multi-dimensional) approach 多特征/多维度分析法Mini-text 微型文本Misuse 误用Monitor corpus (动态)监察语料库Monolingual corpus 单语语料库Multilingual corpus 多语语料库Multimodal corpus 多模态语料库MWU/Multiword unit 多词单位MWE/Multiword expression 多词单位MI/Mutual information 互信息、互现信息N-gram N元组、N元序列、N元结构、N元词、多词序列NLP/Natural Language Processing 自然语言处理Node 节点(词)Normalization 标准化Normalized frequency 标准化频率、标称频率、归一频率Observed corpus 观察语料库Ontology 知识本体、本体Open Choice Principle 开放选择原则Overuse 超用、过多使用、使用过度、过度使用Paradigmatic 纵聚合(关系)的Parallel corpus 平行语料库、对应语料库Parole linguistics 言语语言学Parsed corpus 句法标注的语料库Parser 句法分析器Parsing 句法分析Pattern/patterning 型式Pattern grammar 型式语法Pedagogic corpus 教学语料库Phraseology 短语、短语学POSgram 赋码序列、码串POS tagging/Part-of-Speech tagging 词性赋码、词性标注、词性附码POS tagger 词性赋码器、词性赋码工具Prefab 预制语块Probabilistic (基于)概率的、概率性的、盖然的Probability 概率Rationalism 理性主义Raw text/Raw corpus 生文本(语料)Reference corpus 参照语料库Regex/RE/RegExp/Regular Expressions 正则表达式Register variation 语域变异Relative frequency 相对频率Representative/Representativeness 代表性(的)Rule-based 基于规则的Sample n./v. 样本;取样、采样、抽样Sampling 取样、采样、抽样Search term 检索项Search word 检索词Segmentation 切分、分词Semantic preference 语义倾向Semantic prosody 语义韵SGML/Standard Generalized Markup Language 标准通用标记语言Skipgram 跨词序列、跨词结构Span 跨距Special purpose corpus 专用语料库、专门用途语料库、专题语料库Specialized corpus 专用语料库Standardized TTR/Standardized type-token ratio 标准化类符/形符比、标准化类/形比、标准化型次比Stand-off annotation 分离式标注Stop list 停用词表、过滤词表Stop word 停用词、过滤词Synchronic corpus 共时语料库Syntagmatic 横组合(关系)的Tag 标记、码、标注码Tagger 赋码器、赋码工具、标注工具Tagging 赋码、标注、附码Tag sequence 赋码序列、码串Tagset 赋码集、码集Text 文本TEI/Text Encoding Initiative 文本编码计划The Lexical Approach 词汇中心教学法The Lexical Syllabus 词汇大纲Token 形符、词次Token definition 形符界定、单词界定Tokenization 分词Tokenizer 分词工具Transcription 转写Translational corpus 翻译语料库Treebank 树库Trigram 三元组、三元序列、三元结构T-score T值Type 类符、词型TTR/Type-token ratio 类符/形符比、类/形比、型次比Underuse 少用、使用不足Unicode 通用码Unit of meaning 意义单位WaC/Web as Corpus 网络语料库Wildcard 通配符Word definition 单词界定Word form 词形Word family 词族Word list 词表XML/EXtensible Markup Language 可扩展标记语言Zipf's Law 齐夫定律Z-score Z值。

语言学常用术语

语言学常用术语

语言学常用术语A List of Commonly-used LinguisticTerminology语言学常用术语表Part I General Terms通用术语Acquisition 习得Agglutinative language 粘着语Anthropology 人类学Applied linguistics 应用语言学Arbitrariness 任意性Artificial intelligence (AI)人工智能Behaviorism 行为主义Behaviorist psychology 行为主义心理学Bilingualism 双语现象Cognition 认知Cognitive linguistics 认知语言学Cognitive science 认知科学Comparative linguistics 比较语言学Computational linguistics 计算语言学Corpus-linguistics 语料库语言学Creole 克里奥耳语;混合语Culture 文化Descriptive linguistics 描写语言学Design features 识别特征Developmental psycholinguistics 发展心理语言学Diachronic/historical linguistics历时语言学Dialect 方言Dialectology 方言学Displacement 不受时空限制的特性Dualism 二元论Duality 二重性Epistemology认识论Etymology 辞源学Experimental psycholinguistics 实验心理语言学Formalization 形式化Formal linguistics 形式语言学Forensic linguistics 法律语言学Functionalism 功能主义General linguistics 普通语言学Grammaticality 符合语法性Ideography 表意法Inflectional language 屈折语Inter-disciplinary 交叉性学科的Isolating language 孤立语Langue 语言Macro-sociolinguistics 宏观社会语言学Mentalism 心智主义Micro-sociolinguistics 微观社会语言学Montague grammar蒙太古语法Neuro-linguistics 神经语言学Orthography 正字法Orthoepic 正音法的Paradigmatic 聚合关系Parole 言语Pedagogy 教育学;教授法Philology 语文学Philosophy 哲学Phonography 表音法Pidgin 皮钦语;洋泾浜语Polysynthetic language 多式综合语Prescriptive linguistics 规定语言学Psycholinguistics心理语言学Psychology 心理学Semeiology 符号学Sociology 社会学Speech 言语Sociolinguistics社会语言学Structuralism 结构主义Synchronic linguistics 共时语言学Syntagmatic 组合关系Theoretic linguistics 理论语言学Universal grammar 普遍语法Universality 普遍性Part II Phonology音位学Ablaut 元音变化Acoustic phonetics 声学语音学Affricate 塞擦音Allophone 音位变体Alveolar 齿龈音Articulatory phonetics 发音语音学Auditory phonetics 听觉语音学Articulatory variables 发音变体Aspiration 送气Assimilation 同化Back of tongue舌根Back vowel后元音Bilabial 双唇音Blade of tongue 舌面Broad transcription 宽式音标Central vowel 中元音Collocation 搭配Complementary distribution互补分布Consonant 辅音Dental 齿音Diacritics 变音符号;附加符号Diphthong 双元音Distinctive features 区别性特征Fricative 擦音Front vowel 前元音Glide 音渡Glottal 喉音Hard palate 硬腭International Phonetic Alphabet 国际音标Intonation 语调Liquid 流音Manner of articulation 发音方法Minimal pair最小对立体Narrow transcription 严式音标Nasal 鼻音Nasal cavity 鼻腔Palatal 腭音Pharyngeal cavity 咽腔Phone音素Phoneme音位Place of articulation 发音部位Plosive爆破音Phonemic contrast 音位对立Phonetics语音学Rounded圆唇音Soft palate (velum)软腭Spectrograph 频谱仪Speech organ 发音器官Speech sounds 语音Stop塞音Stress 重音Suprasegmental features 超音段特征T eeth ridge (alveolus) 齿龈隆骨Tip of tongue 舌尖Tone 音/声调Unrounded 非圆唇音Uvula 小舌Velar 软腭音V ocal cords 声带V oiced 浊音V oiceless清音V oicing 浊音化V owel 元音Part III Morphology形态学Acronym 首字母缩略词Affix 词缀Affixation 词缀法Back-formation 逆成法Blending 紧缩法Borrowing 借用Bound morpheme 粘着语素Clipped words 缩略词Coinage 创新词Compounding 合成法Conversion 转换法Closed class 封闭类Derivational morpheme 派生语素Free morpheme 自由语素Idiom 成语Inflection 屈折变化Inflectional morpheme 屈折语素Jargon 行话Lexicography 辞典编纂学Loan words 外来词Morpheme 语素Open class 开放类Prefix 前缀Productive 能产的Root 词根Stem 词干Suffix 后缀Suppletion 异根Word formation 构词法Part IV Syntax句法学Abstract noun 抽象名词Accusative 宾格Active voice 主动态Adjective 形容词Adjunct 附加状语Adverbial 状语Agreement 一致关系Anaphor 照应语Antecedent 先行词Apostrophe 省略符号Apposition 同位语Article 冠词Attribute 定语Case 格Cleft sentence 分裂句Collective noun 集合名词Comment 述题Competence 语言能力Complement 补语Compound predicate 复合谓语Compound sentence 复合句Concession relation 让步关系Concrete noun 具体名词Connective 连接词Constituent 句子成分Content word 实词Continuous aspect 进行体Coordinate clause 并列句Coordinating conjunction 并列连词Copula 系动词Declarative sentence 陈述句Descriptive adequacy 描写充分性Direct object 直接宾语Discontinuous constituents 非连续性成分D-structure 深层结构Dual number 双数Dummy word 伪词Endocentric construction 向心结构Ergative 作格Exclamatory sentence 感叹句Existential sentence 存在句Exocentric construction 离心结构Explanatory adequacy 解释充分性Feminine 阴性Finite clause 限定性分句Finite verb 限定性动词Function word 功能词Generic term 泛指性成分Genitive case 所有格;属格Gender 性Gerundive 动名词Habitual aspect 习惯体Head 中心词Immediate Constituent Analysis (IC Analysis) 直接成分分析法Imperative mood 祈使语气Imperative sentence 祈使句Imperfective aspect 非完成体Indirect object 间接宾语Infinitive 不定式Inflectional affix 屈折前缀Informal language 非正式语言Intensifier 强势语Interjection 感叹词Interrogative sentence 疑问句Intransitive verb 不及物动词Intransitivity 不及物性Irregular verb 不规则动词Labeled tree diagram 加标记的树形图Language faculty 语言器官Lexical verb 实词性动词Main clause 主句Masculine 阳性的Matrix sentence 主句Middle voice 中动语态Modality 情态Modal verbs 情态动词Modification 修饰Modifier 修饰语Morphological process 形态过程Move 移位Negation 否定Neuter gender 中性Nominal 名词性的Nominal clause 名词性分句Nominalization 名物化Nominative case 主格Non-place predicate 空位述谓结构Numeral 数词Object 宾语Objective 宾格Oblique case 斜格Observational adequacy 观察充分性One-place predicate 一位述谓结构Onomatopoeia 拟声词Particle 小品词Parts of speech 词性Passive voice 被动语态Past perfect tense 过去完成时Past tense过去时Perfective aspect 完成体Performance 语言运用;言语行为Personal pronoun 人称代词Personification 拟人化Phrasal verb 短语动词Phrase 短语Phrase structure rules (PS-rules) 短语结构规则Plural 复数的Plurality 复数性Postposition 后置词Postpositional phrase 后置性短语Predicate 谓词Preposition 介词Prepositional phrase 介词性短语Present tense 现在时Progressive aspect 进行体Projection principle 投射原则Pronominal 代词性的Pronoun 代词Quantifier 数量词Reciprocal pronoun 互指代词Reflexive pronoun 反身代词Reflexive verb 反身动词Relative adverb 关系副词Relative clause 关系状语Relative pronoun 关系代词Rhetorical question 反意疑问句Sentence 句子Sentential 句子的Sentential complement 句子性补语Simple sentence 简单句Singular 单数的Singularity 单数性S-structure 表层结构Subject 主语Subjective 主格Subordinate 从属句Substantive 实词Syntactic function 句法功能Tag question 附加疑问句Tense 时态Topic 主题Transformational-generative grammar (TG grammar) 转换生成语法Transitive verb 及物动词Transitivity 及物性Two-place predicate 二位述谓结构Unaccusativity 动词的非宾格性Verb 动词Verbal behavior 言语行为V oice 语态Word classes 词类Word order 词序Yes-no question 是非问句;一般疑问句Part V Semantics语义学Agent 施事Antonym 反义词Antonymy 反义关系Beneficiary 受益者Color word 色彩词Complementarity 互补性反义关系Componential analysis 成分分析法Contradiction 自相矛盾的说法Deictic center 指示中心Deixis 指示语Downgrade 语义降格Experiencer 经历者Homography 同形异音异义Homonymy 同音异义Hyponym 下义词Hyponymy 下义Instrument 工具Locative 地点Meaningfulness 有意义Naming 命名论Participant role 参与者角色Patient 受事Person deixis 人称指示语Place deixis 地点指示语Polysemy 一词多义Possible world 可能世界Predication analysis 述谓结构分析Recipient 接收者Reference 所指Referent 所指对象Selectional restrictions 选择限制Semantic role 语义角色Sense 意义Superordinate 上义词Synonym 同义词Synonymy 同义关系Theme 受事Theta role (θ-role) 语义角色Time deixis 时间指示语Truth condition 真值条件Valency 配价Part VI Pragmatics语用学Addressee 说话对象Adjacency pair 邻接对Context 语境;上下文Conversational implicature 会话含义Cooperative principle 合作原则Direct speech 直接话语Discourse 话语Distal 远指Encyclopedic knowledge 百科知识Euphemism 委婉语Focus 焦点Generalized implicature 广义含义Given vs. new information 已知与未知信息Honorific 敬语Illocutionary act 言外行为Illocutionary force 言外之力Implicature 含义Indirect speech 间接话语Informativeness principle 信息原则Manner implicature 方式含义Maxim of manner 方式准则Maxim of quality 质量准则Maxim of quantity 数量准则Maxim of relation 关联准则Performative 施为句Performative verb 施为动词Perlocutionary act 言后行为Potential implicature 可能含义Potential presupposition 可能预设Pre-announcement 事先声明Preparatory condition 准备条件Presupposition预设Presupposition suspension 预设中止Presupposition trigger 预设激发Propositional act 命题行为Propositional content 命题内容Propositional relation 命题关系Proposition 命题Proximal 近指Quality implicature 质的含义Quantity implicature 量的含义Scalar implicature 标尺含义Schema 图式Self-repair 自我修正Sincerity condition 诚实原则Speaker 说话者Speech act 言语行为Text 语篇Turn 话轮Turn-taking 话轮转换。

corpora名词解释

corpora名词解释

corpora名词解释corpora名词解释1. 什么是corpora?Corpora是文本语料库的复数形式,指的是大量经过整理的文本集合。

语料库是研究自然语言处理(NLP)和文本挖掘的重要数据源,能够用于训练机器学习模型、开发自然语言处理算法以及构建文本分析应用程序。

2. 主要的corpora类型有哪些?•网络文本语料库:收集来自互联网的大量文本,如维基百科、新闻文章、社交媒体评论等。

•专门领域语料库:针对特定领域的文本进行收集和整理,如医学文献、法律文件、金融报告等。

•平行语料库:包含两种或多种语言的相互翻译的文本,常用于机器翻译和跨语言信息检索研究。

•对比语料库:同一语言的多个版本或变体的文本集合,用于研究方言、语言变化和文化影响等。

•历史语料库:收集和保存过去时期的文本,用于研究语言演化和历史文化。

3. 一些常见的corpora示例•维基百科语料库:包含维基百科中的文章文本,可用于构建知识图谱或进行主题分析。

•斯坦福情感树库(Stanford Sentiment Treebank):包含电影评论的语料库,用于情感分析和文本分类任务。

•MNIST手写数字数据库:包含大量手写数字图像数据,常用于计算机视觉领域的图像识别任务。

•清华大学新闻语料库:包含新闻文章的语料库,可用于文本挖掘和事件分析等应用。

•英语标准语料库:收集了大量英语书籍、文章和对话的文本,是研究英语语言学和语法的重要资源。

4. 如何使用corpora进行研究和开发?•数据预处理:使用corpora进行数据清洗、标注、分词、去除停用词等预处理步骤,提高文本数据质量。

•特征提取:从corpora中提取词袋模型、tf-idf特征、词嵌入等特征表示,用于训练机器学习模型。

•模型训练:使用corpora训练文本分类、情感分析、命名实体识别等机器学习模型,为应用程序提供预测能力。

•语义解析:通过处理corpora中的文本,进行自然语言处理、语义分析和语言模型的研究,提高NLP算法效果。

语料库语言学术语汇编V20-CORPUSnplcorpora

语料库语言学术语汇编V20-CORPUSnplcorpora
NLP/Natural Language Processing
自然语言处理
Node (word)
节点(词)
Normalization
标准化、(翻译)规范化
Normalized frequency
标准化频率、归一频率
Observed corpus
观察语料库
Ontology
知识本体、本体
Open-choice principle
Bi-hapax
两次词、二次词
Bilingual corpus
双语语料库
Bootcamp debate/discourse/discussion
(新手)训练营大辩论/话语/大探讨
CA/Contrastive Analysis
对比分析
Case-sensitive/case sensitivity
大小写敏感、区分大小写
语料库语言学术语汇编(V2.0)
Last updated2015-07-31by许家金
Aboutness
所言之事
Absolute frequency
绝对频数
Alignment (of parallel texts)
(平行或对应)语料的对齐
Alphanumeric
字母数字构成的
Annotate
标注(动词)、赋码
CLAWS词性赋码系统
Clean text policy
干净文本原则
Cluster
词丛、词簇
Colligation
类联接、类连接、类联结
Collocaten./v.
搭配词;搭配
Collocability
搭配强度、搭配力
Collocation

语料库语言学术语汇编Aglossaryofcorpuslinguistics.docx

语料库语言学术语汇编Aglossaryofcorpuslinguistics.docx

语料库语言学术语汇编 ( V2.0 )Last updated 2012-10-08 by许家金Aboutness所言之事Absolute frequency绝对频数Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric字母数字构成的Annotate标注(动词)Annotated text/corpus标注文本 /语料库、赋码文本/语料库Annotation标注(名词)Annotation scheme标注方案ANSI/American National Standards Institute美国国家标准学会ASCII/American Standard Code for Information美国信息交换标准码ExchangeAssociates (of keywords)(主题词的)联想词AWL/academic word list学术词表Balanced corpus平衡语料库Base list/baselist底表、基础词表Bigram二元组、二元序列、二元结构Bi-text/bitext双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后的文本)Bi-hapax两次词Bilingual corpus双语语料库Bootcamp debate/discourse/discussion(新手)训练营大辩论 /话语 /大探讨CA/Contrastive Analysis对比分析Case-sensitive/case sensitivity大小写敏感、区分大小写Category-based approach基于类(范畴)的方法Chi-square test/ 2χ卡方检验Chunk词块CIA/Contrastive Interlanguage Analysis中介语对比分析CLAWS/Constituent Likelihood Automatic Word-CLAWS 词性赋码系统tagging SystemClean text policy干净文本原则Cluster词簇、词丛Colligation类联接、类连接、类联结Collocate n./v.搭配词;搭配Collocability搭配强度、搭配力Collocation搭配、词语搭配Collocational strength搭配强度Collocational framework/frame搭配框架Collocational profile搭配概貌Collocational network搭配网络Comparable corpora类比语料库、可比语料库Computational Linguistics计算语言学ConcGram/concgram同现词列、框合结构Concord索引(行)(简略形式)Concordance (line)索引(行)Concordance plot(索引)词图Concordancer索引工具Concordancing索引分析Context语境、上下文Context word语境词Contextual prosody语境韵律Contingency table连列表、联列表、列连表、列联表Co-occurrence/Co-occurring共现、同现Corpus Linguistics语料库语言学Corpus, pl. corpora语料库Corpus-based基于语料库的Corpus-based translation studies基于语料库的翻译研究、语料库翻译学、基于语料库的译学研究Corpus-driven语料库驱动的Corpus-informed语料库指导下的、参考了语料库的Corpus size库容Corpus stylistics语料库文体学Co-select/co-selection/co-selectiveness共选(机制)Co-text共文Data mining数据挖掘DDL/Data Driven Learning数据驱动学习Dependency(句法)依存关系Dice coefficient Dice 系数Disambiguation消歧Diachronic corpus历时语料库Discourse话语、语篇Discourse prosody话语韵律Documentation文检报告、备检文件、说明文档EAGLES/Expert Advisory Groups on Language EAGLES 文本规格Engineering StandardsEmpirical linguistics实证语言学Empiricism经验主义Encoding字符编码Error-tagging错误标注、错误赋码Explicitation显化Extended unit of meaning扩展意义单位File-based search/concordancing批量检索Firthian (linguistics)弗斯(语言学)、弗斯学派的(语言学)Formulaic sequence程式化序列、套语Frequency频数、频率Frequency list词频表General (purpose) corpus通用语料库Genre语体、体裁Grammatical patterning语法型式Granularity颗粒度Hapax legomenon/hapax一次词Header/corpus head文本头、头标、头文件Hidden Markov model (HMM)隐马尔科夫模型、隐马模型Idiom principle习语原则、成语原则Idiomaticity习语性、地道程度Implicitation隐化Index/indexing(建)索引In-line annotation文内标注、行内标注Interlanguage中介语、过渡语Inter-coder agreement/reliability标注者间一致性/信度Introspection/introspective内省(式)(的)Intuition直觉Key keywords关键主题词Keyness主体性、关键性Keywords主题词KWIC/Key Word in Context语境中的关键词、语境共现(方式)KWIC sort语境共现排序、索引行排序Learner corpus学习者语料库Lemma, pl. lemmata/lemmas词目、原形词、词元Lemmatization词形还原、词元化Lemmatizer词形还原工具、词元化工具Lexical bundle词束Lexical density词汇密度Lexical frequency profile词频概貌Lexical grammar词汇语法Lexical item词项、词语项目Lexical patterning词语型式、词汇型式Lexical priming词汇触发理论、词汇启动理论Lexical profile词汇分布概貌Lexical richness词汇丰富度Lexico-grammar词汇语法Lexis词语、词项、词语学Log-likelihood ratio对数似然比、对数似然率Longitudinal/developmental corpus跟踪语料库、发展语料库、历时语料库Machine-readable机读的Machine translation机器翻译Manual annotation手工标注Markup/mark-up标记、置标MDA (Multi-dimensional analysis/approach)多维度分析法Metadata元信息Meta-metadata元元信息MF/MD approach/multi-feature/multi-dimensional多特征/多维度分析法analysisMisuse误用Monitor corpus(动态)监察语料库Monolingual corpus单语语料库Multilingual corpus多语语料库Multimodal corpus多模态语料库MWU/multiword unit多词单位MWE/multiword expression多词表达MI/mutual information互信息、互现信息N-gram N 元组、 N 元序列、 N 元结构、 N 元词、多词序列Neo-Firth (school)新弗斯学派Neo-Firthian新弗斯学派的NLP/Natural Language Processing自然语言处理Node (word)节点(词)Normalization标准化、(翻译)规范化、泛化Normalized frequency标准化频率、标称频率、归一频率Observed corpus观察语料库Ontology知识本体、本体Open choice principle开放选择原则OrthographicOrthography正字法Overuse过多使用、超用、使用过度、过度使用Paradigmatic纵聚合(关系)的Parallel corpus平行语料库、对应语料库Parole linguistics言语语言学Parsed corpus句法标注的语料库、树库Parser句法分析器Parsing句法标注、句法分析Pattern/patterning型式、模式Pattern grammar型式语法Pattern matching模式匹配Pedagogic corpus教学语料库Phraseology短语、短语学Phraseological unit/sequence短语单位 /序列Plain text纯文本POSgram赋码序列、码串POS sequence赋码序列、码串POS tagging/Part-of-Speech tagging词性赋码、词性标注、词性附码POS tagger词性赋码器、词性赋码工具Prefab预制语块Probabilistic(基于)概率的、概率性的、盖然的Probabilistic grammar概率语法、概率性语法、盖然语法Probability概率Query查询、检索Range分布(范围)、跨度Rationalism理性主义Raw frequency原始频数、生频数Raw text/corpus生文本 /生语料Reference corpus参照语料库Regex/RE/RegExp/regular expressions正则表达式、正则式Register variation语域变异Relative frequency相对频率Representative/representativeness代表性(的)Rule-based基于规则的S-universals源语型共性(特征)Sample n./v.样本;取样、采样、抽样Sampling取样、采样、抽样Sanitization净化Search term检索项Search word检索词Segmentation切分、分词Semantic association语义联想Semantic preference语义倾向、语义趋向Semantic prosody语义韵Sentence alignment句对齐、句级对齐SGML/Standard Generalized Markup Language标准通用标记语言Simplification简化Skipgram跨词序列、跨词结构Span跨距Specialized corpus专用语料库、专门用途语料库、专题语料库Standardized type/token ratio标准化类符 /形符比、标准化类/形比、标准化型次比Standardized TTR/STTR标准化类符 /形符比、标准化类/形比、标准化型次比Stand-off annotation分离式标注Stochastic随机的Stop list停用词表、过滤词表Stop word停用词、过滤词Synchronic corpus共时语料库Syntagmatic横组合(关系)的T score T 值T-universals目标语型共性(特征)Tag赋码、标记、附码Tagger赋码器、赋码工具、标注工具Tagging赋码、标注、附码Tag sequence赋码序列、码串Tagset赋码集、码集Tertium comparationis对比中立项、对比基础Text文本Text type文体、文类Text category文体、文类Text mining文本挖掘TEI/Text Encoding Initiative TEI 文本编码计划The Lexical Approach词汇中心教学法The Lexical Syllabus词汇大纲Token形符、词次Token definition/word definition形符界定、单词界定Tokenization分词Tokenizer分词工具Transcription转写Translation memory翻译记忆(库)Translation norms翻译规范Translationuniversals/Universal features of 翻译共性、翻译普遍特征translationTranslational corpus翻译语料库Translationese翻译体、翻译腔Treebank树库Trigram三元组、三元序列、三元结构T-score T 值Type类符、词种、词型TTR类符 /形符比、类 /形比、型次比Type/token ratio类符 /形符比、类 /形比、型次比Underuse少用、使用不足Unicode通用码Unicodify按通用码编码、转换为通用码Unit of meaning意义单位WaC/Web as Corpus网络语料库、网库Wildcard通配符Word alignment词对齐、词级对齐Word form词形Word family词族Word list词表Word sketch词语素描WSD/Word-sense disambiguation词义消歧XML/Extensible Markup Language可扩展标记语言Zipf ’ s Law/Zipfian Law齐夫定律Z score Z 值常用语料库ACE Australian Corpus of EnglishANC American National CorpusARCHER A Representative Corpus of Historical English Registers BASE British Academic Spoken English CorpusBAWE British Academic Written English CorpusBNC British National CorpusBoE Bank of EnglishBrown Brown CorpusCANCODE Cambridge and Nottingham Corpus of Discourse in English CEC China English CorpusCEM Corpus for English MajorsCHILDES Child Language Data Exchange SystemCIC Cambridge International CorpusCLEC Chinese Learners English CorpusCLOB2009 Brown family corpus of British EnglishCOBUILD Collins Birmingham University International Language Database COCA The Corpus of Contemporary American EnglishCOLSEC College Learners Spoken English CorpusCOLT Bergen Corpus of London Teenage LanguageCrown2009 Brown family corpus of American EnglishFLOB Freiburg-LOB Corpus of British EnglishFROWN Freiburg-Brown Corpus of American EnglishHelsinki Diachronic part of the Helsinki Corpus of English Texts DiachroniccorpusHKCSE Hong Kong Corpus of Spoken EnglishICE International Corpus of EnglishICE-GB International Corpus of English: Great BritainICLE International Corpus of Learner EnglishJEFLL Japanese EFL Learner CorpusLCMC Lancaster Corpus Mandarin ChineseLINDSEI Louvain International Database of Spoken English Interlanguage LIVAC Linguistic Variations in Chinese Speech CommunitiesLLC London Lund CorpusLOB Lancaster-Oslo/Bergen CorpusLOCNESS Louvain Corpus of Native English EssaysLONGDALE LONGitudinal DAtabase of Learner EnglishMICASE Michigan Corpus of Academic Spoken EnglishMICUSP Michigan Corpus of Upper-level Student PapersNESSIE Native English Speakers ’Similarly and Identically-prompted EssaysPACCEL Parallel Corpus of Chinese EFL LearnersSBCSAE Santa Barbara Corpus of Spoken American EnglishSCCSD The Spoken Chinese Corpus of Situated DiscourseSCORE Singapore Corpus of Research in EducationSEC Spoken English CorpusSECCL Spoken English Corpus of Chinese LearnersSECOPETS Spoken English Corpus of Public English Test SystemSEU Survey of English UsageSWECCL Spoken and Written English Corpus of Chinese Learners WECCL Written English Corpus of Chinese LearnersLast updated 2012-08-08 by许家金。

语料库语言学术语汇编Aglossaryofcorpuslinguistics

语料库语言学术语汇编Aglossaryofcorpuslinguistics

语料库语言学术语汇编Aglossaryofcorpuslinguistics语料库语言学术语汇编(V2.0)Last updated 2012-10-08 by 许家金Aboutness 所言之事Absolute frequency 绝对频数Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric 字母数字构成的Annotate标注(动词)Annotated text/corpus 标注文本/语料库、赋码文本/语料库Annotation标注(名词)Annotation scheme标注方案ANSI/American National Standards Institute美国国家标准学会ASCII/American Standard Code for Information Exchange美国信息交换标准码Associates (of keywords)(主题词的)联想词AWL/academic word list 学术词表Balanced corpus 平衡语料库Base list/baselist 底表、基础词表Bigram 二元组、二元序列、二元结构Bi-text/bitext双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后的文本)Bi-hapax 两次词Bilingual corpus双语语料库Bootcamp debate/discourse/discussion (新手)训练营大辩论/话语/大探讨CA/Contrastive Analysis 对比分析Case-sensitive/case sensitivity 大小写敏感、区分大小写Category-based approach 基于类(范畴)的方法Chi-square test/χ2 卡方检验Chunk词块CIA/Contrastive Interlanguage Analysis中介语对比分析CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS 词性赋码系统Clean text policy 干净文本原则Cluster 词簇、词丛Colligation 类联接、类连接、类联结Collocate n./v.搭配词;搭配Collocability 搭配强度、搭配力Collocation搭配、词语搭配Collocational strength 搭配强度Collocational framework/frame 搭配框架Collocational profile搭配概貌、管路敷设技术通过管线不仅可以解决吊顶层配置不规范高中资料试卷问题,而且可保障各类管路习题到位。

语料库基本知识

语料库基本知识

.
6
计算语言学
◦ “计算语言学是研究用机器来处理自然语言的学科。它是由信息技
术和语言学交叉而成的”(CuS:1)。SLP没有直接提出计算语言 学的确切定义。SLP的作者在开篇借用了Stanley Kubrick科幻片中 的人物HAL,HAL是一个通晓英语的机器人。作者引入HAL的目 的在于说明,为了构建这样一个可与人通过自然语言进行交流的机 器人,需要哪些知识和技术:语言理解方面有语音识别和自然语言 理解(包括唇读技术),表达方面需要自然语言生成和语音合成, 另外HAL也需要信息检索、信息提取和推理方面的技能。而解决这 些问题一般涉及以下学科:自然语言处理,计算语言学,语音识别 和合成。SLP的作者将这三者合起来称为语音及语言处理,除了以 上HAL所用的这些技能外,SLP也囊括了其他重要的语言处理领域, 如:拼写校正、语法检查和机器翻译。
.
42
语言设定
.
43
.
44
(如逗号、句号等) 包括在内,但这一点有例外,如数字3.1415925 和整数的千分位分隔符(如100,000) 中的逗号等。
为了便于统计,对英语进行分词时通常在以上我们所说的“ 形符” 后加空格,使得他们与文本中的其他形符或符号分离开来。
.
11
类符(type)作为一个统计量,指语料库文本中任何一个独特的词形(word form)。换言之,在一个文本中,重复出现的形符只能记作一个类符。
◦ 都可以对语言学的语音、词汇、句法和语义等层面进行
统计和研究。
.
8
联系: ◦ 统计语言学和计量语言学都是利用统计方法来实现对语言成
分的统计,计量语言学以发现语言成分或语言成分间的数学 规律为目标。而统计语言学以所统计的语言特征在统计学上 显著和不显著为目标。

语言学专业词汇中英文对照版

语言学专业词汇中英文对照版

语言学术语(英-汉对照)表applied linguistics 应用语言学blending混成法A applied sociolinguistics 应用社会语borrowing 借用借词abbreviation 缩写词,略语言学bound morpheme 粘着语素ablative夺格,离格appropriacy 话宜性bounding theory 管辖论accent 重音(符)appropriateness话宜性得体性bracketing 括号法accusative 宾格approximant 无摩擦延续音brevity maxim 简洁准则achievement test 成绩测试aptitude test素质测试bridging 架接acoustic phonetics 声学语音学Arabic阿拉伯语broad tran scripti on 宽式音标acquisition 习得arbitrari ness 任意性broadening 词义扩大acronym缩略语argument 中项中词主目Brown corpus布朗语料库action process 动作过程article 冠词 Cactor动作者articulation 发音calculability 可计算性address form 称呼形式articulator 发音器官calque仿造仿造词语addressee受话人articulatory phon etics 发音语音学can cellability 可删除addresser发话人artificial speech 人工言语cardinal numeral 基数adjective形容词aspect 体cardinal vowel 基本兀音adjunct修饰成分附加语aspirated 吐气送气case 格adverb畐恫assimilation 同化case grammar 格语法affix词缀associative 联想case theory 格理论affixation词缀附加法associative meaning 联想意义category 范畴affricate塞擦音assonance准压韵半谐音categorical component 范畴成分agreeme nt —致关系attributive 属性修饰语定语causative使役的使投动词airstream 气流auditory phon etics 听觉语音学center 中心词alliteration 头韵authe ntic in put 真实投入central determ iner 中心限定词allomorph词/语素变体authorial style 权威风格chain relation 链状关系allophone音位变体authori ng program 编程chain system 链状系统allophonic variation 音位变体aut onomy 自主性choice选择allophony音位变体现象auxiliary 助词choice system选择系统alveolar ridge 齿龈auxiliary verb 助动词circumstanee 环境因子alveolar齿龈音 B class词类ambiguity 歧义babbl ing stage婴儿语阶段class shift词性变换analogical creation 类推造子back-formation 逆构词法clause小句从句anapest抑抑扬格base component 基础部分click吸气音咂音anaphor前指替代behavioural process 行为过程clipping截断法anaphoric reference 前指照应behaviourism 行为主义closed class圭寸闭类animate有生命的bilabial双唇音closed syllable 闭音节annotation 注解bilabial nasal 双唇鼻音cluster 音丛antecedent先行词前在词bilateral oppositi on 双边对立coarticulation 协冋发音anthropological linguistics 人类语言bilingualism双语现象coda结尾音节符尾学bi nary divisio n 二分法code语码信码anticipatory coarticulation 逆化协同bi nary feature 二分特征cognitive psychology 认知心理学发曰binary taxonomy 二分分类学cognitive system 认知系统antonomasia换称代类名binding 制约cohere nee相关关联antonym 反义词binding theory 制约论cohension 衔接antonymy 反义(关系)blade舌叶舌面前部co-hyponym 同下义词appellative 称谓性blank verse 无韵诗colligation 类连结collocative meaning 搭配意义color word 色彩词color word system 色彩词系统comma nd 指令com mon core 共核com mon noun 普通名词com muni cati on 交际com muni cative compete nee 交际能力com muni cative dyn amism, CD 交际性动力com muni cative Ian guage teach ing, CLT 交际语言教学法com muni cative Sentence Patter n, CSP 交际性句子模式com muni cative syllabus 交际教学大纲com muni cative test 交际性测试com muni cative-grammatical approach 交际-语法教学法compact disk 激光盘comparative degree 比较级compete nee 能力complement 补语compleme ntary antonym 互补反义词complementary antonymy 互补反义关系compleme ntary distributi on 互补分布complex predicate 复合谓语component 成分componential analysis 成分分析composite propositi on 复合命题compositionality 复合性compound 复合词复合句comprehension 理解computation 计算computati on al li nguistics 计算语言学computational system 计算系统computer-assisted learning, CAL 计算机辅助学习computer corpus 计算机语料库computer hardware 计算机硬件computer literacy 计算机操作能力computer n etworks 计算机网络computer system 计算机系统computer-assisted instruction, CAI 计算机辅助教学computer-assisted learning,CALL 计算机辅助语言学习conative意动的concept 概念conceptual meaning 概念意义concord —致(关系) concordanee共现关系concrete noun 具体名词concurrent同时发生的conjugation 词形变化conjunct连接副词conjunction 连接词conjunction buttress ing 连接词支撑conno tati on 内涵consequent 跟随成分consonance 辅音韵consonant 辅音con sta nt oppositi on 不变对立constative 表述的con stitue nt comma nd 成分指令con stituent propositi on 成分命题constituentstructure analysis 成分结构分析constituent 成分con struct 编制con structvalidity 编制效度construction 构建constructivism 构建主义content analysis 内容分析conten t validity 内容效度contentword 实义词con text depe ndent 语境依赖的con text of situati on 情景语境con text语境con textual an alyses 语境分析con textualmeaning 语境意义contrastive analysis 对比分析control theory 控制理论con trolled Ianguage 有控制的语言convention 常规规约conventional meaning 常规意义规约意义conventionality常规性规约性conversati onal implicature 会话含义conversational maxim 会话准贝V con verseantonymy 相反反义现象conversion 变换cooperative principle, CP 合作原贝U coordin ate con struct ion 并列结构coord ination并歹U coreferential 互参的coronal舌面前音corpus data语料库语料corpus (plcorpora)语料素材corpus linguistics语料库语言学con text上下文countable可数(名词)coun terfactual propositi on 反事实命题couplet对句对联creativity创造性原创性Creole克里澳尔语混和语cross-cultural communi cati on 跨文化交际cross-linguistic 跨语言的culturally-specific文化特异的curriculum教学大纲customizing 定制的D dactyl扬抑抑格Dani Ian guage 达尼语data retrieval, DR 资料检索database数据库dative (case)与格dative moveme nt 与格移动declarative 陈述句decoding 解码deductive演绎的deepstructure 深层结构defeasibility消除可行性definite 有定的degenerate data 无用的语料deixis指称delicacy精密阶denotation 夕卜延指称dental齿音dentalization 齿音化derivation 彳衍生derivati onal affix 彳衍生词汇derivati onal morphology 派生形态学descriptive adequacy 描写充分性descriptive linguistics 描写语言学designfeature 结构特征determiner 限定词developing grammar 发展语法devia nt 变体deviation偏离变异devoicing清音化diachronic linguistics 历时语言学diachronic历时的diacritic附加符号变音符diagnostictest诊断性测试dialect 方言dialectology 方言学digitized sound数字化语音dimetre 二音步诗行diphthong 二合元音双元音directobject直接宾语direct speech, DS 直接言语direct thought, DT 直接思想direct ion ality方向性discourse语篇话语discourseanalysis语篇分析话语分析discourse interpretatio n 语篇理解discrete分离的离散的discrete-point grammar 离散语法discrete point test 分立性测试disjunction分离关系displacement 移位dissimilatio n 异化(作用)dist in ctive feature 区别性特征distinguisher 辩义成分do-insertion rule do添加规贝U domain 范围领域dorsal舌背音舌中音dorsum舌背(音)doublecomparative 双重比较drill-a nd-practicesoftware 操练软件D-structure D 结构dual双数dualistic view 二分观点duality 二重性E early Modern English 早期现代英语economy经济性简洁性ejective爆发音electronic mail 电子邮件Elizabethan English伊利莎白时期英语ellipsis 省略(法)elliptical sentence structure省略句子结构embedded element 嵌入成分emic位学的emotive感情的empirical经验主义的empirical data经验主义的语料empiricalvalidity 经验效度empiricism 经验主义empty category, EC 空范畴enabling skills使成技能化encoding 编码end rhyme 末端韵en doce ntric con struct ion 内向结构entailment 蕴涵entry con diti on 入列条件epenthesis 插音增音equipolle nt opposition 均等对立equivale nee 相等equivale neereliability 相等信度error analysis 错误分析EST科技英语eth ni city ide ntity 民族认同eth no graphy of com muni cati on 交际民族学etic非位的素的event process事件过程example-based mach ine tran slati on 基于例句的机器翻译exchange error 交换错误exchange sequenee 交际序歹U exchange structure 交际结构exhaustive 穷尽的彻底的existent存在物existential 存在句existential process 存在过程existential quantifier 存在数量词exocentric夕卜向的exoce ntric con struct ion 夕卜向结构experiential 经验的experiential function 经验功能experimental psycholinguistics 实验心理语言学explanatory adequacy 解释充分性explicit grammar instruction, EGI 明显的语法教学法expression minimization 表达最底程度expressive 表达的extended standard theory, EST 扩展标准理论extensive引申的扩展的extent-condition format 程度条件格式exter nal evaluatio n 夕卜部评估external qualifier 外部修饰语extri nsic sources of error 夕卜在的错误来源eye movement 眼部移动Fface validity卷面效度facilitation 便利促进Fasoldfeasibility 可行性feature 特征feedback 反馈felicity con diti on 适宜性条件恰当条件feminine 阴性fiction 小说figurative Ianguage 比喻性语言象征性语言figures of speech修辞手段修辞格finite element 有定成分finite有定的有限的finite state grammar 有限状态语法first-person narrator 第一人称叙述者Firthia n pho no logy 弗斯音系学flap闪音flexibility灵活性变通性floppy disk 软盘focus焦点中心folk etymology 俗词源学民间词源foregrounded features 突出特征foregrounding 突出前景话foreignIanguage teaching 夕卜语教学form形式formal differenee 形式差异formalization 形式化formation 形成formative构形成分构词成分free form 自由形式free in direct speech, FIS 自由间接言语free in direct thought, FIT 自由间接思想free morpheme 自由语素free root morpheme 自由词根语素free variant 自由变体free verse 自由韵文French法语frequency effect 频率效应fricative (摩)擦音frictio n 摩擦front舌面前舌前的fully automatic high quality tran slatio n,FAHQT全自动高质量翻译fun cti on word 功能词function 功能functional grammar 功能语法fun cti on al li nguistics 功能语言学functional sentence perspective, FSP 功能句子观functions of Ianguage 语言功能fusion溶合fuzzy模糊的Ggender differenee 性别差异general linguistics 普通语言学generalisation 概括generative grammar 生成语法generative semantics 生成语言学genitive属格所有格genre体裁语类German德语give n (in formatio n)已给信息global task整体任务glottal 喉音glottal stop 喉塞音goal目标gover nment theory 支配理论government支配己grammatical analysis 语法分析grammatical function ;; grammaticalstructure 语法结构gradable antonymy 分等级的反义关系gradual opposition 渐次对立grammaticalcategory 语法范畴grammatical concept 语法概念grammatical descripti on 语法描写grammatical form 语法形式grammaticalmarker 语法标记grammatical meaning 语法意义grammatical orga ni zati on 语法组成grammatical patter n 语法类型grammaticalprocess 语法过程grammatical rule 语法规贝U grammatical sentence pattern, GSP 语法句形grammatical structure 语法结构grammatical subject 语法主语grammaticalsystem 语法系统grammatical word 语法词graphitic form 文字形式Gricean maximGrice 准贝H group词组guttural 腭音Hhalf-rhyme 半韵hard palate 硬腭head中心词中心成分headed con structi on 中心结构heptameter七音步诗行hierarchical structure 等级结构hierarchical system 等级系统hierarchy等级体系high高(元音)historical linguistics 历史语言学holophrastic stage 单词句阶段homonym 同音/形异议词Hopi Hopi 语horiz on tal relati on 链状关系Horn scale霍恩阶human cognitive system 人类认知系统human Ianguage 人类语言human speech人类言语huma n tran slati on 人译hypercorrect ion 矫枉过正hyponym下义词hyponymy下义关系hypothesis 假设hypothesis-deduction 假设-演绎Iiamb抑扬格iambic pentameter 抑扬格五音步诗行IC an alysis直接成分分析法ICALL (intelligent CALL)智能计算机辅助语言学习ideatio nal (fun ctio n) 概念功台匕冃匕identifying 认同的idiom 成语习语idiomatically-governed 习语支配己的ill-formed sentences 不合适的句子illocutionary act话中行为施为性行为illocutionary force言外作用施为作用imagi native (function)想象功能immediacy assumptio n 即时假定immediate constituent analysis 直接成分分析法imperative rule 祈使规贝U imperative 祈使语气命令的implicate 意含implication 蕴涵含义implicati on conn ective 蕴涵连接implicature 含义言外之意implied meaning 蕴涵意义implosive内破裂音内爆音inanimate 无生命的inclusiveness relation 内包意义indefinite 不定的,无定的indicative陈述式陈述语气in direct object 间接宾语indirct speech, IS 间接言语in direct thought, IT 间接思想Indo-European Ianguages 印欧语言_:言inference 推论推理inference drawing 推论inferen tial com muni cati on 推论交际infinitive 不定式infix中缀in flection屈折(变化)inflectional affix 屈折词缀inflectional morphology 屈折形态学inflective endings 屈折结尾in formati on retrieval 信息检索in formati on structure 信息结构in formative (fun ctio n) 信息功台匕冃匕inn ate ness 先天性inn ate ness hypothesis (语法)天赋假设in put输入in put hypothesis 语言输入说in strume ntal (function) 工具功台匕冃匕integrative test综合性测试intensifier强调成分intensive强调的增强的in teract ional (fun ctio n) 交互功台匕冃匕in terde ntal 齿间音in terface 界面interferenee 干扰in terject ion 感叹词interlanguage 中介语interlingua 国际语interlingual approach 语际法interlocutor 会话者internal evaluati on 内部评估in ternal structure 内部结构international phonetic alphabet, IPA 国际音标in ternet互联网interpersonal 人际的in terpers onal function 人际功台匕冃匕in terpretatio n 解军释interrogative sentence 疑问句intonation 语调in tra-l in guistic relati on 语言内关系intransitive不及物的intrinsic sources of error 错误的内源in variable word 不变词invention 新创词语inversion倒置,倒装IPA chart国际音标图IPS symbol国际音标符号irony讽刺反话isolated opposition 孤立对立Italian意大利语JJapanese 日语jargon黑话行语Jespers on,Otto Johnson & Johnson Johnson Jon es,Daniel K kernel sentence 核心句keyword关键词knowledge 知识known in formatio n已知信息KrashenKruszewski, MikolajKuno, SusumoLlabel标示标记labial唇音labiodental 唇齿音Ianguage 语言Ianguage acquisition device, LAD 语言习得机制Ianguage attitude 语言态度Ianguagechoice 语言选择Ian guage comprehe nsion语言理解Ianguage data语言素材Ianguage learning 语言学习Ianguagemaintenance 语言维护Ian guage processing 语言处理Ianguage structure 语言结构Ianguage system 语言系统Ian guage teaching 语言教学Ianguage universal 语言普遍性Ianguage use语言使用Iangue语言(系统)larynx喉头lateral边音旁流音Latin拉丁语Lati n grammar 拉丁语法lax vowel松元音length长度音长letter字母level层,级,平面Levi nson, Stephe n lexeme词位词素lexical ambiguity 词汇歧义lexical change 词汇变化lexical level 词汇层lexical meaning词汇意义lexical morphology 词汇形态学lexical studies 词汇研究lexical word 词汇词lexicogrammar 词汇语法lexicon词汇词典lexis 词liaison连音连续limerick打油诗line诗行lin ear phono logy 线性音系学linearstructure 线形结构linguistic university 语言普遍性linguistic behaviour 语言行为linguistic behaviour potential 语言行为潜势lin guistic compete nee 语言能力lin guistic con text 语言语境上下文linguistic data 语言素材linguisticdescription 语言描写linguistic determinism语言决定component 形态形态音位学形态音系学change 形态句法论linguistic facts 语言事实lin guistic relativity 语言相对性 linguistic sexism 语言性别歧视 linguistic structure 语言结构 linguistic theory 语言理论 linguisticunit 语言单位 linguistic universal 语言普遍性linguistic variation 语言变异 linguistics 语言学 lip rounding 圆唇化literal language 本义语言 literary stylistics文学文体学 loan translation 翻译借词loanblend 混合借词 loan shift 转移借词 loan word 借词 local area networks, LAN 局域网 locuti on ary act 发话行为,表述性言 语行为 logical component 逻辑成分 logical connective 逻辑连词 logical form component 逻辑式成 分logical form representation 逻辑式表 达 logical formula 逻辑公式 logical function 逻辑功能 logical semantics 逻辑语义学 logicalstructure 逻辑结构 logical subject 逻辑主语 logophoricity 词照应 Lon don School 伦敦学派 long vowed 长元音 loss of sound 语音脱落 loudness 响度M mach inetran slati on机 器 翻译macrolinguistics 宏观语言学 macropropositi on 宏观命题 macrostructure 宏观结构 main clause 主句Mali no wski, Bron islaw man-machine symbiosis 人机共生 manner maxim 方式准贝V manner of articulati on 发音方式marked 标记的 masculine 阳性matalinguistic 元语言学的 material (process )物质过程 mathematical prin ciples 数学原 理maxim 准则maximal on set prin ciple 最大节首辅 音原则 meaningpote ntial意 义 潜势meaning shift 转移 meaning意义mental (processs )思维过程心理过 程 mentalism 心灵主义 message 信息 metafuncti on 元功能 metalinguistic 元语言的 metaphor 隐喻 metathesis 换位(作用) met on ymy 换喻转喻 metre 韵律 metrical patter ning 韵律格式 microcomputer 微机 microprocessor 微处理器 mid 中(元音) mind 思维 mini mal attachme nt theory 最少接触 理论minimal pair 最小对立体 mi ni malist programminimum free form 最小自由形 式 mirror maxim 镜像准贝U mistake 错误 modal subject 语气主语 modal verb 情态动词 modality 情态 modern French 现代法语modification 修饰 modifier 修饰语 monom orphemic 单语素的 monophonemic 单音位的mon ophth ong 单元音 mono syllabic 单音节的Motague grammar 蒙太古语法 mood 语气 morph 形素词素形式 morpheme 语素 词素 形 素morpheme-exchange error 词素交错 误 morphemic shape 词素形状 morphemic structure 词素结构 morphemic tran scripti on词素标morphological change 形态变化morphological rule 形态规贝 U morphology形态学morpho-pho nemic 音位成分morphoph on emics morphoph ono logy morpho-s yn tactical 变化 mother ton gue 母语 本族 语 motivation 动因动机 move (移动) MT 机器翻译 MT quality 机译质量multilateral oppositi on 多边对立 multi-level phono logy 多层 次音系 学 multilingualism 多语制多语现象 Nnarratee 被叙述者narrator 叙述者narrator 'representation of speech acts, NRSA 言语行为的叙述者表 达 narrator'representation of speech,NRS 言语的叙述者表达 narrator'representation of thoughtacts, NRTA 思维行为的叙述者表 达 narrator'representation of thought,NRT 思维的叙述者表达 narrow tran scripti on 窄式音标 narrowing 狭窄化 n asal 鼻音 nasal cavity 鼻腔 n asal sound 鼻音 n asal stop 鼻塞音 nasal tract 鼻道 nasality 鼻音性 nasalization 鼻音化 Nash, Walternative speaker 操本族语者 natural language 自然语言 n aturalistic data 自然语料near-adult grammar 近成人语法 negation 否定否定结构negative 否定的negative interferenee 负面干扰 negative marker 否定标记 negative transfer 负转移 neogrammarian 新语法学家 network 网络n etwork computer 网络计算机 neutralizable opposition 可中立对\立new in formati on 新信息 new stylistics 新文体学 node 节nominal group 名词词组 nominalization 名词化 nominative 主格non-authe ntic in put 非真实语料的输 入 non-contrastive analysis 非对比性分 析 non-conven ti on ality 非规约性non-detachability 非可分离性 non-I in ear pho no logy 非线 性音系 学 non-l in guistic en tity 非语言实体 non-pul monic sound 非肺闭塞音 non-reciprocal discourse 非交替性语 篇 non-reflexive pronoun 非反身代词nonsense word stage 无意义词语阶段non verbal cues非言语提示norm 规范notation system 标写系统notion 意念no ti on al-fu nctional syllabus 意念功能教学大纲noun phrase名词短语noun名词number system 数字系统number数字O object宾语object-deleti on 宾语省略objective case 宾格objectivity 客观性obligatory 强制性observational adequacy 观察充分性abstruction 阻塞OCR scanner光学字符阅读器扫描仪octametre 八音步诗行Old En glish 古英语on e-place predicate 一位谓语on-I ine tran slati on 在线翻译onomatopoeia 拟声词on set节首辅音ope n class开放类open syllable 开音节operational system 操作系统operative可操作性operator 操作词oppositeness relation 对立关系opposition 对立optimal releva nee 最适宜关联option 选择optional可选择的oral cavity 口腔oral stop 口阻塞音ordinal numeral 序数词origin of Ianguage 语言起源orthography 正字法oste nsive com mun icati on 直示交际output 产出overgeneralization 过分法则化Ppalatal腭音舌面中音palatal-alveolar 腭齿龈音palatalizati on (硬)腭化paradigm聚合体paradigmatic relatio n 聚合关系paraphrase 释义意译parole言语part of speech 词类participant 参与者particle小品词语助词particular grammar 特定语的语法partitive 部分的部分格passive tran sformati on 被动转换passive (voice)被动语态pattern drill technique 句型操练法pattern 模式patterning 制定模式pause停顿peak (节)峰perceptual span 感知时距perfectionism 完善主义perfective 完成体performanee test 语言运用测试performanee 语言运用performative (verb) 行事性动词perlocutionary act 话后行为perseverativecoarticulation 重复性协同发音person人称perso nal (fu nctio n)自指性功能pharyngeal卩因头音喉音pharynx 喉头phatic (communion)寒暄交谈交感性谈话phone 音素音子phon ematic unit 音声单位phoneme 音位phonetic alphabet 音标phonetic form component 语音形式部分phon etic similarity 语音相似性phonetic symbol 语音符号phon etictran scriptio n(法)phonetics语音学phono logical an alysis 音位分析phono logical comp onent音位咅B分phono logical level 音系层phono logicalprocess 音位过程phono logical representati on 音位表达phono logical rule 音位规贝U phono logicalstructure 音位结构phono logical system 音位系统phono logical varia nt 音位变体phono logy音系学phrasal verb短语动词phrase短语phrase structure 短语结构phrase structure grammar 短语结构语法phrase structure rule, PS rule 短语结构规则pidgin皮软语洋泾滨语不纯正外语Pitch音咼声调咼低place of articulation 发音部位play剧本plosion 爆破plosive爆破音爆发音plural复数pluralism多元主义plurality复数形式poetic (function)诗学功能poetry诗歌polymorphemic (word)多语词polysyllabic 多音节(词)polysystemicanalysis 多系统分析Portugese葡萄牙语positive transfer 正移转possessive所有的属有的possible grammar 可能语言的语法postalveolar 后齿龈音post-Bloomfieldian linguistics 后布龙菲尔德语言学postdeterminer 后限定词post-structuralistview 后结构主义观占八、、pragmatic inference 语用推论pragmaticroles 语用角色pragmatics 语用学PragueSchool 布拉格派predeterminer 前限定词predicate calculus谓语演算predicate logic 谓语逻辑predicate谓语predicator 谓语(动)词predictivevalidity 预测效度pre-editing预先编辑译前加工prefix前缀pre-modified in put 预修正的入premodifier 前修饰语preposition 介词prepositional calculus 介词演算prepositi onal logic 介词逻辑prepositionalopposition 介词\立prepositi onal phrase 介词语prescriptive 规定式presupposition 前提预设primary cardinal vowel 主要基本元音primary stress主重音第一重音prin ciple ofin formative ness 信息性原则principle of least effort 最省力原则prin ciple of qua ntity 数量原贝U privativeopposition 表非对立表缺对立process 过程producti on error 产生性错误productivity多产性proficiency test 水平测试pro-form代词形式替代形式programming Ianguage 编程语言progressive 进行体progressive assimilation丿顺同化projection rule 投射规则pronominal 代词pronoun 代词pronun ciation 发音pronun ciati on dictionary 发音词典pronun ciati on 发音proportionalopposition 部分对\立propositi on 命题prose style散文风格prosodic analysis节律分析超音质分析psycholinguistics 心理语言学psycholinguistic-socioli nguistic approach心理-社会语言学方法psychological reality 心理现实psychological subject 心理主语psychology of Ianguage 语言心理学psychometric-structuralist approach 心理测定-结构主义法pulmonic sound 肺闭塞音Put on ghua普通话QQ-based implicature基于质量的含义Q-principle质量原则quality 量quality maxim 质量准贝Uquantifier 数量词quantitative analysis 定量分析qua ntitative paradigm 数量变化表qua ntity maxim 数量准贝U quatrain 四行诗Rrange范围rank 级rati on alism 理性主义raw data原始素材R-based implicature 基于关联的涵义reader读者readi ng comprehe nsion 阅读理解realisation 体现recall回忆received pronunciation, R P 标准发音receiver受话者信息接受者recency effect 近期效应recognition 识别recursion 可溯recursive可溯的还原的recursiven ess 递归性reference所指参照referential meaning 所指意义refere ntial theory 所指理论referential 所指的reflected meaning 反映意义reflexive (form)反身形式regional dialect 地域方言register 语域regressive assimilation 逆同化regulatory (function)控制性语言功台匕冃匕relation maxim 关系准则relational opposite 关系对立relational process 关系过程relative clause 关系分句关系从句relative pronoun 关系代词relative unin terruptibility 相对的非间断性releva nee theory 关联理论reliability 信度repetition 重复representational system 表达系统representational 表达实体residue剩余成分restricted Ianguage 限制性语言retrieval process 检索过程retrieval system 检索系统retroflex sound 卷舌音reverserhyme 反陨revised exte nded sta ndardtheory, REST修正扩展标准理论rewritingrules 重写规贝U rheme述位rhetorical skill修辞技能rhyme韵韵角压韵rhythm韵律节奏Roman alphabet letter 罗马字母root词根root morpheme 词根语素round vowel 圆元音R-principle关联原则rule system规则系统rule-based approaches 基于规则的方法rules of Ianguage 语言规贝USsameness relation 相同关系Sanskrit 梵文Sapir-Whorf Hypothesis 萨丕尔-沃夫假设Saussure索绪尔scale of delicacy 精密阶schema图式scheme-oriented Ianguage 面向图式的语言second Ianguage acquisition 第二语言习得secondary cardinal vowel 次要基本元音sec on dary stress 次重音segment 音段selection restriction 选择限制selectionalrules 选择规贝U self-reflexive 自反身sema ntic associati on n etwork 语义关联网络semantic change 语义变化sema ntic comp onent 语义咅B分semantic feature 特征sema ntic in terpretati on 语义解释semanticinterpretative rules 语义解释规则semantic process 语义过程sema ntic represe ntati on 语义表达semantic sentence pattern, SSP 语义句型semantic triangle 语义三角semantics语义学semi-consonant 半辅音semiotic system 符号系统semiotics符号学semi-vowel 半元音sense relation 意义关系sense意义sentence 句子sentencefragments 句子成分sentence meaning 句义sentence memory 句子记忆sentence stress句重音sentence structure 句子结构sentential calculus 句子演算setting 场景sibilant咝擦音sig n符号signified所指受指signifier能指施指simile明喻simulta neity同时性singular 单数situatio nal con text 情景语境situational level 情景层situationalsyllabus 情景教学大纲situational variation情景变异slot空缺social role社会角色socialsemiotic社会符号学socio-cultural role 社会文化角色socioli nguistic study of Ian guage语言的社会语言学研究sociolinguistic studyof society 社会的社会语言学研究sociolinguistics 社会语言学sociologicalapproach 社会学方法soft palate 软腭solidarity 团结sonnet十四行诗sonorant 响音sonority scale 响音阶sound语音soundimage语音图像sound pattern 语音模式sound segment 音段sound system语音系统sound wave 音波speaker ' s meani说话者意义speech言语speech act theory 言语行为理论speechcommunity 言语社团speechcomprehension 言语理解speech event 言语事件speech function 言语功能speechmode言语方式speech organ言语器官speech perception 言语感知speechpresentation 言语表达speech product ion ;言语产生speech research 言语研究speechrole 言语角色speech sound 语音speechsyn thesis 言语合成spelling拼写,拼法splitinfinitives分裂的不定式spoken corpus 口语语料库spoken Ianguage translation 口语翻译spondee扬扬格spoonerism 首音互换斯本内现象spread展元音S-structure表层结构stability稳定性stability reliability 稳定性效度Sta ndard English 标准英语standard theory 标准理论standardization 标准化statistical analysis 统计分析status地位stem词干stimulus 刺激stimulus-response 刺激反应stop闭塞音stored knowledge 储存知识strategicknowledge学习策略知识stratification 层stream of consciousness 意识流stresspattern 重音模式stress重音structuralanalysis 结构分析structural (structuralist) grammar 结构语法structural syllabus结构教学大纲structural test 结构测试structuralism 结构主义structuralist linguistics 结构主义语言学structuralist view 结构主义观点style文体风格stylistic analysis 文体分析stylistics 文体学subcategorize 次范畴subject 主语subject-deletion 主语省略subjective test主观性测试subjectivity 主观性subjunctive mood 虚拟语气subord in ate con structi on 从属结构subord ination 从属substitutability 替代性substitution 替换suffix后缀superlative degree 最高级superord in ate 上坐标词suprasegmental feature 超语段特征surface form 表层形式surface representation 表层表达surface structure 表层结构syllabic structure 音节结构syllabification 音节划节syllable 音节syllabus design教学大纲设计syllabus教学大纲syllogism三段论法symbol符号synchronic (linguistics)共时(语言学) synonym 同义词synonymous 同义的synonymy同义现象syntactic component 句法部分syntactic features 句法特征syn tactic function 句法功能syntactic marker 句法标记syntactic process 句法过程syntactic restriction 句法限制syntactic structure 句法结构syntactical change 变化syntagmatic relation 组合关系syn tax句法system network 系统网络system of sig ns 符号系统system of systems系统的系统systemic(grammar)系统语法systemic-functional Grammar, SFG 系统功能语法Ttacit knowledge默契的知识tagmeme 法位tagmemics法位学tap 一次接触音target Ianguage 目标语言tautology同义反复冗辞template 模块tense vowel 紧元音tense时态test content测试内容test form测试形式testee受试者testing 测试test-retest reliability 一测再测信度tetrameter 四音步诗行text语篇text comprehe nsion 语篇理解text encoding 语篇编码text in terpretati on 语篇解释text style语篇风格textual organization 语篇组织textual语篇功能theme 主位theoretical li nguistics 理论语言学third-person narrator 第三人称叙述者thought prese ntati on 思想表达three-place predicate 三位谓语tone声调音调tongue height 舌高tongue position 舌位tongue tip 舌尖topic主题trace theory 轨迹论traditi onal grammar 传统语法transcribed 标音transcription 音标标音transfer 移转transfer approach 移转法utteranee 语句 uvular 小舌音uvula 小舌 tran sformati on 转换transformation of interrogation 疑问 转换 transformational component 转换咅B 分、transformational grammar 转换 语法 transformational process 转换过程 tran sformati onal rule 转换规贝 U tran sformati on al-ge nerative grammar, TG grammar 转换生成语法 transitivity 及物性 translation 翻译 tree diagram 树形图 trill 颤音 trochee 抑扬格长短格 trope 转喻隐喻 truth con diti on 真值条件 truth value 真值 tu/vous disti nction 你 / 您区别 turn length 话语轮次长度 turn quantity 话语轮次数量 turn-taking 依次发言 two-place predicate 二位谓语 two-word uttera nee 二词话语 typology 类型学 UUn aspirated 不松气的 un derly ing form 底层形式 un derly ing represe ntati on 底层表达 unin terruptibility 非中断性universal grammar, UG 普遍语法 universal quantifier 普遍限量词 universal 普遍现象 universality 普遍性 universals of Ianguage语言的普遍现 象unmarked 未标记的 unrounded vowel 非圆元音 urban dialectology 者E 市方言学 user 用户 user-friendly 方便用户的 utteraneemeaning 语句意义V validity 效度 variable 可变化的 variable word 可变化词 variation 变异 variety 变体语体 velar 软腭音 velarization 腭音化 velum 软口盖 verb 动词 verb phrase 动词短语 verbalcom muni cati on 言语交际 verbal process言语过程 verbiage 言辞 vernacularIanguage education 本地 化教育 vertical relation 选择关系 vocabulary 词汇 vocal cord 声带 vocal organ 发音器官 vocal tract声道 vocative 呼格 voice 语态 voicedconsonant 浊辅音 voiced obstruent 浊塞音 voiced (sound)浊音 voiceless consonant 清辅音 voiceless obstruent 清塞音 voiceless(so und)清音 voicing 浊音化,有声化 vowel glide 元音音渡 vowel 兀音 W web page 网页 Wh-interrogative 特殊疑问句 women register 女性语域 word 词 word class 词类 word formatio n 词语形成 word group 词组 word meaning 词义 word order 词序 working memory system 工作记忆系 统 writi ng 文字writing system 文字系统writte n Ian guage 书面语 writte n text 篇章 XX-bar Theory X-bar 理论 Yyes/no in terrogative 是非问句 yes/no question 是非问句 Zzero form 零形式word recog niti on 词语识另 U word formatio n 词语形成 word-for-word 逐词翻译 wording措辞。

语料库术语汇编

语料库术语汇编

语料库术语汇编1000字1. 语料库 (Corpus):一种语言学研究工具,指一定时间内一定领域内被记录下来的语言使用材料的整合。

2. 词频 (Frequency):指特定词语在语料库中出现的频率。

通常用来研究该词语在不同领域或语言环境下的使用情况。

3. 词汇 (Vocabulary):指一个语言或领域中所涉及的全部词汇。

在语料库研究中,词汇可以从不同的角度进行分类和分析。

4. 标记 (Tagging):是指对语料库中每个词语进行词性和句法结构等标记,使其变得更易于分析。

5. 约定 (Convention):是指研究人员在语料库建设和分析中的一些共同规范,如数据格式、标注方式等。

6. 清洗 (Cleaning):是指剔除语料库中不符合研究要求或不准确的数据,以保证研究的准确性。

7. 分词 (Tokenization):是指将一个连续的文本分割成一个个离散的词语或符号的过程。

分词是语料库研究的基础。

8. 停止词 (Stop Words):指在文本中频繁出现但在分析中往往没有实质意义的词语,如“的”、“和”等。

9. 语法 (Grammar):是指一个语言中的语音、词汇、句法和语用规则等有组织的系统,可以用来解释和生成语言的各种表达。

10. 句法 (Syntax):是指语言中句子的结构和组成规则。

语料库分析中的句法分析可以用来研究语言中的语法规则。

11. 词频分布 (Frequency Distribution):是指一个语料库中各个词语出现的频率分布情况。

通过词频分布可以研究语言中不同词汇的使用情况。

12. 词向量 (Word Vector):是指将词语表示成向量的一种技术。

在语料库研究中,词向量可以用来进行词语分类和聚类分析。

13. 上下文 (Context):是指一个词语在文本中所处的语言环境和意义。

在语料库研究中,上下文分析可以帮助研究人员深入理解词语和语句的含义。

14. 模型 (Model):是指通过统计或机器学习等方法建立的能够反映语言规律或模式的工具或算法。

语料库术语中英对照

语料库术语中英对照

语料库术语中英对照Aboutness 所⾔之事Absolute frequency 绝对频数Alignment (of parallel texts) (平⾏或对应)语料的对齐Alphanumeric 字母数字类的Annotate 标注(动词)Annotation 标注(名词)Annotation scheme 标注⽅案ANSI/American National Standards Institute 美国国家标准学会ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) (主题词的)联想词AWL/Academic word list 学术词表Balanced corpus 平衡语料库Base list 底表、基础词表Bigram ⼆元组、⼆元序列、⼆元结构Bi-hapax 两次词Bilingual corpus 双语语料库CA/Contrastive Analysis 对⽐分析Case-sensitive ⼤⼩写敏感、区分⼤⼩写Chi-square (χ2) test 卡⽅检验Chunk 词块CIA/Contrastive Interlanguage Analysis 中介语对⽐分析CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS词性赋码系统Clean text policy ⼲净⽂本原则Cluster 词簇、词丛Colligation 类联接、类连接、类联结Collocate n./v. 搭配词;搭配Collocability 搭配强度、搭配⼒Collocation 搭配、词语搭配Collocational strength 搭配强度Collocational framework/frame 搭配框架Comparable corpora 类⽐语料库、可⽐语料库ConcGram 同现词列、框合结构Concordance (line) 索引(⾏)Concordance plot (索引)词图Concordancer 索引⼯具Concordancing 索引⽣成、索引分析Context 语境、上下⽂Context word 语境词Contingency table 连列表、联列表、列连表、列联表Co-occurrence/Co-occurring 共现Corpora 语料库(复数)Corpus Linguistics 语料库语⾔学Corpus 语料库Corpus-based 基于语料库的Corpus-driven 语料库驱动的Corpus-informed 语料库指导的、参考了语料库的Co-select/Co-selection/Co-selectiveness 共选(机制)Co-text 共⽂DDL/Data Driven Learning 数据驱动学习Diachronic corpus 历时语料库Discourse 话语、语篇Discourse prosody 话语韵律Documentation 备检⽂件、⽂检报告EAGLES/Expert Advisory Groups on Language Engineering Standards EAGLES⽂本规格Empirical Linguistics 实证语⾔学Empiricism 经验主义Encoding 字符编码Error-tagging 错误标注、错误赋码Extended unit of meaning 扩展意义单位File-based search/concordancing 批量检索Formulaic sequence 程式化序列Frequency 频数、频率General (purpose) corpus 通⽤语料库Granularity 颗粒度Hapax legomenon/hapax ⼀次词Header/Text head ⽂本头、头标、头⽂件HMM/Hidden Markov Model 隐马尔科夫模型Idiom Principle 习语原则Index/Indexing (建)索引In-line annotation ⽂内标注、⾏内标注Key keyword 关键主题词Keyness 主题性、关键性Keyword 主题词KWIC/Key Word in Context 语境中的关键词、语境共现(⽅式)Learner corpus 学习者语料库Lemma 词⽬、原形词、词元Lemma list 词形还原对应表Lemmata 词⽬、原形词、词元(复数)Lemmatization 词形还原、词元化Lemmatizer 词形还原(词元化)⼯具Lexical bundle 词束Lexical density 词汇密度Lexical item 词项、词语项⽬Lexical priming 词汇触发理论Lexical richness 词汇丰富度Lexico-grammar/Lexical grammar 词汇语法Lexis 词语、词项LL/Log likelihood (ratio) 对数似然⽐、对数似然率Longitudinal/Developmental corpus 跟踪语料库、发展语料库、历时语料库Machine-readable 机读的Markup 标记、置标MDA/Multi-dimensional approach 多维度分析法Metadata 元信息Meta-metadata 元元信息MF/MD (Multi-feature/Multi-dimensional) approach 多特征/多维度分析法Mini-text 微型⽂本Misuse 误⽤Monitor corpus (动态)监察语料库Monolingual corpus 单语语料库Multilingual corpus 多语语料库Multimodal corpus 多模态语料库MWU/Multiword unit 多词单位MWE/Multiword expression 多词单位MI/Mutual information 互信息、互现信息N-gram N元组、N元序列、N元结构、N元词、多词序列NLP/Natural Language Processing ⾃然语⾔处理Node 节点(词)Normalization 标准化Normalized frequency 标准化频率、标称频率、归⼀频率Observed corpus 观察语料库Ontology 知识本体、本体Open Choice Principle 开放选择原则Overuse 超⽤、过多使⽤、使⽤过度、过度使⽤Paradigmatic 纵聚合(关系)的Parallel corpus 平⾏语料库、对应语料库Parole linguistics ⾔语语⾔学Parsed corpus 句法标注的语料库Parser 句法分析器Parsing 句法分析Pattern/patterning 型式Pattern grammar 型式语法Pedagogic corpus 教学语料库Phraseology 短语、短语学POSgram 赋码序列、码串POS tagging/Part-of-Speech tagging 词性赋码、词性标注、词性附码POS tagger 词性赋码器、词性赋码⼯具Prefab 预制语块Probabilistic (基于)概率的、概率性的、盖然的Probability 概率Rationalism 理性主义Raw text/Raw corpus ⽣⽂本(语料)Reference corpus 参照语料库Regex/RE/RegExp/Regular Expressions 正则表达式Register variation 语域变异Relative frequency 相对频率Representative/Representativeness 代表性(的)Rule-based 基于规则的Sample n./v. 样本;取样、采样、抽样Sampling 取样、采样、抽样Search term 检索项Search word 检索词Segmentation 切分、分词Semantic preference 语义倾向Semantic prosody 语义韵SGML/Standard Generalized Markup Language 标准通⽤标记语⾔Skipgram 跨词序列、跨词结构Span 跨距Special purpose corpus 专⽤语料库、专门⽤途语料库、专题语料库Specialized corpus 专⽤语料库Standardized TTR/Standardized type-token ratio 标准化类符/形符⽐、标准化类/形⽐、标准化型次⽐Stand-off annotation 分离式标注Stop list 停⽤词表、过滤词表Stop word 停⽤词、过滤词Synchronic corpus 共时语料库Syntagmatic 横组合(关系)的Tag 标记、码、标注码Tagger 赋码器、赋码⼯具、标注⼯具Tagging 赋码、标注、附码Tag sequence 赋码序列、码串Tagset 赋码集、码集Text ⽂本TEI/Text Encoding Initiative ⽂本编码计划The Lexical Approach 词汇中⼼教学法The Lexical Syllabus 词汇⼤纲Token 形符、词次Token definition 形符界定、单词界定Tokenization 分词Tokenizer 分词⼯具Transcription 转写Translational corpus 翻译语料库Treebank 树库Trigram 三元组、三元序列、三元结构T-score T值Type 类符、词型TTR/Type-token ratio 类符/形符⽐、类/形⽐、型次⽐Underuse 少⽤、使⽤不⾜Unicode 通⽤码Unit of meaning 意义单位WaC/Web as Corpus ⽹络语料库Wildcard 通配符Word definition 单词界定Word form 词形Word family 词族Word list 词表XML/EXtensible Markup Language 可扩展标记语⾔Zipf's Law 齐夫定律Z-score Z值。

语料库的专有名词解释

语料库的专有名词解释

语料库的专有名词解释语料库(Corpus)是指按照一定规则建立起来的用于研究语言和文字的大型文本集合。

其主要用途是作为语言学和计算语言学研究的基础,通过对语料库的分析和研究,可以更深入地了解语言的特点和规律。

在现代语言学研究中,语料库已成为一种重要的研究方法和工具。

语料库分类1.文本语料库(Text Corpus):文本语料库是由大量文本组成的语料库,可以包括文学作品、报纸杂志文章、网络文章等。

它能够提供不同领域和不同样式的语言数据,为语言学家和研究者提供了广泛的研究对象。

2.口语语料库(Spoken Corpus):口语语料库主要收集和整理的是真实的口语对话和会话,它可以更真实地反映人们在交流中使用的语言特点。

比如一些跨国公司使用口语语料库来分析和研究客户的需求,以便开发更适应市场的产品。

3.平行语料库(Parallel Corpus):平行语料库指的是两种或多种语言的翻译文本集合,可以用于对比不同语言的语法结构、翻译方法和文化差异等进行研究。

平行语料库在机器翻译和跨语言信息检索中起着重要作用。

4.专门领域语料库(Specialized Domain Corpus):这种语料库主要针对某个特定领域的语言数据,如医学、法律、经济等。

专门领域语料库可以帮助研究人员更好地理解某一领域的特定术语和表达方式,以及该领域中的语言使用习惯。

语料库的应用1.语言学研究:语料库是语言学研究的重要工具之一。

研究者可以通过对语料库中的语言数据进行分析,探索不同语言之间的共性和差异,揭示语言规律和变化趋势。

同时,语料库也可以用于验证和验证语言学理论的有效性。

2.词汇研究:词汇是语言的核心组成部分,语料库可以帮助研究者分析词汇的使用频率、搭配关系、词义演变等。

通过对大规模的语言数据进行统计和比较,可以更准确地了解词汇的含义和用法,对于词汇教学与词汇研究提供了有力的支持。

3.语言技术开发:语料库是训练语言技术模型的重要数据来源,比如自然语言处理、机器翻译、语音识别等。

语言学教程术语索引

语言学教程术语索引

语言学术语〔英-汉对照〕表Glossary and IndexAabbreviation缩写词,略语3.3.1Abercrombie 10.3.2ablative 夺格,离格4.1.1abstractness 抽象性1.3.2accent 重音〔符〕2.4.4;2.4.5accuracy正确性11.6.4accusative 宾格4.1.1achievement test 成绩测试11.6.3acoustic phonetics 声学语音学1.7.1;2.1 acquisition 习得6.1.2acronym 缩略语3.3.1action process 动作过程12.2.3actor 动作者4.4.2;12.2.3addition 添加3.3.2address form称呼形式7.2.3addressee 受话人1.4;9.4.1addresser 发话人1.4;9.4.1adjective 形容词3.1.2;4.1.1;5.5.2adjunct 修饰成分;附加语12.2.3adverb 副词3.1.2affix 词缀3.2.1affix hopping 词缀跳跃4.3.1affixation词缀附加法7.1.4affricate 塞擦音2.4.3;2.4.5;2.9.1agreement 一致关系4.1.3airstream 气流2alliteration 头韵9.3.2;9.3.6allomorph 词/语素变体3.2.4;4.3.1allophone 音位变体2.8allophonic variation 音位变体2.8.3allophony音位变表达象2.8.3alveolar ridge 齿龈2.2alveolar 齿龈音2.4.4;2.4.5ambiguity 歧义4.2.2;4.3.1;6.2.3;8.2.2;8.3.2 ambiguous歧义的5.5.2;6.3American descriptive linguistics 美国描写语言学12.3 American English 美式英语10.3.5American Indian languages 美国印第安族诸语言12.3 American structuralism 美国构造主义10.3.2;12.3 analogical creation 类推造字3.3.1anapest 抑抑扬格9.3.3anaphor 前指替代4.3.3anaphoric reference 前指照应4.3.2Anderson 6.3.1Animal munication system 动物交际系统1.2;1.3 animate 有生命的4.2.1annotation 注解10.3.4;10.3.5antecedent 先行词;前在词4.3.2 anthropological 人类学的12.3.1 anthropological linguistics 人类语言学1.8.3;7.1.1 anticipatory coarticulation 逆化协同发音2.6.1 antonomasia 换称;代类名7.1.4antonym 反义词5.4antonymy 反义(关系) 5.3.2appellative 称谓性4.4.2applied linguistics 应用语言学11applied sociolinguistics 应用社会语言学7.2.4 appropriacy 适宜性11.6.4appropriateness 适宜性;得体性11.2.5 approximant 无摩擦延续音2.4.3;2.4.5Apte 7;7.2.1aptitude test 素质测试11.6.2Arabic 阿拉伯语3.3.1;4.4.1arbitrariness 任意性1.3.1;12argument 中项;中词;主目4.3.3;5.5.2article 冠词3.1.2;4.1.1;4.2.1articulation 发音2.6articulator 发音器官2.4.2;2.4.3articulatory phonetics 发音语音学1.7.1;2.1 artificial speech 人工言语10aspect 体4.1.2aspirated 吐气;送气2.6.2;2.8.2 assimilation 同化2.9.1;3.2.4;3.3.2;6.2.4 associative 联想4.2.1associative meaning 联想意义5.3assonance 准压韵;半谐音9.3.2;9.3.6 Atkinson, A.M. 2.1attributive属性;修饰语;定语4.2.2;12.2.3 auditory phonetics 听觉语音学1.7.1;2.1 Austin, John Langshaw 8.1;8.1.2authentic input 真实投入11.4.2authorial style 权威风格9.4.3authoring program 编程10.1.3autonomy 自主性1.8auxiliary 助词3.1.2;12.4.3auxiliary verb 助动词3.1.2;12.2.3Bbabbling stage婴儿语阶段12.4.1back-formation 逆构词法3.3.1Bally, Charles 9.1Bar-Hillel 10.2.1Barnhart & Barnhart 7.1.4base ponent 根底局部4.3.2;12.4。

corpora名词解释

corpora名词解释

corpora名词解释摘要:1.引言:介绍corpus 的背景和重要性2.定义:解释corpus 的含义和构成3.分类:介绍corpus 的主要类型4.应用:说明corpus 在自然语言处理和语言学研究中的应用5.发展:概述corpus 的发展历程和前景6.结论:总结corpus 的重要性和未来发展趋势正文:【引言】在自然语言处理和语言学研究领域,corpus 起着至关重要的作用。

corpus,即语料库,是一个庞大且具有代表性的文本集合,用于研究自然语言及其规律。

随着计算机技术、人工智能和机器学习等领域的飞速发展,corpus 在学术界和工业界中的地位日益显著。

本文将介绍corpus 的定义、分类、应用和发展趋势。

【定义】corpus 是一个包含大量文本的集合,这些文本来自于不同的来源,如书籍、报纸、网站、电子邮件等。

它们按照一定的标准和比例被筛选、整理和存储,以供研究人员进行自然语言处理、语言学分析和机器学习等应用。

语料库中的文本通常被“tokenize”成词汇或句子,并附加上诸如词性、句法结构、语义信息等注释,以便研究人员进行高效的分析和处理。

【分类】根据来源和用途的不同,corpus 可以分为以下几类:1.通用语料库:包含多种类型的文本,如新闻、书籍、社交媒体等,用于一般的自然语言处理和语言学研究。

2.专用语料库:针对某一特定领域或话题的文本集合,如医学、法律、政治等,用于深入研究和专业领域的应用。

3.平衡语料库:确保各类文本在语料库中的比例适中,以避免分析结果受到偏差的影响。

4.标注语料库:文本中包含详细的注释信息,如词性标注、句法结构标注等,便于研究人员进行精确的分析和处理。

【应用】corpus 在自然语言处理和语言学研究中具有广泛的应用,包括但不限于以下几个方面:1.词汇和语法分析:通过分析语料库中的文本,研究人员可以了解词汇和语法的规律和分布,从而为自然语言处理提供基础数据。

2.机器翻译和语音识别:corpus 为机器翻译和语音识别等应用提供了大量的训练数据,以提高模型的准确性和性能。

Corpora(语料库)

Corpora(语料库)

所以语料库语言学家用一种与自20世纪70 年代在描述翻译研究中推崇的经验主义一 致的方法来研究语言。
At that time, scholars became particularly critical of the use of introspection in translation theory (Holmes 1988:101) and of approaches that viewed translations as idealized, speculative entities, rather than observable facts (Toury 1980a: 79-81).

那个时候,学者都对翻译理论中内省的使 用以及把翻译当成理想化和推测性的实体 而不是可观察事实的方法更批判地看待。
Researchers in CTS now pursue a range of agendas, drawing on a variety of corpus types and processing techniques, and these addressed below, following some more general remarks on corpus design and processing.
of the linguist’ (Stubbs 1996:4).

无论他们用以研究语料库是如何形成的,然而, 所有的语料库语言学都坚持真正数据的首要地位, 正如被检验了的文本那样,比如在口头,书面或 签署行为以一种自然,没有经过语言学家干扰的 情况下出现。
Corpus linguists thus take an approach to the study of language that is consistent with the empiricism advocated in descriptive translation studies since the 1970s.

《英语语言学》术语(英汉对照)表

《英语语言学》术语(英汉对照)表

语言学术语(英-汉对照)表Glossary and Index(备注:因教材改版,部分章节标注等内容有出入。

) Aabbreviation 缩写词,略语3.3.1Abercrombie 10.3.2ablative 夺格,离格4.1.1abstractness 抽象性1.3.2accent 重音(符)2.4.4;2.4.5accuracy 正确性11.6.4accusative 宾格4.1.1achievement test 成绩测试11.6.3acoustic phonetics 声学语音学1.7.1;2.1acquisition 习得6.1.2acronym 缩略语3.3.1action process 动作过程12.2.3actor 动作者4.4.2;12.2.3addition 添加3.3.2address form 称呼形式7.2.3addressee 受话人1.4;9.4.1addresser 发话人1.4;9.4.1adjective 形容词3.1.2;4.1.1;5.5.2adjunct 修饰成分;附加语12.2.3adverb 副词3.1.2affix 词缀3.2.1affix hopping 词缀跳跃4.3.1affixation词缀附加法7.1.4affricate 塞擦音2.4.3;2.4.5;2.9.1agreement 一致关系4.1.3airstream 气流2alliteration 头韵9.3.2;9.3.6allomorph 词/语素变体3.2.4;4.3.1allophone 音位变体2.8allophonic variation 音位变体2.8.3allophony音位变体现象2.8.3alveolar ridge 齿龈2.2alveolar 齿龈音2.4.4;2.4.5ambiguity 歧义4.2.2;4.3.1;6.2.3;8.2.2;8.3.2 ambiguous歧义的5.5.2;6.3American descriptive linguistics 美国描写语言学12.3 American English 美式英语10.3.5American Indian languages 美国印第安族诸语言12.3 American structuralism 美国结构主义10.3.2;12.3 analogical creation 类推造字3.3.1anapest 抑抑扬格9.3.3anaphor 前指替代4.3.3anaphoric reference 前指照应4.3.2Anderson 6.3.1Animal communication system 动物交际系统1.2;1.3 animate 有生命的4.2.1annotation 注解10.3.4;10.3.5antecedent 先行词;前在词4.3.2anthropological 人类学的12.3.1anthropological linguistics 人类语言学1.8.3;7.1.1 anticipatory coarticulation 逆化协同发音2.6.1 antonomasia 换称;代类名7.1.4antonym 反义词5.4antonymy 反义(关系) 5.3.2appellative 称谓性4.4.2applied linguistics 应用语言学11applied sociolinguistics 应用社会语言学7.2.4 appropriacy 适宜性11.6.4appropriateness 适宜性;得体性11.2.5 approximant 无摩擦延续音2.4.3;2.4.5Apte 7;7.2.1aptitude test 素质测试11.6.2Arabic 阿拉伯语3.3.1;4.4.1arbitrariness 任意性1.3.1;12argument 中项;中词;主目4.3.3;5.5.2article 冠词3.1.2;4.1.1;4.2.1articulation 发音2.6articulator 发音器官2.4.2;2.4.3articulatory phonetics 发音语音学1.7.1;2.1 artificial speech 人工言语10aspect 体4.1.2aspirated 吐气;送气2.6.2;2.8.2 assimilation 同化2.9.1;3.2.4;3.3.2;6.2.4 associative 联想4.2.1associative meaning 联想意义5.3 assonance 准压韵;半谐音9.3.2;9.3.6 Atkinson, A.M. 2.1attributive 属性;修饰语;定语4.2.2;12.2.3 auditory phonetics 听觉语音学1.7.1;2.1 Austin, John Langshaw 8.1;8.1.2authentic input 真实投入11.4.2authorial style 权威风格9.4.3authoring program 编程10.1.3autonomy 自主性1.8auxiliary 助词3.1.2;12.4.3auxiliary verb 助动词3.1.2;12.2.3Bbabbling stage 婴儿语阶段12.4.1back-formation 逆构词法3.3.1Bally, Charles 9.1Bar-Hillel 10.2.1Barnhart & Barnhart 7.1.4base component 基础部分4.3.2;12.4。

语料库 入门

语料库 入门

在口语中,start更常用。
语料库的方法基于真实的语言
使用情况,事实胜于雄辩
我们通过对语料库的检索结果进行分析,可以找到很多问 题的答案,例如: “学知识”在英语中是“study knowledge”吗? “快速导航”翻译成“fast guide”对不对? “只为点滴幸福”这句广告语,对应的英文翻译是“Little happiness matters.”吗? 为何“The bad weather set in on Monday.”是正确的, 但“The good weather set in on Monday.”却是错误的?

以上问题也许在词典或语法书这样的工具书中是无法 找到答案的,但语料库能为我们提供方便快捷的解决 方案。 语料库可以辅助EFL学习的各个方面,如词汇、语法、 阅读、语体分析、翻译、口语、写作、测试和西方文 化学习等。
具体来说,本书中语料库辅助 EFL 自主学习的方法 (简称为“语料库方法”)主要指以下三种: (1) 直接在权威的语料库中查询语言和文化现象,如 英 国 国 家 语 料 库 ( BNC ) 和 美 国 当 代 英 语 语 料 库 (COCA); (2) 利用语料库软件进行文本分析,如 AntConc 和 Range; (3) 利 用 其 他 基 于 语 料 库 的 网 站 进 行 学 习 , 如 JustTheWord和Sketch Engine。
语料库语言学常用术语
standardized type/token ratio 标准化类符/形符比 例如,计算每个文本每1000词的 TTR,均值处理,得出STTR
语料库语言学常用术语
Frequencies/occurences(频数,出
现次数) Frequency(频率) 例如每一百万词、十万词中,某单词的 出现次数 常常将某个单词在两个语料库中出现的频 率参照两个语料库的容量,用卡方检验 或对数似然率进行对比,来确定两个语 料库中的该单词的使用上是否有差异
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通用语料库
Genre
语体、体裁
Grammatical patterning
语法型式
Granularity
颗粒度
Hapax legomenon/hapax(pl. hapax legomena/hapaxes)
一次词
Header/Text head
文本头、头文件
Hidden Markov model (HMM)
隐马尔科夫模型、隐马模型
Historical corpus
历时语料库
HowNet
知网
ICTCLAS
中科院汉语分词系统
Idiom principle
习语原则、成语原则
Idiomaticity
习语性、地道程度
CLAWS词性赋码系统
Clean text policy
干净文本原则
Cluster
词丛、词簇
Colligation
类联接、类连接、类联结
Collocaten./v.
搭配词;搭配
Collocability
搭配强度、搭配力
Collocation
搭配、词语搭配
Collocational strength
搭配强度
语料库译学、基于语料库的翻译研究、语料库翻译学、基于语料库的译学研究
Corpus-driven
语料库驱动的
Corpus-informed
语料库指导下的、参考了语料库的
Corpus size
库容
Corpus stylistics
语料库文体学
Co-select/co-selection/co-selectiveness
Category-based approach
基于类(范畴)的方法
Chi-square test/χ2
卡方检验
Chunk
词块
CIA/Contrastive Interlanguage Analysis
中介语对比分析
CLAWS/Constituent Likelihood Automatic Word-tagging System
共选(机制)
Co-text
共文
Data mining
数据挖掘
DDL/Data Driven Learning
数据驱动学习
Dependency
(句法)依存关系
Dice coefficient
Dice系数
Disambiguation
消歧
Diachronic corpus
历时语料库
Discourse
话语、语篇
Collocational framework/frame
搭配框架
Collocational profile
搭配概貌
Collocational network
搭配网络
Comparable corpora
类比语料库、可比语料库
Computational Linguistics
计算语言学
ConcGram/concgram
Bi-hapax
两次词、二次词
Bilingual corpus
双语语料库
Bootcamp debate/discourse/discussion
(新手)训练营大辩论/话语/大探讨
CA/Contrastive Analysis
对比分析
Case-sensitive/case sensitivity
大小写敏感、区分大小写
实证语言学
Empiricism
经验主义
Encoding/Text encoding/Character encoding
字符编码
Error-tagging
错误标注、错误赋码
Explicitation
显化
Extended unit of meaning
扩展意义单位
File-based search/concordancing
Annotated text/corpus
标注文本/语料库、赋码文本/语料库
Annotation
标注(名词)、赋码
Annotation scheme
标注方案、赋码方案
ANSI/American National Standards Institute
美国国家标准学会
ASCII/American Standard Code for Information Exchange
语料库语言学术语汇编(V2.0)
Last updated2015-07-31by许家金
Aboutness
所言之事
Absolute frequency
绝对频数
Alignment (of parallel texts)
(平行或对应)语料的对齐
Alphanumeric
字母数字构成的
Annotate
标注(动词)、赋码
批量检索
Firthian (linguistics)
弗斯(语言学)、弗斯学派的(语言学)
Fisher’s exact test
费舍尔精确检验
Formulaic sequence
程式化序列、套语
Frequency
频数、频率
Frequency list
词频表
General (purpose) corpus
美国信息交换标准码
Associates (of keywords)
(主题词的)联想词
AWL/academic word list
学术词表
Balanced corpus
平衡语料库
Base list/baselist
底表、基础词表
Bigram
二元组、二元序列、二元结构
Bi-text/bitext
双语合璧文本、双语合并文本、双语分行对齐文本(一句源语一句目标语对齐后的文本)
语境韵律
Contingency table
连列表、联列表、列连表、列联表
Co-occurrence/Co-occurring
共现、同现
Corpus Linguistics
语料库语言学
Corpus,pl. corpo基于语料库的
Corpus-based translation studies
Discourse prosody
话语韵律
Documentation
说明文档、文检报告
EAGLES/Expert Advisory Groups on Language Engineering Standards
EAGLES文本规格
Effect size
效应量
Empirical linguistics
框合结构、同现词列
Concord
索引(行)(简略形式)
Concordance (line)
索引(行)
Concordance plot
(索引)词图
Concordancer
索引工具
Concordancing
索引分析
Context
语境、上下文
Context word
语境词
Contextual prosody
相关文档
最新文档