中国口译学习者语料库的副语言标注_标准与程序

合集下载

口译的标准和原则

口译的标准和原则
口译的标准和原则包括以下几个方面：
1. 准确性：口译应尽可能准确地传达讲话者的意思，不掺杂个人理解或加入自己的观点。

口译员应尽力避免翻译错误或误解。

2. 流畅性：口译员应保持良好的口语表达能力和流利的口译技巧，确保信息在翻译过程中的连贯性和流畅性。

3. 中立性：口译员应保持中立的立场，不对讲话内容进行评判或偏颇，尊重不同的观点和立场。

4. 忠实性：口译员应忠实于原始讲话内容，不随意删减或增加信息。

在遇到无法直接翻译的文化差异或难以表达的内容时，可以适当注释或解释。

5. 合适性：口译员应根据具体场合调整口译方式和语言风格，以适应不同的听众群体和环境要求。

6. 专业性：口译员应具备专业的背景知识和丰富的语言技巧，及时更新和提升自己的专业知识和技能。

7. 快速性：口译员应准确抓住讲话者的主旨和要点，及时反应并适时调整自己的翻译速度，保证信息的及时传递。

口译的标准和原则是以准确、流畅、中立、忠实、合适、专业和快速为基础，以确保信息的准确传达和有效沟通。

中国口译学习者语料库的口译策略标注_方法与意义_张威

该语料库是本文作者主持的国家社科基金项目（ 12BYY062 ）的计划研究成果。
①
63
库的口译策略频率、分布、效果的观察与分析，同时为完善口译教学、提高口译实践技能，提供实证数据支撑。二、口译策略研究述评鉴于口译活动（特别是同传）在加工时效、转换程序、信息传递等方面对译员的特殊挑战，口译操作的可能性、口译员的基本素质、口译转换的基本要求等问题一直是口译研究关注的热点为顺利完成口译任务而采取的各种口译策略始终是上（ Pchhacker and Shlesinger 2002 ）。这其中，述问题的关键要素，不仅直接关系口译认知加工程序，影响口译交际效果，更是口译质量分析、口译教学研究的核心内容（ MoserMercer et al． 2000 ）。 2． 1 文献综述 2． 1． 1 口译策略的类别首先，依据工作方式，口译策略在交传、同传、耳语口译、随同口译中的表现各有不同（如交传省略、顺译，而耳语或随同口译重视核心信息强调笔记的规范与译语的组织，同传明确精力分配、的提取与重组），但核心内容基本一致（ Gile 2009 ）。其次，依据口译加工程序，口译策略在理解、记忆、转换、监督等不同阶段表现为不同的“战术 ” （ tactics）（如口译理解策略重视对原文信息结构的判断，口译转换策略强调不同操作技巧）
Gile（ 2009 ： 201 － 215 ； 262 － 263 ）明确了 “战术” （ tactics）与 “策略” （ strategies）的区别。“战术” 指译者在翻译实践过
②
程中处理问题的各种行为，即 “在线” （ online）行动，而 “策略” 指思维中的长期效果，指宏观计划性行为。

口语对话语音语料库CADCC与其语音研究

口语对话语音语料库ＣＡＤＣＣ和其语音研究·李爱军，殷活纲，王茂抹徐波啊宗成庆＇矿中田社会科学院语言研究所，Ⅲ中国科学院自动化研究所摘要口语对话和朗读语麓的差别表现在句法、剐语言学现象、音段和韵律等许多方面，这给口语对话的标注带来新的课题．本文介绍自然口语对话语音语料库ＣＡＤＣＣ（ＣｈｉｎｅｓｅＡｎｎｏｔａｔｅｄＤｉａｌｏｇｕｏａｎｄＣｏｎｖｖｒｓａｔｉｏｎＣｏｒｐｕｓ）和其文字转写，音段以及韵律标注．ＣＡＤＣＣ包括两个子库：电话对话库ｓｅｔｌ和口语对话语篇库ｓｅｔ２．其标注内容包括篇章话题、话轮、韵律和音段的标注．音段标注采用ＳＡＭＰＡ—Ｃ标注系统，韵律标注采用Ｃ－ＴｏＢＩ标注系统．本文还报告了标注结果，如篇章话题的长度，口语话轮出现的模式，插入和叠接现象，韵律结构和朗读语篇的差异等等．１自然口语库ＣＡＤＣＣ语篇（ｄｉｓｃｏｕｒｓｅ）包括朗读语篇和自然口语语篇，又可以分成独白和对话两种形式。

不同形式的语篇具有不同的特性，比如参与的人数、涉及的话题、话轮顺序和话轮长度等等。

我们已经建立了朗读语篇库ＡＳＣＣＤ和独自的自然口语ＣＡＳＳ，并且进行了语音学标注【２】．口语对话语篇库ＣＡＤＣＣ是我们今年开始收集和标注的，我们希望它对言语工程和语音研究会有较大的贡献。

ＣＡＤＣＣ包括两个子库，其中ＳＥＴ１是电话对话库，ＳＥＴ２是正常通道对话库。

表１给出了ＣＡＤＣＣ的详细信息。

ＳＥＴ２中的对话双方是同事或同学．有共同的爱好或话题．谈话内容不限．也就是语篇话题可以自由转换。

其中有８位发音人曾经参加朗读语篇ＡＳＣＣＤ的录音．这样做的目的是为了详细对比朗读和自然口语的各种差异．录音在普通办公室或宿舍进行，对话者身别无线话筒，无线录音设备放置在另外的房间，这样保证了对话双方完全进入自然谈话状态。

每一对发音人的谈话时间在１个小时左右。

２音字转写所有的声音都进行了汉字转写，特别将口语的副语言学和非语言学现象按照表２的符号进行转写例ｌ：Ｂ：我傻ＯＶ＜Ｂ：我印度人Ａ：ＬＡ＜ＬＡ＞ＯＶ＞；例２：Ａ：ＬＥ＜ＭＯ＜嗅ＬＥ＞Ｍ０９；Ｂ：那个就是ＤＳ＜一一ＤＳ＞ｍ子的事儿。

(整理)言语失误标注原1

翻译语料的言语失误标注原则鉴于目前国内的学习者语料库如杨惠中老师和桂诗春老师（CLEC），SWECL(Spoken and written English of Chinese Learners), 大学英语口语语料库（卫乃兴）等所用的标准均为error-tagging system. 为了保持统一和可对比性，便于以后对我国不同类型的英语学习者的语料进行对比，故我们决定采用统一体系，然后在一些不同之处作说明。

CLEC的标注体系“采取两级分类，第一级是大类，每一类里再用数目字细分。

如[cc]为词语搭配不当，[cc1]表示名词和名词的搭配，[cc2]表示名词和动词的搭配，[cc3]表示动词和名词的搭配，等等”这个赋码相对简单合理，易于系统操作。

由于错误标注是手工操作，参与标注的人比较多，如果分类表过于繁复，就难于掌握，届时标注的准确性和连贯性皆难以得到确保。

因此，在实际操作层面，可操作性在很大程度上确定了标注的准确性和统一连关性，也是学习者语料库建库成败的关键。

语语料库标注的一大问题（Hunston, 2003）。

不仅是一如何其他的标注方式如扬达复老师提出的从五个纬度标注，此外，一些错误的类型难以判断，特别是一种错误引起另一种错误，或者错误的本身可以从不同的层面上进行界定，在这种情况下，统一遵循学习者预料的客观性。

作为学习者语料，这是进行中介与对比研究的基础，标注是一项必不可少、又费时费力的浩大工程。

这是进行对比分析的依据，同时也对中介语研究的关键步骤。

同时为了确保标注的正确性和统一性，除对标标注小组成员进行培训，熟悉赋码，还定期会面，讨论标注过程中出现的一些问题，这些讨论一方面有助于统一对某些错误的认识，同时也有助于市的一些分析变得更加深入和丰富。

句子之间的标注以衔接词和连词为主，另一在现有的格式上好操作的标注体现在叙述性人称代词的使用，如。

其他语言层面的标注没有进行，语篇标注的其他层面，如语用角度的言语行为等。

语料库研究选题

语料库研究选题
刊名外语教学与研究
外国语当代语言学
现代外语中国翻译外语与外语教学外语界外语学刊外语教学
CSSCI √ √
√（中文类） √ √ √ √ √ √
北核 √ √ √（语言学类） √ √（语言学类） √ √ √ √
刊名解放军外国语学院学报
外语研究外国语文山东外语教学外语教学理论与实践中国俄语教学中国科技翻译上海翻译外语电化教学中国外语
方法山东外语教学
3.6 语料库语言学与语音研究
高级英语学习者口语音段错误分析：一项基于语料库的研究程春梅，何安平
英语专业学生朗读中话语标记语的韵律模式：一项基于语料库的纵深研究袁咏
英语专业学生朗读中介词突显的研究孙欣平中国学生朗读口语中的英语调型特点研究陈桦中国学生英语朗读中的调群切分模式陈桦英语专业学生朗读中话语标记语的韵律模式——一项基于语料
数据呈现
统计检验
2、研究视角和层次
1）不同水平的学习者比较 2）不同母语背景的学习者比较 3）学习者口语与笔语比较 4）学习者与本族语对比 5）学习者的母语与二语对比
3、基于语料库的研究热点
1）语料库语言学与词汇研究 2）语料库语言学与句法、语义 3) 语料库语言学与话语分析研究 4）语料库语言学与口语研究 5) 语料库语言学与口译研究 6) 语料库语言学与语音研究
实践
[28]基于词块理论的高职英语写作教学 [29]二语学习者学位论文引言中非毗邻式词块的使用特征
外语与外语教学
55篇， CSSCI期刊，北核，A类期刊
28篇，CSSCI，北核
搭配
语料库驱动的语义序列研究——以搭配框架为例外语教学理论与实践

翻译教学语料库的标注及应用_英文_省略_经报道中文翻译及注释语料库_介绍_王惠

ＣｏｎｓｔｒｕｃｔｉｏｎｏｆａｎＯｎｌｉｎｅＰｌａｔｆｏｒｍｆｏｒＣｏｍｕｔｅｒａｉｄｅｄ＊本文为香港城市大学教学发展基金项目 “ －－ｐ／香港城市ＴｅａｃｈｉｎａｎｄＬｅａｒｎｉｎｏｆＢｉｌｉｎｕａｌＷｒｉｔｉｎａｎｄＴｒａｎｓｌａｔｉｎｉｎｂｅｔｗｅｅｎＥｎｌｉｓｈａｎｄＣｈｉｎｅｓｅ（ｇｇｇｇｇｇ） ” 大学项目６的部分成果。０００３０４
·２４６·
— —“ 王惠朱纯深翻译教学语料库的标注及应用 — 英文财经报道中文翻译及注释语料库 ” 介绍
。但这些工具在分析实现形式可预测性不强的文小适中的文本中抽取的语料 ” 因为它们 “ 肯定不能用于深入‘ 分析’ 这些特征，或将整个文本特征时作用有限，（，本置于上下文之中研究 ” 同上）使用这些语料库工具的结果只能让语料库主要 “ （以概率和统计为手段 ” 王克非、黄立波２在翻译研究中发挥作用。除００７：１０１）此之外，更深层次的语料标注、分析则需要人工进行。可喜的是，近年来出现一）、分析语料，如Ｐ如Ｍ句法标注些人工附码帮助处理、ＯＳ标注（ｕｌｔｅｘｔｃｏｒｏｒａｐ（）冯志伟２等。毋庸置疑，这些标注对翻译现象的研究，对某一特定文本类００７型语言及文体特征的考量提供了更为精确有效的考察依据。但是，上述工具在分析和解释方面无能为力，而这对于提高翻提供关于某一翻译现象的系统描述、译教学效率，特别是教学中对特定翻译现象的集中观察、解释与理解以及技巧的训练至关重要。要扩大对应语料库在翻译教学中的作用，可行方法之一就是设计一个语料通过对语料库实行人工标注，使语料库增值。通过这个系统给语料添标注系统，，加的 “ 解释性、语言性 ” 信息（对扩充语料库提供的信息Ｇａｒｓｉｄｅｅｔａｌ．１９９７：２）量以供翻译教学使用具有决定性意义。用于翻译教学的 “ 英文财经报道中文翻译及注释语料库 ” 正是基于此目的创 ‘ 自深深处 ’ 英汉对照版及注释 ” 语料库（的建的。此语料库是 “ Ｚｈｕ＆Ｙｉ２０１０）ｐ延伸和拓展。本文通过介绍该语料库所采用的标注系统和语料抽取工具，探讨特别是语料标注，拓宽语料库在翻译教学中的应用。如何通过语料库建设，２．语料库设计目的本语料库的设计有两个目的。其一，秉承Ｚ的思路，致力于ｈｕ＆Ｙｉ２０１０）ｐ（设计以理论为指导的标注系统，建立可用于深度文本分析的标注系统的方法论；其二，对前者单一译者、单一（文学）语料来源的模式做出补充，为本科和硕士翻译专业的翻译教师提供一个设计案例，探讨如何在保证教学质量的前提下，为推动大班教学、远程翻译教学和学生自主学习提供可操作平台。３．语料库的语料选择 “ 英文财经报道中文翻译及注释语料库 ” 是英汉双语对应语料库。所有语料（均选自《金融时报》的“ 全球经济报道” 栏目２ＦｉｎａｎｃｉａｌＴｉｍｅｓ）００３年中文网站）中的 “ 每日英语 ” 系列，并已获得《金融时报》授权。选择的原因如下：语料提供１随着全球化经济的发展，翻译市场日渐兴旺，但翻译质者在业界的名声和地位：量良莠不齐，而本语料库的建库目的对翻译文本质量提出了较高要求。《金融时

语料库标记与标注以中国英语语料库为例

语料库标记与标注以中国英语语料库为例一、本文概述本文旨在探讨语料库标记与标注的重要性及其在中国英语语料库中的应用。

我们将简要介绍语料库的定义和类型，以及标记与标注在语料库建设中的作用。

接着，我们将以中国英语语料库为例，详细阐述语料库的标记与标注过程，包括标记符号的选择、标注规则的制定以及标注质量的控制等方面。

在此基础上，我们将进一步探讨语料库标记与标注对于语言研究、自然语言处理以及机器翻译等领域的影响和应用价值。

我们将总结当前语料库标记与标注研究中存在的问题和挑战，并展望未来的发展趋势和研究方向。

通过本文的阐述，我们希望能够加深对语料库标记与标注的理解，推动中国英语语料库的建设和发展，为相关领域的研究提供有益的参考和启示。

二、语料库的基本概念与分类语料库（Corpus）是以电子形式存储的语言材料的集合，通常包括文本、音频或视频等形式的语言数据。

语料库语言学是语言学的一个分支，专注于利用语料库进行语言研究。

在语料库语言学中，语料库被视为一种研究工具，可用于描述语言的实际使用情况，揭示语言的规律，以及评估语言教学和自然语言处理的效果。

语料库可以按照不同的标准进行分类。

按照语料库的来源，可以分为原生语料库（native corpus）和编译语料库（compiled corpus）。

原生语料库是直接收集的自然语言文本，如新闻报道、文学作品、社交媒体帖子等。

编译语料库则是由多个不同来源的文本经过整理、清洗和标注后形成的。

按照语料库的内容，可以分为通用语料库（general corpus）和专用语料库（specialized corpus）。

通用语料库包含各种类型的文本，旨在反映语言的整体使用情况。

专用语料库则针对某一特定领域或主题，如医学、法律、科技等领域的语料库。

按照语料库的处理程度，可以分为生语料库（raw corpus）和标注语料库（annotated corpus）。

生语料库是未经处理的原始文本，而标注语料库则对文本进行了各种形式的标注，如词性标注、句法标注、语义标注等。

语料库标记与标注_以中国英语语料库为例_李文中

２０１２年５月第４４卷第３期
外语教学与研究（外国语文双月刊））ＦｏｒｅｉｎＬａｎｕａｅＴｅａｃｈｉｎａｎｄＲｅｓｅａｒｃｈ（ｂｉｍｏｎｔｈｌｇｇｇｇｙ
Ｍａ２０１２ｙＶｏｌ．４４Ｎｏ．３
?
本文涉及的软件系统由该团队韩朝阳负责开发。相关设计及技术思想在团队讨论与研究生课堂
上得到很多启发，特此致谢。此外，相关标记方案也分别由团队各成员负责。
·３３８·
李文中语料库标记与标注：以中国英语语料库为例
入库。、包括文本分类信息（来源、检索日期、类型、状态、标记方案）Ａ．标记模块：、。这些在ＸＭＬ文文本领域（开放标记，可添加）作者信息（开放标记，可添加）＿ ” 、 “ ＿ ” ＿文本信息ｄ文件信息ｆ和“ 位置信息ｌ本中分别组织为 “ ａｔａｉｎｆｏｉｌｅｉｎｆｏｏｃａｌ ” 。ｉｎｆｏ允许以压缩文件格式提交以下文件类型：纯文本、Ｂ．源文本入库模块：音频、视频。ＤＯＣ、ＰＤＦ、ＨＴＭＬ、纯文本文件提交入库。Ｃ．纯文本入库模块：２．２难题与解决方案我们认为，由于文本体裁千差万别，目前的分类标准大多属于定性分类，计所以须由人来判断。但ＸＭＬ是一种非常严谨算机很难自动识别并做出判断，几乎不可能手工添加而不出错，因此这一步由计算机自动完成。软的标记语言，件会把人工添加的信息自动转换为标准的ＸＭＬ文件并进一步处理，这样既保也保证了元信息的信度。同时，考虑到不同类型文本元证了所添加信息的效度，信息的多元性特征，我们设计了８种不同的标记方案，包括著作、一般文件、法律条文、期刊、新闻、论文、杂志和网页。新的标记参数和标记方案可通过修改控制由于分类庞杂，多有交叉和重标记界面的ＸＭＬ文件来添加。对于文本领域，叠，我们对它的标记设计成开放型，使之能够兼容不同的领域分类。语料库标记的作用在于基于类型的研究和分析，基于标记信息，使用者可根据自己的研究目的选择文本或重新组建子语料库并进行检索。对于源格式文本的对应入库问我们的考虑是，原文本中的结构、布局、非文字元素，如插图、链接等都对文本题，我们对格式文本分步进行处的意义理解和分析产生影响。但由于技术的局限，理：第一步，文本对应，即在语料库中把源格式文本与纯文本整体对应，这样使用者在查询语料库时可调出原文本观察。第二步，实现格式文本在统一平台的查询，使用者可选择检索纯文本或原格式文本，如ＤＯＣ、ＰＤＦ与ＨＴＭＬ网页文但相关思想和技术需要进一步探索。第三步，多媒体文件与文本文件对应，本，。并实现双向检索，为此我们开发了多媒体语料库平行定位检索系统（另文讨论）此外，我们还尝试把软件平台与Ｃ开发完成了 “ 开放语料库建设平ＥＣ剥离，（，台” 使之能够满足建设小型语料库的标ＯｅｎＣｏｒｕｓＤｅｖｅｌｏｍｅｎｔＰｌａｔｆｏｒｍ）ｐｐｐ记需求。使用者通过修改控制建库界面的ＸＭＬ文件，就可以设计自己的语料库标记方案，使语料库标记开放化和动态化。尽管各种可用的大中型语料库已有很多，但由于网络时代的文本增长速度极快，语言发展和变化的速度也前所未有，现有的静态语料库已很难满足个人研究者和教师对语料库资源的个性需求。语料库开发向两极发展，一是超大型化，

语料库中熟语标注的基本处理思路和方法

语料库中熟语标注的基本处理思路和方法
基本处理思路：
1. 语料库的数据抽取：语料库中常见的信息形式包括语句、词语对以及对应的表达式标记；
2. 进行数据标注：将句子中的每个词语标记上正确的类别；
3. 数据分类：按照表达式类别，将语料库中的信息分类；
4. 分析记录：将所有被标记的数据进行归类，并整理出各个类别的主要特点；
5. 生成规则：根据分析记录，提取出规律性的模式，从而生成规则；
6. 验证结果：测试结果，对研究结果进行检验验证。

处理方法：
1. 语料库分类：按照词汇或句子类别将语料库进行分类；
2. 命名实体识别：通过词性标注、抽取关键词字根的的方法等将句子或文本中的实体信息抽取出来；
3. 模式相似度对比：根据相似模式进行对比，给出和语料库里相似的表达式；
4. 语义分析：对语料库内容进行语义分析，抽取出语句中的隐含信息暗示的概念；
5. 模糊查询：对文本的每个单词进行模糊查询，将查询到的所有结果列出来，进行筛选处理；
6. 标准语料库建立：把属于同一表达式标注的数据以及可能归属于同一表达式标注的数据放入一个标准语料库中。

CLEC中国英语学习者语料库

CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词，并对言语失误进行标注。

其目的就是观察各类学生的英语特征和言语失误的情况，希望通过定量和定性的方法对中国学习者英语作出较为精确的描写，为我国学生的英语教学提供有用的反馈信息。

言语失误标注原则1.简单合理，易于系统操作。

参与标注的人比较多，分类表过于繁复，就难于掌握。

我们采取两级分类，第一级有11类：词形（fm）、动词短语（vp）、名词短语（np）、代词（pr）、形容词短语（aj）、副词（ad）、介词短语（pp）、连词（cj）、词汇（wd）、搭配（cc）、句子（sn）。

每一类里再用数目字细分。

如[cc]为词语搭配不当，[cc1]表示名词和名词的搭配，[cc2]表示名词和动词的搭配，[cc3]表示动词和名词的搭配，等等。

2.分类表的类别要适中。

过粗容易统一，但信息太少，不利于分析学习者的失误/过细难以统一，容易把同一种失误归到不同类别。

目前我们采取的办法是对常见的失误从细（如vp和np都有9小类），对少见的失误从粗（如cj只有两小类）。

现在的分类表有61个失误码，是属于中等规模的分类表。

提供足够的失误信息（失误本身、失误类型和失误发生范围）。

例如In the past, people are [vp6, 4-] kind to each other…, 失误用方括号表示，放在失误之后。

[vp6]为vp（动词）第6种（时态）失误，4-为失误发生的范围，-表示失误的位置，4表示失误前有4个词。

要联系这4个词，才能判断are这个词用错了。

开放性。

容许研究者根据需要对失误类型进行补充或进一步再分出细类。

例如[sn8]为句子结构有缺陷，研究者可以对这种失误再分为若干细类来研究。

这需要把sn8的失误全部检索出来，然后定出第三级的分类范畴，如sn81，sn82，等等。

5.对语体或失误的来由暂不作标注，因为这需要标注者较多的主观判断，更难以统一。

中国英语学习者语料库CLEC(桂诗春杨惠中)

中国英语学习者语料库CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词，并对言语失误进行标注。

表1 CLEC语料分布类型词次ST2 208088ST3 209043ST4 212855ST5 214510ST6 226106总计1070602言语失误标注原则1.简单合理，易于系统操作。

参与标注的人比较多，分类表过于繁复，就难于掌握。

每一类里再用数目字细分。

如[cc]为词语搭配不当，[cc1]表示名词和名词的搭配，[cc2]表示名词和动词的搭配，[cc3]表示动词和名词的搭配，等等。

2.分类表的类别要适中。

过粗容易统一，但信息太少，不利于分析学习者的失误/过细难以统一，容易把同一种失误归到不同类别。

目前我们采取的办法是对常见的失误从细（如vp和np都有9小类），对少见的失误从粗（如cj只有两小类）。

现在的分类表有61个失误码，是属于中等规模的分类表。

提供足够的失误信息（失误本身、失误类型和失误发生范围）。

例如In the past, people are [vp6, 4-] kind to each other…, 失误用方括号表示，放在失误之后。

[vp6]为vp（动词）第6种（时态）失误，4-为失误发生的范围，-表示失误的位置，4表示失误前有4个词。

要联系这4个词，才能判断are这个词用错了。

开放性。

容许研究者根据需要对失误类型进行补充或进一步再分出细类。

例如[sn8]为句子结构有缺陷，研究者可以对这种失误再分为若干细类来研究。

《2024年口译语料库驱动下的口译副语言现象研究》范文

《口译语料库驱动下的口译副语言现象研究》篇一一、引言随着全球化的快速发展，口译作为一种特殊的语言交际方式，越来越受到广泛关注。

其中，口译副语言现象在口译实践中具有重要的研究价值。

口译副语言是指除基本语言之外，用于辅助传达信息、表达情感和姿态的额外语言元素。

本文以口译语料库为驱动，对这一现象进行深入研究。

二、口译语料库的构建与作用首先，我们构建了一个高质量的口译语料库。

该语料库包括大量真实的口译实例，涵盖了各种场景和主题。

通过这些语料，我们可以系统地分析口译过程中的副语言现象。

口译语料库的构建对于研究副语言现象具有重要意义。

首先，它为研究者提供了丰富的数据资源，使得研究更具针对性和深入性。

其次，通过对比和分析不同实例，我们可以发现副语言现象的规律和特点，为口译实践提供指导。

三、口译副语言现象的分类与特点根据口译实践中的实际表现，我们将口译副语言现象分为以下几类：体态语言、语气与音调、修辞技巧、表情符号等。

（一）体态语言体态语言是口译副语言中最为显著的部分。

包括肢体动作、面部表情和眼神交流等。

这些动作可以辅助传达信息，帮助听者更好地理解。

（二）语气与音调语气与音调是传达信息的重要手段。

通过调整语气和音调，口译员可以更好地表达情感和态度，使信息更具说服力。

（三）修辞技巧修辞技巧是口译中常用的副语言手段。

包括比喻、排比、反问等修辞手法，可以增强语言的表达力和感染力。

（四）表情符号表情符号是一种非语言的表达方式，通过面部表情和肢体动作等来传达信息。

在口译中，表情符号可以帮助传达更丰富的信息，提高沟通效果。

四、口译语料库驱动下的副语言现象分析基于构建的口译语料库，我们深入分析了各类副语言现象在口译实践中的应用和作用。

通过对比和分析不同实例，我们发现：（一）体态语言在口译中具有辅助传达信息的作用。

肢体动作和面部表情可以帮助听者更好地理解翻译内容，提高沟通效果。

（二）语气与音调的合理运用可以增强信息的表达力和感染力，使翻译更加生动形象。

中国口译学习者语料库的副语言标注：标准与程序

（熊金才、孙丽霞，２００１；田华、宋秀莲，２００７）。
狭义副语言可分为五类：个人音质符（包括音色、
译口语化特征进行大规模描述与分析（陈菁、符荣波，２０１４），影响对口译加工过程的全面认识，也不利于口
面的特殊性，口译语料库的建设是学界公认的难题，目
２口译副语言研究综述
２．１ Leabharlann 副语言的定义与范围副语言一般可分狭义、广义两类。狭义 “ 副语言 ”
前国内外口译语料库不仅规模较小、种类较少，而且语料标注没有充分体现口译的口语化特征（副语言是其主要表现）（胡开宝、陶庆，２０１０；张威，２０１２ｂ），语料库口译研究也受此牵连，多为对口译文本特征的描述、对
到伴随、替代、证明或否定的作用，在单语交际及跨文
作者简介：张
威：男，博士，教授，博士生导师。主要研究方向：功能语言学、翻译理论与教学。
收稿日期：２０１４．０８．１０
基金项目：本研究得到以下项目资助：国家社科基金一般项目“ 中国１３＇译学习者语料库的研制与应甩 ” （１２ＢＹＹ０６２）；全国优秀博士学位论文作者专项资金资助项目“ 大型汉英／英汉口译语料库的创建及应用研究（１） ” （２０１０１４）；教育

口译语料库在口译教学中的应用

语言文学研究口译语料库在口译教学中的应用徐谦谦(上海应用技术大学外国语学院，上海201418)摘要：基于口译语料库的研究方法是口译研究的一种主8方法，借助语料库研究方法研究口译教学具有重大意义。

本文从口译教学特点及当前口译教学存在的问题出发，探究口译语料库在提供口译训练材料、辅助口译译前准备、辅助口译记忆训练等方面的具体应用。

关键词：口译语料库口译教学口译记忆训练1.引言语料库口译研究始于,1998年Shlesinger发文"Corpus-Based Interpreting Studies as an Offshoot of Corpus-Based Translation Studies"。

Shlesinger在文中提出可以借鉴语料库语言学对词汇密度、语篇特征、类符-形符比等描写手段及语料库翻译学利用平行语料库和可比语料库的方法开展口译研究。

国际知名出版公司Peter Lang出版了迄今第一本语料库口译研究专题论文集《拓荒语料库口译研究｝(Breaking Ground in Corpus-Based Interpreting Studies)(陈菁，2014)。

目前国外已建成两个大型口译语料库即日本名古屋大学建立的CIAIR口译语料库和意大利博洛尼亚大学建立的EPIC (欧洲议会口译语料库)。

国外研究建型专门用途口译语料库，如Meyer(2008)建立K6语料库来研究交传和同传中对人名的；Petite(2008)建立语料库专门研究同传中的纠正机制(Repair Mechanism)；Cencini(2000)建立电视口译语料库(Television Interpreting Corpus)；Fumagalli(1999-2000)建类比和对应语料库研究英一意时事特点。

甲芳(2017)出目前国已建成的个口译语料库：外国语大学文秋芳教授及其团队建立PACCEL-S(Parallel Corpus of Chinese EFL Learners-Spoken)；上海交通大学胡开宝及其团队建立CECIC(Chinese English Conference Interpreting Corpus)(包括三个库：会汉英平行语料库、会英语语料库、英平行语料子库)；香港理工大学及其团队建立BICCSL(Hong Kong Bilingual Interpreting Corpus on Contem porary Social Life)；英国利大学及建立CEIPPC(Corpus of Chinese-English Interpreting for Premier' s Press Conference)(后来被拓展为CEICO(Chinese-English Interpreting Corpus Online))o国内外文，基于语料库的口译研究具在类口译语料库建应用、口译语料库研究方法、口译和、口译语料写和方法、于建口译语料库进行口译语言特征和口译、口译教学等方。

中国翻译协会标准语料库通用技术规范

中国翻译协会标准T/TAC x—xxxx 语料库通用技术规范General specifications for corpus（征求意见稿）2018-xx-xx发布2019-xx-xx实施中国翻译协会发布前言中国翻译协会是包括翻译与本地化服务、语言教学与培训、语言技术工具开发、语言相关咨询业务在内的语言服务行业的全国性组织。

制定语言服务规范，推动行业有序健康发展，是中国翻译协会的工作内容之一。

近年来，随着人工智能、语言服务、学术研究和语言教学的发展，语料库交易活动日益活跃。

为了更好地规范语料库交易市场，推进语料库在人工智能和语言服务、学术研究及其他相关领域中的应用，特编制《语料库通用技术规范》。

本规范起草单位：上海交通大学、北京大学、北京外国语大学、中国人民解放军外国语学院、同济大学、东南大学、南京师范大学、浙江大学、浙江财经大学、中国社会科学研究院、中国标准化研究院、中译语通科技股份有限公司、阿里巴巴（中国）网络技术有限公司、华为技术有限公司、传神语联网网络科技股份有限公司、北京中译天凯教育服务有限公司、成都优译信息技术股份有限公司、杭州中语科技有限公司、苏州联跃科技有限公司等机构的专家共同起草。

本规范主要起草人：胡开宝、杨平、罗慧芳、张雪涛、陈圣权、吴永波、谢凝、彭成超、许文胜、李爱军、梁红丽、王海涛、王海波、李洁、潘轶岑、何征宇、刘四元、蔡方仁、俞敬松、高志军、张威、程乐、严志军、黎昌抱、易绵竹、毕玉德、郭庆、管新潮、田绪军、李婵、李晓倩、胡昂、任才淇等。

本规范按照GB/T 1.1—2009给出的规则起草。

本规范由中国翻译协会提出并归口。

目录1. 适用范围 (1)2. 规范性引用文件 (1)3. 术语与定义 (1)4. 建设与加工 (7)4.1 建设流程 (7)4.2 语料采集 (8)4.3 语料预处理 (8)4.4 语料标注 (8)4.5 语料对齐 (9)4.6 语料库生成 (9)5. 管理与维护 (9)5.1 语料的分类 (9)5.2 语料库的分类 (9)6. 交易与共享 (10)6.1 语料库描述 (10)6.2 语料库评价 (11)6.3 语料库交易 (15)附录：参考文献 (16)1. 适用范围本标准侧重于描述并规定语料库的建设与加工、管理与维护、交易与共享。

《2024年口译语料库驱动下的口译副语言现象研究》范文

《口译语料库驱动下的口译副语言现象研究》篇一一、引言口译作为语言交流的重要桥梁，在跨文化、跨语言的交际过程中起着举足轻重的作用。

而随着信息技术和大数据的迅猛发展，语料库方法逐渐被应用于口译研究中。

口译语料库不仅可以提供丰富多样的翻译语料，还可用于分析和揭示口译副语言现象。

本文旨在探讨口译语料库驱动下的口译副语言现象，分析其特点、规律及影响。

二、口译副语言现象概述口译副语言现象是指在口译过程中，除了主要的语言翻译外，还伴随着一些非语言性的表达方式，如肢体语言、面部表情、语气变化等。

这些副语言现象对口译的准确性和流畅性起着重要作用。

然而，由于副语言现象的复杂性和多样性，传统的口译研究方法难以全面揭示其特点与规律。

因此，本文尝试借助口译语料库进行深入研究。

三、口译语料库的构建与应用1. 构建：为了全面收集和分析口译副语言现象，我们构建了一个大规模的口译语料库。

该语料库包含了多种语言、多种类型的口译案例，涵盖了政治、经济、文化等多个领域。

同时，我们还采用了先进的语音识别和文字转录技术，将口译过程中的语音和文字信息转化为可分析的数据。

2. 应用：在构建了语料库的基础上，我们利用计算机辅助分析方法对语料库进行深入分析。

通过对副语言现象的识别、提取和分析，我们可以更全面地了解其特点和规律。

同时，我们还采用了定量和定性相结合的方法，从多角度揭示了副语言现象对口译效果的影响。

四、口译副语言现象的特点与规律通过分析和研究，我们发现口译副语言现象具有以下特点：1. 多样性：副语言现象涉及多种非语言性表达方式，如肢体语言、面部表情、语气变化等。

这些表达方式在口译过程中相互交织、相互影响。

2. 动态性：副语言现象是动态变化的，随着口译任务的不同和场景的变化而发生变化。

例如，在紧张或复杂的任务中，副语言现象可能更加丰富和复杂。

3. 辅助性：副语言现象对口译的准确性和流畅性起着辅助作用。

通过合理的运用副语言现象，可以提高口译的效果和质量。

语料库标注说明

语料库标注说明“HSK动态作⽂语料库”语料标注及代码说明“HSK动态作⽂语料库”从字、词、句、篇、标点符号等⾓度，对所收⼊的作⽂语料中存在的外国⼈使⽤汉语的中介语偏误进⾏全⾯标注。

1 、字处理（包括标点符号）[C]：错字标记，⽤于标⽰考⽣写的不成字的字。

⽤[C]代表错字，在[C]前填写正确的字。

例如：地球[C]（“球”是错字）、这[C]。

[B]：别字标记，⽤于标⽰把甲字写成⼄字的情况。

别字包括同⾳的、不同⾳⽽只是形似的、既不同⾳也不形似但成字的等等。

把别字移⾄[B]中B的后⾯，并在[B]前填写正确的字。

例如：提[B题]⾼、考虑[B虎]。

[L]：漏字标记，⽤于标⽰作⽂中应有⽽没有的字。

⽤[L]表⽰漏掉的字，并在[L]前填写所漏掉的字。

例如：后悔[L]，表⽰“悔”在原⽂中是漏掉的字。

农[L]药，表⽰“农”在原⽂中是漏掉的字。

[D]：多字标记，⽤于标⽰作⽂中不应出现⽽出现的字。

把多余的字移⾄[D]中D的后⾯。

例如：我的[D的]，表⽰括号中的“的”是多余的字（原⽂中写了两个“的”）。

[F]：繁体字标记，⽤于标⽰繁体字。

把繁体字移⾄[F]中F的后⾯，并在[F]前填写简体字。

例如：记忆[F憶]、单{F單}纯、养{F養}分{F份}。

注意：1）繁体字标记标⽰的是使⽤正确的繁体字，如果该繁体字同时⼜是别字，则先标繁体字标记，再标别字标记。

例如：俭朴[F樸[B僕]]。

2）繁体字写错了，标为：后[F後[C]]。

[Y]：异体字标记，⽤于标⽰异体字。

把异体字移⾄[Y]中Y的后⾯，并在[Y]前填写简体字。

例如：偏[Y徧]、沉[Y沈]。

[P]：拼⾳字标记，⽤于标⽰以汉语拼⾳代替汉字的情况。

把拼⾳字移⾄[P]中P的后⾯，并在[P]前填写简体字。

例如：缘[Pyúan]分、保护[Phù]。

[#]：⽆法识别的字的标记，⽤于标⽰⽆法识别的字。

每个不可识别的字⽤⼀个[#]表⽰。

例如：更[#][#]保存⾃⼰的⽣命，……[BC]：错误标点标记，⽤于标⽰使⽤错误的标点符号。

CLEC中国英语学习者语料库

CLEC中国英语学习者语料库CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词，并对言语失误进行标注。

表1 CLEC语料分布类型词次ST2 208088ST3 209043ST4 212855ST5 214510ST6 226106总计 1070602言语失误标注原则1. 简单合理，易于系统操作。

参与标注的人比较多，分类表过于繁复，就难于掌握。

我们采取两级分类，第一级有11类:词形(fm)、动词短语(vp)、名词短语(np)、代词(pr)、形容词短语(aj)、副词(ad)、介词短语(pp)、连词(cj)、词汇(wd)、搭配(cc)、句子(sn)。

每一类里再用数目字细分。

如[cc]为词语搭配不当，[cc1]表示名词和名词的搭配，[cc2]表示名词和动词的搭配，[cc3]表示动词和名词的搭配，等等。

2. 分类表的类别要适中。

过粗容易统一，但信息太少，不利于分析学习者的失误/过细难以统一，容易把同一种失误归到不同类别。

目前我们采取的办法是对常见的失误从细(如vp和np都有9小类)，对少见的失误从粗(如cj只有两小类)。

现在的分类表有61个失误码，是属于中等规模的分类表。

提供足够的失误信息(失误本身、失误类型和失误发生范围)。

例如In the past,[vp6, 4-] kind to each other…, 失误用方括号表示，放在失误people are 之后。

[vp6]为vp(动词)第6种(时态)失误，4-为失误发生的范围，-表示失误的位置，4表示失误前有4个词。

要联系这4个词，才能判断are这个词用错了。

开放性。

容许研究者根据需要对失误类型进行补充或进一步再分出细类。

例如[sn8]为句子结构有缺陷，研究者可以对这种失误再分为若干细类来研究。

面向计算机辅助正音的汉语中介语语音语料库的创制与标注

[收稿日期]2009-03-10[作者简介]曹文,博士,北京语言大学对外汉语研究中心副教授,主要研究语音学和对外汉语教学;张劲松,博士,北京语言大学对外汉语研究中心和信息科学学院教授,主要研究语音识别和计算机辅助语音教学。

*本研究得到了教育部人文社科基地重大项目07JJD740060、北京语言大学科研规划项目08WT01及青年骨干教师项目资助。

面向计算机辅助正音的汉语中介语语音语料库的创制与标注*曹文1 张劲松1,2(11北京语言大学对外汉语研究中心北京 100083;21北京语言大学信息科学学院北京 100083)[摘要]本文介绍面向计算机辅助正音的汉语中介语语音语料库的创制思路与标注方法。

该库包括单音节、双音节、三音节、四音节、句子和语段六个子库。

它最大的特点是在声母、韵母、声调及语调等方面进行了偏误标注。

对声母、韵母,它将提供中介语发音人在发音部位和P 或发音方法上的偏误信息;对声调、语调,它将提供声调特征点、调核、边界调、停延P 间断等方面的偏误信息。

这些信息将为汉语CAPL 系统提供可靠、实用的正音线索。

[关键词]对外汉语教学;语音;语料库;计算机辅助语音学习(C APL)[中图分类号]H195[文献标识码]A[文章编号]1003-5397(2009)04-0122-10The Construction of a CAPL ChineseInterlanguage Corpus and Its AnnotationC AO Wen ,Z HANG JinsongAbstract :This paper describes the design and annotation of a Chinese InterlanguageCorpus for Computer Assisted Pronunciation Learning (CAPL).The corpus is created in twosteps differing in number of the samples.It is composed of six sub -corpora:the one ofmonosyllables,the one of disyllables,the one of tr-i syllables,the one of quarter -syllables,theone of sentences and the one of paragraphs.Analysis of the errors in initials,finals,tones andintonations are presented by certain labels in the corpus.The data of the corpus can provideerror information and also clues to making right pronunciation.Keywords :Teaching Chinese as a Foreign Language;corpus;phonetics;CAPL2009年11月第4期语言文字应用Applied Linguistics Nov.,2009No.4引言学好语音是学好一门外语的基础。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

从 20 世纪 80 年代起，基于上述实证数据，研究人员开始从理论层次上认识非语言信息在口译操作中的 Mercer，1994 /2002 ； Alex作用（ Lang，1978 ； Moserieva， 1997 /2002 ； Wadensj， 2001 ）。 Stenzl 于 1983 年提出“翻译交际模型 ” 首先，（ communicative model ）（转引自 Pchhacker， 2004 ： 9495 ）， “口译交际流动” （ communicative flow of 突出了 interpreting）的概念，最早论述了口译员接受原语语言同时强调了译语副语言信息的及副语言信息的过程，特点。其次，非语言现象成为社会语言学、心理语言学与，使口译副语言研究具备多学科、口译研究的“接口 ” 118 ；鲍刚，2005 ），跨学科的特点（刘宓庆，2003 ： 117口译情景是一种典型的社会公共交际行为，口译信息包括三个基本成分：语言、副语言、身势语（ kinesics ），三者相互作用，共同构成真实情景下实际交际语言，因交际心理学、话语分析等视角进此应该从社会语言学、 1987 /2002 ； Jacobson， 2009 ）。行分析解读（ Poyatos， 2． 3 口译副语言研究的不足（ 1 ）研究规模与影响有待提高个别的口译副语言迄今依然处于学界边缘地带，呼吁或尝试远未形成学术研究的规模效应，既无法产生大规模数据基础，更难以产生有普遍意义的结论（ Pchhacker， 2004 ： 202 ）。（ 2 ）研究方法有待系统化、科学化个人体悟，基于口译实践相关探索多为经验总结、的实证性定量研究为数较少，更缺乏大规模客观数据支持，研究方法与程序的参照意义并不明显，严重影响了数据及结论的代表性，其突出表现是部分研究数据规模小（如 Shlesinger （ 1994 ）仅分析了一段 90 秒的口译材料），而且结论相互矛盾（详见： 2． 2． 2 ）。（ 3 ）研究层次有待深化首先，相关研究均为对口译副语言的特点、性质、类别、效果的印象式描述与理论性阐释（ Poyatos， 1987 /2002 ），不仅实证数据支撑不足，而且各种副语言现象的标准化分析方法与程序尚未严格界定（如停顿的时间、发言的速度、音量的高度等），不利于具体研究数据的对比分析与后续研究的跟踪考察。其次，没有充分考虑口译工作方式与环境对口译副语言形式与功效的影响，不利于对口译表达特点的整体认识。如，同传、交传在加工负荷、操作程序、策略
张威：中国口译学习者语料库的副语言标注：标准与程序应用、效果评价等方面均存在差异，其副语言表现应该有所不同，须区别等待?。最后，由于上述研究规模、方法、层次等方面的缺目前尚未就口译副语言“普遍性 ” 或“口译风格 ” 陷，（ interpreting style）进行系统探索。而译员口语表达特（ interpreting universals ）研究的一色是口译“普遍性 ” 2011 ），个自然组成部分（胡开宝，应该成为对翻译“普遍性” 探索的一个有益补充。（ 4 ）研究视野有待拓展尚相关分析均为对口译副语言现象的静态描述，缺乏对不同阶段、不同层次口译人员的跟踪考察或对比分析，更没有展开针对口译学习者的大规模调查分析，既无法对口译副语言的发展变化规律进行客观描述与总结，更无法证实具体结论对口译实践与教学的意义。 voice span，耳听到口说的间隔），一方面利于吸收更多信息，另一方面便于译语协调组织。如：例（ 1 ）
威：男，博士，教授，博士生导师。主要研究方向：功能语言学、翻译理论与教学。
收稿日期： 2014． 08． 10 “中国口译学习者语料库的研制与应用 ” （ 12BYY062 ）；基金项目：本研究得到以下项目资助：国家社科基金一般项目 “大型汉英 / 英汉口译语料库的创建及应用研究（ 1 ） ” （ 201014 ）；教育全国优秀博士学位论文作者专项资金资助项目 “新世纪优秀人才支持计划 ” “翻译能力动态发展与培养模式研究 ” （ NCET100270 ）。部
?
原文：今天我的介绍主要分两个部分。首先，简要介绍一下公司概要和 2005 年的整体业绩状况。译文及副语言标注：〈PSS〉my presentation will be in two part． First 〈PSS 〉company and sorry profile and 2005 financial results．该例中，原语第一小句语言结构清楚，信息容量较小，因而译语起始部分出现较短的停顿现象，用以存储同时听取后续信息，便于整体信息的连原语部分信息，续传译，这是同传实践中常见的等待策略。第二，被迫性停顿指语言结构、信息容量、专业术语等因素增加了理解与转换的加工负荷，影响了译语产出效率，导致了译员表达停顿的现象。如：例（ 2 ）原文：从经营利率、净利率及净资产收益率来看，公司的赢利能力很强。译文及副语言标注：〈PSL 〉and if we look at the
学习者语料库（ CILC ）中，副语言包括停顿、填充、语速、音量、语音拖长等 5 类，其作用体现在信息判断、、解释、更正等方面。同时，开展基于语料库的口译副语言标注与分析，将促进对口译“普遍性 ” 口译认知加工机制、口译策略应用、口译质量评估等议题的探索。关键词：中国口译学习者语料库；副语言；标注中图分类号： H319． 3 文献标识码： A 5795 （ 2015 ） 0100230008 文章编号： 1001-
· 23·
张威：中国口译学习者语料库的副语言标注：标准与程序化信息传播领域中均有体现（张治英，2000 ；王欣红， 2004 ；张华慧， 2013 ）。 2． 2． 1 “意思” “传真” 基于的口译信息截至 20 世纪 70 年代，口译教学与研究关注的焦点是口译（特别是同传）操作规范、译员素质、口译认 2012a），口译的口语化特征知加工机制等议题（张威，尚未进入研究视野。特别是巴黎释意派提出基于“脱的“意思 ” 翻译思想，强调原文信息离原语语言外壳 ” ），的完整传递（甚至“传真 ” 译员个体素质（包括双语熟练程度、口语表达习惯等）对信息传递质量的影响并未引起足够重视（ Pchhacker，2004 ： 139 ；张吉良， 2010 ）。 2． 2． 2 基于实证数据的口译副语言探索从 20 世纪 70 年代起，各类实证方法开始应用于口译副语言探索：首先，译员副语言特征。 ① 研究证实（ Shlesinger， 1994 ），译语语调一般包括非标准停顿、不规则重音、音高变化（从低到高）、时断时续的语速变化等特征， “解释性语调 ” （ in并且认为这些都是具有语义内涵的 terpretational intonation）。同时，原语与译语语篇都存在开始高、结束低的语调模式（ intonation pattern ）（ Waasaf， 2007 ）； ②口译的口语化程度（如有声停顿） 2011 ），高于原语文本（洪磊、王斌华，但也有相反结论（ Pchhacker， 2004 ： 139 ）。其次，副语言与口译质量的关系。 ① 原语副语言特征对译员信息理解与表达有正反两方面影响：原语但如果原副语言特征有助于译员对原语信息的理解，语停顿不符合语法规则或表达习惯，不仅影响译员对原语信息的理解，甚至影响译语的自然表达（ Shlesinger， 1994 ）； ②译员副语言影响口译用户对口译质量的如，译员无声停顿（ silent pause ）频率越高，或是评价，犹豫偏多影响表达流畅性，或是语调单调，口译听众对口译质量的评价就越差，而活跃的语调、适当的重音对 2000 ， 2002 ； Macias，口译信息接受有积极影响（ Mead， 2006 ； Waasaf， 2007 ；廖崇骏，2010 ）。同时口译用户调查研究发现，口译语义、逻辑比口译副语言特征更重 1998 /2002 ）。要（ Aís，最后，口译工作环境与口译副语言的关系。在法庭、医院等社区交际场所，副语言信息的有效理解与传达是译员的一项基本素质，对译员交际身份、信息沟通 1991 ； Aís， 1998 /2002 ；张威，有重大影响（ Shlesinger， 2013 ）。 · 24· 2． 2． 3 对口译口语化特征的理性总口译语料库的建设是学界公认的难题，目前国内外口译语料库不仅规模较小、种类较少，而且语料标注没有充分体现口译的口语化特征（副语言是其 2010 ；张威， 2012b ），主要表现）（胡开宝、陶庆，语料库多为对口译文本特征的描述、对口译研究也受此牵连，口译操作规范的个案分析，尚无法对口译实践策略、口译口语化特征进行大规模描述与分析（陈菁、符荣波， 2014 ），影响对口译加工过程的全面认识，也不利于口译语料库在口译教学与实践中的推广与应用。 “中国口译学习者语料库 ” （ Chinese Inter本文以 preting Learners Corpus，以下简称 CILC ）为例，以口译副语言的定性分析为基础，明确口译副语言对口译信息传递效果的意义，通过例证考察口译副语言的应用环境与效果，力图确立口译语料库建设中副语言标注的基本原则与方法，以便于后期开展基于口译语料库的口译副语言频率、分布、效果的观察与分析，同时为完善口译教学、提高口译实践技能，提供实证数据支撑。

中国口译学习者语料库的副语言标注_标准与程序

口译的标准和原则

中国口译学习者语料库的口译策略标注_方法与意义_张威

口语对话语音语料库CADCC与其语音研究

(整理)言语失误标注 原1

语料库研究选题

翻译教学语料库的标注及应用_英文_省略_经报道中文翻译及注释语料库_介绍_王惠

语料库标记与标注以中国英语语料库为例

语料库标记与标注_以中国英语语料库为例_李文中

语料库中熟语标注的基本处理思路和方法

CLEC中国英语学习者语料库

中国英语学习者语料库CLEC(桂诗春杨惠中)

《2024年口译语料库驱动下的口译副语言现象研究》范文

中国口译学习者语料库的副语言标注：标准与程序

口译语料库在口译教学中的应用

中国翻译协会标准语料库通用技术规范

《2024年口译语料库驱动下的口译副语言现象研究》范文

语料库标注说明

CLEC中国英语学习者语料库

面向计算机辅助正音的汉语中介语语音语料库的创制与标注

(整理)言语失误标注原1