《语料库数据驱动专业文本语义韵研究》评介
语料库驱动研究范式特点
语料库驱动研究范式特点
语料库驱动研究范式是一种研究方法,其特点如下:
1. 基于大规模语料库:语料库驱动研究范式基于大规模的语料库数据,通过对语料库进行分析和挖掘,来获取研究所需的信息。
这些语料库可以是已有的公开语料库,也可以是自己构建的专门用于研究的语料库。
2. 数据驱动:语料库驱动研究范式以数据为驱动,通过对语料库中的数据进行统计和分析,来得出研究结论。
这种方法强调实证研究,通过大量的数据支持来验证研究假设,而不是仅仅依靠理论推理。
3. 统计分析:语料库驱动研究范式采用统计分析方法来处理语料库中的数据。
通过统计分析,可以得出数据的分布、相关性等信息,从而帮助研究者发现规律和趋势。
4. 实用性:语料库驱动研究范式注重实际应用和实用性。
通过对语料库的分析,可以得出实际问题的解决方案,帮助改进产品、提升服务质量等。
5. 多学科交叉:语料库驱动研究范式涉及多个学科领域,如语言学、计算机科学、统计学等。
通过多学科的交叉合作,可以更全面地理解语料库数据,并开展相关的研究。
总的来说,语料库驱动研究范式通过对大规模语料库数据的统计分
析,实证验证研究假设,以解决实际问题为目标,涉及多学科交叉,具有实用性。
课题申报模板:325-语料库“数据驱动”辅助播音与主持艺术专业语言课程教学模式研究
语料库“数据驱动”辅助播音与主持艺术专业语言课程教学模式研究一、问题的提出、课题界定、国内外研究现状述评、选题意义与研究价值(一)问题的提出近年来,伴随着信息技术在教育领域的推广与应用,我国高等教育改革不断深入,在这种背景下,传统的语言教学方法也因现代化教学手段的加入而逐渐丰富和发展起来,各种新式的教学应用模式层出不穷。
其中数据驱动学习模式被广泛地应用于外语教学或者第二语言教学中,但语料库辅助的DDL语言教学还远未达到预期效果。
另外,对于母语的语言教学方面,数据驱动学习模式是否能对学习者的语音、词汇、语法和语用等能力培养产生积极的促进作用的研究也较为少见。
因此语言类课程教学中引入语料库语言学,探索基于语料数据驱动语言教学模式是一个非常重要的课题。
本课题以“数据驱动”(Data-driven Learning,简称DDL)学习为核心理念,以“语料库”(corpus,corpora或corpuses)为技术平台,探索播音与主持艺术专业语言类课程新的教学模式,从而让学生获取知识的方式发生根本变化,极大地促进语言教学改革和收获更多的语言教学成果。
(二)课题界定语料库(corpus,corpora或corpuses)通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语和口语的样本汇集而成,用来代表特定的语言或语言变体。
语料库已经成为语言学理论研究和语言教学不可缺少的基础资源。
本课题所用的语料库主要来源于中国传媒大学的传媒语言语料库,该语料库包括两个密切相关的子语料库,即文本语料库和语音语料库。
除此外还有自建语料库2014年巴西世界杯解说词语料库,收集2014年巴西世界杯的64场比赛的央视解说词,把声音整理转化为文本建立语料库。
数据驱动学习(Data-driven Learning,或者DDL)是一种直接应用语料库及其检索工具的先进学习模式,教师组织学生通过使用计算机检索软件分析大量的真实的语料数据,引导学生自主探索语言现象和功能。
语篇的语料库研究范式评介(1)
2010 年 3 月 第 33 卷第 2 期
— —多维分析法作较为详细的 库研究范式之一 — 介绍 。 2. 对语料库研究范式的不同看法 2. 1 对语料库研究范式的批评 对语料库研究范式用于语篇分析 ① 的批评 概括起来主要有以下几点: ( 1 ) 是以词汇 - 语法模式为焦点的自下而 上的分析 。 Swales[ 37 ] 认为语料库研究范式对语篇分
①பைடு நூலகம்
为行文方便, 本文不对 text 和 discourse 做区分, 均
统称为语篇。
35
析的出发点是句子层面, 焦点是词汇 - 语法模 式, 而不是语篇的宏观结构或句子层面以上的 更大的语篇单位;语料库展示的只是表层资料 ( surface data) [ 6 :511 ] ;对词汇 - 语法模式的分 析限于局部, 几乎未对它们在语篇中的功能进 23 :543 ] 。 行任何阐释[ ( 2 ) 将语篇从语境中剥离了出来[ 5 :36 ] 。 Widdowson [ 40 :22 ] 认为语料库资料是去 28 : 23 ] 语境化的 ( decontextualized ) 。 Hunston[ 认为 缺 乏 现 实 的 和 社 会 的 语 境 是 索 引 行 ( concordance line) 解释中的最严重的障碍 。 ( 3 ) 无法解决语义问题 。 Borsley & Ingham[ 17 ] 认为这种分析不能 处理意义问题, 揭示意义的唯一途径是询问本 36 :8 - 9 ] , 即本族语者依赖于直觉产 族语者[ 出的内省数据 。 2. 2 语料库研究范式的回应 语料库研究范式用于语篇 针对以上批评, 分析的倡导者认为: ( 1 ) 语料库的标注系统 ( tagging system ) 可 “自上而下 ” 的分析路径 。 以部分地实现 使用嵌入标注来标明语篇的语步结构, 可 24 :325 ] 。 使语料库在语篇层面上有更多作为[ Flowerdew[ 24 :326 - 327 ] 认为通过对具有修辞 特征的更大的语篇段( stretches of text ) 进行标 “词汇 - 语法模 注, 可部分地解决语料库是以 的 分 析 路 径 问 题, 如 式为 焦 点 的 自 下 而 上 ” Thompson[ 38 ] 39 ] 和 Upton[ 等的研究, 在这些 研究中词汇 - 语法特征是从基于语篇的语步结 构来分析的, 而不是在索引行或句子层面上进 行的②。这种语篇类型的标注可用于那些具有 如求 相对公式化和常规性修辞结构的体裁中, 职信等, 但对于由不同体裁组成的语篇 、 语步结 构范 围 跨 度 大 的 语 篇 或 具 有 嵌 入 式 语 步 ( embedded move structure) 的语篇, 这种标注方 式可能使用不便, 因此不是切实可行的选择 。 然而, 现在分析软件日益复杂化, 例如 WinMax 工具就具有标明嵌入式语步结构的功能, 可以 部分解决这一问题 。 ( 2 ) 语料库语言学在本质上是一种语境理论。
语料库驱动的意义单位研究及教学应用
语料库驱动的意义单位研究及教学应用首先,语料库驱动的研究方法可以帮助单位研究者更全面地了解和掌握所研究领域的语言使用情况。
语料库中保存了大量真实的语言数据,包含了不同语言形式、不同语境下的语言表达。
研究者可以通过对语料库的分析,了解一些特定的语言表达在实际中的频率和使用情况,从而更准确地描述和解释这个语言现象。
例如,在翻译单位的语料库中分析不同句型的翻译结果,可以推断出最常用的翻译方式和策略,为翻译工作提供指导和参考。
此外,语料库驱动的研究方法还可以用于教学中。
语料库中的数据具有真实性和典型性,能够直接反映出语言使用者的实际需求和实际运用情况。
因此,教师可以利用语料库来设计教材和教学活动,使学生在真实的语言环境中学习和运用语言。
通过参考语料库中的例句和语言表达,学生可以更灵活地掌握和运用语言。
在翻译教学中,教师可以利用语料库来让学生了解不同翻译策略和表达方式,在模拟真实语言使用环境下进行翻译训练。
最后,语料库驱动的研究方法也可以促进不同学科之间的交叉合作。
语料库是一个跨学科的研究工具,可以为不同学科的研究者提供数据和方法支持。
语料库驱动的研究方法可以帮助不同学科之间的研究者开展合作研究,共同解决一些复杂的问题。
比如,在语言与文学研究中,语料库可以提供大量的文本数据用于分析和阐释文学作品的语言特点和风格。
总之,语料库驱动的研究方法在单位研究和教学中具有重要的意义。
它可以帮助单位研究者更全面地了解和掌握所研究领域的语言使用情况,揭示语言中的隐藏规律和趋势,同时也可以在教学中提供真实和典型的语言材料,促进不同学科之间的交叉合作。
《语料库数据驱动的专业文本语义韵研究》评介
《语料库数据驱动的专业文本语义韵研究》评介摘要:语义韵是语料库语言学开辟的一个新研究方向,成为语言学领域一个重要的研究对象。
它正在得到西方语言学家越来越多的重视。
然而在中国,这还不为大多数语言研究者所熟悉。
本文以上海交通大学卫乃兴教授于2002年发表于《当代语言学》刊物第2期中的一篇名为《语料库数据驱动的专业文本语义韵研究》的文章为例进行分析总结,以期对语义韵研究的范围,方法及其研究意义有初步的了解。
关键词:语义韵研究方法意义评介1 文章的研究内容、方法及语料来源总结研究对象:专业文本中的语义韵研究方法:计算搭配词和随机提取词语索引两种方法。
(1)提取节点词在跨距内的搭配词并确定显著搭配词(significant collocates)概括语义韵。
节点词即笔者欲研究其搭配行为的关键词。
文中取词形(word form)为基本研究单位,包括“cause,incurred,utterly probability,career” 等。
搭配跨距将界定为-5/+5,即在节点词左右各取5个词为其语境;所有落入跨距内的词形将被视为节点词的搭配词(collocates)。
统计测量采用Z值,凡是与节点词共现之Z值达2.0者将确定为显著搭配词。
使用的主要工具有Wordsmith等检索软件。
(2)随机提取一定数量的词语索引(concordances),参照类联接,描述语义韵。
文中提到的类联接即词语搭配出现于其中的句法结构(Mitchell1975)。
语料来源:拥有400万词容量的上海交通大学JDEST语料库。
并参照COBUILD语料库数据,进行对比研究。
2 文章具体研究过程概述作者明确了各操作定义。
如语义韵(semantic prosody),即关键词项的典型搭配词在其语境中营造起的语义氛围(Sinclair 1988,1991;Louw 1993;Stubbs 1996)。
以及语义韵大体可分为积极语义韵(positive prosody),中性语义韵(neutral prosody)或错综语义韵(mixed prosody)等类别(Stubbs 1996:176)。
语料库数据驱动下的语用教学研究
语料库数据驱动下的语用教学研究本文利用WordSmith Tools Version5.0的语境共现、词频列表、关键词等检索工具,对收集到的非英语专业学生作文中各种语言错误现象进行统计分析,提出语料库数据驱动方法在语用教学中的优势。
标签:语料库语用失误语用能力语用教学一、引言语用失误自上世纪80年代提出以来,一直是语用学、二语/外语教学与研究的主要议题之一。
曹春春(1998)、孙亚和戴凌(2002)等分别对语用失误进行了界定和分类,并探讨了语用失误对外语教学的启示;研究二语学习者语用失误的学者有Blum-Kulka和Olshtain(1986),Ellis(1992),Trosgorg(1995),何自然和阎庄(1986),李民和陈新仁(2007)等;对语用失误的成因进行分析的有张辉(1994),张新红(2000),孙亚和戴凌(2002)。
作为一种新的外语教学方法与研究范式,语料库具有强大的功能。
然而,经检索,迄今尚无研究者全面系统地从语料库角度探讨语用教学问题,因而这是本文关注探讨的问题。
二、理论基础(一)语用失误及其分类语用失误(Pragmatic failure)的内涵是不能理解所说(词语)的含义;何自然认为:“语用失误不是指一般遣词造句中出现的语言运用错误,而是说话不合时宜的失误,或者说话方式不妥,表达不合习惯等导致交际不能取得预期效果的失误”(何自然,1997)。
在ELF背景下,可以将语用失误重新定义为跨文化交际者由于对当前语境下的显性或隐性社交语用因素的感知或表达不当而带来的交际问题或障碍,如交际目标或意愿的受挫、面子的伤害等。
(陈新仁,2015)托马斯将语用失误分为语用语言失误和社会语用失误(Thomas,1983)。
陈新仁(2015)基于社交语用维度,将语用失误分为4类:1.对交际场合正式程度、行事程序的感知失误;2.对彼此情感距离的感知与表达失误;3.对自己或对方交际目标、行事意愿等的感知失误;4.对对方认同的价值观念、习俗等的冒犯。
《2024年语料库研究》范文
《语料库研究》篇一一、引言语料库作为一种资源丰富的语言数据集合,已成为语言学、语言学研究以及相关领域的热点研究对象。
它能够为语言分析、语言教学、翻译、词典编纂等多个领域提供支持。
本文将介绍语料库研究的重要性,并就当前语料库研究的现状进行梳理,进而分析其中存在的挑战和问题,并探讨未来的发展趋势。
二、语料库研究的现状1. 语料库类型及建设随着技术的进步,语料库建设日趋成熟。
根据不同领域和用途,语料库可大致分为通用型和专用型。
其中,通用型语料库如COCA、BNC等,涵盖了广泛的语言使用场景;专用型语料库则针对特定领域或主题进行收集,如法律、医学等。
此外,还有多媒体语料库和口语语料库等类型。
在建设过程中,研究者需考虑语料库的规模、代表性、时效性等因素。
2. 语料库应用领域语料库在多个领域得到了广泛应用。
在语言学领域,语料库为语言研究提供了丰富的数据支持;在翻译领域,语料库可帮助提高翻译的准确性和效率;在词典编纂方面,语料库为词汇的收集和释义提供了有力支持。
此外,在语言教学、自然语言处理等领域,语料库也发挥着重要作用。
三、当前挑战与问题尽管语料库研究取得了显著成果,但仍面临诸多挑战和问题。
首先,在语料库建设方面,如何确保数据的代表性和真实性是一个亟待解决的问题。
此外,随着技术的发展,如何利用人工智能等手段对语料库进行智能化处理和利用也是一大挑战。
其次,在应用方面,如何将语料库与实际需求相结合,提高应用效果也是一个难题。
此外,不同领域和行业对语料库的需求存在差异,如何满足这些不同需求也是一项挑战。
四、未来展望面对未来的发展,语料库研究将呈现以下几个趋势:1. 多样化与个性化:随着用户需求的多样化与个性化发展,未来的语料库将更加关注用户需求和实际应用场景的差异。
研究者需要设计更多类型的语料库来满足不同领域和行业的需求。
2. 智能化与自动化:人工智能技术的不断发展将促进语料库的智能化和自动化处理。
例如,利用自然语言处理技术对语料进行自动标注、分类和分析等操作,提高处理效率和准确性。
专业的语料库分析
专业的语料库分析语料库分析是一种研究语言使用和语言变化的方法,通过收集、整理和分析大量的语言样本,可以深入了解语言的特点和规律。
在今天的信息时代,语料库分析成为了语言学研究、翻译教学、自然语言处理等领域中不可或缺的工具。
本文将介绍语料库分析的定义、意义和应用,并探讨如何进行专业的语料库分析。
1. 语料库分析的定义与意义语料库分析是指通过采集和分析大量的自然语言文本,以了解语言形式、语义和语用的使用规律。
语料库是包含真实语言文本的大型数据库,可以包括书面文本、口语对话、新闻报道等多种类型。
语料库分析的主要目的是揭示语言的普遍规律和变异现象,帮助我们理解语言的真实使用情况。
语料库分析的意义在于:- 提供可靠的语言数据:语料库中的文本是真实的、自然的语言使用样本,与人们日常使用的语言相符合。
因此,通过语料库分析可以获得更加真实可靠的语言数据,而不仅仅依赖于语言学家的直觉和主观判断。
- 揭示语言的普遍规律:通过对大量语料的统计分析,可以发现语言的普遍规律和共性特征。
这些规律和特征可以用来解释语言学上的问题,如语音、语法和语义等方面的规律。
- 研究语言变异:语料库分析不仅能揭示语言的共性规律,还能研究语言的变异情况。
通过比较不同文体、不同地区、不同社会群体的语言数据,可以了解语言的变异现象,如方言、社会变异和时代变异等。
2. 语料库分析的应用领域语料库分析在语言学研究以及其他相关领域中有着广泛的应用。
下面列举几个常见的应用领域:2.1 语言学研究语料库分析为语言学研究提供了重要的工具和方法。
通过对语料库进行统计分析,可以验证和推测语言学理论,探讨语言的结构和功能,研究语言的变化和发展等。
语料库分析可以帮助语言学家更好地理解自然语言的特点和规律。
2.2 翻译教学语料库分析在翻译教学中的应用越来越广泛。
通过对双语语料库的对比分析,可以揭示两种语言之间的差异和相似之处,帮助学生理解和掌握翻译的技巧和策略。
语料库分析还可以用来构建机器翻译系统,提高翻译效率和质量。
语料库驱动的跨语言语义韵研究
语料库驱动的跨语言语义韵研究目前,国内语料库语义韵的研究成果大都集中在英语单语视角之下,本文采取跨语言的研究视角,考察了英语程度副词“too”及其汉语对应译文“太”的语义韵特点及其差异。
发现相同点在于两者都常见于消极和中性语义韵之中,差别在于英语“too”极少出现于积极语义韵中,而汉语“太”有近百分之十五的几率用于积极语义韵之中。
跨语言语义韵差别的研究,对翻译和二语习得都有不可忽略的指导意义。
标签:too 太语义韵一、引言“韵”(prosody)起初是Firth(1957)研究音位学时所用的概念,指某种语音特点跨越单一音位的现象。
在语料库语言学领域,语义韵(semantic prosody)是指关键词(key word)(即节点词node word)的典型搭配词在其语境中营造起的语义氛围(Sinclair,1988:150~159;Sinclair,1991:74~75;Louw,1993:157~176;Stubbs,1996:176)。
根据关键词所吸引的搭配词的态度意义特点,语义韵可分为积极语义韵(positive prosody)、中性语义韵(neutral prosody)或错综语义韵(mixed prosody)和消极语义韵(negative prosody)三类(Stubbs,1996:176)。
如果关键词项吸引的搭配词项大多具有消极的态度意义,该词项便具有消极语义韵;如果其搭配词多是一些带有积极态度意义的词项,则该词具有积极语义韵;若其搭配词中既有一些表达积极态度意义或中性态度意义的,也有一部分表达消极态度意义的,且各自都占相当的比例,则该词被认为具有中性语义韵,或错综(mixed)语义韵(卫乃兴,2002)。
目前,从研究的角度和内容看,国内基于语料库的语义韵研究可大致分为三类:同、近义词的语义韵异同研究(张继东,2005;张继东,2006),专业文本的语义韵研究(卫乃兴,2002),学习者语言的语义韵研究(Granger,1998:3~18;孙海燕,2004;王海华,2005;卫乃兴,2006;龚嵘,2009)。
基于语料库和语料库驱动的研究方法
基于语料库和语料库驱动的研究方法基于语料库和语料库驱动的研究方法,在语言学、计算语言学以及其他相关领域中被广泛应用。
语料库是一种包含大量文本材料的电子数据库,可以支持研究者对文本进行各种分析和研究。
语料库驱动的研究方法是通过利用语料库中的数据来驱动研究的过程。
语料库驱动的研究方法有多种应用,包括语言描述、语言学理论验证、语言变体研究、语言教学和自然语言处理等。
下面将详细介绍几个常见的应用领域。
首先,语言描述是语料库驱动研究方法的重要应用之一、通过分析语料库中的大量文本数据,研究者可以获得有关特定语言的详细描述。
例如,研究者可以通过语料库研究其中一种语言的词汇、语法结构、语用规则等方面的特征,从而对这种语言进行全面且准确的描述。
其次,语言学理论验证也是语料库驱动研究方法的重要应用之一、通过对语料库中的数据进行统计分析,研究者可以验证其中一语言学理论是否符合实际语言使用的情况。
以句法理论为例,研究者可以利用语料库中的数据来验证句法规则的适用性和普遍性,从而对该句法理论进行评估和验证。
此外,语料库驱动的研究方法也被广泛应用于语言变体研究。
通过对不同语言变体的语料库进行比较和分析,研究者可以揭示不同语言变体之间的差异和变化规律。
例如,在英语研究中,研究者可以通过对美式英语和英式英语语料库的比较,来探讨这两种语言变体之间的差异和变化。
此外,语料库驱动的研究方法在语言教学中也具有重要意义。
通过对语料库中的实际语言使用数据进行分析,研究者可以更好地了解学习者在语言使用上的困难和需求,从而指导语言教学中的教学内容和方法。
例如,在英语教学中,研究者可以通过对学习者使用英语时的常见错误进行分析,来改进教学材料和教学策略,提高学习者的语言能力。
最后,语料库驱动的研究方法在自然语言处理领域也得到了广泛应用。
通过对大规模语料库中的数据进行分析和建模,研究者可以开发各种自然语言处理技术和工具,例如文本分类、信息检索、机器翻译等。
语料库数据驱动的语义韵在大学英语词汇教学中的应用
法 比较单一 , 常用举例 法和翻译法 , 学习效果不理想 。 语义韵指 的是某些词语 由于经常和具有某 种语义 特征 的语言单位共 现而产 生 的一 种语义 特征 。 义韵 语 属于一种特殊 的搭 配现象 , 展示 的是 词语搭 配 的特 它 殊行为 ,而且 这 种特 殊 的搭配 行 为只 有通 过语 料库 , 从大量实际使用 的语 言中总结 出来 , 远非本 族语者 而
教学效果 。
一
构 ?呈现什 么样 的语境特 点? 讨论 3 该节点词 的语义韵特点是什么 ? 讨论 4 和汉语 中“ 原因” 一词 的搭 配特点 有哪些
不 同?
、
研 究 方法 和研 究对 象
步骤三 : 教师 总结。
本文结 合定 性 和 定 量 的研 究 方 法 , 过 教 学 实 通
总结 1 可 以看 到动词 cue主要 使用在 两种 结 as
构 中 ,一 种 结 构 是 “ as + n cue .+t i i t e 如 o n n i ”( . f iv
验, 问卷调查 , 探索利用语 料库将 语义 韵研究 应用 于 英 语词汇教学 中的一条行之 有效 的教学方 法 , 学效 教
二 、教 学实验 的 主要 内容
步骤一 : 介绍语 料库 和语 义韵 的基本 概 念。首先 让学生 了 解 语 料 库 检 索 的 作 用 ,并 通 过 登 录 B C N ( ri a oa C ru ) Bis N t nl o s 在线语料 库 ,以 du t th i p ob 一词为 例演示 了 B C语料库 的检索方法 , N 指导学生 观察 、 归 纳该 词的用 法 ,特别是 词汇 的搭 配 。 后 ,介绍 语义 之 韵 的概念和分 类 ,包括 : 极 ( oi e 语 义 韵 、中性 积 p si ) t v ( et 1语 义韵 和消极 ( ea v ) 义韵。 nur ) a ngt e 语 i 步骤 二 : 录 B C 在 线 语 料 库 ( t :/ o u. 登 N ht / cr s p p bu eu b c ) 检索 cue y .d/ n/ , as 一词 , 设定跨距为 4 观察 ,
国内基于语料库的语义韵研究现状综述(2000—2015)
义韵研究 已经 成为语 料库短语 学领 域里 炙手 可热 的学术 热
点话题 。语义韵 研究 突破 了语料 库语 言学单 一学科 的研 究
界限, 开始 了与词 典学 、 描 写翻译 学 、 语篇 分析 、 专 门用途 英 语等其 他领域 的跨学 科融 合 .综 合基 于数据 与数 据驱 动的 研 究手 段得到 越来越 多 的实证应 用 .语 料库类 型逐 渐深 入 到双语语 义韵构式 研究
近 十五年基 于语 料库 的语 义韵相 关文 献研 究呈逐 年上 升趋
势。 可见语 义韵研 究越 来越 引起 国 内语 言学 学者重 视 , 成 为
入探 索 期 三个 阶段 回顾 基 于 语 料 库 的语 义点话题之 一 。韩存 新 曾对 国 内语义 韵 的历 时研究 节点定 为2 0 0 5 年和2 0 1 0 年 。然而 , 本研 究主要考 查 的是基 于语料 库
二语 习得 研 究 ( 1 6 %) ,双语 翻译 研 究 ( 1 3 %) ,理 论研 究 ( 1 2 %) , 应用 研 究 ( 1 0 %) , 专 门用 途 英语 研 究 ( 9 %) 。基 于
此, 笔 者 将 以历 时 的视 角 , 从 萌 芽起 步 期 、 稳 健发 展 期 、 深
摘 要 : 语 义韵 是一种 意义上 的搭 配共现 特征 , 某些词 汇因经常在形 式上 与具有某种语 义特征 的搭 配词 出现 , 而产 生与
搭 配词相似 的语 义色彩。本文 以历史 的视 角考查 了国内基 于语料库 的语 义韵研 究近 1 5 年 的 学术成果 。 从 萌芽起 步期 、 稳健 发 展期 、 深入探 索期三 个阶段梳理 该话题研 究现 状 , 旨在 为今后 国 内语义韵 理论与 实践 拓展奠 定基 础 。 关键 词 : 语料 库 语 义韵 现状 综述
语料库及数据驱动学习辅助高中英语词汇教学的优势
习人手 , 他认 为 , 在 过 去词 汇 教学 从属 于语 法 教 学 , 教 师教授 的词 并 不 具 有 代 表 性 和科 学性 J 。在 英 语 教学 及学 习过程 中, 不 管是 作 为英 语 教 学 的教 师
还是英语学习者都认识到英语词汇学习在整个英语 学 习过 程 中 的重 要 性 。但 是 , 截 至 目前 , 花 费 时 间
权 晓辉 , 吴
摘
江
( 西北师范大学 外 国语学 院, 甘肃 兰州 7 3 0 0 7 0 )
要: 词汇教学作 为高 中英语教学的一个重要组成部分 , 与计算机辅助下 的数据 驱动学习一起依托 于正在蓬 勃发
展的英语语 料库 , 从 词频 统计研究 、 词语搭配研究 、 词汇句法层 面知识信 息的提供 以及词汇 运用语 境 、 纠正用词失误
多、 学 习词汇效 果差 仍 然 是词 汇 教 与学 过 程 中最 突 出的 问题 。造 成这 种 现象 的原 因有 很 多 , 其 中在 学
3 语料库及数 据驱动学 习
语 料 库是 按 照一 定 的语 言原 则 , 运 用 随机抽 样 方法 , 收集 自然 出现 的连 续 的语 言 , 运 用文本或话 语 片段 而建成 的具 有一 定容 量 的 大型 电子 文本 库 【 6 】 。
T i m J o h n s在 1 9 9 1年 提 出数 据 驱 动 学 习 方 法 ( d a t a —d r i v e n l e a r n i n g , 简称 D D L ) 。其 主 要 思 想 是
库及数据驱动学习探索词汇教学的新途径及它的优 势, 以此拓宽视野和思路 , 提高高中英语词汇教学效
总 和” 。C o a d y在 1 9 9 3年 总 结 出 什 么是“ 掌 握 一 个
语料库数据驱动学习:理据、模式及反思
的 语 言 使 用 模 式 对 词 汇 、语 法 及 规 则 进 行 推 理 和 习 种种弊端 , 1 有益于提高语 言直觉性 。 第二 , 主张 自下而
2语 言 习得 理 论 .
l 模式在其践行过程中难免出现一些问题, 需要人们认
Wii ls l 指出语言习得必备的基本条件为 : 大量 、 优 势 。 真 实 的语言输入 ;使用语言 的机会 以及使用语 言的动 机。 数据驱动学习能够充分满 足以上条件 。 首先 , 语料 l
I 思、重 理,真 发 这 先 学 理 的 l反 慎 处 以 正 挥 一 进 习 念 真
情 境下 , 助各种学 习资源 和媒 介 , 过与外部环境 数 据驱动方法 , 借 通 : 学生得 以一边 观察真实的语料 , 一边
的交互 , 自我发现 、 探索 、 构起知识体 系的过程 , l 断地假设 、 建 提 不 求证 , 而使学 习的过程 变成 了 自 从 我发 倡在教师指导下的 、 以学生为 中心的学习。在数据驱 现和自 f 我探索的过程, 知识更加有薏 、 议 体系化, 其学
l 数据驱动 出, 鼓励学生积极思考 、 质疑 , 主动从真实 的语言事实 关 知识 点的敏感度 。相对于传统教学模式 , 首先 , 提供高质 量的 中观察 、 概括和归纳语言规律 。数据驱动学习并不直 学 习模式具有不 可比拟的优势 :
-
语 然 地道 、 充分 , 营造真实 的语 接教授某一语言特征 ,而是向学生提供语言事实 , I 言输入 , 言材料 自 、 学 语
语料库数据驱动技术在科技翻译教学中的应用
语料库数据驱动技术在科技翻译教学中的应用一、概述随着科技的迅猛发展和全球化的加速推进,科技翻译在跨文化交流中的地位日益凸显。
传统的科技翻译教学方法往往侧重于语言层面的转换,忽视了语料库数据驱动技术在提升翻译质量和效率方面的巨大潜力。
本文旨在探讨语料库数据驱动技术在科技翻译教学中的应用,以期为翻译教学改革提供新的思路和方法。
语料库数据驱动技术以大规模真实语料为基础,通过对语料进行深度挖掘和分析,揭示语言使用的规律和特点。
在科技翻译中,该技术能够帮助译者快速准确地把握专业术语、固定搭配和句式结构,提高翻译的准确性和流畅性。
语料库数据驱动技术还能够提供丰富的语境信息,有助于译者更好地理解原文的深层含义和风格特点,从而实现更高质量的翻译。
将语料库数据驱动技术应用于科技翻译教学,不仅可以提升学生的翻译实践能力,还能够培养他们的数据驱动思维和创新能力。
通过引导学生运用语料库工具进行自主学习和探究,可以激发他们对科技翻译的兴趣和热情,提高他们的综合素质和竞争力。
本文将从语料库数据驱动技术的概念、特点及其在科技翻译中的应用等方面入手,分析该技术在科技翻译教学中的优势与不足,并探讨如何有效地将该技术融入科技翻译教学实践中。
1. 科技翻译的重要性及挑战科技翻译在当今全球化背景下具有举足轻重的地位,它不仅是各国科技交流与合作的桥梁,更是推动科技进步与创新的重要力量。
随着科技的迅猛发展,科技文献的数量和种类不断增加,涉及领域广泛,对翻译的质量和效率提出了更高的要求。
科技翻译面临着诸多挑战。
科技词汇的不断更新和专业化给翻译人员带来了极大的困扰。
翻译人员需要不断更新自己的知识储备,掌握最新的科技词汇和术语,以确保翻译的准确性和专业性。
科技文献通常包含大量的专业术语、复杂句式和长句,这些都需要翻译人员具备扎实的语言基础和深厚的专业知识。
不同语言之间的文化差异和表达习惯也给科技翻译带来了一定的难度。
如何提高科技翻译的质量和效率,成为了翻译界和教育界共同关注的焦点。
《语料库数据驱动的专业文本语义韵研究》评介
共提取 2 0 行 词 语 索 引 。分 析 数 据 得 到 :① 节 点词 在 A D V + A b J
类 联 接 中 的绝 大 多 数 搭 配 词 都具 有 消极 语 义 特 点 。极 少 数 显 示
语料来源 : 拥有 4 0 0万 词容 量 的上 海 交 通 大 学 J D E S T语 料
库。并参照 C O B U I L D语 料 库 数 据 , 进 行 对 比研 究 。 2 文 章 具 体 研 究 过 程 概 述
中性 语 义 特 点 的例 子 中 ,节 点词 在其 扩 张 语 境 中仍 与 消 极 词 项
联系 。② “ u t t e r l y ”在 A D V + V 类联接 中具有消极语义特点 。
初 步的了解。 关键词 : 语义韵 研究方法 意义 评 介
中图分类号 : H 0 3 0
文献标 识码 :A
文章编号 : 1 6 7 2 — 1 5 7 8 ( 2 0 1 3 ) 0 1 — 0 0 3 3 — 0 2
1
文章的研究内容、 方 法 及 语 料 来 源 总 结 研究对象 : 专 业 文 本 中 的语 义 韵
第 1 0卷 第 l 期
V0 1 . 1 0 No . 1
读 与 写 杂 志 Re ad a nd Ⅵ t e Pe io r di c a l
2 0 l 3年 1月 J a n ua r y 2 01 3
《 语料 库数 据驱 动 的专 业 文本 语义韵研 究》 评 介
李 梓
5 4 1 0 0 4 ) ( 广 西 师 范 大 学 国 际文 化 教 育 学 院 广 西 桂 林 摘要 : 语 义韵 是 语 料 库 语 言 学开 辟 的 一 个 新研 究 方 向 , 成 为 语 言 学 领 域 一 个 重 要 的研 究 对 象 。 它 正在 得 到 西方 语 言 学 家越 来 越 多 的 重视 。 然 而在 中 国 , 这 还 不 为 大 多 数语 言研 究 者 所 熟 悉 。 本 文 以上 海 交通 大 学卫 乃 兴 教 授 于 2 0 0 2年 发 表 于 《 当代 语 言 学 》 刊 物 第 2期 中 的一 篇 名 为《 语 料 库 数 据 驱 动 的 专 业 文本 语 义韵 研 究》 的 文 章 为例 进 行 分析 总 结 , 以期 对语 义韵 研 究 的 范 围 , 方 法及 其研 究 意 义 有
基于语料库的语义韵研究对外语词汇教学的启示
基于语料库的语义韵研究对外语词汇教学的
启示
语义韵研究是一种基于语料库的方法,通过分析大量文本数据来
探索词汇之间的语义关系。
这种方法对外语词汇教学有着重要的启示。
首先,语义韵研究可以帮助教师更好地理解外语词汇的语义特点。
通过分析词汇在不同语境中的使用情况,教师可以了解到词汇的真实
含义及其使用方式。
这种了解有助于教师在教学过程中准确解释词汇
的含义,避免误导学生。
其次,语义韵研究可以帮助教师选择更加恰当的词汇教材。
通过
对大量语料库数据的分析,教师可以了解到哪些词汇是频繁使用的,
以及它们的常见搭配。
这样,教师就可以根据语料库的数据选择更加
常用和实用的词汇进行教学,帮助学生掌握最实用的表达方式。
此外,语义韵研究还可以帮助教师教授词汇的多义性和义项选择。
通过观察语料库中不同语境下词汇的使用情况,教师可以帮助学生理
解词汇的不同含义,并学会根据语境选择合适的义项。
这有助于提高
学生的词汇运用能力。
最后,语义韵研究可以促进学生自主学习。
教师可以引导学生使
用语料库进行自主学习,让他们通过观察词汇在不同语境中的使用情
况来深入理解词汇的语义关系。
这种学习方式培养了学生的自主学习
能力,提高了他们的词汇学习效果。
综上所述,基于语料库的语义韵研究对外语词汇教学有着重要的
启示。
教师可以通过该方法更好地了解词汇的语义特点,选择恰当的
教材,教授词汇的多义性和义项选择,并促进学生自主学习。
这将有
助于提高外语学习者的词汇掌握水平。
近十年国内语料库语言学研究综述
近十年国内语料库语言学研究综述一、概述近十年来,语料库语言学在国内的研究取得了显著的发展和突破。
随着信息技术的飞速进步和大数据时代的到来,语料库语言学在语言学研究中的地位日益凸显。
它基于大规模真实文本数据,运用统计学和计算机技术,对语言现象进行定量和定性的分析,为语言学研究提供了全新的视角和方法。
国内语料库语言学的研究范围广泛,涉及语言结构、语言变异、语言使用、语言教学等多个领域。
研究者们利用语料库资源,深入探讨了词汇、语法、语义、语用等层面的语言问题,揭示了语言现象的内在规律和特点。
同时,随着语料库建设的不断完善,语料库语言学在国内的应用也愈加广泛,为自然语言处理、机器翻译、信息检索等领域提供了强大的数据支持和技术基础。
近十年内,国内语料库语言学的研究呈现出以下几个特点:一是研究方法的多样化,不仅注重传统的统计分析方法,还引入了机器学习、深度学习等先进技术二是研究领域的拓展,语料库语言学不再局限于传统的语言结构研究,而是向语言教学、语言规划等应用领域延伸三是语料库资源的不断丰富,各类专题语料库、多语种语料库等不断涌现,为语料库语言学的研究提供了更为丰富和多样的数据来源。
总体而言,近十年国内语料库语言学的研究取得了丰硕的成果,不仅推动了语言学理论的发展,也为语言实践提供了有力的支持。
未来,随着技术的不断进步和语料库资源的日益丰富,语料库语言学在国内的研究将更加深入和广泛,为语言学研究和社会应用带来更多的创新和突破。
1. 语料库语言学的定义与重要性语料库语言学,作为一种独特的语言学研究方法,主要依赖于大规模、结构化的语言数据集合,即语料库,来进行语言分析和研究。
它通过对真实语料进行定量和定性的分析,旨在揭示语言的实际使用情况和内在规律。
近十年来,随着信息技术的飞速发展和语料库规模的日益扩大,语料库语言学在国内语言学界的地位逐渐提升,其重要性也日益凸显。
语料库语言学的定义在于其研究方法和数据基础。
其研究方法强调实证和量化,通过计算机技术和统计手段对语料库中的语言数据进行处理和分析,进而揭示语言的实际使用情况。
语料库驱动的翻译可读性量化评估
语料库驱动的翻译可读性量化评估张志新【期刊名称】《蚌埠学院学报》【年(卷),期】2014(000)003【摘要】借助语料库技术,以《红楼梦》英译本为真实语料,在字词、句子和语篇三个层次上提取可量化译文文本特征,通过不同译本间的对比分析,能够以直观且量化的方式呈现评估过程。
经过实证分析发现,与杨宪益译本相比,霍克斯译本为读者带来较重的阅读认知负荷,但拥有更为清晰的逻辑结构。
%With the help of corpus technology ,it attempted to firstly extract from two English versions of The Dream of Red Mansions some quantifiable textual features on lexical ,sentential and textual levels and then analyzed such features in a contrastive way so as to manifestly display the quantitative evaluating process of translation texts .Findings of the empirical study showed that Hawkins′translation had a clearer logical structure but ,at the sametime ,would burden ordinary readers with heavier lexical cognition load .【总页数】5页(P108-112)【作者】张志新【作者单位】安徽财经大学外国语学院,安徽蚌埠 233030【正文语种】中文【中图分类】H059【相关文献】1.豪斯翻译质量评估理论对摘要翻译的启示--基于语料库的摘要研究 [J], 姜睿萍;杨传鸣;岳欣2.语料库驱动的翻译研究:意义单位、翻译单位和对应单位 [J], 濮建忠3.翻译质量评估的量化模式初探——一项基于学习者语料库的实证研究 [J], 赵勇;刘兰婷;4.翻译质量评估的量化模式初探——一项基于学习者语料库的实证研究 [J], 赵勇;刘兰婷;5.语料库驱动的《政府工作报告》翻译语义韵研究——以“大力”的翻译为例 [J], 莫晓妍因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《语料库数据驱动的专业文本语义韵研究》评介摘要:语义韵是语料库语言学开辟的一个新研究方向,成为语言学领域一个重要的研究对象。
它正在得到西方语言学家越来越多的重视。
然而在中国,这还不为大多数语言研究者所熟悉。
本文以上海交通大学卫乃兴教授于2002年发表于《当代语言学》刊物第2期中的一篇名为《语料库数据驱动的专业文本语义韵研究》的文章为例进行分析总结,以期对语义韵研究的范围,方法及其研究意义有初步的了解。
关键词:语义韵研究方法意义评介中图分类号:h030 文献标识码: a 文章编号:1672-1578(2013)01-0033-021 文章的研究内容、方法及语料来源总结研究对象:专业文本中的语义韵研究方法:计算搭配词和随机提取词语索引两种方法。
(1)提取节点词在跨距内的搭配词并确定显著搭配词(significant collocates)概括语义韵。
节点词即笔者欲研究其搭配行为的关键词。
文中取词形(word form)为基本研究单位,包括“cause, incurred, utterly probability, career”等。
搭配跨距将界定为-5/+5,即在节点词左右各取5个词为其语境;所有落入跨距内的词形将被视为节点词的搭配词(collocates)。
统计测量采用z值,凡是与节点词共现之z值达2.0者将确定为显著搭配词。
使用的主要工具有wordsmith等检索软件。
(2)随机提取一定数量的词语索引(concordances),参照类联接,描述语义韵。
文中提到的类联接即词语搭配出现于其中的句法结构(mitchell1975)。
语料来源:拥有400万词容量的上海交通大学jdest语料库。
并参照cobuild语料库数据,进行对比研究。
2 文章具体研究过程概述作者明确了各操作定义。
如语义韵(semantic prosody),即关键词项的典型搭配词在其语境中营造起的语义氛围(sinclair 1988, 1991; louw 1993; stubbs 1996)。
以及语义韵大体可分为积极语义韵(positive prosody),中性语义韵(neutral prosody)或错综语义韵(mixed prosody)等类别(stubbs 1996:176)。
其中各类的定义将在下面论述中提及。
文章基于语料库证据,采用两种常规方法,以“cause,incurred, utterly,probability,career”等为例研究专业文本中的三类语义韵特点。
现将各研究过程论述如下:2.1“cause”的强烈消极语义韵作者用wordsmith 检索,词形“cause”在jdest中共出现949次。
按照-5/+5的跨距提取搭配词,可提取9490个。
通过z值检验,可提取显著搭配词,同时排出因偶然因素落入跨距的,对节点词并无预见力的词项。
统计数据显示,达到显著标准的搭配词有“damage ,failure, problem, trouble”等52个。
得到所有搭配词的共性是都具有消极语义特点。
对比cobuild中“cause”的语义特点,得知“cause”在两个语料库中的语义特点相同,不同点在于语域差异。
另外用wordsmith统计显著搭配词的距位分布位置和次数等信息,得到“cause”的消极语义氛围极为浓重。
并对比cobuild中“cause”的索引显示,普通文本中“cause”的消极语义氛围远没有专业文本中的浓重。
简评:作者是以怎样的标准对比得出的“cause”在普通文本中远没有其在专业文本中的浓重,是消极搭配词词形数量少,还是使用频率低,又存在多大程度上的差别才称的上“远”都没有给出明确说明。
2.2“incurred”和“utterly”的消极语义韵作者指出jdest中的证据表明,相当多的准技术词具有消极语义韵。
并列表显示“incurred”的显著搭配词数据。
得出结论“incurred”具有消极语义韵。
另外,查询cobuild中对“incur”一词的定义,认为定义中的“unpleasant, as a loss, cause it o happen”等词同样揭示了“incurred”具有消极语义韵。
采用随即提取词语索引的方法研究词性形“utterly”的语义韵。
其在jdest的一个子库里出现了78次。
每隔3行取词1,共提取20行词语索引。
分析数据得到:①节点词在 adv+abj 类联接中的绝大多数搭配词都具有消极语义特点。
极少数显示中性语义特点的例子中,节点词在其扩张语境中仍与消极词项联系。
②“utterly”在 adv+v 类联接中具有消极语义特点。
简评:首先,作者在对比“cause”一词在普通文本中的语义韵时,参考了词汇定义。
词汇定义固然能够在一定程度上反映词汇使用的语境,但是缺少翔实的使用情况分析,笔者认为不足以说明某词形的语义韵。
否则是否所有词汇的语义韵都可以通过cobuild 语料库中所给出的定义加以判断呢?另外,作者指出jdest中,“相当多”的准技术词具有消极语义韵。
但并没有指明有何依据。
第三,作者只研究“utterly”在jdest一个子库中的使用情况,是哪一子库,能否代表该词在专业英语中的语义韵略有争议。
第四,作者并没有指出 adv+abj和 adv+v 是“utterly”唯一两种类联接还是其主要类联接,是总结全部78次出现语句得出的还是提取20行索引后总结的也没有说明。
2.3 “probability”的错综语义韵错综语义韵即节点词既吸引具有积极语义特点的搭配词也吸引消极和中性语义特点的搭配词。
作者指出,jdest证据显示,大部分准技术词具有错综语义韵。
并以“probability”为例展开说明。
该词在库中出现277次,其中115次用于n+of+n 和 n+of+v-ing两个类联接。
每隔3行取1,共提取30行词语索引。
分析索引归纳“probability of”的名词搭配大致可分为3类:⑴具有中性涵义。
该类搭配词有26个,占全部搭配词总数的23%;⑵具有明显的积极语义特点。
共有搭配词11个,占搭配词总数的9%;⑶具有明显消极语义特点。
作者将此类词放在n+of+n和 n+of+v-ing 两个类联接中进行了细致分析。
结果:两组消极搭配词共有78个,占68%。
该类搭配词中,“failure”和“error”的频数最高,分别出现了7次和5次。
由此,“probability of”具有错综语义韵,且表现出与消极语音韵搭配的极强趋势(68%)。
作者还分析了此现象的可能原因,认为大概是与语言使用者的心理特点有关。
人们通常把事情好的方面认为必然,而推测不好的方面的发生概率。
简评:第一,作者曾在上文指出“相当多”的准技术词具有消极语义韵。
此处又认为“大部分”准技术词具有错综语义韵。
“相当多”与“大部分”有何程度上的差别,又是如何得出的结论显得并不太明确。
第二,此环节,作者通过完全统计归纳总结出“probability”的两种主要类联接,笔者认为具备合理性和说服力。
2.4“career”的积极语义韵在积极语义韵里,节点词吸引的几乎全是具有积极语义特点的搭配词。
由此形成一种积极语义氛围。
作者对比研究了词形“career”在普通英语文本中及专业文本中的使用情况,得出该在两个文本中都具有积极语义韵。
不同的是,在专业文本中,“career”的48个主要搭配词中有30个是名词词性,占总数的63%。
而在普通文本中,名词搭配词只占22%。
占多数的搭配词是形容词,且营造了明显而强烈的积极语义氛围。
作者分析,这一差别可能是由语域和文体所致,因为学术英语较严谨,不太用感情色彩强烈的形容词,而名词化倾向却很强。
另外除了以上述几个词为例论证了专业文本中的语义韵特点,作者还研究发现词语使用存在异常搭配。
一般情况下,由于语义韵的作用,只有能与节点词实现语境和谐的词语才可与其搭配。
然而语言的创造性也是语言使用者有时会故意采用异常搭配,通过造成语义韵冲突来实现某种特殊的语用效果。
文中作者讨论了专业文本中语义韵利用的两个实例以说明这一问题。
①“cause the more spectacular effects”②“utterly effective”原文作者分别引用jdest中的句子,其中“cause”和“utterly”均被用于与其语义韵相反的语境中。
以实现反讽等特殊交际效果。
3 总论由于语义韵多隐藏与字里行间,在很大程度上难以通过我们的直觉来发现。
过去,对语义韵的研究十分有限。
原文中,卫乃兴教授采用合理的研究方法,对语料库中的数据进行定量定性研究,通过统计分类,更加准确的揭示了语义韵。
因为研究对象是专业文本中的语义韵,语料来源选取jdest语料库,该库是已被学界公认的学术英语语料库,能够反映专业英语的使用情况。
并且对比所研究词汇在普通文本中的使用特点,更加充分地说明该词语义韵特点的普遍性和准确性。
对比语料选自cobuild语料库,同样该库能够反映词语的日常使用情况,具有参考价值。
同时,可能限于篇幅等原因,原文存在未能详述之处(见文中第2部分各处简评),但不能说明相应之处的研究结果或数据缺乏真实性。
由于语义韵涉及的因素错综复杂,包括搭配词的词性问题、语域、文体等各方面问题,关于语义韵的相关研究还任重道远。
但是,原文作者的研究尝试为语义韵相关研究指明了方向,具有一定的指导作用。
语义韵的研究没有强大、翔实的语料作为依据,没有科学严谨的研究方法是远远不行的,我们应该格外重视这些方面。
随着更多问题的发现和不断解决,语义韵的研究成果会被更广泛的应用于语用学及认知语言学的研究、efl教学、词典编纂、翻译、文学评论、汉语语料库建设、词汇研究等各领域,促进各领域的相关研究。
语义韵的研究虽然并不成熟,尚缺乏对汉语语义韵或英汉语义韵对比的研究,但语义韵显然是一个极具趣味和潜力的研究领域,值得深入开展下去。
参考文献:[1]alan partington. “utterly content in each other’s company”: semantic prosody and semantic preference. [j]. international journal of corpus linguistics,2004,9,131-156(26).[2]richard xiao and tony mcenery. collocation, semantic prosody, and near synonymy: a cross-linguistic perspective. [j]. applied linguistics, 2006,27(1),103-129.[3]纪玉华,吴建平.语义韵研究对象方法及应用[j].厦门大学学报(哲学社会科学版),2000 (3).[4]潘璠,冯跃进.语义韵律的语料库调查及应用研究[j].当代语言学,2003 (4).[5]王海华,王同顺.cause语义韵的对比研究[j].现代外语,2005(3)。