基于学习者语料库的中介语对比分析法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中介语研究标志着二语习得研究作为独立研 究领域的开始 , 它主要涉及语言能力研究和语用 能力研究两个领域 。早期的对学习者语言能力的 研究 , 在乔姆斯基理论的影响下 , 主要集中在语 法规则的习得上 。20 世纪 80 年代后 、90 年代初 , 人们开始重视词汇的习得研究 。这种对语言能力 的研究方法受到了认知心理学的影响 , 大多采用 量化法 。语用能力的研究则借用了多种人文科学 的研究方法 , 如描述语言学 、会话分析 、互动社 会语言学 、人种志/ 微变化分析 、发展语用学 、认 知社会心理学 、话语阐释和跨文化交际学 。这些 方法包容性很强 , 一方面运用逻辑实证主义倡导 的实验法和问卷法了解二语学习者语用能力的整
34
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
信息 。 中介语对比分析方法 ( CIA) 有两种类型 : 一
是以英语为母语的人 (NS) 的语料与非英语母语的 人 (NNS) 的语料对比 , 另一个是 NNS 与 NNS 的语 料对比 。NNS 与 NNS 的对比又包括两个方面 : 多 个不同母语背景的非本族语语料的比较以及同一 母语背景的非本族语语料库中不同水平学习者语 料的比较 。比较 NS 和 NNS 的语言 , 可以发现学习 者中介语中非本族语的特点 ; 比较 NNS 和 NNS 的 语言 , 可以了解不同学习者群体 ( 如 : 母语背景 不同等) 的语言输出 , 以此来发现和区别一些非 母语的特点 。文秋芳 (2005) 在此基础上 , 进一步 扩大了中介语对比分析的途径 , 即学习者的口语 语料与学习者的笔语语料的比较 。
必然结果 。在学习者语料库建立之前 , 中介语对比分析往往局限于定性分析 。基于学习者语料 库的中介语对比分析法 (CIA) 为研究高水平中介语提供了新视角和新方法 。
关键词 : 中介语 ; 学习者语料库 ; 中介语对比分析 ; 外语教学 中图分类号 : G623131 文献标识码 : A 文章编号 : 100922536 (2006) 0620033204
33
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
体情况 , 另一方面运用建构主义所倡导的人种志 、 个案研究等质化方法来详细描写特定社会文化背 景中的语言交际行为 (王立非 , 2004) 。
一 、引言 二语习得研究作为一门独立的学科形成于 Leabharlann Baidu0
世纪中期 , 不仅涉及母语 (MT) 、目标语 ( TL) 以 及中介语 ( interlanguage) ( Selinker , 1972 , 见 Ellis , 1994) 等语言因素 , 而且还涉及社会文化 、教育 环境 、学习者与学习过程等因素 , 是包含多种因 素 、多种过程与多种关系的极为复杂的研究 ( 王 立非 , 2004) 。研究二语习得的主要方法是收集和 描述学习者的语言 , 主要集中研究学习者所产生 的错误以及这些错误在不同阶段的发展特征 、发 展形式和学习者语言的变体 。自 20 世纪 70 年代中 期以后 , 中介语研究成为二语习得研究领域中的 热点问题 。虽然以学习者为中心的中介语研究得 到广泛认同 , 但基于中介语语料库的研究直到 20 世纪 90 年代才逐步受到重视 。
二 、中介语及其研究方法回顾 Selinker 于 1972 年提出的中介语概念及其围绕
中介语发表的数篇论文一般被认为是第二语言习 得研 究 的 开 端 和 标 志 之 一 ( 王 立 非 , 2004 ) 。 Selinker (1972 , 见 Ellis , 1994) 认为 , 中介语是第 二语言学习者在第二语言学习中形成的一种特定
目前 , CIA 研究语言主要从语音 (如停顿 、节 奏 、语调) 、词汇 ( 如总体特征 、某类词) 、语法 (如过去时 、冠词 、名词短语) 以及语篇 ( 如语篇 标记 、提问 、话轮转换) 四个层面入手 。下面笔 者仅以 so 一词为例 , 简要阐述语篇在 CIA 研究中
的应用 。本文作者从语篇出发 , 根据其功能将 so 分为指代 、替换 、连接等五类 , 并对 so 在不同背 景的语料库 ( 中国学生口语语料库与英国国家语 料库) 的使用进行了对比分析 ( 严华 , 2006) 。研 究结果发现 , 中国学生在口语中总体上过多使用 so 一词 (见表 1) , 在具体功能上 , 如连接 、比较 指称等方面过多使用 , 但在固定短语上又存在使 用不足的现象 , 而在替代功能上 , 与母语使用者 不存在显著性差异 。通过对 so 的实证研究 , 我们 得出结论 : 第一 , 二语学习者过多或过少使用某 些词汇 、语法结构 , 这可以归因为学习者会话中 的策略行为 ( strategic behaviour) , 如过多使用是出 于学习者的偏好 ; 使用不足是由于使用了规避的 原则 ; 错误使用是因为学习者还未能熟练地运用 词汇和语法结构 。第二 , 在口语语篇的教学中 , 应当提高和强化衔接词的讲解和使用 , 要创造一 些课堂活动帮助学生进一步理解和运用衔接词 , 比如 : 可以借助语料库 , 让学生自身发现 so 以及 其他衔接词的特征和使用情况 ; 第三 , 在教学中 , 可以使用语料数据驱动 (data driven) 的方法帮助学 生改进和弥补传统课堂教学中的不足 , 让学生明 白在不同语域中衔接词的使用是有区别的 , 比如 : 衔接词在口语中的使用有别于笔语中的使用 , 即 使在口语中也存在不同的语域 , 比如 : 广播用语 和演讲用语等 。
第8卷 第6期 2006 年 12 月
基础英语教育 J ournal of Basic English Education
Vol18 , No16 Dec1 , 2006
基于学习者语料库的中介语对比分析法
秦 旭 严 华
摘 要 : 中介语是第二语言习得中的一个重要概念 , 对中介语的研究是应用语言学领域对比研究发展的
五 、CIA 在外语教学研究中的应用 以非英语为母语的人即学习者的语料与英语
为母语的人即本族语者的语料进行对比 , 可以了 解学习者语言使用的真实情况 , 如 : 正确使用 (correct use ) 、过 度 使 用 ( overuse ) 、使 用 不 足 (underuse) 、未使用 ( unuse) 和错误使用 ( misuse) 等 。不同母语背景之间的学习者的语料对比 , 可 以揭示不同母语的二语学习者的共性和差异 , 以 便认识二语学习的规律 , 分清中介语中受母语影 响的语言特征与外语学习过程中表现出的阶段性 特征 , 以便在教学中区别对待 。不同水平之间学 习者语料的比较 , 可以了解不同水平中介语的特 征 , 以此推断中介语发展的过程和规律 , 从而在 教学中可以区别处理不同发展阶段上的语言错误 。 学习者口语语料与笔语语料的比较 , 可以发现学 习者口语与笔语的差别 , 以帮助学习者提高语域 意识 (王立非 , 2004) 。CIA 正以其崭新的视角成为 研究中介语最先进的方法之一 ( 俞燕明 , 2004) , 也被 Granger (1998) 称为一切基于学习者语料库研 究的中心 。
语言系统 , 这种语言系统在语音 、词汇 、语法与 语用等方面 , 既不同于母语 , 也不同于所学习的 目标语 , 而是一种随着学习的发展向目标语的正 确形式逐渐靠拢的一种动态的语言系统 , 是一种 介于母语和目标语之间的过渡性语言系统 。中介 语的主要特征之一是其过渡性 , 它处于不断的变 化之中 。也就是说 , 学习者在逐步增加对目标语 了解的过程中 , 实际上在大脑中构建了一系列由 简单到复杂的学习者语法 , 即中介语语法 。
四 、基于学习者语料库的中介语对比分析法 在学习者语料库产生之前 , 由于缺乏大量具
有代表性的语料 , 对比分析往往局限于定性分析 。 二语习得研究中数据分析的方法自从语料库建立 后才产生了重大的变化 。现代学习者语料库往往 与学习者中介语分析联系在一起 。定性分析和定 量分析的结合 , 使得中介语的分析方法日臻科学 。 学习者语言不再被简单看成是一种 “错误”, 而是 普 遍 存 在 于 学 习 者 中 的 一 种 规 则 系 统 ( Ellis , 1994) 。从 20 世纪 90 年代中期开始 , 基于学习者 语 料 库 的 中 介 语 对 比 分 析 ( CIA , Contrastive Interlanguage Analysis) 成为二语习得研究的新方法 ( Granger , 2002) 。Granger (1998) 认为 , 这种对比 分析方法能为外语教学提供极有价值的资 源 和
Granger (2002) 认为 , 内省与诱导的数据也存在局 限性 , 其数据的信度值得怀疑 , 因为在人为的实 验环境下 , 诱导出来的数据与学习者使用的语言 有很大的差异 , 而且如果实验条件有限 , 数据采 集的范围很小 , 得出的结论不具有普遍性 。如今 , 语料库技术的发展为解决以上问题提供了有效的 途径 , 与传统的对比分析不同 , 利用学习者语言 与目的语进行对比 , 也可以在不同的学习者语言 之间进行对比 ( 如 : 不同母语背景的学习者在学 习困难上的差异) , 所得到的信息更加可靠 。基于 学习者语料库的分析也不同于传统的错误 分 析 ( EA) , 研究者不仅可以分析学习者的语言形式错 误和语用错误 , 还能通过对比分析进一步观察学 习者使用规避策略 ( avoidance) 的情况 ( 李文中 , 1999) 。研究者认为 , 学习者采取规避策略是一种 选择的结果 , 当学习者使用目的语时 , 总是从自 己所知道的各种相关词汇和用法中选择最有把握 的来使用 , 这种现象表明了学习者对尚未完全掌 握的语言结构所采取的策略 ( Ellis , 1994) 。此外 , 学习者语料库还具有容量大 、材料真实和代表性 强的特点 , 研究结果不再依靠零星的例证 ; 学习 者语料库有分有合 , 为大样本的定量统计分析与 个案定性文本分析提供了相互结合的可能 。此外 , 语料库可以长期保存 、复制和检索 , 为验证性研 究提供了可能 , 有助于提高研究的信度和效度 。
三 、语料库语言学的发展及其理据 20 世纪 90 年代 , 随着计算机信息技术的蓬勃
发展 , 语料库 、语料库语言学成为语言研究手段 的主流 , 基于语料库的中介语研究方法也不断得 到完善 。现代语料库语言学 , 可以追溯到 Quirk 于 1959 年宣布建立的英语用法调查语料库 ( SELI) , 目的是要对英语语法进行全面准确的描述 , 作为 系统描述英语口语和笔语的依据 , 它标志着语料 库过渡到计算机化语料库 。计算机化语料库的优 势在于它的巨大的信息储存量以及检索的快捷与 准确 。作为一种专用语料库 , 学习者语料库在最 近几十年愈来愈得到高度重视 。学习者语料库通 过收集语言学习者口语和笔语的自然语料 , 试图 建立学习者的语言数据库 , 目的在于对学习者的 语言特征和语言发展进行全面而系统的描述和对 比研究 , 而不仅局限于对学习者的错误进行分析 。 学习者语料库的优势在于能够提供有关学习者语 言发展的综合信息 。基于学习者语料库的分析不 仅能够提供学习者学习的典型困难以及在某一具 体方面的主要障碍的反馈信息 , 而且通过不同类 型学习者的语言对比 , 可以发现语言学习者在某 一发展阶段的共同特征和个体特征 ( 杨惠中 、濮 建忠 , 2002) 。
根据 Ellis (1994) 的观点 , 语言习得研究的数 据主要有三个来源 : 一是学习者在语言使用过程 中的数据 , 反映出学习者在理解和表达时的二语 使用情况 , 这是一种自然语言 ; 二是学习者通过 内省 (introspective) 的方法而提供的数据 , 它是一 种元语言判断数据 (metalingual judgments) , 反映出 学习者对二语的直觉判断 ; 三是研究者为达到某 一研究目标从研究对象中引出的数据 , 收集方法 包括问卷或者有声思维等 。二语习得研究者对这 三种不同来源的数据有着不同的看法 。一些研究 者认为 , 自然语言在样本较少时 , 某语言特征出 现的频率较低 , 而且影响语言使用的变量没有得 到控 制 , 因 而 无 法 对 变 量 进 行 系 统 研 究 。但
34
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
信息 。 中介语对比分析方法 ( CIA) 有两种类型 : 一
是以英语为母语的人 (NS) 的语料与非英语母语的 人 (NNS) 的语料对比 , 另一个是 NNS 与 NNS 的语 料对比 。NNS 与 NNS 的对比又包括两个方面 : 多 个不同母语背景的非本族语语料的比较以及同一 母语背景的非本族语语料库中不同水平学习者语 料的比较 。比较 NS 和 NNS 的语言 , 可以发现学习 者中介语中非本族语的特点 ; 比较 NNS 和 NNS 的 语言 , 可以了解不同学习者群体 ( 如 : 母语背景 不同等) 的语言输出 , 以此来发现和区别一些非 母语的特点 。文秋芳 (2005) 在此基础上 , 进一步 扩大了中介语对比分析的途径 , 即学习者的口语 语料与学习者的笔语语料的比较 。
必然结果 。在学习者语料库建立之前 , 中介语对比分析往往局限于定性分析 。基于学习者语料 库的中介语对比分析法 (CIA) 为研究高水平中介语提供了新视角和新方法 。
关键词 : 中介语 ; 学习者语料库 ; 中介语对比分析 ; 外语教学 中图分类号 : G623131 文献标识码 : A 文章编号 : 100922536 (2006) 0620033204
33
© 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
体情况 , 另一方面运用建构主义所倡导的人种志 、 个案研究等质化方法来详细描写特定社会文化背 景中的语言交际行为 (王立非 , 2004) 。
一 、引言 二语习得研究作为一门独立的学科形成于 Leabharlann Baidu0
世纪中期 , 不仅涉及母语 (MT) 、目标语 ( TL) 以 及中介语 ( interlanguage) ( Selinker , 1972 , 见 Ellis , 1994) 等语言因素 , 而且还涉及社会文化 、教育 环境 、学习者与学习过程等因素 , 是包含多种因 素 、多种过程与多种关系的极为复杂的研究 ( 王 立非 , 2004) 。研究二语习得的主要方法是收集和 描述学习者的语言 , 主要集中研究学习者所产生 的错误以及这些错误在不同阶段的发展特征 、发 展形式和学习者语言的变体 。自 20 世纪 70 年代中 期以后 , 中介语研究成为二语习得研究领域中的 热点问题 。虽然以学习者为中心的中介语研究得 到广泛认同 , 但基于中介语语料库的研究直到 20 世纪 90 年代才逐步受到重视 。
二 、中介语及其研究方法回顾 Selinker 于 1972 年提出的中介语概念及其围绕
中介语发表的数篇论文一般被认为是第二语言习 得研 究 的 开 端 和 标 志 之 一 ( 王 立 非 , 2004 ) 。 Selinker (1972 , 见 Ellis , 1994) 认为 , 中介语是第 二语言学习者在第二语言学习中形成的一种特定
目前 , CIA 研究语言主要从语音 (如停顿 、节 奏 、语调) 、词汇 ( 如总体特征 、某类词) 、语法 (如过去时 、冠词 、名词短语) 以及语篇 ( 如语篇 标记 、提问 、话轮转换) 四个层面入手 。下面笔 者仅以 so 一词为例 , 简要阐述语篇在 CIA 研究中
的应用 。本文作者从语篇出发 , 根据其功能将 so 分为指代 、替换 、连接等五类 , 并对 so 在不同背 景的语料库 ( 中国学生口语语料库与英国国家语 料库) 的使用进行了对比分析 ( 严华 , 2006) 。研 究结果发现 , 中国学生在口语中总体上过多使用 so 一词 (见表 1) , 在具体功能上 , 如连接 、比较 指称等方面过多使用 , 但在固定短语上又存在使 用不足的现象 , 而在替代功能上 , 与母语使用者 不存在显著性差异 。通过对 so 的实证研究 , 我们 得出结论 : 第一 , 二语学习者过多或过少使用某 些词汇 、语法结构 , 这可以归因为学习者会话中 的策略行为 ( strategic behaviour) , 如过多使用是出 于学习者的偏好 ; 使用不足是由于使用了规避的 原则 ; 错误使用是因为学习者还未能熟练地运用 词汇和语法结构 。第二 , 在口语语篇的教学中 , 应当提高和强化衔接词的讲解和使用 , 要创造一 些课堂活动帮助学生进一步理解和运用衔接词 , 比如 : 可以借助语料库 , 让学生自身发现 so 以及 其他衔接词的特征和使用情况 ; 第三 , 在教学中 , 可以使用语料数据驱动 (data driven) 的方法帮助学 生改进和弥补传统课堂教学中的不足 , 让学生明 白在不同语域中衔接词的使用是有区别的 , 比如 : 衔接词在口语中的使用有别于笔语中的使用 , 即 使在口语中也存在不同的语域 , 比如 : 广播用语 和演讲用语等 。
第8卷 第6期 2006 年 12 月
基础英语教育 J ournal of Basic English Education
Vol18 , No16 Dec1 , 2006
基于学习者语料库的中介语对比分析法
秦 旭 严 华
摘 要 : 中介语是第二语言习得中的一个重要概念 , 对中介语的研究是应用语言学领域对比研究发展的
五 、CIA 在外语教学研究中的应用 以非英语为母语的人即学习者的语料与英语
为母语的人即本族语者的语料进行对比 , 可以了 解学习者语言使用的真实情况 , 如 : 正确使用 (correct use ) 、过 度 使 用 ( overuse ) 、使 用 不 足 (underuse) 、未使用 ( unuse) 和错误使用 ( misuse) 等 。不同母语背景之间的学习者的语料对比 , 可 以揭示不同母语的二语学习者的共性和差异 , 以 便认识二语学习的规律 , 分清中介语中受母语影 响的语言特征与外语学习过程中表现出的阶段性 特征 , 以便在教学中区别对待 。不同水平之间学 习者语料的比较 , 可以了解不同水平中介语的特 征 , 以此推断中介语发展的过程和规律 , 从而在 教学中可以区别处理不同发展阶段上的语言错误 。 学习者口语语料与笔语语料的比较 , 可以发现学 习者口语与笔语的差别 , 以帮助学习者提高语域 意识 (王立非 , 2004) 。CIA 正以其崭新的视角成为 研究中介语最先进的方法之一 ( 俞燕明 , 2004) , 也被 Granger (1998) 称为一切基于学习者语料库研 究的中心 。
语言系统 , 这种语言系统在语音 、词汇 、语法与 语用等方面 , 既不同于母语 , 也不同于所学习的 目标语 , 而是一种随着学习的发展向目标语的正 确形式逐渐靠拢的一种动态的语言系统 , 是一种 介于母语和目标语之间的过渡性语言系统 。中介 语的主要特征之一是其过渡性 , 它处于不断的变 化之中 。也就是说 , 学习者在逐步增加对目标语 了解的过程中 , 实际上在大脑中构建了一系列由 简单到复杂的学习者语法 , 即中介语语法 。
四 、基于学习者语料库的中介语对比分析法 在学习者语料库产生之前 , 由于缺乏大量具
有代表性的语料 , 对比分析往往局限于定性分析 。 二语习得研究中数据分析的方法自从语料库建立 后才产生了重大的变化 。现代学习者语料库往往 与学习者中介语分析联系在一起 。定性分析和定 量分析的结合 , 使得中介语的分析方法日臻科学 。 学习者语言不再被简单看成是一种 “错误”, 而是 普 遍 存 在 于 学 习 者 中 的 一 种 规 则 系 统 ( Ellis , 1994) 。从 20 世纪 90 年代中期开始 , 基于学习者 语 料 库 的 中 介 语 对 比 分 析 ( CIA , Contrastive Interlanguage Analysis) 成为二语习得研究的新方法 ( Granger , 2002) 。Granger (1998) 认为 , 这种对比 分析方法能为外语教学提供极有价值的资 源 和
Granger (2002) 认为 , 内省与诱导的数据也存在局 限性 , 其数据的信度值得怀疑 , 因为在人为的实 验环境下 , 诱导出来的数据与学习者使用的语言 有很大的差异 , 而且如果实验条件有限 , 数据采 集的范围很小 , 得出的结论不具有普遍性 。如今 , 语料库技术的发展为解决以上问题提供了有效的 途径 , 与传统的对比分析不同 , 利用学习者语言 与目的语进行对比 , 也可以在不同的学习者语言 之间进行对比 ( 如 : 不同母语背景的学习者在学 习困难上的差异) , 所得到的信息更加可靠 。基于 学习者语料库的分析也不同于传统的错误 分 析 ( EA) , 研究者不仅可以分析学习者的语言形式错 误和语用错误 , 还能通过对比分析进一步观察学 习者使用规避策略 ( avoidance) 的情况 ( 李文中 , 1999) 。研究者认为 , 学习者采取规避策略是一种 选择的结果 , 当学习者使用目的语时 , 总是从自 己所知道的各种相关词汇和用法中选择最有把握 的来使用 , 这种现象表明了学习者对尚未完全掌 握的语言结构所采取的策略 ( Ellis , 1994) 。此外 , 学习者语料库还具有容量大 、材料真实和代表性 强的特点 , 研究结果不再依靠零星的例证 ; 学习 者语料库有分有合 , 为大样本的定量统计分析与 个案定性文本分析提供了相互结合的可能 。此外 , 语料库可以长期保存 、复制和检索 , 为验证性研 究提供了可能 , 有助于提高研究的信度和效度 。
三 、语料库语言学的发展及其理据 20 世纪 90 年代 , 随着计算机信息技术的蓬勃
发展 , 语料库 、语料库语言学成为语言研究手段 的主流 , 基于语料库的中介语研究方法也不断得 到完善 。现代语料库语言学 , 可以追溯到 Quirk 于 1959 年宣布建立的英语用法调查语料库 ( SELI) , 目的是要对英语语法进行全面准确的描述 , 作为 系统描述英语口语和笔语的依据 , 它标志着语料 库过渡到计算机化语料库 。计算机化语料库的优 势在于它的巨大的信息储存量以及检索的快捷与 准确 。作为一种专用语料库 , 学习者语料库在最 近几十年愈来愈得到高度重视 。学习者语料库通 过收集语言学习者口语和笔语的自然语料 , 试图 建立学习者的语言数据库 , 目的在于对学习者的 语言特征和语言发展进行全面而系统的描述和对 比研究 , 而不仅局限于对学习者的错误进行分析 。 学习者语料库的优势在于能够提供有关学习者语 言发展的综合信息 。基于学习者语料库的分析不 仅能够提供学习者学习的典型困难以及在某一具 体方面的主要障碍的反馈信息 , 而且通过不同类 型学习者的语言对比 , 可以发现语言学习者在某 一发展阶段的共同特征和个体特征 ( 杨惠中 、濮 建忠 , 2002) 。
根据 Ellis (1994) 的观点 , 语言习得研究的数 据主要有三个来源 : 一是学习者在语言使用过程 中的数据 , 反映出学习者在理解和表达时的二语 使用情况 , 这是一种自然语言 ; 二是学习者通过 内省 (introspective) 的方法而提供的数据 , 它是一 种元语言判断数据 (metalingual judgments) , 反映出 学习者对二语的直觉判断 ; 三是研究者为达到某 一研究目标从研究对象中引出的数据 , 收集方法 包括问卷或者有声思维等 。二语习得研究者对这 三种不同来源的数据有着不同的看法 。一些研究 者认为 , 自然语言在样本较少时 , 某语言特征出 现的频率较低 , 而且影响语言使用的变量没有得 到控 制 , 因 而 无 法 对 变 量 进 行 系 统 研 究 。但