二语习得中词汇知识的外延_徐泉

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
93 .1
98 .5
词 数 ︵个 ︶
覆 盖 率 ︵ % ︶
15851 97.8
10000 95.7
表 3 语料库及文本覆盖率
布朗语料库收录 100 万形词 , 英国国家语料 否仅意味着掌握它的拼写和意义 ? 掌握一个词的 库收录超过 1 亿形词 。 它们所收录的语料多 , 包 意义是否仅意味着粗略地知道它的常用意义 ? 对 括了各种题材和文体 , 分布广泛 。 因为它们的词 于这些问题的答案 , 几十年来 , 词汇研究者们提出
· 20 ·
外语教学理论与实践(FL L TP)2009 年第 1 期
二语习得中词汇知识的外延
华中师范大学 徐 泉
提 要 :随着二语词汇习得研究的深入开展 , 二语词汇知识外延的界定呈现出复杂的发 展性特点 。 总体
上 , 二语词汇知识包含广度和深度两个方面 。 广度外延的 发展包括二语习得者词汇量和词汇量的统计测量方
数均以标题词为单位统计 , 故与以词族为单位统 了不同的标准 。大体可以分为对词汇深度知识静
计相比 , 覆盖率的百分比数值偏大 。 青少年读物 语料库中的词以词族为单位统计 , 但因为文字难 度较低 , 高频词复现率高 , 故相同高频词数的文本 覆盖率相比较布朗和英国国家语料库为高 。 由于 词由高频至低频在英 语使用中复现 率呈下降趋
义在于探求习得者在 L2 发展过程中需要多少和什 在语言的一般使用中出现的频率 , 分布指在各种不
么样的词汇的问题 。要回答多少的问题 , 作为基础 同文体和领域中的使用情况 。 L2 习得者所需词汇
和参照 , 有必要评估英语的总词汇量和本族语持有 的挑选依据也应是词频和分布 , 其中主要是词频 ,
形词指一段文本中含有的与其他词的拼写形 式互不相同的词 。 如 social , socially 和 society 记 作三个形词 。 一个基词(base)可能有多种曲折变 化 , 每种曲折变化均在基词末尾添加不同的曲折 词尾构成 , 因而其拼写形式均不相同 , 各自均记作 一个形词 。但这一基词和它的不同曲折形式均属
时 , 语料中词的分布接近其在语言自然使用中的真 实分布情况 , 此时就只需考虑词频 。 表 3 列出了 Francis 和 Kucera (1982)、Chujo 和 Utiyama (2005)、 Hirsh 和 Nation (1992)对布朗语料库(Brow n)、英国 国家语料库(BNC)和青少年语料库(Juvenile)中词 频对应文本覆盖率的统计结果 。
词汇知识的广度 , 就是词汇量问题 , 对于习得 者来说就是“知道多少词”的问题 。同时 , 广度依 其界定标准的发展而变化 。因此广度的发展包含 两个意义 :1)L2 习得者自身词汇数量的发展 ;2) 词汇量统计测量方法的发展 。 由于统计测量方法 是研究词汇量的基础 , 下文中先予以讨论 。 3 .1 .1 统计测量方法的发展
态的剖析和动态发展的描述两类 。 3 .2 .1 静态剖析
早在 上世 纪 40 年 代 , 克 隆巴 赫(Cronbach , 1942)就提出词汇知识应包括两个方面的内容 :关 于词义的知识和对这些知识存取的水平 。其中词
表 1 词表及界词标准
影响统计结果的因素除了词的界定外标准 , 所掌握的词数 , 即为受试的总词汇量 。 用词表测
还与测试本身有关 , 体现在两个方面 :1)怎样挑选 受测的词 ;2)题型和测试方式 。对于词的挑选 , 奈 申总 结 出两 种 方 法 :词 典法 和 词 表法 (Nation , 1990)。词典法是在一本词典中随机挑选一定数 量的词 , 让受试解释其意义 , 然后根据换算公式 “词汇量 =正确答案数 ×词典中的总词数 ÷ 测试 中的总词数” , 可计算出受试的词汇量 。 分析换算 公式可知 , 这种方法测试的结果因所用词典所含
编号 1
2
3 4
题型 多项选择 受测词与同义词
或释义连线 写出 L1 对等语
内省报告
缺点 如用 L2 给出的选项中含有生词 , 可能会影响检测结果 。 仅 能检测 消极 词汇知 识 ;如用 L2 给出的 同义 词或 释义
中含有生词 , 可能会影响检测结果 。 仅能检测到 积极词汇 。 让受试自己 报告单词掌握情况 , 测试的信度较难控制 。
法的发展 , 词汇量的发展围绕二语习得者需要多 少和什么样的词汇 的问题展 开 , 测 量方法的发 展围绕着 词的 界定 、测试题型和测试方法展开 。 深度外延发展的重点 是对词汇知 识构成成 分的细化 、类别化 和词汇知识 的 存取 自动化等问题 。 二语词汇知识外延的 发展给 予二语 词汇习 得的启示 在于 , 学习者 应根据 自己的 英语 水 平 , 分三个阶段 , 按不同的目标和重点扩充自己的词汇知识 。
词表名 The T eacher' s Wo rd Book The G eneral Service List T he University Word List T he Academic Wo rd List
收词量 3 00 00 198 6
83 6 57 0
界词标准 标题词 词族 词族 词族
测试比一个基于 100 个词族的测试所得结果词汇 量数值偏大 。 表 1 概括了词汇习得研究史上几个 较有影响的词表及其界词标准 。
研制者 T hor ndike 和 Lorge(1944)
Wes t(19 53) Xue 和 Na tio n(1984:215-229)
Co xhead(2000 :213 -239)
示例研究 Wesche 等 , 1996:13 -39
N ation, 1990 :261 -272
N ation, 1993 :115 -134 Read, 1995:1-17
表 2 题型及缺点分析
3 .1 .2 词汇量的发展
20000 词族并不是同等重要的 。衡量词汇重要性
从 L2 习得角度探讨词汇量的发展问题 , 其意 的一个主要标准是词频和分布(range)。词频指词
对于二语习得者来说 , 其所掌握的词汇知识 可以从“量”和“质”两方面来衡量 。“量”是词汇知 识的广度 , “质”是词汇知识的深度 。 广度指的是 学习者所拥有的词汇量 , 即掌握的对其发音 、拼写 和意义有基本了解的所有单词的集合 。 深度指的
是学习者对单个词语形态 、语义 、语用和运用等各 方面知识所了解和掌握的程度 。广度和深度同为 学习者词汇知识不可或缺的两个方面 , 但在二语 习得研究中 , 两方面各自包含哪些 内容 , 怎样检 测 , 特别是关于深度的组成成分等问题 , 尚处于发 展之中 。 3 .词汇知识外延的发展 3 .1 广度的发展
者的词汇量 。 英语的总词汇量 , 不计合成词 、古词 、 因为当用于选词的语料库足够大 , 且包含各种文体
缩略语 、专有名词和方言形式 , 共约含 54000 词族 (Nation &Waring , 1997)。这 么大的词 汇量对于 L2 习得者来说 , 是遥不可及的 , 普通的本族语持有 者也没有达到该数量 。本族语持有者的词汇量 , 5 岁的学龄儿童约有 4 至 5 千词族 , 大学毕业生约有 20000 词 族(Goulden , Nation & Read , 1990), 但这
词条数的多少而变化 。词表法是从根据词频等级 划分的各级词表中分别选出一定比例的词进行测 试 , 然后以各级词的正确率乘以该级词表中词的
表 。另一方面 , 使用不同的题型也会影响词汇量 测试的结果 。 词汇量测试常用题型有四种 , 它们 的共同优点是易操作 , 但各有不同的缺点 。具体
总数 , 得出该级词中受试所掌握的词数 , 累计各级 类型及缺点分析见表 2 。
源自文库
1 .导言 自 20 世纪八 九十年代以来 , 二语(L2)词汇
习得研 究取得了很大 的发展 。 研究 者从词表设 计 、学习策略 、习得模式 、影响习得的因素 、与语言 技能的关系 、心理词汇 、学习者差异等角度 , 在 L2 词汇习得领域内展开探索 。所研究的问题概括起 来 , 可以分为三类 :1)关于“词”和“词汇知识”的本 体研究(如 Nation , 1990);2)关于 L2 词汇习得的 研究(如 Paribakht & Wesche , 1999);3)关于 L2 词汇使用的研究(如 Wesche & Paribakht , 1999)。 在这三类内容中 , 最基本而且与几乎所有其他具 体问 题相 关的是 本体 研究 中关 于“ 词汇 知识” 外延 (denotation)问题 。 因为清楚地探讨与 L 2 词汇习 得和使用相关的任何方面的具体问题 , 几乎都离 不开对 词汇知识的描 述和测评 。要 测评词汇知 识 , 首先需定义它 , 并弄清它的外延 。但到目前为 止 , 虽然在词的本体 、习得和运用等方面取得了丰 硕的成果 , 但关于词的外延问题的研究仍显得纷 繁复杂 , 头绪繁多 , “关于词汇知识的本质 , 还没有 清楚一致的观点”(Laufer &P aribakht , 1998 :365 -391)。本文拟探讨以下问题 :1)词汇知识的外 延包括哪些方面 ? 2)词汇知识的外延经历了哪些 发展 ? 从二语习得角度分析 , 这些不同的界定有 何优 、缺点 ? 3)词汇知识外延的发展对二语词汇 习得有何启示 ? 2 .词汇知识的外延
要衡量学习者所掌握的词汇量 , 首先要界定 “词”这一基本概念 , 即在统计中 , 什么样的形式算 一个词 。 为了不同的目的 , 采用不同的测试方法 , 所得出的词汇量结果往往呈现出较大的差异性 。 调查 显 示 美 国 大学 生 词 汇 量 在 15000 至 超 过 20000 的 较 大 区 间 内 (Anderson & F reebody , 1981)。之所以出现这么大的差别 , 其中一个原因 在于不同研究者计算词汇量的方法不同 。在词汇 量测 试 和统 计 中 , 有 必 要 区 分 几个 概 念 :形 词 (ty pe)、标题词(lem ma)和词族(w ord f amily)。
准 。在词汇量测试中 , 如果按照不同的标准选取 受测词汇 , 或按不同的标准进行统计 , 最后得出的 数据值的含义是不同的 。 例如 , 一个基于 100 个 形词 , 但其中有较多形词是属于同一个标题词的
意义 , 和它们同属一个词族 , 如 leak , leaky , leakiness , leakage , leaker 属于一个词族 。 形词 、标题词 和词族是衡量何种形 式算一个词的 三种不同标
· 22 ·
外语教学理论与实践(FL L TP)2009 年第 1 期
最高频词数及对应文本覆盖率
研究者
语料库
F rancis 和 Kucera Chujo 和 U tiyama Hirsh 和 Nation
Bro wn BN C Juven ile
词 数 ︵个 ︶
10 00 10 00
覆 盖 率 ︵ % ︶
72
76 .8
词 数 ︵个 ︶
2 00 0 2 00 0 2 00 0
覆 盖 率 ︵ % ︶
7 9 .7
8 4 .2
90
词 数 ︵个 ︶
3 00 0 3 00 0 2 60 0
覆 盖 率 ︵ % ︶
84
8 7 .9
96
词 数 ︵个 ︶
600 0 600 0 500 0
覆 盖 率 ︵ % ︶
89 .9
试的主要问题在于测试结果受限于所选用的词频 表等级 。例 如 , 当 选用的词 频表只包 含 3000 词 时 , 无论受试的实际词汇量有多大 , 测试结果不会 超过 3000 。因此测 试时需根据不同程度的受试 选用词量不同的词表 。 词表法的另一个问题是 , 根据词频构成的词表并不一定包含受试已掌握的 词, 且基于不同的语料统计的词频也不尽相同。 目前 , 在词汇量测试时一般利用含多种等级的词
外语教学理论与实践(FL L TP)2009 年第 1 期
· 21 ·
于同一 个标题 词 , 如 w ait , w ai ts , w ait ing , waited 属于 w ait 这一个标题词 。 大部分基词不仅有曲 折形式 , 还有不同的派生形式 。 派生词通常和该 基词及曲折形式有同样的基词形式和相近的基本
相关文档
最新文档