影响留学生汉字习得因素的调查与分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

影响留学生汉字习得因素的调查与分析
本文从分析影响留学生汉字习得的因素入手,通过对92份有效问卷的分析,按照数学期望值大小来划分各因素的影响力等级。

在分析过程中区分了汉字文化圈与非汉字文化圈学生的不同情况,得出了不同汉字背景下,笔画数、部件数、理据性、义项数、字频汉字结构、构词能力这七个因素对汉字习得影响力大小的顺序。

标签:汉字因素留学生习得调查分析
一、影响留学生汉字习得的因素
(一)影响汉字认知的字形因素
现代汉字的字形可以分成“笔画”“部件”和“整字”三个层次。

笔画是构成汉字字形的最小单位,是研究汉字的基础,也是对外汉字教学的基础。

笔画数量影响学习者对汉字的辨识,虽然有个别研究结果反映笔画数多少不影响汉字认知,但大多数学者采用认知心理学研究方法得出量化数据验证了少笔画字的认知易于多笔画字。

第二层次部件是由汉字组成的具有组配汉字功能的构字单位,它大于或等于笔画,小于或等于整字。

它对汉字学习产生的影响表现在部件频率、部件位置和部件数三方面。

韩布新(1998)发现部件频率有易化作用,即部件频率高的汉字识别要优于部件频率低的汉字。

而针对留学生汉字加工的实验发现部件的位置信息影响汉字识别,左右结构字的右下角笔画易抽取,包围结构字的左上角笔画易抽取;右部件比左部件作用大,下部件比上部件作用大。

至于部件数量,大量实验表明在控制笔画数干扰的情况下,少部件字的识别加工快于多部件字。

第三层次是整字,汉字的结构模式①体现了汉字中各个部件的组合规律,而对比汉字和拼音文字的形体特征差异时发现“在汉字字形属性笔画、部件和结构方式三者当中,最能体现这种差异的是结构方式”(肖少北、许晓艺,1996)。

大量研究表明,母语者在学习和使用汉语过程中受到“结构方式效应”的影响,即左右结构的汉字识别加工优于上下结构。

对于非汉字文化圈学习者的实验出现了不同于母语者实验的结论,汉字的结构类型影响汉字的学习,独体字识别优于合体字,但在合体字中,上下结构字的识别优于左右结构字。

(二)影响汉字认知的音义因素
文字是记录语言的一套符号系统,而“文字的理据就是字理,真正实用的文字都是有理据的。

”拼音文字用字母表示音素或音节,这些字母按照一定的规则拼合能表示所构词的读音,而作为表意文字代表的汉字,它的理据性就表现在汉字字形直接与语言中的音或者义发生联系。

“一般地说,理据性高的文字,学习和使用比较方便;理据性低的文字,学习和使用比较困难”(苏培成,2001:102)。

外国人感觉汉字难学的主要原因在于“把汉字当成没有联系、毫无意义的符号,一个一个地死记硬背”(赵妍,2006),他们不能很好地将汉字字形与字音、字义联系起来,即见字知音或见字知义。

因为现代汉字中形声字的比例仍然很高,所以从形旁或者声旁入手去记忆汉字,仍然是扩大字量、记忆音义的重要手段。

绝大部分现代汉字是有理据的,在对外汉语汉字教学中,仍可从现代汉字的理据性入手,通过现代汉字的音、形、义之间的联系帮助留学生发现汉字规律,提高学习效率。

(三)字频及复现率
对于影响母语者学习汉字效果的因素,除了字形复杂性(笔画数、部件数)和结构类型等,汉字的频率也对汉字学习成绩起一些作用。

“字频,即汉字在汉语书面材料中出现的次数,是一种客观的统计指标,它常常被研究者用来代表汉语读者对汉字的实际接触频率和熟悉程度。

”(江新,2007:109)英国学者埃利斯在《语言加工中的频率效应》中指出,语言加工的所有方面都受到语言输入频率的影响,即汉字认知过程中存在字频效应——人们对高频字的认知要比低频字快。

很多研究证明,母语者汉字学习效果受到字频效应的影响,而针对外国人学习汉字的一些研究也发现存在字频效应。

刘丽萍(2002)认为作为衡量字形熟悉度的指标,字频是影响汉字识别的重要因素。

其通过计算非汉字背景留学生的汉字识别正确率与汉字频率间的相关系数,发现两者关系密切,字频高则识别易。

另外一些研究则表明,汉字复现率②在某种程度上同样影响着留学生的汉字学习。

“汉字在教材中出现的次数会影响留学生学习汉字的效果。

因为同一个汉字接触次数越多,学习者对该汉字的熟悉性就会提高,在心理词典中的表征就更精确,识别记忆所需的时间就越短”(郝美玲、刘友谊,2007)。

江新(2004)通过对拼音文字背景汉语初学者的拼音组词纸笔实验,得出最佳复现率至少为7次,且若汉字在课文及生词表中出现的次数为24次,被试正确率高达70%。

可见,在教材中控制好汉字的重现次数有助于汉字学习。

(四)构词能力
张凯(1997)利用计算机统计分析了《现代汉语常用字表》的3500字的构词率(构词个数)③,总结出“现代汉语中的大部分词汇是由这3500字构成的。

对我们能用于是汉语的人来说,掌握了这3500字,就具备了理解70000个词的基本条件”(张凯,1997)。

这说明汉语中数量有限的汉字构成了数十倍于己的词汇,以构词数多的字带动词的学习方式能减轻记忆负担。

另一方面,某字的构词数越多,出现在印刷品及口语中的频率就越高,那么学生对它们的学习效果就更好,所以不少学者认为初级汉语阶段应该教授留学生构词能力强的汉字。

而大量针对汉字学习的实验确实发现构词数效应的存在。

赵果(2003)采取注音组词实验发现字在教材中的构词数的确影响初级欧美学生的识字量,发现构词数多的汉字的学习效果优于构词数少的汉字。

且相比较频率、笔画数、部件数,“从偏相关看,汉字构词数与汉字学习效果的关系最为密切。

”(江新、赵果,2006)
二、关于影响汉字学习因素的问卷调查
对于前人实验或经验总结出的影响因素,我们存在两个疑问:第一,虽然大部分实验结果证明这些因素对外国汉字学习者发生作用,然而,也存在一些不一致甚至相反的实验结果。

如“构词能力”一项,冯丽萍、宋志明(2004),郝美玲、刘友谊(2007)发现构词数效应受到词素类别④、学习者母语背景和字频的制约,而江新(2006)采用纸笔实验⑤检测不到明显的构词数效应。

第二,得到广泛认可的汉字学习影响因素对学习者施予的影响力大小如何?这方面的探讨较少且结论不一。

杨成思认为与语言应用相关的“字频级”“构词频率”“理据性”比与汉字符号本身相关的“笔画”“部件数”“结构类型”“义项数”等影响程度大,而施莎在设计字序表时认为理据性对汉字编排最重要,其次是构词能力,最后才是与汉字自身的笔画、部件因素。

为了避免主观因素干扰,本文将结合外国汉字学习者的问卷分析确定初级汉字教材汉字选取依据及权重赋分等级。

本次问卷发放99份,剔除7份无效问卷,共收集92份。

(一)调查对象
目前区分国别及文化圈的汉字教材较少,所以本文中讨论的影响因素的作用对象包括把汉语作为第二语言学习的所有外国人,对他们汉字水平的划分主要依据其掌握汉字的数量。

《汉字等级大纲》规定初级阶段汉字包括甲、乙级共1604个,但其对字量的确定与分级取决于相应等级的词汇量,没有很好体现汉字的自身规律,所以“按照汉字自身出现频率而统计出来的汉字覆盖率,将是确定汉字输入量的一个重要依据”(李炎、孟繁杰,2006)。

参照《中国语言生活绿皮书》《现代汉语频率词典》《汉字频率统计表》《汉字等级大纲》《社会科学、自然科学综合字频统计表》及《汉字流通频率表》对常用字覆盖率的统计,本文对初级汉字水平的划分以1000为界:掌握字量小于等于1000是初级水平,1000以上识字量不再细分中、高级,一律记作非初级水平。

本次问卷调查对象横向涉及汉字圈、非汉字圈学习者,纵向包括初、中高级汉字学习者。

一方面,在广范围内获取作用于初级阶段外国汉字学习者的普遍影响因素,另一方面,可以从不同水平阶段汉字学习者的信息反馈中总结出一些影响因素的动态变化规律。

参与此次问卷调查的有韩国延世大学30名对外经济贸易专业留学生,除4名归为初级水平外,其余26人皆为中高级水平;中国人民大学初级汉字书写班的9名留学生,其中除一名来自韩国,其余都是欧美籍(将该韩国学生问卷并入延世大学问卷集),他们的识字量在50~500间,属于初级水平⑥;爱尔兰孔子学院的46名汉语学习者,一人识字量不确定,一人识字量3000属于高级水平,2人识字量1500属于中级水平,其余42人识字量在20~1000之间,属于初级水平;意大利博洛尼亚孔子学院的15名汉语学习者,15人识字量在30~200之间,都属于初级水平。

(二)调查内容
问卷内容大体包含三部分:第一部分为开放题,询问学习汉字的时长与掌握
字量以及对于“汉字难学”的看法,这么设计方便后续汉字水平分类工作,可以根据对方掌握字量情况将问卷分为初级、中、高级两档;第二部分是选择题,对前人总结出的影响汉字学习因素的作用效果进行“是、不确定、否”的三选一判断,每道题附有例子帮助答卷者理解题意;最后一部分是排序题,要求结合答卷者本人汉字学习经历,从上述七个因素中选取影响因素并对它们的影响程度从高到低进行排序。

具体来说,第二部分的七个因素来源有三:一是学界普遍承认的选字依据,如“理据性”“构词能力”“字频”;二是研究者们通过实验证明过的“笔画数效应”“部件数效应”“结构效应”,虽然实验结论尚不一致,我们先将其“笔画数”“部件数”“汉字结构”纳入了设题范围,留待答卷人的选择。

对于“汉字结构”一项又附有追问,即对“上下”“左右”“包围”“框架”四种结构的学习难易进行排序,这样做一方面防止此项出现随意作答的情况,另一方面可以探寻被调查者对四种汉字结构的难易认识是否同于实验结果;来源三是前人研究论文中曾涉及而未得到理论和实验证明的因素,即“义项数”。

(三)调查结果
1.汉字文化圈
从韩国汉字学习者处收集的31份问卷,统计第二部分答案发现有两处“极值”。

一处是“笔画数”“部件数”“字频”三项,不论处于初级还是中高级水平,学习者全都选择“同意影响汉字学习”;另一处是“义项数”栏,除一人选择“不确定”,其余皆选“不同意影响汉字学习”。

而剩下三项的答案“不确定”远多于“否定”。

“汉字结构”项:初级水平5人,只有一人选“同意”项,3人不确定,一人选“不同意”。

中高级水平学习者11.5%的人认为其不影响自己学习汉字,剩下的88.5%选择“不确定”;“构词能力”项:初级水平无一人选“同意”,中高级水平学习者一人赞成其影响自己汉字学习,7.7%的人选择否定答案,88.5%选择“不确定”;“理据性”项:初、中高级者无人同意其影响汉字学习,中高级者有38.5%的人选择“不确定”,而61.5%否认其对自己产生影响。

针对第三部分问题,剔除4份初级水平者的答卷与1份无效问卷⑦,剩下26份中高级水平问卷。

为了科学合理地得出各因素影响力大小的排序,我们在本文中引用“数学期望值”对问卷数据进行分析。

离散型随机变量的数学期望指离散型随机变量的一切可能的取值xi与对应的概率Pi(=xi)之积的和。

根据调查结果计算某个因素的真实排名,这一过程可以看成是求该因素排名的数学期望。

某一个因素X(七个当中的一个)的绝对排名应该是确定的,但是不同被调查个体的直观选择却是随机的,第一到第七的七个排名都有可能被选到,我们把该因素的排名看作一个随机变量,当样本(参加调查的人数)足够大时,这个排名的期望应该趋近于真实的排名。

该因素的真实排名越靠前,那么它的数学期望就应该越低。

作为随机变量,一个因素的排名在调查的时候有第一到第七七种可能的取值,每种取值乘以它在样本中出现的概率,求和后得到的就是该随机变量的期望值。

该方法从统计的角度上讲是正确的,可以用极端情况来检验。

不妨做个假设,所有参与调查的样本在排序的时候所做的决定都是绝对正确的,与真实排名吻合,假设因素“X”的真实排名是“x”,那么所有人在选择时给因素“X”的排名都将是“x”,其数学期望EX=1*A%+2*B%+…+7*G%=x,即数学期望和真实排名吻合。

即使实际情况没有这么绝对,当样本足够大的时候,排名的期望和排名的真实值也应该是趋近和吻合的。

统计计算数据如表1,表中数据Px⑧是X因素排名第N位的概率,即“排第N位时X因素的被选次数A2”与“选X的总次数B2”之比,P1是X因素排第一时的概率,P2、P3、P4、P5、P6、P7依次类推,EX指因素X的排名期望值x⑨。

根据表1,我们可以对各因素影响力进行排序:第一,字频(1.58);第二,笔画数(1.96);第三,部件数(2.50);第四,构词能力(4.31);第五,汉字结构和义项数(5.46);第六,理据性(6.73)。

表1:汉字圈各因素影响力排序期望值表
因素
概率笔画数A 部件数B 字频C 汉字结构D 义项数E 构词能力F 理据性G
P1 7/26 3/26 16/26 0 0 0 0
P 2 13/26 8/26 5/26 0 0 0 0
P3 6/26 14/26 5/26 0 0 1/26 0
P4 0 1/26 0 3/26 4/26 18/26 0
P5 0 0 0 12/26 9/26 5/26 0
P6 0 0 0 7/26 10/26 2/26 7/26
P7 0 0 0 4/26 3/26 0 19/26
x(EX)1.96 2.50 1.58 5.46 5.46 4.31 6.73
对比分析二、三部分题目的结果可以发现96.7%的人不同意“义项数”影响汉字学习,在排序题中“义项数”数学期望列第六位,两者表现一致。

但结合其在问卷上的批注发现韩国学生并不否认“义项数”影响自己认知汉字,而是认为汉字义项越多越容易导致混淆,进而造成识记负担。

而杨成思认为“如果在教授汉字的过程中,能将汉字承载的多个义项有机结合串联起来,就可以达到学习有限的汉字而扩展多个词的效果,对学习者有效利用所学汉字表达语言是大有帮助的”(杨成思,2009)。

这与我们的问卷结果有矛盾,说明“义项数”的确对汉字学习起一定作用,但是起负作用还是正作用还有待进一步研究。

至于大多数人不确定对汉字结构类型是否影响汉字学习,原因在于“韩文字母文字也是方块形,而且其结构也是以左右结构和上下结构为主……这些字母经过排列组合,形成方块型拼音文字”(郭圣林,2010),这种与汉字字形相似的特点对习得汉字产生正迁移,他们不大受汉字结构类型的影响。

参与问卷调查的韩国学生大多处于汉字中、高级水平,且一部分人学习了相当数量的繁体字,所以对汉字理据性有较多认识,冯丽萍针对汉字圈与非汉字圈学生的汉字语音加工的实验结果也证明了此点,汉字圈学生能利用形、音之间的联系,采取声旁推理、形似推理策略,“形与音之间的联系较固定”,而非汉字圈学生“对于字形和字音的联系不太固定”(冯丽萍,2002),常常利用语义和语境来记忆语音。

从第三部分结果可以发现影响韩国学生学习汉字的首要因素是字频、笔画数、部件数,理据性影响力最弱,这与前人对理据性的影响力评估也有一定偏差。

2.非汉字文化圈
本次针对非汉字文化圈的欧美籍学生的问卷调查一共61份,剔除其中三份非初级水平问卷(识字量在1000~3000),剩余58份作为统计分析对象。

我们发现第二部分答卷情况与韩国的共性之处多于异性。

相同点在于两者对笔画数、部件数、字频归入影响因素的肯定和对义项数的否定。

超过70%的人认为笔画数、部件数和字频影响自己的汉字学习(笔画74.1%; 部件82.8%;字频79.3%),只有15.5%的人同意义项数的多寡影响汉字识记,通过访谈了解到他们所谓的影响和韩国学生的一样,都认为汉字的义项数越多越容易引起混淆从而抑制汉字识记。

不同之处则表现在对“构词能力”和“理据性”的认可度上升,63.8%的学习者认为汉字构词数越多越有利于自己的汉字学习,而同意将理据性纳入影响因素的人数近58.6%。

另外,我们发现,随着识字量的增加,同意理据性影响汉字学习的人数越多。

将汉字初级水平欧美籍学生的识字量分为4级,一级掌握字量100及其以下者,同意度⑩仅为39.4%(13/33);二级掌握字量100~200(含200)者,同意度上升到88.9%(8/9);三级掌握字量200~500(含500)者,同意度为75%(9/12);四级掌握字量500~1000(含1000)(4/4)者,同意度高达100%。

总体来看,识字量越多,越认同理据性的影响力,说明理据性的作用要在一定的识字量基础上才会显现。

崔永华和陈小荷(2000)曾借助汉语中介语料库,通过统计对比非汉字圈学习者使用汉字的情况,发现“非汉字圈学习者汉字使用错误率,与构成汉字的部件数、笔画数和大纲等级呈正相关11,与汉字的使用频率12和构词等级呈负相关13,且以上因素跟错误率都显著相关。

”我们的问卷结果也明显反映出笔画数、部件数、字频级、构词能力影响非汉字圈学习者学习汉字。

至于“汉字结构”,9.7%的人选择否定选项,而近45%的人认为其影响自己学习汉字,但只有29%的人对四种汉字结构难易程度进行排序。

关于“左右结构”“上下结构”“包围结构”和“框架结构”孰难孰易,共有8种排序方式,统计发现,超过80%的人认为左右型汉字最易、框架结构最难,77.8%的人把包围型列于第三位,55.5%的人将上下型汉字排在第二位。

这能在一定程度上反映“结构方式效应”,但由于完成排序的人数基数较少(18人),且还存在例外情况,我们认为这部分的统计数据不一定具有代表性。

第三部分对于各个因素影响力大小排序,我们依旧按照数学期望值大小来划分各因素的影响力等级。

由于部分填卷者只选出影响自己学习的因素而未进行排序,所以本部分的有效问卷14共23份。

表2:非汉字圈各因素影响力排序期望值表
因素
概率笔画数A 部件数B 字频C 汉字结构D 义项数E 构词能力F 理据性G
P1 5/21 5/21 2/21 1/21 3/21 0 5/21
P 2 5/21 3/21 5/21 3/21 1/21 4/21 0
P3 2/21 5/21 3/21 1/21 5/21 1/21 4/21
P4 4/21 0 4/21 3/21 3/21 4/21 3/21
P5 1/21 2/21 1/21 6/21 3/21 4/21 4/21
P6 0 5/21 4/21 5/21 3/21 4/21 0
P7 4/21 1/21 3/21 2/21 3/21 4/21 5/21
x(EX)3.33 3.48 4.14 4.57 4.10 4.71 4.00
根据上表的统计数据,我们得到各因素影响力进行排序:第一,笔画数(3.33);第二部件数(3.48);第三,理据性(4.00);第四,义项数(4.10);第五,字频(4.14);第六,汉字结构(4.57);第七,构词能力(4.71)。

注释:
①苏培成根据第一级部件的组合模式将合体字分为“左右结构”“上下结构”“包围结构”和“框架结构”。

②所谓复现率,是指字或词在教材中重复出现的次数。

③构词率=单音+双音/2+三音/3+四音/4+五音/5+六音/6
④构词数影响粘着词素的识别,对自由词素没有明显作用。

⑤该实验采用的汉字频率表和构词数主要以汉语学习者在学校课堂学习中使用的统一课本为基础统计得到。

⑥参照引言中引述的“初级输入字量”,此处“初级水平”为1000及其以内。

⑦问卷第三部分问题未作答。

⑧Px=A2/B2
⑨x=1*P1+2*P2+3*P3+4*P4+5*P5+6*P6+7*P7(保留两位小数)。

⑩同意度=同意理据性影响汉字学习的人数/总人数。

k部件越多、笔画越多、大纲等级越高,错误率越高。

l语料库中的使用频率和公共使用频率。

m使用频率越高、构词等级越高,错误率越低。

n对7个因素的影响力大小进行排序的问卷。

参考文献:
[1]韩布新.汉字识别中部件的频率效应[J].心理科学,1998,(3).
[2]肖少北,许晓艺.结构方式在汉字识别中的作用[J].应用心理学,1996,(1).
[3]苏培成.现代汉字学纲要[M].北京:北京大学出版社,2001.
[4]赵妍.现代汉字的理据性与对外汉字教学[J].语言文字应用,2006,(2).
[5]刘丽萍.非汉字背景留学生汉字形音识别的影响因素[J].汉字文化,2002,(3).
[6]江新.“认写分流、多认少写”汉字教学方法的实验研究[J].世界汉语教学,2007,(2).
[7]郝美玲,刘友谊.留学生教材汉字复现率的实验研究[J].语言文字应用,2007,(2).
[8]江新.汉字复现率对拼音文字背景的外国学生汉字学习的影响[A].北京地区第三届对外汉语教学学术研讨会论文选[C].北京:北京大学出版社,2004:437~445.
[9]崔永华.汉字部件和对外汉字教学[J].语言文字应用,1997,(3).
[10]张凯.汉语构词基本字的统计分析[J].语言教学与研究,1997,(1).
[11]江新,赵果,黄慧英,柳燕梅,王又民.外国学生汉语字词学习的影响因素——兼论《大纲》字词的选择与分级[J].语言教学与研究,2006,(2).
[12]冯丽萍,宋志明.词素性质与构词能力对留学生中文词素识别的影响[J].云南师范大学学报(对外汉语教学与研究版),2004,(6).
[13]崔永华,陈小荷.影响非汉字圈汉语学习者汉字学习因素的分析[J].海外华文教育,2000,(1).
[14]冯丽萍.汉字认知规律研究综述[J].世界汉语教学,1998,(3).
[15]张旺熹.从汉字部件到汉字结构——谈对外汉字教学[J].世界汉语教学,1990,(2).
[16]柳燕梅.从识记因素谈汉字教材的编写原则[J].汉语学习,2002,(5).
[17]李焱,孟繁杰.初级阶段对外汉语教材汉字输入量及字目选择[A].首届全国教育教材语言专题学术研讨会[C].厦门:厦门大学出版社,2006:113~116.
(李禄兴北京中国人民大学文学院100872)。

相关文档
最新文档