基于AESOP语料库的宁波方言区英语学习者语音实验研究设计概述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于AESOP语料库的宁波方言区英语学习者语音实验研究设计概
述
本文旨在介绍宁波方言区英语学习者语音语料库(AESOP-Ningbo)的构建,及其在分析发音人语音的音段和超音段声学特征、讨论宁波方言方音在二语习得中的迁移效应和制定改善方言区英语学习者英语语音面貌策略方面的意义和功能。
标签:AESOP二语习得语音实验
一、研究背景
汉语作为以音节计时的声调语言,其独特的音系系统和发音规则与以英语为代表的重音计时拼音语言具有显著差异。然而,以汉语为母语的英语学习者对这种差异的认识多停留在模糊的感知基础上。特别是在方言方音的影响下,学习者往往无意识地将母语音系规则泛化到英语的语音体系中,从而造成语音偏误,并在后续的语言使用阶段进一步延伸和固化(贾媛等,2011)。受资源与条件方面的限制,传统研究多建立在对语音目标构音和感知的“口耳之学”作定性描述的基础上,缺乏现代技术和设备支撑下语音实验研究所具备的客观性和科学性。随着以英语作为第二语言的教学实践和理论研究与语言学、心理学、认知科学以及神经科学甚至工程科学学科背景的逐步融合,特别是计算机和网络技术的推广,语料库语言学和语言标注技术在国内获得相应的发展空间。大规模的英语学习者语料库(如JDEST,HKUST-CLE、CLEC、SWECCL、COLSEC等)为揭示中介语语言特征,归纳语误类型,概括语言发展规律以及反馈和指导外语教学提供了真实的素材,也成为语言量化分析和跨语言对比研究的重要材料源。然而,从方言区英语学习者的语音声学特征出发,基于口语语料库资源和语料标注技术,考察方言方音在英语音韵习得中迁移作用的对策研究在国内仍基本处于空白状态。
亚洲英语学习者语音库项目(AESOP: Asian English Speech Corpus Project)旨在收集和比较亚洲不同地域以英语为第二外语的发音的人口音数据,为研究人员提供开放的语音数据资源,借助语音实验技术,在计算机平台上结合定量与定性分析的方法,获取亚洲英语各变体间的共同特性,并比较母语与目标语音征的差异,分析母语迁移效应对二语习得的影响。2009年,中国应邀成为AESOP项目的正式合作伙伴。研究者在国内不同方言区采集英语学习者的英汉口语语料,考察方言与英语语音格局的系统差异,极大地丰富了AESOP语音资料库的内容。目前,在AESOP框架下对方言区英语学习者音韵特征的研究在山东和江苏两地已初具成果,并逐步向全国十大方言区24个主要城市延伸。
隶属吴语方言区太湖片甬江小片的宁波方言因其独特的声韵系统、四声七调的声调体系及其内部差异和历史沿革而呈现出鲜明的语音特征。然而,基于语料库对宁波方言区学习者英语语音的实验研究以及对宁波方音在中介语语音体系构建中影响的分析在现阶段尚处于空白状态。本文旨在介绍宁波方言区英语学习
者语音语料库(AESOP-Ningbo)的构建及其在分析发音人语音的音段和超音段声学特征、讨论宁波方言方音在二语习得中的迁移效应和制定改善方言区英语学习者英语语音面貌策略方面的意义和功能。
宁波方言区英语学习者语音语料库的创建,不仅有助于学习者对宁波口音英语声学特征的了解和认知,也进一步丰富了AESOP数据库的内容,方便了与其他成员语料间的比较分析。突破一般语料库以文本形式与用户见面的传统方式,语音语料库涵盖了标注文本、声音文件和声学参数三种形式(刘岩,2006)。利用语料库中的录音信息,可以验证母语迁移的语言事实,利用声学参数,可以对语音进行量化分析,AESOP语料库将语音学中的参数VOT、共振峰、语调音系模式等特征用于英语学习者偏误分析,为针对不同方言区学习者提出对应的矫正方法提供了有效途径。
二、研究方法
(一)语料文本
此项研究遴选了吴方言区太湖片甬江小片的典型发音人为被试,借助由中国社会科学院(CASS)语言所语音研究室设计的语料文本,构建了二语学习者英语、方言及普通话语音语料库。
英语语料部分包括源自CMU Dictionary数据库的英语词项共计872个。以单音节词为主,在充分考虑词汇难度、出现频率和语义变化等前提下,兼顾双、多音节词与复合词,尽可能囊括各种元、辅音组合以及重音类型;通过添加部分符合英语音系规则的人工词,考察发音人音段内与音段间的声学特征与构音机制间的关系。此外,对词语产出的筛查还纳入了对目标语和母语间音位配列、音节数量和词重音模式比较的多重考虑。
在句子层面,语料文本包括了791个不同类型、结构和长度的独立语句。以及由CASS提供的415个含短对话在内的语句考察项和旨在考察负载句、韵律边界、窄焦点位置的目标词以及弱读和韵律消歧义现象的测试句88个。在自主音段(AM)理论框架下,通过各类功能句式(包括语音平衡句、疑问句、祈使句、感叹句和焦点句等)的韵律标注和数据提取,实现对发音人语句层面重音指派、音高事件(即音高重音、短语重音和边界调)和节奏型的考察,描述方言区二语习得者独特的韵律特征。
在语句层级以上,通过语篇诵读(包括《北风与太阳》的英文版以及改编自IviE语料库语篇文本的童话故事Cinderella)、半自然的情景对话和看图说话任务来获取连续话语中的音位对立、语音偏误和韵律特征(语速、调域及信息结构等)。
中文语料文本由普通话和宁波方言两部分构成。方言腔的普通话语料分析有助于解释宁波方言对普通话的影响,以及方言与方言腔普通话在学习者英语发音中形成的干扰和迁移作用。宁波方言分布在宁波市六区、奉化、象山、宁海岔路以北、余姚南部、慈溪东部,舟山大部分地区等,使用人口约500万。已有研究
显示,与普通话相比,其声韵系统具有如下特征:声母共计28个,很多声母是宁波话独有的。无翘舌音,有六个独有的擦音,爆破音和鼻音数量均多于普通话,声门音清浊对立在普通话中无对应;韵母共50个(普通话39个),没有儿化音和前鼻音,且其中只有12个韵母出现在普通话韵母体系中。在声调上,较之现代汉语普通话的“三声四调”,宁波方言声调体系可概括为“四声七调”,阳上与阳去不分,保留入声,有着复杂的连续变调。此外,由于空间上的差异和时间上的推进,宁波不同地区的方言乃至新、老宁波话在语音、词汇、语法诸多方面都存在着内部差异,这对受试及语料的选择都产生了影响。
AESOP-Ningbo方言语料文本涵盖了词汇、短语、句子、对话以及篇章总计1464项, 旨在提取宁波方言中最具有代表性的成分,可用于调查方言方音中元音、辅音及声调的典型音韵特征对目标语发音的负向迁移。其中,单音节词的设定囊括了符合宁波方言声韵搭配规则的全部音节和调型(特别是对其所保留的古汉语入声的考察);二、三音节结构覆盖各类调型的组合;语句设计全部采用了问答式的焦点句,而在语篇层面则重复使用了提取发音人英语和方言腔普通话语料的平行文本内容,即《北风与太阳》,以突出呈现宁波方言的音韵特征及其对英语语音的迁移效应。
(二)对发音人的选择
此次AESOP-Ningbo语音库选择了50个发音人,其中男女各25人,出生年份在1984年到1993年之间。发音人中,来自宁波中心城区(江东、江北、海曙)的有26人(地域人口81万),鄞州区19人(地域人口74万),镇海区和北仑区5人(地域人口共57万)。其中在校本科生41人,研究生9人。日常交流语言以普通话为主的有42人,以宁波话为主的4人,其他为宁波话和普通话共用。发音人的父母方言均为宁波话的有47人。发音人的普通话水平良好以上(或普通话二甲水平以上)者15人,中等(或二乙水平以上者)16人,未提供相关信息(或相当于三甲水平)者5人。超过40人具有10年以上的英语学习经历,大部分人的英语水平在中等及以上水平。
(三)语料采录、标注和分析
发音人语音文件采录使用由香港中文大学与中科院深圳先进技术研究院合作开发的CUHK-SIAT录音平台。以便携式电脑和统一型号(SENNHEISER PC166)的内置声卡头戴式耳麦,在低环境噪音(≤300Hz),16000采样率,16位采样精度条件下进行录音。根据语料规模,以单个录音人平均工作8-12小时计算,语料采集计约合400~600小时。
利用跨平台的多功能语音学专业软件praat的语音信息处理功能,综合ToBI、IViE韵律标注系统的设计优势,研究人员可根据需要对采录的语音样本进行手工切分、转写处理和分级标注。并结合语图直观考察发音人L1、L2音段音征和超音段音征的表现,编写并执行Praat脚本程序,提取反映发音人语音特征的各项数据,在实时定量分析与定性分析相结合的基础上,对比被试与本族语发音人语音格局的差异,概括学习者的语音偏误,考察方言方音在二语语音习得中的迁