太原南郊方言的单字调调值的实验分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
太原南郊方言的单字调调值的实验分析
晋语作为北方官话体系中一种保留入声的方言,受到各方言学家的关注。晋语方言研究学者也对晋语方言的方音进行了深入的研究。太原市中心的太原话本应该为晋语的代表性语言之一,但是和其他方言研究遇到的问题一样,由于普通话的推广,如今在太原市内能熟练并且地道地使用晋语的人数已大为减少。另外一方面,太原市原南郊区的方言与老太原话基本接近,现在依然保持了太原方言的特点。本文使用实验语音学的方法对以南坪头村为代表的太原南郊方言的单字调调值进行了实证性质的研究,是为晋语区域方言单字调的一种补充。
标签:太原南郊方言调值实验
一、概述
太原市从大的方言区划来说,基本可以分为城区方言和郊区方言两大部分。其中郊区方言之间也有一些差异,由于语言受行政区划的影响较为明显,所以基本上可以将郊区方言按行政治所区分出不同的小类。本文的语言实验范围仅仅包括太原市原南郊区黄陵乡下辖的27个自然村的语言。由于这一片区域人们所讲的语言差异极小,不仔细分辨很难感觉到差异,所以,我们选取南坪头村村民所讲的语言作为实验对象。
二、实验说明
(一)发音人
任卫泽,男,43岁,小学毕业,是原太原市南郊区黄陵乡南坪头村村民,无外出务工经历。
(二)发音单字表
从过去研究的材料和我们初步的调查结果来看,太原南郊话共有5个声调:平声、上声、去声、阴入和阳入。我们的实验材料按照这5个声调的顺序排列,每个声调选取9个样字。由于声母会对后面的元音基频产生影响,所以我们在样字的选取过程中,声母尽量选择不送气的塞音声母[p-]、[t-]、[k-],不选鼻声母;韵母尽量选择单韵母,为了在同一声调中,能够兼顾元音高低前后,我们选择[i]、[a]、[u]与声母搭配成字,不选鼻音韵尾。在没有满足条件的样字时再考虑临近声韵母搭配的字。具体样字如下:
平声:批低鸡疤他家铺都(du)姑
上声:比底几把打嘎补赌古
去声:屁地记爸大架布渡故
阴入:笔跌急八达夹不扑谷
阳入:白叠杰拔特舌俗读局
(三)录音过程
我们在安静的室内,用praat软件自带的录音功能进行录音。录音时,用地道的南郊话把每个字尽量自然地读三遍,为了防止前后音之间的相互影响,每字的每次录音作为一个独立的样本以wav格式存入电脑,共得到5×9×3=135个有效样本。采样率为16kHz,采样精度为16位。单声道。
(四)分析软件
我们使用praat5.3.43软件进行语音分析。
数据处理使用SPSS统计软件包,EXCEL办公软件。
三、单字调标注
首先,我们将各个调类的语音文件逐一导入praat软件,生成textgrid格式的标注文件进行文本标注。标注共分三层:第一层为汉字层(HZ),确定每个音节的边界,并表明相对应的汉字。以声波图上语音起始点为音节起始边界,以F2终点为音节终点边界。第二层为声韵层(SY),用拼音文字标出,其边界与汉字层相同,以F2的出现为声韵分界线,其左为声母区域,其右为韵母区域。第三层为声调层(SD),根据生成的pitchtier曲线走势判定弯头降尾,标注每个音节的载调段。如下图所示:
其次,修改基频。利用praat生成pitch格式文件,参照语图(主要是窄带图)对该软件自动提取的基频点进行修改,然后将修改过的pitch文件生成pitchtier 格式文件进行进一步修改。保存pitchtier文件,将标注好的pitchtier文件保存到C:\temp,以备基频数据的提取。
最后,提取数据。在praat软件中庸脚本提取第三层标注,得到声调层调型段的时间点。
四、基频LZ归一与五度转换
(一)LZ归一化
1.基频均值的获取
为了消除个人的声音特性,消减录音时每个样本发音风格的差异,以便获得有语言学意义的语音信息,我们需要对每一个标注的文件文件进行基频值的提
取,提取方法是对每一个样本分别取10%、20%、30%、40%、50%、60%、70%、80%、90%、100%等十个百分时刻点的基频值进行提取,然后将所有声调各个样本在每个百分时刻点的基频值导入EXCEL中。求出每个声调每个百分时刻点的基频均值,单位为赫兹。结果如下:
2.基频均值求对数
由于发音变体较多,即使同一个发音人也不可能发出两个在声学上完全相同的音,还有人耳对声音音高的感知和声学实验所获得的基频数值之间并非线性关系,而是呈现对数关系,所以我们有必要对表1中的基频均值转化为以10为底对数值。结果如下:
3.进行z-score归一化
在表2的基础上我们求出所有对数值的均值μ和标准差σ,得到μ=2.20,σ=0.13,n=50.作为参考,最大值max=2.40,min=2.01。接下来,再对数值进行z-score归一化(LZ法)处理时,使用公式:LZi=(xi-μ)/σ
Xi为待归一的百分时刻点基频数的对数值,μ为Xi(i=1,2,3, (50)
的算术平均值,σ是Xi(i=1,2,3,……,50)的标准差。所得的归一化数据如下表:
(二)五度转换
虽然根据各采样点的LZ值对应的区间就可以确定五度值,但是这种对应关系很难直接从数据上判断,一定要放到LZ数据图中才能看得出来。为了使LZ 值和五度值之间的对应关系更加清晰直观,可以采用如下公式把LZ值转换为RD值:
RD=[(LZ+c)/2c]×5
公式中的“RD”为英语“relative degree”的首字母缩略形式,“c”为发音人LZ 值中最大的LZ值的绝对值。经过该公式转换后,RD值最小为0,最大为5,即调值区间为[0,5],这样得到的RD值就是采样点的五度值参考标度。从RD值可以直接观察到采样点的五度值。进行五度值转换时,以便捷为界限,即其中的0~1.0相当于五度值中的1度,1.0~2.0相当于五度值中的2度,2.0~3.0相当于五度值中的3度,3.0~4.0相当于五度值中的4度,4.0~5.0相当于五度值中的5度。得到的RD值如下所示:
五、声调作图
将表4中的数据作图如下:
从上图可以清楚地看到,太原南郊话单字调调值为: