语音样品的选取和实验数据的分析

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

语言科学 ISSN 1671-9484　CN 32-1687/G 2007年3月第6卷第2期(总第27期)23-33
[收稿日期]2006年6月7日 [定稿日期]2006年11月14日
3感谢《语言科学》匿名审稿专家提出的宝贵意见。

语音样品的选取和实验数据的分析3
石　锋1　时秀娟2
1
南开大学　天津　300071 2天津师范大学　天津　300387
提要文章通过对传统的语言调查与现代的语音实验在方法上的比较分析,阐述了语音样品的选取和实验数据的归一化和相对化程序及方法。

关键词语音样品　实验数据　语音格局　归一化　相对化
中图分类号　H 017 文献标识码　A 文章编号　1671-9484(2007)02-0023-11
1引言
现代语音学的研究基本上离不开实验的手段。

现代语音学采用实验的方法分析语音,首先要采集语音样品,然后进行实验分析。

因此,语音样品的选择取样和实验数据的分析处理问题就显得格外重要。

本文讨论语音样品的选取和实验数据的归一化和相对化问题。

2口耳之学和语音实验对样品的选择
2.1音位、音素和音子
传统语音学与现代语音学研究的对象都是语音,但二者的逻辑起点不同,“如果说传统语音学的逻辑起点是靠人耳分解出来的音位(p hone me )或音素(p hone ),那么现代语音学的逻辑起点是靠仪器测
试出来的音子(acoustic allop hone )。

”
(石锋1990)音位是对于一种具体的自然语言和方言进行的听感分类;音素是对于不同语言和方言中的各种语音所作的听感分类;音子是人类借助实验仪器所认识的语音成分。

区分不同的音位要依靠人耳的听感,区分不同的音素同样靠听感辨别;决定音子区分的则是语音实验所得到的数据。

2.2口耳之学的语言调查
传统语音学采用的是口耳之学的方法,集中体现在语言调查和方言调查过程中。

进行调查分析的人员都要经过语音学的严格训练,具有用国际音标听音记音的能力。

在调查中选择当地有代表性的一、两个典型发音人,利用听感判断,审音记音,按照一定的步骤,分析整理出这种语言或方言的语音系统。

语言科学　2007年1月
这里的一个关键问题是审音。

“审音是一种能力,一种技术,也是一门学问”。

(邢公畹1982:11)审音的精细与否往住因人而异,除了要用耳朵仔细分辨外,还要辅以观察发音人的口形和发音动作。

有时分辨要采用比字的形式来确定。

本地人对本地字音的异同很敏感,对比字的判断非常重要。

“本地人对于他自己的方言的事实,他是最后最高的权威。

”(赵元任2002:530)。

关于语音系统的分析整理,邢公畹(1982:12-13)指出“不是一个一个地孤立地去分析,而是先定出一些分析音的标准,然后按照这些标准把音分出类,找出音与音之间的相联系和相区别的体系来。

”“一个记音符号的‘值’,包含着无穷数的有或多或少的差异的一个‘音群’。

……与其认为一个符号代表一个孤立的‘音’,不如认为代表一个‘音型’,或者说‘音的范畴’”。

邢先生在这里明确指出两点:一是要找出语音的“体系”;二是认为音位(记音符号)代表“音的范畴”。

换言之,一个音位的确定,是人耳对于很多次发音进行分析判断的结果。

2.3发音人的人数
传统的语言和方言调查要求发音人的人数并不多,一两个或两三个就可以了。

中国社会科学院语言研究所编的《方言调查字表》(修订本)(北京:商务印书馆,1983年版)只列两个“发音合作人情况”的表格。

如调查一个地点方言的语音,最好始终只用同一个发音人。

“一位介绍人的优点是速度快,材料系统一致。

”(陈其光1998:232)一个发音人可以避免因个人方言的差异造成语音系统混乱。

这是传统上对于较封闭的乡村方言使用的方法。

对于较为开放的现代城市方言进行调查,常常是群体抽样。

发音人数很多,有几十人以至几百人。

如美国拉波夫(L abov)调查纽约百货公司职员带有2r音的状况,记录了264人的发音。

胡明扬《北京话社会语言学调查》(1981)前后共调查了500余人。

2.4从审音到实验
现代语音学由传统语音学发展而来,采用语音实验的方法研究语音。

语音实验使用的仪器,是人的手、眼、耳的延长。

实质上,语音实验的做法与传统语言调查的过程是一致的,只是更加精密、准确。

对于研究人员也提高了要求:在传统语音学方法的基础上,还要熟悉语音实验的方法,更重要的是了解语音实验应该怎样在语言研究中发挥作用。

传统语音学的审音步骤可以部分地对应于语音实验过程。

所不同的有几点:审音的对象一般是未知的系统,审音的结果是确定一批标记各类语音的音标符号;而语音实验研究对象一般是已知的系统,实验的结果却是测量得到的一批数据,可以对前人的成果修正、补充、证实或证伪。

从数据到语音的音位和语音的系统,也就是上文讲的“音的范畴”和音的“体系”,还需要一系列的统计上的归一化和相对化的算法。

这就是本文后面所要阐述的内容。

2.5个体样品和群体样品的选择
语音实验同样有一个重要的问题是语音样品的选取,包括发音人的数目,语音样品的规模等。

语音实验是传统语音调查过程的数据化,同样可以考虑个体发音人和群体发音人的不同选择。

这都需要根据研究的目标来加以确定。

选择个体发音人是从单个发音人采集多项语音样品,就像方言调查的情况一样,目的是分析总体的语音系统。

在这方面同样是单个发音人具有优势:每个人的发音自成系统。

不同发音人的系统具有对
石　锋等　语音样品的选取和实验数据的分析
应一致性,但具体的实验数据可能会有相当大的差异。

如男人和女人的同样声调在绝对值上相差很大。

选择群体发音人是从多个发音人得到专项语音样品,着眼于语音的专题研究,目标或者是社会语言学方面,或者是历史语言学方面,或者是应用语言学方面的。

这些专项语音研究同样也不能脱离语音系统。

离开语音系统所进行的原子式的语音分析不适合语言学的研究。

不论是多人专项取样,还是专人多项取样,通过实验得到的数据都要经过相对化处理之后,才能显示出在语言研究中的意义。

不同说话人的物理测量值是绝对的,它们在语言学中的关系却都是相对的。

只有相对的数学关系才具有语言学的意义。

3声调数据的归一化和相对化
3.1语音格局与声调格局
每一种语言和方言的语音都各成系统,语音系统的表现形式是语音格局(sound p attern)。

语音格局包括这种语言或方言中全部音位的定位特征、各个音位之间的聚合关系与组合关系等方面。

语音格局是语音学和音系学相结合的平台,是二者的交汇点。

我们把语音学的分析和音系学的分析结合起来,在语音格局分析中引入语音实验。

可以把人们对于语音格局的观念具体化,用数据和图表显示出语音的分布格局。

在实际进行中,是要在音系学分析的基础上,把语音的各个子系统,如元音、辅音、声调等,分别进行实验研究。

分析中要依据不同类别语音的性质采用不同的归一化和相对化的方法进行统计和作图。

这样使只能用听觉感知的语音变为能够通过视觉来考察,会拓展和深化我们对语音的性质和规律的认识。

声调的系统性表现为声调格局。

单字调的声调格局由一种语言或方言中全部的单字调(citation f orm)构成,是声调系统的共时初始状态,是各种声调变化的基础形式,应该是进行声调分析的出发点。

单字调的声调格局因不同语言或方言中声调的数目、声调的调型以及它们的分布关系不同表现各有差异。

这可以反映出不同语言或方言的个性特征。

3.2T值计算
通过实验得到的声调的原始数据,如基频值和绝对调长,还不具有语言学的意义,必须对原始数据进行相对化处理。

我们用实验测量出每一声调的各个时点的平均音高数据,把声调的音高数据和通常使用的五度值之间的对应关系采用如下的T值公式来计算:
T=[(lgx-lgb)/(lga-lgb)]×5
其中,a为调域上限频率,b为调域下限频率,x为测量点频率。

所得到的T值就是x点的五度值参考标度(石锋1986)。

也可以写成下面的形式:
T=[(lgx-lgmin)/(lgmax-lgmin)]×5
这样得到的T值,其中的0<T≤1.0相当于五度值中的1度,1.0<T≤2.0相当于五度值中的2度,2.0< T≤3.0相当于五度值的3度,3.0<T≤4.0相当于五度值的4度,4.0<T≤5.0相当于五度值的五度。

3.3声调格局图
通过实验测算,把各单字调的平均曲线以T值为依据画在同一调域空间中,成为声调格局图(见图1)。

五度值本身就是一种相对的标记方法。

在听感分辨中通常在一段竖线上取五个点作为标尺。

在实
验分析中,我们把确定五个点改为划分五个段,
这样只需对少量位于交界点的个案作出处理即可。

在声调格局图中,每一声调所占据的不是简单的一条
线,而是一条带状的空间,可以采用这种带状的包络线来表
示每个调位的声学空间(见图2)。

我们通常所作的声调调
型曲线应该看作为一条带状包络的中线或主线。

(石锋
1994)
3.4T 值的优点
在图1中,音长进行了归一化,音高进行了相对化。

不同发音人所发的不同声调的时长差别不见了。

每个发音人的调高和调域的差别也不见了。

这就是用归一化和相对化的方法尽可能地过滤掉个性因素,最大限度地保留住共性特征。

为了保存个性因素,可以对每个发音人的调高和调域的频率数据作出记录,也能够对每个声调的时长平均值作出记录。

采用T 值的优点在于它的程序简便,具有普遍的可比性。

通过T 值,可以把不同发音人的测量数据,不同语言或方言的实验结果,以及不同作者,甚至不同时期所做的研究放在一起来对照比较,进行分析。

(石锋1994)
3.5声调系统的一致性
为了考察这种可比性,我们在《汉语语音数据库》
(由美国学者Robert Sanders 和石锋合作完成)中选取男、女各5个北京话发音人的录音样品,使用南开大学语音分析软件“桌上语音工作室”
(Mini 2speech Lab )进行实验,每个人的数据都分别经过归一化处理,做出单个人的声调格局图。

(见附录2
)
图3是这十个发音人的声调格局图的
重叠样式。

从图中可以看出,虽然每个人
的声调格局的具体表现各有差异,但总体
的相对关系是一致的。

即使十个人的声调
格局图重叠起来,这种相对关系也看得很
清楚,与图1、图2基本一致。

这可以证明
声调格局研究方法的可靠性。

同时这也说明,每一个人的发音自成系统。

应该重视单个发音人所具有的优势。

不同的发音人的实验数据应该在系统归一化之后再进行比较。

因为不同发音人具体的实验数据可能会有相当大的差异,但是每一个人的系统具有相互对应的一致性。

4元音的归一化和相对化
4.1元音格局和声学元音图
元音的研究使用元音格局的方法。

元音格局是元音系统性的表现,包括的内容可以有元音的定位特征、内部变体的表现、整体的分布关系等等。

每一种语言和方言中的元音音位各自形成一个格局。

可以通过声学实验的方法,用声学元音图来作分布描写。

绘制声学元音图,是用元音的第一共振峰(F 1)的频率为y 轴坐标,第二共振峰(F 2)的频率为x 轴坐标。

为了接近实际的听感距离,对x 轴用对数标度,y 轴用线性标度,并把坐标的零点设在右上角。

语言科学　2007年1月
声学元音图和发音舌位在相对位置上大致对应。

首先,舌位高低跟F1密切相关。

舌位高,F1就低;舌位低,F1就高。

其次,舌位前后跟F2密切相关。

舌位靠前,F2就高,舌位靠后,F2就低。

另外,F2和嘴唇的圆展也有关系。

圆唇作用可以使F2降低一些。

我们从中可以直观地考察同一元音音位内部变体的表现,以及不同元音之间的分布关系等等。

因此,利用声学元音图研究语言的元音系统是很方便的。

(石锋2002)
4.2元音层级
依据主要元音跟韵母中的位次关系可以划分出不同的层级。

出现在单韵母中的元音是一级元音;能够带韵头的元音是二级元音;能够带韵尾的元音是三级元音;既能带韵头也能带韵尾的元音是四级元音。

每一级别上所有的元音都形成相互联系又彼此区别的分布格局。

(石锋2002)其中一级元音的格
局是基础形式,表现这种语言或方言的基本特征。

我们选《北京话音档》〔1〕一位男发音人的录音作成北京话的一级元音格局图(见图4)。

图中的椭圆形的大小显示各个元音音位变体的分布范围,表现出北京话一级元音格局的特点:1)顶点元音/i、u、a/之间的连线呈近似的等边三角形;
2)除低元音/a/之外,/i、y、、、、u/各元音在水平方向上的位次是稳定的;3)中元音/ /有游移性,从到 ,呈垂直方向的滑移。

(石锋2002
)图4　北京话的一级元音声位图
4.3相对的元音格局图
图4是以赫兹为单位的图形显示的元音的相对关系,我们还可以通过一种无标度的图形表现出元音之间的相对关系,更具有普遍性。

具体的做法说明如下:
首先,测量得出一个发音人所发的每个元音的第一共振峰(F1)和第二共振峰(F2)的全部频率值,分别计算出每个元音的第一共振峰(F1)和第二共振峰(F2)平均值。

每一个元音的F1、F2数据为一组,这种语言(方言)中有几个元音就有几组数据。

比如,北京话一级元音有7个,就有7组数据。

其次,找出其中的F1的最大值(F1max)、最小值(F1min)和F2的最大值(F2max)、最小值(F2min)。

那么,在横轴上F2min、F2max的标度和纵轴上F1min、F1max的标度相交所得到的矩形,就是测得的全部元音的分布区域。

这个区域可以归一化为一个正方形。

再次,用每个元音的F1和F2数值分别代入下面算式中的x:
　F1x-F1min F2x-F2min　
F1max-F1min F2max-F2min
得出F1、F2的归一数据。

这样,每个元音在正方形图中都可以有一个确定的点,所有的元音构成元音格局的相对图形。

4.4V值的计算
为了使数据的差异接近听感的距离,我们可以把全部F1、F2的数据从赫兹单位转换为巴克(Bark)
石　锋等　语音样品的选取和实验数据的分析
〔1〕林焘、周一民、蔡文兰《北京话音档》,发音人是周一民,收入侯精一主编《现代汉语方言音库》(上海:上海教育出版社,1998年版)。

单位。

用f代表共振峰频率,采取如下公式(吴宗济、林茂灿1989:90): Bark=7ln{(f/650)+[(f/650)2+1]1/2}
由此,上节的算式可以用以下的V值公式来表示:
V1=B1x-B1min
B1max-B1min ×100V2=B2x-B2min
B2max-B2min
×100
这个公式得出的是每个元音在元音格局标准图形中的坐标值。

在标准图形中,V1值表示元音的高低,最大值为100,表示舌位最低,最小值为0,表示舌位最高。

高元音的V1值一般在0～30之间,中元音在30～70之间,低元音在70～100之间。

V2值表示舌位前后,最大值为100,表示舌位最前,最小值为0,表示舌位最后。

在高元音中,V2在0～20之间是后元音,在20～80之间是央元音,在80～100之间是前元音。

中元音的V2在0～30之间是后元音,在30～70之间是央元音,在70～100之间是前元音。

低元音的V2在0～40之间,属于后元音,在40～60之间属于央元音,在60～100之间属于前元音。

这只是一个大致的参考。

4.5V值的优点
图5为按照上述方法作出的北京话一级元音格局标准图型。

在图
5中,经过归一化和相对化,不同发音人因口腔的生理差别造成的个性
发音差异被最大限度地过滤掉了。

保留下来的主要是元音之间相对关
系的共性特征。

为了保存个性因素,可以在每个发音人的元音格局标准图型中,分
别记录跟V1的0和100以及跟V2的0和100的标度所对应的频率
值或巴克值。

图5　北京话一级元音格局标准图采用V值的优点跟T值的情况一样,在于它具有较强的可比性,便于在不同发音人之间,不同语言或方言之间,以及不同作者的测量数据和分析结果之间进行对照比较,得出客观可靠的结论。

语言科学　2007年1月
4.6元音系统的一致性
跟考察T 值一样,我们选取男、女共10个北京话发音人的录音样品,使用南开大学语音分析软件
“桌上语音工作室”
(Mini 2speech L ab )进行实验,并对每个人的数据都分别进行归一化处理,做出单个人的一级元音格局图。

(见附录2)
图6是这十个发音人的元音格局图的重叠样式。

从图中可以看出,虽然每个人的元音格局的具体表现有细微的差异,但总体相对位置的一致关系是很清楚的。

这可以证明元音格局分析程序方法的可靠性。

首先是单个发音人的实验数据进行归一化,然后再进行互相比较。

每一个人的发音自成系统。

同一语言或方言的发音人具有系统的相互一致性。

这是它们的共性所在。

5余论
5.1系统表现为格局
“语言是一个系统,它只知道自己固有的秩序。

”“它的任何部分都可以而且应该从它们共时的连带关系方面去加以考虑”。

(索绪尔1980:46、160)语言科学的任务就是要揭示语言系统的内在规律,对语言现象的描写和解释力求规则化和系统化。

格局是系统的表现形式。

语言的事实如此纷繁复杂,采用格局的观念来观察和分析语言现象,特别是考察和研究语音现象,是非常适宜而且必要的。

要素只能是系统中的要素,只有在系统中它才有可能存在,离开了系统,就什么也不是。

语音格局的观念就是着眼于整体系统,致力于相互关系,注意在表面现象中发现内在的规律。

语音实验数据的归一化和相对化就是实现这一目标的重要方法。

5.2口耳之学与语音实验
传统的口耳之学使用的是人的耳朵。

人耳是语言的分析仪器。

耳朵的分析实际上包括了语音分析和音系分析,所以如果把语音学和音系学分开,就等于是割裂了耳朵的听感。

所以我们主张的口耳之学跟语音实验的结合,语音学跟音系学的结合,二者是有内在联系的。

5.3实验音系学
语音实验常常得到大量的数据,不免容易使人走入原子主义的为实验而实验的道路。

语音格局的方法就是明确地把语音学和音系学结合起来,是把实验方法和统计方法结合起来,为语言学而进行的语音研究。

这种语音研究,有人称为语言学的语音学,有人称为实验音韵学或实验音系学,我们认为实验
石　锋等　语音样品的选取和实验数据的分析
音系学的名称较为合适。

语音格局的观念和方法可以作为实验音系学的一个基石。

参考文献
陈其光　1998　《语言调查》,北京:中央民族大学出版社。

胡明扬　1987　《北京话初探》,北京:商务印书馆。

林　焘　1990　《语音探索集稿》,北京:北京语言学院出版社。

林　焘　王理嘉　1985　《北京语音实验录》,北京:北京大学出版社。

石　锋　1986　天津方言双字组声调分析,《语言研究》第1期,71-90页。

石　锋　1990　试论语音的层次,载《语音学探微》,9-26页,北京:北京大学出版社。

石　锋　1994　北京话的声调格局,载《语音丛稿》,10-19页,北京:北京语言学院出版社。

石　锋　2002　北京话的元音格局,《南开语言学刊》第1辑,30-36页。

时秀娟　2005　《汉语方言元音格局的实验研究》,南开大学博士学位论文。

索绪尔　1980　《普通语言学教程》,高名凯译,北京:商务印书馆。

王洪君　1999　《汉语非线性音系学———汉语的音系格局与单字音》,北京:北京大学出版社。

王理嘉　1991　《音系学基础》,北京:语文出版社。

吴宗济　1986　《汉语普通话单音节语图册》,北京:中国社会科学出版社。

吴宗济　林茂灿　1989　《实验语音学概要》,北京:高等教育出版社。

邢公畹　1982　《汉语方言调查基础知识》,武汉:华中工学院出版社。

赵元任　2002　《赵元任语言学论文集》,北京:商务印书馆。

Brown ,James 1988　Understanding Research in Second L anguage L earning :A Teacher ’s Gui de to S tatistic and Re 2
search Desi gn .New Y ork ,N Y:Cambridge University Press.
Cheng ,C.C.　1973　Asynchronic Phonology of M andarin Chinese ,The Hague :Mouton.Joos ,Matin 1948　Acoustic Phonetics ,L anguage 24,(Supp1.2).
Ladefoged ,Peter 1982　A Course in Phonetics ,New Y ork :Harcourt Brace Jovanovich.附录一:发音词表:
0089啊ā
0001啊á0058啊ǎ0068啊à0049衣yi
0112移yi 0078椅yi 0102意yi 0021乌wu
0009无wu 0003五wu 0024务wu 0087迂yu
0105鱼yu 0110雨yu 0107玉yu 0080阿e
0059鹅e 0025恶e 0093饿e 0258资zi
1095紫zi 0935次ci 0947字zi 0506枝zhi 0132直zhi 0290纸zhi 0805志zhi
3本实验的语音样本选自《汉语语音数据库》,发音词前的序号为词表的序号。

附录二
:
语言科学　2007年1月
石　锋等　语音样品的选取和实验数据的分析
语言科学　2007年1月
石　锋等　语音样品的选取和实验数据的分析
作者简介
石锋,男,1949年7月生,天津人。

南开大学教授、博士生导师。

研究方向为汉语方言和民族语言的实验音系学、国际汉语教学及汉语语音习得研究。

时秀娟,女,1966年7月生,山东人。

天津师范大学副教授、博士。

研究方向为汉语实验音系学、现代汉语及语言教学。

S ampling and Data Analysis in Phonetic Experiment
Shi Feng1　Shi Xiujuan2
1N ankai U ni versit y,Ti anj i n　300071
2Ti anj i n N orm al Uni versit y,Ti anj i n　300387
Abstract　This paper compares t he t raditional linguistic field work wit h t he modern p honetic ex2 periment in met hodology,aiming at illust rating t he procedure of sample selection and t he met hod of u2 nitization or relativization in data analysis in p honetic experiment.
K eyw ords　p honetic sample　experimental data　sound pattern　unitization　relativization
33。