语言发声研究及相关领域1讲课讲稿

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

语言发声研究及相关

领域1

语言发声研究及相关领域1

孔江平

中国社会科学院民族研究所

摘要

本文从语音学嗓音发声类型研究的角度,介绍了语言发声类型的一些基本概念,并在此

基础上讨论了语言发声类型基础研究的各个方面和相关的领域.嗓音研究的信号有语音声学

信号,声门阻抗信号和高速数字图像信号.研究的方法包括语音学研究,多维嗓音研究,声

门阻抗信号研究,嗓音的小波变换研究,声门高速成像的研究和语音合成研究等.在学科上

涉及语音学,言语声学,嗓音生理学和言语工程等.文章包括以下十一个方面:1)嗓音发

声类型的语音学研究;2)多维嗓音分析;3)声门阻抗信号与声带振动;4)信号类型与基

频提取;5)基于高速数字成像动态声门研究;6)基于高速数字成像的动态声门模型;7)

基于高速数字成像的嗓音病理研究;8)基于小波变换的嗓音研究;9)嗓音的变换;10)语

音合成研究;11)其它.这些基础研究对语音学,言语声学,嗓音医学,言语工程以及声纹

鉴定和声乐等研究都具有十分重要的意义.

1 嗓音发声类型的语音学研究

言语的产生大致可以分为两部分,一部分是"声源",语音学称为"发声",另一部分是"共鸣",语音学称为"调音".语言发声类型是指声带以不同的振动方式所产生的具有

不同性质的声源.对于不同的学科嗓音发声类型的定义也不完全相同,语音学定义的原则是

看其是否具有语言学意义,言语声学主要是根据声学特性的差异,而嗓音医学主要是根据感

知的评价结果,但无论哪个学科大家都一致认为声学参数是最终量化语言嗓音发声类型的基

本依据.常见的发声类型有:1)正常嗓音;2)高音调嗓音;3)低音调嗓音;4)假声;

5)气泡音;6)气嗓音;7)吸气音;8)紧嗓音;9)双周期嗓音;10)耳语等.

现有语音学理论对元音的定义基本上是从调音上来定义的,如舌位最高点的位置,开口

度的大小和圆展唇等,并没有涉及到嗓音发声类型.然而,不同的发声类型在我国的许多民

族语言中相当普遍,如果仅用现有元音的定义远远不能满足我国民族语言的现实,根据我们

对嗓音发声类型的研究,元音有两种不同的音色(quality),一种是由调音产生的音色称为

"调音音色" (articulation quality),另一种是由发声产生的音色称为"发声音色"

(phonation quality).如,景颇语/ka31/和/ka31/两音节的共振峰没有本质的差别,从调

音的角度看,其音色是相同的,但发声音色却不相同.在对我国不同民族语言发声类型的研

究中,可以发现有三种不同的元音音色:1)调音音色不同发声音色相同.2)发声音色不同

调音音色相同.3)调音音色和发声音色都不同.

从我国不同语言嗓音的声学分析和研究可以看出,许多发声类型具有超音段的性质,具

体地讲是"音节性".目前对声调的定义仅限于音调的高低和音调不同的模式,音调的高低

在生理上对应于声带振动的快慢,在声学上对应于基频的大小.因此,可以明确地看出,声

调应该属于发声的研究范畴.如,景颇语/tom31/和/tom31/两音节中的声调,其基频曲线没

有本质的差异,由于发声类型具有音节性,因此,我们也可以将其定义为调质的不同,从而

引出"调质"(tone quality)的概念.根据调质的概念,可以进一步将声调分解成"调时"

与"调声",调时是指肌肉对声带振动快慢的调制,而调声是指肌肉对声带振动方式的调

制.前者在声学上对应于嗓音发声类型的时域特征,而后者对应于嗓音发声类型的频率域特

1 限于版面,参考文献在文中引用不再标明.

2

征.对于调时大家都比较熟悉,也就是我们常说的基频的高低和由基频曲线组成的模式.对

于调声一般人们不太了解,怎样用一个比较直观又准确的方法来表征声调调声的模式是很值

得研究的课题.在以往的研究中,我们通常采用开商(open quotient)和速度商(speed

quotient)来反映声调调质的变化情况.在言语声学和言语工程中,可以用其它的模型来表

征调质的变化,如方特的 LF-模型(Fant, 1985)等.从嗓音发声类型研究的角度来看声调,

我们不难发现现有声调的定义很不准确也很不完全.

不同的民族在发音器官上没有太大的差别,但由于语言不同,他们使用发音器官的部位

有很大的不同.在调音方面,每种语言的音位系统都不相同,发声也是如此,嗓音的使用也

不尽相同.怎样表征不同语言的发声也是语言学和言语声学研究的一项基本内容.如,藏语

和彝语的开商男女之间都有较大的差别,但蒙古语的开商男女之间完全没有差别.

2 多维嗓音分析

多维嗓音分析是从语音信号,EGG 信号或其它语言信号中提取多项参数,然后对

这些参

数进行综合分析.多维嗓音分析主要用于嗓音病变的研究.在语音学上,可以用来

量化不同

的发声类型,但样本要足够长的持续元音.在言语工程上,目前用的还不多,它可

以用来量

化不同人的嗓音,其中有些参数对建立模型十分有用.常用的多维嗓音分析参数

有六类 33

项2.基音类:1)平均基频;2)平均音调周期;3)最高基频;4)最低基频;5)F0 标准

差;6)半调发声 F0 范围.频率抖动类:7)F0 抖动频率;8)振帽抖动频率;9)分析

样本

时长;l0)绝对频率抖动;11)频率抖动百分比;12)相对平均扰动;13)音调扰动商; 14)平滑音调扰动商;15)基频变化率.振幅抖动类:16)振幅抖动;17)振幅抖动百

比;18)振幅扰动商;19)平滑振幅扰动商;20)峰振幅变化率.嗓音指数类:21)清浊率;22)嗓音骚动;23)软发声指数;24)F0 抖动强指数;25)振幅抖动强度指数.嗓

音清

化类:26)嗓音破裂级;27)次和谐级;28)清声级;29)嗓音破裂数;30)次和谐音段数;31)非浊音段数.基本类:32)计算音段数;33)总测定音调周期.

相关文档
最新文档