两种基音周期检测方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基音周期中两种算法
常用的基音周期检测方法-自相关函数法、倒谱法、平均幅度差函数法都属于非基于事件基音检测方法,都先将语音信号分为长度一定的语音帧,然后对每一帧语音求平均基音周期,它们的优点是比较简单,主要应用于只需要平均基音周期作为参数的语音编解码,语音识别等。
自相关函数具有很好的抗噪性,但易受半频、倍频错误影响。
平均幅度差函数只需加法、减法和取绝对值等计算,算法简单;它们在无背景噪声情况下可以精确地提取的语音基音周期,但在语音环境较恶劣、信噪比较低时,检测的结果很差,难以让人满意。
2.1 基于短时自相关函数的方法
能量有限的语音信号}{()s n 的短时自相关函数[10][11]定义为:
10()[()()][()()]N n m R s n m w m s n m w m τ
τττ--==++++∑ (2.1)
其中,τ为移位距离,()w m 是偶对称的窗函数。
短时自相关函数有以下重要性质:
①如果}{()s n 是周期信号,周期是P ,则()R τ也是周期信号,且周期相同,即()()R R P ττ=+。
②当τ=0时,自相关函数具有最大值;当0,,2,3P P P τ=+++…处周期信号的自相关函数达到极大值。
③自相关函数是偶函数,即()()R R ττ=-。
短时自相关函数法基音检测的主要原理是利用短时自相关函数的第二条性质,通过比较原始信号和它移位后的信号之间的类似性来确定基音周期,如果移位距离等于基音周期,那么,两个信号具有最大类似性。
在实际采用短时自相关函数法进行基音检测时,使用一个窗函数,窗不动,语音信号移动,这是经典的短时自相关函数法。
窗口长度N 的选择至少要大于基音周期的两倍,N 越大,短时自相关函数波形的细节就越清楚,更有利于基音检测,但计算量较大,近年来由于高速数字信号处理器(DSP )的使用,从而使得这一算法简单有效,而不再采用结构复杂的快速傅里叶变换法、递归计算法等;
N越小,误差越大,但计算量较小。
图2-1 (a)原信号(b)自相关函数
Figure 2-1 (a) Original signal (b) AutoCorrection function
图2-2 (a)原信号(b)自相关函数
Figure 2-2 (a) Original signal (b) AutoCorrection function 基于自相关函数的算法是基音周期估计的常用方法,特别适用于噪声环境下
的基音提取。
自相关函数在基音周期处表现为峰值,相邻两个峰值之间的间隔即为一个基音周期。
但通常情况下,基波分量往往不是最强的分量,丰富的谐波成分使语音信号的波形变得非常复杂,给基音检测带来了困难,经常发生基频估计结果为其实际基音频率的二次倍频或二次分频的情况。
加之还有清浊混杂等情况,使基音检测成为一大难题。
如图2-1(a)是一帧语音信号,2-1(b)是这帧语音信号的自相关函数,可以看出自相关函数在基音周期处表现为峰值,这些峰值点之间的间隔的平均值就是基音周期,如图2-2(b)所示可以看出自相关函数检测出的基音周期是原始信号基音周期的一半,这是由于谐波峰值点(箭头所示)的影响,这就是上述缺点中所说的倍频现象。
2.2 平均幅度差函数法
语音信号}{()s n 的短时平均幅度差函数[12][13]定义为:
1
120
1()()()()()N n n F s n m w m s n m w m R τττ-==+-+++∑ (2.2) 其中,()w m 是窗函数,N 是一帧语音信号的长度,因为语音信号的浊音段具有周期性,我们假设基音周期为P ,则在浊音段,()n F τ在,2,3P P P τ=+++…处将出现谷点,谷点间的距离即为基音周期。
实际应用中,窗函数1()w m 和2()w m 取矩形窗,这样可使短时平均幅度差函数()n F τ的定义更简单。
短时平均幅度差函数可以写成:
1
01()()()0,1,N n n F s n s n R τττ-==-+=∑…1N -
(2.3)
由于()n F τ只需加法、减法和取绝对值等计算,故算法简单,很易于硬件实现,从而使得短时平均幅度差函数法在基音检测中使用得相当普遍,著名的10阶线性预测声码器LPC-10声码器就采用AMDF 法来进行基音周期的提取。
研究表明:当在静音环境下或当噪声较小时,AMDF 法可以取的较好的检测结果,但在语音环境较恶劣、信噪比较低时,检测的效果很差,难以让人满意。
如图2-3(a)是一帧语音信号,2-3(b)是这帧语音信号的平均幅度差函数,可
以看出平均幅度差函数在基音周期处表现为谷值,这些谷值之间的间隔的平均值就是所要求得基音周期。
如图2-4(a)是在这帧语音信号中加入信噪比是2dB噪声后的波形,由图2-4(b)可以看出它的平均幅度差函数中出现了很多谐波分量,基音峰值点基本淹没在这些谐波分量中,影响了基音周期的判断。
图2-3 (a) 原信号(b) 平均幅度差函数
Figure 2-3 (a) Original signal (b) Average magnitude difference function
图2-4 (a)加噪信号(b) 平均幅度差函数
Figure 2-4 (a) Signal added noise (b) Average magnitude difference function。