结合EMD与DWT-ACF的语音基音周期检测改进算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
结合EMD与DWT-ACF的语音基音周期检测改进算法
张涛;章小兵;朱明星
【摘要】针对传统小波-自相关算法在噪声环境下检测语音的基音周期会出现偏差和漏报的情况,提出一种经验模式分解下的小波-自相关的基音周期检测改进算法.该算法首先利用经验模式分解去除含噪语音趋势项并减噪,再利用改进的小波-自相关法突出每个基音周期的峰值点,提高了基音周期检测的精度.实验结果表明,该改进方法可有效改善加噪语音在基音提取上出现的偏差误报情况以及避免部分倍频和半频错误,提高基音周期检测速率及准确率.%Deviation or omission may occur in speech pitch detection in Low SNR circumstances when using traditional discrete wavelet transform-autocorrelation function algorithm.This paper proposes an improved algorithm based on empirical mode decomposition(EMD)and discrete wavelet transform-autocorrelation function(DWT-ACF).First of all, the EMD process is used to remove the noisy speech trend items and reduce the noise.Then, the improved DWT-ACF is used to highlight the peak value of each pitch period to raise the accuracy of the pitch period detection.The experimental results show that the improved method can effectively reduce the frequency doubling and half frequency errors of noisy speech in pitch extraction so that the situation of the deviation or omission is improved,and the speed and accuracy of the pitch detection is raised.
【期刊名称】《噪声与振动控制》
【年(卷),期】2018(038)002
【总页数】7页(P173-178,192)
【关键词】声学;基音周期检测;小波-自相关;经验模式分解;固有模态函数;倍频和半频
【作者】张涛;章小兵;朱明星
【作者单位】安徽工业大学电气与信息工程学院,安徽马鞍山243002;安徽工业大学电气与信息工程学院,安徽马鞍山243002;安徽工业大学电气与信息工程学院,
安徽马鞍山243002
【正文语种】中文
【中图分类】TN912.3
基音周期检测是语音信号处理中的重要步骤之一,它在语音识别、语音情感识别、语音合成以及语音编码中有着广泛的应用[1]。于是,精准的基音周期检测就具有
非常重要的意义。目前的基音周期检测方法有自相关函数法(Auto Correlation Function,ACF)[2]、平均幅度差函数法(Average Magnitude Difference Function,AMDF)[3]、倒谱法[4]、线性预测系数(Linear Prediction Coefficient,LPC)[5]、小波变换[6]以及相衍生的小波加权自相关函数法[7-8]、平均幅度差自相关函数法[9]等。由于语音是一种复杂非平稳的信号,受限于人的声道、基音周期
范围、情感以及单词的音调等各种因素的影响,因此基音周期的精确检测实际上是非常困难的,但基于基音在语音识别过程中的重要性,人们提出了各种基音周期检测算法。而这些方法中自相关函数法(Auto Correlation Function,ACF)即使在完全纯净语音下也会发生基音的倍频和半频错误,平均幅度差函数法(Average Magnitude Difference Function,A-MDF)在信号幅度变化较快时会出现均值下
降的趋势,倒谱法对噪声比较敏感,当遇到受噪声污染的语音时其检测误差会显著上升[3-4]。由此看出,不同的基音周期检测方法都有各自的优缺点,它们在复杂的语音下并不完善,因此探索一种精确的基音周期检测方法就显得尤为重要。
本文针对传统的小波-自相关法(DWT-ACF)[10]的缺点提出了一种基于经验模式分解(EMD)[11]下改进小波-自相关的基音周期检测算法。该算法先利用经验模式分解(EMD)处理含噪语音信号,提取基本模式分量IMF3-IMF6以消除含噪信号部分噪声以及消除趋势,改善自相关函数法在基音的倍频和半频上的错误(在语音信号中提取基频常用的自相关方法中,倍频和半频是常见的错误。前者是那些低的第1共振峰的干扰;后者出自个人的发音习惯导致的奇数周期和偶数周期的声门脉冲的强度的固有变化。这是由语音信号的特性造成的,与汉语‘上声’结尾有些人发出的吱嘎声,基频很低,难以测量,有同样的性质。这类错误即使在信噪比很高的条件下也会出现。因为言语中基频是一个有规律的慢变过程),以及小波法的基音定位偏差[9],再结合小波算法抗噪声性能与自相关函数法的简单精准,得出一种精确定位基音周期的新算法(EMDDWT-ACF)。对EMDDWT-ACF算法进行仿真实验,实验结果表明,该方法提取的语音基音周期基音轨迹平滑,且相对应的基音频率能与实际的基音频率很好吻合。
1 EMD算法基本原理
1998年,Norden E.Huang等对非平稳信号在瞬时频率方面进行深入研究,创造性地提出了本征模式函数(Intrinsic Mode Function,IMF)[12]以及将任意信号分解为IMF的经验模式分解(Empirical Mode Decomposition,EMD)。
为了得到有意义的瞬时频率,提出了基本模式分量(IMF)的概念,基本模式分量的提出需要满足两个基本条件:
(1)在语音数据序列中,极值点的个数Ne与过零点的个数Ns要满足