基于参数自适应的改进谱减法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于参数自适应的改进谱减法
齐立萍;孙昊;杨鹏;陈萌;王月英
【摘要】针对基本谱减法的噪声残留以及损伤语音的可懂度和自然度等问题,在基本谱减法原理基础上,提出了基于参数自适应的改进谱减法。

引进谱减功率系数和谱减噪声系数,以增强后语音信号的信噪比为输出,以变化的谱减功率系数和谱减噪声系数为输入,自动控制选择最优参数,并且将其与带噪语音输入信噪比相匹配。

对信号进行语音增强时,通过计算其输入信噪比,利用最优参数曲线得到最优参数值,然后结合平滑处理的过程实现语音增强最大化。

实验表明,本文算法有效提高了基本谱减法的语音增强性能。

%Focusing on the problem of the residual noise and the damage of speech intelligibility and naturalness produced by the basic spectral subtraction , an improved spectral subtraction method based on parameter adaptive was proposed .Spectral subtraction noise correction factor and power spectrum correction factor were introduced into the basic spectral subtraction .Using the enhanced signal ’ s SNR as the output , the two parameters as the input ,two optimal parameters were chosen automatically .What’s more, the selected optimal parameters were matched to the input SNR .When performing the enhancement processing , the two optimal parameters were got by calculating the input SNR according to the optimal parametric curve .Then, smoothing process ’ s combination maximized the speech enhancement .Experiments show that the proposed algorithm can effectively improve the performance of speech enhancement based on spectral subtraction .
【期刊名称】《科学技术与工程》
【年(卷),期】2016(000)003
【总页数】5页(P192-196)
【关键词】语音增强谱减法;参数自适应最优参数
【作者】齐立萍;孙昊;杨鹏;陈萌;王月英
【作者单位】河北工业大学控制科学与工程学院;河北工业大学控制科学与工程学院; 智能康复装置与检测技术教育部工程研究中心,天津 300130;河北工业大学控制科学与工程学院; 智能康复装置与检测技术教育部工程研究中心,天津 300130;河北工业大学控制科学与工程学院;河北工业大学控制科学与工程学院
【正文语种】中文
【中图分类】TN912.35
语音增强的目的是提高语音质量,这就需要在降噪和语音失真之间找到一个最好的权衡点[1]。

美国学者Steven Boll提出了基本谱减法[2],通过用带噪语音信号的频谱减去噪声的频谱,将两者相减的结果当成是增强后的信号频谱,虽然背景噪声得到了抑制,但是残留了一定的音乐噪声。

Ephraim和Malah等人共同提出了基于最小均方差(MMSE)短时谱幅度(STSA)估计的语音增强方法[3],这种方法适用于信噪比较高的场合,当信噪比过低时,效果不是特别理想。

2011年,Lu C.T.使用DD算法来改善语音谱旳估计[4],得到一种对噪声掩蔽阈值的更加准确的估计,然后将该阈值用于调整原来算法中的感知增益因子。

对残留噪声的抑制能力得到了明显的提高。

2013年,Hadi Veisi和Hossein Sameti将HMM应用在Mel频域来增强语音,提出了平行的倒谱和谱(parallel cepstral and spectral, PCS)模型来改善语
音从频域到Mel频域引起的失真[5],该方法对非平稳噪声干扰下的语音增强效果很好,但是该方法复杂度较高。

谱减法的基本思想:假设加性噪声信号和语音信号独立,将带噪语音的频谱与噪声信号的频谱作差,最终获得增强后语音信号的频谱。

如果假设s(t)表示纯净语音信号,n(t)表示噪声信号,y(t)表示带噪语音信号,可得
y(t)=s(t)+n(t)
因为背景噪声为加性噪声,所以s(t)和n(t)二者独立,进行傅里叶变换,所以推得式(2)。

E[|Y(ω)|2]=E[|S(ω)|2]+E[|N(ω)|2]
根据语音信号的短时平稳性,一个语音帧可以看作是平稳过程,可得
谱减法突出的优点是算法计算量比较小,实现较容易,并且适用于实时处理[6]。

但是仍然存在一定程度上的不足。

谱减算法增强处理后的信号会残留比较多的噪声,因为有一定的节奏感,所以又称为“音乐噪声”[7]。

产生“音乐噪声”的元音与噪声信号的特点有关,因为其符合高斯分布,幅度随机变化的范围较宽。

所以引用无语音期间噪声统计方差表示噪声时,会因为信号帧噪声分量的大小,残留一部分较大的噪声,在频谱上表现为随机凸起。

增强后的语音信号就会有节奏的残留噪声,对于语音自然度而言,这些音乐噪声严重的影响其质量[8]。

在信号信噪比中,浊音信号占主导地位,但是,对于信号可懂度,辅音和元音等信号占主导地位。

所以输入信噪比过小时,增强后信号的可懂度损伤较严重。

因此,在语音增强的同时,还需考虑信号的可懂度以及自然度[9]。

虽然如此,但是由于谱减法的运算量比较低,而且不需要像其他方法一样,对于模型参数,或者阈值的设置,需要过多的依赖经验的多少。

在基本谱减法的基础上,通过适当的改进,在一定的噪声条件下有很好的增强效果。

进行噪声谱相减时,减去β|λn(ω)|2,β>1。

如此的改进方式,首先能够更好地显现语音信号谱,并且抑制背景噪声,提高增强算法的降噪性能;其次,在语音信号谱中宽带噪声残留变少,在人耳感知上能够更好的掩蔽背景噪声。

基于以上处理,改进后的谱减法公式如式(4)。

除了将公式中噪声频谱的系数进行改进修正外,结合功率谱减法中频谱的平方计算与幅度谱减法中频谱的一次方计算,本文将其改进为由系数灵活控制的|·|α以及|·|1/α,此处的系数α不一定为整数。

这样就得到了改进型的更具有广泛性的谱减法公式。

这种功率谱修正处理使得改进后的谱减法具有了更好的适应性,修正后的功率谱为
结合以上两种处理方法,本文基于参数的改进谱减法的公式如式(6)。

对于谱减功率修正系数α,增大α参数值,会使输出信噪比增大,但是也会导致信
号的失真加剧。

对于谱减噪声系数β,针对噪声残留的问题,使β>1,即利用主
动地多约去噪声值,实现语音在信号频谱中更好的显现,不过语音信号的失真度也许会加剧。

因此,必须严谨的控制两个参数的取值,均衡噪声残留问题与语音失真度问题。

只有适当调节α和β的值,才能够得到良好的语音增强效果。

在不同的带噪信号输入信噪比SNRi条件下,首先以增强后语音信号的信噪比SNRo为输出,以变化的谱减功率修正系数α和谱减噪声系数β为输入,改变输
入参数值,自动控制选择使得输出达到最优值SNRoB时的输入参数值αB和βB,即为最优参数。

并且将选择的最优参数αB和βB与此时的带噪语音输入信噪比SNRi相匹配。

实际应用时,通过计算带噪信号的输入信噪比SNRi,控制语音增
强系统中最优参数αB和βB的选择。

基于最优参数选择的语音增强系统框图如图1所示。

图1中,y(t)表示带噪语音信号,(t)表示增强后的语音信号,OP 是的最优参数选
择环节。

自动控制最优参数选择的系统公式如下。

由增强语音信号的输出信噪比SNRo得出最优参数αB和βB的过程,是通过绘制三者的三维曲线图,从中寻找最大值的坐标值实现的。

如图2所示,带噪信号输
入信噪比SNRi=5 dB,当谱减功率修正系数α,谱减噪声系数β变化时,增强后
语音信号的信噪比SNRo的变化曲线。

本文选择的输入信噪比SNRi取值范围-15~20 dB。

经过大量的实验仿真,得到
当带噪信号输入信噪比SNRi变化时,最优参数αB和βB的数据变化。

表1为最
优参数αB,βB与输入信噪比SNRi的匹配表,其中给出部分数据。

本文针对输入信噪比SNRi与最优参数αB和βB关系分析,建立一种可靠的数学
关系,实现输入信噪比SNRi与最优参数αB和βB的控制。

根据对各种数学模型拟合后的性能分析,综合考虑SSE(误差平方和)以及应用时计算量大小,最终采用四阶多项式作为输入信噪比与最优参数α的数学关系式。

得到输入信噪比SNRi与最优参数αB的函数关系表示:
同样的,得到输入信噪比SNRi与最优谱减噪声系数βB的函数关系为
基于四阶多项式曲线拟合模型拟合之后的最优谱减功率修正系数αB曲线以及最优谱减噪声系数βB曲线如图3所示,由图可以看出,拟合效果比较理想,可以准确表征参数的特征。

通过对比原始语音波形,带噪语音波形以及增强语音波形,发现增强语音波形虽然已经十分接近纯净语音波形,但是由于随机噪声的去除不彻底性,仍然有部分残留。

所以通过对增强后的语音进行时域内的平滑,使得增强后的语音与纯净语音具有更进一步的相似性[10]。

本文选取五点三次的平滑处理方法[11]。

本文主要从时域波形图,语谱图以及增强语音的信噪比三个方面,充分比较基本谱减法与改进后的基于最优参数选择的谱减法的语音增强算法性能,评价增强后的语音质量。

仿真实验中,在随机白噪声条件下对带噪语音信号进行测试。

取信噪比为0 dB,
对基本谱减法和改进后的谱减法进行测试。

预处理时,对语音信号加汉明窗,窗长选择winsize=256,帧间重叠inc=128。

纯净语音数据为实验室环境下录制的语音“河工大”,采样频率f=44 100 Hz,噪声为加性高斯白噪声。

图4分别为SNRi=0 dB噪声条件下,带噪语音和采用基本谱减法以及基于最优参数选择的改进谱减法增强后语音的时域波形。

图5是与图4一一对应的信号语谱图。

时域波形图中,本文算法增强后的语音信号,噪声残留最小。

结合语谱图,无论从信号强度,还是从残留噪声考虑,本文算法增强后的语音最接近于原始语音,语音增强性能最优。

选取的带噪信号输入信噪比全局变化范围为:-15~20 dB。

在不同输入信噪比情况下,用大量仿真实验测试样本语音信号使用基本谱减法和本文改进后的基于最优参数选择的谱减法的语音增强效果。

预处理时,对语音信号加汉明窗,窗长选择winsize=256,帧间重叠inc=128。

纯净语音数据为实验室环境下录制的语音“河工大”,采样频率f=44 100 Hz。

图6为输入信噪比变化时,三种增强算法增强后语音信号的输出信噪比的变化曲线。

由图6可以看出,随着输入信噪比的增大,增强算法的输出信噪比随之增大,本文改进谱减法增强效果最好。

针对语音增强算法的定性比较之后,下面给出定量分析。

表2列出了不同信噪比情况下,采用不同增强算法的输出信噪比SNRo。

表3列出了SNRi=0 dB,5 dB,10 dB,15 dB等不同信噪比情况下,针对本文仿真所得的大量数据,计算基于本文改进算法的增强结果相对于其他算法增强结果的性能提升,在此用增强处理后的输出信噪比SNRo进行衡量。

根据表中的数据,可以看出,三种算法对于带噪语音的增强处理都有明显的效果。

随着噪声语音输入信噪比的提升,三种增强法的提升性能都呈现出下降趋势,这是
因为随着输入信噪比的提升,噪声成分越来越少,其所占信号的百分比越来越小,语音增强相对于纯净语音的提升的重要性变得越来越小。

但是,本文算法相对于其他算法的性能一直都有客观的优越性。

通过参数自适应的方法,引入最优参数的控制,实现了谱减功率修正系数、谱减噪声系数的优化,建立了输入信噪比与最优参数选择之间一种可靠的数学关系,实现了输入信噪比对于最优参数选择的控制。

如此的改进方式,首先能够更好地显现语音信号谱,并且抑制背景噪声,提高增强算法的降噪性能;其次,在语音信号谱中宽带噪声残留变少,在人耳感知上能够更好的掩蔽背景噪声。

解决了基本谱减法噪声残留、损伤语音的可懂度及自然度的问题。

相关文档
最新文档