基于子带ICA-R和收缩函数后处理的语音增强方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于子带ICA-R和收缩函数后处理的语音增强方法
李娟
【摘要】针对噪声和混响情况下的语音增强问题,本文给出一种基于子带独立分量分析(ICA-R)算法和收缩函数后处理的语音增强方法.该方法将ICA-R和收缩函数算法相结合,在噪声和混响环境中通过对两路带噪语音信号进行增强处理,以实现增强目标语音信号的目的.首先对两路带噪语音信号进行子带分解;然后在子带内利用ICA-R算法从带噪语音信号中提取出子带目标信号,再经过综合滤波器形成全带目标信号;最后,将该信号经收缩函数后处理,得到增强后的目标语音信号.用实际录制的带噪语音信号对本文方法进行了测试,实验结果表明,该方法具有较强的噪声抑制能力,对语音信号造成的损伤较小.
【期刊名称】《山西师范大学学报(自然科学版)》
【年(卷),期】2013(027)001
【总页数】4页(P57-60)
【关键词】语音增强;滤波器组;独立分量分析;收缩函数
【作者】李娟
【作者单位】山西师范大学物理与信息工程学院,山西临汾041004
【正文语种】中文
【中图分类】TN912.3
0 引言
随着通信与多媒体技术的发展,人们对语音处理系统的性能提出了越来越高的要求.但是,语音信号不可避免地会受到来自传输媒介的噪声、通信设备内部电噪声、房间混响乃至其他说话人的话音干扰.这些干扰不仅会使接收者得到的语音被噪声污染,同时也会导致许多语音处理系统的性能恶化.
针对同时存在混响和噪声的情况,Low等[1]提出了基于子带盲源分离和自适应噪声抵消的语音增强方法,该方法在子带中利用独立分量分析(Independent Component Analysis,ICA)算法将目标语音信号和噪声进行分离,然后利用自适应噪声抵消器进一步去除噪声,得到了较好的语音增强效果,但是对目标语音信号的损伤较大.由文献[2]可知,该损伤主要由自适应噪声抵消器引起.
为了使语音增强方法既具有较好的抑制噪声和混响的能力,又对目标语音信号损伤较小,本文给出一种基于子带带参考信号盲源分离(Independent Component Analysis with Reference,ICA-R)和收缩函数后处理的语音增强方法.
1 基于子带ICA-R和收缩函数后处理的语音增强方法
本文方法的原理框图如图1所示.由图1可以看出,该方法由四个模块组成:分析滤波器组模块,子带ICA-R模块,综合滤波器组模块和收缩函数后处理模块.
本文方法在子带中进行语音增强,使得在子带中各个混响通道的单位冲激响应函数基本固定不变,从而减少了房间混响对语音质量的影响.在子带中应用ICA-R算法,可以只提取出感兴趣的目标语音信号这一独立分量,节省了计算量,同时避免了一般ICA算法存在的输出顺序不确定问题.在语音信号含有较少噪声或干扰信号时,
收缩函数算法[3,4]将其中一定范围内接近于零的幅值置零,达到去除噪声的
目的,因此,这里将其作为后置滤波器.
图1 基于子带ICA-R和收缩函数后处理的语音增强方法原理框图Fig.1 The proposed speech enhancement method based on ICA-R in subband and shrinkage function post-praessing
1.1 分析与综合滤波器组
在实际环境中,由于空间混响的存在,时间延迟是不可忽略的,此时麦克风阵列接收的信号为声源信号通过若干高阶滤波器卷积后的混合形式,这是一种典型的卷积混合信号.利用子带分解技术可以将混合滤波器的卷积系数分配到各个子带中去,
解决了时域算法中去卷积系统参数收敛时缺乏稳定性的问题.
一般地,均匀分析(综合)滤波器组设计比较简单,在分析与综合滤波器组[5]中,常常采用M通道的均匀分析(综合)滤波器组.
1.2 ICA-R
2000年,Lu等人提出一种利用先验信息提取期望信号的ICA-R算法[6].该算
法既具有 FastICA算法的优点,又可以一次只分离出一个独立分量,避免了ICA
算法存在的输出顺序不确定问题.
ICA-R算法的原理框图如图2所示,其中x1(t),x2(t),…,xN(t)是N路观测信号,y(t)为目标信号估计输出,r(t)为包含目标信号先验知识的参考信号.ε(y,r)为
目标信号输出y(t)与参考信号r(t)的相似性函数,其在ICA-R算法中是作为估计分离向量w*(分离矩阵w的一行)的约束条件,目的是使输出信号y(t)=w*Tx(t)为目
标信号s(t)的估计.
在ICA-R算法中,需要事先选取参考信号r(t),该参考信号的选取对是否能够有效地提取出目标信号至关重要.根据语音信号和噪声的特点可知,语音信号尤其是浊
音的功率谱具有明显的周期性,且其功率谱主要集中在特定的频带内;而随机噪声
的功率谱不呈现周期性,且通常存在于一个比较宽的频带范围内.本文在各个子带中,任取一个麦克风接收信号的功率谱作为参考信号,利用ICA-R算法提取子带
目标语音信号,然后将其通过综合滤波器组得到全带目标语音信号.
图2 ICA-R算法框图Fig.2 Block diagram of ICA-R algorithm
1.3 收缩函数后处理
目标语音信号y(t)中混响已得到一定程度的抑制,但尚有残余噪声存在,本文利用文献[3,4]中提到的收缩函数方法作为后置滤波器对y(t)进行增强处理.收缩函
数方法能有效地将非高斯成分(如语音信号)中的高斯噪声去除.假设目标语音信号中y(t)的残余噪声为nφ(t),nφ(t)为均值为0,方差为的高斯白噪声,则
若s(t)的概率密度函数为p(s(t)),则s(t)可以近似表示为[4]:
其中,f(s(t))=-log[p(s(t))].求式(2)关于s(t)的偏导,并令它等于0,可以得到
由于语音信号是超高斯信号,其概率密度函数可以表示为
将式(4)代入式(3),可以得到[4]
其中
由式(5)可知,为了获得,需要知道三个参数,即噪声方差、α 和 d.
可以利用高斯混合模型估计噪声方差为了方便计算以及更好地反映噪声的特性,我们通过估计麦克风阵列接收到的任意一路带噪语音信号中噪声的方差,作为目标语音信号y(t)中残余噪声的方差
参数α和d由矩量法[8]估计得到,即
2 实验结果
为了验证本文方法的有效性,用实际录制和计算机模拟的带噪语音信号分别对文献[2]方法(原方法)和本文方法进行了性能测试.实验中,原型滤波器的长度L=128,子带数M=8.
在面积为20 m2左右的封闭办公室内,放置了一个圆形会议桌,墙壁和桌面没有经过任何处理.用间距为5 cm的两个麦克风接收一女性的语音,声源与麦克风之间的距离在1.2 m左右,主要干扰为房间混响和计算机主机的噪声(点噪声源).麦克风接收的两路信号如图3(a)和图3(b)所示.用原方法和本文方法对这两路信号进行了增强处理,增强后的语音信号分别如图3(c)和图3(d)所示.
由图3可以看出,本文方法的噪声抑制效果优于原方法,同时,语音波形基本无失真.听音测试也表明,本文方法增强后的目标语音信号中基本听不出噪声存在,同时对语音造成的损伤很小.
图3 实际录制的两路麦克风信号及两种方法的增强结果Fig.3 Two original signals in real environment and enhanced signals by the two methods
表1给出了用两种方法对实际录制的带噪语音信号进行增强处理前后的信噪比对比情况.由表1可以看出,对于麦克风1信号,本文方法和原方法处理前后信噪比分别提高了7.64 dB和4.46 dB.对于麦克风2信号,本文方法和原方法处理前后信噪比分别提高了9.01 dB和5.83 dB.
表1 两种方法对实际录制带噪语音信号进行增强处理前后信噪比对比情况Tab.1 SNRcomparison of the original and the proposed methodsMIC1 MIC2原方法本文方法4.11 2.74 8.57 11.75
3 小结
本文给出一种基于子带ICA-R和收缩函数后处理的语音增强方法.首先,对两路带噪语音信号进行子带分解,然后用带噪语音信号的功率谱作为子带ICA-R的参考信号,提取出子带目标语音信号,再经过综合滤波器组获得全带目标语音信号;然后,利用收缩函数作后置处理进一步抑制噪声.用实际录制的带噪语音信号的对本文方法进行了测试,结果表明本文方法的噪声抑制效果比较好,语音波形基本无失真.
参考文献:
【相关文献】
[1]Low SY,Nordholm S,Togneri R.Convolutive blind signal separation with post-processing[J].IEEE Trans on Speech and Audio Proc,2004,12(5):539~548.
[2]马晓红.传声器阵列语音增强中关键技术的研究[D].大连:大连理工大学,2006:81~88. [3]Acharyya R,Ham F M.A new approach for blind separation of convolutive mixtures [C].IEEE Proc of International Joint Conf on Neural Networks,Orlando,USA,2007.2075 ~2080.
[4]Hyvarinen A,Hoyer P,Oja E.Sparse code shrinkage:denoising of non-Gaussian data by maximum likelihood estimation[J].Neural Computation,1999,11(7):1739 ~1768.
[5]宗孔德.多抽样率数字信号处理[M].北京:清华大学出版社,1996.
[6]Lu W,Rajapakse JC.Constrained independent component analysis[C].Advances in Neural Information Proc.Systems,San Mateo,USA,2000.570 ~576.
[7]Savada H,Kawamura T,Lee A.Blind Blind Source Separation Based on a Fast-Convergence Algorithm Combining ICA and Beamforming[J].IEEE Trans on Speech and Audio Proc,2006,14(2):666 ~678.
[8]Papoulis A.Probability Random variables and Stochastic Processes[M].McGraw-Hill(3rd edition),1991.。