噪声估计算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
太原理工大学
毕业设计(论文)任务书
噪声估计算法的研究及MATLAB仿真
摘要
日常的通信过程中,语音会常常受到环境噪声的干扰而使通话质量下降,严重时使得语音处理系统不能正常工作。
因此,必须采用信号处理方法通过语音增强来抑制背景噪声从而提高语音通信质量,而噪声估计的准确性又直接影响语音的增强效果。
可见,噪声估计是语音增强的一个非常重要的部分,所以研究噪声估计算法有很好的实用价值。
本文主要研究两种噪声估计算法:基于最小统计和最优平滑的噪声估计算法和最小值控制递归平均法的噪声估计算法,通过实验仿真比较最终研究了一种改进的最小值统计量控制递归平均噪声估计算法。
本文的主要工作总结归纳为以下几方面:
首先,本文对几种经典的噪声估计算法进行研究,了解它们的各自优缺点,在此基础上选定两种较好的算法进行具体分析。
其次,了解最小统计和最优平滑和噪声功率谱统计跟踪的噪声估计算法的原理,它的基本思路是先用最优平滑滤波器对带噪语音的功率谱滤波,得到一个噪声的粗略估计,然后找出粗略估计噪声中的在一定时间窗内的最小值,对这个最小值进行一些偏差修正,即得到所要估计的噪声的方差。
通过MATLAB仿真看其特征。
再次,研究了基于非平稳噪声的估计算法,最后通过比较研究了一种改进的最小值控制递归平均算法。
算法采用递归平均进行噪声估计,其递归平均的平滑量控制递归平均噪声估计算因子受语音存在概率控制,而语音存在概率的计算采用了两次平滑和最小统计量跟踪。
与I.Cohen提出的IMCRA算法相比,本文研究采用了一种快速有效的最小统计量跟踪算法。
仿真结果表明:在非平稳噪声条件下,该算法具有较好的噪声跟踪能力和较小的噪声估计误差,可以有效地提高语音增强系统的性能。
最后,对整体论文总结,通过研究发现改进的最小统计量控制递归平均噪声算法在IMCRA算法的基础上,采用了一种简单有效地最小统计量估计算法,在保证噪声估计准确性的同时,减小了算法的复杂度。
同时,基于这种噪声估计的语音增强系统能有效地提高增强语音的信噪比,并且能有效地消除增强语音中的音乐噪声。
关键词: 噪声估计,谱减法,语音检测,最小递归统计量
NOISE ESTIMATION ALGORITHM RESEARCH
AND MATLAB SIMULATION
ABSTRACT
The Daily communication process, speech will often affected by environmental noise interference and make calls the quality descend, serious when make speech processing system didn't work properly. Therefore, must use signal processing methods through speech enhancement to curb background noise so as to improve the quality of voice communication, and the accuracy of the noise estimates directly affected speech enhancement effect. Visible, the speech enhancement noise estimation is a very important part, so the noise estimation algorithm has very good practical value. This paper makes a study of the two kinds of noise estimation algorithm based on least statistics and: the optimal smooth noise estimation algorithm and minimum control recursion average method noise estimation algorithm through experiment comparative simulation, finally puts forward an improved minimum statistic control recursion average noise estimation algorithm.
This paper sums up the main work for the following aspects:
First of all, the paper on the noise estimation algorithm several classic study, understand their respective advantages and disadvantages, based on selected two good concrete analysis algorithm.
Second, understand the smallest statistics and optimal smoothing and noise power spectrum statistical tracking noise estimation algorithm of principle, it is to use the basic ideas of the optimal smoothing filter belt chirp voice power spectral filtering, get a noise a rough estimate, and then find out roughly in certain time window of noise to a minimum, within the minimum deviation correction, some of which is estimated to have the variance of noise. Through the simulation of MATLAB see its characteristics. noise recursively, estimates that the average recursive average smooth quantity cont Again, this paper proposes an improved minimum statistics. Algorithm for recursion average noise estimates by speech exist probability is factor control, and calculation of speech exist probability by two smooth and minimum statistic tracking. And I. Cohen proposed IMCRA algorithms, this paper adopts a kind of fast and effective minimum statistic tracking algorithm. The simulation
results show that the non-stationary noise conditions, the algorithm has good noise tracking ability and smaller noise estimation error, can effectively improve the performance of the system speech enhancement.
Finally, the whole thesis summed up, through the research found that improved least statistic control recursion algorithm in IMCRA average noise based on the algorithm of a simple and effective minimum statistic estimation algorithm, noise estimation accuracy in guarantee, while reducing the algorithm complexity. Meanwhile, based on this kind of noise estimates speech enhancement system can effectively improve the signal-to-noise ratio of the voice enhanced, and can effectively eliminate the music noise voice enhanced. Analytical papers deficiency and future development direction.
KEY WORDS: noise estimation, the spectral subtraction, voice detection, recursive least statistic
目录
1 绪论 (1)
1.1 噪声估计算法研究的目的和意义 (1)
1.2 国内外研究的现状 (2)
1.3 论文的整体安排 (3)
2 几种经典的噪声估计的算法 (4)
2.1 几种噪声估计算法的优点 (4)
2.2 噪声估计算法 (4)
3 基于语音活动性检测的噪声估计算法及MATLAB仿真 (6)
3.1 基于语音活动性检测的噪声估计算法 (6)
3.1.1 短时能量 (6)
3.1.2 短时平均过零率 (7)
3.1.3 基于短时能量和短时平均过零率的语音活动性检测 (7)
3.1.4 实验仿真 (8)
4 基于非平稳噪声的估计算法及MATLAB仿真 (10)
4.1 最小值统计法 (10)
4.1.1 最优平滑 (10)
4.1.2 最小功率谱统计跟踪 (11)
4.1.3 实验仿真 (12)
4.2 基于统计信息的非平稳噪声自适应算法 (12)
4.2.1 概述 (12)
4.2.2 非平稳噪声自适应算法 (13)
4.3 最小值控制递归平均算法 (14)
4.3.1 计算局部能量最小值 (15)
4.3.2 估计语音存在的概率 (15)
4.3.3 更新噪声谱的估计 (16)
4.4 一种改进的最小统计量控制递归平均噪声估计算法 (16)
4.4.1 改进的噪声估计算法 (16)
4.4.2 实验仿真 (17)
5 总结与展望 (19)
5.1 论文的主要工作 (19)
5.2 目前存在的问题及今后的发展方向 (19)
参考文献 (20)
致谢 (21)
附录:外文文献 (22)
1 绪论
1.1 噪声估计算法研究的目的和意义
语音作为语言的声学表现,是人类特有的也是最重要的思想和情感交流段,也是人机交互最自然的方式。
而人们在通信过程中,语音常常受到环境噪声的干扰而使通话质量下降,在实际应用中噪声的存在也会产生很多问题,语音处理设备对人类语音进行获取或处理的过程不可避免地要受到来自周围环境的各种噪声或其它讲话者的干扰,这些干扰噪声最终将使语音处理设备的接收到的语音不再是纯净的原始语音,而是被噪声污染过的带噪语音。
由于环境噪声的污染会使许多语音处理系统的性能急剧恶化,严重时使语音处理系统不能正常工作,因此在上述情况下,背景噪声的存在不仅严重破坏了语音信号原有的模型参数和声学特性,导致许多语音处理系统服务质量的降低,而且会影响系统输出语音的可懂程度,使听众产生听觉疲劳。
在视频信号中也同样存在噪声,很多视频图像处理都是在没有考虑噪声情况下得出的,如果存在噪声就必将会影响这些算法的有效性。
由于噪声对视频图像处理算法的影响如此大,因此在开发图像视频处理算法时必须考虑噪声,必须有一种可靠的方法能准确地估计噪声,以便使很多图像视频处理算法(比如边缘检测、图像分割和滤波等)在噪声存在的情况下依旧保持非常良好的性能。
然而,语音增强技术作为一种预处理技术,是消除这些噪声干扰的一个最重要的手段,它通过对带噪语音进行处理来改善语音质量,使人们易于接受或提高语音处理系统的性能。
语音增强的主要目标是从带噪语音信号中提取尽可能纯净的原始语音,通过语音增强,抑制背景噪声,提高语音通信质量,而噪声估计又是语音增强的一个非常重要的部分,噪声估计的准确性直接影响到语音增强的效果,因此研究噪声估计算法有很好的实用价值。
在这种情况下,必须建立一个语音增强系统,通过对带噪语音进行处理,以消除背景噪声,改善语音质量,提高语音的清晰度、可懂度和自然度,提高语音处理系统的性能;或者将语音增强作为一种预处理手段,以提高语音处理处理系统的抗干扰能力。
要实现这些第一个环节就是要利用噪声的特性参数,很好的将噪声估计出来。
语音增强算法可从信号输入的通道数上分为单通道的语音增强算法和多通道的语音增强算法。
单通道语音系统在实际应用中较为常见,如电话,手机等。
这种情况下语音和噪声同时存在一个通道中,语音信息与噪声信息必须从同一个信号中得出。
而单通道语音增强是语音增强的基础,单通道语音增强第一个环节就是要利用噪声的特性参数,很好的将噪声估计出来,而在此方法中,噪声源是不可接近的,背景噪声的特性只能从带噪语音中获得。
因此,噪声估计的准确性会直接影响最终效果:噪声估计过高,则微弱的语音将被去掉,增强语音会产生的失真;而估计过低,则会有较多的背景残留噪声。
因此,对噪声估计方法的研究是非常必要的,在语音算法的前期必需要对噪声进行估计。
噪声估计还在语音通讯领域非常重要,同时在统计学、图像处理、军事等方面也起着非常重要的作用. 由于噪声的统计特性比语音的统计特性更平稳,所以噪声估计在统
计学中也很有研究意义。
可见,噪声估计在很多领域起着非常重要的作用,那么噪声估计算法作为研究课题是非常有意义的。
1.2 国内外研究的现状
有关抗噪声技术的研究,在国内外作为非常重要的研究课题,已经作了大量的研究工作,取得了丰富的研究成果。
而噪声估计是语音增强中非常重要的一个部分,在这方面的研究,国外比较多一些,以下介绍几种经典的噪声估计算法。
传统的噪声估计方法是使用语音活动性监测( VAD:Voice Active Detection)判别语音是否出现,并分离出无声段,此时无声段主要表现为噪声特性,然后在无声区通过某种统计方法,获得背景噪声特性的近似估计,对噪声谱进行更新。
尽管该方法在噪声为平稳的情况下是可行的,但是在实际的噪声环境中噪声谱的特性变化很大,在低信噪比下,VAD的误检率会增大,在不能正确判断无声段的情况下很难保证估计出来的噪声的准确性。
因此,为了实现精确的噪声估计,就要对噪声谱进行实时的估计。
1994年Martin提出了一种基于最小值统计的方法来估计噪声,它是基于带噪语音信号的功率水平滞后于噪声的功率水平,因此可以通过跟踪带噪语音信号功率谱的最小值来获得噪声功率谱的估计值。
在大约1.5s 的滑动窗口内寻找每一频率带内的频谱最小值,经过补偿后和带噪语音的功率谱进行比较。
不论带噪语音的功率谱是否小于局部最小值,局部最小值都需要更新。
同时,为了能更快的跟踪并更新局部最小值和频谱最小值,把滑动窗口分为子窗口,在每个子窗口内更新噪声的估计谱,提高了精确度[4]。
此算法的基本思路是先用一个最优平滑滤波对带噪语音的功率谱滤波,得到一个噪声的粗略估计。
然后找出粗略噪声中的在一定时间窗内的最小值,对这个最小值进行一些偏差修正,即得到所要估计的噪声的方差。
1995年Doblinger通过比较前帧带噪语音子带平滑功率谱最小值和后帧带噪语音子带平滑功率谱之间大小,对带噪语音子带平滑功率谱最小值每帧进行跟踪和更新,并将其作为估计的噪声谱,该噪声谱估计方法计算效率高,能快速适应背景噪声的变化,但是它直接把带噪语音子带平滑功率谱最小值作为估计的噪声谱,使得噪声谱过估计。
但这种算法容易将语音电平的增长当作噪声电平的增长。
与此类似的算法还有基于分位数统计量的噪声估计算法,先对噪声估计窗内的信号进行排序,然后按一定的分数比例取信号作为噪声估计,算法复杂度比较高。
2002年Cohen 和Berdugo提出了一种基于最小值控制递归平均法的噪声估计算法,把最小追踪法的鲁棒性与递归平均方法的简单性结合到一起,该算法能够快速地追踪突变的噪声功率谱。
与最小统计相比,对最小值的跟踪不是关键性的,在进行递归平均时不需要对语音出现与缺失进行区分,因此即使在弱语音段也同样可以进行连续噪声估计更新。
具有能够快速跟踪噪声谱的突变的能力。
Cohen提出的噪声估计算法不直接依赖于最小统计量,而依赖于最小值的跟踪算法,具有较好的鲁棒性。
虽然比起Martin的最小值统计跟踪算法效果要好的多,但无法完全避免在噪声上升区域的噪声欠估计及持续强语音后面区域出现的噪声过估计的缺陷。
为了进一步提高算法性能,Cohen提出了改进的最小统计量控制递归平均算法(IMCRA,Improved Minima Controlled Recursive Averaging)。
2004年Rangachari 和Loizou提出了一种快速估计方法,不仅使得带噪语音子带中语音出现概率计算更准确,而且噪声谱的更新在连续时间内不依赖固定时间的窗长,但是在语音或噪声能量过高时噪声的估计就会慢下来,而且如果时间大于0.5s 时,就会削
弱一些语音能量。
因此,噪声估计算法有待更进一步的改进。
2009年余力, 陈颖琪提出了一种基于DCT变换的自适应噪声估计算法,采用DCT系数作为块均匀度的度量,较好地适应了高低噪声的情况,算法复杂度不大,能适用于各种实时图像视频处理系统。
理论分析及实验结果表明本算法不仅在低噪声的图片中表现出良好的性能,而且在高噪声的图片中依旧有效。
此外,还能适应不同质量的图像。
通过对基于最小统计量的噪声估计方法和改进的最小统计量控制递归平均噪声估计算法研究发现这些噪声估计方法可以在语音存在段进行噪声估计,能够有效地跟踪非平稳噪声。
但是,这些算法在各个频带进行噪声估计,算法复杂度高,噪声估计方差大。
于是在考虑各频带间的相关性上提出了在巴克域进行噪声估计,减小了噪声估计方差,提高了噪声估计的准确性,并极大地减小算法运算量和存储量。
而且,在巴克域进行噪声估计更符合人耳听觉特性,增强语音具有更好的质量。
其他类似的方法还有低能量包络跟踪和基于分位数的估计方法,后者噪声的估计是基于带噪语音未平滑功率谱的分位数,而不是提取平滑功率谱的最小值,但是此方法计算复杂度很高,且需要很大的内存来存储过去的功率谱值。
本文重点就是在前人研究的基础上,跟踪国内外最新资料,研究了一种新的噪声估计算法,使延迟时间能够缩短,最好没有延迟。
1.3 论文的整体安排
第一章绪论。
噪声估计算法研究的目的和意义及国内外研究的现状。
第二章几种经典的噪声估计的算法。
Martin的最小统计量的估计算法,Cohen和Berdugo提出的基于最小统计量控制递归平均算法,通过比较最终提出改进
的最小统计量控制递归平均算法,仿真结果表明,这种方法在非平稳噪声
条件下,也具有较好的噪声跟踪能力和较小的噪声估计误差,可以有效地
提高语音增强系统的性能。
第三章基于语音活动性检测的噪声估计算法及MATLAB仿真。
通过基于语音活动性检测的噪声估计算法,对能量和最小过零率的语音端点进行检测,仿真结
果得出,我们需要鲁棒性更强的算法,即使在有语音存在的情况下,也能
够实现噪声的连续估计和不断更新。
第四章最小统计递归平均的噪声估计算法及MATLAB仿真。
首先研究了最小值统计跟踪法通过仿真得出此算法不能快速跟踪真实噪声的变化,并研究了基于
统计信息的非平稳噪声自适应算法,但它的计算很复杂。
其次是Cohen和
Berdugo提出的最小值控制递归平均算法,为了进一步提高算法性能,本文
提出了一种改进的最小值控制递归平均算法,此算法在保证噪声估计准确
性的同时减小了算法的复杂度。
第五章总结全文,并分析论文存在的不足及今后的的发展方向。
在以后的噪声估计算法的研究中要进一步完善噪声功率谱的估计算法,进一步将噪声估计方
法和其他方法相结合,争取得到更加精确的噪声估计。
2 几种经典的噪声估计的算法
2.1 几种噪声估计算法的优点
(1) Martin提出的基于最小统计量的噪声估计算法,是先用一个最优平滑滤波对带噪语音的功率谱滤波,得到一个噪声的粗略估计。
然后找出粗略噪声中的在一定时间窗内的最小值,对这个最小值进行一些偏差修正,即得到所要估计的噪声的方差。
而且,为了能更快的跟踪并更新局部最小值和频谱最小值,把滑动窗口分为子窗口,在每个子窗口内更新噪声的估计谱,提高了精确度。
(2)Cohen和Berdugo提出的基于最小统计量控制递归平均算法, 该方法用一个与时频相关的平滑因子对带噪语音的过去值进行平均,以得到噪声的估计值,然后在每一帧内连续的更新噪声。
采用递归平均进行噪声估计,平滑参数受语音存在概率控制,并由最小统计量控制语音存在概率。
(3) 近年来,提出了一种自适应连续噪声谱估计方法,它是一种专门用语单声道语音增强系统的噪声估计的。
它不需要语音的有声/无声检测,噪声谱在所有的帧中连续的更新,并不关心本帧是语音帧还是噪声帧,对每一帧都重新计算其噪声功率谱。
自适应连续的噪声估计算法,省去了对语音端点的检测,对非平稳噪声也有较好的适应性,即使在有语音存在的情况下,也能够实现噪声的连续估计和不断更新。
2.2 噪声估计算法
Martin提出的基于最小统计量的噪声估计算法的基本思路是先用一个最优平滑滤波对带噪语音的功率谱滤波,得到一个噪声的粗略估计。
然后找出粗略噪声中的在一定时间窗内的最小值,对这个最小值进行一些偏差修正,即得到所要估计的噪声的方差。
这种方法是在噪声估计窗内搜索最小值作为噪声估计量,而且此算法对窗长的选择比较敏感,当窗长比较长时,对非平稳噪声的跟踪速度慢,而且容易出现噪声低估;当窗长比较短时,比较容易出现将语音的低能量成分当作噪声。
这些问题可以通过优化的平滑参数和偏差补偿得以改进,虽然提高了精确度,但这大大地提高了算法的复杂度。
仿真结果表明:最小值统计跟踪法对平稳噪声噪声的估计是比较准确的,但是对非平稳噪声就表现的不好了。
而Cohen和Berdugo提出的最小统计量控制递归平均算法(MCRA,Minima Controlled Recursive Averaging),采用递归平均进行噪声估计,平滑参数受语音存在概率控制,并由最小统计量控制语音存在概率。
这种算法不直接依赖于最小统计量,具有较好的鲁棒性,它是使用一个平滑参数对功率谱的过去值进行平均,该平滑参数是根据每个子带中语音存在的概率进行调整的。
在一给定帧的某个子带中语音是否存在的概率可以由带噪语音的局部能量值与其待定时间窗内的最小值的比值决定,把该比值与某一门限做比较,小的比值意味着该子带中不存在语音,反之,意味着该子带内存在语音。
如果给定帧的某个子带中存在语音,那么该子带内的噪声谱等于上一帧的噪声谱,如果
不存在,则根据带噪语音的功率谱更新噪声谱。
最后,为了防止估计的噪声起伏较大,对其进行了递归平滑。
为了进一步提高算法性能,本文研究了一种改进的最小统计量控制递归平均算法。
该算法采用递归平均进行噪声估计,其递归平均的平滑因子受语音存在概率控制,而语音存在概率的计算采用了两次平滑和最小统计量跟踪。
与Cohen提出的IMCRA算法相比,本文采用的是一种快速有效的最小统计量跟踪算法,在IMCRA算法的基础上,利用其对语音最小统计量估计的鲁棒性,采用了一种简单有效的最小统计量估计算法,在保证噪声估计准确性的同时,减小了算法的复杂度。
仿真结果表明:在非平稳噪声条件下,算法具有较好的噪声跟踪能力和较小的噪声估计误差,可以有效地提高语音增强系统的性能。
3 基于语音活动性检测的噪声估计算法及MATLAB 仿真
传统的噪声估计方法使用语音活动监测(VAD )技术分离出无声段,这时无声段主要表现为噪声特性,然后再通过某种统计方法,即可获得背景噪声特性的近似估计。
尽管该方法在噪声为平稳的情况下是可行的,但是在实际的噪声环境中噪声谱的特性变化很大,就很难达到好的降噪效果。
从实用性、易实现性等方面考虑,很多算法都是建立在相对理想的实验室条件下的,要求背景噪声保持平稳,信噪比较高,而且需要一定的训练算法以预先得到背景噪声及语音的统计信息。
在实际工作中,这些条件很难得到满足,而且经常会遇到信噪比较低,背景噪声缓慢变化的情况,也不可能预先得到背景噪声或语音的统计信息。
而且在低信噪比下,VAD 的误检率会增大,在不能正确判断出有声/无声段的情况下,估计出来的噪声很难保证准确性。
因此,为了实现精确的噪声估计,就要对噪声谱进行实时的估计。
近年来,人们提出了一种自适应连续噪声谱估计方法,它是一种专门用语单声道语音增强系统的噪声估计。
噪声谱在所有的帧中连续的更新,并不关心本帧是语音帧还是噪声帧,对每一帧都重新计算其噪声功率谱,它不需要语音的有声/无声检测,对非平稳噪声也有较好的适应性,即使在有语音存在的情况下,也能够实现噪声的连续估计和不断更新。
本章从语音活动检测和连续更新噪声两方面入手,将几种算法的基本原理及过程进行了详细的描述,并分析了实验结果。
3.1 基于语音活动性检测的噪声估计算法
3.1.1 短时能量
语音信号和噪声信号的区别可以体现在他们的能量上,对于一列叠加有噪声干扰的语音信号而言,其语音段的能量是噪声段能量叠加语音声波能量之和。
因此,语音段的能量一般要大于噪声段的能量。
如果环境噪声和系统输入噪声比较小,以至于能够保证系统的信噪比相当高,那么只要计算输入信号的短时能量或短时平均幅度就能够把语音段和噪声背景分开。
这就是仅仅基于短时能量的端点检测方法。
信号x (t )短时能量∑定义为:
E=
()[]2m w
∑∞-∞=m x (3-1) 语音信号的短时平均幅度定义为: M=
()∑∞
-∞=m x m w (3-2) 短时能量有两种定义:短时时域能量和短时谱幅能量,一般用的是短时频域能量表示,因此,短时能量用傅立叶变换后的平方表示,平均幅度为傅立叶变换后谱绝对值的。