开题报告6基于子空间方法的语音增强处理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
湖南工学院毕业设计(论文)开题报告
题目基于子空间方法的语音增强处理
学生姓名唐莉佳班级学号10401340214 专业通信工程
一、选题目的和意义:
人们在语音通信的过程中将会不可避免的受到周围噪声环境的干扰,由于这些干扰噪声的存在,接收者收到的语音已不是纯净的语音信号。为了尽可能的避免噪声的干扰,基于语音信号增强处理的研究非常重要。然而,由于干扰通常都是随机的,从带噪语音中提取完全纯净的语音几乎不可能。在这种情况下,语音增强的目的主要有两个:一是改进语音质量,消除背景噪声,使听者乐于接受,不感觉疲劳;二是提高语音可懂度,方便听者理解。这两个目的往往不能兼得,到目前为止还没有哪种语音增强系统可以同时很好地改善语音质量和可懂度这两个指标。目前有一些对低信噪比带噪语音进行语音增强的方法,可以显著的降低背景噪声,改进语音质量,但并不能提高语音的可懂度,甚至略有下降。这是因为在实际环境中,语音总会受到外界环境噪声的干扰,这些噪声包括从周围环境,传输媒介中引入的噪声,电器设备的噪声以及其他说话人的干扰等等。环境噪声会影响语音质量,严重的情况下语音将完全淹没到噪声中,无法分辨。语音质量的下降会使语音处理系统的性能急剧恶化。比如,语音识别系统在实验室环境中可取得相当好的效果,但在噪声环境中,尤其是在强噪声环境中使用时,系统的识别率将受到严重影响。低速语音编码同样会受到噪声的影响。由于语音生成模型是低速率语音编码的基础,当语音受到噪声干扰时,提取的模型参数将很不准确,重建的语音质量急剧恶化。此时,采用语音增强技术进行预处理,将有效的改善系统性能。
语音增强的主要目标是从带噪语音信号中提取原始纯净语言信号,衡量语音增强效果的方法分主观测试和客观测试两种。主观测试方法包括平均意见得分(MOS)判断韵字测试(DRT)和判断满意度测量(DAM)等。客观测试方法主要根据增强语音的时域波形或频域语谱,给出客观的数值度量。例如一种常用的方法是采用信噪比来度量,此时信噪比的定义是原始语音信号功率与归一化后的增强语音和原始语音之差的功率比。同时采用板仓距离来测试。
语音增强不但与语音信号数字处理理论有关,而且涉及到人的听觉感知和语音学。再者,噪声来源众多,随应用场合而异,它们的特性也各不相同。即使在实验室仿真条件下,也难以找到一种通用的语音增强算法能适用各种噪声环境。必须针对不同噪声环境,采用不同的语音增强对策。
二、国内外研究动态:
语音增强是在噪声环境下用以提高语音通信系统质量的一个重要技术。随着语音技术研究的深入和实际应用的增多,各种语音处理系统都面临着进一步提高性能的问题,语音增强是其中的关键技术之一,已有几十年的研究发展历史。其研究起与20世纪60年代,随着数字信号理论的成熟,在70年代曾形成一个理论高潮,取得了一些基础性成果,并使语音增强发展成为语音信号处理的一个重要分支。
1978年,Lim和Oppenheim提出了基于维纳滤波的语音增强方法。
1979年,Boll提出了谱相减方法来抑制噪声。
1980年,Maulay和Malpss提出了软判决噪声抑制方法。
1984年,Ephraim和Malah提出了基于MMSE短时幅度谱估计的语音增强方法。
1987年,Paliwal把卡尔曼滤波引入语音增强领域。
1995年.Ephraim提出了基于信号子空间分解的语音增强方法。
近年来,基于子空间的语音增强技术受到许多研究者的重视,该方法可减少信号的失真和人为噪声的引入。子空间技术将带噪语音信号看成向量空间的一部分,并将此向量空间划分成两个相互正交
的子空间:信号子空间和噪声子空间。去除噪声子空间的信号分量可以提高带噪信号的语音质量,进一步从信号子空间中估计出高质量的语音信号。
Ephraim and Van-Trees提出了一套有效的子空间语音增强系统,利用特征值分解(EVD)和卡维南-洛维(KLT)变换分解来进行信号空间的划分,并针对白噪声背景下的带噪语音,提出了有效的时域和频域的线性估计算法。
三、主要研究内容:
语音信号处理的大量实验表明,语音矢量的协方差矩阵有很多零特征值,这说明干净语音信号矢量的能量分布在它对应空间的某个子集中。而语音信号处理中,噪声方差通常都假设已知,且严格正定。噪声矢量存在于整个带噪信号张成的空间中。因此带噪语音信号的矢量空间可以认为由一个信号加噪声的子空间和一个纯噪声的子空间构成。可以利用信号子空间处理技术,消除纯噪声子空间,并对语音信号进行估计,实现语音增强。
具体方法如下:
(1)对带噪语音信号的协方差矩阵做特征值分解,将其投影到两个正交子空间,即信号子空间和噪声子空间。
(2)利用噪声和语音的不相关性,对分解的子空间进行处理,尽可能恢复出原始语音信号,以实现语音增强。
本文采用时域约束估计器(TDC)和频域约束估计器(SDC)两种方法来对噪声能量进行约束,可以使语音失真最小化。
四、实验设计方案:
通过在网上查阅基于子空间语音增强处理的相关资料,使用MATLAB软件编写程序,对时域约束估计器(TDC)和频域约束估计器(SDC)两种方法进行仿真实验。
子空间语音增强原理图如图1所示:
带噪语音KL
变
换
估计
噪声
特征
值
带噪语
音特征
值减去
噪声特
征值
时域(频
域)约束
估计器
KL
逆
变
换
纯净语音图1 子空间语音增强原理图
时域约束估计器(TDC)和频域约束估计器(SDC)增强方法具体步骤如下:
(1)将语音进行KL变换,得到子空间域中的带噪语音的特征向量U和特征值
Y
Λ。
(2)估计噪声特征值
N
Λ,一般取带噪语音前3000点求其方差的平均值作为噪声的特征值估计值N
Λ。