语音增强子空间算法

合集下载

利用子空间改进的K-SVD语音增强算法

利用子空间改进的K-SVD语音增强算法
奇 异 值 分 解 算 法对 噪 声进 行 训 练 , 构 建 出 噪 声 字典 ;最 后 , 用 K 奇异值 分解 算法训 练语 音字典. 在 训 练 过
程 中, 如果 某个 原 子 对 应 的 稀 疏 系 数 低 于 设 定 的 阈 值 , 并 且 该 原 子 可 在 训 练 得 到 的 噪 声 字典 中找 到 , 就 把 该 原 子 对 应 的稀 疏 系数 设 为零 , 即可 达 到 去 噪 的 目的. 仿 真结果 表 明, 改进 算法去 除 白噪声和 b a b b l e噪 声 的效果显著 , 有 效提 高 信 噪 比和 减 少 语 音 失 真 , 同时, 该算 法也可以很好地应用于消除随机噪声.
i mp r o v d e K- S VD a l g o i r t h m b y s u b s p a c e i s p op r o s e d .F i r s t ,t h e n o i s e i s t r a c k d e b y t h e o p t i ma l e s t i ma t o r o f t h e
关键 词 :语 音 增 强 ; K 奇异值分解 ; . 3 5 文献标识码 : A 文章编号 : 1 0 0 1 — 2 4 0 0 ( 2 O 1 6 ) O 6 — 0 1 0 9 — 0 7
Sp e e c h e n h a nc e me nt u s i n g t h e i m pr o v e d K- S VD a l g o r i t hm b y s u b s p a c e
利 用 子 空 间改 进 的 K. S VD 语 音 增 强 算 法
郭 欣 , 贾 海 蓉 , 王 栋
( 太 原 理 工 大 学 信 息 工程 学 院 , 山西 太原 0 3 0 0 2 4 )

语音增强算法的分类[必读]

语音增强算法的分类[必读]

语音增强算法的分类现实环境中的噪声多种多样,特性各异,很难找到一种通用的语音增强算法适用于各种噪声的消除;同时语音增强算法与语音信号数字处理理论、人的听觉系统和语音学等学科紧密相关,这也促使人们必须根据不同的噪声源来选择不同的对策。

以上原因使语音增强技术研究呈现百花齐放的局面。

几十年来,许许多多的学者在这方面进行了不懈的努力,总结出了许多有效的方法。

根据信号输入的通道数,可将这些方法分为单通道的语音增强算法与多通道的语音增强算法。

单通道的语音系统在现实生活中较常见,手机、耳麦等都属于单通道语音系统。

这种情况下,语音与噪声同时存在于一个通道中,语音信号与噪声信号必须从同一个带噪语音中获得。

这种系统一般要求信号中的噪声比较平稳,以便在无声段对噪声进行估计,再依据估计得到的噪声参数对有声段进行处理,得到增强语音。

而多通道的语音系统中语音增强的一种算法是,利用各个通道的语音信号之间存在的某些相关性,对带噪语音信号进行处理,得到增强的语音。

比如,在自适应噪声抵消法中采用了两个话筒作为输入,其中一个采集带噪的语音信号,另外一个采集噪声,从噪声通道所采集的噪声直接当作带噪语音中的噪声,并将它从带噪语音中减去即可。

另一种多通道的语音增强算法是采用阵列信号,这种方法采用多个以一定方式排列的采集设备接收信号。

由于不同的独立信号源与各个采集设备之间的距离不同,最后在各个接收设备中的合成信号也不同,再根据这些信号将各个独立信号分离出来。

按照所依据原理的不同,我们可以将语音增强分为以下几类:(1)参数方法此类方法主要依赖于语音生成模型(例如AR模型)的使用,需要提取模型参数(如基音周期、LPC系数等),经常使用迭代方法。

这种方法的最大缺点就是如果实际噪声或语音与模型有较大的差别,或者由于某些原因使得提取语音参数较困难,则这方法较容易失败。

这类方法常用到一些滤波器,如梳状滤波器、维纳滤波器、卡尔曼滤波器等。

(2)非参数方法非参数方法不需要从带噪语音信号中估计语音模型参数,这就使得此类方法相对于参数方法而言应用较广。

信号子空间语音增强和它的应用对噪声语音识别研究文章

信号子空间语音增强和它的应用对噪声语音识别研究文章

研究文章回顾信号子空间语音增强和它的应用对噪声语音识别克里斯赫墨思,帕特里克,和雨果·范·哈默电机工程学系,天主教鲁汶大学,比利时鲁汶赫维2005年10月收到24份修订于2006年3月2006年4月30日由三颗针科斯塔斯卡推荐本文的目的有三个方面:(1)提供了广泛的审查,(2)派生的信号子空间语音增强这些技术的性能的上限,(3)提出了全面的研究子空间的潜力过滤,以增加对固定加性噪声失真自动语音识别器的特性。

子空间滤波方法是基于嘈杂的讲话观测空间的正交分解成信号子空间和噪声子空间。

这种分解可以用于语音模型的低秩的假设下,对是否有可用的估计的噪声相关矩阵。

我们提出了一个广泛的概述可用的估计,并从中获得了理论估计实验评估的上限的性能,可以实现由任何基于子空间的方法。

与噪声数据的自动语音识别(ASR)的实验表明,基于子空间的语音增强显着提高这些系统的特性添加剂有色噪声环境。

获得最佳性能如果没有明确的嘈杂的Hankel矩阵降秩进行。

虽然此策略可能增加的电平残留噪声,它减少了识别器的后端取出必要的信号信息的风险。

最后,它也示出子空间滤波相比,毫不逊色知名谱减法技术。

版权所有©2007 Kris Hermus等。

这是一个开放的文章,分布在Creative Commons Attribution许可下,允许无限制地使用,分配,任何媒体,提供了原来的工作是正确的引用。

1.简介一类特殊的语音增强技术,已经获得了很多关注的是信号子空间过滤。

在这种方法,非参数的线性估计联合国干净的已知语音信号获得基于在减压位置观察到的噪声信号相互orthog的onal信号和噪声子空间。

这种分解是pos-低等级的线性模型的假设下可与浇口语音和一个不相关的添加剂(白)噪声干扰高效。

在这些条件下,能量的相关性不噪声遍及整个观察空间,而连接相关的语音分量的能量集中在其子空间。

此外,在信号子空间可以回收一贯从喧闹的数据。

音频信号处理中的语音增强算法研究综述

音频信号处理中的语音增强算法研究综述

音频信号处理中的语音增强算法研究综述引言:在现实生活中,由于各种环境因素的干扰,语音信号往往受到噪声的影响而变得模糊不清。

为了提高语音信号的质量和可理解性,研究者们致力于开发各种语音增强算法。

本文将对音频信号处理中的语音增强算法进行综述,从传统方法到深度学习方法,分析其原理、应用和优缺点。

传统语音增强算法:1. 统计模型方法统计模型方法是传统语音增强算法中常用的一种方法。

该方法通过对语音信号和噪声进行建模,通过最大似然准则来估计语音信号的参数,进而实现语音增强。

代表性的算法有谱减法(Spectral Subtraction)、最小均方误差法(Minimum Mean Square Error)等。

这些算法在一定程度上能够减小噪声的影响,提高语音信号的质量,但也存在一定的缺点,例如对于非平稳噪声和低信噪比情况下的处理效果并不理想。

2. 子空间方法子空间方法是基于统计模型方法的另一种改进方法。

该方法通过运用降维、投影等技术,将噪声信号和语音信号从不同的子空间中进行建模和分离。

其中,主成分分析(Principal Component Analysis)和独立分量分析(Independent Component Analysis)是常用的子空间方法。

这些方法具有较好的噪声抑制效果,但也存在对信号相关性的依赖性,对噪音类型的预先知识要求较高等问题。

深度学习方法:随着深度学习的快速发展,越来越多的研究者开始将其应用于语音增强领域,并取得了显著的成果。

1. 卷积神经网络(CNN)卷积神经网络是一种使用卷积层和池化层进行特征提取的神经网络模型。

在语音增强领域,研究者们通过将噪声信号和语音信号输入到CNN中,以降低噪声的影响并提取有用的语音特征。

例如,Deep Convolutional Neural Networks(DCNN)被广泛应用于单麦克风语音增强任务中,取得了较好的增强效果。

2. 循环神经网络(RNN)循环神经网络是一种具有记忆能力的神经网络模型,适用于连续序列数据的处理。

语音增强子空间算法

语音增强子空间算法
• 姓名:龙志军
日期:2015年6月7
1 .应用背景
3 3 4 5 2
2 .语音增强算法现状
3 .改进算法的总方案 4 .算法改进的要点
5 .算法仿真分析与总结
1 .应用背景

语音通信是生活中不可或缺的一部分,实际通信环 境中背景噪声广泛存在,语音信号会受到这些噪声的 干扰。语音增强(speech enhancement)技术是消除噪 声干扰的重要手段,以此达到提高受损语音的质量及 可懂度的目的。语音增强技术几乎渗透到所有的语音 信号处理环节中,它在众多领域有着很好的实际应用 价值与发展前景。
3 .改进算法的总方案
带噪 语音
带噪语音协 方差矩阵
噪声协方 差矩阵
平稳/非平稳 噪声估计
内 嵌 预 白 化 对 角 化 矩 阵
建筑业应用软件
特 征 值 分 解 人耳 听觉 掩蔽 约束 维纳 滤波 最 优 估 计 矩 阵 增 强 语 音
4 .算法改进的要点
噪声连续频谱最小值跟踪 内置预白化处理色噪声 人耳听觉约束维纳滤波
1)仿真对象为输入SNR为0dB的babble带噪语音,时域波形如图:
(a)带 噪 语 音 0.5
幅度
0 -0.5
0
0.5
1 时间
1.5
2
2.5 x 10
4
(b)纯 净 语 音 0.5
幅度
0 -0.5 0 0.5 1 时间 (c)本 文 改 进 算 法 增 强 语 音 0.5 1.5 2 2.5 x 10
11.2479
4.3016 11.9964 3.8230 12.2161
10.3990
3.5367 10.3867 3.6936 11.5947

几种单通道的语音增强算法研究

几种单通道的语音增强算法研究

图1谱相减法的一般形式最小均方误差估计(MMSE)基于短时频谱幅度(STSA)对于语音可懂度和质量的重要性究者提出了从已知带噪信号中提取信号幅度谱的最优方法———最小均方误差估计法(MMSE),其估计式如下,A^(k)=ξk1+ξk exp(12∞v∫e-t t dt)R(k)1.3子空间算法图2子空间算法的通用结构基于信号子空间的语音增强算法以线性代数为基础,通过正交分解的思想将带噪信号向量空间分解为分别由纯净信号主导和噪声信8000Hz。

以SNR=5的条件进行仿真的波形图如图3所示。

图3SNR=5时,三种单通道语音增强处理后的波形图以SNR和LLR作为测试实验性能的评价标准。

根据文献[]用来评价去噪能力,LLR用来评价语音失真度,SNR越大越好越小越好。

其仿真结果所获数据见表1。

表1三种单通道语音增强算法的SNR和LLR度量标准输入信噪比0db输入信噪比5db子空间MMSE谱减法子空间MMSE谱减法SNR 6.0042 5.2685 4.428210.4989 6.48808.8460LLR 1.2331 1.1278 1.2234 1.09940.9123 1.0288babble SNR 5.2586 4.5026 4.1849 6.9688 5.3100 6.1929 LLR 1.3145 1.0540 1.1641 1.05970.82240.8316airport SNR 5.8524 5.3125 4.894510.12547.23128.0234 LLR 1.3124 1.0235 1.1864 1.02340.89570.9854(下转第222. All Rights Reserved.Science&Technology Vision科技视界谱减法做为最基本的语音增强算法。

但是实现了分类教学。

强化图书管理员和读者自身素质,。

数字信号处理中的语音增强算法与处理方法

数字信号处理中的语音增强算法与处理方法

数字信号处理中的语音增强算法与处理方法数字信号处理在现代通信领域扮演着重要角色,语音增强作为其中的一个关键应用领域,致力于提高语音信号的质量和清晰度。

本文将介绍一些常用的语音增强算法与处理方法,以帮助读者更好地理解数字信号处理中的语音增强技术。

1. 时域法时域法是一种常见的语音增强算法,它主要通过对语音信号的时间域进行处理来提高语音信号的质量。

其中最常用的方法是维纳滤波器。

维纳滤波器是一种自适应滤波器,它通过最小化噪声和语音信号之间的均方误差来估计噪声的功率谱密度,并对语音信号进行滤波,以减少噪声干扰。

另一个常用的时域方法是扩展最小拍线(EMD),它利用自适应滤波器和经验模态分解方法,对语音信号进行去噪处理。

EMD方法通过将信号分解为一组固有模态函数(IMF)和一个剩余项来进行去噪,从而提高语音信号的质量。

2. 频域法频域法是另一种常用的语音增强算法,它主要通过对语音信号的频域进行处理来提高语音信号的质量。

其中最常用的方法是谱减法。

谱减法通过估计噪声的功率谱密度,将它从观测到的语音信号的频谱中减去,从而减少噪声干扰。

此外,为了尽量保留语音信号的谐波特征,谱减法还会对估计的语音信号功率谱做一些修正。

另一个常用的频域方法是基于频谱特性的语音增强算法,例如基于谐波比的方法和基于特征选择技术的方法。

这些方法通过分析语音信号的频谱特性,如谐波比和谐波间隔等,来提取语音信号的有用信息并减小噪声干扰。

3. 混合域法混合域方法是一种将时域和频域方法相结合的语音增强算法,它综合了两种方法的优点,以达到更好的增强效果。

其中一个常用的混合域方法是频率子带加权方法。

这种方法将音频信号分为多个子带,对每个子带分别进行时域和频域处理,然后将结果进行加权合并,从而提高整体语音信号的质量。

另一个常用的混合域方法是基于主成分分析(PCA)的方法。

PCA方法通过对语音信号进行降维处理和离散余弦变换,从而减少噪声干扰和提取有用的语音信息。

具有较高可懂度的子空间语音增强算法

具有较高可懂度的子空间语音增强算法
i s mo d i f i e d t o c o n s t r a i n t h e ma g n i t u d e s p e c t r u m o f t h e a mp l i f i c a t i o n d i s t o r t i o n i n e x c e s s o f 6 . 0 2 d B wh i c h a f f e c t s i n t e l l i g i b i l i t y
mu m me a n s q u a r e e r r o r t O c o n s t r a i n s p e e c h d i s t o r t i o n b u t i g n o r e s p e e c h d i s t o r t i o n r e g i o n d i f f e r e n c e s h a v e a s i g n i f i c a n t e f f e c t o n
i n t e l l i g i b i l i t y .A p r i o r i s i g n a l n o i s e r a t i o( S NR)a n d g a i n ma t r i x a r e u s e d t O d e t e r mi n e t h e d i s t o r t i o n r e g i o n .Th e n t h e g a i n ma t r i x
A b s t r a c t :A h i g h e r i n t e l l i g i b i l i t y s p e e c h - e n h a n c e me n t a l g o r i t h m b a s e d o n s u b s p a c e i s p r o p o s e d .T h e ma j o r i t y e x i s t i n g s p e e c h - e n —

基于非线性动力学的子空间语音增强

基于非线性动力学的子空间语音增强
基于非线性动力学的子空间语音增强
孙俊峰, ,王新龙
( 南京大学近代声学国家重点实验室。南京大学声学研究所, 南京 209 ) 1 3 0
Sbpc Sec Ehne et e o usae eh acm nB s n p n a d
No l er nm i ni a D a cs n y
S J -nl a X -n u ufg, n ilg n e W g o n n
1Y r , ah pcEh c euna mm nq r rr ti S c l 2 E a DMl, h nmn sg n u MaS a EoS r m pt 1 hi . S e n e t M i e-ue h - e r p m a e a i i r oT e a
A pt e ia r] E E n. cutSe had nl e i , , -11 m l d Et t [, Tas n s, e , S aPo sn 18 1 91 . i u sm o J IE r o A o . p c n i g r s g 94 1 2 c 0 A K m r n SK M l kN nnaD nmc A a s oSe h ] . u . A . 9665 2. . a ad . l , le ya il l i f c[, c s Sc m, , 68 u , . ui o i r c a n y s pe J J o t o. 1 A 9 1 - [RHg e, . t ad t s i eo i hm n eh nlui cask f t e[, s e. 4 . g rH K n , L Ma sn D nin u a sec s a s g ole u s]Py. ] e a z n . a i, s g p i s h i e r J h R v g n a

语音增强算法的分类

语音增强算法的分类

语音增强算法的分类现实环境中的噪声多种多样,特性各异,很难找到一种通用的语音增强算法适用于各种噪声的消除;同时语音增强算法与语音信号数字处理理论、人的听觉系统和语音学等学科紧密相关,这也促使人们必须根据不同的噪声源来选择不同的对策。

以上原因使语音增强技术研究呈现百花齐放的局面。

几十年来,许许多多的学者在这方面进行了不懈的努力,总结出了许多有效的方法。

根据信号输入的通道数,可将这些方法分为单通道的语音增强算法与多通道的语音增强算法。

单通道的语音系统在现实生活中较常见,手机、耳麦等都属于单通道语音系统。

这种情况下,语音与噪声同时存在于一个通道中,语音信号与噪声信号必须从同一个带噪语音中获得。

这种系统一般要求信号中的噪声比较平稳,以便在无声段对噪声进行估计,再依据估计得到的噪声参数对有声段进行处理,得到增强语音。

而多通道的语音系统中语音增强的一种算法是,利用各个通道的语音信号之间存在的某些相关性,对带噪语音信号进行处理,得到增强的语音。

比如,在自适应噪声抵消法中采用了两个话筒作为输入,其中一个采集带噪的语音信号,另外一个采集噪声,从噪声通道所采集的噪声直接当作带噪语音中的噪声,并将它从带噪语音中减去即可。

另一种多通道的语音增强算法是采用阵列信号,这种方法采用多个以一定方式排列的采集设备接收信号。

由于不同的独立信号源与各个采集设备之间的距离不同,最后在各个接收设备中的合成信号也不同,再根据这些信号将各个独立信号分离出来。

按照所依据原理的不同,我们可以将语音增强分为以下几类:(1)参数方法此类方法主要依赖于语音生成模型(例如AR模型)的使用,需要提取模型参数(如基音周期、LPC系数等),经常使用迭代方法。

这种方法的最大缺点就是如果实际噪声或语音与模型有较大的差别,或者由于某些原因使得提取语音参数较困难,则这方法较容易失败。

这类方法常用到一些滤波器,如梳状滤波器、维纳滤波器、卡尔曼滤波器等。

(2)非参数方法非参数方法不需要从带噪语音信号中估计语音模型参数,这就使得此类方法相对于参数方法而言应用较广。

基于麦克风阵列的语音增强方法

基于麦克风阵列的语音增强方法

基于麦克风阵列的语音增强方法概述:在日常生活和工作中,语音通信是人与人之间互相传递信息沟通不可缺少的方式。

在语音通信中,语音信号不可避免地会受到来自周围环境和传输媒介的外部噪声、通信设备的内部噪声及其他讲话者的干扰。

这些干扰共同作用,最终使听者获得的是被噪声污染过的带噪声语音,严重影响了双方之间的交流。

应用阵列信号处理技术的麦克风阵列能够充分利用语音信号的空时信息,具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点,逐渐成为强噪声环境中语音增强的研究热点。

本文将介绍各种麦克风阵列语音增强方法,并总结各个方法的优劣。

最终得出更好的、能够去噪的基于麦克风阵列的语音增强方法。

1麦克风阵列麦克风阵列是将两个麦克风的信号耦合为一个信号。

在频率响应中也可以根据时域中波束形成与空间滤波器相仿的应用,分析出接收到语音信号音源的方向以及其变化。

采用该技术,能利用两个麦克风接收到声波的相位之间的差异对声波进行过滤,能最大限度将环境背景声音滤掉,只剩下需要的声波。

对于在嘈杂的环境下使用采用了这种配置的设备,在嘈杂的环境下能使听者听起来很清晰,没杂音。

2基于麦克风阵列的语音增强方法2.1基于自适应波束形成器的麦克风阵列语音增强自适应波束形成是现在广泛使用的一类麦克风阵列语音增强方法。

最早出现的自适应波束形成算法,其基本思想是在某方向有用信号的增益一定的前提下,使阵列输出信号的功率最小。

在线性约束最小方差自适应波束形成器的基础上,1982 年Griffiths 和Jim 提出了广义旁瓣消除器成为了许多算法的基本框架。

广义旁瓣消除器(GSC)的工作原理是带噪声的语音信号同时通过自适应通道和非自适应通道,自适应通道中的阻塞矩阵将有用信号滤除后产生仅包含多通道噪声参考信号,自适应滤波器根据这个参考信号得到噪声估计,最后由这个被估计的噪声抵消非自适应通道中的噪声分量,从而得到有用的纯净语音信号。

麦克风阵列的自适应算法通过迭代运算获取波束形成的最优权矢量时,噪声模型的估计是一个非常关键的因素。

具有较高可懂度的子空间语音增强算法

具有较高可懂度的子空间语音增强算法

具有较高可懂度的子空间语音增强算法刘鹏;马建芬【期刊名称】《计算机工程与设计》【年(卷),期】2013(34)7【摘要】A higher intelligibility speech-enhancement algorithm based on subspace is proposed.The majority existing speech-enhancement algorithms cannot effectively improve enhanced speech intelligibility.One important reason is that they only use minimum mean square error to constrain speech distortion but ignore speech distortion region differences have a significant effect on intelligibility.A priori signal noise ratio (SNR) and gain matrix are used to determine the distortion region.Then the gain matrix is modified to constrain the magnitude spectrum of the amplification distortion in excess of 6.02 dB which affects intelligibility much.Objective evaluation shows that the proposed algorithm can improve enhanced speech intelligibility NCM (normalized covariance metric) evaluation values.Subjective audition shows that the algorithm improve the enhanced speech intelligibility.%提出了一种具有较高可懂度的基于子空间的语音增强算法.现有的多数语音增强算法无法有效提高增强后语音的可懂度,一个重要原因是这些算法均只使用最小均方误差来限制语音的畸变,却忽视了不同区域语音畸变对可懂度的影响存在较大差异.为了弥补这一缺陷,提出了借助先验信噪比和增益矩阵来判断语音畸变区域,通过改变增益矩阵将对可懂度影响较大的放大倍数大于6.02dB的畸变进行幅度谱限制.客观评价表明,该算法能提高增强后语音可懂度NCM评测值.主观试听结果表明,该算法确实提高了增强后语音的可懂度.【总页数】4页(P2619-2622)【作者】刘鹏;马建芬【作者单位】太原理工大学计算机科学与技术学院,山西太原030024;太原理工大学计算机科学与技术学院,山西太原030024【正文语种】中文【中图分类】TN912.35【相关文献】1.利用子空间改进的K-SVD语音增强算法 [J], 郭欣;贾海蓉;王栋2.一种低信噪比条件下的高可懂度的语音增强算法 [J], 孟欣;马建芬;张雪英3.具有高可懂度的改进的维纳滤波的语音增强算法 [J], 郭利华;马建芬4.基于DNN的子空间语音增强算法 [J], 贾海蓉;王栋;郭欣5.低信噪比下高可懂度语音增强算法 [J], LIU Peng因版权原因,仅展示原文概要,查看原文内容请购买。

基于特征值置换的子空间语音增强算法

基于特征值置换的子空间语音增强算法
中 文 引 用 格 式 :孙成 立 ,穆 俊 生 .基 于 特 征值 置 换 的子 空 间语 音增 强 算 法 [J].计 算 机 工程 ,2016,42(2):272—277,282. 英 文 引 用 格 式 :Sun Chengli,Mu Junsheng.Subspace Speech Enhancement Algorithm Based on Eigenvalue Substitu— tion[J].Computer Engineering,2016,42(2):272—277,282.
【Abstract】A subspace speech enhancement approach is proposed for a better reconstructed speech quality.On the basis of Generalized Eigenvalue Decomposition(GEVD ) subspace approach for speech enhancement,speech quality is
im proved by eigenvalue substitution.The study shows that af ter the generalized eigenvalue decom position for the covariance matrices of the clean speech signal and the noise,the larger eigenvalue com ponent contains the main inform ation of speech signal,while the sm aller eigenvalue component contains noise inform ation.After the eigenvalue ordering,the sm aller eigenvalue and its corresponding eigenvectors are replaced with the larger ones so that there is a better enhanced speech signal and the correlation of the speech fram e can be improved greatly.Com pared with other subspace m ethods,the proposed method can restrain strong noise m ore effectively,and get a higher signal noise ratio.

一种基于子空间分解的语音增强算法

一种基于子空间分解的语音增强算法
TP 0 . 文 献 标 识 码 A 文 章 编 号 1 7 - 3 1 2 O ) 2 O 7 — 3 3 16 6 24 2 ( O 6 O 一 O OO
中图 分 类 号
A o nc a i n Enh nc m e l o ihm s d Pr nu i to a e ntA g r t Ba e
m usc n s . i oie
Ke wo d p o u ca i n e h n e n n ie u s a e y rs r n n ito n a c me t o s s b p c I I
LiBi g n En ne r,Co put r Cen er gi e m e t ,SCU FN ,W uha 30 4, n 4 07 Chi na
o u p c c m po ii n n S bs a e De o s to
LiB i g n
Ab ta t Th s p p r g v s a p o u ca i n e h n e n l o i m a e n Ka h e o v a s o m. Th sr c i a e ie r n n it n a c me t ag rt o h b s d o r u n L e e Tr n f r e
o n y o h ss t h o s . I a e a p id t r c s h r n n it n wih wh t o s .c l r n ie a d n a y h p t e i o t e n ie t c n b p l o p o e s t e p o u ca i t ie n ie o o o s n e o
在信 号 处理 的许 多应 用 中 , 用信 息 必须 从 一 有

基于子空间语音增强方法的研究

基于子空间语音增强方法的研究

基于子空间语音增强方法的研究【摘要】目的:研究基于信号子空间的语音增强方法。

方法:利用Cool Edit Pro2.0软件录制语音,加入各种噪声,利用 Matlab软件进行分析、处理。

结果:观察语音信号波形图和语谱图,利用信号子空间的分解方法,可使信噪比大大增加。

结论:基于子空间的语音增强方法在主观听觉与客观指标上均得到了令人满意的效果。

【关键词】子空间;语音增强;语谱图Abstract Objective: To study speech enhancement method based on the signal sub-space.Methods: Speeches to which various noises were added was recorded by Cool Edit Pro2.0,and analyzed and then dealt with by Matlab.Results: The ratio of noise and signal can be improved a lot by reading speech waveform and speech spectrum and using the sub-space decomposition.Conclusion: The method of speech enhancement based on signal sub-space has achieved satisfying effects in both subjective hearing and objective quota.Key words sub-space enhancement;speech enhancement;speech spectrum语音识别研究已经取得重大发展,但距离机器与人自由交流的目标还相当遥远。

目前的识别系统大都是局限在安静环境中使用的,在噪声环境中,尤其是强噪声环境,语音识别系统的识别性能将受到严重影响。

基于信号子空间的麦克风阵语音增强算法

基于信号子空间的麦克风阵语音增强算法
~tl V a n
T
rees
那 么 总 的 协 方 差 矩 阵 可 以 表 示 如下
用 于 语 音增 强 的 子 空 间算 法 以 来







(4 )
燃萎主 H







其 中 I 。 是 个 N X N 维单位阵 ’ T T u U 设U 【 其 中 H i 是 R 的单位 L ] 2 特 征 向量 对 应 的 特征 值为 入 且 入 > o a ll u 。是 R 的任 意 个 主 特 征 向量 N R U 入 U 因此
=
E
k

z
=




=
=



应用
最早 提 出 又 出现 2 了 些 新 的 算法 “1 1 它们 都 是 在前者 的 基础 上 提 出的 信 号 子 空 间方 法 即 通 过 将 含 噪 语 音 分 解为 语 音 子 空 间 和 噪 声 子 空 间 并 将 含噪 语 音投 影 到 语 音 子 空 间 中 以 该投 影 作 为 语 音 信号 的 估计值 假 设 噪 声是 零 均 值 的 加性 白噪 声 且 与 语音信 号 不 相 关 则其 协 方 差 矩 阵是 正 定的 当噪 声 不 为 白噪 声 时 可 以 先 采 用 线 性 变换 对 非 白噪 声 信 号 进 行 白化 处 理 将 有 色噪 声转 化 为 白噪 声 然后 通 过 K L 展 开 将 含噪语 音信 号 所张 成 的 空 间分 解 成 信 号 子 空 间和噪 声子 空 间

● ● ● ● ●
● ● ●
(6 ) L l 2 则式 (5 ) 可 以 化 为 :

一种改进的子空间语音增强方法

一种改进的子空间语音增强方法

Ne i w mpr v d u pa e m e ho fs e c e o e s bs c t d o p e h nha c m e t ne n
WA GWe -e WAN i, N u - n T N i g N nj , i G X a WA G G o u , O G Qa j n
( 河北 工业 大 学 信 息 工 程 学 院 ,天 津 3 0 0 ) 0 4 1
摘 要 : 出一 种 基 于奇 异 值 分 解 的 子 空 间分 解 语 音 增 强 方 法 , 方 法 是 利 用最 小值 统 计 噪 声估 计 法代 替 传 统 的 V D 提 该 A 方 法 对 噪 声进 行 估 计 , 利 用 所得 噪 声 和 带 噪 语 音 构 造 的 协 方 差 矩 阵得 到 纯 净 语 音 的协 方 差 矩 阵 , 将 特 征 值 分 解 并 并 的 时 域 约 束 和 频 域 约 束 估 计 方 法 推 广 到 奇异 值 分 解 方 法 中 , 过 奇 异 值 分 解 、 构得 到 增 强 后 的语 音 信 息 。 试 验 表 通 重
明 : 方法具有较好的去噪效果 。 该 关 键 词 : 异 值 分 解 ; 声 估 计 ; 小统 计 ; 号 子 空 间 奇 噪 最 信
中 图 分 类 号 : N 1. T 9 23 文 献标 识码 : A 文 章 编 号 :1 7 — 2 6 2 l )6 0 2 - 3 6 4 6 3 (O O 0 — 17 0
ma r .E g n v l e d c mp st n o e t - o i o sr i t n r q e c o i o sr i t e t t n me h d a e t x i e au e o o i o ft i d ma n c n t ns a d f u n y d ma n c n t n s si i t o r i i h me a e a ma o
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4
幅度
0 -0.5
0
0.5
1 时间
1.5
2
2.5 x 10
4
S
3)对比算法处理后的测试语音的MOS(5分制),如下表:
SNR 0dB 10dB 0dB 10dB
噪声类型 babble噪声 babble噪声 汽车噪声 汽车噪声
本文改进算法 3.2 4.6 3.5 4.7
传统子空间算法 2.8 4.1 2.7 4.1
2 .语音增强算法现状
语音增强算法分类
1、谱减法 2、基于统计模型的算法 3、子空间算法
语音增强算法发展趋势
变化域语音增强算法可以充分利用变化域中语音与背景噪声较时域更为明显 的特征,且又能有效的消除语音信号在时域中存在的相关特性,因此增强效 果更明显,变化域增强算法是当今研究的热点,这是本文选取变化域语音增 强算法的主要原因。
3 .改进算法的总方案
带噪 语音
带噪语音协 方差矩阵
噪声协方 差矩阵
平稳/非平稳 噪声估计
内 嵌 预 白 化 对 角 化 矩 阵
建筑业应用软件
特 征 值 分 解 人耳 听觉 掩蔽 约束 维纳 滤波 最 优 估 计 矩 阵 增 强 语 音
4 .算法改进的要点
噪声连续频谱最小值跟踪 内置预白化处理色噪声 人耳听觉约束维纳滤波
0dB
10dB
火车站噪声
火车站噪声
3.5
4.7
3.0
4.2
3)对比算法在不同背景噪声输出语音的分段信噪比,如下表:
噪声类型 Babble噪声(0dB)
输入 (dB) 2.6824
本文算法 (dB) 3.4335
子空间算法 (dB) 2.8598
Babble 噪 声 ( 10dB ) 9.9377
汽车噪声(0dB) 汽车噪声(10dB) 火车噪声(0dB) 火车噪声(10dB) 2.8033 9.9389 2.7493 9.9800
其中 为LPC多项式, 为短时线性预测系数, 为控制共振峰区域的能量 误差的参数, 为预测阶数
2)对噪声失真进行频谱整ห้องสมุดไป่ตู้其实现过程为:
其中:
将上式结合维纳约束优化问题,解得最优线性估计器:
得函数:
,求解
知:
对于白噪声,最优估计器满足:
对于色噪声,结合内嵌预白化最优估计器满足:
5 .算法仿真分析与总结
11.2479
4.3016 11.9964 3.8230 12.2161
10.3990
3.5367 10.3867 3.6936 11.5947
总结
本文提出的基于人耳听觉掩蔽维纳滤波的改进子空间语音 算法,从三个关键要点对传统的子空间算法进行了改进优化, 克服了传统子空间语音增强算法中去除噪声过程中出现的音 乐噪声和失真问题,仿真结果表明在传统子空间算法基础上, 利用人耳听觉掩蔽效应对带噪语音的噪声频谱整形,将其集 成到维纳滤波,对获得的信号子空间进行修改,得到了最优 的估计器,滤波处理后得到的增强语音,达到了理想的去噪 效果。 此外,本文的连续频谱最小值跟踪虽然在语音段也可连续 更新估计噪声,但其存在不论噪声功率是否增加,只要带噪 语音功率谱变大,噪声估计也会跟踪变大的缺点,还有待改 进完善。
4
幅度
0 -0.5
0
0.5
1 时间
1.5
2
2.5 x 10
4
2)仿真对象为输入SNR为10dB的babble带噪语音,时域波形如图:
(a)带 噪 语 音 0.5
幅度
0 -0.5
0
0.5
1 时间
1.5
2
2.5 x 10
4
(b)纯 净 语 音 0.5
幅度
0 -0.5 0 0.5 1 时间 (c)本 文 改 进 算 法 增 强 语 音 0.5 1.5 2 2.5 x 10
1)仿真对象为输入SNR为0dB的babble带噪语音,时域波形如图:
(a)带 噪 语 音 0.5
幅度
0 -0.5
0
0.5
1 时间
1.5
2
2.5 x 10
4
(b)纯 净 语 音 0.5
幅度
0 -0.5 0 0.5 1 时间 (c)本 文 改 进 算 法 增 强 语 音 0.5 1.5 2 2.5 x 10
噪声连续频谱最小值跟踪
对噪声谱进行非线性处理,对功率谱的最小值进行跟踪:
内置预白化处理色噪声
对于色噪声,对带噪信号协方差与噪声信号协 方差矩阵进行EVD分解,其中的 角阵,我们寻找矩阵可以同时对角化 不是对 和 :
其中

分别为
的特征值和特征向量,即:
人耳听觉约束维纳滤波
1)利用信号的LPC分析所导出的感知滤波来将残留噪声 频谱适当分布以使能被信号谱所掩蔽,其传递函数如下:
• 姓名:龙志军
日期:2015年6月7
1 .应用背景
3 3 4 5 2
2 .语音增强算法现状
3 .改进算法的总方案 4 .算法改进的要点
5 .算法仿真分析与总结
1 .应用背景

语音通信是生活中不可或缺的一部分,实际通信环 境中背景噪声广泛存在,语音信号会受到这些噪声的 干扰。语音增强(speech enhancement)技术是消除噪 声干扰的重要手段,以此达到提高受损语音的质量及 可懂度的目的。语音增强技术几乎渗透到所有的语音 信号处理环节中,它在众多领域有着很好的实际应用 价值与发展前景。
相关文档
最新文档