MMSE语音增强算法的实时性改进

合集下载

一种基于MMSE-LSA和VAD的语音增强算法

一种基于MMSE-LSA和VAD的语音增强算法

一种基于MMSE-LSA和VAD的语音增强算法晏光华【摘要】通过介绍语音增强的特点,详细分析了最小均方误差对数谱幅度估计(MMSE-LSA)算法,并提出了与MMSE-LSA算法相匹配的语音激活检测(VAD)算法。

该方案计算简单、易于实现且语音增强效果好,能够动态地跟踪背景噪声的变化。

最后通过仿真分析,比较了MMSE-LSA与其它几种语音增强算法的增强效果。

%The minimum mean square error of log-spectral amplitude estimator (MMSE-LSA) algorithm is analyzed in detail by introducing the characteristics of speech enhancement, and voice activity detection (VAD) algorithm matching with MMSE-LSA algorithm is proposed. This scheme is simple and easy to implement and its speech enhancement effect is good. In addition, it can track the changes of background noise dynamically. Finally, the enhancement effect of MMSE-LSA is compared with that of other algorithms by the analysis of simulation.【期刊名称】《移动通信》【年(卷),期】2014(000)010【总页数】5页(P59-62,66)【关键词】MMSE-LSA;VAD;语音增强【作者】晏光华【作者单位】海军司令部信息化部,北京100036【正文语种】中文【中图分类】TN912.351 引言在语音通信特别是军用语音通信中,各类的噪声干扰较为普遍,坦克、飞机、舰船上的电台常常会受到很强的背景噪声干扰,严重影响语音通信的质量和效果。

基于听觉掩蔽效应的MMSE语音增强算法

基于听觉掩蔽效应的MMSE语音增强算法

C mp trE g ern n p la o s2 0 ,3 2 )10 1 1 o ue n i eig a d A pi t n ,07 4 (7 :4 - 4 . n ci
Ab t a t T i a e o a e o t e e o s p o l ms f t e e i u l o s a d h s e c a e r t n r u h b t e sr c : h s p p r f c s s n h s r u r b e o h rsd a n i i e n t e p e h b rai b o g t y h MMS o E meh d fr s e c n a c me t w e S R s l w.h p o o e lo t m n op r ts t e t o o p e h e h n e n h n N i o T e r p s d ag r h ic r o ae h ma kn p o et s o h a o d — i s i g r p ri f t e e r t a — e s
增强算法的 目的就是得到信号幅值的估计值彳 , 并满足估 计误 差的均方值
IE( 7 { =

目前 , 语音增强的算法 有很 多 , 常用 的基 于短 时幅度谱估 计的算法有谱减法 、 维纳滤波法和最小均 方误差估 汁( MMS E)
a d te d ce sn fte s e c b rain n h e raig o h p e h a e t . o Ke r s p e h e h n e n; nmu a q ae Ero( y wo d :s e c n a c me tMii m Me n S u r rrMMS ; s ig po e is rsd a os e v l E) ma kn rp r e ;e iu ln ie rmoa t

基于EMMD/MMSE低信噪比的语音增强方法

基于EMMD/MMSE低信噪比的语音增强方法

基 于 E MD M MS M / E低 信 噪 比 的 语 音 增 强 方 法
张 正 苏 刘柏 森 , 美玲 , 孙
(.黑 龙 江 工 程 学 院 电 气与 信 息 工 程 学 院 , 龙 江 哈 尔滨 1 0 5 ;2 1 黑 5 0 0 .哈 尔滨 工程 大 学 信 息 与 通 信 工 程 学 院 , 黑龙 江 哈 尔
第 2 第3 6卷 期
21 0 2年 9月






ቤተ መጻሕፍቲ ባይዱ

学 报 ( 自然科 学版 )
Vo . 6 N . 12 o 3
S p., O12 e 2
 ̄ J u n l f i n j n n t ueo c no tg o ra o l gi gI si t fTe h l y He o a t
sg a r c s i g, S s t b an g o p e h e h n e e t p ro ma c . Th o g o n x e i e t , i n l o e sn p O a o o t i o d s e c n a cm n e f r n e r u h d i g e p rm n s
Ab t a t E M D a o v h n p i te f c r b e e i n EM D ,b te i t g mu i o s n t e sg sr c : M c n s l e t e e d o n fe tp o l m x t i s u x s i sc n ie i h i — n
ma o n o i r n a d C mmu iain E gn e ig C l g ,Ha bnEn ie rn ie st ,Ha bn 1 0 0 ,Chn ) n ct n ie rn l e o o e r i gn e ig Unv r i y r i 0 1 5 ia

语音识别技术中的语音增强方法

语音识别技术中的语音增强方法

语音识别技术中的语音增强方法语音识别技术是一种基于计算机的人机交互方式,它将人的语音信息转化为文本或命令,实现自然语言对计算机的控制和交流。

然而,由于语音信号受到环境噪音、语音质量等多种因素的影响,识别准确度可能会受到一定的影响。

为了提高语音识别的准确性和稳定性,语音增强方法应运而生。

一、噪声抑制技术噪声是语音识别中常见的干扰因素之一,它会降低语音信号的质量,阻碍识别系统的准确工作。

因此,噪声抑制技术成为解决这一问题的重要手段之一。

常见的噪声抑制方法包括:频域滤波法、时域滤波法和声学特征转换法。

1. 频域滤波法频域滤波法是基于频域分析的一种噪声抑制技术,它通过分析语音信号的频率特性,有选择性地抑制噪声成分,保留语音信号的有用信息。

常用的频域滤波方法包括谱减法、MMSE准则和Subspace方法等。

2. 时域滤波法时域滤波法是一种基于时域分析的噪声抑制方法,它通过分析语音信号在时间域上的特性,对噪声信号进行抑制。

经典的时域滤波方法有阻带滤波法、LMS自适应滤波法和Kalman滤波法等。

3. 声学特征转换法声学特征转换法是一种基于声学特征的噪声抑制方法,它通过对语音信号的声学特征进行转换,使其更适合于识别算法的处理。

常见的声学特征转换方法有Mel频率倒谱系数(MFCC)、倒频谱法和线性预测法等。

二、语音增强技术除了噪声抑制技术外,语音增强技术也是一种重要的语音处理手段。

它通过调节语音信号的频谱特性,改善语音信号的质量,为语音识别系统提供更清晰、准确的输入。

常见的语音增强技术包括谱减法、频谱平滑法和频谱估计法等。

1. 谱减法谱减法是一种常用的语音增强方法,它通过对语音信号的频谱进行减噪处理,去除噪声成分,提高语音信号的质量。

谱减法的基本原理是通过对语音信号的短时傅里叶变换,将频谱信息进行分析和处理。

2. 频谱平滑法频谱平滑法是一种通过平滑语音信号的频谱来增强语音质量的方法。

它通过对语音信号的频谱进行滤波,去除高频噪声成分,使得语音信号更加平滑。

MMSE-LSA语音增强算法的研究及实现

MMSE-LSA语音增强算法的研究及实现

纯语音波形带噪语音 信噪比=5dBMMSE-LSA改进后算法10.500.510-110-110-10 1 2 3 4 5 6 7 8 90 1 2 3 4 5 6 7 8 90 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10图1 增强后的波形对比图4 结 论本文主要研究了基于短时对数谱的语音增强(MMSE-LSA )算法,以及算法中先验信噪比的估计和帧间平滑。

试验表明该新算法在保证较小失真的情况下,比较明显地降低了噪声,在性能上比原MMSE-LSA 算法有较大的优势,并且运算量不大,适用范围广。

参考文献:[1] 朱先和,杨世平.基于小波变换对信号噪声的处理研究 [J].电子科技,2016,29(6):128-131.[2] Hu Y ,Loizou P C. Speech enhancement based on wavelet thresholding the multitaper spectrum [J].IEEE Transactions on Speech & Audio Processing ,2004,12(1):59-67.[3] 李轩,张瑜,关庆阳.卫星信道MMSE 和LS 均衡算法性能比较 [J].电子科技,2015,28(7):84-86.[4] Hasan M K ,Zilany MSA ,Khan M R. DCT speech enhancement with hard and soft thresholding criteria[J]. Electronics Letters ,2002,38(13):669-670.[5] 杨龙.几种单通道的语音增强算法研究 [J].科技视界,2015(26):155+222.[6] Wang Y ,Han K ,Wang D L. Exploring Monaural Features for Classification-Based Speech Segregation [J].IEEE Transactions on Audio Speech & Language Processing ,2013,21(2):270-279.[7] Xu T ,Wang W. A block-based compressed sensing method for underdetermined blind speech separation incorporating binary mask [C]// IEEE International Conference on Acoustics Speech and Signal Processing ,2010,130(5):2022-2025.作者简介:赵宏志(1990-),男,汉族,江苏涟水人,研究生。

基于MMSE维纳滤波语音增强方法研究与Matlab实现

基于MMSE维纳滤波语音增强方法研究与Matlab实现

基于MMSE维纳滤波语音增强方法研究与Matlab实现容强;肖汉
【期刊名称】《计算机应用与软件》
【年(卷),期】2015(032)001
【摘要】提出一种基于最小均方误差估计维纳滤波器的设计方法与Matlab实现.通过使用莱文森-德宾算法求解维纳-霍夫方程(Yule-walker方程),得到滤波器系数进行维纳滤波.加载Matlab中的语音数据handel,人为地加入高斯白噪声,分别计算加入噪声后信号的自相关Rxx和加入噪声后信号和理想信号的互相关Rxd.在输出端将信号较为精确地重现出来,而噪声却受到最大抑制.实测数据的处理结果证明经过维纳滤波后语音信号的噪声减弱,信噪比提高,较好地改进了语音信号质量.【总页数】4页(P153-156)
【作者】容强;肖汉
【作者单位】郑州轻工业学院易斯顿美院河南郑州451450;郑州大学信息工程学院河南郑州450001;郑州师范学院信息科学与技术学院河南郑州450044
【正文语种】中文
【中图分类】TP391.4
【相关文献】
1.基于维纳滤波语音增强算法的改进实现 [J], 白文雅;黄健群;陈智伶
2.基于掩蔽效应的维纳滤波器语音增强及DSP实现 [J], 尹向雷;郑恩让;马令坤;马晓虹
3.基于MMSE-LSA语音增强算法在非平稳环境下的研究与实现 [J], 张鹏;张艳宁;付中华;张亚娟
4.二维维纳滤波语音增强方法研究与实现 [J], 邢永涛;付中华;张艳宁
5.MMSE-LSA语音增强算法的研究及实现 [J], 赵宏志;安朋博;杜丽霞
因版权原因,仅展示原文概要,查看原文内容请购买。

一种改进的MMSE-STSA语音增强方法的开题报告

一种改进的MMSE-STSA语音增强方法的开题报告

一种改进的MMSE-STSA语音增强方法的开题报告一、选题背景随着语音识别技术的不断发展,语音信号增强技术也变得越来越重要。

语音增强技术的目的是将噪声污染的语音信号恢复成清晰的语音信号,在提高语音信号质量的同时,降低语音识别的误识别率。

随着深度学习技术在语音信号处理领域的应用,现有的许多语音信号增强方法已经能够提供较高的增强效果。

本篇论文将深入探讨一种改进的MMSE-STSA语音增强方法。

二、选题意义针对语音信号增强领域的难点问题,如降噪效率低、语音信号变异性较大等问题,本文将采取一种改进的MMSE-STSA语音增强算法,在保留语音信号清晰度的同时,尽可能地降低噪音污染对语音信号的影响,提高语音识别准确率。

相比于现有的语音增强方法,该方法具有更高的精度和效率,可以更好地解决实际应用中遇到的声音增强难题。

三、主要研究内容1. MMSE-STSA算法的原理及实现方式2. 基于改进的MMSE-STSA算法的语音增强模型的设计和构建3. 对比不同的语音增强方法的性能,包括峰值信噪比、语音清晰度等方面的评估4. 最优算法的实现验证和效果分析四、预期成果通过本文的研究,预期将得到以下成果:1. 深入了解MMSE-STSA语音增强方法原理,以及改进的算法实现过程2. 实现一种改进的MMSE-STSA语音增强算法模型3. 通过数据分析和实验验证,评估该算法在声音增强方面的性能,并与现有算法做出对比4. 对该算法的实际效用作出总结和分析,为相关领域提供技术支持。

五、研究基础本文所涉及的研究领域主要包括语音信号处理、深度学习技术。

六、研究方法本文将采取实验方法,通过构建适当的语音增强模型,对不同算法进行性能评估。

同时,本文还将探索深度学习技术在提高语音增强效果方面的应用,构建实验样本,验证MMSE-STSA算法的性能和有效性。

七、进度安排本文的研究计划进度如下:1. 2021年4月-5月:文献调研和学习相关理论知识;2. 2021年6月-7月:实验数据的采集和预处理;3. 2021年8月-9月:搭建基于改进的MMSE-STSA语音增强方法的语音增强模型;4. 2021年10月-11月:对比不同的语音增强算法,评估各算法的性能;5. 2021年12月:撰写论文,总结研究成果。

语音信号去噪与语音增强算法的研究与优化

语音信号去噪与语音增强算法的研究与优化

语音信号去噪与语音增强算法的研究与优化引言:近年来,随着语音技术的广泛应用,语音信号的质量问题也变得日益重要。

语音信号常常受到噪声的污染,导致语音识别、语音合成等应用的精度和可靠性下降。

因此,语音信号去噪与语音增强算法的研究与优化就变得至关重要。

一、语音信号去噪算法的研究与应用1. 基于频域方法的去噪算法频域方法是最常用的去噪算法之一。

其中,基于谱减法的算法是最经典的一种方法。

谱减法通过在频谱上逐频段地估计噪声功率,并减去相应的噪声能量,有效地抑制了噪声。

此外,还有基于估计噪声谱的计算信噪比的方法,如MMSE估计算法,通过优化估计噪声谱的准确性进一步提高了去噪的效果。

2. 基于时域方法的去噪算法时域方法也是常用的去噪算法之一。

在时域中,最常用的方法是基于自适应滤波器的算法。

该方法通过将输入信号分解为信号和噪声成分,然后通过滤波器估计和消除噪声成分,从而实现去噪的效果。

此外,还有基于小波变换的去噪算法,它通过选择适当的小波基函数,将信号分解为不同尺度和频率的子带,然后根据各个子带噪声的特性进行处理,以达到去噪的目的。

3. 基于深度学习的去噪算法近年来,深度学习在语音信号去噪领域取得了显著的进展。

深度学习算法具有学习能力强、自适应性好等优点,可以更好地处理复杂的语音噪声问题。

其中,基于卷积神经网络(CNN)的去噪算法广泛应用于语音信号去噪和增强任务中。

另外,递归神经网络(RNN)和变分自编码器(VAE)等方法也被用于改善去噪性能。

二、语音增强算法的研究与应用1. 基于幅度谱的增强算法幅度谱增强算法是最常用的语音增强方法之一。

这种方法通过对输入语音信号的幅度谱进行处理,提高信号在不同频率上的可听度。

常见的方法有最小均方(MMSE)谱估计算法和音频谱缩放算法等。

2. 基于时频域的增强算法时频域增强算法是最新的一类语音增强方法,主要应用于非平稳噪声的处理。

这种方法通过在时频域上对输入语音信号进行分析和处理,提高信号的可听度。

改进的低时延语音增强算法

改进的低时延语音增强算法

改进的低时延语音增强算法庞亮;陈亮;张翼鹏【摘要】针对目前语音增强存在较大时延的问题,提出一种低时延语音增强算法。

在传统的先验信噪比估计和噪声估计的基础上,对判决引导算法进行低时延的改进,并提出了一种基于语音存在概率和语音激活检测相结合的噪声估计方法,本文的算法采用对数MMSE估计器结合语音存在概率。

采用ITU-T P.826 PESQ、分段信噪比、总信噪比和对数谱失真对该算法进行了测试,并与其他几种算法进行了对比,实验结果表明,该算法有效降低了时延,可以很好的跟踪非平稳噪声,在信噪比较低的情况小可以取得很好的增强效果,且音乐噪声和残留背景噪声也可以得到很好的抑制。

【期刊名称】《通信技术》【年(卷),期】2014(000)011【总页数】6页(P1276-1280,1308)【关键词】语音增强;判决引导;先验信噪比估计;噪声谱估计【作者】庞亮;陈亮;张翼鹏【作者单位】解放军理工大学通信工程学院,江苏南京210007;解放军理工大学通信工程学院,江苏南京210007;解放军南京炮兵学院,江苏南京211132【正文语种】中文【中图分类】工业技术doi:10.3969 / j.issn.1002-0802.2014.11.008改进的低时延语音增强算法*庞摇亮1,陈摇亮1,张翼鹏2(1.解放军理工大学通信工程学院,江苏南京 210007;2.解放军南京炮兵学院,江苏南京 211132)摘摇要:针对目前语音增强存在较大时延的问题,提出一种低时延语音增强算法。

在传统的先验信噪比估计和噪声估计的基础上,对判决引导算法进行低时延的改进,并提出了一种基于语音存在概率和语音激活检测相结合的噪声估计方法,本文的算法采用对数 MMSE 估计器结合语音存在概率。

采用 ITU-T P.826 PESQ、分段信噪比、总信噪比和对数谱失真对该算法进行了测试,并与其他几种算法进行了对比,实验结果表明,该算法有效降低了时延,可以很好的跟踪非平稳噪声,在信噪比较低的情况小可以取得很好的增强效果,且音乐噪声和残留背景噪声也可以得到很好的抑制。

基于短时对数谱估计MMSE的语音增强算法研究

基于短时对数谱估计MMSE的语音增强算法研究

【 y wod 】sec n acmet so -i pcrm a a s ;MMS Ke r s p eheh ne n; hr t set n l i t me u ys E
1 引言
语 音 增 强 的 目的 是 从 带 噪 语 音 中尽 可 能 提 取 纯
2 L A— S MMS E算 法
Er r r ) c mb n d wi d a c d VAD p e h e h n e n s r p s d Co a e i t e p c rl s b r ci n, o o ie t a v n e h s e c n a c me t i p o o e . mp r d w t h s e ta u ta t h o
通 过 实验 表 明 .S — L A MMS 增 强算 法 在 消 除背 景 噪 声 、 E 增加 语 音 清 晰度 和 提 高语 音 自然 度 等 方 面 比谱 减 法更 加 有 效 。
【 键 词 】语 音 增 强 ;短 时谱 估 计 ;最 小 均 方 误 差 关 【 中图 分 类 号 】T 1 .5 N9 2 3 【 献 标 识 码 】A 文
r s l h w t a t e e ut s o h t h meh d f L A— s t o o S MMS c mb n d wi E o i e t VAD p e h n a c me t s mo e f cie h n t e h s e c e h n e n i r e e t t a h f v s e t l s br c in i e s o o s u p e s n a d s e c i n l d s r o . p cr u ta t n t r f n i s p r s i n p e h sg a i o t n a o m e o t i

语音识别技术中的语音增强算法研究与改进

语音识别技术中的语音增强算法研究与改进

语音识别技术中的语音增强算法研究与改进语音识别是一种将人类语音转化为可识别文本的技术,如今已经广泛应用于各行各业,包括智能助理、语音控制、自动语音转录等。

然而,由于语音信号在传输、录制或环境因素的影响下,通常会受到音频质量下降、噪声干扰和回声等问题的困扰。

因此,语音增强算法的研究和改进成为提高语音识别准确度和鲁棒性的关键。

语音增强算法旨在通过对语音信号进行滤波、噪声抑制和声音修复等处理,提高语音信号质量,减少噪声干扰,从而改善语音识别的效果。

目前,已经有许多语音增强算法得到了广泛的研究和应用,比如基于频谱的算法、基于模型的算法以及深度学习方法等。

首先,基于频谱的语音增强算法是最早也是最经典的一种方法。

该方法的基本思想是通过对语音信号的频谱进行分析,进而对噪声进行建模和估计,并将其从观测语音信号中减去。

常见的频域算法包括谱减法、谱减法改进算法、最小均方差法等。

其中,谱减法是最简单的一种算法,它根据噪声和纯净语音信号的功率谱之差来进行噪声减除。

然而,频谱失真和谐波失真等问题限制了这些方法的性能。

其次,基于模型的算法通过对语音和噪声进行建模,利用已知的发音模型和声学模型,对噪声进行估计和去除。

这种方法的优势在于对信号进行更准确的建模和处理。

常见的模型算法包括基于隐马尔可夫模型(HMM)的方法、基于混合高斯模型(GMM)的方法以及基于生成对抗网络(GAN)的方法等。

这些方法通过建立模型并通过训练优化参数,实现对噪声进行抑制和去除。

然而,模型算法往往需要大量的计算和复杂的训练过程,限制了其实时性和可扩展性。

最后,随着深度学习技术的发展,基于深度神经网络的语音增强算法逐渐成为研究的热点。

深度学习算法通过构建深度神经网络模型,利用大量的标注样本进行训练,实现对语音信号的去噪和增强。

常见的深度学习方法包括卷积神经网络(CNN)、循环神经网络(RNN)和生成对抗网络(GAN)等。

这些方法通过多层次的神经网络结构和优化算法,可以更好地对语音信号进行建模和处理,提高语音识别的效果。

试析基于听觉掩蔽效应的MMSE语音增强算法

试析基于听觉掩蔽效应的MMSE语音增强算法

2 1 0 中国电子商务 . 1 0 0・ 2 _ 07
由于环境的复杂性 , 任何 增强算 法都 有其优 点和 局限性 。 MMS E算 法和人耳听觉掩蔽效应相结合 , 根据掩 蔽阈值来 调整增 益值 , 而使 得 从 增强语音的残留噪声和语音畸变较小 , 提高 了感知质量。
四 、 语 结 经过处理大 量电台录制 的声音样本 , 我们得 出: 基于听觉掩蔽效 应
的 MMS E语 音增 强算法 , 消除背景噪声 、 在 音乐 噪声 、 加语音 可懂度 和 增 提高语音 自然度等方面 比谱减法更加有效。 参 考文 献 :
该 算法不但 对非平稳 的环 境噪声有 很好 的抑制作 用 , 亦能 有效地 抑制 。
为 了 减小 残 留噪 音 对 听觉 效 果 的影 响 , 于人 耳 掩 饰效 应 的 增 强 方 法 近 基
想 的 条 件 下 采集 的 。 大 多 数 语 音 识 别 和 语 音 编 码 在 开 始 研 究 时 都 要 在
10 H 80 z的音 高 4 d 5 B。所以一般来说 , 低频的音容易掩蔽高频的音 ; 在距 离强音较远处 , 绝对听觉 门限 比该强音所引起 的掩蔽 阈值 高, 这时 , 噪声 的掩蔽 阈值应该取绝对 听觉 。 时间上相邻声音之 间的掩蔽 现象称谓 时域掩蔽 。也就是说 掩蔽声 和被掩蔽声不 同时 出现 , 以又 叫做异时掩蔽 。它 又分为导前 掩蔽和滞 所 后掩蔽 。掩蔽声音 出现之前的一段时间 内发生掩蔽效应 , 则称 为导前掩 蔽; 否则称为滞后掩蔽 。产生时域掩蔽的主要原 因是人的大脑 处理信息 需要花费一定的时间 , 异时掩蔽 也 随着 时间 的推 移很快会衰 减, 是一种 弱 掩 蔽 效 应 。一 般 情 况 下 , 前 掩 蔽 只 有 3 一2 m , 滞 后 掩 蔽 却 可 导 ms 0 s 而

基于MMSE和小波变换的语音增强算法

基于MMSE和小波变换的语音增强算法

基于MMSE和小波变换的语音增强算法潘小龙;张卫强;郦元宏【摘要】提出一种最小均方误差与小波变换相结合的改进算法来提高语音识别系统的性能。

首先通过小波变换对带噪语音进行多尺度分解,然后对不同尺度的小波系数采用MMSE 算法,最后对MMSE 处理过的小波系数进行重构得到增强语音。

实验结果表明:与传统算法相比较,提出的新算法去噪效果显著,有效地提高了语音的质量。

%Anew algorithm combining MMSE with wavelet transformation is put forward to improve the performance of speech recognition. Firstly, the noisy speech is processed with wavelet transformation by multi-scale decomposition, then the multi-scale wavelet coefficient is determined with MMSE algorithm. Finally the wavelet coefficient is reconstructed to enhance the speech quality. By comparing the presented algorithm with the traditional ones, as indicated by the result of MATLAB experiment, the developed algorithm is found to be of better performance in terms of speech enhancement.【期刊名称】《宁波大学学报(理工版)》【年(卷),期】2016(029)003【总页数】4页(P68-71)【关键词】最小均方误差;小波变换;语音增强【作者】潘小龙;张卫强;郦元宏【作者单位】宁波大学信息科学与工程学院,浙江宁波 315211;宁波大学信息科学与工程学院,浙江宁波 315211;宁波大学信息科学与工程学院,浙江宁波315211【正文语种】中文【中图分类】TN912.35语音识别在安静的环境中可以有较好的性能,但现实环境中不可避免地夹杂着噪声,对语音识别产生了较大影响,因此对带噪语音的处理就显得特别重要. 目前,语音增强方法主要有基于语音短时谱幅度估计法(Short Time Spectral Amplitude,STSA)、基音周期法、语音参数模型法、听觉场景分析法等.在基于语音短时谱幅度估计法(STSA)中,最小均方误差(Minimum Mean-Square Error, MMSE)比谱减法等传统方法能更多地利用语音和噪声统计特性的先验知识[1],对语音系数的先验概率进行估计,并在此基础上按照最小均方误差的准则对语音系数进行估计. MMSE准则中,下信号短时间可以看成是平稳信号,但当信号为非平衡时,其去噪效果大大降低,而且在低信噪比情况下,由语音增强失真引起的包括语音频谱变形和增强后的剩余噪声对信号有较大的干扰,从而降低语音识别系统的精度. 为解决上述问题,人们提出了基于小波变换的语音增强算法. 鉴于小波变换在低信噪比情况下去噪效果好和处理非平稳信号的优势,可以改善MMSE在低信噪比下信号的失真,因此,将MMSE与小波变换结合在一起处理语音信号可以有效提高语音识别系统的性能.对于传统去噪算法如谱减法[2]等进行语音增强后所产生的“音乐噪声”,MMSE算法可以较好地解决该缺陷,这是由于MMSE方法能更多地利用语音和噪声统计特性的先验知识. 以下基于MMSE的短时频谱分析来介绍MMSE原理.语音短时频谱可用指数形式作如下表示[3]:上述公式将信号分为若干帧信号,其中,i代表信号为第i帧,X(k,i)和Y(k,i)分别为纯净语音和带噪语音的频谱函数,A(k,i)和N(k,i)分别为纯净语音和带噪语音的语音短时谱幅度. 对于带噪语音信号目的是使纯净语音的短时谱幅度估计值与纯净语音短时谱幅度最接近,亦即使信号失真度最小.假设各频谱分量之间相互独立,则可以推导出语音短时谱的MMSE估计值为:其中,a(k)为A(k)的一帧信号所对应的谱幅度.假设噪声谱服从零均值高斯分布,则:假设语音谱服从高斯分布,则其幅值和相位的联合分布为:其中, D(k)为噪声的谱幅度;λX(k)为纯净语音能量期望植;λD(k)为噪声能量期望值,可由语音间歇时静音帧估计得到,代入式(3)可得公式如下:其中,为超几何函数[4],则:其中,和分别为先验信噪比和后验信噪比. 可将式(8)写成如下形式:其中,为增益函数. 因此由以上公式可得到纯净语音谱幅度估计值,对其添加含噪信号的相位及反傅里叶变换后就可得到增强后的语音.作为时频域分析方法,傅里叶变换能将信号不同时刻的相同频率成分都映射到同一频率点上,因此无法对信号某个时间点的某个频率的特征进行分析,相当于不能表述信号的时频局部性质,这正是非平稳信号的关键. 小波变换是空间和频率的局部变换,因而能有效地从信号中提取信息,克服上述缺点. 小波去噪首先进行多尺度小波变换,然后对小波系数进行处理,去除噪声中的小波系数,保留原始信号的小波系数,对小波系数进行小波逆变换(小波重构),最后得到去噪后的近似真实信号[5-6]. 假设函数()xφ为平方可积函数,即且满足以下容许性条件:则称()xφ为小波基函数. 对于任意实数为小波变换的尺度因子,b为平移因子,对其进行离散小波变换,此时通常定义其中,,jkZ∈. 由小波基()xφ生成的依赖于(a,b)的离散小波函数如下所示[7-8]:则信号f(t)以x(φ)为基的小波变换为:在实际应用中,通常取02a=,01b=. 由此可见,离散小波变换的提出,使得小波变换在计算机的分析成为可能.带噪声语音通过小波变换划分得到不同尺度的小波系数,小波变换的有用信号能量主要集中在大的小波系数和特定的频率范围内,而噪声分布于整个小波域内,因此小波分解后有用的信号系数幅值会大于噪声的系数幅度,可采取阈值方法来得到有用信号. 然后对各个尺度的小波系数进行MMSE处理,最后对处理过的小波系数进行小波重构,得到增强后的语音信号. 新算法的整体框架如图1所示.首先对带噪声语音进行Mallat小波分解,得到不同尺度的分解系数,在频域中对应不同频率的子带信号. 假定0~P频率空间为F0,经过一级分解后被分为0/2P-的低频子空间F1和/2PP-的高频空间W1,然后将低频空间一直分解下去,得到Fn、Wn、…、W2、W1,它们之间的空间互不相交,它们所对应的小波系数为cd1、cd2、cd3、cd4、cd5、ca5(其中cdn为高频系数, ca5为第五层的低频系数). 然后对不同频率范围、尺度的小波系数进行MMSE估计,得到改进的小波系数. 最后对处理过的小波系数利用Mallat算法进行重构,得到增强语音. 运用小波变换进行去噪处理,可选择不同小波基函数. 仿真选Daubechies为正交小波基,阶次为4,分解层数为5层;语音为在噪声环境下的“宁波”两个字的发音信号, 16kHz的采样率, PCM, 16位,单声道; MMSE对小波系数进行最小均方误差估计.图2为带噪信号经过小波去噪处理和新算法处理过的信号对比. 由图可见,新算法中的信号幅度比小波去噪算法处理过信号幅度有所减小,噪声部分幅度变得更为平滑,对噪声有较好的抑制作用.图3~图5为去噪前语音信号小波系数、小波去噪后小波系数和新算法去噪后小波系数的图形. cd1~cd5分别对应滤波前第1层高频系数到第5层高系数,其频率范围对应8000~16000Hz, 4000~8000Hz, 2000~4000Hz, 1000~2000Hz, 500~1000 Hz, ca5为第5层低频系数,频率范围为0~500Hz. cd1~cd5分别对应滤波后第1层高频系数到第5层高系数. 对比不同方法滤波的图形,可见利用新算法滤波后的小波系数噪声明显减少,这使得小波重构的信号对噪声有较好的抑制作用.文中语音采集通过Cooledit处理软件完成,采集1~10这10个数字的英语发音作为实验对象. 采用16000Hz的采样频率,单声道录音,精度为16位,通过对24个人录音,得到240个语音数据,其中120个数据用来训练语音识别模型,另外120个数据用来进行语音识别测试. 提取每帧信号的24阶MFCC作为语音特征参数,噪声为高斯白噪声.通过语音识别可以得到加噪语音、MMSE去噪、小波变换去噪以及新方法去噪后的语音识别率,从表1数据中可以得出改进方法的去噪效果较其他2种方法有一定的提高.5 结论MMSE相比于谱减法等传统方法更多地利用了语音和噪声统计特性的先验知识,但前提是信号短时平稳,这大大局限了该方法的应用. 而小波变换在非平稳和低信噪比的情况下具有较好的语音增强能力. 提出的新方法结合了MMSE方法和小波变换的各自优点,实验结果表明新方法处理后得到的信号损害较小,而且去噪效果较好,从而提高了语音识别系统的性能,相比于传统的去噪方法有一定的提高. 但其算法复杂度较高,并且对波形会造成一些损害,有待于今后继续深入研究.【相关文献】[1]宁更新. 抗噪声语音识别新技术的研究[D]. 广州:华南理工大学, 2006.[2]熊燕. 抗噪声语音识别技术研究[J]. 信息科技及现代服务, 2006(7):204-205.[3]方瑜. 语音增强相关问题研究[D]. 北京:北京邮电大学, 2011.[4]丁沛. 语音识别中的抗噪声技术[D]. 北京:清华大学,2003.[5]王苏敏,谢小云,邓茜. 基于小波去噪的语音识别系统[J]. 数字技术与应用, 2012(5):232.[6]毛艳辉. 小波去噪在语音识别预处理中的应用[D]. 上海:上海交通大学, 2010.[7]胡惠英,吴善培. 小波去噪在语音识别中的应用[J].北京邮电大学学报,1999, 22(3):31-34.[8]崔晓,张松炜. 基于小波和先验信器噪比维纳滤波的语音增强[J]. 河南师范大学学报(自然科学版), 2013,41(1):43-46.。

基于MMSE准则的语音增强算法研究

基于MMSE准则的语音增强算法研究

基于MMSE准则的语音增强算法研究近年来,随着语音技术的不断发展,语音增强算法的应用越来越广泛。

在实际生活中,由于种种原因,如环境噪声、话筒和扬声器的质量等造成的语音信号质量较差,这给语音通信、语音识别等应用带来了极大的困扰。

因此,研究如何提高语音信号的质量对于促进语音技术的应用具有重要的意义。

其中,基于MMSE准则的语音增强算法是一种较为有效的方法。

一、MMSE准则简介MMSE准则,全称Mean Squared Error准则,顾名思义就是最小化均方误差。

在语音信号增强领域,我们所讨论的是降低环境噪声对于语音信号的影响。

那么MMSE准则如何应用于语音增强领域呢?首先,我们需要了解线性滤波器的原理。

线性滤波器的本质是根据当前时刻的输入信号和历史时刻的输出信号,计算出当前时刻的输出信号,实现对于信号的滤波。

而MMSE准则就是使用最小均方误差来寻找最优的线性滤波器系数。

二、基于MMSE准则的语音增强算法在实际的应用中,利用MMSE准则实现语音增强通常需要经过以下几个步骤:1、去噪首先,我们需要获取到带噪语音信号并减去噪声。

在实际应用中,一般使用专业的软件对语音信号和噪声信号进行分离,并进行噪声去除。

2、帧分割接下来,我们需要对去噪后的语音信号进行帧分割,通常每一帧长度为20ms-30ms。

3、特征提取在每一帧中,我们需要提取出一些特征,如短时时域和频域特征,以用于后续的处理。

4、噪声估计通过前面的步骤,我们可以得到一个纯净的语音信号序列,而噪声信号无法得到。

因此,我们需要对于每一帧估计噪声的功率谱密度。

5、计算噪声门限在每一帧中,我们需要根据噪声功率谱估计值来计算一个门限来判断是否需要进行降噪处理。

6、噪声估计更新在实际操作中,由于噪声的功率谱密度会随着时间的变化而变化,因此我们需要对于上一帧估计的噪声功率谱密度进行更新。

7、引入MMSE准则我们在第一步去噪时已经减去了噪声信号,接下来,我们需要根据MMSE准则计算出一个最优的增强滤波器系数。

一种改进型MMSE语音增强方法

一种改进型MMSE语音增强方法

一种改进型MMSE语音增强方法
蔡斌;郭英;李宏伟;龚成
【期刊名称】《信号处理》
【年(卷),期】2004(020)001
【摘要】本文提出了一种改进型语音短时谱最小均方误差(MMSE)估计的增强方法.通过在每一帧及帧内每一频点对无音的概率(SAP)进行估计,得到Ephraim和Malah MMSE估计算法的改进形式.对增强后的语音客观和主观测试表明:在低信噪比条件下,相对于传统的谱减法和MMSE估计方法,这种改进的方法能更好的抑制背景噪声和残留的"音乐噪声".
【总页数】5页(P68-72)
【作者】蔡斌;郭英;李宏伟;龚成
【作者单位】空军工程大学电讯工程学院,西安,710077;空军工程大学电讯工程学院,西安,710077;空军工程大学电讯工程学院,西安,710077;空军工程大学电讯工程学院,西安,710077
【正文语种】中文
【中图分类】TN91
【相关文献】
1.基于EMMD/MMSE低信噪比的语音增强方法 [J], 张正苏;刘柏森;孙美玲
2.基于MMSE维纳滤波语音增强方法研究与Matlab实现 [J], 容强;肖汉
3.基于听觉感知的LSA-MMSE改进型语音增强方法 [J], 陈琪;郭英;张群;王布宏
4.结合掩蔽特性的LSA-MMSE语音增强方法 [J], 陈琪;郭英;段艳丽;王博
5.耦合MMSE和WEDM幅度谱估计的语音增强方法 [J], 韩勇;赵宇红
因版权原因,仅展示原文概要,查看原文内容请购买。

语音增强算法的研究与实现

语音增强算法的研究与实现

语音增强算法的研究与实现在日常生活中,语音信号一直是我们想要获得可用信息的最常用的载体。

然而,由于声音的质量受到环境影响的不同,有时很难获得清晰的语音信号。

为了解决这个问题,人们提出了语音增强技术。

语音增强是一种技术,可以提高声音信号的质量,使其变得更清晰、更有层次。

它是通过语音信号处理技术来实现的,可以让信号更加清晰,使用者更容易接收和理解。

为了提高语音信号的质量,语音增强技术应用了很多不同的算法,其中包括非线性增强、带通滤波、噪声抑制、自适应增益控制等。

比如,在非线性增强中,通过一系列的参数,可以有效地减少噪音,提高信噪比;在带通滤波中,通过滤波器进行语音信号的选择,可以有效地增强在频率范围内的信号;在噪声抑制中,采用混合噪声抑制算法,有效地减少低频和噪声,提高语音信号的质量;在自适应增益控制中,采用自适应动态增益算法,可以有效地提高语音信号的质量。

其次,为了更好地提高语音信号的质量,可以采用多尺度多分辨率增强算法。

它采用多尺度多分辨率的方法来增强语音信号,可以有效地减少噪声干扰,提高信噪比,提高声音信号的可靠性。

除了此种方法,还可以采用采样增强算法来提高声音信号的质量。

采样增强算法是通过改变采样率来提高声音信号的质量的。

最后,结合实际应用,可以进一步改进和完善语音增强算法,使其可以更好地满足不同领域的要求。

例如,在自动语音识别系统中,可以利用语音增强算法提高声音信号的质量,以便获得更好的识别效果;在智能家居中,可以利用语音增强算法来增强家中的声音信号,以便更好地识别和处理用户的声音指令。

从上面的分析可以看出,语音增强算法是一种非常有效的技术,可以提高声音信号的质量,以满足不同领域的要求。

未来,将会有更多的算法被开发出来,以更好地满足人们的需求,实现更高质量的语音信号。

综上所述,语音增强算法是一种可以提高声音信号质量的技术,它包括非线性增强、带通滤波、噪声抑制、自适应增益控制等,以及多尺度多分辨率增强算法和采样增强算法。

运用MMSE先验信噪比估计进行语音增强

运用MMSE先验信噪比估计进行语音增强

运用MMSE先验信噪比估计进行语音增强熊民权;曾以成;侯丽霞;杨红姣【期刊名称】《计算机工程与应用》【年(卷),期】2011(047)027【摘要】针对DD (Decision-Directed)先验信噪比估计方法在处理语音时产生延迟以及非因果先验信噪比估计算法不具实时性的缺点,提出一种MMSE(Minimum Mean Square Error)先验信噪比估计方法.它在高斯语音模型假设的基础上,运用最小均方误差准则直接从带噪信号中估计先验信噪比.通过对增强语音信噪比、Itakura-Saito失真测度以及信号时域图和语谱图仿真,结果表明,该算法比DD算法能更好地抑制“音乐噪声”和防止语音畸变,且相对于非因果先验信噪比估计算法具有更强实时性.%To solve the problems that Decision-Directed(DD) a priori SNR estimation gets defects of delayed and non-casual a priori SNR estimation has shortcoming of non-real time.MMSE a priori SNR estimation is proposed in this paper.Based on the Gauss voice model assumption, it directly estimates SNR of noisy speech using the Minimum Mean Square Error (MMSE) methods.Simulation with the SNR.Itakura-Saito distortion measure,signal wave and spectrogram show that the proposed method is not only better than DD in the area of suppressing "musical noise" and preventing the voice distortion but also superior to non-causal a priori SNR estimation on real-time.【总页数】4页(P152-154,157)【作者】熊民权;曾以成;侯丽霞;杨红姣【作者单位】湘潭大学光电工程系,湖南湘潭411105;湘潭大学光电工程系,湖南湘潭411105;湘潭大学光电工程系,湖南湘潭411105;湘潭大学光电工程系,湖南湘潭411105【正文语种】中文【中图分类】TN912【相关文献】1.基于动量项先验信噪比估计的语音增强算法 [J], 沈锁金;刘伟;魏静2.基于新型先验信噪比估计语音增强算法的对比研究 [J], 沈锁金;魏静;高颖3.基于先验信噪比估计和增益平滑的语音增强 [J], 安扣成4.先验信噪比估计语音增强算法的对比分析 [J], 沈锁金;欧世峰;刘伟;魏静5.基于MMSE先验信噪比估计的语音增强 [J], 陈俊;孙洪;董航因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
维普资讯
20 年第 2期 06
声学与电子工程
总第 8 2期
 ̄l vE语音增强算法的实时性改进 S
杨 昌方 ,陈 健
( 西安电子科技大学通信工程学院,西安 , 707 ) 101
摘要 :通过 I v E语音增 强算法 的分析 ,指 出其存在实 时性方面 的缺 点,并提出改进方法 。实验结 Cl dS
净语音 以及噪声的第 k个频谱分量 。我们的任务
2 4
能 接 到, 是 用 直 得 于 利
( )式 改 写 为 : 4
/ / 将 R= 可
维普资讯
杨 昌方等:M S ̄ 音增强算法的实时性改进 ME -
显然 -1 -便是经典的EMMMS 语音增强算法p - E 】 。
的效果,在语音畸变和可懂度之间能取得较好的 折衷:虽然不断有学者对其进行方法改进 ,但这 种算法的实时性都不太理想 , 本文分析了 MMS E 算法在实时性方面存在缺陷的原因 ,并提 出改进 的方法,同时也给出了实验结果 。
Fntn uco )且M(;;) i abc 按下式计算I: ’ 1
果表 明改进后算法 的实时性得 到了显著 改善 ,同时还 可得 到较 好质量的增 强语音 。
关键词:语音增强 : 实时性 ; MMS E
现 实生活 中的语音信号总是会被各种噪 声 所干扰 ,成为带噪语音 ,使语音处理系统的性能 受到不 同程度 的影响 ,所 以有必要对带噪语音进
Байду номын сангаас


卜㈣
() 9
12 WS 语音增强算法的改进 .对 E 由 (0 式可知, 1) 决定最终增益的有三个量:
和 ,后两 个量不能改变,我们只能改 变 ,在进一步讨论前,我们先通过增益曲线来

为便于讨论,我们将 ( )式写为增益的形式: 8
A k:Gp , ’ k ( , )R ,
1删 S 语 音增 强算法 E
1 1M S 语音增强算法简介 . ME 观 测到的语音信号可写为:
/ ) [r() l/ rk= 1/k+/一 ‘ ( / r( ( /+ )  ̄ ( ) k1 ・

() 6
在 这 里 , r () {Ⅳ 1 和 / k =E I ★2 )
自然我们有:

杆c



卜 。
讨论 G ( ) , 与三变量的关系, 如图 l 所示 ( 图 中 一1 即为瞬时信噪 比,用它做参数能更好的 反映增益的真实性 ) 。
()瞬 时信噪 比( 一 ̄- d a ) 0B
图 l增益 曲线图
()先验信噪 比 = d b OB
从图 l 可以看出。 、 固定情况下。 越
数。所 以。我们有必要减少算法的计算量。
大,增益 G 越大。同时由图 l( )可以得到这 d b
计 , 我 们 可 以 按 照 判 决 导 引 法 [ D cs n 9 1( eio. i Di ce poc )对其 进行 估 计 。 由于 () r tdAp rah e 七 不
令 = kxjk S = xj N Re [ ] Ae [ pO 、 pa
分 别表 示对() 2式进行 F T变 换 后 的带噪 语音 、 F 纯
r () {S f 为噪声和语音信号的 k / 七 =E f ) 第 个
() 1
频谱分量 的能量均值。 和 分别表示先验信
噪 比和后 验 信 噪 比 ,定 义式 为 :

xt=st+nt ( ) ( ) ()
者不相关。将信号分帧且离散化后可得:
其中,st和 nt分别为信号和噪声,且假设二 ( ) ( )
M(;;) 口6C =
( 1旦 + !.22 aa 1 a 2 + 三 竺 ± ~ t( + ) + ) C
- 一
c3
+.. .
b1 bb )2 bb ) + )3 1 ( +1 ( +1 6 2 1 ( 1
( 5)
()式 中的 r k 和 U 定义如下: 4 / ) ★ (
x1 ) ( n +n1n ( n :s1 ) ( ) , , ,
() 2
( / ) = r 七 ( k r( , 《/ ) 7 ) 七 / / ) (
先 验信 噪 比 必须在 每 一帧重新进 行估
其中, 为帧号且 , 1 , ; = ,…Ⅳ N为帧长。 = ,3 2 …,n l 2 :
行 增强 处理 。
就是要得到信 号幅值 A 的估计值 A ,同时要使 ★ k
得 ( )式定义的误差函数值最小: 3
J E(f )) - { — A
可得 I: 。 1
() 3
由现有的一些文献可知,常见的语音增强算 法大致可以分为以下几类:( )谱幅度估计,如 1 维纳滤波I 谱减'1以及 E ha I 1 、 法 1 pri m和Ma hEM) l (. a
的最 小 均 方 误 差 ( nmu a.q a r r Mii m MenSur Er - e o MMS )估计p: 2 语音产生模型,如结合卡尔 E J( ) 曼滤波的 自 回归模型I;( )人耳听觉掩蔽效应, 3 1
E表 示期望算子 。通过使得 的值撮小我们最终
Jr 譬M ; ]4 ,c[+c V = c 一; 卢 / r 一 c 七 ¨
其中r,为伽马 ( a m ) ( ) G m a 函数,M(;; 为 口6C )
合 流 超 几 何 函 数 ( o f et H pr o e i C n un y e em tc l g r
该法通常都是结合其它一些算法使用 ; 4 小波 J() 分析,基于小波分析的语音增强算法越来越受到 人们的关注I; 5 其它算法,如隐马尔可夫模型 6 () J [和 子空 。 7 1 】 法。 等方 基于 MMS 的语音增强算法可 以取的较好 E
相关文档
最新文档