基于NMF的MCLP语音去混响方法研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于NMF的MCLP语音去混响方法研究

麦克风阵列作为一种语音采集装置,其广泛应用于电话会议、演讲厅和助听器等封闭环境时,由于室内混响、噪声等因素的影响,很难获得高音质的语音信号。为此学者们展开了一系列针对室内混响、噪声等影响因素的语音增强方法研究。

语音去混响技术作为语音增强的重要组成部分,它在语音识别、声源定位和地震数据分析等各个方面同样发挥着不可替代的作用,因此,开展封闭环境下语

音去混响研究具有重要的理论意义和现实价值。论文对混响的产生、混响表征、混响数学模型等基本理论知识进行系统地阐述,并对当前主要的语音去混响方法进行了详细的描述;最后,在此基础上,展开对实际封闭声学环境下多通道语音去混响方法的研究。

麦克风阵列采集到的混响语音信号通常分为三部分:直达语音部分、早期反射部分和后期混响部分。由于混响早期反射部分对于提高语音的音质有益,而后期混响部分产生的掩蔽效应会严重降低语音清晰度、音质,所以去混响方法通常将直达语音部分和早期反射部分作为目标信号进行重构。

在论文中,主要对基于多通道线性预测(MCLP)的去混响方法进行了深入的探讨和研究,并在MCLP去混响理论的基础上进行改进处理以达到进一步提高语音

去混响性能的目的。原MCLP方法中通常直接用阵列采集信号对目标信号协方差进行初始化,为了研究协方差对MCLP方法的影响,论文提出了一种基于相干扩散功率比(CDR)的协方差初始化方案。

另外,纯净语音的短时傅里叶变换系数具有一定的稀疏性且大于混响语音信号的短时系数稀疏特性,因此可以通过提高输出信号的稀疏性来产生一个逼近于期望信号的信号作为最终的输出信号。论文利用纯净语音信号的短时系数稀疏特

性及其NMF的分解特性,提出将NMF应用到一种基于复广义高斯先验模型(CGG)的MCLP去混响方法中。

仿真实验结果表明,在相同条件下,两种改进的方法比常规的MCLP去混响方法具有更好的去混响效果。

相关文档
最新文档