基于多统计模型和人耳听觉特性的麦克风阵列后滤波语音增强算法
基于RLS自适应算法的麦克风阵列语音增强
信 息『 j 科学
刘 金 成
基于R S自 L 适应算法的麦克风阵列语音增强
( 宁工业大学 电子与信息工程学院 , 辽 辽宁 锦州 1 10 ) 2 0 1
摘 要 : 克 风 阵列 具 有 空 间 选择 特 性 与 高信 号增 益 特 性 , 麦 因而 成 为 非 手持 式 智 能 语 音 处 理 系统 中捕 捉说 话人 语 音 的重 要 手段 。 分析 了 两种 典型的 自适麦克风阵列语音增强 中的应用, L ) RL ) 并根据仿真的结果得 出结论。 关键词 : 麦克风 阵列 ; 自适应算法 ; 最小均方算法 ; 递归最小二次方算法
1概 述 进 了 经 典 G C算 法 中 S 在 电话视频 会议 、 多媒体设备 、 语音识别 由于加权矢量误差引起 等系统的声音拾取过程中,不可避免地会受到 的有 用 信 号 的 衰 减 问 外界环境噪声或其他说话人语音的干扰 。为了 题 。G C方法由于其结 S 寻求增强语音 、 去除背景噪声的有效方法 , 多年 构清晰 , 算法易于理解 , 以来 , 语音增强技术一直是人们关注的重点。 语 计 算 量 较 小 且 对 相 干 噪 音 增 强作 为 语 音 数 字信 号 处 理 的一 项 前 置 处 理 声 有 很 好 的 消 噪效 果 而 方案是抑制干扰的一种有效方法 ,为语音信号 被 广 泛 地 应 用 于 实 际 的其他应用提供 了基础和保障。 中 。 的语 音 增 强 实 现 方 目 , 前 基于单麦克风 的语音增 强方法 己取 案 中 即 采 用 了 经 典 的 得很大进展 , 其作为一种传统 的语音增强方法 , G C算法 ,并对其 自适 S 理论上相对比较成熟。 但是 , 由于单麦克风只拾 应滤波器模块进行 了针 取一路语音信号 ,致使其可用信息仅 限于时 / 对 实 际 实 现 的 改 进 , 取 :自 适应 F i I R 频信息 , 在强混响以及非平稳等复杂噪声环境 得 了较好的效果 。 图 IG C原 理 框 图 S 中的表现并不理想。针对这种情况 , 0世纪 广 义 旁 瓣 抵 自2 肖器是 自适 毳1 9 O年代以来 ,随着阵列信号处理理论的发展 , 应 波 束形 成 器 的一 种 通用 模 型 。 广 义旁 瓣 抵 消 步骤 l 初始 化 w 0j } =0 { =O 基 于麦克 风阵列 的语音增 强技术得 到广 泛重 系统如图 1 所示 , 它由上下两个处理模块组成 。 视 , 以多麦克风拾取多路语音信号 , 其 为语音增 上面的模块 中含有一个延迟 一相加波束形成单 更新 .=《 ; } ・l 强处理提供除时 , 频以外的空域信 息 ,弥补了 元 , 其加权系数是 固定的 , 其功能是非 自适应滤 单麦克风在这方面 的不足 ,成为 当前语音信号 波 : 步骤 2 J } T : 一X J y() c :Ar , x( ) z ( 1 ) 处理领域的研究热点 。 2基本算法设计 式 中 1 l ” , e- x, 1 { ∽J: ( -{J ' l _ + 4 i 波束形成 是经典 的麦克风阵列语 音增强 良2 A = 【。 , , 以, … mM一) 1 1 ] f 2 1 方法 ,其思想是通过麦克风阵列拾取 多路语音 f 一0 。) 信号并进行分析与处理 ,使阵列形成 的波束方 为简单起见 , 设该权系数 向量满足 向图主瓣对准 目标语音 ,零点”指 向干扰源 以 “ 算法初始化 , 0 fl A 1= 0 … 抑 制 干扰 信 号 , 而尽 可 能 地 获取 目标 语 音 。 从 其 【J j 高信 噪比时取 小的正 常数 中波束方向及波束主瓣宽度与麦克风 的间距 、 随后对输 出信号 y i 按事先设定的 cn) 低 信 嗓 比 时 取 小 的 正 常 数 数 目、 摆放位置、 声源入射角度 以及采样频率密 FR进 行 滤 波 I K I 切相关 。波束的形成不仅消除了使用单个 麦克 对 每一 时刻 , ,-I 1 2, 计 算 )( = f< 一 ) , ) ∑ i ( ‘ c yn 风时需人工调节麦克风指向的问题 ,而且 可以 使输 出语音的信噪 比大幅度提高 , 而无需人 从 下面的旁瓣抵消模块含有一个阻塞矩阵处 ( 一】 l h j+ f 【 1 j p 对 工干预亦可获得高质量 的语音。波束形成方法 理 单 元 和 一 个 自适 应 K阶 FR滤 波 器 单 元 组 。 I 又可细分为 固定波束形成 、自适应波束形成和 阻 塞 矩 阵处 理 单 元 的 目的 ,是 为 了 除去 注视 方 计 算 P” = —w 1 O) ({ 《 b 一 Ⅱ 具有后 置滤波器的波束形成方法三种 。使用 自 向上的信 号, 使其输 出只为干扰噪声 的组合。 由 适应波束形成来实现麦克风阵列语音增强。分 于 经过 时 间延 迟 补偿 后 ,各 麦 克 中所 含 注 视 方 一 i一 j 《 ㈨ ^l , . 析了两种典 型的 自适 应算法 :最小 均方算 法 向上的语音信号是完全同相的,所以只要阻塞 (MS和递归最小二次方算法(L ) L ) R S在麦克风 阵 矩 阵中每一行上 的元素之和为零 ,就可以保证 , ^ l ; _r .硒h f 1 一 l 一 列语音增强中的应用 , 并根据仿真的结果得 出 输 出中不含注视方向上的语音信号。经过阻塞 结论。 矩阵处理后 的信号为 yn t )= i 一 ) L n) , () 8 U() X() =B n 自适应波束形 成方法根据 输入信号 的统 由于 ( ) n 中只由干扰噪声组成,它不包 计特性 的变化来调 整滤波 器系数 ,使阵列 的 设 代表阻塞矩阵 B中的第 m行元素 向 含有注视方 向上的信号 , 以系统对于语音信 所 波束“ 零点” 向干扰噪声 的方 向, 高了阵列 量 , 指 提 则对 于所 有 用 m需 要 满 足 号的所有处理都包含于 )中。 这样 , 寻找滤 的适应 能力。最早 的 自适应波束形成的理论是 1= 0 … 波系数 ( 向量 , 系统的噪声输 出功率最 n ) 使 Fot 17 rs 于 9 2年提 出的 ,在此基础上 ,9 2年 18 1J 0 就等同于上述的带约束的优化问题 。 不过这 Gii 和 J r h f s i m提出了广义旁瓣抵消器(ee — G nr d 由于 彼此 是 线 性 独立 的 , 以 u( 最 多 小 , 所 n ) 里的求解问题变为无约束的 L MS问题 。 滤波系 i d SdlbsC ne e, 称 G C。 该 结 构 主 有 M一1 z ie e a cU r简 e 0 S) 个线性独立组 成元素 , 也就是 说 , 阻塞 数 的 自适 应 调 整公 式 为 要 由固定波束形成 、阻塞矩阵和多通道 噪声抵 矩 阵 B行 的维数一定是 M一 或更少 。 1
《2024年基于麦克风阵列的语音增强研究》范文
《基于麦克风阵列的语音增强研究》篇一一、引言随着人们对音频质量要求的不断提高,语音增强技术逐渐成为音频处理领域的研究热点。
麦克风阵列技术作为一种有效的语音增强手段,通过多个麦克风的协同作用,可以实现对声源的定位、语音信号的分离以及语音增强的功能。
本文旨在研究基于麦克风阵列的语音增强技术,以期在复杂环境中实现高保真的语音识别与通讯。
二、麦克风阵列基本原理麦克风阵列是由多个麦克风按照一定规则排列而成的阵列系统。
其基本原理是通过不同麦克风接收到的信号之间的相位差和幅度差,结合阵列几何结构,实现对声源的定位和信号的分离。
麦克风阵列技术广泛应用于语音识别、语音增强、声源定位等领域。
三、基于麦克风阵列的语音增强方法基于麦克风阵列的语音增强方法主要包括声源定位、信号分离和后处理三个步骤。
1. 声源定位:通过多个麦克风的信号到达时间差和幅度差等信息,估计出声源的方向和距离。
声源定位是后续信号分离的基础。
2. 信号分离:在确定了声源位置后,采用适当的信号处理算法,如盲源分离、基于高阶统计的分离方法等,从混合信号中提取出目标语音信号。
这一步骤中,针对噪声环境和不同背景下的分离效果尤为关键。
3. 后处理:通过语音增益调整、噪声抑制等后处理技术,进一步提高语音信号的质量。
后处理环节可以有效消除背景噪声、回声等干扰因素,使语音信号更加清晰。
四、研究现状与挑战目前,基于麦克风阵列的语音增强技术在理论研究和实际应用方面都取得了显著的成果。
然而,在实际应用中仍面临诸多挑战。
如:如何提高声源定位的准确性、如何有效分离混合信号中的目标语音、如何处理不同环境下的噪声干扰等。
此外,随着人工智能和深度学习技术的发展,如何将先进的算法应用于麦克风阵列技术,提高语音增强的效果和效率,也是当前研究的重点。
五、研究方法与实验结果为了解决上述问题,本文采用深度学习算法与麦克风阵列技术相结合的方法进行语音增强研究。
首先,通过构建神经网络模型,实现对声源的精准定位和混合信号的有效分离;其次,利用深度学习算法对后处理环节进行优化,进一步提高语音质量;最后,通过实验验证了该方法的可行性和有效性。
基于麦克风阵列的语音增强算法研究
第29卷第3期 2021年6月Vol.29 No.3Jun. 2021电脑与信息技术Computer and Information Technology文章编号:1005-1228(2021)03-0039-04基于麦克风阵列的语音增强算法研究于春和,马 跃(沈阳航空航天大学 电子信息工程学院,辽宁 沈阳 110136)摘 要:语音通信为最普通的一种通信模式,在我们的日常生活中发挥着极为关键的效果。
然而,在客观场景内,声音势必会因噪音而产生影响。
此类噪声与干扰不但会影响声音的可知性,还使声音处理系统的性能急剧恶化。
但是,在现实环境中,声音受到噪音和干扰是不可避免的。
这些噪声和干扰不仅影响声音的可知性,还使声音处理系统的性能急剧恶化。
麦克风阵列语音增强为语音增强中最普遍的一种模式。
文章具体讲解了几类比较普遍的麦克风阵列增强算法以及语音扩展算法的仿真处理结果,语音扩展算法可以从噪音声音中尽可能地提取清晰的声音,从而提高语音质量和主观舒适性。
关键词:麦克风阵列;语音增强;语音扩展算法中图分类号:TN912 文献标识码:AResearch on Speech Enhancement Algorithm Based on Microphone ArrayYU Chun-he, MA Yue( College of Electronic Information Engineering, Shenyang Aerospace University, Shenyang 110136, China )Abstract:Voice communication is the most basic way of communication and plays a very important role in People's Daily life.However, in the real world, sound is inevitably affected by noise and interference.These noises and disturbances not only affect the intelligibility of sound, but also make the performance of sound processing system deteriorate rapidly.However, in the real environment, it is inevitable that the sound is subjected to noise and interference.These noises and disturbances not only affect the intelligibility of sound, but also make the performance of sound processing system deteriorate rapidly.Microphone array speech enhancement is one of the most commonly used methods in speech enhancement. This paper introduces several commonly used microphone array speech enhancement algorithms and the simulation results of speech expansion algorithms. The speech expansion algorithm can extract as clear a sound as possible from the noise sound, so as to improve the speech quality and subjective comfort.Key words: microphone array; speech enhancement; speech expansion algorithm收稿日期:2020-11-11作者简介:于春和(1976-),男,辽宁绥中人,副教授,博士,主要研究方向:信息获取与处理;马跃(1996-),男,辽宁辽阳人,硕士研究生,主要研究方向:信息获取与处理。
语音信号处理中的麦克风阵列设计与信号增强算法研究
语音信号处理中的麦克风阵列设计与信号增强算法研究第一章:介绍随着科技的进步和应用场景的不断拓展,语音信号处理在语音识别、语音合成、自然语言处理、语音通讯等方面的应用也越来越广泛。
麦克风阵列作为一种重要的语音采集设备,具备广泛的应用前景。
对麦克风阵列进行优化设计和信号增强算法的研究,对于提高语音识别和通讯质量具有重要意义。
本文就麦克风阵列的设计以及信号增强算法的研究进行探讨。
第二章:麦克风阵列设计2.1 麦克风阵列的原理和类型麦克风阵列是由多个麦克风按照一定的规律布置形成的,在语音信号采集时可达到降噪、抑制回声等效果。
麦克风阵列按照几何形状可以分为线性阵列、圆形阵列、矩形阵列等多种类型。
2.2 麦克风阵列的参数设计麦克风阵列的参数设计包括麦克风数目、麦克风的位置和间距等方面。
例如,麦克风距离的确定、错误安置麦克风可能导致降噪和定位错误等问题。
2.3 麦克风阵列的信号处理麦克风阵列采集来的信号需要进行信号处理,在这个过程中,需要考虑到语音增强、人声检测、信号分离、降噪、回声抑制等多方面问题。
第三章:信号增强算法研究3.1 基于卷积神经网络的语音增强算法研究卷积神经网络作为深度神经网络的一种,已经被广泛应用于音频和语音信号的处理。
基于卷积神经网络的语音增强算法,可以有效地处理语音信号的噪声,提高语音信号的识别准确率和可理解性。
3.2 基于小波变换的人声检测算法研究人声检测是基于语音增强的重要步骤,也是语音信号处理的难点之一。
基于小波变换的人声检测算法,通过消除语音信号的非人声成分,从而提取出更加纯净和准确的人声信号,进一步提高语音识别的准确率和可理解性。
3.3 基于矩阵分解的信号分离算法研究信号分离是语音增强的重要技术之一,也是语音信号处理的难题。
基于矩阵分解的信号分离算法,可以从多声源混合的语音信号中分离出单一语音信号,进一步提高语音信号识别和理解的准确率和可靠性。
3.4 基于小波变换和快速傅里叶变换的降噪算法研究噪声是语音信号处理中的重大问题,如何减少噪声对语音信号的干扰是语音增强的重要技术之一。
《2024年基于麦克风阵列的语音增强研究》范文
《基于麦克风阵列的语音增强研究》篇一一、引言随着智能设备的广泛应用,语音交互技术在日常生活与工作场景中逐渐成为关键的信息交互手段。
基于麦克风阵列的语音增强技术是语音处理领域中的一项重要技术,它能有效地改善声音质量、识别语音并抵抗外界噪音。
本文主要就基于麦克风阵列的语音增强技术进行深入的研究与探讨。
二、麦克风阵列的基本原理麦克风阵列是由多个麦克风组成的系统,通过捕捉声音在空间中的传播特性,对声音信号进行空间滤波和定位。
每个麦克风都能捕捉到声音信号,通过阵列处理算法,可以确定声音的来源方向和距离,从而对声音进行增强或抑制。
三、语音增强的需求与挑战随着语音交互技术的普及,语音增强的需求日益增长。
然而,实际环境中的声音信号常常被各种噪声干扰,影响了语音识别的准确度。
基于麦克风阵列的语音增强技术可以有效减少背景噪声的影响,提高语音质量。
但是,在实际应用中仍面临着诸多挑战,如多路径效应、反射干扰、噪音与语音的频谱重叠等。
四、基于麦克风阵列的语音增强技术研究针对上述挑战,研究者们已经开展了一系列关于基于麦克风阵列的语音增强技术研究。
这些研究主要围绕以下几个方面:1. 阵列信号处理算法:通过优化阵列信号处理算法,如波束形成、噪声抑制等,提高对声音信号的捕捉和识别能力。
2. 声源定位与追踪:利用麦克风阵列捕捉到的声音信号,结合声源定位算法,实现声源的实时定位与追踪。
3. 噪音抑制与回声消除:针对环境中的各种噪音和回声干扰,研究有效的抑制和消除方法,提高语音的清晰度。
4. 深度学习在语音增强中的应用:利用深度学习技术,如卷积神经网络、循环神经网络等,对麦克风阵列捕捉到的声音信号进行深度分析和处理,进一步提高语音增强的效果。
五、实验与结果分析为验证基于麦克风阵列的语音增强技术的效果,研究者们进行了大量的实验。
实验结果表明,通过优化阵列信号处理算法、声源定位与追踪、噪音抑制与回声消除等技术手段,可以有效提高语音识别的准确度。
《基于麦克风阵列的语音增强研究》范文
《基于麦克风阵列的语音增强研究》篇一一、引言随着人工智能技术的快速发展,语音识别和语音交互技术得到了广泛的应用。
然而,在实际应用中,由于环境噪声、语音信号的复杂性和多变性等因素的影响,语音信号的质量往往受到严重影响。
因此,如何提高语音信号的质量,成为了一个亟待解决的问题。
麦克风阵列技术作为一种有效的语音增强技术,得到了广泛的关注和研究。
本文旨在研究基于麦克风阵列的语音增强技术,提高语音信号的质量和识别率。
二、麦克风阵列技术概述麦克风阵列技术是指将多个麦克风按照一定的几何排列方式组合在一起,通过对多个麦克风接收到的声音信号进行处理,以实现语音增强的技术。
它能够通过信号处理算法对不同方向的声源进行定位、滤波和增强,从而得到更清晰、更完整的语音信号。
麦克风阵列技术已经被广泛应用于智能音响、智能家居、无人驾驶等领域。
三、基于麦克风阵列的语音增强技术研究基于麦克风阵列的语音增强技术主要包括两个方面:声源定位和语音增强。
1. 声源定位声源定位是麦克风阵列技术的关键技术之一。
通过多个麦克风的接收信号,可以确定声源的位置和方向。
常见的声源定位算法包括基于时延估计的算法、基于波束形成的算法等。
其中,时延估计算法通过测量不同麦克风接收到的声音信号的时间差,从而确定声源的位置。
波束形成算法则是通过加权求和不同麦克风的接收信号,形成指向特定方向的波束,从而确定声源的位置。
2. 语音增强语音增强是麦克风阵列技术的另一个重要应用。
通过对接收到的声音信号进行滤波、去噪等处理,可以有效地提高语音信号的质量和识别率。
常见的语音增强算法包括基于谱减法的算法、基于噪声估计的算法等。
其中,谱减法是一种常用的噪声抑制算法,它通过估计噪声的功率谱并从混合信号中减去噪声的功率谱,从而得到更清晰的语音信号。
噪声估计算法则是通过估计环境噪声的参数,对噪声进行建模并从接收信号中去除噪声。
四、实验与分析为了验证基于麦克风阵列的语音增强技术的效果,我们进行了实验分析。
《2024年基于麦克风阵列的语音增强研究》范文
《基于麦克风阵列的语音增强研究》篇一一、引言随着科技的快速发展,语音技术得到了广泛的关注和应用。
麦克风阵列技术的引入,使得语音增强的研究变得尤为重要。
语音增强技术能够有效地提高语音信号的信噪比,从而提高语音识别的准确率。
本文将探讨基于麦克风阵列的语音增强技术的研究现状、方法及挑战。
二、麦克风阵列技术概述麦克风阵列是由多个麦克风组成的系统,通过收集声源的信号并进行分析,可以实现对声源的定位和语音信号的增强。
麦克风阵列技术具有较高的空间分辨率和抗干扰能力,能够有效地抑制噪声和干扰信号,提高语音识别的准确率。
三、基于麦克风阵列的语音增强方法1. 波束形成技术波束形成是麦克风阵列中常用的语音增强技术。
通过调整各个麦克风的权重和相位,使得阵列的输出在特定方向上形成波束,从而增强该方向的语音信号。
常见的波束形成方法包括延迟求和波束形成和最小方差无畸变响应波束形成等。
2. 盲源分离技术盲源分离技术是一种基于统计模型的语音增强方法。
该方法通过估计语音信号和噪声信号的统计特性,将混合信号分离成原始的语音信号和噪声信号。
基于麦克风阵列的盲源分离技术可以进一步提高语音增强的效果。
3. 深度学习技术深度学习技术在语音增强领域得到了广泛的应用。
通过训练深度神经网络模型,可以有效地提取语音信号中的特征信息,并抑制噪声和干扰信号。
基于麦克风阵列的深度学习语音增强方法可以提高语音识别的准确率,并具有良好的鲁棒性。
四、实验与结果分析为了验证基于麦克风阵列的语音增强方法的有效性,我们进行了实验研究。
实验中采用了不同的噪声环境,包括室内、室外、嘈杂环境等。
通过对比不同方法的实验结果,我们发现基于麦克风阵列的波束形成技术和深度学习技术能够有效地提高语音识别的准确率,并具有良好的抗干扰能力。
此外,我们还发现结合盲源分离技术和麦克风阵列技术可以进一步提高语音增强的效果。
五、挑战与展望尽管基于麦克风阵列的语音增强技术取得了显著的成果,但仍面临一些挑战和问题。
《2024年基于麦克风阵列的语音增强研究》范文
《基于麦克风阵列的语音增强研究》篇一一、引言随着智能设备的广泛应用,语音交互技术在人机交互中占据了越来越重要的地位。
其中,麦克风阵列技术的应用,使得语音识别系统的性能得到了显著提升。
基于麦克风阵列的语音增强技术,可以有效地提高语音信号的信噪比,从而改善语音识别的准确率。
本文将针对基于麦克风阵列的语音增强技术进行深入研究,并探讨其在实际应用中的效果。
二、麦克风阵列技术概述麦克风阵列是指将多个麦克风按照一定的几何结构排列在一起,通过信号处理技术对多个麦克风的信号进行融合,以实现空间滤波、语音定位和语音增强等功能的技术。
其基本原理是利用不同位置麦克风的信号差异,通过算法处理,实现噪声抑制、回声消除等效果。
三、基于麦克风阵列的语音增强方法(一)波束形成波束形成是麦克风阵列中常用的一种语音增强方法。
其基本思想是通过加权求和的方式,将指向目标方向的信号加强,同时抑制来自其他方向的干扰噪声。
波束形成的算法包括相位变换法、最小方差法等。
(二)盲源分离盲源分离是一种利用多个麦克风的信号对音频信号进行源分离的技术。
其基本思想是将不同位置的麦克风信号进行时间-空间变换,通过多通道线性系统来分离出各个音频源的信号。
盲源分离方法可以有效地去除非目标方向的干扰噪声,提高语音识别的准确率。
(三)噪声抑制噪声抑制是麦克风阵列中常用的另一种语音增强方法。
其基本思想是通过估计和消除噪声信号来提高语音信号的信噪比。
常用的噪声抑制方法包括基于频谱减法、基于子空间方法的噪声抑制等。
四、实际应用效果分析在实际应用中,基于麦克风阵列的语音增强技术能够有效地提高语音信号的信噪比和识别率。
通过使用波束形成算法,能够明显抑制非目标方向的噪声和干扰信号,提高目标方向上的语音清晰度。
同时,通过盲源分离和噪声抑制等算法的应用,可以进一步提高语音识别的准确率。
此外,基于麦克风阵列的语音增强技术还可以应用于多语种、多环境下的语音识别系统中,以适应不同的应用场景和需求。
《基于麦克风阵列的语音增强研究》范文
《基于麦克风阵列的语音增强研究》篇一一、引言随着语音识别技术的快速发展,语音增强技术已成为语音处理领域的重要研究方向。
麦克风阵列技术作为一种有效的语音增强手段,能够通过多个麦克风的协同作用,提高语音信号的信噪比,从而提升语音识别的准确率。
本文旨在探讨基于麦克风阵列的语音增强技术的研究现状、方法及未来发展趋势。
二、麦克风阵列技术概述麦克风阵列是指将多个麦克风按照一定的几何排列方式组合在一起,形成一个具有特定功能的系统。
通过多个麦克风的协同作用,麦克风阵列可以实现对声源的定位、语音信号的增强以及噪声的抑制等功能。
麦克风阵列技术广泛应用于智能语音助手、会议系统、听诊器等领域。
三、基于麦克风阵列的语音增强方法1. 波束形成波束形成是麦克风阵列中常用的语音增强方法。
通过调整各个麦克风的权重系数,使阵列的输出在特定方向上形成指向性波束,从而增强目标语音信号并抑制来自其他方向的噪声。
常见的波束形成算法包括延迟求和法、最小方差无畸变响应法等。
2. 语音活动检测语音活动检测是判断语音信号是否存在的一种技术。
通过分析麦克风阵列接收到的信号,判断是否存在语音信号并确定其起始位置。
在语音活动检测的基础上,可以进一步对语音信号进行增强处理。
3. 噪声抑制噪声抑制是麦克风阵列中重要的语音增强技术。
通过估计并消除背景噪声,提高语音信号的信噪比。
常见的噪声抑制算法包括谱减法、谱子空间法等。
四、研究现状与挑战目前,基于麦克风阵列的语音增强技术在研究与应用方面已取得了一定的成果。
然而,仍面临诸多挑战,如多径干扰、声源方向的不确定性、阵列结构与声场环境不匹配等问题。
针对这些问题,研究人员需要进一步提高算法的鲁棒性和适应性,以满足实际应用的需求。
五、未来发展趋势未来,基于麦克风阵列的语音增强技术将朝着更加智能化、自适应和鲁棒性的方向发展。
一方面,将结合深度学习等人工智能技术,提高算法对复杂声场环境的适应能力;另一方面,将研究更加先进的阵列结构与算法,以实现更高效的语音增强效果。
《基于麦克风阵列的语音增强研究》范文
《基于麦克风阵列的语音增强研究》篇一一、引言随着人们对音频质量要求的不断提高,语音增强技术在现代通信、语音识别、语音合成等领域的应用变得越来越重要。
麦克风阵列作为一种能够接收多方向声音的装置,对于语音增强的效果起着关键的作用。
本文将基于麦克风阵列的语音增强研究进行详细介绍。
二、麦克风阵列的基本原理麦克风阵列由多个麦克风组成,通过接收不同位置的声音信号,利用信号处理技术对声音进行定位、滤波和增强等处理。
其基本原理包括声波传播、麦克风信号采集和信号处理三个部分。
声波传播过程中,声音以声波的形式传播到麦克风阵列,不同位置的麦克风接收到不同强度的声音信号。
麦克风信号采集部分负责将接收到的声音信号转换成电信号,然后通过信号处理技术对电信号进行处理。
三、基于麦克风阵列的语音增强技术基于麦克风阵列的语音增强技术主要包括波束形成、噪声抑制、回声消除和语音分离等方面。
1. 波束形成波束形成是麦克风阵列中最重要的技术之一,其目的是通过加权和延迟处理不同麦克风的信号,使得在特定方向上的声音信号得到增强,而在其他方向上的噪声信号得到抑制。
常见的波束形成算法包括相位敏感波束形成和相位无关波束形成等。
2. 噪声抑制噪声抑制是语音增强中必不可少的部分,其目的是在保证语音清晰度的前提下,尽可能地减少背景噪声的影响。
基于麦克风阵列的噪声抑制技术可以通过多通道噪声抑制算法,对不同位置的麦克风信号进行独立处理,从而实现更高效的噪声抑制效果。
3. 回声消除回声消除是解决在语音通信过程中由于传输路径或扬声器等设备引起的回声问题的重要技术。
基于麦克风阵列的回声消除技术可以通过估计回声路径并利用滤波器消除回声。
同时,也可以利用麦克风阵列中的多个麦克风来识别并抑制回声信号。
4. 语音分离语音分离的目的是将混合声音中的各个语音分离出来,以实现更好的语音识别效果。
基于麦克风阵列的语音分离技术可以通过对不同位置的麦克风信号进行时空域处理和频域分析等方法,实现多个语音信号的有效分离。
《2024年基于麦克风阵列的语音增强研究》范文
《基于麦克风阵列的语音增强研究》篇一一、引言随着人工智能技术的快速发展,语音识别和语音交互技术已成为人们日常生活和工作中不可或缺的一部分。
然而,在复杂多变的实际环境中,语音信号常常受到各种噪声的干扰,导致语音质量下降,进而影响语音识别的准确性和语音交互的体验。
因此,如何有效地进行语音增强,提高语音信号的信噪比(SNR),成为了一个重要的研究课题。
麦克风阵列技术因其能够通过多个麦克风的协同作用,实现空间滤波和声源定位,为语音增强提供了新的解决方案。
本文将基于麦克风阵列的语音增强研究进行深入探讨。
二、麦克风阵列技术概述麦克风阵列是由多个麦克风按照一定规则排列组成的系统,可以实现对声源的空间定位和信号处理。
通过分析不同麦克风接收到的声波的时间差、相位差和幅度差等信息,可以确定声源的位置,并利用空间滤波技术对声源信号进行增强。
麦克风阵列技术广泛应用于语音识别、语音交互、音频监控等领域。
三、基于麦克风阵列的语音增强方法1. 波束形成技术波束形成是麦克风阵列中常用的语音增强技术。
通过加权求和多个麦克风的信号,使得阵列在特定方向上的响应得到增强,同时在其他方向上的响应得到抑制,从而达到提高信噪比的目的。
2. 盲源分离技术盲源分离技术是一种基于计算声学的语音增强方法。
通过分析多个麦克风接收到的混合信号,将声源信号从混合信号中分离出来,从而实现语音增强。
该技术可以有效地处理多个声源同时发声的情况。
3. 联合去噪与去混响技术在实际环境中,除了噪声干扰外,声源信号还可能受到房间混响的影响。
联合去噪与去混响技术将去噪和去混响结合起来,同时对噪声和混响进行抑制,进一步提高语音增强的效果。
四、实验与分析为了验证基于麦克风阵列的语音增强方法的有效性,我们进行了多组实验。
实验结果表明,采用波束形成技术的麦克风阵列可以有效地提高信噪比,降低背景噪声对语音识别的影响。
盲源分离技术可以有效地处理多个声源同时发声的情况,提高语音识别的准确性。
基于多统计模型和人耳听觉特性的麦克风阵列后滤波语音增强算法 (1)
(1)
˜(ejω ) − S (ejω ) = E (ejω ) = G(ejω )S ˜ (ejω ) (6) [G(ejω ) − 1] × S (ejω ) + G(ejω )N ˜ (ejω ) 为 S ˜(ejω ) 中的噪音. 其中, N 式 (6) 中的第一项描述了增强语音中目标语音 的畸变, 第二项描述了增强语音中残余噪声的大小. 可计算出一个合适的后滤波器 G(ejω ) 使得增强语音 中的残余噪声小于人耳的听觉掩蔽阈值, 从而消除 其影响. 2.1 基于目标语音存在概率最大化的信号子空间维 度确定和基于条件概率的噪声功率谱估计
其 中, w 是 阵 列 加 权 系 数, S 是 目 标 语 音, d = [d1 , · · · , dL ]H 是传播向量, N = [N1 , · · · , NL ]H 是 噪声信号向量. 误差信号 e = S − w HX 的功率为:
φee = E[{S − w HX }{S H − X Hw }] =
号的功率谱来得到理想的后滤波器, 限制了后滤波 算法的性能. 所以, 合理的后滤波器设计, 准确的信 号功率谱估计都可以使得语音增强算法的性能得到 大幅提高. Zelinski[2] 假设各个阵元上的噪声信号是 不相关的, 提出了一种后滤波器设计方法. 但由于实 际环境中, 阵元噪声之间是存在一定相关性的, 所以 该算法性能较差. McCowan 等[3] 考虑了噪声之间 的相关性, 利用散射噪声场的特性, 提出了一种后滤 波器设计方法, 具有较好的语音增强性能. 但由于其 算法是基于散射噪声场假设的, 所以, 当实际场合中 的噪声场不符合散射噪声场时, 该算法性能会有明 显的下降. 本文利用人耳的听觉掩蔽效应, 提出了一 种基于听觉感知特性的后滤波器设计方法. 为了更 准确地估计噪声功率谱, 本文将带噪信号空间分解 为信号子空间和噪声子空间, 提出了用目标语音信 号存在概率最大化来估计子空间维度的方法, 合理 地估计出信号子空间和噪声子空间的维度, 在噪声 子空间上, 提出了用条件概率估计噪声功率谱的方 法. 实验证明, 本文所提的噪声估计方法比以往的噪 声估计方法更准确, 所提的基于听觉感知特性的后 滤波器也比传统的后滤波器更有效.
麦克风阵列的协同自适应滤波语音增强方法
麦克风阵列的协同自适应滤波语音增强方法赵益波;杨蕾;严涛;李春彪【摘要】在麦克风阵列语音增强方法中,传统的广义旁瓣抵消器在处理存在显著脉冲噪声的语音信号时效果较差.为提高在脉冲噪声干扰下的语音信号增强效果,提出一种麦克风阵列的协同自适应滤波语音增强方法.该方法采用协同自适应滤波取代线性自适应滤波,基于NLMS算法导出了滤波器权值和协同因子的自适应更新算法.仿真实验结果表明,所提方法能有效地消除掉语音信号的脉冲噪声和高斯噪声,克服线性自适应滤波对非线性脉冲噪声的不敏感性,比广义旁瓣抵消器效果优越很多.【期刊名称】《现代电子技术》【年(卷),期】2019(042)008【总页数】5页(P16-20)【关键词】语音增强;麦克风阵列;协同自适应滤波;脉冲噪声;高斯噪声;非线性滤波【作者】赵益波;杨蕾;严涛;李春彪【作者单位】南京信息工程大学电子与信息工程学院,江苏南京210044;江苏省大气环境与装备技术协同创新中心,江苏南京210044;南京信息工程大学电子与信息工程学院,江苏南京210044;南京信息工程大学电子与信息工程学院,江苏南京210044;南京信息工程大学电子与信息工程学院,江苏南京210044【正文语种】中文【中图分类】TN912.35-340 引言单麦克风只能拾取一路信号,一般不能随声波一起运动,而且由于说话人的一些运动,使得基于单麦克风的语音增强效果并不理想[1]。
麦克风阵列具有空间选择性,可以用“电子瞄准”的方式从所需的声源位置获得高品质的信号,同时抑制其他说话人的干扰声音和环境噪声,可以取得明显的消噪效果[2]。
麦克风阵列不要求在声源本地放置传感器,也不会随着说话人的移动来移动麦克风位置以改变接收方向[3]。
这些特性有利于其获得多个或移动声源,并且可用于一些特殊的场合[4]。
自适应滤波具有自适应性,在系统辨识、语音信号处理、图像处理等方面有着广泛的应用[5]。
基于广义旁瓣抵消器(Generalized Sidelobes Canceller,GSC)的麦克风阵列自适应语音增强方法是将麦克风阵列和自适应滤波技术结合起来的语音增强方法。
基于TF-GSC的多通道后置滤波语音增强算法
基于TF-GSC的多通道后置滤波语音增强算法马子骥;倪忠;余旭【摘要】针对传统语音增强算法在非平稳噪声,尤其是在噪声为语音的环境下,对噪声的抑制效果急剧下降的情况,提出了一种基于传递函数—广义旁瓣抵消(TF-GSC)和最佳修正测井谱振幅估计量(OM-LSA)的改进型多通道后置滤波语音增强算法.算法在后置滤波时,利用TF-GSC输出信号与参考噪声之间的相互关系求解出语音存在概率,并更新噪声功率谱估计.实验结果表明:算法可以有效地抑制非平稳噪声,提高语音增强算法在语音噪声环境下的鲁棒性.%Aiming at the problem that the suppression effect of traditional speech enhancement algorithm in non-stationary noise,especially in case that in environment where noise is speech,inhibition of noise is decreased sharply,an improved multichannel post-filtering speech enhancement algorithm based on transfer functions generalized sidelobe canceller(TF-GSC)and optimal modified log spectral amplitude estimator(OM-LSA)is proposed.The algorithm uses the correlation between the TF-GSC output signal and the reference noise to solve the speech existence probability and update the noise power spectrum estimation in post-filtering.The experimental results show that the algorithm can effectively suppress non-stationary noise and improve the robustness of speech enhancement algorithm in speech noise environment.【期刊名称】《传感器与微系统》【年(卷),期】2018(037)005【总页数】4页(P105-107,111)【关键词】语音增强;非平稳噪声估计;先验语音存在概率;后置滤波【作者】马子骥;倪忠;余旭【作者单位】湖南大学电气与信息工程学院,湖南长沙410000;湖南大学电气与信息工程学院,湖南长沙410000;湖南大学电气与信息工程学院,湖南长沙410000【正文语种】中文【中图分类】TN912.30 引言与单麦克风降噪算法在时域和频域处理相比,基于多麦克风阵列的降噪算法可以充分利用空间滤波技术,对其他方向的噪声进行滤波处理,从而获得更好的降噪效果。
基于麦克风阵列的语音增强算法概述
- 29 -基于麦克风阵列的语音增强算法概述丁 猛(海军医学研究所,上海 200433)【摘 要】麦克风阵列语音增强技术是将阵列信号处理与语音信号处理相结合,利用语音信号的空间相位信息对语音信号进行增强的一种技术。
文章介绍了各种基于麦克风阵列的语音增强基本算法,概述了各算法的基本原理,并总结了各算法的特点及其所适用的声学环境特性。
【关键词】麦克风阵列;阵列信号处理;语音增强 【中图分类号】TN911.7 【文献标识码】A 【文章编号】1008-1151(2011)03-0029-02(一)引言在日常生活和工作中,语音通信是人与人之间互相传递信息沟通不可缺少的方式。
近年来,虽然数据通信得到了迅速发展,但是语音通信仍然是现阶段的主流,并在通信行业中占主导地位。
在语音通信中,语音信号不可避免地会受到来自周围环境和传输媒介的外部噪声、通信设备的内部噪声及其他讲话者的干扰。
这些干扰共同作用,最终使听者获得的语音不是纯净的原始语音,而是被噪声污染过的带噪声语音,严重影响了双方之间的交流。
应用阵列信号处理技术的麦克风阵列能够充分利用语音信号的空时信息,具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点,逐渐成为强噪声环境中语音增强的研究热点。
美国、德国、法国、意大利、日本、香港等国家和地区许多科学家都在开展这方面的研究工作,并且已经应用到一些实际的麦克风阵列系统中,这些应用包括视频会议、语音识别、车载声控系统、大型场所的记录会议和助听装置等。
文章将介绍各种麦克风阵列语音增强算法的基本原理,并总结各个算法的特点及存在的局限性。
(二)常见麦克风阵列语音增强方法1.基于固定波束形成的麦克风阵列语音增强固定波束形成技术是最简单最成熟的一种波束形成技术。
1985年美国学者Flanagan 提出采用延时-相加(Delay-and-Sum)波束形成方法进行麦克风阵列语音增强,该方法通过对各路麦克风接收到的信号添加合适的延时补偿,使得各路输出信号在某一方向上保持同步,并在该方向的入射信号获得最大增益。
基于感知滤波器与统计方法的语音增强新算法
that under various no ises, th is m ethod is be tter than other m ethods.
K eyw ords: Phonetic speech enhancem ent F ilter Spectra l am plitude estmi a tion Signal no ise ra tio W avelet packet transform
基于感知滤波器与统计方法的语音增强新算法 王 娜, 等
基于感知滤波器与统计方法的语音增强新算法
New A lgorithm Ba sed on Perceptua l Filte r and Sta tistica lM ethod fo r Phonetic Speech Enhancem ent
图 1 小波包分解结构示意图 F ig. 1 D ecom pos ition structu re o f the w avelet packet
将分解后 的最 终结 点 按从 左到 右 的顺 序 编号 为 1~ 24, 则各结点所对应的频率范围如表 1所示。
8
PRO CESS AUTOMATION IN STRUMENTAT ION Vol 31 N o 12 Decem eber 2010
法 [ 1- 4]。参数法 依赖于 使用 的语 言生 成模 型, 需 要提 取模型参数, 当实际噪 声或语 音条 件与模 型有较 大的 差距时, 此类方法容易失效; 统计法较充分地利用了语 音和噪声的统计特性, 一般要建立模型库, 通过训练过 程获得初始统计参数。
语音是典型的非 平稳信 号, 小 波的多 分辨特 性使 其非常适合对非平 稳信 号进行 分析。近 年来, 基 于阈
基于麦克风阵列的数字助听器语音增强技术
基于麦克风阵列的数字助听器语音增强技术∗戴红霞;赵力【期刊名称】《电子器件》【年(卷),期】2015(000)003【摘要】Since it’s hard for Hearing Aids users to listen in the noise and reverberation environment,design of Digital Hearing Aid based on Microphone array can increase Speech SNR in this environment. This paper briefly introduces the theory of applying Microphone array into the Speech enhancement design of Digital H/A,and then present some common Microphone array Speech enhancement technology.%针对噪声和混响环境下的助听器用户聆听上的困难,基于麦克风阵列的数字助听器设计能够很好的提高助听器在这种环境下的语音信噪比。
本文研究了应用麦克风阵列进行数字助听器语音增强处理技术,提出了一种基于粒子群优化的改进粒子滤波算法,它将语音增强问题转换为从带噪语音中对纯净语音的估计过程,引入粒子群优化的方法来产生建议分布,使降噪结果更接近纯净语音,从而得到更好的语音增强效果。
【总页数】5页(P606-610)【作者】戴红霞;赵力【作者单位】江苏信息职业技术学院电子信息工程系,江苏无锡214153;东南大学信息科学与工程学院,南京210096【正文语种】中文【中图分类】TN912.34【相关文献】1.基于维纳滤波的数字助听器语音增强算法 [J], 王方杰;金赟2.基于麦克风阵列的语音增强技术及应用 [J], 杜军;桑胜举3.基于谐波重构滤波的数字助听器\r语音增强算法 [J], 王方杰;金赟4.基于维纳滤波与理想二值掩蔽的数字助听器语音增强算法 [J], 戴红霞;唐於烽;赵力5.基于锥形麦克风阵列的语音增强技术研究 [J], 孙科伟;李建海;杨海东;宋博因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
现实生活中的语音常常受到环境中噪声的影响, 多通道语音增强算法在近些年来受到了广泛关注. 麦克风阵列语音增强算法相对于单通道语音增强算 法的优势在于它可以利用多路信号之间的相关性更 准确地估计信号的特性, 从而达到更好的语音增强 效果. 其中, 麦克风阵列后滤波语音增强算法更是由 于其出色的降噪性能近年来得到了广泛的使用[1−3] . Simmer 等[1] 证明了最小均方误差意义下的最优多 通道语音增强解可分解为一个最小方差非畸变响应 波束形成器加上一个单通道的维纳后滤波器的形式. 尽管理论上证明了后滤波算法的最优性, 但在实际 应用中, 由于很难精确地估计出语音信号和噪声信
值之下, 那么该噪声就不会被人耳感知, 从而实现对 带噪语音信号的增强. 具体的做法如下: 假设最小方差非畸变响应波束形成器的输出信 ˜(ejω ), 目标语音信号为 S (ejω ), 后滤波器为 号为 S G(ejω ), 后滤波增强后的语音信号与目标语音信号 的误差可表述如下:
Y = w HX = w H [S · d + N ]
CHENG Ning1 LIU Wen-Ju1 Abstract To overcome the drawbacks of the conventional microphone array post-filter speech enhancement method, some improvements are proposed using the masking properties of human ears. A subspace selection method is proposed by maximizing the present probability of the target speech. In the noise subspace, the conditional probability is used to estimate the noise power spectrum. A novel post-filter is proposed based on the masking properties of human ears. Experiments prove that the proposed noise estimation method and post-filter are much better than the conventional ones. The proposed speech enhancement technique has shown to produce impressive results in terms of quality measures of the enhanced speech. Key words Microphone array, auditory properties based post-filter, speech enhancement, multi-statistic models
从式 (6) 中可以看出, 要实现基于听觉感知特 性的后滤波器的设计, 首先需要估计出噪声功率谱. 通常使用的噪声估计方法是基于语音检测 (Voice activity detection, VAD) 的噪声估计方法[1] . 也就 是检测出带噪语音中的纯噪声帧, 用这些帧上的平 均功率谱来估计语音与噪声混合帧上的噪声功率谱. 由于噪声是变化的, 各帧上的噪声实际上是不同的. 所以, 基于 VAD 的噪声估计方法用纯噪声帧上的平 均噪声功率谱来估计所有帧上的噪声功率谱会导致 较大的估计误差. 针对这一情况, 本文提出了一种基 于带噪信号子空间分解的噪声功率谱估计方法, 在 每一帧信号上都估计噪声功率谱, 极大地减少了噪 声估计误差. 在目标信号与噪声不相关的假设下, 带噪信号 在时帧 t 和频率 k 的功率谱矩阵 ΦXX (k, t) 可表示 为目标语音信号功率谱矩阵 ΦSS (k, t) 和噪声信号 功率谱矩阵 ΦN N (k, t) 之和:
更多技术文章,论文请登录
第 36 卷 第 1 期
2010 年 1 月
自 动 化 学 报
ACTA AUTOMATICA SINICA
Vol. 36, No. 1 January, 2010
基于多统计模型和人耳听觉特性的麦克风 阵列后滤波语音增强算法
程 宁1 刘文举 1
摘 要 针对麦克风阵列后滤波语音增强算法的不足, 结合人耳的听觉掩蔽效应, 提出了改进的后滤波语音增强算法. 提出 了最大化目标语音存在概率来确定信号子空间维度的方法, 在噪声子空间上, 利用条件概率估计出噪声功率谱. 基于人耳的听 觉掩蔽效应, 提出了后滤波器的一种合理的设计方法. 实验证明, 所提的噪声估计方法比传统方法更加准确, 所提的后滤波算 法比传统的后滤波算法更好, 在多项语音评价指标上, 都取得了更好的实验效果. 关键词
ቤተ መጻሕፍቲ ባይዱ
号的功率谱来得到理想的后滤波器, 限制了后滤波 算法的性能. 所以, 合理的后滤波器设计, 准确的信 号功率谱估计都可以使得语音增强算法的性能得到 大幅提高. Zelinski[2] 假设各个阵元上的噪声信号是 不相关的, 提出了一种后滤波器设计方法. 但由于实 际环境中, 阵元噪声之间是存在一定相关性的, 所以 该算法性能较差. McCowan 等[3] 考虑了噪声之间 的相关性, 利用散射噪声场的特性, 提出了一种后滤 波器设计方法, 具有较好的语音增强性能. 但由于其 算法是基于散射噪声场假设的, 所以, 当实际场合中 的噪声场不符合散射噪声场时, 该算法性能会有明 显的下降. 本文利用人耳的听觉掩蔽效应, 提出了一 种基于听觉感知特性的后滤波器设计方法. 为了更 准确地估计噪声功率谱, 本文将带噪信号空间分解 为信号子空间和噪声子空间, 提出了用目标语音信 号存在概率最大化来估计子空间维度的方法, 合理 地估计出信号子空间和噪声子空间的维度, 在噪声 子空间上, 提出了用条件概率估计噪声功率谱的方 法. 实验证明, 本文所提的噪声估计方法比以往的噪 声估计方法更准确, 所提的基于听觉感知特性的后 滤波器也比传统的后滤波器更有效.
DOI
麦克风阵列, 基于听觉特性的后滤波器, 语音增强, 多统计模型
10.3724/SP.J.1004.2010.00074
Microphone Array Post-filter Based on Multi-statistical Models and Perceptual Properties of Human Ears
2 基于人耳听觉掩蔽效应的后滤波器设计
本文的目标在于对式 (5) 中的单通道后滤波器 的估计. 合理的单通道后滤波器设计需要考虑的问 题包括两个方面: 好的降噪性能和较小的目标语音 畸变. 通常而言, 后滤波器在降噪的同时, 也可能会 增加目标语音的畸变. 所以, 对这两者进行合理折中 是后滤波器设计必须考虑的问题. 本文利用人耳的 听觉掩蔽效应提出了一种合理的折中方案, 设计了 一种新的基于听觉感知特性的后滤波器. 人耳的听 觉掩蔽效应是指, 在通常情况下, 目标语音信号是强 信号, 而背景噪声相对较弱, 这样人耳听觉系统会根 据具体的目标语音信号确定频域上的听觉掩蔽阈值, 如果使滤波后的残余噪声限制在人耳的听觉掩蔽阈
H φSS − w Hφ XS − φ H XS w + w ΦXX w
(2)
令 φee 对权值 w 求导数, 使其为零, 可得最优加权 系数: 1 w opt = Φ− (3) XX φ XS 在目标信号与噪声不相关的假设下, 式 (3) 变为:
H 1 −1 w opt = Φ− φSS d (4) XX φSS d = [φSS dd + ΦN N ]
其 中, w 是 阵 列 加 权 系 数, S 是 目 标 语 音, d = [d1 , · · · , dL ]H 是传播向量, N = [N1 , · · · , NL ]H 是 噪声信号向量. 误差信号 e = S − w HX 的功率为:
φee = E[{S − w HX }{S H − X Hw }] =
应用 Sherman-Morrison-Woodbury 恒等式[1] , 上式 又可表示为:
w opt =
φSS
1 φSS Φ− NNd = 1 −1 d H Φ−1 d + (d H Φ− N N d) NN
1 φSS Φ− NNd 1 φSS + φN N d H Φ− NNd
(5)
其中, φSS 和 φN N 分别是单通道目标信号和噪声的 自功率谱, ΦN N 是阵元间的噪声交叉功率谱矩阵. 式 (5) 可看成一个最小方差非畸变响应波束形成器 H −1 1 Φ− N N d /(d ΦN N d ) 加上一个单通道的维纳后滤波器 φSS /(φSS + φN N ).
(1)
˜(ejω ) − S (ejω ) = E (ejω ) = G(ejω )S ˜ (ejω ) (6) [G(ejω ) − 1] × S (ejω ) + G(ejω )N ˜ (ejω ) 为 S ˜(ejω ) 中的噪音. 其中, N 式 (6) 中的第一项描述了增强语音中目标语音 的畸变, 第二项描述了增强语音中残余噪声的大小. 可计算出一个合适的后滤波器 G(ejω ) 使得增强语音 中的残余噪声小于人耳的听觉掩蔽阈值, 从而消除 其影响. 2.1 基于目标语音存在概率最大化的信号子空间维 度确定和基于条件概率的噪声功率谱估计
ΦXX (k, t) = ΦSS (k, t) + ΦN N (k, t)
(7)
对于麦克风阵列信号而言, 可假设各阵元上噪声信 号的自功率谱相等, 而阵元间噪声信号不相关[3] , 则 下式成立:
ΦN N (k, t) = φN N (k, t)I
收稿日期 2008-12-29 录用日期 2009-06-15 Manuscript received December 29, 2008; accepted June 15, 2009 国家重点基础研究发展计划 (973 计划) (2004CB318105), 国家高技 术研究发展计划 (863 计划) (20060101Z4073, 2006AA01Z194), 国 家自然科学基金 (90820011, 60675026, 60121302, 90820303) 资助 Supported by National Basic Research Program of China (973 Program) (2004CB318105), National High Technology Research and Development Program of China (863 Program) (20060101Z4073, 2006AA01Z194), and National Natural Science Foundation of China (90820011, 60675026, 60121302, 90820303) 1. 中国科学院自动化研究所模式识别国家重点实验室 北京 100190 1. National Laboratory of Pattern Recognition, Institute of Automation, Chinese Academy of Sciences, Beijing 100190