一种改进的AEDA声源定位及跟踪算法

合集下载

一种基于麦克风阵列的声源定位算法研究

一种基于麦克风阵列的声源定位算法研究

一种基于麦克风阵列的声源定位算法研究王勇;刘颖;刘建平【摘要】麦克风阵列声源定位广泛应用于视音频会议系统及枪声定位系统等领域.提出了一种基于最小熵值(ME)的麦克风阵列声源定位新方法,其特点在于利用最小熵值方法对麦克风阵列进行时延估计,并与离散网格方法相结合,对声源进行空间搜索.实验结果表明,在同等混响或噪声条件下,该方法定位优于广义互相关-相位变换方法(GCC-PHAT).%The acoustic source is widely used in audio and video conference system and gunshot localization system. In this article, a novel acoustic source localization algorithm for microphone array based on minimum entropy and stochastic region contraction (ME) is proposed. The algorithm show that the acoustic source can be developed to estimate time delay between microphones on a basis of minimum entropy and localize the acoustic source in search space by using discrete grid search algorithm. Experimental results show that the proposed algorithm is much more robust than GCOPHAT in noise and reverberation environment.【期刊名称】《现代电子技术》【年(卷),期】2011(034)019【总页数】4页(P61-64)【关键词】麦克风阵列;声源定位;最小熵值;波达时延差【作者】王勇;刘颖;刘建平【作者单位】西安电子科技大学,陕西西安710071;武警工程学院,陕西西安710086;武警工程学院,陕西西安 710086【正文语种】中文【中图分类】TN911.3-340 引言基于麦克风阵列的声源定位是声学信号处理领域中的一个重要问题。

MUSIC声源定位算法的改进及其矩阵分析

MUSIC声源定位算法的改进及其矩阵分析

摘 要 : 对 传 统 的 M USI C 算 法 时 域 特 征 分 析 方 法 改 进 到 频 域 , 并 将 其 在 G SM M A 麦 克 风 阵 列 模 型 上 进 行 声
源定 位仿真 计算 ,获得 了良 好的定 位效 果,同 时对 改进算 法进 行了矩 阵理 论分析 。
关 键 字 : 声 源 定 位 ; GS M MA ; M US IC 改 进 算 法 ; 矩 阵 分 析 。
r e s
j
Ms
c
rJ 1
2 πf j
(rJ
1,M
rJ 1 )
e
c
.. .
rM
rJ 1, M
.
rJ K e rJK , M
j 2 πf ( rJ K ,M c
rJK )
以上(1-1)~(1-4)式就是 GSMMA 麦克风阵列数学模型, 它对远场和 近场声源 程序都兼 容且适用于 任意拓扑 结构的 麦克风阵列,因此,我们将此模型用于声源定位的场合。 1.2 MUSIC 算 法的改进
r
c
, . . ., s e
rM
j 2 π f (rM c
rs )
]T
的声源频率分量对应的方向矢量为 (1-3) 。同理,得出 K 个干扰源的方向矢量为 aJK(ΘJK , f ) ,传输矩阵为:
A( f ) = [a s (Θs , f ), aJ 1( ΘJ 1, f ),..., aJ K (ΘJ K, f )]
Байду номын сангаас
量,是阵列信号处理的新方向。收集语音信号的麦克风阵列
不同算法应用的矩阵模型也会有所不同,下面采用任意拓扑
结构的麦克风阵列模型[1](GSMMA)进行声源定位算法学

一种改进的AEDA声源定位及跟踪算法

一种改进的AEDA声源定位及跟踪算法
佐治亚理工大学电子与计算机工程系yitenghuang2001年采用自适应特征值分解算法aedaadaptiveeigenvaluedecompositionalgorithm对时延进行估计用线性校正最小二乘法估计声源方位该方法可以有效地克服混响和噪声的影响但是自适应特征值分解法需要一定时间才能够收敛定位时间较长对初值敏感并且对声源跟踪的能力也较差
1 . 2 基于自相关算法的语音检测
在进行实时声源定位过程中, 准确地检测出目 标语音信号的出现, 可有效的减少系统定位的运算 量并提高系统的性能, 因此在 AEDA 算法之前加入 了语音检测模块 ( VAD,Voice Activity Detection) 。一
Fig. 2 图2 改进的 AEDA 算法
北京大学学报 (自然科学版) , 第 41 卷, 第 5 期, 2005 年 9 月 Acta Scientiarum Naturalium Universitatis Pekinensis,Vol. 41,No. 5( Sept. 2005)
一种改进的 AEDA 声源定位及跟踪算法
李承智 曲天书2
1
时延估计
自适应特征值分解法采用了双通道信道盲估计 思想。算法首先自适应地估计声源到 2 个麦克风传 输信道的冲击响应, 然后根据这些冲击响应估计出这 2 个接收信号之间的时间延迟。该算法可以看作是 LMS 时延估计算法的一种推广, LMS 算法只对一个通 道的冲击响应进行估计, 而 AEDA 算法同时对 2 个通 道的传输响应进行估计, 如图 1 所示。
Modified AEDA algorithm structure
般的语音检测算法常常用信号的能量和过零率来进行语音和非语音的判断, 然而能量和过零 率极易受噪声的影响, 本文基于信号的最大互相关值实现了一种语音检测方法, 该方法利用麦 克风阵列采集信号的相关信息, 可有效去除非相关噪声的影响。 2 个信号的互相关可以表示为: 1 * * ( n) (s ( ) ) ) , ( FFT c n )= FFT-( i n ) FFT ( s j 则: (( )= max c n) (3)

二次加速SRP-PHAT声源定位算法

二次加速SRP-PHAT声源定位算法

二次加速SRP-PHAT声源定位算法乔杰;李致金;赵力【期刊名称】《数据采集与处理》【年(卷),期】2011(26)6【摘要】In microphone arrays application, sound source localization is a vitally important problem. Sound source localization algorithm based on steering response power-phase transform (SRP-PHAT) has high robustness and accuracy, especially in noisy and echo environment. But SRP-PHAT algorithm requires large computation, which is a big shortcoming in application. To solve the problem, a new algorithm is proposed by optimizing arrays construction and search strategy. Two-dimensional search space is firstly converted to one-dimensional one then a hierarchic search strategy is adopted in one-dimensional search space. Simulation results show that a bulk of computational expense is saved by using the new algorithm.%基于可控功率响应和相位变换(Steering response power-phase transform,SRP-PHAT)的声源定位算法具有较高的鲁棒性和准确性,特别是在强噪声和回响条件下.但SRP-PHAT类算法在工程应用中有一个巨大的障碍,那就是需要较大的运算量.为了解决该问题,本文从阵列拓扑结构和搜索策略两个方向出发,对SRP-PHAT类算法加速.首先,通过垂直布置的阵列将二维空间的搜索转化为一维空间的搜索;其次,采用层次搜索策略,由粗至精对一维空间进行搜索.仿真实验表明,采用该方法可以节约大量的计算量.【总页数】5页(P681-685)【作者】乔杰;李致金;赵力【作者单位】南京信息工程大学电子与信息工程学院,南京,210044;南京信息工程大学电子与信息工程学院,南京,210044;东南大学信息科学与工程学院,南京,210096【正文语种】中文【中图分类】TN912【相关文献】1.一种改进的联合SRP-PHAT语音定位算法 [J], 袁安富;孟君2.改进的SRP-PHAT声源定位方法 [J], 谭颖;殷福亮;李细林3.基于SRP-PHAT的实时声源定位算法设计与实现 [J], 刘生4.基于SRP-PHAT的实时声源定位算法设计与实现 [J], 刘生5.基于改进二次相关算法的声源定位仿真研究 [J], 简泽明;彭阳;高泽平;刘梦然因版权原因,仅展示原文概要,查看原文内容请购买。

一种声源定位跟踪系统实现方法

一种声源定位跟踪系统实现方法

物联网技术 2023年 / 第9期220 引 言随着信息技术和人工智能的快速发展,声音导航跟踪定位的应用越来越广泛。

声音信号是人们传递信息的重要方式,在智能车载、智能家居、可穿戴设备等领域受到关注[1]。

声源定位技术,在现代工业制造中可以通过噪声和异响进行定位[2];在国防现代化方面,可以用来辅助测量炮兵阵地、定位狙击手位置、测量弹药、测试火炮的着落点和空中炸点[3];在生活中,可以准确识别空调、冰箱、洗衣机等家电产品的噪声源,从而确定其位置、分布,并优化控制减小噪声,改善人们的工作和生活环境[4]。

声源定位技术主要可以分成三大类:第一类是基于最大输出功率的可控波束形成技术;第二类是高分辨率谱估计技术;第三类是基于声达时间差的定位技术,利用到达阵列上各传声器的声音信号间的时间差来定位声源,这类技术计算量小,比较适用于实时处理,实际运用也十分广泛。

本文基于声源近场传播模型[5-6]设计并制作了一个以STM32为主控的声源定位跟踪系统,该系统实现了对较宽频率声源进行定位与追踪[7],在视频会议、语音增强、自动语音识别领域[8-9]有重要的应用价值。

1 理论分析与计算1.1 TDOA 的基本定位原理传统的基于TDOA 技术[10-12]的无线定位系统一般涉及4个基站和1个移动平台MB(x , y , z ),其中下行发射基站为B 0(x 0, y 0, z 0),上行接收基站为B i (x i , y i , z i ), i =(1, 2, 3),移动平台MB 发送到各基站的上行信号的到达时间差为t 10、t 20、t 30,且均可测得。

设R i 为MB 到各基站的距离,已知电磁波在空气中的传播速度为c ,则可算得MB 到各个基站的距离差R 1-R 0=t 10×c =R 10,R 2-R 0=t 20×c =R 20,R 3-R 0=t 30×c =R 30。

由此可列方程组:R x x y y z z R x x y y z z R 020202021212121222=−+−+−=−+−+−=()()()()()()()()()()()()x x y y z z R x x y y z z 22222232323232−+−+−=−+−+− (1)解三元二次方程组便可求得移动平台MB 的坐标(x , y , z ),从而实现声源定位。

一种改进的MMSE-STSA语音增强方法的开题报告

一种改进的MMSE-STSA语音增强方法的开题报告

一种改进的MMSE-STSA语音增强方法的开题报告一、选题背景随着语音识别技术的不断发展,语音信号增强技术也变得越来越重要。

语音增强技术的目的是将噪声污染的语音信号恢复成清晰的语音信号,在提高语音信号质量的同时,降低语音识别的误识别率。

随着深度学习技术在语音信号处理领域的应用,现有的许多语音信号增强方法已经能够提供较高的增强效果。

本篇论文将深入探讨一种改进的MMSE-STSA语音增强方法。

二、选题意义针对语音信号增强领域的难点问题,如降噪效率低、语音信号变异性较大等问题,本文将采取一种改进的MMSE-STSA语音增强算法,在保留语音信号清晰度的同时,尽可能地降低噪音污染对语音信号的影响,提高语音识别准确率。

相比于现有的语音增强方法,该方法具有更高的精度和效率,可以更好地解决实际应用中遇到的声音增强难题。

三、主要研究内容1. MMSE-STSA算法的原理及实现方式2. 基于改进的MMSE-STSA算法的语音增强模型的设计和构建3. 对比不同的语音增强方法的性能,包括峰值信噪比、语音清晰度等方面的评估4. 最优算法的实现验证和效果分析四、预期成果通过本文的研究,预期将得到以下成果:1. 深入了解MMSE-STSA语音增强方法原理,以及改进的算法实现过程2. 实现一种改进的MMSE-STSA语音增强算法模型3. 通过数据分析和实验验证,评估该算法在声音增强方面的性能,并与现有算法做出对比4. 对该算法的实际效用作出总结和分析,为相关领域提供技术支持。

五、研究基础本文所涉及的研究领域主要包括语音信号处理、深度学习技术。

六、研究方法本文将采取实验方法,通过构建适当的语音增强模型,对不同算法进行性能评估。

同时,本文还将探索深度学习技术在提高语音增强效果方面的应用,构建实验样本,验证MMSE-STSA算法的性能和有效性。

七、进度安排本文的研究计划进度如下:1. 2021年4月-5月:文献调研和学习相关理论知识;2. 2021年6月-7月:实验数据的采集和预处理;3. 2021年8月-9月:搭建基于改进的MMSE-STSA语音增强方法的语音增强模型;4. 2021年10月-11月:对比不同的语音增强算法,评估各算法的性能;5. 2021年12月:撰写论文,总结研究成果。

声源定位与追踪算法研究

声源定位与追踪算法研究

声源定位与追踪算法研究声源定位与追踪算法是指利用传感器技术和信号处理技术来确定声音的产生位置并实时追踪声音的移动轨迹。

在智能音频处理、音频增强、语音识别、语音合成、无线麦克风网络等领域中,声源定位与追踪算法扮演着重要的角色。

随着技术的进步和应用场景的不断扩大,声源定位与追踪算法也得到了快速的发展。

本文将从传感器选择、声源定位算法和声源追踪算法三个方面进行探讨。

首先,传感器选择是声源定位与追踪算法的基础。

常用的传感器有阵列麦克风和摄像头。

阵列麦克风是一种将多个麦克风组合成一个整体的设备。

通过采集声音在不同麦克风之间的时间差和振幅差,可以计算出声源的位置信息。

摄像头则是通过图像处理算法分析场景中的移动物体来实现声源的定位与追踪。

在实际应用中,根据不同场景和需求选择合适的传感器非常重要。

其次,声源定位算法是确定声源位置的关键。

常见的声源定位算法包括互相关法、波束形成法、最小二乘法等。

互相关法是一种通过计算麦克风信号之间的互相关系数来估计声源位置的方法。

波束形成法则是将多个麦克风的信号加权相加,形成一个指向声源的波束。

最小二乘法是通过最小化声源位置与各个麦克风之间的残差平方和来估计声源位置。

尽管这些算法在实现原理上有所不同,但都能够准确地估计声源位置,并在实际应用中取得了良好的效果。

最后,声源追踪算法是实时跟踪声源移动的关键。

常见的声源追踪算法包括卡尔曼滤波算法、粒子滤波算法等。

卡尔曼滤波算法是利用状态方程和观测方程来对声源位置进行预测和修正的方法。

粒子滤波算法则是通过利用一组随机粒子来近似表达参数的概率分布,从而实现对声源位置的估计和跟踪。

声源追踪算法能够在实时变化的环境中实时地跟踪声源的位置,为后续的音频处理和分析提供了重要的数据基础。

总结起来,声源定位与追踪算法是利用传感器技术和信号处理技术来确定声音的产生位置并实时追踪声音的移动轨迹。

在传感器选择、声源定位算法和声源追踪算法三个方面进行研究和探索,可以为智能音频处理、音频增强、语音识别、语音合成、无线麦克风网络等领域的应用提供技术支持。

一种改进搜索的A-star算法

一种改进搜索的A-star算法

一种改进搜索的A-star算法
汪川;生佳根;於跃成;刘畅
【期刊名称】《计算机与数字工程》
【年(卷),期】2024(52)3
【摘要】针对移动机器人在大规模复杂环境中规划速度慢、计算量大等问题,提出一种改进A-star路径规划算法。

引入双向跨节点搜索机制,从原始起点和终点开始,分别以对向当前节点作为目标点进行搜索,优化寻路方向并缩减搜索节点数量;改进遇到障碍物时的搜索方法引入跳变概念,当扩展节点处于障碍物内时该节点认作无效节点,发生跳变,从无效节点处向垂直于无效节点扩展方向的两个方向搜索,直至搜索至非障碍物区,使快速脱离障碍物区域;改进节点评价方法采用分段评价方式,正常扩展阶段将扩展节点加入open表,并对open表中节点评价,当发生跳变时将跳变节点加入jump表并清空open表,然后对jump中节点表进行评价,该操作使得评价节点始终保持在一定数量,减少不必要节点的计算,节约内存占用,使得搜索效率不会因为扩展节点增多而降低。

算法有效性在Matlab中仿真实现,通过对比不同算法在不同障碍物栅格地图中的仿真结果,论文改进算法计算节点更少,效率更高。

【总页数】8页(P692-699)
【作者】汪川;生佳根;於跃成;刘畅
【作者单位】江苏科技大学计算机学院
【正文语种】中文
【中图分类】TP391
【相关文献】
1.一种改进Best-First算法的主题爬虫搜索算法
2.一种基于改进模拟退火算法的程序性能优化参数搜索算法
3.一种融入模式搜索的改进人群搜索算法
4.一种改进的A-Star算法
5.一种基于改进的布谷鸟搜索算法的无人机三维航路规划算法
因版权原因,仅展示原文概要,查看原文内容请购买。

基于神经网络的声源定位算法研究

基于神经网络的声源定位算法研究

基于神经网络的声源定位算法研究声源定位是指通过分析接收到的声音信号,确定声音的来源方向和位置的技术。

在现实生活中,声源定位在许多领域具有重要的应用,例如无人机导航、追踪系统、语音识别等。

然而,由于环境噪声和信号传播的复杂性,实现准确和快速的声源定位一直是一个具有挑战性的问题。

近年来,神经网络在声源定位领域取得了显著的进展。

神经网络是一种模拟人脑神经系统的计算模型,通过模拟神经元之间的连接和信息传递,可以学习和处理复杂的非线性关系。

基于神经网络的声源定位算法利用神经网络的强大模式识别和学习能力,能够有效地处理复杂的声音信号,并准确地确定声源的位置。

基于神经网络的声源定位算法通常包括两个主要步骤:特征提取和定位。

在特征提取阶段,算法通过分析声音信号的频谱、时域和时频特性等,提取出有用的特征信息。

常用的特征包括梅尔频率倒谱系数(MFCC)、短时能量和过零率等。

然后,这些特征被输入到神经网络中进行处理。

在定位阶段,神经网络通过学习大量的声音数据样本,建立了声源位置和特征之间的映射关系。

当接收到新的声音信号时,神经网络可以根据这些映射关系,预测声源的位置。

为了提高定位的准确性,通常会采用多个神经网络进行集成学习,利用多个神经网络的预测结果进行综合判断。

基于神经网络的声源定位算法具有许多优势。

首先,它能够自动学习和适应不同环境的声音特征,使得算法具有较好的鲁棒性。

其次,神经网络可以处理高维特征数据,能够捕捉到更多的声音信息。

此外,神经网络还可以通过增加网络的深度和宽度,提高算法的表达能力和学习能力。

然而,基于神经网络的声源定位算法也存在一些挑战和问题。

首先,神经网络需要大量的标注数据进行训练,而获取准确的标注数据是一项繁琐且耗时的工作。

其次,神经网络的结构和参数设置对算法的性能有较大影响,需要进行合理的设计和调优。

此外,神经网络的计算复杂度较高,对计算资源要求较大,限制了算法在实时性和实际应用中的推广。

综上所述,基于神经网络的声源定位算法在实现准确和快速的声源定位方面具有巨大潜力。

声源定位与跟踪中的自适应算法综述

声源定位与跟踪中的自适应算法综述

声源定位与跟踪中的自适应算法综述声源定位与跟踪是指在多声源环境中,通过分析音频信号来确定声源的位置,并通过跟踪声源的位置变化实现实时的声源定位与跟踪。

在实际应用中,声源定位与跟踪的技术被广泛应用于语音识别、追踪系统、语音增强等领域。

随着科技的发展,研究者们提出了许多自适应算法来实现声源定位与跟踪。

这些算法通过自适应处理音频信号,能够适应不同的环境和噪声干扰,提高了声源定位与跟踪的准确性和稳定性。

自适应算法的核心思想是根据传感器接收到的声音信号,并结合环境噪声等信息,对声源的位置进行估计。

其中,常用的自适应算法包括基于波束形成的MVDR算法、基于延迟和和平均的GCC-PHAT算法、基于互相关的GCC-NCC算法等。

MVDR(Minimum Variance Distortionless Response)算法是一种常用的自适应波束形成算法。

它的核心思想是通过调整不同传感器间的权重来抑制多路径效应和噪声干扰,并最小化输出信号的方差。

MVDR算法在处理定位中的多径效应和噪声干扰方面表现出较好的性能,但对于模型误匹配和信号截断等情况较为敏感。

GCC-PHAT(Generalized Cross Correlation-Phase Transform)算法是一种通过计算差分延迟和相位信息来确定声源位置的自适应算法。

该算法通过计算传感器接收到的音频信号之间的互相关函数,得出音频信号之间的时延差,并结合相位信息推测声源的位置。

GCC-PHAT算法在处理定位中的多路径效应和噪声干扰方面表现出较好的鲁棒性,但对于近距离声源和低频声音的定位存在一定的限制。

GCC-NCC(Generalized Cross Correlation-Normalized Cross Correlation)算法是一种将标准互相关算法与规范化互相关算法相结合的自适应算法。

该算法通过计算互相关函数得到声源定位的初步估计,再通过标准互相关和规范化互相关的结合来提高声源定位的准确性和鲁棒性。

科技成果——麦克风阵列声源识别、定向和定位技术

科技成果——麦克风阵列声源识别、定向和定位技术

科技成果——麦克风阵列声源识别、定向和定位技术成果简介
利用麦克风阵列技术准确定向声源,采用模式识别技术辨别并区分话音和其它声响,采用时延和几何方法确定声源方位,实时处理,算法稳定,抗噪能力强。

应用于监控摄像头辅助系统(引导摄像头转向异常方向,标定录像带中的异常时刻,异常情况时报警等),室内防盗系统(识别破门破窗等异常声响并录音或报警),办公室夜间防盗系统(识别并定向或定位夜间出现的各类异常声响并录音或报警),交通监控系统,保护区监控系统(如偷猎者方位,非法车辆识别、定位和报警等),视像会议系统中的话者定向,机械异常声响识别和定位,基于麦克风阵列的语音获取系统的话者定向或定位,灾场搜寻系统(机器人载,无人机载,营救人员穿戴)。

项目水平国内领先
成熟程度样机
合作方式
合作开发、专利许可、技术转让、技术入股。

一种改进的抗DA/AD变换的音频水印算法

一种改进的抗DA/AD变换的音频水印算法

s mma ie . h u n i ai n b s d a d o wa e a k n l o i m su e , n wh c h p r p it r q e c — o i ss lce u r d T e q a tz to — a e u i t r r i g ag rt z m h i s d i ih t e a p o rae fe u n y d ma n i ee t d
i t di i a i eltv l s v r A/ n he au o sgn l n a r ai e y e e e D AD c nv r i n e io o e so nv r nm e t a e r s n e n r p e e t d.Th os i p tntt r e r a o ha e m t m ora h e e s ns t t
音 频信 号 产生差 异 的 因素 ,进 而分 析 总结 了影 响音 频 水 印信 息 最重要 的 三点原 因一噪 声干 扰 ,时
域 漂移 和 幅值 差 异 。针 对 以上 三 点原 因,我 们 采用 改善基 于量化 的音 频 水 印算法 的方 法 ,选择 合 适 的频 率域 和对 水 印信 息做 B H 纠错编 码 处理 。 实验 证 明 与现有 算 法相 比 ,此 种 方 法有 更好 的 C
c n rb t d e s l o t e a d o wae ma k n - n ie i tr e e c , i e d man d f a d a l u e d fe e c , r n l z d a d o t u e a v re y t h u i tr r i g i o s ne fr n e t m - o i r t n mp i d i r n e a e a ay e n i t

一种TDOA/AOA联合定位的算法

一种TDOA/AOA联合定位的算法

a g rt m . n t s a g rt m, n e s r a ep a e n o e fx d p a f r o h r u d t e s r h z m u h a d p t h loi h I l o ih hi o e s n o n b l c d o n i e l to m n t e g o n o m a u e t e a i t n ic c a g eb t e h ss n o n h mi e . e o h r s n o a ep a e n o e m o i g p a f r , n h i e e t n l e we n t i e s ra d t e e t r Th t e e s rc n b l c d o n v n l to m a d t e d f r n t i TD0A
( meDi e e c rv 1 a e me s r d a ifr n i ,t e h Ti f rn e OfAri a)c n b a u e td fe e ttme h n t e LS( e s q a e l o i m a e r a h d t i L a ts u r)ag rt h c n b e c e o
不 同的 时刻 测量 不 同 的时 差量 测值 ,进 而建立 求解 目标位 置估 计值 的最 小二 乘 算法 。仿 真 结果表 明:该 算 法可 以有
效提 高系统 的定位 精度 ,特 别是 T OA 的测 量值 应 用得越 多 ,则 定位 精度 越 高 。 D 关键 词 :T DOA;AOA;最 小二乘 解 ;联合 定 位 算法 ;定位 精 度
摘要 :针 对地 面辐射 源 目标 的 定位 问题 ,提 出一 种 T D0 A0

基于DEM格网的改进型A*路径搜索算法

基于DEM格网的改进型A*路径搜索算法
o t eag rt m r a i ae y p a tc l p l a i n fh lo i h a ev l t d b r ci a p i to . d a c
Ke o d :DE Gr ; ra p —e ok GI; pt— n ig yw r s M— i o d o on t r; S ahf dn ;Di saa oi m; A loi m d t w i j t l rh kr g t ag rh t
Ab t a t T e l t ah Fi dn r b e b s do M — i , t ed fe e c n a n s ewe n DEM — i n a p — e — s r c : o d a h P t — n i gp o l m a e nDE Gr wi d h i r n ea d s me e s t e f b Grda dr d t o n t o o
ag rtm o sd r gteg o rp ysa ec aa tr s mpo e , a dage d l mp s d Fn l , tefa iit n aii lo i c n ie n e g a h p c h r cesi e ly d h i h n re yr ei i o e . ial u s y h s l a dv l t e bi y dy
摘 要 : 解 决 D M 格 网 上 的路 径 搜 索 问题 , 析 了 D M 格 网 和 道 路 拓 扑 网络 的 共 性 与 区 别 , 结 合 D M 格 网 的特 点 对 比 为 E 分 E 并 E
了Di s a j t 算法和 A 算法 的优缺 点 , 出了基 于 D M 格 网的改进 型 A 路 径搜 索 算法 。该算 法充分 考虑 D M 格 网上 的路 径 kr 提 E E 可 达条 件 , 用移动 窗 口法获取搜 索网格候 选集 ,并根据 地理 空间分 布特征 选取 A 算法 的估价 函数 ,同时 引入 贪婪 准 则缩 采

高精度声源定位技术的研究进展

高精度声源定位技术的研究进展

高精度声源定位技术的研究进展声源定位技术是一项关键的技术,广泛应用于各个领域,如音频处理、通信系统、无人机导航等。

近年来,随着科技的不断进步,高精度声源定位技术也得到了长足的发展。

本文将介绍该技术的研究进展,并探讨其在实际应用中的潜力。

首先,高精度声源定位技术的研究主要集中在两个方面:传感器阵列设计和信号处理算法。

传感器阵列是实现声源定位的关键组成部分,其设计直接影响到定位精度。

目前,常见的传感器阵列包括线性阵列、圆形阵列和球形阵列等。

研究人员通过对传感器阵列的优化设计,提高了定位的准确性和稳定性。

其次,信号处理算法也是高精度声源定位技术中不可或缺的一环。

传统的声源定位算法主要基于波束形成原理,通过对接收到的声波信号进行处理,确定声源的位置。

然而,由于环境噪声和多路径效应的存在,传统算法在复杂环境下的定位精度有限。

因此,研究人员提出了一系列新的信号处理算法,如基于卷积神经网络的声源定位算法、基于深度学习的声源定位算法等。

这些算法通过对大量数据的学习和分析,提高了定位的准确性和鲁棒性。

除了传感器阵列设计和信号处理算法,高精度声源定位技术的研究还涉及到其他方面的内容。

例如,研究人员通过引入多模态信息,如视频、惯性传感器等,提高了声源定位的精度。

此外,他们还研究了声源定位与其他相关技术的结合,如目标跟踪、声纹识别等,进一步拓展了该技术的应用范围。

高精度声源定位技术在实际应用中具有广阔的前景。

首先,它可以应用于智能音频处理领域。

通过准确地定位声源,可以实现自适应降噪、声源增强等功能,提高音频质量和用户体验。

其次,该技术可以应用于通信系统中。

通过定位对方的声源,可以实现声纹识别、定向通信等功能,提高通信的安全性和效率。

此外,高精度声源定位技术还可以应用于无人机导航、智能家居等领域,为人们的生活带来更多便利。

尽管高精度声源定位技术已经取得了一定的研究进展,但仍存在一些挑战和问题。

首先,复杂环境下的定位精度仍然有待提高。

一种基于空间和频谱时序信息建模的多移动声源定位方法和系统[发明专利]

一种基于空间和频谱时序信息建模的多移动声源定位方法和系统[发明专利]

专利名称:一种基于空间和频谱时序信息建模的多移动声源定位方法和系统
专利类型:发明专利
发明人:刘宏,杨冰,李一迪
申请号:CN202210137621.9
申请日:20220215
公开号:CN114611546A
公开日:
20220610
专利内容由知识产权出版社提供
摘要:本发明涉及一种基于空间和频谱时序信息建模的多移动声源定位方法和系统。

本发明将直达路径相位差和声源活跃程度信息以加权求和的方式编码到学习目标中,从而指导网络学习具有竞争性和时变性的多移动声源的直达路径相位差特征,避免了多目标回归框架面临的分配歧义以及输出维度不确定问题;通过迭代地检测和定位主导声源来确定多移动声源的位置,降低了多声源之间的相互影响;引入频谱特征提取网络,建立了声源位置与声源身份之间的关联,通过对空间和频谱的时序信息进行建模实现了可靠的多移动声源跟踪。

申请人:北京大学深圳研究生院
地址:518055 广东省深圳市南山区西丽深圳大学城北京大学校区
国籍:CN
代理机构:北京君尚知识产权代理有限公司
代理人:邱晓锋
更多信息请下载全文后查看。

基于单声学矢量传感器的最大能量动态声源波达方向跟踪算法

基于单声学矢量传感器的最大能量动态声源波达方向跟踪算法

基于单声学矢量传感器的最大能量动态声源波达方向跟踪算法胡振涛;李松;金勇【摘要】针对在空域非均匀噪声环境下目标定位跟踪问题,提出一种基于单声学矢量传感器的最大能量动态声源波达方向(DOA)跟踪算法.首先结合噪声协方差矩阵估计结果实现对传感器接收信号的预白化处理,进而确定加权参数值,提出一种加权参数固化的最大能量算法,从而在声压与振速域噪声功率比未知的条件下提高了DOA估计精度.在此基础上,利用最大能量定向估计子输出信息来构建运动目标的量测方程,并在容积Kalman滤波框架下实现对于动态声源的状态跟踪.理论分析与仿真结果验证了算法的可行性和有效性.【期刊名称】《控制理论与应用》【年(卷),期】2014(031)002【总页数】6页(P209-214)【关键词】波达方向估计;目标跟踪;声矢量传感器;运动声源【作者】胡振涛;李松;金勇【作者单位】河南大学图像处理与模式识别研究所,河南开封475004;河南大学图像处理与模式识别研究所,河南开封475004;河南大学图像处理与模式识别研究所,河南开封475004【正文语种】中文【中图分类】TP391波达方向(direction of arrival,DOA)估计在无线电通信、雷达、声纳超分辨、地震探测、导航和医学等领域有着广泛的应用,一直是通信、雷达、声纳等领域研究的重点内容之一.在水声信号处理中,确定声波的到达方向是信号处理中的一个重要方面.通常采用声压传感器阵列对声场进行空间采样,并进行空间谱估计.考虑到声波兼有标量场和矢量场,传统的声压传感器仅利用了其声压信息(标量场),而矢量传感器可以空间共点、时间同步测量声场中的声压(标量场)和振速(矢量场)信息.由于矢量传感器本身固有的方向敏感性和测量信息量大的优点,相对于采用声压传感器必将进一步提升DOA估计的性能.近年来,针对矢量传感器阵列的DOA估计研究受到国内外学者的广泛关注.Nehorai等研究了基于声学矢量传感器阵列DOA估计的克拉美罗界(CRLB)[1],Hawkes等讨论了声学矢量传感器阵列的几何结构和传感器空间位置对参数估计性能的影响[2],为声矢量传感器DOA估计领域的发展以及估计性能的讨论奠定了理论基础.顾陈等结合传播算子方法与声学矢量传感器特点,提出一种基于传播算子的声学矢量传感器阵列扩展孔径二维DOA估计算法[3].陈华伟等将宽带聚焦思想引入到了矢量传感器阵宽带处理,提出了基于矢量传感器阵的宽带相干信号子空间最优波束形成方法[4],避免了波束形成中对目标源方位的预估.此外,基于子空间的信号处理方法也均被应用到矢量传感器应用领域,如多信号分类(MUSIC)算法[5]以及基于旋转不变技术的估计信号参数(ESPRIT)算法[6].其中,Suresh等结合矢量传感器阵列与压缩波束形成方法,对常模型MUSIC算法加以改进并应用于浅海环境的DOA估计[7],取得了较好的效果.然而,上述基于阵列信号处理技术的高分辨率DOA估计方法(MUSIC和ESPRIT算法)通常需要二维搜索,运算量极大.因此,Levin等基于首要梯度上升的原理,提出一种基于单一矢量传感器的DOA估计方法[8],以期在空域非均匀高斯噪声环境中,通过最大能量DOA估计算法获得声源方位,其估计的均方误差在恰当权值选取下逼近CRLB.算法避免了二维搜索,但在噪声各部分功率比未知环境下无法确定最优权值并获得其对应的DOA最优估计.此外,以上对DOA估计的研究均以静态声源为研究对象,而在实际工程应用中,常常需要面对动态声源目标的处理,如果直接利用上述算法,需要重复对信号协方差矩阵进行特征值分解或奇异值分解,运算量极大.目前,已有学者尝试将目标定位算法和跟踪算法进行结合,取得一定研究成果[9–10].但其研究成果多局限于声压传感器阵列,而基于矢量传感器量测信息的声源定位与跟踪方法研究报道较少.Zhong 等通过Capon波束形成方法与粒子滤波算法的相结合,提出了基于矢量传感器的2-D波达方向跟踪算法[11],给出了一种基于矢量传感器的定位跟踪一体化实现的新思路.基于以上分析,本文在借鉴文献[8]给出最大能量算法实现机理基础上,构建一种加权参数固化的最大能量算法,通过白化单极子传感器和偶极子传感器接收噪声能量,固定了加权因子的取值并保证DOA估计精度最优;利用最大能量定向估计子输出信息在极坐标系下构建运动目标的量测方程,并在容积Kalman滤波框架下实现对于动态声源的状态估计,提出了一种基于单声学矢量传感器的最大能量动态声源波达方向跟踪算法.声矢量传感器由3个正交的偶极子振速传感器与1个单极子声压传感器组成,利用声矢量传感器可以同时获得空间内某一点处的振速和声压信息.考虑k时刻载波频率为f的远场声源Sk,uk为与波达方向相反的声源方向向量:和分别表示声信号入射向量的俯仰角和方位角.pk为声源声压,表示声源振速,且其中:ρ0表示传播介质密度,c表示传播介质中声信号的传播速率.考虑水下声源定位及跟踪场景下声源大多做平稳运动,因而以时间顺序分别在各个时刻进行多次快拍数据采集,并做出相应的DOA估计.假设每一时刻测得N组快拍数据,则k时刻声源Sk∈ℝ1×N,噪声εk∈ℝ4×N由声压域噪声和振速域噪声=组成,矢量传感器接收数据Yk∈ℝ4×N由声压域信息和振速域信息组成,可分别表示为以下形式:ak∈ℝ4×1表示导向矢量,且表示Sk到传感器的波达时间.针对声源信号Sk与噪声为广义平稳的零均值非相关随机过程,并且就其方差分别为和的情况展开研究和讨论.3.1 加权参数固化的最大能量DOA算法(Maximum power DOA estimation algorithm based on weight parameter fi xed)针对k时刻噪声分量高斯非均匀情况,基于约束条件=1,声源导向矢量的估计为其中:与单极子元素部分波束形成输出相关,与各个偶极子元素的波束形成输出相关. k时刻矢量传感器接收到的N组快拍数据的协方差矩阵可表示为表示信号振速域与声压域的协方差矩阵;分别表示信号声压域的协方差矩阵和振速域的协方差矩阵.根据最大能量法(maximum power,MP)[8],将式(5)中的目标函数展开作适当变换并对qk求梯度,得到定义为MP算法的加权参数,文献[8]中的理论分析及实验指出,,与k时刻噪声声压功率、振速功率在各个坐标轴上的分量有关,并满足关系+=1.且在=/(+)的条件下,即当的值与单极子和各个偶极子噪声功率呈反比时, DOA估计均方角度误差接近CRLB.然而,对噪声声压与振速部分功率未知的场景,由于无法得到噪声各部分功率比,标准MP算法无法确定最优加权参数取值,从而影响到算法DOA估计精度.针对以上问题,结合估计噪声协方差矩阵实现对传感器接收信号预白化处理,使得处理后噪声振速与声压功率比为1,进而确定加权参数值为0.5.在此基础上,提出一种加权参数固化的最大能量算法(WPF--MP).算法实现原理如下:考虑k时刻传感器获得声源信号的N组快拍采样数据,由于声源信号Sk与噪声为广义平稳的零均值非相关随机过程,结合公式(3)–(4)和式(6),协方差矩阵可以表示为以下形式:其中:表示k时刻N组快拍采样下声源信号的噪声协方差矩阵,且N趋近于无穷时,为表征噪声统计特性的矩阵.通过非均匀噪声协方差估计方法[12],可以估计出入射声信号的噪声协方差矩阵,从而将传感器接收信号预白化得到从而,接收信号预白化后的协方差阵为并且,结合式(8)与式(9),预白化后量测信息协方差矩阵.此时,所对应的噪声协方差矩阵为单位矩阵,即噪声声压域与振速域功率相同.因此,可将式(7)中值固化为ˆα=0.5,对MP算法进行改进,基于首要梯度上升的原理进行迭代[8],当方向矢量趋于稳定时(即小于容忍参数ε),获取其对应的声源方位,使得DOA估计角度均方误差最接近CRLB.下面给出WPF--MP算法实现流程:1)初始化:t=0,t表示算法迭代次数,设置迭代上限L,步长参数µ,容忍参数ε.2)估计噪声协方差矩阵.3)通过式(9)得到预白化后的信号n=1, 2,...,N.4)利用式(10)得到信号预白化之后的则初始方向矢量end6)输出:3.2 基于WPF–MP的动态声源DOA跟踪算法(Dynamic acoustic source DOA tracking algorithm based on WPF--MP)最大能量DOA估计算法为静态声源定位方法,将其应用于动态声源目标跟踪场景,由于没有利用声源运动方程的先验信息,所以计算复杂度较高且精度有限.基于声源跟踪的水域舰船探测背景,声源通常做较为平稳的匀速运动,因而考虑对具有代表性的匀速直线运动声源进行DOA跟踪,且传感器量测噪声为高斯白噪声.声矢量传感器静态声源DOA估计的研究中,传感器观测模型为极坐标模型,以致目标状态与观测之间存在非线性映射关系,因此考虑将容积卡尔曼滤波(cubature Kalman fi lter,CKF)引入到运动声源的DOA估计中进行纯方位跟踪,以提高声源状态估计精度.声源目标的运动状态方程可描述为其中:为k时刻声源目标的状态向量,xk,yk和zk分别表示声源在X,Y,Z轴的位置信息,则代表动态声源在各轴的速度分量;Φk|k−1表示系统状态转移矩阵,Γk−1表示系统噪声驱动阵,Wk−1为系统激励噪声序列.以k时刻WPF--MP算法输出向量作为CKF的量测信息,进而通过反三角函数构建向量对应极坐标下的量测方程:则量测噪声Vk的协方差矩阵其中h(Xk)为非线性的测量方程表达式.然而在滤波过程中,k时刻真实状态向量Xk 未知,因而无法采用式(13)获得Rk.当噪声是方差分别为且互不相关的高斯白噪声时,采用WPF--MP算法获得的DOA估计误差基本趋于稳定,并采用Monte Carlo仿真技术,基于每一组快拍数据得到DOA估计与其整体均值的残差,进而得出k时刻Zk的噪声协方差矩阵综上所述,构建加权参数固化的最大能量跟踪(WPF--MPT)算法,将DOA估计的俯仰和方位信息作为容积卡尔曼滤波算法[13]的量测信息,自适应地跟踪移动声源的波达方向.为便于WPF--MPT的工程应用,以下给出WPF--MPT算法具体实现步骤:1)时间更新.①由k−1时刻协方差矩阵Pk−1|k−1正定,对该矩阵进行因式分解②容积点估计:其中表示矩阵[In×n−In×n]∈ℝn×m的第i列元素,In×n表示n维单位矩阵,m=2n为容积点的总数.③容积点传播:④预测状态估计与误差协方差矩阵估计:2)量测更新.①采用WPF--MP算法得到各时声源方向矢量.②求出对应极坐标下的俯仰角与方位角则容积卡尔曼滤波量测Zk=.③矩阵Pk|k−1因式分解:④容积点估计:⑤容积点传播:⑥预测量测估计:⑦信息方差与协方差矩阵估计:⑧计算卡尔曼增益:⑨求解状态估计及其误差协方差矩阵:由于声矢量传感器量测信息中不含有运动声源与矢量传感器之间的径向距信息,因而在状态估计中仅可利用目标的俯仰与方位角度量测信息获取目标状态估计ˆxk|k,进而通过反三角函数获得k时刻所对应的俯仰与方位角度估计.4.1 基于WPF--MP的DOA估计(DOA estimation based on WPF--MP)仿真实验采用均方角度误差(MSAE)[1]为标准评估DOA估计方法性能,仿真实验中快拍次数N取8000,分别采用MP算法与WPF--MP算法进行声源DOA估计,俯仰角和方位角的真实值分别为ϕk=30◦,声信号和噪声能量分别为WPF--MP算法中步长参数µ与容忍参数ε等的选取决定了算法的收敛次数并影响DOA估计精度.文献[8]给出了MP算法的仿真环境和参数设定,并验证方向矢量qtk在20次迭代内基本收敛.因此,为了便于算法的对比,WPF--MP算法参考MP算法进行参数设定,算法迭代次数上限L=50,步长参数µ=1,容忍参数ε=0.00001.此外,为体现加权参数选取的重要性,MP算法中,加权参数αpk选取0到1间100个常数分别进行DOA估计,步长为0.01; WPF--MP算法则固化加权参数ˆα=0.5进行DOA估计.进行MC=10000次蒙特卡洛仿真实验,在声压与振速噪声功率比不同的条件下,分别获得MP与WPF--MP算法MSAE均值及其对应的CRLB,并通过一维搜索给出MP算法不同加权参数下DOA估计精度最优点,所获比较效果如图1所示.由图1可以看出,针对噪声各部分功率取值不同的情况,WPF--MP算法DOA估计的MSAE均值与MP算法中选取恰当参数所对应的最优估计MSAE均值相近似,且逼近CRLB.但当MP算法中取其他值时, MP算法无法获得最优DOA估计.为进一步验证WPF--MP算法的优越性,在相同的信号、噪声以及其他仿真实验条件下,本文采用本领域经典的Capon算法[14]对声源目标进行DOA估计,将其10000次蒙特卡洛仿真实验所获得的俯仰和方位角度估计结果的均方根误差(RMSE)、估计时长与MP算法以及WPF--MP算法作对比.Capon算法的DOA估计结果由二维搜索获得,仿真过程中本文设定搜索步长为0.1◦,方位与俯仰的搜索范围均为0◦到60◦.对于声信号噪声各部分功率比未知的情况,MP算法无法通过公式来选取加权参数,因此,对比实验中MP算法的加权参数选取0至1间的随机数.3种算法对比效果如表1所示.由表1可以看出,由于避免了二维搜索,MP算法和WPF--MP算法的DOA估计时间明显优于Capon算法.MP算法虽然计算效率最高,但随机选取的αpk很难保证其DOA估计精度达到最优;WPF--MP算法则固化了加权参数的选取以获取最优DOA估计,从RMSE对比中可以发现,WPF--MP算法与Capon算法估计精度相当且优于MP算法.图1和表1中对比足以说明, WPF--MP算法同时兼具高效率和高估计精度的优点,具有较好地工程应用价值.4.2 基于WPF--MPT的动态声源DOA跟踪(Dynamic acoustic source DOA tracking based on WPF--MPT)综合静态WPF--MP波达方向估计方法与容积卡尔曼滤波算法,仿真实验完成在三维空间运动的声源DOA跟踪.设动态声源在笛卡尔坐标系中做匀速直线运动,声源与传感器距离为d=1000m,初始时刻俯仰角θ0=30◦、方位角ϕ0=30◦,X,Y,Z轴速度分量分别为20m/s,−10m/s,−20m/s,声信号和噪声能量分别为目标状态方程如式(11)所示,量测方程采用WPF--MP算法的DOA估计结果,即过程噪声是具有零均值和正定协方差阵的高斯白噪声向量,采样间隔T=1s.CKF量测Zk的噪声方差阵Rk由式(14)获得.对目标进行k=120步DOA跟踪,图2和图3分别给出了各个时刻WPF--MPT算法与WPF--MP算法DOA估计的俯仰与方位角度估计RMSE对比.综合图2–3,WPF--MPT算法DOA估计的RMSE明显低于静态WPF--MP算法.并且由于CKF框架的引入,随着采样时刻的增加,其RMSE逐渐下降并趋于稳定.4.1部分的仿真已充分验证了静态WPF--MP算法的有效性,综合图2–3结果,更可以反映出WPF--MPT算法的优越性.此外,为验证算法对于声信号不同信噪比下跟踪定位效果的普适性和优越性,表2和表3中给出不同信噪比下100次蒙特卡洛仿真实验得到的WPF--MP算法与WPF--MPT算法第21到第120个采样时刻的DOA 估计RMSE均值结果的比较.可以看出,由于WPF--MPT算法利用先验信息有效地对原估计结果进行了修正,对于信噪比以及噪声各部分功率比不同的条件,算法的DOA估计精度较WPF--MP 算法均有所提高.在上述仿真实验的基础上,采用相同的仿真背景,图4中给出条件下WPF--MPT算法MSAE均值与静态MSAE的CRLB的对比,可以看出,由于声源运动状态方程的引入, WPF--MPT算法突破了静态声源DOA估计MSAE的CRLB,进一步验证了WPF--MPT算法的有效性.近年来,矢量传感器的声信号DOA估计问题引起了国内外学者的广泛关注和研究.然而,目前大部分研究都是关于静态声源DOA估计,本文针对动态声源DOA估计与跟踪问题,结合容积Kalman滤波算法与最大能量DOA估计算法,基于矢量传感器量测技术提出一种加权参数固化的最大能量声源跟踪算法.相对于现有DOA估计方法,WPF--MPT算法具有以下优势:首先,较之于基于阵列信号处理技术的高分辨率DOA估计方法(MUSIC和ESPRIT算法),WPF--MPT算法无需二维搜索,并且在最大能量DOA估计方法的基础上,解决了加权参数的取值问题,有效降低了运算量;其次,引入容积Kalman滤波算法,对运动声源进行建模并自适应跟踪,解决了运动声源DOA跟踪问题,实现声源DOA估计与跟踪一体化,拓宽了算法适用范围;此外,采用矢量传感器量测数据适用于不同信噪比下的DOA跟踪,且适用于声压部分与振速部分噪声功率未知的情况.胡振涛(1979–),男,副教授,博士,主要从事复杂系统建模与估计、多源信息融合、非线性滤波的研究,E-mail:************.cn;【相关文献】[1]NEHORAI A,PALDI E.Acoustic vector sensor array processing[J]. IEEE Transations on Signal Processing,1994,42(9):2481–2491.[2]HAWKES M,NEHORAI A.Effects of sensor placement on acoustic vector sensor array performance[J].IEEE Journal of Oceanic Engineering,1999,24(1):33–40.[3]顾陈,何劲,朱晓华,等.基于传播算子的声学矢量传感器阵列扩展孔径二维DOA估计算法[J].电子学报,2010,38(10):2377–2382. (GU Chen,HE Jin,ZHU Xiaohua,et al.Extended-aperture twodimensional DOA estimation with acoustic vector sensor array using the propagator method[J].Acta Electronica Sinica,2010,38(10): 2377–2382.)[4]陈华伟,赵俊渭.声矢量传感器阵宽带相干信号子空间最优波束形成[J].声学学报,2005,30(1):76–82. (CHEN Huawei,ZHAO Junwei.Coherent signal subspace wideband optimal beamforming for acoustic vector-sensor array[J].Acta Electronica Sinica,2005,30(1):76–82.)[5]WONG K T,ZOLTOWSKI M D.Self-initiating MUSIC-based direction fi nding in underwater acoustic particle velocity- fi eld beamspace[J].IEEE Journal of Oceanic Engineering,2000,25(2): 262–273.[6]CHEN H,ZHAO J.Coherent signal-subspace processing of acoustic vector sensor array for doa estimation of wideband sources[J].Signal Process,2005,85(4):837–847.[7]SURESH K N,DIBU J P,BHATTACHARYA C.DOA estimation using compressive beamforming in shallow ocean using acoustic vector sensors[C]//Annual IEEE India Conference.India:IEEE,2012:551–554.[8]LEVIN D,GANNOT S,HABET S.Direction-of-arrival estimation using acoustic vector sensors in the presence of noise[C]//IEEE International Conference Acoustics,Speech and Signal Processing. Prague:IEEE,2011:105–108.[9]刘楠,张娟,张林让,等.一种适用于MIMO雷达的低复杂度二维DOA估计方法[J].电子学报,2012,30(3):505–511. (LIU Nan,ZHANG Juan,ZHANG Linrang,et al.A low complexity 2-D estimation method for MIMO rader[J].Acta Electronica Sinica, 2012,30(3):505–511.) [10]HU D X,ZHAO Y J,LI D H.Joint source number detection and DOA track using particle fi lter[C]//International Conference on Measuring Technology and Mechatronics Automation.Changsha:IEEE, 2010:13–14.[11]ZHONG X H,PREMKUMAR A B,MADHUKUMAR A S.Particle fi ltering and posterior cramer-rao bound for 2-D direction of arrival tracking using an acoustic vector sensor[J].IEEE Sensor Journal, 2012,12(2):363–377.[12]WU Y T,HOU C H.Direction-of-arrival estimation in the presence of unknown non-uniform noise fi elds[J].IEEE Journal of Oceanic Engineering,2006,31(2):504–510. [13]ARASARATNAM I,HAYKIN S.Cubature Kalman fi lters[J].IEEE Transactions on Automatic Control,2009,54(6):1254–1269.[14]HAWKES M,NEHORAI A.Acoustic vector-sensor beamforming and Capon direction estimation[J].IEEE Transactions on Automatic Control,1998,46(9):2291–2304.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

北京大学学报(自然科学版),第41卷,第5期,2005年9月Acta Scientiarum NaturaliumUniversitatis Pekinensis,V ol.41,N o.5(Sept.2005)一种改进的AEDA声源定位及跟踪算法1)李承智 曲天书2) 吴玺宏(北京大学视觉与听觉信息处理国家重点实验室,北京,100871;2)E2mail:qutianshu@)摘 要 开展了基于麦克风阵列的真实声场环境声源定位的工作。

针对传统的自适应特征值分解时延估计算法收敛时间慢、对初值敏感以及不能有效跟踪时延变化等问题,提出了一种改进的自适应特征值分解时延估计算法,该方法通过改进初值设定方法,有效改善了对时延变化的估计。

另外,通过引入一个基于相关运算的语音检测算法,提高了定位系统的抗噪声能力。

实验表明在真实的声场环境下该算法能够对单个声源的三维空间位置进行实时的定位和跟踪,系统在115m范围内对声源的定位误差小于8cm,声源位置变化时,系统也能准确跟踪声源的位置。

关键词 麦克风阵列;声源定位;声源跟踪;AE DA算法;LMS算法中图分类号 TP3910 引 言基于麦克风阵列的声源定位是声学信号处理领域中的一个重要问题,在视频会议、智能机器人、鲁棒语音识别等领域有着广泛的应用。

近年来,在真实声场环境下抗混响的声源定位算法研究成为研究热点。

声源定位大致分为3类方法。

第1类是基于波束成型的方法,该方法可以对单声源进行定位[1,2],也可以对多声源进行定位[3],但存在对初值敏感的问题。

另外还需要知道声源和噪声的先验知识,该方法存在计算量大,不利于实时处理等缺点。

第2类是基于高分辨率谱估计的方法。

该方法在理论上可以对声源的方向进行有效的估计,并且适用于多个声源的情况[4]。

但由于该算法是针对窄带信号,因此如要获得较理想的精度就要付出很大的计算量代价。

另外这些算法无法处理高度相关的信号,因此混响会给算法的定位精度带来较大影响。

第3类方法是基于时延估计的方法。

该类算法计算量小,易于实时实现,近年来得到了高度重视。

基于时延估计的算法分为2个部分。

第1部分为时延估计,即计算声源到两两麦克风之间的时间差;第2部分为方位估计,即根据时延和麦克风阵列的几何位置估计出声源的位置,其中时延估计最为关键。

互相关法是最常用的一种时延估计算法,但是它在混响较大的情况下性能下降很多。

1982年,D1H.Y oun等[5]提出了最小均方(LMS,Least Mean Square)时延估计算法,其性能和互相关法基本相当。

布朗大学于1995年实现了一个实时声源定位系统[6],该系统采用相位变换的时延估计算法和线性插值方位估计算法,在混响较小的情况下能够准确的估计时延但在混响较大情况下误差较大。

1997年新泽西州立大学采用相位变换法作为时 1)国家自然科学基金(60305004)中国博士后科学基金(2003033081)资助项目收稿日期:2004208223;修回日期:2004211211908延估计和非闭合的方向搜索算法进行实时的声源定位[7],实验结果表明混响对系统的影响很大。

同年美国PictureT el公司开发了PictureT el limelight声源定位系统[8],该系统采用相位变换和简单的三角测定定位算法,这2种算法均不能有效消除混响的影响。

佐治亚理工大学电子与计算机工程系Y iteng Huang于2001年采用自适应特征值分解算法(AE DA,Adaptive E igenvalue Decom position Alg orithm)对时延进行估计,用线性校正最小二乘法估计声源方位[9]。

该方法可以有效地克服混响和噪声的影响,但是自适应特征值分解法需要一定时间才能够收敛,定位时间较长,对初值敏感,并且对声源跟踪的能力也较差。

针对自适应特征值分解声源定位算法的不足,本文提出了一种改进的AE DA时延估计算法,通过结合AE DA算法和LMS算法,在保持AE DA算法性能的情况下可以有效的跟踪时延的变化。

另外,基于这种新的时延估计算法本文实现了一个抗混响的实时声源定位系统。

在第2和第3部分分别介绍了时延估计算法和方位估计算法,第4部分给出仿真实验结果和讨论,第5部分给出结论。

1 时延估计1.1 改进的自适应特征值分解法图1 自适应特征值分解(AE DA)算法框图Fig.1 AE DA alg orithm structure自适应特征值分解法采用了双通道信道盲估计思想。

算法首先自适应地估计声源到2个麦克风传输信道的冲击响应,然后根据这些冲击响应估计出这2个接收信号之间的时间延迟。

该算法可以看作是LMS时延估计算法的一种推广,LMS算法只对一个通道的冲击响应进行估计,而AE DA算法同时对2个通道的传输响应进行估计,如图1所示。

AE DA算法中误差信号可表示为:e(n)=^u T(n)x(n),(1)其中:x(n)=[x T i(n),x T j(n)],x i(n)=[x i(n),x i(n-1),…,x i(n-L+1)]T,x j(n)=[x j(n),x j(n-1),…,x j(n-L+1)]T,^u(n)=[^h T j(n),-^h T i(n)]T, ^h i(n)=[^h i,0(n),^h i,1(n),…,^h i,L-1(n)]T,^h j(n)=[^h j,0(n),^h j,1(n),…,^h j,L-1(n)]T。

式中x(n)为各个麦克风的接收到的信号,^hi (n),^hj(n)为声源到第i,j2个麦克风的冲击响应。

应用受限LMS自适应算法,冲击响应可以按下式更新:^u(n+1)=^u(n)-μe(n)x(n),(2) 其中μ是步长参数。

虽然估计信道的冲击响应很困难,但是本算法只需要得到2个信道的时间延迟。

可以将^u(n)初始化为^u LΠ2(0)=1,这表示了通道j的直达声的时延。

由于“镜像作用”,在自适应过程018 北京大学学报(自然科学版)第41卷 中,^u (n )的第2部分会出现一个负的峰值,它代表了通道i 直达声的时延。

2个时延之间的距离即为声源到2个麦克风的时间差。

AE DA 算法通过估计信道冲击响应来去除混响对时延估计的影响,因此在混响条件下,它能取得良好的性能。

但是它对初值的设定比较敏感,当时延改变时,算法收敛值将作为新的初值,这导致算法对改变后的时延收敛较慢,无法有效的跟踪时延的变化。

为了让算法快速的收敛到新的时延,结合LMS 时延估计算法对自适应特征值分解算法进行了改进。

改进后的算法如下所示:第1步:首先应用自适应特征值分解法(如图1所示),将^u (n )初始化为^u L Π2(0)=1,求取各麦克风之间的时间差;第2步:每隔一段时间重新设置h j 的初值,即:h j (L Π2)=1,h j (n )=0,n ≠L Π2,如图2所示;图2 改进的AE DA 算法Fig.2 M odified AE DA alg orithm structure 第3步:重复步骤1、2,不断求取更新后的各个麦克风之间的时间差。

1.2 基于自相关算法的语音检测在进行实时声源定位过程中,准确地检测出目标语音信号的出现,可有效的减少系统定位的运算量并提高系统的性能,因此在AE DA 算法之前加入了语音检测模块(VAD ,V oice Activity Detection )。

一般的语音检测算法常常用信号的能量和过零率来进行语音和非语音的判断,然而能量和过零率极易受噪声的影响,本文基于信号的最大互相关值实现了一种语音检测方法,该方法利用麦克风阵列采集信号的相关信息,可有效去除非相关噪声的影响。

2个信号的互相关可以表示为:c (n )=FFT -1(FFT (s i (n )3FFT 3(s j (n )))),(3)则:max (c (n ))=>τ, 语音存在;<τ, 语音不存在。

(4)2 方位估计在时延估计完成后,为了估计声源的三维坐标,系统采用了最小一步二乘算法。

假设麦克风的坐标为:r i =(x i ,y i ,z i )T , i =0.1,…,N -1,(5)其中N 为麦克风的个数,x 、y 、z 分别代表空间的三维坐标值。

声源的坐标为r s =(x s ,y s ,z s )T 。

(6) 每个麦克风和声源到原点的距离为R i =‖r i ‖=x 2i +y 2i +z 2i , i =1,2,…,N -1,(7)R s =‖r s ‖=x 2s +y 2s +z 2s 。

(8)118 第5期李承智等:一种改进的AE DA 声源定位及跟踪算法 声源到2个麦克风的距离差为d ij =c τij , i ,j =0,1,…,N -1,(9)其中τij 为声源到麦克风i 和j 的时间延迟,c 为声速。

利用球形最小二乘误差方程可得声源坐标的估计值为[9]:^θ=A +b ,A =[s |^d ], s =x 1y 1z 1x 2y 2z 2………x N -1y N -1z N -1,(10)其中:θ=x s y sz sR s , b =12R 21-^d 210R 22-^d 220……R 2N -1-^d 2N -10。

(11)3 仿真实验及讨论3.1 实验系统构成整个声源定位系统由3部分组成,见图3。

第1部分为麦克风阵列,该阵列由6个麦克风组成;第2部分为实验室自主开发的18通道音频采集卡(SHRC -SC0401),该采集卡基于TI T MS320vc5509DSP 芯片设计,声音信号经22kH z 采样,16bit 量化,通过US B 接口把多通路声音信号采集到计算机;第3部分为计算机,实现声音定位和跟踪算法。

图3 仿真实验系统Fig.3 S imulate system3.2 实验结果与讨论为了验证算法的性能,实验环境选择北京大学视觉与听觉信息处理国家重点实验室的审听室,审听室的大小为3160m ×2188m ×2150m 、混响时间为0125s 、本底噪声为2019dB 。

声源为20s 语音信号由扬声器(漫步者R1000T C )播放,系统采用16kH z 采样,每个麦克风之间的距离平均为30cm 。

表1为实验结果。

218 北京大学学报(自然科学版)第41卷 表1 仿真试验结果T able 1 Emulation test result实际坐标Πcm d Πcm测量坐标Πcm (误差Πcm )Π(相对误差Π%)(6310,910,-610)6319(6714,617,-816)413Π618(-310,11010,610)11012(-518,11613,810)712Π615(8410,7610,-3410)11812(8913,7913,-3811)714Π612(-6710,12810,-2310)14613(-6315,13312,-2215)614Π413(-6110,15610,-5010)17418(-6614,17518,-5217)2017Π1118(-17010,4410,-6310)18616(-13415,4913,-6111)3519Π1912 从实验结果可以看出声源距离小于115m 时,误差较小,误差范围在8cm 以下;距离大于115m 时,误差较大。

相关文档
最新文档