阵列信号识别声源相关总结_1002
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
阵列信号识别声源相关总结
1 阵列信号识别声源的方法归类
噪声源的识别方法可大致分为3类:传统的噪声源识别方法,如选择运行法、铅覆盖法及数值分析方法等,传统方法虽然陈旧、使用效率低,但目前仍有许多企业在应用。例如,为了测量汽车高速行驶时的车内噪声,需要将车门缝隙用铅皮封住;第二类,利用现代信号处理技术进行噪声源识别,如声强法、相干分析、偏相干分析适合与很多场合,能解决许多一般问题。如评价某些噪声源、某些频谱对场点(模拟人头耳朵处),这时采用相干分析就可以解决。第三类,利用现代图像识别技术进行振动噪声源识别,其分为两种,一种是近场声全息方法(NAH),一种是波束形成方法(Beamforming)。
相比于传统识别和现代信号处理方法,声阵列技术具有测试操作简单、识别效率高,以及可对声源进行量化分析并对声场进行预测等优点。
1.1 声全息方法
近场声全息技术经过很长时间的发展已经日趋成熟,广泛应用于近距离测量和对中低频噪声源的识别。
声全息方法,其基本原理是首先在采样面上记录包括声波振幅和相位信息的全息数据,然后利用声全息重建公式推算出重建面上的声场分布。该方法一方面可以获得车外声场分布的三维信息,另一方面可以进行运动车辆车外噪声源识别的研究,而且还具有在进行噪声测试时,抗外界干扰强的特点。按声场测量的原理可分为常规声全息、近场声全息和远场声全息三种。
常规声全息,全息数据是在被测物体的辐射或散射场的菲涅尔区和弗朗和费区(即全息接收面与物体的距离d远大于波长λ的条件下)采用光学照相或数字记录设备记录的,因为受到自身实用条件的限制,根据全息测量面重建的图像受制于声波的波长。它只能记录空间波数小于等于2π/λ的传播波成分,而且其全息测量面只能正对从声源出来的一个小立体角。因此,当声源辐射场具有方向性时,可能丢失声源的重要信息。并且通过声压记录得到的全息图,只能用于重建声压场,而不能得到振速、声强等物理量。
远场声全息NAH(Near-field Acoustical Holography),其特点是全息记录平面与全息重建平面的距离d远远大于声波的波长λ,即其全息数据是在被测声源产生声场的辐射或散射声场的菲涅尔区和弗朗和费区获得的。这种方法通过测量离声源很远的声压场来重建表面声压及振速场,由此可预报辐射源外任意一点的声压场、振速场、声强矢量场。由于进行全息数据记录的表面距离被测声源面较远,而全息记录的表面的面积是有限的。所以声源发出的声波有很大一部分不
能够被全息记录平面所检测到,不利于对声场声源的识别。和常规声全息一样,用远场声全息方法记录的全息数据,所获得的重建像的分辨率受限于声波波长 ,不适宜高分辨率的场合。传感器的布置受精度要求限制,且通过扫描方式获得全息数据,测量工作比较费时,效率较低。
近场声全息,是一种新的成像技术,是全息成像理论的推广和突破。近场声全息是在紧靠被测声源物理表面的测量面(d<<λ)记录全息数据,然后通过变换技术重建三维空间声压场、振速场、声强矢量场,并能预报远场指向性。由于是近场测量,所以除了记录传播波成分外,还能记录空间频率高于且随传播距离按指数规律衰减的倏逝波成分。由于它含有振动体细节信息,所以理论上可获得不受波长限制的高分辨率图像,测量覆盖了从声源出来的一个大的方位角,有指向性的声源能够被不失信息地检测出来。
比较上面三种声全息技术,NAH实用面最广,分辨率最高,可操作性最强,所以近些年来,国内外对NAH研究相当活跃。
1.2 波束形成方法(Beamforming)
波束形成是基于传声器阵列的一种信号处理方法,适合中高频和中长距离声源的识别。相对于近场声全息法必须要求规则阵列,波束形成方法可以用不规则阵列,比如随机阵列、圆环阵列等等。因此,波束形成算法对传声器的数量要求大大降低。对于波束形成算法,传声器阵列的布局对识别效果影响很大,选择合适的阵列形式可以遏制旁瓣、避免一定的混叠现象、提高识别精度、减少传声器的数量。
基于麦克风阵列的声源定位问题,利用一组按一定几何位置摆放的麦克风,定出声源的空间位置,按照定位原理大体上可分为三大类:(1) 基于最大输出功率的可控波束形成技术;(2) 基于到达时间差TDOA技术;(3) 基于高分辨率谱估计的定位技术。
1.2.1 基于最大输出功率的可控波束的声源定位算法
基于可控波束的定位算法,是早期的一种定位方法。该算法的基本思想是,采用波束形成技术,调节麦克风阵列的接收方向,在整个接收空间内扫描,能量最大的方位为声源的方位。采用不同的波束形成器可得到不同的算法。该方法在满足最大似然准则的前提下,以搜索的方式,使麦克风阵列所形成的波束对准信号源,从而获得最大输出功率。即,对麦克风所接收到的声源信号滤波,并加权求和来形成波束,进而通过搜索声源可能的位置来引导该波束,波束输出功率最大的点就是声源的位置。基于可控波束形成的定位算法,主要分为延迟累加波束
算法和自适应波束算法。前者运算量较小,信号失真小,但抗噪性能差,需要较多的阵元才有比较好的效果。后者因为加了自适应滤波,所以运算量比较大,而且输出信号有一定程度的失真,但需要的麦克风数目相对较少,在没有混响时有比较好的效果。由于该方法需要进行全局搜索,运算量极大,虽然可以采用一些迭代方法来减少运算量,但常常没有有效的全局峰值,收敛于几个局部最大值,且对初始搜索值极度敏感。并且,可控波束定位技术依赖于声源信号的频谱特性,其最优化准则绝大多数都基于背景噪声和声源信号的频谱特性的先验知识。因此,该类方法在实际系统中性能差异很大,再加之计算复杂度高,限制了该类算法的应用范围。
1.2.2 基于时延估计的声源定位算法
基于时延估计的声源定位算法,在导航、声纳等领域有广泛的应用。该算法首先估计各麦克风之间的相对时延,然后利用估计出的时延,确定声源的位置。
在现有的麦克阵列声源定位方法中,该方法运算量相对较小,实时性较好,硬件成本较低,因而倍受关注。但是,该算法适合于单个声源的定位系统,如果用于多声源定位,性能将会严重下降。基于时延估计的定位方法,主要由时延估计和声源定位两部分组成。时延估计算法的方法很多,广义互相关函数法(Gee,Generalized Cross-Correlation)运用最为广泛。广义互相关法通过求两信号之间的互功率谱,并在频域内给予一定的加权,来抑制噪声和反射的影响,再反变换到时域,得到两信号之间的互相关函数,其峰值位置,即两信号之间的相对时延。由于实际应用中,一般不能预先得到有关信号和噪声的先验知识,只能用其估计值来代替加权函数的理论值。因此,实际性能与理论性能有较大差距,尤其在混响较强的情况下。互功率谱相位加权C(SP)法,对两路输入信号进行了白化处理,从而锐化了相关函数的峰值,使算法本身具有一定抗混响和噪声的能力。但随着信噪比的降低和混响的增强,其性能急剧下降。
基于时延估计的声源定位的方法第二步,要根据第一步计算出的时延,估计声源的方位。从理论上看,估计二维/三维参数仅需要2-3个独立的时延估计值,每一个时延估计对应一个双曲线/面,其交点为声源位置。但是,由于估计误差和分辨率的影响,往往不能交于一点。多个时延估计值对应的双曲线/面在空间交于一个区域,采用最小二乘拟合可求出最优解。基于时延估计的声源定位算法在运算量上优于其它的定位算法,可以在实际系统中低成本实现。就目前的文献报道来看,基于时延估计的定位算法仅仅适合于单声源定位,而对多声源的定位效果就不好;在房间有较强混响和噪声的情况下,往往很难获得精确的时延,从而导致第二步的定位产生很大的误差。由于阵列结构和系统采样率等条件的限制,其定位精度远远不能与超分辨类算法相比,其应用受到限制。