麦克风阵列信号处理20130513
麦克风阵列声源处理 波束成形法matlab
麦克风阵列声源处理和波束成形法在声学信号处理领域中扮演着重要的角色。
通过利用麦克风阵列的多个麦克风来获取声音信号,并且根据波束成形法对声音进行处理,可以实现对声源的定位、分离和增强,从而在语音识别、语音通信、音频录制等应用中发挥重要作用。
本文将对麦克风阵列声源处理和波束成形法进行全面的评估和探讨,以及共享对这一主题的个人观点和理解。
一、麦克风阵列声源处理1.1 麦克风阵列的原理和结构麦克风阵列是由多个麦克风组成的一种声学传感器系统,可以在空间上对声音进行采集和处理。
它通常由均匀排列的麦克风单元组成,每个麦克风单元之间的位置和间距都是预先设计好的,以便实现对声源的准确定位和分离。
麦克风阵列可以使用不同的拓扑结构,如线性阵列、圆形阵列等,以适应不同的应用需求。
1.2 麦克风阵列的声源定位和分离通过对麦克风阵列采集到的声音信号进行处理和分析,可以实现对声源的定位和分离。
常用的方法包括波束成形、自适应信号处理、时域盲源分离等。
这些方法可以根据麦克风阵列采集到的信号特点,对声源进行空间定位和分离,从而实现对复杂环境下多个声源的有效处理。
1.3 麦克风阵列声音增强和降噪在实际应用中,麦克风阵列可以用于对声音进行增强和降噪。
通过对采集到的声音信号进行处理,可以有效地提取和增强感兴趣的声音信号,同时抑制噪音和干扰声音,从而提高语音识别和通信的质量。
二、波束成形法在声源处理中的应用2.1 波束成形方法的基本原理波束成形法是一种基于阵列信号处理的方法,通过对阵列接收到的信号进行加权和叠加,可以实现对特定方向上声源的增强,从而形成一个波束。
波束成形法可以通过调整加权系数,实现对不同方向上声源的响应,从而实现对多个声源的定位和分离。
2.2 波束成形方法的实现与优化波束成形方法在实际应用中需要考虑到不同方向上声源的信号特点和空间分布,以及阵列的结构和性能参数。
对于不同的应用场景,波束成形方法需要进行优化设计,包括阵列几何结构的选择、加权系数的计算和调整等,以实现对声源的有效处理和增强。
麦克风阵列信号处理的研究现状与应用
麦克风阵列信号处理的研究现状与应用罗金玉等:麦克风阵列信号处理的研究现状与应用麦克风阵列信号处理的研究现状与应用罗金玉,刘建平.,张一闻(1.武警工程学院研究生大队,陕西西安710086;2.武警工程学院通信工程系,陕西西安710086)摘要:在回顾麦克风阵列信号处理研究历程的基础上,对麦克风阵列信号处理的特点进行分析,总结了目前的研究热点问题及现有算法并对各算法的优缺点进行比较,重点阐述了使用最为广泛的声源定位算法,最后介绍几个有价值的应用领域,为进一步研究麦克风阵列信号处理奠定基础.关键词:麦克风阵列信号处理;声源定位;TD0A;应用,中图分类号:TN911-34文献标识码:A文章编号:1004—373X(2010)23—0080—05 StudyStatusandApplicationofMicrophoneArraySignalProcessingLUOJin-yu,LIUJian-ping,ZHANGYi—wen(1.Post—graduateManagingBrigade,EngineeringCollegeofArmedPoliceForce,Xi'an710086,Chi na;2.DepartmentofC0mmunlcationEngineering,EngineeringCollegeofArmedPoliceForce, Xi'art710086.China)Abstract:Theeharacteristicofthemicrophonearraysignalprocessingisanalyzedbasedonth ereviewfortheprogressofmicrophonearraysignalprocessing.Thehotissuebeingstudiedrecentlyandtheexistingalgo rithmscorrespondingtoitaresummerized.Themeritsanddemeritsofthealgorithmsarecompared.Thewidely-usedsoun dsourcelocalizationalgerithmiselaboratedemphatically.Somevaluableapplicationfieldsareintroduced.Keywords:microphonearraysignalprocessing;soundsourcelocalization;TDOA;applicati on0弓l言阵列信号处理的发展源于2O世纪40年代的自适应天线组合技术,它使用锁相环进行天线跟踪.1967年Widrow提出最小均方(LMS)自适应算法,标志着阵列信号处理取得了显着进展.1969年Capon提出恒定增益指向最小方差波束形成器,通过增加已知信息的利用程度提高了对目标的分辨能力.1979年Schmidt提出多重信号分类(MUSIC)方法,开创了子空间类阵列信号处理算法研究的先河,是阵列信号处理发展史上的一个重要里程碑.1986年Roy等人提出的基于旋转不变技术的信号参数估计方法(ESPRIT),相对MUSIC算法大大降低了计算量同时降低了算法对硬件的要求,为阵列信号处理的发展谱写了新的篇章.麦克风阵列信号处理是阵列信号处理的一个新兴分支,继承和发展了阵列信号处理理论算法,最早于8O年代初期用于大型会议室的会议系统uj,证明了其在语音信号处理方面的独特优势.近年来它已成为现代信号处理的的重要研究热点之一,很多国际着名的公司和研究机构,如IBM,BEIL等,都致力于麦克风阵列收稿日期:2010—06—18基金项目:国家自然科学基金资助项目(6094000)8O的研究和产品开发.麦克风阵列正成为越来越流行的高质量语音拾取工具,预计在不久的将来将取代传统的桌面或头戴式麦克风].并且由于其在语音信号处理上具有其他信号处理方法无法比拟的优势,被广泛应用于军事国防,智能空间,新型人机交互,机器人导航等众多领域,并且随着研究的不断深化,其研究应用的前景也不断扩大.1麦克风阵列信号处理的特点麦克风阵列信号处理是阵列信号处理的一个新兴分支.在很长的一段时间里,它的许多算法都是直接借用或简单修改成熟的传统阵列信号处理算法.这在研究初期大大推动了麦克风阵列信号处理的发展,但深入的研究表明,这些算法往往无法应用于实际系统或是算法性能不理想,这主要是因为麦克风阵列信号处理具备以下区别于传统阵列信号的特点E~-73:语音信号是宽带信号麦克风接收的语音信号没有经过调制,阵元间时延和相位差与信号源的频率密切相关.且不同类型的语音信号频谱差异很大,传统的窄带信号处理算法不再适用.语音信号是短时平稳信号麦克风接收信号为短时平稳的语音信号,分析处理必须建立在短时的基础《现代电子技术}2010年第23期总第334期通信与信息技术q 上,特别是当声源移动时,分析处理的难度变大.应用环境存在高混响在一些非手持式智能语音通信系统中,麦克风与说话人距离较远,特别是应用于室内环境时,麦克风接收到的信号除语音直达外,还包括大量经多次反射后形成的反射波,造成高混响,大大降低了语音信号的质量.而且造成混响的原因很多,混响模型很复杂,去混响难度大.应用环境的噪声大且复杂在麦克风阵列应用中,背景噪声很复杂且不同应用环境的噪声源也不同,如室内外的噪声源差异就很大.因此提高信号信噪比难度大.2麦克风阵列信号处理的研究内容2.1声源定位麦克风阵列声源定位技术利用空间分布的多路麦克风拾取声音信号,通过对麦克风阵列的各路输出信号进行分析和处理,得到一个或者多个声源的位置信息. 目前存在的声源定位算法主要包括基于波束形成的方法,基于高分辨率谱估计方法和基于到达时延差估计方法,它们分别将声源和阵列结构之间的关系转变为空间波束,空间谱函数或者多个到达时间差信息,然后通过估计这些信息进行声源定位.2.1.1基于波束形成的定位方法基于波束形成的定位算法是出现较早的定位方法,通过对麦克风阵列接收到的语音信号进行滤波,加权求和,然后直接控制麦克风指向使波束有最大输出功率的方向...NLbea(q)一『xi(+矗)]dt(1)Jo一式中:L表示波束输出;()表示各麦克风的接收信号.式(1)就是一个典型的波束形成估计方程,通过调整各麦克风接收信号的时延值r使输出信号达到最大,进而确定声源位置.因为解上述方程确定通常是一个非线性的优化问题,无法直接计算得到,通常采用Newton—Raphson算法或最陡下降算法来确定最大值,而在声源定位系统中,最大值对应的t不是惟一的,取决于信号的初始值,许多研究人员提出采用峰值搜索的方法来解决这种问题_8].但目标函数和峰值搜索的计算量往往很大,这也成为基于波束形成定位方法最大的弊端.2.1.2基于高分辨率谱估计的定位方法基于高分辨率谱估计的定位方法通过求解阵列接收信号的协方差矩阵获得空间谱函数,再由此信息进行声源定位,包括自回归模型,最小方差频谱估计, MUSIC,ESPRIT,子空问拟合等.其中的很多方法只能适用于远场模型,即要求麦克风阵列与声源的距离较远,远远大于麦克风阵元间距,并且麦克风是布置成线形.将其用于近场时,性能会下降很多.同时这种方法也要进行峰值搜索,但它的峰值通常都比较尖锐].2.1.3基于到达时延差(TDOA)的定位方法基于到达时延差的定位方法是利用时延估计算法求出信号到达阵列不同麦克风的相对时延,再利用这些时延信息和麦克风阵列的空间位置关系估计声源位置, 是麦克风阵列声源定位方法中应用最为广泛的方法. 基于到达时延差的定位方法已经成功地应用于雷达,声纳系统中,但是它们处理的信号是窄带信号,信噪比高. 应用于宽带,高混响的麦克风阵列定位系统时,需要添加一些特殊滤波器并进行预处理.基于到达时延差定位法的第一步是准确计算时延差.广义互相关函数(GeneralizedCrossCorrelation, GCC)是出现最早的方法,可以在时频两个领域进行计算时延差:z(£)一口5(£一)+72(£)(2)r+..(rlj)一lz(4-r0)()dt(3)式中:-z()是麦克风的接收信号;()是声源信号是衰减因子是延迟量;()是噪声;Y是两阵元的相关函数.相关函数.y最大值对应的r就是所要求的阵元i和阵元J之间的时延差.为减少计算量,还可以对信号进行FFT变换,在频域做相关然后搜索峰值:r+..n,,(£)一IX(厂)x(厂)edf(4)式中:R(£)是两阵元频域的相关函数;x(_厂)是麦克风接收信号z()的傅里叶变换.为提高抗噪,抗混响性能,提高时延估计精度,还可以通过加权函数来改进GCC,例如相位变换法(Phase Transform,PHAT),平滑变换法(SmoothedCoherence Transform,SCoT)等[.r+..R.(£)一}gt(f)x(-厂)x(厂)edf(5)式中:xF(f)为加权函数,PHAT中的(厂)为:厂最小均方(LeastMeanSquare,LMS)自适应滤波和自适应特征值分解(AdaptiveEigenvalueDecompo—sitionAlgorithm,AEDA)等时延估计算法都在声源定位中也到了广泛应用_1].但自适应方法依赖于实验8】罗金玉等:麦克风阵列信号处理的研究现状与应用的初始值并且计算时会产生较大的时延,无法适用于实时应用.文献[17-203等分别使用广义互相关函数,基于语音信号模型或产生语音的激励源特征,最小平方和极大似然估计的方法给出了TDOA的估计或实现声源定位.TDOA定位法的第二步是通过计算出的时延差来确定声源位置.理论上,三个麦克风组成的阵列已经能确定声源位置,而增加麦克风的数量,即增加TDOA数据可以减小估计误差.通过TDOA来定位声源的方法有很多:例如极大似然法,最小方差法等.极大似然法认定误差服从高斯分布,试图寻找误差最小点.而最小方差法是试图找到一个点使期望的TDOA值与实测的TDOA值的方差和最小.基于到达时延差TDOA的两步定位法,延时小,适用于实时的声源定位与目标追踪.但存在的问题是第一步从原始的麦克风接收数据中提取了时延差这一中间信息后,丢弃了其他的有用信息,只将TDOA用于第二步计算,造成信息损失.一种更好的方法是将原始数据中所有的中间信息保留,并都用于最后一步声源位置的确定.2.2噪声抑制噪声抑制是要去除观测信号中的噪声,获得高质量的期望信号.由于通信过程中噪声的产生无法避免,并且严重影响语音信号的质量,因此噪声抑制一直是通信学研究的热点问题,也出现了许多基于单一接收阵元的噪声抑制方法.然而这些方法存在的最大问题是在抑制噪声的同时,往往也影响了期望信号,付出信号可懂度下降的代价ll2.利用麦克风阵列独特的空间滤波特性,可以很好地解决这一问题,可以达到抑制噪声的同时不对期望信号产生任何干扰.目前,基于麦克风阵列实现噪声抑制的方法主要有自适应噪声对消和基于空间信息抑制噪声这两类方法, 其中,基于空间信息的方法又可分为两大类:基于波束形成原理的方法和基于盲信号分离的方法.而波束形成方法又可以分为固定波束形成方法和自适应的波束形成方法,其基本原理是利用阵列的空间信息对目标声源形成过滤波束避免来自其他方向的噪声干扰.自适应噪声对消,是实时地在信号静默期获取噪声的参考信号,来消弱噪声信号.2.3去混响混响是室内声源停止发声后,由于房间边界面或其中障碍物使声波多次反射或散射而产生声音延续的现象,是对语音质量影响最大的因素之一,会严重降低语音信息的可懂度,因此,去混响是语音通信研究的一个重点问题.82目前去混响的方法主要分为三类:基于信源声学模型去混响,通过同形转化分离混响和基于信道反转均衡去混响,其中,基于信道反转均衡去混响又分为直接反转,最小均方误差和多信道反转理论的方法引.文献[23]应用倒谱预滤波技术来抑制房间混响,文献[24]通过选取多个峰值进行线性交叉来削弱混响的影响.但由于这两种方法采用了理想房间模型,因此时延估计的抗混响性能较差.文献[25-J的自适应特征值分解算法直接从房间混响模型出发,通过自适应方法逼近房间冲激响应,进而估计时延,因而该方法在混响较强的条件下仍有良好的估计性能.但该方法需要估计矩阵运算,计算量大,难以在实际系统中应用. 2.4声源盲分离声源盲分离是要通过分析麦克风阵列的接收信号来区分同一时刻来自不同方向的信号,由于无法获知信道的具体性能参数和声源信号,称为盲分离.充分利用信源信号独立性的独立成分分析法(IndependentCorn—ponentAnalysis,ICA)是声源盲分离使用较广的方法.但是在高混响的环境下,基于ICA的算法性能下降很快,有待改进.2.5鸡尾酒会效应众所周知,即使在嘈杂的背景环境下,人也能集中精神去听其中的某一种声音,这种有趣的心理声学现象被称为鸡尾酒效应.大量研究实验表明人的这种能力得益于人有两只耳朵.人的大脑只需要根据两只耳朵听到的声音强度就能有效地跟踪声源,这在麦克风阵列的应用上具有极大的指导意义,由此引发了一波研究鸡尾酒效应的热潮.3麦克风阵列信号处理的应用麦克风阵列信号处理具有十分广阔的应用前景,在军事国防,智能化,远程控制,人机交互,电脑游戏,视频会议,语音监测等许多领域都有重要的科研价值和潜在的实用价值,已经引起了许多国家学术界,工业界和军界的高度重视.下面简要介绍麦克风阵列信号处理的一些应用.3.1国防领域应用麦克风阵列信号处理因其出色的语音信号处理能力,被广泛应用于军事国防.国外在智能雷弹系统和战场侦查系统研究中,广泛使用基于麦克风阵列的被动声探测,近几年还将麦克风阵列声源定位技术应用于飞机探测,直升机报警,炮位侦查,单兵声测系统,枪声定位等.AAI公司的PDCue系统将麦克风安装在车辆的四角,可以提供低轮廓,360.的态势感知能力.在任何环境下,PDCue系统都可以根据单发,多发和点射枪声《现代电子技术)2olo年第23期总第334期通信与信息迅速定位并跟踪枪声来源.国内近几年也在麦克风阵列信号处理方面进行了大量研究,受到国防科技重点实验室基金和国家自然科学基金的支持,并已取得了一定的成果.其中炮用立靶声定位系统列入国家军用标准,弹头落点定位系统和敞开型胸环靶系统也已通过鉴定并列入国家军用标准. 3.2智能化领域应用麦克风阵列信号处理可以自动高效地从接收的语音信号中提取有用信息,适用于智能化领域.2003年意大利里雅斯特大学和帕多瓦大学联合研制了智能声视联合多代理监视跟踪系统,对脚步声之类的声源进行轨迹跟踪,能实现对博物馆等公共场所的人流进行记录,或监测在某作品前人们停留的时间长短l2引. 2007年加拿大魁北克的珊不勒凯大学机电学院开发研制了避障机器人.机器人具有鲁棒的定位性能和通过使用波束成形和粒子滤波能同时跟踪几个声源.4结语麦克风阵列信号处理是数字信号处理的一个新领域,具备许多传统阵列信号处理无法比拟的优势,是目前国内外的研究热点.很多国际着名的公司和研究机构,如IBM,BELL等,正致力于麦克风阵列的研究和产品开发.相信随着研究的不断深入,麦克风阵列信号处理也必定会具备越来越广阔的应用前景.[I]参考文献FLANAGANJ,J0HNSTONJ,ZAHNR,eta1. Computersteeredmicrophonearraysforsoundtransduc—tioninlargerooms[J].Acoust.Soc.Amer.,1985,78(5):1508—1518.[23FLANAGANJL,SURENDRANA,JANE.Spatially selectivesoundcaptureforspeechandaudioprocessing[J]. SpeechCommunication,1993,13(1/2):207—222.[3]GRENIERY.Amicrophonearrayforcarenviroment[c]//IEEEProceedingsofICASSP一92.SanFrancisco, CA,USA:ICASSP,1992,1:305—308.[4]KELLERMANW.Aself-steeringdigitalmicrophonearray[c]//IEEEProceedingsofICASSP一91.Toronto,Ont, Canada:ICASSP,1991,5:3581—3584.[5]HERBORDTW,KELLERMANNWIAdaptivebeamforming foraudiosignalacquisition[c]//AdaptiveSignalProcessing: [6]ApplicationstoReal—worldProblems.Berlin,Germany: Springer—Verlag,2003:321-325. COMPERNOLLEDV.Switchingadaptivefiltersforen—hancingnoisyandreverberantspeechfrommicrophonearray recordings[c]//Proc.IEEEICASSP,1990.Albuquerque,NM:ICASSP,1990:833—836.[7]DIBIASEJ.Ahigh—accuracy,low-latencytechniquefor talkerlocalizationinreverberantenvironmentsrD].Provi dence,USA:BrownUniversity,2000.[83DIBIASEJ,sILVERMANH,BRANDsTEINM.Robust localizationinreverberantrooms[M]//BRANDsTEINMs,WARDDB(eds.).MicrophoneArrays:Signal ProcessingTechniquesandApplications[s.I.]:Springer, 2001:208-360.[9]KROLIKJ.Focusedwide—bandarrayprocessingforspatial spectralestimation[M].Beijing:PrenticeHall,1991.El0]KNAPPcH,cARTERGc.Thegeneralizedcorrelation methodforestimationoftimedelay[J].IEEETrans.on Acoust.,Speech,SignalProcessing,1976,ASSP一24:32O一327.[11]RuIY,FLORENCIOD.Timedelayestimationinthe presenceofcorrelatednoiseandreverberationEc]//Pro—ceedingsofIEEEInternationalConferenceonAeoustics, Speech,andSignalProcessing(ICASSP04).Redmond,WA,USA:MicrosoftRes.,2004:133—136.[12]RuIY,FLORENCIODinei.NewdirectapproaChesto robustsoundsource1ocalizationrC]//Proc.ofIEEEICME2003.Baltimore,MD:ICME,2003:6-9.r13]CARTERGC,NUTTALLAH,CABLEPG.The smoothedcoherencetransform[J].IEEESignal ProcessingLetters,1973,61:1497—1498.r14]HUANGY.Real—timeacousticsource1ocalizationwith passivemicrophonearrays[D].Atlanta,GA:Georgia InstituteofTechnology,2001.[15]HuANGYi—teng,BENEsTYJ,ELK0Gw.Aneffient linear—correctionleast—sq0aresapproachtosource1ocaliza一{ion[c]//2001IEEEWorkshopontheApplicationsofSigna1ProcessingtoAudioandAcoustics.NY,USA: LucentTechno1.,2001:67—7O.[16]HuANGY,BENESTYJ,ELKOGW.Adaptiveeigen—valuedecompositionalgorithmforreal—timeacousticsource localizationsystem[C]//1999IEEEInternational ConferenceonAcoustics,SpeechandSignalProcessing. Phoenix,AZ,USA:ICASSP,1999,2:937—940.rl7]BECHLERDirk,KROSCHELKristian.Reliability criteriaevaluationforTD0Aestimatesinavarietyofre—alenvironments[C]//20051EEEInt.Conf.onAcous—tics,SpeechandSignalProcessing(ICASSP).Philadel—phia,USA:ICASSP,2005:985—988.[18]YEGNANARAYANAB,PRASANNASRM,RAOKS.Speechenhancementusingexcitationsourceinforma—tion[C]//Proc.ofIEEEInt.Conf.onAcoustics, SpeechandSignalProcessing(ICASSP).Orlando,FL: ICASSP,2002:541-544.[19]cHENJc,YA0K,HUDSONRE.Sourcelocalization83等:麦夏阵歹IJ{言号处理的研究现状与应用andbeamformingⅢJ].IEEESignalProcessingMagazine, 2002,19(2):3O一39.[2o]CHENJC,HUDSONRE,YAOK.Maximum—likelihood [21] sourcelocalizationandunknownsensorlocationestimation forwidebandsignalsinthenear—field[J].IEEETrans.on SignalProcessing,2002,50(8):1843—1854.CHENJ,BENESTYJ,HUANGY,eta1.Newinsights intothenoisereductionWienerfilter[J].IEEETrans.on Audio,Speech,LanguageProcessing,2006,14:]2]8一】234.[22]HUANGY,BENESTYJ,CHENJ.Dereverberation [M]//BENESTYJ,SONDHIMM,HUANGYi—teng. HandbookofSpeechProcessing.Berlin,Germany: Springer,2007:145-282.[23]CHAMPAGNEB,BEDARDS,STEPHENNEA.Per formanceoftimedelayestimationinthepresenceofroom reverberation[J].IEEETransactiononSpeechandAudio Processing,1996,4(2):148—152.[24]PARISIR,cIRILLOA,PANELLAM,eta1.Source localizationinreverberantenvironmentsbyconsistentpeak selection[c]//IEEEInternationalConferenceonAcous—tics,SpeechandSignalProcessing.Hawaii:IEEE,2007,1:137-14O.[25]BENESTYJ.Adaptiveeigenvaluedecompositionalgo—rithmforpassiveacousticsourcelocalization[J].JournalofAcousticSocietyofAmeriea,2000,107(1):384—391.[26]MUMOLOE,NOLICHM,MENEGATTIE,eta1.A multi——agentsystemforaudio——videotrackingofawalkingpersonin8structuredenvironment[c]//Proceedingsof WorkshoponMulti——agentRoboticSystemsTrendsandIn—- dustrialApplications.Padova,Italy:MRSTIA,2003:323—326.L27]V ALINjM,MICHAUDF,ROUATJ.Robustlocaliza—tionandtrackingofsimultaneousmovingsoundsources usingbeamformingandparticlefilteringJ-j].Roboticsand AutonomousSystemsJourna1,2007,55(3):216-228.作者简介罗金玉女,1986年出生,湖南人,硕士研究生.主要研究方向包括现场声音信号感知,数字信号处理等.刘建平男,1967年出生,陕西人,教授,博士.一直从事军事通信学,语音信号处理和医学信号处理等领域的研究.张一闻男,1978年出生,内蒙古人,讲师,博士.主要研究方向为阵列信号处理,自适应信道跟踪及多速率通信.(上接第79页)参考文献[1]范红,冯登国,吴亚非.信息安全风险评估方法与应用[M].北京:清华大学出版社,2006.[2]傅鹂,刘嘉伟,周贤林.基于业务的信息资产识别方法[J].通信技术,2007,40(1o):238—240.[3]范建华,薛岩龙.基于层面划分法的信息资产识别方法[J].标准科学,2009(9):64—68.[4],沙超,陈云芳.一种基于TCP/IP协议栈的操作系统识别技术[J].计算机技术与发展,2006,16(10):125127.[5]QUINLANJR.Inductionofdecisiontree[J].MachineLearning,1986(1):81—106.r6]BREIMANL,FRIEDMANJ.H,OLSHENR.A.Classifi—cationandregressiontrees[M].Belmont,CA:WadsworthInternationalGroup,1984.[7]MEHTAM,AGRAWALR,RISSANENJ.SLIQ:Afast andscalableclassifierfordatamining[M].US:IBMAlmadenResearchCenter,1996.[8]QUINLANROSSJ.C4.5:Programsformachinelearning[M].SanMate,CA:MorganKaufmannPublishers,1993.[9]国君,段立娟,王实,等.数据挖掘原理与算法[M],北京:清华大学出版社,2005.[1o]杨学兵,张俊.决策树算法及其核心技术EJ].计算机技术与发展,2007,17(1):43—45.[11]黄爱辉.决策树C4.5算法的改进及应用[J].科学技术与工程,2009,9(1):34—36.[12]裴昌幸.现代通信系统与网络测量[M].北京:人民邮电出版社,2008.作者简介:杨艳女,1986年出生,陕西西安人,硕士研究生.主要研究方向为信息安全.刘建华男,1963年出生,河北易县人,高级工程师.主要研究方向为信息安全.田东平男,1955年出生,安徽泗县人,博士后,教授.主要研完方向为量子通信.84《王贝代电子技市》(半月刊)欢避刊登广告029--85393376。
麦克风阵列信号处理方法
APAH 2I
其特点是 R RH 即为Hermitian矩阵,特征值为正。
1 2 ,, M 0
10
1.1 阵列信号模型
对照两个R表达式可以认为,若将R的M个特征值按大小依次 排列,则前P个与信号有关,且其数值大于后M-P个 ,即
21
2、移动通信中的智能天线
智能天线是一种天线阵列,它可以动态地调节 各阵元上信号的加权幅度和相位,自适应地控 制波束幅度、指向和零点位置,使零点指向干 扰方向,波束指向有用用户。
普通天线阵列: 方向图固定不变 智能天线阵列: 方向图动态调节
22
2、移动通信中的智能天线
智能天线技术的发展过程
自适应时间延迟估计的原理、结构和算 法是建立在自适应信号处理的理论和技术 基础之上的。基于最小均方的自适应时间 延迟估计方法是一种最基本的自适应时延 估计方法
特性
方法简单,计算量小,对噪声、混响及 数据观测长度敏感
对信号和噪声进行白化处理,增强信号 中信噪比较高的频率成分,而抑制噪声 功率,从而获得更好的时延估计精度, 但受环境背景影响较大
的平均功率为
P(W )
1 N
N n1
2
y(n)
1 N
M m1
w*m xm (n) 2
1 N
W
H a(d ) 2
N n1
d (n) 2
1 N
J j1
N n1
ij (n)
2
W
H a(
j)
2
1 N
W
N
2 n(n) 2
麦克风阵列信号处理算法研究
麦克风阵列信号处理算法研究麦克风阵列是指由多个麦克风组成的阵列,通过对阵列中麦克风信号的处理,可以实现信号的方向性增强、空间滤波和噪声抑制等效果。
因此,在语音识别、语音增强、远场语音采集等领域都有广泛的应用。
麦克风阵列可以形成的微弱信号从而提高语音识别的准确性。
与单一麦克风相比,麦克风阵列能够对方向性声源进行有效的捕捉,并且可以对噪声进行滤波抑制,对听觉信号进行增强处理。
然而,麦克风阵列系统的性能受多种因素影响,包括麦克风位置、信号处理算法等。
在麦克风阵列信号处理算法中,主要包括波束形成和方向估计两个方面。
波束形成是指对接收到的麦克风信号进行加权和相位校准,从而形成一个指向目标信号的波束;方向估计是指对目标信号的方向进行估计。
波束形成算法是麦克风阵列信号处理算法中的核心内容。
常见的波束形成算法包括广义旁瓣消除(Generalized Sidelobe Canceller,GSC)、最小均方(Minimum Mean Square Error,MMSE)和最大信噪比(Maximum Signal-to-Noise Ratio,MSNR)等。
广义旁瓣消除算法是一种基于自适应滤波的波束形成算法,其主要思想是通过在线更新权重系数,抑制麦克风阵列接收到的信号中的旁瓣干扰。
最小均方算法和最大信噪比算法则是一种基于统计建模的波束形成算法,通过对麦克风阵列中接收到的信号进行统计建模,进而实现信号的增强和噪声的滤波。
除了波束形成算法外,方向估计算法也是麦克风阵列信号处理算法中的重要内容。
常见的方向估计算法包括时延和相位差(Time Delay and Phase Difference,TDPD)算法、最大似然(Maximum Likelihood,ML)算法等。
时延和相位差算法是一种基于时间差信号处理的方向估计算法,可以通过对阵列中麦克风的时间差和相位差进行计算,从而估计目标信号的方向。
最大似然算法则是一种基于概率统计的方向估计算法,通过对阵列中接收到的信号进行统计建模,进而实现目标信号方向的估计。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
N
2
n(n)
n1
N
2
N
P(W ) E y (n)
2
EW
H
X (n) X H (n)W W H RW
14
1.2 波束形成
波束形成器最佳权向量
权向量约束条件: W a(d ) 1
HHale Waihona Puke W H a( j ) 0
最佳权向量是在约束条件下,求满足
min E y(n)
信号载频为
k为波数向量,即为波数(弧度/长度),c为光速, λ为电磁波波
e
j t
,以平面波形式沿k方向传播
长,
则距离基准点r处的阵元接收信号为
r sr (t ) s(t ) exp j t r k c
k 为电波传播方向的单位向量, k
1 信号相对于基准点的延迟时间 r c
4
1.1 阵列信号模型
各阵元上接收信号分别为
1 si (t ) s(t ri ) exp j t ri k c
阵列信号的向量
T
S (t ) s1 (t ), s2 (t ),, sM (t ) s(t ) e
方向向量为
a( ) 1, e jr2k ,, e jrM k
Z
第j个声源
第j个声源
Sj
rj θj
第i个麦克风
S j Pi
Sj
S j Pi S j
Y
φj
X
φ
O
φ
Pi
) vi (t ) fi (t ) ij f1 j (t ij
j 1
D
) vi (t ) fi (t ) f1 j (t ij
j 1
D
26
2.1 麦克风阵列模型
麦克风阵列信号模型
27
2.1 麦克风阵列模型
根据声源与麦克风阵列距离的远近,可以将声场模型划分为:近场模型 和远场模型。近场时声波是球面波前,要考虑各阵元的幅度差异,而远 场时 ,可以近似认为声波为平面波前。因此第i个麦克风接收到的信号就 可以用下面两个式子来表示。
W w1 ,, wM
——权矢量 ——阵列的方向向量,或方向系 数、波束图
7
g ( ) W a( )
H
1.1 阵列信号模型
第i个阵元的接收信号
xi (t ) ( ) zi ( ) ( )e j 2 sin z(t )
第i个阵元的接收信号
j 21 sin x1 (t ) e X(t ) ( ) z (t ) a( ) ( ) z (t ) j 2 M sin x ( t ) e M
PCAP ( ) 1 a H ( ) R 1a( )
15
1.3高分辨DOA估计
20 世纪70 年代末开始,DOA 估计算法得到了迅速的发展, 尤以特征子空间类算法为突出,如MUSIC 和ESPRIT,已成为 DOA 估计的标志性算法。 MUSIC算法
基本思想是将任意阵列输出数据的协方差矩阵进行特征分解,从而
m1
12
1.2 波束形成
设空间远场的一个期望信号d(t),其波达方向为
,
d J个不需要的信号(干扰信号),其波达方向 还有 j 为 ,设每个阵元上的加性白噪声,且都具有同样 的方差,此时第k个阵元上的接收信号为
xk (t ) a( d )d (t ) a( j )i j (t ) nk (t )
30
2.2声源定位理论基础
基于TDOA的声源定位算法
名称 方法描述 直接计算两个麦克风接收信号的互相关 函数,互相关函数取最大值的时刻即为两 麦克风之间的时间延迟 对接收信号先分别进行预滤波即加权处 理,然后再送入相关器估算互相关 特性 方法简单,计算量小,对噪声、混响及 数据观测长度敏感 对信号和噪声进行白化处理,增强信号 中信噪比较高的频率成分,而抑制噪声 功率,从而获得更好的时延估计精度, 但受环境背景影响较大 通过对功率谱的归一化,去除了信号的 幅度信息,只保留了信号的相位特性, 对于噪声和混响都有较好的抑制作用, 但容易产生相位卷绕问题 不依赖于输入信号和噪声的先验知识, 可用于统计特性变化的时变环境,但计 算量较大,不适合实际实现 基本相关法
得到与信号分量相对应的信号子空间和与信号分量相正交的噪声子 空间,然后利用这两个子空间的正交性进行谱峰搜索来估计信号的 入射方向。
16
1.3 DOA估计
MUSIC算法
17
18
19
1.3 DOA估计
20
1.3 DOA估计
21
2、移动通信中的智能天线
智能天线是一种天线阵列,它可以动态地调节 各阵元上信号的加权幅度和相位,自适应地控 制波束幅度、指向和零点位置,使零点指向干 扰方向,波束指向有用用户。
W
2
min EW
W
H
RW
Bartlett波束形成器
WBF a(d ) a H (d )a(d )
a H ( ) Ra( ) PBF ( ) H a ( )a( )
Capon波束形成器
R 1a( ) WCAP ( ) H a ( ) R 1a( )
采集到的信号进行预滤波,并加权求和来形成波束,进 而通过搜索声源可能的位置来引导该波束,波束输出功 率最大的方位即为声源的方位。 高分辨率谱估计法主要有AR模型法、最大熵法、MUSIC法、 ESPRIT等方法。该类方法一般定位精度都比较高,但在 声源定位中的效果并不理想 基于到达时延(TDOA)估计的定位法,原理是首先估计出 声源到达各麦克风对的相对时延,然后利用时延值计算 出声源到达各麦克风的距离差,最后用几何或搜索算法 确定声源位置。
9
1.1 阵列信号模型
阵列向量的二阶统计量为阵列协方差矩阵
R E{X(k )X (k )}
H
s(k)与n(k)统计独立,则有
R AE{s(k )s (k )}A E{n(k )n (k )}
H H H
APA I
H 2
其特点是
R RH
即为Hermitian矩阵,特征值为正。
2
1
sin 1
e e
j
2
sin 1
j sin 1 e 2 j sin 1 e 1
[a(1 ), a(2 ),, a( p )]
s(k ) [s1 (k ),, s p (k )]T
n(k ) [n1 (k ),, nM (k )]T
2
1.1 阵列信号模型
阵列的基本概念
天线阵列中单位元素称为阵元,阵元都是有源的
阵元可以是无方向性的,也可以是有方向性的 阵元可以有多种排列方式,如线阵、圆阵。
阵列信号处理的两大研究内容:
参数估计:以DOA估计为代表 空间滤波:波束形成。
3
1.1 阵列信号模型
平面波与阵列
波束形成网络
作用是按照控制单元的要求,对每个阵元的信号加以不同的权值,
按此权值形成天线阵列的方向性图。
自适应处理器
作用是按照自适应的算法计算出波束形成网络的加权值
24
2、移动通信中的智能天线
25
3、基于麦克风阵列的声源定位
2.1 麦克风阵列模型
2.2 声源定位理论基础 2.3 声源定位实验研究
j k ( M 1) d sin T
2 T
j ( M 1) d sin j d sin 1, e , , e
1 j 2 d sin 1 e A 2 j d ( M 1) sin 1 e
j 1
J
d (t ) x1 (t ) i (t ) a( ), a( ), , a( ) 1 n(t ) d 1 J xM (t ) i ( t ) J
x(t ) As(t ) n(t ) a( d ) a( j )i j (t ) n(t )
jr 1k
,e
jr2 k
,, e
jrM k T
T
p个信号时方向矩阵
A a(1 ), a(2 ),, a( p )
5
1.1 阵列信号模型
等距线阵——M个阵元等距排成直线,阵元间
距为d
aULA ( ) 1, e
j k d sin
2
, , e
a( ) ——天线增益,全向天线时为常数
等距线阵M个阵元,P个信源。第m个阵元上第k次采样值
2 j ( m 1) sin i P xm (k ) si (k )e n( k ) i 1
写成向量形式
8
A [a(1 ), a(2 ),, a( p )]T
e e
j j
2
1
d sin p
2
d sin p
6
1.1 阵列信号模型
等距线阵的阵列响应与方向图 单个信源
2s ( t )
y(t ) s(t )Wm e
m1
M
* j
d sin
y(n) S (n)W H a( ) S (n) g ( )
普通天线阵列:
智能天线阵列:
方向图固定不变