盲信号总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
盲分离研究背景与数学模型
简介:盲信号分离是当前信号处理领域最热门的技术之一。
由于其重要的理论价值和广泛的应用前景 ,盲信号分离在近 20 年引起了广泛的重视和研究。
盲信号分离起源于鸡尾酒会议问题 ,即在很多人同时说话的情况下(通常包含噪声),怎样从多个声音采集设备(如麦克风)采集到的声音信号中分离出所需要的各个说话者的声音?在这个过程中,各个信号源未知,信号混叠参数即传输信道的先验知识也未知,因此我们称这个过程是“盲”的。
目前,以盲信号分离为核心的盲信号处理技术已经成为重要的研究课题,并在许多领域,特别是在语音信号分离与识别、生物信号(如脑电图、心电图)处理、雷达、声纳、遥感、通信系统、噪声控制等领域,吸引了大量的研究和重视。
盲信号分离:是指在不知道源信号和传输信道特性的情况下,从一个传感器阵列的输出信号(也叫观测信号,混叠信号)中分离或估计出源信号的波形。
目标是如何最大化分离信号的独立性。
观测数据:是一组传感器的输出,其中每个传感器接收到的是源信号的不同混合。
源信号混合方式:有线性和非线性两种方式。
当混叠模型为非线性时,一般很难从混叠数据中恢复源信号,除非对信号和混叠模型有进一步的先验知识。
线性模型有三种:(1)线性瞬时混叠(2)延迟无回声混叠(3)回声混叠
1,线性瞬时混叠模型:目前主要采用的工具是稀疏成分分析。
2,延迟无回声混叠模型:即每个传感器仅接收到每个源一次。
由于传输距离的远近及传输介质的影响,源信号到达每个传感器的时刻可能并不是同时的。
3,回声混叠:各个传感器不仅直接接收到每个源信号,而且还接收到每个源信号的回声信号。
根据混叠方式对盲信号分离进行分类:如果根据传感器个数M 和源信号个数N 来分类,则
把M > N称为超定模型,
M = N为适定模型,
M < N称为欠定模型。
欠定模型比适定模型和超定模型更难求解。
对适定或者超定模型,只要能够估计出混叠矩阵,就能恢复源信号。
●按照未知信号源的混合形式,可以将盲处理分为线性混合和非线性混合两种类型,其中线性混合包括瞬
时混合和卷积混合。
●按照传输信道中是否包含噪声,可以分为含噪声盲处理和无噪声盲处理两种类型。
其中,
噪声为有色噪声或白色高斯噪声等。
●此外,考虑混合通道为单路和多路,可以分为单通道和多通道两种类型。
BSP 解决的问题包括两个方面:
盲辨识,得到未知混合信道的混合矩阵。
盲源分离,得到未知多路源信号的波形估计。
其中,独立分量分析(ICA)是代表分离算法各个分量互不相关的一种特例。
当分量不是并行得到而是逐个提取时称为盲提取。
BSP 目前主要包含了以下几个研究方向:盲信号分离和盲信号抽取、盲辨识和盲均衡、盲多用户检测等等
盲分离一般步骤:建立数学模型设定合适的分离准则推导一种学习算法来求解分离矩阵W
根据分离矩阵W来估计源信号
步骤一:为盲分离设计一个合适的数学模型;
步骤二:设定一种分离准则,将分离准则用目标函数表示出来。
根据输出向量间统计独立性的度量推导一个以分离矩阵w为变元的目标函数L(w),如果某个w’才能使目标函数L(w)达到极大或极小值,此时的各项参数为最优参数,此时的w’访即为所需的分离矩阵。
依据设定的分离准则,即目标函数L(w)的不同将推导出不同的学习算法。
步骤三:用一种有效地优化算法来求解w’。
算法=目标函数+优化算法,可以采用任意的经典的最优化算法来优化目标函数。
目标函数的选取决定了算法的统计特性,如一致性和稳健性等,最优化算法的选择决定了算法的特性,如收敛速度、存储器要求等。
步骤四:根据步骤三所求取的分离矩阵W来进行源信号的估计,即混和信号的盲分离。
将所接收到的观测信号经过预处理后,通过分离矩阵W,所得到的结果就是对源信号的有效估计,也就是达到了分离效果。
数据的预处理:一般观测信号在进行算法的分离前都要进行数据的预处理。
原因:盲分离的一般性假设要求,信号的独立性。
一般接收到的观测信号都具有一定的相关性,因此在进行信号的盲分离前,通常都要对观测数据进行预处理,如白化预处理。
目的:预处理后的信号去除了它们的相关性。
这样不仅简化了后续的分离提取过程,并且通常情况下对数据进行过预处理后,算法的收敛性较好,能起到优化分离效果的作用。
一,在适定的线性瞬时模型下的盲信号分离方法-------独立成分分析ICA
条件:假定源信号是相互独立的,混叠方式为线性瞬时混叠,混叠矩阵列满秩。
原理:通过最大化输出信号之间的统计独立性来估计源信号。
只要能估计出混叠矩阵,就能恢复出源信号。
方法:目标函数和优化算法。
过程:第一步是建立目标函数来表征分离结果的独立程度;
第二步是目标函数确定后,可通过各种不同的优化算法进行优化,进而确定分离矩阵W。
缺点:对实际采样的信号,往往很难精确验证其是否满足独立性条件。
ICA方法又分为:(1)最大化非高斯性(2)最小化互信息(3)最大似然估计(4)二阶统计量
1,最大化非高斯性方法
原理:非高斯性度量有两个:峭度和负熵。
峭度:用于度量非高斯性,通过峭度的绝对值最大化可以提取独立的源信号。
负熵:在具有相同方差的随机变量中,高斯随机变量具有最大的熵。
通过最大化负熵可以提取独立的源。
代表方法:快速独立元分析算法FastICA。
;FastICA算法是一种快速而数值稳定的方法,采用拟牛顿算法实现寻优,具有超线性收敛速度,通常收敛速度较梯度下降寻优算法快得多。
优点:收敛速度非常快,可以同时估计次高斯信号和超高斯信号。
缺点:峭度由于使用了高阶统计量,对噪声比较敏感;而负熵则需要估计源信号的概率密度函数。
2,最小化互信息
原理:当随机变量的互信息=0时说明这几个随机变量是统计独立。
通过最小化互信息熵来估计统计独立的源信号。
3,最大似然估计
原理:利用线性变换前后的概率密度函数之间的关系,立即可得到最大似然估计方法的目标函数。
4 ,二阶统计量
条件:信号具有不同的时序结构。
原理:基于信号的时序结构的特性来分离源信号。
方法:利用广义特征分解实现盲辨识,为了提高算法鲁棒性,广义特征分解通常用联合对角化算法代替。
代表方法:SOBI,时间预测度方法。
优点:不需要估计概率密度函数,不需要源信号的统计独立性,不需要计算高阶统计量,因此计算方便,效率高。
优化算法:普通梯度下降算法,相对梯度,自然梯度。
1,普通梯度下降算法
缺点:不能得到理想的收敛速度。
因为普通梯度都是把矩阵拉成一维向量来求导。
并不是目标函数在该变量空间下降最快的方向。
2,相对梯度:是在黎曼空间下降最快的方向。
缺点:只能保证目标函数是局部收敛的,不能确定输出的信号是不是源信号。
二,在欠定的线性瞬时模型下的盲信号分离方法-------- 稀疏成分分析SCA
条件:如果观测器个数少于源信号个数,假设是源信号具有很好的稀疏性。
原理:虽然总体上源信号个数多于观测器个数,但是在任意时刻同时活动的源的个数不超过观测器个数,从而原问题仍然是适定的。
分析方法:一类是同时估计混叠矩阵与源信号;
一类是采用两步法:首先估计混叠矩阵,再重构具有稀疏特性的源信号。
优点:不依赖于信号的统计特性,而且能够处理欠定混叠模型。
稀疏变换:为了使得信号具有更好的稀疏特性,往往需要在信号的具有显著稀疏特性的变换域处理。
这些变换统称为稀疏变换,常见的有小波变换、短时傅里叶变换等。
1,估计混叠矩阵的方法:基于k-均值聚类的直线聚类算法、自适应估计源个数的算法、LOST算法、在URCP 算法基础上提出了未知源个数的统一分离算法。
基于k-均值聚类的直线聚类算法的缺点:要预先指定聚类个数(即源信号个数),不太现实。
URCP算法的基本思想是:首先对聚类个数作过估计,聚类之后通过适定的合并规则来缩小聚类个数。
虽然不需要预先知道源信号个数,但是需要知道源信号个数的上界。
LOST算法:粗略的估计源信号的个数。
2,估计源信号的方法:最小化L0算法,最小化L1范数的算法,线性规划方法、内点牛顿法。
过程:根据源信号的稀疏性,从混叠矩阵中选择至多M 列(M 为观测器个数),然后根据观测信号和选出的列重构源信号。
三,卷积模型下的卷积盲源分离
原理:由于卷积模型在时域实施分离时涉及太多的参数,因此采用频域方法。
考虑到傅里叶变换的特性,时域的卷积模型转换到频域就成了线性瞬时模型,也就是说卷积模型可以转化成频域的线性瞬时模型,因此可以通过发展频域的独立成分分析ICA来求解卷积模型。
方法:时频掩码方法。
该方法利用语音信号在短时傅里叶变换域的稀疏性来估计混叠参数和重构源信号。
缺点:由于语音信号的短时平稳性,这些方法需要对观测信号做加窗傅里叶变换,然后在每个频率箱运行复数ICA算法。
因为ICA 算法固有的顺序不确定性导致了难以解决的排序问题。
因此通常存在所谓的排序问题。
盲分离的几何算法研究
条件:线性瞬时混叠模型在适定或超定的情况下。
原理:利用各个源信号的某种“独有特征”——比如非高斯性、时序结构等——把它从其它信号中分离开来。
分离过程:第一步:白化观测信号(去二阶相关性),目的是去相关性获得主成分;
第二步:旋转观测信号,寻找一正交阵,任意正交阵U 可以表示成一系列旋转矩阵的乘积。
关键:确定一系列的旋转,即确定第(2)步中的正交阵U。
优点:几何算法能够比较直观的显示盲分离混合过程和分离过程的几何含义;并且为盲分离提供可视化的分离过程和解释,从而丰富了盲分离的内涵。
简单直观,不需要估计概率密度函数,因此比较方便,而且收敛速度快。
缺点:一方面大多只能工作在低维的情况(观测信号个数小于或等于3),另一方面算法的效率也有待提高。
新的几何算法——最小值域方法MR
几何解释:当一个信号与其它信号独立时,它的值域最小,亦即散点图在它对应的坐标轴上的投影长度最小。
优点:该算法有比较严格的理论基础;另一方面,该算法不需要估计源信号概率密度函数,不需要使用任何阶的统计量,从而比较简单。
缺点:即使目标函数局部收敛,也能保证分离的正确性。
然而,作者给出的算法却不能保证局部收敛,从而分离的正确性得不到保证。
算法的适用范围并没有作深入分析。
算法效率不够高、收敛性存在问题。
改进的最小值域算法iMRA
与原算法相比,本算法的优越性:表现在两个方面:第一,优化结果更可靠;其次,由于每次本算法直接找到子问题的全局极小值,因此优化效率更高。
批处理算法
原理:当各信号独立时,它们在各坐标轴的投影之和达到最小值。
记白化后的观测信号在两个坐标轴上的投影之和为l。
当该正方形的各边与对应坐标轴平行时,l 达到最小值。
优点:把算法推广到可用于稀疏信号。
改进的最小值域算法(批处理模式)BiMRA:
语音信号识别基于盲源信号分离的实现
盲信号分离:是指在传输信道特性和输入信息未知或者仅有少量先验知识的情况下,只由观测到的输出信号来辨识系统,以达到对多个信号分离的目的,从而恢复原始信号或信号源。
盲分离问题的研究内容大体上可以划分为:瞬时线性混叠盲分离、卷积混叠盲分离,非线性混叠盲分离以及盲分离的应用四部分。
盲源信号分离的DSP实现方法
原理:基于负熵最大的FastICA算法。
优点:FastICA算法的优点收敛速度快、无需选步长参数、能够通过选择适当的非线性函数g来最佳化、能减小计算量等。
同时也有许多神经算法的优点,如并行、分布式且计算简单,内存要求很少等。
中心极限定理:即:若一随机变量X由许多相互独立的随机变量Si(i=1,2,…,N)之和组成,那么,只要Si具有有限的均值和方差,则不论其为何种分布,随机变量X较Si更接近高斯分布。
思路:在所有等方差的随机变量中,高斯变量的熵最大,因而可以利用熵来度量非高斯性,常用熵的修正形式,即负熵。
因此,在分离过程中,可通过对分离结果的非高斯性度量来表示分离结果间的相互独立性,当非高斯性度量达到最大时,表明已完成对各独立分量的分离。
盲信号处理技术在水下目标分离中的应用
背景:水声信号非高斯、非线性及非平稳等特性较为复杂,
时域FastICA算法:用于水下不同信号瞬时线性混合的分离
频域FastICA算法:用于水下不同信号卷积混合模型的分离。
盲信号分离的算法很多,每种算法都有其自身的特点,如不同的算法的目标函数或学习算法可能不同,并且它们的适用性也各不相同。
依据不同的应用环境,需要对经典理论算法进行拓展研究以及相应改进,想要最终将盲分离应用于水下目标的分离,势必要由经典算法入手,依据水声环境的特性对所选取的算法进行深入研究和改进,才能最终应用于水声信号,实现我们的应用目的。
在线性混合模型下,分离算法有:最大化算法、自然梯度算法和快速不动点算法FastICA以及基于二阶统计量的多未知信号提取算法AMUSE和二阶盲辨识算法SoBI
informax算法和自然梯度算法都需设定学习步长,这降低了算法的适用性;AMUSE算法不能分离统计独立的、平稳的白噪声信号;SOBI算法在相同信噪比下的分离性能弱于FastlcA算法。
FastICA算法的适用性强,分离效果稳定,结合水声实际情况,发觉卷积混合模型更贴合实际水声情况,因此将时域FastICA算法扩展到了复频域,并且还对复频域算法进行了改进改进的复频域FastlCA算法解决了盲分离存在的次序不确定性问题。
最终将改进的复频域FastICA算法应用于水声不同目标信号的混合分离。
基于盲信号处理技术的地震弱信号分离方法
基于协同学的语音身份识别算法研究
语音的识别分为语音段的预处理、特征参数的提取、特征参数还原以及身份识别四个部分。
语音预处理中,在现有语音预处理方法的基础上引入了盲信号分离技术,分别设计并实现了盲信号去噪、釆样和量化、预加重、分帧和加窗以及端点检测等的具体处理算法。
对于特征参数的提取,借鉴现有特征参数提取算法的思想,设计并实现了基于线性预测倒谱系数和梅尔频率倒谱系数的组合语音特征值提取算法。
在特征参数的还原处理中,引入协同学思想和K-均值聚类算法,设计了基于协同学的参数还原模型,对模型中的基于K-均值聚类算法的原型模式向量选择、基于协同学的特征参数还原等.
关键模块的处理算法进行了详细的设计及实现。
)对于身份的识别,釆用对待检语音进行基于协同学还原后的语音特征值与存档的特征信息的相似度计算来判定说话人的身份,设计并实现了基于相似度的身份判定算法。
含噪信号的提取和分离技术的研究
现阶段,关于含噪盲信号分离或抽取问题,已经有了一些有效可行的稳健算法。
其中包括,针对非广义高斯噪声的分布模型采用经过优化的非线性激活函数;采用处理缺损数据的期望最大化(EM)算法来完成含噪盲信号的分离和抽取;将噪声信号看成是与多路混合信号并行的信号成分,利用含高斯分布信号的抽取算法来得到目标信号并消除噪声和干扰信号;采用已有的前置滤波装置对噪声进行简单的滤除等等。
这些方法在一定程度上降
低了噪声对分离算法性能的影响,提高了分离结果的准确度。
本论文在此背景下以减小由测量噪声、环境噪声、干扰信号等所引起的分离或提取算法误差为目标进行研究,将现有的全盲或半盲自适应的盲信号分离方法进行分类。
并且按照类别的不同提出几种相应的改进含噪稳健处理算法,其中主要包括基于源独立性的含噪提取算法、基于时间自相关性的含噪提取算法以及基于降噪盲源分离(DSS)框架并结合噪声小波预处理的含噪提取算法。
在对算法原理进行理论分析的同时,通过仿真实验验证了这几种算法的有效性和可行性。
此外,指出了在含噪盲信号分离和提取问题上未来可能的研究方向。
BSS 可以简单概括为:在源信号及信道参数的任何先验知识均无法确知的情况下,通过接受装置观测到的信号阵列来得到源信号,同时还可以辨识未知信道的参数。
在图像信号处理中,图像恢复和理解指的是利用已知的图像先验信息解决由于噪声和干扰引起的图像畸变[3]。
而图像的盲恢复表示仅利用畸变后的图像和少量先验信息,从畸变图像中估计恢复原图和得到干扰信号的过程。
盲信号处理方法,特别是独立分量分析(ICA)[4]方法,在图像信号恢复应用中是十分有效的方法。
图像信号处理中一种较为基本的处理思想是:通过使用各种不同的基函数对信号进行变形处理,然后通过特定的信号表示提取出信号的典型特征,进而利用这些特征对图像信号进行估计、压缩和恢复。
对于同时包含线性和非线性混合信号在内的图像,传统的信号变换(例如FT 变换和WT 变换)不能找出信号有效估计主分量。
而利用ICA 方法,先将图像分解为互不相关的独立分量,然后对这些分量进行分析,这样就提供了一种能够表示图像结构的有效方法。
针对另一种利用信号自相关性的BSS 分离算法展开了研究,这种方法不再依赖于信号的独立性,大大扩展了BSS 方法的使用范围。
通过对已有常用算法的研究提出一种基于高阶累积量对回归参数进行估计的新算法。
最后通过仿真证明该算法性能优良,具有较好的分离效果。
本文研究了一种新的分离算法模型即DSS 算法模型,这种算法的原理与基于噪声预处理的算法具有相似之处,但是,它具有更好的自适应性。
在对该算法的原理进行说明后,我们将其与常用的小波降噪预处理相结合,提出了一种基于二次DSS 降噪的新算法.
盲分离的提出来源于解决从未知混合信号中估计源信号波形的问题。
指的是在混合过程和混合信号都未知的情况下,仅仅通过关于这些未知参量的部分或全部先验知识估计出未知分量。
盲分离最早的提出是基于“鸡尾酒会”问题,即在声学处理中模拟人耳识别,从混合人声信号中得到特定语音源信号。
盲抽取是在大量源信号中将我们感兴趣的目标信号逐个提取的过程,这种情况下,即使源信号的个数未知算法也可以实现。
二者的区别在于同时分离和逐个提取。
而ICA 的提出则是基于信号源各自独立互不相关,是盲分离方法的一种特例。
盲辨识的提出是基于对源信号未知混合信道的估计和辨识。
传统的信道辨识问题处理中,在已知系统输入和输出信号的波形的情况下,利用传统算法能够准.确地估计出信道特性的未知参量。
从而完成辨识过程。
而盲辨识方法是在输入参量未知输出参量已知的情况下进行辨识的过程,我们所要得到的包括未知源信号和混合信道参量两部分的特性参数。
盲均衡是基于源信号混合方式是卷积混合的问题提出的。
当信道为卷积特性时,接收端观察到的信号应表示为未知源信号和信道脉冲响应的卷积形式。
它与线性混合方式不同,具有一定的时延。
这种情况下所进行的分离叫做解卷积。
经典的解卷积算法是在已知信道响应参数和输出信号波形下估计输入信号波形,而盲解卷积则是利用输出观测信号得到源信号波形,此时,混合信道参量均为未知。
通信信号处理问题中,将实现解卷积过程的功能元件称为均衡器,指的是补偿由于传输过程中的各种衰减和信道时变引起的信号畸变。
不同于经典的解卷积算法,盲均衡可以解决时变系统问题,在无线通信中有很大的应用价值[6]。
事实上,当混合信道参量实现识别后,信号的分离就可以进一步实现。
目前,ICA 主要针对混合过程为线性混合的盲分离问题进行处理。
而盲辨识则是针对卷积混合问题进行处理。
特别的,独立分量分析方法也可以处理卷积混合问题.
利用源信号的时间自相关性,提出一种基于自回归高阶估计的盲信号提取算法,算法采用HOS 对回归权值进行估计,解决了传统的二阶自相关回归估计算法在混合信号包含背景噪声的情况下无法实现正确分离的问题,同时,在无噪情况下,仿真实验表明高阶回归估计较二阶回归估计具有更快的收敛速度。
独立分量分析在盲信号分离中的应用研究
在最小互信息盲分离算法的基础上提出了盲信号分离的基于模糊神经网络的独立分量分析方法。
这种分离是有条件的:瞬时混合、统计独立。
由ICA的数学模型可知,在源信号S(t)未知,混合矩阵A未知的情况下,若要使求得的最优逼近信源的独立信号Y,只要求得解混矩阵W 即可。
为此,将多道观测信号X(t)作为输入值,经由去均值、白化的数据预处理后,以负熵最大化理论作为优化判据,从而确定目标函数,应用牛顿迭代算法求目标函数最大值以求得解混矩阵W,最终得到相互独立的信号Y。
为解决寻求最优的成矿元素组合的问题,将单元素地球化学数据视为多道观测信号X(t),将影响元素组合的各种因素视为混合矩阵A,在影响因素难以确定的前提下,从统计独立性的角度出发,将分离出各独立分量中能量最大的分量视为成矿元素组合。