EMD经验模式分解信息汇总资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
EMD
Empirical Mode Decomposition
经验模态分解
美国工程院院士黄锷1998年提出
一种自适应数据处理或挖掘方法,适用于非线性、非平稳时间序列的处理。
1.什么是平稳和非平稳
时间序列的平稳,一般是宽平稳,即时间序列的方差和均值是和时间无关的常数,协方差与与时间间隔有关、与时间无关。未来样本时间序列,其均值、方差、协方差必定与已经获得的样本相同,理解为平稳的时间序列是有规律且可预测的,样本拟合曲线的形态具有“惯性”。
而非平稳信号样本的本质特征只存在于信号所发生的当下,不会延续到未来,不可预测。
严格来说实际上不存在理想平稳序列,实际情况下都是非平稳。
2.什么是EMD经验模态分解方法?
EMD理论上可以应用于任何类型时间序列信号的分解,在实际工况中大量非平稳信号数据的处理上具有明显优势。这种优势是相对于建立在先验性假设的谐波基函数上的傅里叶分解和小波基函数上的小波分解而言的。EMD分解信号不需要事先预定或强制给定基函数,而是依赖信号本身特征自适应地进行分解。
相对于小波分解:EMD克服了基函数无自适应性的问题,小波分析需要选定一个已经定义好的小波基,小波基的选择至关重要,一旦选定,在整个分析过程中无法更换。这就导致全局最优的小波基在局部的表现可能并不好,缺乏适应性。而EMD不需要做预先的分析与研究,可以直接开始分解,不需要人为的设置和干预。
相对于傅里叶变换:EMD克服了传统傅里叶变换中用无意义的谐波分量来表示非线性、非平稳信号的缺点,并且可以得到极高的时频分辨率。
EMD方法的关键是将复杂信号分解为有限个本征模函数IMF,Intrinsic Mode Function。分解出来的IMF分量包含了原信号的不同时间尺度上的局部特征信号。
这句话中:不同时间尺度=局部平稳化,通过数据的特征时间尺度来获得本征波动模式,然后分解or筛选数据。
本质上,EMD将一个频率不规则的波化为多个单一频率的波+残波的形式。
原波形=ΣIMFs+余波
信号()t f
筛选出的本征模函数IMF包括余波,对应有实际的物理成因。
现实中的信号分量IMF不会保持完全稳定的频率和振幅,也常常无法从各个分量中直接看出信号规律。EMD分解经常被用作信号特征提取的一个预先处理手段,将各IMF分量作为后续分析方法的输入,以完成更加复杂的工作。
3.IMF的筛选过程
第一步:
Get原数据曲线f(t)所有极大值点,三次样条插值函数拟合成原数据的上包络线;
Get原数据曲线f(t)所有极小值点,三次样条插值函数拟合成原数据的下包络线。
第二步:
上包络线和下包络线的均值or中位数曲线m(t)(在图中显示为中间的包络线,即平均包络线),均值or中位数记为ml
原数据-平均包络=IMF
F(t)-m(t)=H(t)
第三步:
如果hl中还存在负的局部极大值和正的局部极小值,说明这还不是一个本征模函数,需要继续进行筛选,重复前两步,直到SD(筛分门限值,一般取0.2~0.3)小于门限值时停止。
具体过程如图所示:
所分解出来的各个IMF分量包含了原信号的不同时间尺度的局部特征信号。
第四步:
残差r(t)=f(t)-H(t),重复前三步,直到r(t)满足预先设定的条件。
如果成功完成筛选过程,获得第一个IMF,可以通过原始信号减去先前提取的IMF,再一次重复上述过程二获得下一个IMF。依此类推,直到提取完所有的IMF为止,即残差只包含不超过2个极值时停止。
整个过程不是基于严格的数学计算,而是基于经验。
4.EMD分解基于以下假设条件:
(1)数据至少有两个极值,一个最大值一个最小值;
(2)数据的局部时域特性是由极值点间的时间尺度唯一确定;
(3)如果数据没有极值点但有拐点,则可以通过对数据微分一次或多次求得极值,然后再通过积分来获得分解结果。
IMF的约束条件:即每个本征模函数IMF都应该满足的两个条件
(1)在整个数据范围内,局部极值点和过零点的数目必须相等,或相差数目为1。
(2)在任意时刻,局部最大值的包络,即上包络线,和局部最小值的包络,即下包络线,的平均值必须为0.
IMF图像特征:曲线要反复跨越x轴,且不能在某次穿过零点后出现多个极点;包络线要对称。
图一为原始信号;图二到七为EMD分解后得到的6个IMF分量,IMF1~IMF5;图八为残差。每个IMF都满足约束条件。
5.EMD存在的缺陷,改善方法?
IMF分解时存在模态混叠现象,也就是说当信号的时间尺度存在跳跃性变换、信号极值点分布不均匀时,对信号进行EMD分解,一个IMF中会包含不同时间尺度的特征成分。原因一方面由于原始信号频率特征的影响,另一方面是EMD算法本身的缺陷。
模态混叠的出现,使EMD分解得到的IMF分量失去了物理意义。
历史解决方案:
黄锷曾经提出过中断检测的方法,即直接对结果进行观察,如果出现模态混叠则重新分解,需要人为进行后验判断。
重庆大学谭善文提出了多分辨率的EMD方法,对每一个IMF规定一个尺度范围来解决模态混叠,这种方法牺牲了EMD良好的自适应性。
黄锷2009年提出EEMD,一种噪声辅助信号处理方法,更好的解决模态混叠问题。
(2)在分解出IMF的过程中需要进行多次迭代(?),而停止迭代的条件缺乏明确的标准,所以不同的停止条件下,得到的IMF也是不同的。
(3)端点效应
端点效应是影响经验模态分解精度的主要因素,即在筛选过程中上下包络在数据序列的两端会出现发散现象,并且这种发散还会逐渐向内,“污染”整个数据序列从而使得到的IMF严重失真;在对得到的IMF进行Hilbert变换时,信号的两端也会有端点效应问题出现。端点效应会增加一些虚假成分,信号的总能量也随之增加。
历史解决方案:
Huang等人提出采用"特征波"延拓法来抑制信号的端点效应,是根据信号的频率和幅