EMD

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

算法概述
• EMD方法基于信号本身的局部特征时间尺度,把原始信号进行平稳化处理,将 复杂的信号分解成有限个具有不同特征尺度的数据序列,每一个序列即为一个 本征模态函数(Intrinsic Mode Function)分量,IMF反映了原始信号的本质和真实 信息。信号经EMD分解之后,其瞬时频率也具有了物理意义,因此,EMD算 法是一种非常适用于非平稳、非线性数据序列的复杂信号处理方法。
数学基础,如:正交性、收敛性、完备性、唯一性等EMD特性,试验方法求证一 些特性,而不能进行数学上的证明,甚至于至今为止都无法很好的解释“什么信 号能进行EMD分析,什么信号不能进行EMD分析”。然而对于本征模态函数, 也仅仅只能通过窄带信号的过零点与过极值点的关系以及非常有限的可用例子的 经验中获得IMF定义,其效果很难令人满意。尽管大部分的例子都表明了EMD结 果的直观合理性,但是其理论框尚待改善。
式子:
n
x (t ) c i rn
i 1
残差 r n是信号 x(t) 的集中趋势,IMFs(c1,,cn )分别包含了信号不同时间特征尺度大小的
成分,其尺度依次由小到大,因此,各分量也就相应地包含了从高到低的不同频率段的
成分。每个频率段包含的频率成分是不同的,它们随 x(t)的变化而变化。
• EMD只需要根据信号的时间特征尺度自适应的对信号进行分解。信号经EMD分解所得到的本 征模态函数均代表着信号不同尺度的特征。因为对于每个本征模态函数,连续两个极值点之间 定义了信号局部波动特征,这就反映了信号在不同尺度的特性。
本征模态函数(Intrinsic Mode Function)
一般认为,一个本征模函数IMF必须满足以下两个条件: (1)在整个信号上,极值点的个数和过零点的个数相等或至多相差一个; (2)在任意时刻,由局部极大值点和局部极小值点分别形成的上、下包络线的均值为零,也即是 说,上、下包络线相对于时间轴是局部对称的。 通常情况下,实际信号都是复杂信号,并不满足上述条件,因此,Huang进行了以下假设: (1)任何信号都是由若干本征模态函数组成的; (2)各个本征模态函数既可是线性的,也可是非线性的,各本征模态函数的局部极值点和零点相 同,同时上、下包络关于时间轴局部对称; (3)在任何时候一个信号都可以包含若干个本征模态函数,若各模态函数之间相互混叠,就组成 了复合信号。
EMD算方法的主要问题及改进
(3)IMF筛分准则
在实际情况中,上下包络的均值无法为零,通常当满足下面式子(标准偏差系数)时,就认为
包络的均值满足IMF的均值为零的条件:
T
[ h1 ( k 1 ) ( t ) h1 k ( t )] 2
SD t 0
T
h
2 1(
k

1
)
(
t
)
t0
• 经验模态分解(Empirical Mode Decomposition,简称EMD)是美国国家宇航局 N.E.Huang等人在1998年提出Hilbert-Huang变换(希尔伯特黄变换,简称HHT) 的基础上,提出的一种非常重要的信号处理的方法。它是一种新型的自适应信 号时频处理方法,特别适用于非平稳、非线性信号的分析处理。

称为筛分门限,一般取值在0.2到0.3之间;
a(t) emax emin
• 另一种判断准则由法国学者Rilling提出,其表达式为:
emax emin
以该函数作为判定是否终止筛选过程的依据。式中 emax , emin 分别为上、下包络线。设定三个门限 值1、 2、 ,相应的满足以下两个条件,就认为分解得到的IMF满足要求。
EMD算法基本步骤
(4)从x(t) 中分离 c 1 ,得到 r1 x(t) c1,将r1 视为原始信号重复上述过程,就得到信
号 x(t) 的第二个IMF成分c2 ,一直重复上述过程n次,就得到n个IMF,r2 r1 c2,,rn rn1 cn ,
当 r n 是单调函数或是一个极小的常量时,就无法再提取IMF,停止分解过程,得到下面
经验模态分解(EMD) Empirical Mode Decomposition
算法背景
• 信号处理中,频率是信号最重要的表示,由于传统的傅立叶变换分析方法并不 能分析出信号的某一频率在什么时刻出现,为此产生了能同时在时间和频率上 表示信号密度和强度的时频分析,如短时傅立叶变换和小波分析等,但其基本 思想都是根据傅立叶变换的理论得到的,因此也没有进一步的突破。
① 规定 a(t)中小于 1 的比率不低于1 ,即:
# {t D a (t ) 1} 1 # {t D}
D是信号持续的总时间,#A表示在集合A中元素的总个数;
② 对于在整个时间范围内的时刻t,要满足:
a(t) 2
以上两个条件1、2、 的默认值为 1 0.05,2 0.5, 0.95
正交性指标通常不会超过1%,对于短信号在极端的情况下可能达到5%,也就是说通过EMD分解
得到的IMF分量是近似正交的。
• (3)自适应性
EMD的自适应性主要表现在三个方面,一是基函数的选取,EMD分解的基函数完全由信号本
身决定,在筛分过程中得到;二是自适应的分辨率,每一个IMF分量包含的频率各不相同,由原
EMD算法的流程图
EMD算法图解

原始信号
x(t) sin( 2 20t) 2 cos( 2 60t)
找到局部极值点
拟合包络线
得到 h1 x (t ) m1
EMD算法的主要性质
• EMD方法不仅直观、简单而且具有完备性、近似正交性,同时还具有良好的 自适应性。
• (1)完备性 所谓的完备性是指通过分解得到的IMF分量和残余分量 r n能够将原信号完全恢
• 基于上述思想,分解的到的IMF的筛分过程可表述如下:
特征时间尺度
• 时间和频率是描述信号的基本参数。频率定义了信号单位时间的周期重复次数,而特征尺度通 过直接从时域观察信号的变化过程,同样可以获得类似频率的信号特征。信号的特征尺度是与 频率密切相关的,一般大的特征尺度对应小的频率,小的特征尺度对应大的频率。

i 1
i1 j 1
EMD算法的主要性质
• 因此,对于原始信号x(t)的正交性指标,可以定义为:
T n 1 n 1
IO ( ci (t )c j (t ) / x 2 (t )) t 0 i 1 j 1
T是信号的总长度
如果分解是正交的,那么①式中的交叉项应该等于0,Huang通过大量试验得出:对于一般信号其
EMD算法的主要问题及改进
• (2)端点效应
求包络平均是通过对原始数据中上、下极值点分别进行三次样条插值拟合以 后所取的平均值。三次样条插值常常产生过冲或下冲情况,由此产生的IMF不能 严格保证包络的对称性。原信号的端点可能不是极值点,在一定程度上对其进行 拟合时因为边界摆动会带来计算上的偏差,产生拟合误差,在信号两端出现发散 现象,随着筛分过程的不断进行,这种发散现象逐渐传播至内,使分解结果严重 失真,产生假频信号。
• 端点延拓的目的是要使延拓后的波形既能反映出原始信号在端点处的变化趋势, 又能体现原始信号的已知信息,满足这两个条件的延拓才有意义。
• 一般的延拓方法有:镜像闭合端点延拓、斜率极值延拓、多项式拟合延拓等。
镜像闭合端点延拓
• 镜像闭合端点延拓就是在信号的左右两侧具有对称性的极值点上各放一面镜子, 这样就得到长度为2倍的镜内信号长度的周期信号。若取一周期信号将其首尾 连接,就形成了一个封闭的环状,不存在端点,数据的上下包络线完全有数据 的内部确定,从而从根本上避免了端点效应。
始信号在不同的频率下表现出来,这些频率因信号不同,频率成分也各不相同,所以说EMD的分
辨率是自适应的;三是自适应的滤波过程,依据信号本身,将信号按频率由高到低,自动分解出
各个IMF。
EMD算法的主要问题及改进
• (1)理论体系不完整 目前为止,因为尚未构建适合EMD算法的数学建模,同时也就不会有严格的
复。 (2)近似正交性
IMF的正交性可以通过后验的方法给出。原信号的重构信号可以表示为:
1
x(t) ci i 1
其中,把残余分量 r n可以看作第n+1个IMF分量,对上式两边平方得:
n 1
n 1 n 1
x 2 ( t )
c
2 i
(
t
)

2
ci (t)c j (t)
EMD算法的主要问题及改进
• (4)模态混叠 模态混叠主要是指同一个IMF分量当中出现了不同尺度或频率的信号,或者
• 在实际的时间序列中,组成的信息往往是相当复杂的,有用的微弱信号甚至可 能淹没在强信号或噪声中,然而这些小振幅信号可以相当突出的显示IMF成分。 因此利用IMF分析原始数据的信息或许更加准确。
EMD算法基本步骤
• (1)假设原始信号为 x(t) ,找出所有的局部极大值点和局部极小值点,用三次样条 函数连接所有局部极大值点作为上包络线;用三次样条函数连接所有局部极小值点 作为下包络线,上包络线与下包络线应包含所有数据;
原始信号
延拓后的周期性信号
用于分析处理的一个周期性信号
镜像延拓法只考虑了信号端点附近的
极值点变化特征,没有考虑端点外极值点
对信号延拓的影响。由于信号的复杂性,
仅以端点附近极值点的特性决定延拓极值
显然不能准确反映信号的真是趋势,无法
镜像延拓后的环形闭合曲线
使延拓的效果达到最优。镜像延拓要求将镜面放在极值点处,当无法确定信号端 点是否为极值点时,最好截去一部分数据以便把镜面放在极值点处,如果处理一 个不适合截去的短数据时,处理效果就会欠佳。
EMD算法被认为是200年来以傅立叶变换为基础的线性和稳态频谱分析的一个重 大突破,该方法从根本上摆脱了傅立叶变换的约束,它不仅不需要考虑选择小波 基函数的难题,而且吸取了小波变换多分辨率的优点,局部自适应性强,是一种 真正自适应性的时频分析方法,更适合分析非平稳、非线性信号。近些年来该方 法已经在机械故障诊断检测、地震信号分析、生物医学信号特征提取、图像处理、 电能质量分析以及非平稳时间序列预测等众多领域得到了广泛的应用。
• (2)求出上包络线与下包络线的均值 :m1 (Un Ln) / 2,信号 x(t)与 m 1的差 h1 x(t) m1 , 如果 h1是IMF,那么 h1 是的第一个分量;
• (3)如果h1不是IMF,就将 h1看成原始信号处理,在进行上述步骤;得到 h11 h1 m11, m11 是 h1上下包络线的均值,经反复筛选k次,如果 h1k 满足IMF的条件,h1k 就称为 IMF,就有 h1k h1(k 1) m1k ,c1 h1k 是原始信号的第一个IMF成分,代表 x(t ) 最高频率 的分量;
• 我们通过定义在特定要求点之间的时间尺度来获得信号的特征,在数学上,定义所有t时刻, 函数过零点的时间位置间隔就是过零点的时间尺度;定义连续两个极值点的时间间隔就是极值 点的时间尺度,在EMD分解中采用的是基于极值点的时间尺度方法。Huang等人分析认为时间 尺度代表了信号的局部震荡尺度,并且仅表示一种震荡模式,这种震荡模式从一个极值点到另 一个相反的极值点,因此时间尺度是震荡的内在隐含尺度,称为特征时间尺度。
右图中给出了一个有限长的信号,其真实包 络线由黑色线给出,三次样条法构造的包络线以 红色虚线给出,由于信号的不完整,三次样条插 值算法基于给定时间内的信号极值构造包络曲线 出现了失真,使包络曲线在边界处扭曲,令分解 所得的IMF出现误差,失去了物理意义。
端点延拓
• 为了抑制和消除端点效应的影响,人们提出在信号的两端进行端点延拓的方法, 即在数据两端通过一定的方式增加极值点,这样新增的极值点也可作为插值点 来构造样条曲线。
• 由于每一个IMF分量是代表一组特征尺度的数据序列,因此筛选的过程实际上 将原始数据序列分解为各种不同特征波形的叠加。从物理学的意义上讲,通常 信号的高频部分包括较多的噪声,而信号真正的有用信息大多包含在低频部分。 本征模态函数的本质是数据内在的振动模态,在每一个周期内,只包括一种振 动模态,不存在复杂的叠加波。
相关文档
最新文档