5.2 集合经验模态分解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

集合经验模态分解算法:
(1)对原始信号添加白噪声序列:
xi (t) x(t) ni (t)
(5.2.7)
式中 ,xi (t) 是对原始信号数百度文库 x(t) 添加第i个白噪声 后得到的新信号,ni(t) 是白噪声。
(2)根据(5.2.1)~(5.2.2)式所描述的经验模态分 解方法,将添加了白噪声的信号分解成各分量IMFs。 得到了第i个分量IMF响应的组分 Cij (t) 和剩余组分 ri(t) 。
IMF4分量表示的是气温准30年的周期变化,其方差 贡献率为8.58%,在此时间尺度上,气温变幅逐渐 增大,变化的不稳定性增强;趋势项分量的方差贡 献率高达33.40%,表征了新疆年平均气温在19572012年间整体上呈现出非线性的上升变化趋势,尤 其自20世纪80年代后期开始升温较为明显。
在理论上来说,该方法适用于任何类型的信号分解 ,特别是在处理非线性、非平稳时间序列方面,更 具有明显的优势。目前,这一方法已被广泛地应用 于自然科学与社会科学研究的相关领域。
一、集合经验模态分解的基本原理
集合经验模态分解(EEMD)方法,是在经验模 态分解(empirical mode decomposition,缩写为 EMD)的基础上发展起来的。该方法的本质,是对时 间序列数据进行局部平稳化处理,然后进行希尔伯特 变换获得时频谱图,得到有物理意义的频率。
第2节 集合经验模态分解
➢ 集合经验模态分解的基本原理 ➢ 集合经验模态分解实例
集合经验模态分解(ensemble empirical mode decomposition,缩写为EEMD),是黄锷(Huang N. E.)等人创建的一种信号分析方法。
该方法的优点,是依据数据自身的时间尺度特征进 行信号分解,即局部平稳化处理,无须预先设定任 何基函数,因而具有广泛的适用性。
在相同的时段内,各IMF分量随时间呈现出或强 或弱的非均匀变化,说明这些不同时间尺度的准周期 性振荡不仅包含了气候系统外在强迫的周期变化,还 包含有气候系统的非线性反馈作用。
每种尺度信号波动频率和振幅对原数据总体特征 影响程度可用方差贡献率表示。表 5.2.1给出了各 IMF分量的方差贡献率。
表 5.2.1 气温距平各分量的方差贡献率
集合经验模态分解的基本原理 经验模态分解,基于以下假设条件: ① 信号函数至少有两个极值,一个最大值和一个最 小值; ② 信号的局部时域特性是由极值点间的时间尺度唯 一确定; ③ 如果信号函数没有极值点但有拐点,则可以通过 对数据微分一次或多次求得极值,然后再通过积分 来获得分解结果。
该方法的本质,是通过信号的特征时间尺度来获 得本征波动模式,然后分解信号。
,振荡信号极为明显,气温振幅呈现出减小-增大减小的趋势,而且可看到在20世纪60年代中后期、 70年代末80年代初和90年代气温振幅明显高于其它 时段; IMF2表示的准6年周期方差贡献率约为19.61%,基 本上反映了20世纪80年代末90年代初期气温偏高的 事实;
IMF3分量表示的准10年周期方差贡献率为10.11%, 显示其在20世纪60—70年代振幅相对较大;
在20世纪90年代,新疆气温总体处于高温期,但 各年气温也存在较大差异,偏高年份与偏低年份的平 均气温相差高达2.6℃;
21世纪前10年,气温总体仍偏高,但后期气温显 著低于前期,同时极端气温事件也明显增多。
对于距平后的年平均气温时间序列,运用集合经 验模态分解方法进行分解,得到了4个IMF分量和一个 趋势项(图 5.2.3)。
(5.2.5)
对 r1(t) 做(5.2.1)~(5.2.5)式同样的“筛选”
过程,一次得到C2,C3,… ,直到 r1(t) 基本呈单调趋
势或 r1 t 很小时停止,则原信号重构为:
n
x(t) Ci (t) rn (t) i 1
(5.2.6)
虽然经验模态分解方法在信号分析中具有明显的 优势,但也存在着无法避免的缺陷,即边缘效应和 尺度混合。
本研究所用的数据,均由中国气象科学数据共享 服务网(http://cdc.cma.gov.cn/)发布,这些数据在发 布之前已做过极值和时间一致性等检验,质量较好。
图5.2.1 新疆概貌及气象站点分布情况
(二)结果与讨论
气温变化的趋势特征
图 5.2.2 1957-2012年新疆年平均气温距平变化
这种分解过程可以形象地称之为“筛选 (sifting)”过程。
经验模态分解过程:
经验模态分解,将信号中不同尺度的波动和趋势
逐级分解开来,形成一系列具有不同特征尺度的数据 序列,即本征模函数(IMF)分量,最低频率的IMF分 量代表原始信号的总趋势或均值的时间序列。
对于原始信号x(t) ,首先找出其所有局部极大值和
(5.2.2)
如 h1(t) 不满足IMF条件,则视其为新的 x(t),重复 (5.2.1)式和(5.2.2)式的计算步骤,经过k次重复, 得到满足IMF要求的 h1k(t),即第一个IMF分量:
h1k (t) h1(k1) (t) m1k (t)
(5.2.3)
实际操作中过多地重复上述处理会使IMF变成幅 度恒定的纯粹的频率调制信号,从而失去实际意义。
因此,可采用标准差SD (一般取0.2~0.3)作为筛选 过程停止的准则,当SD达到某个阈值时,停止筛选。 SD的计算公式为:
SD
T
h1(k
1)
(t
)
h1k
(t))
2
t0
h1(k1) (t)
(5.2.4)
若设第一个IMF分量 h1k(t) c1 ,则其它剩余量 r1(t)
可表示:
r1(t) x(t) C1
本征模函数表征了数据的内在的振动模式。 由本征模函数的定义可知,由过零点所定义的本 征模函数的每一个振动周期,只有一个振动模式,没 有其他复杂的奇波。一个本征模函数并没有约束为是 一个窄带信号,而且可以是频率和幅值的调制,还可 以是非稳态的。单由频率或单由幅值调制的信号也可 以成为本征模函数。
(二)经验模态分解
集合经验模态分解,是在经验模态分解的基础上 ,加入一组或多组白噪声信号,用于抑制经验模态分 解过程中出现的端点效应和模态混叠现象。由于它引 入了白噪声扰动并进行集合平均,从而避免了尺度混 合问题,使得最终分解的各分量保持了物理上的唯一 性。
(一)本征模函数
经验模态分解,将复杂信号分解为有限个本征模 函数(intrinsic mode function,简称IMF),所分解 出来的各IMF分量包含了原信号的不同时间尺度的局 部特征信息。
二、集合经验模态分解实例
(一)研究区域与数据来源
我国新疆地区,其基本的气候特征是:晴天多, 日照强,干燥,少雨,冬寒夏热,昼夜温差大。
为分析新疆地区气温变化趋势的多尺度特征及其 空间差异,选用了具有代表性、时间序列较为完整的 位于新疆的16个国际交换站的1957—2012年期间的年 平均气温数据,这些站点基本上可以覆盖整个新疆地 区(详见图5.2.1)。
本征模函数,是经验模态分解的基础。 在物理上,如果瞬时频率有意义,那么函数必须 是对称的,局部均值为零,并且具有相同的过零点和 极值点数目。在此基础上,黄锷等人提出了本征模函 数的概念。
一个本征模函数,必须满足以下两个条件:
① 在整个时间范围内,函数的局部极值点和过零点 的数目必须相等,或最多相差一个; ② 在任意时刻点,局部最大值的包络(上包络线) 和局部最小值的包络(下包络线)平均必须为零。
N Tk NPk
(5.2.10)
式中,N是IMF的长度,NPk 是 IMF的峰点的个数。 对于添加了白噪声的第k个IMF分量,其能量谱密度 均值 Ek 和平均周期 Tk 的近似关系为:
ln Ek ln
Tk
0
a
(5.2.11)
即在以
ln
Tk
a
为X轴,ln Ek
为Y轴的图中,两者的
关系将表现为斜率为-1的直线。
从理论上说,白噪声的IMF分量应分布在该直线 上,但实际应用时会产生些许偏差,对此给出白噪声 能量谱分布的置信区间:
ln Ek ln{Tk }a 2 / N eln({Tk } / 2 )
其中,a为显著性水平。
(5.2.12)
在给定的显著性水平下,分解所得IMF的能量相 对于周期分布位于置信度曲线以上,表明其通过显著 性检验,可认为是在所选置信水平范围内包含了具有 实际物理意义的信息;
尤其是尺度混合,它不仅会造成各种尺度振动 模态的混合,甚至还可以使个别IMF失去物理意义。
而集合经验模态分解,是在经验模态分解的基 础上发展起来的,由于其引入了白噪声扰动并进行 集合平均,从而避免了尺度混合问题,使得最终分 解的IMFs分量保持了物理上的唯一性。
(三)集合经验模态分解
集合经验模态分解的操作步骤 (1)在待分析的原始信号序列中叠加上给定振幅的 白噪声序列; (2)对于加入白噪声后的信号,做经验模态分解; (3)反复重复以上两步操作,每次加入振幅相同的 新生的白噪声序列从而得到不同的IMFs; (4)将各次分解得到的IMFs进行集合平均,使加入 的白噪声互相抵消,并将其作为最终的分解结果。
IMF components IMF1 IMF2 IMF3 IMF4 RES
Period/year
3
6
10
30
Contribution/% 28.29 19.61 10.11 8.58 33.40
结合图 5.2.3和表 5.2.1可以看出, IMF1表示的准3年周期贡献率最大,达到了28.29%
从图 5.2.2来看,新疆年平均气温在20世纪80年 代末90年代初出现转折,在80年代末以前气温相对偏 低,之后则相对偏高;但总体来看,近50多年来,全 疆气温呈上升趋势。
进一步分时段来看,在1957—1988年期间,尽管 新疆气温处于偏低期,然而在20世纪60和70年代及80 年代前期,仍呈逐渐上升态势,这意味着新疆在低温 期也经历了一个逐渐升温过程;
各IMF分量依次反映了气温从高频到低频不同时间 尺度的波动特征,最后所得趋势项(RES)表示气温随 时间变化的整体演变趋势。
每个IMF分量,从各自不同的物理意义,刻画了 原序列中固有的不同特征尺度的振荡。
各IMF分量所包含的具有实际物理意义的信息多 少,可通过显著性检验来判断。
IMF1和IMF2落在90%—95%置信区之间,它们所包 含的具有实际物理意义的信息较多;IMF3和IMF4落在 80%—90%置信区之间,它们所包含的具有实际物理意 义的信息相对略少。
图 5.2.3 新疆1957—2012年气温距平各IMF分量及趋势项
从图5.2.3可以看出, 在1957—2012年期间,新 疆年平均气温变化具有相对稳定的准周期性。其表现 在年际尺度上,具有准3年(IMF1)和准6年(IMF2) 的 变化周期;而在年代际尺度上,具有准10年(IMF3)和 准30年(IMF4)的变化周期。
集合经验模态分解可借助于白噪声的集合扰动进行 显著性检验,从而给出各个分量IMFs的信度。
设第k个IMF分量的能量谱密度为:
Ek
1 N
N
Ik
j 1
2
j
(5.2.9)
式中,N代表IMF分量的长度,I k ( j)表示第k个IMF 分量通过蒙特卡罗法对白噪声序列进行实验。
第k个分量IMF的平局周期:
(3)最后,对上述分解得到的响应的IMF组分求均值 ,就得到了最终的分解结果,即:
C j (t)
1 N
N
Cij (t)
i 1
(5.2.8)
式中,Cj (t) 为最终得到的第j个分量IMF, N 是白噪 声序列的个数, Cij (t)代表加入添加第i个白噪声处理后的 第j个分量IMF。
集合经验模态分解的显著性检验
极小值,然后利用三次样条插值方法形成上包络线u1(t)
和下包络线 u2(t) ,则局部均值包络线 m1(t)可表示为:
m1 (t )
1 2
u1 (t )
u2
(t)
(5.2.1)
原始信号 x(t) 减去局部均值包络线m1(t) ,可得第
一向量 h1 , 数学表达式为 :
h1(t) x(t) m1(t)
若位于置信度曲线以下,则认为未通过显著性检 验,其所含信息多为白噪声成分。
集合经验模态分解的计算过程,可以借助于 Matlab软件编程实现。由黄锷领导的研究团队提供的 集合经验模态分解计算程序(Matlab软件程序m文件 “eemd.m”),可以从台湾国立中央大学数据分析 方法研究中心网站下载 (http://rcada.ncu.edu.tw/eemd.m)。
相关文档
最新文档