0一种冗余字典下的信号稀疏分解新方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2007—05—17 基金项目:国家自然科学基金资助(60672125,60736043,60776795),教育部长江学者和创新团队支持计划(IRT0645)-国家部委预研基金
资助 作者简介:刘丹华(1978一),女,讲师,西安电子科技大学博士研究生,E-mail:dh.1iu@mail.xidian.edu crt,
图1是文中算法的分解过程示意图.设N为信号,的长度,D={B,,Bz,…,BL),Bt={反,J=1,2,…, N),i=1,2,…,L,E为第i个标准正交基组,则D为L组正交基级联而成的字典.希望找到K(K《N)个
K
系数来对厂进稀疏逼近,A=∑cjgj.
第1次分解:首先,分别利用标准正交基B;(i=1,2,…,L)对信号厂进行正交分解,将得到N个系数,选
2008年4月 第35卷第2期
西安电子科技大学学报(自然科学版) JoURNAL OF XIDIAN UNIVERSITY
Apr.2008 VoL 35 NO.2
一种冗余字典下的信号稀疏分解新方法
刘丹华,石光明,周佳社
(西安电子科技大学电子工程学院,陕西西安710071)
摘要:针对目前冗余字典下信号稀疏分解紫用算法计算复杂度高的问题,提出一种分组匹配追踪算法.
IIR‘0= min 钏R钏).
(6)
i-76iI’…ti≠il--1
依次类推,直到找到第L组系数牛,qsl.,…,e一。,砖.至此,共得到L组分解系数0,0,…,哇一。,C屯'I,膏,
.L
|L
1
。I
莺’..·,圣一。,之'..·,c},毒’..·,毫一。,毫,将它们合并起来记作Cl,龟’..·,cK.最终得到信号f的稀疏分解,即
号结构的一个原子而构建的一种逼近过程口’1引.但是,由于每次迭代字典中的所有剩余原子都需与信号作内
积,以找到最能匹配信号结构的一个原子,所以MP算法计算量仍十分巨大.笔者提出新算法的目的就是在
完成信号稀疏分解的同时,降低计算复杂度,并尽可能克服过匹配现象.
2基于多组正交基级联字典的分组匹配追踪算法
2.1文中算法描述 基于多组正交基级联字典的分组匹配追踪算法的基本思想是:根据信号特性,选择多组正交基构造冗余
Gabriel Peyr6t7]提出在某个正交基字典里,自适应地寻找可以逼近某一种信号特征的最优正交基,根据不 同的信号可以寻找最适合信号特性的一个基,然后对信号进行变换以得到较低计算复杂度下的信号稀疏表示.
但一组固定的正交基仍然不可能对所有具有多种奇异特性的信号都能够达到稀疏分解.因此笔者从降 低计算复杂度的角度出发,提出基于多组正交基级联字典[8]的分组匹配追踪算法.通过与MP算法的仿真实 验比较,结果表明该算法是快速而有效的.
IIRl 0=min.{I|R圳}.
(4)
I-l●Z●…●L
即找到与信号f匹配程度最高的标准正交基Bil’并得到第一组系数c},c≥'..‘,哇,一。,f.;:t1.,同时将Bt。这组正
交基从字典中删去.
第z次分解:对残余信号RH作上述同样的分解过程,可得
R‘=RH一∑t g? ,
(5)
』=1
其中尉满足下式(同样删去相应的一组正交基)
1信号稀疏分解与匹配追踪(MP)算法
基于冗余字典的信号稀疏分解的数学描述:设集合D=(g。,i=1,2’..·,M),且Hilbert空间
RⅣ=span(D),M》N.由于M》N,称D为冗余字典,其元素因为不再满足正交性称为原子,并且原子都作 了归一化处理.对于信号,∈RⅣ,在D中选取K(K《N)个原子对信号,作K项逼近:
(3)
f=1
其中lIc|I。是序列q(i=1,2,…,K)中非零项的个数.对于冗余字典D来说,这是一个NP难问题[9].
人们转而采用能够求解局部最优的MP贪婪算法以取代求忙0。的全局最优,以降低计算的复杂度.MP
算法在每一次迭代过程中,用原始信号或残余信号跟冗余字典中所有原子做内积,从字典里选择最能匹配信
Abstract: For the extremely high complexity 0f usual algorithms for sparse decomposition,a new group
matching pursuit algorithm is presented based on a redundant dictionary with several orthonormal bases.The
2004年由Candes,Romberg,Tao和Donoho[23建立起来的压缩传感(Compressive sensing,CS)理论进 一步将稀疏分解思想提升到了一个新的高度.CS理论的基础就是要求信号在某个空间具有稀疏性,因此稀 疏分解的研究有极其重要而深远的理论意义和广泛的应用价值.
至今已经发展了多种稀疏分解算法.常用的有匹配追踪(matching pursuit,MP)算法[1]、基追踪(basis pursuit,BP)算法‘引、框架方法(method of frames,MOF)算法LlJ、最佳正交基(basis orthogonal best,BOB) 算法Is]、正交匹配追踪(orthogonal matching pursuit,OMP)算法[6].其中BP算法、MP算法是目前最常用
li
出志i个大系数ci,c;,…,c~i一。,c气i作分解,则分解后所得的残余Ril=厂一∑qi g;,在L组这样的大系数中选
万方数据
230
西安电子科技大学学报(自然科学版)
第35卷
(·)稀疏分解过程
(b)重构过程
图1基于多组正交基级联字典的分组匹配追踪算法的分解及重构过程
出一组系数cIl,巳s1’..·,c2一,,毫满足
该算法首先利用多组正交基构造冗余字典,然后采用迭代式分组匹配追踪,每次迭代从字典中选出一组
和原始信号或残余最匹配的正交基,采用正交分解快速算法进行正交分解得到少量重要系数。多次迭代
后逐渐稀疏逼近原始信号.实验结果表明,基于小波正交基级联冗余字典进行信号稀疏分解时,在同等
稀疏条件下,与匹配追踪(MP)算法相比,该算法的计算速度提高了大约30倍,而且可避免过匹配现象.
eventually.Simulation results show that the calculating speed of the algorithm in this paper increases by about
thirty times compared with MP’S.Moreover。this algorithm can avoid over-matching.
Key Words: sparse decomposition;redundant dictionary;matching pursuit algorithm;signal compression
在信号与信息处理中,如何用空间变换有效地表达信号,是一个很重要的问题.传统的信号表示方法是基 于“基”的展开,如Fourier变换和小波变换等.但这种建立在正交基上的信号分解有一定的局限性,往往不总能 够达到好的稀疏表示效果,尤其是对于时频变化范围很广的信号,效果更差.一种更好的信号分解方式应该是 根据信号的特点,自适应地选择合适的基函数,来完成信号的分解.因此近年来非正交分解引起人们极大的研 究兴趣.Mallat和Zhang于1993年提出基于冗余字典(redundant dictionary)的稀疏分解思想[1].
万方数据
第2期
刘丹华等:一种冗余字典下的信号稀疏分解新方法
229
的两种算法.在众多稀疏分解算法中MP算法的速度是最快的,但其计算量仍然巨大.这是由于MP每一步 都要完成信号或残余信号在冗余字典中的每一个原子上的投影计算.MP算法还有另两个缺点:(1)在已选 原子组成的子空间上,信号的展开可能不是最好的;(2)极易造成过匹配现象[3].
关键词:稀疏分解;冗余字典;匹配追踪算法,信号压缩
中图分类号:TN911.72
文献标识码:A
文章编号:1001-2400(2008)02-0228-05
New method for signal sparse decomposition over a redundant dictionary
L儿,Dan—hua,SHI Guang-ming,ZHOU J ia—she (School of Electronic Engineering,Xidian Univ.,Xi7an 710071,China)
fK=
芝:
<厂,g;>gi ,
(1)
iEk·亿I=K
其中k是g;Байду номын сангаас下标集合.定义逼近误差 仃一inf II厂一A 0 .
(2)
,K
从稀疏逼近的角度出发,希望在满足条件(2)的前提下,从各种可能的组合中,挑选出分解系数最为稀疏
的一组原子.要找到最稀疏的信号表示,等同于解决0一范数问题[1]
X
rain…l o,s.t.f=2:clgi,
另外,当原始信号恰好包含冗余字典中两个原子的线性组合时,采用MP算法极易造成过匹配现象.文 中算法则克服了过匹配现象,实验结果也证明了这一点.
万方数据
第2期
刘丹华等:一种冗余字典下的信号稀疏分解新方法
231
3实验结果分析
3.1 小波基下正交分解的逼近误差对比 以一维语音信号(图2(a))为例,取N=1 024,用Daubechies系列小波基dbl—dbl0构造正交级联字典.
matching algorithm adopts the the idea of iterative group
pursuit and selects the optimal basis from the
matching dictionary by comparing the
sig越or degree between the
字典,将各组正交基与信号进行匹配程度比较,选择在与信号,最匹配的一组基下进行分解,得到第一批重 要系数,然后从字典中将最匹配的这组基删掉.接下来对残余信号Ri进行同样分解,将R与字典中剩余正交 基的匹配程度进行比较,在最匹配的一组基下将残余信号R‘分解,得到下一批重要系数.依次类推,直到完 成残余信号Ri的精度要求(或分解系数个数要求)为止. 2.2文中算法分解过程
.2
1
’L
‘L
●1
12
kL
K
,≈^=∑q1 g;+∑勺2 g;+…+∑oL g;=∑qg』.
(7)
由分解过程可以看出发现:文中算法和MP算法的思想相似,但不同的是MP算法每次迭代从原子库选 择一个最佳原子,而文中算法则是选择一组最佳正交基进行分解.
笔者提出的算法的改进之处在于:(1)在一定条件下可以保证其收敛性,且易于编制算法;(2)它每一次 迭代过程都是在正交基下进行分解(常用正交变换大都有快速算法),极大地降低了计算复杂度.当选择的字 典是D=(B。,B:,…,B。)时,如果E的正交变换和重构有快速算法(如小波基),此时该算法的计算复杂度 为0(N),而MOF算法、BOB算法的算法复杂度均为O(Nlog N),BP算法比MOF算法、BOB算法还要 慢,只有MP算法是准线性的,然而其速度却极大地依赖于字典中原子的数量M(通常M》N).所以当冗余 字典是由多组正交基级联而成时,该算法在计算复杂度方面优于MP算法.
取K一128(K《N),表1为单独使用一组小波基时的逼近误差0,一^9对照表.从表1中可以看出,db7 的逼近效果最好.在正交基级联字典中进行稀疏分解时,笔者所提算法逼近误差ll,一,K ll=1.498 7《 2.8941,它远小于单独使用db7正交分解的逼近误差,从视觉效果看(图2(b)和2(d)),文中算法重构出的 信号也远好于正交基分解重构信号.
the residua and every basis.Each operation
of decomposing results in a few important coeffidents by using the fast calculating algorithm of orthogonal
decomposition.Mter several such iterations.the original signal is approximated、^ritll a few coeffidents
资助 作者简介:刘丹华(1978一),女,讲师,西安电子科技大学博士研究生,E-mail:dh.1iu@mail.xidian.edu crt,
图1是文中算法的分解过程示意图.设N为信号,的长度,D={B,,Bz,…,BL),Bt={反,J=1,2,…, N),i=1,2,…,L,E为第i个标准正交基组,则D为L组正交基级联而成的字典.希望找到K(K《N)个
K
系数来对厂进稀疏逼近,A=∑cjgj.
第1次分解:首先,分别利用标准正交基B;(i=1,2,…,L)对信号厂进行正交分解,将得到N个系数,选
2008年4月 第35卷第2期
西安电子科技大学学报(自然科学版) JoURNAL OF XIDIAN UNIVERSITY
Apr.2008 VoL 35 NO.2
一种冗余字典下的信号稀疏分解新方法
刘丹华,石光明,周佳社
(西安电子科技大学电子工程学院,陕西西安710071)
摘要:针对目前冗余字典下信号稀疏分解紫用算法计算复杂度高的问题,提出一种分组匹配追踪算法.
IIR‘0= min 钏R钏).
(6)
i-76iI’…ti≠il--1
依次类推,直到找到第L组系数牛,qsl.,…,e一。,砖.至此,共得到L组分解系数0,0,…,哇一。,C屯'I,膏,
.L
|L
1
。I
莺’..·,圣一。,之'..·,c},毒’..·,毫一。,毫,将它们合并起来记作Cl,龟’..·,cK.最终得到信号f的稀疏分解,即
号结构的一个原子而构建的一种逼近过程口’1引.但是,由于每次迭代字典中的所有剩余原子都需与信号作内
积,以找到最能匹配信号结构的一个原子,所以MP算法计算量仍十分巨大.笔者提出新算法的目的就是在
完成信号稀疏分解的同时,降低计算复杂度,并尽可能克服过匹配现象.
2基于多组正交基级联字典的分组匹配追踪算法
2.1文中算法描述 基于多组正交基级联字典的分组匹配追踪算法的基本思想是:根据信号特性,选择多组正交基构造冗余
Gabriel Peyr6t7]提出在某个正交基字典里,自适应地寻找可以逼近某一种信号特征的最优正交基,根据不 同的信号可以寻找最适合信号特性的一个基,然后对信号进行变换以得到较低计算复杂度下的信号稀疏表示.
但一组固定的正交基仍然不可能对所有具有多种奇异特性的信号都能够达到稀疏分解.因此笔者从降 低计算复杂度的角度出发,提出基于多组正交基级联字典[8]的分组匹配追踪算法.通过与MP算法的仿真实 验比较,结果表明该算法是快速而有效的.
IIRl 0=min.{I|R圳}.
(4)
I-l●Z●…●L
即找到与信号f匹配程度最高的标准正交基Bil’并得到第一组系数c},c≥'..‘,哇,一。,f.;:t1.,同时将Bt。这组正
交基从字典中删去.
第z次分解:对残余信号RH作上述同样的分解过程,可得
R‘=RH一∑t g? ,
(5)
』=1
其中尉满足下式(同样删去相应的一组正交基)
1信号稀疏分解与匹配追踪(MP)算法
基于冗余字典的信号稀疏分解的数学描述:设集合D=(g。,i=1,2’..·,M),且Hilbert空间
RⅣ=span(D),M》N.由于M》N,称D为冗余字典,其元素因为不再满足正交性称为原子,并且原子都作 了归一化处理.对于信号,∈RⅣ,在D中选取K(K《N)个原子对信号,作K项逼近:
(3)
f=1
其中lIc|I。是序列q(i=1,2,…,K)中非零项的个数.对于冗余字典D来说,这是一个NP难问题[9].
人们转而采用能够求解局部最优的MP贪婪算法以取代求忙0。的全局最优,以降低计算的复杂度.MP
算法在每一次迭代过程中,用原始信号或残余信号跟冗余字典中所有原子做内积,从字典里选择最能匹配信
Abstract: For the extremely high complexity 0f usual algorithms for sparse decomposition,a new group
matching pursuit algorithm is presented based on a redundant dictionary with several orthonormal bases.The
2004年由Candes,Romberg,Tao和Donoho[23建立起来的压缩传感(Compressive sensing,CS)理论进 一步将稀疏分解思想提升到了一个新的高度.CS理论的基础就是要求信号在某个空间具有稀疏性,因此稀 疏分解的研究有极其重要而深远的理论意义和广泛的应用价值.
至今已经发展了多种稀疏分解算法.常用的有匹配追踪(matching pursuit,MP)算法[1]、基追踪(basis pursuit,BP)算法‘引、框架方法(method of frames,MOF)算法LlJ、最佳正交基(basis orthogonal best,BOB) 算法Is]、正交匹配追踪(orthogonal matching pursuit,OMP)算法[6].其中BP算法、MP算法是目前最常用
li
出志i个大系数ci,c;,…,c~i一。,c气i作分解,则分解后所得的残余Ril=厂一∑qi g;,在L组这样的大系数中选
万方数据
230
西安电子科技大学学报(自然科学版)
第35卷
(·)稀疏分解过程
(b)重构过程
图1基于多组正交基级联字典的分组匹配追踪算法的分解及重构过程
出一组系数cIl,巳s1’..·,c2一,,毫满足
该算法首先利用多组正交基构造冗余字典,然后采用迭代式分组匹配追踪,每次迭代从字典中选出一组
和原始信号或残余最匹配的正交基,采用正交分解快速算法进行正交分解得到少量重要系数。多次迭代
后逐渐稀疏逼近原始信号.实验结果表明,基于小波正交基级联冗余字典进行信号稀疏分解时,在同等
稀疏条件下,与匹配追踪(MP)算法相比,该算法的计算速度提高了大约30倍,而且可避免过匹配现象.
eventually.Simulation results show that the calculating speed of the algorithm in this paper increases by about
thirty times compared with MP’S.Moreover。this algorithm can avoid over-matching.
Key Words: sparse decomposition;redundant dictionary;matching pursuit algorithm;signal compression
在信号与信息处理中,如何用空间变换有效地表达信号,是一个很重要的问题.传统的信号表示方法是基 于“基”的展开,如Fourier变换和小波变换等.但这种建立在正交基上的信号分解有一定的局限性,往往不总能 够达到好的稀疏表示效果,尤其是对于时频变化范围很广的信号,效果更差.一种更好的信号分解方式应该是 根据信号的特点,自适应地选择合适的基函数,来完成信号的分解.因此近年来非正交分解引起人们极大的研 究兴趣.Mallat和Zhang于1993年提出基于冗余字典(redundant dictionary)的稀疏分解思想[1].
万方数据
第2期
刘丹华等:一种冗余字典下的信号稀疏分解新方法
229
的两种算法.在众多稀疏分解算法中MP算法的速度是最快的,但其计算量仍然巨大.这是由于MP每一步 都要完成信号或残余信号在冗余字典中的每一个原子上的投影计算.MP算法还有另两个缺点:(1)在已选 原子组成的子空间上,信号的展开可能不是最好的;(2)极易造成过匹配现象[3].
关键词:稀疏分解;冗余字典;匹配追踪算法,信号压缩
中图分类号:TN911.72
文献标识码:A
文章编号:1001-2400(2008)02-0228-05
New method for signal sparse decomposition over a redundant dictionary
L儿,Dan—hua,SHI Guang-ming,ZHOU J ia—she (School of Electronic Engineering,Xidian Univ.,Xi7an 710071,China)
fK=
芝:
<厂,g;>gi ,
(1)
iEk·亿I=K
其中k是g;Байду номын сангаас下标集合.定义逼近误差 仃一inf II厂一A 0 .
(2)
,K
从稀疏逼近的角度出发,希望在满足条件(2)的前提下,从各种可能的组合中,挑选出分解系数最为稀疏
的一组原子.要找到最稀疏的信号表示,等同于解决0一范数问题[1]
X
rain…l o,s.t.f=2:clgi,
另外,当原始信号恰好包含冗余字典中两个原子的线性组合时,采用MP算法极易造成过匹配现象.文 中算法则克服了过匹配现象,实验结果也证明了这一点.
万方数据
第2期
刘丹华等:一种冗余字典下的信号稀疏分解新方法
231
3实验结果分析
3.1 小波基下正交分解的逼近误差对比 以一维语音信号(图2(a))为例,取N=1 024,用Daubechies系列小波基dbl—dbl0构造正交级联字典.
matching algorithm adopts the the idea of iterative group
pursuit and selects the optimal basis from the
matching dictionary by comparing the
sig越or degree between the
字典,将各组正交基与信号进行匹配程度比较,选择在与信号,最匹配的一组基下进行分解,得到第一批重 要系数,然后从字典中将最匹配的这组基删掉.接下来对残余信号Ri进行同样分解,将R与字典中剩余正交 基的匹配程度进行比较,在最匹配的一组基下将残余信号R‘分解,得到下一批重要系数.依次类推,直到完 成残余信号Ri的精度要求(或分解系数个数要求)为止. 2.2文中算法分解过程
.2
1
’L
‘L
●1
12
kL
K
,≈^=∑q1 g;+∑勺2 g;+…+∑oL g;=∑qg』.
(7)
由分解过程可以看出发现:文中算法和MP算法的思想相似,但不同的是MP算法每次迭代从原子库选 择一个最佳原子,而文中算法则是选择一组最佳正交基进行分解.
笔者提出的算法的改进之处在于:(1)在一定条件下可以保证其收敛性,且易于编制算法;(2)它每一次 迭代过程都是在正交基下进行分解(常用正交变换大都有快速算法),极大地降低了计算复杂度.当选择的字 典是D=(B。,B:,…,B。)时,如果E的正交变换和重构有快速算法(如小波基),此时该算法的计算复杂度 为0(N),而MOF算法、BOB算法的算法复杂度均为O(Nlog N),BP算法比MOF算法、BOB算法还要 慢,只有MP算法是准线性的,然而其速度却极大地依赖于字典中原子的数量M(通常M》N).所以当冗余 字典是由多组正交基级联而成时,该算法在计算复杂度方面优于MP算法.
取K一128(K《N),表1为单独使用一组小波基时的逼近误差0,一^9对照表.从表1中可以看出,db7 的逼近效果最好.在正交基级联字典中进行稀疏分解时,笔者所提算法逼近误差ll,一,K ll=1.498 7《 2.8941,它远小于单独使用db7正交分解的逼近误差,从视觉效果看(图2(b)和2(d)),文中算法重构出的 信号也远好于正交基分解重构信号.
the residua and every basis.Each operation
of decomposing results in a few important coeffidents by using the fast calculating algorithm of orthogonal
decomposition.Mter several such iterations.the original signal is approximated、^ritll a few coeffidents