小波和多尺度简介
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在众多的信号处理应用中,人们希望找到一种稀疏的数据表示,用稀疏逼近取代原始数据表示可从实质上降低信号处理的成本,提高压缩效率。传统的信号表示理论基于正交线性变换,但许多信号是各种自然现象的混合体,这些混合信号在单一的正交基变换中不能非常有效地表现出来。例如,一个含有脉冲和正弦波形的混合信号,既不能用单一的脉冲基函数,也不能用单一的正弦基函数有效地表示。在这个例子中,有两种结构类型同时出现在信号里,但它们却完全不同,其中哪一个都不能有效地模拟另一个。所以,人们希望寻找一种能够同时建立在两种基函数之上的信号表示,其结果应该比采用其中任一种基函数有效得多。
在图像和视频处理方面,常用的信号分解方式通常是非冗余的正交变换,例如离散余弦变换、小波变换等。离散余弦变换其基函数缺乏时间/空间分辨率,因而不能有效地提取具有时频局部化特性的信号特征。小波分析在处理一维和二维的具有点状奇异性的对象时,表现出良好的性能,但图像边缘的不连续性是按空间分布的,小波分析在处理这种线状奇异性时效果并不是很好。因而说,小波分析对于多维信号来说并不是最优的,不能稀疏地捕捉到图像结构的轮廓特征,因此在图像和多维编码方面的新突破,必定取决于信号表好似的深刻变革。
最近几年,研究人员在改变传统信号表示方面取得了很大的进展。新的信号表示理论的基本思想就是:基函数用称之为字典的超完备的冗余函数系统取代,字典的选择尽可能好地符合被逼近信号的结构,其构成可以没有任何限制,字典中的元素被称为原子。从字典中找到具有最佳线性组合的m项原子来表示一个信号,称作信号的稀疏逼近或高度非线性逼近。
从非线性逼近的角度来讲,高度非线性逼近包含两个层面:一是根据目标函数从一个给定的基库中挑选好的或最好的基;二是从这个好的基中拣选最好的m项组合。利用贪婪算法和自适应追踪,从一个冗余函数系统中进行m项逼近方法的理解只是些零星的片段,用高度非线性方法以指定的逼近速率来描述函数仍然是一个富有挑战的问题。
从基函数的形成来讲,在图像表示方面体现为多尺度几何分析,无论是曲波(curvelets)、带波(bandlets),还是仿形波(coutourlets),都要求基函数应具备下述特点:(i)多分辨率分析,(ii)时频定位能力,(iii)全角度分析(方向性),(iv)各向异性的尺度变换。这些新的冗余函数系统的不断涌现,使信号稀疏表示的方法更加成为研究的热点。
超完备信号稀疏表示方法肇始于20世纪90年代。1993年Mallat和Zhang首次提出了应用超完备冗余字典对信号进行稀疏分解的思想,并引入了匹配追踪(marching pursuit, MP)算法。在这篇文献中,作者用自然语言表述浅显的类比,说明超完备冗余字典对信号表示的必要性,同时强调字典的构成应较好地复合信号本身所固有的特性,以实现MP算法的自适应分解。
新思想的提出引起人们极大的关注,但由于算法所涉及的计算量十分繁重,因而早期研究的焦点集中在如何实现算法的快速计算,降低算法的复杂度,以及选择何种类型原子构造合适的字典两方面。这期间,许多音视频信号处理方面的实验都对MP算法作出了有利的支持,尤其在甚低码率视频编码方面,MP算法更显示出极大的优越性.
1999年Donoho等人又另辟蹊径,提出了基追踪(basis pursuit, BP)算法,并从实验的角度举证了MP,MOF,和BOB算法各自的优劣。稍后,又在2001年发表的另一篇重要文章中,给出了基于BP算法的稀疏表示具有唯一解的边界条件,并提出了字典的互不相干性的概念。
注:摘自《基于冗余字典的信号超完备表示与稀疏分解》
自1807年Fourier 提出任意一个周期为2π的函数都可以表示成一系列三角函数的代数和,到今天蓬勃发展的小波分析,科学家们的研究目的是对不同的函数空间提供一种直接、简便的分析方式,即寻求函数在某一特定空间下,在某种基下的最优逼近。逼近的误差体现了用此基表示函数的稀疏程度或是分解系数的能量集中程度。
Fourier分析的思想是将函数表示为具有不同频率的谐波函数的线性叠加,即将函数用一簇三角基展开,将原函数在时域中的讨论转换为对这个叠加权系数的讨论,即Fourier 变换在频域中的研究。这种三角体系展开方式的局限性促使人们去寻找其他的正交体系——小波分析。小波分析的地位在数学界是独一无二的,它较精确的时频定位特性,成为处理非平稳信号的有利工具;也证明了小波分析比Fourier 分析更能稀疏地表示一段分段光滑或有界变差函数。这是小波分析成功的一个关键原因。但是,由于张量积小波只具有有限方向数,它主要适合表示一维奇异性的对象,当它在处理二维或更高维奇异性时,就显得无能为力。小波在表示这些函数时并不是最优的或者最稀疏的表示方法。
为了更好地处理高维奇异性,一类带有方向性的稀疏表示方法——多尺度几何分析应运而生。它的产生符合人类视觉皮层对图像有效表示的要求,即局部性、方向性和多尺度性。它的目的就是为具有面奇异或线奇异的高维函数找到最优或最稀疏的表示方法。目前,已有的多尺度几何分析方法有Emmanuel J Candès等人提出的脊波变换(ridgelet transform)、单尺度脊波变换(monoscale ridgelet transform)、curvelet变换(curvelet transform),E. Le Pennec等人提出的bandelet变换,以及M.N.Do 等人提出的contourlet变换。另外,还有一些多尺度分析方法,如David Donoho 提出的wedgelet、beamlet等。本文根据以上方法出现的时间顺序来讨论其逼近性能的异同。在图像处理方面,图像的稀疏表示在对图像数据的存储、传输中得到了广泛的应用。由于余弦基和小波基能够用较少的系数达到图像较精确的非线性逼近,成为图像稀疏表示的重要方法。如今,多尺度几何分析的出现,又为图像的稀疏表示提供了一个全新而又有效的方法。
1奇异性分析
本文称无限次可导的函数是光滑的或没有奇异性的。若函数在某处有间断或某阶导数不连续,则称该函数在此处有奇异性。图像的奇异性或非正则结构通常包含了图像的本质信息。例如图像亮度的不连续性表示景物中的边缘部分,这是认识图中最重要的部分。图像的奇异性是常见的,也是重要的。在自然界中光滑物体的边界往往体现为沿光滑曲线的奇异性,并不仅是点的奇异性。在数学上,通常用Lipschitz指数刻画信号的奇异性大小[8]。
3多尺度几何分析
3.1脊波变换
脊波理论的基本框架是由E.J Candès 建立,并与D.L.Donoho等人在其后续工作中[12]逐步拓展和完善。脊波变换是一种非自适应的高维函数表示方法,对含