压缩感知原理汇总
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
压缩感知原理
1压缩感知引论
传统方式下的信号处理,是按照奈奎斯特采样定理对信号进行采样,得到大量的采样数据,需要先获取整个信号再进行压缩,其压缩过程如图2.1。
图2.1 传统的信号压缩过程
在此过程中,大部分采样数据将会被抛弃,即高速采样后再压缩的过程浪费了大量的采样资源,这就极大地增加了存储和传输的代价。
由于带宽的限制,许多信号只包含少量的重要频率的信息。所以大部分信号是稀疏的或是可压缩的,对于这种类型的信号,既然传统方法采样的多数数据会被抛弃,那么,为什么还要获取全部数据而不直接获取需要保留的数据呢?Candes和Donoho等人于2004年提出了压缩感知理论。该理论可以理解为将模拟数据节约地转换成压缩数字形式,避免了资源的浪费。即,在采样信号的同时就对数据进行适当的压缩,相当于在采样过程中寻找最少的系数来表示信号,并能用适当的重构算法从压缩数据中恢复出原始信号。压缩感知的主要目标是从少量的非适应线性测量中精确有效地重构信号。核心概念在于试图从原理上降低对一个信号进行测量的成本。压缩感知包含了许多重要的数学理论,具有广泛的应用前景,最近几年引起广泛的关注,得到了蓬勃的发展。
2压缩感知原理
压缩感知,也被称为压缩传感或压缩采样,是一种利用稀疏的或可压缩的信号进行信号重构的技术。或者可以说是信号在采样的同时被压缩,从而在很大程度上降低了采样率。压缩感知跳过了采集N个样本这一步骤,直接获得压缩的信号的表示。CS理论利用到了许多自然信号在特定的基 上具有紧凑的表示。即这些信号是“稀疏”的或“可压缩”的。由于这一特性,压缩感知理论的信号编解码框架和传统的压缩过程大不一样,主要包括信号的稀疏表示、编码测量和重构算法等三个方面。
对于一个实值的有限长一维离散时间信号X ,可以看作为一个N R 空间N ×1的维的列向量,元素为[
]n ,n ,=1,2,…N 。N R 空间的任何信号都可以用N ×1维的基向量{}1i N i =ψ的线性组合表示。为简化问题,假定这些基是规范正交的。把向量{}1i N i =ψ作为列向量形成N N ⨯的基矩阵ψ:=[12,,ψψ ⋯ ,N ψ],于是任意信号X 都可以表示为:
X =ψΘ (2.1)
其中Θ是投影系数Θ=[],i i X θ=⎡ψ⎤⎣⎦构成的N ×1的列向量。显然,X 和Θ是同一个信号的等价表示,X 是信号在时域的表示,Θ则是信号在ψ域的表示。如果Θ的非零个数比N 小很多,则表明该信号是可压缩的。一般而言,可压缩信号是指可以用K 个大系数很好地逼近的信号,即它在某个正交基下的展开的系数按一定量级呈现指数衰减,具有非常少的大系数和许多小系数。这种通过变换实现压缩的方法称为变换编码。在数据采样系统中,采样速率高但信号是可压缩的,采样得到N 点采样信号X ;通过T X Θ=ψ变换后计算出完整的变换系数集合{}i θ;确定K 个大系数的位置,然后扔掉N K -个小系数;对K 个大系数的值和位置进行编码,从而达到压缩的目的。
由Candes 、Romberg 、Tao 和Donoho 等人在2004年提出的压缩感知理论表明,可以在不丢失逼近原信号所需信息的情况下,用最少的观测次数来采样信号,实现信号的降维处理,即直接对信号进行较少采样得到信号的压缩表示,且不经过进行N 次采样的中间阶段,从而在节约采样和传输成本的情况下,达到了在采样的同时进行压缩的目的。Candes 证明了只要信号在某一个正交空间具有稀疏性,就能以较低的频率()M N <<采样信号,而且可以以高概率重构该信号。即,设定设长度为N 的信号X 在某正交基或框架ψ上的变换系数是稀疏的,如果我们可以用一个与变换基ψ不相关的观测基 :M N ⨯()M N <<对系数向量进行线性变换,并得到观测集合:1Y M ⨯。那么就可以利用优化求解方法从观测集合中精确或高概率地重构原始信号X 。
图2.2是基于压缩感知理论的信号重构过程框图。
图2.2 基于压缩感知理论的信号重构过程
基于压缩感知的信号重构主要包含了信号的稀疏表示、编码测量和重构算法三个步骤。第一步,如果信号X ∈N R 在某个正交基或紧框架ψ上是可压缩的,求出变换系数T X Θ=ψ,Θ是ψ的等价或逼近的稀疏表示;第二步,设计一个平稳的、与变换基ψ不相关的M N ⨯维的观测矩阵Φ,对Θ进行观测得到观测集合T Y X =ΦΘ=Φψ,该过程也可以表示为信号X 通过矩阵CS A 进行非自适应观测:CS Y A = (其中CS T A =Φψ),CS A 称为CS 信息算子;第三步,利用0-范数意义下的优
化问题求解X 的精确或近似逼近ˆX
: 0
min T X ψ s.t. CS T A X X Y =Φψ= (2.2) 求得的向量X 在基上的表示最稀疏。
针对上述的三个步骤,下面将一一解决其中的三个问题。
2.1 信号的稀疏表示
压缩感知的第一步即,对于信号X ∈N R ,如何找到某个正交基或紧框架ψ,使其在ψ上的表示是稀疏的,即信号的稀疏表示问题。
所谓的稀疏,就是指信号X 在正交基下的变换系数向量为T X Θ=ψ,假如对于02p <<和0R >,这些系数满足:
1/P P i P i R θ⎛⎫Θ≡≤ ⎪⎝⎭∑ (2.3)
则说明系数向量Θ在某种意义下是稀疏的。如何找到信号最佳的稀疏域?这是压缩感知理论应用的基础和前提,只有选择合适的基表示信号才能保证信号的稀疏度,从而保证信号的恢复精度。在研究信号的稀疏表示时,可以通过变换系数衰减速度来衡量变换基的稀疏表示能力。Candes 和Tao 研究表明,满足具有幂次速度衰减的信号,可利用压缩感知理论得到恢复,并且重构误差满足:
62ˆ(/log )r r E X X C K N -=-≤⋅ (2.4)
其中r=1/p – 1/2,0
文献[8]指出光滑信号的Fourier 系数、小波系数、有界变差函数的全变差范数、振荡信号的Gabor 系数及具有不连续边缘的图像信号的Curvelet 系数等都具有足够的稀疏性,可以通过压缩感知理论恢复信号。如何找到或构造适合一类信号的正交基,以求得信号的最稀疏表示,这是一个有待进一步研究的问题。Peyre 把变换基是正交基的条件扩展到了由多个正交基构成的正交基字典。即在某个正交基字典里,自适应地寻找可以逼近某一种信号特征的最优正交基,根据不同的信号寻找最适合信号特性的一个正交基,对信号进行变换以得到最稀疏的信号表示。
对稀疏表示研究的另一个热点是信号在冗余字典下的稀疏分解。这是一种全新的信号表示理论:用超完备的冗余函数库取代基函数,称之为冗余字典,字典中的元素被称为原子。字典的选择应尽可能好地符合被逼近信号的结构,其构成可以没有任何限制。从冗余字典中找到具有最佳线性组合的K 项原子来表示一个信号,称作信号的稀疏逼近或高度非线性逼近。从非线性逼近角度来讲,信号的稀疏逼近包含两个层面:一是根据目标函数从一个给定的基库中挑选好的或最好的基;二是从这个好的基中挑选最佳的K 项组合。因此,目前信号在冗余字典下的稀疏表示的研究集中在两个方面:(1)如何构造一个适合某一类信号的冗余字典;(2)如何设计快速有效的稀疏分解算法。
在构造冗余字典方面,文献[16]中提出使用局部Cosine 基来刻画声音信号的局部频域特性;利用bandlet 基来刻画图像中的几何边缘;还可以把其它的具有不同形状的基函数归入字典,如适合刻画纹理的Gabor 基、适合刻画轮廓的Curvelet 基等等。在稀疏分解算法的设计方面,基于贪婪迭代思想的MP(Matching Pursuit)算法表现出极大的优越性,但不是全局最优解。Donoho 等人之后提出了基追踪(basis pursuit ,BP)算法。BP 算法具有全局最优的优点,但计算复杂度极高。之后又出现了一系列同样基于贪婪迭代思想的改进算法,如正交匹配追踪算法(OMP),分段匹配追踪(StOMP)算法等。
2.2 测量矩阵的选取
如何设计一个平稳的、与变换基ψ不相关的M N ⨯维的观测矩阵Φ,保证稀疏向量Θ从N 维降到M 维时重要信息不遭破坏,是第二步要解决的问题,也就是信号