Sparse and Low-Rank Matrix Decompositions
基于低秩矩阵恢复的去噪方法在石油测井中的应用
基于低秩矩阵恢复的去噪方法在石油测井中的应用王艳伟;夏克文;牛文佳;Ali Ahamd【摘要】随着测井技术的发展,各大油田采集和存储的测井数据量呈井喷式增长,并存在大量冗余和噪声,在进行油气层识别前必须对测井数据进行压缩和去噪等预处理.低秩矩阵恢复(Low-Rank Matrix Recovery,LRMR)理论将压缩感知(Compressed Sensing,CS)中向量样例的稀疏表示推广到矩阵的低秩情形,从较大但稀疏的误差中恢复出本质上低秩的数据矩阵,可更好地保持数据结构,提高去噪效果.因此将低秩矩阵恢复理论中的去噪方法应用于石油测井中,实现对测井数据的去噪处理.对比研究了加速近端梯度算法(Accelerate Proximal Gradient,APG)、精确增广拉格朗日乘子(Exact Augmented Lagrange Multipliers, EALM)法和非精确增广拉格朗日乘子法(Inexact Augmented Lagrange Multipliers,IALM)在测井数据中的去噪效果,对去噪前后的测井数据分别采用支持向量机(Support Vector Machine,SVM)和相关向量机(Relevance Vector Machine,RVM)进行油气层识别,结果表明,与不去噪情况相比,利用三种算法进行去噪处理后油气层识别精度都有了显著提升.通过参数优化减少迭代次数,可使得IALM算法在运算时间上优于EALM 算法和APG算法,明显提高了运算效率.%With the development of well logging techniques,the repository of data in the major oil fields has shown an enormous growth.Presence of redundancy and noise in well logging data requires the data to be compressed and denoised to make it useful for recognition of oil and gas layers.Low-rank matrix recovery (LRMR) theory generalizes the sparse representation of vector samples in compressed sensing (CS) to the matrix of low rank case.This theory considers recovery of the low-rank data matrix from large and sparseerrors,leading to better maintenance of data structure and achieving a superior denoising effect.Thus,here we propose a denoising method through low-rank matrix recovery,and application of its three algorithms (accelerated proximal gradient (APG) algorithm,exact augmented Lagrange multiplier (EALM),and inexact augmented Lagrange multiplier (IALM)) to oil well log ging data to improve the denoising effect.Pre-and post-denoising logging data were consequently used in oil and gas layer recognition by support vector machine (SVM) and relevance vector machine (RVM),respectively.Results show that oil and gas layer recognition accuracy is improved remarkably by the three denoisingalgorithms,compared to when denoising was not applied.IALM algorithm was superior to EALM and APG algorithms,through parameter optimization to reduce the number of iterations,which could obviously improve the operation efficiency.【期刊名称】《石油物探》【年(卷),期】2017(056)005【总页数】7页(P644-650)【关键词】石油测井;数据去噪;低秩矩阵恢复;加速近端梯度算法;增广拉格朗日乘子法【作者】王艳伟;夏克文;牛文佳;Ali Ahamd【作者单位】河北工业大学电子信息工程学院,天津300401;河北省大数据计算重点实验室,天津300401;河北工业大学电子信息工程学院,天津300401;河北省大数据计算重点实验室,天津300401;河北工业大学电子信息工程学院,天津300401;河北省大数据计算重点实验室,天津300401;河北工业大学电子信息工程学院,天津300401;河北省大数据计算重点实验室,天津300401【正文语种】中文【中图分类】P631在油气测井过程中,所得测井数据量庞大,其中必定存在大量的数据冗余和噪声[1],在进行油气层识别前需要进行数据压缩和去噪等预处理,并保证数据处理后满足识别所需的最小精度。
基于向量稀疏和矩阵低秩的压缩感知核磁共振图像重建算法
基于向量稀疏和矩阵低秩的压缩感知核磁共振图像重建算法张红雨【摘要】当前基于压缩感知理论的核磁共振图像重建算法大多仅利用图像数据的稀疏性或者低秩性,并没有同时利用图像的这两个性质.本文提出了一种基于向量稀疏性和矩阵低秩性的压缩感知核磁共振图像重建方法.该方法利用核磁共振图像中图像块的非局部相似性对求解优化模型的经典非线性共轭梯度算法进行改进.主要是在共轭梯度算法的迭代过程中对每一图像块寻找其相似块,由于相似块的像素组成的矩阵具有低秩性,因此利用矩阵低秩恢复算法对每一图像块进行更新.改进后的方法同时利用了图像数据的稀疏性和低秩性.实验结果表明,该方法相对于现有的具有代表性的图像重建算法相比,提升了重建图像的质量,具有较高的信噪比.%Most of the Magnetic Resonance Image (MRI) reconstruction algorithms that based on compressed sensing theory were only used the sparsity or low-rank of the image data,they did not use the two properties at the same time.In this paper,we propose a new kind of MR image reconstructed algorithm for utilizing sparse vector and low-rank matrix based on compressed sensing theory.This method utilizes the non-local similarity of the image blocks in the MRI to improve the classical nonlinear conjugate gradient method for sloving the optimization model.In the iterative process of conjugate gradient algorithm for each image block to find the similar blocks,due to the matrix that includes the pixel of the similar blocks is low-rank,therefore,we apply to the low-rank matrix recovery algorithm to update each image block.The proposed method improves the quality ofreconstructed image and has a higher signal to noise ratio when compared with the exisiting reconstruction algorithms.【期刊名称】《天津理工大学学报》【年(卷),期】2017(033)001【总页数】5页(P25-29)【关键词】核磁共振成像;压缩感知;稀疏性;低秩性;共轭梯度法【作者】张红雨【作者单位】天津大学理学院,天津300350【正文语种】中文【中图分类】TP391.41磁共振成像技术(Magnetic Resonance Imaging,MRI)是20世纪80年代发展起来的影像检查技术.由于其不仅可以清楚地显示人体病理结构的形态信息,特别是对软骨组织具有很强的分辨能力,且对人体无辐射危害,近年来被广泛的应用于临床医学等领域.但MRI存在成像速度慢,易产生伪影等缺点.研究人员针对这些缺点展开了深入的研究.目前研究方向较多的是如何在减少采样数据时有效的重建图像,即在减少扫描时间的同时尽量提高图像的分辨率.近年来,Donoho与Candes等人提出的压缩感知(Compressive Sensing,CS)理论表明,如果信号具有稀疏性或在某个变换域下具有稀疏性,可以用一个与变换基不相关的观测矩阵将高维信号投影到低维空间中,然后通过求解优化问题就可以从少量投影中精确的重建出原信号[1-2].MR图像重建具备压缩感知理论应用的两个关键条件.首先MR图像满足在小波,差分等变换域下具有稀疏性,其次对K空间数据欠采样引起的混叠伪影是非相干的.为此,利用压缩感知理论可以从欠采样的K空间数据中恢复出原图像.近年来压缩感知理论在MRI领域的应用已成为研究热点.目前在压缩感知理论框架下很多文章利用MR图像在不同转换域上的稀疏性作为先验知识建立模型,实现了MR图像的快速重建[2-6].Donoho等[2]利用MR图像在总变分(total variation,TV)域的稀疏性采用共轭梯度算法求解MR重建问题.Lustig等[3]利用MR图像在小波域的稀疏性和TV的稀疏性设计了在K空间欠采样下重建MRI的优化模型.Ravishanker等[5]借鉴基于块稀疏的自适应字典稀疏的重建方法-KSVD[4],提出了基于KSVD的自适应字典学习的MRI重建算法DLMRI(Dictionary Learning Magnetic Resonance Imaging).Huang等[6]利用MR图像在小波域和TV域的稀疏性,使用算子分裂算法将MRI重建问题分解并提出了FCSA(FastCompositeSplittingAlgorithms)算法对分解后问题进行求解.Li等[7]利用MR图像在轮廓波域,小波域和TV域的稀疏性作为正则项建立优化模型,将快速迭代阈值算法(Fast iterative shrinkage/threshold algorithm,FIATA)进行改进对其进行求解,提高了重建图像的质量和计算效率.自然图像中存在大量重复的相似结构,这些相似结构不仅包括在平滑区域里,而且也存在于纹理区域和边缘部分中.图像的这个性质—非局部相似性对图像进行恢复重建在图像细节保真方面得到了提升.Buades等[8]通过在图像中搜索相似块并对其进行加权平均滤波进行图像去噪,取得良好的去燥效果.Dabov等[9]提出一种新的块匹配算法(BM3D),这种方法利用图像块的相似性对图像块进行聚类并采用滤波对图像进行重建.Dong等[10]提出了一种新的基于相似块的局部自适应迭代奇异值阈值的低秩算法,在解决图像重建问题中取得了不错的重建效果.自然图像的非局部相似性同样在MR图像中也普遍存在[11].Aksam M等[11]利用块的相似性和冗余性提出了增强非局部均值算法应用到脑部MRI图像去噪和分割中.Qu等[12]提出了从下采样的K空间数据中利用基于块的方向小波的方法来重建MR图像.Huang等[13]改进了FCSA算法,用非局部TV去代替FCSA中的TV,提高了图像重建的整体质量.本文提出了基于向量稀疏性和矩阵低秩性相结合的压缩感知核磁共振图像重建方法.在原有基于向量稀疏的求解模型中,通过利用MR图像的非局部相似性质,对共轭梯度算法进行改进.改进后的算法主要是在迭代过程中通过块匹配方法对每一图像块寻找其相似快,由相似块的像素组成的矩阵具有低秩性,然后使用矩阵低秩恢复算法对图像块进行更新.文献[2]在压缩感知理论框架下运用MR图像在傅里叶域和TV域上的稀疏性进行重建.本文对文献[2]中的求解算法作了改进,改进的算法同时利用了MR图像的向量稀疏性和矩阵低秩性两个先验知识.下面先简要介绍文献[2]提出的基于向量稀疏的压缩感知重建MR图像的方法.1.1 基于向量稀疏的压缩感知MR图像重建方法设x为要重建的MR图像,对x进行稀疏变换为x=ψα、α,是图像x在ψ域的稀疏表示系数,然后用一个与变换矩阵ψ不相关的测量矩阵Φ对图像x进行线性投影,从而得到线性观测值y.MR图像的重建问题就是要根据观测值y重建MR 图像[1][14].该问题属于逆问题的求解.因为MR图像在许多变换域上是稀疏的,Candes等[15]证明了MR重建问题可以通过求解最小L0范数得到解决.由于L0问题是NP-hard 问题,Donoho等[16]提出了用L0范数代替L0范数,进而转化为一个凸优化问题.即其中x是待重建的图像,y是在Fourier变换域下的观测数据,Fu为MRI傅里叶域下的随机欠采样算子,ψ表示稀疏域.将TV作为稀疏正则项,保留了图像的边缘和细节信息[17].因此文献[2]同时利用MR图像在傅里叶域和TV域上稀疏性,得到下面的模型(2).分别表示第一,第二维度方向像素的离散梯度.对于模型(2),文献[2]采用非线性共轭梯度算法进行求解.此算法的主要步骤为:Step1:设置初始参数并计算初始梯度:x0为待重建MR图像,y为Fourier变换域下的观测数据,α,β为线性搜索参数,iter为迭代次数,Tol为迭代停止精度,并令k:=0.Step2:计算初始下降搜索方向:Step3:若‖gk‖<Tol同时k>iter时,停止计算,输出x*=xk.Step4:确定搜索步长t.初始化t=1,当满足条件f(xk+txk)>f(xk)+αt*Re al(gk*Δxk),令步长为t=βt.Step5:图像更新并计算下降搜索方向:Step6:迭代次数更新:令k:=k+1,转步Step3.1.2 基于矩阵低秩的压缩感知MR图像重建算法图像的每一个像素都与其周围的像素点共同构成图像中的一个结构.以某个像素点为中心取窗口称该窗口为图像块.所取图像块包含一定的空间结构,而在图像中存在大量重复相似结构信息,这可以看做图像本身结构细节部分具有非局部相似性.如图1所示,在图像中取一小块,则可以在图像中找到多处与此图像块相似的小块.本文利用MRI具有的非局部相似性对文献[2]的求解算法进行改进,使得MRI重建算法不仅利用了MRI在傅里叶域和TV域上具有稀疏性,同时也考虑了具有相似特性的图像块所构成矩阵的低秩特性.本文采用改进后的非线性共轭梯度算法求解优化问题.原算法在Step5中采用最速下降法直接对图像进行更新,而改进后的算法先在Step5中使用矩阵低秩算法对图像块进行更新后,再使用最速下降法进行二次更新.具体操作如下:将图像x分成若干小图像块,对每一个图像块寻找其对应的相似图像块进行聚类,将相似图像块的像素组成近似低秩矩阵的列向量.采用下面模型对近似低秩矩阵寻找相似图像块的低秩子空间:其中P=[p1,p2,…,pm]表示相似块构成的矩阵,U表示为左乘矩阵,V为右乘矩阵,∑=diag{λ1,λi,…,λk}为对角矩阵,λi为奇异值,τ为正则参数.分为两步对问题(5)进行迭代求解.①对低秩矩阵P进行SVD分解:(U,∑,V)=svd(P).②对经过SVD分解得到的奇异值进行软阈值操作:,其中Sτ表示为阈值为τ的软阈值操作.因此新的低秩矩阵为P*=UVT.得到的每一个新的低秩矩阵作为更新图像块的初始估计,再将更新后的图像进行最速下降法的二次更新.改进后的方法充分利用图像数据的稀疏性和低秩性,从而更好地平滑噪声和保持图像边缘信息.为了验证本文改进的算法的性能和效果,对两幅经典MR图像进行测试.测试图像的尺寸均为256*256.如图2列出了两幅原始图像(不含噪声).首先对原始K空间数据加入噪声方差为0.01的高斯白噪声后进行欠采样(采样率为0.2),然后再用欠采样数据进行图像重建.实验部分测量矩阵采用的是高斯随机观测矩阵,稀疏变换域为Fourier域,图像块的大小为7*7.为了验证算法的有效性,本文算法将与CG算法[2],SparseMRI算法[3],FCSA算法[6],FICOTA算法[7]进行比较.实验结果的对比,主要采用主观比较和客观评价标准比较相结合的方式.主观比较主要比较MR图像重建的整体效果和图像纹理,边缘等局部细节.客观评价标准采用PSNR(peak signal-to noise radio),TEI(Tranferred edge information)和数据逼真项L2范数误差这三项来评估重建效果.图3,图4为两幅图像在不同算法下的重建效果,图5为重建Shoulder图像的局部细节图.通过图3,图4可以看出,与其他算法相比,本文方法整体重建效果较清晰.从图5可以看出,本文重建的纹理细节较为清晰,边缘锯齿较小,平滑了噪声.表1,表2为测试图像在不同算法下的客观评价标准对比.通过表1,表2可以看出,对于测试图像Brain和Shoulder,从客观标准PSNR和TEI的值来看,本文算法高于其他算法,说明本文算法重建图像的质量最好.而L2范数误差值的角度来看,本文方法的值要小于其他算法,说明本文算法重建图像与原图像之间的误差最小.通过表1,2的结果分析,本文方法在3个客观评价标准的性能方面都高于其它4种方法,从客观上反映了本文方法取得了较好的重建效果.因此无论是从重建MR图像质量的主观比较还是客观评价标准来对比,本文算法能够很好地利用K空间欠采样数据重建出效果更好的MR图像,而且从整体图像的重建效果来看,本文算法都要优于其他算法.本文提出了一种基于向量稀疏和矩阵低秩的压缩感知MR图像重建的方法,使用矩阵低秩算法对非线性共轭梯度算法进行改进,充分将图像数据的稀疏性和低秩性结合在一起.通过与其他算法对比,本文算法具有较高的信噪比,重建的图像整体更为清晰,更好地平滑噪声和保持图像边缘信息.下一步工作将进一步探究图像数据的稀疏性和低秩性在MR图像中实现更加快速和有效的重建.【相关文献】[1]Donoho pressed sensing[J].IEEE Transactions on Information Theory,2006,50(1):1289-1306.[2]Lustig M,Donoho D,Santos J M,et pressed sensing MRI[J].IEEE Signal Processing Magazine.2008,25(2):72-82.[3]Lustig M,Donoho D,Pauly J M.Sparse MRI:The application of compressed sensing for rapid MR imaging[J].Mag-netic Resonance in Medicine,2007,58(2):1182-1195.[4]Aharon M,Elad M,Bruckstein A,et al.K-SVD:An algorithm for designing of overcomplete dictionaries for sparse representation[J].IEEE Trans on Signal Processing,2006,54(1):4311-4322.[5]Raavishankar S,Bresler Y.MR Image reconstruction from highly undersampled k-space data by dictionary learning[J].IEEE Trans on Medical Imaging,2011,30(3):1028-1041.[6]Huang J,Zhang S,Metaxas D.Efficient MR image reconstruction for compressed MR imaging[J].Medical Image Anlysis,2011,15(5):670-679.[7]Li J W,Hao W L,Qu X B,et al.Fat iterative contourlet thresholding for compressed sensing MRI[J].Electronics Letters.2013,49(19):1206-1208.[8]Buade A,Morel J M.A non-local algorithm for image denoising[C]//Proceedingsof the 2005 Computer Vision and Pattern Recognition(CVPR).San Francisco.CA:IEEE,2005:60-65.[9]Dabov K,Foi A,Katkovnik V,et al.Image denoising by sparse 3D transform-somain collaborative filtering[J].IEEE Trans on Image Processing.2007,16(1):2080-2095.[10]Dong W S,Shi G M,Li X.Nonlocal image restoration with bilateral variance estimation:a low-rank approach[J].IEEE Trans on image processing,2013,22(2):700-712.[11]Aksam M,Jalil A,Rathore S,et al.A.Robust brain MRI den-oising and segmentation using enhanced non-local means algorithm[J].International Journal of Imaging Systems and Technology,2014,24:52-66.[12]Qu X,Guo D,Ning B.et al.Undersampled MRI reconstruction with patch-based directional wavelets[J].Magnetic resonance imaging,2012,30(1):967-977.[13]Huang J,Yang pressed magnetic resonance imaging based on wavelet sparsity and nonlocal total variation[J]. Proceedings,2012,5(1):968-971.[14]石光明,刘丹华,高大化,等.压缩感知理论及其研究进展[J].电子学报,2009,37(5):1070-1081.[15]Candes E J,Tao T.Robust uncertainty principles:exact signal reconstruction from highly incomplete frequency Information[J].IEEE Trans on Information Theory,2006,52(1):489-509.[16] Donoho D.Atomic decomposition by basis pursuit[J].SIAM Review,2001,43(1):129-159.[17]Rudin L,Osher S.Non-linear total variation noise removal algorithm[J].Phys D,1992,60(2):259-268.。
low-rank adaptation原理
Low-Rank Adaptation(低秩自适应)是一种基于低秩适应的微调技术,旨在通过用低维结构近似大型模型的高维结构来降低其复杂性的技术。
在语言模型的上下文中,这意味着创建一个更小、更易于管理的原始模型表示,它仍然可以很好地执行特定的任务或领域。
低秩适应背后的思想是,对于许多任务,大型模型的高维结构可能包含冗余或不相关的信息。
通过识别和删除这种冗余,可以创建一个更有效的模型,保留其原始性能,但需要更少的资源来培训和部署。
Low-Rank Adaptation的主要组成部分包括预训练语言模型(一种大规模的语言模型,如GPT或BERT,它已经在不同的任务和领域集上进行了训练)和低秩适应层
(在预训练模型的权重矩阵上添加一个低秩矩阵,使模型能够更有效地学习特定于任务的信息)。
Low-Rank Adaptation的工作原理是通过在其权重矩阵中引入低秩矩阵来适应预训
练的语言模型。
该低秩自适应层初始化随机值,并在微调过程中更新。
Low-Rank
Adaptation的适应过程的关键步骤包括初始化(从一个预训练的语言模型开始,
并在其权重矩阵中添加一个低秩适应层)和微调(在新的任务或领域上训练模型,只更新低秩适应层,同时保持预训练模型的权重固定)。
与完全微调相比,Low-Rank Adaptation可以将GPT-3的可训练参数数量减少1万倍,计算硬件要求减少3倍。
Low-Rank Adaptation在GPT-3和GPT-2上的模型
质量表现与微调相当或更好,尽管可训练参数较少,训练吞吐量更高,推理延迟没有增加。
低秩稀疏求解推导过程
低秩稀疏表示算法求解1. 鲁棒性主成分分析(Robust Principal Component Analysis, RPCA ) min L,E rank (L )+λ‖E ‖0 s.t.X =L +E (RPCA)min L,E ‖L ‖∗+λ‖E ‖1 s.t.X =L +E (RPCA 最终求解模型)假设背景存在单一的子空间,没有考虑到高光谱影像中复杂的背景地物信息2. 低秩表示算法(Low Rank Representation )min Z rank (Z ) s.t.X =DZ (LRR 初始模型)min Z,E ‖Z ‖∗+λ‖E ‖2,1 s.t.X =DZ +E (LRR 最终求解模型)3. 低秩和稀疏表示(Low Rank and Sparse Representation )min Z,E ‖Z ‖∗+‖Z ‖1+λ‖E ‖2,1 s.t.X =DZ +E (LRASR 最终求解模型)4. 字典学习的方法上面方法采用整个矩阵作为过完备字典,实际运算计算代价较大,因此采用了学习字典方法,用少量的原子构成字典x =Dα+v (系数α是稀疏的)α̂=argmin ‖x −Dα‖2+γ‖α‖1 (采用稀疏编码方法来求稀疏系数)D (n+1)=D n −μ∑(D n αi −x i )αi T M i=1 (字典学习过程)5. 单/多局部窗口低秩表示模型(SLW_LRRSTO/MLW_LRRSTO )min Z,E ‖Z ‖∗+η‖Z −Z ̃‖F2+λ‖E ‖2,1 s.t.X =DZ +E, 1d T ∙Z = 1n T矩阵的各种范数含义:‖∙‖∗ 核范数,矩阵的奇异值之和,用于rank (∙)的松弛求解‖∙‖0 0范数,矩阵中非零元素的个数,通常松弛到‖∙‖1之后进行求解‖∙‖1 1范数,矩阵元素的绝对值之和(稀疏规则算子,L1范数是L0范数的 最优凸近似,而且它比L0范数要容易优化求解)‖E ‖2,1 ℓ1,2范数,矩阵中各列的2范数之和‖∙‖F F 范数,矩阵元素的绝对值的平方和,再开方参数λ称为正则化参数,用于控制稀疏解的稀疏度,λ取值越大,解α就越稀疏。
PCA与SVD区别
PCA与SVD的区别1.1楼foreseer201初级会员注册于: 2006/12/29发帖数: 95近期看到这方面的内容,发现两者之间的区别:PCA对原数据的协方差矩阵(中心化后转置相乘)进行特征值分解,得到一组基底组成的矩阵。
然后原数据与之相乘得到在这组新基底下的投影数据,进行后续处理。
对协方差矩阵的分解,直观上理解为两个目的:降低相关性、保留方差大的样本数据。
但是SVD直接分解的是原数据。
虽然形式上与PCA相似(并且同时得到两个方向的PCA),但是不像PCA有那么直观的意义。
仅是从矩阵运算的形式上降维了原数据。
区别在于SVD得到的U阵和V阵是原数据转置相乘后的特征向量组,而PCA却是对其协方差矩阵特值分解。
那么是不是说,SVD分解后的U、V阵靠前的分量可以直接使用?而不必像PCA的需要投影?刘版那个“禁军教头林书豪”的例子中,就是直接使用的U阵前两个分量。
1 年前回复#回复2.2楼肖楠版主注册于: 2009/10/31发帖数: 2,794如果不考虑数据的均值,SVD 完全等价于PCA。
SVD 对稀疏数据用得更多一些。
1 年前回复#回复3.3楼ltx5151新手上路注册于: 2012/05/24发帖数: 6PCA and SVD are equivalent in certain sense, so no need to worry their differences. Assume X is the standardized data matrix, and the columns are variables, rows are samples. SVD of X is $$X =UDV^T$$, where the matrix $$UD$$ is just the principal component matrix that is used commonly, and if you just use the first k columns of $$UD$$, then it is the first k principal components. Actually, the implementation of most PCA functions in software is using SVD. PCA is an eigen decomposition of covariance matrix (note that this is the singular value decomposition for the covariance matrix, but this SVD is not the SVD we usually mean. When we say SVD, we normally refer the the SVD of X). PCA has its certain interpretations such as the largest variance directions. So one can argue that PCA focus more on covariance matrix while SVD focus more on the data itself. But there is no fundamental differences between PCA and SVD. From a matrix viewpoint, SVD are best low rank matrixapproximation in Frobenius norm, as well as as the low dimensional hyperplane approximation to the data cloud, which give much wider applications than PCA. As mentioned by nan.xiao, SVD is also widely used for sparse matrix or matrix completion with missing values, which is based on itsinterpretation which is NOT reflected by PCA.1 年前回复#回复4.4楼foreseer201初级会员注册于: 2006/12/29发帖数: 95Thanks for both reply."PCA focus more on covariance matrix while SVD focus more on the data itself." It was my confusion between PCA and SVD before."From a matrix viewpoint, SVD are best low rank matrix approximation in Frobenius norm, as well as as the low dimensional hyperplane approximation to the data cloud".Thus to some degree UD(first k columns) are equivalent XP(X is the data itself, P is the eigendecomposition result of covariance matrix. Also take the first k columns) in the respect ofapplication...。
基于低秩矩阵恢复的群稀疏表示人脸识别方法
基于低秩矩阵恢复的群稀疏表示人脸识别方法胡静; 陶洋; 郭坦; 孙雨浩; 胡昊; 王进【期刊名称】《《计算机工程与设计》》【年(卷),期】2019(040)012【总页数】6页(P3588-3593)【关键词】人脸识别; 群稀疏; 低秩恢复; 低秩映射矩阵; 重构残差【作者】胡静; 陶洋; 郭坦; 孙雨浩; 胡昊; 王进【作者单位】重庆邮电大学通信与信息工程学院重庆400065【正文语种】中文【中图分类】TP391.40 引言人脸识别有着广泛的应用前景。
但人脸数据类别多,每类数据少,不同人脸结构相似,是众多从事人脸识别研究的学者所面临的挑战。
稀疏表示(sparse representation based classification,SRC)[1]是目前人脸识别领域的热门研究方向,该方法实质上是最近邻(nearest neighbor,NN)[2]类内表示策略分类器的扩展。
SRC激发了一系列算法的提出,如模糊稀疏表示方法[3]、自适应加权空间稀疏表示方法[4]以及基于稀疏稠密混合表示的方法[5]等。
SRC方法要求训练样本是在较为理想的情况下采集的,而当训练图像中存在由遮挡、表情等引起的变化时,会破坏人脸图像样本。
另外,由于不同人脸间的相似性,SRC所得的表示系数虽然是稀疏的,但往往分布在多个类别,易导致误分类。
针对SRC方法的第一个问题,可以从训练集中分离出鉴别性的信息,如文献[6]中的鲁棒主成分分析算法(robust principal component analysis,RPCA),可将受污染的样本矩阵分解为低秩逼近矩阵和稀疏误差矩阵。
Chen等将低秩表示与低秩矩阵恢复(low rank matrix recovery,LR)[7]技术结合起来用于恢复数据中潜在的低秩结构,提出一种结构非相关性约束(low-rank matrix recovery with structural incoherence,LRSI)的思想[8]。
机器学习中矩阵低秩与稀疏近似
3、课程论文用 A4 纸双面打印。字体全部用宋体简体,题目 要求用小二号字加粗,标题行要求用小四号字加粗,正文内容要求 用小四号字;经学院同意,课程论文可以用英文撰写,字体全部用 Times New Roman,题目要求用 18 号字加粗;标题行要求用 14 号字加粗,正文内容要求用 12 号字;行距为 2 倍行距(方便教师 批注);页边距左为 3cm、右为 2cm、上为 2.5cm、下为 2.5cm;其 它格式请参照学位论文要求。
1.2 l0正则
l0正则是最直接最根本的稀疏学习技术。然而不幸的是,它具有组合的性质,是 个非凸正则子,难于分析。最小化l0范数是一个NP难的问题,在理论和实践中,均只 存在指数复杂度(相对于向量维数)的算法。一般来说,绝大多数算法对求l0只能得 到一个非精确解,有的直接求解最接近l0正则的凸l1正则(显然在lp正则中,p越少越
3
华南理工大学工学博士研究生课程论文
a) p ≥ 1
b) 0 < p < 1
图 1 当p ≥ 1与0 < p < 1时,lp正则子的形状示意图。
接近l0正则),也有的研究者使用如下函数逼近来逼近l0: x 0 ≈ i log(ε + |xi|),其 中ε是一个很小的正数,它是为了避免出现log 0数值上的无意义。但对于需要直接优
2
华南理工大学工学博士研究生课程论文
统计学习是当今机器学习领域的主流技术。向量空间的统计学习算法已经比较 成熟,近几年来,许多研究者主要把目光放在矩阵空间上。与向量空间相比,基于矩 阵空间的学习技术由于缺少扩展性,会随着问题的大小在空间和时间复杂度上分别 呈二次方与三次方增长,所以如何逼近一个目标矩阵而令机器学习技术更鲁棒更精 确更适合于大规模的情况已成为当今机器学习领域十分热门的话题。受到支持向量 机、压缩感知和非负矩阵分解等技术的启发,基于稀疏和低秩性质的假设,人们开发 了一系列基于矩阵方法的机器学习算法。
一种新的基于非凸秩近似的鲁棒主成分分析模型
一种新的基于非凸秩近似的鲁棒主成分分析模型潘鹏;王永丽;陈勇勇;王淑琴;贺国平【摘要】Robust principal component analysis (RPCA) aimed to recover a low rank matrix in applications of data mining,machine learning and image processing.The nuclear norm exists some disadvantages when dealing with in real-world sets as a convex approximation of the matrix rank function.In this paper,a new non-convex approximation function isproposed,combining with the advantages of the non-convex approximation of rank function.An improved RPCA model is proposed based on the new non-convex approximation function,and the augmented Lagrange multiplier method is used to solve he improvedmodel.Moreover,the numerical experiments with real-world application of video background separation show that our algorithms are helpful.%在机器学习、数据挖掘和图像处理等研究领域,鲁棒主成分分析(RPCA)主要用于恢复一个低秩的数据矩阵.考虑到核范数作为矩阵秩函数的凸近似在处理实际数据集时存在的问题,以及矩阵秩函数的非凸近似所展现出的优势,提出了一种新的非凸近似函数.基于该非凸近似函数,提出一个改进的RPCA模型,并应用增广拉格朗日乘子法对其进行求解.最后利用视频背景分离的实际数据,通过数值实验验证了新模型的有效性.【期刊名称】《科学技术与工程》【年(卷),期】2017(017)031【总页数】5页(P305-309)【关键词】鲁棒主成分分析;非凸近似;增广拉格朗日乘子法;视频背景分离【作者】潘鹏;王永丽;陈勇勇;王淑琴;贺国平【作者单位】山东科技大学数学与系统科学学院,青岛266590;山东科技大学数学与系统科学学院,青岛266590;山东科技大学数学与系统科学学院,青岛266590;山东科技大学数学与系统科学学院,青岛266590;山东省科学院,济南250000【正文语种】中文【中图分类】TP751.1由Candès等[1,2]和Donoho[3]提出的基于稀疏表示的压缩传感理论已广泛应用于信号和图像处理等领域。
Robust Principal Component Analysis
(Throughout the paper, M denotes the 2-norm; that is, the largest singular value of M .) This problem can be efficiently solved via the singular value decomposition (SVD) and enjoys a number of optimality properties when the noise N0 is small and i.i.d. Gaussian. Robust PCA. PCA is arguably the most widely used statistical tool for data analysis and dimensionality reduction today. However, its brittleness with respect to grossly corrupted observations often puts its validity in jeopardy – a single grossly corrupted entry in M could render the estimated ˆ arbitrarily far from the true L0 . Unfortunately, gross errors are now ubiquitous in modern appliL cations such as image processing, web data analysis, and bioinformatics, where some measurements may be arbitrarily corrupted (due to occlusions, malicious tampering, or sensor failures) or simply irrelevant to the low-dimensional structure we seek to identify. A number of natural approaches to robustifying PCA have been explored and proposed in the literature over several decades. The representative approaches include influence function techniques [26,47], multivariate trimming [19], alternating minimization [28], and random sampling techniques [17]. Unfortunately, none of these existing approaches yields a polynomial-time algorithm with strong performance guarantees under broad conditions3 . The new problem we consider here can be considered as an idealized version of Robust PCA, in which we aim to recover a low-rank matrix L0 from highly corrupted measurements M = L0 + S0 . Unlike the small noise term N0 in classical PCA, the entries in S0 can have arbitrarily large magnitude, and their support is assumed to be sparse but unknown4 .
Robust Principal Component Analysis
∗ John Wright† , Arvind Ganesh† , Shankar Rao† , and Yi Ma†
Department of Electrical Engineering University of Illinois at Urbana-Champaign Visual Computing Group Microsoft Research Asia
Abstract. Principal component analysis is a fundamental operation in computational data analysis, with myriad applications ranging from web search to bioinformatics to computer vision and image analysis. However, its performance and applicability in real scenarios are limited by a lack of robustness to outlying or corrupted observations. This paper considers the idealized “robust principal component analysis” problem of recovering a low rank matrix A from corrupted observations D = A + E . Here, the error entries E can be arbitrarily large (modeling grossly corrupted observations common in visual and bioinformatic data), but are assumed to be sparse. We prove that most matrices A can be efficiently and exactly recovered from most error sign-and-support patterns, by solving a simple convex program. Our result holds even when the rank of A grows nearly proportionally (up to a logarithmic factor) to the dimensionality of the observation space and the number of errors E grows in proportion to the total number of entries in the matrix. A by-product of our analysis is the first proportional growth results for the related but somewhat easier problem of completing a low-rank matrix from a small fraction of its entries. We propose an algorithm based on iterative thresholding that, for large matrices, is significantly faster and more scalable than general-purpose solvers. We give simulations and real-data examples corroborating the theoretical results.
矩阵低秩分解理论[行业严选]
• 于是Yk的更新过程为
• DULL比APG算法具有更好的可扩展性,这是因为在每次迭
代过程中对偶方法不需要矩一阵类特的制 完全奇异值分解。
10
增广拉格朗日乘子法(augmented Lagrange
multipliers,ALM)
• 构造增广拉格朗日函数:
• 当Y=Yk,μ=μ k ,使用交替式方法求解块优化问题
矩阵低秩分解理论及其应用分析
成科扬 2013年9月4日
一类特制
1
从稀疏表示到低秩分解
• 稀疏表示
✓ 压缩感知(Compressed sensing)
一类特制
2
从稀疏表示到低秩分解
• 矩阵低秩分解
observation
low-rank
sparse
✓ 矩阵低秩稀疏分解(Sparse and low-rank matrix decomposition)
• 为便于优化,凸松弛后转化为:
一类特制
23
低秩矩阵补全求解
• MC问题可应用ALM算法求解,将原优化问题重新表示为: 于是构造上述问题的部分增广拉格朗日函数为
一类特制
24
低秩矩阵补全应用
• 智能推荐系统
一类特制
25
低秩矩阵补全应用
• 电影去雨线处理
一类特制
26
基于r秩逼近的低秩矩阵分解及在铁轨缺陷检测中的应用
学校代码:10004 密级:公开北京交通大学硕士学位论文基于r秩逼近的低秩矩阵分解及在铁轨缺陷检测中的应用Low Rank Matrix Decomposition Based on r Rank Approximation and Its Application in Rail Defect Detection作者姓名:李德志学号:17120312导师姓名:岑翼刚职称:教授学位类别:工学学位级别:硕士学科专业:信号与信息处理研究方向:低秩矩阵分解北京交通大学2020年6月致谢三年的研究生生活匆匆而过,回首往昔的点点滴滴,令我不胜感慨。
在此,我衷心感谢我的导师岑翼刚教授。
犹记得刚刚踏入北京交通大学校门的我,对于未来的发展茫然而不知所措,对于周围的环境感到陌生而又格格不入,这些糟糕的事情因为岑老师的热情耐心而终得到解决。
当我不能够掌握自己的研究方向时,岑老师通过对公式进行一步一步地推理证明帮助我尽快地理解并掌握研究的方法;当我不能够很好地与他人沟通交流时,岑老师总是会带头组织一些实验室活动,使实验室的每一个人都能通过友好地沟通交流而增进感情。
岑老师也会经常将他看到的新颖知识点分享给我们,使得我们总能很快地接触到外界的学术发展变化。
与此同时,岑老师也会尽可能地邀请一些知名的专家学者来学校进行交流讨论,不断开阔我们的视野。
在这三年的学习生活中,岑老师不仅传授给我许多学术上的知识,还教会我很多为人处世的技巧。
我也要感谢实验室中的每一个人,感谢阚世超,周继坤,张芳慧,张悦、黄洁媛,杨帅,王荟苑,龚杰,杨熙,安梦蕾,宗佳平等师兄师姐,师弟师妹们在这三年里都一直友好热情地给我提供精神上以及物质上的帮助,使得我在学习上遭遇困难时,不曾苦恼于无计可施;在生活上遭遇挫折时,不曾消沉郁郁寡欢。
在此表示衷心的感谢!此外,还要感谢这三年里有意或者无意中帮助过我的老师、同学,感谢你们提供给我的帮助,感谢你们的无私奉献,使得我能够不断地克服困难,勇往直前。
基于稀疏和低秩Hankel矩阵分解的SAR图像相干斑抑制
①基金项目:国家自然科学基金青年项目(项目编号:61907008)。 作者简介:蔡金萍(1995—),女,汉族,广东信宜人,硕士,研究方向为合成孔径雷达信号处理、机器学习等。 通信作者:赵曜(1984—),男,汉族,江西赣州人,博士,副教授,研究方向为雷达系统设计、合成孔径雷达信号 处理、雷达跟踪滤波算法、稀疏信号处理等。E-mail:yaozhao@。
工业技术
图1 含噪图像矩阵提升到Hankel矩阵的示意图
(a()(原aa))图 (b(()bb噪)) 声图 (c)(L(cce))e (( dd(d)))Frost
文献标志码:A
文章编号:1674-098X(2020)11(b)-0069-08
SAR Image Despeckling Based on Sparse and Low-rank Hankel Matrix Decomposition
CAI Jinping ZHAO Yao* (School of Information Engineering, Guangdong University of Technology, Guangzhou, Guangdong
Province, 510006 China) Abstract: Synthetic Aperture Radar (SAR) is a research hotspot in modern remote sensing technology. When the radar wave reaches the rough surface, interference between the echoes occurs due to the difference of basics scatters phases. That causes a lot of speckle noise in the SAR image and affects the quality of the SAR image. In this paper, a method based on sparse and low-rank Hankel matrix decomposition proposes. Compared with the traditional algorithm, this method effectively improves the quality of the image and despeckles noise. While keeping the edge sharp, the smoothness of images is better improved. Through simulation experiments and real data experiments, it can conclude that the proposed algorithm has achieved better results in the aspect of SAR image speckling. Key Words: Synthetic aperture radar; Despeckling; Low-rank hankel matrix decomposition; Sparsity
稀疏优化与低秩矩阵优化
min x TVx s .t . Ax b, x 0, || x ||0 k .
(3)
三、应用实例
例2、互补问题的稀疏解 众说周知,二人矩阵博弈模型、具有生产和投资的经济 均衡模型、交通流均衡模型等,都可以转化为互补问题.如果 这个互补问题有多个解,则在这个解集中寻找一个最为稀疏 的解:
这个理论突破了香农定理对信号采样频率的限制,能够以
较少的采样资源,较高的采样速度和较低的软硬件复杂度获得 原始信号.
二、稀疏优化与压缩感知
假设原始信号为向量 x (维数大),测量信息为 b 向量 (维数小),且它们满足线性关系,则其数学模型就是一 个欠定线性方程组 Ax b. 如果原始信号 x 具有稀疏性,则其数学意义就是零元 素多,即非零元素少, 于是可以转化为稀疏优化模型:
min rank ( X ) s.t . X ij Mij ,
i , j .
(6)
三、应用实例
例5、多维标度问题(管理学、统计学) 已知12个城市中两两城市之间的距离,请你标出这12个 城市的平面坐标位置.类似地,已知一个传感器网络,通过互 相收发信号可以确定传感器之间的距离,请确定传感器的平 面坐标位置.此外,有100种白酒,品尝家可以对每两种白酒 进行品尝对比,给出一种相近程度的得分(越相近得分越高, 相差越远得分越低),我们希望从这些得分数据中得到这100 种白酒之间的排序表,所建立的数学模型就是一个矩阵秩极小 问题: min rank (Y ) (7) 2
四、理论与算法
■凸差松弛理论和算法
凸差松弛就是用(1范数-q范数)代替0-范数,从图像可以看 出,它更接近稀疏优化问题,能更好得区分无关项和相关项, 从而有助于得到较精确的逼近.
■光滑松弛理论和算法
鲁棒主成份分析(RPCA)
Robust PCA1. RPCA 简介1. 1 为什么使用RPCA?求解被高幅度尖锐噪声而不是高斯分布噪声污染的信号分离问题。
1.2 主要问题给定C = A*+B*, 其中A*是稀疏的尖锐噪声矩阵,B* 是低秩矩阵, 目的是从C中恢复B*.B*= UΣV‟, 其中U∈R n*k,Σ∈R k*k ,V∈R n*k3. 与PCA的区别PCA和RPCA 的目的都是矩阵分解, 然而,对于PCA, M = L0+N0, L0:低秩矩阵; N0: 小的idd Gaussian噪声矩阵, 通过最小化||M-L||2 且满足条件rank(L)<=k来搜索L0的最好秩k估计.通过SVD可以解决这个问题.对于RPCA, M = L0+S0, L0:低秩矩阵; S0: 稀疏尖峰噪声矩阵, 接下来将给出具体的求解过程.2. 正确分解的条件4. 病态问题:假设稀疏矩阵A*和B*=e i e j T 是分解问题的解.1) 假设B* 不仅低秩而且稀疏, 可找到另一个稀疏加低秩分解A1= A*+ e i e j T和B1 = 0, 因此, w我们需要对低秩有一个合理的认识确保B* 不是太稀疏. 稍后附加条件需要由奇异向量U和V所张成的空间(也就是B*的行列空间)与标准基“不连贯” 。
2) 相似地, 假设A* 是稀疏且低秩的(例如A*的第一列非零, 其他列为0, 则A* 秩为1且是稀疏的). 可找到另一个有效的分解A2=0,B2 = A*+B* (这里秩(B2) <= 秩(B*) + 1). 因此我们需要限制稀疏矩阵不应该是低秩的.即, 假设每一行/列不应该有太多的非零元素(不存在稠密的行/列), 避免这种情况发生.5. 正确恢复/分解的条件:如果A* 和B* 来自于这些类时, 则可以高概率获得精确恢复[1].1) 对于低秩矩阵L---随机正交模型[Candes andRecht 2008]:以如下方式构建秩k矩阵B* 其SVD分解为B*=UΣV‟ : 奇异向量U,V∈R n*k来自于对R n*k 中秩k偏等距算子的简单随机抽样. U和V的奇异向量不需要相互独立. 对奇异值无任何约束.2) 对于稀疏矩阵S---随机稀疏模型:矩阵A* 使得支撑(A*) 随机等可能地采样于尺度m的所有支撑集合中. There is no assumption made about the values of A* at locations specified by support(A*). [Support(M)]: M中非零元素的位置Latest [2] improved on the conditions and yields the …best‟ condition.3. 恢复算法6. Formulization对于分解D = A+E,其中A是低秩误差E是稀疏的.1) 凭直觉提出min rank(A)+γ||E||0, (1)然而这时非凸的,因此难于处理(两者是NP-hard需要近似处理).2) 放松条件L0-范数至L1范数,用核范数代替秩min||A||* + λ||E||1,where||A||* =Σiσi(A) (2)这是凸的, 也就是存在唯一的最小值解.理由: 注意到||A||* + λ||E||1 是rank(A)+γ||E||0在满足条件max(||A||2,2,||E||1, ∞)≤1上的集合(A,E) 的凸包.此外, there might be circumstances under which (2) perfectly recovers low-rank matrix A0.[3] shows it is indeed true under surprising broad conditions.7. 求解RPCA 的优化算法采用两种不同的方法求解. 第一种方法, 直接使用一阶方法求解邻近问题. (E.g. 邻近梯度, 加速邻近梯度(APG)), 每一次迭代的计算瓶颈是一个SVD计算.第二种方法是将问题转换为对偶问题求解, 从对偶优化解中重新得到邻近解. RPCA的对偶问题为:max Y trace(D T Y) , subject to J(Y) ≤ 1其中J(Y) = max(||Y||2,λ-1||Y||∞). ||A||x指A的x范数.(无穷范数表示矩阵中绝对值最大的一个)。
稀疏信号恢复问题解的个数
稀疏信号恢复问题解的个数∗廖安平;杨苗;谢家新;沈坤【摘要】This paper is concerned with the number of solution to sparse signal recovery problem based on linear measurements, which is an important problem in signal processing. In the noiseless measurement case, by taking advantage of the combinatorial analysis method, an upper bound is established for the number of solution to the sparse signal recovery problem, and by constructing a special linear measuring matrix, the best of the upper bound is proved as well. Moreover, if the measuring matrix satisfies some conditions, the upper bound could be improved. Based on these results, some new ideas of a finite search can be employed to solve the sparse signal recovery problem in some special cases.%稀疏信号恢复是信号处理研究领域中的重要问题,本文研究基于线性测量的稀疏信号恢复问题解的个数。
在无噪测量下,采用组合分析方法,给出了稀疏信号恢复问题解的个数的一个上界,并通过构造一个特殊的线性测量矩阵,证明了该上界是最佳的。
基于稀疏矩阵变换的电网故障电流快速算法
基于稀疏矩阵变换的电网故障电流快速算法陈志光;范幸;李一泉;朱峥;邱建;黄明辉【摘要】结合稀疏矩阵低阶更新算法和低秩分解理论,提出一种电网故障电流快速算法。
首先,基于对称分量法将故障引起的网络结构变化用经过相序变换的修正导纳矩阵表示;然后,根据非负矩阵分解原理将其变换成2个低秩矩阵乘积的形式;最后,利用已形成的因子表,采用低阶更新算法实现故障后网络电流的快速计算。
新算法充分利用了电力网络节点导纳矩阵的稀疏特征,对其进行低阶分解处理,大大减少了等值阻抗的计算量,提高了短路电流的计算速度。
分别在 IEEE-14、IEEE-30、IEEE-118和 IEEE-1047节点系统对新算法进行测试,并与传统的修正导纳矩阵法进行对比,结果表明新方法的计算精度能满足工程要求,在大规模系统中计算速度的优势明显。
%Combining sparse matrix low rank update algorithm and low rank decomposition theory,a kind of fast algorithm for power grid faulted current was proposed.Firstly,change of network structure caused by fault was shown by modified ad-mittance matrix after phase-sequence transformation.Then,according to non-negative matrix decomposition principle,the modified admittance matrix was transformedto form of product of two low rank matrix.Finally,the formed factor table and low rank update algorithm was used to realized fast calculation on network current after the fault.The new algorithm fully used sparse characteristic of admittance matrix of electric power network nodes to deal with low rank decomposition which greatly reduced calculated amount for equivalent impedence and improved calculation speed for short circuit current. IEEE-14 node system,IEEE-30 node system,IEEE-1 1 8 node systemand IEEE-1047 node system was respectively used for testing the new algorithm and compared results of the new algorithm with those of traditional modified admittance matrix methods.Results indicates that calculation precision of the new method could satisfy engineering requirements which is of obvious advantage in calculation speed for large scale system.【期刊名称】《广东电力》【年(卷),期】2015(000)009【总页数】6页(P50-55)【关键词】稀疏矩阵;低阶更新;低秩分解;修改导纳;故障电流【作者】陈志光;范幸;李一泉;朱峥;邱建;黄明辉【作者单位】广东电网有限责任公司电力调度控制中心,广东广州 510000;杭州智光一创科技有限公司,浙江杭州 310058;广东电网有限责任公司电力调度控制中心,广东广州 510000;广东电网有限责任公司电力调度控制中心,广东广州510000;广东电网有限责任公司电力调度控制中心,广东广州 510000;广东电网有限责任公司电力调度控制中心,广东广州 510000【正文语种】中文【中图分类】TM711.2随着电网负荷容量的不断增大、大容量发电机组和变电设备的大量投入以及大规模集中式风电等新能源基地的电源通过高电压等级网络与负荷中心的互联,电网负荷中心与电源的电气距离逐渐缩短,系统的短路电流水平逐渐增大,电网某些区域的线路和母线甚至出现短路电流临近极限的状况,严重威胁着大电网的安全稳定运行。
稀疏总结
稀疏表示在目标检测方面的学习总结1,稀疏表示的兴起大量研究表明视觉皮层复杂刺激的表达采用的是稀疏编码原则,以稀疏编码为基础的稀疏表示方法能较好刻画人类视觉系统对图像的认知特性,已引起人们极大的兴趣和关注,在机器学习和图像处理领域得到了广泛应用,是当前国内外的研究热点之一.[1]Vinje W E ,Gallant J L .Sparse coding and decorrelation in pri- mary visual cortex during natural vision [J].Science ,2000,287(5456):1273-1276.[2]Nirenberg S ,Carcieri S ,Jacobs A ,et al .Retinal ganglion cells act largely as independent encoders [J ].Nature ,2001,411(6838):698-701.[3]Serre T ,Wolf L ,Bileschi S ,et al .Robust object recognition with cortex-like mechanisms[J].IEEE Transactions on PatternAnalysis and Machine Intelligence ,2007,29(3):411-426.[4]赵松年,姚力,金真,等.视像整体特征在人类初级视皮层上的稀疏表象:脑功能成像的证据[J].科学通报,2008,53(11):1296-1304.图像稀疏表示研究主要沿着两条线展开:单一基方法和多基方法.前者主要是多尺度几何分析理论,认为图像具有非平稳性和非高斯性,用线性算法很难处理,应建立适合处理边缘及纹理各层面几何结构的图像模型,以脊波(Ridgelet)、曲波(Curvelet)等变换为代表的多尺度几何分析方法成为图像稀疏表示的有效途径;后者以Mallat 和Zhang 提出的过完备字典分解理论为基础,根据信号本身的特点自适应选取能够稀疏表示信号的冗余基。
低秩稀疏矩阵分解
低秩稀疏矩阵分解
低秩稀疏矩阵分解(Low Rank and Sparse Matrix Factorization)是一种常见的矩阵分解方法。
该算法的目的是将一个
给定的矩阵分解为一个低秩矩阵和一个稀疏矩阵的乘积。
这种方法的优点在于可以同时减少矩阵的维度,并去除其中的噪声。
在实际应用中,低秩稀疏矩阵分解被广泛应用于图像、语音、天
气预报等领域。
人们可以通过该算法从原始数据中提取出有用的信息,并进行进一步的分析和处理。
该算法的实现基于矩阵分解和优化技术,并需要对数据的结构有
深入的了解。
因此,对于初学者而言,需要较长时间的学习和实践才
能够熟练掌握该技术。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Sparse and Low-Rank Matrix Decompositions摘要:我们考虑如下的基本问题:给定一个由未知稀疏矩阵和未知的低秩矩阵的和的矩阵,能够精确的恢复他们吗?这种恢复的能力有很大的用处在许多领域,一般情况下,这个目标是病态的和NP难的。
本文提出了如下的研究:(a)一个新的矩阵不确定性原则;(b)一个简单的基于凸优化的精确分解方法。
我们的不确定规则是一个量化的概念,即矩阵不可能稀疏当有漫行列空间时。
他决定了什么时候分解问题是病态的,并形成了我们的分解方法和分析基础。
我们提出决定条件—在稀疏和低秩元素上—在这种条件下我们的方法可以精确的恢复。
1、引言给定一个由未知稀疏矩阵和未知低秩矩阵加和的矩阵,我们研究如何把矩阵分开为稀疏成分和低秩成分。
这样的问题在很多领域得到应用,比如:统计模型选择,机器学习,系统鉴别,计算复杂度理论,及光学等。
本文我们提出在何种条件下这个分解问题是适定的,例如,稀疏和低秩成分在根本上是可识别的,目前的凸松弛精确的恢复稀疏和低秩成分。
主要结果:令,是一个稀疏矩阵,是一个低秩矩阵。
给定矩阵C后,目标是在不知道的稀疏模式和的秩或奇异值的情况下恢复和。
在没有额外条件下这个问题是完全不适定的。
在很多条件下,一个特定的解是不存在的;比如说低秩矩阵本身就稀疏,这就使得很难从另一个稀疏矩阵中唯一的区别出来。
为了知道何时精确解所示可能的,我们定义了新的秩-稀疏不相关概念,他通过一个不确定原则将矩阵的稀疏模式和矩阵的行或列空间联系到一起。
我们的分析是几何形式的,并且从切空间到稀疏和低秩矩阵代数簇扮演了重要的角色。
解决这样的分解问题是NP难的。
一个合理的首要方法是最小化,满足约束条件A+B=C,式中,作为稀疏和秩的折中。
这个问题在解决上是复杂且顽固的;我们提出一个较好的凸优化问题,目标是的凸松弛。
我们松弛通过用L1范数来代替他,他表示矩阵A中所有元素绝对值的和。
我们松弛通过用核范数来代替他,核范数是矩阵B的奇异值的和。
注意到核范数可以被看作是‘L1范数’施加到奇异值上(即矩阵的秩是非零奇异值的个数)。
L1范数和核范数是非常好的替代品,并且一些结果给出在一些条件下这些松弛可以恢复稀疏和低秩对象。
因此,我们得目的是把C分解为,用如下的凸松弛:我们可以把(1)式转会为一个半定问题(SDP)【18】,并且这个半定问题存在多项式时间内的通用求解器。
我们指出,稀疏和低秩矩阵在特定条件下,SDP式(1)的最优特定解是。
事实上,精确恢复的条件只是基础辨识条件的轻度紧缩。
本质上这些条件需要稀疏矩阵没有集中在一个行或列上的支撑,而低秩矩阵没有行或列空间与坐标轴严格对齐。
我们的条件的一个有趣的特点是对稀疏矩阵非零值和低秩矩阵的奇异值的幅度没有假设要求。
我们同时给出的数值决定方式。
本文不给出结果的详细的证明。
在【3】中有证明。
应用:我们简要的列出我们的方法的部分应用;【3】中有更详细的细节。
在统计模型选择设置上,稀疏矩阵可以和高斯图模型相关【11】,低秩矩阵可以总结未观察,潜在变量的效果。
把一个给定的模型分解为这些简单的部分对研究有效的评估和推理算法是很有用的。
在计算复杂度上,矩阵刚性的概念捕捉矩阵(矩阵应该改变(这种变化可以是任意幅度的变化),为了减小矩阵的秩到特定的水平之下)元素的最小值。
矩阵的刚性界复杂性理论中有几个意义。
相似的,在系统鉴定设置上,低秩矩阵代表系统的一个小的模型阶,而稀疏矩阵代表系统有一个稀疏冲击响应。
把系统分解为这些简单的成分可以提供简单的更有效的描述。
在光学上,许多现实世界的图像成像系统有效的描述为一个对角矩阵(代表所谓的‘非相干’系统)和一个低秩矩阵(相干分量)的和。
我们的结果提供好的方法来描述一个有简单系统组成的复合光学系统。
更一般地,我们的方法同时也扩展秩最小化的适用性,比如说光谱数据分析。
II、可识别性就像在引言中介绍的那样,在没有额外条件下矩阵分解问题是病态问题。
本节中,我们讨论和量化使分解唯一的所需要的加在稀疏和低秩矩阵上的假设条件。
贯穿全文,我们把我们限制在的矩阵来避免杂乱的符号。
我们的分析扩展到矩形矩阵,如果我们用代替n。
A、准备工作我们首先以简单的描述和稀疏低秩矩阵的代数簇特性开始。
代数簇是一个多项式方程系统的解的集合。
稀疏矩阵被他们的支撑的大小所约束,可以看作代数簇:这个簇的维度是m.事实上,可以看作个子空间的联合,并且每一个子空间。
一看就知道是一个簇,我们注意到簇的联合也是一个簇,中个子空间可以表述为一个线性方程系统。
对任何一个,M中关于的切空间由下式给出:如果,的维数就是m。
我们把当作中的子空间。
秩约束矩阵的簇定义为:这个簇的维度是。
一看就知道,是一个簇,注意到中的一个矩阵中的任何一个(k+1)*(k+1)子矩阵的行列式一定是0。
在矩阵的元素(复数)中任何一个子矩阵的行列式是一个多项式,那么就是一个多项式方程的解的集合。
对任何一个矩阵,M中关于的切空间是所有矩阵的集合,与任意和M中相同的行空间或者列空间。
特别的,令是M的奇异值分解,,,然后我们有;T(M)的维度是k(2n-k).前面我们把T(M)看作中的子空间。
既然T(M)和都是中的子空间,我们可以比较这两个子空间的向量。
详细的见文献【3】。
B、可识别问题我们介绍两种情况。
这些例子意味着额外的约束,这些约束被需要,为了确保存在独特的分解为稀疏和低秩矩阵。
首先,令是任意的稀疏矩阵,令,式中表示第i个标准的基向量。
既然这样,秩为1的矩阵也是稀疏的,并且一个有效的稀疏加低秩分解可能是。
这样我们需要条件使得低秩矩阵不是太稀疏的。
对任何一个矩阵M,考虑如下的相对于切空间的数量:式中是谱范数(比如说最大奇异值),表示行和最大。
这样就很小,意味着切空间的元素不可能有他们的支撑在几个集中的地方;结果是M不可能很稀疏。
我们形式化这个想法,通过把行列空间不相干概念和联系起来,这里我们把行或列空间当作不相干的,在关于标准基时,如果这些空间不和坐标轴对齐。
令,用如下的公式描述M中行列空间的不相干性:这里表示向量的L2范数,表示投影到行或列空间。
因此,评价的是行列空间与坐标轴最对齐的投影。
对任何秩为k的矩阵M,我们有,式中最小边界如果在行或列空间属于任何k个n*n正交Hadamard矩阵的列的集合(span(v1,v2……vk)),而上界可以到达如果行或列空间包含标准的基向量。
典型的一个矩阵M有不相干的行或列空间,就会有。
如下的结果表明M中的行或列越不相干,就越小。
命题1:对任何,我们有,(6)和(7)中对有定义。
实例:如果是一个满纸的矩阵,或者一个诸如的矩阵,那么。
那么M中行或列不相干的边界对确定的边界很重要。
下一步考虑是任何一个低秩矩阵,,v是的第一列。
那么,就有零元素在第一行,,C和有相同的列空间。
一个合理的稀疏加低秩分解在这种情况下可能是及。
这里。
需要稀疏矩阵有有界度(比如每一行或列有很少的非零元素)来避免可识别问题。
对于任何矩阵M,我们定义如下的关于切空间的数量:一个矩阵的数量很小意味着切空间的元素的光谱不是很集中,例如这些要素的奇异值不是很大。
在下面的问题中将看到,一个有界度(每行或列有很少的非零值)稀疏矩阵M有小的。
命题2:令是任何一个每行或列最多有个非零元的矩阵,并且每行或列至少有个非零元。
在式(8)中已经定义,我们有:实例:注意到如果有满支撑,例如:。
因此,每行或列中零元素的个数对的边界来说是一个很好的约束。
我们在这里强调,简单的对M中非零值个数设定边界是不充分的;稀疏模式在确定的值时也起到很大的作用。
III、秩稀疏不确定原则和精确恢复本节中,我们看到,稀疏矩阵有小的,低秩矩阵有小的,,并且,事实上,可以精确的恢复通过使用SDP(1)。
A、切空间可识别性在分析能否被精确恢复之前(用SDP(1)),我们问一个简单的问题。
假设我们有关于切空间的先验信息,并且给定。
我们能唯一的从C恢复出吗?假设这种切空间的先验信息在实际上是不现实的,相当于假设的支撑和的行或列空间的先验知识;然而,我们对在精确分解上有关于稀疏和低秩矩阵的非常有用的条件有很好的了解。
给定且空间的信息,一个唯一恢复的充分必要条件是且空间和横向相交:也就是,子空间有简单的交叉点。
条件的充分性对分解的唯一性是很清楚的。
对于必要性的部分,suppose for the sake of a contradiction that 一个非零矩阵M 属于;则可以分别加和减M从,而仍然有有效的分解,这违反了唯一性的要求。
事实上,公式(9)所描述的切空间的横向交叉也是使SDP(1)有唯一优化解的一个条件之一。
如下的命题提出了一个关于的简单的条件,使得切空间横向相交。
命题3:对任何两个矩阵,我们有:式中,在(6)和(8)中定义,切空间在(3)和(5)中定义。
很小意味着空间横向相交;所以,我们可以精确的恢复在给定时。
在下面的一部分,我们将会看到对命题3的适当的收紧对识别来说也是充分的,来确保恢复的精确性用SDP(1)方法。
命题3的另一个重要的结果是我们对如下的秩-稀疏不确定准则有初步的证据。
定理1:对任何矩阵M不等于0,有。
证明:给定,很显然,比如说M同时是两个切空间的元素。
然而,意味着,这是矛盾的。
所以,我们有。
因此,对于任意矩阵,不肯很小。
注意到命题3包括是对不同矩阵的断言,而定理1是对相同矩阵的关于的声明。
本质上,不确定性准则断言,不可能有矩阵太稀疏当有不相干的行和列空间时。
极端的例子是矩阵,他有这样的特性:。
B、使用半定规划问题精确恢复我们主要的结果是如下样本,确定性充分条件用来精确恢复使用SDP(1)。
定理2:给定,如果:那么,问题(1)的特定优化是,在的变化范围为:应用命题1和2及定理2,我们有如下的结果,他给出了具体的能被精确恢复的稀疏和低秩矩阵类别。
推论3:假设满足。
给定的特定最优解是,在的变化范围内。
(用SDP(1)方法)。
因此,稀疏矩阵with bounded degree及低秩矩阵with row/column spaces not closelyaligned with the coordinate axes 可以被特定的分解。
我们在这里强调,我们的结果提供确定性的充分条件对精确分解来说。
我们同时注意到,这些条件仅仅包含A* 的稀疏模式和B* 的行列空间。
对A* 的非零元素和B* 的奇异值没有依赖。
原因是(1)的梯度最优条件仅仅包括切空间,而不是A* 的具体非零元或B* 的奇异值。
IV、仿真结果我们确定本文的理论用简单实验的实验结果。
在这些实验中,我们产生如下的任意的秩为k的矩阵B* 在中:产生任意,服从独立同分布的高斯元,设置。
我们产生一个随机的m稀疏的矩阵A*通过设置均匀随机的大小为m的支撑,并且,设置支撑值是服从独立同分布高斯分布。