基于 建模的稳健稀疏 低秩矩阵分解
低秩矩阵分解与逼近
机器学习10.低秩矩阵分解主要内容低秩矩阵分解问题L2VS L1主要问题:缺失+噪音 CWMMoG主要内容低秩矩阵分解问题L2VS L1主要问题:缺失+噪音 CWMMoG已知数据:计算两个低秩矩阵目标:使低秩矩阵乘积尽可能重目标使低秩矩阵乘积尽可能重建原矩阵大量应用:运动中的结构检测社交网络/推荐系统(E.g.,Eriksson and Hengel ,2010)人脸建模信息提取(E.g.,Cheng et al., 2012)(E.g., Candes et al.,2012)(E.g. Deerwester et al. 1990)关键问题:☐如何度量原数据与重建数据偏差?性能?最常见误差函数选择:最常见误差函数选择主要内容低秩矩阵分解问题 L2VS L1主要问题:缺失+噪音 CWMMoG各自优劣?L2模型的解为?加正交约束有无影响?L2范数模型L1 范数模型 SVDY oung diagram (CVPR, 2008)T orre&Black (ICCV , 2001) R1PCA (ICML, 2006) L2 Wiberg (IJCV , 2007)LM_S/LM_M (IJCV , 2008)SALS (CVIU, 2010)LRSDP (NIPS, 2010)PCAL1 (PAMI, 2008) ALP/AQP (CVPR, 2005) L1Wiberg (CVPR, 2010, best paper award) RegL1ALM (CVPR, 2012) Damped Wiberg (ICCV , 2011)Weighted SVD (T echnometrics, 1979) WLRA (ICML, 2003)Damped Newton (CVPR, 2005) CWM (AAAI, 2013)Reg-ALM-L1 (CVPR, 2013)L2范数模型L1 范数模型SVDY oung diagram (CVPR, 2008) T orre&Black (ICCV , 2001) R1PCA (ICML, 2006) L2 Wiberg (IJCV , 2007) LM_S/LM_M (IJCV , 2008) SALS (CVIU, 2010) LRSDP (NIPS, 2010)PCAL1 (PAMI, 2008) ALP/AQP (CVPR, 2005)L1Wiberg (CVPR, 2010, best paper award) RegL1ALM (CVPR, 2012)Damped Wiberg (ICCV , 2011)Weighted SVD (T echnometrics, 1979) WLRA (ICML, 2003)Damped Newton (CVPR, 2005) CWM (AAAI, 2013)Reg-ALM-L1 (CVPR, 2013)L2范数模型L1 范数模型优点: 光滑模型优点: 对极端异常点表现稳健算法速度快在无缺失前提下有全局极优缺点: 对异常点与强噪音点表现不稳缺点: 非光滑模型算法速度慢健在高斯噪音下表现不佳R b t P bl 为什么?!Robust Problem为什么对于大误差点的惩罚Mean vs Median 误差分布假设主要内容低秩矩阵分解问题 L2VS L1主要问题:缺失+噪音 CWM MoG数据缺失强噪音{01}⨯d n ,{0,1},∈∈ij W R w 为Hardamard 乘积算子L1低秩矩阵分解模型对异常点与强噪音表现稳健!✓Ke and Kanade, CVPR, 2005✓Eriksson and van den Hengel, CVPR, 2010✓Kwak TPAMI 2008Kwak, TPAMI, 2008✓Wright et al., NIPS, 2009✓Zheng et al., CVPR, 2012✓…L1 Low-Ranki i iMatrix Factorization典型方法:✓ALP: Ke and Kanade, CVPR. 2005Wib L1E ik d d H l CVPR2010✓WibergL1: Eriksson and van den Hengel, CVPR. 2010.✓PCAL1: Kwak, TPAMI. 2008.✓Robust PCA: Wright et al., NIPS. 2009.✓RegL1ALM: Zheng et al., CVPR. 2012✓…优点✓对异常点表现稳健缺点✓非光滑非凸模型✓算法速度慢主要内容低秩矩阵分解问题 L2VS L1主要问题:缺失+噪音 CWM MoGCWMCoordinate D t动机在很多其它机器学习问题中坐标下降算法Descent : 在很多其它机器学习问题中,坐标下降算法已经成为非常有效的计算方法之一LassoRidge RegressionElastic Net. (Friedman et al., 2007; 2010)坐标下降:将原问题分解为针对每个变量元素优化的子问题,然后顺序求解,对L1 LRMF 问题而言:每个子问题均是凸的每个子问题均可通过加权均值滤子快速准确求解算法复杂度与数据大小与维度呈近似线性增长Cyclic Weighted MedianW X UVT()L1难点?CWML1 LRMF 模型可按如下两种方式进行分解11()()-=-∑TTj j j L L W X UV W X u v 11()()=-=-∑Ti i i i j ji L L jW E u v w e u ij v 11()()-=-∑Ti j ji L L W X UV we v ij u jT i j j j i E X u v ≠=-∑, j w 与 j w分别为W 的第j 列和行, i j e 与i j e 分别为i E 的第j 列和行,ij u 与ij v 分别为i u 与i v 的第j 个元素.Cyclic Weighted Median-TW X UV 1()L VSVS.1()-i j ji L w e u ij v 1-i j jj i L w e w u ijv ()-i j ji w e v ij u -i j jj i w e w v ij u 1L 1LCyclic Weighted MedianL1 LRMF 关于U,V的子关于每个变量元素的子问题问题Cyclic Weighted Median每个子问题转换为一个标准的加权均值问题!Cyclic Weighted MedianL1 LRMF 目标函数在迭代过程中单调递减!Cyclic Weighted Median计算复杂度:稠密数据:O(d logd)稀疏数据:O(s logs)稠密数据:O(n logn)稀疏数据:O(s logs)s 为数据矩阵每列/行的本质稀疏度当数据矩阵高度稀疏时, CWM 计算复杂度仅为O((n+d)s), 少于现有最快的算法复杂度O(dn).O((+d)) O(d)Cyclic Weighted Median人工: 100个矩阵,每个大小为7×12,秩为3.Cyclic Weighted Median人脸数据人脸数据:Yale B dataset✓Facedata1 & Facedata2:每组包含64张脸,每个脸大小包含一定程度的缺失与24×21,包含定程度的缺失与椒盐噪声点。
稀疏表示与低秩矩阵分解方法在图像重建中的应用
稀疏表示与低秩矩阵分解方法在图像重建中的应用近年来,随着科学技术的不断发展,图像处理技术已经得到了广泛的发展和应用。
在图像处理过程中,图像重建是其中十分重要的一个过程,它可以使图像更加清晰,具有更高的质量,并且使人们更加方便地进行图像处理和分析。
这篇文章将主要讨论稀疏表示和低秩矩阵分解方法在图像重建中的应用。
一、稀疏表示在图像重建中的应用稀疏表示是一种数字信号处理中的一个重要方法,它已经被广泛应用于图像处理领域。
稀疏表示的主要思想是将一个向量(或矩阵)表示成若干个基向量的线性组合,其中只有很少的基向量参与了该向量的表示。
稀疏表示的优点在于它可以使高维度的数据变得更加简单和易于处理。
在图像重建中,稀疏表示可以用于处理采样不足或失真严重的图像。
具体的处理方法是利用图像的稀疏性质,将一个稀疏的信号进行压缩表示,然后在原有采样信号的基础上,加上这个压缩信号,从而得到一个更加清晰的图像。
当然,在使用稀疏表示进行图像重建时,我们需要选取合适的基向量,以使得稀疏表示的过程能够更加准确和高效。
二、低秩矩阵分解在图像重建中的应用低秩矩阵分解,也称为矩阵分解低秩近似,是另一种在图像处理中广泛应用的方法。
其主要思想是将一个任意大小的矩阵表示为两个低秩矩阵之和,其中一个矩阵代表该矩阵的平均值,称为秩为1的矩阵,另一个矩阵代表该矩阵的扰动项,通常有较低的秩,也称为低秩矩阵。
相比于稀疏表示方法,低秩矩阵分解方法更加注重矩阵的结构和局部特征的处理,所以在处理图像时起到了较好的效果。
低秩矩阵分解常常用于图像去噪、图像填补和图像重构等方面的处理。
它能够有效地减小噪声和伪像的干扰,同时也能保留图像的细节和轮廓信息。
三、稀疏表示与低秩矩阵分解的结合应用稀疏表示与低秩矩阵分解的组合成了一种新的图像重建方法——稀疏表示与低秩矩阵分解联合重建方法。
该方法主要是将两种基于矩阵结构特点处理的方法结合到一起,以充分利用它们在图像重建中的优势。
具体而言,该方法首先利用稀疏表示方法处理图像的高边缘和高频部分,然后再利用低秩矩阵分解方法对图像的低频和低边缘部分进行处理。
稀疏优化与低秩矩阵优化
【3】Z.Y. Luo, L.Y. Qin, L.C. Kong, N.H. Xiu, The Nonnegative Zero Norm Minimization under Generalized Z-matrix Measurement, JOTA, 2013.
问题: min rank(Y )
(7)
s.t. (Y ) D2 ,Ye 0,Y 0.
这里,是一个特定的线性算子.
三、应用实例
例6、Sparse-Viso CT CT是医学诊断的主要工具之一,其成像的数学原理是
Ax=b,其中x是一个未知向量,表示人体待检查部位的图像, 维数512*512代表像素个数,b是一个测量值,其维数为 1160*672代表射线的条数(1160代表圆周划分的角度),A是 (1160*672,512*512)阶矩阵,由物理规律得到.由于其行 数大于列数,一般情况下该方程无解.更为可怕的是行数多意 味着“吃线”多,对人的身体危害极大.期望:“吃线少、时 间短、图像清晰”.现在,假设人体待检查部位的图像稀疏, 那么应用稀疏优化理论和算法,可以进行研究。
这是一个矩阵秩极小问题.
三、应用实例
例4(上)、Netflix Prize 2006年10月Netflix电影公司为了有效发展自己的推荐系
统而发起的长达5年的竞赛,要求参赛者根据48万余用户对1 万7千部电影的不完全评分记录推测出另外近300万条电影评 分记录的数值.任何组织或个人只要能提交比Netflix现有电 影推荐系统Cinematch效果好10%的新方法,就可以获得诱人 的7位数奖金.不仅如此,每年它还会为此提供5万美元的年度 进步奖.
基于低秩矩阵分解的光场稀疏采样及重构
基于低秩矩阵分解的光场稀疏采样及重构覃亚丽;张晓帅;余临倩【期刊名称】《光学精密工程》【年(卷),期】2017(025)005【摘要】光场成像技术中光场的采集和数据的压缩处理是亟待解决的问题.为了实现光场的稀疏采样和恢复,建立了基于光场低秩结构的压缩采样相机系统,研究了光场矩阵的结构特征及压缩采样下光场图像的重构问题.根据静态光场各视点图像之间的内容相似性,将这些图像向量化并按列组合成一个二维矩阵,该矩阵呈现出低秩或近似低秩的状态.对光场图像矩阵进行低秩分解,结果表明偏离低秩的部分呈现出很强的稀疏性性质,低秩和稀疏各自表征不同的数据冗余度.然后,对基于掩膜的相机采样系统进行随机Noiselets变换测量,鉴于重构过程是一个低秩稀疏相关性约束下的优化求解问题,采用贪婪迭代求解分别重构出光场矩阵的低秩部分和稀疏部分.仿真结果表明,重构图像的PSNR维持在25 dB以上,且保留了光场视点间的视差信息,能够满足稀疏采样中对光场图像的要求.【总页数】7页(P1171-1177)【作者】覃亚丽;张晓帅;余临倩【作者单位】浙江工业大学信息工程学院,浙江杭州 310023;浙江工业大学信息工程学院,浙江杭州 310023;浙江工业大学信息工程学院,浙江杭州 310023【正文语种】中文【中图分类】TN911.74;TP391.41【相关文献】1.基于稀疏与低秩矩阵分解的视频背景建模 [J], 周密;宋占杰2.基于低秩矩阵分解和稀疏表达的人脸识别方法 [J], 谭群超3.基于低秩稀疏矩阵分解的非接触心率估计 [J], 黄继风; 白国臣; 熊乃学; 魏建国4.基于低秩稀疏矩阵分解的非接触心率估计 [J], 黄继风; 白国臣; 熊乃学; 魏建国5.基于稀疏和低秩Hankel矩阵分解的SAR图像相干斑抑制 [J], 蔡金萍;赵曜因版权原因,仅展示原文概要,查看原文内容请购买。
低秩与稀疏正则化在图像去噪与分割中的建模研究
低秩与稀疏正则化在图像去噪与分割中的建模研究低秩与稀疏正则化在图像去噪与分割中的建模研究摘要:图像去噪与分割是图像处理领域的重要问题。
为了提高图像去噪与分割的效果,近年来研究者们提出了许多基于低秩和稀疏正则化的方法。
本文将重点探讨低秩和稀疏正则化在图像去噪与分割中的建模研究。
首先介绍了低秩和稀疏正则化的基本原理和数学模型,然后详细讨论了低秩和稀疏正则化在图像去噪和分割中的应用方法,并通过实际案例进行验证。
最后,并对未来低秩和稀疏正则化在图像去噪与分割中的研究方向进行了展望。
1. 引言图像去噪与分割是图像处理领域的重要问题,广泛应用于计算机视觉、人工智能等领域。
图像去噪是指在有噪声的图像中恢复原始图像,而图像分割则是将图像划分为不同的区域,以实现目标检测、目标追踪等应用。
然而,由于各种因素的影响,图像往往存在各种不同类型的噪声,如高斯噪声、椒盐噪声等,这会影响到图像去噪与分割的效果。
2. 低秩与稀疏正则化的基本原理与模型2.1 低秩正则化低秩正则化是一种通过对图像矩阵进行降秩处理来恢复真实图像信息的方法。
低秩正则化的基本思想是,真实图像往往具有较低的秩,即具有较少的独立信息,而噪声和干扰会导致图像矩阵的秩升高。
因此,通过对图像矩阵进行低秩正则化处理,可以去除图像中的噪声和干扰,从而恢复原始图像。
2.2 稀疏正则化稀疏正则化是一种通过对图像进行稀疏表示处理来去噪和分割的方法。
稀疏正则化的基本思想是,真实图像在某种表示下可以被稀疏表示,即可以用较少的非零系数表示图像。
而噪声和干扰会导致图像在稀疏表示下的系数变得更加密集,因此通过对图像进行稀疏正则化处理,可以去除图像中的噪声和干扰,实现去噪和分割的效果。
3. 低秩与稀疏正则化在图像去噪中的研究与应用3.1 基于低秩正则化的图像去噪方法基于低秩正则化的图像去噪方法主要包括基于低秩矩阵分解的方法和基于低秩约束的方法。
低秩矩阵分解方法通过对图像矩阵进行SVD分解,将低秩约束转化为对特征值的约束,从而实现去噪的效果。
稀疏优化与低秩矩阵优化演示文稿
条件
.从而得到稀疏优化模型: x k
0பைடு நூலகம்
min xTVx
s.t. Ax b,
x 0,
(3)
|| x ||0 k.
第10页,共23页。
三、应用实例
例2、互补问题的稀疏解
众说周知,二人矩阵博弈模型、具有生产和投资的经济均衡模型、交
通流均衡模型等,都可以转化为互补问题.如果这个互补问题有多个解 ,则在这个解集中寻找一个最为稀疏的解:
第16页,共23页。
三、应用实例
例6、Sparse-Viso CT CT是医学诊断的主要工具之一,其成像的数学原理是Ax=b,其中
x是一个未知向量,表示人体待检查部位的图像,维数512*512代表像素个
数,b是一个测量值,其维数为1160*672代表射线的条数(1160代表 圆周划分的角度),A是(1160*672,512*512)阶矩阵,由物理规律 得到.由于其行数大于列数,一般情况下该方程无解.更为可怕的是行 数多意味着“吃线”多,对人的身体危害极大.期望:“吃线少、时 间短、图像清晰”.现在,假设人体待检查部位的图像稀疏,那么应用稀
矩阵秩极小(或低秩矩阵恢复)问题是指在某种线性约束条件下,求一个
决策矩阵使其秩达到极小.它的基本数学模型是:
min rank( X ) s.t. A( X ) b, (2) 其中 A是从 Rm到n 的Rd线性变换,b 是一个 d 维向量.
第3页,共23页。
一、模型与基本概念
【注】
1、模型(2)是模型(1)的一个推广; 2、可以把零范数和秩函数放在约束中,变成 非凸 约束
疏优化理论和算法,可以进行研究。
第17页,共23页。
四、理论与算法
凸松弛理论和算法
低秩矩阵与稀疏表示
低秩矩阵与稀疏表示1. 概述低秩矩阵和稀疏表示是两个相关的数学概念,在许多领域都有着广泛的应用。
低秩矩阵是指秩较低的矩阵,而稀疏矩阵是指包含大量零元素的矩阵。
稀疏表示是指使用一组有限的基向量来表示一个信号或数据。
2. 低秩矩阵低秩矩阵在许多领域都有着广泛的应用,例如:图像处理:图像通常可以表示为低秩矩阵,因此可以通过低秩矩阵分解来进行图像压缩、降噪和去模糊等操作。
自然语言处理:文本数据通常也可以表示为低秩矩阵,因此可以通过低秩矩阵分解来进行文本分类、文档聚类和信息检索等操作。
推荐系统:推荐系统通常需要对用户和物品之间的数据进行建模,而低秩矩阵分解可以用来构建用户-物品矩阵,从而实现个性化推荐。
3. 稀疏表示稀疏表示在许多领域也有着广泛的应用,例如:信号处理:信号通常可以表示为稀疏向量,因此可以通过稀疏表示来进行信号压缩、降噪和去噪等操作。
图像处理:图像通常也可以表示为稀疏矩阵,因此可以通过稀疏表示来进行图像压缩、降噪和去模糊等操作。
机器学习:机器学习算法通常需要对数据进行建模,而稀疏表示可以用来构建稀疏模型,从而提高模型的性能。
4. 低秩矩阵与稀疏表示的关系低秩矩阵和稀疏表示之间存在着密切的关系。
一方面,低秩矩阵通常可以表示为稀疏矩阵,另一方面,稀疏矩阵通常也可以表示为低秩矩阵。
因此,低秩矩阵分解和稀疏表示可以相互转化。
5. 低秩矩阵与稀疏表示的应用低秩矩阵和稀疏表示在许多领域都有着广泛的应用,例如:图像处理:图像通常可以表示为低秩矩阵或稀疏矩阵,因此可以通过低秩矩阵分解或稀疏表示来进行图像压缩、降噪和去模糊等操作。
自然语言处理:文本数据通常也可以表示为低秩矩阵或稀疏矩阵,因此可以通过低秩矩阵分解或稀疏表示来进行文本分类、文档聚类和信息检索等操作。
推荐系统:推荐系统通常需要对用户和物品之间的数据进行建模,而低秩矩阵分解或稀疏表示可以用来构建用户-物品矩阵,从而实现个性化推荐。
信号处理:信号通常可以表示为稀疏向量,因此可以通过稀疏表示来进行信号压缩、降噪和去噪等操作。
基于矩阵低秩稀疏分解的图像去噪算法
基于矩阵低秩稀疏分解的图像去噪算法王雪; 靳伍银【期刊名称】《《计算机工程与设计》》【年(卷),期】2019(040)010【总页数】5页(P2955-2958,3048)【关键词】图像去噪; 低秩矩阵恢复; 优化; 正则; 非精确增广拉格朗日乘子法【作者】王雪; 靳伍银【作者单位】兰州理工大学机电工程学院甘肃兰州730050【正文语种】中文【中图分类】TP391.410 引言作为图像处理领域研究多年的经典问题,诸多图像去噪算法不断被提出,典型的有滤波器[1]、非局部去噪[2]、变换域去噪[3]和基于字典学习的图像去噪算法[4]。
这些图像去噪算法及其改进算法在一定程度上提高了图像的质量,但目前仍然没有最佳方法可以完全解决噪声问题。
并且,在考虑去噪算法优劣的评判标准中,其运行时间的快慢和效果的好坏存在冲突,去噪算法的优化问题实则还是寻求最优解的问题。
近几年,随着压缩感知理论在图像处理领域的成功应用,研究者们将向量的稀疏表示推广到矩阵的恢复,得到了低秩矩阵恢复(low-rank matrix recovery,LRMR)及其相关理论[5]。
该理论能够很好实现高维数据的降维,可以用于诸多工程领域,包括人脸识别、背景建模、图像处理和雷达信号处理等。
矩阵低秩稀疏分解算法应用数据矩阵各行列间的冗余性,逼近原始数据,找出其内部结构,主要由鲁棒主成分分析(robust principal component analysis,RPCA)、低秩表示和矩阵补全3部分表示[6]。
RPCA法成功地应用到了机器视觉领域。
Cao等提出一种总变分正则化RPCA模型并将其应用于动态背景下的运动目标检测,取得了很好的效果[7]。
Mattei等提出了一种移动主成分分析法,该算法将点云建模为重叠的两维子空间的集合很好实现了点云去噪[8]。
本文针对低秩恢复去噪对于高斯噪声约束的不足,提出了一种块正则的模型,采用非精确的拉格朗日乘子法对该模型进行求解,通过对比发现该模型与传统算法相比能获得更高的主观与客观质量。
低秩稀疏矩阵分解transformer
低秩稀疏矩阵分解transformer
Transformer是一种基于注意力机制的深度学习模型,在自然语言处理等领域取得了显著的成果。
在处理大规模数据时,为了提高计算效率,研究人员提出了一些基于低秩稀疏矩阵分解的Transformer模型。
这些方法的基本思想是通过对自注意力矩阵进行低秩近似或分解,降低计算复杂度。
例如,利用可以一次访问多个token的内存模块,如全局存储器,来提高效率。
还可以通过内核化的方式,将注意力矩阵近似为核,从而提高效率。
此外,利用递归连接矩阵分块法中的各个块,也可以提高效率。
这些方法在保持Transformer模型性能的同时,有效地减少了计算量和参数数量,提高了模型的效率和泛化能力。
在实际应用中,可以根据数据的特点和任务的需求,选择合适的低秩稀疏矩阵分解Transformer模型,以获得更好的效果。
矩阵低秩分解理论
为了对噪声和野点更加鲁棒,一个更合理的模型为:
01
一般意义上的LRR可以看做:
02
低秩矩阵表示(LRR)
构造上述优化问题的增广拉格朗日乘子函数为 当 时,X的式为 拉格朗日乘子的迭代公式为 参数μ的更新式为
图像去光照影响恢复
低秩矩阵恢复应用
视频背景建模 Candès, Li, Ma, and W., JACM, May 2011.
低秩矩阵恢复应用
图像类别标签净化
低秩矩阵恢复应用
01.
RPCA
02.
文本主题分析 传统PCA
低秩矩阵恢复应用
音乐词曲分离
低秩矩阵恢复应用
图像矫正与去噪
低秩矩阵恢复应用
需要根据应用问题本身的物理意义, 设计合理的数学模型, 使用现代凸优化方法进行高效的求解。
应用方面:
01
02
03
研究展望:
01
04
02
03
增广拉格朗日乘子法(augmented Lagrange multipliers,ALM)
构造增广拉格朗日函数:
当Y=Yk,μ=μ k ,使用交替式方法求解块优化问题 min A,E L(A,E,Yk,μ k )。
使用精确拉格朗日乘子法交替迭代矩阵A和E,直到满足终止条件为止。若 则
稀疏优化与低秩矩阵优化
min x TVx s .t . Ax b, x 0, || x ||0 k .
(3)
三、应用实例
例2、互补问题的稀疏解 众说周知,二人矩阵博弈模型、具有生产和投资的经济 均衡模型、交通流均衡模型等,都可以转化为互补问题.如果 这个互补问题有多个解,则在这个解集中寻找一个最为稀疏 的解:
这个理论突破了香农定理对信号采样频率的限制,能够以
较少的采样资源,较高的采样速度和较低的软硬件复杂度获得 原始信号.
二、稀疏优化与压缩感知
假设原始信号为向量 x (维数大),测量信息为 b 向量 (维数小),且它们满足线性关系,则其数学模型就是一 个欠定线性方程组 Ax b. 如果原始信号 x 具有稀疏性,则其数学意义就是零元 素多,即非零元素少, 于是可以转化为稀疏优化模型:
min rank ( X ) s.t . X ij Mij ,
i , j .
(6)
三、应用实例
例5、多维标度问题(管理学、统计学) 已知12个城市中两两城市之间的距离,请你标出这12个 城市的平面坐标位置.类似地,已知一个传感器网络,通过互 相收发信号可以确定传感器之间的距离,请确定传感器的平 面坐标位置.此外,有100种白酒,品尝家可以对每两种白酒 进行品尝对比,给出一种相近程度的得分(越相近得分越高, 相差越远得分越低),我们希望从这些得分数据中得到这100 种白酒之间的排序表,所建立的数学模型就是一个矩阵秩极小 问题: min rank (Y ) (7) 2
四、理论与算法
■凸差松弛理论和算法
凸差松弛就是用(1范数-q范数)代替0-范数,从图像可以看 出,它更接近稀疏优化问题,能更好得区分无关项和相关项, 从而有助于得到较精确的逼近.
■光滑松弛理论和算法
(优选)稀疏优化与低秩矩阵优化
一、模型与基本概念
稀疏优化问题是指在某种线性约束条件下,求一个决策变量使 其非零元素个数达到极小.它的基本数学模型是:
min x , s.t. Ax b, (1) 0
其中 A Rmn,b 是一个 m 维向量,m<n.
矩阵秩极小(或低秩矩阵恢复)问题是指在某种线性约束条件 下,求一个决策矩阵使其秩达到极小.它的基本数学模型是:
个欠定线性方程组 Ax b.
如果原始信号 x 具有稀疏性,则其数学意义就是零元
素多,即非零元素少, 于是可以转化为稀疏优化模型:
min x , s.t. Ax b. 0
二、稀疏优化与压缩感知
•假设原始信号为矩阵X(维数大),测量信息为矩阵B(维 数小),且它们满足线性关系,则其数学模型就是一个线 性矩阵方程组 A(X)=B .
与集合{x|Ax b}中选一个解.由此可知,所有这些模型在
一般情况下都是NP-困难问题.
◆如何松弛(近似)易求解? →理论研究; ◆如何设计算法?→算法研究; ◆如何应用到实际部门?→应用研究.
二、稀疏优化与压缩感知
压缩感知是国际上近期出现的一种信息科学理论,它首先 由著名华裔数学家、2006年菲尔兹奖得主陶哲轩 & Candes、 美国国家科学院院士Donoho独立提出,被评为2007年度美国十 大科技进展之一,其基本内容是:
这是一个矩阵秩极小问题.
三、应用实例
例4(上)、Netflix Prize 2006年10月Netflix电影公司为了有效发展自己的推荐系
统而发起的长达5年的竞赛,要求参赛者根据48万余用户对1 万7千部电影的不完全评分记录推测出另外近300万条电影评 分记录的数值.任何组织或个人只要能提交比Netflix现有电 影推荐系统Cinematch效果好10%的新方法,就可以获得诱人 的7位数奖金.不仅如此,每年它还会为此提供5万美元的年度 进步奖.
基于 建模的稳健稀疏 低秩矩阵分解
这里 · ∗ 表示矩阵奇异值之和, 称为矩阵的核范数, ·
然而,实际中的系统往往会受噪声影响,矩阵D不能严格地表示成低秩矩阵与稀疏矩阵之和。为 此,文献[7]在假设 D − A − E F δ(δ > 0)的情况下提出稳定主成分追踪(Stable Principle Component Pursuit, SPCP) , 并证明求解优化问题(3)所得到的矩阵A与E 的误差平方和以O(δ2 )为上界。
A,E ∈Rm×n
min
A
1/2 S 1/2
+λ E
a la F
(4) δ
s.t.
2
D−A−E
1/2 r 其中 A S 1/2 = ( r ) 表示矩阵A所有奇异值{σi }ii= 对应于S chatten p 范数 p = 1 i=1 σi =1 构成向量的l1/2 范数, 2的 m n a 1/a a 情形, 本文简记为S 1/2 范数。 E la = ( i=1 j=1 |Ei j | ) 表示矩阵E 拉直向量的la 范数, 参数a的选取可采 用如下启发式的方法:δ > 0表示在有噪声情况下对矩阵D进行近似分解,取a = 1即用l1 范数刻画矩阵 1 的一维稀疏性; δ = 0表示对矩阵D进行准确分解, 取a = 2 即用l1/2 范数进一步诱导矩阵的一维稀疏性。
min f ( x) + g(z)
x,z
矩阵低秩分解理论
针对噪声和异常值的问题,未来的研究将更加注重提高低 秩分解的鲁棒性,例如通过引入鲁棒性损失函数或采用鲁 棒性优化算法。
模型融合
为了应对不同应用场景的需求,未来的研究将探索如何将 不同的低秩分解模型进行融合,以充分利用各自的优势。
对未来研究的展望
理论分析
尽管矩阵低秩分解已经在许多领域取得了成功应用,但其理论分析仍然不够完善。未来的研究将进一步深入探索低秩 分解的理论性质,例如收敛性、稳定性等。
将任意矩阵分解为三个矩阵的乘积,其中两个是正交矩阵,一
个是对角矩阵,对角线上的元素即为奇异值。
非负矩阵分解(NMF)
02
要求分解后的矩阵元素非负,适用于处理非负数据,如图像和
文本等。
鲁棒主成分分析(RPCA)
03
将原始矩阵分解为低秩矩阵和稀疏矩阵之和,用于处理含有异
常值和噪声的数据。
低秩分解的优化目标
02 矩阵低秩分解的基本原理
矩阵的秩与低秩性
矩阵的秩
矩阵中线秩性
当矩阵的秩远小于其行数和列数时, 称该矩阵具有低秩性。低秩矩阵意味 着其包含大量冗余信息,可通过降维 技术提取主要特征。
矩阵分解的基本方法
奇异值分解(SVD)
01
改进算法探讨
1 2 3
鲁棒主成分分析(RPCA) RPCA针对含有异常值的数据,通过引入稀疏约 束,将数据分解为低秩部分和稀疏部分,提高算 法的鲁棒性。
增量式矩阵低秩分解
针对大规模数据,增量式算法能够逐步更新矩阵 的低秩分解结果,降低计算复杂度和存储空间需 求。
基于深度学习的矩阵低秩分解
利用深度学习模型强大的特征学习能力,结合传 统的矩阵低秩分解算法,进一步提高算法的性能 和适用性。
基于稀疏与低秩矩阵分解的视频背景建模
基于稀疏与低秩矩阵分解的视频背景建模
周密;宋占杰
【期刊名称】《计算机应用研究》
【年(卷),期】2015(32)10
【摘要】针对传统背景建模方法的缺点,基于稀疏与低秩矩阵分解理论,在增广拉格朗日乘子法框架下,研究了一种收敛更快的非精确增广拉格朗日乘子法(IALM),直接实现监控视频序列中背景和前景的分离.该算法采用块Lanczos方法和热启动技术实现部分奇异值分解,使得原有IALM的计算量和迭代次数得以控制.基于实际监控视频的实验结果表明,该算法恢复出的背景矩阵更为低秩,且运行时间下降了几十倍,即能够更加简洁高效地解决背景建模这一实际问题.
【总页数】4页(P3175-3178)
【作者】周密;宋占杰
【作者单位】天津大学电子信息工程学院,天津300072;天津大学理学院,天津300072
【正文语种】中文
【中图分类】TP391.41
【相关文献】
1.基于低秩矩阵分解的光场稀疏采样及重构 [J], 覃亚丽;张晓帅;余临倩
2.基于低秩矩阵分解和稀疏表达的人脸识别方法 [J], 谭群超
3.基于低秩稀疏矩阵分解的非接触心率估计 [J], 黄继风; 白国臣; 熊乃学; 魏建国
4.基于低秩稀疏矩阵分解的非接触心率估计 [J], 黄继风; 白国臣; 熊乃学; 魏建国
5.基于稀疏和低秩Hankel矩阵分解的SAR图像相干斑抑制 [J], 蔡金萍;赵曜因版权原因,仅展示原文概要,查看原文内容请购买。
低秩稀疏矩阵分解
低秩稀疏矩阵分解
低秩稀疏矩阵分解是一种矩阵分解技术,能够将一个高维稀疏矩阵分解成两个低秩矩阵的乘积,从而实现数据压缩与降维。
该技术在推荐系统、图像处理、自然语言处理等领域得到广泛应用。
低秩稀疏矩阵分解的主要思路是将原始矩阵分解成两个低秩矩
阵的乘积,其中一个矩阵表示样本之间的相似度,另一个矩阵表示样本在该相似度空间中的表示。
这种分解方法能够有效地减少数据的维度,提高模型的可解释性和泛化能力。
目前,常用的低秩稀疏矩阵分解算法包括基于矩阵分解的方法、基于图模型的方法以及基于概率模型的方法。
其中,基于矩阵分解的方法是最为常用的方法,如SVD、PCA、NMF等,这些方法能够保留数据的主要特征,并且有较好的可解释性。
在实际应用中,低秩稀疏矩阵分解需要考虑到数据的稀疏性和噪声,以及算法的效率和可扩展性。
未来,随着数据量的不断增加和应用场景的多样化,低秩稀疏矩阵分解将继续发挥重要作用。
- 1 -。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘要 为实现稳健的稀疏-低秩矩阵分解,本文首次引入矩阵的S 1/2 范数以诱 导矩阵的低秩性来构建新模型,并在ADMM算法框架下设计了高效的交替阈值迭 代算法。该算法采用增广拉格朗日乘子技术,在迭代过程中交替更新低秩矩阵和 稀疏矩阵。由于这两个矩阵的最优更新具有显式形式,算法整体的计算精度和时 间代价得以控制。 大量的数值模拟实验说明:相较于目前最好的不精确ALM算法, 交替阈值迭代算法的迭代次数与时间代价大幅降低,对噪声更为稳健,分解出的 低秩矩阵的秩与稀疏矩阵的稀疏度更接近于真实值。 在对监控视频进行背景建模 这一实际问题中, 交替阈值迭代算法得到的背景矩阵更为低秩, 更符合问题先验, 且时间代价相较于不精确ALM算法降幅高达一个数量级,这说明新模型与算法能 有效解决相关实际问题。
考虑到S 1/2 模型的目标函数与约束条件关于稀疏矩阵与低秩矩阵是可分的, 本文基于ADMM[12] 算 法思想提出交替阈值迭代算法。 该算法利用增广拉格朗日乘子技术, 在迭代过程中采用交替投影的思 想逐个更新低秩矩阵、 稀疏矩阵和拉格朗日乘子。 低秩矩阵与稀疏矩阵的更新需要求解两个非线性非
2
中国科学 : 信息数学 第 40 卷 第 1 期
A,E ∈Rm×n
min
A
∗
+λ E
l1 F
(3) δ
s.t.
D−A−E
为求解优化问题(2)与(3) ,文献[6]基于目标函数的一阶信息提出了阈值迭代框架,但算法的 收敛速度很慢, 且每次迭代都要进行一次奇异值分解, 无法快速求解大型实际问题。此后, 文献[8]提 出了直接求解原始问题的APG算法和求解相应对偶问题的梯度上升算法,并通过实验说明这两种算 法在处理1000 × 1000的矩阵时相较于阈值迭代算法加速了50倍。 进一步地, 文献[9]基于拉格朗日乘子 技术提出了不精确ALM算法(简称为ALM算法) ,在显著提高计算精度的同时其计算速度是APG算法 的5倍, 这是目前已知的求解大规模问题的最好算法。 稀疏-低秩矩阵分解问题可理解成从稀疏矩阵与低秩矩阵组成的过完备字典中寻找矩阵D的(近 似)最简单表示A + E ,其中稀疏矩阵E 的简单程度用其非零元素的个数即矩阵的l0 范数来刻画,可视 为矩阵在一维意义下的稀疏度,低秩矩阵A的简单程度则用矩阵秩即非零奇异值的个数来刻画,可视 为矩阵在二维意义下的稀疏性。PCP与SPCP受到广泛关注的原因就在于:用矩阵的l1 范数代替l0 范数 来刻画矩阵的一维稀疏度,用核范数即奇异值向量的l1 范数代替矩阵秩来刻画矩阵的二维稀疏度,从 而得到原始组合优化问题(1)的最紧凸松弛形式。 近年来已发展成熟的l1/2 正则化理论[10,11] 则说明: 相较于常用的l1 范数, l1/2 范数可进一步诱导向量 的稀疏性, 在稀疏信号重建中对噪声具有更强的稳健性。 为得到矩阵D更为简单的 (近似) 表示, 本文 将向量的l1/2 范数推广到矩阵, 分别用S 1/2 范数和l1/2 范数来刻画矩阵二维与一维稀疏度, 提出如下实现 (近似)稀疏-低秩矩阵分解的S 1/2 模型:
A,E ∈Rm×n
Байду номын сангаас
min
A
1/2 S 1/2
+λ E
a la F
(4) δ
s.t.
2
D−A−E
1/2 r 其中 A S 1/2 = ( r ) 表示矩阵A所有奇异值{σi }ii= 对应于S chatten p 范数 p = 1 i=1 σi =1 构成向量的l1/2 范数, 2的 m n a 1/a a 情形, 本文简记为S 1/2 范数。 E la = ( i=1 j=1 |Ei j | ) 表示矩阵E 拉直向量的la 范数, 参数a的选取可采 用如下启发式的方法:δ > 0表示在有噪声情况下对矩阵D进行近似分解,取a = 1即用l1 范数刻画矩阵 1 的一维稀疏性; δ = 0表示对矩阵D进行准确分解, 取a = 2 即用l1/2 范数进一步诱导矩阵的一维稀疏性。
k+1 k k +1 k+1
上述交替阈值迭代算法的关键是在每次迭代中交替更新低秩矩阵、 稀疏矩阵和拉格朗日乘子, 直 到满足预先设定的收敛条件。因此,算法整体的计算精度与时间代价在很大程度上取决于(10)中两 个子问题的求解。
2.2 两个子问题的显式最优解
(10)中更新稀疏矩阵和低秩矩阵所需要求解的两个子问题可分别简化成如下形式:
A,E ∈Rm×n
min rank(A) + λ E s.t. D= A+E
l0
(1)
其中rank(A)表示矩阵A的秩, E l0 表示矩阵E 的非零元个数即l0 范数, 参数λ则用于平衡矩阵A的低秩程 度和矩阵E 的稀疏程度。 显然,稀疏-低秩矩阵分解问题通常是病态的 (NP-hard) 。受压缩感知与统计领域相关研究工 作[1,2] 的启发,文献[3]基于“秩-稀疏不相关性”(rank-sparsity incoherence)给出了问题可解的条件,
min X − W
X 2 F 2 F
+λ X
a la 1/2 S 1 /2
(11) (12)
min X − W
X
+λ X
问题(11) 的求解比较简单, 文献[9]已证明a = 1时的最优解为S T λ/2 (W ), 即以 λ 2 为阈值对矩阵W 的 [12] 每个元素进行Soft阈值收缩, 相应的Soft阈值算子 定义为: x − sgn( x)λ, | x| > λ (13) S T λ ( x) = 0, 其它 其中 sgn(·)是符号函数。
1 引言
论 文
基于S 1/2建模的稳健稀疏-低秩矩阵分解
饶过x , 彭毅x , 徐宗本x ∗
x 西安交通大学信息与系统科学研究所, 西安710049 *通信作者E-mail: raoguo2010@, weichiche@, zbxu@ 2012–xx–xx 2012–xx–xx 国家自然科学基金(批准号: 61075054,60975036,11171272)资助项目
凸优化问题, 本文通过将作用于向量的Soft[13] 与Half[10] 阈值算子推广到矩阵情形以给出其最优解的显 式形式, 这从很大程度上保证了所设计算法的高精度与低时间代价特性。 与目前最好的ALM算法相比,大量的模拟实验说明本文所提出的交替阈值迭代算法具有以下优 点: 达到收敛所需迭代次数与时间代价大幅降低, 对噪声有更强的稳健性, 分解出的低秩矩阵的秩更 接近于真实值, 同时算法的可靠性对矩阵A的低秩程度依赖更少。 另外, 在监控视频背景建模[4] 这一实 际应用中, 交替阈值迭代算法能得到更为低秩的背景矩阵, 这一现象更符合建模时利用的先验, 且时 间代价相较于ALM算法降幅高达一个数量级, 这对实际中海量视频数据的快速处理具有重要意义。
关键词
S 1/2 范数,稀疏-低 秩矩阵分解,快速 稳健,交替阈值迭 代
1 引言
在工程应用中,许多复杂的系统通常是由多个简单的系统组成。为更好的理解复杂系统的行为 与性质, 人们往往利用复杂系统的可分解性将其分解成若干简单系统来进行研究。特别地, 当复杂系 统的矩阵表示是一个稀疏矩阵与一个低秩矩阵之和时,分解该复杂系统可描述成稀疏-低秩矩阵分解 问题:已知矩阵D可表示成低秩矩阵A与稀疏矩阵E 之和,A的秩信息与E 的稀疏结构信息未知,如何 由D准确地分解出矩阵A与E?该问题的数学模型如下:
min f ( x) + g(z)
x,z
(5)
s.t. Mx + Nz = c
其中 x ∈ Rn , z ∈ Rm ,M ∈ R p×n ,N ∈ R p×m ,f 、 g为凸函数。 考虑问题的增广拉格朗日乘子形式:
1 Lµ ( x, z, y) = f ( x) + g(z) + y ( Mx + Nz − c) + µ Mx + Nz − c 2 (6) 2 2 其中y表示线性等式约束的乘子,µ > 0表示对不满足线性等式约束的惩罚因子,也称为增广拉格朗日
(7)
显然, ADMM与对偶上升法和乘子法非常相似, 由 x极小化、 z极小化和对偶变量y更新组成, 且对偶变 量的更新步长与乘子法一样取为µ。 虽然ADMM的收敛性理论建立在目标函数 f (·)和g(·)为凸函数的基础上, 但其思想可推广到非凸优 化问题的求解, 本文正是基于这样的推广来设计求解新模型 (4) 的交替阈值迭代算法。 我们先考虑新 模型的增广拉格朗日乘子形式: 1 1/2 2 Lµ (A, E , Y ) = A S +λ E a (8) la + < Y, D − A − E > + µ D − A − E F 1/2 2 其中Y ∈ Rm×n 是线性约束乘子, µ > 0表示对不满足等式约束D = A + E 的惩罚因子, 其取值依赖于模型 (4)中正参数δ, 特别地, 当δ = 0时µ = ∞。为极小化Lµ (A, E , Y ), 我们通过迭代求解如下三个子问题: Ak+1 = arg min Lµ (A, Ek , Yk ) A (9) Ek+1 = arg min Lµ (Ak+1 , E , Yk ) E Yk+1 = Yk + µ(D − Ak+1 − Ek+1 )
饶过等: 基于S 1/2 建模的稳健稀疏-低秩矩阵分解
文献[4,5,6]则提出通过求解如下凸优化问题实现主成分追踪(Principle Component Pursuit,PCP) ,以准 确分解出稀疏与低秩矩阵:
A,E ∈Rm×n
min
A
∗
+λ E
l1
(2)
s .t .
D= A+E
l1 表示矩阵所有元素绝对值之和。