基于稀疏表示的人脸识别方法
稀疏表示的人脸识别及其优化算法
第 1 ≠ A q 1 步 : ≠A = ]
第2 G A 1 步 = T】 A,Q
第 步
T y ]
X= Q F A R= rd c0 X po ut 一G 更新 po u t ̄ G rd c l 0l
第 步
第 步
第 步
edd n o
数 向量 中非 0 素 的个数 。 元 稀疏 编码 与 信号 的 压缩感 知 重构 具有 相 同的数 学形 式 , 主要 的求 解算 法包 括 最 小 , 其 0 范数 法 、 贪婪 迭
代匹配追踪系列算法等。其 中, 匹配追踪类方法为其近似求解提供 了有力工具 , 在稳定性和运行速度方面
具 有一 定 的优 势 。 目前 常 用 的 匹配 追踪 类 算法 包 括 : 交 匹配 追 踪 ( ̄ ooa ma hn usi 0MP 算 正 o h gnl t igp r t c u, ) 法 , 基于树 型搜 索 的正交 匹配 追踪算 法 , 则化 正交 匹配追 踪算 法 , 正 压缩 采样 匹配追 踪算 法 等 。 。
l 正交 匹配追踪算法
正 交匹 配追 踪思 想 本质 上是 来 自于 ‘ ” 就是从 过 完备 字典 的 Ⅳ个 原 子 中寻找 个 关 键 分量 , ~ 稀疏 ,
这 个关键分量系数的绝对值应该 比其它N K - 个分量大得多。算法在每一次的迭代过程中, 从过完备原子 库里选择与信号最匹配的原子来进行稀疏逼近并求出余量 , 然后不断迭代选 出与信号余量最为匹配的原 子。为了减少迭代次数 , 算法通过递归对 己选择原子集合进行正交化以保证迭代的最优性。具体 见算法
.
1 a mn[ A 1 s.0 ≤  ̄ r iI— 2; .1 1 =g Y 0 t1 0 2
基于Gabor小波能量子带分块的稀疏表示人脸识别
燕 山大 学 学报
J o u r n a l o f Ya n s h a n Un i v e r s i t y
Vo 】 .3 7 No .1
J a n. 2 01 3
文章编号 :1 0 0 7 — 7 9 1 X( 2 0 1 3 )0 1 - 0 0 6 8 — 0 7
摘 要 :基于稀疏表示分类 的人脸识别通常提取特征脸 、随机脸和费歇尔脸这些整体特 征,忽略了局部特征在 克服光照和表情变化方面 的优越性 。针对 以上 问题 ,本文提 出了基于 Ga b o r 小波能量子带分块的稀疏表示 人脸
识 别 算 法 。首 先 将 人 脸 图像 进 行 不 同尺 度 和 方 向 下的 Ga b o r 小 波 变 换 ,对 得 到 的 每 个 能 量 子 带进 行 分 块 ,然 后 将 各 子块 能量 信 息 融 合 组 成 子 带 的特 征 向量 ,再 将 各 能 量 子 带 特 征 向量 融 合 组 成 增 强 的 Ga b o r 特 征 向 量 , 最后 将 该特 征 应用 于稀 疏 表 示 人 脸 识 别 。实 验 结 果 表 明 ,该 算 法 对 于 光 照 和 表 情 变 化 具 较 好 的 的 鲁棒 性 。
关键 词 : 人脸 识 别 ; 图像 分 块 ;Ga b o r 小 波 ;稀 疏 表 示
中图分类号:T P 3 9 1 . 4
文献标识码 :A
DOl :1 0 . 3 9 6 9  ̄ . i s s n . 1 0 0 7 - 7 9 1 X . 2 0 1 3 . 0 1 . 0 1 2
一Leabharlann 脸识 别 和纹理 分类 领域 取得 了可喜 的成 果 。
改进的基于残差加权的稀疏表示人脸识别
A s at T r e ehnetep r r ac f R R,a poe prerpeettncas ct n ( R bt c of t r n ac e om neo F r uh h f S ni r dsas ersna o l i ai S C)me o m v i sf o i td h
n r lo p re e r s n ain o f ce t. Si o n fs a s r p e e t to c ef in s i multo x e i e tl e ut h w h tt a rs ls s o t a h r c g to r r n e fW f
第3 l卷第 3期
21 02年 9月
中南 民族大学学报(自然科学版 ) Jun f ot—et lU i ri r ai aie( a. c. dt n ora o uhC nr nv syf t nli N tSiE io ) l S a e t o N o ts i
Vo _ 1 l 3 No 3 .
基础上 , 出了一种基 于残差加权 的稀疏表示人脸识别新 方法. 方法通 过对类残 差图像关 于所属类 稀疏表示 系 提 该
数的 范数进行归一化加权 , 有效提升 了原始基于类残 差判决 的识别能 力. 真实验结 果表 明 : 仿 改进 的基于残差 加权 的稀 疏表 示方法能够有效提高 系统 的识别性能. 关键词 人脸 识别 ; 稀疏表示 ; 残差加权
鲁棒 性 自动人脸 识别 是几 十年来 计算 机视 觉领
方 法 , 过 比较每 个类残 差均 方值 的倒 数 , 成对 测 通 完 试 图像是 否 为合 法人 脸 图像 的判 定 ; i Qa 人 给 o等 出 了 一 种 线 性 降 维 的 s P( prt Peev g P Sasy rsri i n
基于稀疏表达的人脸遮挡物去除
基于稀疏表达的人脸遮挡物去除吴从中;刘渠芬;詹曙【摘要】Face recognition technology is one of the most promising biometric technologies .Glasses , scarves and other obstructions have great impact on face recognition .In order to improve the recogni‐tion rate of the occluded face images ,a new occlusion removal method based on sparse representation is presented .In this method ,the sparse coefficients for the human face images with occlusion in the training sets are obtained .Then the images are reconstructed with the obtained coefficients to get the unoccluded face images .The experimental results show that this method can effectively remove the frontal occlusion and improve the rate of face recognition .%人脸识别技术是目前最具发展潜力的生物特征识别技术之一。
眼镜、围巾等遮挡物的存在对人脸识别系统的识别率影响很大,为了提高有遮挡的正面人脸图像的识别率,文章提出了基于稀疏表达分类的去除遮挡的方法。
该方法对于有遮挡的人脸图像先求出其在无遮挡人脸图像训练集上的稀疏系数,再根据求得的稀疏系数进行恢复重建,得到去遮挡的人脸图像。
稀疏编码在人脸识别中的应用实例
稀疏编码在人脸识别中的应用实例人脸识别技术是一种通过计算机对人脸图像进行分析和比对,从而识别出人脸身份的技术。
在现代社会中,人脸识别技术已经广泛应用于安全检测、身份验证、人脸支付等领域。
而稀疏编码作为一种有效的特征提取方法,也被应用于人脸识别中,取得了显著的成果。
稀疏编码是一种基于信号的压缩表示方法,通过对信号进行稀疏表示,可以提取出信号的重要特征。
在人脸识别中,稀疏编码可以通过对人脸图像进行稀疏表示,从而提取出人脸的特征信息。
与传统的人脸识别方法相比,稀疏编码能够更好地保留人脸图像的细节信息,提高识别的准确性。
一个典型的稀疏编码在人脸识别中的应用实例是基于字典学习的人脸识别方法。
字典学习是一种通过学习数据样本的稀疏表示字典,从而实现特征提取和分类的方法。
在人脸识别中,可以通过字典学习的方法,将人脸图像表示为字典中的一组稀疏向量,从而提取出人脸的特征。
具体来说,字典学习的过程包括两个关键步骤:字典训练和稀疏编码。
在字典训练阶段,通过对大量的人脸图像进行学习,得到一个字典,该字典包含了人脸图像的重要特征。
在稀疏编码阶段,将待识别的人脸图像表示为字典中的一组稀疏向量,通过计算稀疏向量与字典之间的相似度,可以实现对人脸的识别。
稀疏编码在人脸识别中的应用实例不仅仅局限于字典学习,还可以应用于其他的人脸识别算法中。
例如,基于稀疏编码的局部二值模式(LBP)算法是一种常用的人脸识别方法。
该方法通过将人脸图像分成不同的局部区域,对每个局部区域进行稀疏编码,从而提取出人脸的局部特征。
通过对局部特征进行组合和比对,可以实现对人脸的整体识别。
除了在人脸识别中的应用,稀疏编码还可以应用于其他的图像识别问题。
例如,稀疏编码可以应用于目标检测、图像分类等领域。
通过对图像进行稀疏表示,可以提取出图像的重要特征,从而实现对图像的准确识别。
总之,稀疏编码作为一种有效的特征提取方法,在人脸识别中具有重要的应用价值。
无论是基于字典学习的方法,还是基于稀疏编码的局部特征提取方法,都能够在人脸识别中发挥重要作用。
人脸识别系统中的稀疏表示算法分析比较
人脸识别系统中的稀疏表示算法分析比较人脸识别技术作为生物特征识别的一种重要应用,被广泛应用在安全系统、身份验证、人脸检索等领域。
稀疏表示算法作为一种常用的特征提取方法,在人脸识别系统中发挥着重要的作用。
本文将对人脸识别系统中的稀疏表示算法进行综述,并分析比较各种算法的优缺点。
稀疏表示算法是一种通过训练样本的线性组合来表示待识别样本的方法。
这种算法的基本思想是,每个人脸图像都可以通过有限个训练样本来表示,而且表示的系数应该是稀疏的。
在人脸识别系统中,稀疏表示算法将每个人脸图像表示为一组系数,然后利用这些系数进行分类或者比对。
常用的稀疏表示算法包括L1范数最小化算法、L2范数最小化算法、稀疏主成分分析算法等。
L1范数最小化算法是一种常用的稀疏表示算法。
它的基本思想是,通过将待识别样本表示为训练样本的线性组合,使得系数具有较高的稀疏性。
L1范数最小化算法通过在优化问题中引入L1范数的约束,将待识别样本的系数向量尽可能地稀疏化。
这种算法具有良好的鲁棒性和适应性,但是计算复杂度较高,且需要进行大量的样本训练。
L2范数最小化算法是另一种常用的稀疏表示算法。
与L1范数最小化算法不同的是,L2范数最小化算法将稀疏性约束改为了平滑性约束,即通过最小化待识别样本与训练样本之间的残差来获得系数。
这种算法计算简单且效果良好,但是对噪声敏感,并且无法处理样本集中存在线性相关性的情况。
稀疏主成分分析算法是一种基于主成分分析的稀疏表示方法。
它通过将待识别样本投影到稀疏子空间中,从而减小样本之间的差异。
稀疏主成分分析算法适用于维数较高的数据,并且具有较好的鲁棒性和鉴别性。
然而,该算法对于数据的线性相关性不敏感,且计算复杂度较高。
在实际应用中,选择合适的稀疏表示算法需要根据具体的任务需求和数据特点来进行。
在性能方面,L1范数最小化算法相对较强,在处理噪声和数据集中存在的线性相关性方面表现出色。
而L2范数最小化算法计算简单且效果良好。
基于稀疏表示的人脸识别
参考文献
[1] Wright J, Yang AY, Ganesh A, Sastry SS, Ma Y. Robust face recognition via sparse representation. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2009, 31(2):210-227 [2] Inaba FK, Salles EOT. Face Recognition Based on Sparse Representation and Joint Sparsity Model with Matrix Completion. Latin America Transactions, IEEE (Revista IEEE America Latina), 2012, 10(1):1344-1351 [3] Lee H, Chung Y, Kim J, Park D. Face image retrieval using sparse representation classifier with gabor-LBP histogram. Information Security Applications: Springer, 2011:273-280.
基于稀疏表达的人脸识别 分类器
汇报人:于海泳、邓博 2015.6.10
背景介绍
近年来,人脸识别作为最为自然与可视化的识别方法,在公安,
企业,机场,超市,军队,航天等多个重要的行业领域,为视频监控、身
份验证和信息安全提供了一个良好的解决方案具有其独特的优势:
(1)非接触式操作
(2)隐秘性操作强 (3)图像采集系统的成本低廉
识别率 稀疏表达分类器 最近邻分类器 93.75 87.5
频域下稀疏表示的大数据库人脸分类算法
频域下稀疏表示的大数据库人脸分类算法胡业刚;任新悦;李培培;王汇源【摘要】人脸识别的识别率受众多因素影响,目前已有很多成形的高识别率算法,然而,随着数据库中人脸图像的增加,识别率下降很快。
鉴于该特点,采用频域下的稀疏表示分类算法能有效解决上述问题,先使用快速傅里叶变换(FFT)将人脸数据从时域变换到频域,再通过 l 1范数最优化稀疏表示算法,把所有训练样本作为基向量,稀疏表示出测试样本,最后使用最近邻子空间算法分类。
在扩展的 YaleB 人脸库中实验结果表明,该算法具有有效性。
%The recognition rate of face recognition is influenced by many factors, in which there are lots of effective algo-rithms, however, with the increase of face in the database, and the recognition rate will be decreased rapidly. In this situation, the sparse representation classification under the frequency domain can solve the above problems effectively. Firstly, the face image will be transformed from time domain to frequency domain using FFT algorithm, and then sparse representation about the test sample will be obtained by l1 norm optimization approach, in which all the training samples as the base vectors, in addition using the nearest neighbor subspace classification. Finally the experimental results show that the algorithm is effective in the extensional Yale B face database.【期刊名称】《阜阳师范学院学报(自然科学版)》【年(卷),期】2015(000)002【总页数】4页(P83-86)【关键词】稀疏表示;快速傅里叶变换;人脸识别【作者】胡业刚;任新悦;李培培;王汇源【作者单位】阜阳师范学院数学与统计学院,安徽阜阳 236037;阜阳师范学院数学与统计学院,安徽阜阳 236037;阜阳师范学院数学与统计学院,安徽阜阳236037;阜阳师范学院数学与统计学院,安徽阜阳 236037【正文语种】中文【中图分类】TP391.41 引言近年来,人脸识别已成为经典的模式识别研究问题之一。
基于正则化边界Fisher分析和稀疏表示分类的人脸识别方法
p r o b l e m. I f p i r n c i p l a c o mp o n e n t a n ly a s i s i s u s e d t o d e l w a i t h t h e p r o b l e m, s o me u s e f u l c o mp o n e n t s w i l l g e t l o s t f o r
Ab s t r a c t :Wh e n Ma r g i n l a F i s h e r A n ly a s i s( MF A) i s a p p l i e d t o f a c e r e c o g n i t i o n ,i t s u f e r s t h e s m l a l s i z e s a mp l e
题, 则会丢失一些对分类有益 的分量 ; 如果把 MF A的 目标 函数 用最大间距 准则代替 , 则较难得到 最佳参数 。提 出 了一
种正 则化 的 M F A方法 , 该方 法用一个较 小的数 乘上单位 阵构造 正则项 , 然后加到 MF A的类 内散 度矩 阵 中, 使得 所得
基于稀疏表示和奇异值分解的人脸识别
s i g u l a r v a l u e s o f i ma g e a s t h e f e a t u r e s f o r s p re a r e p r e s e n t a t i o n , a v o i d i n g t h e k e y i n f o r ma t i o n l o s s i n u s u a l s t ch o a s t i c d o w n s a mp l i n g p r o c e s s e f e c t i v e l y .T he e x p e r i me n t o n ORL d a t a b a s e s h o w s t h a t t h e p r o p o s e d a l g o i r t h m i s mo r e r o b u s t i n t h e s ma l l s a mp l e a n d l o w d i me n s i o n s i t u a t i o n i n f a c e r e c o g n i t o n .
Z H A N G C i x i a n g , L I U H u i , Q I A NG Z h e n p i n g
( 1 .F a c u l t y o f I n f o r m a t i o n E n g i n e e r i n g a n d A u t o m a t i o n ,K u n m i n g U n i v e r s i t y o f S c i e n c e a n d T e c h n o l o g y ,K u n m i n g Y u n n a n 6 5 0 0 0 0 ,C h i n a ; 2 .D e p a r t m e n t o fC o m p u t e r a n dI n f o r m a t i o nS ci e n c e ,S o th u w e s t F o r s e t r y U n i  ̄r s h y ,K u n mi n g Y u n n a n 6 5 0 0 0 0 ,C h i n a )
基于非负稀疏表示的人脸识别
组 成。如果每一 类都 有足够 的训 练样例 ,那 么一个 测试 样 例的线性表示 自然是稀 疏 的。在 此情形 下 ,测试样 例 的稀 疏表示可通过求解 z 最小 化问题 而有效获 得。最稀疏 的系
数 可 以解 释 为 在 重 构 测 试 样 例 的 过 程 中 每 个 训 练 样 例 所 贡 献 的 权 重 。当 训 练 样 例 数 目特 别 大 时 ,求 解 测 试 样 例 的 稀 疏 表 示 是 相 当耗 时 的 。 为 了 减 轻 稀 疏 表 示 的 计 算 代 价 ,本 文 提 出 了两 种 方 法 :对 于 稀 疏 表 示 方 法 强 加 非 负 约 束 ,进
棒 性 上 具 有 优 越 性 ;与 随 机 采 样 方 法相 比 ,该 采 样 方 法具 有 较 高的 识 别 精 度 。 关 键 词 :稀 疏 表 示 ;非 负稀 疏 表 示 ;人 脸 识 别 ;仿 射 传 播 ;采 样 ;非 负矩 阵 分 解 中 图法 分 类 号 :T 3 1 4 文 献 标 识 号 :A 文 章 编 号 :1 0—0 4 ( 0 2 0 0 20 P 9 . 0 072 2 1) 52 0—5
上式 可重新表示为
Y — 。 (2 )
建议按 如下方式选取 参数 : 一 0 2} 。 . { Yl 。。考虑到矩阵 A l Ar 的特殊性 ,建议采用乘性迭代算法来求解式 ( ) r A 9
x ( x mi ( , ) . ( r ) 一 一 .* n 0 n ) / A Ax ( 0 1)
g t ema rx f c o ia in a i ti a t rz t v o
0 引 言
作 为信 号处 理 的 强 有 力 的 工 具 ,稀 疏 表 示 与 压 缩 感 知 理 论 在 近 年 来 受 到 了 广 泛 地 关 注 。所 谓 信 号 的 稀 疏 表 示 , 就 是将 给 定 的 信 号 表 示 为 字 典 的 相 对 少 数 几 个 基 的 线 性 组 合 。Z 最 小 化 问 题 可 以用 来 求 解 最 优 的 稀 疏 表 示 ,但 它 是 。 NP难 问题 。令 人 兴 奋 的是 ,压 缩 感 知 理 论 证 实 了 稀 疏 或 近
基于改进LBP算子和稀疏表示的三维人脸识别研究
为 新 一 级 的 统 一 模 式 和 非 统 一 模 式 .这 样 就 能 更 完 善 的用 L B P算 子 表 示 图像 特 征 。 例如 , 可 以针 对 R = 3 , 2 , 1 的情 况 时 进 行 统 一 模式 L B P特 征 的提 取 .再 针 对 每一 级 的非 统 一 模 式 部 分 . 用 更 小 的半 径 提 取 L B P特 征 本
的图片 稀疏表示人脸识别算 法被称 为“ S R C ” 算法 . 步
骤如下 :
小于 2 . 则称该 L B P算子是符 合统一模式 的 . 否则就令
L B P算 子 值 为 P + I : 跳 转 的 含 义 是 二进 制位 从 0到 1 之 间的变换 , 例如 0 0 0 1 0 0 0 0 ( 2次跳 转 ) 。 0 0 1 1 0 1 0 0 ( 4次 跳 转) 。计 算 跳 转 的公 式 为 :
文在三维图像的处理中还 加入 了梯度信息
周 围八个邻点值 , 为 了适应不 同尺度 的图像计算 , 0 i a l a
在 文献 『 5 1 中用 圆形邻域对 L B P算 子进行重 新描述 , 这
样 可以方便地将 L B P运算扩展 到任何大小 的邻域 中 对于一 张灰度 图像 . 每个像素点的计算公式如下 :
J o h n Wr i g h t 在 文献【 7 】 中进行过 完备集 ( 字典 ) 构造 , 信 号 的稀 疏分解 . 信号的稀疏重建三个步骤 . 通过计 算测
试 数 据 和 训 练 数 据 的 残 差 来 进 行 图像 分 类 .在 A R 数 据 库 上 .稀 疏 表 示 甚 至 可 以 识 别 一 些 人 肉 眼无 法 识 别
光线 、 视角 、 尺 度 变 化 显 著 的 人 脸 图 像 中是 一 种 比较 实
Gabor字典及l0范数快速稀疏表示的人脸识别算法
f e a t u r e s o f t h e i ma g e a t mu l t i p l e s c le a s ,a le l e s s s e n s i t i v e t o t h e v a r i a t i o n s o f i l l u mi n a t i o n a n d c a mo u l f ge a .S mo o t h e d l 0 lg a o — i r t h m r e q u i r e s f e w e r me su a r e me n t v a l u e s b y c o n t i n u o u s l y d i f e r e n t i a b l e f u n c t i o n a p p r o x i ma t i o n l o n o r m. T h e a l g o it r h m o b ・
基于对称Gabor特征和稀疏表示的人脸识别
( 湖南大学 电气与信息工程学院,长沙 4 1 0 0 8 2 ) ( 通信作者电子邮箱 h u d a h e l i n g l i @1 2 6 . c o n r )
摘
要: 受启发于人脸 近似 对称 的先验知识 , 提 出一种基 于对称 G a b o r 特征的稀疏表示算法并成功运 用于人 脸识
J o u r n a l o f C o mp u t e r Ap p l i c a t i o n s
I S S N 1 o o1 — 9 0 8 1
2 01 4 — 0 2 — 1 0
计算机应 用, 2 0 1 4 , 3 4 ( 2 ) : 5 5 0— 5 5 2 文章编号 : 1 0 0 1 — 9 0 8 1 ( 2 0 1 4 ) 0 2 — 0 5 5 0 — 0 3
和光 照变化情 况下仍 能获得较 高的识 别率。
关键词 : 对称 G a b o r 特征 ; 稀疏表示 ; 镜像 变换 ; 加权 因子 ; 人脸识 别
中图分类号 : T P 3 9 1 . 4 1 文献标志码 : A
Fa c e r e c o g ni t i o n ba s e d o n s y mme t r i c Ga b o r f e a t u r e s a nd s pa r s e r e pr e s e n t a t i o n
Ab s t r a c t :I n s p i r e d b y p i r o r k n o wl e d g e o f f a c e i ma g e s ’a p p r o x i ma t e s y mme t r y ,a n lg a o r i t h m b a s e d o n s y mme t r i c Ga b o r f e a t u r e s a n d s p a r s e r e p r e s e n t a t i o n wa s p r o p o s e d ,w h i c h w a s s u c c e s s f u l l y a p p l i e d i n t o f a c e r e c o g n i t i o n i n t h e p a p e r .At i f r s t , mi l T o r t r a n s f o r m wa s p e r f o r me d o n f a c e i ma g e s t o g e t t h e i r mi r r o r i ma g e s ,w i t h w h i c h t h e f a c e i ma g e s c o u l d b e d e c o mp o s e d i n t o o d d — e v e n s y mme t r i c f a c e s .T h e n ,Ga b o r f e a t u r e s we r e e x t r a c t e d f r o m b o t h o d d f a c e s a n d e v e n f a c e s t o g e t t h e G a b o r o d d — e v e n s y mme t i r c f e a t u r e s , w h i c h c o u l d b e f u s e d v i a a w e i g h t i n g f a c t o r t o g e n e r a t e t h e n e w f e a t u r e s .A t l a s t ,t h e n e w l y o b t a i n e d f e a t u r e s w e r e c o mb i n e d t o f o m r a n o v e r — c o mp l e t e d i c t i o n a r y w h i c h w a s u s e d b y s p a se r r e p r e s e n t a t i o n t o c l a s s i f y t h e f a c e s .T h e e x p e i r me n t a l r e s u l t s o n AR a n d F ER E T f a c e d a t a b a s e s s h o w t h a t t h e n e w me t h o d c a n a c h i e v e h i g h a c c u r a c y e v e n w h e n f a c e
基于自编码器和稀疏表示的单样本人脸识别
在许多现实的人脸识别场景,比如护照验证和登机口身份识别,通常很少甚至只有一个训练图像,而测试样本可能包含各种剧烈的脸部变化如光照、表情和遮挡,这就是所谓的单样本人脸识别问题。
如何在含有剧烈类内变化的人脸识别场景中取得较好的识别效果,成为当前许多人脸识别工作研究的重点问题。
针对这个问题,研究者们提出了许多单样本人脸识别的解决方案。
受到稀疏表示的启发,Wright等[1]首次将基于稀疏表示的分类方法(Sparse Representation Classification,SRC)用于人脸识别中并取得了很好的效果。
基于SRC的人脸识别方法背后的基本假设是待分类的人脸基于自编码器和稀疏表示的单样本人脸识别王钰1,2,刘凡1,2,王菲1,21.河海大学海岸灾害及防护教育部重点实验室,南京2100982.河海大学计算机与信息学院,南京210098摘要:单样本人脸识别因其在现实生活中的广泛应用而成为人脸识别领域的热门话题。
单张训练样本条件下训练样本的缺少和复杂的类内人脸表情、光照、遮挡变化给单样本人脸识别研究带来困难。
传统的基于稀疏表示的人脸识别方法需要大量的训练样本构成过完备的字典,因而在单样本条件下识别效果明显下滑。
针对这一问题,提出一种基于有监督自编码器的带变化人脸样本生成方法,在保留身份信息的同时自动生成带变化的人脸图像用于单样本条件下的字典扩充,一定程度上缓解了单样本条件下的欠采样问题,弥补了训练集和测试集间的人脸变化信息差异,使得传统的稀疏表示方法能够适用于单样本人脸识别问题。
在公共数据库上的实验结果不仅证明了该方法的有效性,而且对测试集中不同的人脸变化也展现出了较强的鲁棒性。
关键词:单样本人脸识别;有监督自编码器;稀疏表示;字典学习文献标志码:A中图分类号:TP399doi:10.3778/j.issn.1002-8331.2007-0312Autoencoder Based Sparse Representation for Single Sample Face RecognitionWANG Yu1,2,LIU Fan1,2,WANG Fei1,21.Key Laboratory of Ministry of Education for Coastal Disaster and Protection,College of Computer Information,HohaiUniversity,Nianjing210098,China2.College of Computer and Information,Hohai University,Nanjing210098,ChinaAbstract:Single sample face recognition has become a hot topic in the field of face recognition since its wide application in real life.The lack of training samples and the dramatic inter-class variations of facial expression,illumination,and occlusion make it difficult to study.The traditional face recognition method based on sparse representation needs a large number of training samples to construct an over-complete dictionary,so the recognition accuracy is significantly dropped under the single sample condition.To solve this problem,a supervised autoencoder based method is proposed to generate faces with variations,which can automatically generate face images with variations while preserving identity information for dictionary expansion under the condition of a single sample.To a certain extent,this method can alleviate the problem of under sampling under the condition of a single sample,and make up for the difference of face variance information between the training set and test set,making the traditional sparse representation method suitable for single sample face recognition.Experimental results on public databases not only prove the effectiveness of the method but also show strong robustness to different face variations in the test set.Key words:single sample face recognition;supervised auto-encoder;sparse representation;dictionary learning基金项目:江苏省自然科学基金(BK20191298);河海大学海岸灾害及防护教育部重点实验室开放基金(201905)。
线性代数在人脸识别中的应用研究
线性代数在人脸识别中的应用研究在人脸识别技术的快速发展中,线性代数扮演了重要的角色。
线性代数是一门研究向量、矩阵、线性方程组等数学对象及其代数运算的学科,广泛应用于人脸识别的算法和模型中。
本文将探讨线性代数在人脸识别中的具体应用研究。
一、特征向量与特征值分解特征向量与特征值分解是线性代数中重要的概念,其在人脸识别中的应用被广泛探索和验证。
通过对人脸图像进行特征向量与特征值分解,可以提取出人脸图像的主要特征。
这些特征可以用于比较、匹配和识别人脸图像。
在人脸识别中,常用的特征向量与特征值分解方法是主成分分析(PCA)。
通过PCA,可以将高维的人脸图像转化为低维的特征向量表示。
具体而言,PCA将人脸图像矩阵进行奇异值分解,得到特征向量矩阵和特征值矩阵。
利用特征向量矩阵,我们可以将原始图像进行降维,提取出其中的主要特征,而特征值矩阵则表示了这些主要特征的重要程度。
二、向量空间和投影在人脸识别中,向量空间和投影也是线性代数的重要应用。
通过将人脸图像空间转化为向量空间,可以方便地进行人脸识别算法的设计与实现。
首先,我们将训练集中的人脸图像表示为向量,构建一个人脸图像向量空间。
然后,将待识别的人脸图像投影到该空间中,利用向量空间的计算方法比较待识别人脸图像与训练集中人脸的相似度。
通过计算和比较向量之间的距离或角度,可以实现人脸的快速识别。
三、线性方程组与矩阵运算在人脸识别算法中,线性方程组与矩阵运算也被广泛应用。
例如,通过解线性方程组可以计算出两个向量之间的线性关系,从而判断它们是否具有相似性。
另外,利用矩阵运算的性质,可以对人脸图像进行变换和操作。
例如,利用线性代数的矩阵乘法运算,可以对人脸图像进行旋转、缩放和平移等变换操作。
这些变换可以帮助我们更好地理解和识别人脸图像中的特征。
四、奇异值分解和压缩感知奇异值分解和压缩感知是人脸识别领域中常用的数学方法,也有着深厚的线性代数基础。
通过奇异值分解,我们可以对人脸图像进行降维和重构,获得更加紧凑和表示能力强的特征。
一种快速的基于稀疏表示的人脸识别算法
一种快速的基于稀疏表示的人脸识别算法
龙法宁;杨夏妮
【期刊名称】《图学学报》
【年(卷),期】2014(035)006
【摘要】基于稀疏表示的人脸识别算法(SRC)识别率相当高,但是当使用l1范数求最优的稀疏表示时,大大增加了算法的计算复杂度,矩阵随着维度的增加,计算时间呈几何级别上升,该文提出利用拉格朗日算法求解矩阵的逆的推导思路,用一种简化的伪逆求解方法来代替l1范数的计算,可将运算量较高的矩阵求逆运算转变为轻量级向量矩阵运算,基于AR人脸库的实验证明,维度高的时候识别率高达97%,同时,计算复杂度和开销比SRC算法大幅度降低95%.
【总页数】4页(P889-892)
【作者】龙法宁;杨夏妮
【作者单位】玉林师范学院计算机科学与工程学院,广西玉林537000;玉林师范学院计算机科学与工程学院,广西玉林537000
【正文语种】中文
【中图分类】TP311
【相关文献】
1.一种快速的基于稀疏表示的人脸识别算法 [J], 龙法宁;杨夏妮;
2.Gabor字典及l0范数快速稀疏表示的人脸识别算法 [J], 曾军英;甘俊英;翟懿奎
3.快速稀疏表示分类的人脸识别算法 [J], 范自柱
4.一种鲁棒稀疏表示的单样本人脸识别算法 [J], 沈韬;李克清;夏瑜
5.一种改进的联合稀疏表示人脸识别算法 [J], 吴明;潘亚宾
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第37卷 第9期2010年9月计算机科学Computer Science Vol.37No.9Sep 2010到稿日期:2009210226 返修日期:2010201215 本文受国家自然科学基金项目(60875010)资助。
杨荣根(1979-),男,博士生,讲师,主要研究方向为信号与信息处理、信号稀疏分解等,E 2mail:yang_rg @ ;任明武(1969-),男,教授,博士生导师,主要研究方向为图像处理与分析;杨静宇(1941-),男,教授,博士生导师,主要研究方向为模式识别。
基于稀疏表示的人脸识别方法杨荣根1,2 任明武1 杨静宇1(南京理工大学计算机学院 南京210094)1(淮阴工学院计算机工程系 淮安223003)2摘 要 分析了稀疏表示的数学本质就是稀疏正规化约束下的信号分解,研究了一种正交匹配追踪的稀疏表示算法并利用矩阵Cholesky 分解简化迭代过程中矩阵求逆计算来快速实现算法,将该算法应用在人脸识别中,利用训练样本构建冗余字典,将测试样本看成冗余字典中训练样本的线性组合,通过在不同人脸库上的实验证明了该方法的有效性。
关键词 稀疏表示,稀疏编码,压缩感知,正交匹配追踪,特征提取中图法分类号 TP391 文献标识码 ASparse Representation Based Face Recognition AlgorithmYANG R ong 2gen 1,2 R EN M ing 2wu 1 YANG Jing 2yu 1(School of Computer Scien ce,Nanjin g Un iversity of Science and T echnology,Nan jing 210094,China)1(Faculty of Computer E ngineering,H uaiyin In stitu te of Techn ology,H uaian 223003,China)2Abstr act We analyzed t he mathemat ic essence of sparse representat ion,spar se r egular ized signal decomposition.Stu 2died a spar se representat ion algor ithm of orthogonal matching ing t he matr ix Cholesky decomposition,we rea 2lized the OMP a lgorithm a fast version.We cast the r ecognit ion pr oblem as one of classifying among multiple linear r e 2gression models and developed a new fr amework from sparse signal representat ion.We viewed a test sample as the linear combinat ion of training samples.We conduct ed experiments on face recognition to verify the efficacy of the pr oposed al 2gor ithm.Keywords Sparse represent ation,Sparse coding,Compressed sensing,Orthogonal matching pursuit,Feature extraction1 引言信号的数字采样过程将数据表示成时间或空间的delta 函数之和,这种表示给分析带来很大不便。
信号处理技术常常需要通过更有效的表示来捕获信号的特征:对识别来说,表示需要突出显著特征,对去噪来说,表示需要有效的分离信号和噪声,对压缩来说,表示需要用少量的系数来描述大部分的信号。
有趣的是这些应用中看似目的不同,但都有一个共同的目标就是简化信号表示(稀疏化)。
在冗余字典上的稀疏表示[1]是一个快速发展的领域,在许多基础的信号和图像处理中取得了目前最好的效果[225]。
基本的模型表明自然信号能够被表示(或逼近)成预先定义的原子信号的线性组合,而且这些组合系数是稀疏的,也就是说大部分系数是0,或接近0。
形式描述如下:设y I R m 是一个列信号,一些原子信号构成字典A I R m @n ,则稀疏正规化下稀疏编码问题为x C=argmin||y -Ax ||22subject to ||x ||0[T (1)误差约束下稀疏编码问题为x C=argmin||x ||subject to ||y -Ax ||22[E(2)在上面的表达式中x C是y 的稀疏表示,E 是误差容限,T是稀疏阈值,||.||0表示l 0范数,列数向量中非0元素的个数。
式(1),式(2)在很多文献中都有研究,而且被证明是NP 难问题,但还是可以通过不同的方法逼近,包括正交匹配追踪、基追踪[6]、Focal 欠定系统求解(FOCU SS )、梯度追踪[7]等。
稀疏表示的最初目的是为了用比香农定理更低的采样率来表示和压缩信号[8],事实上JPEG2000压缩编码标准的成功主要就归功于自然图像小波系数的稀疏性[9]。
在去噪方面利用小波方法和平移不变小波也开发出许多有效算法[10]。
稀疏和过完备性已经被成功应用于图像动态范围压缩[11]、图像卡通和纹理成分的分离[12]等。
在这些应用中算法的性能往往要看表示的稀疏性和是否忠实于原始信号。
稀疏表示过程中的字典也没有假定任何特殊的意义,只是从一些标准的基库中选择如Four ier,Wavelet,Curvelet,Gabor 等,甚至是从随机矩阵中生成的。
本文主要应用稀疏表示进行模式分类,在分类过程中与图像处理不同的是过完备字典的选择并不是上面提到的从标准的基库中选择而是训练样本本身。
测试样本稀疏表示的过程就是找到样本在这些字典元素的,即训练样本上的线性组#267#合,不过这种组合要满足稀疏约束(或者叫做稀疏正规化)。
后面我们会讨论这些有趣的问题,很自然地看到样本确实能通过OM P 2Cholesky 算法找到其在字典上的最稀疏表示,有了这个表示系数就可以将样本归类到系数最大的那个样本所属的类别。
这里所用的算法OM P 2Cholesky 简单、快速,不同于文献[13]所用的算法。
2 稀疏表示算法2.1 正交匹配追踪算法正交匹配追踪算法是稀疏表示的一种经典的也是最简单的算法之一,它试图求得式(1),式(2)提出的问题逼近解。
为了简化描述,假定字典A 的列已经归一化,正交匹配追踪算法在每一步迭代过程中选择和当前迭代残差最相关的原子,选定原子以后,将信号正交投影到这些原子张成的空间中,重新计算残差,由此循环直到满足约束条件(见算法1)。
注意第5行是贪心选择原子步骤,第7行是正交投影步骤。
在第7行的计算由于其计算成本高通常不会显式进行,一种实际可行的方法就是利用矩阵Cholesky 或QR 分解来减少矩阵求逆的计算量。
x I =(A I )+y =(A T I A I )-1A T I y 的计算需要求矩阵A T I A I 的逆,它在投影过程中仍然保持非奇异性,这保证了线性无关原子的选择。
符号I 表示索引向量(i 1,,,i k ),A I 是A 的子矩阵,包含了被I 索引的列。
算法1 正交匹配追踪1.In put:Dictionary A ,sign al y ,target sparsity K or target err or E2.Output:Spars e repr esentation x3.Init:Set I:=(),r:=y,x :=04.wh ile(s toppin g criterion not m et)do5. k C:=arg max k|d T k r |6. I:=(I ,k C)7. x I :=(A I )+y 8. r :=y -A I x I 9.end while2.2 一种更快速的改进:OMP 2cholesky在正交匹配追踪算法中矩阵A T I A I 是一个对称正定阵,在每一步迭代更新中仅仅是追加一行或者一列,因此它的Cholesky 分解仅仅需要计算它的最后一行。
这很容易验证假定未更新之前矩阵的Cholesky 分解 F = L L T I R (n -1)@(n -1),则在更新追加行之后的Cholesky 分解F =F v v T cI Rn @n(3)由F =LL T 和式(4)给定。
L =L 0wTc -w Tw,w = L -1v(4)整个OM P 2Cholesky 算法实现见算法2。
算法2 OMP 2Cholesky1.In put:Dictionary A ,sign al y ,target sparsity K or target err or E2.Output:Spars e repr esentation x3:Init:Set I:=(),L:=[1],r:=y,x:=0,A(0):=A T y ,n:=14.wh ile(s toppin g criterion not m et)do 5. k C:=arg max k|a T k r |6. if n >1then7. w :=solve for w{Lw =A T I a k C}8. L:=L 0w T1-w T w9. end if10. I :=(I,k C)11. x I :=solve for c{LL T c =A I }12. r :=y -A I x I 13. n:=n +114.end wh ile与原来正交匹配追踪方法不同的是在每次迭代原子选择步骤,不再需要显式地知道残差r 或x ,只要知道A T r 。
因此,我们不需要显式地计算r 和它的乘数A T ,取而代之去计算低计算开销的A T r 。
用A 表示A =A T r ,A (0)=A T y 和G =A T A ,可以写成A =A T (y -A I (A I )+y)=A (0)-G I (A I )+y =A (0)-G I(G I,I )-1A (0)I (5)这意味着给定预先计算的A (0)(A 的初始值也就是迭代之前的值)和G ,就可以在每次迭代中只要计算A 不去显式计算r 。
更新步骤中只要矩阵G I 而不是应用整个的字典A T 。
注意,矩阵G I,I 的逆矩阵应用上面讨论的Cholesky 分解进行求逆。