增强Kernel学习优化最大边缘投影的人脸识别
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
增强Kernel学习优化最大边缘投影的人脸识别
郑翔;鲜敏;马勇
【摘要】针对传统的流形学习算法通常只考虑样本类内几何结构而忽略类间判别
信息的问题,提出一种基于增强核学习的最大边缘投影(MMP)算法。
首先使用基于增强核学习非线性扩展的MMP采集人脸图像的非线性结构;然后利用核变
换技术加强原始输入核函数的判别能力,并且借助于特征向量选择算法改善算法的计算效率;最后,利用基于乘性规则训练的支持向量机完成人脸的识别。
在Yale、ORL、PIE三大通用人脸数据库的组合数据集及AR上的实验验证了该算法的有效性。
实验结果表明,相比其他几种核学习算法,该算法取得了更好的识别效果。
%For the problem that traditional manifold learning methods usually consider intra-class geometry structure only but ignore the discriminative information of inter-classes,we propose an enhanced kernel learning-based maximum margin projection (MMP)algorithm. Firstly,we use MMP nonlinearly extended by enhanced kernel learning to collect the nonlinear structure of face image.Then,we use kernel transformation technology to enhance the discriminant ability of original inputted kernel function,and improve the computation efficiency of the proposed algorithm by feature vector selection algorithm.Finally,we use support vector machine trained
by multiplicative rules to finish the face recognition.The effectiveness of
the proposed algorithm is verified by the experiments on AR and the combination datasets of three com-mon face databases Yale,ORL and PIE.Experimental results show that the proposed algorithm has better
recognition efficiency comparing with several other advanced approaches based on kernel learning.
【期刊名称】《计算机应用与软件》
【年(卷),期】2015(000)009
【总页数】5页(P314-318)
【关键词】人脸识别;最大边缘投影;支持向量机;增强核学习;特征向量选择
【作者】郑翔;鲜敏;马勇
【作者单位】四川工程职业技术学院计算机科学技术系四川德阳618000;四川工程职业技术学院计算机科学技术系四川德阳618000;四川工程职业技术学院计算机科学技术系四川德阳618000
【正文语种】中文
【中图分类】TP391
由于在许多领域具有巨大的潜力,基于面部的人脸识别受到了广泛的关注,如人机交互界面、生物特征身份认证及多媒体监控等。
人脸识别的主要挑战是捕获的人脸图像数据经常位于高维空间内,例如,大小为n1×n2的人脸图像需要用n1×n2
维的向量来表示。
出于对维度的考虑,在正式进行分类前常常需要进行降维,从而获得有效的低维判别特征表示,常用的技术有:主成分分析PCA(Principal Component Analysis)[1]和线性判别分析LDA(Linear Discriminant Analysis)[2]。
PCA是一种无监督的降维算法,旨在提取线性子空间,使它投影数据的方差最大。
而LDA是一种监督的降维技术,旨在寻求一个线性变换,使得类间散布矩阵与类
内散布矩阵的比值最大。
研究表明,这些算法用于人脸识别时,LDA优于PCA,
因为LDA中运用了判别信息[3,4]。
然而,PCA和LDA的全局线性度使得它们无
法有效地描述非线性分布式人脸图像。
为了打破这种限制,提出使用核变换对PCA和LDA进行非线性扩展,如核PCA(Kernel Principal Component Analysis, KPCA)[5]和核LDA(Kernel Linear Discriminant Analysis, KLDA)[6],其性能远
远超越了传统的线性变换。
尽管上述提到的算法只寻求一个紧凑的人脸识别欧几里得空间,无法找到它的非线性流形结构,但该算法仍能达到相当好的人脸识别性能。
最近研究表明,可以从嵌入在高维环境空间的非线性低维流形结构中采集人脸图像。
为了找到人脸数据图像数据的内在流形结构,学者们提出了许多用于降维的流形学习算法,如ISOMAP[7]、局部线性嵌入LLE(Locally Linear Embedding)[8]和拉
普拉斯特征映射LE(Laplacian Eigenmap)[9]。
虽然这些流形学习算法可以保护非线性流形结构局部或全局几何性能,但是这些算法只定义了一个嵌入的训练数据集,不提供算法来映射不存在于数据集中的点到新的数据集,这是采样问题中常见的问题。
一般通过使用线性化程序对所有新测试数据构建内部映射来解决这个问题,局部保持投影LPP(Locality Preserving Projections)[10]是最具代表性的例子,与
此同时,利用图形嵌入框架的视图来分析和解释这些算法[11]。
但是,这些算法的目的只是保存嵌入式空间中数据的位置或相似性,而不是良好的识别能力,因此,它们可能不是最佳的以人脸识别为最终目的的算法。
基于上述分析,提出了一种基于增强核学习的最大边缘投影EK-MMP(Maximum Margin Projection based on Enhancing Kernel)[12]算法。
不同于只考虑类内
几何结构、而忽视了类间判别信息的传统流形学习算法,EK-MMP同时兼顾类内
的几何结构和类间降维判别信息。
不同于线性的原始MMP,EK-MMP可以使用
核学习捕获人脸图像的非线性结构,因此,EK-MMP判别能力更强。
此外,还采
用了核变换技术[13,14]来进一步提高辨识能力,采用特征向量选择算法降低EK-MMP的计算成本。
高维人脸图像数据映射到低维特征空间后,再用传统分类算法
分类和识别人脸图像。
实验结果表明了本文算法的有效性及高效性。
最大边缘投影MMP(Maximum Margin Projection)[12]算法是最近才提出的用于降维的流形学习算法,局部保持近邻关系且显式地利用判别信息来分类,是一种基于图形的学习算法。
利用带标签和不带标签的数据学习内在数据流形的线性相似度,旨在找到数据流形的几何和判别结构。
给定人脸数据集{x1,x2,…,xn}⊂Rm,对应的类标签为c1,c2,…,cn∈{1,2,…,p},令
X=[x1,x2,…,xn]。
MMP旨在寻求一个保存高维人脸流形的局部几何和判别结构的人脸特征子空间,令Sb和Sw分别表示类间图Gb和类内图Gw的权重矩阵,MMP试图确保Gw的连接点尽可能地靠近,Gb的连接点尽可能地远离,可以通
过求解下列优化问题得到:
约束条件为:
式中,Lb=Db-Sb是Gb的拉普拉斯矩阵,Db是一个对角矩阵,其对角线上的条目是Sb的列总和,例如Sb,ij,Dw也是一个对角矩阵,其对角线上的条目是Sw
的列总和,例如Sw,ij。
权重矩阵Sb、Sw的定义如下:
式中,}表示数据集的k最近邻居,l(xi)表示xi的标签,包含有不同标签的邻居,
包含剩余的邻居。
然后,在约束条件式(3)下最小化式(1)、最大化式(2)可以简化为以下优化问题:
式中,β∈[0,1]是一个决定类间图和类内图的权重值的常量。
最后,通过使用简单的代数变换,MMP的投影向量是以下广义特征值问题最大特征值的相关特征项:
在应用PCA算法丢掉零特征值对应的成分后,XDwXT是非奇异的,矩阵(XDwXT)-1X(βLb+(1-β)Sw)XT关联的最大特征值被当作MMP的投影向量。
2.1 核最大边缘投影
作为一个线性降维算法,MMP算法很容易理解并且实现简单,但它对于有姿势、表情、光照等大变化的复杂非线性变化的人脸识别通常不能提供良好的性能,因为它是一个线性算法。
为了打破这个限制,提出了通过增强核学习对MMP进行非
线性扩展。
这种泛化对EK-MMP取得更好的识别精度有重要意义,缓解了MMP
仅作为一个线性流形学习算法的限制。
EK-MMP的想法是在一个核学习构建的隐式特征空间F中解决MMP的这个问题。
直观的核学习是将输入数据x从原始特征空间映射至高维希尔伯特空间F,该空间是由非线性映射构造的:
在这样的空间内,人脸图像数据是线性可分的。
然后建立的线性MMP算法实现
特征空间与输入数据空间的非线性同行映射,而非显式表示的,它由核函数K(·)隐式表示,是特征空间每对点之间的内积:
在特征空间F执行EK-MMP算法意味着Gw的连接点是尽可能靠近的,而Gb的连接点是尽可能远离的,相当于解决以下优化问题:
约束条件为:
那么,在式(12)约束条件下,式(10)的最优目标函数可改写如下:
最后,在约束条件式(12)下同时考虑式(10)和式(11),EK-MMP的最优目标函数可
定为:
然后,最大化上述目标函数的变换向量a由下述广义特征值问题的最大特征值解
得到:
φ(X)(βLb+(1-β)Sw)φ(X)Ta=λφ(X)Dwφ(X)Ta
由于式(15)的特征值必须位于特征空间F所有样本范围内,存在系数ωi,i=1,2,…,n,如:
式中,ω=[ω1,ω2,…,ωn]T。
使用式(16)和式(9),改写式(15)如下:
那么,EK-MMP的问题转化为寻找矩阵(KDwKT)-1K(βLb+(1-β)Sw)KT的主特征值。
令ω1,ω2,…,ωl为式(17)的解,根据其特征值排列λ1>λ2>…>λl。
因此,对
于一个新的人脸图像数据x,它在特征空间F内a上的映射可计算如下:
对于人脸识别,会出现矩阵KDwKT奇异的问题,这源于核特征空间的维数通常远高于经验特征空间的维数,这是小样本(SSS)问题的通病,一个可行的解决办法是
通过执行核KPCA投影来降低特征空间的维数,使矩阵KDwKT满秩。
2.2 核变换
由于核函数的选择会显著影响核学习的性能,好的核函数选择是任何核算法成功的关键,因此,学者们在为待解决问题设计适当核函数方面做出了大量的努力。
直到现在,如何为给定的应用程序选择合适的核函数仍然是悬而未决的问题。
传统的可选择线性函数、多项式或高斯核作为核函数,但这些核函数不能充分利用人脸图像数据的特性。
本文提出了一种基于核变换技术的核函数K(x,y),用于提高EK-MMP的性能,如下:
其中,K(x,y)是原始输入核函数,选择高斯核k(x,y)=exp(-γ‖x-y‖2),因为它在许多模式分类应用中具有优越的性能,I是单位矩阵,L是图拉普拉斯算子矩阵,它
是人脸图像数据相关几何结构的模型,图拉普拉斯算子定义为L=D-W,D是一个
对角矩阵,由Dii=∑iWij和式(20)给出。
上述核变换技术的主要思想是通过一个最近邻图来估计其内在流形结构,保存了人脸图像空间的局部几何结构,然后把它们整合到核变换程序中,由此产生的新的核函数可以利用局部几何结构和判别信息。
最近研究表明,输入空间的局部特征和内在几何结构可能对分类性能有一定的影响,因此,输入核k(x,y)按照局部几何结构来变形,生成的核函数K(x,y)执行效果可能会比原始输入核函数好。
2.3 特征向量选择
从式(16)中可以观察到EK-MMP算法在训练阶段计算量是比较大的,因为它的计算复杂度跟需要表示转换向量的训练点数目是成比例的。
事实上,数据子空间的维度范围由核矩阵K的秩φ(xi)和大规模数据集的rank(K)决定,如果用rank(K)替换n,并在特征空间F中选择相应的子集,将极大地提高EK-MMP的计算效率,基于上述考虑,采用特征向量选择算法加速EK-MMP运行速度。
特征向量选择的基本思想是找到一个足以表示所有数据的子集,作为特征空间F
中被选子集的线性组合。
已知特征空间F中被选特征向量子集
S={φ(xs1),φ(xs2),…,φ(xsr)},其中r表示被选特征向量的数量,然后任一输入数据xi的估计映射,作为特征空间F中φS的线性组合,正式的描述如下:
式中,是系数向量。
然后,特征向量选择的目的是去发现系数βi,使估计的映射(xi)与真正的映射φ(xi)尽可能地远离,通过最小化下述目标函数可以得到它的解:
设置βi的偏导数δi为零,执行上述优化问题,通过使用矩阵形式,最优目标函数式(22)可以改写如下:
式中,KSS是一个被选向量点积的方阵,KSi是xi与被选向量集S的点积。
特征向量选择算法的最终目标是使式(23)适用于所有采样样本数据,它可以概括为以下形式:
上述优化问题的解可以从文献[14]中描述的迭代算法获得,当KSS不再是可逆的
或者被选向量预定义的数目达到时,算法停止。
2.4 分类
经由EK-MMP算法转换后,可以获得每个人脸图像的面部特征矩阵,然后,人脸识别就变成一个模式分类任务,支持向量机SVM(Support Vector Machine)[15]分类器因其在最小化VC维度和获取最小风险结构方面有良好的泛化能力而被用于分类,SVM的最优目标函数如下:
约束条件为:
一旦通过求解式(25)的二次规划问题(QP)得到最优α,SVM分类器的分类决策函
数就可给出如下:
尽管式(25)的二次规划(QP)问题有重要的计算优势,它不受局部最小值的影响,但是给定n训练样本,QP求解器的计算复杂度为O(n3),这在非常大的人脸图像数据集上是不可行的。
因此,用SVM分类器代替这种算法来求解QP问题是迫切需要的。
为此,应用以下基于乘性规则的算法来改善SVM分类器的训练速度。
式中:
式(28)中乘性迭代卓越的优点是,它可以并行实现,且从不违反非负条件约束。
此外,研究已证明这个乘性规则可以单调地提高式(25)的最优目标函数。
2.5 整个算法描述
基于上述分析,总结所提EK-MMP算法如下:
1) PCA预处理。
通过丢掉零特征值相应的成分来投影人脸图像xi到PCA子空间。
2) 根据式(4)和式(5)分别计算类间图Gb和类内图Gw的权重矩阵Sb和Sw。
3) 根据式(14)和式(12)构建核MMP最优目标函数。
4) 根据式(19)定义的核变换技术计算自适应核函数。
5) 通过求解式(24)定义的优化问题获得特征空间的特征向量子集。
6) 通过求解式(17)定义的广义特征问题获得EK-MMP的变换向量。
7) 根据式(17)将人脸图像投影到低维特征空间。
8) 根据式(25)和式(26)在低维特征空间构造SVM的最优目标函数。
9) 根据式(28)的乘性规则获得最优支持向量。
10) 由式(27)对人脸图像分类和识别。
总之,人脸识别过程有三个步骤。
首先,用降维算法EK-MMP计算人脸子空间;然后,将人脸图像投影到人脸子空间;最后,采用依靠乘性规则训练的SVM分类器识别人脸图像。
实验使用MATLAB7.0在个人计算机上实现,计算机配置为:Windows XP操作系统、迅驰酷睿2处理器、2.53 GHz主频、4 GB RAM。
为了证明本文算法的性能,对混合人脸图像数据库Yale、ORL、CPU PIE及AR进行了大量的实验。
3.1 人脸数据库
1) Yale人脸数据库包含15个人的165张图像,每个人有11张在各种表情和光照条件下的图像,如图1所示为Yale上某人的11张人脸图像示例。
2) ORL数据库包含40个人的图像,每个人提供10个不同的人脸图像,如图2所示为ORL上某人的10张人脸图像示例。
3) CMU PIE数据库子集包含68个人的图像,每个人有20张不同的人脸图像,,如图3所示为PIE人脸数据库的人脸图像示例。
4) AR人脸数据库包括70个男性56个女性的4000幅图像,这些图像包含有六类差异:脸部表情变化(无表情、微笑、生气、尖叫)、不同的光照变化、遮蔽(太阳镜和围巾)。
本文从原始AR数据库选择100个对象(50个男性和50个女性)用于实验,带有遮挡变化的人脸图像如图4所示。
所有的人脸图像先要被手动对齐、剪裁,然后调整大小为32×32像素。
采用均衡化直方图对人脸图像的亮度作归一化处理,这种混合人脸图像数据库被分成两个不
重叠集,分别用于训练和测试。
每个数据库分区用每人一半的图像用于训练,剩下的用于测试。
为减少统计上的差异,最后的结果是超过10个随机重复实验得到的平均值。
3.2 实验结果及分析
实验将提出的EK-MMP算法与核PCA(KPCA)[5]、核LDA(KDA)[6]、核
LPP(KLPP)[10]、MMP[12]进行了比较,使用原始输入高斯核函数k(x,y),参数设置为。
其中γ0是训练集的标准差。
维度从20变化到100,SVM分类器的参数C 调整由数据集10交叉验证,从21个实验中挑出最好的结果予以说明,实验结果如图5所示。
从图5可以看出:
1) 提出的EK-MMP算法优于KPCA、KDA、KLPP、MMP算法,表明EK-MMP 可以有效利用局部流形结构和判别信息进行人脸识别,与此同时,EK-MMP可以用核学习捕获人脸图像的非线性结构,因此,EK-MMP有更强的识别能力。
除了选择EK-MMP算法用于降维,核变换技术的选择,特征向量选择算法和基于乘性规则的SVM分类器都对识别率的提高起重要作用。
2) KPCA表现最差,可能由于KPCA是一个无监督算法,忽略了分类中有价值的类标签信息。
3) KDA和EK-MMP算法的性能非常接近,一个可能的解释如下:虽然KDA是一个监督算法,它不考虑流形结构;对于KLPP来说,它旨在发现局部流形结构而不是判别信息。
因此,标签信息或局部流形结构哪个更重要是值得商榷的。
4) 因为MMP既考虑了局部流形结构也考虑了标签信息,它得到了比KPCA、KDA、KLPP算法更好的性能,然而,作为一个线性算法,MMP因其图像内容和风格的高可变性可能无法捕捉非线性结构。
因此,MMP的性能比EK-MMP差。
此外,核构建是本文算法的关键技术之一,使用核变换技术构建核函数,也可以使
用其他类型的核函数如线性函数、多项式或高斯核,实验使用不同的核函数测试EK-MMP的识别性能,识别结果如图6所示。
从图6可以看到,提出的核变换技术执行效果远远好于线性函数、多项式、高斯核,主要是因为核变换技术可以利用局部几何结构和判别信息、输入空间的内在几何结构,这些跟分类的识别能力都有关系,因此,核变换技术比传统的核函数获得了更好的识别率。
此外,分析了遮挡变化对本文算法识别性能的影响,实验使用每人8幅未遮挡的
正面视图图像作为训练图像,使用包含太阳镜(覆盖图像的30%)和围巾(覆盖图像
的50%)的两个分离集作为测试集,并与其他几种核函数进行比较,识别结果如表
1所示。
从表1可以看出,相比其他几种核函数,本文算法能获得与它们相当甚至更好的
识别率。
而在识别效率上,本文算法的识别速率约为高斯核的15倍。
在围巾集这种几乎遮挡住一半人脸的数据集上,本文算法仅对2%的图像误分类,就目前所知,这是在围巾集上仅使用灰度值作为特征时得到的较好的结果。
3.3 性能比较
最后,为了验证本文算法的效率,实验记录上述三种基于核算法的计算时间,运行时间比较如表2所示。
从表2可以看出,本文算法比KPCA、KDA、KLPP算法更高效,主要由于特征向量选择策略加快了EK-MMP的运行速度,基于乘性规则的算法进一步提高了
SVM分类器的训练速度,由此体现了本文算法的高效性。
人脸识别、降维技术被广泛用来减少人脸图像数据维数和提高判别信息,为了进一步改善人脸识别的识别效果,提出了一种基于增强核学习的最大边缘投影算法,在Yale、ORL、CPU PIE及AR人脸数据库上的实验结果表明了本文算法的有效性及高效性。
未来通过改变初始参数的设置,进行大量的实验,并结合其他先进的技术,在提高基于核学习的人脸识别算法的识别率的同时,进一步提高算法的效率。
【相关文献】
[1]周旭东, 陈晓红, 陈松灿. 半配对半监督场景下的低分辨率人脸识别[J]. 计算机研究与发展, 2012, 49(11): 2328-2333.
[2]王科俊, 邹国锋. 基于子模式的Gabor特征融合的单样本人脸识别[J]. 模式识别与人工智能, 2013, 26(1): 50-56.
[3]邓剑勋, 熊忠阳, 曾代敏. 基于EMD的融合特征快速多示例人脸识别算法[J]. 四川大学学报:工程科学版, 2012, 44(2): 99-104.
[4]曹洁, 吴迪, 李伟. 基于鉴别能力分析和LDA-LPP算法的人脸识别[J]. 吉林大学学报:工学版, 2012, 42(6): 1527-1531.
[5]Wen Y, He L, Shi P. Face recognition using difference vector plus KPCA[J]. Digital Signal Processing, 2012, 22(1): 140-146.
[6]张建明, 杜丹, 刘俊宁. 基于2D-Gabor与KLDA的特征提取[J]. Computer Engineering, 2011, 37(15): 137-139.
[7]Li M, Liu Y. Iso-map: Energy-efficient contour mapping in wireless sensor networks [J]. Knowledge and Data Engineering, IEEE Transactions on, 2010, 22(5): 699-710.
[8]惠康华, 肖柏华, 王春恒. 基于自适应近邻参数的局部线性嵌入[J]. 模式识别与人工智能, 2010, 23(6): 842-846.
[9]侯臣平, 吴翊, 易东云. 新的流形学习算法统一框架及改进的拉普拉斯特征映射算法[J]. 计算机研究与发展, 2009, 46(4): 676-682.
[10]金一, 阮秋琦. 基于核的正交局部保持投影的人脸识别[J]. 电子与信息学报, 2009, 31(2): 283-287.
[11]王永茂, 徐正光, 赵珊. 基于自适应近邻图嵌入的局部鉴别投影算法[J]. 电子与信息学报, 2013, 35(3): 633-638.
[12]Lu G F, Lin Z, Jin Z. Face recognition using discriminant locality preserving projections based on maximum margin criterion [J]. Pattern Recognition, 2010, 43(10): 3572-3579. [13]王庆军, 张汝波, 刘冠群. 一种应用于人脸识别的核正交等度规映射算法 [J]. 光电子·激光, 2010, 21(11): 1702-1705.
[14]朱杰, 杨万扣, 唐振民. 基于字典学习的核稀疏表示人脸识别算法[J]. 模式识别与人工智能, 2012, 25(5): 859-864.
[15]麻宏静. 基于相对角聚类和支持向量机的人脸特征点定位技术研究[D]. 西北大学, 2010.。