改进PCA-LDA的人脸识别算法研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

改进PCA-LDA的人脸识别算法研究
马帅旗
【摘要】针对主成分分析(PCA)未充分利用样本类别信息及线性鉴别(LDA)在小样本时识别率低的问题,提出了一种基于PCA和LDA相融合的人脸识别算法。

该算
法首先将输入人脸图像进行几何位置规范化和灰度分布均衡化预处理;然后利用PCA算法将人脸训练图像投影到低秩特征子空间,利用LDA算法计算类间离散度大、类内离散度小的特征子空间,从而获得PCA-LDA的人脸融合特征空间;最后将训练
样本、测试样本投影至融合的特征空间,并利用最近邻准则实现对测试样本的识别。

实验结果表明,该算法能够有效融合PCA和LDA的优势,提高系统识别的鲁棒性和
效率。

【期刊名称】《陕西理工大学学报:自然科学版》
【年(卷),期】2019(000)002
【总页数】5页(P62-66)
【关键词】主成分分析;线性鉴别分析;特征融合;几何归一化
【作者】马帅旗
【作者单位】[1]陕西理工大学电气工程学院,陕西汉中723000;
【正文语种】中文
【中图分类】TP391.41
在人脸图像识别系统中,图像大小对系统的识别速度影响较大,因而在保留图像数
据主要特征信息的情况下,将高维图像数据投影至低维特征空间,并采用特征降维的方法进行目标识别。

目前,人脸图像特征提取和线性降维方法主要有主成分分析(Principal Component Analysis,PCA)和线性鉴别分析(Linear Discriminant Analysis,LDA)等方法。

PCA是以图像数据K-L变换为基础的无监督特征提取方法[1],是在保证各维度数据方差最大的约束下,将原始数据投影到低维线性子空间,使原始数据在保留各维度分布特性的基础上信息损失量最少。

PCA算法侧重于提取原始数据的特征信息,具有较高的识别率和识别速度,但PCA算法对光照和拍摄角度等敏感[2],未充分考虑图像已有的类别标签信息,因而所获得的特征并不是最有效的类别分辨特征。

LDA算法是一种带有标签的有监督降维方法,LDA充分考虑同类之间和不同类别之间的特征信息,选择使得Fisher准则函数达到极值的向量作为最佳投影方向,从而使投影后不同类的样本离散度最大,而同类的样本离散度最小[3]。

LDA方法能从高维数据空间中提取出具有类别鉴别能力的低维特征,改善了光照不均匀时图像的识别率,但当训练样本数小于样本维数时,LDA的类内离散度矩阵SW奇异,无法求解矩阵的特征向量,导致小样本时的LDA性能较差。

本文结合PCA与LDA算法的优势与不足,提出PCA子空间与LDA子空间的融合算法,利用PCA将高维空间的样本投影到低维空间,以保证样本类内离散度矩阵非奇异,再利用LDA算法进行特征提取,实现两种特征子空间融合,再将人脸测试集投影至融合的特征空间,依据最近邻分类准则进行分类,从而整体上提高识别系统的鲁棒性和识别效率。

1 图像的预处理
由于识别的图像易受外部光照强度、拍摄角度、焦距等因素影响,因而需要对输入图像进行预处理。

图像的预处理主要涉及输入图像的几何位置规范化[4]和图像灰度归一化。

几何位置规范化是对原始输入图像进行旋转、缩放和裁剪等操作[5],
灰度归一化用于消除噪声对输入图像灰度分布的影响,从而使预处理后的图像的尺度、方向和灰度分布基本相似。

依据双眼在图像中的纵横坐标对人脸图像进行角度旋转、尺度缩放和边界裁剪等几何归一化处理,从而使得处理后的双目之间距离和双目距图像边界距离都达到预先设定值。

若旋转中心位于图像的左上角,左、右眼的中心坐标分别为(xl,yl)、(xr,yr),为了保证两眼处于同一水平线,则绕图像左上角逆时针旋转的角度
若(x1,y1)和(x2,y2)分别表示旋转前、后点的坐标,则图像中的像素点旋转变换关系可表示为
(1)
若(x2,y2)、(x3,y3)分别表示缩放前、后的图像像素坐标,经过缩放后双目的预定标准距离D1=70,实际距离的计算公式为缩放比例为k=D1/D2,则像素点的缩放变换关系为
(2)
为了使预处理后的人脸图像的宽度width=130,高度height=150,左眼睛距图像的左边界距离和右眼睛距图像的右边界距离为30,双目的对称中心与图像的上边界和下边界的距离分别为50和100,需要对图像进行平移和裁剪处理。

若(xl,yl)和(xr,yr)分别为图像平移前的左眼、右眼中心纵横坐标,Δx和Δy分别表示水平偏移量和垂直偏移量,则水平和垂直方向的平移距离为Δx=width/2-(xl+xr)/2、
Δy=height/3-(yl+yr)/2。

若像素点(x3,y3)和(x4,y4)分别表示平移前后图像像素点的坐标,则图像中像素点的平移变换可以表示为
(3)
图1为经过上述旋转、缩放和平移预处理后的人脸图像,像素(x,y)经预处理后的坐标(x′,y′)可以表示为
(4)
(a) 原始图像 (b) 旋转、缩放并剪切后的图像图1 人脸图像的几何归一化
在人脸图像预处理时,可以选择双眼、双眉、鼻尖与嘴巴中线作为特征点进行归一化处理。

如在双眼部分或全部被遮挡的情况下,选择两眉毛中点进行归一化处理。

为了使预处理后的人脸图像的宽度width=130,高度height=150,左眉毛中点距图像的左边界距离和右眉毛中点距图像的右边界距离为30,双眉毛的对称中心与图像的上边界和下边界的距离分别为30和120。

同理,若双眼、双眉都被遮挡时,选择鼻尖和嘴巴中线为特征点进行归一化,鼻尖距离上边界距离为110,嘴巴中线距离下边界为20,鼻尖距离左右边界75。

2 基于PCA与LDA的特征融合与识别
训练图像样本集表示为X=[x1,x2,…,xN]∈Rm×N,xi表示图像转化成的列向量,m为图像的像素数,N为训练图像的数量。

按照图像是否属于同一对象的原则进行分类,训练图像样本矩阵[6-7]也可表示为X=[X1,X2,…,XC]∈Rm×N,C为类别数,Xj∈Rm×Nj表示第j类训练图像集合,Nj表示第j类图像的数量,总样本数PCA与LDA特征融合与识别步骤如下:
步骤1 将训练集合中的所有图像转换为列向量,计算每类图像的类内平均图像和总体平均图像计算每幅图像相对于所属类平均图像的差值图像φi=x-μi;计算每类图像相对于总体平均图像的差值图像φ=μi-μ。

步骤2 计算特征差值的协方差矩阵
Ф
(5)
步骤3 求取差值协方差矩阵Ф的非零特征值λ=(λ1,λ2,…,λN),进而求取对应特征向量V=(v1,v2,…,vN),并对特征向量按照特征值降序方式进行排列:
Ф·V=λ·V。

(6)
步骤4 计算协方差矩阵特征值的累积贡献率一般取80%~99%之间,选择前r个
较大特征值对应的特征向量Vr=(v1,v2,…,vr)作为训练特征差值PCA的特征子空间Wpca=(v1,v2,…,vr)。

步骤5 将输入图像x、每类平均图像μj和总体平均图像μ投影到PCA子空间[5]:
(7)
(8)
(9)
步骤6 分别计算LDA算法中的每个类内散布矩阵Sj、总体类内散布矩阵SW及类间散布矩阵SB:
(10)
(11)
(12)
步骤7 根据Fisher准则,使样本在LDA投影空间内的类间离散度SB最大和类内离散度SW最小,可知最佳投影子空间W满足
(13)
步骤8 依据拉格朗日乘数法可得
(14)
利用特征分解方法求取矩阵的特征值λ及特征向量W,将矩阵的特征值按降序排列,选择前p个较大特征值λ=(λ1,λ2,…,λd,…,λp)对应的特征向量构成LDA的特征子空间Wida=(W1,W2,…,Wd,…,Wp)∈Rl×p。

步骤9 将PCA和LDA的特征空间进行融合[2]:
(15)
对于任意一图像列向量x,在融合特征空间的投影关系可表示为
(16)
将训练图像及测试图像分别投影至融合的特征空间,若y和Yi分别表示测试样本x和训练样本类Xi投影后特征,则定义在融合投影空间中测试样本x到训练样本类Xi的距离为
D(x,Xi)=‖y,Yi‖,
(17)
依据最近邻分类准则,若且x∈Xj,则最近邻分类器的分类决策为x∈Xj。

3 实验结果及分析
采用英国剑桥大学Olivetti实验室的ORL人脸库进行实验,该人脸库包含400幅人脸图像,分为40类不同年龄、不同性别和不同种族的人脸,而每类人脸又包含10幅不同方向、光照、面部表情和面部遮挡物的图像。

对40类人脸库中每类人
的前5幅图像进行训练,后5幅图像进行测试。

表1给出了PCA和PCA-LDA融合算法的识别率与投影特征维数之间的关系。

表1 识别率与特征维数关系特征维数PCA识别率/%PCA-LDA识别率
/%2592.094.03592.594.04592.594.05592.594.56593.095.07592.595.58591.0 96.09590.594.5
从表1可知,当特征空间维数小于25时,虽然PCA和PCA-LDA融合算法的识
别率都较低,但随着特征维数的增加,二者的识别正确率增长较快;当融合特征空间维数继续增加且小于65时,识别率逐渐增加并趋于稳定,PCA算法正确识别率的极值点为93%,PCA-LDA算法的正确识别率的极值点为96%;若融合特征空
间的维数继续增加时,融合特征空间的维数过多,所有的特征向量并不都代表有效的投影方向,部分特征向量可能表征与人脸特征无关的噪声、背景等投影方向,正确识别率也不会超过极值点,反而随着维数增加而逐渐减小。

ORL人脸库中共计40类人,每类人共10幅图像,其中i幅用于训练,则10-i幅图像用于实验测试。

设定PCA算法的累计贡献率为0.9,表2给出了不同算法下
识别率与训练样本个数之间的关系。

表2 不同算法下识别率比较样本数PCA识别率/%LDA识别率/%PCA-LDA识别

/%167.1961.1175.00272.5075.3184.29380.4284.6988.93482.5091.6793.7558 5.0092.0094.50690.8393.7597.50793.7595.0098.38897.5097.50100
由表2可以看出,当训练样本为1时,LDA的识别率仅为61.11%,受LDA算法影响,PCA-LDA融合算法识别率相对于PCA略大;当训练的人脸图像小于3,PCA、LDA和PCA-LDA算法的识别率都相对较低,PCA-LDA最高不超过89%;训练的样本数增加时,PCA、LDA和PCA-LDA的识别率逐渐增加,且PCA-LDA 的增长率高于PCA和LDA;当训练样本数为8时,PCA-LDA的识别率达到
100%。

表3给出了不同的训练样本下,LDA的最佳投影维数与识别率之间关系。

表3 不同训练样本下的PCA-LDA识别率训练样本数LDA投影维数PCA-LDA识别率
/%12375.0022984.2933888.9342993.7552494.5062797.5071898.38816100 另外在实验中发现,PCA算法侧重于提取图像数据原始特征,LDA算法侧重于提取同类之间及不同类之间的差别,当每类样本较少时,样本类别信息不足,LDA 识别效果较差;当训练的样本数增加时,同类及不同类的特征信息增加,识别率有显著提高。

PCA-LDA算法能够结合PCA及LDA算法的优势,对样本类别具有较好的鲁棒性,能获得较好的正确识别率。

4 小结
本文首先将原始图像投影至PCA特征空间,实现数据降维;然后用LDA的类别标签信息,获得类内样本特征及类间样本特征;进而实现PCA与LDA特征融合,获得一个有效的分类器。

实验结果表明,该PCA-LDA融合算法能够结合二者优势,有效解决小样本问题,对光照不均匀、表情变化及拍摄方向具有一定鲁棒性,其识别率高于传统的PCA算法,具有一定的应用价值。

[ 参考文献 ]
【相关文献】
[1] 刘毛溪,万鸣华,孙成立,等.无监督的稀疏差分嵌入特征提取方法[J].小型微型计算机系
统,2017,38(5):1134-1138.
[2] 何国辉,甘俊英.PCA-LDA算法在性别鉴别中的应用[J].计算机工程,2006,32(19):208-210.
[3] 方菲菲,余稳.基于PCA-LDA-SVM的多普勒雷达车型识别算法[J].数据采集与处
理,2012,27(1):111-116.
[4] 邓洪波,金连文.一种基于局部Gabor滤波器组及PCA+LDA的人脸表情识别方法[J].中国图象图形学报,2007,12(2):322-329.
[5] 华顺刚,周羽,刘婷.基于PCA+LDA的热红外成像人脸识别[J].模式识别与人工智
能,2008,21(2):160-164.
[6] 杨方方,吴锡生,顾标准.基于低秩子空间投影和Gabor特征的稀疏表示人脸识别算法[J].计算机工程与科学,2017,39(1):131-137.
[7] 范哲意,曾亚军,蒋姣,等.改进的稀疏表示静止-视频人脸识别算法[J].信号处理,2016,32(5):567-574.。

相关文档
最新文档