一种基于位平面的压缩域人脸识别算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一种基于位平面的压缩域人脸识别算法
代毅;肖国强;李占闯
【摘要】针对光照等干扰因素对人脸识别的不利影响,以及人脸图像的维度过高等问题,提出了一种新的基于位平面的压缩域人脸识别算法.该算法综合利用了图像丰富的位平面信息和压缩域内图像处理技术,提出新的人脸特征表达方法.实验结果表明,该方法不仅能够有效地降低图片维度,并且具有较好的鲁棒性.
【期刊名称】《计算机工程与应用》
【年(卷),期】2010(046)001
【总页数】4页(P140-142,153)
【关键词】离散余弦变换;位平面;主成份分析(PCA)
【作者】代毅;肖国强;李占闯
【作者单位】西南大学计算机与信息科学学院,重庆,400715;西南大学计算机与信息科学学院,重庆,400715;西南大学计算机与信息科学学院,重庆,400715
【正文语种】中文
【中图分类】TP391.41
DAI Yi,XIAO Guo-qiang,LI Zhan-chuang.Face recognition algorithm based on bit-planes in compressed puter Engineering and Applications,2010,46(1):140-142.
人脸识别技术的研究工作自20世纪60年代开始以来,经历了几十年的发展,已经取得了长足的进步,成为近年来模式识别和人工智能领域中的研究热点。

然而文献中
所提出的人脸识别方法大多数是基于像素域的人脸图像,包括实验用的一些人脸图像数据库,如Yale、ORL、MIT,也大多数是BMP格式的图像。

在面对实际应用中海量存贮的压缩人脸图像时,要先对图像进行解压操作,然后再进行识别,这无疑大大限制了识别系统性能的提高[1]。

另一方面,在诸多人脸识别的算法中,基于PCA(主成份分析)的特征脸方法是一种有效的特征提取方法[2-3],它不仅可以有效地降低人脸图像的维数,同时又能保留主要的识别信息。

但此方法需要将人脸图像矩阵预先转换成一维的向量,然后以向量作为原始特征进行特征提取。

由于转换后的一维向量的维数一般较高,对随后的特征提取造成困难,使得后续算法具有较高的计算复杂度。

为此,Yang等人提出了二维PCA方法进行人脸图像的特征提取[4],此方法不需要预先将人脸图像矩阵展开成一维的向量,有效地提高了特征提取的速度,并取得了较高的识别率。

但此方法所提取的特征维度较高,对光照、遮挡、人脸表情以及姿态等多种因素的鲁棒性不强。

在此基础上,Yan等人提出一种基于位平面和广义PCA的人脸识别方法——BPGPCA[5],把人脸在像素域的位平面信息分为轮廓信息和纹理信息,通过融合这两类信息构造新的在酉空间的人脸,最后进行广义PCA分析。

拥有较高的识别率和较强的鲁棒性。

但是此方法是基于像素域的,不但需要对压缩图片进行全解压操作,并且在其位平面提取的纹理信息对人脸识别的作用不大。

提出一种在DCT域上的,融合位平面信息的人脸图像特征提取方法,利用类内平均脸进行PCA分析,从而实现人脸识别。

通过对India人脸标准库进行的实验结果表明,该方法有效地降低了特征向量维度,具有更好的鲁棒性,并且在样本数较低的情况下也能达到较高的识别率。

在压缩域上的人脸图像的提取,是指在不完全解压的情况下,直接挖掘图片在压缩域上的信息,从而达到人脸识别的目的。

目前的编码标准中普遍采用的是基于
DCT变换的压缩算法,使得基于这种压缩域上的图像特征提取技术成为压缩域上图像特征提取技术的主流。

JPEG标准采用的是DCT技术,其编/解码过程如图
1[6]。

DCT变换具有把高度相关数据能量集中的趋势,变换后得到的DC系数包含了图像平均亮度信息。

将图像分成8×8的像素块,对每块进行DCT变换。

仅提取每一个宏块中的DC系数,构成一副原图的DC图像,其长和宽都为原图的1/8,数据量为原图的1/64。

这样利用DC图像就可以实现在不完全解压的情况下进行人脸识别。

假设一幅人脸图像像素值由八位二进制数表示,通过分别提取二进制数的每一位,一幅图片能分解为八个位平面。

图2中列出了一幅人脸图像及其8个位平面的示例。

由图2可见随着位平面从低位到高位(即从位平面1到位平面8),人脸的轮廓特征逐渐变得明显。

借助图像的位平面表示形式可以采取对图像特定位平面的操作来达到对图像特征描述的目的。

将图像经过直方图均衡化预处理,然后再进行位平面分解[7],得到的结果如图3所示。

由图可见,经直方图均衡化预处理的人脸图像,其第1、2、6、7和8五幅能够辨认出人脸的轮廓来,其携带了丰富的轮廓信息。

影响人脸识别的因素主要来源于类间的差异和类内的差异[8]。

同一个人的多幅图像由于受光照、表情等因素的影响,人脸的类内差异会远远大于不同人之间的类间差异。

研究表明,PCA算法受面部饰物、光照、表情等变化因素影响较大。

为了提高人脸的识别率,急需降低人脸的类内差异,因此考虑对这些位平面进行加权,引起类内差异过大的位平面权重小,使处理后的图片较好地保留原图像信息,而且能够有效地避免干扰因素的影响。

整个位平面加权的特征向量提取实现过程如下:
用Xls表示第 s个人的第 l幅图像(其中 s=1,2,…,S,l=1,2,…,L,人脸
图像都是默认为经过了直方图均衡预处理)。

某一个人的类内平均脸Xs为:
对进行位平面抽取得到其五个平面(其中 n=1,2,6,7,8)。

则进行归一化后新的人脸图像为:
同样,对于类内平均脸Xs也可以得到其归一化后的新人脸图像As:
权值am需要通过实验得到,其值因训练样本的不同而不同,每更换一组训练样本都需要对am的值重新通过实验确定。

经大量实验发现权值am的取值存在以下规律:随着位平面i的升高其相应的权值呈递增趋势,说明更高位平面图像包含的信息更丰富。

并且,不同的训练样本其各位平面图像受到光照等干扰信息的影响不同。

通过比较各单幅位平面图像的识别率Pi,能够判断此位平面所受影响程度。

显然,Pi值较小的,此位平面被影响的程度较大。

加权策略要能够反映以上规律,使加
权后的图像类内差异降低,并保留尽可能多的人脸信息。

因此,采用如下加权策略:对加权策略还需补充的是:当某个位平面k受干扰因素影响较大时,即Pk较小的情况下(一般当Pk<Pmax×70%时,认为此位平面受干扰较大,其中Pmax为
Pi中的最大值),式(4)的加权策略还不足以有效地消除干扰,需将加权策略修改为:
经过1.2节的处理,得到了经过轮廓特征加权后的新的人脸。

再利用类内平均脸对其类内的训练样本进行规范化处理,然后计算图像协方差矩阵,并根据此协方差矩阵求解一组最优特征向量来用于人脸的特征提取。

这样不仅扩大了类间样本差别,还缩小了类内样本差别[9]。

人脸样本的图像协方差矩阵Gt定义如下:
显然,Gt为n×n维的非负定对称矩阵(假设人脸图像为n×n的矩阵)。

定义求
解最优特征向量的准则函数J(x)为:
式(7)中,x为n维的单位列向量,使得J(x)取得最大值的特征向量称为最优特征向量,此最优特征向量也即为图像协方差矩阵Gt的最大特征值所对应的特征
向量。

通常选取Gt的前d个最大的特征值所对应的单位正交特征向量作为一组最优特征向量,于是这d个特征向量就构成了一个特征子空间W,即W=[X1,
X2,…,Xd],其中 d<n。

构成特征子空间的特征向量维度的选取与识别率的高低有直接影响。

当特征向量维度由小到大增加时识别率会随之增加,但识别率增加到一定程度之后,会趋于稳定甚至下降。

这是因为,最初当特征向量个数增加时,特征向量所能表征的主要人脸模式也随之增加,但当特征向量个数增加到一定程度后,会引入一些次要人脸模式和噪声,因此这时识别率变化不大甚至下降[9]。

把最大化识别率的特征向量维度称为最优维度,其值的选取因训练样本的不同而不同。

也就是说,每更换一组训练样本,都需要重新计算最优维度。

假设求得特征向量对应的特征值按降序排列为:X1,X2,X3,X4…。

图4为按降序排列的特征值。

最优维度的确定包含两种情况:(1)如果在其中能够找到一个明显的“陡降”范围,那么最优维度往往比较容易确定。

在“陡坡”前面部分的特征值之和与总的特征值之和的比值较大,其对应的特征向量包含了大量的信息。

(2)如果在没有明显的“陡降”的情况下。

利用归一化后的相邻特征值的差值,按照如下方法进行判断。

设θn=(λn-λn-1)/λ1,图 5 所示为Δθn=(θn-θn-1)的图像。

可以看出在峰值处即为“梯度”较大的地方,而最优维度往往出现在此处。

实验发现,若峰值出现在比较靠前或者比较靠后(一般小于总特征值个数的10%或大于30%)的位置,都是不可取的。

理由是前者包含的信息不足够,后者因为所包含维度太大,其代价
太高。

因此图5中,第一个出现峰值的位置5不可取,紧跟的三个峰值位置11,14,16作为最优维度的取值。

基于位平面的压缩域人脸识别的整个算法的流程图如图6所示。

实验选用Indian人脸库,该图库是JPEG格式,每幅图像大小640×480像素。

图库分为两个目录:males和females,一共包含40类人,每类11幅图像。

库中图像包括了光照、姿势的变化,饰物的遮挡,年龄的变化等。

实验从males目录中随机挑选15类人,将彩色图像转换为黑白图像来进行识别。

选取每人的前6张图像作为训练样本,用剩下的图像作为测试样本,总的训练样本数为90,测试样本数为75。

一共实验3次,取3次实验的平均值作为最后的识别结果。

如图7所示为Δθ的分布图,观察峰值出现的位置,取特征向量维度为7。

实验测得各单幅位平面的识别率分别为:p1=80%,p2=60%,p6=77.3%,
p7=81.33%,p8=57.53%。

据1.2节得所赋权值为:a1=0.64,a2=0.72,
a6=3.58,a7=4.63,a8=1.49。

将提出的算法和2DPCA、BPGPCA进行比较,在表1中列出了各种识别方法的最优识别率及达到最优识别率时特征空间大小(其中特征空间大小为单个特征向量大小与特征向量维度之积)。

另外,还在不同训练样本数下进行了实验,观察在每类不同训练样本数目下,各算法的识别率,测试结果如表2所示。

实验结果表明,在Indian人脸库上,该文方法的识别率明显的高于2DPCA和BPGPCA,并且在所需空间的大小上却远小于它们。

当人脸库中的数目很大或者人脸图片尺寸很大时,利用该文提出的方法具有很大的优势。

从表2可以看出,
2DPCA和BPGPCA随着样本数的减少,识别率下降非常明显。

虽然该文方法也出现了识别率下降的问题,但是可以看到方法的下降幅度明显更小,证明了方法较强的鲁棒性。

提出一种基于位平面的压缩域人脸识别算法。

利用人脸在DCT域上的轮廓位平面信息,通过加权特征融合构造新的人脸,最后利用类内特征脸进行PCA分析。

提高了识别率,大幅度降低了特征空间大小,并且具有较好的鲁棒性。

在人脸库中的数目很大或者图片较大时其优点非常明显。

【相关文献】
[1]Feng G C,Jiang J.Image extraction in DCT domain[J].IEEE Proc Vis Image Signal Process,2003,150(1).
[2]Turk M,Pentland A.Face recognition using eigenfaces[C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition.Maui:IEEE,1991:586-591. [3]Turk M,Pentland A.Eigenfaces for recognition[J].Cognitive Neuroscience,1991,3(1):71-86.
[4]Yang Jian,Zhang D,Alejandro F,et al.Two-dimensional PCA:A new approach to appearance-based face representation and recognition[J].IEEE Transactions on PAMI,2004,26(1):131-137.
[5]Wallace G K.The JPEG still picture compression standard[J].Communication of the ACM,1991,34(4):31-45.
[6]Meng Ji-cheng,Zhang Wen-bin.Volume measure in 2DPCA-based face
recognition[J].Pattern Recognition Letters,2007,28:1203-1208.
[7]Wang Hui-yuan,Leng Yan,Wang Zeng-feng,et al.Application of image correction and bit-plane fusion in generalized PCA based face recognition[J].Pattern Recognition Letters,2007,28(16):2352-2358.
[8]Wang Peng,Ji Qiang,James L,et al.Modeling and predicting face recognition system performance based on analysisofsimilarity scores[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2007,29(4):665-670.
[9]Gan Jun-ying,Zhou Dang-pei,Li Chun-zhi.A method for improved PCA in face recognition[J].International Journal of Information Technology,2005,11(11).。

相关文档
最新文档