基于加权小波的DCT人脸识别算法研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于加权小波的DCT人脸识别算法研究
余嘉;方杰;许可
【摘要】In order to solve the problem of high dimensional image with complicated calculation, the paper proposes a method combined with weighted wavelet analysis and DCT for face recognition. The method decomposes face image by wavelet, extracts the DCT transform coefficients of low-frequency and weighted high-frequency as feature vectors. It uses the weighted distance for classification. Compared with the traditional PCA algorithm as well as wavelet combining PCA algorithm, the experimental results on ORL and YALE face databases show that the proposed algorithm can improve the training time and the recognition rate.%针对图像维数过高,计算复杂的问题,提出一种基于加权小波分析和DCT的人脸识别方法,通过对人脸图像进行小波分解,提取低频和加权高频分量的DCT变换系数作为识别特征向量,采用加权距离进行分类识别.该方法在ORL和YALE人脸库上进行了测试比较,结果表明,无论训练时间还是识别率,都优于传统的PCA方法,和小波结合PCA的方法相比较,识别率也明显提高.
【期刊名称】《计算机工程与应用》
【年(卷),期】2012(048)017
【总页数】5页(P199-202,237)
【关键词】人脸识别;加权小波分析;离散余弦变换(DCT);加权距离
【作者】余嘉;方杰;许可
【作者单位】重庆大学自动化学院,重庆400030;重庆大学通信工程学院,重庆400030;重庆大学通信工程学院,重庆400030
【正文语种】中文
【中图分类】TN391
1 引言
随着社会的不断进步以及各方面对快速有效自动身份验证的要求,人脸识别技术近年来得到了飞速的发展。
光照、表情、视角、姿态以及图片的质量等是影响人脸识别效果的因素,对此提出了利用局部频率描述[1],纹理和深度信息结合[2]等方法来进行识别。
统计学习的方法是目前针对小样本统计估计和学习的最佳理论。
基于统计学习的人脸识别法中特征提取是关键,直接影响到分类识别的效果。
一幅图像的主要信息包含在低频部分,细节信息则体现在高频部分。
人脸识别过程中,图像维数过高,计算复杂,如何提取有用信息是研究的关键。
小波变换是一种时域和频域的变换,采用小波分解图像,可以得到图像的低频系数和高频子图,用分解后的小波系数来描述人脸图像,可大大减少了后续计算的复杂度。
离散余弦变换(DCT[3])是从DFT变换发展而来的,是一种正交变换,在性能上接近K-L变换(PCA),变换后将大部分能量集中在小部分系数(特征值)上,是一种常用的图像压缩方法,相对于PCA,离散余弦变换(DCT)数据独立,仅依赖于单个图像本身,增加训练样本不需要重新训练,不像PCA那样依赖于整个训练样本,而且DCT拥有快速算法。
目前,小波变换被广泛地应用于人脸识别,将图像进行小波变换后,对低频分量应用各类线性、非线性方法提取特征进行分类识别或者将各频率分量直接连接起来构成人脸向量进行特征识别,还有则是应用对数域DCT进行光照补偿后采用小波提
取特征来分类识别[4-6]。
根据文献[6]启示,首先利用二维离散小波变换对人脸图像进行分解,再分别对低
频和加权高频分量进行离散余弦变换(DCT),提取DCT变换系数作为识别特征,加权计算低频和高频距离进行分类识别[7]。
在ORL和YALE人脸库上进行仿真实验,证明了该方法取得较好的识别效果。
2 人脸图像的小波分解
小波变换的核心就是对图像相应的像素值或图像位置的系数进行均值和差值的计算,产生由像素的平均值和细节系数表示的图像,去除一些冗余信息。
二维离散小波变换是将二维图像在不同的尺度上进行分解,得到各方向细节分量,如图1所示。
图1 二维小波分解
人脸图像经过二维小波分解后,可得到低频子带图LL,高频子带图LH、HL、HH,LL为原图像的平滑像,LH保持了原图像的垂直边缘细节,HL保持了原图像的水
平边缘细节,HH保持了原图像的斜边缘细节。
对每次得到的LL还可以再次进行
小波变换,又可以得到下一级的4个子带图[4],如图2所示。
对于正面人脸,表情主要反映在眼睛和嘴巴,眼睛和嘴巴的水平特征要比垂直特征明显,小波分解的水平边缘子带图HL刻画了人脸的表情特征;人脸的轮廓和鼻子的垂直特征比水平特征要明显,易受发型和侧脸姿势的影响;对于刚体模式,斜边缘信息反映图像的整体结构特征,但对于非刚体模式的人脸,斜边缘信息的稳定性最差。
图2 小波分解子带图
对人脸图像进行小波变换的两个关键问题是小波基的选择和分解层数的确定。
不同的小波基,不同的分解层数对最后的识别率和识别速度都会产生影响。
3 基于离散余弦变换(DCT)的特征提取
二维离散余弦变换的定义如下[6]:
其中F(u,v)为DCT系数,u=0,1,…,M-1;v=0,1,…,N-1。
a(u),a(v)定义如下:
图3 人脸图像的DCT变换及重构
一幅图像经过离散余弦变换之后,DCT系数F(u,v)值较小的分布在频域变化因子u,v较大的区域,而较大的F(u,v)值分布在u,v较小的左上角区域,即有用信息集中区域,如图3(b)所示,人脸图像经过DCT变换之后,主要的能量集中在左上角区域,通过提取左上角的DCT变换系数,可以进行图像重构,如图3(c)所示,是分别提取50×50,25×25数量的DCT系数重构的人脸图像,可以看出,只需要提取部分合适的系数,就可以很好地重构出原图。
在人脸识别中,通过提取适当的离散余弦变换系数,即可作为人脸的特征向量进行人脸识别,大大降低了计算的复杂度。
4 基于加权小波变换和离散余弦变换的人脸识别
首先对人脸图像进行小波变换,然后对低频分量进行DCT变换,提取DCT系数
构造低频特征向量,再对加权高频分量进行DCT变换,提取DCT系数构造高频
特征向量;识别时,对给定的待测样本进行同样的小波变换和DCT变换,提取相
应的变换系数构造低频和高频特征向量,将待测试样本的低频和高频向量与训练样本的低频和高频特征向量计算欧式距离,加权得到新的距离,采用最近邻分类方法进行识别。
流程框图如图4所示。
人脸图像经过小波变换后,得到:
(1)低频训练样本集
AL=[x1L,x2L,…,xNL],其中xiL=LL ,LL 为人脸图像小波变换后的低频分量,N为训练样本数。
(2)加权高频训练样本集
AH=[x1H,x2H,…,xNH],其中 xiH=a1HL+a2LH ,HL和LH分别为人脸图像小
波变换后高频水平分量和垂直分量,a1,a2为加权系数,N为训练样本数。
根据第2章,经小波变换后,低频分量体现了图像的近似特征,包含了大部分的
图像信息,则作为主要的特征提取分量;各高频分量体现了图像的不同细节特征,在识别过程中可辅助区分模糊类,眼睛、嘴巴体现的水平特征和鼻子所反映的垂直特征是识别中区分表情的重要细节,由于人脸是非刚体模式,斜边缘信息的稳定性很差,所以实验中舍去了该高频分量。
将xiL和xiH分别进行DCT变换,得到:
(1)低频特征向量空间
XL=[λ1L,λ2L,…,λNL],其中λiL为 xiL的DCT变换部分系数。
(2)加权高频特征向量空间
XH=[λ1H,λ2H,…,λNH],其中λiH 为 xiH 的DCT变换部分系数。
测试人脸经过小波分解和DCT变换后得到低频特征向量μL和加权高频特征向量
μH,与训练样本集计算欧式距离:
低频:,其中i=1,2,…,N 。
加权高频:,其中i=1,2,…,N 。
加权距离:,其中β 1,β2为距离加权系数。
5 实验结果和分析
实验中采用ORL标准人脸数据库,该人脸库包括40个人,每个人10张图像,共400张,大小为92×112,灰度级为256,每幅图像的光照、姿态、角度各不相同,是目前研究中较常用的人脸库。
目前小波基的选择还没有很好的理论指导,一般通过大量的实验来选择。
对于小波分解层数,太少的层数可能效果不太好,太多的分解层数则会大大减少图像包含的
信息量,文中采用双正交小波[8]对图像进行小波变换。
对于DCT变换系数的提取,不是越多越好,太多的DCT系数并不表示可以很好地识别,由前面的分析知道,
经DCT变换后,主要信息集中在左上角低频部分,所以提取不同数量的DCT系
数也会影响识别结果。
图4 基于加权小波变换的DCT的人脸识别流程图
实验中,每人随机抽取3幅图作为训练样本,其余7幅用作测试样本,采用2层
小波分解[8],DCT系数取15×15[6]。
采用单独用加权高频分量进行识别比较,
结果见表1。
并分别将低频和加权高频分量结合,以及取不同距离权重系数时的识别率进行了统计,结果见表2、表3。
表2中α1为小波分解高频水平分量权重系数,α2为小波分解高频垂直分量权重系数,其距离权重系数都取0.5,表3中β1为低频分量距离权重系数,β2为加权高频分量权重系数,小波分解高频水平分量
权重取0.7,垂直分量权重取0.3。
表1 单独高频分量识别率高频权重α1=0.0,α2=1.0 α1=0.1,α2=0.9 α1=0.2,α2=0.8 α1=0.3,α2=0.7 α1=0.4,α2=0.6 α1=0.5,α2=0.5 α1=0.6,α2=0.4 α1=0.7,α2=0.3 α1=0.8,α2=0.2 α1=0.9,α2=0.1 α1=1.0,α2=0.0识别率/(%)8.218.579.2910.3611.0711.4312.1413.219.648.938.93
为了对比高频分量对识别率的影响,进行了以下实验,首先只采用小波低频分量进行识别,识别率为89.64%,再分别用低频分量和单独水平方向高频分量结合,识别率为90.36%,低频分量和单独垂直方向高频分量结合,识别率为90.00%,低
频和所有方向高频分量结合,识别率为88.92%,结合表1、表2可看出,将低频和合适的高频分量融合,可以提高识别率,取不同的高频分量权重系数,其所包含的细节信息对识别率有不同的贡献率。
实验中将斜边缘高频分量引入用于识别反而识别率降低了,分析原因是由于人脸是非刚体模式,斜边缘信息稳定性很差,引入其中,对整体识别效果造成了影响。
表3中对距离的加权处理,体现了低频分量
和高频分量对识别的重要程度。
表2 低频结合加权高频分量识别率高频分量权重识别率/(%)α1=0.5,
α2=0.590.36 α1=0.6,α2=0.491.07 α1=0.7,α2=0.391.79 α1=0.8,
α2=0.290.71 α1=0.9,α2=0.191.07
表3 加权距离识别率识别率/(%)91.4391.4391.7992.5092.86
考虑到不同小波分解层数和提取不同数量DCT系数对识别率的影响,实验还进行
了多层小波分解,并提取不同数量的DCT变换系数进行比较。
实验结果见表4,
其中的高频分量权重和距离权重都根据前面的实验结果取定值(表5和表6中取
值一样)。
从表中可以发现,当小波分解层数为3层,DCT系数提取为15×15时,识别率可以提高到94.29%。
表4 不同小波分解层和不同DCT变换系数识别率(%)DCT系数
25×2515×1510×105×51层分解识别率90.7191.0790.3690.712层分解识别率92.5092.8691.7990.713层分解识别率4层分解识别率
94.2993.5788.2187.8681.07
表5 基于ORL库的几种识别法比较识别方法识别率/(%)训练总时间/s平均每
幅识别时间/ms PCA 83.574.09133 DWT+PCA 85.362.14139本文方法
94.291.83134
表6 基于YALE库的几种识别法比较识别方法识别率/(%)训练总时间/s平均每
幅识别时间/ms PCA 82.221.33213 DWT+PCA 83.331.64137本文方法
88.891.03201
除此外,还将本文方法和单独使用PCA方法以及使用小波结合PCA的方法进行比较。
实验结果见表5、表6,表5是在ORL人脸库的实验结果,表6是在YALE
人脸库的实验结果,其中小波结合PCA方法中也采用双正交小波进行2层小波变换。
根据结果可以发现,和单独使用PCA识别方法以及小波变换和PCA相结合的
方法相比,该文的方法不仅提高了识别率,而且也缩短了训练时间。
6 结论
将人脸图像进行小波变换后,对低频和加权高频分量分别进行DCT变换,提取变换系数作为识别特征。
提出的对高频分量的加权处理方法,充分利用高频分量中的细节信息,而且加权距离体现了低频和高频分量对识别效果的贡献率,实验结果表明,无论训练时间还是识别率,该方法都优于传统的PCA识别方法,和小波变换结合PCA的识别方法相比,识别率也提高了很多。
为了进一步提高识别性能,今后将进一步研究在小波域的核方法。
【相关文献】
[1]Zhen Lei,Ahonen T,Pietikainen M,et al.Local frequency descriptorforlow-resolution face recognition[C]//2011 IEEE International Conference on Automatic Face&Gesture Recognition and Workshops,2011:161-166.
[2]Assadi A,Behrad A.A new method for human face recognition using texture and depth information[C]//10th Symposium on Neural Network Application in Electrical Engineering,2010:201-205.
[3]尹红涛,付平,沙学军.基于DCT和线性判别分析的人脸识别[J].电子学报,2009,37(10):2211-2214.
[4]林克正,李艳芳,辛晨.基于2D-DWT与FLD的人脸识别算法[J].计算机工程,2011,37(11):195-196.
[5]冯浩,陈勇,王宪保.结合DCT和WT的多分类器融合的光照人脸识别[J].计算机工程与应用,2010,46(8):153-155.
[6]Wang Mei-hua,Jiang Hong,Li Ying.Face recognition based on DWT/DCT and
SVM[C]//International Conference on Computer Application and System Modeling,2010:507-510.
[7]赵书兰.MATLAB R2008数字图像处理与分析实例教程[M].北京:化学工业出版社,2009:
189-194.
[8]周国民,陈勇,李国军.人脸识别中应用小波变换的两个关键问题[J].浙江大学学报,2005,32(1):34-38.。