人脸识别技术地几个主要地地研究方向
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人脸识别技术的几个主要研究方向
1 引言
计算机人脸识别是指基于已知的人脸样本库,利用计算机分析图像和模式识别技术从静态或动态场景中,识别或验证一个或多个人脸。通常识别处理后可得到的基本信息包括人脸的位置、尺度和姿态信息。利用特征提取技术还可进一步抽取出更多的生物特征(如:种族、性别、年龄..) 。计算机人脸识别是目前一个非常活跃的研究课题,它可以广泛应用于保安系统、罪犯识别以及身份证明等重要场合。虽然人类对于人脸的识别能力很强,能够记住并辨识上千个不同的人脸,可是对于计算机则困难多了,其表现在:人脸表情丰富;人脸随年龄的增长而变化;发型、胡须、眼镜等装饰对人脸造成的影响;人脸所成图像受光照、成像角度以及成像距离等影响。
计算机人脸识别技术是近20年发展起来的,90年代更成为科研热点,仅从1990 年到1999年之间,EI 可检索到的相关文献多达数千篇,关于人脸识别的综述也屡屡可见[1] 。自动人脸识别系统包括两个主要技术环节首先是人脸检测和定位,然后是对人脸进行特征提取和识别(匹配)。本文着重介绍人脸识别技术的各类方法,通过对比指出各类方法的优缺点及今后的发展方向。
2 人脸检测和定位
人脸检测和定位即对于给定的一幅图像检测图像中是否有人脸,若有则确定其在图像中的位置,并从背景中分割出来。这是个极富挑战性的问题,因为人脸是非刚体,且人脸在图像中的大小和方向以及人的肤色和纹理等方面有很大的可变形。人脸检测问题主要有四种:(1)对于给定的一幅人脸图像,将其中的人脸定位并给出其位置;(2)在一幅混乱的单色场景图中检测出所有的人脸;(3)在彩色图像中检测(定位)所有人脸;(4)在某一视频序列中,检测和定位出所有人脸。文献[2]对人脸检测进行了较为详细的综述,指出常用的人脸检测方法有四种:(1)基于知识的方法;(2)基于人脸固定特征的方法;(3)基于模板匹配的方法;(4)基于外貌的方法(Appearance-based methods),在基于模板匹配的方法中所采用的是预先确定的模板,而在基于外貌的方法中其模板的选择是通过对一系列图像的学习而确定的。一般来说,基于外貌的方法依
靠统计和学习技术来找出人脸和非人脸图像的相关特征。在该方法中有特征脸法、基于聚类的方法、神经网络方法和支持向量机的方法。CMU库是常用的人脸检测库,主要的算法评定指标为错误接受率(FAR)和错误拒绝率(ARR)。
3 人脸特征提取和识别
目前大部分研究主要是针对二维正面人脸图像,也有基于三维人脸模型的方法,还有一种所谓的混合系统的身份鉴定系统。
3.1 二维正面人脸识别
在对人脸图像进行特征提取和分类之前一般需要做几何归一化和灰度归一化。几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大小,灰度归一化是指对图像进行光照补偿等处理,光照补偿能够一定程度地克服光照变化的影响而提高识别率。下面将介绍几种常见的人脸识别方法:
3.1.1 基于特征脸方法
人脸识别是一个高维的模式识别问题,1987年Sirovich 和Kirby为减少人脸图像的表示采用了PCA方法(主分量分析方法),1991年Matthew Turk 和Alex Pentland最早将PCA应用于人脸识别[3],将原始图像投影到特征空间中,得到一系列降维图像,取其主元表示人脸,由于主元具有脸的形状故称为“特征脸”。
特征脸方法是目前较为成功的正面人脸识别方法,但是只考虑了人脸的整体特征且对光照的变化敏感,所以有学者提出了FLD方法,即Fisher脸。通过在Harvard和Yale人脸库上做的测试表明Fisherfaces比Eigenfaces有更低的错误率且对于光照和表情变化有更好的鲁棒性。实验中部分特征脸见图1。
图1 部分特征脸
如前所述,特征脸方法忽略了人脸的局部特征(如:眉毛、眼睛、鼻子、口等)在识别中的作用,因此有学者在特征提取时采用基于多特征(eigenfaces,eigenUpper,eigenTzone,edge distribution)的方法,取得了较好的效果。另外,对人脸图像预处理后,进行特征脸分析也会明显降低错误率。
3.1.2 基于神经网络的方法
神经网络是受动物神经系统启发,利用大量简单处理单元互联而构成的复杂系统,以解决复杂模式识别与行为控制问题。神经网络方法已被应用于人脸检测和正面人脸识别并取得了较好的效果。神经网络方法主要有BP网络、自组织网络、卷积网络、径向基函数网络和模糊神经网络等。BP网络采用反向传播学习算法,由于其运算量相对较小,消耗时间短,而被广泛采用。
由于采用单一神经网络很难解决人脸图像的偏转问题,文献[4]则采用一种新的神经网络集成的方法解决多视角人脸识别问题。目前,神经网络集成的方法主要有投票、简单平均和平均加权。其优点在于不需要预先进行人脸偏转角度的估计,且在给出识别结果的同时而给出角度估计信息(允许采集的人脸左右偏转+30~ +30)。
神经网络方法虽然取得了一定的成功,但是其运算量大、训练时间长、收敛速度以及容易陷入局部最小等方面的问题成为制约其在人脸识别中更加广泛应用的主要因素。
3.1.3 基于支持向量机的方法
支持向量机是建立在统计学习理论的VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(Generalization Ability)。具有以下几个优点:
(1)它专门针对小样本情况,其目标是得到现有信息的最优解而不是当样本数目趋于无穷时的最优解;
(2)算法最终将转化成为一个二次型寻优问题,从理论上说,得到的将是全局最优点,解决了在神经网络方法中无法避免的局部极值问题;
(3)算法将实际问题通过非线性变换转换到高维的特征空间(Feature Space),在高维空间中构造线性判别函数来实现原空间中的非线性判
别函数,特殊性质能保证机器有较好的推广能力,同时它巧妙地解决
了维数问题,其算法复杂度与样本维数无关;
概括说,支持向量机就是首先通过用内积函数定义的非线性变换将输入空间变换到一个高维空间,在这个空间中求广义最优分类面。SVM分类函数形式上类似于一个神经网络,输出是中间节点的线性组合,每个中间节点对应一个支持向量,示意图见图2。
在SVM 方法中,只要定义不同的内积函数,就可以实现多项式逼近、贝叶斯分类器、径向基函数(Radial Basic Function 或RBF)方法、多层感知器网络