三维人脸识别算法综述_柳杨
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第18卷增刊1
系统仿真学报©V ol. 18 Suppl.1 2006年8月Journal of System Simulation Aug., 2006
三维人脸识别算法综述
柳杨
(浙江科技学院信息学院, 浙江杭州 310023)
摘要:三维人脸识别与二维人脸识别相比,由于其不受视角、光照、姿势等因素的影响,越来越
受到研究者的关注。综述主要是对目前已有的三维人脸识别算法,并且指出了目前三维人脸识别存
在的一些问题。
关键词:人脸识别;三维;算法
中图分类号:TP391.9文献标识码:A文章编号:1004-731X (2006) S1-0400-04
Survey of 3D Face Recognition Algorithms
LIU Yang
(Zhejiang University of Science and Technology, Hangzhou 310023, China)
Abstract: Researchers pay more attention to 3D face recognition, because comparing with 2D face recognition it’s not affected by factors such as viewpoint, illumination, pose etc. This survey focuses on the relevant algorithms on 3D face recognition, and points out the challenges in 3D face recognition.
Key words: face recognition; 3D; algorithms
引言
生物识别(Biometrics)技术目前越来越受到研究者的关注。手写识别是比较老的生物识别技术。人脸识别和指纹识别的研究也有比较长的一段历史了。最近,声音识别、步态识别、视网膜识别、虹膜识别以及三维人脸识别也发展比较快。
相比二维人脸识别而言,三维人脸识别具有不受视点、光照和表情等因素影响的优点,本文主要对三维人脸识别的算法做一个综述。
1 三维人脸识别算法
1.1Minimum Distance最小距离法
将与测试样本最近邻样本的类别作为决策的方法称为最近邻法。
Lao[11]利用从立体图像创建稀疏深度图来进行三维人脸识别。利用等亮度轮廓线进行立体匹配。利用等亮度轮廓线和2d边缘查找虹膜。利用虹膜的位置查找其它的特征点位置从而进行姿势标准化处理。当数据被转化成规范的数据后就可以利用相应点间的最近平均差分进行识别。
Cartoux[5]进行三维人脸识别的方法是,首先基于主曲率分割一个范围图片,并找到通过脸的双边对称平面用来对姿势进行归一化。
Beumier和Acheroy[3]利用3D和2D数据的加权相似测
收稿日期:2006-01-30 修回日期:2006-05-31
作者简介:柳杨(1978-), 女, 湖北武汉人, 助教, 硕士, 研究方向为计算机图形学, 虚拟人技术。量和进行多模态的识别。他们在3D和2D人脸中均使用一个中轴轮廓线和一个横向轮廓线,这样得到四个分区,利用加权相似矩阵和来进行三维人脸的识别。他们使用测试的数据库中包含有100个人,
每个人有几种不同姿势的照片。在这个试验中使用了图库中27人的照片和一个29人的搜索集,错误率低于1.4%。大体上说多模态的3D+2D识别比单纯的3D识别或2D识别要好。
Xu[31]使用了Beumier的图库。原始的3D点云被转化为正常网格。鼻子首先被找到,并作为一个锚点用来寻找其他的局部区域。从嘴、鼻子、左眼和右眼局部区域的数据中计算特征向量。特征空间的维度通过主成分分析降维。利用全局和局部形状成分,基于最近领域法进行配准。
1.2Correlation关联算法
每个三维模型都有一个扩展高斯球(EGI)与之对应。EGI记录了面片法向落入全空间各个方向的多边形面积大小。一般用一组向量来表示某个三维模型对应的EGI 特征:每个向量的长度正比与每个面片的面积,方向平行于面片的法向,将这些向量平移到坐标原点,形成一种球坐标系的下的矢量分布,构成了三维模型EGI 的向量表示。
Tanaka[27]对非多边形物体利用主曲率而不是面法线进行分割,利用扩展高斯球表征脸,利用EGI的球面相关性进行三维人脸的识别。
Lee和Milios[12]基于均值和高斯曲率的符号分割距离图像中的凸起,给每一个凸起区创建扩展高斯球。通过关联扩展高斯球对搜索图片和图库图片进行配准。扩展高斯球利用通过物体表面的表面法线分布状态来描述物体的形状。利用
2006年8月柳 杨:三维人脸识别算法综述Aug., 2006
图像配准中的合成关系约束算法来建立搜索图片和图库图片的匹配。在人脸表情改变时,凸起区比其它区域形状的改变要小。这样就可以解决人脸表情变化时的三维人脸识别问题。然而扩展高斯球对物体大小的改变不敏感。因此在这种表达中脸型相似但大小不一样的人脸不能被区分。
1.3Closest Vector最近向量法
Gordon[9]基于脸的曲率分割来进行三维人脸识别。此方法提取一组特征来表述脸的曲率和大小属性,这样在特征空间中间中每张脸都变成一个点,利用最近领域法进行配准。利用此方法对8张人脸,其中每张人脸3个姿势进行识别,识别率为100%,但它不考虑表情变化。
Nagamine[19]通过寻找五个特征点,用这五个特征点来标准化脸部姿势,然后通过脸部数据的各种曲线和轮廓线进行三维人脸的配准。利用16个人,每人10张照片进行实验,实验证明利用通过脸部中心的垂直轮廓曲线进行识别,识别率最高。Nagamine认为考虑到大量的计算和硬件能力,利用整张脸的数据进行人脸识别是不可行的。
Lee[13]通过定位鼻尖,然后基于脸部轮廓在一系列深度值中形成一个特征向量来进行三维人脸识别。他们报道在rank five的识别有94%的正确率,但是没有报道在rank one 的识别率。识别率在rank five和rank one之间能够有戏剧性的变化,所以不能通过此数据预测在rank one这种方法有多大的识别率。
Moreno[18]和他的合作者首先基于高斯曲率对三维人脸进行分割,然后对每个分割区域创建一个特征向量来进行三维人脸识别。他们对60个不同人的420张脸部网格进行实验,每个人有不同的表情和姿势,对一组正视图在rank one 的识别率有78%。
1.4Huasdroff distance 豪斯多夫距离法
Hausdorff 距离是定义在两个点集之间的距离,它的最大优点就是它在点集匹配过程中并不定义点和点之间的一一对应关系。
Achermann和Bunke[1]利用扩展Hausdorff距离配准来进行三维人脸的识别。他们利用24个人,每人10张图像共240张图像进行实验,此算法在某些场合可以得到100%的识别率。
Lee和Shim[14]利用Hausdorff距离的深度权重和表面曲率信息(最小值、最大值和高斯曲率)进行三维人脸的识别。他们利用42个人,每人两张图像进行识别。利用这种方法在rank one可以得到98%的识别率,而单纯利用Hausdorff 距离得到的识别率低于90%。
Russ[24]利用Hausdorff的结果对距离图像进行配准。他们利用Chang的部分数据集进行实验。在鉴别实验中,对200人可以达到98%的鉴别率,对68个人进行鉴别的错误率为0%。
Russ[25]利用Hurdorff距离配准距离图像表征的3D人脸数据进行人脸识别。这个跌代配准过程和利用ICP进行搜索数据和图片数据的对准调节差不多。有很多降低配准过程空间和时间复杂度的方法。Russ利用FRGC version 1数据集进行实验,在rank one识别率可以达到98.5%。
1.5ICP(Iterative Closet Point)最靠近点迭代法
Lu[16]利用ICP方法进行三维人脸识别。这种方法假设图库中的三维图像是一个更完整的人脸模型,搜索三维图像是一个正视图就像图库图像一样。实验中有18个人,每个人有多副搜索图像,不考虑姿势和表情的变化,识别率为97%。Lu[17]利用ICP配准3D形状来建立多模态的3D+2D 系统。他们使用线性判别式分析法进行2D配准。他们的试验数据是一组100人,每人三张中性表情,三张微笑表情。通过实验他们认为3D配准比2D配准好。如果使用3D+2D 识别中性表情有98%的识别率,对于一组具有中性表情和微笑表情图像有91%的识别率。
Papatheodoro和Rueckert[22]利用基于四位空间(x,y,z,亮度)点距的广义性ICP进行多模态的3D+2D人脸识别。在早期,这种方法融合了形状和纹理信息,而不是单独用一种模态进行决策,然后再把决策结果结合起来。实验中,图库中有62人,搜索库中是这62人不同姿势和表情的图像。他们报道配准中性表情的前视图有98%~100%的正确率。当搜索图像的姿势和表情与图库不相配时识别率下降。比如,搜索图像转45度角后,识别率降为73%~94%,微笑表情的识别率只有69%~89%。
Chang[7]利用多区域方法来进行三维人脸识别。这是一种合议分类器方法,围绕鼻子的多维交迭分区使用ICP进行单独配准,多维3D配准的结果进行组合。他们利用FRGC version 2数据集中400个人的4000张图像进行实验,在图库中每个人都有一张中性表情图像,剩下的图像最为搜索图像,在rank one有92%的识别率。
1.6PCA(Principal Component Analysis)主成分分析法
基于主成分分析,从数据库中提取大量的人脸模式,经预处理后得到人脸的训练样本集。在这个人脸样本集中做主成分分析,得到一组特征向量,从而将样本库和搜索库中的人脸进行配准,进行三维人脸的识别。
Bronstein[4]利用等轴变换方法进行三维人脸分析,试图解决三维人脸识别中人脸表情变化的问题。这种方法对人脸表情具有鲁棒性。他们提出一个有效的多模态3D+2D人脸识别,即利用展平纹理和正则图片的特征分解。
Tsalakanidou[29]利用3D和彩色图片进行多模态的人脸识别。他们利用彩色图像而不是灰度图像进行人脸识别,在多模态人脸识别工作中是比较独特的。他们利用XM2VTS 数据集中的40人图像进行彩色图片识别、3D识别和3D+彩色图像识别的试验。识别算法是基于PCA的,并结合了单个色彩平面和距离图像识别的结果,多模态的识别率高达