人脸识别核心算法技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人脸识别核心算法技术
在检测到人脸并定位面部关键特征点之后,主要的人脸区域就可以被裁剪出来,经过预处理之后,馈入后端的识别算法。
1、在检测到人脸并定位面部关键特征点之后,主要的人脸区域就可以被裁剪出来,经过预处理之后,馈入后端的识别算法。识别算法要完成人脸特征的提取,并与库存的已知人脸进行比对,完成最终的分类。我们在这方面的主要工作包括:
· 基于LGBP的人脸识别方法
问题:
统计学习目前已经成为人脸识别领域的主流方法,但实践表明,基于统计学习的方法往往会存在“推广能力弱”的问题,尤其在待识别图像“属性”未知的情况下,更难以确定采用什么样的训练图像来训练人脸模型。鉴于此,在对统计学习方法进行研究的同时,我们还考虑了非统计模式识别的一类方法。
思路:
对于给定的人脸图像,LGBP方法首先将其与多个不同尺度和方向的Gabor滤波器卷积(卷积结果称为Gabor特征图谱)获得多分辨率的变换图像。然后将每个Gabor特征图谱划分成若干互不相交的局部空间区域,对每个区域提取局部邻域像素的亮度变化模式,并在每个局部空间区域内提取这些变化模式的空间区域直方图,所有Gabor特征图谱的、所有区域的直方图串接为一高维特征直方图来编码人脸图像。并通过直方图之间的相似度匹配技术(如直方图交运算)来实现最终的人脸识别。在FERET四个人脸图像测试集合上与FERET97的结果对比情况见下表。由此可见,该方法具有良好的识别性能。而且LGBP方法具有计算速度快、无需大样本学习、推广能力强的优点。
表.LGBP方法与FERET'97最佳结果的对比情况
· 基于AdaBoost的Gabor特征选择及判别分析方法
问题:
人脸描述是人脸识别的核心问题之一,人脸识别的研究实践表明:在人脸三维形状信息难以准确获取的条件下,从图像数据中提取多方向、多尺度的Gabor特征是一种合适的选择。使用Gabor特征进行人脸识别的典型方法包括弹性图匹配方法(EGM)和Gabor特征判别分类法(GFC)。EGM在实用中需要解决关键特征点的定位问题,而且其速度也很难提高;而GFC则直接对下采样的Gabor特征用PCA降维并进行判别分析,尽管这避免了精确定位关键特征点的难题,但下采样的特征维数仍然偏高,而且简单的下采样策略很可能遗漏了非常多的有用特征。
摘要:
针对上述问题,我们考虑如何对Gabor特征进行有效降维,将目前受到极大关注的AdaBoost算法创新性的应用于Gabor特征的选择上来,用于提取对识别最有利的特征(我们称这些选择出来的Gabor特征为AdaGabor特征),并最终通过对AdaGabor特征的判别分析实现识别(称该方法为AGFC识别方法)。在CAS-PEAL和FERET人脸图像库上的对比实验表明:AGFC方法不但可以大大降低Gabor特征的维数从而可以更加有效地避免“维数灾难问题”,降低了计算复杂度,同时识别精度也有了较大的提高。将AGFC与EGM,GFC进一步比较可以看出:无论是EGM还是GFC,均是主观的选择若干面部关键特征点提取人脸的特征表示,而我们提出的AGFC方法则是通过机器学习的方法自动的选择那些对区分不同人脸具有关键作用的Gabor特征。参见下图所示三者之间的区别与联系。
三种不同的人脸建模方法比较示意图
· 基于SV的Kernel判别分析方法sv-KFD
摘要:
支持向量机(SVM)和Kernel Fisher分析是利用kernel方法解决线性不可分问题的两种不同途径,我们将二者进行了有机结合。我们首先证明了SVM最优分类面的法向量在基于支持向量的类内散度矩阵的前提下具有零空间性质,基于此定义了核化的决策边界特征矩阵(Kernelized Decision Boundary Feature Matrix,简写为KDBFM),最后利用基于零空间的Kernel Fisher方法计算投影空间。我们还进一步提出了融合类均值向量差及KDBFM
来构建扩展的决策边界特征矩阵(EKDBFM)的方法,并把这两种方法成功地应用到了人脸识别领域,在FERET和CAS-PEAL数据库的实验结果表明该方法比传统人脸识别算法具有更好的识别性能。
· 基于特定人脸子空间的人脸识别方法
问题:
Eigenface是人脸识别领域最著名的算法之一,本质上是通过PCA来求取人脸图像分布的线性子空间,该空间从最佳重构的角度反映了所有人脸图像分布的共性特征,但对识别而言,这样的特征却未必有利于识别,识别任务需要的是最大可能区分不同人脸的特征。
摘要:
“特征脸”方法中所有人共有一个人脸子空间,而我们的方法则为每一个体人脸建立一个该个体对象所私有的人脸子空间,从而不但能够更好的描述不同个体人脸之间的差异性,而且最大可能地摈弃了对识别不利的类内差异性和噪声,因而比传统的“特征脸算法”具有更好的判别能力。另外,针对每个待识别个体只有单一训练样本的人脸识别问题,我们提出了一种基于单一样本生成多个训练样本的技术,从而使得需要多个训练样本的个体人脸子空间方法可以适用于单训练样本人脸识别问题。在Yale Face DatabaseB人脸库对比实验也表明我们提出的方法比传统的特征脸方法、模板匹配方法对表情、光照、和一定范围内的姿态变化具有更优的识别性能。
2、人体面貌识别技术包含三个部分:
(1)人体面貌检测
面貌检测是指在动态的场景与复杂的背景中判断是否存在面像,并分离出这种面像。一般有下列几种方法:
①参考模板法
首先设计一个或数个标准人脸的模板,然后计算测试采集的样品与标准模板之间的匹配程度,并通过阈值来判断是否存在人脸;
②人脸规则法
由于人脸具有一定的结构分布特征,所谓人脸规则的方法即提取这些特征生成相应的规则以判断测试样品是否包含人脸;
③样品学习法
这种方法即采用模式识别中人工神经网络的方法,即通过对面像样品集和非面像样品集的学习产生分类器;
④肤色模型法
这种方法是依据面貌肤色在色彩空间中分布相对集中的规律来进行检测。
⑤特征子脸法
这种方法是将所有面像集合视为一个面像子空间,并基于检测样品与其在子孔间的投影之间的距离判断是否存在面像。