人脸识别研究背景历史与发展现状及研究范围和方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人脸识别研究背景历史与发展现状及研究范围和方法
1人脸识别研究背景
2人脸识别的发展历史和现状
3国外人脸识别的研究范围及主要方法
3.1人脸识别的研究范围
3.2人脸识别的研究方法
1人脸识别研究背景
人类进入21世纪,随着计算机和网络技术的日渐发达,信息安全体的隐患日益突出,自从911恐怖袭击以后,各国越来越重视社会的公共安全,信息识别与检测显示出前所未有的重要性,其应用领域之广,几乎可以包含社会的各个领域。

现今生活中主要采用号码、磁卡、口令等识别方法,这些都存在着易丢失、易伪造、易遗忘等诸多问题。

随着技术的不断发展,传统的身份识别方法已经受到越来越多的挑战,可靠性大为降低,势必出现新的信息识别和检测技术。

人们逐渐的把目光转向了生物体征,这些都是人类遗传的DNA所决定的,并且每个人都拥有自己独一无二的生物体征。

生物识别技术大致可以分为两大类,一类是物体体征,例如指纹、虹膜、人脸、体味等。

另一类是行为体征,例如书写、步频、惯性动作等,这些都可以通过现在的计算机图像处理技术进行识别。

与其他人类的生理特征相比,人脸存在易采集、非接触、静态等优点,比较容易被大众所接受。

据调查,人与人接触时,90%的人是通过观察一个人的脸部特征来了解对方,获取对方的基本信息,这就是所谓的第一印象。

虽然外部条件例如年龄、表情、光照等发生巨大变化,是一个人的面部特征发生巨大变化,但是人类仍然可以识别,这一现象说明人的脸部存有大量特征信息,通过提出人脸部的特征信息,就可以判断一个人。

人脸识别过程主要分为三个部分。

首先,采集人脸图像样本。

很多科研机构都建立的自己的人脸图像库,最著名的有美国国防部发起建立的FERET人脸库和英国剑桥大学建立的ORL人脸库;其次,进行特征提出,然后将提取的特征数据导入特征数据库;最后,鉴定某个人身份信息时,用特定的匹配算法将数据库中的特征数据通这个待识别人的人脸特征进行匹配,从而实现身份鉴定。

据相关市场调查,人脸识别技术在产业中占据一定份额,其主动、直接、简便、友好等特点,必将促进其持续增长。

所以人脸识别技术的市场前景将十分广泛。

2人脸识别的发展历史和现状
人脸识别的应用领域十分广泛,在绘画、法医学、心理学、医学、人类学、金融、安保等领域,都有非常重要的应用。

人脸识别最早的研究可以追溯到19世纪法国人Galton的工作。

而我国的研究则起步于上世纪80年代,虽然起步较晚,但是却取得了很多研究成果。

人脸识别大致可以分为三个发展阶段:
第一阶段是一般性模式下脸部特征研究,所采用的主要技术方案是基于人脸几何结构特征的方法,Bertillon用一个简单的语句将人脸与数据库中特征数据联系。

人工神经网络一度曾经被研究人员拥有人脸识别问题中。

这一阶段是人脸识别的初级阶段,重要成果不多,人工依赖性较强,基本没有实际应用。

第二阶段是人脸识别的成果井喷期,诞生了很多具有代表性的人脸识别算法,美国军方组织了著名的FERET人脸识别算法测试,并且同时期出现了商业化的人脸识别系统,比如最为著名的Visionics的FaceIt系统。

麻省理工学院媒体实验室的Turk和Pentland提出的“Eigenface”方法无疑是这一时期内最为优秀的方法。

这一方法被证明是使原始图像与重构图像之间的均方误差极小化的最佳压缩方式。

第三阶段是真正的机器自动识别,这一阶段主要克服光照、姿态、表情变化时对人脸识别的准确性的影响。

随着人脸识别的深入研究,很多研究者进行了专门的攻关并且取得了一定的进展。

Pentland等人提出的基于视角的特征脸方法为每个视角构建一个特征空间,取得了比标准特征脸方法更高的性能。

Huang等人在基于视角的特征脸方法的基础上,采用神经网络集成的方法,实现多视角人脸识别。

由Blanz等人提出的三维可变型模型方法是一类应用广泛的方法。

该方法对三维空间中成像过程进行模拟,通过用一个三维可变型的人脸模型对图像进行拟合,从图像中估计出人脸的三维形状和纹理信息。

这种方法能够克服不同的姿态和光照的影响。

结果表明其具有较好的识别性能,在10人的2000张图像上的实验识别率为88%。

3国外人脸识别的研究范围及主要方法
3.1人脸识别的研究范围
人脸识别的研究范围大致包括以下四大内容:
①人脸定位和检测:对给定的一幅图像先检测是否是人脸,若有则确定其在图像中的范围,并对其进行分割提取。

人脸由于是非刚性的物体,容易受外界环境的影响而发生变化,所以人脸识别检测定位技术十分重要。

②人脸特征抽取:通常机器判定图像为人脸后,用一些算法提取出人脸部的特征数据,然后存入人脸数据库。

最主要的几种算法是特征脸和代数特征。

③人脸识别:就是对未知的一张人脸图像与人脸数据库中的进行比较,得出相关结果。

这一过程最重要的是选择合适的匹配算法。

人脸识别包括人脸验证(face verification)和人脸辨识(face identification)。

④外界干扰项分析;对外界的环境影响进行归类总结并且加以分析。

改进算法从而克服这些因素的影响。

3.2人脸识别的研究方法
人脸识别的研究方法根据研究角度的不同可以有不同的分类。

目前人脸识别方法的研究方向主要有两个:其一是基于整体的研究方法,它主要是考虑了模式的整体属性, 包括特征脸(Eigen face) 方法、模板匹配方法、弹性图匹(elastic graph matching) 方法、隐马尔可夫模型(Hidden Markov Model) 方法以及神经网络方法等;其二是基于特征分析的方法, 也就是将人脸基准点的相对比率和其它描述人脸脸部特征的形状参数或类别参数等一起构成识别特征向量。

这种基于整体脸的识别不仅保留了人脸主要特征部件之间的拓扑关系,而且也保留了各部件本身的信息。

基于特征分析的识别是通过提取出局部轮廓信息及灰度信息来设计具体识别算法。

两种方式的人脸识别方法各有优点,基于整体的识别保留了更多信息,基于人脸特征分析的识别比基于整体的方法直观,它提取并利用了最有用的特征,如关键点的位置以及部件的形状分析等。

基于整个人脸的识别把整个人脸图像作为识别模式,光照、视角以及人脸尺寸会对人脸识别有很大的影响,因此,如何能够有效地去掉这些干扰是关键问题。

基于特征部件分析的人脸识别方法的困难在于如何建立好的模型来表达识别部件。

近年来的发展趋势是将人脸的整体识别和特征分析结合起来,如Kin-Man Lam 提出的基于分析和整体的方法,Andreas Lanitis 提出
的利用可变形模型(Flexible Models) 来对人脸进行解释和编码的方法等等。

①模板匹配法是一种经典的模式识别方法,它充分利用了人脸的纹理和灰度特征。

它的识别方法就是将待识别的人脸图像与数据库中所有的模版进行比较,找出最相近的脸。

由于这种方法要求两幅图像上的目标要有相同的尺度、取向和光照条件,所以预处理要做尺度归一化和灰度归一化的工作。

最简单的人脸模板是将人脸看成一个椭圆,检测人脸也就是检测图像中的椭圆。

另一种方法是将人脸用一组独立的小模板表示,如眼睛、嘴巴、鼻子、眉毛和下巴等模板。

但这些模板的获得必须利用各个特征的轮廓,而传统的基于边缘提取的方法很难获得较高的连续边缘。

即使获得了可靠度高的边缘,也很难从中自动提取所需的特征量。

后来改进用弹性模板方法提取特征。

弹性模板是由一组根据特征形状的先验知识来设计可调参数来定义的。

这个参数是由能量函数来决定的,首先利用图像的边缘、峰值、谷值和强度信息以及特征形状的先验知识设计能量函数,然后将参数向能量函数减小的方向调整,当能量函数达到最小时,这组参数所对应的模板形状最符合特征形状。

在识别率上基于弹性模板的方法比基于几何特征的识别方法要好,尽管基于几何特征的识别方法识别的速度快,而且要求的内存也小。

有人专门对基于几何特征的识别方法和基于弹性模板的识别方法进行了比较,得出的结论是:模板匹配法优于几何特征法。

②特征脸方法是从主成成份分析(Principal Component Analysis, PCA)导出的一种人脸识别和描述技术,实质上是通过K-L(Karhunen-Loeve)变换来实现的,K-L变换是图像压缩技术中的一种最优正交变换。

特征脸方法起源于图像描述技术。

Kirby 和Sirovich 用主成成份分析有效的表达了人脸图像。

他们对给定的一组原始人脸图像集合,计算图像压缩最好的坐标系统,每个坐标事实上是他们定义为特征图(Eigen pictures)的图像。

他们认为从理论上来说,任何人脸图像集合都可以用两个集合近似的重建,其一是每个人脸的权值集合,其二是一组标准的图像集合(Eigen pictures)。

人脸的权值通过将人脸投影到对应的特征图像得到。

Turk和Pent land认为如果大量的人脸图像可以由一组特征图像的加权来重建,那么有效的人脸识别方法就是通过长期的经验建立特征图像,通过比较重建图像所需要的特征权值识别人脸。

因此,每一个人脸都可以用一组重建的权值表示。

简单地说,就是将一高维的向量,通过一个特殊的特征矩阵,投影到一个低维的向量空间,表征为一个低维向量,并保留主要信息。

即通过低维表征的向量和特征向量矩阵就可以完全重构出所对应的高维向量。

这种表达相对于图像本身就是一种高度压缩的方式。

概括的说,特征脸方法的基本思想就是:通过K-L变换,得到高维图像空间的一组正交基,保留其中较大特征值对应的正交基,组成特征脸空间,然后将
新人脸图像投影到特征脸空间中,得到一组投影向量,作为识别的特征向量,比较其与已知人脸在人脸库中的位置,从而判断它是否是库中的人脸,如果是,是哪一幅人脸。

特征脸方法把人脸图像作为一个整体来编码,而不关心眼、嘴、鼻等单个特征,从而大大降低了识别的复杂度。

此方法的主要缺点是目前还没有一个快速的求解特征值和特征向量的算法,每一张新脸入库,都要重新计算特征值和特征向量,费时较多。

优点是:图像的原始灰度数据可直接用来学习和识别,不需要任何初级或中级处理;不需要人脸的几何和反射知识;通过低维子空间表示进行有效压缩;与其他匹配方法相比,识别简单有效。

为了解决上述缺点,研究人员在此基础上发展了许多改进方法:如将特征脸与线性判别函数相结合,可以使得对光照及人脸表情不太敏感。

③隐马尔科夫模型(Hidden Markov Model,HMM)是用于描述信号统计特性的一组统计模型。

HMM使用马尔科夫链模拟信号统计特性的变化,而这种变化又是间接地通过观察序列来描述的,因此,隐马尔科夫过程是一个双重的随机过程。

HMM的基本理论是由Baum和Welch 等人在20世纪60年代末70年代初建立,在语音识别中应用较多。

在HMM中节点表示状态,有向边表示状态之间的转移,一个状态可以具有特征空间中的任意特征,对同一特征,不同状态表现出这一特征的概率不同。

HMM有三个主要问题:评估、估计及解码。

关键是前两个问题。

评估用于解决识别问题,一般采取比较有效的“向前一向后”法;估计用来产生用于识别的各个单元的HMM,采取Baum Welch方法。

Samaria最早提出人脸的HMM模型,他将人脸的五个显著区域,包括头发、额头、眼睛、鼻子和嘴巴,看成5个不同的状态,它们的秩序依次从上到下保持不变。

五个状态是抽象的,不具有具体的意义,只能通过观察序列对它进行估计。

HMM的优点是允许人脸表情有较大变化,较大的头部转动,缺点是实现的复杂度较高。

④由于人工神经网络(Artificial Neural Network,ANN)对复杂模式的良好分类能力,导致该方法在人脸识别中得到了广泛的应用。

神经网络模型各种各样,它们从不同的角度对生物神经系统进行了不同层次的描述和模拟。

有代表性的网络模型有感知器、多层映射BP网络、RBF网络、Hopfield模型等。

目前,在人工神经网络的实际应用中,绝大部分的神经网络模型都是采用BP网络及其变化形式,它是人工神经网络最精华的部分。

BP网络主要用于函数逼近、模式识别、数据压缩等领域。

使用BP神经网络作为模式分类器时,其节点数取决于数据源的维数,即特征空间的维数。

但是人们在进行模式采集时,总是尽可能的多采集测量数据的多个特征值,致使样本维数很大。

样本维数很大首先带来的问题是处理的困难,处理时间的消耗和费用都会很大,有时直接用于分类甚至是不可能的,即所谓“维数灾难”。

其次,在过多的数据量中,有的可能对
刻画事物的本质贡献并不大,甚至可以说非常微小。

这就需要有一个样本空间到特征空间的转化,通过特征提取压缩样本的维数,在满足识别精度要求的前提下,尽可能的减少处理数据的冗余度,即尽量做到处理数据的各个特征之间不相关。

此时,输出层的节点数就是要分成的类别数,即模式空间的维数。

所以人们常常会把主成成份方法和神经网络方法结合起来使用。

先用主成成份分析方法对图像进行特征提取,再用这些特征向量和相应的教师信号训练BP网。

Cottrell首先利用三层的BP网络来进行人脸的特征提取,BP网的输入和输出的神经元相同,隐含层的输出作为特征。

对网络进行训练使得其输出逼近输入。

提取的特征再通过一个两层的神经网络进行分类。

最简单的神经网络实现方法是用不同姿态或表情的人脸图像作为输入样本,用标准正面人脸图像作为输出。

Intrator等提出了一种混合型神经网络来进行人脸识别,其中非监督神经网络用于特征提取,而监督神经网络用于特征分类;Lawrance和Giles等用自组织特征映射(SOM)神经网络和卷积神经网络相结合,对400幅人脸图像进行了人脸识别的研究,其中SOM网络用来量化图像样本到降维的拓扑空间,卷积神经网络则在一定程度上实现了局部的平移、旋转、尺度和变形的不变性;Lin和Kung提出了一种基于概率决策的神经网络用于人脸识别。

这种网络在决策神经网络的基础上加入了概率变化,采用虚拟样本进行强化和反强化学习,得到较为理想的概率估计结果,同时采用模块化的网络结构加快网络的学习。

这种方法在人脸检测、人脸定位和人脸识别的各个步骤上都得到了较好的应用。

相关文档
最新文档