人脸检测外文翻译参考文献
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人脸检测外文翻译参考文献(文档含中英文对照即英文原文和中文翻译)
译文:
基于PAC的实时人脸检测和跟踪方法
摘要:
这篇文章提出了复杂背景条件下,实现实时人脸检测和跟踪的一种方法。这种方法是以主要成分分析技术为基础的。为了实现人脸的检测,首先,我们要用一个肤色模型和一些动作信息(如:姿势、手势、眼色)。然后,使用PAC技术检测这些被检验的区域,从而判定人脸真正的位置。而人脸跟踪基于欧几里德(Euclidian)距离的,其中欧几里德距离在位于以前被跟踪的人脸和最近被检测的人脸之间的特征空间中。用于人脸跟踪的摄像控制器以这样的方法工作:利用平衡/(pan/tilt)平台,把被检测的人脸区域控制在屏幕的中央。这个方法还可以扩展到其他的系统中去,例如电信会议、入侵者检查系统等等。
1.引言
视频信号处理有许多应用,例如鉴于通讯可视化的电信会议,为残疾人服务的唇读系统。在上面提到的许多系统中,人脸的检测喝跟踪视必不可缺的组成部分。在本文中,涉及到一些实时的人脸区域跟踪[1-3]。一般来说,根据跟踪角度的不同,可以把跟踪方法分为两类。有一部分人把人脸跟踪分为基于识别的跟踪喝基于动作的跟踪,而其他一部分人则把人脸跟踪分为基于边缘的跟踪和基于区域的跟踪[4]。
基于识别的跟踪是真正地以对象识别技术为基础的,而跟踪系统的性能是受到识别方法的效率的限制。基于动作的跟踪是依赖于动作检测技术,且该技术可以被分成视频流(optical flow)的(检测)方法和动作—能量(motion-energy)的(检测)方法。
基于边缘的(跟踪)方法用于跟踪一幅图像序列的边缘,而这些边缘通常是主要对象的边界线。然而,因为被跟踪的对象必须在色彩和光照条件下显示出明显的边缘变化,所以这些方法会遭遇到彩色和光照的变化。此外,当一幅图像的背景有很明显的边缘时,(跟踪方法)很难提供可靠的(跟踪)结果。当前很多的文献都涉及到的这类方法时源于Kass et al.在蛇形汇率波动[5]的成就。因为视频情景是从包含了多种多样噪音的实时摄像机中获得的,因此许多系统很难得到可靠的人脸跟踪结果。许多最新的人脸跟踪的研究都遇到了最在背景噪音的问题,且研究都倾向于跟踪未经证实的人脸,例如臂和手。
在本文中,我们提出了一种基于PCA的实时人脸检测和跟踪方法,该方法是利用一个如图1所示的活动摄像机来检测和识别人脸的。这种方法由两大步骤构成:人脸检测和人脸跟踪。利用两副连续的帧,首先检验人脸的候选区域,并利用PCA技术来判定真正的人脸区域。然后,利用特征技术(eigen-technique)跟踪被证实的人脸。
2.人脸检测
在这一部分中,将介绍本文提及到的方法中的用于检测人脸的技术。为了改进人脸检测的精确性,我们把诸如肤色模型[1,6]和PCA[7,8]这些已经发表的技术结合起来。
2.1肤色分类
检测肤色像素提供了一种检测和跟踪人脸的可靠方法。因为通过许多视频摄像机得到的一幅RGB 图像不仅包含色彩还包含亮度,所以这个色彩空间不是检测肤色像素[1,6]的最佳色彩图像。通过亮度区分一个彩色像素的三个成分,可以移动亮度。人脸的色彩分布是在一个小的彩色的色彩空间中成群的,且可以通过一个2维的高斯分部来近似。因此,通过一个2维高斯模型可以近似这个肤色模型,其中平均值和变化如下: m=(r ,g ) 其中r =N 1∑=N i ri 1,g =N 1∑=N i gi 1
(1) ∑=⎥⎦
⎤⎢⎣⎡σσσσ (2) 一旦建好了肤色模型,一个定位人脸的简单方法是匹配输入图像来寻找图像中人脸的色彩群。原始图像的每一个像素被转变为彩色的色彩空间,然后与该肤色模型的分布比较。
2.2动作检测
虽然肤色在特征的应用种非常广泛,但是当肤色同时出现在背景区域和人的皮肤区域时,肤色就不适合于人脸检测了。利用动作信息可以有效地去除这个缺点。为了精确,在肤色分类后,仅考虑包含动作的肤色区域。结果,结合肤色模型的动作信息导出了一幅包含情景(人脸区域)和背景(非人脸区域)的二进制图像。这幅二进制图像定义为 ,其中It(x,y)
和It-1(x,y)分别是当前帧和前面那帧中像素(x,y )的亮度。St 是当前帧中肤色像素的集合,(斯坦)t 是利用适当的阈限技术计算出的阈限值[9]。作为一个加速处理的过程,我们利用形态学(上)的操作(morpholoical operations )和连接成分分析,简化了图像Mt 。
2.3利用PCA 检验人脸
因为有许多移动的对象,所以按序跟踪人脸的主要部分是很困难的。此外,
还需要检验这个移动的对象是人脸还是非人脸。我们使用特征空间中候选区域的分量向量来为人脸检验问题服务。为了减少该特征空间的维度,我们把N 维的候选人脸图像投影到较低维度的特征空间,我们称之为特征空间或人脸空间[7,8]。在特征空间中,每个特征说明了人脸图像中不同的变化。
为了简述这个特征空间,假设一个图像集合I 1,I 2,I 3,…,I M ,其中每幅图像是一个N 维的列向量,并以此构成人脸空间。这个训练(测试)集的平均值用A =M 1∑=M
i Ii 1来定义。用φi =I I -A 来计算每一维的零平均数,并以此构成
一个新的向量。为了计算M 的直交向量,其中该向量是用来最佳地描述人脸图
像地分布,首先,使用C =M 1∑=M
i 1φi φi r =YY r (4)来计算协方差矩阵Y =[φ 1φ
2…φ M ]。虽然矩阵C 是N ×N 维的,但是定义一个N 维的特征向量和N 个特征
值是个难处理的问题。因此,为了计算的可行性,与其为C 找出特征向量,不如我们计算[Y T Y]中M 个特征向量v k 和特征值λk ,所以用u k =k Y λvk
*来计算一个
基本集合,其中k =1,…,M 。关于这M 个特征向量,选定M 个重要的特征向量当作它们的相应的最大特征值。对于M 个训练(测试)人脸图像,特征向量W i =[w 1,w 2,…,w M ’]用w k =u k T φi ,k=1,…,M (6)来计算。
为了检验候选的人脸区域是否是真正的人脸图像,也会利用公式(6)把这个候选人脸区域投影到训练(测试)特征空间中。投影区域的检验是利用人脸类和非人脸类的检测区域内的最小距离,通过公式(7)来实现的。Min (||W k candidate -W face ||,||W k candidate -W nonface ||),(7)其中W k candidate 是训练(测试)特征空间中对k 个候选人脸区域,且W face ,W nonface 分别是训练(测试)特征空间中人脸类和非人脸类的中心坐标,而||×||表示特征空间中的欧几里德距离(Euclidean )
3.人脸跟踪
在最新的人脸检测中,通过在特征空间中使用一个距离度量标准来定义图像序列中下一幅图像中被跟踪的人脸。为了跟踪人脸,位于被跟踪人脸的特征向量和K 个最近被检测的人脸之间的欧几里德距离是用obj =arg k min||W old -W k ||,k =1,…,K ,(8)来计算的。
在定义了人脸区域后,位于被检测人脸区域的中心和屏幕中心之间的距离用