计算机人脸检测中的人眼定位算法研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机人脸检测中的人眼定位算法研究【摘要】分析了几种常用的人眼定位算法,并提出了一种基于肤色信息、人脸面部几何特征和人眼灰度信息的算法。该算法定位效率高,并对背景、尺寸等细节具有很好的适应性,在人脸实时检测系统中具有很好的应用价值。
【关键词】人眼定位;肤色提取;几何特征
1 人眼定位的重要意义
双眼是人脸的突出特征,它们在人脸中占据比较固定的位置,双眼间的距离刻画了人脸的大小,是人脸识别中尺度归一化的依据。因此双眼的精确定位成为人脸检测与识别前处理阶段非常关键的一步,绝大部分的人脸识别算法都强烈地依赖于双眼的准确定位。只要人眼被精确定位,则脸部其他特征,如眉、鼻、嘴等,可由潜在的分布关系比较准确地定位。
2 人眼定位的主要方法
2.1霍夫变换法
假设经预处理已经得到包含眼球的图像ep,为了节省检测眼球的时间并避免镜片反光点边缘产生的干扰,先用小灰度聚类法粗定眼球中心点,以此缩小检测范围,聚类的过程是将图像ep中灰度值最小的n个像素,按列递增的顺序排序,若相邻的列数差值都未超过预先设定的门限t1,说明只有一个聚类中心,求出这些像素行列的平均值就是要找的眼球中心点;若超过了门限t1,说明这n个像素可以聚成两类,对左眼,因为阴影、镜脚集中在左边,所以取
右边那类的平均值;对右眼,则取左边那类的平均值;n的选择可根据图像ep的总像素数目及眼球占图像的大致百分比决定。在用霍夫变换检测眼球前,先用canny算法提取边缘。对于比较细长的眼睛,由于眼球的上半部分较多地被眼皮覆盖,所以改用检测下半圆,这样更可靠且省时。
2.2 变形模板法
模板匹配法主要是模板的选择,根据所选模板的维数可分为二维可变形模板和三维可变形模板。
2.3边缘特征分析法
此算法所处理的图像为单人灰度图像,是利用图像的垂直灰度投影曲线,根据凸峰宽度确定人脸的左右边界,然后利用人脸区域的水平灰度投影曲线确定头顶及鼻子中部形成的上下边界。利用预测法先确定人眼在眉眼区域的大概位置,通过检测眉眼部位的边缘及边缘分组,确定双眼的坐标位置。
观察不同单人脸图像的垂直灰度投影曲线,可以发现人脸所在区域将使垂直灰度投影曲线形成一个具有一定宽度的凸峰。这个凸峰的左右边界大致代表了人脸的左右边界。当人脸的左右边界确定之后,取左右边界之间的人脸区域作为研究对象,作该图像的水平灰度投影曲线,观察人脸区域图像的水平投影曲线可以发现,此曲线的第一个极小值点对应人的头顶,因为头发的低灰度产生了水平投影曲线的低谷,而曲线的最大值点和次最大值点分别对应人的额头部位和人的鼻中部,这样就可以轻易地求得人眼所处的大致水平
位置。
2.4对称变换法
在计算机视觉研究中,对称性被认为是物体的基本性质之一,通常在将物体从背景中分割出来后,用来简化物体形状的描述,或物体的近似。目前研究最多的是点对称(也叫中心对称)和轴对称,对人脸而言,眼睛、鼻子、嘴巴等都有很弱的点对称性,广义对称变换正是用来描述物体的点对称。以上的对称变换利用了人眼的中心强对称和脸部特征的生理几何分布,对人脸偏转、脸部表情变化、光照变化等因素的左右不敏感,因而具有很好的鲁棒性。但是,以上对称变换的计算需要在大范围的尺度上进行,计算量很大,而且,由于只是描述了各点的局部对称性,当它用于人眼的定位时产生的候选点较多,不太利于眼睛的精确定位。
3 基于肤色、几何特征和灰度信息的人眼定位
3.1肤色提取
肤色是人脸的重要信息,不依赖于面部的细节特征,对于旋转、表情等变化情况都能适用,具有相对的稳定性并且和大多数背景物体的颜色相区别。anil k.jain曾专门统计研究了皮肤的色彩模型,他提出的方法属于色彩空间中的聚类模型,这一类肤色模型的建立要选取一种合适的色彩空间。
3.2肤色区域分析
因为人脸肤色建模是根据皮肤颜色来确定的,有可能把脖子、肩膀、手臂等肤色区域或是与肤色相近的其他物体也包括了进去,
所以得到的只能是人脸的大致区域,需要进一步通过各种算法将那些非人脸区域尽可能都去除掉。为了排除非人脸区域,依据人脸区域的空间特征,本文选取了连通区域像素数、区域填充率和长宽比判断因素。
(1)连通区域像素数
因为人脸有一定的大小,通常人脸小于19*19则无法识别,因此对于n值小于300的块我们认为是非人脸将其值置为背景是合理的。
(2)区域填充率
对于二值化之后的一个连通区域,系统中使用该区域的像素数与外接矩形的像素数的比值来表征这个区域的空间属性。假设s’是外接矩形的像素数,s为目标区域的像素数,若0.5
(3)长宽比
通过对人脸特征的统计,人脸的长宽比应该大致在这样的一个范围内:0.6<人脸长宽比<1.5。考虑到人脸区域和脖子区域大都是连通的,所以实际处理中将比例修正到如下的范围内:0.6<人脸长宽比<2 。
3.3 形态学图像处理
肤色提取后,图像中仍然含有一些噪声(主要在背景中)。噪声的存在显然会使后续的操作更为复杂。为了既能把图像中的噪声点去掉又能保持图像有用信息不发生变化,本文使用形态学滤波器对
人脸候选区域进行除噪。通过形态学处理不但可以过滤由于噪音或者其他原因引起的一些较小的不可能为人脸的类肤色区域,减少候选区域和提高检测速度,而且可以填补肤色区域内的较小空洞,防止这些空洞被误认为是人脸器官所造成,为后续检测区域降低了误判的可能性。