模式识别在人脸识别中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

模式识别在人脸识别中的应用

目前在人脸定位领域,几何模型匹配方法得到了广泛的使用。

本文对几何模型匹配方法进行了研究,提出了一套完整的人脸定位算法。在预处理部分,采用了特别的增强人脸特征与脸部皮肤之间对比度的方法及局域取阈值二值化方法,改进了预处理的效果。在图像分割部分,实现了经典的分合算法,并且使用成组算法改进了分合的效果。在人脸匹配部分,实现了基于眼睛和嘴的几何模型匹配,并对评价函数的构造进行了研究。

此篇论文所涉及到的是人脸的定位和识别。简单来说,所谓人脸的定位,就是在照片(静态图像)或视频(动态图像)中标出人脸所在的位置,把人脸选取出来。而人脸的识别就是把选取出来的人脸与数据库中已有的人脸进行比较,找出匹配的档案来。有的文献把人脸的定位和识别统称为人脸识别,定位和识别则是两个主要的步骤。完整的人脸识别系统涉及到决定照片或视频中有无人脸,并计数,定位,定出大小,然后根据数据库识别出个人,可能的话还要识别表情,以及根据脸的图像做出描述(瓜子脸,丹凤眼等等就是日常生活中“描述”的例子),或者反过来根据描述挑选匹配的人脸图像。

从模型匹配的方法来看,目前的人脸定位算法可以粗略地分为两大类:第一类是利用人脸各器官之间的几何关系的方法;第二类是利用标准人脸图像或者其变换结果直接或者经特征提取后进行匹配的方法。第一类方法利用了明显的先验知识,因而方法简单明了,执行速度较快,对人脸的方向和表情有一定的适应性(在一定的变化范围内面部特征的相对几何关系变化很小), 但是准确率往往不高(漏判和误判),而且对预处理要求高,依赖于所有面部特征都完整地被提取,所以对转角较大的侧脸, 光照极度不均匀, 部分脸被遮蔽(眼镜, 围巾等)适应性不好。第二类方法利用了更多的图像信息, 准确率高,不易受欺骗;缺点是计算量大,而且使用的人脸模板受人脸库中已有资料的影响,可能会有通用性不好的问题(比如不同人种的人脸模板不能通用)。

利用人脸各器官之间的几何关系的方法可以作为完整的人脸定位算法的一

个基础,就是说利用几何匹配先大致找到图像中的人脸(可能含有很多错误),然后使用利用标准人脸图像或者其变换结果直接或者经特征提取后进行匹配的

方法来确证,剔除实际不是人脸的区域。这样既可以利用第一类方法的速度优势,又可以利用第二类方法的准确度优势。

从一幅图中,按一定规则划分出感兴趣的部分或区域叫做分割。对于利用人脸各器官之间的几何关系的人脸定位方法来说,分割算法是十分重要而关键的。在这里,感兴趣的部分是人脸的器官(眼睛,嘴巴,眉毛,鼻子等等)。分割算法如果能够有效地把人脸器官和脸的其他部分分离开来,并且保持器官的完整性(比如嘴巴没有破碎成几段),就是成功地达到了目的。

最常见的几类方法是:按像素或处理过的像素的灰度值进行分割(其实就是取阈值做二值化);提取边缘,利用边缘进行分割;区域生长方法。

区域生长方法寻找互相连接在一起,并有相同特征的像素所形成的区域(我把这样的区域称作特征块或者“物体”),是实现图像分割的一种重要方法。区域是一个二维连通区,所以生成区域的办法大致有三类:局部法:这是根据像素的性质或像素的临近像素的性质决定像素分在什么区域;总体法:这是根据遍及整幅图中大量像素的性质决定把一群像素划分到一个区域中;分裂合并法(简称分合):这是利用状态空间技术分裂或合并区域,用图结构表示区域和边界,这时要利用局部和总体的合并与分裂准则。

图像分割的目的是把人脸的器官与脸的其他部分分离开来,并保存每个器官的完整性。在照片中,人脸比较明显而易辨别的特征主要是面部器官:眼睛,嘴巴,鼻子和眉毛。鼻子往往与脸的反差不大,因此通常用鼻孔代替。这几个面部特征在灰度图像中一般比周围区域暗。尤其是眼睛和嘴巴在绝大部分情况下都清晰可见。因此图像分割可以利用的特征就是:灰度比周围区域暗的区域。在我的毕业设计中,为了减少图像分割这一步的运算量,预处理的时候就对图像做了二值化。因此事实上分割的对象已经是黑白图像,分割简化为找出所有黑色的连通区域,它们都成为人脸器官的候选者。

对分割算法有两个要求:

1、一定的抗噪声能力。经过二值化的黑白图像中,难免会有很多与主旨无关的细碎黑色像素连接了本应分开的特征,而某些单一的特征也可能会破碎成几块。要求分割算法具有一定的能力抵抗这些噪声,将应该分开的特征分开,应该成为整体的部分连起来。

2、运行速度要快。人脸定位和识别系统常常作为实时应用,在这些场合要求系统的运行不能耗时过长,否则就失去意义了。从几何匹配方法来看,最耗时的步骤就是图像分割这一步。所以这一步的速度决定了整个人脸定位方法的运行速度。

分合算法的目的是把图像分割为许多这样的区域:具有某种共同特征并且相互连通的像素分在同一个区域,而特征不同或者不相互连通的像素分在不同的区域。

判定区域R内的像素是不是具有共同的特征需要均匀性判据H(R),H(R)为True表示区域均匀,否则表示不均匀。一般应用的均匀性判据往往是区域内的灰度比较均匀,比如区域内最大和最小的灰度值之差不超过一定阈值(5)。在我的应用中,因为图像已事先做了二值化,所以均匀性的判定有所不同。我只关心黑色的区域,因为只有黑色区域可能代表人脸特征。当一个区域中黑色像素占了绝大部分时,我就认为它是均匀的。

分合算法采用金字塔数据结构。首先讨论以像素计的边长是2的整数次幂的正方形图像。塔的底层(第0层)是原始图像(在我的应用中是已经过二值化的图像)。用相邻排作正方形的四个像素作为子结点,计算上一层相应像素的取值。这样每上溯一层(层编号加1),像素数目成为原来的1/4。当整幅图只剩下一个像素时,金字塔构造完毕(见图1)。数据结构某一层中的一个像素事实上代表了第0层中2j个像素组成的一个数据方块(j是该层编号)。

图1 金字塔数据结构

为了表示和计算方便起见,用编码来代表这样的一个数据块。设数据结构中最高一层的编号为n,则这个编码共有n位。把一个方块内的四个子方块按照图2顺时针标记为1,2,3,4。为了表示一个数据块,我们首先把原始图像划分成

相关文档
最新文档