基于matlab的彩色图像皮肤区域分割及人脸检测
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
第一章引言 (1)
第二章算法理论与实现原理 (1)
2.1肤色分割理论 (1)
2.2常见肤色模型比较 (2)
2.2.1 区域模型 (2)
2.2.2 简单高斯模型 (2)
2.2.3 混合高斯模型 (2)
2.2.4 直方图模型 (3)
2.3常见色彩空间比较 (3)
2.3.1 RGB (3)
2.3.2 HSV (4)
2.3.3 YcbCr (4)
第三章系统设计 (7)
3.1建立肤色模型 (7)
3.2肤色分割步骤 (8)
第四章参考文献 (12)
第五章心得体会 (12)
第一章引言
近年来,随着人工智能的快速发展,人脸识别技术逐渐成为模式识别与计算机视觉领域的一个研究热点,可用于身份认证、人员监视、图像数据库检索以及目标跟踪等场合。
人脸识别(Face Recognition)是将输入的人脸图像与系统已知人脸库中的模型进行比较,以确定是否存在相匹配的人脸,而人脸检测( Face Detection) 是指在输入图像中确定所存在的人脸的位置与大小,所以快速有效的人脸检测则显得至关重要,是实现人脸识别的前提和基础。
人脸检测系统要求实现对输入的可能包含人脸的图像进行处理,并输出图像中是否存在人脸以及人脸的数目、位置、尺度、位姿等参数信息。传统的人脸检测方法大多是在亮度空间内进行,利用灰度的变化做多尺度空间的全搜索,计算量非常大、效率极低,而在人脸区域中,肤色一定是占主导地位的像素色彩值,虽然肤色因人而异,但经过研究可以发现肤色在色彩空间中的一定范围内是呈聚类特性的,特别是在排除了光照亮度和在经过变换的色彩空间中,利用肤色这一特征可以排除掉在灰度图像中的非皮肤区域,这对人脸检测起到了积极的作用。
第二章算法理论与实现原理
2.1肤色分割理论
肤色特征主要由肤色模型进行描述,而肤色模型的选取与色度空间(chrominance space)的选择密切相关。人脸检测常用的色度空间主要RGB(红、绿、蓝三基色)、rgb(亮度归一化的三基色)、HSI(色调、饱和度、亮度)、YIQ(NTSC制的光亮度和色度模型)、YUV(PAL制的光亮度和色度模型)、YCbCr(CCIR601)编码方式的色度模型、CIEL(国际照明委员会提出的基于色度学的彩色模型)等。
另外,用肤色模型对肤色进行分割分为两个阶段:模型建立与
模型运用。模型的建立主要是通过对大量肤色像素集进行统计分析,然后确定模型中的参数;对于模型的运用,主要是通过已建立的肤色模型来判别所输入的像素或区域是否为肤色,或者给出其与肤色的相似程度。不论在什么样的色彩空间中,肤色模型大体上分为四种:区域模型或IF-THEN模型、简单高斯模型、混合高斯模型和直方图模型。
2.2常见肤色模型比较
2.2.1 区域模型
该模型又称IF-THEN模型、简单门限模型,它主要是利用了肤色在色彩空间的聚类性(即取值范围),将一块满足一定条件的区域标定为肤色区域。采用这个模型来判别肤色需要分两步走:首先通过统计的方法确定模型(即归属于肤色的具体范围);其次利用这个模型来判别新的像素或区域是否为肤色。因此,对于一幅新的图像,如果某个像素或区域满足给定的条件就为肤色,否则就是非肤色。从上面的判断过程来看,它是一种较简单的肤色模型。该模型的困难之处在于如何确定阈值。阈值选择不当可能会使肤色检测率下降,误检率上升。此方法计算简单,使用方便,速度快,但是效果不是很好,只适用于特定条件下的肤色检测。
2.2.2 简单高斯模型
这种方法是假设肤色分布服从单峰高斯分布。它主要通过统计分析,预测高斯分布的参数,其中参数确定常用的方法有EM 算法,Maximum-Likelihood或通过统计直接求得色彩空间中每个分量(一般利用的是该色彩空间中的色度分量)的均值与方差。采用这种方法也分为两步:首先选择方法确定模型的参数(即均值和方差);其次利用该模型来判别新的像素或区域是否为肤色。简单高斯模型相对区域模型能更好的表示肤色分布,因此相对而言,它的肤色检测率也高出许多,并且模型的参数也易于计算,但是速度比区域模型慢。
2.2.3 混合高斯模型
由于具有不同种族的肤色直方图并不完全满足单峰高斯分
布,通过研究可以采用多峰的高斯分布来精确表示。因此,提出了混合高斯模型,如公式2.1所示:
∑==m
i i i w x p w p x p 1)|()()( (2.1)
其中,)(x p 为肤色像素在色彩空间中的混合概率密度,)|(i w x p 为分量的概率密度,)(i w p 为分量的先验概率,i=1, 2,...,m 为混合密度的分量个数。该模型表明肤色的每个像素密度都属于概率密度的混合体。在这个模型中主要难点是对混合高斯模型的参数估计。其参数的估计常采用Dempster 等人提出的基于极大似然的算法。利用该算法需要进行迭代,而迭代的收敛速度受参数的初值影响,同时与分量密度个数关系很大,分量越多,运算越复杂。这种方法相对于前面两种模型来说,肤色的检测率要高得多,误检率也要小得多,但是模型的确定(即模型的参数估计)较难,速度较慢,不适合快速的肤色检测。
2.2.4 直方图模型
通过对肤色直方图的统计,然后利用阈值来进行判别。对于三维直方图,尽管效果很好,但是需要很多的训练样本而且训练时间很长,这里不详细讨论这种方法。
2.3常见色彩空间比较
2.3.1 RGB 空间
由于彩色图像是多光谱图像的一种特殊情况,对应于人类视觉的三基色即红、绿、蓝三个波段,是对人眼的光谱量化性质的近似。因此利用R 、G 、B 三基色这三个分量来表征颜色是很自然的一种格式。而且多数的图像采集设备都是以CCD 技术为核心,直接感知色彩的R 、G 、B 三个分量,这也使得三基色模型成为图像成像、显示、打印等设备的基础,具有十分重要的作用。
RGB 色彩空间用R 、G 、B 三种基本颜色分量来表示数字图像像素的颜色值。RGB 色系坐标中三维空间的三个轴分别与红、绿、蓝三基色相对应,原点对应于黑色,离原点最远的顶点对应于白