人脸检测方法综述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人脸模式的特征包括肤色特征和灰度特征。 2.1 肤色特征 肤色是人脸的重要信息, 不依赖于面部的细节特 征, 对于旋转、表情等变化情况都能够适用, 具有相对的 稳定性并且和大多数背景物体的颜色相区别。因此肤色 特征在人脸检测中是最常用的一种特征, 肤色特征主要 由肤色模型描述。 使用何种形式的肤色模型与色度空间( chrominance space) 的选择密切相关。可以从两个方面考察某种色度 空间: ( 1) 在该色度空间中能否用给定的模型描述“肤色” 区域的分布; ( 2) 色度空间中“肤色”与“非肤色”区域的重叠有多 少。 人脸检测常用的色度空间主要有 RGB 三基色、rgb 亮度归一化的三基色、SHI ( 饱和度、色调、亮度) 、YIQ ( NTSC 制的光亮度和色度模型) 、YUV( PAL 制的光亮度 和色度模型) 等。 常用的肤色模型有高斯模型、混合高斯模型和直方 图模型。Terrillon 等考察了归一化的 r- g、CIE- xy、归一化 的 TSL、CIE - DSH、HSV、YIQ、YES、CIE - L*u*v 和 CIE - L*a*b 九种色度空间。比较了高斯模型和混合高斯模型 在不同色度空间中的性能, 发现除了少数情况之外, 一般 需要使用混和高斯模型才能较好地描述肤色区域的分 布。Terrillon 等同时指出, 最终限制检测性能的因素是不 同色度空间中“肤色”与“非肤色”区域的重叠程度。 Jones 等研究了 RGB 空间中“肤色”与“非肤色”象素 的分布, 根据标定出肤色区域的近 2 万幅图片 ( 包含约 20 亿个象素) 建立了三维直方图, 在此基础上比较了直 方图模型和混合高斯模型, 发现前者的性能略好于后者。 除了上述三种肤色模型外, 还有直接利用几何参 数 描 述 肤 色 区 域 分 布 范 围 的 模 型 、三 维 投 影 模 型 、基 于 神经网的肤色模型等。此外, 也有同时考虑“肤色”与“非 肤色”像素分布的基于贝叶斯方法的模型。 2.2 灰度特征 灰度特征包括人脸轮廓特征、人脸灰度分布特征 ( 镶嵌图特征、直方图特征等) 、器官特征( 对称性等) 、模 板特征等。 轮廓是人头部分的的重要特征。Craw 等首先在低 分辨率图像中使用一个轮廓模板匹配出人脸的大概范 围, 然后在高分辨率图像中使用 Sobel 算子获得边远的 位置和方向, 并连接出完整的人脸轮廓。Wang 等提取边
( 2) 基于人工神经网的方法 人工神经网( ANN) 方法是把模式的统 计 特 性 隐 含 在 ANN 的结构和参数之中, 对于人脸这类复杂的、难以 显式描述的模式, 基于 ANN 的方法具有独特的优势。 CMU 的 Rowley 等使用了多个 ANN 检测多姿态的 人脸, 算法的框架如图 1.1 所示。
3 人脸检测的方法
现有的人脸检测方法主要有: ( 1) 基于启发式模型的方法; ( 2) 基于统计式模型的方法。 本节将主要介绍基于统计式模型的人脸检测方法。 3.1 基于启发式模型的方法 基于启发式模型的方法首先抽取几何形状、灰度、 纹理等特征, 然后检验它们是否符合人脸的先验知识。 基于这一原理的人脸检测方法有很多, 比如 Yang [1] 等 提 出 了 基 于 镶 嵌 图 ( Mosaic Image, 又 称 为 马 赛 克 图) 的人脸检测方法。Yang 等将人脸的五官区域分别划 分为 4×4 个和 8×8 个马赛克块, 使用一组规则进行检 验, 并且利用边缘特征进一步验证。卢春雨等[2]对镶嵌 图方法进行了改进, 按照人脸器官的分布将人脸划分为 3×3 个马赛克块, 在检测中自适应地调整各块的大小,使 用一组基于各块灰度和梯度统计特征的知识规则检验 该区域是否为人脸, 取得了较好的实验结果。 利 用 人 脸 的 轮 廓 、对 称 性 等 少 量 特 征 的 方 法 适 用 于 较强约束条件下( 如简单背景、头肩图象) 的人脸检测。 由于使用的特征较少, 此类算法可以达到较高的检测速 度, 实现实时检测与跟踪。利用人脸五官分布特征的知 识模型方法能够在一定程度上适用于复杂背景图象中 的人脸检测, 同时达到较高的检测速度。但是需要看到, 要想进一步提高知识模型的适应能力, 需要综合更多的 特征, 这实际上涉及到图象理解这一困难的问题。这是 此类方法进一步发展遇到的主要障碍。 3.2 基于统计模型的方法 由于人脸图象的复杂性, 显式地描述人脸特征具有 一定困难, 因此另一类方法— ——基于统计模型的方法越 来越受到重视。此类方法将人脸区域看作一类模式, 即 模板特征, 使用大量的“人脸”与“非人脸”样本训练、构 造分类器, 通过判别图象中所有可能区域属于哪类模式 的方法实现人脸的检测。实际上, 人脸检测问题被转化
应用研究
为统计模式识别的二分类问题。 ( 1) 基于特征空间的方法 此类方法将人脸区域图象变换到某一特征空间, 根
据 其 在 特 征 空 间 中 的 分 布 规 律 划 分“ 人 脸 ”与“ 非 人 脸 ” 两类模式。
主 元 分 析(PCA, Principal- Component Analysis)是 一 种常用的方法。它根据图象的统计特性进行的正交变换 ( K- L 变换) , 以消除原有向量各个分量间的相关性。变 换得到对应特征值依次递减的特征向量, 即特征脸[3]。 Moghaddam 等[3]发现人脸在特征脸空间的投影聚集比 较紧密, 因此利用前若干张特征脸将人脸向量投影到主 元子空间 F 和与其正交的补空间 F, 相应的距离度量分 别称为 DIFS (Distance In Feature Space) 和 DFFS( Dis- tance From Feature Space) 。对于人脸检测问题, 由于没 有考虑“非人脸”样本的分布, 需要同时使用 DIFS 和 DFFS 才能取得较好的效果。
本文提出的人脸检测问题是人脸识别这个问题下 的一个子问题, 这也是人脸识别的前提。
人脸检测研究具有重要的学术价值, 人脸是一类具 有复杂细节变化的自然结构目标, 由于人脸的特殊性, 人脸检测面临如下几个难题:
( 1) 人脸外貌、表情、肤色的不同, 造成模式的可变 性;
( 2) 人脸可能存在眼睛、胡须等附属物; ( 3) 人脸影像收到光照产生的阴影影响。 因此, 如果能够找到解决此类问题的方法, 构造人 脸检测和跟踪系统, 将为人脸识别以及类似的复杂模式 检测问题提供重要启发。 目前国内外针对人脸检测问题的研究很多, 比如著 名的 MIT、CMU 等, 国内的又清华大学、北京工业大学、 中科院计算技术研究所等, 而且, MPEG7 标准组织已经 建立了人脸识别草案小组, 人脸检测算法也是征集内容 之一。随着人脸检测问题研究的深入, 国际上在此项目 上发表的相关论文数也大幅度增长, 本文针对人脸检测
0 引言
人脸检测是模式识别的一个新近的发展方向和重 要应用, 人脸检测和识别在安全识别、身份鉴定、以及公 安部门的稽查活动中都有广泛而重要的应用前景。
就人脸检测这一部分, 它是人脸识别的首要步骤, 长久以来人们都在致力于找到一个能够快速定位人脸 的算法。目前人脸检测的方法主要有两种, 基于启发式 模型的方法和基于统计式模型的方法, 而近些年, 基于 统计模型的模式识别方法被广泛运用, 比如基于神经网 络的模式识别等。本文将介绍人脸检测中遇到的一系列 问题, 并列举数据比较各种人脸检测方法的检测效果, 以作参考。
关键词:人脸检测; 启发式模型; 统计式模型 中图分类号: TP 391 文献标识码: A 文章编号: 1009- 3044(2005)36- 0159- 04
S urve y on Huma n Fa ce De te ct Me thod LV Lin
(School of Software Engineering, Tongji University, Shanghai 201804, China) Abs tra ct:With the development of computer science and the society, the face detection research and application drew more and more attention. But how to design fast and efficient face detection method is still a big problem. This pa- per will analyze the primary problem and method of face detection, which based on two primary face detection patterns, and make a comparison between these methods. Ke y word:Face detection; Heuristic model; Statistical Model
收稿日期: 2005- 10 作者简介: 吕琳( 1982- ) , 男, 同济大学嘉定校区软件学院硕士在读。
159
电脑知识与技术
问题的讨论也参考了许多前人的经验。
2 人脸模式的特征提取
模式识别的首要问题是要找到能够较好代表客观对 象的特征, 并加以筛选, 使用最有用、最有代表性的特征作 为模式识别的依据, 选择何种特征作为人脸检测的依据、 如何利用这些特征, 是人脸检测研究的一个关键问题。
人脸区域那的各个器官( 如双眼、鼻子、嘴等) 百度文库人 脸的重要特征。Kouzani 等使用人工神经网络分别检测 眼睛、鼻子、嘴以及人脸的整体特征。
人脸区域的灰度本身可以作为模板特征, 通常取仅 包 括 双 眼 、鼻 子 和 嘴 的 面 部 中 心 区 域 作 为 共 性 的 人 脸 模 板特征, 排除掉头发、脸颊两侧变化很大的部分。被广泛 地用于基于统计学习的人脸检测方法中。
160 电脑知识与技术
应用研究
缘特征并根据关于 Hoough 变换抽取椭圆形状信息。 人脸核心区域( 眼睛、鼻子、嘴区域) 具有独特的灰度
分布特征。Yang 等首先提出了人脸的镶嵌图就是将图像 划分为一组大小相同 的方格, 每个方格的灰度为格中各 个像素的平均值。镶嵌图特征是指这些块的值应当满足 的约束规则。Lu 等依据人脸的左右对称性, 通过提取投 影直方图特征检测人脸的旋转角度, 在提取镶嵌图特征。 Dai 等提取空间灰度共现矩阵( SGLD) 特征等等。
1 人脸检测和人脸识别
说到人脸检测就不能不提到人脸识别问题, 人脸识 别问题是指: 对输入的人脸图像或者视频, 首先判断其 中是否存在人脸, 如果存在人脸, 则进一步的给出每个 人脸的位置、大小和各个主要面部器官的位置信息, 并 依据这些信息, 进一步提取每个人脸中所蕴含的身份特 征, 并将其与已知人脸库中的人脸进行对比, 从而识别 每个人脸的身份。
军事安全和公共安全领域, 智能门禁、智能视频监控、公 安布控、海关身份验证、司机驾照验证等是典型的应用; 在民事和经济领域, 各类银行卡、金融卡、信用卡、储蓄 卡的持卡人的身份验证, 社会保险人的身份验证等具有 重要的应用价值; 在家庭娱乐等领域, 人脸识别也具有 一些有趣有益的应用, 比如能够识别主人身份的智能玩 具、家政机器人, 具有真实面像的虚拟游戏玩家等等。
应用研究
电脑知识与技术
人脸检测方法综述
吕琳 ( 同济大学软件学院, 上海 201804)
摘要:随着计算机科学的发展和社会的进步, 人脸检测的研究和应用越来越得到广泛的关注。但是设计快速有效 的人脸检测方法仍然是一个难度很大的问题。本文将从人脸检测方法的两个主要模式出发, 分析了当前人脸检测的 主要问题和方法, 并对这些方法进行比较。
人脸识别的过程可以分为以下三个部分: ( 1) 人脸检测: 判断输入图像中是否存在人脸, 如果 有, 给出每个人脸的位置, 大小; ( 2) 面部特征定位: 对找到的每个人脸, 检测其主要 器官的位置和形状等信息; ( 3) 人脸比对: 根据面部特征定位的结果, 与库中人
脸对比, 判断该人脸的身份信息 人脸识别技术具有广泛的应用前景, 在国家安全、
( 2) 基于人工神经网的方法 人工神经网( ANN) 方法是把模式的统 计 特 性 隐 含 在 ANN 的结构和参数之中, 对于人脸这类复杂的、难以 显式描述的模式, 基于 ANN 的方法具有独特的优势。 CMU 的 Rowley 等使用了多个 ANN 检测多姿态的 人脸, 算法的框架如图 1.1 所示。
3 人脸检测的方法
现有的人脸检测方法主要有: ( 1) 基于启发式模型的方法; ( 2) 基于统计式模型的方法。 本节将主要介绍基于统计式模型的人脸检测方法。 3.1 基于启发式模型的方法 基于启发式模型的方法首先抽取几何形状、灰度、 纹理等特征, 然后检验它们是否符合人脸的先验知识。 基于这一原理的人脸检测方法有很多, 比如 Yang [1] 等 提 出 了 基 于 镶 嵌 图 ( Mosaic Image, 又 称 为 马 赛 克 图) 的人脸检测方法。Yang 等将人脸的五官区域分别划 分为 4×4 个和 8×8 个马赛克块, 使用一组规则进行检 验, 并且利用边缘特征进一步验证。卢春雨等[2]对镶嵌 图方法进行了改进, 按照人脸器官的分布将人脸划分为 3×3 个马赛克块, 在检测中自适应地调整各块的大小,使 用一组基于各块灰度和梯度统计特征的知识规则检验 该区域是否为人脸, 取得了较好的实验结果。 利 用 人 脸 的 轮 廓 、对 称 性 等 少 量 特 征 的 方 法 适 用 于 较强约束条件下( 如简单背景、头肩图象) 的人脸检测。 由于使用的特征较少, 此类算法可以达到较高的检测速 度, 实现实时检测与跟踪。利用人脸五官分布特征的知 识模型方法能够在一定程度上适用于复杂背景图象中 的人脸检测, 同时达到较高的检测速度。但是需要看到, 要想进一步提高知识模型的适应能力, 需要综合更多的 特征, 这实际上涉及到图象理解这一困难的问题。这是 此类方法进一步发展遇到的主要障碍。 3.2 基于统计模型的方法 由于人脸图象的复杂性, 显式地描述人脸特征具有 一定困难, 因此另一类方法— ——基于统计模型的方法越 来越受到重视。此类方法将人脸区域看作一类模式, 即 模板特征, 使用大量的“人脸”与“非人脸”样本训练、构 造分类器, 通过判别图象中所有可能区域属于哪类模式 的方法实现人脸的检测。实际上, 人脸检测问题被转化
应用研究
为统计模式识别的二分类问题。 ( 1) 基于特征空间的方法 此类方法将人脸区域图象变换到某一特征空间, 根
据 其 在 特 征 空 间 中 的 分 布 规 律 划 分“ 人 脸 ”与“ 非 人 脸 ” 两类模式。
主 元 分 析(PCA, Principal- Component Analysis)是 一 种常用的方法。它根据图象的统计特性进行的正交变换 ( K- L 变换) , 以消除原有向量各个分量间的相关性。变 换得到对应特征值依次递减的特征向量, 即特征脸[3]。 Moghaddam 等[3]发现人脸在特征脸空间的投影聚集比 较紧密, 因此利用前若干张特征脸将人脸向量投影到主 元子空间 F 和与其正交的补空间 F, 相应的距离度量分 别称为 DIFS (Distance In Feature Space) 和 DFFS( Dis- tance From Feature Space) 。对于人脸检测问题, 由于没 有考虑“非人脸”样本的分布, 需要同时使用 DIFS 和 DFFS 才能取得较好的效果。
本文提出的人脸检测问题是人脸识别这个问题下 的一个子问题, 这也是人脸识别的前提。
人脸检测研究具有重要的学术价值, 人脸是一类具 有复杂细节变化的自然结构目标, 由于人脸的特殊性, 人脸检测面临如下几个难题:
( 1) 人脸外貌、表情、肤色的不同, 造成模式的可变 性;
( 2) 人脸可能存在眼睛、胡须等附属物; ( 3) 人脸影像收到光照产生的阴影影响。 因此, 如果能够找到解决此类问题的方法, 构造人 脸检测和跟踪系统, 将为人脸识别以及类似的复杂模式 检测问题提供重要启发。 目前国内外针对人脸检测问题的研究很多, 比如著 名的 MIT、CMU 等, 国内的又清华大学、北京工业大学、 中科院计算技术研究所等, 而且, MPEG7 标准组织已经 建立了人脸识别草案小组, 人脸检测算法也是征集内容 之一。随着人脸检测问题研究的深入, 国际上在此项目 上发表的相关论文数也大幅度增长, 本文针对人脸检测
0 引言
人脸检测是模式识别的一个新近的发展方向和重 要应用, 人脸检测和识别在安全识别、身份鉴定、以及公 安部门的稽查活动中都有广泛而重要的应用前景。
就人脸检测这一部分, 它是人脸识别的首要步骤, 长久以来人们都在致力于找到一个能够快速定位人脸 的算法。目前人脸检测的方法主要有两种, 基于启发式 模型的方法和基于统计式模型的方法, 而近些年, 基于 统计模型的模式识别方法被广泛运用, 比如基于神经网 络的模式识别等。本文将介绍人脸检测中遇到的一系列 问题, 并列举数据比较各种人脸检测方法的检测效果, 以作参考。
关键词:人脸检测; 启发式模型; 统计式模型 中图分类号: TP 391 文献标识码: A 文章编号: 1009- 3044(2005)36- 0159- 04
S urve y on Huma n Fa ce De te ct Me thod LV Lin
(School of Software Engineering, Tongji University, Shanghai 201804, China) Abs tra ct:With the development of computer science and the society, the face detection research and application drew more and more attention. But how to design fast and efficient face detection method is still a big problem. This pa- per will analyze the primary problem and method of face detection, which based on two primary face detection patterns, and make a comparison between these methods. Ke y word:Face detection; Heuristic model; Statistical Model
收稿日期: 2005- 10 作者简介: 吕琳( 1982- ) , 男, 同济大学嘉定校区软件学院硕士在读。
159
电脑知识与技术
问题的讨论也参考了许多前人的经验。
2 人脸模式的特征提取
模式识别的首要问题是要找到能够较好代表客观对 象的特征, 并加以筛选, 使用最有用、最有代表性的特征作 为模式识别的依据, 选择何种特征作为人脸检测的依据、 如何利用这些特征, 是人脸检测研究的一个关键问题。
人脸区域那的各个器官( 如双眼、鼻子、嘴等) 百度文库人 脸的重要特征。Kouzani 等使用人工神经网络分别检测 眼睛、鼻子、嘴以及人脸的整体特征。
人脸区域的灰度本身可以作为模板特征, 通常取仅 包 括 双 眼 、鼻 子 和 嘴 的 面 部 中 心 区 域 作 为 共 性 的 人 脸 模 板特征, 排除掉头发、脸颊两侧变化很大的部分。被广泛 地用于基于统计学习的人脸检测方法中。
160 电脑知识与技术
应用研究
缘特征并根据关于 Hoough 变换抽取椭圆形状信息。 人脸核心区域( 眼睛、鼻子、嘴区域) 具有独特的灰度
分布特征。Yang 等首先提出了人脸的镶嵌图就是将图像 划分为一组大小相同 的方格, 每个方格的灰度为格中各 个像素的平均值。镶嵌图特征是指这些块的值应当满足 的约束规则。Lu 等依据人脸的左右对称性, 通过提取投 影直方图特征检测人脸的旋转角度, 在提取镶嵌图特征。 Dai 等提取空间灰度共现矩阵( SGLD) 特征等等。
1 人脸检测和人脸识别
说到人脸检测就不能不提到人脸识别问题, 人脸识 别问题是指: 对输入的人脸图像或者视频, 首先判断其 中是否存在人脸, 如果存在人脸, 则进一步的给出每个 人脸的位置、大小和各个主要面部器官的位置信息, 并 依据这些信息, 进一步提取每个人脸中所蕴含的身份特 征, 并将其与已知人脸库中的人脸进行对比, 从而识别 每个人脸的身份。
军事安全和公共安全领域, 智能门禁、智能视频监控、公 安布控、海关身份验证、司机驾照验证等是典型的应用; 在民事和经济领域, 各类银行卡、金融卡、信用卡、储蓄 卡的持卡人的身份验证, 社会保险人的身份验证等具有 重要的应用价值; 在家庭娱乐等领域, 人脸识别也具有 一些有趣有益的应用, 比如能够识别主人身份的智能玩 具、家政机器人, 具有真实面像的虚拟游戏玩家等等。
应用研究
电脑知识与技术
人脸检测方法综述
吕琳 ( 同济大学软件学院, 上海 201804)
摘要:随着计算机科学的发展和社会的进步, 人脸检测的研究和应用越来越得到广泛的关注。但是设计快速有效 的人脸检测方法仍然是一个难度很大的问题。本文将从人脸检测方法的两个主要模式出发, 分析了当前人脸检测的 主要问题和方法, 并对这些方法进行比较。
人脸识别的过程可以分为以下三个部分: ( 1) 人脸检测: 判断输入图像中是否存在人脸, 如果 有, 给出每个人脸的位置, 大小; ( 2) 面部特征定位: 对找到的每个人脸, 检测其主要 器官的位置和形状等信息; ( 3) 人脸比对: 根据面部特征定位的结果, 与库中人
脸对比, 判断该人脸的身份信息 人脸识别技术具有广泛的应用前景, 在国家安全、