马勇 博士论文 人脸检测

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

复杂背景下人脸检测和器官定

位研究

(申请清华大学工学博士学位论文)

培养单位:清华大学电子工程系

学科:信息与通信工程

研究生:马勇

指导教师:丁晓青教授

二○○四年七月

摘要

人脸检测和器官定位是人脸信息处理领域中的一个重要课题,具有很高的学术价值和应用潜力;同时人脸检测和器官定位又是一个极具挑战性的问题。本文研究其中最具普遍性,也是最困难的复杂背景下静止灰度图像中的人脸检测、以及在得到人脸区域后进行的器官精确定位问题。在对复杂背景下人脸检测和器官定位问题的特点以及现有解决方法进行深入分析的基础上,本文主要在以下方面做出了创新:

(一)将风险概念引入SVM分类器设计中,首次提出了风险敏感的SVM 算法(CS-SVM),进行了理论分析和实验验证,证明了与常规SVM算法相比CS-SVM算法可以减少高风险类别上的FRR,在此基础上尽量减少低风险类别上的FAR,并保持分类器良好的推广性能。论文还将CS-SVM算法应用于正面直立人脸检测,提出了一种层次型的正面直立人脸检测器设计方法,实验结果进一步表明了CS-SVM算法的上述优点;

(二)将风险概念引入AdaBoost学习算法,提出了一种新的风险敏感AdaBoost学习算法(CS-AdaBoost),使算法的优化目标由常规AdaBoost算法的最小化错误率上界改变为最小化错误风险上界,从而较好的折衷FAR和FRR;论文对CS-AdaBoost算法的其它性质进行了理论分析和实验验证。并结合扩展了的微结构特征,提出了基于CS-AdaBoost算法的正面直立人脸实时检测方法,大量实验结果表明本文方法的人脸检测性能达到和超过了目前同类算法的最好性能。

(三)提出了一种快速检测复杂背景下平面内任意旋转的正面人脸的新方法。本方法采用一种结构简单的人脸方向分类器进行窗口旋转角度的估计,结合正面直立人脸检测器来验证旋转校正后的窗口,从而检测到平面内任意旋转的正面人脸。大量实验证明本方法人脸检测率接近于直接旋转图像来检测人脸的方法的性能,而优于目前提出的绝大部分正面旋转人脸检测方法,并且具有较快的检测速度。

- I -

(四)提出了一种复杂背景下人脸姿态估计和多姿态人脸快速检测新方法。本方法将多层结构由简单到复杂、姿态划分由粗到精的人脸姿态估计器与人脸/非人脸分类器组织成一个快速多姿态人脸检测器。这样构成的多姿态人脸检测器不仅可以在快速检测到人脸位置的同时得到人脸的姿态信息,而且可以降低人脸/非人脸分类器的训练难度,提高了分类器的检测性能和姿态估计的准确性。大量实验结果表明本方法具有很好的检测性能。

(五)提出了一个解决器官精确定位问题的统一框架,并在此框架的指导下,给出了定位眼睛和嘴巴的具体实现算法。在大量测试集上详尽地比较了本文算法以及其它典型器官定位算法的性能,实验结果表明本文提出的定位算法特别是眼睛定位算法无论是定位精度还是鲁棒性均优于这些方法。论文还特别研究了眼睛定位对于人脸识别性能的影响并尝试利用多个定位结果来进一步提高识别性能。实验结果表明在使用相同识别算法的情况下,基于本文眼睛定位算法的识别性能接近于基于人工标定结果的识别性能,而优于基于其它自动定位算法的识别性能。

除了应用于解决人脸检测和器官定位问题外,本文提出的算法对于解决复杂背景下的其它物体如文字、汽车、行人等的定位问题也具有很强的启发意义。

关键词:人脸检测,器官定位,姿态估计,支持向量机,AdaBoost,风险敏感分类器设计

- II -

目录

摘要..................................................................................................................... I ABSTRACT............................................................................................................ III 第一章绪论 (1)

1.1 人脸检测研究的意义 (1)

1.2 人脸检测研究现状 (2)

1.2.1 基于启发式规则的人脸检测 (4)

1.2.2 基于统计方法的人脸检测 (8)

1.3本文研究的人脸检测问题及其特点 (15)

1.3.1 人脸模式具有复杂的变化 (15)

1.3.2 非人脸模式难于描述 (16)

1.3.3 人脸检测器应采用分层结构 (17)

1.3.4 分类器设计应基于最小风险原则 (17)

1.4本文主要工作 (18)

1.5论文的安排 (19)

第二章人脸样本的采集和算法评测 (21)

2.1引言 (21)

2.2人脸样本采集 (21)

2.2.1 基于器官特征点的人脸标定 (22)

2.2.2 基于特征点的人脸姿态估计 (23)

2.2.3 人脸样本的几何归一化 (25)

2.2.4人脸样本的灰度分布归一化 (29)

2.3人脸检测算法的评测 (31)

2.3.1 测试图像库 (31)

2.3.2 人脸正确检测的评价标准 (33)

2.3.3 人脸检测算法性能评测指标 (34)

2.4小结 (36)

第三章基于风险敏感SVM的正面人脸检测 (37)

- V -

3.1引言 (37)

3.2 SVM基本理论 (38)

3.2.1 问题描述 (39)

3.2.2 问题求解 (40)

3.2.3 核函数和非线性SVM分类器 (42)

3.2.4 SVM问题的数值解法 (43)

3.3风险敏感的SVM(Cost Sensitive SVM,CS-SVM) (43)

3.3.1 CS-SVM算法的提出 (43)

3.3.2 CS-SVM分类器设计 (43)

3.3.3 CS-SVM算法与常规SVM算法的区别 (45)

3.3.4 CS-SVM算法与常规SVM算法的实验比较 (45)

3.4基于CS-SVM的正面直立人脸检测 (47)

3.4.1 特征提取 (47)

3.4.2 人脸检测器的训练 (48)

3.4.3 人脸候选后处理算法 (50)

3.5实验 (53)

3.5.1 人脸检测中的搜索策略 (53)

3.5.2 人脸检测器对噪声的敏感性 (56)

3.5.3 与其他算法的性能比较 (56)

3.6结论 (59)

第四章基于风险敏感的AdaBoost算法的正面人脸检测 (61)

4.1引言 (61)

4.2AdaBoost基本理论 (62)

4.2.1 AdaBoost在训练集上的优化目标 (63)

4.2.2 AdaBoost的推广性能分析 (65)

4.2.3 AdaBoost与后验概率的估计 (66)

4.2.4 其它类型的AdaBoost算法 (66)

4.3Cost-Sensitive AdaBoost(CS-AdaBoost)算法 (66)

4.3.1 CS-AdaBoost在训练集上的优化目标 (68)

α的确定 (68)

4.3.2 CS-AdaBoost算法中参数

t

- VI -

相关文档
最新文档