CVPR论文阅读报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CVPR论文阅读报告
论文名称:检测遮蔽的脸在荒野用本地直线的嵌入卷积神经网络方法
技术概括:存在的脸检测的模型被粗略地分成三种,分别是基于提高模型,可变形的部分模型(DPM)和卷积网络模型(CNN)。
第一种是基于提高的分类器,在这个分类器里面,ViolaJones脸检测器是最有名的模型之一,它用简单的Haar特征适应了增加的层叠。受这种模型的激励,李等人提出了一个多视角的脸检测器,它能够适应表面特征在训练和测试的过程中。一个脸检测器被用于有效地检测脸用一种优化地决策树地组合。通过比较像素集聚度在内部地节点里面脸可以被检测以一种极其高地速度。
第二种是基于可变形地模型分类。除了基于提高地方法,一些方法目的在于清楚地建模结构或者脸地变形用DPM。例如朱和Ramanan提出了一个树结构的模型为了脸的检测,可以同时评估脸的姿势和定位脸部的标志。典型地,基于DPM的脸检测器完成了印象深刻的正确率但是可能受高计算消耗的困扰由于DPM的使用。
第三种是基于卷积神经网络的分类,与基于提高和基于DPM的方法不同,基于CNN的脸检测器直接学习脸的代表从数据里面和适应深度学习范例为了检测一个脸的存在在一个
浏览的窗口里。例如李等人提出了层叠式CNN,它是一个提高的基于运行的脸检测器。一
个窗口的脸被评估用一个有意识的属性CNN和遮挡被看作是产生面部推测很好的。结果,
这种方法展现了强壮的能力在检测脸用严重的遮挡和各种各样的姿势。
总之,很多数据库和模型存在在文献里面,但是他们中的很少被特别用于发展为了遮挡脸的检测。由于这样的结果,我们提出了数据库MAFA为了训练和和标记遮挡脸的检测器,然而一个新的LLE-CNNs模型被推出也作为一个数据线。被推荐的数据库和模型将被描述在
接下来的两个部分。
研究方向:与正常脸检测的传统任务相比,现在存在的模型在检测掩饰脸上,经常有一个很大的表现性能下落,可能主要由两个原因引起,第一个原因,缺少一个由大量遮蔽的脸组成的数据库,它为了搜索关键特征通过不同的面具脸分享和识别用最新的技术表现的模型。第二个原因,面部特征来自被遮蔽的部分不再是有效的在检测的过程中,然而遮挡物的存在不可避免地吸收了一定确定种类的噪音。
为了面具脸的检测,这篇论文呈现了一个数据库,叫做MAFA,数据库由30811个网络图片组成,在网络图片里面,有35806张遮蔽的人类脸被手动标记。在注释的过程中,我们保证每张图片至少包含一张脸被不同类别的遮挡物覆盖,当然每个遮挡脸的6个主要特征脸的定位,眼睛和遮挡物,面部方向,遮挡程度和遮挡物类型,都是被手动标记和交叉检测通过九个被试者。数据库不久会在网上公开,通过这样我们相信能有利于新的脸部检测的发展在未来。
为了检测遮挡脸的主要特征在MAFA里面,我们发现大多数面部的特征都能被丢失在严重遮蔽的脸里面。然而高度多样化的遮挡物可以吸收不同种类的干预。通过这种事实的激发,我们提出了检测遮蔽的脸在荒野用本地直线的嵌入卷积神经网络方法(LLE-CNNs)为了遮蔽脸的检测,通过恢复丢失的脸线索和消除没有脸部的线索在特征的子空间。提出的方法包括一个提议的模块,一个嵌入的模块,一个证实的模块。提议的模块首先提取一套面部动作和特点,每个动作用4096个像素描述器,和一个提前训练的VGG面部模型。考虑到一个遮挡脸的描述器不能完成或者有干扰,我们把它嵌入到一个特征子空间,这个空间由两个字典组成,字典包含来自有代表的正常脸和无脸的描述器。发现那样那种字典被学习来自一个大的
正常脸,遮蔽脸和无脸的数据池来自以前的数据和MAFA的训练集。随着一个接近的本地的直线的插入,一个代表的区域能够被相似分数特征化对于代表的正常脸和无脸。最后,那样基于相似的描述器被嵌入进验证模块,这个模块由一个全连接层的深度神经网络组成以便于区别真正的脸。实验的结果在提出的MAFA数据库里面展示提出的LLE-CNNs方法有意义地比最新地技术高6个百分点在检测遮挡脸上。
应用前景:这篇论文的主要贡献由三个,第一,我们呈现了一个面具脸的数据库能够被用于另外的训练资源为了发展新的脸检测器。第二,我们提出了LLE-CNNs方法为了遮挡脸的检测,正确率超过了6个最新脸检测技术在检测面具脸上。第三,我们进行了理解性的分析在关键挑战上在面具脸检测里,为了在未来发展新的脸检测非常有帮助。