基于级联形状回归的多视角人脸特征点定位
超全的最新的人脸识别特征点定位方法
超全的最新的人脸识别特征点定位方法人脸识别是近年来计算机视觉领域的一个重要研究方向,其中人脸特征点定位是其关键技术之一、早期的人脸特征点定位方法主要基于手工设计的特征和传统的机器学习算法,但这些方法在复杂场景下效果较差。
随着深度学习的兴起,越来越多的人脸特征点定位方法采用了基于深度神经网络的方法,取得了令人瞩目的成果。
下面将介绍一种具有较高准确率和鲁棒性的最新人脸特征点定位方法。
该方法主要分为两个阶段:人脸检测和人脸特征点定位。
在人脸检测阶段,首先利用深度神经网络模型,如MTCNN(多任务级联卷积神经网络)或RetinaFace,对输入图像进行人脸检测。
通过对检测结果进行阈值处理和非极大值抑制,筛选出较为准确的人脸候选框。
在人脸特征点定位阶段,利用深度神经网络模型进行人脸特征点的定位。
最常用的模型是HourGlass网络,它是一个具有层级结构的神经网络,能够有效处理不同尺度和不同角度下的人脸特征点定位任务。
HourGlass网络通过堆叠多个残差模块实现了对特征的多尺度和多次聚合。
此外,为了提高网络的鲁棒性,还可以引入注意力机制和多尺度信息融合。
具体而言,人脸特征点定位任务可以分为两个子任务:人脸区域回归和特征点定位。
在人脸区域回归子任务中,将输入图像通过HourGlass网络,输出人脸框的位置信息。
在特征点定位子任务中,将输入图像和人脸区域通过HourGlass网络,输出相应的特征点坐标。
为了提高网络的鲁棒性,可以引入一些技巧,如辅助损失函数、残差连接、批量归一化等。
除了HourGlass网络,还有其他一些深度神经网络模型也被广泛应用于人脸特征点定位任务,如ResNet、VGGNet等。
这些模型通过堆叠多个卷积和池化层,实现对图像特征的抽取和学习。
同时,为了进一步提高准确率,可以采用数据增强技术,如随机旋转、缩放和平移等。
综上所述,最新的人脸特征点定位方法主要利用深度神经网络模型进行人脸检测和特征点定位。
人脸追踪的应用原理
人脸追踪的应用原理1. 什么是人脸追踪人脸追踪是一种计算机视觉技术,用于在视频或图像序列中检测和跟踪人脸。
它通过分析图像中的特征点、形状、纹理等信息,识别人脸并跟踪它们的运动。
人脸追踪技术在许多领域有广泛的应用,包括人机交互、安防监控、虚拟现实等。
2. 人脸追踪的技术原理人脸追踪的技术原理可以分为以下几个步骤:2.1 人脸检测人脸追踪首先需要进行人脸检测,即在图像中确定人脸位置。
常用的人脸检测算法包括基于特征的方法、基于分类器的方法和基于深度学习的方法。
其中,基于深度学习的方法如使用卷积神经网络(Convolutional Neural Networks,CNN)进行人脸检测,能够取得较好的检测效果。
2.2 人脸特征点定位在人脸检测的基础上,需要进一步定位人脸的关键特征点,如眼睛、鼻子、嘴巴等位置。
这些特征点的定位可以通过监督学习方法、回归方法或深度学习方法来实现。
通过人脸特征点的定位,可以更精确地描述人脸的形状和姿态。
2.3 人脸跟踪人脸跟踪是指在连续的图像帧中追踪人脸的运动。
人脸跟踪算法通常基于人脸的运动模型来预测下一帧中的人脸位置,并通过与当前帧中的实际位置进行比较来更新模型。
常见的人脸跟踪算法包括基于颜色和纹理的方法、基于特征点的方法和基于深度学习的方法。
3. 人脸追踪的应用人脸追踪技术在许多领域有广泛的应用,包括但不限于以下几个方面:3.1 人机交互人脸追踪可以用于人机交互,实现人脸识别、表情识别、眼球跟踪等功能。
例如,人脸追踪可以用于游戏中的头部追踪,实现头部动作的实时捕捉,并将其应用于虚拟现实游戏中。
3.2 安防监控在安防监控领域,人脸追踪可以用于识别和跟踪潜在嫌疑人。
通过与数据库中的人脸特征进行比对,可以实时发现目标人物的行踪,并提供给相关部门进行进一步的处理。
3.3 虚拟现实人脸追踪在虚拟现实领域也有广泛的应用。
通过追踪用户的面部表情和眼球运动,可以实时调整虚拟现实场景的渲染效果,提升用户的沉浸感。
多视角级联回归模型人脸特征点定位
多信息融合的多姿态三维人脸面部五官标志点定位方法
o l — d li f r t n n t e p e e t d me h d fi e i v ra tAfi e S FT s u i z d n mu t mo e n o ma i .I h r s n e t o ,a f n a in f — I i o n n wa t ie l
( 西省 语 音 与 图 像 信 息 处理 重 点实 验 室 西 北 工 业 大学 计 算 机 学 院 陕 西 安 7 0 2 ) 1 1 9
摘 要
针 对 三 维 人 脸 模 型 面 部 五 官 标 志 点 定 位 对 姿 态 变 化 非 常 敏 感 的 问题 , 出 了 一 种 基 于 多信 息 融 合 的 多 姿 提
t e f r to D a e me h,t e e o ei r u t b e f r p a t a p l a i n Ex e i n a e h o ma f3 f c s h r f r mo e s i l o r c i l p i t . s a c a c o p rme t l — r
M u t- s Fa i lLa d a k Lo a i a i n Ba e n M u t- o e n o m a i n liPo e 3D c a n m r c l to s d o z liM d lI f r to
人脸识别中的人脸关键点检测算法优化
人脸识别中的人脸关键点检测算法优化一、引言人脸识别技术在近年来得到了广泛的应用,其实现原理中的一个关键环节就是人脸关键点的检测。
人脸关键点检测算法的优化是提高人脸识别准确性和效率的关键。
本文将就人脸关键点检测算法的优化进行探讨。
二、人脸关键点检测算法概述人脸关键点是人脸图像中的一些特定位置,例如眼睛、鼻子、嘴巴等部位。
人脸关键点检测算法旨在通过对人脸图像的分析,准确地定位这些关键点。
常见的人脸关键点检测算法包括传统的基于模型的方法和基于深度学习的方法。
传统的基于模型的方法主要基于特征提取和模式匹配原理,通过人工设计特征或使用机器学习方法对特征进行学习。
这些方法通常需要预定义的特征模型,并且对于不同的人脸图像,需要手动调整模型参数,因而具有一定的局限性。
基于深度学习的方法则利用深度神经网络的强大学习能力,自动学习人脸的特征表示,并通过回归或分类模型得到人脸关键点的坐标。
这些方法在人脸关键点检测任务上取得了良好的效果,但是其复杂的网络结构和需要大量的训练数据使得其计算复杂度较高。
三、人脸关键点检测算法的优化方向为了提高人脸关键点检测算法的准确性和效率,研究者们提出了一系列的优化方法和技术。
以下将从多个方面对这些优化方向进行讨论。
1. 特征提取人脸关键点检测算法的准确度与特征提取的质量密切相关。
为了获得更好的特征表示,可以使用先进的特征提取算法,如局部二值模式(Local Binary Patterns, LBP)、方向梯度直方图(Histogram of Oriented Gradients, HOG)等。
这些算法可以从人脸图像中提取出更具代表性的特征,有助于提高关键点检测的准确性。
2. 模型优化对于基于模型的人脸关键点检测算法,模型的优化是一项重要的任务。
可以通过对模型进行精细的调整和优化,提高模型的性能。
此外,还可以使用更为先进的模型,如级联形状回归器(Cascade Shape Regression, CSR)、支持向量回归(Support Vector Regression, SVR)等,来取代传统的模型,提高关键点检测的精确度。
人脸关键点检测 经典算法
人脸关键点检测经典算法人脸关键点检测经典算法是计算机视觉领域的一个重要研究方向,它旨在识别和定位人脸图像中的关键点,如眼睛、鼻子、嘴巴等。
本文将介绍人脸关键点检测的基本原理以及三种经典算法:传统机器学习方法、深度学习方法和级联回归方法。
通过分析比较这些算法的优劣势,我们能够更好地理解人脸关键点检测技术的发展和应用。
一、人脸关键点检测基本原理人脸关键点检测的基本原理是将人脸图像中的关键点位置信息映射到特定的坐标系中。
这样一来,我们就可以通过机器学习或深度学习算法来训练模型,使其能够自动识别和定位这些关键点。
具体来说,人脸关键点检测的基本步骤包括以下几个方面:1. 数据准备:从人脸图像或视频中收集一系列标注好的训练样本,其中包含了关键点的位置信息。
2. 特征提取:将人脸图像转换成计算机可以理解的特征向量。
常用的特征包括灰度直方图、梯度直方图和局部二值模式等。
3. 模型训练:使用机器学习或深度学习算法对提取的特征进行训练,以建立关键点检测模型。
4. 模型测试和优化:使用测试集评估模型的性能,并根据需要对模型进行调整和优化。
二、传统机器学习方法传统机器学习方法在人脸关键点检测中有着较长的历史。
常用的传统机器学习方法包括支持向量机(SVM)、随机森林(RandomForest)和神经网络等。
在传统机器学习方法中,特征提取是一个关键问题。
基于传统机器学习方法的人脸关键点检测通常使用手工设计的特征表示,如HOG(Histogram of Oriented Gradients)、SIFT(Scale-Invariant Feature Transform)和SURF(Speeded Up Robust Features)等。
其中,HOG是一种常用的特征表示方法,它通过计算图像中不同方向上梯度的直方图来描述图像的纹理和边缘信息。
SIFT和SURF 则是基于图像局部特征的表示方法,它们可以在尺度、旋转和光照变化下保持特征的稳定性。
MATLAB中的人脸检测与人脸关键点定位技术
MATLAB中的人脸检测与人脸关键点定位技术人脸检测与人脸关键点定位是计算机视觉中一个重要的课题,它在许多应用领域都有着广泛的应用,如人脸识别、人机交互、表情分析等。
MATLAB作为一种非常强大的科学计算软件,也提供了丰富的工具和函数来实现这些功能。
在本文中,将探讨MATLAB中的人脸检测与人脸关键点定位技术,并介绍其原理和具体实现方式。
一、人脸检测技术人脸检测是计算机视觉中的一项基础任务,其目标是在给定的图像中准确地识别出人脸的位置。
在MATLAB中,人脸检测通常基于基于统计模型的方法,如Haar特征和级联分类器。
1. Haar特征Haar特征是一种用于物体检测的特征描述方法,它通过计算图像中不同区域的灰度差异来表示目标物体的特征。
在人脸检测中,Haar特征可以用来检测人脸的各种细节,如眼睛、鼻子、嘴巴等。
MATLAB提供了一系列函数和工具箱来计算和提取Haar特征,以及构建Haar特征分类器。
2. 级联分类器级联分类器是一种常用的目标检测方法,它通过级联多个简单的分类器来实现对复杂目标的检测。
在人脸检测中,级联分类器可以用来筛选候选区域,并排除一些不可能是人脸的区域,从而提高检测的准确率。
MATLAB中的人脸检测函数通常会使用级联分类器进行初步筛选,以减少计算量。
二、人脸关键点定位技术人脸关键点定位是在检测到人脸后,进一步定位人脸的关键特征点,如眼睛、眉毛、鼻子、嘴巴等。
在MATLAB中,人脸关键点定位主要基于形状模型和特征点回归方法。
1. 形状模型形状模型是一种用于描述人脸形状变化的数学模型,它通过学习和建模一组训练数据的形状变化,从而能够对新的输入数据进行形状预测。
在人脸关键点定位中,形状模型可以用来对给定的人脸进行局部形状的估计,从而进一步定位关键点。
MATLAB提供了一些函数和工具箱来实现形状模型的训练和预测。
2. 特征点回归特征点回归是一种常用的人脸关键点定位方法,它通过学习一个回归函数,将图像中的像素坐标映射到关键点的位置坐标。
一种基于局部信息的脸部特征定位方法.
一种基于局部信息的脸部特征定位方法脸部特征定位,即在图像或图像序列的给定区域内搜索部分或所有人脸特征(如眼、鼻、嘴、耳等)的位置、关键点或轮廓线。
其中包括眼睛、鼻子、嘴巴、下颌、耳朵以及人脸外轮廓等所有需要提取特征点的位置。
脸部特征定位可以为人脸识别、姿态表情分析、人脸跟踪等研究工作提供重要的几何信息,特征定位的准确与否直接关系到后续应用的可靠性因而具有举足轻重的地位。
ASM(Active Shape Models)是基于几何形状信息的方法之一,由脸部特征定位,即在图像或图像序列的给定区域内搜索部分或所有人脸特征(如眼、鼻、嘴、耳等)的位置、关键点或轮廓线。
其中包括眼睛、鼻子、嘴巴、下颌、耳朵以及人脸外轮廓等所有需要提取特征点的位置。
脸部特征定位可以为人脸识别、姿态表情分析、人脸跟踪等研究工作提供重要的几何信息,特征定位的准确与否直接关系到后续应用的可靠性因而具有举足轻重的地位。
ASM(Active Shape Models)是基于几何形状信息的方法之一,由Cootes等于1992年提出。
它采用点分布模型(Point Distribution Model,PDM)描述形状变化,另一方面计算各特征点法线方向上灰度值的一阶偏导,并建立局部纹理模型。
在搜索时通过纹理模型得到当前点的最佳匹配位置,然后调节形状模型,最终达到对特征的精确定位。
由于匹配准则的问题ASM容易陷入局部极小点,对于初始位置要求比较高。
Wiskott等将Gabor小波用于人脸识别领域,提出了弹性图的概念并用于脸部特征的定位。
该方法可以适用于一定程度的姿态及表情变化,实践证明是有效的。
由于该方法在搜索时需要在整幅图上寻找特征点的最佳匹配位置,这一过程十分费时,计算量也很大。
Jiao等使用Gabor小波提取局部纹理特征,Gabor特征的幅值与相位包含了丰富的人脸局部纹理信息,在搜索时可以提供指导。
由进一步的研究分析可知,不仅特征点的Gabor系数特征包含局部纹理的有用信息,特征点周围邻域中各点的Gabor系数特征也是很有用的。
利用计算机视觉技术进行人脸关键点定位的技巧与方法
利用计算机视觉技术进行人脸关键点定位的技巧与方法随着计算机视觉技术的不断发展,人脸关键点定位已经成为许多应用领域中的重要技术。
这项技术可以帮助我们准确地识别和定位一个人的面部特征,如眼睛、鼻子、嘴巴等关键点,为人脸识别、表情分析、面部变形等应用提供了基础支持。
本文将介绍一些利用计算机视觉技术进行人脸关键点定位的技巧和方法。
一、图像预处理图像预处理是人脸关键点定位的第一步。
由于图像来源的多样性和不确定性,图像预处理能够提高后续人脸关键点定位的准确性和稳定性。
1. 图像对齐:对于不同姿态和角度的人脸图像,需要将其进行对齐,统一为正脸姿势。
通过人脸检测和人脸对齐算法,可以将人脸调整到一个统一的位置和角度,提供一致的特征定位环境,方便后续的处理。
2. 亮度和对比度调整:人脸图像的亮度和对比度不一致会对关键点定位造成影响。
通过直方图均衡化、自适应对比度增强等方法,可以增强图像的可视性,提高后续处理的效果。
二、特征提取特征提取是人脸关键点定位的核心步骤,通常采用的方法有形状模型和深度学习模型。
1. 形状模型:形状模型方法通常通过定义一个统一的人脸模板,然后通过优化算法去拟合人脸图像中的关键点。
常用的方法有Active Shape Model(ASM)、Active Appearance Model(AAM)等。
这些方法通过定义关键点之间的形状约束和形状变化模型,能够实现对人脸图像中关键点的准确定位。
2. 深度学习模型:近年来,深度学习模型在人脸关键点定位中取得了更好的效果。
通过使用卷积神经网络(CNN)、残差网络(ResNet)等模型,可以实现对人脸图像中关键点的自动学习和定位。
基于深度学习的方法在大规模数据集上进行训练,能够提供更精确、鲁棒的人脸关键点定位结果。
三、关键点定位与优化在进行关键点定位后,需要进行一些优化操作,以提高结果的准确性和鲁棒性。
1. 形状约束优化:根据人脸特征的几何结构和形状约束,进行约束优化,例如眼睛的位置相对于鼻子的位置等。
基于级联分类器的人脸检测
基于级联分类器的人脸检测作者:程俊红来源:《硅谷》2008年第10期[摘要]提出基于级联分类器人脸特征检测。
在人脸检测层,先对输入的图像进行预处理,初步检测人脸,如果认定图像中不存在人脸,就不存在进行整体和局部的搜索,直接退出检测,如果存在人脸,则检测出人脸的大概位置作为全局搜索的初值。
[关键词]级联定位人脸检测中图分类号:TP7 文献标识码:A 文章编号:1671-7597(2008)0520019-01一、引言人脸检测可以被看作是一个只有两个类的分类问题,即将图像分为“脸”和“非脸”,人脸检测是从图像中识别一个具有一个很大的类内可变性的对象类,人脸检测的目的是通过大量的训练样本的学习,去减少脸的“类”的类内可变性,而增加“脸”与“非脸”的类间可变性。
为了解决在实际的人脸检测过程中,发现局部模板在局部细节的跟踪上能得到较高的精度,但由于局部模板跟踪是一个较小的区域,特征信息量在整个脸中比较小,因而经常出现跟丢现象。
同时还注意到在连续视频流人脸跟踪中,如果中间某一帧出现错误,往往后续的帧也会出现错误,跟踪位置偏离实际位置越来越大,也就是跟踪的误差越来越大。
从而提出了基于级联分类器人脸特征检测算法。
二、分类器结构在人脸检测时,首先要构造一个分类器。
通常是在被检测图像上开设一个小窗口,将子窗口包含的信息通过某种变换后,作为分类器的输入。
子窗口在整个图像上遍历地滑动,分类器通过判断每个子窗体是否存在在人脸来进行检测。
在数量巨大的被检测子窗口中,绝大多数的子窗口将在检测中被排除掉,最后所剩的是极少数的,即小概率事件。
因此人脸检测是一个小概率事件。
要想让单一的分类器具有较高分类性能是十分困难的,本文的方法是构建一个具有n个节点的人脸检测,系统是一个分类器的集合,每个分类器hi串联起来,每一个分类器叫弱分类器,合并成一个强分类器。
级联系统的训练与分类采用Boosting(推进式)学习方法,整个人脸检测过程的框架相当于一个退化的决策树,Boosting的分类过程是:从第一个分类器的正确结果触发第二个分类器,它被调整得到一个非常高的检测率。
面部特征点的提取算法
面部特征点的提取算法
面部特征点的提取算法有多种,下面列举几种常见的算法:
1. HoG特征结合SVM分类器:通过计算图像的梯度直方图(HoG)来提取面部特征,然后使用支持向量机(SVM)进行分类,找到人脸区域和特征点位置。
2. 级联AdaBoost算法:通过级联的强分类器来进行人脸检测和特征点定位。
首先使用强分类器来筛选出可能的人脸区域,然后在这些区域中利用特征点模型来定位面部特征点。
3. Active Shape Model (ASM):通过训练样本集合来学习人脸的形状模型,然后利用这个模型来对新的人脸图像进行特征点的定位。
4. 迭代最近点算法(Iterative Closest Point, ICP):通过将3D 模型和2D图像匹配来进行人脸特征点定位。
首先将3D模型投影到2D图像上,然后通过ICP算法不断迭代优化,找到最佳的特征点位置。
以上只是一些常见的面部特征点提取算法,实际上还有很多其他算法和方法,如基于深度学习的方法、活体识别等。
具体选择哪种算法要根据具体应用场景和需求来决定。
基于时空形变网络的人脸关键点定位与追踪
基于时空形变网络的人脸关键点定位与追踪基于时空形变网络的人脸关键点定位与追踪人脸关键点定位与追踪是计算机视觉领域中的重要任务,对于人脸识别、姿态估计、表情分析等应用具有重要意义。
近年来,随着深度学习的发展,深度神经网络在人脸关键点定位与追踪任务上取得了显著的成果。
本文将介绍一种基于时空形变网络的方法,用于人脸关键点的定位与追踪。
时空形变网络是一种专门针对时空变换任务设计的深度神经网络。
对于人脸关键点定位与追踪任务来说,时空形变网络能够有效地利用视频序列中的时空信息,提高关键点定位和追踪的准确性和鲁棒性。
首先,我们需要收集人脸关键点的训练数据。
人脸关键点是人脸上一些重要的特征点,如眼睛、嘴巴、眉毛等。
通过在大量的人脸数据集中手动标记这些关键点,我们可以得到一个人脸关键点的训练集。
然后,我们需要设计一个时空形变网络,以实现人脸关键点的定位与追踪。
时空形变网络可以看作是一个时序的三维卷积神经网络,输入为一段连续的视频序列,输出为对应视频中的人脸关键点。
时空形变网络能够捕捉人脸在连续帧之间的形变信息,从而实现关键点的准确定位和追踪。
在时空形变网络中,我们可以使用一种叫作Spatial Transformer module的模块来实现关键点的定位与追踪。
Spatial Transformer module可以对输入的特征图进行形变操作,从而能够在空间和时间上自适应地调整网络的感受野,提高关键点定位的准确性和鲁棒性。
通过利用Spatial Transformer module,时空形变网络可以自动学习到人脸关键点在不同姿态下的表示,从而提高关键点定位与追踪的效果。
最后,我们需要训练时空形变网络,以实现人脸关键点的定位与追踪。
在训练过程中,我们可以使用已标记好的人脸关键点数据进行监督学习,通过最小化预测关键点与真实关键点之间的距离来优化网络参数。
此外,我们还可以使用一些数据增强技术,如随机裁剪、镜像翻转等,来增加训练样本的多样性,提高网络的泛化能力。
基于非线性Boosting回归的多视角人脸配准
基于非线性Boosting回归的多视角人脸配准
苏延超;艾海舟;劳世竑
【期刊名称】《自动化学报》
【年(卷),期】2010(0)4
【摘要】人脸配准可以作为表情分析、人脸识别等人脸相关研究的预处理步骤,是人脸相关的计算机视觉研究的关键问题.本文针对图像中水平视角在正负45°内的人脸配准问题,利用基于Haar特征的非线性Boosting回归算法,根据标定点邻域内的局部纹理预测标定点的位移,提出了一种新的基于经典活动形状模型(Active shape model,ASM)的实时多视角人脸配准算法.在两个数据集合上的测试实验表明,该算法在速度、准确度和稳定性上都比经典的ASM算法有显著提高且优于近期的改进算法,具有明显的实用价值.
【总页数】6页(P522-527)
【作者】苏延超;艾海舟;劳世竑
【作者单位】清华大学计算机系,北京,100084;清华大学计算机系,北京,100084;日本欧姆龙公司核心技术研究所,京都,日本,619-0283
【正文语种】中文
【相关文献】
1.基于LBP和CCS-AdaBoost的多视角人脸检测 [J], 何智翔;丁晓青;方驰;文迪
2.基于连续Adaboost算法的多视角人脸检测 [J], 武勃;黄畅;艾海舟;劳世竑
3.基于非线性特征和线性映射的多视角低分辨人脸识别算法 [J], 曾啸;黄华
4.基于非线性特征和线性映射的多视角低分辨人脸识别算法 [J], 曾啸;黄华;
5.基于级联形状回归的多视角人脸特征点定位 [J], 桑高丽; 王国滨; 朱蓉; 宋佳佳因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于级联形状回归的多视角人脸特征点定位
桑高丽,王国滨,朱蓉,宋佳佳
(嘉兴学院 数理与信息工程学院,浙江 嘉兴 314001)
摘 要:针对当前人脸特征点定位精度低、且当人脸图像存在较大姿态变化时不能在同一模型框架下实现任意姿
态人脸图像的面部特征点精确定位问题,提出基于级联形状回归的对姿态、遮挡都鲁棒的人脸特征点定位方法.
收稿日期:2018−05−21.
网址:/eng/article/2019/1008-973X/201907017.shtml
基金项目:浙江省自然科学基金资助项目(LY15F020039,LQ18F020006,LQ18F020007).
作者简介:桑高丽(1986−),女,讲师,从事模式识别相关的研究. /0000-0002-6567-1652. E-mail:g.sang@
第 53 卷第 7 期 2019 年 7 月
浙 江 大 学 学 报 (工学版)
Journal of Zhejiang University (Engineering Science)
DOI: 10.3785/j.issn.1008-973X.2019.07.017
Vol.53 No.7 Jul. 2019
第 7期
桑高丽, 等:基于级联形状回归的多视角人脸特征点定位[J]. 浙江大学学报:工学版, 2019, 53(7): 1374–1379.
1375
离,需要进一步的研究和提升. 针对姿态变化的人脸特征点定位方法大致可
ቤተ መጻሕፍቲ ባይዱ
为了提高定位的准确度,提出按姿态偏转造成的遮挡程度对人脸区域进行分块,针对每一块分别训练形状估计
回 归 器 ; 为 了 能 够 在 同 一 框 架 下 实 现 任 意 姿 态 人 脸 的 特 征 点 定 位 , 在 特 征 点 形 状 定 义 中 引 入 特 征 点 的 可 见 /不 可
见 属 性 ; 为 了 提 高 该 算 法 的 性 能 , 在 特 征 的 计 算 方 法 和 计 算 策 略 上 分 别 进 行 改 进 . 在 Multi-PIE、 AFLW、 COFW 和
SANG Gao-li, WANG Guo-bin, ZHU Rong, SONG Jia-jia
(Department of Mathematics and Information Engineering, Jiaxing University, Jiaxing 314001, China)
Abstract: A new cascade shape regression based facial landmark location method was proposed in order to improve the low landmark location accuracy and perform landmark location with large pose variations in a unified frame. The face area was divided according to the degree of occlusion in order to improve the accuracy of landmark location, and the shape regression was separately trained for each block. The visible/invisible attribute was introduced to the landmark's definition in order to locate the landmarks of any pose under the unified frame. The calculation and the strategy of feature extraction were improved in order to guarantee the performance of the proposed algorithm. The experimental results on the Multi-PIE, AFLW, COFW and 300-W databases show that the proposed method not only has strong robustness to pose and occlusion, but also achieves good results under other uncontrollable factors. Key words: landmark location; cascaded shape regression; regional division; visible/invisible attribute; multiview
作为人脸图像分析过程中的一个重要基础环 节,精准的人脸特征点定位对众多人脸的相关研 究和应用课题具有关键作用. 如何获取精准的人 脸特征点定位一直都是图像处理、计算机视觉、 模 式 识 别 以 及 人 机 交 互 等 领 域 的 研 究 热 点 问 题 [1].
姿态变化一直是人脸特征点定位所面临的经 典难题. 在实际应用中,尤其是实时采集人脸图 像同时受到姿态、光照、表情、遮挡等因素的共同 作用,人脸特征点的定位精度很难令人满意,现 有方法的精度距离实际应用的要求还有很大距
300-W 数据库上的实验结果表明,提出算法不但对姿态、遮挡具有很强的鲁棒性,而且在其他不可控因素影响下
取得很好的效果.
关键词: 特征点定位;级联形状回归;区域划分;可见/不可见属性;多视角
中图分类号: TP 391
文献标志码: A
文章编号: 1008−973X(2019)07−1374−06
Multi-view facial landmark location method based on cascade shape regression