一种更快捷的轻量级人脸识别模型
fastestdet训练

fastestdet训练介绍fastestdet是一个用于物体检测任务的模型,其目标是在给定一张图像的情况下,准确地检测和定位图像中的物体。
fastestdet的目标是实现最快的检测速度,同时保持较高的检测准确率。
本文将探讨fastestdet训练的相关内容,包括其实现原理、训练过程和应用领域等。
实现原理fastestdet基于深度学习的目标检测方法,其中最常用的是基于卷积神经网络(Convolutional Neural Network,CNN)的方法。
CNN是一种用于图像处理任务的深度学习模型,通过多层卷积和池化层提取图像的特征,并通过全连接层进行分类或回归。
fastestdet使用了一种轻量级的CNN架构,以达到更快的检测速度。
其核心思想是通过减少模型的计算复杂度和参数量来提高速度。
为此,fastestdet采用了以下几种策略:1.剪枝:通过对已训练好的模型进行参数剪枝,将参数量减少到最小。
这样可以减少模型的计算量,并且降低了模型在推理阶段的内存消耗。
2.蒸馏:使用蒸馏技术将大型模型的知识传递给小型模型,从而提高小型模型的性能。
这样可以在保持速度的同时,不显著降低模型的准确率。
3.混合精度训练:使用混合精度训练技术,将模型的参数在训练过程中以低精度进行计算,并最终以高精度进行更新。
这样可以减少内存带宽和算力的需求,进一步提高训练速度。
训练过程fastestdet的训练过程主要包括数据准备、模型选择、超参数设置和模型训练等步骤。
1.数据准备:为了训练fastestdet模型,需要准备一组包含物体标注信息的图像数据集。
这些标注信息一般包括物体的类别和边界框的位置。
为了提高训练效果,可以使用数据增强技术对图像进行随机变换,如缩放、平移和翻转等操作。
2.模型选择:根据任务的需求和计算资源的限制,选择适合的fastestdet模型。
fastestdet提供了多种模型架构,可以根据需要选择对应的模型。
人脸识别技术的算法模型

人脸识别技术的算法模型人脸识别技术是计算机视觉领域中的一道难题,主要任务是通过数字图像或视频中的人脸来确认其身份。
目前,该技术已经成为了许多领域的关键工具,如边境管理、视频监控、金融服务等。
其应用领域的广阔和市场潜力的巨大,让人脸识别技术受到了越来越多的关注和研究。
那么人脸识别技术的算法模型是怎样的呢?一、人脸检测模型人脸识别的第一步是人脸检测。
其目的是从背景中准确确定人脸的位置。
常用的人脸检测方法包括Haar检测器、基于区域的CNN(R-CNN)、YOLO(You Only Look Once)等。
Haar检测器是基于Haar特征的一种传统的人脸检测模型。
它先将图像分成不同的区域并计算出每个区域内的Haar特征值,再通过AdaBoost算法进行分类,最后使用级联分类器对人脸进行检测。
R-CNN是在2014年提出的一种发现物体的方式,它需要在大量图像中共同学习目标物体的检测和分类。
该方法使用了区域建议网络(RPN)来生成可能的物体位置区域,然后再对这些区域进行分类。
YOLO是一种全新的目标检测算法,其优点是速度快,准确率高且可以检测多个物体。
该模型将图像分为多个格子,并对每个格子使用卷积神经网络进行分类和回归,最后再通过非极大值抑制来排除重叠的检测框。
人脸对齐模型的目的是将检测到的人脸对齐,以便在后续的特征提取过程中提高准确性。
常见的对齐方法包括在人脸上标记关键点(即人脸特征点)和基于三维模型的人脸对准方法。
基于关键点的对齐方法目前是最常用和最有效的方法之一。
该方法通过在人脸上标记多个关键点来确定人脸的几何形状,然后将脸部旋转、缩放和平移等变换以进行对齐。
人脸特征提取是人脸识别的核心过程,这是由于人脸图像所包含的信息太多太杂,而且不同人之间的面部特点也具有很强的差异性。
人脸识别模型的目的是提取出鲁棒性、代表性和可重复性强的特征来。
常见的模型包括Eigenface、Fisherface、LBPH(Local Binary Patterns Histograms)、DeepFace、VGGFace等。
深兰科技DBFace,被《机器之心》扒出来的“轻量级高精度人脸检测模型”

上周末,一篇题为《模型仅有7M:轻量级高精度人脸识别方法DBFace》的文章在国内头部的专业人工智能媒体《机器之心》上首发,并被高度评价“这个仅7M大小的人脸识别模型几乎识别出了世界最大自拍照中的所有人像!”。
随后又被新浪科技、CSDN、机器学习研究会等多家科技/垂直类(自)媒体进行了转载。
对DBFace这个名字,业内人士不难联想到人工智能头部企业深兰科技(DeepBlue)。
果不其然,这个模型的创建者,正是来自深兰科技下属深兰科学院算法研究所的两位“高手”——Libia和Wish。
据了解,该模型起初只是被放在了Github上,没想到被《机器之心》扒了出来,而且短短3天时间,这个开源的模型就新增了超400次使用。
今天就跟随这两位算法大咖一起来看看DBFace是如何诞生的1. 网络选择DBFace的初衷是设计成一款轻量级的人脸检测器,能够在边缘计算上有效的使用,而疫情时期的特殊需求,也使得对于hard类(例如戴上口罩)人脸检测势在必行。
因为CenterNet具有后处理的简洁高效性,以及对小目标友好等特点,在综合性能和速度的考虑下,我们选择了CenterNet结构做检测任务,采用MoblienetV3做Backbone。
相较于MobilenetV2,MobilenetV3在其基础上新增了 SE 、Hard-Swish Activation等模块,在兼顾Infernce速度的同时提升网络性能。
结构如下:对于任务头的设计,我们引入了SSH的DetectModule和ContextModule,经实验验证该模块能有效的提升DBFace算法的检出性能。
对于上采样设计,我们采用Upsample+Conv+Act的方式,避免使用反卷积造成可能的锯齿问题。
2. Loss定义整个网络由三部分Loss组成:热力图(HeatMap)损失, 位置坐标偏移量(BoundingBox)损失,关键点(Landmark)损失。
2.1 HeatMap 损失:Focal LossFocal loss,该损失函数是在标准交叉熵损失基础上修改得到的。
Emfacenet:一种轻量级人脸识别的卷积神经网络

Emfacenet:一种轻量级人脸识别的卷积神经网络
武文娟;李勇
【期刊名称】《小型微型计算机系统》
【年(卷),期】2023(44)3
【摘要】随着计算机技术日益发展,计算机视觉逐渐融入人们的生活,深度卷积神经网络在计算机视觉领域得到了广泛的应用.然而计算资源和内存的限制,为卷积神经网络在嵌入式设备的部署带来了巨大的困难.本文提出了一种新的轻量级的人脸识别的卷积神经网络——Emfacenet,通过在CASIA-WebFace数据集上进行卷积神经网络的训练,并在计算机CPU平台以及嵌入式平台上利用LFW数据集对模型的预测效果分别进行测试,Emfacenet在CPU平台下识别速度分别是Resnet50、Mobilenetv3以及Mobilefacenets这3种模型的2.07倍、1.67倍、1.63倍,在嵌入式平台下识别速度分别56.65倍、2.09倍、3.41倍.而且Emfacenet卷积神经网络模型大小仅为138.1KB,保持较高精度的同时运行效率显著提高,可以适用于嵌入式等硬件资源受限领域来实现人脸识别.
【总页数】5页(P560-564)
【作者】武文娟;李勇
【作者单位】国防科技大学计算机学院
【正文语种】中文
【中图分类】TP183
【相关文献】
1.基于轻量级卷积神经网络的人脸识别方法
2.一种新的高效轻量级卷积神经网络模型
3.一种轻量级的卷积神经网络的行人检测方法
4.基于轻量级卷积神经网络人脸识别算法的研究与应用
5.基于一种轻量级卷积神经网络的植物叶片图像识别研究
因版权原因,仅展示原文概要,查看原文内容请购买。
轻量级卷积神经网络在人脸识别中的应用研究

轻量级卷积神经网络在人脸识别中的应用研究随着科技的不断发展,人工智能技术已经广泛应用于各行各业,其中人脸识别技术受到了广泛的关注。
随着智能手机、智能门禁等场合的普及,人脸识别技术已经被广泛应用到了日常生活中。
当然,除了家庭和公共场合,人脸识别技术还被广泛应用于安保、司法、医疗等诸多领域。
在人脸识别技术的应用过程中,卷积神经网络(CNN)是其中最常用的模型之一。
CNN通过对图像进行卷积操作来提取图像的特征信息,进而进行分类和识别。
然而,由于CNN模型具有较大的尺寸和参数,这就导致了其在计算和存储方面的不足。
因此,轻量级卷积神经网络(LCNN)应运而生。
轻量级卷积神经网络(LCNN)是一种简化了卷积操作的模型,其可以显著减少CNN的计算量和存储容量。
LCNN模型将图像分为非重叠的小块,然后将制定的卷积核应用于这些块上。
这种方法提高了计算效率,使得模型更适用于移动端及嵌入式设备等资源有限的环境中。
在人脸识别中,LCNN模型可以大大提高识别的速度和准确性。
人脸图像经常是较小和稀疏的,当使用LCNN模型时,可以更容易地将大型CNN模型优化为小型网络,从而提高计算效率和准确性。
同时,LCNN模型可以使用更少的内存,更快的速度和更少的能耗来实现人脸识别。
因此,在人脸识别领域中,LCNN模型被广泛应用。
除了与传统卷积神经网络相比具有更高的效率和更快的速度之外,LCNN模型还具有其它优势。
例如,LCNN模型可以使用交叉熵损失函数,这种损失可帮助提高网络的准确性。
此外,LCNN模型还可以使用基于深度学习的人脸识别技术,例如FaceNet和DeepFace等。
这些技术可以将图像提取到向量空间中,并计算图像之间的相似性。
这些向量可以用于比较两个面孔,并确定它们是否属于同一人。
这就使得LCNN模型在人脸识别领域拥有了更高的准确性和更广泛的应用能力。
然而,虽然LCNN模型在人脸识别中的应用有着广泛的前景和应用前景,但在实践中仍存在一些问题。
一种快速人脸定位算法

一种快速人脸定位算法人脸定位是计算机视觉领域中的一个重要任务,广泛应用于人脸识别、人脸表情分析、人脸检测等多个领域。
快速人脸定位算法就是指在保证准确率的前提下,能够在短时间内对图像中的人脸进行定位的算法。
目前,快速人脸定位算法主要有以下几种:1. Haar特征及级联检测器Haar特征是一种基于图像亮度差异的特征,通过计算图像中各个区域的亮度和,可以快速判断是否存在人脸。
级联检测器是一种级联的分类器,可以快速过滤掉图像中明显不是人脸的区域,从而提高定位速度。
这种方法的优势在于速度快,但对于光照变化、旋转、遮挡等情况的适应性相对较差。
2.基于特征点的人脸定位这种方法首先在训练集中标注人脸的关键特征点,如眼睛、鼻子、嘴巴等,然后通过计算待定位图像中的特征点位置来进行人脸定位。
这种方法的优势在于能够对光照变化、旋转等情况具有较好的适应性,但相对于Haar特征方法来说速度会稍慢一些。
3.深度学习方法近年来,深度学习方法在人脸定位领域取得了巨大的突破。
通过使用卷积神经网络等深度学习结构,可以直接从图像中学习到人脸的特征表示,从而实现准确率和速度的双重提升。
深度学习方法的优势在于可以自动学习特征,适应性较好,但需要较大的训练集和计算资源。
以上是一些常见的快速人脸定位算法,不同算法在准确率和速度上有所权衡。
根据具体应用场景的需求,可以选择合适的算法。
此外,人脸定位算法的性能还受到图像质量、人脸姿态、光照条件、遮挡等因素的影响,需要综合考虑各种因素来选择最合适的算法。
在实际应用中,也可以采用多种算法进行融合,以进一步提高人脸定位的准确率和速度。
一种轻量级人脸识别在线测试平台的设计

第19卷第4期广东交通职业技术学院学报V ol.19No.42020年12月JOURNAL OF GUANG DONG COMMUNICATIONPOLYTECHNICDecember 2020收稿日期:2020-04-30作者简介:张景文,高级讲师,硕士研究方向:移动开发近年来,人工智能应用得到各国的重视,其发展迅速。
深度学习、人机交互、智能识别、学习分析等人工智能技术正持续不断地融入教育领域的各个方面[1]。
人脸识别技术是AI 的重要组成,具有高精度、识别速度快,技术具备高并发、高吞吐、低时延等优势,成效得到许多应用考验,例如在软件登录、手机解锁、门禁进出、移动支付等各种场景。
建设基于人脸识别和互联网+的在线教学平台,使用稳定和准确技术手段的人脸识别用于人员识别管理,通过人脸识别功能保证学员身份真实性,避免远程教学平台监管不严而导致顶替现象,有利于维护线上教学与测试公平性。
1技术原理与特点1.1主要原理人脸识别是人工智能技术中的关键技术之一,它的技术原理是对来源于图片或视频的人脸信息的收集和比对,包括人脸检测定位、人脸特征提取和人脸识别比对3个过程。
可应用人脸识别和认证、人脸检索、人脸美化、脸部特效、照片管理等应用[2]。
为了实现人脸识别功能,本研究选用了“腾讯云”人工智能接口中人脸识别功能,基于腾讯文章编号:1671-8496-(2020)-04-0052-04一种轻量级人脸识别在线测试平台的设计张景文(东莞理工学校,广东东莞523000)摘要:随着人工智能技术迅速发展,在工作和生活场景使用人工智能技术越来越多。
目前采取人工智能、大数据和VR 等新技术提升学生管理和课堂教学环境是教育行业发展的新热点。
下文论述了应用腾讯云人脸识别API 实现学生身份核实的线上考试的实现思路。
它基于微信小程序开发环境,具有开发简易、布置方便和识别精准等优势,可以为教育工作者进一步提升线上考试的内涵提供参考。
关键词:人工智能;人脸识别;小程序;在线考试中图分类号:TP18文献标识码:AThe Designing of A Lightweight Facial Recognition Online TestPlatformZHANG Jing-wen(Dongguan Science and Technology School,Dongguan,Guangdong 523000,China)Abstract:With the rapid development of artificial intelligence (AI),more and more AI technologies are employed in both work and life areas.It is a novel hot spot that AI,big data,VR,.etc.are being gradually applied into the field of enhancing the management of students and the teaching environment.This paper discusses the application of Ten-cent Cloud facial recognition API to realize students 'identification on the platform of online tests.It is based on the developing environment of wechat mini program,featuring the simple development,convenient deployment and ac-curate identification so that it can offer valuable reference for education workers to further improve the contents of online tests.Key words:AI;facial recognition;mini program;online tests基金项目:2019年度广东省教育技术中心教育信息化应用融合创新课题“基于供给与需求侧改革理念的中职教学资源建设与实践”(项目编号:19JX06241)第4期张景文:一种轻量级人脸识别在线测试平台的设计优图领先的面部分析技术,它提供分析技术包括人脸检测与分析、人员查重、活体检测等多种功能,支持API和离线SDK两种接入方式。
一种轻量级人脸识别模型的训练方法及装置[发明专利]
![一种轻量级人脸识别模型的训练方法及装置[发明专利]](https://img.taocdn.com/s3/m/ecc5831330126edb6f1aff00bed5b9f3f90f72be.png)
专利名称:一种轻量级人脸识别模型的训练方法及装置专利类型:发明专利
发明人:汪厚峄,霍帅,易甜,南楠,王晓明,彭刚
申请号:CN202010825578.6
申请日:20200817
公开号:CN114078268A
公开日:
20220222
专利内容由知识产权出版社提供
摘要:本发明公开了一种轻量级人脸识别模型的训练方法及装置,该方法包括将样本数据输入轻量级人脸识别模型中进行训练,得到训练后的识别模型,基于注意力模型对训练后的识别模型执行池化卷积操作,得到二维空间注意力人脸特征图;对训练后的识别模型包括的人脸特征图与二维空间注意力人脸特征图执行逐元素操作,得到三维空间注意力人脸特征图,池化三维空间注意力人脸特征图,得到一维通道注意力人脸特征图;对三维空间注意力人脸特征图与一维通道注意力人脸特征图执行逐通道操作,得到人脸识别模型。
可见,本发明能够使得轻量级人脸识别模型自适应地对复杂场景中的图像特征进行细化,提高该模型的鲁棒性,从而有利于获取到精度高的人脸识别结果。
申请人:珠海全志科技股份有限公司
地址:519000 广东省珠海市高新区唐家湾镇科技二路9号
国籍:CN
代理机构:广州三环专利商标代理有限公司
更多信息请下载全文后查看。
基于深度学习的轻量级人脸检测模型研究

4.1 系统设计
针对人脸识别所对应的各种外部环境,把深度学习算法融 入其中,设计出基于深度学习的轻量级人脸检测算法模型。本 系统具有功能扩展性、稳定性、高效性等特点,整个系统的功 能设计内容如下。
(1) 节目管理模块。该模块功能主要用于节目的日常管 理,如节目编辑、数据保存、输入输出管理等,对待检节目进 行实时监测,并保存相关的监测信息,对节目进行识别并做好 标记与分段,有效存储人脸识别的特征信息。
2.4 数据集
基于深度学习的轻量级人脸检测模型一般都要通过大数据 技术的积极配合,有些数据可通过外界或其他途径获取,如可 以通过互联网、监控视频、个人证件、生活照片等方式获取, 由于这些数据格式千差万别,需要分别进行数据转换才能使 用,且转换过程必须按同一标准进行。在进行深度学习人脸检 测模型研究中,要求对人脸数据建立一个数据集,并且对这些 数据进行大数据分析,本文主要应用两种数据集,一种是 CASIA-WebFace,另一种是 UMDfaces,为网络训练做预 先的准备,这样可提高人脸检测的准确性。
2.2 词汇表达与分类训练
如果在人脸特征提取过程中出现滞后现象,可采用聚合 方式进行处理,即采用视觉词汇表达的方式进行,整个过程 把人脸特征用视觉词汇先表达出来,把词汇集存储在指定的 库中,并建立相应的词汇图,该项流程完成后,每台设备进 行深度学习的目标可以实现。首先通过分类器对设备进行训 练,然后用测试集测试设备的训练程度,目前大多采用多层 传感器解决分类问题,系统的神经网络采用梯度算法,可解 决无法识别线性数据的问题,使识别范围进一步扩大。同时, 用于识别的设备还可通过反向传播算法精准地统计出整个神 经系统中神经元的实时数量,可进一步改进整个系统,提升 系统的工作效率。
NCA-MobileNet:一种轻量化人脸表情识别方法

NCA-MobileNet:一种轻量化人脸表情识别方法
左义海;白武尚;何秋生
【期刊名称】《液晶与显示》
【年(卷),期】2024(39)4
【摘要】针对目前人脸面部表情识别方法存在参数量多、计算资源消耗大和识别精度低的问题,提出了一种基于条件协调注意力机制的轻量化人脸面部表情识别方法。
首先,对MobileNet V3网络层数进行缩减,同时将倒残差结构中间通道数和输出通道数增大至原来的1.5~3.2倍,使用Mish代替Hardswish激活函数,实现特征提取后的非线性化。
其次,引入改进的协调注意力机制,在张量信息嵌入中沿水平和竖直方向依次通过最大池化和平均池化进行编码,并通过张量信息集成产生具有全局感受野和精确位置信息特征,提取面部表情在空间和通道位置上的详细信息。
最后,在公开数据集FERPlus和RAF-DB上进行实验,结果表明所提方法参数量降低15.91%,准确率分别为88.84%和85.90%,比改进前模型准确率分别提升0.83%和1.39%。
该方法具有良好的识别性能,验证了所提方法的有效性。
【总页数】10页(P522-531)
【作者】左义海;白武尚;何秋生
【作者单位】太原工业学院工程训练中心;太原科技大学电子信息工程学院
【正文语种】中文
【中图分类】TP391.4
【相关文献】
1.一种基于卷积神经网络的人脸表情自动识别方法
2.一种基于改进的卷积神经网络的人脸表情识别方法
3.一种基于面部纹理特征融合的人脸表情识别方法
4.黑龙江省企业在技术创新中存在的问题及对策分析
5.论温经通脉汤治疗动脉硬化闭塞症的临床价值分析
因版权原因,仅展示原文概要,查看原文内容请购买。
一种轻量级人脸追踪与识别系统设计方案

一种轻量级人脸追踪与识别系统设计方案
车佳祺;许晓荣;梁颢铭
【期刊名称】《电子设计工程》
【年(卷),期】2022(30)14
【摘要】为了解决在计算与存储资源受限的嵌入式设备中实现人脸追踪与识别的问题,设计了一种基于Maixduino AI K210开发板的YOLOX-Nano与MobileFaceNet轻量级人脸追踪和识别系统方案。
将输入图像的长宽缩减至原来的7/13,使YOLOX-Nano运算量从1.08 GFLOPS缩减到0.31 GFLOPS,将MobileFaceNet网络的激活函数替换为Maixduino AI K210开发板KPU支持的LeakyRelu算子。
通过将图像输入缩减后的YOLOX-Nano得到人脸的定位,并将定位信息转化成角度发送给舵机,舵机转动使人脸始终保持在图像中心位置。
通过改进后的MobileFaceNet网络进行人脸识别,实现人脸追踪与识别。
通过设计多种实际情形进行实验,验证了该系统在实际使用时具有较好的稳定性和准确性。
【总页数】6页(P58-63)
【作者】车佳祺;许晓荣;梁颢铭
【作者单位】杭州电子科技大学通信工程学院
【正文语种】中文
【中图分类】TN919.8
【相关文献】
1.轻量级智能终端人脸识别系统研究与实现
2.人脸自动追踪与识别系统的设计与实现
3.城市轨道交通公安人脸识别系统设计方案研究
4.城市轨道交通公安人脸识别系统设计方案研究
5.基于轻量级网络的人脸识别系统
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Computer Science and Application 计算机科学与应用, 2020, 10(4), 659-664Published Online April 2020 in Hans. /journal/csahttps:///10.12677/csa.2020.104068A Faster Lightweight Face RecognitionModelShuai Peng1, Hongbo Huang1,2, Weijun Chen1, Shuwen Pan1,21Computer School, Beijing Information Science and Technology University, Beijing2Institute of Computing Intelligence, Beijing Information Science and Technology University, BeijingReceived: Mar. 23rd, 2020; accepted: Apr. 7th, 2020; published: Apr. 14th, 2020AbstractWith the development and application of deep learning-based approaches, face recognition algo-rithms have already been used on devices with sufficient computing resources and achieved high accuracy and fast speed. Face recognition models based on deep learning have better recognition accuracy, but requiring a large amount of computing resources. Aiming to this problem, this paper designs a model called Lite-Inception-ResNet, which is a lightweight network model based on deep learning algorithms and requires much fewer computing resources. The proposed model is based on the Inception-ResNet model and improved in network architecture and activation functions.Experiments on VGGFace2 and LFW show that the Lite-Inception-ResNet model can reduce the amount of parameters by 88.2% and the amount of calculation by 76.5% with only a 0.1% accura-cy reduction, making the model more suitable for devices with less computing resources.KeywordsDeep Learning, Face Recognition, Lightweight一种更快捷的轻量级人脸识别模型彭帅1,黄宏博1,2,陈伟骏1,潘淑文1,21北京信息科技大学计算机学院,北京2北京信息科技大学计算智能研究所,北京收稿日期:2020年3月23日;录用日期:2020年4月7日;发布日期:2020年4月14日摘要随着基于深度学习的人脸识别算法的发展和应用,人脸识别算法已经可以运用在计算资源充足的设备上彭帅等并取得很高的精度和较快的速度,但是在计算资源受限设备上的应用有诸多困难。
基于深度学习的人脸识别模型有着更好的识别精度,但是大多数基于深度学习的模型均需要大量的计算资源来支持运行。
本文针对这一问题,设计出一个占用少量计算资源的基于深度学习算法的轻量级网络模型Lite-Inception-ResNet,该模型基于具有良好性能的Inception-ResNet模型,在保持原模型良好性能的基础上对卷积核和网络架构进行了优化和重新设计,并选用了性能更好的激活函数。
在VGGFace2和LFW 上的实验表明,新模型可以在LFW数据集上仅降低0.1%正确率的情况下减少88.2%的参数量和76.5%的计算量,使该模型可以较好地应用于计算资源较少的设备上。
关键词深度学习,人脸识别,轻量级Copyright © 2020 by author(s) and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License (CC BY 4.0)./licenses/by/4.0/1. 引言近年来,随着深度学习的发展,基于深度学习的人脸识别方法在现实中得到了广泛的应用。
尤其在公共安全、智慧城市和金融交易等方面,对人脸识别技术的需求与日俱增。
当前基于深度学习的人脸识别算法在精度上已经可以满足各类需求,但是其需要用到的计算量是非常大的,对运用的计算设备有着较高的需求,尤其高精确度的人脸识别模型通常需要用到大型的并行运算设备,这对于将模型迁移到计算资源少的小型设备上是一种挑战。
因此,如何减少模型消耗的计算成本,设计出在计算资源少的小型设备上能高效运行的轻量级网络模型,已经成为进一步研究的热点之一。
轻量级网络模型吸引了大量研究人员的关注,目前已经取得不少的研究成果,如通过裁切、压缩和编码来降低网络模型的参数量和计算量的方法[1]。
另有一些工作如MobileNet [2]和ShuffleNet [3]等则通过重新设计网络结构,引入逐通道卷积和逐点卷积等方式来降低参数量。
这些模型在降低参数量和计算量的同时,其识别率等性能也下降明显,使得如何在轻量级网络模型的性能和计算复杂度之间取得恰当的均衡成为一个新问题。
本文针对这一问题,提出一个以大型网络架构Inception-ResNet [4]为基础,在识别率几乎没有下降的情况下优化出的一个轻量级网络模型Lite-Inception-ResNet,在性能和计算量之间取得了更好的平衡。
2. 相关研究与方法基础2.1. 人脸识别相关进展近几年,基于卷积神经网络的方法已经成为人脸识别的主流方法,其主要分为两条研究路线,一条是对于网络架构进行改进的方法[5][6],通过改进网络结构来提升模型的性能和速度。
另一条是对损失函数进行改进的方法[7][8][9],通过改进损失函数来增强网络在大规模人脸识别上的区分度。
随着模型在精度上的不断提升,为了使网络结构能更好的运用于小型设备上,对于轻量级网络结构的研究[2][3]也与日俱增。
2.2. Inception-ResNet架构Inception-resnet是由Google提出的一个卷积神经网络架构,其有v1和v2两个版本,该网络架构由彭帅等几个简单的卷积层、下采样层和几十个Inception-resnet模块所组成。
Inception-resnet模块的设计思路源于GoogLeNet [10]中的Inception模块和ResNet [11]中的残差思想,每个Inception-resnet模块均由一个Inception模块和残差直连组成。
Inception模块可以从特征图里获取到不同尺度的特征信息,残差思想则可以保留下更多前几层网络所获取到的特征信息,并使网络得以训练的更深。
结合了Inception模块和残差思想的Inception-resnet模块可以使整体网络拥有更为优秀的特征提取能力。
2.3. PReLUPReLU [12]是由何恺明等人提出的一种可以被训练的激活函数,其设计思路源于LeakyReLU [13]。
常用的激活函数ReLU是将特征图中的所有负值置于零,这可能会使特征图损失部分提取出的特征信息。
LeakyReLU则是将特征图中的所有负值乘上同一个固定的常数α,这样既能起到非线性的作用,同时减少特征图的信息损失。
PReLU则是更进一步将这个α设置为可训练参数,这样使得网络拥有更好的可训练性。
由于Leaky ReLU和PReLU均是只增加一个参数,所以如果将常用激活函数ReLU改进为Leaky ReLU或是PReLU,则可以更好的发挥网络在特征提取上的性能,而增加的参数量和计算量是近乎忽略不计的。
3. 网络架构设计本文以Inception-ResNet v2为基础网络架构,设计出一个参数量远比Inception-ResNet v2少的网络结构Lite-Inception-ResNet。
Inception-Resnet v2网络结构由一个基础模块和四十个Inception-Resnet模块还有两个下采样Inception模块所组成,其中基础模块由几个卷积层和池化层组成,下采样Inception模块则是包含了下采样操作的Inception模块。
本文提出的Lite-Inception-ResNet则是在此基础之上适当减少参数量并将使用的Inception-Resnet模块数减少到了十三个。
Lite-Inception-ResNet的网络架构如表1所示。
在模型的参数总量上,Inception-ResNet v2有55 M的参数量,而Lite-Inception-ResNet缩减到了6.5 M的参数量,在总参数量上有8.4倍的缩减。
Table 1. The network architecture of Lite-Inception-ResNet表1. Lite-Inception-ResNet的网络架构输出特征图的大小网络层大小步长补边79 × 79 × 64 卷积7 × 7, 64 2 否39 × 39 × 64 最大池化 3 × 3 2 否39 × 39 × 48 卷积 1 × 1, 48 1 是39 × 39 × 128 卷积 3 × 3, 128 1 是19 × 19 × 128 最大池化 3 × 3 2 否19 × 19 × 96 卷积 1 × 1, 96 1 是19 × 19 × 256 卷积 3 × 3, 256 1 是19 × 19 × 256 简化的Inception-Resnet a 模块× 49 × 9 × 512 简化的下采样Inception a模块9 × 9 × 512 简化的Inception-Resnet b 模块× 54 × 4 × 1024 简化的下采样Inception b模块4 × 4 × 1024 简化的Inception-Resnet c 模块× 41 × 1 × 1024 全局池化+ 特征图平铺512 全连接层512彭帅等为进一步优化模型的性能,在经过详细对比实验的基础上,本文提出在Lite-Inception-ResNet中使用PReLU激活函数替换Inception-ResNet模型的ReLU激活函数。