中国计量学校文献综述

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中国计量学院现代科技学院毕业设计(论文)文献综述

学生姓名:吴鹏晖学号:0930333222专业:电子信息工程

班级:电信092

设计(论文)题目:

基于LVQ神经网络的人脸朝向识别算法研究指导教师:李向军

系:信息工程系

2013年1月3日

基于LVQ神经网络的人脸朝向识别算法研究

文献综述

一、人脸识别概述

人脸识别作为一个复杂的模式识别问题,近年来受到广泛的关注,识别领域的各种方法在这个问题上各显所长,而且发展出了许多新方法,大大丰富和拓展了模式识别方向。人脸识别、检测、跟踪、特征定位等技术近年来一直是研究的热点、人脸识别是人脸应用研究中重要的第一步,目的是从图像中分割出不包括背景的人脸区域。由于人脸形状的不规则性以及光线和背景条件多样性,现有的人脸研究算法都是在试图解决某些特定实验环境下的一些具体问题,对人脸识别位置和形状都有一定的要求。而在实际应用中,大量图像和视频源中人脸的位置,朝向和旋转角度都不是固定的,这就大大增加了人脸识别的难度。

在人脸识别领域的众多研究方向中,人脸朝向分析一直是一个少有人涉及的领域。在以往的研究中,一些研究者谈及了人脸朝向问题,但其实绝大多数都是希望在人脸识别过程中除去人脸水平旋转对识别过程的不良影响。但是,实际问题要复杂的多,人脸朝向是一个无法回避的问题。因此,对于人脸朝向的判断和识别,将会是一件非常有意义的工作。

人脸检测与识别技术是生物特征鉴别技术中研究最多和最热门的技术之一,它已经在身份认证、安全检查、罪犯查询、人机交互等广泛领域得到了初步应用。在人脸检测研究中,构建快速而精确的检测方法一直是该领域的研究热点;在人脸识别研究中,如何克服获取图像光线、表情、视角等变化的影响,提高识别率则是迫切需要研究的问题。针对这两个问题,本文以彩色和灰色正面人脸静态图像为研究对象,将模式识别理论和图像处理技术相结合,重点研究基于LVQ人工神经网络(ANN)的肤色像素检测和基于模板匹配的人脸精确检测方法,以及基于小波包分解(WPD)和(2D)2PCA的不同变化条件人脸图像的识别方法,为建立快速精确的人脸识别系统提供技术依据。

二、LVQ神经网络的介绍

LVQ(Learning Vector Quantization)即学习向量量化神经网络,属于前向神经网络类型,在模式识别和优化领域有着广泛的的应用。LVQ神经网络由三层组成,即输入层、隐含层和输出层,网络在输入层与隐含层间为完全连接,而在隐含层与输出层间为部分连接,每个输出层神经元与隐含层神经元的不同组相连接。隐含层和输出层神经元之间的连接权值固定为1。输入层和隐含层神经元间连接的权值建立参考矢量的分量(对每个隐含神经元指定一个参考矢量)。在网

络训练过程中,这些权值被修改。隐含层神经元(又称为Kohnen神经元)和输出神经元都具有二进制输出值。当某个输入模式被送至网络时,参考矢量最接近输入模式的隐含神经元因获得激发而赢得竞争,因而允许它产生一个“1”,而其它隐含层神经元都被迫产生“0”。与包含获胜神经元的隐含层神经元组相连接的输出神经元也发出“1”,而其它输出神经元均发出“0”。产生“1”的输出神经元给出输入模式的类,由此可见,每个输出神经元被用于表示不同的类。

LVQ神经网络是在监督状态下对竞争层进行训练的一种学习网络,它允许指定输入被分到那个类,竞争层将自动对输入进行分类。相比于其它网络,它能够以较少的计算量处理大量的输入数据。另外,虽然其结构简单,但却表现出比BP网络更强的有效性和鲁棒性。Mohammad指出LVQ神经网络具有高斯混合模型相似的分割效率和效果,而运算和实现却十分简单。因此,可以构建肤色和非肤色像素组,并利用这些像素来训练LVQ神经网络,然后使用训练成功的LVQ 网络实现输入图像中肤色像素的检测(分类)。目前,LVQ神经网络已经成功地应用于肤色检测[69,70]。

LVQ网络最早是由Kohonen提出的有导师学习的混合网络,其网络结构简单,如图所示,由输入层、隐竞争层和输出层组成。其中输入层与隐竞争层为竞争层,节点间为完全连接;隐竞争层与输出层为线性层,节点间为部分连接且权值固定为1。LVQ神经网络结构如图2所示。

LVQ神经网络结构图(图2)

LVQ网络隐竞争层的每个神经元通过学习原型向量对输入空间的区域进行分类,但它不是通过计算内积得到输入向量和权值向量中最接近者,而是通过直接计算距离的方法来模拟LVQ网络,从而向量无需规格化。当训练样本[x1,…,xn]输入网络时,计算其与隐层神经元之间的欧氏距离(Euclidean distance),具有最小距离的隐层神经元因获得激发而赢得竞争,于是产生“1”,其他则被迫产生“0”。在输出层,与隐层获胜神经元相连接的神经元也发出“1”,其他则被迫产生“0”。产生“1”的输出神经元给出输入模式的类,每个输出神经元被表示为不同的类,这样线性层将竞争层的分类结果映射到用户定义的目标分类上。

三、人脸识别功能模块

1、人脸捕获与跟踪功能

人脸捕获是指在一幅图像或视频流的一帧中检测出人像并将人像从背景中

分离出来,并自动地将其保存。人像跟踪是指利用人像捕获技术,当指定的人像在摄像头拍摄的范围内移动时自动地对其进行跟踪。

2、人脸识别比对

人脸识别分核实式和搜索式二种比对模式。核实式是对指将捕获得到的人像或是指定的人像与数据库中已登记的某一对像作比对核实确定其是否为同一人。搜索式的比对是指,从数据库中已登记的所有人像中搜索查找是否有指定的人像存在。

3、人脸的建模与检索

可以将登记入库的人像数据进行建模提取人脸的特征,并将其生成人脸模板(人脸特征文件)保存到数据库中。在进行人脸搜索时(搜索式),将指定的人像进行建模,再将其与数据库中的所有人的模板相比对识别,最终将根据所比对的相似值列出最相似的人员列表。

4、真人鉴别功能

系统可以识别得出摄像头前的人是一个真正的人还是一幅照片。以此杜绝使用者用照片作假。此项技术需要使用者作脸部表情的配合动作。

5、图像质量检测

图像质量的好坏直接影响到识别的效果,图像质量的检测功能能对即将进行比对的照片进行图像质量评估,并给出相应的建议值来辅助识别。

四、认识识别技术的应用与发展

人脸识别技术的应用可以分为两部分:执法应用和商业应用。人脸识别技术主要是在执法应用中使用,特别是照片相册(静态匹配)和视频监控(实时匹配的视频图像序列)。本商业应用范围从静态匹配照片上的信用卡,提款卡,护照,驾驶许可证,和照片的身份证实时匹配与静止图像或视频图像序列的存取控制。

相关文档
最新文档