基于对称变换的人脸图像眼睛定位方法
人脸识别技术中的人脸对齐算法
人脸识别技术中的人脸对齐算法最近,随着人脸识别技术的不断发展和普及,越来越多的场合开始使用该技术来进行身份验证、门禁管理等需求。
而在实际应用中,人脸对齐算法是人脸识别技术的核心之一。
本文将介绍人脸对齐算法的基本原理和现有的应用。
一、什么是人脸对齐算法?人脸对齐是人脸识别技术的核心步骤之一,它指的是将人脸图像中的人脸区域对齐到同一个标准位置。
这个标准位置通常是一个确定的位置,比如眼睛、鼻子、嘴巴的中心位置。
利用人脸对齐技术,可以消除人脸图像中的旋转、缩放和位移等变化,使得后续的人脸特征提取和匹配更加准确。
二、人脸对齐算法的基本原理人脸对齐算法通常分为两个步骤:关键点定位和仿射变换。
关键点定位是指在人脸图像中提取出几个关键点,比如眼睛、鼻子、嘴巴等,来描述人脸区域的位置和姿态。
关键点定位通常使用深度学习模型来实现,比如人脸检测模型或关键点检测模型。
这些模型利用深度学习的方法,通过训练大量的人脸图像数据,从而对人脸的关键点进行准确的定位。
仿射变换是指通过一些数学方法,将人脸图像中的人脸区域映射到一个标准的位置和姿态。
仿射变换通常包括平移、旋转、缩放等变换操作,可以通过一些线性代数的方法来实现。
具体来说,可以通过计算人脸关键点之间的距离和角度,来确定一个变换矩阵,然后利用该矩阵对人脸图像进行变换,从而实现人脸对齐。
三、人脸对齐算法的应用人脸对齐算法在人脸识别技术中有着广泛的应用。
首先,在人脸检测和识别中,通常需要先对人脸进行对齐处理,以消除不同摄像头、光照和姿态等对人脸图像的影响,从而提高人脸识别的准确率。
其次,在身份验证和门禁管理中,也可以利用人脸对齐技术进行人脸比对,实现自动化的身份认证和门禁管理。
除了以上应用,人脸对齐算法还有着其他的应用,比如表情识别、虚拟化妆、人脸变形等。
在表情识别中,通过将图像中的人脸对齐到一个标准位置,可以更好地提取表情特征,从而实现更准确的表情识别。
在虚拟化妆和人脸变形中,也需要对人脸进行对齐处理,以确保虚拟化妆效果和变形效果的准确性。
基于人脸识别中眼睛定位的算法
% 二值化
o : f r 1r w o
fr= : l4 o I o j c-
首 先 求 的 图 像 的 直 方 图 .并 采 用 15的 窗 1进 行 均 = I
ini) ((,1 3 ) f ( >T11) 7 , j + a( ) 1 1 : ; i
系 统 等 领 域 有 着 广 泛 的 应 用 前 景 『 在 人 脸 识 别 中 . 响 1 I 影 人 脸识别 率高 低 的重要 因素 之一 是 眼睛 的精确 定位 目 前 人脸识 别 常用方 法大 致 分为 基于几 何特 征 、基 于代数 特 征 的 识 别 和 基 本 神 经 网 络 的 识 别 方 法 1 近 年 来 , 究 2 1 。 研 眼 睛 定 位 算 法 较 多 . 要 有 区 域 分 割 法 [ 灰 度 投 影 法 1、 主 3 1 、 4 1 边 缘 提 取 法 [ 统 计 学 习 法 [ . 域 分 割 法 首 先 对 人 脸 的 5 1 、 6 区 1 等
交 互 系 统 等 领 域 。 睛 定 位 是 人 脸 识 别 中一 个 重 要 的 信 息 , 文 根 据 人 脸 中眼 睛 的 灰 度 及 形 状 信 息 , 出 了一 眼 本 提
种 新 的眼睛定 位算 法。 实验 结果表 明此算 法具有 较好 的准 确性和 可行 性。
关 键 词 : 脸 识 别 ; 睛 定 位 ; 法 人 眼 算 中图分类 号 :P 9 T 3
f r i :o o =lr w
fr= : l4 o 1 o j c-
上 述 方 法 都 取 得 了 一 定 的 成 功 . 普 遍 存 在 收 敛 速 度 但
结合人脸特征和改进的积分投影的眼睛定位方法
第3 3卷第 6期
E 正C R0N C E I T I NGI E NE R
Vo . 3 N . 13 o 6
Jn 07 u .2 0
结 合 人 脸特 征 和改进 的积 分 投 影 的眼 睛定 位 方 法
最 大类 间方差 阈值 分割 法的二值 化 处理和 数 学形 态 学的 开运 算 处理 ; 次 , 选人 脸 区域 ; 其 框 最后 , 据 根
人脸 特征 间的 几何 关 系先 缩 小眼睛 区域 的搜 索范 围 , 分 别框 选 出左右 人 眼 区域 , 利 用 改进 的积 分 并 再
投影及其统计数据的峰值位置分别确定左右眼球 的中心位置, 然后输 出眼睛定位的结果。实验表 明, 该方法具有很 高的精度 , 对不同角度和不同方向的倾斜人脸 、 脸部表情及姿势变化等具有很好的鲁棒
性。
关键词 : 睛定位 ; 眼 人脸 特征 ; 分投 影 ; 选人脸 ; 积 框 二值 化 ; 开运 算
中 图分 类 号 :N 1 . 3 T 9 17
0 引
言
在整个 头高 中所 占的 比例有 所 增 加 , 一 般不 会 超 过 但 头高 的 348。因此 , /l J 只要得 到 了人脸 边 界 , 就可 以利
用 的投影 函数 是 在 现 有 的 积分 投 影 函数 基 础 上 的改
进: 在二值图像的基础上分别统计每行 、 每列中包含的
黑 点或 白点 的数 目。因此 , 影 函数 变得 非常 简单 , 投 大 大减少 了计算 量 , 而有 效地 提高 了计算 速度 。 从
.
51 -
维普资讯
( pn g 操作 , O ei ) n 即
o e ( ) =D( X) pn X E( )
基于轮廓检测的眼睛定位方法
47河南科技2010.4下1 引言人脸识别在保密系统、可视电话系统以及人机交互系统等领域有着广泛的应用前景。
眼睛作为人脸的重要特征,在人脸检测和识别中都发挥着重要的作用。
目前人脸识别常用方法大致分为基于几何特征、基于代数特征的识别和基本神经网络的识别方法。
近年来,研究眼睛定位算法较多,主要有区域分割法、灰度投影法等,区域分割法首先对人脸的二值图像进行区域分割, 然后设定一系列经验值和支持函数定位眼睛; 灰度投影法对人脸图像进行水平和垂直方向的投影,根据波峰、波谷的分布信息来定位眼睛;边缘提取法首先对人脸图像进行边缘提取, 然后用霍夫变换检测眼球,构造一个眼部模板,用一系列函数从能量角度找出眼睛;统计学习法将人眼区域看作一类模式,使用大量不同条件下的人眼与非人眼样本, 借助统计分析理论和机器学习方法提取人眼共有的一些特征, 实现人眼检测。
上述方法都取得了一定的成功,但普遍存在收敛速度慢、计算量大、定位不够准确等缺陷。
本算法根据眼睛的两大结构特征:①在人脸中具有对称性;②其灰度值集中在某个区域,提出了一种结合人脸中眼睛的灰度及面积信息的人眼定位新算法,并具体实现。
二、眼睛定位算法描述1. 滤除噪声通过摄像头得到的图像中,一般含有一定的噪声,为了在后面的眼睛定位中得到更好的效果,在一开始,使用了canny滤波,滤除了一定的噪声。
2. 基于整个图像的灰度值对图像进行二值化图像二值化的目的是使眼部区域凸显出来,而图像二值化处理的关键是阈值的选择,阈值选择的原则是选择和眼睛较为接近的灰度值,本文选择一种可变的阈值。
如果将整幅灰度图像的灰度值从大到小排成数列:}....,.........,,,.........,,{21021,N N N N T T T T T T T T +−+−−=其中,“,N T −”代表最小的灰度值,“,N T ”代表最大的灰度值,我们定义0T 为整幅图的平均灰度值,则为 ∑−==NN i T T i。
一种处理部分遮挡表情图像的方法
gn e ig a d A piai n 。 0 1 4 ( ) 1 0 1 3 ier n p l t s2 1 。73 :7—7 . n c o
Ab t a t I o d r o o v t e p o lm t a sx a i f ca e p e so s l d f c l o r c g ie s r c : n r e t s le h r b e h t i b sc a il x r s in a e i u t e o n z wh n h u n e e i t e t e h ma y s a e p ril o c u e u o t e fi g o a r o as a n w t o a e n s m mer r n f r t n i p e e t dRe e - r a t l c l d d d e t h rn e f h i r h t , e me h d b s d o y ay t t so ma i s r s n e . f r y a o
基于图像处理技术的人脸识别实现
基于图像处理技术的人脸识别实现随着科技的不断进步,人脸识别技术成为了近年来发展最快的一种识别技术之一。
目前,基于图像处理技术的人脸识别已经成为了现代化社会中的一种重要应用。
这项技术使得人们在安全管理、门禁系统、身份认证、刑侦调查等领域中拥有更加准确、高效的解决方案。
在本文中,我将介绍基于图像处理技术的人脸识别实现方法以及它的应用。
一、人脸识别技术的基本原理在介绍人脸识别技术的实现方法之前,我们需要了解一些基本原理。
人脸识别技术主要分为三个步骤:人脸检测、人脸对齐和人脸识别。
1. 人脸检测人脸检测是指通过图像处理技术,从复杂的背景中提取并定位出人脸区域。
常用的人脸检测算法有Haar+Adaboost算法、HOG+SVM算法、Cascade CNN等。
2. 人脸对齐由于人脸在不同位置、角度、光线下的图像特征差异非常大,因此在进行人脸识别前,必须对数据进行归一化。
所谓的归一化即是对人脸进行标准化处理,使得人脸在空间上具有一定的统一性。
通常使用人脸对齐算法对人脸进行标准化处理,常用的人脸对齐算法有仿射变换和人脸特征点对齐。
3. 人脸识别人脸识别是指通过人脸图像的特征信息,对不同的人脸进行识别和区分。
常用的人脸识别算法有PCA算法、LDA算法、SVM 分类器等。
二、基于图像处理技术的人脸识别实现方法1. 采集人脸图像首先,需要采集人脸图像数据。
采集人脸图像时,应注意到采集设备的摄像头像素、拍摄距离、环境光等因素。
高像素的摄像头和较近的拍摄距离可以获得高质量的人脸图像,以便后续的特征提取和分类。
2. 人脸检测和对齐对于采集的人脸图像,需要进行人脸检测和对齐,以获得统一标准的人脸图像。
常用的人脸检测和对齐算法可用OpenCV、dlib 等开源库实现。
3. 特征提取一般情况下,将原始的人脸图像进行降维处理,变成一组高维度的特征向量,以便于后续的分类和识别。
主流的人脸特征提取算法有PCA、LDA、特征脸等。
4. 特征分类和识别对于提取到的人脸特征进行分类和识别的目的是判别出这张人脸所属的个体是谁。
基于Hough变换的人眼检测方法研究
基于Hough 变换的人眼检测方法研究吴 冰,陈步威,李富贵,杨文强(河南理工大学电气工程与自动化学院,河南焦作 454003)摘要:人脸检测在许多应用中都是重要的一个处理阶段,眼睛是一个在人脸检测中极为重要的人脸特征,因此一种精确可靠的定位眼睛的算法对许多实际的应用是十分重要的.提出一种基于Hough 变换椭圆检测的人眼睛定位方法,先对人脸图象进行canny 边缘提取,然后根据眼睛的生理特征,利用提取的眼睛边缘特征进行椭圆检测.实验证明该方法定位准确,能有效的抑制噪声,并且有很高的识别率.关 键 词:Hough 变换;椭圆检测;眼睛检测中图分类号:TP 391 文献标识码:A 文章编号:1673-9798(2008)05-0556-05Research on detecti on of human eye based on Hough transformWU B ing,CHEN Bu -wei,L I Fu -gui,Y ANGW en -qiang(School of Electrical Engineering &Auto m ation .Henan Polytechnic U niversity,J iaozuo 454003,China )Abstract:Face detecti on is an i m portant step in many app licati ons such as hu man face recogniti on,video conferencing,hu man computer interfacing etc .The eye is the most i m portant facial feature in face detecti on .Thus,a reliable and fast method f or l ocating the eyes p recisely in an i m age is vital t o many p ractical app lica 2ti ons .A ne w method f or detecti on and recogniti on of hu man eye is p r oposed in the paper,based on elli p se and Hough transf or m.A t first,i m ages of the hu man face edge are extracted based on canny method .Then,according t o the physi ol ogical characteristics of the eye,elli p se detecti on is done fr om the eyes of extracting edge features .The results show that this method has positi oning accuracy,effective noise supp ressi on,and a high recogniti on rate .Key words:Hough transf or m;elli p se detecti on;eyes detecti on0 引 言随着信息社会对安全要求的不断提高,人脸识别技术在罪犯辨认、安全验证系统、信用卡验证、医学、档案管理、视频会议等方面表现出巨大的应用潜力,成为当前模式识别和人工智能领域的一个研究热点.人脸识别系统主要包括人脸检测和定位、人脸特征的提取和识别两个主要部分.人脸检测和定位,即从输入图象中找到人脸及人脸的位置,并将人脸从背景中分割出来,然后才是对归一化的人脸图像进行特征提取和识别.对人脸的基本特征如眼睛、鼻子和嘴巴的准确定位在很多人脸识别方法中也是必不可少的步骤,尤其是眼睛的准确定位.因为与鼻子,嘴巴相比,眼睛区域不仅包含可丰富的,区别于其他人的重要信息,而且是对图像进行旋转校正,归一化和均衡化的前提,同时也是人脸其他部位检测和提取的基础.目前人眼定位的算法有:可变形模版法,灰度投影法,边缘提取法第27卷第5期2008年10月 河南理工大学学报(自然科学版)JOURNAL OF HE NAN P OLYTECHN I C UN I V ERSI TY (NAT URAL SC I E NCE ) Vol .27 No .5Oct .2008 收稿日期:2007-12-01 基金项目:河南省教育厅自然科学研究计划项目(2008B510009) 作者简介:吴冰(1964-),男,江西萍乡人,博士,副教授,研究方向为图像处理、智能信息处理等. E -mail:cbw779@等.眼睛定位一般采用模板匹配方法,但是,单一模板匹配很难适应人面大小不同的情况.而由Yille 等人提出、Xie 等人进行改进的基于弹性模板匹配的面部特征抽取方法虽然稳定、可靠,但仍存在着计算量大,能量函数很难适应一般情况的缺点.灰度投影法是根据波峰波谷的分布信息来定位眼睛,定位速度快,但波峰波谷的分布对不同的人脸和姿态的变化非常敏感,定位精度较差,并易陷入局部最小而导致定位失败.边缘提取法是首先对人脸图像进行边缘提取,然后用霍夫变换检测眼球,构造一个包括眼睛、眼睑的眼部模版,用一系列函数从能量角度找出眼睑,该方法需要做大量预处理,参数过多的眼部模版不适用于个体差异太大的人脸.本文根据眼睛轮廓所具有的椭圆特性提出一种基于Hough 变换法椭圆检测的眼睛定位方法[1].首先对人脸图像进行预处理后进行边缘提取,并对边缘图进行二值化,用Hough 变换的椭圆检测方法对二值化图像进行椭圆检测,从而确定双眼的精确位置.1 眼睛检测1.1 边缘提取边缘提取的算子主要有Canny 、lap lacian of Gaussian 、Sobel 等算子.这里我们选取Canny 、lap la 2cian of Gaussian 、Sobel 三者来比较.提取前我们需要对图像进行灰度均衡与图像滤波.由于图像受到光照不均,环境污染,反光等因素的影响,图像的质量受到一定程度失真,为便于后面处理速度提高以及定位准确,先对原始图像进行灰度均衡的变化时,取均值是对f (i,j )较好的估计.但当该邻域跨越两块区域的边界时,由于两块不同的样本参与运算,将导致边界模糊.所以我选择了中值滤波,因为该滤波算法不仅能有效的抑制噪声,而且图像也不会变模糊,从而有利于人眼定位.经过灰度均衡与图像滤波后对图像的边缘提取的效果如图1所示.这里我们选择Canny 算子.因为这里Canny 算子提取的边缘图象中,在包含眼睛轮廓的前提下,其他边缘点比较少.所以本文选择眼睛区域边缘点较为丰富的Canny 边缘检测算子进行边缘提取.1.2 二值化灰度图像的二值化处理就是将图像上的点的灰度置为0或255,即将256个亮度等级的灰度图像通过适当的阀值选取而获得仍然可以反映图像整体和局部特征的二值化图像.把灰度图像二值化,有利于再对图像做进一步处理时,图像的集合性质只与像素值为0或255的点的位置有关,不再涉及像素的多级值,使处理变得简单,而且数据的处理和压缩量小.而且能有效的去掉噪声干扰,提高定位的精确率.为了得到理想的二值图像,一般采用封闭、连通的边界定义不交叠的区域.使用阀值法就可以得到比较好的分割效果.图2就是Canny 算子提取边缘后图像的二值化效果.755 第5期 吴冰等:基于Hough 变换的人眼检测方法研究2 基于Hough变换椭圆检测的精确定位瞳孔2.1 基于惯量等效椭圆匹配的椭圆定位本文使用惯量椭圆匹配法[2-3]定位眼睛的位置.惯量椭圆匹配法主要用于目标之间的匹配,可以实现高精度的椭圆定位.由此算法可以比较精确地确定椭圆的位置、大小和方向,将椭圆的长度参数的变化范围确定到一个像素的范围内,为下面使用Hough 变换法进行椭圆检测做准备.以下是惯量椭圆匹配法的计算:设图像的分辨率为m ×n ,灰度图像的函数表示为f (i,j ).(1)统计椭圆边缘点的个数: N =∑n i =1∑m j =1 f (i,j ).(1)(2)计算椭圆中心的坐标(p,q ): p =1N =∑n i =1∑m j =1 (f (i,j )×j ),(2) q =1N =∑n i =1∑m j =1 (f (i,j )×i ),(3)(3)计算椭圆的朝向角θ,这里的朝向角定义为椭圆的主轴与i 轴正向的夹角.图像沿j 方向的转动惯量: A =∑n i =1∑mj =1 (f (i,j )×i 2),(4)图像沿i 方向的转动惯量: B =∑n i =1∑mj =1 (f (i,j )×j 2).(5)图像沿i,j 方向的惯性积: H =∑n i =1∑mj =1 (f (i,j )×j ×i ).(6)椭圆2个主轴方向的斜率: k =12H (A -B )-(A -B )2+4H 2, (7)l =12H (A -B )+(A -B )2+4H2, (8)则椭圆的朝向角: θ=arctan k 若A <B ,arctan l 若A >B.(9)(4)计算椭圆的长半轴和短半轴的长度,b .对单个椭圆来说图像区域的面积M 就等于边缘点的个数,即在面积归一化过程中M =N . a =2/N (A +B )-(A -B )2+4H 2,(10) b =2/N (A +B )-(A -B )2+4H 2(A -B )+(A -B )2+4H 2 .(11)2.2 基于Hough 变换的椭圆检测Hough 变换是一种用于区域边界形状描述的方法,常常被用于直线段、圆和椭圆的检测.其基本思想是将图像的空间域变换到参数空间,用大多数边界点满足的某种参数形式来描述图像中的区域边界.Hough 变换检测技术根据局部度量来计算边界曲线参数,因而,对于区域边界噪声干扰或被其它目标遮盖而引起边界发生间断的情况,具有很好的容错性和鲁棒性.利用以上求得的椭圆5个参数[4-7],有855河南理工大学学报(自然科学版) 2008年第27卷 ((x -p )co s θ+(y -q )sin θ)2a 2+(-(x -p )sin θ+(y -q )co s θ)2b 2=1.(12)以下就是基于Hough 变换法椭圆检测的计算步骤:(1)定义1个五维的累加数组ACC,其元素可以写为ACC (p,q,a,b,θ),并且将其初始化为0,即ACC (p,q,a,b,θ)=0.(2)确定p,q,a,b 的取值范围.眼睛轮廓所表示的椭圆,其长度和宽度都是在一定范围之内的,所以在对图像边缘进行椭圆拟合后,对长轴和短轴设定一个范围,筛选出符合条件的椭圆区域作为眼睛的候选区域.这不仅可以提高眼睛检测速度,同时可以减少其他因素对检测结果的影响.根据ORL 人脸数据库实验测试,得到人眼睛的宽度约为40个像素,高度在11~20个像素之间.所以我们设定长轴∈[15,50],短轴∈[5,30].(3)搜索整幅图像,对于每一个椭圆的边缘点,让p,q,a,b,θ遍历所有可能的组合,并将它们代入式(12)计算出θ,同时对累加数进行累加,即 ACC (p,q,a,b,tanθ)=ACC (p,q,a,b,θ)+1.3 实验结果对于该文所介绍的在人脸检测中用椭圆检测算法精确定位眼睛虹膜的方法,笔者使用ORL 人脸图像库进行眼睛定位的实验[8-10].其中包含不同表情、不同光照、不同姿态、头发的遮挡和佩戴眼镜等各类人脸图像,图片大小为100×100.本文按照上述流程也为ORL 库选择了相应的边缘检测算子(Canny ),利用VC 编程实现[11-12].部分实验结果图像如图3所示,用符号“+”代表定位的眼睛位置.可以看到,对于不同表情、不同光照、不同姿态和佩戴眼镜的情况都有较好的定位结果.但对某些眼睛眯拢厉害或闭合的部分图像识别效果不理想.4 结 论人脸识别系统中,眼睛的精确定位是非常重要的一个环节,后续的图像几何归一化、图像矫正和特征提取都依赖于眼睛的位置和几何参数.本文根据眼睛轮廓所具有的椭圆特性,对人脸图像的边缘图像进行椭圆拟合,以确定眼睛可能所在的区域.实验结果证实该方法可以获得高达96%的验证率,另外该方法对姿态、尺度、表情等变化具有一定的鲁棒性.但本文在特征提取上需要更多的特征点,所以对人脸图像的要求较高,计算量较大,在今后的研究中可结合人脸的生理特征及探索快速算法来降低复杂度,使本算法更完善.参考文献:[1] Y OW K C,C I P OLLA R.Feature -based hu man face detecti on [J ].I m age and V isi on Computing,1997,15(9):713-735.[2] 任重,邵军力.立体视觉中的双目匹配方法研究[J ].信息与控制,2001,30(7):727-730.[3] YI W U LE I,K OK CHE ONG WONG .Elli p se Detecti on Based on Sy mmetry [J ].Pattern Recogniti on Letters,1999,20:41-47.(下转第564页)955 第5期 吴冰等:基于Hough 变换的人眼检测方法研究服从正态分布的情况,有了均匀分布的随机数,可以变换到其它分布.(3)文中讨论的粗大误差只是在3σ准则下,对于其他的准则可进一步扩充.(4)文中的随机数采用了高级语言的随机数发生函数.高级语言,如C 等都含有均匀分布的伪随机数发生函数,在要求不高的情况下可以采用此函数;在要求高的情况下,可以采用其他方法[8-9]编程实现,并需要进行数字特征方面的检验.参考文献:[1] 费业泰.误差理论与数据处理[M ].北京:机械工业出版社,2003.1.[2] 潘雄,付宗堂.系统误差的检测与处理[J ].化工自动化及仪表,2006,33(1):56-59.[3] 李金海.误差理论与测量不确定度评定[M ].北京:中国计量出版社,2003.11.[4] 赵俊伟.新一代GPS 标准与计量体系的现状与发展方向的思考[J ].河南理工大学学报:自然科学版,2005,24(2):121-125.[5] 戴颖,计奎.生成正态分布随机数的一种新方法-基于W indows 时间函数[J ].地矿测绘,2004,20(2):7-8.[6] 张清泉,朱启华,景峰,等.正态分布随机数发生器及其在模拟光传输软件中的应用[J ].强激光与粒子束,2000,12(2):225-228.[7] 杨建潮.测量误差中粗大误差的差别与处理[J ].计量与测试技术,2004,31(6):33.[8] 梁金千、张跃.在计算机上产生真随机数的探讨[J ].计算机工程,2003,29(15):176-177.[9] 吴飞.产生随机数的几种方法及其应用[J ].数值计算与计算机应用,2006,27(1):48-51.(责任编辑 宫福满)(上接第559页)[4] ROSI N P L.A note on the least squares fitting of elli p ses [J ].Pattern Recogniti on Letters,1993,14:799-808.[5] ADE L A SE W I SY,FRANZ LE BERL.Detecti on Elli p se by Finding L ines of Sy mmetry in the I m ages V ia an HoughTransf or m App lied t o Straight lines [J ].I m age and V isi on Computing,2001,19:857-866.[6] CHE LLAPP A R,W I L S ON C L,SI ROHEY S .Hu man and machine recogniti on of faces:a survey [J ].Pr oc I EEE,1995,83(5):705-740.[7] S AMAL A,I YE NG AR P A.Aut omatic recogniti on and analysis of hu man faces and facial exp ressi ons:a survey [J ].Pattern Recogniti on,1992,25(1):65-77.[8] 冯素玲.人脸识别常用方法研究[J ].微计算机信息,2004(5):45-47.[9] 边肇祺,张学工.模式识别[M ].北京:清华大学出版社,1999.[10]LA I J H,Y UE N P C,FE NG G C .Face recogniti on using holistic Fourier invariant features [J ].Pattern Reconiti on,2001,34(1):95-109.[11]向世明.V isual C +++数字图像与图形处理[M ].北京:电子工业出版社,2002.[12]陆虾,陈纯.图像处理原理、技术与算法[M ].杭州:浙江大学出版社,2001.(责任编辑 宫福满)465河南理工大学学报(自然科学版) 2008年第27卷 。
一种改进的人脸图像眼睛快速定位方法
Fb o e .2 o7
种 改进 的人脸 图像 眼 睛快 速定 位 方 法
张志 刚 周 明全 , 国华 , 耿
(. 1 西北 大学 信 息科 学与技 术 学 院 , 西 西安 70 6 ; 陕 10 9 2 北 京 师范 大学 信 息科 学与技 术学 院 , 京 107 ) . 北 0 85
摘
(z .g 13 cm) z g@ 6 .o g 要 : 于 广义对 称 变换 的原理 , 传 统的 眼 睛检 测 算 法进 行 了改进 。首 先 , 用 面部 眉 眼 区 基 对 利
域 的灰度 呈 纵 向 明显 变化 的特 点 , 用积 分 图法 快速地 初 步定位 眉 眼 区域 , 这 些候 选 的 区域 内用对 应 在 称 变换 法检 测候 选 的 眼睛 点 , 最后根 据 先验 知识 确 定 眼 睛对 。 实验 结果 表 明本 方 法 简便 易行 , 速度
Ab t a t a e n g n rl e y s r c :B s d o e e ai d s mmer r n fr p n i l , ali rv d a g rtm o y s lc t n w f p p s d z t t so m r c p e l mp o e lo h fr e e o ai a r o e : y a i i o t o F rt a c r i g t e c a a trs c fg a h r h n e n v r c l h a d d t y b w d e e l go s wee s lc e is, c o d n o t h r ce t s o ry s ap c a g s o e t a ,t e c i aee e r a y e in l e e t h i i i n o n ' d rp d y b sn tg a g e h i u ;t e ,as mme r rn fr g r h a p l e r h e e ;f a y y e e a il yu i g i e rli e t nq e h n y n ma c t t s m a o t w sa p i t s a c y s i l ,e e w r y a o l im d e o n l s d tr ie a e n p o n wl g .Ex e me t e ut r v a te me o i l d e s ob aie ,a d h g e ee n d b s d o r rk o e e m i d p r na r s l p et t h t d i s i l s o h h s mp e a a yt e r l d n i h r n e z a c r c d s e d p r r a c a b an . c u a y a p e f m n e C b o ti e n e o n e d
人脸对齐 算法
人脸对齐 算法人脸对齐是一种用来确定两个图像中的人脸在形状上的重叠程度,以实现精准定位的计算机视觉技术。
它也被称为人脸检测、人脸识别、人脸识别等。
它的原理是将两个不同的图像中的人脸部分标定,然后根据相对位置来进行比较,以便自动调整图像中的各个特征点,使其尽量重合。
下面简要总结人脸对齐算法:一、标定(Annotation)标定就是将人脸图像中某些关键点标记,以便确定人脸特征点位置,包括眼睛,鼻子,嘴巴和耳朵。
二、变换(Transformation)根据标定的特征点位置,利用变换模型(如仿射变换),对所有相关点进行映射,使两个图像的特征点的位置尽量重合。
三、优化(Optimization)通过前面的步骤,优化算法可以使两个图像具有最低的不重合度。
它可以通过求解梯度下降的方式,使不重合度最小化,从而获得最佳的结果。
四、跟踪(Tracking)在视频应用中,需要对动态的人脸图像进行对齐。
传统人脸检测算法将静止图像作为输入,而基于跟踪的人脸检测则会受到视频图像的影响。
该算法会通过根据上一帧中特征点的位置来确定当前帧中的新的特征点位置,从而使得检测精度更加准确。
五、算法结合(Algorithm Combination)很多时候,采用多种算法结合的方式来实现人脸对齐,以better精准检测效果。
他们中的某些算法可以增强变换步骤,而另一些算法可以增强优化步骤,以使用户拥有更精确的检测结果。
六、其他技术(Other Technology)除了上述算法技术外,还有一些其他技术,如深度神经网络模型(Deep neural network models)、特征表示(Feature representation)和置信度管理(Confidence management),可以改善人脸对齐的效果。
基于改进对称变换的人眼定位
种 基 于对称 变 换 的人 脸 图像 眼 睛定 位 的方 法 : 法 该
给出眼睛的大概位置 ; 文献 [ ] 3 利用水平和垂直方 向上 的方差投影 函数来搜索 眼睛的中心位置 , 该方 法计 算量小 , 但对 姿态 变化 比较 敏 感 ; 献 [ ] 用 文 4使
参数 化 的可变形 模板 定 位 眼和 嘴 , 较好 地 检 测 出 能
的一种有效 方法 , 它对 人 脸 偏 转 、 情 变 化 、 照 变 表 光 化等 条件不 敏感 , 有一定 的鲁棒性 , 具 很适 合用 于 面
部主要特征 的提取。为改进传统 G T法 的计算量 S 大 , 选点 过多等 问题 , 献 [ ] G T的基 础 上考 候 文 7在 S 虑 了对 称性 在不 同方 向上 的分 布 情 况 , 由此 提 高 了 定位 的精度。文献 [ ] 8 则从邻 域范 围考虑 , 对称 在
维普资讯
西北 大学学报 ( 自然科学版 ) 20 0 8年 8月 , 3 卷 第 4期 , u. 20 , o.8 N . 第 8 A g ,0 8 V 13 , o4 Jun f otw s U i ri N t a Si c dt n ora o r et nv sy( a rl c n eE io ) l N h e t u e i
性, 因此对 称变换 的原 理 就 是通 过 设 计 一 定 的 变换 函数 , 图像 中眼 睛等 对 称 区域对 函数 具 有 高 的 响 使 应值 , 而达 到特 征定 位 的 目的 。 从 记 图像 中任 一 点 P = ( ,i Y)的梯 度 为 P , 其 模 和梯 度矢 量方 向角 分别 和 0, ∈ [ 1] 1 0, 表示 T 任两 点 P , P 的连 线 与 水 平 方 向 的 逆 时针 夹 角 , 则
多尺度对称变换及其应用于定位人脸特征点
第 3期 20 02年 3月
电
 ̄
子
学
报
Ⅷ 0 N 3 o3
] d  ̄x l
ON C SI C I A NI A
多 尺 度 对 称 变 换及 其应 甩 于定 位 人脸 特 征 点
彭进业 , 一 俞卞章 王大凯2李 楠 , ,
K y ,o d e # r s: s' c E t y m ̄ . “ a ,. t r l m e o a ue p it ; nisn e ia ir e o a a ees  ̄ne t a e d xn m:  ̄ i m ff t ons a t y  ̄ t c lbot g n lw v lt; tn- s d i e ig e r - r h b n
O B dc n AS ' e 印咀 0 , 1 O W I 吐. W" 1 眦 c 出 te_ . hs h 坩 T i cI vw totice  ̄ fcmp t o a Id n I d i0 ,fa mae i cmpe lb L mc i u rme to o ua nlbl e .n a dt n i n i g s o r ̄ E h n i t r |
(. 1 西北工业大学电子工程系, 陕西 西安 7 05 ; 1 82 0 西北大学 电子科学系 . 陕西西安 70 6 ) 109
摘
要 : 提 出 了一种 在 图像 的反对称 双正交小 渡分解数据 域中, 实现多 尺度对称变换 的方法 , 并特 它应用 于脸
部 图像 中主要 特征点 的定 位 . 这种 方法与直接在原始图像数据 域中的 同类 方法相 比 , 大幅度减少计算量 、 能 加快定 位 速度 . 并明显提 高定位准确度 除此之外 , 由于它是在小 波分解 数据域上实现的 , 就为在 图像数据压缩域 中提取人脸 这 图像特征奠定了基础 关犍 词 : 对称变换 ;特征点定位 ;反对称 双正交小坡 ;基于内容的图像检 索 中图分 类号 : 1 3 1 P 9 文献标识码 : A 文章 编号 : 07-i2(∞2 0 - 6-4 322 i 2 ) 3 3 3 0 0
眼球追踪技术的原理
眼球追踪技术的原理眼球追踪技术是一种基于人眼运动的技术,通过追踪和分析眼球在空间中的运动,可以获取人眼在不同目标上的焦点和注意力分布。
该技术常用于人机交互、市场研究、心理学研究等领域,为我们了解人类视觉行为提供了重要的工具。
眼球追踪技术的原理可以简单概括为以下几个步骤:1. 采集眼球图像:眼球追踪技术通常使用红外摄像机来采集眼球图像。
红外光可以穿透瞳孔,而普通光线则会被瞳孔吸收,因此使用红外摄像机可以更清晰地观察到眼球表面的细节。
2. 提取瞳孔中心:通过图像处理算法,可以提取眼球图像中的瞳孔,并计算出瞳孔的中心位置。
瞳孔中心的坐标可以作为眼球位置的参考点。
3. 跟踪眼球运动:利用瞳孔中心的坐标,可以追踪眼球在空间中的运动轨迹。
通过连续采集眼球图像并计算瞳孔中心的变化,可以得到眼球的运动轨迹。
4. 分析眼球运动:根据眼球的运动轨迹,可以进一步分析眼球在不同目标上的注视时间和注视顺序。
通过统计眼球的注视点分布,可以了解到人眼在观察场景时的注意力分布。
眼球追踪技术的原理基于人眼的解剖结构和运动特点。
人眼由角膜、瞳孔、晶状体、视网膜等组成,角膜是眼球表面的透明薄膜,瞳孔是控制进入眼球的光线量的开闭孔,晶状体可以调节光线的折射度,视网膜是感受光线并将其转化为神经信号的重要组织。
当人眼注视一个目标时,光线通过角膜和晶状体的折射作用聚焦在视网膜上,形成一个清晰的图像。
同时,瞳孔的大小会根据光线的强度自动调节,以保证视网膜上的光线量适中。
当人眼转动时,眼球的肌肉会控制瞳孔的位置和大小,使光线能够准确地聚焦在视网膜上。
眼球追踪技术利用了眼球的运动特点,通过追踪和分析眼球的运动轨迹,可以推断出人眼在观察场景时的注意力分布和视觉行为。
例如,在人机交互中,可以根据用户的眼球运动来预测其意图和需求,实现更智能、更自然的交互方式。
在市场研究中,可以通过眼球追踪技术来评估广告效果、产品包装设计等,为市场营销提供决策依据。
在心理学研究中,眼球追踪技术可以揭示人眼在观察情感表情、阅读文字、解决问题等任务时的认知过程和策略。
人脸对齐仿射变换计算
人脸对齐仿射变换计算人脸对齐是计算机视觉中的一个重要问题,它可以帮助识别不同人脸之间的相似性,以及实现人脸识别、表情识别、人脸特征点检测等应用。
在对人脸进行处理之前,需要进行人脸对齐,将不同姿势、光照条件下的人脸图像对齐到一个标准的位置和大小。
人脸对齐的过程通常包括两个步骤:检测人脸关键点和进行仿射变换。
在这篇文章中,我们将重点讨论人脸对齐中的仿射变换计算。
仿射变换是一种线性变换,它可以通过矩阵乘法的方式对图像进行平移、旋转、缩放和错切等操作,从而实现人脸对齐的目的。
1.人脸关键点检测在进行人脸对齐之前,首先需要检测人脸关键点,即人脸图像中的眼睛、鼻子、嘴巴等关键位置。
通常使用机器学习算法或深度学习方法来检测人脸关键点,比如Dlib、MTCNN、OpenCV等库提供了成熟的人脸关键点检测算法。
在检测到人脸关键点之后,我们可以利用这些关键点进行仿射变换,将人脸图像对齐到标准的位置和大小。
假设我们检测到了人脸图像中的两个眼睛、一个鼻子和一个嘴巴的关键点,我们可以通过以下步骤进行仿射变换:(1)计算人脸中心点:将两个眼睛的坐标取平均值作为人脸的中心点。
(2)计算面部旋转角度:根据两个眼睛的坐标计算面部的倾斜角度,从而对图像进行旋转。
(3)计算人脸的缩放比例:通过两个眼睛之间的距离计算人脸的缩放比例,使得人脸对齐之后大小一致。
(4)进行仿射变换:根据上述计算结果,我们可以构建一个仿射变换矩阵,对人脸图像进行平移、旋转和缩放操作,从而实现人脸对齐。
下面我们通过一个具体的示例来演示人脸对齐仿射变换的计算过程。
假设我们检测到了一个人脸图像中的四个关键点:左眼、右眼、鼻子和嘴巴的坐标,现在我们要将这个人脸对齐到一个标准的位置和大小。
首先,我们计算人脸的中心点:```center_x = (left_eye_x + right_eye_x) / 2center_y = (left_eye_y + right_eye_y) / 2```接着,计算面部的倾斜角度:```angle = atan2(right_eye_y - left_eye_y, right_eye_x -left_eye_x)```然后,计算人脸的缩放比例:```scale = distance(left_eye, right_eye) / reference_distance```最后,构建仿射变换矩阵:```matrix = getAffineTransform([left_eye, right_eye, nose, mouth], [reference_left_eye, reference_right_eye, reference_nose, reference_mouth])aligned_face = warpAffine(face, matrix, (width, height))```通过这些步骤,我们就可以实现对人脸图像的对齐,使得不同姿势、光照条件下的人脸图像可以对齐到一个标准的位置和大小。
insightfaceswap 原理
insightfaceswap 原理InsightFaceSwap是一种基于人脸识别技术的面部交换算法,能够将一个人的面部特征与另一个人的面部特征进行交换,从而实现两个人的面部特征互换。
该算法采用了深度学习和卷积神经网络的方法,能够在保持面部特征的同时有效交换面部表情、肤色等细节。
InsightFaceSwap的原理主要包括以下几个关键步骤:1.人脸检测:首先需要对图像中的人脸进行检测和定位。
通常使用的是一种叫做人脸关键点检测的方法,通过在人脸图像中识别出眼睛、鼻子、嘴巴等关键特征点,以确定人脸的位置和姿态。
2.人脸对齐:由于不同的人脸可能会有大小、角度和姿态等差异,为了使得交换后的面部特征能够满足对齐要求,需要进行人脸对齐操作。
这里通常采用的是仿射变换或者透视变换,通过对关键点进行变换,将两个人脸的姿态和角度保持一致。
3.特征提取与匹配:在对齐后的人脸图像上,使用卷积神经网络对面部特征进行提取。
通常采用的是一种叫做人脸识别的模型,比如ArcFace或者SphereFace模型。
这些模型可以将人脸图像转化为一个具有较高表征能力的向量,也被称为人脸特征。
4.特征交换:在特征提取阶段,我们得到了两个人脸的特征向量,接下来就可以进行面部特征的交换了。
一种常用的方法是通过线性插值的方式,计算两个人脸特征之间的距离,并在中间比例点处进行插值得到新的特征向量。
然后,通过反向的特征提取网络,将插值后的特征向量转换为交换后的面部特征。
5.图像重建:最后,使用反卷积神经网络将交换后的面部特征重建成图像。
反卷积网络可以将特征向量转化为原始图像的像素值,从而获得最终生成的交换后的面部图像。
InsightFaceSwap的原理基于深度学习的卷积神经网络,其中使用的人脸识别模型可以实现高性能的人脸特征提取,并通过插值和反向特征提取来实现面部特征的交换。
这使得该算法能够在保持面部特征的同时,实现高质量的面部交换。
总结起来,InsightFaceSwap是一种基于人脸识别和深度学习的面部交换算法。
基于图像处理的眼动追踪技术研究
基于图像处理的眼动追踪技术研究眼动追踪技术(Eye Tracking Technology)是一种基于图像处理的技术,旨在实时监测和记录人眼在二维或三维空间中的运动轨迹。
该技术在众多领域中具有重要的应用,如心理学、人机交互、市场营销等,其研究和应用价值备受关注。
眼动追踪技术的原理是通过不同的设备(如红外摄像机)或传感器(如鼻眼追踪系统)捕捉和跟踪眼睛的运动。
这些设备可以在眼睛周围放置,或者通过特殊的眼镜或眼镜架固定在眼睛上。
通过适当的算法和模型,可以准确地根据眼球的位置和运动来推断用户的视线方向,实现眼动追踪。
眼动追踪技术的研究主要集中在两个方面:单眼追踪和双眼追踪。
单眼追踪指的是通过追踪一个单独的眼球来获取眼动信息。
这种方法在追踪眼球位置和眼动轨迹时比较简单,但无法准确估计注视点。
双眼追踪则可以同时追踪两只眼球,实现更精确的注视点检测和视线跟踪。
目前,大多数眼动追踪系统都采用双眼追踪技术。
眼动追踪技术的研究和应用具有广泛的意义。
首先,在心理学领域,眼动追踪技术可以用来研究人眼在观看广告、阅读文字、浏览网页等任务时的注意力分配和认知加工过程。
这有助于深入理解人类的视觉注意机制和决策行为,为认知心理学的研究提供重要的实验数据。
其次,在人机交互领域,眼动追踪技术可以应用于交互界面的设计和优化。
通过分析用户的注视点和视线跟踪数据,可以确定用户在界面上的兴趣点和注意力分布,从而提供个性化的交互体验和改进用户界面的易用性。
此外,在市场营销和广告领域,眼动追踪技术可以用来研究消费者在购物过程中的注意力分配和行为决策。
通过分析用户在观看广告、商品展示和产品包装时的注视点和注视持续时间,可以评估广告效果和消费者的购买意愿,为市场营销策略提供有力的依据。
在现实生活中,眼动追踪技术已经开始应用于日常生活和医学领域。
例如,在驾驶员监控系统中,眼动追踪技术可以用来检测驾驶员的疲劳和注意力分散程度,提供驾驶辅助和安全警示。
使用人脸识别技术进行人脸检测与定位
使用人脸识别技术进行人脸检测与定位人脸识别技术是近年来发展迅猛的一项人工智能技术,它通过对人脸图像的提取、分析和比对,可以进行人脸检测和定位。
人脸检测与定位是人脸识别技术的基础,它在人脸识别、人脸验证和人脸表情分析等领域具有广泛的应用前景。
本文将重点介绍使用人脸识别技术进行人脸检测与定位的原理和方法。
人脸检测与定位的目标是从图像或视频中准确地识别出人脸,并确定人脸在图像中的位置。
在实际应用中,人脸检测与定位需考虑到光照、角度、遮挡和表情等因素的干扰。
以下是一种常用的人脸检测与定位的方法。
首先,人脸检测与定位通常可分为两个阶段:特征提取和分类器。
特征提取阶段旨在提取图像中与人脸相关的特征,常用的特征包括颜色、纹理和形状等。
分类器阶段则使用分类算法对提取到的特征进行判别,进而识别出人脸。
在特征提取阶段,常用的方法有基于模板匹配的方法、基于特征点的方法和基于纹理的方法。
模板匹配的方法是通过与预先定义的人脸模板进行比对来确定人脸位置。
特征点的方法则是通过检测人脸中的关键特征点(如眼睛、鼻子和嘴巴等)来确定人脸位置。
纹理的方法则是通过分析图像中的纹理模式来确定人脸位置。
这些方法各有优劣,可根据实际场景和需求进行选择。
在分类器阶段,常用的方法有支持向量机(SVM)、人工神经网络(ANN)和卷积神经网络(CNN)等。
SVM是一种常用的分类器,它通过将数据映射到高维空间来实现非线性分类。
ANN模拟了人脑神经元的工作原理,能够自动学习和提取特征。
CNN是一种特殊的ANN,它通过卷积和降采样等操作来实现对图像数据的高效处理,已经在人脸识别中取得了显著的效果。
除了上述方法,目前还出现了一些基于深度学习的人脸检测与定位方法,如基于卷积神经网络的人脸检测网络(FaceNet)和基于区域卷积神经网络的人脸检测方法(RCNN)。
这些方法利用深度学习的强大模式识别能力和高效计算能力,实现了在大规模数据集上的人脸检测与定位,并取得了较好的效果。
人脸对齐三点算法 -回复
人脸对齐三点算法-回复人脸对齐三点算法是一种用于将人脸图像中的多个关键点对齐的算法。
这些关键点通常表示人脸的眼睛、鼻子和嘴巴等特征。
通过对齐这些关键点,我们可以更好地进行人脸识别、表情分析和人脸编辑等应用。
本文将一步一步地解释人脸对齐三点算法的原理和具体步骤。
首先,让我们来了解一下人脸对齐的意义。
在一张人脸图像中,由于面部角度、姿态、光照条件等因素的影响,每个人脸的形状和位置都可能有所不同。
这使得在进行人脸相关的任务时,很难对不同人脸进行准确的比较和分析。
因此,通过将人脸的关键点对齐到一致的位置,可以消除这些差异,从而提高算法的准确性和稳定性。
人脸对齐三点算法的一般步骤如下:第一步:检测人脸。
在应用人脸对齐算法之前,我们首先需要检测出图像中的人脸。
这可以通过使用人脸检测算法来实现,例如Viola-Jones算法、卷积神经网络等。
这些算法可以帮助我们在图像中定位到人脸所在的位置。
第二步:提取人脸关键点。
我们可以使用人脸关键点检测算法来提取人脸图像中的关键点位置。
常用的关键点包括眼睛、鼻子和嘴巴等特征点。
具体的算法包括Dlib库中的shape_predictor、OpenCV库中的Haarcascades等。
这些算法会根据训练好的模型,在图像中找到目标关键点的位置。
第三步:计算变换矩阵。
通过对齐关键点,我们可以计算出从原始图像到目标图像的变换矩阵。
常用的方法是通过三个关键点的对应关系来计算出相似变换。
例如,可以计算出原始关键点和目标关键点之间的平移、缩放和旋转关系,从而得到变换矩阵。
第四步:进行图像变换。
利用得到的变换矩阵,我们可以将原始图像进行对齐。
具体地,通过对原始图像进行仿射变换或透视变换,使得关键点在目标图像中对齐。
这样,不同图像的人脸就可以具有一致的形状和位置。
第五步:后处理。
在完成图像对齐后,我们可以进行一些后处理步骤来进一步改善对齐效果。
例如,可以使用图像平滑算法来减少图像中的噪声和伪影。
人脸定位文档
人脸定位1. 引言人脸定位是计算机视觉中的一个重要研究领域。
它的目标是通过使用计算机算法从一张图片或者视频中准确地定位出人脸的位置。
人脸定位在人脸识别、人脸跟踪、人机交互等领域具有广泛的应用。
本文将介绍人脸定位的概念、方法、常见的算法和应用领域。
2. 概述人脸定位即是将人脸从一幅图片或者视频中准确地识别出来,并确定其在图像中的位置。
通常情况下,人脸定位包括两个主要的步骤:人脸检测和人脸分析。
人脸检测是指从输入的图像中找到人脸的位置和大小,而人脸分析则是根据人脸的位置和特征进行进一步的分析和处理。
3. 人脸检测算法3.1 Viola-Jones算法Viola-Jones算法是一种经典的人脸检测算法。
该算法通过使用Haar特征和Adaboost分类器来检测人脸。
Haar特征是基于图像的像素差异来描述图像特征的方法,而Adaboost分类器则是通过训练一系列弱分类器来构建一个强分类器。
Viola-Jones算法具有较高的检测速度和鲁棒性,是目前应用广泛的人脸检测算法之一。
3.2 基于深度学习的人脸检测算法近年来,基于深度学习的人脸检测算法取得了显著的进展。
其中,基于卷积神经网络的人脸检测算法具有较好的性能。
通过训练大规模的人脸数据集,卷积神经网络可以准确地检测出人脸的位置。
常用的基于深度学习的人脸检测算法包括Faster R-CNN、YOLO和SSD等。
4. 人脸分析算法4.1 人脸关键点检测算法人脸关键点检测算法是指识别和定位人脸上的重要关键点,如眼睛、鼻子、嘴巴等,用于进一步的人脸分析和表情识别。
常用的人脸关键点检测算法包括基于特征的方法和基于深度学习的方法。
4.2 人脸表情识别算法人脸表情识别算法是指根据人脸上的表情特征来判断人脸表达的情感状态。
常用的人脸表情识别算法包括基于特征分类器的方法和基于深度学习的方法。
这些算法可以用于情感分析、虚拟现实等应用。
5. 人脸定位的应用领域人脸定位在各个领域均有广泛的应用。
基于对称非负矩阵分解的人脸识别算法
基于对称非负矩阵分解的人脸识别算法王雪光;陈淑红【摘要】提出一种利用镜像偶特征改造NMF(Non-negative Matrix Factorization)基图像并进行局部特征提取的人脸识别算法.首先获取镜像偶特征并进行二次Haar小波分解,得到重构人脸样本图像.然后利用NMF分解得到一组在垂直方向对称的基图像,由它们组成基矩阵并对它们正交规范化.改造后的基图像符合人脸对称的生理特性,使得NMF基矩阵更加适用于人脸特征提取.在含有姿态变化和不均匀光照样本的Yale人脸数据库上取得了较好的识别效果.%This paper proposes an algorithm for face recognition by reforming the base image of NMF with even mirror-like features and extracting the localfeature.First,the even mirror-like feature is obtained and followed by the secondary Haar wavelet decomposition,and the reconstructed face sample image is derived.Then,by employing NMF method a set of basic images symmetrical in vertical direction are obtained,and they are used to form the base matrix and to be performed the orthogonal normalisation.The transformed base image meets the physiological characteristic of facial symmetry,this makes the NMF base matrix more suitable for face feature extraction.The algorithm achieves pretty good recognition effect on Yale face database with the samples of posture changes and uneven illumination.【期刊名称】《计算机应用与软件》【年(卷),期】2013(030)008【总页数】4页(P148-150,183)【关键词】人脸识别;非负矩阵分解;对称性;特征提取;镜像【作者】王雪光;陈淑红【作者单位】河北工程大学信息与电气工程学院河北邯郸056038;河北工程大学信息与电气工程学院河北邯郸056038【正文语种】中文【中图分类】TP301人脸识别是模式识别的一个重要研究课题,已被广泛应用于门禁系统、考勤系统、安检、刑事案件侦破等领域中。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第30卷第2期2004年3月 光学技术OPTICAL TECHN IQU EVol.30No.2March 2004 文章编号:100221582(2004)022*******基于对称变换的人脸图像眼睛定位方法Ξ解明1,马泳2(1.北京理工大学信息科学技术学院光电工程系,北京 100081;2.华中科技大学电子与信息工程系,湖北武汉 430074)摘 要:利用图像灰度分布的特性,从计算对称值的角度出发,利用梯度对称变换,实现了一种自动定位人脸图像中眼睛的算法。
经计算机模拟实验表明,它对一定程度的背景干扰以及光照的变化不敏感,对正面人脸且在眼睛张开的情况下,对称变换的定位准确率可以达到95%以上。
关键词:对称变换;人脸识别;模型基编码中图分类号:TP391.41 文献标识码:AMethod of eyes location based on symmetry transformXIE Ming1,MA Y ong2(1.Class4120002,Beijing institute of technology,Beijing 100081,China)(2.Department of Electronics and Information,Huazhong University of Science and Technology,Wuhan 430074,China)Abstract:A facial features location algorithm automatically to locate eyes is ing gamma distribution and gra2 dient symmetry transform,the core of this algorithm is to compute each pixel’s symmetry values.The simulation experiment by computer demonstrates that this algorithm is not sensitive to the background interference and irradiant metamor phose in certain lever.Under a circumstance of a facial face and o pen eyes,the accuracy of allocation of symmetry transform can reach95%or more.K ey w ords:symmetry transform;face recognition;model2based image coding1 引 言文献[1]中的人脸识别算法在定位人脸上的眼睛、鼻、嘴等五官的位置时,主要是根据人脸图像的灰度特性。
例如对正面人脸图像来说,在包含有双眼的条状区域内,图像灰度变化曲线会在双眼处出现两个尖峰,由此可确定尖峰处为眼睛的中心的位置。
文献[2]是先用Canny算子提取人脸图像的边缘,然后用Hough变换来定位眼睛的中心位置。
在此基础上,使用眼睑弹性模板去匹配眼睑,由此把提取出的眼睛轮廓作为人脸识别的特征量。
另外,在模型基图像编码中,特征定位也很重要。
对于特定的人头肩序列图像来说,模型的匹配以及运动参数的估计都要用到一些重要的特征点,如眼睛、鼻、嘴的中心位置点。
文献[3]在估计运动参数时就用了到眼睛和嘴的位置坐标,它是利用LO G算子在不同σ值下的边缘检测结果,根据人头肩序列图像的先验知识来确定眼睛和嘴的位置。
文献[4]提出的模型基编码方案中也涉及到了眼睛和嘴的定位,只是它的定位过程隐含于模型中。
无论是在人脸自动识别还是在模型基编码中,对人的眼睛和嘴的自动定位是不可缺少的一步。
作为模型基编码研究中的一部分,本文讨论了以对称变换为基础的一种自动定位图像中的人脸眼睛的方法,该方法也适用于人脸识别系统。
2 对称变换2.1 对称的定义对称是自然界最常见的现象之一。
如果经过某种对称算子的作用后,物体保持原样不变,则称该物体是对称的。
例如,字母A是左右对称,Z是对角对称,H既是左右对称又是对角对称,如图1所示。
图1 对称的例子对称也可定义为,给定一个二维平面上的物体,如果存在一条将它分成两个呈镜像部分的轴x,则称它关于x对称。
如图1(a)所示,字母A关于μ轴对称,图1(c)所示中的H关于μ、ζ对称。
如果把面也考虑进来,这个732Ξ收稿日期:2003207218;收到修改稿日期:2003209210作者简介:解明(19822),男,湖北省武汉市人,北京理工大学信息科学技术学院光电工程系学生,主要从事数字图像处理的研究。
对称的定义可以延伸到三维空间。
由于对称的存在具有普遍性,所以许多学者提出了不同的计算物体对称程度的方法。
2.2 对称的度量首先定义几个概念。
以下把定义在二维和三维数字空间的数字化物体的组成元素分别称为像素和体素。
定义1:数字图像是一种映射I :nD →F ,其中n =2,3;F 称为特征空间。
最简单的情形是F 表示物体各可见点的灰度值,即常见的二维数字图像。
一般来说,F 中的元素不只一维,称为特征矢量,n 维空间中的各点(i 1,i 2,…,i n )用p 表示。
例如,一幅大小为N ×N 的二维图像可以定义为I (i 1,i 2)=(灰度值,梯度值),即I (p )=f 。
定义2:给定一幅图像I (p ),设T 是定义在n 维空间的双射几何变换,例如T 2(p )=p ,如果I (p )=I [T (p )],那么称I 是对称的。
衡量二维图像中物体的对称性有两种方法:一种是力矩度量(moment measure );另一种是梯度度量(gradient measure )。
前者借用物理学上的力矩概念来计算对称度,后者通过灰度梯度来计算。
下面主要讨论后一种方法。
2.3 对称变换的定义定义3:对称变换就是通过特定的算子将数字图像I (p )映射到另一个空间F (p )上。
对于F 空间的任一元素来说,F (i 1,i 2)=(对称值,对称角度)。
所谓的特定算子可以根据应用的不同要求自行定义。
由于对称变换多用于检测图像中感兴趣的区域,因此算子的定义要考虑到感兴趣区域的特点。
对于人眼睛这个特定区域的检测来说,下面给出一个具体的对称变换过程。
对二维图像而言,采用梯度法的对称变换实际上可看作一个二维滤波过程,非常利于并行实现。
对称变换对梯度图像(按定义1把图像梯度矩阵称为梯度图像)并没有太严格的要求,大多数边缘检测算子都可以用来产生梯度图像。
作者采用了一个非常简单的边缘算子来计算各像素点的梯度,即直接采用高斯函数作为梯度算子。
一维高斯函数的定义为G σ(t )=(1/2πσ)e -r 2σ2 对于点p (x ,y )来说,x ,y 方向上的梯度分别为 I x (p )=dd xG (x )G (y )3I (x ,y )I y (p )=G (x )dd xG (y )3I (x ,y )3代表卷积。
所以点p 的灰度梯度矢量为 I (p )=( I x (p ), I y (p )) 定义所得梯度图像E (p )如下:E (p )=E (x ,y )=R (p )θ(p )=log (1+‖ I (p )‖) arg I (p )式中,θ(p )为梯度的方向。
由于梯度的变化较大,为提高对称算子的鲁棒性,所以采用了梯度的对数值来计算梯度的大小R (p )。
对于任意p ,q 两点来说,L 为过p ,q 的直线,设αpq 为L 与水平x 轴的夹角,则对称算子定义如下:S (o )=∑(p ,q )∈Γ(o )R (p )R (q ){1-cos [θ(p )+θ(q )-2αpq ]}{1-cos [θ(p )+θ(q )]}‖p -q ‖其中Γ(o )=(p ,q )p +q 2=o ,‖p +q ‖≤2r式中,o 为图像中的任意像素点;r 为可调参数,用来调整点o 邻域的大小。
一般r =3σ。
表达式R (p )R (q )在灰度变化不大的区域多为零值,而一般在感兴趣的区域灰度变化都较丰富,人脸图像的眼睛区域就是如此。
从图3(b )中可以看出,眼睛区域梯度层次较多。
在灰度变化丰富的区域,R (p )R (q )将取得较大的值。
由于作者没有直接使用梯度值进行计算,而是采用了梯度的对数,这样就可以避免强边缘的影响,这是因为作者主要考虑的是对称程度的计算,边缘的强度大小对对称值的影响不大的缘故。
另外,在计算p ,q 两点对点o 对称值的贡献时,还应该把p ,q 位置分布考虑进来。
由于对称算子是邻域处理算子,利用了图像的局部特性,因此在上面定义的对称算子中直接利用了p ,q 两点间距离‖p -q ‖的倒数。
文献[5]中,利用二维高斯函数定义了一个距离权函数来计算p ,q位置分布对点o 对称值的贡献,计算较复杂。
在[θ(p )-αpq ]+[θ(q )-αpq ]=π时,也就是说p ,q 两点的梯度方向处于相反或相向时,表达式{1-cos [θ(p )+θ(q )-2αpq ]}取得最大值,并且当满足[θ(p )-αpq ]=[θ(q )-αpq ]=π/2时,表达式{1-cos [θ(p )+θ(q )]}也取得最大值,这种情形发生在水平或垂直边缘附近。
在图2中,可以清楚地看出这种梯度方向上的对称关系,图像中对称的区域在经过梯度运算后梯度方向也呈对称分布。
这里只显示了图3(a )人脸图像中的右眼附近区域的梯度分布情况。
由于人脸图像中眼睛区域的灰度变化很丰富,反映到梯度图像上就表现为以眼球为中心,且在梯832光 学 技 术 第30卷图2 梯度图像的梯度方向分布(a)原图;(b)梯度图像;(c)对称变换后的图像;(d)定位结果。
度方向呈放射状分布。
这样,在经过上述对称算子变换后,在眼睛中心附近的像素对应的对称值将会很大。
一般来说,眼睛中心附近像素的对称值大,都处于最大对称值的前四五位。
通过对称变换可以很容易获取眼睛位置的候选点,再经过一定的先验知识的判别,最终可确定眼睛的位置,进而由人脸固有的几何比例关系确定嘴的位置。
上述对称变换实际上可看成是一种非线性滤波。
由于对每个像素点都进行相同的邻域处理,对称变换算法很适合并行处理。
但也要看到,这种算法的计算量较大,约为0(kr2),其中k为图像中像素点的数目,r为邻域大小。
3 实验结果和分析上述算法是在MA TLAB中编程实现的。
由于高斯函数的能量大部分集中在小于3σ的范围内,因此实验中高斯算子的大小取为3σ。
选取σ=015,高斯滤波算子的大小为3,实验结果如图3所示。