自动人脸识别中的图像质量评价

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一种基于倒谱的人脸图像清晰度评价方法

杨飞苏剑波

1 引言

人脸识别由于其非接触式、基本无须配合和操作隐蔽性强等优势，被认为是一种可广泛使用的生物特征识别技术，长期以来一直受到学术界和产业界的广泛关注[1-4]。然而，也正因为追求“无须配合”的实施效果，导致了人脸图像采集的随意性，图像之间差异较大、图像质量参差不齐的情况。采用低质量的人脸图像进行人脸识别，必然会导致识别准确率的下降[2, 4]。而长期以来，人脸识别的研究大都是基于预先准备好的图像质量一般较高的人脸库的，这与现实应用情况有很大的不同。因此尽管实验测试中的人脸识别准确率已经相当之高，然而在实际应用中的表现却并不尽如人意。为此，近年来有不少研究者开始着手于研究对各种不同质量人脸图像足够鲁棒的人脸识别技术，目前虽已取得了很大的进展，但离实用仍有一些差距。一方面，由于处理低质量图像而被引入的额外手段往往十分复杂，会大大增加人脸识别系统的复杂度，使得人脸识别耗费时间更长一一这对于多数实际应用是不可接受的；另一方面，不受图像样本因素影响的人脸识别算法是难以获得的。因此，我们必须研究新的解决方法。

在基于视频流的自动人脸识别应用中，获得的人脸图像数量通常较多，如果对人脸图像样本进行质量评价，

筛选较为合适的样本用于识别，这无疑会提高自动人脸识别系统的准确率；即使样本数目有限，也可以依据质量评价结果来选用相应的图像预处理方法来提高识别率。另外，根据人脸图像的质量情况来调整分类器的阈值或其它参数能有效地降低错误拒绝率（FRR）或错误接受率（FAR），亦可提高人脸识别

的实用性能。可见，在自动人脸识别系统中引入人脸图像质量评价环节是一条推动人脸识别实用化的重要途径。因此，近几年来人脸图像的质量评价逐渐引起了人们的关注，关于图像质量评价的评价框架和相关指标的研究工作也已有一些公开报道[2-4]，但关于人脸图像质量评价方法的研究目前还并不充分，人们往往是直接借用传统的图像质量评价方法。本文的研究表明，现有方法并不一定适用于自动人脸识别这个特别领域中的人脸图像质量评价，其评价结果与实际情况可能存在一定差距。本文接下来将以清晰度这一重要的人脸图像质量评价指标为例进行详细说明，并提出一种比传统评价方法更适合于自动人脸识别的清晰度评价方法。最后，通过对同一组人脸图像进行清晰度评价实验，将其与传统清晰度评价方法进行对比，以验证本文方法的准确性要高于传统方法。另外，还在真实环境下通过人脸识别实验来验证本文提出的清晰度评价方法在自动人脸识别中的作用及其适用性。

2 自动人脸识别中的清晰度评价

在基于视频流的自动人脸识别应用中，自动检测采集到的人脸图像不清晰的情况时有发生。不清晰的人脸图像不但会影响人脸识别的准确率，而且还会影响对譬如人脸姿态等其它图像质量指标的评价[2,4]，故本文将清晰度选作研究对象。影响人脸图像清晰度的原因主要有图像模糊和采集噪声干扰。忽略采集噪声，摄像机对焦失准或拍摄瞬间人脸沿摄像机光轴方向快速运动会造成离焦模糊，拍摄瞬间人脸垂直于摄像机光轴方向快速运动会造成运动模糊，实际上这两种模糊经常是并存的。传统的图像质量评价往往是考察经过计算压缩、传输、增强或其他处理变换后的图像与原始图像质量上的差别，在评价时通常有“标准图像”可供参照[5]。因此，无论是具有计算简单优点而被广泛使用的均方差（MSE）和峰值信噪比（PSNR）方法，还是更符合人眼视觉系统（HVS）特性的结构相似度（SSIM）方法⑹或基于自然场景统计（NSS）的视觉信息逼真度（VIF）方法⑺，由于必须得通过将变换后的图像与标准图像进行比较来做出质量评价，故皆不适合作为自动人脸识别中的人脸图像清晰度评价方法。另一方面，无需参考图像的图像质量评价方法相对较少，且主要用于图像盲恢复参数的辨识（如对点扩散函数PSF的估计等），其中的特

征提取过程较为复杂，计算耗时长，故难以满足自动人脸识别系统的时间要求。于是，研究者们提出了

通过衡量图像梯度统计信息【2］或高频部分能量［3］来评价人脸图像清晰度的方法。这两种方法虽然无需参考图

像，而且简单快速，但是其实并不可靠。这是因为不同人的面部差异通常较大，

再加上眼镜的佩戴, 使得人脸图像的边缘信息差异更大；而且，运动模糊图像的边缘不是在所有方向都是模糊的，与运动方向垂直的方向上的边缘并没有发生退化，而且运动模糊还会产生新的锐利边缘(例如一个亮点可能在运动模糊后形成一条线)，所以不能完全依据边缘信息来判断图像模糊程度。鉴于上述原因，本文提出了一种新的基于倒谱(cepstrum)域分析的清晰度评价方法。

3人脸图像清晰度评价方法

倒谱理论自从1963年被提出后［8］，在雷达、地震波、超声波和语音信号分析等领域得到了应用，后来又作为

一种盲去卷积方法被应用于图像恢复的参数辨识中 I 9】。如果能准确地辨识出模糊图像的点扩散

函数的参数，即能评价出图像的模糊程度。但实际上，在倒谱图中很难清楚地辨识出点扩散函数的特征；而且通常情况下不能预知模糊的类型，辨识点扩散函数的参数往往需要对倒谱图进行预处理，其过程也是比较复杂并且费时的［10］。为了避免这些问题，本文提出了一种新的清晰度评价方法，不通过辨识点扩散函数的参数而是采取直接统计倒谱图中的高能量亮点的方法来估计图像清晰度。因为本文只研究人脸图像的清晰度评价，暂不考虑对模糊人脸图像进行复原，所以无须区分模糊类型或辨识出点扩散函数的参数。采用这种方法不仅避免了模糊参数难以辨识的问题，而且使算法得以大大简化，提高了清晰度评价速度，下面给出详细说明。

首先，图像的降质过程可用下面的数学模型来近似描述［10］:

g(x, y) = f(x, y) * h(x, y) + n(x, y),

其中f(x, y)为输入清晰图像，h(x,y)为点扩散函数，n(x,y)为加性噪声。在这个模型里，输出降质图像g(x,y) 被表示为f(x,y)与 h(x,y)的卷积再加上n(x,y)。忽略噪声的影响，式(1)可写为：

g(x, y) = f(x, y) * h(x, y).

不失一般性，考察匀速直线运动产生的运动模糊，拍摄瞬间物体相对镜头的位移大小为

d ，运动方

向与水平轴的夹角为则由其导致的点扩散函数为: y xtan , x 2 y 2 d/2 elsewhere

h(x, y)

0 elsewhere

于是，通过式(2) — (4)，用一张清晰图像可分别人工模拟出其不同程度的运动模糊和离焦模糊效果。对于一幅大小

为 M X N 的灰度图像g(x, y)，它的傅立叶变换为：

G(u, v) = F{g(x, y)},

(5)

则其倒谱域变换定义为［9】:

-1 Cep{I(x, y)} = F {log | G(u, v)|},

⑹

1 式中F { }和F { }分别表示傅立叶变换和反傅立叶变换， |?表示求复数模。由式 ⑵、(6)可得

Cep{ g(x, y)} = Cep{f(x, y)} + Cep{h(x, y)}.

⑺ 由此可见，倒谱域变换的一个重要性质是：在倒谱域内，模糊图像的倒谱可分解为清晰图像的倒谱和点

(1) 丄 h(x,y) d

0 另外，由几何光学分析可知，一个散焦半径为

R 的点扩散函数可描述为: