基于人脸识别的数学建模优秀论文3

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

8
矩阵转换成列向量。设每张灰度图像的行数为 N, 列数为 M，则灰度图像能够转换为一个 N*M 行，1 列的向量。从图片数据库里选取 L 张图像，由这 L 张图像的列向量组成一个 n*m 行，L 列的矩阵 T。对矩阵 T 各个列向量求取平均值得到 m，m 也为 N*M 行，1 列的向量。由均值 m 可以还原回 N*M 的矩阵，从而做出平均人脸的图像。为了能够简单地展示平均人脸的效果，只随机选取图像数据库中的 200 张图像，生成平均脸的效果如下：
图 4 平均脸
这张平均脸平均综合反映了 200 张人脸图像的信息，并不是普通意义下只针对一个人的人脸图像。 B 特征脸的生成和投影系数的求取对一张图像进行特征信息提取，往往由于维数过高带来计算困难的难题。而 PCA 能够基于 K-L 变换有效地实现对图像降维。经过查阅文献资料，将 K-L 变换的原理简单地阐述如下：在原图像的测量空间找出一组 u 个正交矢量，要求这组正交矢量能最大程度地反映出数据方差，然后将原图片模式矢量从 w 维空间投影到这组正交矢量构成 u 维子空间，则投影系数为构成原模式的特征矢量，由于要求 u<w，所以 PCA 能够实现维数的压缩。为了简洁地阐述投影系数的求取步骤和
关键词：预处理主成分分析法欧式距离支持向量机
1
1. 问题重述与人的指纹不同，人脸总是在不断变化的。只是微笑一下，人脸就发生了改变。眼角纹、鼻子的反光点、露出的牙齿，统统都在改变。仰天大笑，脸上显现的形状很快发生变化。即使有同样的表情，人的头发也在不断发生变化，刚理发后的变化更是非常大。然而，人眼却能毫不费力地从一堆照片中认出他认识的人，即使这个人他们只见过一面。题目所给的人脸数据库包含了 13000 张人脸，共 5749 个身份，本文需要基于题目所给出的数据库，解决如下问题：（1）设计算法，识别该数据库中的人脸，与人眼识别结果进行比较；（2）对《今日说法》2015 年 6 月 27 日节目“藏在大衣里的纸条” 中的犯罪嫌疑人胡洋进行脸部识别，协助警方破案；（3）判断年龄变化是否会影响该算法的识别结果，并用算例加以说明；（4）与已有人脸识别算法相比我们设计的算法有哪些优势。 2.问题分析本题需要我们建立模型设计出算法，实现人脸自动识别。主要有以下几个问题需要解决：识别题目所给数据库中的人脸，对生活中的普通照片和网络照片进行匹配识别，利用算例研究年龄对本算法进行人脸识别的影响，最后，给出本文建立的算法与已有算法相比有什么优势。要解决这些问题，主要的思路就是要建立一个模型和算法，能够自动实现不同状况条件下的人脸识别。
11
识别人脸图像最相似的人脸图像。这里给出一次匹配成功的界面图片：
图 7 基于欧式距离的人脸识别当给出原始图像后，在 200 个图像数据库里查找，由上图结果可知基于欧式距离的人脸识别结果模型给出了图像数据库里能够与原始待识别图像匹配度最高的图像。 4.1.4 基于支持向量机的人脸识别模型前文阐述了对人脸图像进行预处理的综合有效的方法，然后基于预处理后的图像用主成分分析法提取人脸特征信息，最后基于欧氏距离判据来对图像进行识别。这里的基于支持向量机的人脸识别结果模型也能够有效地对各张图像的投影系数进行分类，从而识别出待检测的人脸图像。传统的支持向量机是通过对两类数据的学习寻找一个最优分类
9
特征脸的生成过程，仍然取上文用来生成平均脸的那 200 张图像。 Step 1: 计算 200 张图像的平均脸 m= Step2:
1 200 Xi 200 i 1
计算每一张人脸图片与平均脸的差别
d i X i m(i 1,2, …200)
Step3: 构建协方差矩阵： C
开
始
选取训练集样本构造特征脸空间
将预存人脸投影到特征脸空间
Leabharlann Baidu
将待别人投影特征空间
识脸到脸
计算欧式距离
返回最小距离的图像
结
束
图 6 基于欧式距离的人脸识别算法流程图待识别的人脸图像投影到特征脸空间，得到待识别的第 j 张人脸图像，结合前面 PCA 模型得出投影系数公式为 j z T ( m) . 前文取了 200 张人脸图像作为训练集。识别过程中计算 j 和人脸数据库里每个人脸的距离 j 2 || - j ||2 .最后通过编写程序就能实现查找与待
Step3 ：人脸边缘检测。经二值化后的人脸图像中,数值为 0 的部
分表示背景,数值为 1 的部分表示人脸。运用 matlab 中的 regionprops 函数求像素数值 1 的 8 连通区域，构建包含像素数值 0 的最小矩阵，得到人脸的边缘区域。
5
Step4 ：图像规范化。在 Step3 中已求得人脸边缘矩阵，运用 matlab
Step1 :光线补偿。由于图片存在光照不均匀的情况,所以在对图像
进行处理之前对图片进行光线补偿。即把图片中亮度最大的的像素提取出来,计算这些像素的总灰度值,求得光线补偿系数。根据光线补偿系数把整个图片的亮度进行线性放大。
Step2 ：二值化。经过光线补偿后的图像是具有多个灰度级的单
色图像。由于每个人自身的脸部肤色基本一致，且与背景颜色相差很大。为了将人脸区域与背景区域分别开来，便于识别人脸区域,要将这些多值图像转换成只具有黑白两个灰度级的二值图像。
10
Qi
1
i
Ai , (i 1,2, …p) . 则“特征脸”空间为 z=( Q1, Q2 , …Q p ). 最后将每
一幅人脸与平均脸的差值矢量投影到“特征脸”空间，即
z T d i (i 1,2, …5) 。用 Matlab 编写程序即可以求解各个人脸图像投
影到特征脸空间的坐标系数。 4.1.3 基于欧式距离的人脸识别模型根据前面基于 PCA 的人脸特征提取模型可以得到降维的“特征脸”空间，则每个预存人脸图像和待识别人脸图像都可以投影到特征脸空间得到一个对应的坐标，按照欧式距离的计算方法计算待识别人脸图像与预存数据库中的人脸图像的距离，将距离最小的预存人脸图像输出作为识别的结果。据此，可以总结出基于欧式距离的人脸识别模型的算法流程图如下：
3
3.2 符号的约定与说明编号 1 2 3 4 5 6 7 符号 m
di
说明平均脸列向量第 i 张人脸与平均脸 m 的差值矢量训练样本集的协方差矩阵特征脸空间支持向量机中训练样本的类别数图像在特征脸空间的坐标系数欧式距离
C z K

j
4.模型的建立与求解 4.1 问题一：设计算法对数据中的人脸进行识别题目所给的数据库包含了 13000 张人脸，共 5749 个身份。通过对数据库中的图片进行分析可知，每张图片中人脸的个数不唯一，每个人的脸型大小不同，面部特征不同，并且由于拍摄角度，距离以及拍摄时的光线不同，不同图片中的同一个人的脸所在位置和大小等特征都可能不同。所以人脸识别的第一步就是人脸检测及预处理，即通过一系列预处理，在输入图像中锁定人脸,并准确定位其位置和大小。特征提取是人脸识别过程中重要的过程，本文采用主成分分析法
其是对去除椒盐噪声更加有效，而且能比较好地保留图像边缘的锐度和图像细节特征。中值滤波的效果图如下：
图 2 中值滤波效果图
Step6 ：直方图均衡化。即把一已知灰度概率分布的图像，变换
成具有均匀概率分布的新图像的过程。其示意图如下：
7
图 3 直方图均衡化结果图把数据库中的 13000 多张图片全部进行预处理，就得到了 13000 多张人脸照片，观察结果可知，成功率大于 90%，符合预期。 4.1.2 基于 PCA 的人脸特征提取模型在人脸识别的科研领域里，如何能够有效地用低维提取和表示出人脸特征的信息一直是研究的热点话题。而作为统计学方法的主成分分析法可以实现这样的功能，所以在人脸识别领域发挥着重大的作用。 A 平均脸的生成在计算机里每一张图像的存储方式是矩阵的形式，而为了构造人脸向量数据库以方便求出平均脸和特征脸，则需将每一张图像对应的
1 200 1 T di * di AAT 200 i 1 200
Step4: 运用奇异值分解求 V= AT A 的特征值 i 和正交归一化向量 i
将特征值 i 按照从大到小的顺序排列，根据查找的文献资料，选取前 P 个特征值使它们的和大于 90%，然后用选取的 p 个特征值对应的特征向量构成特征脸空间的转换矩阵，将部分特征脸输出如下：
数学建模校内竞赛论文
论文题目：基于 PCA 和 SVM 的人脸识别算法
基于 PCA 和 SVM 的人脸识别算法摘要
由于人脸图像对光照、表情等变化较为敏感，导致人脸图像特征提取，特征分类难度大，人脸识别技术在精度和识别率等方面存在问题。本文针对人脸识别问题设计了行之有效的综合创新算法。它改进了传统的基于几何特征的人脸识别方法，结合人脸的肤色模型使得人脸检测的算法得以简化；使用现今的主成分分析算法，在更低的维度提取了人脸图像的主要特征信息；融合了基于欧氏距离的人脸识别模型和基于支持向量机的人脸识别模型，集成了二者的优点，提高了算法的准确率。针对问题一，设计了一套包括图像预处理，图像特征提取，图像识别判据的综合算法来对人脸进行更有效地识别，识别准确率较高。针对问题二和问题三，分别根据题目要求更新了数据库，并运用问题一的模型，对题目要求的图片进行识别。其中问题二中犯罪嫌疑人的照片被成功识别，问题三中部分不同年龄的照片被识别出来。针对问题四，重点阐述本文设计的算法具有很强的综合性和较好的创新性，从而突出它相对于已有人脸识别算法的优势。
图 5 部分特征脸这些部分特征脸的每张特征脸都含有 200 张图片里的多张人脸图像的拓扑信息，所以上面的每一张特征脸不是真正意义的一张人脸图像。接下来通过求取每一张图像在构建的降维特征脸空间下的投影系数，获知该图像在特征脸空间下的位置信息，从而可以作为人脸识别的依据。在如上的操作步骤进行到 step4 之后，利用奇异值分解的理论可以导出计算协方差矩阵 C 的前 P 个特征向量的公式：
( PCA) 进行特征提取。实质是假设所有的人脸都处于一个低维线形空
4
间,而且不同的人脸在这个空间中具有可分性。具体做法是由高维图像空间经 KL 变换后得到一组新的正交基,对其进行取舍,保留主要信息生成低维的人脸空间,也即人脸的特征子空间。识别过程是人脸识别最后一步，也是呈现识别结果的过程。本文采取欧式距离法和基于支持向量机法进行识别，并且根据结果对两种方法进行比较。 4.1.1 图像预处理首先对本题数据库中的图片进行预处理，本文图片预处理主要是基于肤色检测与人脸特征相结合的方法，其主要步骤如下：
函数求得其中心坐标，查阅资料得到人脸长宽比例即矩阵大小，将人脸图像规范化，图像大小为 140 110 ，如图 1 所示。
（0_1）
（0_2）
（0_3）
原始图像
(1_1)
(1_2) 图像规范
(1_3)
(2_1)
(2_2) 规范结果
6
(2_3)
图 1 图像规范化示意图
Step5 ：中值滤波。中值滤波算法不仅能有效去除图像噪音，尤
2
问题一：数据库中每张图片包含的人脸个数不唯一，并且人脸的位置和形状大小等特征差异很大，所以需要先对图片进行预处理，以准确获得完整清晰的人脸图像。由于每张人脸照片的信息量很大，进行识别前需要用主成分分析法提取主要的特征信息。分别采用欧式距离法和基于支持向量机的方法识别数据库中的照片。问题二：要对犯罪嫌疑人进行人脸识别，需要先提取犯罪嫌疑人的照片，并且构建包含其照片的人脸数据库。运用问题一所构建的模型和算法，对其进行人脸识别。问题三：随着年龄的变化，人的脸部特征会发生很大的变化，这使人脸识别的难度加大。数据库中每个人的照片年龄差距很小，需要通过网络途径得到一些不同年龄的照片，通过算例得出年龄对算法的影响。问题四：通过大量地阅读文献，改进本文的算法，得出本文与已有人脸识别算法相比的优势。 3.模型的假设与符号的约定 3.1 模型的假设与说明 (1)假设题目所给的数据库中每张照片都必须包含一张完整的人脸 (2)假设每张图片上对应的名字都正确 (3)假设今日说法视频中出现的照片真实