基于人脸识别的数学建模优秀论文3
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8
矩阵转换成列向量。设每张灰度图像的行数为 N, 列数为 M,则灰度 图像能够转换为一个 N*M 行,1 列的向量。从图片数据库里选取 L 张图像,由这 L 张图像的列向量组成一个 n*m 行,L 列的矩阵 T。对 矩阵 T 各个列向量求取平均值得到 m,m 也为 N*M 行,1 列的向量。 由均值 m 可以还原回 N*M 的矩阵,从而做出平均人脸的图像。为了 能够简单地展示平均人脸的效果, 只随机选取图像数据库中的 200 张 图像,生成平均脸的效果如下:
图 4 平均脸
这张平均脸平均综合反映了 200 张人脸图像的信息, 并不是普通 意义下只针对一个人的人脸图像。 B 特征脸的生成和投影系数的求取 对一张图像进行特征信息提取, 往往由于维数过高带来计算困难 的难题。而 PCA 能够基于 K-L 变换有效地实现对图像降维。经过查阅 文献资料,将 K-L 变换的原理简单地阐述如下:在原图像的测量空间 找出一组 u 个正交矢量, 要求这组正交矢量能最大程度地反映出数据 方差, 然后将原图片模式矢量从 w 维空间投影到这组正交矢量构成 u 维子空间,则投影系数为构成原模式的特征矢量,由于要求 u<w,所 以 PCA 能够实现维数的压缩。 为了简洁地阐述投影系数的求取步骤和
关键词:预处理 主成分分析法 欧式距离 支持向量机
1
1. 问题重述 与人的指纹不同,人脸总是在不断变化的。只是微笑一下,人脸 就发生了改变。 眼角纹、 鼻子的反光点、 露出的牙齿, 统统都在改变。 仰天大笑,脸上显现的形状很快发生变化。即使有同样的表情,人的 头发也在不断发生变化,刚理发后的变化更是非常大。然而,人眼却 能毫不费力地从一堆照片中认出他认识的人, 即使这个人他们只见过 一面。题目所给的人脸数据库包含了 13000 张人脸,共 5749 个身份, 本文需要基于题目所给出的数据库,解决如下问题: (1)设计算法,识别该数据库中的人脸,与人眼识别结果进行比较; (2)对《今日说法》2015 年 6 月 27 日节目“藏在大衣里的纸条” 中的犯罪嫌疑人胡洋进行脸部识别,协助警方破案; (3)判断年龄变化是否会影响该算法的识别结果,并用算例加以说 明; (4)与已有人脸识别算法相比我们设计的算法有哪些优势。 2.问题分析 本题需要我们建立模型设计出算法,实现人脸自动识别。主要有 以下几个问题需要解决:识别题目所给数据库中的人脸,对生活中的 普通照片和网络照片进行匹配识别, 利用算例研究年龄对本算法进行 人脸识别的影响,最后,给出本文建立的算法与已有算法相比有什么 优势。要解决这些问题,主要的思路就是要建立一个模型和算法,能 够自动实现不同状况条件下的人脸识别。
11
识别人脸图像最相似的人脸图像。这里给出一次匹配成功的界面图 片:
图 7 基于欧式距离的人脸识别 当给出原始图像后,在 200 个图像数据库里查找,由上图结果可 知基于欧式距离的人脸识别结果模型给出了图像数据库里能够与原 始待识别图像匹配度最高的图像。 4.1.4 基于支持向量机的人脸识别模型 前文阐述了对人脸图像进行预处理的综合有效的方法,然后基于 预处理后的图像用主成分分析法提取人脸特征信息, 最后基于欧氏距 离判据来对图像进行识别。 这里的基于支持向量机的人脸识别结果模 型也能够有效地对各张图像的投影系数进行分类, 从而识别出待检测 的人脸图像。 传统的支持向量机是通过对两类数据的学习寻找一个最优分类
9
特征脸的生成过程,仍然取上文用来生成平均脸的那 200 张图像。 Step 1: 计算 200 张图像的平均脸 m= Step2:
1 200 Xi 200 i 1
计 算 每 一 张 人 脸 图 片 与 平 均 脸 的 差 别
d i X i m(i 1,2, …200)
Step3: 构建协方差矩阵: C
开
始
选取训 练集样 本构造 特征脸 空间
将预存 人脸投 影到特 征脸空 间
Leabharlann Baidu
将待 别人 投影 特征 空间
识 脸 到 脸
计算 欧式 距离
返回 最小 距离 的图 像
结
束
图 6 基于欧式距离的人脸识别算法流程图 待识别的人脸图像 投影到特征脸空间,得到待识别的第 j 张人 脸图像,结合前面 PCA 模型得出投影系数公式为 j z T ( m) . 前文 取了 200 张人脸图像作为训练集。 识别过程中计算 j 和人脸数据库里 每个人脸 的距离 j 2 || - j ||2 .最后通过编写程序就能实现查找与待
Step3 :人脸边缘检测。经二值化后的人脸图像中,数值为 0 的部
分表示背景,数值为 1 的部分表示人脸。运用 matlab 中的 regionprops 函数求像素数值 1 的 8 连通区域,构建包含像素数值 0 的最小矩阵, 得到人脸的边缘区域。
5
Step4 : 图像规范化。 在 Step3 中已求得人脸边缘矩阵, 运用 matlab
Step1 :光线补偿。由于图片存在光照不均匀的情况,所以在对图像
进行处理之前对图片进行光线补偿。 即把图片中亮度最大的的像素提 取出来,计算这些像素的总灰度值,求得光线补偿系数。根据光线补偿 系数把整个图片的亮度进行线性放大。
Step2 :二值化。经过光线补偿后的图像是具有多个灰度级的单
色图像。由于每个人自身的脸部肤色基本一致,且与背景颜色相差很 大。为了将人脸区域与背景区域分别开来,便于识别人脸区域,要将 这些多值图像转换成只具有黑白两个灰度级的二值图像。
10
Qi
1
i
Ai , (i 1,2, …p) . 则“特征脸”空间为 z=( Q1, Q2 , …Q p ). 最后将每
一幅人脸与平均脸的差值矢量投影到“特征脸”空间,即
z T d i (i 1,2, …5) 。用 Matlab 编写程序即可以求解各个人脸图像投
影到特征脸空间的坐标系数。 4.1.3 基于欧式距离的人脸识别模型 根据前面基于 PCA 的人脸特征提取模型可以得到降维的“特征 脸”空间,则每个预存人脸图像和待识别人脸图像都可以投影到特征 脸空间得到一个对应的坐标, 按照欧式距离的计算方法计算待识别人 脸图像与预存数据库中的人脸图像的距离, 将距离最小的预存人脸图 像输出作为识别的结果。据此,可以总结出基于欧式距离的人脸识别 模型的算法流程图如下:
3
3.2 符号的约定与说明 编号 1 2 3 4 5 6 7 符号 m
di
说明 平均脸列向量 第 i 张人脸与平均脸 m 的差值矢量 训练样本集的协方差矩阵 特征脸空间 支持向量机中训练样本的类别数 图像在特征脸空间的坐标系数 欧式距离
C z K
j
4.模型的建立与求解 4.1 问题一:设计算法对数据中的人脸进行识别 题目所给的数据库包含了 13000 张人脸,共 5749 个身份。通过 对数据库中的图片进行分析可知,每张图片中人脸的个数不唯一,每 个人的脸型大小不同,面部特征不同,并且由于拍摄角度,距离以及 拍摄时的光线不同, 不同图片中的同一个人的脸所在位置和大小等特 征都可能不同。所以人脸识别的第一步就是人脸检测及预处理,即通 过一系列预处理,在输入图像中锁定人脸,并准确定位其位置和大小。 特征提取是人脸识别过程中重要的过程, 本文采用主成分分析法
其是对去除椒盐噪声更加有效, 而且能比较好地保留图像边缘的锐度 和图像细节特征。中值滤波的效果图如下:
图 2 中值滤波效果图
Step6 :直方图均衡化。即把一已知灰度概率分布的图像,变换
成具有均匀概率分布的新图像的过程。其示意图如下:
7
图 3 直方图均衡化结果图 把数据库中的 13000 多张图片全部进行预处理,就得到了 13000 多张人脸照片,观察结果可知,成功率大于 90%,符合预期。 4.1.2 基于 PCA 的人脸特征提取模型 在人脸识别的科研领域里, 如何能够有效地用低维提取和表示出 人脸特征的信息一直是研究的热点话题。 而作为统计学方法的主成分 分析法可以实现这样的功能,所以在人脸识别领域发挥着重大的作 用。 A 平均脸的生成 在计算机里每一张图像的存储方式是矩阵的形式, 而为了构造人 脸向量数据库以方便求出平均脸和特征脸, 则需将每一张图像对应的
1 200 1 T di * di AAT 200 i 1 200
Step4: 运用奇异值分解求 V= AT A 的特征值 i 和正交归一化向量 i
将特征值 i 按照从大到小的顺序排列,根据查找的文献资料,选 取前 P 个特征值使它们的和大于 90%, 然后用选取的 p 个特征值对应 的特征向量构成特征脸空间的转换矩阵,将部分特征脸输出如下:
数学建模校内竞赛论文
论文题目:基于 PCA 和 SVM 的人脸识别算法
基于 PCA 和 SVM 的人脸识别算法 摘要
由于人脸图像对光照、表情等变化较为敏感,导致人脸图像特征 提取,特征分类难度大,人脸识别技术在精度和识别率等方面存在问 题。本文针对人脸识别问题设计了行之有效的综合创新算法。它改进 了传统的基于几何特征的人脸识别方法, 结合人脸的肤色模型使得人 脸检测的算法得以简化;使用现今的主成分分析算法,在更低的维度 提取了人脸图像的主要特征信息; 融合了基于欧氏距离的人脸识别模 型和基于支持向量机的人脸识别模型,集成了二者的优点,提高了算 法的准确率。 针对问题一,设计了一套包括图像预处理,图像特征提取,图像 识别判据的综合算法来对人脸进行更有效地识别,识别准确率较高。 针对问题二和问题三,分别根据题目要求更新了数据库,并运用 问题一的模型,对题目要求的图片进行识别。其中问题二中犯罪嫌疑 人的照片被成功识别,问题三中部分不同年龄的照片被识别出来。 针对问题四, 重点阐述本文设计的算法具有很强的综合性和较好 的创新性,从而突出它相对于已有人脸识别算法的优势。
图 5 部分特征脸 这些部分特征脸的每张特征脸都含有 200 张图片里的多张人脸 图像的拓扑信息, 所以上面的每一张特征脸不是真正意义的一张人脸 图像。 接下来通过求取每一张图像在构建的降维特征脸空间下的投影系 数,获知该图像在特征脸空间下的位置信息,从而可以作为人脸识别 的依据。在如上的操作步骤进行到 step4 之后,利用奇异值分解的理 论可以导出计算协方差矩阵 C 的前 P 个特征向量的公式:
( PCA) 进行特征提取。实质是假设所有的人脸都处于一个低维线形空
4
间,而且不同的人脸在这个空间中具有可分性。具体做法是由高维图 像空间经 KL 变换后得到一组新的正交基,对其进行取舍,保留主要信 息生成低维的人脸空间,也即人脸的特征子空间。 识别过程是人脸识别最后一步,也是呈现识别结果的过程。本文 采取欧式距离法和基于支持向量机法进行识别, 并且根据结果对两种 方法进行比较。 4.1.1 图像预处理 首先对本题数据库中的图片进行预处理, 本文图片预处理主要是 基于肤色检测与人脸特征相结合的方法,其主要步骤如下:
函数求得其中心坐标,查阅资料得到人脸长宽比例即矩阵大小,将人 脸图像规范化,图像大小为 140 110 ,如图 1 所示。
(0_1)
(0_2)
(0_3)
原始图像
(1_1)
(1_2) 图像规范
(1_3)
(2_1)
(2_2) 规范结果
6
(2_3)
图 1 图像规范化示意图
Step5 :中值滤波。中值滤波算法不仅能有效去除图像噪音,尤
2
问题一:数据库中每张图片包含的人脸个数不唯一,并且人脸的 位置和形状大小等特征差异很大,所以需要先对图片进行预处理,以 准确获得完整清晰的人脸图像。由于每张人脸照片的信息量很大,进 行识别前需要用主成分分析法提取主要的特征信息。 分别采用欧式距 离法和基于支持向量机的方法识别数据库中的照片。 问题二:要对犯罪嫌疑人进行人脸识别,需要先提取犯罪嫌疑人 的照片,并且构建包含其照片的人脸数据库。运用问题一所构建的模 型和算法,对其进行人脸识别。 问题三:随着年龄的变化,人的脸部特征会发生很大的变化,这 使人脸识别的难度加大。数据库中每个人的照片年龄差距很小,需要 通过网络途径得到一些不同年龄的照片, 通过算例得出年龄对算法的 影响。 问题四:通过大量地阅读文献,改进本文的算法,得出本文与已 有人脸识别算法相比的优势。 3.模型的假设与符号的约定 3.1 模型的假设与说明 (1)假设题目所给的数据库中每张照片都必须包含一张完整的人脸 (2)假设每张图片上对应的名字都正确 (3)假设今日说法视频中出现的照片真实