DIP - 基于MATLAB的人脸识别算法课程设计报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字图像处理实验报告
院系:计算机科学学院
班级:计科11303
小组成员:张世柳、邓伟养、兰洋、冯威
成员学号: *********
实验名称:基于MATLAB的人脸识别算法
实验时间: 2015.10.01 - 2015.10.19
实验地点:东4教2号机房
目录
一、绪论 (2)
二、实验设计 (2)
(一)实验题目 (2)
(二)实验目的 (2)
三、实验准备 (2)
(一)环境准备 (2)
(二)知识准备 (3)
四、算法设计 (3)
(一)问题描述 (3)
1. 主成分的一般定义 (3)
2. 主成分的性质 (4)
3. 主成分的数目的选取 (4)
(二)PCA算法的功能实现 (5)
1. 人脸空间的建立 (5)
2. 特征向量的选取 (5)
3. 人脸识别 (5)
4. 识别流程 (6)
五、程序实现 (6)
(一)人脸识别程序 (6)
1. 用户界面 (6)
2. 选择图片 (6)
3. 图片选择后 (6)
4. 查找后 (6)
(二)测试及结果分析 (6)
六、实验总结 (7)
七、参考文献 (10)
一、绪论
随着科技的发展,人类社会的进步,传统身份识别由于容易遗失,容易被破解已不能起到身份识别作用。人们需要更加安全可靠的身份识别技术。而生物特征的独一无二,不易丢失和被复制的特性很好满足了身份识别的需要。同时随着计算机科学技术和生物医学的发展使得利用生物特征识别成为了可能。在生物特征识别领域,由于人脸识别的操作快速简单,结果直观,准确可靠,不需要人的配合等优点已成为人们关注的焦点。主成分分析(PCA)通过提取高维度的人脸图像的主元,使得图像在低维度空间中被处理来降低了图像处理的难度。由于其有效的解决了图像空间维数过高的问题,已经成为人脸识别领域非常重要的理论,本实验研究的是基于MATLAB人脸识别算法的实现。
二、实验设计
(一)实验题目
机器人视觉——基于MATLAB的人脸识别算法
(二)实验目的
1. 初步了解人脸识别的特征法;
2. 学会使用主成分分析算法(PCA);
3. 通过功能模块实现人脸识别系统;
4. 完成数字图像处理课程的作业要求。
三、实验准备
(一)环境准备
MATLAB 7.0
(二)知识准备
1. MATLAB的优势特点:
(1) 高效的数值计算及符号计算功能,能使用户从繁杂的数学运算分析中解脱出来;
(2) 具有完备的图形处理功能,实现计算结果和编程的可视化;
(3) 友好的用户界面及接近数学表达式的自然化语言,使学者易于学习和掌握;
(4) 功能丰富的应用工具箱,为用户提供了大量方便实用的处理工具。
2. 主成分分析(Principal Component Analysis,PCA),将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。PCA是数字图像处理中经常用到的降维方法,在处理有关数字图像处理方面的问题时,比如经常用的图像的查询问题,在一个几万或者几百万甚至更大的数据库中查询一幅相近的图像。这时,我们通常的方法是对图像库中的图片提取响应的特征,如颜色,纹理,sift,surf,vlad等特征,然后将其保存,建立响应的数据索引,再对要查询的图像提取相应的特征,与数据库中的图像特征对比,找出与之最近的图片。如果为了提高查询的准确率,通常会提取一些较为复杂的特征,如sift,surf等,一幅图像有很多个这种特征点,每个特征点又有一个相应的描述该特征点的128维的向量,设想如果一幅图像有300个这种特征点,那么该幅图像就有300*vector(128维)个,如果我们数据库中有一百万张图片,这个存储量是相当大的,建立索引也很耗时,所以用PCA将其降维。
四、算法设计
(一)问题描述
1. 主成分的一般定义
设有随机变量X1,X2,…,Xp,其样本均数记为,,…,,样本标准差记为S1,S2,…,Sp。首先作标准化变换,我们有如下的定义:
(1) 若C1=a11x1+a12x2+ … +a1pxp,…,且使 Var(C1)最大,则称C1为第一主成分;
(2) 若C2=a21x1+a22x2+…+a2pxp,…,(a21,a22,…,a2p)垂直于(a11,a12,…,a1p),且使Var(C2)最大,则称C2为第二主成分;
(3) 类似地,可有第三、四、五…主成分,至多有p个。
2. 主成分的性质
主成分C1,C2,…,Cp具有如下几个性质:
(1) 主成分间互不相关,即对任意i和j,Ci 和Cj的相关系数
Corr(Ci,Cj)=0 i j
(2) 组合系数(ai1,ai2,…,aip)构成的向量为单位向量,
(3) 各主成分的方差是依次递减的,即
Var(C1)≥Var(C2)≥…≥Var(Cp)
(4) 总方差不增不减,即
Var(C1)+Var(C2)+ … +Var(Cp)
=Var(x1)+Var(x2)+ … +Var(xp) =p
这一性质说明,主成分是原变量的线性组合,是对原变量信息的一种改组,主成分不增
加总信息量,也不减少总信息量。
(5) 主成分和原变量的相关系数 Corr(Ci,xj)=aij =aij
(6) 令X1,X2,…,Xp的相关矩阵为R, (ai1,ai2,…,aip)则是相关矩阵R的第i个特征向量(eigenvector)。而且,特征值i就是第i主成分的方差,即
Var(Ci)=i
其中i为相关矩阵R的第i个特征值(eigenvalue)
1≥2≥…≥p≥0
3. 主成分的数目的选取
前面已指出,设有p个随机变量,便有p个主成分。由于总方差不增不减,C1,C2等前几
个综合变量的方差较大,而Cp,Cp-1等后几个综合变量的方差较小, 严格说来,只有前几个综合变量才称得上主(要)成份,后几个综合变量实为“次”(要)成份。实践中总是保留前几个,忽略后几个。
保留多少个主成分取决于保留部分的累积方差在方差总和中所占百分比(即累计贡献率),它标志着前几个主成分概括信息之多寡。实践中,粗略规定一个百分比便可决定保留几个主成分;如果多留一个主成分,累积方差增加无几,便不再多留。