基于主成分分析的人脸特征提取

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

! 令 m 为{ x i | i = 1,
, M} 的均值, 即: m =
1 M
M
x i; 又令
i= 1
i 为各向量相 对于该均值的偏差, 即: i = x i - m
令 W= [ i M] , 计算的协 方差 矩阵 C= W WT , 则矩 阵 C
的各特征向量构成的 单位正交基对应对于 i 的一组投影坐标。
二、P CA 原理
( 一) 概述 主成分分析法( P CA) 是模式识别判别分析中最常用的一种 线性映射方法, 该方法是根 据样本 点在多 维模式 空间的 位置分 布, 以样 本点在空间 中变化最大 方向, 即方差最 大的方向, 作为 判别矢量来实现数据的特征提取与数据压缩的。从概率统计观 点可知, 一个随机变量的方差越大, 该随机变量所包含的信息就 越多, 如 当一个变量 的方差为零 时, 该 变量为一 常数, 不含任何 信息。所谓 主成分就是原始数据的 m 个变量经线 性组合( 或映 射) 后得到的变量, 该变化使得 其变换 后的变量 方差为 最大( 第 一主成分) 的部 分。各 个主 成分 之间 是相 互线 性无 关的 ( 正交 的) , 从第一主成分往后, 主成分按方差大小的顺序排列( 对应特 征值按大小顺序 排列) 。对于 特征值 为 i 的主 成分, i 也 是该 主成分的方差, 该值表示样本点在该主成分方向的离散 程度, 主 成分 i 的贡献率 i 可用下式表示: i = i/( 1 + 2+ + p) 主成分中方差较小 或 i 较小的 主成 分被认 为包 含的 是噪 声, 在分析时不使 这 些变 量引 入模 型, 这样 使分 析的 主成 分减 少, 以达到降维的目的。 主成分中任两个可构成 判别分 析平面, 因此 可实现高 维空 间向两维平面及其他维平面映射的目的。一般取方差较大的几
246 E N TR EPREN EU R WO R LD
的特征向量。
三、基于 P CA 方法的人脸特征提取
人脸识别问题中 , 通过将 二维人 脸灰度 矩阵的 各行级 联起
来, 可以得到一个 K 维向 量。假定 样本 集中 有 M 个长 度为 N ( 人脸图像灰度矩阵 的行 * 列) 的 长向 量, 表 示如 下( pj 为像 素 的灰度值) :
x i= [ p1 pN ] T , i= 1, 2, , M
个主成分构成判别分 析平面。
( 二) 原理
令 x 为 表示环境的 m 维随机向 量。假设 x 均值为 零, 即 E
[ x] = 0;
令 w 表示为 m 维单位向量, x 在其上投 影。这个投影 被定
义为向量 x 和 w 的内积, 表示为:
n
! y =
wkx k = wTx
k= 1
满足约 束条件|
|
w|
因为矩 阵 W 大小为 N ∀ M , 因此 C 矩阵大小为 N ∀ N( N 为
人脸图像分辨率, 通常 N #10000) , 求解这样大矩阵的特征 值和 特征向量将会 消耗相 当大 的计 算 资源。考 查矩 阵 WT W, 其 大
小为 M ∀ M , 通常样本数量 不会太多( M ∃ 1000) , 因此我们 先计 算 该矩阵的特征值和特征向量, 假定为 %i 和 !%i, 则有: WT W!%i=
( 1) 计算人脸灰度图象向量的平均值( 如图 1) :
五、结论
本文深入的介绍 了 PCA 的原理, 其 基本思想是提取出空间 原始数据中的主要特 征( 主元) , 减少数据冗余, 使得数据在一个 低维的特征空间被处理, 同时保持原始数据的绝大部分的信息, 从而解决数据空间 维数过 高的瓶 颈问题。并 利用了 PCA 方法 成功的完成了人脸 的特征 提取和检 测, 给出了 实验结果。 由于 从照片或摄像机拍摄 图像中检测出的人脸还存在表情和光照等 因素的影响, 因此还需要更进一步的图像处理和特征提取, 有待 于我们进一步的研究 。
四、基于 PCA 方法的人脸检测
特征相量 !i 如 果按照人 脸图 像的 排列方 式组 成一幅 新的 图像, 称 为特征图像, 因为 它看起来确 实像一幅 人脸图像, 因此 也称为特征脸, 而 ∀ n 的值表 示各 特征 脸在 该人 脸图 像中 所占 的比例成分。各人脸图像都可以通过这种特征脸的方法重构出 来, 通过比较重构后 ∀ i 之间的 欧拉距离可以用于识别当前图像 所属人脸类别或者是否为人脸图像。我们采用该方法在一幅含 有背景的照片中检测出人脸, 步骤如下:
参考文献: [ 1] R af ael C. G on zal ez, R ichard E. Woods, S teven L. Eddin s 著 阮秋
琦 等译 数字图像处理[ M ] 电子工业出版社。2006, 4. [ 2] 周激流, 张晔. 人脸识别理论研究进展[ J ] . 计算机辅助设 计与图
综合
基于主成分分析的人脸特征提取
刘小凤 李 文
摘 要: 主成分分析是一种数学变换的方法, 其基本思想是提取 出空间原始数据中的主要特征( 主元) , 减少数据冗余, 使得数据 在一个低维的特征空间被处 理, 同 时保持 原始数 据的绝 大部分 的信息, 从而解决数据 空间维 数过高 的瓶颈 问题。本文 通过主 成分分析法对人脸特征 进行提取。 结果表 明, 该 提取方 式识别 率较高。 关键词: P CA ; 人脸识别; 特征提取 中图分类号: F 123. 16 文献标识 码: A 文章编号: CN 43- 1027/ F( 2010) 12- 245- 02 作 者: 中山职业技术学院计算机工程系; 广东, 中山, 528404
一、引言
人脸识别技术在信息安全领域应用较广, 如公安系 统、银行 与海关的监控系统等。计算 机人脸 识别技 术困难较 多, 关键在 于人脸表情丰富; 人脸受外部环境的影响等。另外, 人脸识别还 与图像处理、模式识别及神经网络等学科联系 紧密。因 此, 人脸 识别中所选取的特征必须对上述因素具备一定的鲁棒性。主成 分分析( P rincipal Component A nalysis, PCA) 是当前用得最多的 特征提取方法, 是用于信号 恢复的经 典算法, 研 究证明 PCA 提 取出来的图像特征与人类视觉上感知细胞感知的特征有很大的 相似性。
%i !%i 两边同时左乘 W, 得到: ( WWT ) W!%i = %i W!%i。 由上式可以 看出, C 矩阵的 前 M - 1 个特征 值 i 和特 征向
量 !i 分别为 %i 和| | W!%i | | ( W!%i归 一化 ) 。既 然我 们只 是将 个 M 个图像向量合成为矩阵 W , 因此其协方差矩 阵的秩不可 能超 过 M - 1 ( - 1 来源 于各图 像向量 与均值 向量相 减) , 所以 C 矩
图 1 人脸灰度图象向量的平均值 ( 2) 计算协方差矩阵 的特征 值和特 征向量, 提取 脸部特 征, 构造特征脸( 选取前 10 个特征向量) ( 如图 2) 。 ( 3) 计算各人脸图像库中各样本的 ∀ i 值。 ( 4) 利用一栅格扫描待检测图像, 利用特征脸计算各扫描图 像的 ∀ 值, 计算其与样本 ∀ i 之间的 欧拉距 离:∃i = | | ∀ - ∀ i| | , 若有任一∃i 的值小于预设的阈值, 则认 为当前扫 描图像 为一幅 人脸, 否则认为不是人脸( 如图 3) 。 至此, 我们通过 PCA 方法实现了人脸的特征提取和检测。
阵的其它特征值均为零。通过这种方法 可以求出矩阵的所有特
征值和特征向量。
将特征向量按照 特征值由 大到小 的顺序排 列, 对应于 最大 特征值的特征向量能够反映出 人脸图像的最大相异性。特征值
企业家天地 245
综合
大小按照指数规律递减, 因此, 大约最 开始 5% ~ 10% 的 特征值 蕴含了人脸图像 90% 的相异性, 即人脸信息 绝大部分包 含在最 开始 5% ~ 10% 特征值 所对应 的特征 向量中, 这使 得我们 能够 对协方差矩阵 C 降维。我们抽取 C 矩阵的前 50 个特征 值和特 征向量构成特征空间, 令 vm = !Ti w n ( w n 为 某一 幅人 脸图 像向 量与图像 m 均值的差, 1∃ i ∃ 50) , 则 ∀ n = [#n1#n2 #n50 ] T 为该 图像在特征空间中 投影 得到 的新 图 像向 量, 它只 有 50 维 的大 小, 且保留了原图像的绝大部分信息。
|
=
(
w T成分分 析的 目的
就是寻找一个权值向 量 w 使得表达式的值最大化:
E[ y2 ] = E[ ( w T x ) 2 ] = wT E[ x x T ] w = wT Cxw 根据线性代数的 理论, 可以知道满 足式子值 最大化的 w 应
该满足下式:
Cxw j = jw j j= 1, 2, , m 即使得上述式 子最大 化的 w 是 矩阵的 最大 特征值 所对 应
形学学报, 1999, 11( 2) : 180- 184. [ 3] 李刚. 基于特征脸法的 正面人 脸识 别研究 [ D] . 北京: 国防 科技
大学研究生院, 2002. [ 4] 齐怀峰. 基于特征脸的人脸检测与识别[ J ] . 云南: 云南师 范大学
学报, 2005, 25( 9) : 22- 23. ( 责任编辑: 侯高杰)
相关文档
最新文档