数字图像处理 第十一章 图像特征提取与分类

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
BP神经网络的模型
11.3.2 神经网络方法
(二)、BP神经网络算法 BP (Back Propagation)神经网络全称为基于误差反向传播算法
的人工神经网络。相比较于数字计算机,人工神经网络在构成原理和 功能特点等方面更加接近人脑,与计算机不同,它不是按给定的程序 一步一步地执行运算,而是能够自身适应环境、总结规律、完成某种 运算、识别或过程控制。
(1)以每个关键点为中心选择一个大小为41×41的像斑 (2)分别计算区域内像素点(不包括边缘点)的垂直,水平梯度,得到 一个2×39×39=3042 维的特征向量。
11.4.2 增强型PCA-SIFT特征提取
(3)将关键点特征向量组成一个k×3042的矩阵A (4)使用PCA算法,得到一个n×3042的投影矩阵。 计算PCA-SIFT 投影矩阵的步骤:首先选取有代表性的图像,检测到这 些图像的所有关键点之后, (1)以每个关键点为中心选择一个大小为41×41的像斑 (2)分别计算区域内像素点(不包括边缘点)的垂直,水平梯度,得到一 个2×39×39=3042 维的特征向量。 (3)将关键点特征向量组成一个k×3042的矩阵A (4)使用PCA算法,得到一个n×3042的投影矩阵。
地解决由于环境变化而引起的图像变化问题。 该算法分为三个部分:Gabor变换,投影分析确定人眼区域的横坐
标和纵坐标。
11.4.1 基于Gabor滤波人眼定位算法
(二)、人脸图像的Gabor变换 Gabor滤波器的核函数
11.4.1 基于Gabor滤波人眼定位算法
Gabor基的实部
11.4.1 基于Gabor滤波人眼定位算法
(一)、BP神经网络的基本结构 BP网络是一种单向传播的多层前向网络,它具有三层或三层以上的神
经网络,包括输入层、中间层和输出层。
特点: 各层神经元仅与相邻层神经元之间相互全连接,同层内神经元之间无 连接,各层神经元之间无反馈连接,构成具有层次结构的前馈型神经网络 系统。
11.3.2 神经网络方法
11.2 常用的图像特征提取方法
11.2.1 低层次特征提取
(一)、灰度特征 灰度特征可以在图像的某些特定的像素点上或者其邻域内测定,也可
以在某个区域内测定。
11.2.1 低层次特征提取
(二)、周长和面积 周长与面积是描述图像区域大小的最基本的特征,周长与面积只与区
域的边缘有关,而与其内部灰度值的变化没有关系。 计算区域周长的方法: (1) 边界点的面积之和。
(1)将权值初始化为0-1之间的随机值; (2)从样本组中取出 x0 , x1,L xN1,输入网络,制定期望输出 d0 , d1,..., dM 1 ; (3)计算隐含层输出 h0 , h1,..., hL1 和网络实际输出 y0 , y1,..., yM 1
x0 , x1,..., xN 1
; (4)计算实输出和期望输出的误差:际
11.3.3 统计学习理论和支持向量机识别方法
SVM示意图
11.3.3 统计学习理论和支持向量机识别方法
超平面集满足 H1, H2 表达式 使分类间隔 2 最大的分类面就是最优分类超平面。
归一化表达式
11.3.3 统计学习理论和支持向量机识别方法
求解最佳 (,b) 问题转化为二次规划问题
11.3.3 统计学习理论和支持向量机识别方法
叠加在数字化边界线上的重取样网格
重取样的结果
11.2.2 高层次特征提取
0 01 1
0 3 3
01
3
1
3
1
1 21 2
3 32 3 2
0
7 2
1
6
2
6
1
6
2
6
3 3
5 5
重取样链码表示
11.2.2 高层次特征提取
边界的链码取决于起始点。可以通过简单的过程实现关于起始点的归 一化
起始点归一化
11.2.2 高层次特征提取
11.3.2 神经网络方法
(3) 输出层节点个数 输出层神经元个数:
(4) 隐含层节点个数 对于用于模式识别/分类的BP网络
11.3.2 神经网络方法
(5) 传输函数 BP网络中的传输函数通常采用(Sigmoid)型函数
(6) 训练方法及参数的选择 BP网络学习算法有多种:最速下降BP算法、动量BP算法、学习率可变 的BP算法、弹性BP算法、变梯度算法、拟牛顿算法等。
11.3.2 神经网络方法
隐含层误差
(5)调整权值
11.3.2 神经网络方法
(6)返回第(2)步,用所有样本反复训练网络,多次迭代,只到权值达到 稳定。实际训练时,定义出反映实际输出和期望误差平方和的价值函数
收敛规则
11.3.2 神经网络方法
(四)、BP网络参数选择
(1)网络层数 BP网络可以包含不同的隐含层。在不限隐含层节点数的情况下,两层 的BP网络就可以实现任意非线性映射,但BP网络隐含层数目一般不超过两 层。 (2)输入层节点个数 输入层神经元个数根据具体的字符所抽取的网格像素概率分布特征的 维数来确定。
规划问题的对偶问题,即最大目标函数
相应的分类决策函数
11.3.3 统计学习理论和支持向量机识别方法
对于线性不可分的情况,一方面用直线对其划分,另一方面通过事先 确定的非线性映射将输入向量x映射到一个高维的特征空间中去,然后在此 高维空间中构建最优超平面。
11.3.3 统计学习理论和支持向量机识别方法
链码旋转归 一化的意义
原始链码在边界旋转后发生变化,所以利用链码的一阶差分来重新构 造的序列就不会随边界的旋转而变化。
实现一阶差分链码:通过计算目标元素与其逆时针方向相邻元素的数 字来得到。
11.2.2 高层次特征提取
旋转归一化
11.2.2 高层次特征提取
(二)、傅立叶描绘子 假定物体的形状是一条封闭的曲线,沿边界曲线上的一个动点p(l)的坐
11.2.1 低层次特征提取
(三)、最小外接矩形——长轴与短轴
11.2.1 低层次特征提取
MER计算方法:将物体每次以左右的增量在范围内旋转。每旋转一次, 记录其坐标系方向上的外接矩形边缘点的最大和最小值,从而求出外接矩 形的面积。
11.2.2 高层次特征提取
(一)、链码 利用一系列具有特定长度和方向的相连直线段来表示目标的边界。 算法描述: (1)给每一个线段一个方向编码; (2)有4链码和8链码两种编码方法; (3)从起点开始,沿边界编码,至起点被重新碰到,结束一个对象的编码。
标变化为x(l)+jy(l)是一个以形状边界周长为周期的函数。
11.2.2 高层次特征提取
反变换
11.2.2 高层次特征提取
原图 K=64
p=4
p=61
p=62
11.2.2 高层次特征提取
(三)、纹理谱
像素点的纹理单元TU
11.2.2 高层次特征提取
像素值的纹理模式
归一化的纹理谱
11.3 图像特征分类基础
11.2.2 高层次特征提取
链码表示的特点: (1)只有边界的起点需用绝对坐标表示,其余点都可只用接续方向来 代表偏移量; (2)链码表达可大大减少边界表示所需的数据量。 采用链码的方法存在的问题: (1)产生的码串通常情况下会很长; (2)链码发生与目标整体形状无关的较大变动。
11.2.2 高层次特征提取
11.3.2 神经网络方法
(1)正向传播过程
设网络的输入层节点数为N,隐含层节点数为L,输出层节点数为M。rຫໍສະໝຸດ r输入向量为r
x
(x0 , x1,L
xN 1)
,其期望输出向量为
d (d0 , d1,..., dM 1) ,实际
输出为 y ( y0 , y1,L yM 1)
① 输入层:第i个节点的输入为:
满足Mercer条件的核函数,它就对应某一空间变换的内积 二次规划问题的目标函数
11.4 基于人脸图像的性别分类系统
11.4.1 基于Gabor滤波人眼定位算法
人眼定位的目的为了实现人脸图像的归一化校正。现有人眼定位的方 法主要有灰度投影、模板匹配、神经网络、活动形状模板(ASM)等方法。
(一)、Gabor滤波人眼定位算法的选择依据 将一幅图像分解为局部对称和反对称的基图像表示。而且能够较好
11.1 特称提取与分类概述
(三)、图像特征的概念
特征是某一类对象区别于其他对象的相应特点或特性,或是这些特点 和特性的集合。特征是通过测量或处理能够抽取的数据。对于图像而言, 每一幅图像都具有能够区别于其他类图像的自身特征,有些是可以直观地 感受到的自然特征,比如亮度。边缘、纹理和色彩等等吧,有些则是需要 通过变换或处理才能得到的,如矩、直方图以及主成分等。
模式识别处理流程
11.1 特称提取与分类概述
(二)、目标描述的概念
为便于识别,目标描述符应该具备如下重要的属性: 1、当两个目标具有相同的形状时,它们一定具有相同的描述符。 2、当同一目标发生一定的旋转或平移时,描述符不变,表明描述的是 同一个物体。 3、描述符尽量具备的性质,即它所描述的尽量包含一些该物体所特有 的,区别于其他物体的独一无二的特征。
② 隐含层:第j个节点的输入:
11.3.2 神经网络方法
③ 输出层:第k个结点输入:
BP网络的误差函数
11.3.2 神经网络方法
(2) 权值修正过程 输出层与隐含层之间的权值的调整对于每一个 wjk 的修正值
11.3.2 神经网络方法
11.3.2 神经网络方法
(3) 权值的调整方式
11.3.2 神经网络方法
11.4.1 基于Gabor滤波人眼定位算法
人眼定位效果图
11.4.2 增强型PCA-SIFT特征提取
(一)、PCA-SIFT介绍 首先利用SIFT检测关键点,然后利用关键点的特征向量使用PCA计算
投影矩阵,这样将新图像的SIFT特征向量与投影矩阵相乘就可以生成PCASIFT特征向量。
计算PCA-SIFT 投影矩阵的步骤:首先选取有代表性的图像,检测到 这些图像的所有关键点之后,
(2)当链码值为奇数时,其长度记作 ,当链码值为偶数时,其长度 记作1。周长P如下:
11.2.1 低层次特征提取
常用的面积计算方法: (1)一种是利用像素点数计算面积。
(2)利用链码计算面积。
11.2.1 低层次特征提取

则相应边缘包围的面积
11.2.1 低层次特征提取
(3)利用边缘坐标计算面积。
11.1 特称提取与分类概述
(四)、特征选择及分类的概念
从一组特征中挑选出一些有效的特征以达到降低特征空间维数的目的, 这个过程叫特征选择。
评判的标准有以下4个方面: 1. 可区别性 2. 可靠性 3. 独立性 4. 数量少
11.1 特称提取与分类概述
特征提取和选择的总原则是:尽可能减少整个识别系统的处理时间和 错误识别率,当两者无法兼得时,需要做出相应的平衡;或者缩小错误识 别的概率,以提高识别精度,但会增加系统运行的时间;或者提高整个系 统速度以适应实时需要,但会增加错误识别的概率。
11.3.1 距离分类器设计与应用
距离是描述像素点之间关系的重要度量,也是特征分类最简单的方法 之一。常用的表示方法有欧式距离,市区街道距离,棋盘距离等。 (一)、欧式距离
(二)、市区街道距离
11.3.1 距离分类器设计与应用
(三)、棋盘距离
欧几里德距离
市区街道距离
棋盘距离
11.3.2 神经网络方法
Gabor基的模
11.4.1 基于Gabor滤波人眼定位算法
Gabor变换
需要延拓图像边缘的过程
11.4.1 基于Gabor滤波人眼定位算法
(三)投影分析
Gabor变换的实部图
11.4.1 基于Gabor滤波人眼定位算法
Gabor变换后的人脸图像
11.4.1 基于Gabor滤波人眼定位算法
Gabor变换的人脸图像在水平和垂直方向的投影
11.3.2 神经网络方法
BP网络的实现分为两个阶段,即学习阶段和识别阶段。 学习阶段,输入要学习的样本,按照网络初始设定的权值以及传输函 数进行计算得出每一层神经元的输出。 识别阶段,对给定的输入根据训练完成的神经网格进行计算,从而得 到识别结果。
11.3.2 神经网络方法
(三)、BP网络的训练
11.2.2 高层次特征提取
4方向链码
8方向链码
11.2.2 高层次特征提取
例:若设起始点的坐标为,则分别用4方向和8方向链码按逆时针顺 序表示图11-4中网格图像的区域边界。则4方向链码:1 1 1 2 3 2 3 2 3 0 0 0; 8方向链码:2 2 2 4 5 5 6 0 0 0;
网格图像
11.1特征提取及分类概述
图像特征提取与分析的目的是为了让计算机具有认识或者识别图像的 能力,即图像识别。
图像识别是根据一定的图像特征进行的,因而,这些特征的选择便尤 为重要,将会直接影响到图像识别分类器的设计、性能及识别结果的准确 性。
11.1 特称提取与分类概述
(一)、模式识别系统的基本构成
相关文档
最新文档