图像识别与模式识别
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
特征选择 所要提取的应当是具有可区别性、可靠 性、独立性好的少量特征。 因此特征选择可以看作是一个(从最差 的开始)不断删除无用的特征和组合有关联 的特征的过程,直到特征的数目减少到易于 驾驭的程度,同时分类器的性能仍能满足要 求为止。
每类的每一个特征均值:
来自百度文库
假设训练样本中有 M 个不同类别的样本。 令 N j 表示第 j 类的样本数,第 j 类中第 i 个样本的两 个特征分别记为 xij 和 yij 。 每类的每一个特征均值:
T
x Rn
类别与类别空间:c个类别(类别数已知)
1, 2 , , i , c
基本概念
决 策
把样本x分到哪一类最合理?解决该问 题的理论基础之一是统计决策理论 决策:是从样本空间S,到决策空间Θ 的一个映射,表示为 D: S --> Θ
假设我们要把一个样本集合 {x1 , x2 ,......} M 分成M类 1 , 2 ,......, ; 如上所述,该样本集合可以表示为N维特 征空间 中的一个点集,它的分类问题表 x 述为将该特征空间划分为M个子空间,每 一子空间为一类,子空间中的样本点属于 相应类别。 这样,分类问题的关键就在于如何找到一 个正确子空间划分,即划分子空间的界面。
句法(或结构)模式识别
基于形式语言理论的概念为基础。模式按其结构分解为子模式 或模式基元,模式基元的连接关系以文法形式进行描述。
一个场景的示意图
场景结构的分析
模糊模式识别
模糊集理论,Zadeh,1965 模糊集理论在模式识别中的应用
神经网络模式识别
特点:具有信息分布式存储、大规模自适应并行处理、 高度的容错性以及学习能力 缺点:实际应用中仍有许多因素需要凭经验确定,比如 如何选择网络节点数、初始权值和学习步长等;局部极 小点问题、过学习与欠学习问题等
z
其中 是一个新的变量,它决定 x和 y 在组 合中的比例。
如果训练样本集中每一对象都对应于二 维特征空间(即平面 x y)中的一个点,上 式描述了为所有到在 z 轴(与 x 轴成 角) 上的投影。显然应选取使得类间距最大的 或者满足评价特征质量的其它条件的 。
8.2 统计模式识别
8.2.1 基本概念 这里我们讨论数字特征的识别。其前提 是,假定我们所处理的模式每一个样本都 表示为N维特征矢量,写为:
模式可以是以矢量形式表示的数字特征; 也可以是以句法结构表示的字符串或图; 还可以是以关系结构表示的语义网络或框 架结构等。 对于上述三种类型的模式,必须分别使用不 同的识别和推理方法:统计模式识别,句法 模式识别和人工智能方法。
统计模式识别
基本原理是:有相似性的样本在模式空间中互相接近, 并形成“集团”,即“物以类聚”。 主要方法有:决策函数法, k近邻分类法,支持向量机, 特征分析法,主因子分析法等… 参考书籍:《统计模式识别》(Andrew R.Webb) Jain A K, Duin R P W, Jianchang Mao. Statistical pattern recognition: a review. Pattern Analysis and Machine Intelligence, 2000. 22(1) : 4~37.
1 Nj
2 ˆ ( y ) ij yj i 1
Nj
在理想情况下同一类别中所有对象的 特征值应该很相近。
特征相关系数 第 j 类特征 和特征 y 的相关系数估计为
x
ˆ xyj
1 Nj
(x
i 1
Nj
ij
ˆ xj )( yij ˆ yj ) ˆ xj ˆ yj
1 ˆ xj Nj
x
i 1
Nj
ij
和
1 ˆ yj Nj
y
i 1
Nj
ij
注意:仅是两个值基于训练样本的估计值,而不是 真实的类均值。
特征方差 第 j 类的特征 x 和特征 y 的方差估值 分别为:
ˆ
2
xj
1 Nj
(x
i 1
Nj
ij
ˆ xj )
2
2 ˆ yj 和
它的取值范围为 [ 1,1]。 如果=0,说明这两特征之间没有相关性;接近+1 表示这两个特征相关性强;为 -1 表示任一特征都与 另一特征的负值成正比。 因此,如果相关系数的绝对值接近1,则说明这两 个特征可以组合在一个特征或干脆舍弃其中一个。
类间距离
一个特征区分两类能力的一个指标是类间距离, 即类均值间的方差归一化间距。显然,类间距离大 的特征是好特征。 对特征 x 来说,第 j 类与第 k 类之间的类间距为:
显然,特征矢量 x 可以表示为N维特征 矢量空间 中的一个点,这样统计模式识 x 别的概念及方法就可以在特征空间中予以 研究。
x ( x1 , x2 ,......, x ) N
模式分类:根据识别对象的观测值确定其类别 样本与样本空间表示:
x x1, x2 ,
, xn
“模式”是一个客观事物的描述,是指建立 一个可用于仿效的完善的标本。
模式识别的研究内容
1)研究生物体(包括人)是如何感知对象的,属 于认知科学的范畴 2)在给定的任务下,如何用计算机实现模式识别 的理论和方法
典型模式识别系统
图像识别系统
人脸识别系统
8
图像识别
8.1 概述 模式可以定义为物体的描述。由于描述这个 词的意义比较广泛,有人把它推广到图像数 据本身,因为图像数据也是相应事物的一种 描述,只不过这样的描述不够抽象和简要而 已。前章中我们已经讨论过图像的各种特征 和描述的提取方法。因此,我们将模式解释 为物体的较抽象的特征和描述。
图像处理
图 像
图像识别 图像理解
计算机图 形学
描 述
图像(模式)识别概念
图像识别与模式识别
模式识别:对表征事物或现象的各种形式的 (数值的,文字的和逻辑关系的)信息进行处 理和分析,以对事物或现象进行描述、辨认、 分类和解释的过程,是信息科学和人工智能的 重要组成部分。 什么是模式 (Pattern)?
ˆ D xjk
ˆ xj ˆ xk ˆ ˆ
2 xj 2 xk
降维 有许多方法可以将两个特征 x 和 y 合成为 一个特征 ,一个简单的方法是用线性函数: z ax by 由于分类器的性能与特征幅值的缩放倍数 无关,可以对幅值加以限制,如 a 2 b 2 1 因此 z x cos y sin