第10章 模板匹配与模式识别
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非监督分类
无法获得先验知识的情况下根据模式之间 的相似度进行分类。将相似性强的模式归为 同一类别,该方法又称为聚类分析其中k均值 聚类就是一种非监督分类的方法。
例:统计模式识别
19名男女同学进行体检,测量了身高和体重,但 事后发现其中有4人忘记填写性别,试问(在最小 错误的条件下)这4人是男是女?体检数值如下:
(i, j )
模板t(x,y) t(x,y)
图象f(x,y)
采用形式:非相似度、相似度
max f − t
s
非相似度
计算的是模板与 图象重合部分的 非相似度,该值 越小,则匹配程 度越好。
∫∫
s
f − t dxdy f − t dxdy
2
∫∫
s
s表示t x,y)定义的区域 (
相似度:
计算的是模板与图象重合部分的相似度,该 值越大,表示匹配程度越好
f3
{ck}
fi
fi
cm
f3
f2
f2
优点: 能够利用少量特征,使不同特征在不同判定中 起不同作用; 每次判定比较简单 缺点: 容易从树根就产生错误,并且不能够平等的使 用所有的特征 注意: 在靠近树根部必须选择稳定的,抗噪强的特征
实例:句法模式识别
问题:如何利用对图像的结构信息描述, 识别如下所示图片:
模式表示
图象输 入
识别 分析
预处 理
分割 描述
基元 提取
句法 分析
分类决策
训练 样本
基元 选择
句法 推断
句法 分析 改进 规则
结构模式识别系统框图
树分类法
树分类法:根据树型分层理论,将未知数据归属于某 一类的分类方法,是一种基于二叉树的分类方法。
{c1,c2,…,cn1}
f1
{c1,c2,…,cn} f1 {cn1+1,cn1+2,…,cn}
第10章 模板匹配和模式识别技术
1 基本概念:模式 模式识别
模式:存在于时间和空间中可观察的物体相同或 相似性;它指的不是事物本身,而是从事物获得 的信息,因此表现为具有时间和空间分布的信息。 模式的直观特性: 可观察性 可区分性 相似性
模式识别的研究目的:利用计算机对物理对 象进行分类,在错误概率最小的条件下,使 识别的结果尽量与客观物体相符合。 如下所表示: Y = F(X) X X的定义域取自特征集 Y的值域为类别的标号集 F是模式识别的判别方法
P ( w1 ) p ( X | w1 ) = P ( w2 ) p ( X | w2 )
特征矢量分布函数
使用最大似然法,需要预先求出
P ( wi )和p ( X | wi ),P( wi )是类别wi 被观测的概率, 因此可以预测;p ( X | wi )是表示类别wi的特征 矢量分布函数,通常假设如下正态分布。
特征处理:特征提取和特征选择 首先对识别对象的性质进行测量;利用测量值作 为分类的特征。 特征选择:
选择有区分性,可靠性,独立性好的特征
特征选择的方法:
穷举法:从m个测量值里面选取n个特征,然后对每 一种选法利用已经知道类别属性的样本进行试分类, 获得其正确率,分类误差最小的一组特征便是最好 的选择。 最大最小类对距离法: 基本思想 :从K个类别中选取最难分离的一对类别, 然后选择不同的特征子集,计算这一类别的可分性, 具有最大可分性的特征子集就是该方法所选择的最 佳特征子集。 这种方法不改变原始观测值的物理意义。
b
a
模板匹配过程:
建立模板:对每个类别建立一个或多个模版, 模板比较:输入样本和数据库中每个类别的模版变换中检测图象和地图之间对应点; 不同光谱或者不同摄影时间所得的图象之间的位 置配准; 运动物体的跟踪; 图象中对象物位置的检测
模板匹配方法
设检测模板为 t ( x, y ) , 令其中心与图象 f ( x, y ) 中一象素重合,检测 t ( x, y ) 和图象重合部分的相似度, 对图象所有的象素都进行 这样的操作,根据相似度 为最大或者超过某一个阈 值来确定对象物是否存在。
模式识别的基本过程:学习、分类
(1)学习过程 读取样本特征 建立分类规则 进行分类检验 (2)分类过程 读取事物信息 选取特征 按规则分类 对分类结果进行评估
2 模板匹配
模板匹配:当对象 图案以图象的形式 表现时,根据该图 案与一幅图象的各 个部分相似度判断 其是否存在,并求 得对象物在图象中 位置操作。
模式识别简史
1929年G.Tauschek发明阅读机,能够阅读0-9的数字。 30年代Fisher提出统计分类理论,奠定了统计模式识 别的基础。 50年代傅京荪提出句法结构模式识别。 60年代L.A.Zadeh提出了模糊集理论,模糊模式识别 方法得以发展和应用。 80年代以Hopfield网、BP网为代表的神经网络模型导 致人工神经元网络复活,并在模式识别得到较广泛的 应用。 90年代小样本学习理论,支持向量机也受到了很大的 重视。
m(u , v) =
∫∫ t ( x, y) f ( x + u, y + v)dxdy
s
m *(u , v) =
m(u , v)
∫∫ f ( x + u, y + v)dxdy
s
m *(u , v) =
∫∫ [ f ( x + u, y + v) − f ][t ( x, y) − t ]dxdy
s
[ f ( x + u, y + v) − f ]2 dxdy ∫∫ [t ( x, y ) − t ]2 dxdy ∫∫
s s
s表示t ( x, y )定义的区域, f , t分别表示在 f ( x + u, y + v), t ( x, y )在s内的均值
模板匹配算法的改进
高速模板匹配算法 在模板匹配中应用的模板大,因此导致计 算量比较大于是Barnea等人提出了序贯相似 性检测算法-SSDA法
如果图像和模板在(u,v)处有和模板一致的 图案时,则m(u,v)的值很小,相反则较大。特别 是模板和图像重叠部分完全不一致的情况下,和 就不断的增大。 当差的绝对值部分和超过某一个阈值的时就 认为在该位置不存在于模板一致的图案,从而转 移到下一个位置。 还有一种方法:粗检索和细检索两个阶段。 模板一次移动若干个像素,计算匹配尺度, 先求出大致的范围。然后在大致范围内,在每次 移动一个像素,求出匹配尺度,确定对象所在位 置。
多级树描述结构
实例:句法模式识别(续)
训练过程: 用已知结构信息的图像作为训练样本,先识 别出基元(比如场景图中的X、Y、Z等简单平 面)和它们之间的连接关系(例如长方体E是 由X、Y和Z三个面拼接而成),并用字母符号 代表之; 然后用构造句子的文法来描述生成这幅场景 的过程,由此推断出生成该场景的一种文法。
模板的要求:
检测对象大小和方向未知的情况下进行模板匹 配,需要具备各式各样大小和方向的模板,从而确 定对象及其未知。 对象形状复杂时,需要把对象分割成几个分图 案,把分图案作为模板进行匹配,然后研究分图案 之间的位置关系,从而获得图像中对象的位置。
模版匹配:
优点:直接、简单(早期非智能化方法) 缺点:适应性差(可采用形变模版)
最大似然法
gi ( X ) = p ( wi | X ) = p ( X | wi ) P ( wi ) 式中P ( wi )表示类别wi的模式以多大的概率被观测 到的情况,称为先验概率; p ( X | wi )表示条件概率密度函数; p ( wi | X )表示在观测模式X 的时候,该模式属于 类别wi 确定度
模式识别系统的目标:在特征空间和解释空间 之间找到一种映射关系,这种映射也称之为假 说。 特征空间:从模式得到的对分类有用的度 量、属性或基元构成的空间。 解释空间:
wi ∈ Ω, i = 1, 2,..., c Ω表示类别的集合,称为解释空间
模式识别的依据是相似性 可以识别从未见过的事物;可以识别变形的 事物;根据事物的特征来识别它 识别时抓住分类的主要特征,而忽略其他细节 差异(只考虑相似不考虑相同)
3 统计模式识别
统计模式识别是研究每一个模式的各种测量统计 数据特性,按照统计决策理论进行分类。
三部分组成:分类; 特征处理:由已知类别的训练样本求出判别函数以及判别规 则,进而用来对未知类别的图像进行分类。 自适应学习部分:用训练样本根据某些规则求出一些判别规 则之后,再对这些训练样本逐个进行检测,观察是否有误差
特征变换 就是将m个测量值的集合通过某种变换,产生n个特征 用于分类。 分两种情况:从减少原始特征之间相关性和浓缩性信 息量的角度出发。 另一种方法就是根据观测量所反映的物理现象与待分 类别之间的关系的认识,通过数学运算产生一组新的 特征值,使得待分类之间的差异在改组特征值里面更 加明显。
统计分类法
m(u , v) = ∑∑ f (k + u − 1, l + v − 1) − t (k , l )
k =1 l =1
m
n
计算图象f(x,y)在像素(u,v) 的非相似度m(u,v)作为 匹配的尺度。式中的(u,v) 表示的不是模板与图像重合 部分的中心坐标,而是重合部分的左上角坐标,模板 大小为m*n
该方法为理论上为误差最小的分类法
如在一维数特征空间场合,如下图T把特征空间 分成两个区域,产生的误分类概率为:
PE = E12 + E21 = ∫ P( w2 ) p ( X | w2 )dx + ∫ P( w1 ) p ( X | w1 )dx
−∞ T T ∞
这一误分类概率随T的位置而发生变化,在 位置上确定T时,PE最小,
实例:统计模式识别
待识别的模式:性别(男或女) 测量的特征:身高和体重 训练样本:15名已知性别的样本特征 目标:希望借助于训练样本的特征建立判 别函数(即数学模型)
实例:统计模式识别
体 重 kg
80
70
60
50 100 150 200
身高cm
实例:统计模式识别
从图中训练样本的分布情况,找出男、女两 类特征各自的聚类特点,从而求取一个判别函数 (直线或曲线)。 只要给出待分类的模式特征的数值,看它在 特征平面上落在判别函数的哪一侧,就可以判别 是男还是女了。 根据训练样本,建立决策边界; 统计决策理论,根据每一类总体的概率分布决定决 策边界 优点:理论基础扎实,算法适用面广;缺点:算法 复杂、对于统计分类不明确的问题难求解
1 −1 exp[− ( X − U i )T ∑ i ( X − U i )] ∑i 2 其中U i 表示均值, i从训练样本中得到 ∑ p( X | wi ) = (2π )
−n / 2 −1/ 2
1 n U = ∑ X i = [u1 , u2 ,..., un ]T n i =1 a11 … a1m = M O M ∑ a L amm m1 1 n aij = ∑ ( xki − ui )( xkj − u j ) n − 1 k =1 i, j = 1, 2,..., m 假设特征矢量为正态分布的前提下,为简化 最大似然法,常把似然函数P( wi ) p ( X | wi )用其 对数 ln P( wi ) + ln p ( X | wi )代替
实例:句法模式识别(续)
将整个场景图像结构分解成一些比较简单的子 图像的组合; 子图像又用一些更为简单的基本图像单元来表 示,直至子图像达到了我们认为的最简单的图 像单元(基元); 所有这些基元按一定的结构关系来表示,利用 多级树结构对其进行描述(这种描述可以采用形 式语言理论).
实例:句法模式识别(续)
句子
主语
谓语
宾语
名词 短语
动词 短语
名词 短语
冠词
形容词
名词
动词 副词 介词
冠词
形容 词
名词
句子的层状结构
自然句法规则用语模式识别:
房子和树
结构模式识别以形式语言为基础,将一个复 杂的模式分解成一系列子模式,对子模式继续分 解,最后分解成最简单的子模式(基元),然后 借助于一种形式语言对模式的结构进行描述,从 而识别对象。 模式,子模式,基元类似于短语,单词,字 母。因此该方法类似于语言句法结构分析,因此 称句法模式识别。
监督分类 就是根据预先已知类别名的训练样本,求出各 类在特征空间的分布,然后利用它对未知数据进行 分类。
g1 g2 gc判别函数
常用的判别函数 距离判别函数 线性判别函数 该方法一般将m类问题分解成m-1个两类识 别的问题。先把特征空间分为一类和其它类。 线性判别函数的系数通过样本试验确定。 统计决策理论