最小距离分类法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
d ( x, i ) x i ( x i )T x i
2
xT x xT i i x i i
T
T
xT x ( xT i i x i i) 式中 x T x ( x T i i T x i i ) 为特征的线性函数,可作为判别函数:
i1 i i 2 id x1 x X 2 x d
对任一被识图像X:
计算距离 d ( X , i ) 找出最小的距离,设为 d ( X , i ) 则X属于i类。具体判别时, 2 可用 x y 代替距离进行计算,即
最小距离分类法, 1.二类别的情况
• • 在模式识别方法中,最简单的就是模式匹配,就是把未知图像和一个标准图像相 比,看它们是否相同或相近。 1.二类别的情况 设有两个标准模板A和B,它们的特征向量为:
A1 A A2 Ad B1 B B2 Bd
i 1
i
i
当: d ( X , A ) d ( X , B ) 时,X属于A; 当: d ( X , A ) d ( X , B ) 时,X属于B;
2.多类别的情况
设有m类,=[1 2 …m],每一类由一堆向量,从每一堆向量中,挑出一个最标准的 为代表,称为图像的原型。如i类, 其原型的特征向量为:
T
T
T
Gi ( x ) x T x ( x T i i x i i )
T
T
若
Gi ( x ) min
则X属于i类
3.决策区域
• 上述分类问题还可以用决策区域来表示,如二类问题,如下图
1 2
R1
R2
将模板1 、2做连线,在 做平分线平分线左边为R1 区,右边为R2区,R1,R2 为决策区域。 对于四类问题,则有四个区:
d ( x, i ) min
则x属于i
源自文库
用这种方法,决策边界将是片状的,例如,一个二分类问题1 2 .设1有两个代 表, 11, 12,设2有三个代表, 21, 22, 23.决策区域的划分如图所示。 这种方法,概念简单,但分 段边界较复杂。如果是非线 性的边界,可用分段线性来 代替。要针对具体的问题进 行处理 近邻法则是一种次优法则,其 产生的错误率要比最小的贝叶 斯错误率大。但是,当子样数 目较多时,其错误率不会超过 贝叶斯错误率的二倍
11 R1
21
22 R2 23
12 R1
5.聚类分类法
聚类分类法,又名聚合分类法或称群分技术。它与上述方法不同。 (1)聚合分类, 聚合分类是一种分类方法,它是把特征空间中彼此靠近的点归属于 同一类,称为子类,也称为分群技术。实际上就是用一个准则函数,比如说这个 准则函数是数据到各个群的中心距离的平方和,然后找一个使准则函数极小的分 群方法。从这种观点出发,就去找每一类中点与点之间的距离,使其最小化。这 种方法的优点在于简单方便。 类似性的度量,当把分群问题表示成要在一组数据中找出“自然数据群”时,首先应 当确定什么叫“自然数据群”。在某种意义上说,一群里的子样要比其他群的子 样更相像一些。这实质上涉及两个方面,一是如何测定子样之间的类似性,另一 是如何对一组子样分割为一些群的方法进行评价。两个子样之间的类似性(或差 异性)的最显然的一种度量,就是它们之间的距离。首先要定义一个适当的距离 函数,然后计算一对子样之间的距离,距离越小,类似性越大;反之,类似性越 小,若距离是差异的一种好的度量,那么同一群里得子样之间的距离将明显小于 不同群子样之间的距离。因此假定当两个子样之间的距离小于某个阈值0时,就 认为这两个子样属于同一群。显然, 0的选择是很重要的,两个极端, 0太大, 则所有的字样将归于同一群,若太小,则每一群里可能只有一个子样。 若用距离作为差异度的度量,则意味着特征空间是各向同性的,所以由距离确定的群 关于平移和旋转是不变的,但是对于一般的线性变换,这种分群就有可能改变, 为了使其不变,可在分群之前把数据标准化。
x1 x X 2 x d
任何一个待识别的图像的特征向量为
那么,X属于A还是B?若X=A则该图像为A,X=B则该图像为B.进一步怎样知道X=A 1 呢?最简单的办法就是利用距离来判别.任意两点之间的距离按欧机里德的距离定 d ( x y )2 2 义,则 d ( x, y )
对于三类问题,则有三个区:
2
R2 1 3 1 R1 R3 R1
2
R2
3 R3 4 R4
上面是针对二维特征向量,界面为线,决策区为平面,对于三维特征向量,界面 为超平面,决策区为空间
4.最近邻域分类法
最小距离分类法,是取一个最标准的向量做代表,但是有许多图像,一类中不能只取 一个向量做代表,例如要求识别一类零件中五种相互近似的形状,则一类的代表应该 有五个向量,这样就把最小距离的概念从一个点到一个点的距离扩充到一个点到一组 点之间的距离,如果有m类, 1 2 …m,其向量组分别为1 2… m.每组中有ki个向 量, i=[i1, i2… iki],然后再求距离。求这种距离应该计算最近邻距离,用数学表示就 2 是: d ( x, i ) min x iq , q 1,2,..., ki 若