模式识别理论

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

• 如果预先不知道样本的类别，要在学习过程中根据样本的相似性对被识别的样品进行识别分类和归类，称为聚类分析。
聚类分析是完全依靠样本自然特性进行识别的方法，是一种无监督模式识别。
模式空间
样本xi可用一组参量(矢量)来表征，即 xi=(xi1, xi2, ..., xin)，在模式识别中，这种参量值又称特征。通常这些参量实际上就是原始数据。这样一组参量构成了模式识别空间的一个点，或称一个n维的模式。由这些模式所构成的n维变量空间，称为模式空间。因高维模式空间提供了更多的信息，故有可能解决一些低维空间中难于解决的问题。
m1=(69.3, 61.9, 83.5, 70.8, 97.7, 91.5, 87.6, 82.4 )
m2=(59.2, 55.5, 81.9, 63.9, 95.1, 91.0, 91.1, 86.5 )
m1=(69.3, 61.9, 83.5, 70.8, 97.7, 91.5, 87.6, 82.4 )
y
x
x
yt
o
yo
二维模式向一维空间投影示意图
y
（1)求解Fisher准则函数
~ 2 ~ 2 ~ 2 u ( S S ) u u S u sW sW1 sW 2 W1 W2 W
类间离差度为：
~ 2 ( m m ) 2 (u m u m )( u m u m ) u S u ~ ~ sB 1 2 1 2 1 2 B
KNN算法
计算未知样本点和所有训练集样本点之间的距离。从最小距离开始计样本数，一直计到有K个样本数为止，此时所对应的距离就为最近邻的最小距离。如果在这个最小距离中，距某一类训练集中的样本数多，距离又小，则可将待分类样本划到该类中。优点：对数据结构无特殊要求，简单易行，不需要训练过程。缺点：未对训练点进行信息压缩，每判断一个点都要将其对所有已知点的距离计算一遍,工作量较大。
m1=(69.3, 61.9, 83.5, 70.8, 97.7, 91.5, 87.6, 82.4 )
m2=(59.2, 55.5, 81.9, 63.9, 95.1,
91, 91.1, 86.5 )
无监督模式识别法
不需要训练集，对所研究的模式进行
适当分类的问题则需要用无监督模式识别
方法，这类模式识别方法又叫聚类分析法 (clustering analysis method)。
模式识别的特点
• 模式识别的理论基础是多元统计理论和一些近代数学方法（如神经元网络理论）。 • 模式识别给出的是统计和经验的规律，无法提供关于样பைடு நூலகம்理论模型。
用计算机模式识别方法总结规律预报未知，虽然不如纯粹的理论方法严格和有明确的机理及解释，但却有广泛的适应面，能够在现有知识、理论不够完善的情况下发挥作用。在用计算机模式识别方法解决问题时，我们仍需要借助于与研究对象相关的理论知识，去估计、判断影响研究对象的大致因素，用这些因素的参数构筑多维空间（即模式空间）描述研究对象的特征，才能用模式识别的方法总结规律。
例子现有甲状腺病人（记为类1）和正常人（记为类2）各10例，分别测试5项功能指标，测试结果见表a和表b所示。以每一类的前8个样本作为训练集（表 a），后2个作为测试集（表b）。用 LLM法对其进行判别。
Fisher线性判别
x
o
二维模式向一维空间投影示意图
y
x
yt
o
二维模式向一维空间投影示意图
什么是模式识别
• 模式识别包括两个阶段，即学习阶段和实现阶段，前者是对样本进行特征选择，寻找分类的规律，后者是根据分类规律对未知样本集进行分类和识别。 • 广义的模式识别属计算机科学中智能模拟的研究范畴，内容非常广泛，包括声音和语言识别、文字识别、指纹识别、声纳信号和地震信号分析、照片图片分析、化学模式识别等等。计算机模式识别实现了部分脑力劳动自动化。
模式识别理论
Pattern Recognition
什么是模式识别
• 模式识别（Pattern Recognition）是一种从大量信息和数据出发，在专家经验和已有认识的基础上，利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别的、评价的过程。 • 从数学角度而言，模式识别也是一个数学建模过程。只是给出的是定性结论而不是定量指标。
即
1 J F = ( m1 m 2 ) S W ( m1 m 2 )
称
1 y ( m1 m 2 ) S W x
为Fisher变换函数
（3) 求解Fisher判别函数
由于变换后的模式是一维的，因此判别界面实际上是各类模式所在轴上的一个点，所以可以根据训练模式确定一个阈值 yt，于是Fisher判别规则为: 1 u x y y t x 2
模式识别计算过程示意图
有监督模式识别（判别分析）
• 如果样本的类别数是已知的，先用一组已知类别的样本作为训练集，建立判别模型，再用建立的模型根据相似性原则来对未知样本进行识别，称为判别分析。判别分析是在事先知道类别特征的情况下建立判别模型对样本进行识别归属，是一种有监督模式识别。
无监督模式识别（聚类分析）
模式识别的数据预处理
模式间相似度的度量
模式识别方法I
有监督模式识别法（判别分析法） Supervised pattern recognition (Discriminating analysis methods)
参数判别分析法包括距离判别、Fisher判别与Beayes 判别分析法等非参数判别分析法包括线性学习机、K-最近邻法、人工神经网络法等
C1=[-0.0103,0.0402,-0.0246,0.0166, 0.0313,-0.0246,-0.0174]´ C2=[0.0103,-0.0402,0.0246,-0.0166, -0.0313,0.0246,0.0174]´
2. 计算地层I、II的每一个矢量与C1和 C2的距离，分别如表a和表b所示：
线性学习机法 Linear learning machine—LLM
作为模式识别中决策分类的一种方法，该法希望通过某种方法，在模式空间中到找到一个判决面（此面叫做分类器），使不同类的模式点分别位于判别面的两侧。未知模式的分类可根据它位于判别面的哪一侧来定。若判别面是一个线性超平面，就叫线性分类器。
模式识别常用术语
• 特征抽提（Feature Extraction）
• 训练集（Training Set）
• 识别率（Recognition Rate）
• 预测能力（Predictive Ability）
注意事项
训练集的数据一定要可靠。
训练集的样本数目要足够多，样本数m与模式空间维数n 的比值至少应满足m/n≥3，最好 m/n≥10。模式空间特征的选择是成败的关键，要选取与样本分类有关的特征，如果不能包括与分类有关的主要特征，模式识别就不会有好的效果。
~ m )2 ~ ( m1 u S B u 2 J F (u ) ~ 2 ~ 2 sW1 sW 2 u S W u
并使其最大,上式称为Fisher准则函数。
（2) 求解Fisher最佳鉴别矢量
利用二次型关于矢量求导的公式可得：
J F u S B u 2 ( u S W u ) S B u 2 ( u S B u ) S W u 2 u u u S W u ( u S W u )
u S B u 令 u S W u
可得：
S B u SW u
1 1 u S W S B u S W ( m1 m 2 )( m1 m 2 )u
• 上式右边后两项因子的乘积为一标量，令其为，于是可得
u S B u J F (u ) u S W u 1 1 ( m 1 m 2 ) S W ( m 1 m 2 )( m 1 m 2 ) S W ( m 1 m 2 ) 1 1 ( m 1 m 2 )’S W S W S W ( m 1 m 2 ) 1 ( m1 m 2 ) S W ( m1 m 2 )
K-Nearest Neighbors Discrimination Method
KNN法的基本假设： “同类样本在模式空间中相互较靠近，不同类样本在模式空间中相互远离” 。
K最近邻法考查未知样本点的K个近邻（K为单数整数），若近邻某一类样本最多，则可将未知样本判为该类。
为了进行定量判别，可先找出待分类样本的最近邻，并事先约定最近邻区域中的训练集样本数。如果只取一个最近邻样本点，即样本数为１，则称1NN法；如果取２个最近邻样本点，即样本数为 2，则称2NN法；如果样本数为K，则称K近邻法，简称KNN法。
1 u x y y t x 2
以100元A面数据和50元A面数据为例
100元A面:(64,76,99,84,98,95,88,83),…
50元A面:(65,67,82,80,89,94,86,92),…
N1=N2=60算得:
m1=(69.3,61.9,83.5,70.8,97.7,91.5,87.6,82.4) m2=(59.2,55.5,81.9,63.9,95.1,91.0,91.1,86.5)
简化的KNN法—类重心法
将训练集中每类样本点的重心求出，然后判别未知样本点与各类样本点重心的距离。未知样本点距哪一类重心距离最近，即未知样本属于哪一类。
例：有两种地层，用7种指标的分析数据判别，先从已经准确判断的地层中各取 9个样本，测得的数据如下表：
1. 将上表数据进行归一化处理后计算两类的重心得：
• 常用聚类分析方法有：
• 分级聚类分析法—Hierarchical clustering methods • 最小（大）生成树法—Minimun（Max） Spanning Tree Method • K均值聚类法—K-means Clustering Method • 模糊聚类法—Fuzzy clustering method • PCA投影分类法等等
m2=(59.2, 55.5, 81.9, 63.9, 95.1,
91, 91.1, 86.5 )
m1=(69.3, 61.9, 83.5, 70.8, 97.7, 91.5, 87.6, 82.4 )
m2=(59.2, 55.5, 81.9, 63.9, 95.1,
91, 91.1, 86.5 )
1 u S W ( m1 m 2 )
• 式中为一标量因子，其不改变轴的方向，可以取为1,于是有 1 u S W ( m1 m 2 )

此时的
u 可使Fisher准则函数取最大值，即是n 维空
间到一维空间投影轴的最佳方向，由 1 u S W ( m1 m 2 ) 和 S B ( m1 m 2 )( m1 m 2 ) JF 最大值为:
判别阈值可取两个类心在u方向上轴的投影连线的中点作为阈值，即:
yt
~ m ~ m1 2 2
~ （7）计算m i 。
~ 1 mi Ni
y
j
(i ) j

1 Ni
(i ) u x j u m i
j
（8）计算yt 。 y t
~ m ~ m1 2 2
（9）对未知模式x判定模式类。