模式识别

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

模式识别

摘要:本文简单介绍了模式识别,主要讲述了模式识别常用的方法:神经网络、模糊诊断、支持向量机、聚类分析的定义及各自有缺点。

关键字:模式识别;神经网络;模糊诊;、支持向量机;聚类分析ABSTRACT:This paper briefly introduced the pattern recognition, mainly tells the story of pattern recognition commonly used method: neural network and fuzzy diagnosis, support vector machine, clustering analysis of the definition and have their own shortcomings.

Key words: Pattern recognition; Neural network; Fuzzy diagnosis; And support vector machine (SVM); Clustering analysis

一、模式识别

我们知道,被识对象都具有一些属性、状态或者特征。而对象之间的差异也就表现在这些特征的差异上。因此可以用对象的特征来表征对象。另一方面,从结构来看,有些被识对象可以看作是由若干基本成分按一定的规则组合而成。因此,可以用一些基本元素的某种组合来刻画对象。

广义地说,存在于时间和空间中可观察的物体,如果我们可以区别它们是否相似,都可以称之为模式。模式所指的不是事物本身,而是从事物获得的信息,能够表征或刻画被识对象类属特征的信息模型成为对象的模式。有了模式,对实体对象的识别就转化为对其模式的识别。识别其实就是分类,即辨识或判别被识对象的类属。

模式识别就是确定一个样本的类别属性(模式类)的过程,即把某一样本归属于多个类型中的某个类型。

模式识别的三大任务:模式采集、特征提取和特征选择、类型判别。

模式识别系统的主要环节:特征提取、特征选择、学习和训练、分类识别。

模式识别的应用如下:

生物学:自动细胞学、染色体特性研究、遗传研究;天文学:天文望远镜图像分析、自动光谱学;经济学:股票交易预测、企业行为分析;医学:心电图分析、脑电图分析、医学图像分析;工程:产品缺陷检测、特征识别、语音识别、自动导航系统、污染分析;军事:航空设想分析、雷达和声纳信号检测和分类、自动目标识别;安全:指纹识别、人脸识别、监视和报警系统。

模式识别常用的方法:神经网络、模糊诊断、支持向量机、聚类分析。

二、模式识别常用的方法

1、聚类分析

聚类分析法是理想的多变量统计技术,主要有分层聚类法和迭代聚类法。聚类分析也称群分析、点群分析,是研究分类的一种多元统计方法。

聚类分析概述:例如,我们可以根据各个银行网点的储蓄量、人力资源状况、营业面积、特色功能、网点级别、所处功能区域等因素情况,将网点分为几个等级,再比较各银行之间不同等级网点数量对比状况。

聚类分析的基本思想:相似的归为一类、模式相似性的度量和聚类算法、无监督分类。即我们所研究的样品(网点)或指标(变量)之间存在程度不同的相似性(亲疏关系——以样品间距离衡量)。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据。把一些相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另一类,直到把所有的样品(或

指标)聚合完毕,这就是分类的基本思想。选择什么特征、选择多少个特征、选择什么样的量纲、选择什么样的距离测度对分类结果都会产生极大影响。

聚类过程遵循的基本步骤:特征选择、近邻测度、聚类准则、聚类算法、结果验证、结果判定。

聚类分析法的主要流程包括:数据预处理、为衡量数据点间的相似度定义一个距离函数、聚类或分组和评估输出,用流程图描述如下图:

在聚类分析中,通常我们将根据分类对象的不同分为Q型聚类分析和R型聚类分析两大类。

R型聚类分析是对变量进行分类处理,Q型聚类分析是对样本进行分类处理。

R型聚类分析的主要作用是:1、不但可以了解个别变量之间的关系的亲疏程度,而且可以了解各个变量组合之间的亲疏程度。2、根据变量的分类结果以及它们之间的关系,可以选择主要变量进行回归分析或Q型聚类分析。

Q型聚类分析的优点是:1、可以综合利用多个变量的信息对样本进行分类;

2、分类结果是直观的,聚类谱系图非常清楚地表现其数值分类结果;

3、聚类分析所得到的结果比传统分类方法更细致、全面、合理。

为了进行聚类分析,首先我们需要定义样品间的距离。常见的距离有:①绝对值距离②欧氏距离③明科夫斯基距离④切比雪夫距离

聚类的几种方法:

(1)直接聚类法

先把各个分类对象单独视为一类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已归的两类,则把这两类并为一类。每一次归并,都划去该对象所在的列与列序相同的行。经过m-1次就可以把全部分类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。

(2)最短距离聚类法

最短距离聚类法,是在原来的m×m距离矩阵的非对角元素中找出,把分

类对象Gp和Gq归并为一新类Gr,然后按计算公式计算原来各类与新类之间的距离,这样就得到一个新的(m-1)阶的距离矩阵;再从新的距离矩阵中选出最小者dij,把Gi和Gj归并成新类;再计算各类与新类的距离,这样一直下去,直至各分类对象被归为一类为止。

(3)最远距离聚类法

最远距离聚类法与最短距离聚类法的区别在于计算原来的类与新类距离时采用的公式不同。最远距离聚类法所用的是最远距离来衡量样本之间的距离。

目标:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集。

聚类应用的四个基本方向:减少数据、假说生成、假说检验、基于分组的预测。

聚类分析是一种非监督学习的方法,解决方案是数据驱动的。

模糊聚类分析技术广泛应用于故障诊断、识别等场合。例如应用在了汽车变速箱齿轮故障诊断中,液体火箭发动机故障仿真数据的聚类识别,得到了该方法应用于该型号液体火箭发动机故障诊断中时的精度并据此说明了其应用与液体火箭发动机故障诊断中的应用价值。

2、神经网络

2.1 神经网络介绍

模式描述方法:以不同活跃度表示的输入节点集(神经元)

模式判定:是一个非线性动态系统。通过对样本的学习建立起记忆,然后将未知模式判决为其最接近的记忆。

理论基础:神经生理学,心理学

主要方法:BP模型、HOP模型、高阶网

主要优点:可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题。允许样本有较大的缺损、畸变。

主要缺点:模型在不断丰富与完善中,目前能识别的模式类还不够多。

神经网络是受人脑组织的生理学启发而创立的。由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以在不同的神经元之间传递增强或抑制信号。增强或抑制是通过调整神经元相互间联系的权重系数来实现的。神经网络可以实现监督和非监督学习条件下的分类。

神经网络具有并行处理能力、自学习能力、自适应能力和以任意精度逼近任意非线性函数的特点,是解决非线性、多变量、不确定等复杂控制问题的一条十分有效的途径,它在模式识别、系统辨识、控制等领域都得到了广泛的应用。

神经网络的类型多种多样,它们是从不同角度对生物神经系统不同层次的抽象和模拟。从功能特性和学习特性来分,典型的神经网络模型主要包括感知器神经网络、线性神经网络、BP神经网络、径向基函数神经网络(RBF神经网络)、自组织映射神经网络和反馈神经网络等。

BP神经网络和RBF神经网络在解决非线性系统辨识中蕴藏着巨大的潜力。而RBF神经网络是以函数逼近理论为基础而构造的一类前向网络,且每个隐含层神经元传递函数都构成了拟合平面的一个基函数,它是一种局部逼近网络(即对于输入空间的某一个局部区域只存在少数的神经元用于决定网络的输出),且径向基函数神经网络的学习速度要较BP网络快,这类网络的学习等价于在多维空间中寻找训练数据的最佳似合面。径向基函数神经网络在逼近能力和学习速度等方面均优于BP神经网络。

相关文档
最新文档