随机算法学习心得-模式识别
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模式识别
经过近10周的学习,学习了随机算法中有关模式识别的知识,对随机算法中模式识别的知识也有了较多的了解和认识,下面就谈谈自己对模式识别这方面的知识的学习心得和一些简单的总结。
首先,对于一个完整的模式识别系统,其基本上由三大部分组成,即数据采集、数据处理和分类决策或模型匹配。我们在设计模式识别是同时,需要注意模式类的定义、应用场合、模式表示、特征提取和选择、聚类分析、分类器的设计和学习、训练和测试样本的选取、行骗能评价等。针对不同的应用目的,模式识别系统三部分的内容可以有很大的差异,特别是数据处理和模式分类这两部分,为了提高识别结果的可靠性,往往需要加入知识库(规则)以对可能产生的错误惊醒修正,或通过引入限制条件大大缩小待识别模式在模型库中的搜索空间,以减少匹配计算量。在某些具体应用中,如机器视觉,除了要给出被识别对象时申明物体外,还要求给出该物体所处的位置和姿态以引导机器人的工作。
下面,主要谈谈自己对于模式识别方法的认识和理解。模式识别的方法大致可以分为模板匹配、统计模式识别、句法(结构)模式识别、模糊模式识别和人工神经元网络模式识别五个主要方法。
首先,对于模板匹配,该方法时最早出现,也是最简单的模式识别方法之一。模板匹配方法在字符识别、人脸识别等领域有广泛的应用,但该方法计算量非常大,而且该方法的识别率严重依赖于已知模板,如果已知模板产生变形,会导致错误的识别,为了改善这种情况,衍生出了可变形模板匹配方法。
统计模式识别方法,又称决策理论识别方法,该方法根据模式的统计特征,用一个n维特征空间(特征集)来描述每个模式,然后基于概率论、数理统计以及矩阵理论和向量代数的知识,利用合适的判别函数(每个模式类的特征值分布函数),将这个n维特征空间划分为m 个区域,即类别。特征值分布函数可以通过指定或学习得到。比如,字符识别器确定一个模式的类别为“a”到“z”26 类中的一个。同样地,在进行签名的有效性验证时,人们将某一签名确定为“真实”或“伪造”。统计模式识别技术对于解决分类问题非常有用。在统计模式识别中,贝叶斯决策规则从理论上解决了最优分类器的设计问题,但其实施却必须首先解决更困难的概率密度估计问题。
句法(结构)模式识别,1962 年,R.Narasimahan 提出了一种基于基元关系的句法模式识别方法,傅京孙在这个领域进行了卓有成效的工
作,形成了句法模式识别的系统理论。句法(结构)模式识别主要是基于特征的结构相关性进行内部模式结构的描述。比如,图像分析常常涉及到图像的描述而不仅仅是分类。一个描述包括图像基元的信息以及这些信息之间的关系。句法模式识别(结构模式识别的一种)利用句法、句法分析和自动推理机理论来描述和分析一个模式的结构,是相对较成熟的模式识别方法。一维字符串的语法分析可以在许多方面进行拓宽,从而应用于二维和三维模式的识别。错误信息和不确定信息的句法处理是目前的研究热点。统计模式识别和句法模式识别是模式识别领域的两大主流研究方向。
模糊模式识别1965 年L.A.Zadeh 的《模糊集合论》宣告了模糊数学的诞生,从那以来,有关模糊信息处理的理论和应用取得了重大进展,并由此产生了模糊模式识别方法。模糊模式识别是基于模糊数学的模式识别方法。现实世界中存在许多界限不分明、难以精确描述的事物或现象,而模糊数学则可以用数学的方法研究和处理这类具有“模糊性”的事物或现象。模糊数学的出现使得人们可以模拟人类神经系统的活动,描述模式属于某类的程度,因此,模糊数学在模式识别中得到了很好的应用。模糊聚类分析是非监督模式识别的重要分支。1994 年,Randas 利用模糊聚类从原始数据中直接提取特征,并对提取出来的特征进行优选和降维操作,以免造成维数灾害。马少平在汉字的方向像素特征进行了模糊化描述,是特征变化比较平滑,提高了汉字特征描述的准确度。在模糊模式识别中,隶属函数的选取是关键。
人工神经元网络模式识别,上世纪50 年代末,F.Rosenblatt[16]提出了一种简化的模拟人脑进行识别的数学模型—感知机,初步实现了通过给定类别的各个样本对识别系统进行训练,使系统在学习完毕后具有对其他未知类别的模式进行正确分类的能力。80年代,J.Hopfield深刻揭示出人工神经元网络所具有的联想存储和计算能力,为模式识别技术提出了一种新的途径,短短几年在很多方面就取得了显著成果,从而形成了人工神经元网络模式识别方法。神经元模式识别利用神经元网络中出现的神经计算模式进行。大部分神经元网络都有某种训练规则,如基于现有模式调节连接权重。换句话说,神经元网络直接对例子进行学习,得出其结构特征进行推广,就像孩子从狗的例子中认识狗一样。
实际上,上述模式识别方法并非完全独立、互不相干的,这些方法互相渗透、互相补充。在许多新兴的应用领域,没有唯一最优的方法,必须同时使用几种不同的模式识别方法。人们已经尝试设计融合了许多识别方法的模式识别系统。下表对上面介绍的集中模式识别方法进行了
简单的归纳总结。
表1 常见的模式识别方法
方法表示模式识别函数判别准则
模板匹配样本、像素、
曲线相关性、距离
度量
分类误差
统计模式识别特征类属判别函数分类误差结构模式识别基元规则、语法接受误差模糊识别特征隶属函数隶属度
神经元网络模
式识别样本、像素、
特征
非线性信号处
理函数
均方误差
模式识别是一个快速发展的学科,因此很难对该领域的最新研究进展做一个很全面详尽的总结。模式识别从上世纪20年代发展至今,已经有了许多行之有效的模式识别方法来解决不同问题,但是还没有发展成统一的、有效的可应用于所有问题的模式识别理论。模式识别研究的目的就是要开发出一般的不依赖于应用领域的数据分析技术,使得机器可以像人类一样分析解决各种问题。这是一个难以实现的目标,人们当前要做的工作是结合具体问题提出新的模式识别方法,或者根据各种现有模式识别方法的特性,将不同的模式识别方法融合在一起解决同一问题的不同方面,互相取长补短,开创模式识别研究和应用的新局面。