模式识别方法简述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
XXX大学
课程设计报告书
课题名称模式识别
姓名
学号
院、系、部
专业
指导教师
xxxx年xx月xx日
模式识别方法简述
摘要:模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的( 数值的、文字的和逻辑关系的) 信息进行处理和分析, 以对事物或现象进行描述、辨认、分类和解释的过程, 是信息科学和人工智能的重要组成部分。模式识别研究主要集中在两方面, 一是研究生物体( 包括人) 是如何感知对象的,属于认识科学的范畴, 二是在给定的任务下, 如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容, 后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力, 已经取得了系统的研究成果。
关键词:模式识别; 模式识别方法; 统计模式识别; 模板匹配; 神经网络模式识别
模式识别(Pattern Recognition)是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着2 0 世纪4 0 年代计算机的出现以及5 0 年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在2 0 世纪6 0 年代初迅速发展并成为一门新学科。
模式识别研究主要集中在两方面, 一是研究生物体( 包括人) 是如何感知对象的,属于认识科学的范畴, 二是在给定的任务下, 如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家和神经生理学家的研究内容, 后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力, 已经取得了系统的研究成果。模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。
模式识别是一种借助计算机对信息进行处理、判别的分类过程。判决分类在科学研究和生产实践中的应用是相当广泛的, 但往往因所需处理的影响因子过多, 过于复杂, 给问题的研究和解决增加了困难。多因子问题的目标( 结果或性能) 与影响因子之间难以找出直接的联系, 或是很难直接用理论的途径解决, 在各因子之间一时也找不到明显的关联。计算机模式识别的引入给复杂问题的解
决带来了曙光。模式识别使得人们在影响因素很多的情况下仍能对众多信息进行方便的处理, 利用计算机技术对数据进行总结, 寻找目标与众多因子之间的某种联系或目标的优化区域、优化方向, 对实际问题的解决具有指导意义和应用价值, 因此获得广泛应用, 并取得较大成功。
模式识别方法( Pattern Recognit ion Method) 是一种借助于计算机对信息进行处理、判决分类的数学统计方法。一个完整的模式识别系统由数据获取、数据处理、特征提取和选择、分类决策4 部分组成,如下图所示。
图一模式识别系统
在设计模式识别系统时,需要注意模式类的定义、应用场合、模式表示、特征提取和选择、聚类分析、分类器的设计和学习、训练和测试样本的选取、性能评价等。针对不同的应用目的,模式识别系统各部分的内容可以有很大的差异,特别是在数据处理和模式分类这两部分,为了提高识别结果的可靠性往往需要加入知识库(规则)以对可能产生的错误进行修正,或通过引入限制条件大大缩小待识别模式在模型库中的搜索空间,以减少匹配计算量。在某些具体应用中,如机器视觉,除了要给出被识别对象是什么物体外,还要求出该物体所处的位置和姿态以引导机器人的工作。下面分别简单介绍模式识别系统数据获取、数据处理、特征提取、分类决策或模型匹配的工作原理。
数据获取是指利用各种传感器把被研究对象的各种信息转换为计算机可以接受的数值或符号(串)集合。习惯上,称这种数值或符号(串)所组成的空间为模式空间。这一步的关键是传感器的选取。为了从这些数字或符号(串)中抽取出对识别有效的信息,必须进行数据处理,包括数字滤波和特征提取。
数据处理是为了消除输入数据或信息中的噪声,排除不相干的信号,只留下与被研究对象的性质和采用的识别方法密切相关的特征(如表征物体的形状、周长、面积等等)。举例来说,在进行指纹识别时,指纹扫描设备每次输出的指纹图像会随着图像的对比度、亮度或背景等的不同而不同,有时可能还会产生变形,
而人们感兴趣的仅仅是图像中的指纹线、指纹分叉点、端点等,而不需要指纹的其它部分或背景。因此,需要采用合适的滤波算法,如基于块方图的方向滤波、二值滤波等,过滤掉指纹图像中这些不必要的部分。
特征提取是指从滤波数据中衍生出有用的信息,从许多特征中寻找出最有效的特征,以降低后续处理过程的难度。我们对滤波后的这些特征进行必要的计算后,通过特征选择和提取形成模式的特征空间。人类很容易获取的特征,对于机器来说就很难获取了,特征选择和提取是模式识别的一个关键问题。一般情况下,候选特征种类越多,得到的结果应该越好。但是,由此可能会引发维数灾害,即特征维数过高,计算机难以求解。因此,数据处理阶段的关键是滤波算法和特征提取方法的选取。不同的应用场合,采用的滤波算法和特征提取方法以及提取出来的特征也会不同。
基于数据处理生成的模式特征空间,人们就可以进行模式识别的最后一部分:模式分类或模型匹配。该阶段最后输出的可能是对象所属的类型,也可能是模型数据库中与对象最相似的模式编号。模式分类或描述通常是基于己经得到分类或描述的模式集合而进行的。人们称这个模式集合为训练集,由此产生的学习策略称为监督学习。学习也可以是非监督性学习,在此意义下产生的系统不需要提供模式类的先验知识,而是基于模式的统计规律或模式的相似性学习判断模式的类别。
应用模式识别方法的首要步骤是建立模式空间。所谓模式空间是指在考察一客观现象时, 影响目标的众多指标构成的多维空间。每个指标代表一个模式参量。假设一现象有几个事件( 样本) 组成, 每一个事件都有P 个特征参量( X1, X2, . . . Xp) , 则它就构成P维模式空间, 每一个事件的特征参量代表一个模式。模式识别就是对多维空间中各种模式的分布特点进行分析, 对模式空间进行划分, 识别各种模式的聚类情况, 从而做出判断或决策。分析方法就利用映射!和逆映射!技术。映射是指将多维模式空间进行数学变换到二维平面, 多维空间的所有模式( 样本点) 都投影在该平面内。在二维平面内, 不同类别的模式分布在不同的区域之间有较明显的分界域。由此确定优化方向返回到多维空间( 原始空间) , 得出真实信息, 帮助人们找出规律或做出决策, 指导实际工作或实验研究。