图像模式识别的方法介绍

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

图像模式识别的方法介绍
2.1图像模式识别的方法
图像模式识别的方法专门多，从图像模式识别提取的特点对象来看，图像识别方法可分为以下几种：基于形状特点的识别技术、基于色彩特点的识别技术以及基于纹理特点的识别技术。

其中，基于形状特点的识别方法，其关键是找到图像中对象形状及对此进行描述，形成可视特点矢量，以完成不同图像的分类，常用来表示形状的变量有形状的周长、面积、圆形度、离心率等。

基于色彩特点的识别技术要紧针对彩色图像，通过色彩直方图具有的简单且随图像的大小、旋转变换不敏锐等特点进行分类识别。

基于纹理特点的识别方法是通过对图像中专门具有结构规律的特点加以分析或者那么是对图像中的色彩强度的分布信息进行统计来完成。

从模式特点选择及判别决策方法的不同可将图像模式识别方法大致归纳为两类:统计模式(决策理论)识别方法和句法(结构)模式识别方法。

此外，近些年随着对模式识别技术研究的进一步深入，模糊模式识别方法和神经网络模式识别方法也开始得到广泛的应用。

在此将这四种方法进行一下说明。

2.1.1句法模式识别
关于较复杂的模式，如采纳统计模式识别的方法，所面临的一个困难确实是特点提取的问题，它所要求的特点量十分庞大，要把某一个复杂模式准确分类专门困难，从而专门自然地就想到如此的一种设计，即努力地把一个复杂模式分化为假设干较简单子模式的组合，而子模式又分为假设干基元，通过对基元的识别，进而识别子模式，最终识别该复杂模式。

正如英文句子由一些短语，短语又由单词，单词又由字母构成一样。

用一组模式基元和它们的组成来描述模式的结构的语言，称为模式描述语言。

支配基元组成模式的规那么称为文法。

当每个基元被识别后，利用句法分析就能够作出整个的模式识别。

即以那个句子是否符合某特定文法，以判别它是否属于某一类别。

这确实是句法模式识别的差不多思想。

句法模式识别系统要紧由预处理、基元提取、句法分析和文法推断等几部分组成。

由预处理分割的模式，经基元提取形成描述模式的基元串〔即字符串〕。

句法分析依照文法推理所推断的文法，判决有序字符串所描述的模式类别，得到判决结果。

问题在于句法分析所依据的文法。

不同的模式类对应着不同的文法，描述不同的目标。

为了得到于模式类相适应的文法，类似于统计模式识别的训练过程，必须事先采集足够多的训练模式样本，经基元提取，把相应的文法推断出来。

实际应用还有一定的困难。

2.1.2统计模式识别
统计模式识别是目前最成熟也是应用最广泛的方法，它要紧利用贝叶斯决策规那么解决最优分类器问题。

统计决策理论的差不多思想确实是在不同的模式类中建立一个决策边界，利用决策函数把一个给定的模式归入相应的模式类中。

统计模式识别的差不多模型如图2，该模型要紧包括两种操作模型：训练和分类，其中训练要紧利用己有样本完成对决策边界的划分，并采取了一定的学习机制以保证基于样本的划分是最优的;而分类要紧对输入的模式利用其特点和训练得来的决策函数而把模式划分到相应模式类中。

统计模式识别方法以数学上的决策理论为基础建立统计模式识别模型。

其差不多模型是:对被研究图像进行大量统计分析，找出规律性的认识，并选取出反映图像本质的特点进行分类识别。

统计模式识别系统可分为两种运行模式:训练和分类。

训练模式中，预处理模块负责将感爱好的特点从背景中分割出来、去除噪声以及进行其它操作;特点选取模块要紧负责找到合适的特点来表示输入模式;分类器负责训练分割特点空间。

在分类模式中，被训练好的分类器将输入模式依照测量的特点分配到某个指定的类。

统计模式识别组成如图2所示。

图2 统计模式识别模型
2.1.2.1几种统计模式识别的方法
统计模式识别依照采纳方法的不同能够进行多种形式的分类：通过贝叶斯决策理论对条件密度的样本进行分类；关于类条件密度不明的情形，可依照训练样本的类别是否己知将分类问题分为监督学习和非监督学习两大类；监督学习和非监督学习又可依照是否通过参数决策分为参数估量和非参数估量。

统计模式识别的另一种分类方法是依照决策界是否直截了当得到将其分为几何方法和基于概率密度的方法。

几何方法经常直截了当从优化一定的代价函数构造决策界;而基于概率密度的方法要第一估量密度函数然后构造分类函数指定决策界。

1、几何分类法
1) 模板匹配法
它是模式识别中的一个最原始、最差不多的方法，它将待识模式分别与各标准模板进行匹配，假设某一模板与待识模式的绝大多数单元均相匹配，那么称该模板与待识模式〝匹配得好〞，反之那么称〝匹配得不行〞，并取匹配最好的作为识别结果。

2〕距离分类法
距离是一种重要的相似性度量，通常认为空间中两点距离越近，表示实际上两样本越相似。

大约有十余种作为相似性度量的距离函数，其中使用最广泛的是欧氏距离。

它是使用最为广泛的方法，常用的有平均样本法、平均距离法、最近邻法和Ｋ－近邻法。

3〕线性判别函数
和上述的方法不同，判决函数法是以判决边界的函数形式的假定为其特性的，而上述的方法差不多上以所考虑的分布的假定为其特性的。

假如我们有理由相信一个线性判决边界取成：
d d x w x w x w x g +++= 2211)(
是合适的话，那么剩下的问题确实是要确定它的权系数。

权系数可通过感知器算法或最小平方误差算法来实现。

但作为一条规那么，应用此方法必须注意两点；第一确实是方法的可适性问题，第二确实是应用判决函数后的误差准那么。

4〕非线性判别函数
线性判决函数的特点是简单易行，实际应用中许多问题往往是非线性的，一种处理的方法将非线性函数转换为线性判决函数，因此又称为广义线性判决函数。

另一种方法借助电场的概念，引入非线性的势函数，它通过训练后即可用来解决模式的分类问题。

2 概率分类法
几何分类法是以模式类几何可分为前提条件的，在某些分类问题中这种条件能得到满足，但这种条件并不经常能得到满足，模式的分布常常不是几何可分的，即在同一区域中可能显现不同的模式，这时，必须借助概率统计这一数学工具。

能够说，概率分类法的基石是贝叶斯决策理论。

设有R 类样本，分别为w1, w2 , … , wR,假设每类的先验概率为P(wii), i = 1,2 ,3,…R,关于一随机矢量Ｘ，每类的条件概率为〔又称类概率密度〕P(X/Wii)，那么依照Bayes 公式，后验概率为：
∑==R i i
i i i i w p w X p w p w X p X w p 1)()|()
()|()|(
从后验概率动身，有Bayes 法那么：
i
j R j i w X X w p j j i ≠∀=∈=；且，，，，，其中则若 21)],|(max [ arg
2.1.2.2朴素贝叶斯分类器朴素贝叶斯分类是一种十分简单的分类算法，叫它朴素贝叶斯分类是因为这种方法的思想确实专门朴素，朴素贝叶斯的思想基础是如此的：关于给出的待分类项，求解在此项显现的条件下各个类别显现的概率，哪个最大，就认为此待分类项属于哪个类别。

通俗来说，就好比这么个道理，你在街上看到一个黑人，我问你你猜这哥们哪里来的，你十有八九猜非洲。

什么缘故呢？因为黑人中非洲人的比率最高，因此人家也可能是美洲人或亚洲人，但在没有其它可用信息下，我们会选择条件概率最大的类别，这确实是朴素贝叶斯的思想基础。

朴素贝叶斯分类的工作过程如下：
〔1〕每个数据样本用一个n 维特点向量{}n x x x X ,...,21=表示，分别描述对n 个属性A 1,A 2,…A n 样本的n 个度量。

〔2〕假定有m 个类C 1,C 2,…C m 。

给定一个未知的数据样本X 〔即没有类标号〕，分类法将推测X 属于具有最高后验概率〔条件X 下〕的类。

即是说，朴素贝叶斯分类将未知的样本分配给类C i ，当且仅当
(
)()i j m j X C P X C P j i ≠≤≤>,1,
如此，最大化()X C P i 。

其()X C P i 最大的类C i 称为最大后验假定。

依照贝叶斯定理
()()()()
X P H P H X P X H P =， ()()()()X P C P C X P X C P i i i =
〔3〕由于P(X)关于所有类为常数，只需要()()i i C P X P 最大即可。

假如类的先验概率未知，那么通常假定这些类是等概率的，即P(C 1)=P(C 2)=…=P(C m )。

并据此只对()i C X P 最大化。

否那么，最大化()()i i C P C X P 。

注意，类的先验概率能够用()s s C P i i =运算其中s i 是类C i 中的训练样本数，而s 是训练样本总数。

〔4〕给定具有许多属性的数据集，运算()i C X P 的开销可能专门大。

为降低运算()i C X P 的开销，能够做类条件独立的朴素假定。

给定样本的类标号，假定属性值相互条件独立，即在属性间，不存在依靠关系。

如此，
()()∏==n
k i k i x p C X P 1 〔7.8〕
概率()i C X P 1，()i X P 2，…()i n C X P 能够由训练样本估值，其中〔a 〕假如A k 是分类属性，那么()i ik i k s s C X P =，其中s ik 是在属性A k 上具有值x k 的类C i 的样本数，而s i 是C i 中的训练样本数。

〔b 〕假如A k 是连续值属性，那么通常假定该属性服从高斯分布，因而，
()()e i C i i i i C k x x g C X P C C C k i k 22221,,σμπσσμ⎪⎭⎫ ⎝⎛-== 〔7.9〕
其中，给定类C i 的训练样本属性A k 的值，()
i i C C k x g σμ,,是属性A k 的高斯密度
函数，而i i C C σμ,分别为平均值和标准差。

〔5〕为对未知样本X 分类，对每个类C i ，运算()()i i C P C X P 。

样本X 被指派到类C i ，当且仅当
()()()()i j m j C P C X P C P C X P j j i i ≠≤≤>,1,
换言之，X 被指派到其()()i i C P X P 最大的类C i 。

整个朴素贝叶斯分类分为三个时期：
第一时期——预备工作时期，那个时期的任务是为朴素贝叶斯分类做必要的预备，要紧工作是依照具体情形确定特点属性，并对每个特点属性进行适当划分，然后由人工对一部分待分类项进行分类，形成训练样本集合。

这一时期的输入是所有待分类数据，输出是特点属性和训练样本。

这一时期是整个朴素贝叶斯分类中唯独需要人工完成的时期，其质量对整个过程将有重要阻碍，分类器的质量专门大程度上由特点属性、特点属性划分及训练样本质量决定。

第二时期——分类器训练时期，那个时期的任务确实是生成分类器，要紧工作是运算每个类别在训练样本中的显现频率及每个特点属性划分对每个类别的条件概率估量，并将结果记录。

其输入是特点属性和训练样本，输出是分类器。

这一时期是机械性时期，依照前面讨论的公式能够由程序自动运算完成。

第三时期——应用时期。

那个时期的任务是使用分类器对待分类项进行分类，其输入是分类器和待分类项，输出是待分类项与类别的映射关系。

这一时期也是机械性时期，由程序完成。

半朴素贝叶斯分类模型(SNBC)
为了突破朴素贝叶斯分类器的独立性假设条件的限制，除了上述〝提升〞等方法之外，还能够通过改变其结构假设的方式来达到目的，为此有人提出了半朴素贝叶斯分类(SNBG Semi-Naive Bayesian classifier)的构想。

半朴素贝叶斯分类模型对朴素贝叶斯分类模型的结构进行了扩展，其目的是为了突破朴素贝叶斯分类模型特点属性间独立性假设限制，提高分类性能。

目前半朴素贝叶斯分类模型学习的关键是如何有效组合特片属性。

条件互信息度量半朴素贝叶斯分类学习算法能够解决目前一此学习算法中存在的效率小高及部分组合意义不大的问题。

SNBC 的结构比NBC 紧凑，在SNBC 的模型构建过程中，依照一定的标准将关联程度较大的差不多属性(即NBC 中的特点属性)合并在一
起构成〝组合属性〞(也称之为〝大属性〞)。

逻辑上，SNBC中的组合属性与NBC 中的差不多属性没有全然性差别，SNBC的各个组合属性之间也是相关于类别属性相互独立的。

图是SNBC的模型示意图。

这类模型通过将依靠性强的差不多属性结合在一起构建新的模型，如此能够部分屏蔽NBC中独立性假设对分类的负面作用。

但从名称能够看出，SNBC依旧属于朴素贝叶斯分类的范畴。

这是因为除了结构上的差别之外，运算推导过程与NBC无异。

半朴素贝叶斯分类结构示意图
2.1.2.3图像金字塔
图像金字塔是以多辨论率来说明图像的一种结构。

1987年，在一种全新而有效的信号处理与分析方法，即多辨论率理论中，小波首次作为分析基础显现了。

多辨论率理论将多种学科的技术有效地统一在一起，如信号处理的子带编码、数字语音识别的积分镜像过滤以及金字塔图像处理。

正如其名字所表达的，多辨论率理论与多种辨论率下的信号〔或图像〕表示和分析有关。

其优势专门明显，某种辨论率下无法发觉的特性在另一种辨论率下将专门容易被发觉。

图像金字塔是结合降采样操作和平滑操作的一种图像表示方式。

它的一个专门大的好处是，自下而上每一层的像素数都不断减少，这会大大减少运算量；而缺点是自下而上金字塔的量化变得越来越粗糙，而且速度专门快。

高斯金字塔里有两个概念：组〔Octave〕和层〔Level或Interval〕，每组里有假设干层。

高斯金字塔的构造是如此的，第一组的第一层为原图像，然后将图像做一次高斯平滑〔高斯卷积、高斯模糊〕，高斯平滑里有一个参数σ，然后
将σ乘一个比例系数k作为新的平滑因子来平滑第一组第二层得到第三层。

重复假设干次，得到L层他们分别对应的平滑参数为：0，σ，kσ，k2σ，……。

然后将最后一幅图像做比例因此为2的降采样得到第二组的第一层，然后对第二组的第一层做参数是σ的高斯平滑，对第二层做kσ的平滑得到第三层，以此类推。

每组对应的平滑因子是一样的，如此反复形成了O组L层，组建成高斯金字塔。

2.1.3模糊模式识别
模糊模式识别的理论基础是20世纪60年代产生的模糊数学，它依照人对事物识别的思维逻辑，结合人类大脑识别事物的特点，将运算机中常用的二值逻辑转向连续逻辑。

在图像识别领域应用时该方法能够简化图像识别系统，并具有有用、可靠等特点。

模式识别是一门边缘学科，它和许多技术学科有着紧密的联系，它本身确实是人工智能的重要组成部分，因此，从本质上来说，模式识别所要讨论的核心问题，确实是如何使机器能模拟人脑的思维方法，来对客观事物进行有效的识别和分类。

一方面现有的广为运用的统计模式识别方法与人脑进行模式识别相比，其差别还专门大，另一方面待识别的客观事物又往往具有不同程度的模糊性。

许多学者试图运用模糊数学的方法来解决模式识别问题，形成一个专门的研究领域----模糊模式识别(Fuzzy Pattern Recognition)。

比较成熟的理论和方法有最大来属原那么、基于模糊等价关系的模式分类、基于模糊相似关系的模式分类和模糊聚类，其中模糊聚类方法的研究和应用尤为成功和广泛。

目前，模糊模式识别方法已广泛应用图形识别、染色体和白血球识别、图象目标的形状分析、手写体文字识别等，但其中也遇到许多困难，其中一个典型的例子确实是隶属函数的确定往往带有体会色彩。

应用模糊方法进行图像识别的关键是确定某一类别的隶属函数，而各类的统计指标那么要由样本像元的灰度值和样本像元的隶属函数的值即隶属度共同决定。

隶属度表示对象隶属某一类的程度。

2.1.4神经网络模式识别
神经网络的研究始于20世纪40年代，上世纪80年代开始在各国广泛兴起，神经网络模式识别源于对动物神经系统的研究，通过采纳硬件或软件的方法，建立了许多以大量处理单元为结点，各单元通过一定的模式实现互联的拓扑网络。

该网络通过一定的机制，能够仿照人的神经系统的结构和功能。

神经网络是一种全新的模式识别技术，它具有以下几个方面的特点:(1)神经网络具有分布式储备信息的特点。

(2)神经元能够独立运算和处理收到的信息，即系统能够并行处理输入的信息。

(3)具有自组织、自学习的能力。