图像分割常用算法优缺点探析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图像分割常用算法优缺点探析
摘要图像分割是数字图像处理中的重要前期过程,是一项重要的图像分割技术,是图像处理中最基本的技术之一。本文着重介绍了图像分割的常用方法及每种方法中的常用算法,并比较了各自的优缺点,提出了一些改进建议,以期为人们在相关图像数据条件下,根据不同的应用范围选择分割算法时提供依据。
关键词图像分割算法综述
一、引言
图像分割决定了图像分析的最终成败。有效合理的图像分割能够为基于内容的图像检索、对象分析等抽象出十分有用的信息,从而使得更高层的图像理解成为可能。目前图像分割仍然是一个没有得到很好解决的问题,如何提高图像分割的质量得到国内外学者的广泛关注,仍是一个研究热点。
多年来人们对图像分割提出了不同的解释和表达,通俗易懂的定义则表述为:图像分割指的是把一幅图像分割成不同的区域,这些区域在某些图像特征,如边缘、纹理、颜色、亮度等方面是一致的或相似的。
二、几种常用的图像分割算法及其优缺点
(一)大津阈值分割法。
由Otsu于1978年提出大津阈值分割法又称为最大类间方差法。它是一种自动的非参数非监督的门限选取法。该方法的基本思路是选取的t的最佳阈值应当是使得不同类间的分离性最好。它的计算方法是首先计算基于直方图而得到的各分割特征值的发生概率,并以阈值变量t将分割特征值分为两类,然后求出每一类的类内方差及类间方差,选取使得类间方差最大,类内方差最小的t作为最佳阈值。
由于该方法计算简单,在一定条件下不受图像对比度与亮度变化的影响,被认为是阈值自动选取的最优方法。该方法的缺点在于,要求得最佳阈值,需要遍历灰度范围0—(L-1)内的所有像素并计算出方差,当计算量大时效率会很低。同时,在实际图像中,由于图像本身灰度分布以及噪声干扰等因素的影响,仅利用灰度直方
图得到的阈值并不能使图像分割得到满意的结果,虽在一定程度上可以消除噪声的影响,但该方法计算量相当大,难以应用到实时系统。
(二)基于边缘检测的分割算法。
基于边缘检测方法的基本思想是先检测图像中边缘点,再按一定策略连接成轮廓,从而构成分割区域。其难点在于边缘检测时抗噪性和检测精度的矛盾,若提高检测精度,则噪声产生的伪边缘会导致不合理的轮廓,若提高抗噪性,则会产生轮廓漏检和位置偏差。
经典的边缘检测方法是构造对像素灰度级阶跃变化敏感的微分算子,如roberts梯度算子、Sobel梯度算子等,其边缘检
测速度快,但得到的往往是断续的、不完整的结构信息,这类方法对噪声较为敏感。边缘检测技术中较为成熟的方法是线性滤波器,其中尤其是以拉普拉斯LOG(Laplace of Gauss)算子最为有名。
LOG算子较好地解决了频域最优化和空域最优化之间的矛盾,计算方法也比较简单方便,另外,该算子在过零点检测中具有各向同性特点,保证了边缘的封闭性,符合人眼对自然界中大多数物体的视觉效果。在实际应用中,用高斯函数对图像做平滑滤波存在以下问题:高斯函数在对图像平滑的同时却产生了边缘模糊效应,出现了缓变边缘。而且随着领域的增大,抑制噪声效果的同时,边缘模糊效应相应增加,使LOG算子的噪声平滑能力与边缘定位能力相矛盾。
(三)基于神经网络的分割算法。
基于神经网络模型(ANN)的方法的基本思想是用训练样本集对神经网络进行训练,以确定节点间的连接和权值,再用训练好的神经网络分割新的图像数据。近年来随着神经网络模型的不断丰富,神经网络用于图像分割的算法也是日益增多,如基于多层神经网络的非线性图像分割、基于RBF 神经网络的图像分割、基于竞争Hopfield 神经网络的自动聚类图像分割、基于BP 神经网络算法的图像分割等。
BP 网络是多层前馈型网络的典型代表,BP 网络模型如下图所示:
BP 算法又名反向传播算法。由于这种算法在本质上是一种神经网络学习的数学模型,所以,有时也称为BP模型,这个算法目前还存在一些问题,如计算量大、所耗时间长,收敛速度缓慢,不能保证学习结果达到均方误差的全局最小点,没有知识积累性等。人们对BP 算法提出了各种各样的改进方法,其中大部分是减少其运算量的,主要方法是合理选择修改权重的步长值和增加动态因子,另外利用其它的优化算法来优化神经网络的结构。
神经网络存在巨量的连接,容易引人空间信息,能较好地解决图像中的噪声和不均匀问题,选择何种网络结构是这种方法要解决的主要问题。
(四)基于数学形态学的分割算法。
数学形态学是以形态结构元素为基础对图像进行分析的数学工具。它的基本思想是用具有一定形态的结构元素去度量和提取图像中的对应形状以达到对图像分析和识别的目的。数学形态学的应用可以简化图像数据,保持它们基本的形状特征,并除去不相干的结构。数学形态学的基本运算有4个:膨胀、腐蚀、开启和闭合。它们在二值图像中和灰度图像中各有特点。
数学形态学在图像处理中的应用广泛,有许多实用的算法。其中分水岭分割方法,是一种基于拓扑理论的数学形态学的分割方法,其基本思想是把图像看作是测地学上的拓扑地貌,图像中每一点像素的灰度值表示该点的海拔高度,每一个局部极小值及其影响区域称为集水盆,而集水盆的边界则形成分水岭。分水岭的概念和形成可以通过模拟浸入过程来说明。在每一个局部极小值表面,刺穿一个小孔,然后把整个模型慢慢浸入水中,随着浸入的加深,每一个局部极小值的影响域慢慢向外扩展,在两个集水盆汇合处构筑大坝,即形成分水岭。
数学形态学对图像的处理具有直观上的简明性和数学上的严谨性,由于形态学技术在进行图像处理时,充分考虑到了图像的结构特征,为基于形状细节进行图像处理提供了强有力的手段。因此相对于其他图像处理方法而言,形态学技术具有独特的结构特征优势。
三、结束语
在图像分割问题上,至今还没有建立起完善的理论体系,图像分割技术呈现出多种特征相融合、多种分割方法相结合、新理论新技术不断创新的发展趋势。与此同时,许多研究人员正不断尝试将一些新方法和新理念引人到图像分割领域。图像分割技术正朝着自动、精确、快速、自适应性和鲁棒性的目标发展。随着计算机技术的不断发展及各种新理论的应用与改进,相信图像分割技术会不断完善和成熟起来。
参考文献:
[1]许微,侯正信。基于扩散率函数的图像放大算法[J]。传感技术学报,2006年04期