SLIC超像素分割算法和目前超像素算法的比较.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SLIC超像素分割算法和目前超像素算法的比较
Radhakrishna Achanta, IEEE专业会员,
Appu Shaji, Kevin Smith, IEEE专业会员,
Aurelien Lucchi,
Pascal Fua, IEEE会士,
and Sabine Susstrunk,
IEEE高级会员
摘要近年来计算机视觉应用已经越来越依赖于
超像素处理,但它并不总是很清楚什么是一个好的超像素的算法。为了了解目前算法的优点和缺点,我们验证比较了5种目前使用的超像素算法与图像边缘吻合的能力,速度,内存使用率和它们对于分割效果的影响。我们引入了一种基于应用k-means 聚类算法的简单线性迭代聚类(SLIC)的新的超像素算法以有效生成超像素。尽管它很简单,SLIC
对于边界的吻合度与之前的算法相比不分上下甚
至更好。同时,它速度更快,占用内存更小,分割性能更优,并直接扩展了超体素生成。
索引词汇超像素,分割,聚类,k-means
1 简介
超像素算法组像素在感知上有意义的原子
区域中可以取代像素网格的刚性结构(图1)。他们捕捉图像冗余,提供了一种便捷的计算图像特征,并大幅降低后续图像处理任务的复杂度的原始方法。他们已经成为很多计算机视觉算法的关键构建模块,比如在PASCAL VOC挑战赛中得分最高的多类对象分割[ 9 ],[ 29 ],[ 11 ],深度估计[ 30 ],分割[ 16 ],人体模型估计[ 22 ],以及目标定位[ 9 ]。
有许多方法来生成超像素,每一个都有自己的优点和缺点,可能更适合特定的应用程序。例如,如果图像边界吻合度是非常重要的,那么基于图的方法会是一个理想的选择。然而,如果是用超像素来构建一幅图像,那么如[ 23 ]这种产生一个更为常规的晶格的方法可能是更好的选择。虽然很难界定什么是对所有应用都理想的方法,我们相信以下性能通常是可取的:
1. 超像素应该有好的图像边界吻合度。
2. 当用于减少计算的复杂性时,作为一个预处理步骤,超像素应该可被快速计算,占据较小的内存,和简单的使用。
3. 当用于分割的目的时,超像素分割既要能够提高处理速度又要提高搜索结果的质量。
我们验证比较了5种目前使用的超像素算法[ 8 ],[ 23 ],[ 26 ],[ 25 ],[ 15 ]的速度,图像边界吻合度以及分割性能的影响。我们也提供对这几种超像素分割法的定性评估。我们的结论是,没有一种现有的方法完全满足上述所有性能。
为了解决这个问题,我们提出了一种新的超像素的算法:简单线性迭代聚类(SLIC),它应用k-means聚类算法以相似的方法生成超像素[ 30 ]。显而易见的是,在伯克利基准中证实SLIC在图像边界的吻合度方面不如现有的几种算法[20],在Pascal [ 7 ]和MSRC [ 24 ]数据集分割时优于现有算法。此外,它比起现有方法处理速度更快,占有内存更小。除了这些可量化的优点,SLIC便于使用,生成大量超像素时简洁灵活,可扩展到更大规模并且易于获得。1
2 现有的超像素算法
超像素生成算法大致可以分为基于图或梯
度上升的算法。下面,我们回顾几种较为流行的超像素算法,包括一些原本不是专门为生成超像素而设计的算法。表1提供了一个检查方法的定性定量的总结,包括它们的相对性能。
图1 SLIC 算法64,126,1024像素下的图像分割
2.1 基于图的算法
基于图的算法在生成超像素时把图形中的每一个像素当做节点来处理。两个节点间的边权与相邻像素间有相似的比例。超像素是通过图像成本函数的最小值来定义的。 NC05.归一切割算法[ 23 ]利用图像的轮廓和纹理作为线索递归的划分了图中的所有像素,全局最小化成本函数根据划分边界的边缘定义。它产生了一种非常正规完美的超像素。然而,NC05的边界吻合度很小,并且虽然有试图加快算法存在[ 5 ],但它在各种方法中处理速度依然是最慢的(特别是大的图像)。NC05具有)(2
3N O 的复杂性,其中N 是像素的数量。
GS04.Felzenszwalb 和Huttenlocher [ 8 ]提供了一种可以替代基于图的方法,这种方法已被应用到超像素生成中。它提供了一种聚类像素作为图像中的节点的方法,这样每一个超像素都在组成像素的最小生成树上。GS04 的边界吻合度在实际中很好,但是会导致超像素的尺寸和形状不规则。它是
)log (N N O 复合体,并且在实际中处理速度
很快。然而,它不提供对于超像素的数量或者致密性的准确控制。
SL08.摩尔等人提出了一种生成超像素的方法,通过网格寻找最优路径或接缝,使
图像分解成更小的垂直或水平区域[ 21 ]。这种使用最佳路径进行图像切割的方法类似于Seam Carving [ 1 ]。然而SL08复杂度
)log (2
3N N O 并没有对预计算边界地图作
出解释,着强烈影响了输出的质量速度。 GCa10和GCb10.在[ 26 ]中,Veksler 等人使用类似于全局最佳路径的纹理合成工作[ 14 ]。通过拼接重叠的图像块来生成超像素,每一个像素抖唯一属于一个重叠区域。他们认为这种方法的两个变种,一个产生紧凑的超像素(gca10)和一个强度恒定的超像素(gcb10)。
2.2 基于梯度上升的算法
从一个粗糙的初始像素聚类开始,梯度上升的方法迭代优化集群直到收敛准则满足形成超像素。
MS02.在[ 4 ]中,均值漂移作为一个用于定位局部密度函数的最大值的迭代模式搜索方法被应用于寻找图像的颜色或强度特征空间的模式。将收敛到相同的方式的像素定义为超像素。MS02是一个产生不规则形状不均匀规格超像素的传统方法。它的复杂度为)(2
N O ,导致它的处理速度很慢,而且不能提供对超像素数量、规格和致密性的直接控制。
QS08.快速漂移[ 25 ]还使用了一种模式搜索分割机制。它使用中心漂移过程初始化分割。然后将特征空间中的每个点移动到邻节点以增加Parzen 密度估计。虽然它的边缘吻合度较好,但是QS08)(2
dN O 的复杂度导致处理速度慢(d 是一个小常量[25])。QS08不支持对超像素规格和数量的明确控制。以前的作品都采用QS08进行对象定位[ 9 ]和运动分割[ 2 ]。
WS91.分水岭方法[ 28 ]从局部极小值开