基于形态学尺度空间的多尺度图像分割研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
—197—
(a) Gaussian 空间图像堆栈
(b) 相应(a)图像的分水岭分割堆栈 (c) 形态学滤波图像堆栈
(d) 相应(c)图像的分水岭分割堆栈 图 1 尺度空间图像堆栈
δ t It (x) = div(C(x)∇I t (x))
(3)
其中,t 仍然为尺度参数, It (x) 为在尺度为 t 空间下图像的
因此,任意大小的膨胀和腐蚀可以通过迭代来获得,即
δ
i S
(I
(x),ξ
(x))
=
m
in
(δ
i S
−1
(
I
(x),ξ
(x))
⊕
S
,ξ
( x ))
(7)
ε
i S
(I (x),ξ
(x))
=
m
a
x
(ε
i −1 S
(
I
(x),ξ
(x))
S ,ξ (x))
(8)
其中
,i
自
然
数。该迭代
的
稳定输
出
作为重
构
膨胀
δ
( S
【Abstract】This paper presents a new framework for the hierarchical segmentation of various images. The scale-space is based on morphological anisotropic diffusion that uses reconstruction morphological operators. The proposed scheme for multiscale segmentation comprises a morphological scale-space and morphological gradient watersheds. Its aim is to produce steak of image segmentation and obtain a meaningful hierarchy among the objects in the image by linking technique. The experimental results of the proposed scheme are obtained with a wide range of image including natural scenes. The result shows that the scheme is effective. 【Key words】Image segmentation; Morphological scale space; Morphological watersheds; Morphological operation
I
•
S
=
ε
( rec S
)
(
I
(x
)
•
S,
I (x))
(11)
因此,通过重构开操作在第 1 步可消除与结构元素 S 不
相适应的亮特征应用简单的开操作。在第 2 步,它迭代地膨
胀,而恢复那些没有被开操作完全移去的成分的轮廓,因此
可使用原始图像作为参考图像,ξ (x) = I (x) 。类似地重构闭
操作将对暗特征进行处理。因此,图像的多尺度操作可以使
用下式迭代实现:
M (x) = I (x) • S + I (x) o S
(12)
2
其输出图像应该包含比该尺度大的特征。由此可见小尺
度操作后的图像中包含大尺度操作后图像的特征。相继尺度
开闭操作后的图像差异只包含一个特定尺度的特征。
为了加快迭代速度,可以将式(12)改写为[12, 13]
M (x) = (I (x) • S) o S + (I (x) o S) • S
rec
)
(
I
,ξ
)
或
重构腐蚀
ε
( rec S
)
(
I
,ξ
)
,
即
δ
( S
rec
)
(I,
ξ
)
=
δ
n S
(I
,
ξ
);
ε
( rec S
)
(I
,ξ
)
=
ε
n S
(
I
,
ξ
)
(9)
基于这些操作的重构开操作简单地由 I o S 表示:
I
o
S
=
δ
( rec ) S
(I
(x)
o
S
,
I (x))
(10)
类似地,重构闭操作可以被定义为 I • S
(13)
2
使用式(13)对图像操作,则生成不同尺度空间下的图像,如
图 1(c)。对这些图像进行分割形成了多尺度分割层,如图 1(d)。
1.3 边缘计算
为了获得最后的分割,需对于上述重构形态学空间中所
生成的图像分割堆栈进行处理。假设 P0 = {S1, S2,K, Sn} 为在局
部 s0 尺 度 下 的 初 始 分 割 , 在 层 次 k 下 的 分 割 HLk 为
C(x) = exp ⎧⎪⎨⎪⎩−⎛⎜⎝ || ∇((I
S) k
o
S
)(x)
||
⎞2 ⎟⎠
⎫⎪ ⎬ ⎪⎭
(4)
其中, (I S) o S 为形态学开—闭滤波器, S 为结构元素,k
为梯度域值。
相对于传统非线性扩散的方法,形态学非线性扩散方法
能实现对图像平滑真正的可扩展性。其中 S 决定了最小连通
分量的大小。但是,不同大小结构元素进行的标准的开、闭
描述, C(x) 为扩散张量。当 C 为标量时,式(3)将变成式(2)。
从式(3)可发现,扩散系数随局部图像梯度而变化。因此,该
方法很大程度上依赖于扩散系数的计算。形态学的方法是计
算扩散系数最有效的方法之一。但基本的形态学操作不适合
该任务,而这些操作的组合可以在实现对图像平滑的同时相 对保护对象边缘。其扩散系数的计算可表示为[9]
1 多尺度形态学分割
多尺度形态学分割的目的是产生图像形态学尺度空间表
达,并通过梯度分水岭创建图像分割金字塔,然后使用链接
技术获得在局部尺度下分水岭线拓扑结构。
1.1 多尺度层次分割 分水岭算法是图像分割中使用较为普遍的方法,但存在
过分割现象。为了克服过分割现象,通常的方法是对图像进
行平滑滤波,如应用较为广泛的 Gaussian 滤波器。设图像为
(a)
(b)
(c)
图 2 重构形态学滤波
1.2 重构形态学开闭操作 由于标准的开、闭操作的主要不足是它们不能完全保护
好对象的边界信息。这主要是由于标准形态学操作只关注了
—198—
图像特征的大小,而忽视了特征的形状。然而,可通过重构
方法,设计形态学滤波器以满足特征的形状和大小要求[10,11]。
设基本的测地膨胀为
缘逐渐消失,大的对象边缘出现了漂移。
为了克服上述问题,引入图像的多尺度特性表达。目前, 所有已知的尺度空间模型能通过非线性扩散方程表达[8]为
基金项目:国家自然科学基金资助项目(30370393) 作者简介: 刘海华(1966—),男,博士生、副教授,主研方向:计算 机系统结构,多媒体与网络;陈州徽,硕士生;谢长生,教授、博导 收稿日期:2005-12-25 E-mail:liu_hai_hua@hotmail.com
刘海华 1,2,陈州徽 2,谢长生 1
(1. 华中科技大学计算机科学与技术学院,武汉 430074;2. 中南民族大学电子信息工程学院,武汉 430074)
摘 要:给出了图像层次分割的新架构,阐述了基于重构形态学操作的尺度空间产生方法,提出了基于形态学尺度空间和形态学分水岭的 多尺度分割策略,其目的是生成图像的分割堆栈,并通过链接技术获得有意义的对象分割。该文给出了对各种图像的分割的实验结果,验 证了分割策略的有效性。 关键词:图像分割;形态学尺度空间;形态学分水岭;形态学操作
第 32 卷 第 11 期 Vol.32 № 11
计算机工程 Computer Engineering
2006 年 6 月 June 2006
·人工智能及识别技术·
文章编号:1000—3428(2006)11—0197—03 文献标识码:A
中图分类号:TP391
基于形态学尺度空间的多尺度图像分割研究
图像分割作为图像分析的一种有效方法,其主要功能是 将图像分割为多个区域,然后识别其区域是属于图像背景还 是属于感兴趣的对象,从而提取图像中的对象。本方法在计 算机视觉和图像处理应用中是非常重要,特别是对基于对象 的互操作功能的视频压缩编码标准 MPEG4[1]和 MPEG7 [2]。
然而,图像分割是非常困难的问题,特别是图像的自动 分割。到目前为止,图像分割出现了各种不同的算法和技术。 其中形态学分割是一种有趣的方法,对图像的处理是很有用 的。这主要是因为形态学技术依赖于形态学工具,它可以针 对图像的特征处理,如大小、形状和对比度等。在区域提取 分割方法中,使用较为广泛的是形态学分水岭算法,但本算 法的主要问题是对图像中的噪声极其敏感,在分割时会产生 严重的过分割现象。这种问题可以通过将该算法整合到多分 辨率的方法中被克服。然而,基于多分辨率分割的图像边界 信息不能完全体现对象结构,不同分辨率空间下连通边界分 割很难保持一致性[3]。因而出现了基于多尺度空间的分水岭 分割方法。大部分尺度空间是通过不同尺度 Gaussian 函数卷 积而生成[4]。虽然能满足尺度空间的重要属性,但在大尺度 下会出现边界模糊以及产生新对象,引起边界漂移和 影响分 割的准确性。为此,出现了非线性操作的尺度空间分割方法 研究,并取得了一些效果[5,6]。虽然非线性扩散能减少特征的 漂移,但不能保证消除小尺度细节,从而会导致图像处理中 的各种问题。为此,本文提出了形态学尺度空间下多尺度图 像层次分割方法。本方法通过对视觉上比较敏感对象的位置、 大小,以及它们的形状等可定量测量的信息进行重构形态学 操作,从而实现图像的分割和识别。
DC(Si , S j ) = min
q
max { f
aq ∈Bq
(a)
−
f
(aqΒιβλιοθήκη Baidu)}
(14)
其中, a 表示 2 个分割 Si 和 Sj,边界上较低的点(鞍点),f(•)
是洪水蔓延过程的函数;Bq 表示属于拓扑开集 Bas(q) 的开连
通分量,其定义为
B a s ( q ) := {b | ∃ γ , γ (0 ) = a , γ (1) = b ,
δ
1 S
(I
,ξ
)
,它表示原始图像
I
(x)
相对
参考图像 ξ (x) 大小为 1(最小尺度)膨胀。其定义为
δ
1 S
(
I
(
x
),
ξ (x))
=
min(I (x) ⊕
S,
ξ (x))
(5)
类似地定义基本测地腐蚀
ε
1 S
(I
,ξ
)
为
ε
1 S
(
I
(
x
),
ξ (x))
=
max(I (x)
S , ξ (x))
(6)
操作仍然对图像的局部边界产生影响。图 2(b)为使用圆形结
构元素,对图 2(a)进行开操作的结果。从图中可以观察到开
操作在滤除图像中较小尺度亮特征的同时,平滑了大量特征
边界的棱角部分,并且使一个完整对象的较小部分消失。为
了更好地保护图像特征的边界,将使用重构形态学操作代替
传统的方法实现对图像的滤波。
=
∂ 2 It ∂ x2
+
∂ 2 It ∂ y2
(2)
其中, I0 (x) = I (x) t 为尺度参数,正比于标准方差σ。因此, 随着 t 的变化,输出不同尺度的图像,如图 1(a)所示。通过
对梯度分水岭分割后,形成了多尺度分割堆栈,如图 1(b)所
示。然而,从图 1(a)可以发现,随着 t 的增加,小的对象边
I(x),Gaussian 滤波器为 Gσ(x),则输出图像为 Iσ(x)为
Iσ (x) = I (x) × Gσ (x)
(1)
其中,Gσ(x)为滤波器的核函数。而σ为 Gaussian 函数的标准 方差。对于不同的σ其输出图像是不同的,这可以使用热传导 方程表达[7],其形式如下:
∂It ∂t
=
∆It
Pk
=
{S1k
,
S
k 2
,K
,
S
k n
}
,
则
层
次
分
割
存
在
Pk
⊇
P k −1
的关系。而
每层的分割所对应的区域邻近相关图为 ℜk (Pk , Ak ) ,其中
Pk 和 Ak 分别为在 k 层下的分割区域集合和区域之间的公共
弧线的集合。该相关图是连续合并而产生的。那么分割的目
的要求计算每个邻近区域之间的分割弧线,而得到轮廓线。 每对相邻分割的边界定义为[14]
Multiscale Image Segmentation Based on Morphological Scale Space
LIU Haihua1,2, CHEN Zhouhui2, XIE Changsheng1
(1. College of Computer Science and Technology, Huazhong University of Science and Technology, Wuhan 430074; 2. College of Electronical and Information Engineering, South-central University for Nationalities, Wuhan 430074)
(a) Gaussian 空间图像堆栈
(b) 相应(a)图像的分水岭分割堆栈 (c) 形态学滤波图像堆栈
(d) 相应(c)图像的分水岭分割堆栈 图 1 尺度空间图像堆栈
δ t It (x) = div(C(x)∇I t (x))
(3)
其中,t 仍然为尺度参数, It (x) 为在尺度为 t 空间下图像的
因此,任意大小的膨胀和腐蚀可以通过迭代来获得,即
δ
i S
(I
(x),ξ
(x))
=
m
in
(δ
i S
−1
(
I
(x),ξ
(x))
⊕
S
,ξ
( x ))
(7)
ε
i S
(I (x),ξ
(x))
=
m
a
x
(ε
i −1 S
(
I
(x),ξ
(x))
S ,ξ (x))
(8)
其中
,i
自
然
数。该迭代
的
稳定输
出
作为重
构
膨胀
δ
( S
【Abstract】This paper presents a new framework for the hierarchical segmentation of various images. The scale-space is based on morphological anisotropic diffusion that uses reconstruction morphological operators. The proposed scheme for multiscale segmentation comprises a morphological scale-space and morphological gradient watersheds. Its aim is to produce steak of image segmentation and obtain a meaningful hierarchy among the objects in the image by linking technique. The experimental results of the proposed scheme are obtained with a wide range of image including natural scenes. The result shows that the scheme is effective. 【Key words】Image segmentation; Morphological scale space; Morphological watersheds; Morphological operation
I
•
S
=
ε
( rec S
)
(
I
(x
)
•
S,
I (x))
(11)
因此,通过重构开操作在第 1 步可消除与结构元素 S 不
相适应的亮特征应用简单的开操作。在第 2 步,它迭代地膨
胀,而恢复那些没有被开操作完全移去的成分的轮廓,因此
可使用原始图像作为参考图像,ξ (x) = I (x) 。类似地重构闭
操作将对暗特征进行处理。因此,图像的多尺度操作可以使
用下式迭代实现:
M (x) = I (x) • S + I (x) o S
(12)
2
其输出图像应该包含比该尺度大的特征。由此可见小尺
度操作后的图像中包含大尺度操作后图像的特征。相继尺度
开闭操作后的图像差异只包含一个特定尺度的特征。
为了加快迭代速度,可以将式(12)改写为[12, 13]
M (x) = (I (x) • S) o S + (I (x) o S) • S
rec
)
(
I
,ξ
)
或
重构腐蚀
ε
( rec S
)
(
I
,ξ
)
,
即
δ
( S
rec
)
(I,
ξ
)
=
δ
n S
(I
,
ξ
);
ε
( rec S
)
(I
,ξ
)
=
ε
n S
(
I
,
ξ
)
(9)
基于这些操作的重构开操作简单地由 I o S 表示:
I
o
S
=
δ
( rec ) S
(I
(x)
o
S
,
I (x))
(10)
类似地,重构闭操作可以被定义为 I • S
(13)
2
使用式(13)对图像操作,则生成不同尺度空间下的图像,如
图 1(c)。对这些图像进行分割形成了多尺度分割层,如图 1(d)。
1.3 边缘计算
为了获得最后的分割,需对于上述重构形态学空间中所
生成的图像分割堆栈进行处理。假设 P0 = {S1, S2,K, Sn} 为在局
部 s0 尺 度 下 的 初 始 分 割 , 在 层 次 k 下 的 分 割 HLk 为
C(x) = exp ⎧⎪⎨⎪⎩−⎛⎜⎝ || ∇((I
S) k
o
S
)(x)
||
⎞2 ⎟⎠
⎫⎪ ⎬ ⎪⎭
(4)
其中, (I S) o S 为形态学开—闭滤波器, S 为结构元素,k
为梯度域值。
相对于传统非线性扩散的方法,形态学非线性扩散方法
能实现对图像平滑真正的可扩展性。其中 S 决定了最小连通
分量的大小。但是,不同大小结构元素进行的标准的开、闭
描述, C(x) 为扩散张量。当 C 为标量时,式(3)将变成式(2)。
从式(3)可发现,扩散系数随局部图像梯度而变化。因此,该
方法很大程度上依赖于扩散系数的计算。形态学的方法是计
算扩散系数最有效的方法之一。但基本的形态学操作不适合
该任务,而这些操作的组合可以在实现对图像平滑的同时相 对保护对象边缘。其扩散系数的计算可表示为[9]
1 多尺度形态学分割
多尺度形态学分割的目的是产生图像形态学尺度空间表
达,并通过梯度分水岭创建图像分割金字塔,然后使用链接
技术获得在局部尺度下分水岭线拓扑结构。
1.1 多尺度层次分割 分水岭算法是图像分割中使用较为普遍的方法,但存在
过分割现象。为了克服过分割现象,通常的方法是对图像进
行平滑滤波,如应用较为广泛的 Gaussian 滤波器。设图像为
(a)
(b)
(c)
图 2 重构形态学滤波
1.2 重构形态学开闭操作 由于标准的开、闭操作的主要不足是它们不能完全保护
好对象的边界信息。这主要是由于标准形态学操作只关注了
—198—
图像特征的大小,而忽视了特征的形状。然而,可通过重构
方法,设计形态学滤波器以满足特征的形状和大小要求[10,11]。
设基本的测地膨胀为
缘逐渐消失,大的对象边缘出现了漂移。
为了克服上述问题,引入图像的多尺度特性表达。目前, 所有已知的尺度空间模型能通过非线性扩散方程表达[8]为
基金项目:国家自然科学基金资助项目(30370393) 作者简介: 刘海华(1966—),男,博士生、副教授,主研方向:计算 机系统结构,多媒体与网络;陈州徽,硕士生;谢长生,教授、博导 收稿日期:2005-12-25 E-mail:liu_hai_hua@hotmail.com
刘海华 1,2,陈州徽 2,谢长生 1
(1. 华中科技大学计算机科学与技术学院,武汉 430074;2. 中南民族大学电子信息工程学院,武汉 430074)
摘 要:给出了图像层次分割的新架构,阐述了基于重构形态学操作的尺度空间产生方法,提出了基于形态学尺度空间和形态学分水岭的 多尺度分割策略,其目的是生成图像的分割堆栈,并通过链接技术获得有意义的对象分割。该文给出了对各种图像的分割的实验结果,验 证了分割策略的有效性。 关键词:图像分割;形态学尺度空间;形态学分水岭;形态学操作
第 32 卷 第 11 期 Vol.32 № 11
计算机工程 Computer Engineering
2006 年 6 月 June 2006
·人工智能及识别技术·
文章编号:1000—3428(2006)11—0197—03 文献标识码:A
中图分类号:TP391
基于形态学尺度空间的多尺度图像分割研究
图像分割作为图像分析的一种有效方法,其主要功能是 将图像分割为多个区域,然后识别其区域是属于图像背景还 是属于感兴趣的对象,从而提取图像中的对象。本方法在计 算机视觉和图像处理应用中是非常重要,特别是对基于对象 的互操作功能的视频压缩编码标准 MPEG4[1]和 MPEG7 [2]。
然而,图像分割是非常困难的问题,特别是图像的自动 分割。到目前为止,图像分割出现了各种不同的算法和技术。 其中形态学分割是一种有趣的方法,对图像的处理是很有用 的。这主要是因为形态学技术依赖于形态学工具,它可以针 对图像的特征处理,如大小、形状和对比度等。在区域提取 分割方法中,使用较为广泛的是形态学分水岭算法,但本算 法的主要问题是对图像中的噪声极其敏感,在分割时会产生 严重的过分割现象。这种问题可以通过将该算法整合到多分 辨率的方法中被克服。然而,基于多分辨率分割的图像边界 信息不能完全体现对象结构,不同分辨率空间下连通边界分 割很难保持一致性[3]。因而出现了基于多尺度空间的分水岭 分割方法。大部分尺度空间是通过不同尺度 Gaussian 函数卷 积而生成[4]。虽然能满足尺度空间的重要属性,但在大尺度 下会出现边界模糊以及产生新对象,引起边界漂移和 影响分 割的准确性。为此,出现了非线性操作的尺度空间分割方法 研究,并取得了一些效果[5,6]。虽然非线性扩散能减少特征的 漂移,但不能保证消除小尺度细节,从而会导致图像处理中 的各种问题。为此,本文提出了形态学尺度空间下多尺度图 像层次分割方法。本方法通过对视觉上比较敏感对象的位置、 大小,以及它们的形状等可定量测量的信息进行重构形态学 操作,从而实现图像的分割和识别。
DC(Si , S j ) = min
q
max { f
aq ∈Bq
(a)
−
f
(aqΒιβλιοθήκη Baidu)}
(14)
其中, a 表示 2 个分割 Si 和 Sj,边界上较低的点(鞍点),f(•)
是洪水蔓延过程的函数;Bq 表示属于拓扑开集 Bas(q) 的开连
通分量,其定义为
B a s ( q ) := {b | ∃ γ , γ (0 ) = a , γ (1) = b ,
δ
1 S
(I
,ξ
)
,它表示原始图像
I
(x)
相对
参考图像 ξ (x) 大小为 1(最小尺度)膨胀。其定义为
δ
1 S
(
I
(
x
),
ξ (x))
=
min(I (x) ⊕
S,
ξ (x))
(5)
类似地定义基本测地腐蚀
ε
1 S
(I
,ξ
)
为
ε
1 S
(
I
(
x
),
ξ (x))
=
max(I (x)
S , ξ (x))
(6)
操作仍然对图像的局部边界产生影响。图 2(b)为使用圆形结
构元素,对图 2(a)进行开操作的结果。从图中可以观察到开
操作在滤除图像中较小尺度亮特征的同时,平滑了大量特征
边界的棱角部分,并且使一个完整对象的较小部分消失。为
了更好地保护图像特征的边界,将使用重构形态学操作代替
传统的方法实现对图像的滤波。
=
∂ 2 It ∂ x2
+
∂ 2 It ∂ y2
(2)
其中, I0 (x) = I (x) t 为尺度参数,正比于标准方差σ。因此, 随着 t 的变化,输出不同尺度的图像,如图 1(a)所示。通过
对梯度分水岭分割后,形成了多尺度分割堆栈,如图 1(b)所
示。然而,从图 1(a)可以发现,随着 t 的增加,小的对象边
I(x),Gaussian 滤波器为 Gσ(x),则输出图像为 Iσ(x)为
Iσ (x) = I (x) × Gσ (x)
(1)
其中,Gσ(x)为滤波器的核函数。而σ为 Gaussian 函数的标准 方差。对于不同的σ其输出图像是不同的,这可以使用热传导 方程表达[7],其形式如下:
∂It ∂t
=
∆It
Pk
=
{S1k
,
S
k 2
,K
,
S
k n
}
,
则
层
次
分
割
存
在
Pk
⊇
P k −1
的关系。而
每层的分割所对应的区域邻近相关图为 ℜk (Pk , Ak ) ,其中
Pk 和 Ak 分别为在 k 层下的分割区域集合和区域之间的公共
弧线的集合。该相关图是连续合并而产生的。那么分割的目
的要求计算每个邻近区域之间的分割弧线,而得到轮廓线。 每对相邻分割的边界定义为[14]
Multiscale Image Segmentation Based on Morphological Scale Space
LIU Haihua1,2, CHEN Zhouhui2, XIE Changsheng1
(1. College of Computer Science and Technology, Huazhong University of Science and Technology, Wuhan 430074; 2. College of Electronical and Information Engineering, South-central University for Nationalities, Wuhan 430074)