基于K均值聚类和概率松弛法的图像区域分割
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 20 卷 第 2 期 2010 年 2 月
计算机技术与发展
COM PU T ER TECHN OLO GY A N D DEV ELO PM EN T
V ol. 20 No. 2 F eb. 2010
基于 K 均值聚类和概率松弛法的图像区域分割
周卫星, 廖 欢
( 华南师范大学 物理与电信工程学院, 广东 广州 510006)
N
i= 1 Ri = R ; 对所有的 i 和 j , i j , 有 Ri Rj = ; 对 i = 1, 2, , N , 有 P ( Ri ) = T RU E; 对 i j , 有 P( Ri Rj ) = FALSE; 对 i = 1, 2, , N , Ri 是连通的区域。 其中 P ( Ri ) 是对所有在集合 Ri 中 元素的逻辑谓 词, 代表空集。 下面先对上述各 个条 件分别 给予 简略解 释: 条件 指出在对一幅图像的分割结果中全部子区域的总和 ( 并集) 应能包括 图像中 所有像素 ( 就是 原图 像) , 或者 说分割应将图像中的每个 像素都 分进 某个子 区域 中。 条件 指出在分割结果中 各个子 区域 是互不 重叠 的, 或者说在 分割 结果 中 一个 像素 不能 同 时属 于两 个区 域。条件 指出在分割结果中每个子区域都有独特的 特性, 或者说属于同一个区 域中的 像素 应该具 有某些 相同特性。条件 指 出在 分割结 果中, 不同的 子区域 具有不同的特性, 没有公共元素, 或者说属于不同区域 的像素应该具有一些不同的特性。条件 要求分割结 果中同一个子区域内的像 素应该 是连 通的, 即 同一个 子区域内的任意两个像素 在该子 区域 内互相 连通, 或 者说分割得 到的 区域 是 一个 连通 组元。 最后 需 要指 出, 实际应用中图像分割不 仅要把 一幅 图像分 成满足 上面五个条件的各具特性的区域而且需要把其中感兴 趣的目标区域提取出来。只有这样才算真正完成了图 像分割的任务。
ZH OU We-i x ing, L IAO H uan
( School of Physics & T elecommunication Eng ineering, South China Nor mal University, Guang zhou 510006, China)
Abstract: In order t o reduce over - segment at ion, can take advant ages of K - means w hich is sim ple, fast and able t o deal w it h large database and probability relaxat ion. T he m ethod of combining K - means and probabilit y relaxat ion is used in this paper. First apply K means clust ering met hod to segment the image pixels into dif ferent regiments. Then an it erat ive probability relaxat ion operat ion is applied in order t o optimize the coarse segment at ion to f urt her segment t he uncertain pixels according to t heir st at ist ic properties. Experimental result s indicat e t hat proposed met hod is eff ect ive f or image segment at ion and object ext ract ion. Key words:region- based image segment at ion; K- means; probability relaxat ion
K 均值算法 由 M acQ ueen[ 3, 4] 首 先提出, 也是 解决 聚类问题 的 一种 经典 算法。 其核 心思 想 是随 机 选择
K 个对象, 每个对象 代表 一个簇 的初始 均值 或中心。
对剩余的每个对 象, 计算其 与各 个簇 中心 的距 离, 根
K
据使距 离指 标的 目标 函 数 E =
( 3) 对 j = 1, 2, 更新类均值;
, k, 根据式
k+ 1 i
=
1 N
x
g( x)
Q
k i
( 4) 对所有 i = 1, 2,
, K,若
k+ i
1
=
k i
,
则终止。
否则, 退回步骤( 2) 继续下一次迭代。
通 过比 较上 述两 种算法 描述 可得 知 K 均 值比 C 均值算法简单、快速, 对处理 大数 据集, 该 算法 是相对
收稿日期: 2009- 06- 24; 修回日期: 2009- 09- 06 基金项目: 广东省攻关项目( 2008B080701053) 作者简介: 周卫星( 1958- ) , 男, 副教授, 研究 方向为图像 处理、模式 识别。
结果基本上不受初 始聚类 中心的 影响, 笔 者提 出先利 用 K 均值聚类对图像像素 进行初步 的划分, 在 充分了 解目标灰度信息的 基础上, 再利用 概率松 弛算 法对分 类结果进行更进一 步的处 理, 从而 提取出 图像 中真正 的目标, 实现对图像的成功分割。
1
u ik )
m
, ( i=
1, 2,
, c)
计算聚类中心矩阵 V( l );
( 3) 根据 式
uik =
c
(
j= 1
1
dik dj k
)
2 m-
,
1
利用
V(l ) 更新 隶属
度矩阵 U(l ), 得到新的模糊分类矩阵 U( l );
( 4) 若 U( l ) - U(l + 1) < , 停 止。否则 置 l = l
1 图像分割定义
图像分割将图像中具有特殊含义的不同区域分开 来, 这些区域是互不相交的, 每一个区域都满足特定区 域的一致性。比如对 同一物 体的 图像, 一 般需 要将图 像中属于该物体的像素( 或物体的特征像素点) 从背景 中分割出来, 将属于不同物体的像素点离开。
分割出来的区域应该同时满足: ( 1) 分割出来 的图像 区域的 均匀 性和连 通性。其 中, 均匀性指的是该 区域中 所有像 素点都 满足 基于灰 度、纹理、彩色等特征 的某种 相似 性准则, 连通 性是指 该区域内存在连接任意两点的路径。 ( 2) 相邻分割区 域之间 针对选 定的某 种差 异显著
第2期
周卫星等: 基于 K 均值聚类和概率松弛法的图像区域分割
69
性。 ( 3) 分割区域边界应该规整, 同时保证边缘的空间
定位精度。 借助集合概念对图像分割可给出如下比较正式的
定义[ 2] : 令集合 R 代表整个图像区域, 对 R 的分割可看作
将 R 分成 N 个 满 足以 下五 个条 件 的非 空子 集 ( 子区 域) R1, R 2, , RN :
FCM 算法步骤可描述如下:
( 1) 确定分类数 c 与加 权指数 m, m 一 般取 2, 设 定迭代停止阈值 为一小正数, 初始化 迭代次数 l = 0 和模糊分类矩阵 U(0) , 给出初始聚类中心 V( 0);
n ( u ik ) mx k
( 2) 将
U( l ) 代入
vi=
k= 1
n
k=
(
J( U, V) = n c ( uik ) m ( dik ) 2 k = 1i = 1
式中, m [ 1, + ] 为 加权 指数; uik 表 示 第 k 个 像素 对第 i 个类的 隶属 度; d ik 为第 k 个像 素到第 i 个类中
心的距离, U 为模糊分类矩阵, V 为聚类中心集合。
g(x ) -
k= 1 x
k
Qi
k+ 1 i
2 最小的原则将它划分到最相似的 簇, 算法选择
的相似性度量通常是 欧几 里德距 离的倒 数[ 5] , 也就是
说两者的距离越小表 示两者 的相似 性越 大, 反 之则相 似性越小。然后 重新 计算各 个簇 的新 均值, 更新 簇中
心。这个过程不断重复, 直到准则函数收敛。 K 均值算法描述如下:
摘 要: 在进行图像区域分割时, 为了减少过度分割现象, 可利用 K 均值算法简单、快速并且能够有效地处理大数据库的
优点及概率松弛算法并行快速且考虑空间信息的优点, 同时考虑灰度信息和空间信息将两种方法相结合应用于图像的区
域分割。首先利用 K 均值聚类方法将图像初步分为多个类, 然后, 利用迭代的概率松弛法对粗分结果进行优化, 对一些疑
0引言
在对图像的研究 和应 用中, 通 常需 要将所 关心的 目标从图像背景中提取出 来, 图像 分割 就是将 图像分 成各具特性的区域并提取出感兴趣的目标的技术和过 程。在研究图像分割的过程中, 已经产生了阈值分 割、 边缘检测、统计 学分割 等多 种方法[ 1] 。 但这些 方法只 是将图像 简单 地 分为 两类, 这 往往 不符 合 实际 情 况。 而目前有人 提出 的基 于模 糊 C 均值 和 概率 松弛 的区 域分割算 法又 存在 以 下缺 点: 其 一, 在许 多实 际 应用 中, 所 涉 及 的 数 据 大 多 是 海 量 的, 这 必 然 会 导 致 用 FCM 计算非常复杂; 其二, 由于 聚类 中心 初值 的设定 是随机的, 会导致算法在局部最小值时收敛, 影响聚类 的准确度。针对上述情况, 考虑到 K 均值算 法具有简 单、快速并且能够有效地处理大数据库的优点, 且分类
想是图像中每一个像素的归属不仅应该由其本身来决
定, 而且应该受到 它的领 域像 素的影 响。所以 松弛法
既是建立在领域运算基础 上的算 法, 又 是依据 精确的
分类判据, 以一个像素一个像素迭代进行的, 因此它具 有并行性质运算速度高的优点和串行性质逐步迭代自
适应的能力。松弛法 以像 素为操 作对 象, 借助 一次次 的迭代确定各像素的归属, 每次迭 代基 于定量 的相容
( 1) 任意选 K 个初始类均值,
1 1
,
12,
,
1 K
;
( 2) 在第 k 次迭代中, 可根据下述准 则将每个像
素都赋给 K 类之一: 对所有 i = 1, 2, , K , j = 1, 2,
,K,i
j , 如果
g( x)-
k i
<
g(x )-
k j
则
x Q ki , 设 Qki 的新的类中心为 Qki+ 1;
+ 1, 返回( 2) 。
算法中的 为收敛 阈值, > 0。 是影 过早
收敛, 聚类结果不稳定, 特别在初始参数不确定的条件 下, 这种现象更为普遍和明显。当阈值过小时, 则可能
会导致过度计算, 既浪费时间, 又可能发生无法收敛的 问题。
可伸缩的和高效率 的, 且分 类结果 基本上 不受 初始聚
70
计算机技术与发展
第 20 卷
类中心的影响, 故文中选择 K 均值聚 类算法 作为粗分 类时的分割。
3 概率松弛迭代算法
松弛方法是图像处理和模式识别中一种有效的并
行方法[ 6] , 最早是由 Rosenfeld 等[ 7] 提出。它 的基本思
似像素进行进一步分割和目标提取。实验结果表明, 该算法比较简单且具有良好的特性。
关键词: 图像区域分割; K 均值; 概率松弛
中图分类号: T P391
文献标识码: A
文章编号: 1673- 629X( 2010) 02- 0068- 03
Region- Based Image Segmentation Based on K- means and Probability Relaxation
2 粗分类算法选择
模糊 C 均 值( FCM ) 是 解决 聚类 问 题的 一种 经典 算法, 是基于对目标函数优 化基础 上的 一种数 据聚类 方法。假设有一幅 图像, 它的 n 个像素 构成模 糊集 X = ( x 1, x 2, , x n) , 若将 n 个像 素分 成 c 类, 则 构成 c 个模糊子集, 每个 模糊子 集都 有一个 聚类 中心。对于 模糊 C 均值, 定义目标函数为:
计算机技术与发展
COM PU T ER TECHN OLO GY A N D DEV ELO PM EN T
V ol. 20 No. 2 F eb. 2010
基于 K 均值聚类和概率松弛法的图像区域分割
周卫星, 廖 欢
( 华南师范大学 物理与电信工程学院, 广东 广州 510006)
N
i= 1 Ri = R ; 对所有的 i 和 j , i j , 有 Ri Rj = ; 对 i = 1, 2, , N , 有 P ( Ri ) = T RU E; 对 i j , 有 P( Ri Rj ) = FALSE; 对 i = 1, 2, , N , Ri 是连通的区域。 其中 P ( Ri ) 是对所有在集合 Ri 中 元素的逻辑谓 词, 代表空集。 下面先对上述各 个条 件分别 给予 简略解 释: 条件 指出在对一幅图像的分割结果中全部子区域的总和 ( 并集) 应能包括 图像中 所有像素 ( 就是 原图 像) , 或者 说分割应将图像中的每个 像素都 分进 某个子 区域 中。 条件 指出在分割结果中 各个子 区域 是互不 重叠 的, 或者说在 分割 结果 中 一个 像素 不能 同 时属 于两 个区 域。条件 指出在分割结果中每个子区域都有独特的 特性, 或者说属于同一个区 域中的 像素 应该具 有某些 相同特性。条件 指 出在 分割结 果中, 不同的 子区域 具有不同的特性, 没有公共元素, 或者说属于不同区域 的像素应该具有一些不同的特性。条件 要求分割结 果中同一个子区域内的像 素应该 是连 通的, 即 同一个 子区域内的任意两个像素 在该子 区域 内互相 连通, 或 者说分割得 到的 区域 是 一个 连通 组元。 最后 需 要指 出, 实际应用中图像分割不 仅要把 一幅 图像分 成满足 上面五个条件的各具特性的区域而且需要把其中感兴 趣的目标区域提取出来。只有这样才算真正完成了图 像分割的任务。
ZH OU We-i x ing, L IAO H uan
( School of Physics & T elecommunication Eng ineering, South China Nor mal University, Guang zhou 510006, China)
Abstract: In order t o reduce over - segment at ion, can take advant ages of K - means w hich is sim ple, fast and able t o deal w it h large database and probability relaxat ion. T he m ethod of combining K - means and probabilit y relaxat ion is used in this paper. First apply K means clust ering met hod to segment the image pixels into dif ferent regiments. Then an it erat ive probability relaxat ion operat ion is applied in order t o optimize the coarse segment at ion to f urt her segment t he uncertain pixels according to t heir st at ist ic properties. Experimental result s indicat e t hat proposed met hod is eff ect ive f or image segment at ion and object ext ract ion. Key words:region- based image segment at ion; K- means; probability relaxat ion
K 均值算法 由 M acQ ueen[ 3, 4] 首 先提出, 也是 解决 聚类问题 的 一种 经典 算法。 其核 心思 想 是随 机 选择
K 个对象, 每个对象 代表 一个簇 的初始 均值 或中心。
对剩余的每个对 象, 计算其 与各 个簇 中心 的距 离, 根
K
据使距 离指 标的 目标 函 数 E =
( 3) 对 j = 1, 2, 更新类均值;
, k, 根据式
k+ 1 i
=
1 N
x
g( x)
Q
k i
( 4) 对所有 i = 1, 2,
, K,若
k+ i
1
=
k i
,
则终止。
否则, 退回步骤( 2) 继续下一次迭代。
通 过比 较上 述两 种算法 描述 可得 知 K 均 值比 C 均值算法简单、快速, 对处理 大数 据集, 该 算法 是相对
收稿日期: 2009- 06- 24; 修回日期: 2009- 09- 06 基金项目: 广东省攻关项目( 2008B080701053) 作者简介: 周卫星( 1958- ) , 男, 副教授, 研究 方向为图像 处理、模式 识别。
结果基本上不受初 始聚类 中心的 影响, 笔 者提 出先利 用 K 均值聚类对图像像素 进行初步 的划分, 在 充分了 解目标灰度信息的 基础上, 再利用 概率松 弛算 法对分 类结果进行更进一 步的处 理, 从而 提取出 图像 中真正 的目标, 实现对图像的成功分割。
1
u ik )
m
, ( i=
1, 2,
, c)
计算聚类中心矩阵 V( l );
( 3) 根据 式
uik =
c
(
j= 1
1
dik dj k
)
2 m-
,
1
利用
V(l ) 更新 隶属
度矩阵 U(l ), 得到新的模糊分类矩阵 U( l );
( 4) 若 U( l ) - U(l + 1) < , 停 止。否则 置 l = l
1 图像分割定义
图像分割将图像中具有特殊含义的不同区域分开 来, 这些区域是互不相交的, 每一个区域都满足特定区 域的一致性。比如对 同一物 体的 图像, 一 般需 要将图 像中属于该物体的像素( 或物体的特征像素点) 从背景 中分割出来, 将属于不同物体的像素点离开。
分割出来的区域应该同时满足: ( 1) 分割出来 的图像 区域的 均匀 性和连 通性。其 中, 均匀性指的是该 区域中 所有像 素点都 满足 基于灰 度、纹理、彩色等特征 的某种 相似 性准则, 连通 性是指 该区域内存在连接任意两点的路径。 ( 2) 相邻分割区 域之间 针对选 定的某 种差 异显著
第2期
周卫星等: 基于 K 均值聚类和概率松弛法的图像区域分割
69
性。 ( 3) 分割区域边界应该规整, 同时保证边缘的空间
定位精度。 借助集合概念对图像分割可给出如下比较正式的
定义[ 2] : 令集合 R 代表整个图像区域, 对 R 的分割可看作
将 R 分成 N 个 满 足以 下五 个条 件 的非 空子 集 ( 子区 域) R1, R 2, , RN :
FCM 算法步骤可描述如下:
( 1) 确定分类数 c 与加 权指数 m, m 一 般取 2, 设 定迭代停止阈值 为一小正数, 初始化 迭代次数 l = 0 和模糊分类矩阵 U(0) , 给出初始聚类中心 V( 0);
n ( u ik ) mx k
( 2) 将
U( l ) 代入
vi=
k= 1
n
k=
(
J( U, V) = n c ( uik ) m ( dik ) 2 k = 1i = 1
式中, m [ 1, + ] 为 加权 指数; uik 表 示 第 k 个 像素 对第 i 个类的 隶属 度; d ik 为第 k 个像 素到第 i 个类中
心的距离, U 为模糊分类矩阵, V 为聚类中心集合。
g(x ) -
k= 1 x
k
Qi
k+ 1 i
2 最小的原则将它划分到最相似的 簇, 算法选择
的相似性度量通常是 欧几 里德距 离的倒 数[ 5] , 也就是
说两者的距离越小表 示两者 的相似 性越 大, 反 之则相 似性越小。然后 重新 计算各 个簇 的新 均值, 更新 簇中
心。这个过程不断重复, 直到准则函数收敛。 K 均值算法描述如下:
摘 要: 在进行图像区域分割时, 为了减少过度分割现象, 可利用 K 均值算法简单、快速并且能够有效地处理大数据库的
优点及概率松弛算法并行快速且考虑空间信息的优点, 同时考虑灰度信息和空间信息将两种方法相结合应用于图像的区
域分割。首先利用 K 均值聚类方法将图像初步分为多个类, 然后, 利用迭代的概率松弛法对粗分结果进行优化, 对一些疑
0引言
在对图像的研究 和应 用中, 通 常需 要将所 关心的 目标从图像背景中提取出 来, 图像 分割 就是将 图像分 成各具特性的区域并提取出感兴趣的目标的技术和过 程。在研究图像分割的过程中, 已经产生了阈值分 割、 边缘检测、统计 学分割 等多 种方法[ 1] 。 但这些 方法只 是将图像 简单 地 分为 两类, 这 往往 不符 合 实际 情 况。 而目前有人 提出 的基 于模 糊 C 均值 和 概率 松弛 的区 域分割算 法又 存在 以 下缺 点: 其 一, 在许 多实 际 应用 中, 所 涉 及 的 数 据 大 多 是 海 量 的, 这 必 然 会 导 致 用 FCM 计算非常复杂; 其二, 由于 聚类 中心 初值 的设定 是随机的, 会导致算法在局部最小值时收敛, 影响聚类 的准确度。针对上述情况, 考虑到 K 均值算 法具有简 单、快速并且能够有效地处理大数据库的优点, 且分类
想是图像中每一个像素的归属不仅应该由其本身来决
定, 而且应该受到 它的领 域像 素的影 响。所以 松弛法
既是建立在领域运算基础 上的算 法, 又 是依据 精确的
分类判据, 以一个像素一个像素迭代进行的, 因此它具 有并行性质运算速度高的优点和串行性质逐步迭代自
适应的能力。松弛法 以像 素为操 作对 象, 借助 一次次 的迭代确定各像素的归属, 每次迭 代基 于定量 的相容
( 1) 任意选 K 个初始类均值,
1 1
,
12,
,
1 K
;
( 2) 在第 k 次迭代中, 可根据下述准 则将每个像
素都赋给 K 类之一: 对所有 i = 1, 2, , K , j = 1, 2,
,K,i
j , 如果
g( x)-
k i
<
g(x )-
k j
则
x Q ki , 设 Qki 的新的类中心为 Qki+ 1;
+ 1, 返回( 2) 。
算法中的 为收敛 阈值, > 0。 是影 过早
收敛, 聚类结果不稳定, 特别在初始参数不确定的条件 下, 这种现象更为普遍和明显。当阈值过小时, 则可能
会导致过度计算, 既浪费时间, 又可能发生无法收敛的 问题。
可伸缩的和高效率 的, 且分 类结果 基本上 不受 初始聚
70
计算机技术与发展
第 20 卷
类中心的影响, 故文中选择 K 均值聚 类算法 作为粗分 类时的分割。
3 概率松弛迭代算法
松弛方法是图像处理和模式识别中一种有效的并
行方法[ 6] , 最早是由 Rosenfeld 等[ 7] 提出。它 的基本思
似像素进行进一步分割和目标提取。实验结果表明, 该算法比较简单且具有良好的特性。
关键词: 图像区域分割; K 均值; 概率松弛
中图分类号: T P391
文献标识码: A
文章编号: 1673- 629X( 2010) 02- 0068- 03
Region- Based Image Segmentation Based on K- means and Probability Relaxation
2 粗分类算法选择
模糊 C 均 值( FCM ) 是 解决 聚类 问 题的 一种 经典 算法, 是基于对目标函数优 化基础 上的 一种数 据聚类 方法。假设有一幅 图像, 它的 n 个像素 构成模 糊集 X = ( x 1, x 2, , x n) , 若将 n 个像 素分 成 c 类, 则 构成 c 个模糊子集, 每个 模糊子 集都 有一个 聚类 中心。对于 模糊 C 均值, 定义目标函数为: