基于人类视觉特性的纹理分割方法
计算机视觉中的图像分割与识别方法
计算机视觉中的图像分割与识别方法随着计算机科学的发展,人们对计算机视觉的应用越来越广泛。
计算机视觉是指识别,解析和回收数字和图像数据的能力,通常利用计算机来模拟机器视觉或人类视觉,以便进行图像处理和图像分析。
其中,图像分割和识别技术是计算机视觉中的重要研究领域之一。
一、图像分割技术图像分割是将图像分成多个子区域或像素集的过程,目的是为了更好地理解图像。
图像分割的过程通常是将像素分为两组或更多组(称为“分割”)。
这些组可以表示图像中的不同区域,例如前景,背景,天空,树,建筑等。
图像分割的结果可以用于计算机视觉领域的其他应用,例如人脸检测,物体识别,图像压缩等。
目前,常用的图像分割方法包括K-均值聚类方法,分水岭算法,基于区域生长的方法,和基于边缘的方法等。
1. K-均值聚类方法K-均值聚类是常用的一种图像分割方法。
该方法将图像中的所有像素划分为K个不同的组。
这些组通常表示不同的区域或不同的物体。
K-均值聚类首先需要初始化K个点,通常是通过随机选择K个像素点的方法。
然后,每个像素点都将被分配到最近的K 个点之一。
最后,计算K个点的新位置,并将所有像素重新分配给最近的点。
这个过程重复执行,直到聚类中心稳定不再改变。
2. 分水岭算法分水岭算法是另一种常用的图像分割方法。
该方法将图像看作地形,其中亮度被视为高度。
算法通过在图像中标记种子点来开始。
然后,像素被赋予绑定到最接近的种子点的标记号。
最后,像素被分成许多区域,这些区域形成分离的区域,每个种子点属于其中的一个区域。
3. 基于区域生长的方法基于区域生长的图像分割方法是一种基于合并原则的方法。
该方法将图像分为不同的区域,其中每个区域都具有相同的属性(例如颜色,亮度等)。
每个区域通过查找与其邻域相似的像素来生长。
区域增长过程可以基于以下标准:- 相邻像素具有相似的性质- 相邻像素具有相似的灰度值- 像素被分配到一个区域的成本函数最小4. 基于边缘的方法基于边缘的图像分割方法使用边缘作为图像中不同区域之间的分界线。
基于HSI和LAB颜色空间的彩色图像分割
基于HSI和LAB颜色空间的彩色图像分割一、本文概述随着科技的发展,图像处理技术在众多领域中的应用日益广泛,如医疗影像分析、卫星遥感、机器视觉等。
在这些应用中,彩色图像分割作为图像处理的核心技术之一,其重要性不言而喻。
彩色图像分割旨在将图像中的像素划分为若干个具有相似特性的区域,从而便于后续的图像分析和理解。
本文主要探讨基于HSI(Hue, Saturation, Intensity)和LAB (Lightness, a, b)颜色空间的彩色图像分割方法。
HSI颜色空间更接近人类视觉感知,能够较好地反映颜色的本质特征,而LAB颜色空间则具有感知均匀性,能够更好地适应不同光照条件下的图像分割。
本文首先介绍HSI和LAB颜色空间的基本原理及其在彩色图像分割中的应用优势。
接着,详细阐述基于这两种颜色空间的彩色图像分割算法,包括预处理、特征提取、分割策略等关键步骤。
通过实验验证所提方法的有效性和准确性,并与现有方法进行比较分析,以展示其在彩色图像分割领域的应用潜力。
二、相关技术研究综述彩色图像分割是计算机视觉领域的一个重要任务,旨在将图像划分为多个具有相似性质的区域。
这一过程的实现依赖于颜色空间的选择和相应的分割算法。
在众多颜色空间中,HSI(色调、饱和度、强度)和LAB(亮度、a通道、b通道)因其与人类视觉感知的紧密关联而受到广泛关注。
HSI颜色空间以人类视觉系统对颜色的感知为基础,其中色调(Hue)描述了颜色的基本属性,如红色、绿色或蓝色饱和度(Saturation)表示颜色的纯度或鲜艳程度强度(Intensity)则与颜色的亮度或明暗程度相关。
这种颜色空间对于颜色分割特别有用,因为它与人类对颜色的直观感知更为接近。
LAB颜色空间则是一种基于人眼对颜色亮度和色差的感知而设计的颜色模型。
L通道表示亮度信息,而a和b通道则分别表示绿色到红色以及蓝色到黄色的色差。
LAB颜色空间的一个显著优点是它的色域比RGB更广,且其亮度通道与色度通道是分离的,这有助于在分割过程中保持颜色的一致性。
基于人类视觉特性的纹理分割方法
确 定 G b r 波器 的数 量 为 6 向 ,频 率为 5级 。 ao 滤 方
对于人 类感 知纹理 的研 究结 果表 明,人类 对纹 理 区分 的三 个 重要 的特征 是重复 性 , 方 向性 、结构 元素 的复杂 性 。 且人类 对 并 纹理 的识 别是直 觉的 ,即对 整个 视场 中的 内容先进 行并 行观 察再 进行 视觉 处理 。外部 的图像 信息 是通过 一组 并行 的 ,近 似于 独立 通道 进入 H S中,每个 通道可 以被 设想成 一个 二维 的滤波 器 。 V 下面提 出的基 于 H S工作机 理的 F F 理分割 方法 即很 好 的 V R纹
计算 机 光盘软件 与应 用
工程 技 术 C m u e D S f w r n p lc to s o p t r C o ta e a d A p a n i i 21 第 l 0 0年 3期
基于人类视觉特性的纹理分割方法
马 浩 然
(电子科技 大学光 电信息学院 ,成都
第 l :对 输 入图像 使用 上述 Gb r滤波器进 行滤波 。 步 ao
第 2步 :对 输 出图像进 行 全波整流 。
第 3步 :对 输 出图像进 行 G us a as in滤波 ,即平滑 处理 。
第 4步:对输 出 图像进行 K m a s - e n 聚类 ,得到 标记 后的分割
l w, e u e ofl ie c p .n t i a e , o o e e t r e me t to e h d ba e n s c n — r e r c s i g m e h nim f o t s m t d s o e I h s p p r h i pr p s d a t x u e s g n i n m t o s o e o d o d rp o e s n c a s o a d
基于人工智能的图像分割算法研究
基于人工智能的图像分割算法研究近年来,人工智能技术飞速发展。
其中,基于人工智能的图像分割算法在计算机视觉领域中扮演着重要的角色。
图像分割是将一张图像分成若干个子区域的过程,每个子区域都应该拥有一定的特征,能够对图像进行更深层次的分析和理解。
在实际应用中,图像分割技术可以用于医学影像的分析、自动驾驶汽车的环境感知、无人机的目标跟踪等领域。
目前,基于人工智能的图像分割算法主要分为两类:传统算法和深度学习算法。
传统算法主要包括基于阈值法、基于区域生长法、基于边缘检测法、基于水平集法等几种。
其中,基于阈值法最为简单,它通过把灰度图像二值化来实现图像分割,但它只适用于灰度图像中目标与背景的对比度较高的情况。
基于区域生长法与基于边缘检测法是常用的分割方法,它们通过对图像的原始像素进行聚类、区域合并、边缘检测等操作来实现分割。
这两种方法都需要较为复杂的计算过程,但在处理一些纹理复杂、边缘不清晰的图像时仍然表现出较好的效果。
基于水平集法是一种基于偏微分方程的图像分割方法,它对图像的形状和纹理特征都具有较好的适应性。
深度学习算法则是近年来应用较为广泛的一种图像分割方法。
深度学习算法主要通过训练神经网络来实现自动分割,与传统算法相比,它不需要手动设计特征、选择分割算法等环节,而网络自身可以通过学习提取对分割任务有意义的特征。
目前主流的深度学习方法包括全卷积网络(FCN)、U-Net、Mask R-CNN等。
FCN是最早提出的一种专门用于图像分割任务的深度学习模型,它通过逐层卷积来获取图像的语义信息用于像素级别的分类。
U-Net则是基于FCN的改进版本,主要在网络结构上增加了对低级特征的重建,从而提高了分割精度。
Mask R-CNN是一种目标检测和实例分割的方法,其将分类、检测、分割三个任务融合到同一个模型中。
在实际应用中,图像分割的精准度直接影响到整个图像分析任务的成功率。
因此,如何评估图像分割结果的质量是一个重要的问题。
图像分割方法
图像分割方法图像分割是计算机视觉领域中的一个重要问题,它旨在将图像分成具有语义信息的区域。
图像分割在许多应用中都扮演着重要的角色,比如医学图像分析、自动驾驶、图像检索等。
针对不同的应用场景,有多种图像分割方法被提出并应用于实际问题中。
本文将介绍几种常见的图像分割方法,并对它们的原理和特点进行简要的分析。
1. 阈值分割。
阈值分割是一种简单而有效的图像分割方法。
其基本思想是将图像的灰度值按照设定的阈值进行划分,从而将图像分成不同的区域。
对于灰度图像,可以根据像素的灰度值与设定的阈值进行比较,将像素分为目标和背景两类。
阈值分割方法简单易行,但对光照变化和噪声敏感,对于复杂背景和多目标分割效果有限。
2. 边缘检测分割。
边缘检测分割是一种基于图像边缘信息的分割方法。
其基本思想是利用图像中目标与背景之间的边缘信息进行分割。
常用的边缘检测算子有Sobel、Prewitt、Canny等。
通过检测图像中的边缘信息,可以将图像分成具有明显边界的区域。
边缘检测分割方法对光照变化和噪声具有一定的鲁棒性,但在边缘连接处容易出现断裂和断点。
3. 区域生长分割。
区域生长分割是一种基于像素生长的分割方法。
其基本思想是从种子点开始,根据一定的生长准则逐步将与种子点相邻且满足条件的像素加入到同一区域中,直到满足停止准则为止。
区域生长分割方法适用于具有明显区域特征的图像,对于光照变化和噪声具有一定的鲁棒性,但对于种子点的选择和生长准则的确定比较敏感。
4. 基于深度学习的分割方法。
随着深度学习技术的发展,基于深度学习的图像分割方法逐渐成为研究热点。
深度学习模型如FCN、U-Net等在图像分割领域取得了显著的成果。
这些方法利用卷积神经网络对图像进行端到端的学习,能够有效地提取图像的语义信息,对于复杂背景和多目标分割效果较好。
总结。
图像分割是计算机视觉领域中的重要问题,有许多方法可以用来实现图像分割。
不同的方法适用于不同的应用场景,具有各自的特点和局限性。
纹理特征提取方法
纹理特征提取方法
纹理特征提取是计算机视觉中一个重要的研究内容,其可以用来提取和描述图像中的
纹理特征,以满足图像识别的要求。
纹理特征提取有以下几种方法。
基于统计方法的纹理特征提取方法是根据统计特征,如局部直方图,局部二元直方图
或相关系数,来描述图像中的纹理。
它们可以用来比较每个像素和其邻域内像素之间的统
计特征,从而提取出局部纹理特征,并可用于识别各种类型的纹理。
2. 基于模式识别方法的纹理特征提取方法
基于模式识别方法的纹理特征提取方法是一种高维特征,它利用图像空间中的模式识
别算法,如Gabor小波变换、结构元素统计和生成模式和多分辨率分析,来提取包含的图
像纹理特征。
它仅从局部的特征提取中获得了更多的信息,可用于图像识别算法的输入参数。
基于矢量方法的纹理特征提取方法利用增强矢量实现图像中纹理的提取和分类。
该方
法主要是利用矢量图来逆变换成像素图,并利用这些矢量图来描述图像纹理特征。
它不仅
能够给出空间特征,而且能够提供更多的信息,可用于纹理分类及其他图像识别应用的研
究中。
此外,近年来也出现了基于深度学习的纹理特征提取方法。
基于深度学习的纹理特征
提取方法利用深度神经网络,自发提取和描述纹理特征,从而使图像纹理特征更加多样化。
它可以在保持纹理特征多样性的同时提高识别准确度。
人眼视觉感知融合等周理论的自然迷彩纹理提取
为完整的图像细节 , 更易 于与 目标背景相融合。分 割质 量 评定 指标 的定 量评 价也证 实 了本 文方 法 的有
效性 。
C, I ≤
1 人类视 觉模 型
人 类 的 眼 睛 有 两 大 类 视 觉 细胞 分 别 是 视 杆 体
2 0 1 3年 9月 1 7 日收到 四 川 省科 技 厅 支撑 计 划 项 目
图案 。
因此 , 试 图结 合 人 类 视 觉 感 知 特 性 和 等 周 理 论 , 提 出一 种 有 效 的 数 码 迷 彩 纹 理 提 取 方 法 , 利 用人 眼对 亮 度差 的敏感 度对 图像 的灰 度级 进行 分割 与合 并 , 从 而提 高数 码 迷 彩 纹 理 的 提取 质 量 。 与 现有 的几种 经典 阈 值分 割 方 法 的 比较 实验 表 明 , 该 方法 提 取 的数码 迷彩 纹理 具有 良好 的混 色效果 和较
第 1 4卷
第 5期
2 0 1 4年 2月
科
学
技
术
与
工
程
Vo 1 . 1 4 N o . 5 F e b .2 0 1 4
1 6 7 1 —1 8 1 5 f 2 0 1 4 ) 0 6 . 0 1 2 4 — 0 5
S c i e n c e T e c h n o l o g y a n d E n g i n e e r i n g
等周 理论 的数码迷 彩纹理提 取方法。此方法先利用人 的视 觉感 知特性构 造边权值 函数 , 再将 等周 率作为选 择分 割阈值 的准 则, 选取最小 等周 率所对应 的的候选 阈值 作为最终 分割阈值 , 完成数码迷 彩纹理 的提 取。在一 系列 自然纹理 图像上 的实验结 果表 明, 与现 有的几种 经典 多阈值 分割方法相比 , 此方法 的分 割效果更好 。 关键词 数码迷彩 等周理论 多级 阈值 图像分 割
基于图像处理的纹理分析与识别算法研究
基于图像处理的纹理分析与识别算法研究摘要:图像纹理是一种视觉特征,对于图像分析和识别具有重要意义。
本文针对基于图像处理的纹理分析与识别算法进行研究,探讨了常见的纹理特征提取方法和纹理分类技术,并对图像纹理分析与识别在实际应用中的挑战进行了讨论。
通过对现有算法的综合分析和比较,提出了一种综合性的纹理分析与识别算法,该算法在不同数据集上进行了实验验证,并与其他算法进行了对比。
实验结果表明,该算法在纹理分类任务中取得了较好的性能。
1. 引言图像纹理是指图像中不规则的、表达风格和结构的像素分布。
它能提供丰富的视觉信息,被广泛应用于图像处理、模式识别、计算机视觉和机器学习等领域。
基于图像处理的纹理分析与识别算法的研究旨在自动化地从图像中提取纹理特征并进行分类识别,以满足实际应用中对纹理信息的需求。
2. 纹理特征提取方法在图像纹理分析中,提取纹理特征是非常关键的一步。
常见的纹理特征提取方法包括灰度共生矩阵、局部二值模式、Gabor滤波器和小波变换等。
2.1 灰度共生矩阵灰度共生矩阵(GLCM)是一种用于描述纹理特征的统计方法。
它通过计算图像中不同像素之间的灰度级关系来提取纹理特征。
主要包括对比度、相关性、能量和熵等几个特征参数。
灰度共生矩阵方法简单且计算效率高,被广泛应用于纹理分析与识别任务中。
2.2 局部二值模式局部二值模式(LBP)通过比较中心像素与相邻像素的灰度级来提取纹理特征。
它具有不变性和计算效率高的优点,被广泛应用于人脸识别、纹理分类和目标检测等任务中。
2.3 Gabor滤波器Gabor滤波器是一种基于多频率和多尺度模型的纹理特征提取方法。
它模拟人眼对纹理信息的感知过程,具有较好的旋转和尺度不变性。
Gabor滤波器在纹理分析和识别任务中取得了较好的效果。
2.4 小波变换小波变换是一种将信号分解成不同尺度和频率的方法。
它通过分析图像中不同的频率分量来提取纹理特征。
小波变换方法具有较好的多尺度性和时间-频率局部化特性,被广泛应用于图像压缩和纹理分类等领域。
lpips指标
lpips指标LPIPS (Learned Perceptual Image Patch Similarity) 是一种评估图像质量的指标,它是基于人类感知的视觉系统而设计的。
LPIPS 使用了深度学习技术为每个图像提取特征,并基于这些特征计算它们之间的相似度。
这个指标对于图像处理、计算机视觉、机器学习等领域都非常有用,它能够帮助我们更加准确地评估图像的质量和相似度。
LPIPS 的设计思路LPIPS 评估指标是基于人类视觉系统的感知能力而设计的。
人类视觉系统能够对图像的感知进行高度的对比和相似性的判断。
LPIPS 的设计就是要完全模拟这种判断过程,让这个评估指标更加符合人的视觉感知。
LPIPS 的设计思路可以分为两个阶段:图像特征提取和特征相似度计算。
在第一个阶段,LPIPS 使用了一些基于深度学习的算法来提取图像中的特征向量。
这些算法使用了许多卷积神经网络架构,包括 VGG 和 ResNet 等。
这些网络能够从图像中提取出许多不同的特征,如边缘、颜色、纹理等,这些特征能够反映图像的不同方面,在后续计算中非常关键。
在第二个阶段,LPIPS 的计算方法采用了一种相对的方法,即将两个图像在相同的网络中进行前向传播,获得它们对应的特征向量,然后计算它们之间的距离。
LPIPS 通过对比距离来评估两个图像的相似度。
如果两个图像在特征空间中有相似的分布,那么它们的距离就比较小,它们的相似度就更高。
LPIPS 的优缺点LPIPS 评估指标有许多优点。
首先,它可以模拟人类视觉系统的感知力,这使得它非常适合评估图像的相似性和质量。
其次,它基于深度学习技术,可以从图像中提取出许多不同方面的特征来评估图像的相似度。
它也可以用于评估许多不同类型的图像,包括图像、视频、3D 模型等。
除此之外,LPIPS 也有一些缺点。
首先,它需要大量的计算资源来进行特征提取和相似度计算。
其次,它也有一定的局限性,它无法考虑图像的语境和含义,只能通过图像本身的特征来评估它的质量和相似度。
基于人类视觉系统特性的直方图可逆信息隐藏算法
图像 的不 可感性. 收 方得 到 水 印 图像后 , 同样 接 按 的方法对水 印图像 进行 分块 和划分 , 不 同区域水 对
体数字图像嵌入数字信息的同时, 往往也会造成原
始 图像不 可逆转 的改变 , 即使 在提 取 嵌 入信 息 后 , 仍 无法 获得原始 图像. 而保证原 始数据 的完整 性是
1 示. 所
信息 隐藏 算法 就显得尤 为重要. 可 逆信息 隐藏 算 法 原 理 如 下 ¨ : 存 在 的载 J对
体数字 图像信号 J使用无损信息隐藏算法 , , 将信 息 嵌入 到 中获得 隐秘数 字 图像 信号 ,, 然后 , 可公开传 播与通 信 对 接 收者 , 在 没有 载 体数 字 可 图像信号 和嵌 入 信 息 的情 况 下 , 获 得 的 ,中 从 通过相 应提取算 法得 到嵌入 的信息 , 能够 完整 并 的恢复 嵌入信息 前 的载体数字 图像信 号 目前 , 信息 隐藏算法按 实现 方式 可分为两 可逆 类 , 法和 变换域 法. 域 法 中基 于 图像 直 方 图 空域 空 的可逆 信息 隐藏算法具 有信息 隐藏容 量大 、 算法简 单、 有较 高峰值 信 噪 比等特 点 , 因此在 很 多领 域得
1 2 纹理 区和边缘 区的分类算 法 .
边 缘 区对噪声 不是很 敏感 , 可嵌入适 量秘 密信 息. 在边缘 区 图像 块直 方 图谷 值点 ( a e ) 右 可 Vly 左 l
变异度 是标准 差 占均 值 的 比例 , 变异度计 算方
法 如下 :
两边生 成嵌入 信息 的空 间. 谷值点 在 图像 块直方 图 中对应 出现次 数最少 的灰度 值点 , 设谷值 点灰度 值 为 g , 值点左 边 点 灰 度 值 为 g 谷 一1 谷 值 点 右边 ; 点灰度 值 为 g +1 按行 逐 点 扫 描 图 像块 , 所 有 . 将
符合人类视觉感知的图像对象分割方法
+J) ;…
( )
时,目前大多数 的分割方法都只考虑了底层图像特征 的一致 性 ,所以分割得 到的结果通常也只是一些底层特征一致 的图 像 区域 ,并不能直 接分 割出图像对象。文献【】 2试图解决 图像
由式 1 ( 生成图 ) 像尺 度序列{ 、 从中抽 。 J , 取,和J 作
( s tt r at nR c g i o n t c l nel e c , a h n ies yo c n ea d e h o o y W u a 3 0 4 C ia I tuef t r e o nt na dAr f i tl g n e Hu z o gUnv ri f i c c n lg , h n4 0 7 , hn ) ni oP e i i aI i i t S e n T
l 概述
图像分割是将 图像划分成若干具有特征一致性且互不重
叠 的图像 区域的过程 。理想的图像分割能抽取 出和真实世界
对 应 的 图像 对 象 ,从 而 使 更 高 层 的 图像 理 解 成 为 可 能 …。 同
f。 , =,
1: +r l t i; , △竺二 ( J
ojc e t cin b sd o betmo e,i po oe n ti p pr An i g ss ohd b oiersaeo ea ri cas—cl, oo bet xr t ae n ojc dl s rp sd i hs ae. ma ei mote y n l a cl p rt n o r sae c lr a o n o e
[ src]I g bet e mett nmeh di ac r t u nvs npret n whc o s t o o besaergo e me t ina d Abta t maeojc sg nai to n codwi h ma io ecpi , i cni s f u l— l insg na o n o h i o h s d c e t
fsim指标
fsim指标
FSIM(Feature Similarity Index Measure)是一种用于评估图像质量的指标。
它利用特征相似性进行质量评价,主要考虑了图像的结构和纹理信息。
FSIM指标基于人类视觉系统(HVS)的特性,认为图像中的特征对于感知图像质量非常重要。
这些特征包括边缘、角点、纹理等,它们在图像中起着关键作用。
FSIM通过比较两幅图像的特征相似性来评估它们的质量。
它采用了一种多尺度的策略,在不同的尺度上提取特征,并比较这些特征的相似性。
这样做的好处是能够同时考虑图像的细节和整体结构。
FSIM指标的计算过程包括以下几个步骤:
1.特征提取:在输入的两幅图像中,使用滤波器组提取特征。
这些特征可以
是边缘、角点、纹理等。
2.特征描述:对于提取的特征,使用描述子进行描述。
描述子可以是SIFT、
SURF、ORB等。
3.特征匹配:比较两幅图像的特征描述,找出匹配的特征点。
可以使用最近
邻距离或者其他算法进行匹配。
4.特征相似性度量:根据匹配的特征点,计算它们之间的相似性度量。
可以
使用SSIM、NCC等度量方法。
5.质量评估:将所有尺度上的相似性度量进行平均,得到最终的质量评估结
果。
总之,FSIM指标是一种综合考虑了图像结构和纹理信息的评估方法,具有较好的可靠性和准确性。
它能够有效地评估图像质量,并被广泛应用于图像处理和计算机视觉领域。
纹理特征——精选推荐
纹理特征第⼀章绪论1.1研究背景随着计算机技术的迅速发展以及机器视觉系统在通信、宇宙探测、遥感、⽣物医学等领域的应⽤,纹理图像分析技术越来越成为视觉领域研究的热点话题。
在⽇常⽣活中,图像随处可见,我们所接受的所有信息的80%是来⾃视觉信息,可见图像信息在我们⽇常⽣活中的重要性。
图像的特征主要包括颜⾊特征、纹理特征和形状特征。
相⽐于颜⾊特征和形状特征,图像的纹理特征包含了图像的许多信息,通过对其分析可以得到更好的宏观和微观信息,所以在图像分析中,纹理的特征分析越来越受到⼈们青睐。
因此,越来越多的国内外学者致⼒于图像纹理特征提取的研究。
纹理特征提取技术作为数字图像处理领域中的⼀种新的应⽤,在军事、医学和计算机科学等众多领域,都⼴泛地采⽤了这⼀技术。
(1). ⽆⼈飞⾏器的⾃主导航与定位利⽤存放在飞⾏器上的参考图像,与其在飞⾏过程中获得的下视或前下视、图像进⾏⽐较,从⽽判断⽆⼈飞⾏器的当前位置,确定其飞⾏⽅向和位置上的偏差[1-3]。
(2)遥感测量从20世纪90年代以来,随着遥感技术的提⾼,⾼分辨率的遥感影像越来越多,遥感可以在较⼩的空间范围内观察地表的细节变化,进⾏⼤⽐例尺遥感制图、提取⾼精度的地理信息、监测⼈为活动对环境的影响等。
借助对遥感图像的纹理分析、提取影响的纹理特征,可以推进影响解译的⾃动化[1]。
在遥感图像中,不同地形地貌对应着遥感图像中不同的纹理图像,平原、⼭地、丘陵、村庄、⽔域、⽥地等不同地貌可以通过纹理区分开来。
(3)医疗辅助诊断从严格意义上说,在引⼊线代医疗仪器前,医学基本上不能称为科、学。
传的医疗诊断靠的是经验。
事实上即使在今天中医也基本上依靠经验。
这样就带来了两⽅⾯的问题,⼀是医⽣的训练⽆法科学化,⽽是诊断的结果加⼊了较多的⼈为因素。
现代医疗仪器的使⽤在⼀定程度上解决了这两⽅⾯的问题,但仪器除了直接提供数据外,⼏乎不能进⾏任何⾃动分析⼯作,很多仪器如X-光机、CT、B 超、各种显微诊断设备等提供的都是图像,这样诊断的结论⼜⼀次依赖于读者经验。
特征提取uve算法
特征提取uve算法特征提取是计算机视觉领域中的一项重要任务,旨在从原始图像数据中提取出代表其特征的信息。
特征提取是许多计算机视觉应用的基础,包括目标检测、图像分类和人脸识别等。
基于分析人眼的视觉特征,UVE(Unity of Visual Elements)算法提取图像的局部和全局特征,以便对图像进行高级分析和识别。
UVE算法通过模拟人眼对图像的感知来实现特征提取。
UVE算法的特征提取过程主要包括以下几个步骤:1. 边缘检测:通过使用Canny算子等边缘检测算法,提取出图像中的边缘信息。
边缘是图像中的显著特征之一,可以用于后续的形状和轮廓分析。
2.色彩特征提取:UVE算法利用颜色直方图提取图像的色彩特征。
颜色直方图是一种统计图表,用于表示图像中各个颜色的分布情况。
通过计算颜色直方图,可以得到图像的颜色分布特征,进而用于图像分类和识别。
3.纹理特征提取:UVE算法使用各种纹理特征描述符,如局部二值模式(LBP)、灰度共生矩阵(GLCM)和方向梯度直方图(HOG)等,提取图像的纹理特征。
纹理是图像中的一种结构性信息,可以用于识别物体的表面特征。
4.字形特征提取:UVE算法通过分析图像中的字形信息来提取特征。
字形是指物体的形状、结构和轮廓等特征。
UVE算法可以通过检测图像中的几何形状和轮廓来提取字形特征。
5.空间分布特征提取:UVE算法通过对图像进行空间分析,提取出图像中不同物体之间的空间关系和分布特征。
空间分布特征可以用于判断物体之间的相对位置和距离关系。
特征提取完成后,UVE算法将提取的特征向量输入到分类器中进行分类和识别。
分类器可以是传统的机器学习算法,如支持向量机(SVM)和k最近邻分类器(k-NN),也可以是深度学习模型,如卷积神经网络(CNN)和循环神经网络(RNN)。
由于UVE算法模拟了人眼对图像的感知过程,因此在图像处理和计算机视觉领域具有广泛的应用。
例如,在图像和图像检索中,可以利用UVE 算法提取图像的视觉特征,以便进行相似图像的匹配和检索;在人脸识别和人体姿态估计中,可以利用UVE算法提取图像中的关键点和特征,以实现人脸和人体的识别和分析。
基于人类视觉特性的纹理分割方法
维普资讯
第2 6卷 第 5期
20 0 6年 5月
文 章 编 号 :0 1 0 l 2 0 ) 5一t 1 0 1 0 —9 8 ( 0 6 0 O 5— 3
计算机应用
Co u e p i ain mp tr Ap lc t s o
V 12 o 5 o. 6 N .
fau e h o e ca sf ai n rs s a d te l td a p iain d man n t i a e , a txu e e tt n ag rt m e tr ,t e w r l i c t et n h i e p l t o i .I h s p p r e t r s g na i l o h s s i o e mi c o e m o i b e n t e HVS me h n s wa r s ne . I C i e te n mb r o e t r y e a d a p o i t r a n te i g s a d o h c a im s p e td t a gv h u e f txu e tp e n n p r xma e a s i h ma e e
基于视觉感知特性的彩色图像分割
y 个 聚 类 中 心 。 X
现代计算 机图形 系统 可以产生 成千上 万种颜 色 , 而好
的 视 觉 观 察 员 ( C E定 义 ) 能 对 在 最 大 亮 度 的 1 0 0 由 I 只 70
种颜色做 出响应 l 。人 眼 中的红 色视 锥 细胞 具 有很 小 的 4 ] 光谱敏感 度 , 色视锥 细胞 具 有最 大敏 感 度 , 然蓝 色视 绿 虽 锥细胞敏 感度 适 中 , 与 绿 色视 锥 细 胞 敏感 度 更 为 相 近 但
域, 也可 以对应于多个 区域 。关 于 图像 分割 领域 的研究有
很多不同的技术 L , 2 大概可 以分为基于直方 图的 , 于边 界 ] 基
* 收 稿 日期 :0 1 8月 9日, 回 日期 :0 1年 9月 盼盼 , , 常 女 硕士研究生 , 研究方 向 : 图像处理 , 模式识别。黄继风 , 博士 , 教授 , 硕士生导 师, 研究方 向: 模式识别 , 数据挖掘 ,
图像纹理特征提取方法综述
图像纹理特征提取方法综述一、本文概述随着计算机视觉和图像处理技术的飞速发展,图像纹理特征提取已成为该领域的一个重要研究方向。
纹理作为图像的基本属性之一,反映了图像的局部模式和结构信息,对于图像识别、分类、分割等任务具有至关重要的作用。
本文旨在全面综述图像纹理特征提取方法的研究现状和发展趋势,以期为相关领域的研究人员提供有益的参考和启示。
本文将首先介绍纹理特征提取的基本概念和研究意义,阐述其在图像处理和分析中的重要性。
随后,将详细综述经典的纹理特征提取方法,包括基于统计的方法、基于结构的方法、基于模型的方法和基于变换的方法等,分析它们的优缺点和适用范围。
在此基础上,本文将重点介绍近年来新兴的深度学习纹理特征提取方法,包括卷积神经网络(CNN)、循环神经网络(RNN)等,探讨它们在纹理特征提取方面的优势和应用前景。
本文还将对纹理特征提取方法的应用领域进行简要介绍,包括图像分类、目标检测、图像分割等,并展望未来的研究方向和挑战。
通过本文的综述,我们希望能够为相关领域的研究人员提供全面的纹理特征提取方法知识,促进该领域的进一步发展。
二、纹理特征提取的基本概念和原理纹理是图像的一种重要属性,描述了图像局部区域的像素排列模式和重复结构。
纹理特征提取旨在从图像中识别并量化这些模式,以用于诸如图像分类、目标识别、场景理解等计算机视觉任务。
在进行纹理特征提取时,主要涉及到几个核心概念,包括滤波器、特征向量、统计量以及纹理模型。
滤波器:滤波器在纹理特征提取中扮演着关键角色,用于检测图像中的特定频率和方向信息。
常见的滤波器包括Gabor滤波器、小波变换滤波器、局部二值模式(LBP)滤波器等。
这些滤波器能够在不同尺度上提取图像的局部信息,从而捕获到纹理的精细结构。
特征向量:通过滤波器处理后的图像数据需要进一步转化为特征向量,以便进行后续的分析和比较。
特征向量通常是一组数值,用于量化图像中某一区域的纹理特征。
常见的特征向量包括灰度共生矩阵(GLCM)的统计量、傅里叶变换系数、小波变换系数等。
通过视觉认知心理学对三维模型分割
通过视觉认知心理学对三维模型分割摘要:随着三维模型网格的造型、重构和可视化等相关技术的迅速发展,以及先进的、高精度的扫描技术的不断推出,三维模型的复杂度和数据量急剧增长,远远超过了当前计算机实时的图形处理能力。
因此产生了许多以模型分割为初步阶段的网格相关算法,从而可以大大降低三维模型的复杂程度。
因此三维模型分割成为近年来的热点研究课题。
而在三维形状分析、模拟压缩、模型检索和三维动画等方面的应用上,三维模型的语义分割更具有实际意义。
三维模型分割是指根据一定的几何及拓扑特征,将封闭的网格多面体或者可定向的二维流形,依据其表面几何、拓扑特征,分解为一组数目有限、各自具有简单形状意义的、且各自连通的子网格片的工作,是一种将网格模型分解为许多有意义的连通网格子集的过程。
早期的研究工作中有两方面的工作对三维模型分割研究有着巨大的影响。
一个是计算几何的凸分割。
其目的是把非凸的多面体分解为较小的凸多面体,以提高图形学绘制和渲染的效率。
该工作的研究广泛,但是多数的算法难以实现和调试。
由于多面体网格边界的分割算法容易实现,复杂形体的计算量往往是线性的,所以计算几何的凸分割往往不去用于分割多面体,而是分割它的边界。
另外一个是计算机视觉中的深度图像分割。
深度图像具有很简单的行列拓扑结构,处理起来比较容易,所以其分割算法相对简单。
心理物理学认为:人类对形状进行识别时,部分地基于分割。
复杂事物往往被看作简单的基本元素或组件的组合。
由此发展出视觉理论的―最小值规则,即人类在对物体的认知过程中,倾向于把最小的负曲率线定义为组成要素的边界线,并据此将物体分割为几个组成要素,由此得到的分割结果被称为―有意义的分割,也可以称为语义分割。
而语义分割对于网格模型显著占优特征的表示和提取、多尺度的存储和传输以及分布式局部处理都是十分有意义的。
关键词:三维模型分割;语义分割;视觉认知心理学;骨架提取;捷径规则一、三维模型分割的发展三维模型分割算法在早期的时候多为手工分割或者半自动分割,而后逐渐出现了基于自动分割的应用工作。
一种视觉显著性引导的模糊聚类图像分割方法
㊀第54卷第2期郑州大学学报(理学版)Vol.54No.2㊀2022年3月J.Zhengzhou Univ.(Nat.Sci.Ed.)Mar.2022收稿日期:2021-05-26基金项目:国家自然科学基金项目(61703252,62076154);国际科技合作计划项目(201903D421050);中央引导地方科技创新项目(YDZX20201400001224)㊂第一作者:白雪飞(1980 ),女,副教授,主要从事图像处理㊁机器学习研究,E-mail:baixuefei@㊂通信作者:王文剑(1968 ),女,教授,主要从事机器学习㊁计算智能㊁图像处理研究,E-mail:wjwang@㊂一种视觉显著性引导的模糊聚类图像分割方法白雪飞1,㊀韩晓静1,㊀王文剑1,2(1.山西大学计算机与信息技术学院㊀山西太原030006;2.山西大学计算智能与中文信息处理教育部重点实验室㊀山西太原030006)摘要:传统的模糊C 均值聚类算法利用图像的灰度㊁颜色㊁纹理㊁强度等底层特征进行聚类,实现图像的分割,它容易受到噪声的影响,且计算量大,不能提供理想的彩色图像分割结果㊂针对这些问题,提出一种视觉显著性引导的模糊聚类图像分割方法㊂首先使用显著性检测对图像进行初始化分割,得到带有区域级标注信息的引导图,然后将引导图作为指导信息,引导模糊聚类算法对图像进行细分割㊂在公共数据集上的实验结果表明,本文方法与其他改进的FCM 算法和深度网络分割模型相比,可以取得较好的分割效果,有效减少了分割时间㊂关键词:模糊C 均值聚类;显著性检测;彩色图像分割;聚类分割中图分类号:TP391.4㊀㊀㊀㊀㊀文献标志码:A㊀㊀㊀㊀㊀文章编号:1671-6841(2022)02-0001-07DOI :10.13705/j.issn.1671-6841.2021213Visual Saliency-guided Fuzzy Clustering Method forImage SegmentationBAI Xuefei 1,HAN Xiaojing 1,WANG Wenjian 1,2(1.School of Computer and Information Technology ,Shanxi University ,Taiyuan 030006,China ;2.Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry ofEducation ,Shanxi University ,Taiyuan 030006,China )Abstract :The traditional fuzzy C -means clustering algorithm uses the low-level features of image,such as grayscale,color,texture and intensity,to achieve image segmentation.These methods are susceptible to noise and has a large amount of calculation,so they can not provide ideal color image segmentation results.To solve these two problems,a visual saliency-guided fuzzy clustering imagesegmentation method was proposed.Firstly,the image was initialized and segmented by saliency de-tection,and the guide graph with region-level labeling information was obtained.Then,the guide graph was used to guide the fuzzy clustering algorithm to segment the image.Experimental on the three common data sets showed that,compared with other improved FCM algorithm and deep networksegmentation model,the proposed method could achieve better segmentation results and reduce the segmentation time effectively.Key words :fuzzy C -means clustering;saliency detection;color image segmentation;cluster segmentation0㊀引言彩色图像分割是图像处理中的一项重要技术,在实际应用过程中,面对不同的分割任务需求,需要灵活地采用不同的图像分割方法㊂图像分割方法主要分为基于边缘㊁阈值㊁聚类和特定理论[1-4]等分割方法㊂模糊聚类算法由于其快速有效的分割特点,郑州大学学报(理学版)第54卷已经被成功应用于智能交通㊁医学影像等领域㊂在众多的模糊聚类方法中,模糊C均值算法(fuzzy C-means,FCM)已成为图像分割领域最主要的方法之一㊂但FCM算法也存在一些不足之处:首先,FCM 算法忽略了图像的空间信息,对噪声和分布不均匀的像素较为敏感;其次,FCM算法在进行图像分割时,需要遍历所有像素,图像分辨率越高,算法的时间复杂度越高㊂针对FCM算法忽略图像空间信息,对噪声较为敏感等问题,Krinidis等[5]提出了基于模糊局部信息C均值聚类算法(fuzzy local information C-means, FLICM),通过引入空间模糊因子,将像素的局部空间信息与灰度信息相结合,提升了算法的鲁棒性,但该算法的时间复杂度较高㊂针对FCM算法分割时间取决于图像分辨率大小的问题,学者们提出利用直方图信息对原始图像分类,可大大降低算法的时间复杂度㊂Cai等[6]提出了快速广义的模糊聚类算法(fast generalized fuzzy C-means,FGFCM),该算法的时间复杂度取决于图像的灰度级数量,且通过融合局部空间信息和灰度信息,提高了算法对噪声的鲁棒性,又保留了图像的边缘细节,但是在对给定彩色图像进行分割时,需要进行特殊的预处理㊂Lei 等[7]提出了快速鲁棒性的模糊聚类算法(fast and robust fuzzy C-means,FRFCM),该算法首先利用形态学运算去除图像噪声,然后利用形态学重建弥补图像细节,使得FRFCM获得了更为理想的分割效果,但是该算法在彩色图像分割中,仍需要大量的执行时间㊂上述改进的FCM算法在提高图像分割效果的同时,也增加了计算量;尤其是在彩色图像分割中,传统FCM算法及其改进的算法,只利用了像素的灰度㊁颜色㊁纹理等底层特征来进行图像聚类,未考虑图像的高层语义信息㊂针对这些问题,本文提出一种视觉显著性引导的模糊聚类图像分割方法(sali-ency-guided fuzzy C-means,SGFCM),将显著图作为先验信息,引导模糊聚类对彩色图像进行分割;同时将像素的显著值度量引入FCM的目标函数中,来提高算法的分割精度㊂本文工作的主要贡献为:1)使用显著性检测方法对图像进行预分割,分割结果具有高层语义信息,符合人眼视觉特征,利用高层语义信息引导模糊聚类方法进行图像分割; 2)在模糊聚类算法的目标函数中,引入显著性度量,在前景和背景颜色相似的图像分割任务中,能够有效地将前景与背景进行分离㊂1㊀模糊C均值(FCM)聚类算法FCM算法是众多模糊聚类技术中应用最广泛的算法之一㊂Dunn最先提出了FCM算法[8],首次将模糊理论引入聚类算法中,而后Bezdek对其进行了改进与推广[9]㊂FCM算法主要是通过不断的迭代运算,得到更新的隶属度矩阵和聚类中心,最终求得目标函数值㊂将FCM算法应用于图像分割中,是将一幅图像中包含的所有像素点看作一个需要归类的样本数据集合,以各像素点的特征作为样本的特征向量,通过欧氏距离度量像素点之间的相似性,从而将图像分割转变为求解FCM算法的最优解问题,其目标函数为Jm=ðc k=1ðn i=1u m ki d2ki(x i,v k),(1)其中:c为聚类类别数;n为图像中像素的总数;u ki 为隶属度函数,表示第i个样本属于第k个类中心的概率;m为模糊指数,决定了划分结果的模糊性,一般情况下m=2;d ki表示样本x i到聚类中心v k的欧氏距离,用于衡量相似性大小㊂式(1)的约束条件为ukiɪ[0,1],1ɤiɤn,1ɤkɤc, 0<ðc k=1u ki<n,1ɤkɤc㊂ìîíïïïï(2) 2㊀本文算法针对传统FCM及改进算法未考虑图像高层语义信息的问题,本文提出SGFCM方法,图1为算法的过程图㊂算法分为两个分支:第一个分支通过显著性检测和阈值处理生成具有区域级标注的引导图,作为先验信息;第二个分支通过多元形态学重建对待分割图像进行去噪㊂将两个分支产生的结果图用于模糊聚类算法中,实现彩色图像分割㊂本文提出的SGFCM方法,有效地将高层语义信息和底层颜色信息相结合,使用视觉显著性引导模糊聚类对图像进行分割,分割效果与人类感知更符合㊂2.1㊀引导图生成人类的视觉注意力机制可以很容易地在复杂的背景中判断图像中的显著区域,优先分配图像分析所需要的计算资源㊂视觉显著性是模仿人类视觉注意力机制选择场景中某个子集的能力,由此产生的显著图像对视觉处理的后续任务有着重大的意义㊂本文利用显著性检测对图像的显著区域和背景区域2㊀第2期白雪飞,等:一种视觉显著性引导的模糊聚类图像分割方法㊀㊀图1㊀算法过程图Figure 1㊀Algorithm process diagram进行标记,生成引导图,在两部分区域分别执行模糊聚类算法,能有效提高计算效率,缩短算法的执行时间㊂图2为实现引导图的整个流程㊂图2㊀引导图实现过程Figure 2㊀Guide map realization process首先输入待分割图像I ,通过显著性检测得到显著图,如图2(b)所示,区域越亮,表示该区域的显著值越高,越容易引起观察者的注意㊂得到显著图后,利用阈值分割和形态学处理对显著图进一步处理,本文选取OSTU 算法来得到阈值图,如图2(c)所示㊂由图2(c)可知,经过阈值分割的图像中存在一些较小的独立的像素块,为了去除显著区域周围较小的干扰像素块,采用形态学处理的方式改善阈值分割后的结果,如图2(d)所示㊂白色框外的部分为确定的背景区域,记为F B ;框内包含部分背景和目标,为不确定区域,记为F U ㊂2.2㊀预处理图像在传输和存储的过程中容易产生噪声,而传统的FCM 算法对含噪声的图像不具有鲁棒性,针对这个问题,学者们提出对灰度图像进行形态学重建[10],不仅能平滑图像,保留图像的边缘细节,同时能在事先不确定噪声类型的情况下对图像去噪,有利于提高后续分割算法的准确率㊂但彩色图像不同于灰度图像,它拥有R㊁G㊁B 三个通道的信息,所以彩色图像中每一个像素都是一个矢量,需要将矢量进行排序后,才能对图像进行形态学重建处理㊂本文采用文献[11]提出的一种偏序方法,将RGB 空间中的矢量变换到YUV 空间,排序之后再进行多元形态学重建操作㊂原图像经过多元形态学重建处理后,能够去除大部分噪声和孤立点,同时保留图像细节信息,使后续模糊聚类算法结果更加准确㊂结合2.1小节中所生成的引导图F U ㊁F B 和经过预处理的图像I M 以及公式(3),能够得到具有标记信息的待分割图像I S ㊂I U 表示具有标记信息的前景区域,I B 表示具有标记信息的背景区域㊂I S =I B +I U ,I U =I M ɘF U ,I B =I M ɘF B ㊂ìîíïïïï(3)2.3㊀一种结合视觉显著性的FCM 算法在彩色图像分割中,FCM 算法以及改进算法都是通过像素与聚类中心的颜色相似度来计算目标函数值,未考虑像素的显著性㊂本文提出将像素的显著值加到FCM 的目标函数中,计算像素点与中心像素的颜色距离和显著值距离㊂本文提出的SGFCM 算法的目标函数定义为J m =ðc k =1ðni =1umki[d 2ki (x i ,v k )+s 2ki (x i ,v k )],(4)其中:c 为聚类中心总数;n 为像素总数;x i 表示第i 个像素;v k 表示第k 类的中心;u ki 为隶属度函数,表示把像素x i 划分到第k 个类中心的概率;m 为模糊指数;s 2ki (x i ,v k )表示x i 到第k 个聚类中心的显著值距离,用于衡量像素与聚类中心显著性的相似性,使用x is ㊁v ks 分别代表第i 个像素和第k 个类中心的显著性值,s 2ki 的计算公式为s 2ki=(x is -v ks )2㊂3郑州大学学报(理学版)第54卷㊀㊀本文在CIE-Lab空间下完成图像分割,所以像素点与聚类中心的距离公式为d ki =(xil-vkl)2+(x ia-v ka)2+(x ib-v kb)2㊂2.4㊀算法流程SGFCM算法的具体步骤描述如下㊂输入:待分割RGB图像I㊂输出:分割结果图M㊂步骤1㊀对待分割图像进行形态学重构,消除噪声影响,对图像进行显著性检测,得到图像的显著性图,根据OSTU算法和形态学处理得到标记图,作为模糊聚类算法的引导图;步骤2㊀在I U区域和I B区域分别进行聚类,更新隶属度和聚类中心;步骤3㊀如果算法迭代次数大于T,或聚类中心变化小于阈值,则算法结束,输出分割结果;否则执行步骤2;步骤4㊀根据公式(3),合并最终结果图㊂3㊀实验结果与分析为了验证本文提出的SGFCM算法对彩色图像的分割效果,同时评估本文算法的有效性和效率,实验选取了FCM㊁FGFCM㊁FLICM㊁FRFCM以及深度分割网络PSP-Net[12]作为对比算法进行分析比较㊂实验硬件配置为CPU:Intel i7-10700K@3.8GHz; RAM:DDR416GB㊁3200MHz;GPU:NVIDIA GTX 1080Ti㊁11GB㊂编程环境为MATLAB2019b和Py-thon3.7㊂3.1㊀参数设置本文算法和其他4种模糊聚类对比算法都是基于目标函数优化的聚类算法,因此在目标函数迭代之前,需要设置3个参数:模糊指数㊁收敛条件和最大迭代次数㊂本文实验中这3个参数分别设置为2㊁10-5和50㊂对于需要采用固定大小邻域窗口的算法,统一采用3ˑ3的邻域窗口㊂FGFCM算法的空间尺度因子为λs=3,FRFCM算法中用于多元重构的SE大小和用于隶属度滤波的窗口大小都设置为3ˑ3㊂对于深度分割网络PSP-Net,训练阶段设置batchsize=16,初始学习率为0.01,在梯度下降求解神经网络参数时,使用Momentum优化方法来加快收敛速度,设置Momentum中的参数β=0.9,权重衰减为0.0001㊂显著性检测算法采用文献[13]中提出的基于直方图对比度的方法,颜色量化在RGB 颜色空间中进行,在Lab空间测量颜色的距离㊂3.2㊀分割效果对比实验为了验证本文算法的有效性,使用公共数据集BSDS500[14]㊁MSRC[15]和PASCAL VOC2012[16]进行实验㊂BSDS500数据集包含500张大小为481ˑ321或321ˑ481的自然图像㊂MSRC数据集包含591张大小为320ˑ213或213ˑ320的自然图像㊂PASCAL VOC2012数据集包含20个目标类别,其中训练集㊁验证集和测试集的图像数量分别为10582张㊁1449张㊁1456张㊂本文算法与模糊聚类算法的对比实验选取MSRC和BSDS500作为测试数据集,图3展示了5种算法对自然图像的分割对比图,1)~3)行的分割图像来自BSDS500数据集,4)~6)行的分割图像来自MSRC数据集㊂图3的1)~5)行图像中,显著目标较小或图像的背景较为复杂,对比算法FCM㊁FGFCM㊁FLICM的分割结果中包含了大量的小区域块,有时甚至无法准确将目标聚类,FRFCM算法因为使用多元形态重构和隶属度滤波,得到了较好的分割结果㊂本文算法能够较好地将目标分割出来,且背景较为干净㊂第6)行图像中前景目标有明显的光线明暗变化所带来的噪声,其他4种对比算法的分割结果都被这种噪声所影响,导致分割结果不连续,本文算法能较为完整地将前景分割出来,有效地避免了噪声的干扰㊂本文算法与深度分割网络PSP-Net的对比实验选取PASCAL VOC2012为测试数据集㊂图4展示了图像的分割结果对比图,PSP-Net的分割结果具有语义信息,但部分图像的分割结果不完整㊂本文算法的分割结果虽然不含语义信息,但无论在背景简单或者纹理复杂的图像中,都能够将图像中的前景物体较为完整地分割出来㊂总体来看,在处理前景与背景颜色相似或差异较大的图像时,本文算法都能得到较好的分割结果㊂本文所提出的SGFCM 算法利用视觉显著性来表达目标和背景之间的空间分布信息,引导聚类进行分割,替代以往改进算法利用像素邻域信息来表示空间信息,能够使算法准确识别显著目标的位置,从而进行有效分割㊂3.3㊀定量分析为了评估算法的分割性能,实验使用5种评价指标对分割结果进行测试:概率边缘指数[17](PRI)㊁重叠比率[14](CV)㊁变化信息[14](VI)㊁全局一致性误差[18](GCE)㊁边界位移误差[19](BDE)㊂由于深度分割网络的评价指标与模糊聚类算法有较大差异,本文只对模糊聚类算法进行定量分析㊂PRI是一种相似度度量,用于分割后的图像M4㊀第2期白雪飞,等:一种视觉显著性引导的模糊聚类图像分割方法㊀㊀图3㊀五种算法在BSDS500和MSRC 数据集的结果对比Figure 3㊀Comparison of the results of five algorithms on BSDS500and MSRCdataset图4㊀SGFCM 算法与PSP-Net 在PASCAL VOC2012数据集的结果对比Figure 4㊀Comparison of the results of SGFCM and PSP-Net on PASCAL VOC2012dataset与对应的真值图(GT )中相同的像素对进行计数,p ij 是分割后图像M 的第i 个聚类中心与GT 中的第j 个聚类中心的像素数;N 是图像中像素的总数㊂PRI (M ,GT )=1-(ði(ðjp ij )2-2ðj(ðjp ij )2+2ððp ij 2)/N ㊂㊀㊀CV 是一种重叠度度量,可以用来评价分割效果,其中,O (R ,Rᶄ)=R ɘRᶄ/R ɣRᶄ表示分割后的图像M 和GT 中,两个区域R 与Rᶄ的重叠度,CV (M ңGT )=(ðRESR ㊃max RᶄɪIᶄO (R ,Rᶄ))/N ㊂㊀㊀VI 是一种相似度度量,根据它们的平均条件熵来度量2个分割结果之间的距离,H 和I 分别代表2个分割结果之间的熵和相互信息,VI (M ,GT )=H (M )+H (GT )-2I (M ,GT )㊂㊀㊀GCE 是两个分割相互一致的全局误差,GCE =1n min ðp i{E (M ,GT ,p i )E (M ,GT ,p i )},E (GT ,M ,p i )=R (GT ,p i )\R (M ,p i )/R (GT ,p i )㊂㊀㊀BDE 是一种度量误差,用于测量M 与GT 之间的边界像素的平均误差,其中:N 1和N 2分别表示M和GT 边界中的总像素;d 是GT 中的一个像素p i 与M 中最接近的边界像素p 之间的距离㊂BDE (M ,GT )=ðN iid (p i,M )/N1+2ðN 2id (p i ,GT )/N 2,d (p i ,M )=min p ɪMp i -p ㊂㊀㊀PRI 和CV 的数值越大,分割越理想,VI ㊁GCE 和BDE 的数值越小,表明分割结果越好,利用上述指标测试相关算法在BSDS500和MSRC 两个数据集上的平均分割效果㊂对BSDS500数据集的图像,聚类个数设置为2~6;对MSRC 数据集的图像,聚类个数设置为2~4,其中每个指标下的最优值用黑体进行标记㊂表1和表2分别展示了5种算法在BSDS500数据集和MSRC 数据集上的平均性能㊂分析表1和表2中的数据可知,FCM㊁FGFCM㊁FLICM 3种算法的PRI ㊁CV ㊁VI ㊁GCE 值相似,FRFCM 算法的5郑州大学学报(理学版)第54卷PRI值和BDE值明显优于其他算法㊂本文提出的SGFCM算法在PRI㊁CV㊁VI㊁GCE上的平均性能都优于对比算法,其BDE值与最优值相差在0.04以内㊂表1㊀五种算法在BSDS500数据集上的平均性能Table1㊀The average performance of the fivealgorithms on the BSDS500data set算法PRI CV VI GCE BDE FCM0.740.43 2.880.4013.48 FGFCM0.750.44 2.810.3913.28 FLICM0.740.43 2.830.4013.38 FRFCM0.760.45 2.670.3712.35 SGFCM0.770.47 2.360.3212.39表2㊀五种算法在MSRC数据集上的平均性能Table2㊀The average performance of the fivealgorithms on the MSRC data set算法PRI CV VI GCE BDE FCM0.700.55 1.930.3212.67 FGFCM0.700.56 1.850.3112.39 FLICM0.720.59 1.730.2812.29 FRFCM0.710.58 1.790.3012.23 SGFCM0.720.60 1.620.2612.26 3.4㊀执行时间比较执行时间是衡量算法性能的一个重要指标,本文实验分别计算了5种算法在BSDS500和MSRC 两个数据集上的平均执行时间,如表3所示,每个数据集下效率最高的算法使用黑体标记㊂表3㊀五种算法的执行时间比较Table3㊀Comparison of execution time of five algorithms单位:s数据集FCM FGFCM FLICM FRFCM SGFCM BSDS500 1.15 4.67195.53 1.870.76 MSRC0.22 1.5937.760.530.24㊀㊀从表3可以看出,除SGFCM算法外,FCM算法比其他算法要快,因为FCM算法没有计算额外邻域信息㊂FGFCM比FLICM所用时间少的原因是FGF-CM提前计算了邻域信息,而FLICM在每次迭代中反复计算邻域信息,导致计算复杂度较高㊂FRFCM 具有较快的速度是因为该算法的多元形态重构和隶属度滤波只需要计算一次㊂本文算法较快的主要原因是利用显著性检测对图像进行初始化分割,经过阈值处理和形态学处理得到的引导图具有区域级标记信息,能够表达图像的高层语义信息㊂使用图像的高层语义信息引导模糊聚类对图像进行分割,在背景区域和不确定区域分别使用模糊聚类算法对像素进行聚类,无须在每次迭代计算邻域信息,有效减少了聚类算法的迭代时间,提升了算法的效率㊂4㊀总结本文提出一种视觉显著性引导的模糊聚类图像分割算法(SGFCM),利用视觉显著性的高层语义信息引导模糊聚类算法对图像进行分割㊂本文算法使用显著性检测对图像的显著区域和背景区域进行初始化分割,经过阈值处理和形态学处理,得到具有区域级标注的引导图,引导模糊聚类算法在不同的区域分别进行聚类,能够大大减少聚类算法的迭代时间;同时将像素的显著性值作为一个衡量相似性因子,引入模糊聚类算法的目标函数中来提升算法的分割准确率㊂经过大量实验表明,本文算法在复杂背景的图像中进行分割时,能有效去除背景干扰,在较短时间内完成图像分割任务㊂但本文算法存在一定的局限性,聚类中心个数需要事先设定,未来将对此进行算法的完善㊂参考文献:[1]㊀LYU H R,FU H Y,HU X J,et al.Esnet:edge-basedsegmentation network for real-time semantic segmentationin traffic scenes[C]ʊ2019IEEE International Conferenceon Image Processing.Piscataway:IEEE Press,2019:1855-1859.[2]㊀辛娇娇,陈本豪,郭元术,等.基于改进暗通道先验的图像去雾算法[J].郑州大学学报(理学版),2020,52(1):72-78.XIN J J,CHEN B H,GUO Y S,et al.Image defoggingalgorithm based on improved dark channel prior[J].Journal of Zhengzhou university(natural science edi-tion),2020,52(1):72-78.[3]㊀LU L Z,WANG C,YIN X.Incorporating texture intoSLIC super-pixels method for high spatial resolution re-mote sensing image segmentation[C]ʊThe8th Interna-tional Conference on Agro-geoinformatics.Piscataway:IEEE Press,2019:1-5.[4]㊀刘国奇,邓铭,李晨静.融合RGB颜色空间的植物图像分割模型[J].郑州大学学报(理学版),2019,51(1):18-23.LIU G Q,DENG M,LI C J.Plant image segmentationmodel based on RGB color space[J].Journal of Zheng-zhou university(natural science edition),2019,51(1):18-23.[5]㊀KRINIDIS S,CHATZIS V.A robust fuzzy local informa-tion C-means clustering algorithm[J].IEEE transactionson image processing,2010,19(5):1328-1337. [6]㊀CAI W L,CHEN S C,ZHANG D Q.Fast and robust6㊀第2期白雪飞,等:一种视觉显著性引导的模糊聚类图像分割方法fuzzy C-means clustering algorithms incorporating local in-formation for image segmentation[J].Pattern recogni-tion,2007,40(3):825-838.[7]㊀LEI T,JIA X H,ZHANG Y N,et al.Significantly fastand robust fuzzy C-means clustering algorithm based onmorphological reconstruction and membership filtering[J].IEEE transactions on fuzzy systems,2018,26(5):3027-3041.[8]㊀DUNN J C.A fuzzy relative of the ISODATA process andits use in detecting compact well-separated clusters[J].Journal of cybernetics,1973,3(3):32-57. [9]㊀BEZDEK J C.Pattern recognition with fuzzy objectivefunction algorithms[M].Berlin:Springer Press,1981.[10]WU Y P,PENG X Q,RUAN K,et al.Improved imagesegmentation method based on morphological reconstruc-tion[J].Multimedia tools and applications,2017,76(19):19781-19793.[11]LEI T,ZHANG Y N,WANG Y,et al.A conditionallyinvariant mathematical morphological framework for colorimages[J].Information sciences,2017,387:34-52.[12]ZHAO H S,SHI J P,QI X J,et al.Pyramid scene par-sing network[C]ʊIEEE Conference on Computer Visionand Pattern Recognition.Piscataway,IEEE Press,2017:6230-6239.[13]CHENG M M,MITRA N J,HUANG X L,et al.Globalcontrast based salient region detection[J].IEEE transac-tions on pattern analysis and machine intelligence,2015,37(3):569-582.[14]ARBELÁEZ P,MAIRE M,FOWLKES C,et al.Contourdetection and hierarchical image segmentation[J].IEEEtransactions on pattern analysis and machine intelligence,2011,33(5):898-916.[15]SHOTTON J,WINN J,ROTHER C,et al.Textonboost:joint appearance,shape and context modeling for multi-class object recognition and segmentation[C]ʊEuropeanConference on Computer Vision.Berlin:Springer Press,2006:1-15.[16]EVERINGHAM M,GOOL L,WILLIAMS C K I,et al.The pascal visual object classes(VOC)challenge[J].International journal of computer vision,2010,88(2):303-338.[17]UNNIKRISHNAN R,PANTOFARU C,HEBERT M.To-ward objective evaluation of image segmentation algo-rithms[J].IEEE transactions on pattern analysis and ma-chine intelligence,2007,29(6):929-944. [18]MARTIN D,FOWLKES C,TAL D,et al.A database ofhuman segmented natural images and its application toevaluating segmentation algorithms and measuring ecologi-cal statistics[C]ʊIEEE International Conference on Com-puter Vision.Piscataway:IEEE Press,2001:416-423.[19]WANG X F,TANG Y X,MASNOU S,et al.A global/local affinity graph for image segmentation[J].IEEEtransactions on image processing,2015,24(4):1399-1411.7。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2005-11-04;修订日期:2006-02-11 基金项目:交通部博士基金资助项目(200332522501) 作者简介:毕胜(1964-),男,辽宁沈阳人,副教授,博士研究生,主要研究方向:图像处理、机器视觉; 梁德群(1940-),男,辽宁大连人,教授,博士生导师,主要研究方向:低级视觉、并行结构、图像检测.文章编号:1001-9081(2006)05-1015-03基于人类视觉特性的纹理分割方法毕 胜,梁德群(大连海事大学信息工程学院,辽宁大连116026)(besheng@m sn .com )摘 要:纹理分割是将一幅图像依据纹理不同分成若干个不同的区域,目前广泛采用的是利用滤波器族(如Gabor )对图像进行分解。
但由于图像纹理表现的各异性,通常在滤波器参数的选择上不能做到自适应,导致提取的特征不明显,分类效果不好,使用范围受限。
文中提出了一种基于人类视觉系统(Hu man V isual Syste m,HVS )机理的纹理分割方法,不但可以模拟人类观察纹理直觉处理阶段确定纹理区的个数并且粗略地划分区域,而且可以模拟专注处理阶段自动选择Gabor 滤波器的个数及参数。
该算法符合HVS 区分纹理机理,计算过程简单、方便。
针对各纹理选取的特征明显,分类效果好。
关键词:人类视觉系统;纹理分割;Gabor 滤波器;纹理特征度量;滤波中图分类号:TP391.41 文献标识码:AAdapti ve texture segm en t a ti on m ethod ba sed on property of HVSB I Sheng,L I A NG De 2qun(School of Infor m ation Technology,D alian M ariti m e U niversity,D alian L iaoning 116026,China )Abstract:Texture seg mentati on involves subdividing an i m age int o differently textured regi ons .Many texture 2seg mentati on schemes are based on a filter 2bank model,e .g .Gabor filter 2bank .But these algorith m s usually are li m ited because of the πs variety and the para meters selecti on difficulty .These deficiencies lead t o the inefficient extracted feature,the worse classificati on results and the li m ited app licati on domain .I n this paper,a texture seg mentati on algorith m based on the HVS mechanis m was p resented .It can give the nu mber of texture type and app r oxi m ate areas in the i m age m i m icking the p reattentive stage,and can als o give the Gabor filters para meters m i m icking the f ocused attenti on stage .This algorith m corres ponds t o the HVS p r operty,and the app r oach is easy t o i m p le ment and computati onally efficient .The features are characteristic,and the classificati on results have higher accuracy .Key words:HVS (hu man visual system );texture seg mentati on;Gabor filter;texture features measurement;filtering0 引言目前纹理分析主要任务有纹理分类、纹理分割、纹理合成等。
其中纹理分类是利用预先定义的纹理种类,通过提取纹理特征,利用模式分类算法进行分类。
主要应用在图像检索等领域。
而纹理分割则不同,它是利用纹理特征进行区域分割的一种手段。
在分割前并不知道图像中存在什么类型的纹理、存在多少种纹理及各区域纹理的类型。
事实上,纹理分割过程并不需要知道上述这些特点,我们只需要知道两种或多种纹理的不同即可。
纹理分割可以分成两步进行:1)特征计算;2)基于特征值的区域一致性分割。
特征提取在纹理分割中具有重要作用。
目前纹理分割的主要方法有基于统计的方法、基于结构的方法、基于模型的方法和基于信号处理的方法。
但由于大多数均未强调人类视觉系统的感知机理,这些方法在使用时均有相应的适用范围[1]。
人类很容易认出纹理,但对其下定义却很难。
仅在文献[2]中就归纳出了6种纹理的定义。
这些均说明了人们对人感知纹理的机理并不十分清楚。
并没有像研究彩色那样,给予严格的定义和度量[4],造成目前对各种纹理算法性能的评价多是基于某种数学描述的客观评价。
这就造成了目前纹理分析研究方法在一定程度上困难。
但另一方面纹理感知的精神心理学研究表明,对纹理算法的评价应是基于人类视觉系统的表现而进行的客观评价[2]。
因此研究基于人类视觉系统的纹理特征分类具有十分重要的意义。
文献[3]关于人类感知纹理的研究结果表明,人类对纹理区分的三个重要的特征是重复性,方向性、结构元素的复杂性。
并且人类对纹理的识别是直觉的,即对整个视场中的内容先进行并行观察再进行视觉处理,外部的图像信息是通过一组并行的,近似于独立通道进入HVS 中。
每个通道可以被设想成一个二维的滤波器[1]。
受人类对纹理分割方法的启发,许多研究人员提出了基于滤波器族进行纹理分割的方法[4,5]。
将输入图像分解成各种成分子图像之和。
小波分解和小波包分解等各种树形分解方法及Gabor 分解方法便是基于这种机理提出的。
早期的Gabor 分割方法是利用预先确定参数的大量特殊选择的滤波器族或利用一组特别设计的Gabor 滤波器来解决特定的问题。
大量的滤波器导致大量的计算并产生大量的特征致使分类效果不好。
本文在人们对HVS 工作机理认识的基础上提出了自适应的纹理分割的多通道频域分析方法。
实验证明,由于这种方法接近于人类对纹理的感知特性。
所以算法简单、分割效果好。
1 Gabor 、楔形和环形滤波一个两维的Gabor 滤波器基本函数GEF (Gaborele mentary functi on )的空域滤波函数可以表示为[3]:第26卷第5期2006年5月计算机应用Computer App licati onsVol .26No .5May 2006g (x,y )=12πσx σy exp [-12(x 2σ2x +y2σ2y)+2πj ωx]其中,σx ,σy 为x 和y 方向上高斯包络的方差,ωx 为调制频率。
该滤波器经过不同角度的旋转和调制就构成了Gabor 滤波器族。
其频域表示形式为:G (u,v )=exp {-12[(u -ω)2σ2u +v2σ2v]}其中: σu =12πσx σv =12πσy 环形和楔形滤波器:f r 1,r 2=∫2π0∫ r 2r 1|F (u,v )|2d r dθf θ1,θ2=∫θ 2θ1∫ ∞0|F (u,v )|2d r dθr =u 2+v2θ=atan (v /u )其中:r 为环形滤波器的半径,θ2~θ1为楔形滤波器的角度。
图1 环形、楔形和gabor 滤波器频谱图以上各滤波器均可以形成非正交的滤波器族。
2 纹理度量为模拟HVS 进行纹理特征提取需要,借助功率谱函数,本文定义指标:纹理的方向,纹理的规则度,纹理的重复度。
根据傅里叶变换:F (u,v )=1MN ∑M -1x =0∑N -1y =0f (x,y )e-j 2π(ux /M +vy /N )(1)定义图像的功率谱函数为:P (u,v )=|F (u,v )|2=R 2(u,v )+I 2(u,v )(2)设图像大小为M ×N 。
2.1 纹理的方向性(D irecti onality )反映纹理分布的总体方向性度量。
对功率谱图进行各方向投影,分别求取各方向上投影的最大值并记为:D n =max(∑Mu =0Pθ(u,v )),θ=n π/K ;n =0,1,2,…,K -1;K 为投影方向分辨率μD =∑K-1i =0DiσD =∑K-1i =1(Di-μD )2说明:σD 越大,说明纹理的方向性越强。
并定义:D =max (D n )时θT 为纹理的方向:θT =π-nπK,0≤θT <π (3)2.2 纹理规则性(Regularity )反映图像具备纹理特征的程度。
利用功率谱图统计各频率分量能量的分布情况。
以功率谱图中心为圆心的圆周上分布的能量代表原图像中包含该频率能量的大小。
构造同心圆,对每个频率成分分别统计其功率密度:E r =∑(u,v )∈SP (u,v )S,S ∈u 2+v 2=r 2;r =0,1,2,…,M /2 (4)经实验得出,如图像中不存在明显的重复成分,则E r 为单调下降的。
并且其功率密度函数呈指数规律下降。
当图像呈现出纹理特征时,E r 则不为单调下降。
首先对功率谱密度进行归一化处理,通过指数曲线对其功率密度函数进行拟合,求取E r 对拟合曲线的均值和方差即可确定纹理的规则度。
对功率谱密度函数利用指数函数h (x )=a 3x b +c 进行拟合,得到拟合曲线为 E r ,则:μE =∑K-1i =0(Ei-E^ i )σ2E =∑K-1i =1((Ei-E ^ i )-μD )2(5)σE 越大,则纹理的规则度越高,即越趋向于纹理图。
2.3 纹理的重复性(Repeatability )反映纹理基元重复的频率。
求取偏离拟合曲线最大的E r 及对应的频率f:R =max (E r )(6)为克服尺度不一致造成的影响;计算尺度不变性归一化重复性f R =23f /M ,它反映了相对于图像尺寸的重复性。
3 基于人类视觉特性的纹理分割在用上述滤波器族进行图像空频域分解时,目前大多针对具体应用对象,采用固定参数分解的方法。