基于HSI颜色空间统计直方图的图像检索
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于HSI颜色空间统计直方图的图像检索
摘要: 给出了一种对图像的特征进行提取、分析并识别出一定形状及色彩差别的方法,主要目的是提取图像的颜色变化。首先是对采集到的彩色图像进行预处理,包括:图像的滤波、目标图像的定位等;然后采取了相应的图像颜色空间和识别算法,包括:图像颜色空间的变换、颜色量化、图像特征提取、识别算法。计算机仿真结果表明,该算法可行,并取得了较好的效果。
关键词:颜色空间;颜色量化;特征提取;识别算法
Abstract:This article provides a approach that can extracte, analyse and identify a certain shape and color differences for the image features, the main purpose is to extract the color changement of image. The first step is the pre-processing of the collected color image, including: image filtering, target image positioning. What follows is signal image recognition, including: transformation of image color space, color quantization, image feature extraction, recogonition algorithm and the algorithm implementation. Finally, get the recognition results.
Keywords:color space; color quantization; feature extraction; recognition algorithm
1引言
当今是一个信息肆意滋生的互联网时代,要想有效利用网上的这些信息,就需要将这些杂乱的信息梳理成可以查询的数据,这就必然要使用信息检索。图像检索是信息检索的重要组成部分,常用的百度、谷歌、雅虎等搜索引擎均提供图像检索,它的重要性正逐渐增加。我们正处于一个视觉的时代,几乎人人都有成百上千的数字图片想要发布到互联网上,这正是图像检索的意义所在。
图像检索是计算机视觉中非常重要的部分,其目的是构造自动处理某些信息的机器系统,用以代替人类完成分类和辨别的任务。目前图像识别检索的研究主要涉及物体表面形状检索、尺寸与面积的检测以及色彩的检索等方面。颜色是物体重要的外在特性,具有对物体本身的尺寸、方向、视角等依赖性小、鲁棒性高等优点,因而在图像识别中占有重要地位,对彩色图像的处理己经成为当前图像处理领域重要的研究课题[1],如:近年来,国内外对农产品品质自动检索、彩色印刷及纺织品中的彩色图样的检索研究中,都采用了基于图像的颜色检索技术。
2图像检索技术一般算法
2.1 颜色空间
在计算两幅图像的相似度时,通常要提取它们的颜色特征在特定的颜色空间进行比较。颜色空间的目的是按照某种标准利用基色表示颜色,常用的有RGB 、HSI 、HSV 等。RGB 颜色空间的相似不能代表颜色的相似。例如,查询图像上RGB 颜色是(200,150,0),图像库图像的RGB 颜色是(200,200,0),这两幅图像在RGB 颜色空间上很相似,但在颜色上差别很大(黄色和绿色)[2]
。HSI 和HSV 颜色空间则没有这个方面的问题,它们很适合人们肉眼的分辨,较好地反映人对颜色的感知和鉴别能力
[3][]
。故在此采用HSI 颜色空间。通过(2—1)~
(2—3)公式[4]
,可以将图像从RGB 颜色空间转换到HSI 颜色空间。
()()()()()()()()()()()()⎪⎪⎩⎪⎪⎨⎧>⎪
⎪⎭⎫ ⎝⎛--+---+--≠≠⎪
⎪⎭⎫ ⎝⎛--+---+-=G
B B G B R G R G R B R G R B R G R B G B R G R G R B R G R H ,2arccos 2,2arccos π或 (2—1)
),,(),,(B G R MIN B G R MAX S -= (2—2) 3
B
G R I ++=
(2—3) 2.2 颜色量化
一幅图像的颜色种类通常非常的多,如果直接计算相似度,会消耗很大的特征存储空间。实验表明,增加颜色直方图的维数可以有效地提高检索的精度,但当维数增加到一定程度时,检索的精度提高很小而且可能下降[5]
。但如果对颜色进行适当的量化后再计算,计算量会少许多,且计算效率得到提高。颜色量化是指将H,S,I 3个分量按人的颜色感知进行非等间隔的量化,然后对颜色模型的大量分析和计算。故在此对HSI 颜色空间进量化,把色度量化成8个空间,把饱和度分成3个空间,把亮度分成3个空间,即颜色空间被分成72 区间。具体量化值如下:
[][][][][][][][]⎪⎪⎪
⎪⎪
⎩
⎪⎪
⎪⎪
⎪⎨⎧∈∈∈∈∈∈∈∈=315,296,7295,271
,6270,191,5190,156,4155,76,375,41,240,21,120,316,0h h h h h h h h H (2—4)
[][][]⎪⎩⎪
⎨⎧∈∈∈=1,7.0,27.0,2.0,12.0,0,0s s s S (2—5)
[][][]⎪⎩
⎪
⎨⎧∈∈∈=1,7.0,27.0,2.0,12.0,0,0i i i I (2—6)
2.3 图像描述
图像有多种描述方式,颜色直方图就是其中之一。颜色直方图描述了图像颜色在颜色空间上的分布。常见的直方图有两种:统计直方图,累加直方图。
借助图像特征的统计直方图可以描述图像。图像特征的统计直方图是一个一维离散函数,如公式(2—7)所示。在公式中k 代表图像的特征取值,L 是特征可取值个数,n k 是图像中具有特征值为k 的像素的个数,N 是图像像素的总数。颜色直方图有许多的优点:对图像进行旋转之后,它的颜色直方图不发生改变;颜色直方图容易提取,且比较容易计算两个直方图之间的相似度。
()1,1,0,-==
L k N
n k H k
(2—7) 图像特征的累加直方图是一个一维离散函数,计算公式如(2—8)所示。公式中k 代表图像的特征取值,L 是特征可取值个数,n k 是图像中具有特征值为k 的像素的个数,N 是图像像素的总数。累加直方图能增加直方图的鲁棒性[]
。
()1,1,0,0
-==∑
=L k N
n k I k
i k
(2—8) 2.4 图像分块
两幅图像的颜色直方图相似,两幅图像的内容可能不相似,这主要是由颜色的空间分布不同引起的。一般来说,图像可分为主体部分和背景部分,如果不进行分块,那么背景部分的颜色信息就会混入到主体部分。通过对图像进行分块,提取各个区域的直方图,就可以获得图像的空间分布信息。
传统的分块方法将图像分成n m *部分,这样并没有突出图像的重要信息,故在此采用另外一种分块方法进行分块。首先,将图像分成88⨯区域,如表3-1所示。其次,将图像的64个区域重新组合成12个区域。R 1 = { I 1 },R 2 = { I 8 },R 3 = { I 57 },R 4 = { I 64 },R 5 = { I 2,I 3,I 4,I 5,I 6,I 7 },R 6 = { I 9,I 17,I 25,I 33,I 41,I 49 },R 7 = { I 58,I 59,I 60,I 61,I 62,I 63 },R 8 = { I 16,I 24,I 32,I 40,I 48,I 56 },R 9 = { I 10,I 11,I 12,I 18,I 19,I 20,I 26,I 27,I 28,I 29,I 36,I 37 },R 10 = { I 13,I 14,I 15,I 21,I 22,I 23,I 28,I 29,I 30,I 31,I 36,I 37 },R 11 = { I 28,I 29,I 34,I 35,I 36,I 37,I 42,I 43,I 44,I 50,I 51,I 52 },R 12 = { I 28,I 29,I 36,I 37,I 38,I 39,I 45,I 46,I 47,I 53,I 54,I 55 }。其中,R 1、R 2、R 3和R 4是最不感兴趣的区域,R 9、R 10、R 11和R 12是图像的主体