基于内容的图像检索原理及方法应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的值越趋向 1 , 两幅图像越相似 。D ( X , Y) = 1 则两幅
图像完全一致 。
在此算法基础上 , 美国 Wayne State University 视觉神
经网络试验室研制的 WISE ( Wayne Image Seeker) 系统中
负责图像颜色特征处理的 COLOR2WISE 模块对直方图交
以 R GB 色度空间为例说明图像量化过程 : 设色度空 间中每个点都可用向量表示 :
·第 24 卷 2001 年第 3 期·
ITA
! 理论与探索 #
X = [ Rx GxBx ]2 两种颜色 M 和 N 的相似度可以用色彩距离 D ( M , N) 表示 :
D (M ,N) = ( Rm - Rn) 2 + ( Gm - Gn) 2 + (Bm - Bn) 2 考虑到 R GB 色度空间不一定是均匀性线性空间[4 ] , 按距离最短颜色最接近分类检索结果与预期结果相差很 大 。于是可在 R GB 色度空间中采用加权范数补偿其非均 匀性 , 此时上式变为 :
d2hist ( X , Y) = ( X - Y) TA ( X - Y) 21214 利用矩 (moment) 的优势特征算法[8 ] 设颜色频
道的一阶矩 E , 二阶矩 J 和三阶矩 S 分别代表颜色频道的
平均 值 ( average ) , 方 差 ( variance ) 和 倾 斜 度 ( skew2
较 , 在有噪声情况下检索效果较好 。公式为 :
d2hist ( X , Y) = ( X1 - Y2) 2 + ( X2 - Y2) 2 + … + ( Xn - Yn) 2
= ( X - Y) T ( X - Y)
考虑到颜色分布的不均匀性 , 引入相关权值 N 3 N 维 矩阵 A , A = [αij ] , 权重αij表示颜色 i 和颜色 j 间相似程 度 。此时公式改为 :
(X , Y) 称距离函数 , 0 ≤d ( X , Y) ≤2N 。当 d ( X , Y)
= 0 时 , 认为 X 和 Y 完全相同 ; d ( X , Y) = 2N 时 , X
和 Y 完全不同 ; 当 d ( X , Y) 小于某个阈值时可认为 X
和 Y 足够相似 。Ll2metric 算法的优点是比较过程简单 ,
图像形状进行图像检索的新方法 。
311 利用信息熵描述图像 信息论是用消除不确定性或减少无序性来定义信息
的 。也就是说信息意味着有序性 , 而信息变量的熵反映了
根据交集的值选出最佳方案 。直方图交集算法公式如下 :
N
∑min{X(i ,j ,k) , Y(i ,j ,k) }
D ( X , Y) = i ,j ,k
N
∑X(i ,j ,k)
i ,j ,k
其中 X 和 Y 分别表示检索图 (库图) 与目标图 , D
( X , Y) 为两幅图像的匹配值 。D ( X , Y) ∈ (0 , 1) 它
t} 和 {b (i , j) ≤t} 。
物体部分比例 :
∑ ω0 (t) = p (i) 0 Φi Φt
背景部分比例 :
— 164 —
物体均值 :
∑ ω0 (t) =
p (i)
t Φi Φm- 1
∑ μ0 (t) =
ip (i) /ω0 (t)
0 Φi Φt
背景均值 :
总均值 :
∑ μ1 (t) =
ness) , 以这些颜色频道分布的特征值来表示颜色频道 ,
用于检索图像 。公式如下 :
N
∑ D (X , Y) = (Wi1 | XEi - YEi | + Wi2 | XJi - YJi | + Wi3 | XSi - YSi | ) i=1
式中 Ei , Ji , Si 分别表示图像颜色频道的一阶矩 、二
! 理论与探索 #
ITA
●李 勇 (安徽财贸学院经济信息管理系 安徽 233041)
基于内容的图像检索原理及方法应用
Abstract : The paper mainly deals wit h t he basic concept , characteristics and met hods of t he color and shape2 based image retrieval. It gives several quantization algorit hms for image retrieval. At t he same time , Otsu met hod t hat selects t he image t hreshold automatically and a new met hod using information entropy are described.
幅图像的比较很细 , 在有噪声情况下这种算法易产生错误
的结果 。
21212 Ll2metric 算法 (Swain , bsllard , 1991)
n
∑ d ( X , Y) = | Xi - Yi | i=1
X 和 Y 分别表示检索图 (库图) 与目标图 , Xi 和 Yi
分别表示落入第 i 个颜色频道的 X 和 Y 中像素个数 , d
首先要将图像进行数字化处理 , 用色度空间[3 ]描述图 像颜色分布 (使用具有特定意义的一组二进制数表示一个 像素 , 进而将整个图像以若干组二进制数表示 , 以利于计 算机处理) 。可采用 HSB 色度空间 3 种元素表示每个像素 的颜色组合 。这样就可以用 3 组二进制代码表示 HSB 色 度空间值 , 来描述一个像素 。也可采用多媒体技术中常用 的 R GB 色度空间 ( R , 红 ; G , 绿 ; B , 蓝) 表示一个像 素 。用 3 组二进制代码分别表示 R GB 的强度 , 从而使一 个像素也可用 3 组二进制代码表示 。
可利用 Otsu 法先将图像物体与背景分离出来 , 将图像以 g
(f) 颜色直方图表示出来与同样方法生成的目标图像的颜
色直方图加以比较 , 在满足一定阈值的情况下得到检索结
果。
21211 基于直方图交集的算法 ( Swain) [5 ] 直方图交集
算法是将目标图像的颜色直方图与库图的直方图取交集 ,
3 基于形状的图像检索方法
对图像形状的准确度数学描述较为困难 , 主要有 : 使
— 165 —
! 理论与探索 #
ITA
用 G. Cortelazzo 等人的匹配技术 ; Anil K. Jain 等人使用
边界方向的直方图 ; C. P. Lam 等人使用不变矩和傅里
叶描述子等 , 此处不再赘述 。这里仅介绍利用信息熵描述
但如果被检索图像与目标图像颜色分布不是完全一致而是
略有偏差 , 则检索结果存在较大模糊性 , 即便提高阈值也
仅仅能代表颜色数值相似而非实际颜色分布相似 。
21213 欧基里德距离 ( Euclidean Distance) 公式算法[7 ]
利用欧基里德距离公式对两个 N 维直方图 X , Y 图像的比
集算法作了一定程度的改进 :
∑ D ( X , Y) =
N
min ( Xi , Yi)
n
i=1
∑Xi
i=1
N 是颜色频道数 , Xi , Yi 分别是图像 X , Y 中属于颜
色频道 N 的像素数 , 通过像素总和的比值来确定图像间
的相似度 。再利用颜色频道间距优化算法 (Niblack 等人 ,
1995) COLOR2WISE 中最基本的相似度算法可写为 (其
·情报理论与实践·
中αij 为颜色间距识别模型[6 ]) : D ( X , Y) = ( X - Y) TA ( X - Y)
NN
∑∑ =
αij ( Xi - Yi) ( Xj - Yj)
i=1 j=1
wenku.baidu.com
虽然基于直方图交集的算法检索精度较高 , 但它对两
Keywords : image database ; retrieval algorit hm/ color histogram ; information entropy
图像检索问题可表示为任给一个检索图像 X , 从图像 库 Ψ 中检索出一个图像 Y 使 Π Y ∈φ, 取 minD (f ( X) , f ( Y) ) , D (f ( X) , f ( Y) ) 表示图像 X 和 Y 的相似距离 。 对于图像检索 , 可依赖于对图像内容特征的标引及匹配实 现 。对于彩色或灰度图像 , 人们常通过图像的画面内容特 征 , 使用图形的颜色纹理等内容作为图形的特征 。对于单 色无纹理的二值图像 , 则可使用图像的形状匹配 。前者通 常可 利 用 颜 色 直 方 图 , 通 过 基 于 直 方 图 交 集 的 算 法 (Swain ) ; 利 用 矩 ( moment ) 的 优 势 特 征 检 索 算 法 (Markus Stricker , Markus Orengo , 1995) 和 Ll2metric 算 法 (Swain , Bsllard , 1991) 等进行图像检索 。后者则可使 用 G. Cortelazzo 等人的匹配技术 ; Anil K. Jain 等人使用 边界方向的直方图 ; C. P. Lam 等人使用不变矩和傅立 叶描述子以及利用信息熵通过单元熵的新方法来描述图像 形状特征 。
所有像素落入特定颜色频道的值以纵坐标形式表示 。设图
像 X 由 H 级颜色频道组成 , 第 i 种颜色 hi (i = 1 , 2 , …, H) , 落入颜色频道 hi 的像素数量为 gi , 则 G ( g1 , g2 , …, gH) 向量组即为颜色直方图 。
212 基于颜色检索的匹配算法
一幅待检索图像 F (M , N) 利用颜色直方图检索时 ,
1 图像阈值的选取
在进行图像检索前 , 可选取一定的阈值使图像背景与 物体最佳分离 。图像阈值自动选取方法中简单适用 、自适
应性强且具有代表性的方法有大津算法 (最大类间方差
法 , Otsu , 1979) [1 ] 。其原理是图像物体部分与背景部分 灰度分布方差越大 , 图像物体与背景分离准确性越大 。 Otsu 方法公式如下 :
ip (i) /ω1 (t)
t Φi Φm- 1
μ = ω0 (t)μ0 (t) +ω1 (t)μ1 (t)
此时有图像最佳阈值 g 的公式为 :
g
=
Arg
Max
0 Φt Φm-
[ω0
1
(t)
(μ0
(t)
- μ) 2
+ω1 (t) (μ1 (t)
- μ) 2 ]
2 基于颜色的图像检索方法
由于颜色的特征与图像尺寸无关 , 所以颜色特征具有 旋转不变性和尺寸不变性 , 即图像颜色特征与图像尺寸和 图像对象位置无关 。在利用颜色的图像检索中 , 可用颜色 直方图[2 ]表示图像整体颜色分布特征 。利用颜色直方图向 量构造图像颜色特征索引记录 , 同时在检索时用户将其绘 制的颜色分布图或引用的检索范围按同种方法转换为相应 的颜色直方图 。利用颜色直方图匹配算法计算检索图和目 标图的相似度 , 满足一定阈值要求即可认为符合检索需 求。 211 如何建立颜色直方图
阶矩 、三阶矩 ; Wi1 , Wi2 , Wi3 为用户定义 的 权 重 ; N
为颜色频道数目 。Ei , Ji , Si 公式表示如下 :
∑ ∑ N
Ei
=
1 N
Pij Ji
j=1
=
N
1 N
j=1
( ( Pij
-
Ei)
2)
1 2
N
∑ Si
=
1 N
j=1
( ( Pij
-
Ei)
3)
1 3
Pij 代表图像第 i 个颜色频道中第 j 个像素 。
设 b (i , j) 为 M 3 N 图像 (i , j) 点处的灰度值 , 灰 度级为 m , 设 b (i , j) 取值 [ 0 , m - 1 ] , p ( k) 是灰度 值为 k 的频率 , 则 :
∑ p (k)
=
1 MN
b
(i
,j)
1
设以灰度值 t 为阈值分割出背景与物分别为 {b (i , j) >
D (M ,N) = w1 ( Rm - Rn) 2 + w2 ( Gm - Gn) 2 + w3 (Bm - Bn) 2
其中 w1 、w2 和 w3 为加权系数 , 根据人眼睛对 R GB 三原
色的敏感程度取值 。
此时将待检索图像上所有像素的色度空间值 (也称颜
色频道 colorchannel) 分布以横坐标形式表示 , 将图像中