基于内容的图像检索技术研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于内容的图像检索技术研究
学号:10404400204 姓名:陈萍班级:数字媒体艺术1002班学院:包装与材料工程
〔摘要〕基于内容的图像检索技术是对图像的物理内容为加工对象的检索技术之一,主要实现方式包括基于颜色、纹理、形状和语义等。其中基于颜色的图像检索发展最为成熟,而基于语义的检索则尚处于探讨、研究阶段。
关键词:图像检索、内容、语义
引言
随着信息技术的普及与发展及应用,数字图像的数量正以惊人的速度增长。如何将数字图像处理、计算机视觉技术与传统数据库技术相结合,建立基于对图像内容自动或半自动描述的新一代图像视频数据库成为现在亟待解决的课题。基于内容的图像检索(CBIR)是解决这一问题的关键技术之一。CBIR与传统的检索手段不同,它是利用图像的颜色、纹理、形状等基本特征进行检索,并把这些量化特征与图像存储在一起,它的特点是:直接从媒体内容中提取信息线索。基于内容的检索是一种近似匹配;特征提取和索引建立常需要用人机交互的方法,学习人的主观相似度感受。它主要使用的是基于相似度量的示例查询方法。
2 基于内容的图像检索技术
基于内容的图像检索的前提是基于内容的描述。图像内容既包括了颜色、纹理、形状等低层次视觉特征,又包括了对目标意义的复杂推理等的高层语义特征。检索进行查询的层次基本可分为三层:
(1 )基于原始数据的查询。这是最低层次的查找,每一幅图像为像素点的简单有序的集合体,查询时相似性的度量标准是点对点的比较,这个层次的比较是非常具体的,只有在使用相对精确匹配时才有用。
(2 )基于特征的查询。这是较高层次的查询,在基于特征的层次上描述图像。图像特征包括原始属性:颜色、纹理、形状等,也包括脱离了原始性的抽象属性:灰度直方图,颜色直方图,空间频谱图。不同的特征可以被分成不同的特征矢量组。图像的区域划分基本上是根据特征矢量的不同特征,同一个区域内的特征矢量具有相同的属性。在n维特征空间的查询,实质上就是目标特征矢量的相似性度量。数据库内的图像文件的特征矢量集以及抽取方法,被事先抽取并保存,查询时,使用给出的模板,图像按照库内保存的方法抽取目标特征矢量。(3 )基于语义的查询。这是最高层次的查询,可以看作是基于对象的查询。查询图像中包括的具体的物体,发生的场景,图像所描述的感性色彩等都属于这个层次的查询。目前实现图像检索的手段有很多,包括基于分数维的图像检索,基于多颜色空间的图像检索方法,基于内容的图像检索,基于区域的图像匹配算法的关键技术研究,基于颜色特征的图像检索方法等等。而且基于图像处理技术的日趋成熟,检索的效果也越来越好,但仍未到图像语义的图像检索阶段。
2.1 基于颜色特征
颜色是一种重要的,目前使用最广的视觉特征,同一类事物通常有着相似或相同的颜色特征。因此可以利用颜色特征来区分不同物体, 也是绝大多数基于内容的图像和视频检索的多媒体数据库中使用的特征之一。颜色往往和图像中所包含的物体或场景十分相关,颜色特征对图像本身的尺寸、方向、视角的依赖性较小,从而具有较高的鲁棒性。基于颜色特征的检索主要采用的方法包括颜色直方图、颜色矩、颜色相关图等。颜色直方图是在许多图像检索系统中被广泛采用的颜色特征,特别适于描述那些难以进行自动分割的图像。
2.2 基于形状特征
形状是刻画物体的本质特征之一,在二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域,所以对形状的描述涉及到对轮廓边界的描述以及对这个边界所包围区域的描述。目前的基于形状检索方法大多围绕着从形状的外轮廓特征和形状的区域特征建立
图像索引,总的来说,形状表示法可以分为2 类:基于边界的和基于区域的。前者仅使用形状外边界,而后者则用了整个形状的区域信息。在基于形状的图像检索中有3个问题需要解决,首先,形状通常与图像中的特定目标对象有关, 因此形状比颜色和纹理的语义性更强,要获得目标的形状参数,先要进行图像分割,所以形状特性会受到图像分割效果的影响。其次,描述目标的形状是一个非常复杂的问题,人对形状的感觉是视网膜感受和现实世界的知识相结合的结果。事实上,目前还没有找到与人的主观感觉完全匹配的形状模型。第三,从不同的视角获得的形状可能会有很大差别,为了准确进行形状匹配,需要解决平移、缩放、旋转中的不变性问题。形状的表示方法有两类:基于边界的表示和基于区域的表示,这两种表示方法的典型代表分别是傅里叶描述子和不变矩。傅里叶描述子的基本思想是用对图像进行傅里叶变换得到的边界作为形状描述,它的优点就是把二维问题简化为一维问题。傅里叶变换的高频分量对应细节而低频分量对应总体形状,所以可以只用一些对应低频分量的傅里叶系数来近似描述边界形状。比较了基于区域的方法、基于边界的方法和两种方法的综合使用,实验结果表明,两种方法综合使用效果更好。
2.3 基于纹理特征
在许多类图像中,纹理是一种十分重要的特征。通常人们将那些在图像局部区域内呈现不规则性,儿在整体上表现出某种规律性的特征称为纹理。例如,大部分航空和卫星遥感图像医学显微图像以及石油地球物理勘探所得到的人工地震剖面图像等。因此研究对纹理的描述、纹理图像的分割、分类等,不仅是图像处理领域的重要理论研究课题,同时也有着广泛的应用前景。图像或物体的纹理特征反映了图像或物体本身的属性,常用粗糙性、方向性和对比度等来描述。对纹理图像的描述常借助纹理的统计特性或结构特性进行,对基于空域的性质也常可转换到频域进行活动,所以常用的纹理描述方法是:统计法、频域法、结构法。统计法从图像有关属性的统计分析出发;结构法则力图找出纹理基元,再从结构组成上探索纹理的组成规律。一般来说,统计分析方法能够取得较好的效果,所以一直占据着主导地位。早期的研究方法主要有马尔可夫随机场理论GMRF(Gaussian Markov random field)和吉布斯分布(Gibbs distribution)理论,这些方法主要考虑了一定范围内图像点的关系。随着小波的出现及其在图像处理中的应用,基于多尺度多分辨率的算法逐渐成为主流。Michael Unser采用如下算法:对纹理图像进行小波变换;计算各予频带内小波系数的平方和的均值作为特征向量;通过计算Bayes距离,碍出样本与各融知纹理的相似度,从而进行分类。
2.4 基于语义特征
与基于低层物理特征查询不同,语义特征查询是基于文字的查询,查询图像中包括的具体的物体,发生的场景,图像所描述的感性色彩等都属于这个层次的查询。图像语义具有模糊性、复杂性、抽象性,一般包括3个语义层次:特征语义、目标和空间关系语义。高层语义特征语义就是图像的颜色、形状、纹理等低级视觉特征,与视觉感知直接相连;目标语义和空间关系语义需要识别和提取图像中的目标类别目标之间的空间位置等关系,涉及到模式识别和逻辑推理的相关技术。一般而言,高层的图像语义往往建立在较低层次的语义获得的基础上,并且层次越高,语义越复杂,涉及的领域知识越多。基于语义的图像检索一般指的是基于目标和高级语义的图像检索方法。
3 基于内容的图像检索的效果评价
在基于内容的检索中, 由于检索算法比较多,需要对各种算法的检索结果进行评判,以比较其优劣从研究情况来看,对于系统的响应时间和吞吐率的评价论述的较少,对检索效果评价更多地放在对检索结果的正确与否,主要使用查找率评价检索效果。
4 总结
综上所述,可以看出基于内容的图像检索仍然是一个开放性的研究课题,其研究将涉及认知科学、人工智能、模式识别、图像处理、信息检索等多个领域。对于基于内容的图像检