基于内容的图像检索系统的设计与实现【开题报告】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
毕业设计开题报告
计算机科学与技术
基于内容的图像检索系统的设计与实现
一、选题的背景、意义
1.1图像检索技术的产生和发展
随着多媒体技术和Internet网络的迅速的发展,数字图像的容量正以惊人的速度增长.无论是军用还是民用,无论是静态的还是动态的,每天都会产生海量的图像信息.近年来大规模图像库的出现,管理、组织和利用图像成为一项亟待解决的技术难题.于是图像检索技术这种能够快速而且准确查找访问图像的技术应运而生[1].
基于内容的图像检索(Content-Based Image Retrieval,简写为CBIR)是20世纪90年代兴起的新技术,其实质是图像特征相似性匹配检索.因其直观(示例描述)、高效(相似性匹配检索)、通用(与领域知识无关)等特点,近年来在国际国内均是一个热门研究课题.
图像检索技术发展到现在大致经历了两个阶段基于:文本的检索和基于内容的检索.早期的图像检索是基于文本注释的(Text.Based Image Retrieval),该方法的实质是把图像检索转换为与该图像对应的文本检索. 基于内容的图像检索即CBIR),即对图像的视觉内容,如图像的颜色、纹理、形状等进行分析和检索[2].
基于内容的图像检索系统的体系结构如图(一)所示[3]
图(一)
90年代后,在快速发展的数据库技术和计算机视觉技术的大力推动下,CBIR得到国内
外计算机界研究人员的广泛重视,迅速成为国内外研究的热点之一。不仅各大著名国际杂志纷纷设立专刊介绍该领域的研究现状与科研成果,国内外各高校和科研机构也积极展开了对CBIR的研究,发表了大量相关理论和技术应用的论文[4-5].此外,鉴于人们对CBIR的重要性、有效性和优越性有了更深的认识,近年来国内外已纷纷投入人力物力研制成一些系统,既有各科研机构的演示软件,也有商业应用软件。其中,较具有商业价值的有IBM公司的QBIC(Query By Image Content)系统,Virage公司开发的Virage系统以及MIT多媒体实验室开发的Photobook系统。实验原型系统中比较具有代表性的有清华大学计算机系结合863高技术研究发展项目研制的“Web 上基于内容的图像检索"系统, Excalibur公司开发的Retrieval Waret[6]系统,哥伦比亚大学开发的WebSEEK系统,UCSB大学开发的Netra系统原型以及美国伊利诺斯大学Urbana-Champian分校开发的MARS(Multimedia Analysis and Retrieval System)系统。
就目前研究现状而言,CBIR技术己经研究了十多年,有了很大发展,也有了不少成形的算法,不过其中很多关键问题还是远远没有得到解决,总体效果不能令人满意。目前基于内容的图像检索技术仍然主要集中在颜色、纹理、形状、轮廓等底层视觉特征提取的基础上,但是由于图像特征描述和特征提取及相似性度量的复杂性,其技术仍不是很成熟,理论上有许多问题还有待解决。而且,由于计算机视觉以及人工智能发展的不成熟,及目前的关系型数据库不同于理论上的图像数据库,故还有许多问题需要进行研究。主要如下:1.图像特征描述与提取; 2.相关反馈技术; 3.结合多种检索手段[7]; 4.对专业图像的检索; 5.数据模型问题;6.多种检索手段相结合的问题[7];7.高效存储及检索技术; 8.如何评价和衡量一个检索系统的优劣还没有一个统一的标准。
1.2发展现状——图像检索算法的研究
基于图像内容的检索技术主要依据图像的颜色、纹理、形状特征以及图像中子图像(对象)的特征进行检索.常见的检索内容主要包括:
(1)颜色:图像颜色分布、相互关系、组成等:(2)纹理:图像的纹理结构、方向、组合及对称关系等:(3)形状:图像轮廓组成、形状、大小等:(4)对象:图像中子对象的关系、数量、属性、旋转等.
(一)颜色
颜色是图像检索中最先被采用的特征,通常采用RGB三色表示.为使表示法更符合人眼
视觉特性,比较时一般要把RGB空间转换成其他颜色空间.Munsell, HIS,HSV,HSB都是面向视觉感知的颜色模型.颜色特征的表达主要有统计直方图、累积直方图和颜色布局3种.其中,MPEG-7在统计直方图中推荐了可伸缩颜色和帧组/图组颜色两种描述符,在颜色布局中推荐了颜色布局描述符.简单直方图匹配算法主要有颜色直方图、颜色一致性矢量、颜色有关图、颜色矩等.颜色直方图的比较是最基本的方法,但缺乏图像的空间信息:颜色一致性矢量方法不仅统计了整幅图像中各颜色的像素值,还统计了图像中各颜色最大区域的像素值,效果较好,但它并没有强调各颜色最大区域的形状以及与背景的关系:颜色有关图法强调同一颜色在图像中的空间距离有关性,其检索效果比上述几个方法都要好,但计算量比较大;颜色矩算法主要是采用图像中各颜色的均值和方差做比较,处理简单,可作为图像检索的初检,为下一步的细检缩小搜索范围.颜色特征在图像检索中占有重要位置,但其固有的光照敏感性也限制了其使用范围[8-9].
(二)纹理
纹理是图像的又一重要特征,虽然尚无精确的定义,但却受到广泛研究!一般认为纹理就是纹理元素有规律的排列组合,而把具有重复性、形状简单、强度一致的区域看作纹理元素.视觉纹理特性主要有:粗糙度、对比度、方向度、线象度、规整度、粗略度等,MPEG 7中推荐了3种纹理描述符,分别是边缘直方图、同质描述符和纹理浏览描述符.纹理描述的难点就在于它与物体的形状间存在密切的关系,干变万化的物体形状与嵌套式分布使纹理的分类变得十分困难.纹理特征对模式识别和计算机视觉等领域都具有重要的意义.7O年代初期,Haralick等人提出了纹理特征的共生矩阵(cooccurrencematrix)表示,从数学角度研究了图像纹理中灰度级的空间依赖关系.Tamura等人从纹理的视觉感知心理学角度,提出了纹理特征的表达,表示的所有纹理性质都具有直观的视觉意义.近2O年中,有大量的研究集中在应用随机场模型表达纹理特征,Markov随机场(MRF)模型取得了很大成功,其典型的应用是自回归纹理模型(simultaneous autod reeressife,或SAR),还有一种常用的纹理分析和分类方法是小波变换(wafelet transform),小波变换表示的纹理特征,可以用每个波段的每个分解层次上能量分布的均值和标准方差.Gabor过滤法能够最大程度地减少空间和频率的不确定性,同时还能够检测出国像中不同方向和角度的边缘和线条由于纹理描述比较困难,一般对纹理的检索都采用示例查询(guery By hiample)方式.用户给出示例的全部或部分区域特征,从而找到类似图像[9-10].
(三)形状
形状是物体的一个重要特征.但由于物体形状的自动获取有一定难度,基于形状的检索