基于内容的图像检索系统的设计与实现【开题报告】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
毕业设计开题报告
计算机科学与技术
基于内容的图像检索系统的设计与实现
一、选题的背景、意义
1.1图像检索技术的产生和发展
随着多媒体技术和Internet网络的迅速的发展,数字图像的容量正以惊人的速度增长.无论是军用还是民用,无论是静态的还是动态的,每天都会产生海量的图像信息.近年来大规模图像库的出现,管理、组织和利用图像成为一项亟待解决的技术难题.于是图像检索技术这种能够快速而且准确查找访问图像的技术应运而生[1].
基于内容的图像检索(Content-Based Image Retrieval,简写为CBIR)是20世纪90年代兴起的新技术,其实质是图像特征相似性匹配检索.因其直观(示例描述)、高效(相似性匹配检索)、通用(与领域知识无关)等特点,近年来在国际国内均是一个热门研究课题.
图像检索技术发展到现在大致经历了两个阶段基于:文本的检索和基于内容的检索.早期的图像检索是基于文本注释的(Text.Based Image Retrieval),该方法的实质是把图像检索转换为与该图像对应的文本检索. 基于内容的图像检索即CBIR),即对图像的视觉内容,如图像的颜色、纹理、形状等进行分析和检索[2].
基于内容的图像检索系统的体系结构如图(一)所示[3]
图(一)
90年代后,在快速发展的数据库技术和计算机视觉技术的大力推动下,CBIR得到国内
外计算机界研究人员的广泛重视,迅速成为国内外研究的热点之一。
不仅各大著名国际杂志纷纷设立专刊介绍该领域的研究现状与科研成果,国内外各高校和科研机构也积极展开了对CBIR的研究,发表了大量相关理论和技术应用的论文[4-5].此外,鉴于人们对CBIR的重要性、有效性和优越性有了更深的认识,近年来国内外已纷纷投入人力物力研制成一些系统,既有各科研机构的演示软件,也有商业应用软件。
其中,较具有商业价值的有IBM公司的QBIC(Query By Image Content)系统,Virage公司开发的Virage系统以及MIT多媒体实验室开发的Photobook系统。
实验原型系统中比较具有代表性的有清华大学计算机系结合863高技术研究发展项目研制的“Web 上基于内容的图像检索"系统, Excalibur公司开发的Retrieval Waret[6]系统,哥伦比亚大学开发的WebSEEK系统,UCSB大学开发的Netra系统原型以及美国伊利诺斯大学Urbana-Champian分校开发的MARS(Multimedia Analysis and Retrieval System)系统。
就目前研究现状而言,CBIR技术己经研究了十多年,有了很大发展,也有了不少成形的算法,不过其中很多关键问题还是远远没有得到解决,总体效果不能令人满意。
目前基于内容的图像检索技术仍然主要集中在颜色、纹理、形状、轮廓等底层视觉特征提取的基础上,但是由于图像特征描述和特征提取及相似性度量的复杂性,其技术仍不是很成熟,理论上有许多问题还有待解决。
而且,由于计算机视觉以及人工智能发展的不成熟,及目前的关系型数据库不同于理论上的图像数据库,故还有许多问题需要进行研究。
主要如下:1.图像特征描述与提取; 2.相关反馈技术; 3.结合多种检索手段[7]; 4.对专业图像的检索; 5.数据模型问题;6.多种检索手段相结合的问题[7];7.高效存储及检索技术; 8.如何评价和衡量一个检索系统的优劣还没有一个统一的标准。
1.2发展现状——图像检索算法的研究
基于图像内容的检索技术主要依据图像的颜色、纹理、形状特征以及图像中子图像(对象)的特征进行检索.常见的检索内容主要包括:
(1)颜色:图像颜色分布、相互关系、组成等:(2)纹理:图像的纹理结构、方向、组合及对称关系等:(3)形状:图像轮廓组成、形状、大小等:(4)对象:图像中子对象的关系、数量、属性、旋转等.
(一)颜色
颜色是图像检索中最先被采用的特征,通常采用RGB三色表示.为使表示法更符合人眼
视觉特性,比较时一般要把RGB空间转换成其他颜色空间.Munsell, HIS,HSV,HSB都是面向视觉感知的颜色模型.颜色特征的表达主要有统计直方图、累积直方图和颜色布局3种.其中,MPEG-7在统计直方图中推荐了可伸缩颜色和帧组/图组颜色两种描述符,在颜色布局中推荐了颜色布局描述符.简单直方图匹配算法主要有颜色直方图、颜色一致性矢量、颜色有关图、颜色矩等.颜色直方图的比较是最基本的方法,但缺乏图像的空间信息:颜色一致性矢量方法不仅统计了整幅图像中各颜色的像素值,还统计了图像中各颜色最大区域的像素值,效果较好,但它并没有强调各颜色最大区域的形状以及与背景的关系:颜色有关图法强调同一颜色在图像中的空间距离有关性,其检索效果比上述几个方法都要好,但计算量比较大;颜色矩算法主要是采用图像中各颜色的均值和方差做比较,处理简单,可作为图像检索的初检,为下一步的细检缩小搜索范围.颜色特征在图像检索中占有重要位置,但其固有的光照敏感性也限制了其使用范围[8-9].
(二)纹理
纹理是图像的又一重要特征,虽然尚无精确的定义,但却受到广泛研究!一般认为纹理就是纹理元素有规律的排列组合,而把具有重复性、形状简单、强度一致的区域看作纹理元素.视觉纹理特性主要有:粗糙度、对比度、方向度、线象度、规整度、粗略度等,MPEG 7中推荐了3种纹理描述符,分别是边缘直方图、同质描述符和纹理浏览描述符.纹理描述的难点就在于它与物体的形状间存在密切的关系,干变万化的物体形状与嵌套式分布使纹理的分类变得十分困难.纹理特征对模式识别和计算机视觉等领域都具有重要的意义.7O年代初期,Haralick等人提出了纹理特征的共生矩阵(cooccurrencematrix)表示,从数学角度研究了图像纹理中灰度级的空间依赖关系.Tamura等人从纹理的视觉感知心理学角度,提出了纹理特征的表达,表示的所有纹理性质都具有直观的视觉意义.近2O年中,有大量的研究集中在应用随机场模型表达纹理特征,Markov随机场(MRF)模型取得了很大成功,其典型的应用是自回归纹理模型(simultaneous autod reeressife,或SAR),还有一种常用的纹理分析和分类方法是小波变换(wafelet transform),小波变换表示的纹理特征,可以用每个波段的每个分解层次上能量分布的均值和标准方差.Gabor过滤法能够最大程度地减少空间和频率的不确定性,同时还能够检测出国像中不同方向和角度的边缘和线条由于纹理描述比较困难,一般对纹理的检索都采用示例查询(guery By hiample)方式.用户给出示例的全部或部分区域特征,从而找到类似图像[9-10].
(三)形状
形状是物体的一个重要特征.但由于物体形状的自动获取有一定难度,基于形状的检索
一般仅限于非常容易识别的物体形状可用面积、离心率、圆形度、形状矩、曲率、分形维等全局和局部特征来表示.一般来说,形状特征有两种表示方法,一种是轮廓特征,一种是区域特征.前者使用物体的外边界,而后者使用整个形状区域这两类形状特征的最典型方法是傅立叶形状描述符(Fourier shape descriptors)和形状无关矩(MomentInfariants).主要分析方法有不变矩、傅立叶描述符、向心链码等,前两种方法是最成功的表示法.其中不变距法利用了不变距的位移、旋转和缩放不变性:傅立叶描述符法是用物体边界的傅立叶变换作为其形状描述:向心链码的方法首先采用向心链码对形状进行编码,再在编码码流中直接提取形状的“相对凸数及”凸度” 以此作为形状检索的依据[11].
(四)空间关系
空间关系特征是比颜色或纹理要高层一些的特征,是图像中各对象的基本关系之 .利用图像中对象的空间关系来区别图像,符合人们识别图像的习惯,直角坐标系是其最直接的表示法.空间关系主要包括拓扑、方向、度量三大类关系.空间关系特征可以分为两类,一类方法首先对图像进行自动分割,划分出其中所含的对象或颜色区域,然后根据这些区域对图像索引,主要包括二维符号串、空间四叉树和符号图像:另一类方法则简单地将图像均匀划分若干子块,对每个图像子快提取特征建立索引.在检索中,首先根据特征计算图像的相应子快之间的相似度,然后通过加权计算总的相似性.这类方法从概念上来说非常简单,但这种普遍规则的分块并不能精确的给出局部色彩的信息,且计算和存储的代价都比较昂贵,因此,在实际中应用较少,从而给基于对象空间关系的图像检索带来了困难.[12]
二、研究的基本内容与拟解决的主要问题
1.学习掌握BMP位图格式,知道位图操作的基本方法;
2.继续学习C++[13]语言,达到能用它熟练的实现位图基本操作;
3.阅读一定量的相关参考文献,了解常见的图像检索算法,包括其主要使用的颜色空间、
一些常见的变换手段,特征提取的方法,了解一些机器学习算法[14];
4.能够对图像检索算法进行评判,指出其优缺点和其适用的场合;
5.选择一个深刻理解的检索算法对其做一定改进,要求算法有一定鲁棒性,检索有较高
的准确率;
6.在vc环境下实现该算法,锻炼实现算法的能力和程序调试的能力;
7.学会处理实验结果,能对实验结果进行分析,指出其不足;
三、研究的方法与技术路线、研究难点,预期达到的目标
(一)文献研究法
文献法主要指搜集、鉴别、整理文献,并通过对文献的研究形成对事实的科学认识的方法。
文献法是一种古老、而又富有生命力的科学研究方法。
对现状的研究,不可能全部通过观察与调查,它还需要对与现状有关的种种文献做出分析。
(二)技术路线
基于内容的图像检索系统一般包括图像处理模块、查询模块、对象库和特征库和知识库。
(三)研究难点
1.能够对图像检索算法进行评判,指出其优缺点和其适用的场合;
2.选择一个深刻理解的检索算法对其做一定改进,要求算法有一定鲁棒性,检索有较高
的准确率;
3.在vc环境下实现该算法,锻炼实现算法的能力和程序调试的能力;
4.学会处理实验结果,能对实验结果进行分析,指出其不足;
(四)预期达到的目标
设计完成在阅读一定量的参考文献的基础上,分析理解各种常见的基于内容的图像检索算法,并能对其做一定评价。
选择其中的一个算法,对其进行适当改进,以此为核心,在老师指导下完成一个实验系统。
在此过程中锻炼自学习能力,文献阅读能力,程序设计能力,实验结果分析能力,和文档整理能力。
四、论文详细工作进度和安排
2010.11.18-2010.12.10 完成文献综述,了解常见的静态图像检索算法;
2010.12.11-2010.12.25 完成开题报告,在前面文献阅读的基础上,整理工作思路,确定工作目标;
2010.12.26-2011.01.06 完成外文翻译;
2011.01.07-2011.02.10 选择一个熟悉的检索算法,进行深入分析,并对其进行改进,完成算法设计;
2011.02.11-2011.04.01 编程完成算法的测试系统;
2011.04.02-2011.04.10 实验测试,分析实验结果;
2011.04.11-2011.05.10 撰写毕业论文;
2011.05.11-2011.05.31 论文修改;
2011.06.01-2011.06.13 论文评阅。
五、主要参考文献:
【1】杨德三. 基于内容的图像检索技术研究[D].兰州:兰州理工大学,2008,1-3.
【2】贾君霞.基于内容的图像检索技术综述[J].应用技术,2010,(11):1.
【3】王伟,基于内容的图像检索关键技术研究[D],南京: 南京信息工程大学2010 ,38-40 【4】tecki,R.Melter,A.Gross.Special issue on Shape Represent- ation and Similarity for Image Database[J].Pattern Recognition,2002,35(1):1-297.【5】 C.Cool,A.Spink.Special Issues of Context in Information Retrieval- [J].Information Processing and Management,2002,38(5):605-742.
【6】James Dowe.Content-based Retrieval in Multimedia Imaging[J].Proc SPIE Storage and Retrieval for Image and Video Database,1993.
【7】温泉彻.基于内容的图像检索关键技术研究.微计算机信息,2007,(03):278-280.【8】孙涛.基于颜色空间的图像特征提取的研究[D].吉林:吉林大学,2006.
【9】徐琨,李燕.基于分块颜色矩和纹理特征的图像检索方法.西安石油大学学报.2005,20(2):76-79
【10】石磊.基于纹理特征的图像检索方法[D].四川:四川大学,2007.
【11】金莲芳.基于MPEG-7形状特征的图像检索技术研究[D].广西:广西大学,2005.【12】韩轩.基于颜色和空间特征的图像检索技术研究[D].厦门:厦门大学.
【13】マーチン・ファウラー.クラス~オブジェクト指向プログラミング[M].日本:翔泳社,2005.
【14】 Chuen-Horng Lin , Rong-Tai Chen , Yung-Kuan Chan .A smart content-based image retrieval system based on color and texture feature[J].Image and Vision
Computing ,2009 ,27:658–665.。