基于颜色直方图的图像检索 开题报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
南京邮电大学毕业设计(论文)开题报告
题目基于颜色直方图的图像检索系统的设计与实现
学生姓名班级学号专业
提纲(开题报告2000字以上):
1. 对指导教师下达的课题任务的学习与理解
2. 阅读文献资料进行调研的综述
3. 根据任务书的任务及文献调研结果,初步拟定的执行(实施)方案(含具体进度计划)
1.对指导教师下达的课题任务的学习与理解
从20世纪70年代开始,图像检索的技术就已经开始。传统的文本检索技术,是通过关键字式的提问查询,可以检索的关键字有图像名称、图像尺寸、压缩类型、作者、年代等图像标引。到90年代以后,多媒体信息迅速膨胀,全世界的数字图像的容量以惊人的速度增长,这些图像分布在世界各地,它们都是无序、无索引的。要检索靠传统技术全部都要人工标注,而人工标太主观,不确定,不同人,不同语种,对同一幅图像的理解不同,标注描述就会千差万别。而且随着数据库数以万计地增加,人们寻找资料变得非常耗时,造成资源无法有效利用。因此人们提出了一种新的对图像内容语义的检索技术——基于图像内容的检索CBIR (Contented-Based Image Retrieval),它不需要用户的参与,而利用图像自身的特征,如颜色、纹理、形状等特征来进行检索,具有较强的客观性。
基于内容图像的检索CBIR主要依据图像的画面内容特征和主题对象特征来进行检索。由图像分析软件对输入的图像先进行图像分析,根据图像自身所包含的颜色(灰度)、纹理、形状、空间关系等特征以及这些特征的组合,自动抽取特征,在将输入图像存入图像库的同时将其相应的特征向量也存入与图像库相连的特征库。在进行检索图像时,对每一幅给定的查询图,进行图像分析,并提取图像特征向量,利用基于这些特征定义的特征度量函数计算或评价特征之间的相似性,将该图像的特征向量和特征库中的特征向量进行匹配,根据匹配的结果搜索图像库中将最相似的一些检索结果就可以提取出所需要的检索图,返回给用户。CBIR的目的不是去理解或识别图像目标,它所关注的是能否基于内容快速发现信息,旨在对视觉信息提供强有力的描述,实现视觉信息的结构化,在用户可以接受的响应时间内从图像库中查询到符合要求的图像,最终达到用户对这些视觉信息内容自由访问的目标。
在图像的形状、颜色、纹理等特征中,颜色特征是最显著、最可靠、最稳定的视觉特征,是人识别图像的主要感知特征。相对于几何特征而言,颜色对图像中子对象的大小和方向的变化都不敏感,具有相当强的鲁棒性。同时,在许多情况下,颜色又是描述一幅图像最简便而有效的特征。人们对于一幅图像的印象,往往从图像中颜色的空间分布开始。所有这些都促使颜色成为基于内容的图像检索所采取的主要手段之一。
颜色直方图所描述的是不同色彩在整幅图像中所占的比例,而并不关心每种色彩所处的空间位置,即无法描述图像中的对象或物体。颜色直方图特别适于描述那些难以进行自动分割的图像。直方图中的数值都是统计而来,描述了该图像中关于颜色的数量特征,可以反映图像颜色的统计分布和基本色调;包含了该图像中某一颜色值出现的频数,而丢失了某象素所在的空间位置信息。颜色直方图可以是基于不同的颜色空间和坐标系。最常用的颜色空间是RGB颜色空间,原因在于大部分的数字图像都是用这种颜色空间表达的。然而,RGB空间结构并不符合人们对颜色相似性的主观判断。因此,有人提出了基于HSV空间、Luv空间和Lab空间的颜色直方图,因为它们更接近于人们对颜色的主观认识。其中HSV空间是直方图最常用的颜色空间。它的三个分量分别代表色彩(Hue)、饱和度(Saturation)和值(Value)。
本课题研究的重点是:1、数学模型。数学模型是CBIR系统的核心,它决定了CBIR所能支持的查询类型和检索性能。建立的数学模型要充分反映图像对象的内容,反映与领域无关的和能够有效存储的物理特性及逻辑特征。2、颜色直方图特征提取。特征提取是基于内容的图像检索的基础。特征提取算法应简单易用,且具有自动提取的功能,所选择的特征应尽可能表达原始图像的信息,同时可以借助一些先进的数学工具来提取图像特征。3、检索技术。在对图像的检索中,最主要的方式是相似性检索。即在图像数据库中找到与给定图像最为相似的一幅。它的一般做法是提取出图像的特征建立特征库。由于图像特征一般都是高维的矢量数据,所以这时图像检索就转化为对空间数据库中高维数的近邻检索问题。为了能够高效的进行数据特征索引,从而实现图像信息的检索,目前对索引技术的研究主要集中在降低索引维数和建立良好的索引方法上。
本课题研究实现的目标是:1. 设计颜色直方图特征提取算法;2. 设计和建立特征数据库;
3.设计与实现检索匹配算法;
4. 交互界面设计与实现,并应用编程语言(VC++)设计并实现基于颜色直方图的图像检索系统,并形成相关文档。
2.阅读文献资料进行调研的综述
1、基于内容的图像检索(CBIR)
所谓基于内容图像的检索是指由图像分析软件对输入的图像先进行图像分析,根据图像中物体或区域的颜色(color)、形状(shape)或纹理(texture)等特征以及这些特征的组合,自动抽取特征,在将输入图像存入图像库的同时将其相应的特征向量也存入与图像库相连的特征库。在进行检索图像时,对每一幅给定的查询图,进行图像分析,并提取图像特征向量。将该图像的特征向量和特征库中的特征向量进行匹配,根据匹配的结果到图像库中搜索就可以提取出所需要的检索图。
基于内容的图像检索是一个逐步求精的过程,大致可以经过以下几个步骤:
(1)特征提取。对图像数据进行自动或半自动的特征提取,提取用户感兴趣的、适合检索要求的特征。特征提取可以是全局性的,如整幅图像,也可能是针对某个目标,如图像中的子区域等。
(2)图像匹配。在选取了特征之后,需要选择或寻找适当的判别准则,从而判断出待识别的图像的特征与数据库中的哪些图像的特征最接近。常用的度量准则是距离度量法。
(3)结果输出。将满足一定相似性条件的一组候选结果按相似度大小排列后返回给用户。
(4).特征调整。对系统返回的结果可通过浏览来挑选,直至找到满意的结果,或从候选结果中选择一个示例,经过特征调整,形成一个新的查询。
2、颜色的度量体系
颜色度量体系(color system),也叫做颜色制或者叫做颜色体制,实际上就是人们组织和表示颜色的方法。组织和表示颜色的方法主要有两种:一种是颜色模型,一种是编目系统。颜色模型是用简单方法描述所有颜色的一套规则和定义。颜色空间是颜色模型最普通的例子,RGB、CIE XYZ、CIE LAB、CMYK等。
3、特征特征与颜色提取
颜色特征与图像中的物体或场景十分相关,它定义明确,抽取容易,对图像本身的尺寸、方向、视觉的依赖性较小,具有尺度不变性、旋转不变性和位置不变性等特点,对图像的描述最简便而有效,在图像的各种特征中最显著、可靠和稳定,是人识别图像的主要感知特征。
颜色的特征表达首先依赖于所选用的颜色模型,不同的颜色模型,不同的具体应用,要与