基于深度学习和稀疏表示的图像分类与检索方法研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于深度学习和稀疏表示的图像分类与检索方法研究
图像分类和图像检索技术是当前计算机科学飞速发展和数字图像资源爆发式增长形势下智能信息处理领域研究的热点问题。
如何对图像内容进行有效的表示是图像分类和图像检索技术中一个关键问题。
目前,在图像分类与图像检索技术中,特征描述是图像表示的主要形式,存在着高维度与复杂性等问题。
图像的稀疏表示模型作为一种新兴的特征表示方法,能够有效解决实际应用中所存在的存储量、计算复杂度与图像解译性等方面的问题。
此外,深度学习技术的出现使得图像特征提取不再依赖于受人为主观因素影响的人工设计方法,而是着眼于通过大量数据来发掘数据中所隐含的深层次关系,使得图像特征的描述能力得到进一步的提升。
本文主要针对图像分类和图像检索中图像特征表示问题,研究了基于稀疏表示的图像表示方法和基于层次化特征提取的深度学习模型,以达到提升图像分类与检索性能的目的。
本文的主要工作包括:(1)提出一种基于稀疏表示和特征融合的图像检索方法:针对目前图像局部特征表达所存在的高维度与复杂性等问题,以“稀疏编码”为核心,通过字典学习、系数学习、特征池化等一系列操作,构建了基于稀疏表示的稀疏特征学习模型,所获得的特征描述相较于局部特征更具稀疏性与可区分性。
同时,根据人类视觉系统在认知过程中先整体而后局部的特性,结合Gist特征描述子在进行事物初划分上的高效性,构建了一种基于稀疏表示和特征融合的分阶段图像检索算法。
该算法的主要优点在于,一是传统的局部特征描述存在数量不等及高维度等问题,在图像检索应用领域局限性较
大。
因此,采用基于局部特征的稀疏特征学习模型能够有效解决图像局部特征在图像检索领域的应用问题。
二是采用了结合全局特征和局部特征的分阶段检索结构,从而可以对图像进行全面的描述,进而提
高了图像检索的性能。
在Coil20和改进的Caltech256数据集上进行的实验测试,验证了本文提出算法的有效性。
(2)提出一种基于卷积深度置信网络的图像分类与检索方法:首先,结合CNN中“局部感受野”的思想,在DBN模型中引入卷积操作,构建了一个由3个CRBM堆叠而成的卷积深度置信网络(CDBN),从而可以较好地获取到图像数据邻域的空间信息,获得到具备良好局部不变性和高层次的特征描述。
其次,为了探究CDBN模型在图像分类与检索应用中的有效性,使用CDBN与softmax分类器相结合的算法构建了基于卷积深度置信网络的图像分类框架。
然后,在图像分类的基础上,通过对查询图像进行正确分类并在类内使用HOG特征进行检索排序,进一步构建了基于卷积深度置信网络的图像检索框架,实现了通过图像分类来优化图像检索的性能。
在三个标准图像数据集(Coi120、UCM和改进Caltech256)上的实验验证了以卷积深度置信网络作为特征提取器,可以有效提升图像特征的表达能力,在图像分类和检索应用中表现出一定的优势。