基于词袋模型的图像分类算法研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
词袋模型定义
词袋模型图像处理过程
词袋模型图 像分类步骤
1.特征提取和描述 通过对图像中相关位置进行分析,以一定的标准寻找出图 像中的特殊区域,进而将之代表整个图像。 2.词典生成 通过划分的特征空间为选定区域,如果在同一片区域中存 在着同样的特征值,将之认为具有相同特征值的图像。进而借 助K-means 聚类对SIFT特征进行整体划分,在划分后,视觉单 词位于划分区域正中央。 3.特征量化 针对特征量的量化,就是对所选定的特征区域规定一个特 征值,进而以距离查找所规定的额距离在所选择区域中进行距 特征值最近的区域挑选聚类区。 4.训练分类器 通过在所选定的区域进行整体的选择,挑选出分类超平面, 进而能够实现各种特征值的排列组合。而最优超平面的检测和 选择过程可以通过以下式子进行反应:
基于金字塔原理 的词袋模型表示
通过对直方图交叉函数进行计算,可按照以下式子进行:
I ( H , H ) min( H (i), H (i))
L X L Y i 1 l X L Y
D
将金字塔匹配核按照以下方式匹配:
K ( X ,Y ) I
L L l 0
L 1
1
2
l l+1 ( I I ) L 1
46.1 57.1
49 58.1
ROI提取方法 55.6 提取方法
表2 ROI提取方法与传统方法分类正确率比较(%) (Caltech 256)
结论
研究总结
研究总结
本文对基于词袋模型的图片分类算法进行研究,首 先介绍了图像分类方法,进而对图像分类应用作出一定 的介绍,使我们对图像分类有一整体的把握。其次,论 文介绍基于词袋模型的图片分类定义及步骤,包括特征 提取和描述、词典生成、特征量化、训练分类器,进而 又分析了基于金字塔匹配原理的词袋模型表示;最后, 通过实验分析表明:将ROI 提取技术与金字塔匹配原理 相结合,能够十分有效的增强词袋模型分类效率与效果。 ROI提取过程中能够迅速探索到目标区域的特征值,并 形成视觉信息,能够适用于图像数量较小的情况,分类 精度较高。将之结合金字塔匹配原理,能够忽略图像背 景及空间因素的影响,在分层较小的情况下,实现较高 精度的图像分类。
图像分类方法
图像分类方法及应用
图像分类应用
图像分类方法
图像分类就是基于对目标特征值的设定,将众多图像 数据中选择出目标图像并对其进行分类的方式。借助计算 机视觉,通过不同算法对图像进行处理,进而划分不同图 像中的符合特征值的像素区域进行分类,进而对其实现选 择和分类的方法。 1.基于色彩特征的索引技术 2.基于纹理的图像分类技术 3.基于形状的图像分类技术 4.基于空间关系的图像分类技术
结果与分析
N
2
3
4
5
10
20
常规方法
无
无 84.1
无 84.3
78.2 84.5
79.5 85
81.2 85.6
ROI提取方法提 83.9 取方法
表1 ROI 提取方法与传统方法分类正确率比较(%) (Caltech 101)
结果与分析
2
3
4
5
10
20
常规方法
无
无ห้องสมุดไป่ตู้56
无 56.5
45.2 56.8
词袋模型图 像分类步骤
反应方程:
n 1 2 min c i , 2 i 1
约束条件:
y ( xi -b)≥ 1-i,i>0,i=1, 2,3, ,n。 i ·
基于金字塔原理 的词袋模型表示
因为传统词袋模型仅仅是将图像表示成视觉单词的直 方图,并没有考虑到物体的形状信息,也没有考虑到视 觉特征的空间信息。 所以将金字塔模型引入到词袋模型 中,建立金字塔词袋模型,将金字塔词袋模型与金字塔 直方图模型相结合,两种信息相互补充,共同来表征图 像;在分类器设计方面采用 SVM进行分类。
基于词袋模型的图像分类算法研究
2012级 电子与通信工程学 姓名:马博 学号:1230060222 指导老师:张重
目录
CONTENTS
结论
实验结果与分析
基于词袋模型的 图片分类 图像分类方法及应 用
绪论
研究背景
绪论
研究意义
研究背景
伴随计算机技术及信息传递的不断增长,实现了各类 信息的分类保存和稳定运输。伴随信息技术的不断发展, 信息传递速率逐步加快,图像作为重要的信息传递方式不 断被人们所运用。怎样高效的实现对不同类别图像进行分 类和挑选成了急需要解决的问题。借助计算机技术,通过 各种图像分类方法,较为有效的实现众多图像的迅速分类 成了图片分类处理的一大方向。 图像分类可将众多图像数据进行统一划分,通过制 定的相关标准按照需求进行分类与挑选,进而能够帮助我 们对众多图像信息中快去挑选有效信息的速率。借助计算 机平台能够较为有效的实现图像的准确分类。
结束放映
实验样本选取
实验结果与分析
结果与分析
实验样本选取
本文整体的设计过程,借助了在进行常规图像分类过 程中较为常用的数据库即:Caltech 101 以及Caltech256 (加利福尼亚理工学院分类图像数据库)作为本次实验的 主要实验图像来源。整体来看,101和265数据库较为相似, 都具有较丰富的图像资源,数据量较大,具对这两个数据 库中的图像进行分类具有普适性。因此,在论文试验过程 中,以两数据库中图像进行试验
致谢
首先,我要感谢我的论文指导老师张重老师。不论是从最开始选题还是到 最后的定稿的各个环节上,老师都给予了我耐心指示和细心教导。如果没有您 对我的指导和帮助,我根本不可能完成这篇论文。在这里,我对您致以最诚挚 的感谢! 在此也谢谢辛苦工作的论文答辩组的老师们,谢谢老师们的谆谆教诲,老 师们幸苦了。
词袋模型定义
基于词袋模型的图片分类
词袋模型图 像分类步骤
基于金字塔匹配原理 的词袋模型表示
词袋模型定义
词袋模型分类方法,可以理解为将所有的词语放入较 大的袋子中,不考虑词语的相互联系,也屏蔽其语法概念, 从一个大袋子中认为其出现的可能性是一样的,和其它相 关词语没有直接的联系。这种分类图像的方式必须设置一 个容量较大的词典,这样就可以认为在文档中的词语都能 够看成随机出现的直方图。同理,在对图像进行处理过程 中,这种图像处理的方式就是将图像中的单元看成单词, 而图像本身作为承载单词的文档,图像分类的过程可以理 解为对图像中的特征值进行定位,进而会以视觉单词的形 式进行输出。一般来说,基于词袋模型的图像处理方法必 须对图像进行词典的形成和特征值的提取,最终选择相应 的分类器对齐进行分类。
结果与分析
借助数据库Caltech 101 和Caltech 256 中图像进行实验 研究,随机从这两种图像数据库中选择10类图像作为实验对象: Caltech 101: bass(椴树), camara, cellphone, chair,cup,dollar bill(美钞), hawksbill(玳瑁), euphonium (次中音号), gramophone(留声机), soccer ball; Caltech 256: breadmaker, buddha(佛像), bulldozer(推 土机), butterfly, cactus (仙人掌), cake, calculator, camel, canoe(独木舟)。 我们通过实验来分析ROI (region of interest)提取是 否符合要求。设置对照实验,传统提取作为对照,也就是将途 中信息全部提取,不是仅仅针对ROI 区域提取特征数据,这样 生成的词典具有全面性,同时将ROI 提取作为最终的对照。针 对20个ROI 区域内图像特征进行提取,进而获得20组实验数据 作为对照。具体结果通过表1和表2进行显示。
研究意义
本文对基于词袋模型的图像分类算法,重点分析其工 作原理,了解起运算过程,对选定的图像库进行统一前处 理,然后借助求特征值的方式,通过HSV特征和SIFT特征整 体反映出所要描绘图像的色彩及形状大小,进而通过SIFT 特征进行最终图像的分类表达。最后,对这种分类方法进 行实验对比分析,研究其分类精度,进而能够进一步推广 这种图像分类处理方式,使词袋模型更容易被大众认知和 接受。
图像分类应用
1、图像检索:这是图像分类最基础的目的。能够完全 取代传统图像标注的分类方法,实现快速、高效图像检索。 2、目标跟踪:主要运用于处理违法犯罪的照片或工作 过的相关图片进行追踪。是图像分类技术在实际生活中的 重要运用。 3、军事领域:在军事领域中,图像分类方法也常常被 用到,尤其应用于侦查照片的分析中。信息化时代,计算 机战争逐渐扩散,图像处理分类技术能够帮助我国分析敌 国信息,军事力量,甚至可应用在军事模拟中,对具有即 时追踪的战斗过程进行图像分析,可整体提升我国军事力 量。