基于仿射不变离散哈希的遥感图像多目标分类
遥感图像分类方法及应用示例
遥感图像分类方法及应用示例遥感技术是通过卫星、飞机等远距离传感器获取地表信息的一种技术手段。
遥感图像分类是遥感技术中的一项重要任务,它可以将遥感图像中的像素按照其特征进行分类,并生成分类结果。
本文将介绍遥感图像分类的方法,并给出一些应用示例。
一、遥感图像分类方法1. 基于像元的分类方法基于像元的分类方法是将遥感图像中的每个像素点看作一个样本进行分类,通过像素点的光谱特征来确定其所属类别。
常见的方法有最大似然法、支持向量机等。
最大似然法是一种基于统计学原理的分类方法,它通过求解样本的概率密度函数来确定像素点的类别。
支持向量机是一种基于样本间距离的分类方法,它通过构建超平面将不同类别的样本分开。
2. 基于对象的分类方法基于对象的分类方法是将遥感图像中的像素组成的对象进行分类,通过对象的形状、纹理等特征来确定其所属类别。
常见的方法有基于区域的分割和基于对象的分类。
基于区域的分割将遥感图像中的像素按照相似性进行分组,形成具有相同特征的区域。
基于对象的分类是在分割得到的区域基础上,通过提取区域的特征来确定其所属类别。
3. 基于深度学习的分类方法随着深度学习技术的发展,基于深度学习的分类方法在遥感图像分类中得到了广泛应用。
深度学习通过构建深层神经网络模型,可以自动学习遥感图像中的特征表示。
常见的方法有卷积神经网络(CNN)、循环神经网络(RNN)等。
卷积神经网络可以有效地提取图像的空间特征,循环神经网络可以捕捉图像序列的时序特征。
二、遥感图像分类的应用示例1. 农作物类型分类农作物类型分类是农业生产中的重要任务,可以帮助农民了解农田的分布情况和种植结构,指导农作物管理和精细化农业。
通过遥感图像分类方法,可以将农田遥感图像中的不同农作物进行分类,比如小麦、玉米、水稻等。
这样可以帮助农民进行农作物识别和农田监测,提高农业效益。
2. 土地利用分类土地利用分类是城市规划和土地资源管理中的重要任务,可以帮助决策者了解土地利用的分布情况和变化趋势,指导城市规划和土地资源开发。
多媒体数据的知识关联与理解专题前言
软件学报ISSN 1000-9825, CODEN RUXUEWE-mail: jos@ Journal of Software ,2019,30(4):865-866 [doi: 10.13328/ki.jos.005668] ©中国科学院软件研究所版权所有. Tel: +86-10-62562563多媒体数据的知识关联与理解专题前言* 蒋树强1, 刘青山2, 孙立峰3, 李 波41(中国科学院 计算技术研究所 智能信息处理重点实验室,北京 100190) 2(江苏省大数据分析技术重点实验室(南京信息工程大学 自动化学院),江苏 南京 210044) 3(清华大学 计算机科学与技术系,北京 100084) 4(北京航空航天大学 计算机学院,北京 100191)通讯作者: 蒋树强, E-mail: sqjiang@ 中文引用格式: 蒋树强,刘青山,孙立峰,李波.多媒体数据的知识关联与理解专题前言.软件学报,2019,30(4):865-866. http:// /1000-9825/5668.htm 近年来,不同来源的多媒体数据产生量剧增,成为用户信息获取、信息交换与信息消费的主要对象,多媒体数据具有广泛的应用需求和重大的应用价值.相对于其他数据类型,图像、视频等多媒体数据具有关系繁杂、冗余性强、信息隐藏深、全面理解困难等特点,因此,全面和准确地分析和理解多媒体内容是一个非常重要和具有挑战性的问题.最近,基于知识关联与理解的多媒体计算正逐渐得到研究者的关注,呈现出新的发展动态,这项研究可以使得多媒体内容的分析与理解更加深入,建立从多媒体内容感知到全面认知理解的桥梁.本专题公开征文,共收到投稿13篇,其中,12篇论文通过了形式审查,内容涉及图像/视频等多媒体内容的识别、理解和描述的各个方面.特约编辑先后邀请了30多位专家参与审稿工作,每篇投稿至少邀请3位专家进行评审.稿件经初审、复审、ChinaMM 2018论文交流和终审4个阶段,历时5个月,最终有7篇论文入选本专题.《视觉场景描述及其效果评价》对现有视觉场景描述及相关技术进行综述,介绍主要方法、模型及研究进展,梳理评价方法的各项指标,对视觉场景描述技术面临的问题与挑战进行了分析,并讨论了未来的应用前景.《跨媒体深层细粒度关联学习方法》提出了跨媒体循环神经网络及联合关联损失函数,用以挖掘媒体内和媒体间的多层面关联,支持高效的跨媒体检索.《基于区域敏感生成对抗网络的自动上妆算法》提出了一种掩模控制的自动上妆生成对抗网络,能够重点编辑上妆区域,保持主体信息,实现特定区域上妆.《基于仿射不变离散哈希的遥感图像多目标分类》在监督离散哈希(SDH)目标函数中引入仿射不变因子约束,构造仿射不变离散哈希,并应用于遥感图像的多目标分类.《基于条件随机场的深度相关滤波目标跟踪算法》面向鲁棒的目标跟踪,将基于深度学习的判别式相关滤波和条件随机场模型结合,设计了一个端到端的深度卷积神经网络.《基于小波域的深度残差网络的图像超分辨率算法》将小波变换的思想与深度残差网络相结合,并利用图像空间损失和小波系数损失约束网络训练,并将该方法用于图像的超分辨率重构问题.《利用可分离卷积和多级特征的实例分割》在全卷积实例感知分割网络的基础上,面向图像中的实例分割,设计了一个具有边界细化模块和多级特征的复杂分割分支.本专题主要面向多媒体技术、图像处理、人工智能等多领域的研究人员和工程人员,反映了我国学者在多媒体内容分析与理解领域最新的研究进展.感谢《软件学报》编委会和中国计算机学会多媒体技术专委会对专题工作的指导和帮助,感谢专题全体评审专家及时、耐心、细致的评审工作,感谢踊跃投稿的所有作者.希望本收稿时间: 2019-01-23866 Journal of Software软件学报 V ol.30, No.4, April 2019专题能够对多媒体及相关领域的研究工作有所促进.蒋树强(1977-),男,博士,研究员,博士生导师,国际期刊《ACM ToMM》和《IEEE Multimedia》的Associate Editor,CCF多媒体专委会常委,ACM SIGMM中国分会副主席,主要研究领域为图像/视频等多媒体信息的分析、理解与检索技术和多模态智能技术,在本领域重要刊物和会议上发表论文150多篇.刘青山(1975-),男,博士,教授,博士生导师,江苏省大数据分析技术重点实验室主任,国际期刊《Signal Processing》、《Neurocomputing》和国内期刊《自动化学报》编委,CCF多媒体专委会和计算机视觉专委会常委,先后主持国家杰出青年基金项目、国家自然科学基金重点项目等多项国家级项目,主要研究领域为图像与视频理解,模式识别等,在本领域重要刊物和会议上发表论文100余篇.孙立峰(1972-),男,博士,教授,博士生导师,网络多媒体北京市重点实验室主任,CCF多媒体技术专委会秘书长,主要研究领域为网络多媒体,智能媒体处理,多媒体大数据,视频编码,社交媒体等,在本领域重要刊物和会议上发表论文120余篇,获得4项国际期刊、会议最佳论文奖.李波(1966-),男,博士,教授,博士生导师,数字媒体北京市重点实验室主任,中国计算机学会多媒体技术专业委员会主任,作为负责人已完成武器装备型号、863计划、973计划、国家重点研发计划、国家自然科学基金等课题40余项,在本领域重要期刊和国际学术会议发表学术论文100余篇.。
测绘技术中的遥感图像分类方法
测绘技术中的遥感图像分类方法随着科技的进步和人们对地理信息需求的增加,测绘技术在国民经济和社会发展中扮演着重要的角色。
而遥感图像分类作为测绘技术中的一个重要环节,对于地理信息的提取和分析具有至关重要的意义。
本文将探讨测绘技术中常用的遥感图像分类方法,以及它们的优缺点和应用领域。
一、监督分类方法监督分类是一种常见的遥感图像分类方法,它通过已标注的样本数据来训练分类模型,并将模型应用到整个图像中去。
常用的监督分类方法包括支持向量机(SVM)、最大似然分类器和随机森林等。
这些方法依赖于统计学原理和机器学习算法,能够通过学习样本的特征和类别之间的关系来进行分类。
支持向量机是一种经典的监督分类方法,它通过构建一个最大间隔的超平面来实现对图像的分类。
最大似然分类器则是基于概率模型的分类方法,它假设样本数据服从某种概率分布,并通过最大化类别条件概率来进行分类。
而随机森林是一种集成学习方法,它通过构建多个决策树来进行分类,并将它们的结果集成起来以提高分类准确度。
监督分类方法的优点在于能够充分利用样本数据进行分类,分类结果相对较准确。
然而,监督分类方法也存在一些局限性,如对样本数据的要求较高、对特征选择较为敏感等。
二、非监督分类方法与监督分类方法不同,非监督分类方法不需要预先标注样本数据,而是通过无监督学习的方式对图像进行分类。
典型的非监督分类方法包括聚类分析和自组织神经网络等。
聚类分析是一种常见的非监督分类方法,它将样本数据划分为多个互不重叠的群组,使得同一群组内的样本尽可能相似,不同群组之间的样本尽可能不同。
聚类分析可以帮助我们发现数据中的潜在结构和模式,对于无法预先确定类别的遥感图像分类具有一定的优势。
自组织神经网络是一种类似于人脑的算法,它通过对图像进行自我组织和学习来进行分类。
自组织神经网络能够自动提取图像的特征和结构信息,并根据这些信息进行分类。
这种方法在处理大规模遥感图像时具有一定的优势,但对计算资源的需求也相对较高。
遥感图像分类方法与分类精度评估技巧
遥感图像分类方法与分类精度评估技巧遥感图像分类是遥感技术的重要应用之一,通过对遥感图像中不同地物进行分类,可以有效提取地物信息,为各类地理研究和应用提供了重要数据支持。
而遥感图像分类方法和分类精度评估技巧则是遥感图像分类工作中的关键环节。
一、遥感图像分类方法遥感图像分类方法主要分为监督分类和非监督分类两种。
监督分类是根据人工定义的训练样本来进行分类,通过计算遥感图像像元的特征值与训练样本的特征值之间的距离或相似度来确定像元的地物类别。
监督分类方法具有分类精度高的优势,但需要大量准确的训练样本,并且需要人工干预进行样本分类。
非监督分类是根据图像像元自身的特征值进行分类,算法会自动对图像中的像元进行聚类,根据像元的特征相似性来确定地物类别。
非监督分类方法可以大幅降低人工干预量,但分类精度相对较低,对遥感图像的解译要求较高。
同时,还有基于物理模型的分类方法,该方法通过对地物的物理性质进行建模,从而实现对遥感图像地物的分类。
基于物理模型的分类方法可以较好地解决遥感图像的反射率与地物属性之间的关系,但对数据质量和物理模型的准确性要求较高。
二、分类精度评估技巧对于遥感图像分类的结果,需要进行分类精度评估来判断分类结果的准确性。
常用的分类精度评估技巧主要包括混淆矩阵、Kappa系数和面积误差指标等。
混淆矩阵是一种常用的分类精度评估方法,通过对分类结果与实际样本之间的差异进行矩阵统计,来获得分类的准确性。
混淆矩阵包括真阳性(TP)、假阴性(FN)、假阳性(FP)和真阴性(TN)四个参数,通过计算这些参数的比例可以得到分类的准确性。
Kappa系数是一种综合评估分类精度的方法,根据分类结果与实际样本的一致性程度来判断分类的准确性。
Kappa系数的取值范围为[-1,1],取值越接近1表示分类结果越准确。
面积误差指标是一种用来评估分类结果准确性的指标,通过计算分类结果与实际样本之间的面积差异来评估分类的准确性。
面积误差指标越小表示分类结果越准确。
遥感图像分类与目标识别
遥感图像分类与目标识别随着近年来遥感技术的飞速发展,遥感图像分类与目标识别逐渐成为了遥感应用领域中的重要研究方向。
在计算机视觉和模式识别的支持下,遥感图像分类和目标识别的精度和效率不断提高,为环境监测、城市规划等方面提供了有力的支持。
一、遥感图像分类遥感图像分类是将遥感图像中的像素点划分为不同的地物类型的过程。
它是遥感图像分析的基础和核心内容之一。
遥感图像分类通常分为有监督分类和无监督分类两种方法。
有监督分类是利用对样本地物类型已知的遥感图像进行训练,建立分类模型,对另一张遥感图像进行分类的方法。
在建立分类模型时,我们需要选取一定数量的代表性样本,对这些样本进行特征提取和分类标签的标注。
常用的有监督分类方法包括最小距离分类法、最大似然分类法、支持向量机分类法等。
无监督分类则是不依赖于已有的分类标签信息,而是只基于遥感图像自身的统计特征,将像素点划分为不同的类别的方法。
无监督分类通常采用聚类法完成,常用的聚类方法有K-Means聚类法、ISODATA聚类法等。
二、目标识别目标识别是指对遥感图像中的特定地物进行检测定位并识别的过程。
目标识别是遥感图像分析中的高级应用,具有重要的现实意义。
常见的遥感图像目标识别任务包括道路提取、建筑物提取、水体提取等。
道路提取是目前遥感图像目标识别应用中的重要研究方向。
由于道路网在城市规划和交通管理中的重要性,对道路提取算法的精度和效率有较高的要求。
现有的道路提取算法包括基于图形学的方法、基于分割的方法、基于深度学习的方法等。
建筑物提取是遥感图像目标识别的另一个热点研究方向。
随着城市化进程的不断加快,建筑物信息的获取和更新成为了城市管理和规划的重要内容。
建筑物提取算法主要包括基于图形学的方法、基于分割的方法、基于纹理特征的方法、基于光谱信息的方法等。
水体提取是指对遥感图像中的水源、河流、湖泊等水体类型进行提取的过程。
它在自然资源管理和环境监测中具有重要的应用价值。
常用的水体提取算法包括基于周边像元的分水岭算法、基于对象的多尺度分割算法、基于最大似然法的分类算法等。
遥感图像处理中的多目标跟踪算法研究
遥感图像处理中的多目标跟踪算法研究遥感技术可以帮助人类更好地了解地球与自然界,比如进行林火探测、洪水监测、气象预报等。
在遥感图像处理过程中,多目标跟踪算法是十分关键的一步。
该算法可以帮助我们在遥感图像中准确地追踪多个目标的运动轨迹,并对目标进行实时跟踪和分析。
在多目标跟踪算法研究中,首先需要完成的任务是目标检测。
目标检测可以得到遥感图像中的所有目标位置,然后根据其运动轨迹进行跟踪。
常用的目标检测算法有卷积神经网络(CNN)、支持向量机(SVM)和传统的图像处理算法。
在实际应用中,由于遥感图像存在很大的噪声和复杂的背景,传统的图像处理算法可能会存在误检等问题。
因此,目前较为常用的是基于深度学习的目标检测算法,例如YOLO、RCNN、SSD 等。
在完成目标检测后,多目标跟踪算法需要对目标的运动轨迹进行处理和分析。
多目标跟踪算法最主要的挑战在于目标的数量和速度问题。
传统的目标跟踪算法在较高的目标密度下存在很大的问题,而深度学习算法在速度上会存在一定的瓶颈。
因此,当前多目标跟踪算法主要采用两种策略:单目标跟踪和多目标跟踪。
单目标跟踪算法将每个物体视为一个单独的目标进行跟踪,跟踪某些物体时可能会存在跟踪误差。
多目标跟踪算法则通过对物体进行聚类,将概率最高的物体集中在一起进行跟踪,大大提高了跟踪的准确性和可靠性。
除此之外,对跟踪算法的优化也是研究的重点之一。
除了改进算法本身外,也可以通过调整遥感图像的参数等方式来提高跟踪的效果。
例如,可以根据光照、质量、角度、镜头状态等因素调整遥感图像的参数来增加跟踪的准确性和可靠性。
总的来说,多目标跟踪算法是遥感图像处理中非常重要的一部分。
目前,该领域仍然存在许多挑战和问题需要解决,但是随着深度学习和计算能力的不断发展,我们相信多目标跟踪算法的研究会在未来不断迈上新的台阶。
光学遥感图像多目标检测及识别算法设计与实现
光学遥感图像多目标检测及识别算法设计与实现摘要:针对目前光学遥感图像处理与分析多集中在单目标检测及识别领域的局限性,多目标检测及识别成为了一个非常值得关注的研究课题,提出了一种光学遥感图像多目标检测及识别算法。
首先,采用自适应阈值算法对目标快速检测分割;然后,结合图像金字塔思想和基于尺度不变特征变换的特征包(BoFSIFT)特征提出了一种分层的BoFSIFT特征表示目标的全局特征和局部特征,详细地描述了目标的分布特性;最后,采用基于径向基核函数的支持向量机为弱分类器的AdaBoost算法,经过不断更新权重之后得到一个强分类器对待测试目标图像完成分类识别,识别率达到了93.52%。
实验结果表明,所提算法对多类遥感图像目标的分割效果显著,特征选取恰当,识别方法快速有效。
关键词:光学遥感图像;自适应阈值;基于尺度不变特征变换的特征包特征;AdaBoost算法;多类目标引言光学遥感图像通常是指可见光和部分红外波段传感器获取的影像数据,其直观易理解,空间分辨率通常比较高,在有光照和晴朗的天气条件下,图像内容丰富,目标结构特征明显,便于目标分类识别。
随着遥感技术和模式识别技术的发展,对光学遥感图像多目标分类和识别的研究已引起了广泛关注,它的发展对对地观测、军事侦察等领域有广泛的意义[1]。
基于光学遥感图像的多目标检测与识别研究主要涉及目标分割检测、特征提取和目标识别3个阶段。
目标的检测分割阶段是提取遥感图像信息的重要准备环节,在目标点检测的基础上,依据特征把图像划分成多个区域[2]。
文献[3]对纯海洋背景和海陆背景两种情况下的舰船目标分别用区域生长法和先验法完成目标分割;文献[4]对传统的圆形检测Hough变换方法作了改进,首先是计算目标梯度场检测油库圆心坐标,然后通过计算梯度值加权估计半径值以便对目标准确定位;文献[5]首先用小波分析建筑物目标,然后结合马尔可夫随机场(Markov Random Field,MRF)完成检测分割。
遥感图像的分类与特征提取方法
遥感图像的分类与特征提取方法引言:遥感图像在现代科学技术和地理信息系统领域中扮演着至关重要的角色。
遥感图像的分类和特征提取是遥感数据处理的关键步骤,对于地表覆盖类型识别、环境监测、农业资源管理等方面起到至关重要的作用。
本文将探讨遥感图像分类与特征提取的方法和技术,为读者提供一个全面的了解。
一、遥感图像分类方法遥感图像分类是将图像中的像素按照其地物类别进行分类的过程。
常用的遥感图像分类方法有:基于像素的分类方法、基于对象的分类方法和混合分类方法。
1. 基于像素的分类方法基于像素的分类方法是将图像分类问题看作是一个像素级别的问题。
该方法使用像素的数值信息或者统计特征作为分类依据,计算像素的数值与预定义类别之间的相似度。
常用的基于像素的分类方法有最大似然分类、支持向量机、神经网络等。
这些方法主要基于图像中像素的灰度级或者颜色值进行分类,但对于相似的地物类别,效果较差。
2. 基于对象的分类方法基于对象的分类方法认为相邻像素之间具有一定的空间关联性,将图像中的像素组织成不同大小的对象,然后根据对象的形状、纹理、空间关系等特征进行分类。
该方法能够有效地解决图像中相似类别的分类问题,常用的基于对象的分类方法有基于区域的分类、基于决策树的分类等。
3. 混合分类方法混合分类方法是将基于像素和基于对象的分类方法相结合,以充分利用它们各自的优势。
该方法首先基于像素进行初步分类,然后在对象的层次上进行进一步分类,最终得到更准确的分类结果。
混合分类方法能够有效地提高分类的准确性和可靠性。
二、遥感图像特征提取方法遥感图像特征提取是指从遥感图像中提取出能够区分不同地物类别的特征。
常用的遥感图像特征提取方法有:基于统计的特征提取、形状特征提取和纹理特征提取。
1. 基于统计的特征提取基于统计的特征提取方法使用图像的统计量来描述不同地物的特征。
常用的统计特征包括均值、方差、协方差、像素灰度直方图等。
通过提取这些统计特征,并对它们进行适当的组合和处理,可以有效地提取出能够反映地物类别特征的特征向量。
遥感图像分类方法及其在测绘中的应用
遥感图像分类方法及其在测绘中的应用遥感图像是通过遥感技术获取的地球表面的图像信息。
遥感图像具有广泛的应用领域,其中之一就是测绘领域。
遥感图像分类方法是将遥感图像中的像素点按照一定的规则进行分类和标记,以获取图像中不同区域的信息,从而实现对地物和地貌的解译和分析。
本文将介绍常用的遥感图像分类方法,并探讨其在测绘中的应用。
一、遥感图像分类方法1. 基于像元的分类方法基于像元的分类方法是将遥感图像中的每个像素点单独进行分类。
常用的方法包括最大似然分类、支持向量机等。
最大似然分类是根据每个像素点的灰度值和概率分布进行分类,将每个像素点归入具有最大可能性的类别。
支持向量机是一种基于统计学习理论的分类方法,通过构建一个划分超平面将不同类别的像素点分开。
2. 基于对象的分类方法基于对象的分类方法将相邻像素点组成的图像区域作为一个整体进行分类。
常用的方法包括分割-分类法、基于决策树的分类方法等。
分割-分类法首先将遥感图像进行分割,得到不同的图像区域,然后对每个图像区域进行分类。
基于决策树的分类方法通过构建一棵决策树,根据遥感图像特征进行划分,逐层分类。
3. 基于深度学习的分类方法基于深度学习的分类方法是近年来新兴的分类方法,它利用神经网络模型对遥感图像进行分类。
常用的方法包括卷积神经网络(CNN)、循环神经网络(RNN)等。
卷积神经网络通过多层卷积和池化操作提取图像的特征,然后通过全连接层进行分类。
循环神经网络则适用于序列数据的分类,可以处理带有时序关系的遥感图像数据。
二、遥感图像分类在测绘中的应用1. 地物提取与更新遥感图像分类可以用于地物提取与更新。
通过对遥感图像进行分类,可以有效地将地物区分出来,如建筑物、道路、水体等。
同时,可以利用多期遥感图像进行地物的更新,观察地物的变化情况,为城市规划、土地利用等提供依据。
2. 地貌分析与监测遥感图像分类也可以应用于地貌分析与监测。
通过对地表的分类,可以得到不同区域的地貌类型,如山地、平原、河流等。
一种基于样本重加权的遥感图像多类目标检测方法[发明专利]
专利名称:一种基于样本重加权的遥感图像多类目标检测方法专利类型:发明专利
发明人:程塨,司永洁,姚西文,韩军伟,郭雷
申请号:CN202011342048.2
申请日:20201125
公开号:CN112418108A
公开日:
20210226
专利内容由知识产权出版社提供
摘要:本发明提供了一种基于样本重加权的遥感图像多类目标检测方法。
首先,进行图像数据增广处理和尺度缩放预处理;然后,构建目标检测网络,包括特征提取模块、特征增强模块和检测头部模块,为了实现特征的显著性表达,针对部分特征层级进行特征增强操作;接着,进行网络端到端的训练过程,采用样本重加权策略来引导训练网络更多关注纵横比差异大的目标样本,以此来优化训练模型;最后,实现目标检测过程,将待检测遥感图像输入到训练好的目标检测网络中,得到每个先验框的类别预测值和其坐标偏移量,再使用非极大值抑制来过滤掉针对同一目标的重叠率较高的检测结果。
本发明具有较高的遥感图像目标检测精度和速度。
申请人:西北工业大学深圳研究院,西北工业大学
地址:518057 广东省深圳市南山区高新南九道45号
国籍:CN
代理机构:西北工业大学专利中心
代理人:常威威
更多信息请下载全文后查看。
一种基于Hash编码的超光谱遥感图像分类方法[发明专利]
专利名称:一种基于Hash编码的超光谱遥感图像分类方法专利类型:发明专利
发明人:徐军,张倩,刘利卉,周超,鲁浩达,孙明建
申请号:CN201610403385.5
申请日:20160608
公开号:CN106096648A
公开日:
20161109
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于Hash编码的超光谱遥感图像分类方法,属于图像信息处理技术领域,提出了用块Hash自动编码的思想来处理超光谱遥感图像,本发明提出了用Hash自动编码的思想来处理超光谱遥感图像,将遥感图像每个通道提取出来,分成块,将每个小块先进行分段Hash处理,生成Hash序列用来表征块的特征,然后将生成的编码进行SVM分类。
和基于传统像素的分类方法相比,在相同的实验条件下,本发明方法的图像分类结果更加准确,视觉效果更好。
申请人:南京信息工程大学
地址:210000 江苏省南京市建邺区奥体大街69号
国籍:CN
代理机构:南京经纬专利商标代理有限公司
代理人:许方
更多信息请下载全文后查看。
基于多特征的遥感影像分类方法
一、多特征提取
纹理特征是遥感影像中另一种重要的特征,它可以反映地物的表面结构和纹 理。通过分析纹理特征,可以区分出不同类型的土地覆盖类型,如森林、草地、 沙漠等。
一、多特征提取
形状特征是遥感影像中另一种重要的特征,它可以反映地物的形状和结构。 通过分析形状特征,可以区分出不同类型的建筑物、道路等。
结论与展望
同时,如何将遥感影像分类方法与其他技术相结合,如地理信息系统(GIS)、 专家系统等,也将是未来研究的重要方向。
谢谢观看
内容摘要
本次演示采用的遥感影像分类方法基于决策树分类技术。首先,对遥感影像 进行预处理,包括噪声去除、光谱归一化等操作。然后,利用决策树分类器对预 处理后的影像进行训练和分类。在训练过程中,采用交叉验证技术优化模型的参 数,提高模型的泛化能力。在分类过程中,结合传统图像分类方法中的空间信息、 上下文信息等优点,实现对遥感影像的准确分类。
三、分类结果优化
聚类是将相似的像素聚成一个簇,从而减少错分和混淆。常用的聚类算法包 括K-means聚类、层次聚类、光谱聚类等。通过聚类可以将相似的像素聚成一个 簇,从而减少错分和混淆。
三、分类结果优化
滤波是将像素进行局部平滑处理,以减少噪声和不确定性。常用的滤波算法 包括均值滤波、中值滤波、高斯滤波等。通过滤波可以将噪声和不确定性去除, 提高分类的精度和可靠性。
内容摘要
基于决策树的遥感影像分类方法主要包括以下步骤: 1、数据预处理:包括辐射定标、大气校正等步骤,以消除遥感影像的噪声和 畸变,获取高质量的原始数据。
内容摘要
2、特征提取:从遥感影像中提取与地物类型相关的特征,如颜色、纹理、形 状等。
3、构建决策树:利用提取的特征训练决策树模型,建立决策规则,并根据这 些规则对遥感影像进行分类。
遥感影像处理中的分类与目标提取方法
遥感影像处理中的分类与目标提取方法遥感影像处理在近年来得到了广泛的应用,其中分类与目标提取是遥感影像处理的重要环节。
遥感影像分类是将遥感影像像素划分为不同的类别,而目标提取则是从遥感影像中识别和提取出特定的目标。
本文将探讨遥感影像处理中的分类与目标提取方法,并介绍其中一些常用的技术。
一、分类方法1. 基于像元的分类方法基于像元的分类方法是将遥感影像中的每个像元单独划分为相应的类别。
常用的基于像元的分类方法有最大似然分类、支持向量机分类和人工神经网络等。
最大似然分类是一种统计学方法,它基于每个像元在不同类别下的概率分布进行分类。
支持向量机分类则是一种机器学习算法,它通过将像元在高维空间中进行分类来实现分类目标。
人工神经网络则模仿生物神经网络的结构和工作原理,通过训练网络模型实现遥感影像分类。
2. 基于对象的分类方法基于对象的分类方法是将遥感影像中的像元组织为具有特定属性的对象,然后对这些对象进行分类。
常用的基于对象的分类方法有基于分割的目标提取和基于特征的目标提取。
基于分割的目标提取是先对遥感影像进行分割,将像元组织为具有相似特征的对象,然后通过对这些对象进行分类来实现目标提取。
基于特征的目标提取则是通过提取目标的特征,如形状、纹理和颜色等,然后通过对这些特征进行分类来实现目标提取。
二、目标提取方法1. 监督学习方法监督学习方法是以已有的标记数据作为训练样本,通过对样本进行训练得到分类器,然后用分类器来对新的遥感影像进行目标提取。
常用的监督学习方法有支持向量机、随机森林和神经网络等。
支持向量机算法在目标提取中广泛应用,它能够对非线性、高维的数据进行分类,并具有较好的泛化能力。
随机森林是一种基于决策树的集成学习算法,通过对多个决策树的预测进行集成来实现目标提取。
神经网络则是一种模拟人脑神经网络的计算模型,通过对网络模型进行训练来实现目标提取。
2. 非监督学习方法非监督学习方法是不依赖于标记数据的方法,它通过对遥感影像数据的聚类来实现目标提取。
遥感影像处理中的分类与目标提取方法
遥感影像处理中的分类与目标提取方法遥感影像处理是利用遥感技术获取的遥感影像数据进行分析、处理和应用的过程。
在遥感影像处理中,分类和目标提取是非常重要的步骤。
分类是将遥感影像中的像素或区域划分到不同的类别中,而目标提取则是从遥感影像中提取出感兴趣的目标对象。
一、分类方法1.1 基于像素的分类方法基于像素的分类方法是将遥感影像中的每一个像素点都进行分类,常见的分类方法包括最大似然分类、支持向量机和随机森林等。
这些方法通过对每个像素的特征进行分析,将其划分到最适合的类别中。
1.2 基于目标的分类方法与基于像素的分类方法不同,基于目标的分类方法将遥感影像中的目标对象作为分类的基本单元。
例如,在城市遥感影像中,目标可以是建筑物、道路或植被等。
这种方法首先对目标进行提取,然后通过对提取的目标进行特征分析和分类。
二、目标提取方法2.1 基于形状特征的目标提取方法基于形状特征的目标提取方法主要是通过对目标的形状进行分析和比较来提取目标。
例如,可以使用边缘检测算法来提取目标的轮廓,然后通过对轮廓的形状进行分析和比较。
这种方法适用于目标具有明显边界和规则形状的情况,如建筑物和道路等。
2.2 基于纹理特征的目标提取方法基于纹理特征的目标提取方法通过对目标的表面纹理进行分析和比较来提取目标。
例如,可以使用纹理特征提取算法来提取目标的纹理特征,然后通过对纹理特征的分析和比较来判断目标。
这种方法适用于目标具有特殊的纹理特征的情况,如森林和农田等。
2.3 基于深度学习的目标提取方法近年来,随着深度学习的发展,基于深度学习的目标提取方法在遥感影像处理中得到了广泛的应用。
深度学习通过构建深度神经网络模型,可以从遥感影像中学习到更高级别的特征表示,从而实现更准确的目标提取。
例如,可以使用卷积神经网络来提取目标的特征,然后通过对特征进行分类或分割来提取目标。
三、遥感影像处理中的挑战在分类和目标提取的过程中,遥感影像处理面临着一些挑战。
测绘技术中的遥感图像分类方法和技巧
测绘技术中的遥感图像分类方法和技巧遥感图像分类是测绘技术中的重要任务之一,它通过对遥感图像数据进行处理和分析,将图像中的像素点按照其所属的类别进行分类。
准确地分类遥感图像可以为农业、城市规划、环境保护等领域提供重要的数据支持。
本文将介绍遥感图像分类的一些常用方法和技巧。
首先,遥感图像分类的最基本方法是基于像元的分类。
该方法将遥感图像中的每个像元视为一个独立的单元,通过对其进行分析,判断其所属的类别。
这种方法简单直观,适用于对图像中各个像元的特征进行独立分析的情况。
常见的基于像元的分类方法包括最大似然分类法、ISODATA聚类法等。
最大似然分类法基于像元的统计特征,通过计算像元在各个类别下出现的概率,选择概率最大的类别作为其所属类别。
ISODATA聚类法则通过对像元进行聚类,将相似的像元归为一类。
这些方法都需要对图像进行预处理,如去噪、增强等,以提高分类的准确性。
除了基于像元的分类方法,还有一些基于对象的分类方法。
基于对象的分类方法将像元组成的集合看作是一个对象,通过对对象进行分析和比较,确定其所属类别。
这种方法适用于对图像中存在空间关联的信息进行分析的情况。
常见的基于对象的分类方法包括目标导向分类法、基于规则的分类法等。
目标导向分类法通过预先定义的目标特征和规则,将具有相似特征的像元组成的对象归为一类。
基于规则的分类法通过制定一系列规则,对不同的对象进行分类。
这些方法需要对图像进行分割和特征提取等预处理,以便对对象进行分析。
在进行遥感图像分类时,还需要注意一些技巧和注意事项。
首先,合理选择特征是分类的关键,特征应能充分表征不同类别之间的差异。
常用的特征包括光谱特征、纹理特征、形状特征等。
其次,合理选择分类算法也是至关重要的。
不同的分类算法适用于不同的场景和数据特点,需要根据具体情况选择合适的算法。
此外,样本的选取也是影响分类准确性的重要因素。
样本应能代表不同类别的特征,且样本之间应有足够的差异性。
遥感图像分类算法的研究与应用
遥感图像分类算法的研究与应用一、引言遥感技术在二十世纪后期得到了快速发展,伴随着遥感技术的广泛应用,遥感图像分类算法的研究也日趋重要。
遥感图像分类是将遥感图像中的像素按照其表示的物理意义分配到不同的类别中,常用于土地利用调查、自然灾害监测等领域。
本文将对遥感图像分类算法进行探讨,包括分类方法、特征提取、分类器设计等方面的内容,并结合实际应用介绍遥感图像分类的研究与应用。
二、遥感图像分类的分类方法遥感图像分类的分类方法主要可分为基于统计学方法和基于机器学习方法两种。
1. 基于统计学方法基于统计学方法的遥感图像分类是通过对图像进行统计分析,分析各种类别在不同波段上的反射率、亮度、形状等信息,根据统计结果将像素分类到不同的类别。
常用的统计学方法包括最小距离分类法、最大似然分类法、贝叶斯分类法等。
其中,最小距离分类法简单易懂,但只能应用于二分类问题;最大似然分类法假设不同类别的像素分布满足高斯分布,对噪声敏感,可用于多分类问题;贝叶斯分类法充分考虑样本的先验概率和后验概率,对分类效果影响较小,但计算复杂。
2. 基于机器学习方法基于机器学习方法的遥感图像分类是利用机器学习算法从大量的样本数据中学习判别规则,根据规则将像素分类到不同的类别。
常用的机器学习算法包括支持向量机、人工神经网络、决策树等。
其中,支持向量机可以很好地处理高维数据,对于分类边界不明显的图像有较好的效果;人工神经网络模拟了人脑神经元的工作方式,可以学习到非线性关系,对分类效果比较好;决策树是一种简单易懂的分类方法,对特征值的选择比较敏感。
三、遥感图像分类的特征提取特征提取是将原始图像数据转化为有意义的特征向量的过程,同时保留了影响像元分类的重要信息。
遥感图像的特征提取方法主要可分为基于像元的特征提取和基于对象的特征提取两种。
1. 基于像元的特征提取基于像元的特征提取是利用像素的灰度值或光谱信息提取特征,并将其作为分类的依据。
像元的灰度值和光谱信息是基本的特征,还可以通过不同波段的比值、差值、指数等方式提取其他特征。
基于部分随机监督离散式哈希的遥感图像分类方法[发明专利]
专利名称:基于部分随机监督离散式哈希的遥感图像分类方法专利类型:发明专利
发明人:康婷,刘亚洲,孙权森
申请号:CN201810321172.7
申请日:20180411
公开号:CN108805157B
公开日:
20220218
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于部分随机监督离散式哈希的遥感图像目标分类方法。
根据标定好的真实数据,对遥感图像进行目标分割,对分割好的目标进行特征提取,每个目标均用特征向量进行表示,所有目标的特征向量组合成特征矩阵;对每一类样本按照相同比例划分为训练样本和测试样本;对所有样本进行离散哈希编码;对所有样本进行部分随机哈希编码;将离散哈希编码与部分随机编码相结合,迭代优化参数,最终获得更精准的哈希编码;根据所生成的哈希编码,计算汉明距离,完成分类。
该方法解决了在处理遥感图像过程中,数据量过大导致的计算复杂度高的问题,实现了对遥感图像进行快速有效的分类。
申请人:南京理工大学
地址:210094 江苏省南京市孝陵卫200号
国籍:CN
代理机构:南京理工大学专利中心
代理人:王玮
更多信息请下载全文后查看。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
软件学报ISSN 1000-9825, CODEN RUXUEW E-mail: jos@ Journal of Software,2019,30(4):914−926 [doi: 10.13328/ki.jos.005661] ©中国科学院软件研究所版权所有. Tel: +86-10-62562563基于仿射不变离散哈希的遥感图像多目标分类∗孔颉, 孙权森, 徐晖, 刘亚洲, 纪则轩(南京理工大学计算机科学与工程学院,江苏南京 210094)通讯作者: 孙权森, E-mail:sunquansen@摘要: 遥感图像的多目标分类是一个具有挑战性的课题.首先,由于数据的复杂性以及算法对存储的高需求,传统分类方法很难兼顾到分类的精度和速度;其次,遥感成像过程中产生的仿射变换,使得目标的快速解译难以实现.为此,提出一种基于仿射不变离散哈希(AIDH)的遥感图像多目标分类方法.该方法采用具有低存储、高效率优势的监督离散哈希框架,结合仿射不变优化因子,构造仿射不变离散哈希,通过将具有相同语义信息的仿射变换样本约束到相似的二值码空间实现分类精度的提高.实验结果表明,在NWPU VHR-10和RSDO-dataset两个数据集下,相比于经典的哈希方法和分类方法,所提方法在具备了高效性的同时,其精度也得到了保证.关键词: 遥感;监督哈希;仿射不变性;多目标分类;平均分类精度中图法分类号: TP391中文引用格式: 孔颉,孙权森,徐晖,刘亚洲,纪则轩.基于仿射不变离散哈希的遥感图像多目标分类.软件学报,2019,30(4): 914−926. /1000-9825/5661.htm英文引用格式: Kong J, Sun QS, Xu H, Liu YZ, Ji ZX. Multi-object classification of remote sensing image based on affine- invariant supervised discrete hashing. Ruan Jian Xue Bao/Journal of Software, 2019,30(4):914−926 (in Chinese). http://www.jos. /1000-9825/5661.htmMulti-object Classification of Remote Sensing Image Based on Affine-invariant Supervised Discrete HashingKONG Jie, SUN Quan-Sen, XU Hui, LIU Ya-Zhou, JI Ze-Xuan(School of Computer Science and Engineering, Nanjing University of Science and Technology, Nanjing 210094, China)Abstract: The multi-object classification of remote sensing images has been a challenging task. Firstly, due to the complexity of the data and the high requirement of storage, the traditional classification methods are difficult to achieve both the accuracy and speed of the classification. Secondly, the affine transformation caused by the remote sensing imaging process, the real-time performance of the object interpretation is difficult to be realized. To solve the problem, a multi-object classification of remote sensing image is proposed based on affine-invariant discrete hashing (AIDH). This method uses supervised discrete hashing with the advantage of low storage and high efficiency, jointed with affine-invariant factor, to construct affine-invariant discrete hashing. By constraining the affine transform samples with the same semantic information to the similar binary code space, the method achieves the enhancement on classification precision. Experiments show that under the two datasets of NWPU VHR-10 and RSDO-dataset, the method presented in this paper is more efficient than classical hash method and classification method, and it is also guaranteed in accuracy.Key words: remote sensing; supervised hashing; affine-invariant; multi-object classification; mean average precision (MAP)1 引言随着不同用途卫星的发射以及遥感技术的飞速发展,遥感图像的分辨率越来越高,涵盖的光谱谱段越来越∗基金项目: 国家自然科学基金(61673220)Foundation item: National Natural Science Foundation of China (61673220)本文由“多媒体数据的知识关联与理解专题”特约编辑蒋树强研究员、刘青山教授、孙立峰教授、李波教授推荐.收稿时间:2018-04-13; 修改时间: 2018-06-13; 采用时间: 2018-09-30孔颉等:基于仿射不变离散哈希的遥感图像多目标分类915广,有效完成多目标分类工作从而正确解译卫星数据成为了一个具有挑战性的课题[1−6].目前应用于自然图像分类的经典方法有K近邻分类法(K-NN)、随机森林法(RF)、支持向量机(SVM)、稀疏表示分类器(SRC)[7−10]等.K-NN法以测试样本邻域信息为参照确定其所属类别,能够较快地完成分类工作,然而分类精度受数据集的影响较大.RF法通过训练集重构来放大分类模型间的差异,从而提高组合分类模型的外推预测能力,实现分类精度的提升,具有较强的分类鲁棒性,缺陷是算法训练时间过长.SVM以其在小样本学习上的优势,降低了学习机对样本信息的依赖性,然而,当样本数增多以及为解决多目标分类而创建多个二类SVM分类器时,过高的机器内存要求和不断增加的运算时间,都影响了SVM方法的效率.SRC方法以稀疏表示思想为基础,通过寻找测试样本在不同类别训练样本上的最优稀疏表示系数确定其类别号,具有很高的分类精度,然而生成过完备词典对电脑存储的高要求以及过长的运算时间是其主要的缺陷[11].而应用于遥感图像的分类方法,除了以上几种分类方法外[12−15],早期的工作是围绕目标物光谱分析为基础的,生成具有代表性的目标特征曲线或归一化指数进行分类判别.归一化指数的方法,是指特殊波段间运算所产生的能够代表目标明显特征的指数,如归一化植被指数(NDVI)、归一化水体指数(NDWI)、归一化雪盖指数(NDSI)分别用于提取植物、水体、雪覆盖信息[16].特征曲线分析方法,是以同类物质样本在光谱空间的概率相似性为基础的,主要方法有最大似然法、最小距离法等[17].这些早期遥感图像的分类方法具有很强的先验知识的支撑,具有很高的分类精度,然而适用范围却局限于多源数据、多光谱信息.近年来,基于人工神经网络的遥感图像分类方法通过模拟人类神经系统的结构与功能,将样本信息以神经元形式传递、加权分析和反馈的方式实现遥感图像的多目标分类.人工神经网络,主要包括前向网络、反馈网络和自组织网络,其结构设计很复杂,具有很强的特征捕捉能力,在多目标分类工作中取得了不错的效果,然而过长的学习时间以及网络结构难以收敛等因素都制约了其应用价值[18,19].结合这些经典分类方法的利弊,我们希望找到一种新的方法,既不过分依赖数据集的构成,又能降低算法的存储需求,并能保证较高的精度和速度.哈希方法以其低存储、高效率等优势在图像检索领域率先得到了广泛应用,近年来逐渐推广到图像分类、识别等问题中[20].哈希方法的主要思想是,在不改变原数据语义相似性的基础上,通过将高维特征空间映射到低维的汉明空间,以低字节二值哈希码代替原有的高维实数特征以表征原有数据信息.早期哈希方法如局部敏感哈希(LSH)是数据无关的哈希技术,对投影向量及二值码初始化采取特定分布中随机采样的策略,虽然在模拟数据中有足够的理论支撑,但在实际场景下性能得不到保证[21].近10年的哈希方法研究重心逐渐转化到利用数据自身以及一些监督信息设计高效的哈希函数上,其主要的分支划分为无监督哈希和监督哈希.无监督哈希方法主要有谱哈希(SH)[22]、可扩展图哈希(SGH)[23]、流形哈希(IMH)[24]等,通过挖掘数据集的分布信息,以谱聚类方法、流形结构等模型求解.而通过将语义信息等先验知识嵌入到哈希函数学习中,监督哈希方法近年来发展迅速,其主要代表方法有核监督哈希(KSH)[25]、最小损失哈希(MLH)[26]、监督离散哈希(SDH)[27]、列采样监督离散哈希(COSDISH)[28]、旋转不变离散哈希(RIDISH)[29].以标签化类别信息加入到样本训练和测试中,通过引入核学习、度量学习等方法用于生成二值码,监督哈希方法在多目标分类应用中更为适用[30].KSH[25](CVPR 2012)通过将核映射思想引入到哈希技术中,以内积代替汉明距离运算,在保证样本相似性的基础上提高了分类精度.SDH[27](CVPR 2015)采用适当的嵌入学习算法,将哈希码直接映射到标签信息上,并采用离散循环坐标梯度下降方法(DCC)在离散约束下按位求解,简化了运算过程,大大提高了算法效率.COSDISH[28](AAAI 2016)以迭代采样语义相似矩阵的多列完成所有数据的训练学习,代替了传统的松弛化约束求解的方式,提高了分类方法的速度和稳定性.目前为止,哈希方法在自然图像分类问题上已取得了很大的成功,然而要引入到遥感领域还需要结合遥感卫星成像前后的具体星情.遥感图像的目标识别,除了受样本有限、纹理丰富等遥感图像数据因素的影响外,还会因在轨相机的姿态、传感器拍摄时不同方位角和俯仰角而发生变化.随着遥感目标数量的不断增大,不断增加的几何校正预处理过程已经不能满足在轨实时目标检索和匹配工作的需求.对常见卫星遥感图像,其成像模型可用中心投影成像来近似,可以认为观测数据和实际数据间近似满足仿射变换关系[31].为此,在将哈希引入遥感图像多目标分类时,需要考察样本的仿射变换信息,使这些信息的哈希特征表达具有相似性并能更好地表达916 Journal of Software 软件学报 V ol.30, No.4, April 2019原样本的类别信息.针对上述问题,本文提出一种仿射不变离散哈希的框架,在SDH 目标函数中引入仿射不变因子约束,通过求解汉明空间的离散优化问题实现优质二值码的生成.而仿射不变因子约束项迫使仿射变化扩大的同型号样本集具有相同的二值码,从而保证了哈希算法的仿射不变性.本文的框架图如图1所示.Fig.1 The frame of the proposed method图1 本文算法框架图本文的主要贡献有以下两个方面.(1) 提出一种仿射不变离散哈希方法,通过在监督离散哈希二值码的生成过程中加入仿射不变项模型优化,有效地解决了因卫星成像形成的仿射变换畸变对分类精度的影响.(2) 通过在不同数据集下的实验对比,其结果表明,不论是横向对比于经典的哈希方法,还是纵向对比于经典的分类方法,本文方法均兼顾了多目标分类的精度和速度.2 仿射不变离散哈希(AIDH )2.1 监督离散哈希(SDH )假设有n 个样本,{}1=,nd n i i X x R ×=∈每一列代表一个d 维的样本.为了正确表达样本语义信息,哈希学习需要生成一组二值码{}{}n 1=1,1,nL i i B b ×=∈−其中,b i 是对应于样本x i 的字节长度为L 的二值化编码.不同于无监督哈希最小化样本间距离相似性的求解方式,监督哈希利用了训练样本的标签信息,使得真实类别(标签)与预测类别间的差异尽可能地小.监督哈希的正则化目标函数可表示为221,,1min s.t :sgn(()),1,...,n T i i B W Hi i i y W b W b H x i n λ=⎫−+⎪⎬⎪==⎭∑ (1) 其中,1{}C L Ck k W w R×==∈是哈希码在C 个分类上的投影矩阵;1{}n C n i i Y y R ×==∈是样本的标签矩阵,若y ki =1,表示 样本x i 属于类别k ,反之,若y ki =0,则表示样本x i 不属于类别k ;H (x i )为哈希函数;λ1是正则化参数.为了获得高质量的哈希码,使得学习到的二值编码能够保持原有样本空间的相似性,并减少因随机映射生成哈希函数的误差,考虑构建哈希函数H (X )将样本的连续特征映射到二值化空间上,对二值编码B 进行离散约束.于是,式(1)改写为22212,,min ()s.t :{1,1},1,...,T B W HL nY W B WB H X B i n λλ×⎫−++−⎪⎬⎪∈−=⎭(2)式(2)的第3项代表哈希函数H (X )与二值码B 之间的拟合误差,λ1为惩罚因子.哈希函数通常是采用映射学孔颉 等:基于仿射不变离散哈希的遥感图像多目标分类 917习算法获取,为保持样本的非线性结构,采用如下形式:()()T H X P X φ= (3)其中,()m n X R φ×∈为径向基核映射产生的矩阵,每一列221(),...,,[()()]T mx exp x a exp x a φσσ=−−−−而{}1mj j a =是训练样本X 中随机抽取的m 个样本点,σ则是核函数的步长.矩阵m L P R ∗∈是降维矩阵,用于将核函数空间投影 到哈希码空间.通过式(3)的非线性哈希函数构造过程,可以明显减少式(2)中原始距离和汉明距离的重构误差[27]. 2.2 仿射不变离散哈希若直接将哈希用于遥感图像的目标分类中,会受限于拍摄时的高度和角度等因素,形成不同程度的仿射变换.为此,我们希望在SDH 的基础上做出改进,生成一种具有仿射不变性的哈希编码.设图像仿射变换前后坐标分别为G (x ,y )和G ′(x ′,y ′)∈R 2,则有:0111x x A t y y ′⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥′=⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥⎣⎦⎣⎦(4) 其中,非奇异阵cos sin 0cos sin 00sin cos sin cos s s s A s s s αααααααα−−⎡⎤⎡⎤⎡⎤==≠⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦i i i i 由物体的旋转变换T α和缩放变换T β组成,而 t =[t 1,t 2]T 代表物体的平移变换.考虑到样本图像的稠密性,目标平移产生的影响几乎没有,t 项不作考虑[32].依据MSA 特征提取的方法可知,图像在仿射变换前后的对应像素点亮度函数具有相同分布,这种同分布的关系是独立于仿射变换的;那么图像的仿射变换不会改变图像所代表物体的语义信息[33].由于仿射变换前后的图像对应着相同标签模式类的信息,那么可以将仿射后扩大的样本加入到训练样本集,并加以仿射约束信息优化原有目标函数,生成更优质的哈希码[2].定义R 个旋转角度α={α1,α2,…,αR }及其旋转变换12{,,...,},R T T T T αααα=其中,i T α表示经αi 角度旋转变换;定义S 个缩放因子β={β1,β2,…,βs }及其缩放变换12{,,...,},s T T T T ββββ=其中,i T β表示βi 倍缩放变换.那么仿射变换可表达为旋转变换和缩放变换的笛卡尔积:T α,β=T α×T β.将T α,β应用于所有训练样本X ,结合原始训练集,即构成了新的用于仿射不变离散哈希模型的样本集T α,β={X ,T α,βX }.由于仿射变换前后不改变物体本身的语义信息,那么所得到的哈希码应该是相似的,生成的哈希码对数据集具有仿射不变性[5,34].类似于旋转不变HOG 特征的处理方案,添加仿射不变约束项如下:22,3,3,1(,)=ni ii Q B T B b T b B T B αβαβαβλλ=−=−∑ (5)其中,,111RSi j k i j k T b T T b R S αβαβ===×∑∑表示样本x i 所有仿射变换张成的样本子空间所生成二值码的均值. 这样,式(2)的原目标函数就可以改写为2222123,,,min ()+s.t :{1,1}1,...,,T B W HL n Y W B WB H X B T B B i n αβλλλ×⎫−++−−⎪⎬⎪∈−=⎭(6)可以看到,通过添加此约束项可以迫使每个样本生成哈希码更接近于其张成的仿射样本子空间的均值,从而实现整体样本集X α,β与其二值哈希编码B 尽可能地相似.式(6)即为仿射不变离散哈希所需优化的目标方 程[35].2.3 优化求解方案仿射不变离散哈希的未知变量分别为B 、W 、H ,可以通过交替优化的方式把式(6)的问题分解为3个子问题,分别进行求解.(1) P -step :固定B 、W ,优化P .由于P 优化的过程只与H (X )有关,因而,只需优化式(6)中的第3项.求解结果如下:918 Journal of Software 软件学报 V ol.30, No.4, April 20191(()())()T T P X X X B φφφ−= (7)(2) W -step :固定P 、B ,优化W .原方程简化为求解只有前两项的监督哈希问题,通过最小二乘法可求解:11=(+)T T W BB I BY λ− (8)(3) B -step :固定W 、P ,优化B .原问题转化为求解式(9)所示函数:22223,min ()s.t {1,1}T BL n Y W B B H X B T B B αβλλ×⎫−+−+−⎪⎬⎪∈−⎭(9)将式(9)展开,再化简,等价于求解:2min 2()s.t {1,1}T T BL n W B Tr B A B ×⎫−⎪⎬⎪∈−⎭(10)其中,23,()A WY H X T B αβλλ=++而Tr (·)表示矩阵的迹.受SDH 优化方式的启发,采用DCC 来按位求解哈希码,每一位对应B 的一行数据.令b i 为矩阵B 的第i 行,q i 为矩阵Q 的第i 行,w i 为矩阵W 的第i 行;i B 为矩阵B 去除b i 后的矩阵,i A 为矩阵Q 去除a i 后的矩阵, W为矩阵W 去除w i 后的矩阵,那么:i i 22)(T T T T TW B const w W Bb A const a b Tr B ⎫=+⎪⎬⎪=+⎭(11)式(11)中const 为常数项,不影响优化过程.将式(11)代入式(10)中约掉常数项和倍数项,可得:i i min s.t {1,1}T T T bnw W B a b b ⎫−⎪⎬⎪∈−⎭() (12) 这个问题可以获得如下的闭解:i i sgn()T b a BWw =− (13) 因而,本文方法的基本步骤可见下面的算法[35].算法. 仿射不变离散哈希(AIDH).输入:训练样本{}1,,ni i i x y =字节数L ,锚点数m ,最大迭代次数it ,参数λ1,λ2,λ3; 输出:二值码1={}{1,1}.n L n i i B b ×=∈−(1) 在训练样本集中随机选取m 个样本,并利用径向基函数求得式(3)中的φ(X ). (2) 随机方式初始化所有样本的二值码{1,1}.L i b ∈− (3) 循环下述3个步骤直至收敛. W -step :利用式(8)计算W .P -step :利用式(7)计算P ,代入式(3)中,求解H (X ).B -step :利用式(13)按位迭代学习b i ,得到哈希码1={}{1,1}.n L n i i B b ×=∈−3 实验部分3.1 数据集介绍及算法运行环境为了验证AIDH 算法的有效性,本文采用两个数据集NWPU VHR-10和RSOD-Dataset.NWPU VHR-10是西北工业大学团队标注的航天遥感目标检测数据集,而RSOD-Dataset 是武汉大学团队标注的一个遥感图像公共数据集[36].两个数据集通过提供了源图像以及各自图像中所含带目标坐标信息的标签文件(ground truth),给出了可提取的多类目标样本.这两个数据集的优势就在于源图像的存在给出了旋转样本边缘的信息,避免了样孔颉等:基于仿射不变离散哈希的遥感图像多目标分类919本自旋转产生的边缘黑带.NWPU VHR-10提供了650幅图像,生成了3 896个目标,分为10个数据类,分别为757架飞机、302艘舰船、655个油桶、390座棒球场、524座网球场、159座篮球场、163座足球场、224个港口、124座桥梁、598个车辆.这些数据来自谷歌地球(分辨率0.5m~2m)和法伊英根数据(分辨率0.08m)[4].RSOD-Dataset提供了936幅图像,生成了7 400个目标,分为4个数据类,分别为5 374架飞机、1 698个油桶、176架立交桥、149个操场.这些数据取自谷歌地图和天地图等,图2给出了该数据集的各类目标信息,而各类目标的分辨率见表1.(a) 飞机(b) 油桶(c) 立交桥(d) 操场Fig.2 Four-class object samples of RSOD-Dataset图2 RSOD-Dataset的4类目标示例Table 1The resolution of different objects of RSOD-Dataset表1 RSOD-Dataset各类目标分辨率目标类飞机油桶立交桥操场分辨率(m) 0.5~2 0.3~1 1.25~3 0.4~1在数据的特征选择上,使用的是国际上公认的Gist特征[37].该特征是512维的,由基于视觉词袋模型的网格化Gabor小波系数组成.在样本集设置上(以RSOD-Dataset为例),按比例随机抽取2 000个来自4类的目标作为测试样本集;然后,对剩余的5 400个样本集作仿射变换,并对扩大后的样本集打乱次序后作为训练样本集,将训练和测试样本集的特征及其类别标签合成到一个.mat文件中用于算法验证.本文的实验中,旋转系数为R=11, α={30°,60°,…,330°},缩放系数都是S=2,β={0.5,0.75}.此外,为了验证算法的有效性,我们生成了10组.mat文件,取平均值作为算法的精度结果.本文的所有实验是在软件MATLAB2014a上仿真实现的,电脑的处理器是英特尔酷睿i7-8550U,CPU主频1.99GHz,内存为8GB RAM.3.2 实验对比及定量分析本文是以哈希方法为基础的遥感多目标分类,实验分为两部分,一是比较本文方法和经典的哈希方法之间的精度,二是比较本文方法与传统的多目标分类方法之间的优越性.3.2.1 哈希方法之间的性能对比为了验证仿射不变离散哈希方法在哈希函数改进上的优越性,本文选取了谱哈希(SH)[22]、可扩展图哈希(SGH)[23]、核监督哈希(KSH)[25]、列采样监督离散哈希(COSDISH)[28]、监督离散哈希(SDH)[27]、旋转不变离散哈希(RIDISH)[29]作为对比方法以验证算法的精度.此外,为了验证本文方法相对于旋转不变离散哈希的优势,特增加一步实验,旋转&尺度不变离散哈希(RI&SIDISH)代表的是旋转不变离散哈希方法在旋转不变约束项中加入缩放变换的结果.定量指标上,选取4个指标来评价算法的精度.表2~表5显示出这些指标在各种哈希算法下的评价结果.920 Journal of Software软件学报 V ol.30, No.4, April 2019(1) 平均分类精度(MAP):准确分类的目标占总数的比例.(2) 前1 000个样本的分类精度(precision of top 1000 returned samples):对所有测试样本寻找其匹配度较高的前1 000个训练样本计算其分类精度,再对这些测试样本分类精度取平均值.(3) 汉明距离在半径为2时的分类精度(precision of Hamming distance with radius 2):以汉明距离小于等于2为测度,对所有测试样本寻找与其接近的训练样本并计算分类精度,再对这些测试样本的分类精度取平均值.(4) 各分类精度(AP):各类目标的分类精度.表2~表4从宏观的角度给出了7种哈希方法在多目标分类中的精度对比情况.在哈希字节的选取上,给出了8字节、16字节、32字节和64字节的数据.可以看到,随着哈希字节数的增长,各种哈希方法的增长趋势是一致的,直至32字节,而到了64字节时,很多哈希方法的精度反而会有所降低.这种情况的发生往往取决于数据集的分布以及过拟合的发生.鉴于此,在表5中给出了32字节时各目标分类的结果.Table 2 MAP of different hashing method in 8,16,32,64 bits表2不同哈希方法在8、16、32、64字节下的平均分类精度Table 3 The precision of top 1000 returned samples ofdifferent hashing method in 8,16,32,64 bits表3不同哈希方法在8、16、32、64字节下的前1 000个样本的分类精度Table 4The precision of Hamming distance with radius 2 ofdifferent hashing method in 8,16,32,64 bits两个数据集均能有效验证7种哈希方法的分类精度.从宏观对比上看,武汉大学RSOD-Dataset数据集的分类精度较高于西北工业大学NWPU VHR-10数据集的分类精度,究其原因是,武汉大学的数据集虽然样本数很孔颉等:基于仿射不变离散哈希的遥感图像多目标分类921多,但是数据类型较少(4个),样本的差异性较大,数据集较为简单,使得分类的精度偏高.而西北工业大学的数据集,包含的数据类型较多(10个),样本集的多样性增加了准确分类的难度,更能层次化地反映出不同算法在多目标的分类效果.从监督和无监督哈希方法之间对比上来看,两种无监督哈希方法SH、SGH的精度较低,甚至连30%都不到,这符合了机器学习中无监督方法在没有先验信息时,即使挖掘更多的数据自身的特征也难以有效提升分类精度的结论.而6种监督哈希方法的平均分类精度都达到了至少65%以上.而且,KSH方法在8字节处的分类精度就已达到了67.73%的精度,说明了哈希方法以较少的字节依然能够很好地区分出不同目标类的语义信息.COSDISH方法在8字节处就取得了高于KSH、SDH的分类精度,然而,随着哈希码字节数的增多,分类精度的增长却不如其他方法明显,该方法的优点在于,对样本数目不敏感,两个数据集下分类精度随字节增长的幅度相似,代表着这种算法的稳定性很高.观察表2后4行的数据可以发现,RIDISH相对于SDH有更大的提升在于8字节处就能获得8成以上的分类精度,这主要得益于该方法考虑了样本的旋转多样性.而观察RIDISH和RI&SIDISH的精度可以发现,在加入原数据的缩放样本后,数据的精度反而有所下降(约为4%).这个现象表明,数据的尺度性会影响到RIDISH的分类精度.而本文方法在考察了样本的仿射变换信息后,精度达到了93.74%,高于RI&SIDISH方法的89.91%,即说明本文方法在不同尺度目标的语义表达的有效性,达到了改进哈希方法对仿射不变性的要求.同时,本文方法在MAP等精度上也略高于RIDISH方法,表明本文方法继承并发扬了旋转不变哈希在哈希码约束项上改造的优势.图3和图4直观地给出了两个数据集下7种哈希方法在不同字节数时的3种分类精度指标.(a) 平均分类精度(b) 前1 000个样本的分类精度(c) 汉明距离在半径为2时的分类精度Fig.3 The diagram of three precision indexes varied with bits in NWPU VHR-10 dataset 图3 NWPU VHR-10数据集的3个精度指标随字节变化示意图(a) 平均分类精度(b) 前1 000个样本的分类精度(c) 汉明距离在半径为2时的分类精度Fig.4 The diagram of three precision indexes varied with bits in RSOD-Dataset图4 RSOD-Dataset数据集的3个精度指标随字节变化示意图不难看出,SH、SGH方法的分类精度偏低,32字节之后精度不再提升甚至会有所下降,尤其是汉明半径在2922 Journal of Software软件学报 V ol.30, No.4, April 2019以内的分类精度在64字节处极低,表明汉明半径以2为测度时加入进了过多的误判样本.而KSH、COSDISH、SDH则高于两种无监督哈希方法,这一方面得益于类标签信息的引入,另一方面则是核学习方法的优势.然而,这两种方法在8字节处的精度还是偏低于后3种方法,毕竟字节数过少难以准确地表达出样本的特征.而RISDH、RI&SIDISH和本文方法在各字节下均保持着较高的精度,而且分类效果相对稳定,这主要得益于样本集扩充和算法的有效性,以样本点的成倍增加弥补了特征维数低的不足.表5给出了两个数据集中不同哈希方法在32字节下,各目标的分类精度以及总体分类精度(MAP).从纵向对比可以看到,NWPU VHR-10数据集在飞机、油桶、车辆等小目标的分类精度上均较高,而篮球场、桥梁、足球场等大目标的精度则偏低.这种现象的出现原因有两个:(1) 小目标的分辨率都较高,辨识度高,降低了分类的难度;反之,大目标覆盖范围广,分辨率较低,又包含了很多有用信息,无形中提高了分类的难度.(2) 从数据集的构成上看,小目标的样本数较多,而大目标的样本数较少.这一点无疑更加重要,从“网球场”这一类来看,同样是大目标数据,在样本数足够多的情况下依然取得了不错的效果.同样地,对于RSOD-Dataset而言,立交桥和操场的分类精度要低于飞机和油桶.而从横向对比不同方法在各目标分类精度的结果来看,本文方法虽然在个别目标类的分类精度与RIDISH不相上下(表格中加粗显示),但是,整体分类精度的提高,尤其是篮球场和桥梁两个“短板”精度上的提高,反映出仿射不变离散哈希在多目标分类上的优势.Table 5AP and MAP of different hashing methods in 32 bits表5不同哈希方法在32字节下各目标的分类精度和总体分类精度最后,我们给出各参数对本文方法的影响.AIDH主要有3个参数(R、S、m),分别是旋转系数、缩放系数以及锚点数.下面通过变化其中一个参数、固定另外两个参数来分析各参数对算法精度的影响.旋转系数对算法的影响是以旋转间隔角的变化来体现的,通过变换旋转间隔角以分析其对分类精度的影响.缩放系数方面,可以通过缩放尺度变化以分析其对分类精度的影响.而锚点数,则通过增加哈希模型中改变锚点的个数来分析其对分类精度的影响.下面以NWPU VHR-10为例,图5给出了本文方法在哈希码为8字节、32字节时MAP随参数变化的影响情况,其中旋转间隔角以15、30、45、90、180、360完成实验;缩放比例按照0.75、0.5、0.25、(0.5,0.75)、(0.25,0.75)、(0.25,0.5)作对比(不作旋转);锚点数则给出了500、1 000、1 500、2 000、4 000个锚点作为对比参数.图5所示实验结果表明,当算法的3个参数在32字节时对MAP的提升幅度小于8字节时,其中不同字节下锚点数的增长对算法的精度都有稳定性提升,这是来源于SDH方法引入嵌入学习对算法精度提升的效果.在8字节时,随着旋转间隔角的减小,算法的精度不断提升,直至15°后(R=12)趋于平稳;而在缩放系数方面,在0.5和0.75这两个尺度下,达到算法精度的极值点;当缩放系数小于0.5时,算法精度则有所降低.为此,本文选取(0.5, 0.75)两个尺度相结合作为缩放系数;而从锚点数的影响上来看,当锚点数小于2 000时,随着锚点数的增加,分类。