一种基于去噪自编码网络的SAR图像目标识别方法[发明专利]
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201811302162.5
(22)申请日 2018.11.02
(71)申请人 电子科技大学
地址 611731 四川省成都市高新区(西区)
西源大道2006号
(72)发明人 漆进 秦金泽 胡顺达
(51)Int.Cl.
G06K 9/00(2006.01)
G06K 9/46(2006.01)
G06K 9/62(2006.01)
(54)发明名称
一种基于去噪自编码网络的SAR图像目标识
别方法
(57)摘要
本发明公开了一种基于去噪自编码网络的
SAR图像目标识别方法,该方法包括:使用三维模
块匹配算法(BM3D)对图像去噪;
对原始图像和去噪后的训练图像,用滑动窗口提取密集特征点,
并分别按对应位置成对保存,用于后期训练深度
去噪编码器的输入;用去噪后图像提取的SIFT特
征为原始输入x ,以对应的未去噪图像提取的
SIFT为加噪输入训练深层去噪自编码网络;
使用空间金字塔(SPM)模型计算图像特征向量表
达,利用最大池化方法(Max Pooling )对各个局
部特征进行汇总,得到最终的图像描述向量;利
用大量密集SIFT特征进行深度网络训练,利用深
层去噪自编码网络学习特征的高层表示,最后使
用深度网络特征替代初始局部特征训练线性支
持向量机分类识别。
权利要求书2页 说明书4页 附图1页CN 109389101 A 2019.02.26
C N 109389101
A
1.一种基于多尺度稀疏表示的SAR图像目标识别方法,其特征在于,包括:
步骤(1)SAR图像去噪:密集SIFT特征提取依然会受到相干斑噪声的干扰,故先利用去噪算法对原图像进行预处理;
步骤(2)提取密集尺度不变局部特征(SIFT):对(1)中预处理后的训练图像,每一幅图像提取密集特征点,并通过随机采样的方法构成训练特征子集;对于测试图像,同样提取密集SIFT特征,保留所有特征进行稀疏编码;
步骤(3)对特征进行稀疏表示:对(2)中获得的训练特征子集,利用多尺度字典学习方法,学习全局多尺度字典,;然后对(2)中图像提取的所有密集SIFT特征(训练图像和测试图像)进行稀疏编码,获得特征的稀疏表示,利用稀疏表示特征替代原始图像相应位置提取的SIFT特征点;
步骤(4)特征映射:经过(2)的特征提取和(3)的稀疏表示后,每幅图像在不同位置得到一个稀疏特征向量,对特征向量进行聚类,然后使用空间金字塔(SPM)模型计算图像特征向量表达,利用最大池化方法(Max Pooling)对各个局部特征进行汇总,得到最终的图像描述向量;
步骤(5)线性支持向量机分类:得到(4)中训练图像的最终图像描述向量后,训练分类器进行SAR图像目标识别。
2.如权利要求1中利用三维模块匹配算法(BM3D)将具有相似结构的图像子块组合成三维数组,利用联合滤波的方法在变换域进行图像滤波,最后通过逆变换得到去噪后的图像。
3.如权利要求1中首先使用滑动窗口方法进行密集采样,选定不同的窗口大小和滑动步长,在同一副图像中,提取多个尺度下的密集SIFT特征,然后进行高斯模糊和方向匹配计算,保证在每一个滑动过得窗口中都提取到128维的SIFT描述子,对于一副M×N大小的图像,假设尺度S={0,1,2},则滑动窗口大小和相应的采样间隔步长为:
win size(s)=16×2s,
win step(s)=8×2s,
经过滑动窗口后,一幅图像提取的密集SIFT特征数为:。
4.如权利要求1中为了使稀疏表示同样具有多尺度特性,在局部特征提取时加入多尺度特征,再以多尺度特征作为输入训练字典,学习多尺度特性;
算法的步骤如下:
(1)密集SIFT特征提取:通过所述(2)的方法,从训练图像等间隔密集采样提取多尺度的128维SIFT特征,对于一幅64*64大小的SAR图像,以[0,1,2]---个尺度提取密集SIFT,特征数达到59;
(2)随机下采样:通过密集采样提取了大量的SIFT特征描述子,其中存在大量冗余,对其进行随机抽样,根据训练集选择抽样比例,得到多尺度训练特征子集;
(3)多尺度字典学习:将多尺度密集SIFT特征集作为输入,利用RLS-DLA算法学习全局
多尺度字典,得到多尺度字典D;
(4)稀疏表示:对于训练集,将原始密集SIFT特征经过多尺度稀疏表示,用于后期训练分类器,对于测试集图像,同样提取每幅图片的密集SIFT特征,再经过多尺度字典求解稀疏表达,用于后期分类器的输入。
5.如权利要求1中通过空间金字塔,在同一个尺度的图像子块中,利用最大值池化方法(Max Pooling)的方法对各个局部特征进行汇总,然后连接各个尺度子块内汇总的特征得到最终的图像描述向量,假设C是某个子块产生的特征编码集合:
其中,M为稀疏编码后的稀疏特征向量维度,S为该子块内的稀疏特征向量个数,使用最大值池化(max pooling)方法获得每一个子块的M维特征向量:
经过池化后,每个子块的多个稀疏特征汇总成一个特征向量^,最后将图像所有子块的汇总特征向量组合成一个图像描述。
6.如权利要求1中局部特征经过多尺度稀疏表示后,具有更强的表达能力,后期只需要简单的线性支持向量机即可,对于测试集,同样经过特征提取、多尺度稀疏表示和特征映射后,用训练好的支持向量机进行预测,实现目标的识别。
一种基于去噪自编码网络的SAR图像目标识别方法
技术领域
[0001]本发明属于合成孔径雷达(SAR)图像应用领域,涉及一种SAR图像目标识别方法,特别是一种基于去噪自编码网络的SAR图像目标识别方法。
背景技术
[0002]合成孔径雷达(SAR)作为一种重要的遥感成像传感器,在环境监测、资源勘察和国防军事等领域有着非常广泛的应用。
面对海量的SAR数据,如何从中自动、快速、准确地识别目标成为了目前SAR图像处理研究的重要方向,越来越引起人们的关注和重视。
[0003]近年来深度学习在图像处理和语音识别等领域取得了广泛的应用,其核心思想是通过构建一种包含多个隐藏层的深度神经网络结构,用以提取图像、语音等信号的高层语义信息,从而可以提高后期分类或识别的准确率。
神经网络通过构造多层网络结构,可以实现直接对原始图像进行逐层表示和分类。
网络的每一层相当于一个特征提取过程,从而实现从图像到高层特征的提取,但是通常需要大量的训练样本才能防止模型发生过拟合。
[0004]目前SAR图像目标识别方法主要有基于模板匹配的方法、基于模式分类的方法和基于稀疏表示的方法。
但是模板匹配方法由于需要预先存储大量模板,算法空间复杂度高,并且性能容易受SAR图像质量的影响,算法鲁棒性不够。
基于模式分类的方法需要手动设计特征,分类器选择的条件假设在不同应用背景下性能差异较大,具有一定的局限性。
稀疏表示的方法通过对原始图像进行稀疏表示,即是一次特征提取过程,可以直接用原始图像的稀疏表示进行分类与识别,从而有效的避免了手工提取特征的困难。
另一方面,稀疏表示的求解过程计算复杂,计算量大,十分耗时。
[0005]目前已提出的SAR图像目标识别算法都不够通用,且由于SAR图像中含有的大量相干斑噪声,进行目标识别前一般都需要经过复杂耗时的图像预处理过程;同时,传统光学图像的特征提取在SAR图像特征中不够稳定鲁棒。
为了解决上述SAR目标识别的问题,本发明提出了基于去噪自编码网络的SAR图像目标识别方法。
自编码网络通过逐层无监督学习,对网络进行预训练,可以一定程度减小模型发生过拟合。
去噪自编码网络对传统自编码网络进行了拓展,考虑了输入图像的噪声影响,对有噪输入具有一定的鲁棒性。
考虑SAR特有的相干斑噪声影响,利用去噪自编码器构造深度神经网络,使用深层去噪自编码网络进行SAR 图像目标分类。
发明内容
[0006]鉴于上述现有技术的不足,本发明所要解决的技术问题是如何针对高分辨率SAR 图像,利用去噪自编码器构造深度神经网络,使用深层去噪自编码网络进行SAR图像目标分类。
[0007]为实现上述目的,本发明提供了一种基于去噪自编码网络的SAR图像目标识别方法。
其特征包括:
[0008](1)SAR图像去噪:特征提取会受到相干斑噪声的干扰,故先利用去噪算法对原始
训练图像进行预处理;
[0009](2)提取密集尺度不变局部特征(SIFT):分别对(1)中的原始图像和去噪后的训练图像,提取密集特征点,并分别按对应位置成对保存。
用于后期训练深度去噪编码器的输入。
对于测试图像,不再进行去噪处理,直接提取密集SIFT特征;
[0010](3)深层去噪自编码特征提取:用去噪后图像提取的SIFT特征为原始输入x,以对应的未去噪图像提取的SIFT为加噪输入训练深层去噪自编码网络;
[0011](4)特征映射:使用空间金字塔(SPM)模型计算图像特征向量表达,利用最大池化方法(Max Pooling)对各个局部特征进行汇总,得到最终的图像描述向量;
[0012](5)分类识别:用训练图像特征集训练线性支持向量机(SVM)。
对于测试集,同样进行密集SIFT特征提取、深度网络特征转换,特征映射表达,最后用己训练SVM进行分类预测。
[0013]进一步地,所述(1)中利用三维模块匹配算法(BM3D)将具有相似结构的图像子块组合成三维数组,利用联合滤波的方法在变换域进行图像滤波,最后通过逆变换得到去噪后的图像。
[0014]所述(2)中首先使用滑动窗口方法进行密集采样,选择一定的窗口大小和滑动步长,进行高斯模糊和方向匹配计算,保证在每一个滑动过得窗口中都提取到128维的SIFT描述子。
对于一副M×N大小的图像,假设尺度S={0,1,2},则滑动窗口大小和相应的采样间隔步长为:
[0015]win size(s)=16×2s,
[0016]win step(s)=8×2s,
[0017]
[0018]经过滑动窗口后,一幅图像提取的密集SIFT特征数为:
[0019]
[0020]所述(3)中用去噪后图像提取的SIFT特征为原始输入x,以对应的未去噪图像提取的 SIFT为加噪输入训练深层去噪自编码网络。
特征提取算法步骤如下:
[0021](1)密集SIFT特征提取:通过所述(2)的方法,从训练图像等间隔密集采样提取多尺度的128维SIFT特征,对于一幅64*64大小的SAR图像,以[0,1,2]---个尺度提取密集 SIFT,特征数达到59。
[0022](2)无监督预训练:使用去噪后的SIFT特征作为原始输入,未去噪的SIFT特征作为加噪输入,逐层预训练网络参数。
[0023](3)有监督微调:网络的最后一层作为标签输出层,利用反向传播算法,微调整个网络的参数,有监督微调的次数不能太多(因为单个SIFT特征包含的目标类别信息不足,多次微调使得网络参数无法表达足够的特征原始信息),通过交叉验证和early-stopping选择较优微调迭代次数。
[0024](4)前向传播特征提取:针对每个样本图片(训练或测试),直接提取密集SIFT特征,然后将密集SIFT作为网络输入,前向传播计算输出层之前的倒数第二层响应,作为最后的深层特征表达,用以替代原始的密集SIFT特征,作为后期分类器的输入特征。
[0025]所述(4)中通过空间金字塔,在同一个尺度的图像子块中,利用最大值池化方法(Max Pooling)的方法对各个局部特征进行汇总,然后连接各个尺度子块内汇总的特征得到最终的图像描述向量。
假设C是某个子块产生的特征编码集合:
[0026]
[0027]其中,M为稀疏编码后的稀疏特征向量维度,S为该子块内的稀疏特征向量个数。
[0028]使用最大值池化(max pooling)方法获得每一个子块的M维特征向量:
[0029]f i=m j axc i,j,i=1,...,M,j=1,...,S
[0030]经过池化后,每个子块的多个稀疏特征汇总成一个特征向量^,最后将图像所有子块的汇总特征向量组合成一个图像描述:
[0031]
[0032]
[0033]所述(5)中利用大量密集SIFT特征进行深度网络训练,考虑SAR图像斑点噪声的影响,利用深层去噪自编码网络学习特征的高层表示,最后使用深度网络特征替代初始局部特征训练线性支持向量机分类识别。
与传统的SAR图像目标识别方法相比,本发明在识别过程中的有效性和鲁棒性更高,并且算法复杂度较低。
[0034]以下将结合附图对本发明的构思、具体方案及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
[0035]图1是基于去噪自编码网络的SAR图像目标识别算法框架图
[0036]图2是去噪自编码网络SAR图像特征提取算法流程图;
具体实施方式
[0037]下面结合附图来说明本发明的实施方式
[0038]如图1所示,本发明的本发明的SAR图像目标识别算法原理为:
[0039](1)先利用三维模块匹配算法(BM3D)将具有相似结构的图像子块组合成三维数组,利用联合滤波的方法在变换域进行图像滤波,最后通过逆变换得到去噪后的图像。
[0040](2)对原始图像和去噪后的训练图像,用滑动窗口提取密集特征点,并分别按对应位置成对保存。
用于后期训练深度去噪编码器的输入。
对于测试图像,不再进行去噪处理,直接提取密集SIFT特征。
假设尺度S={0,1,2},则滑动窗口大小和相应的采样间隔步长为:[0041]win size(s)=16×2s,
[0042]win step(s)=8×2s,
[0043]
[0044]经过滑动窗口后,一幅图像提取的密集SIFT特征数为:
[0045]
[0046](3)用去噪后图像提取的SIFT特征为原始输入x,以对应的未去噪图像提取的SIFT 为加噪输入训练深层去噪自编码网络。
特征提取算法步骤如下:
[0047](1)密集SIFT特征提取:通过所述(2)的方法,从训练图像等间隔密集采样提取[0048]多尺度的128维SIFT特征,对于一幅64*64大小的SAR图像,以[0,1,2]---个尺度提[0049]取密集SIFT,特征数达到59。
[0050](2)无监督预训练:使用去噪后的SIFT特征作为原始输入,未去噪的SIFT特征作[0051]为加噪输入,逐层预训练网络参数。
[0052](3)有监督微调:网络的最后一层作为标签输出层,利用反向传播算法,微调整个[0053]网络的参数,有监督微调的次数不能太多(因为单个SIFT特征包含的目标类别信息不足,
[0054]多次微调使得网络参数无法表达足够的特征原始信息),通过交叉验证和early-stopping
[0055]选择较优微调迭代次数。
[0056](4)前向传播特征提取:针对每个样本图片(训练或测试),直接提取密集SIFT特[0057]征,然后将密集SIFT作为网络输入,前向传播计算输出层之前的倒数第二层响应,作为
[0058]最后的深层特征表达,用以替代原始的密集SIFT特征,作为后期分类器的输入特征。
[0059](4)通过空间金字塔,在同一个尺度的图像子块中,利用最大值池化方法(Max Pooling) 的方法对各个局部特征进行汇总,然后连接各个尺度子块内汇总的特征得到最终的图像描述向量。
[0060](5)利用大量密集SIFT特征进行深度网络训练,考虑SAR图像斑点噪声的影响,利用深层去噪自编码网络学习特征的高层表示,最后使用深度网络特征替代初始局部特征训练线性支持向量机分类识别。
[0061]以上详细描述了本发明的较佳具体实施例。
应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。
因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
图1
图2。