【CN109993221A】一种图像分类方法及装置【专利】
一种图像分类方法、装置、设备及计算机可读存储介质[发明专利]
专利名称:一种图像分类方法、装置、设备及计算机可读存储介质
专利类型:发明专利
发明人:梁玲燕,董刚,赵雅倩,曹其春
申请号:CN201911041052.2
申请日:20191025
公开号:CN110782021A
公开日:
20200211
专利内容由知识产权出版社提供
摘要:本发明公开了一种图像分类方法,包括:接收待分类图像信息;利用通过对比裁剪量化误差和max量化误差选取得到的量化阈值进行权重参数量化后的深度神经网络模型,对待分类图像信息进行分类操作,得到图像分类结果;其中,裁剪量化误差为基于深度神经网络模型的原权重参数计算得到的裁剪阈值进行权重参数量化得到,max量化误差为基于深度神经网络模型的原权重参数计算得到的最大绝对值权重阈值进行权重参数量化得到;输出图像分类结果。
本发明缩小了图像分类设备中深度神经网络模型,保证了模型精度,降低了计算量,提高了图像分类效果。
本发明还公开了一种图像分类装置、设备及存储介质,具有相应技术效果。
申请人:浪潮电子信息产业股份有限公司
地址:250101 山东省济南市高新区浪潮路1036号
国籍:CN
代理机构:北京集佳知识产权代理有限公司
代理人:侯珊
更多信息请下载全文后查看。
图像分类方法和装置[发明专利]
专利名称:图像分类方法和装置专利类型:发明专利
发明人:沈伟
申请号:CN202110263231.1申请日:20210311
公开号:CN112633425A
公开日:
20210409
专利内容由知识产权出版社提供
摘要:本申请公开了一种图像分类方法和装置,涉及人工智能技术领域;本申请获取待训练的自编码模型、样本图像、标签信息以及参考图像,自编码模型包括第一特征提取分支和第二特征提取分支、解码器;基于样本图像及其标签信息对第一特征提取分支进行预训练,得到预训练后第一特征提取分支;通过预训练后第一特征提取分支对样本图像和参考图像进行特征提取,得到样本图像的样本特征信息和参考图像的参考特征信息;基于样本特征信息和参考特征信息之间的损失值对参考图像进行更新,得到第一特征图像;根据样本图像和第一特征图像对自编码模型训练,得到训练后自编码模型,训练后自编码模型用于对图像分类。
本申请可以提高图像分类的准确性和泛化性能。
申请人:腾讯科技(深圳)有限公司
地址:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层
国籍:CN
代理机构:深圳翼盛智成知识产权事务所(普通合伙)
代理人:李汉亮
更多信息请下载全文后查看。
图像分类方法、装置、计算机设备和可读存储介质发明专利
图像分类方法、装置、计算机设备和可读存储介质技术领域本申请涉及图像处理技术领域,特别是涉及一种图像分类方法、装置、计算机设备和可读存储介质。
背景技术X光片(X-Rays)以其低廉的价格以及较好的影像效果,在肺部疾病、心脏疾病、腹部疾病以及骨折等的早期发现中占有重要地位。
通常扫描技师使用医疗设备对患者完成扫描后,提交医学影像给对应的放射科医生进行阅片,由放射科医生根据自身经验识别医学影像中的病灶特征,给出病灶识别结果。
通常,扫描技师在对患者的某一部位进行扫描时,会录入所扫描的部位标签(如,当前医学影像为腹部图像),然后放射科医生根据部位标签对医学影像进行病灶识别。
但是,传统技术会存在因扫描技师失误而将部位标签录错的情况,这就要求放射科医生先对扫描部位进行判断,再进行病灶识别,其病灶识别过程的效率和准确率都比较低。
发明内容基于此,有必要针对传统技术中病灶识别过程的效率和准确率都比较低的问题,提供一种图像分类方法、装置、计算机设备和可读存储介质。
第一方面,本申请实施例提供一种图像分类方法,包括:获取待分类的医学图像;将医学图像输入预设的多任务网络模型,得到医学图像中关键点的分割结果和图像分类结果;多任务网络模型为根据带有关键点标签与分类标签的训练样本进行训练所得到的;当关键点的分割结果和图像分类结果满足预设条件,则确定图像分类结果表征的拍摄部位为目标拍摄部位。
在其中一个实施例中,训练样本包括多个样本图像和每个样本图像对应的标签,该标签包括关键点标签与分类标签;多任务网络模型的训练方式包括:将样本图像输入初始多任务网络,得到初始关键点分割结果和初始图像分类结果;计算初始关键点分割结果和关键点标签之间的第一损失、以及初始图像分类结果和分类标签之间的第二损失;根据第一损失和第二损失对初始多任务网络进行训练,得到多任务网络模型。
在其中一个实施例中,将医学图像输入预设的多任务网络模型,得到医学图像中关键点的分割结果和图像分类结果,包括:采用多任务网络模型中的第一卷积层对医学图像进行特征提取,得到医学图像的特征图;采用多任务网络模型中的第二卷积层对特征图进行关键点特征检测,得到关键点的分割结果;采用多任务网络模型中的池化层和全连接层对特征图进行特征分类,得到图像分类结果。
一种图像分类方法和装置的制作方法
一种图像分类方法和装置的制作方法专利名称:一种图像分类方法和装置的制作方法一种图像分类方法和装置技术领域本申请涉及图像处理技术,特别是涉及一种图像分类方法和装置。
技术背景数字化的医学影像设备,如CT、MRI, PET等在临床医学中被大量应用,使得医学图像的数据量急剧增长,以至于现有的图像存储及管理方式、图像处理与分析方法都面临着巨大的挑战。
而基于内容的医学图像分类技术作为一种图像处理技术,可以完成医学图像类别的自动标注任务,使新产生的医学图像自动实现类别标注,并进一步完善医学图像资源的存储与检索功能。
目前的图像分类技术主要是先根据训练数据进行分类器的训练,当通过训练得到一个分类器后,再利用训练得到的分类器对待分类图像进行分类。
基于内容的医学图像分类技术以医学图像特征参数的提取为实现前提。
由于医学图像自身的特定和应用背景特点使得单一的特征参数提取方法难以在医学图像内容的表达中取得理想的效果。
同时,实验数据也表明,采用多特征参数实现的医学图像分类的准确率要高于采用单一特征参数实现的医学图像分类的准确率。
因此,采用多特征参数实现医学图像分类成为一个重要的研究内容。
在采用多特征参数实现医学图像分类的过程中,会出现提取出的特征参数的特征数据的维度较高问题。
例如,对一个待分类的图像提取Haralick、灰度直方图、形状上下文、FFT、Gabor这几种特征参数时,Haralick的特征数据的维度为14,灰度直方图的特征数据的维度为16,形状上下文的特征数据的维度为72,FFT的特征数据的维度为10,GabOr的特征数据的维度为64。
显然,从待分类图像中提取的特征参数的特征数据的维度较高。
发明人在研究中发现,如果直接利用高维特征数据进行图像分类,由于数据维度过高,以及不同特征数据间的关系被忽略的因素,会直接导致分类器效率和准确度的下降。
如果对高维特征数据进行降维处理,如采用PCA (Principal Component Analysis,主成分分析)降维方法,会使得原特征数据的信息丢失,没有充分利用提取的特征信息。
一种图像分类方法及装置[发明专利]
专利名称:一种图像分类方法及装置专利类型:发明专利
发明人:黄永祯,曹春水,王继隆
申请号:CN201910075279.2
申请日:20190125
公开号:CN111488893A
公开日:
20200804
专利内容由知识产权出版社提供
摘要:本申请提供了一种图像分类方法及装置,其中,该方法包括:获取待分类图像;将待分类图像输入至预先训练好的特征提取网络中,得到待分类图像的特征向量;将特征向量输入至预先训练好的分类层的每个冗余神经元组中,得到每个冗余神经元组中各个神经元输出的第一分类概率,其中,每个神经元输出的第一分类概率表示待分类图像属于该神经元所在冗余神经元组对应的分类类别的概率;将每个冗余神经元组中各个神经元输出的第一分类概率输入至分类结果激活层中,得到每个冗余神经元组对应的第二分类概率;基于每个冗余神经元组对应的第二分类概率,确定待分类图像的分类结果。
本申请能够在不增加标注成本的情况下,提高类内差异较大时的图像分类精度。
申请人:银河水滴科技(北京)有限公司
地址:100000 北京市海淀区学院路51号7层0701
国籍:CN
代理机构:北京超成律师事务所
代理人:胡上海
更多信息请下载全文后查看。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910227705.X
(22)申请日 2019.03.25
(71)申请人 新华三大数据技术有限公司
地址 450000 河南省郑州市高新技术产业
开发区杜英街166号总部大观B18号楼
(72)发明人 徐启南
(74)专利代理机构 北京超成律师事务所 11646
代理人 刘静
(51)Int.Cl.
G06K 9/62(2006.01)
(54)发明名称一种图像分类方法及装置(57)摘要本申请提供了一种图像分类方法及装置,其中,该方法包括:获取待分类的目标图像;将目标图像输入至预先训练好的分类模型中,输出目标图像的类别;其中,目标图像在分类模型中的处理过程包括:提取目标图像的目标方向梯度直方图HOG特征矩阵;分别计算目标HOG特征矩阵和每个类别对应的参考HOG特征矩阵之间的互信息值;基于计算出的互信息值,确定与目标HOG特征矩阵之间的互信息值由大到小排列在前K位的参考HOG特征矩阵;K为正整数;根据排列在前K位的参考HOG特征矩阵分别对应的类别,将出现次数最多的类别作为目标图像的类别。
采用上述方式,可以在保证准确率较高的情况下,节省硬件处理资源,
提升图像处理效率。
权利要求书4页 说明书14页 附图5页CN 109993221 A 2019.07.09
C N 109993221
A
权 利 要 求 书1/4页CN 109993221 A
1.一种图像分类方法,其特征在于,包括:
获取待分类的目标图像;
将所述目标图像输入至预先训练好的分类模型中,输出所述目标图像的类别;其中,所述目标图像在所述分类模型中的处理过程包括:
提取所述目标图像的目标方向梯度直方图HOG特征矩阵;
分别计算所述目标HOG特征矩阵和每个类别对应的参考HOG特征矩阵之间的互信息值;
基于计算出的互信息值,确定与所述目标HOG特征矩阵之间的互信息值由大到小排列在前K位的参考HOG特征矩阵;K为正整数;
根据所述排列在前K位的参考HOG特征矩阵分别对应的类别,将出现次数最多的类别作为所述目标图像的类别。
2.如权利要求1所述的图像分类方法,其特征在于,所述分别计算所述目标HOG特征矩阵和每个类别对应的参考HOG特征矩阵之间的互信息值,包括:
根据所述目标HOG特征矩阵中各个特征参数,计算每种特征参数出现在所述目标HOG特征矩阵中的第一概率,并基于计算出的第一概率,确定所述目标HOG特征矩阵的第一信息熵;其中,每个特征参数用于表征所述目标图像中对应的图像区域的图像特征,取值相同的特征参数为同一种特征参数,所述图像区域包括至少一个像素点;以及,根据每个所述参考HOG特征矩阵的各个特征参数,计算每种特征参数出现在每个所述参考HOG特征矩阵中的第二概率,并基于计算出的第二概率,确定每个所述参考HOG特征矩阵的第二信息熵;以及,
计算所述目标HOG特征矩阵和每个所述参考HOG特征矩阵中同一位置处出现同种特征参数的第三概率,并基于计算出的第三概率,确定所述目标HOG特征矩阵和每个所述参考HOG特征矩阵之间的第三信息熵;
基于所述第一信息熵、每个所述参考HOG特征矩阵的第二信息熵、以及所述目标HOG特征矩阵和每个所述参考HOG特征矩阵之间的第三信息熵,计算所述目标HOG特征矩阵和每个所述参考HOG特征矩阵之间的互信息值。
3.如权利要求1所述的图像分类方法,其特征在于,所述方法还包括:
获取训练样本集和测试样本集,其中,所述训练样本集中包括不同类别的训练样本子集,每种类别的训练样本子集中包括归属于该类别的多个训练样本图像,所述测试样本集中包括多个测试样本图像,每个测试样本图像与预设类别标签相对应;
基于所述不同类别的训练样本子集中的训练样本图像、以及所述测试样本集中的测试样本图像,对基础分类模型中的基础特征提取模块和基础类别预测模块分别进行训练,在确定训练完成后分别得到特征提取模块和类别预测模块;
将训练完成后的特征提取模块和类别预测模块构成所述分类模型。
4.如权利要求3所述的图像分类方法,其特征在于,根据以下方式训练所述基础特征提取模块:
将每个测试样本图像和每个类别的训练样本子集中的训练样本图像输入至所述基础特征提取模块中,分别提取每个测试样本图像的第一HOG特征矩阵、以及每个类别的每个训练样本图像的第二HOG特征矩阵;
将提取出的第一HOG特征矩阵和提取出的第二HOG特征矩阵输入至所述基础类别预测
2。