桔小实蝇等六种常见果园害虫图像数据集
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4卷第1期2022年3月
Vol.4,No.1
Mar.2022农业大数据学报
Journal of Agricultural Big Data
桔小实蝇等六种常见果园害虫图像数据集
张翔鹤1,2王晓丽1,2,3刘婷婷1,2,3胡林1,2樊景超1,2,3*
(1.中国农业科学院农业信息研究所,北京100081;
2.国家农业科学数据中心,北京100081;
3.农业农村部农业大数据重点实验室北京100081)
摘要:使用机器视觉方法进行虫害识别是果园害虫防控或治理的必然需求。
目前对果园害虫图像数据的采集,多数品种单一,分辨率参差不齐。
并且仅收集害虫原始图像数据,同时包含原始图像和机器识别显著图图像
的数据集极少。
本数据集包括桔小实蝇、金龟子、梨小食心虫、青叶蝉、星天牛和柑桔大实蝇六种常见害
虫的图像数据,共计2412张。
其中原始图像1613张,未经处理。
经过反卷积方法处理的图像,剔除特征不
显著的图像后,保留特征显著图像,共计799张。
该数据集可为果园害虫的识别分类研究提供数据基础。
关键词:果园;害虫识别;图像数据;机器识别
中图分类号:S436.6文献标识码:A文章编号:2096-6369(2022)01-0114-05
引用格式:张翔鹤,王晓丽,刘婷婷,等.桔小实蝇等六种常见果园害虫图像数据集[J].农业大数据学报,2022,04(01):114-118.
Zhang Xianghe,Wang Xiaoli,Liu Tingting,et al.Image Data Set of Six Common Orchard Pests such as Bactrocera Dorsalis[J].
Journal of Agricultural Big Data,2022,04(01):114-118.
Image Data Set of Six Common Orchard Pests
such as Bactrocera Dorsalis
Zhang Xianghe1,2Wang Xiaoli1,2,3Liu Tingting1,2,3Hu Lin1,2Fan Jingchao1,2,3*
(1.Agricultural Information Institute of Chinese Academy of Agricultural Sciences,Beijing100081;
2.National Agriculture Science Data Center,Beijing100081;
3.Key Laboratory of Big Agri-Data,Ministry of Agriculture,Beijing100081)
Abstract:It is essential to use machine vision method for pest identification in orchard pest control and management.At present,most of the orchard pest image data collection centre on a single type
and the resolution is inconsistent.In addition,only the original image data of pests are collected,
and few data sets contain both the original image and the salient image of machine recogni‐
tion.This data set includes2412image data of six common pests,such as bactrocera dorsalis, DOI:10.19788/j.issn.2096-6369.220117
收稿日期:2021⁃12⁃20
基金项目:中国农业科学院创新工程:数据整合与应用服务研究(2020CX017)
第一作者简介:张翔鹤,女,硕士,研究生,研究方向:农业科学数据管理;E-mail:*****************
通讯作者:樊景超,男,博士,副研究员,研究方向:农业科学数据管理;E-mail:*******************
第1期张翔鹤等:桔小实蝇等六种常见果园害虫图像数据集
chafer,grapholitha molesta,leaf hopper,long icorn and bactrocera minax.Among them,1613
original images were unprocessed.For images processed by deconvolution method,a total of799
images with significant features were retained after eliminating the images with insignificant fea‐
tures.In conclusion,the data set can provide a data basis for the identification and classification
of orchard pests.
Keywords:orchard;pests identification;image data;machine recognition
1引言
我国是果业大国,随着我国经济结构的调整,果品产业已成为我国种植业的第三大产业。
但是我国水果需求量仍然很大,根据国家统计局数据显示,近几年我国水果进口数量均大于出口数量。
2020年我国水果出口金额为68.32万美元,进口金额为115.6万美元。
究其原因,是我国出口的水果达不到进口国的水果质量标准。
近年来,人们对高质量产品的需求不断提高,如何生产出高质量的绿色有机水果已经受到了社会各界的广泛关注。
对果园的治理包括疏花疏果、树体保护、灾害防治等措施,及时观察、测报和随时清理果园中的病虫源是最为有效措施。
果园虫害轻则导致果园减产,重则导致果树损毁。
现阶段,我国果园病虫害造成投入成本高,病虫害的发生造成的直接经济成本约为总成本的十分之一以上。
对病虫害的防治成本约为总成本的百分之四十以上。
果园病虫害种类繁多,过去的果园病虫害监测和防治已经很难满足当前时间、空间和成本上的需求,而基于图像识别技术对果园害虫进行精准识别,能够降低成本,精准治理果园,提高果实质量,增加收益。
通过害虫图像对其种类进行精准识别,对果树进行害虫情况预测,进而针对具体害虫进行精准用药或者引入天敌生物等措施[1],达到精准治理病虫害。
由此看来,果园害虫的分类识别对果园综合治理至关重要[2-3]。
本研究收集了果园中常见的六种害虫的图像数据,对开展果园害虫的机器识别提供了基础图像数据。
随着深度学习技术和计算机图像处理水平的快速提升,诸多学者也采集了很多果园害虫图像数据用以机器的深度学习训练。
李文勇[4]设计了一套果树害虫采集系统,采集各种果树害虫的图像数据,并以此研发了一种基于机器视觉的果园性诱害虫在线识别与计数方法;程鲁玉等[5]也依据果林害虫的图像数据,根据机器视觉方法提取害虫图像特征,从而实现了果林中果害虫图像特征高效分类识别,能够为果林病虫草害的诊断提供有力依据;田冉等[6]则将工业相机采集的果园害虫图像数据和红外传感器识别结果相结合,得到一种红外传感器与机器视觉融合的果树害虫识别和计数方法,可以一定程度上提高害虫的识别准确率。
此外,对于有记载的可信度高的同类调查数据集,山东农业大学相关研究人员[7]对北京昌平等地苹
数据库(集)基本信息简介
数据库(集)中文名称数据库(集)英文名称
数据作者
通讯作者
数据采集时间
数据格式
数据服务系统网址
基金项目
数据库(集)组成
桔小实蝇等六种常见果园害虫图像数据集
Image data set of six common orchard pests such as Bactrocera dorsalis
樊景超
樊景超(*******************)
2018年
*.jpg,*.png,*.bmp
https:///data.html#/datadetail?id=286640
中国农业科学院创新工程:数据整合与应用服务研究(2020CX017)
数据集由害虫原始图像数据和机器识别显著图图像两部分组成,其中:
1.害虫原始图像数据集,包含桔小实蝇、金龟子、梨小食心虫、青叶蝉、星天牛和柑桔大实蝇六种常见害虫的图像数据,共1613张,
51.97MB;
2.机器识别显著图图像数据集,包含六类害虫的机器识别显著图图像,共799张,116.39MB.
采集区域
数据量
中国
168M
115
农业大数据学报:数据论文第4卷第1期
果园的虫害进行调查,含有采集地、采集部位、采集人、采集单位等数据。
当前我国果园病虫害数据的收集,主要集中于对害虫资源的发生危害信息,害虫本身的图像数据集较少。
本数据集通过网络搜索引擎收集了果园常见的六种害虫:桔小实蝇、金龟子、梨小食心虫、青叶蝉、星天牛和柑桔大实蝇的原始图像数据,并对模糊不清、分辨率低和尺寸不一的图像进行筛选,最终得到可用于图像识别技术的图像1613张。
并提供其中三种害虫的显著度图像,可用于进一步的害虫分类研究。
本数据集为果园害虫相关研究提供了数据基础。
2数据采集与处理方法
2.1害虫图像数据采集
本数据集的测试对象为果园害虫,经过文献调研和资料调查,选取六种最常见的害虫图像,通过网络爬虫和搜索引擎获取。
基于建立的模型,其适用度有所不同,考虑到一般的显卡容量以及运行时间,对图片尺寸的要求为100~300px 之间[8]。
收集到的图像样本数据量如表1所示。
2.2图像处理方法
对于本数据集中的显著图图像数据,由于图像质量对模型的构建至关重要,并且决定了后续相关研究提取昆虫特征的有效性,因此图像处理方法至关重要。
对于害虫图像的有效特征提取,有很多种方法,如蚁群优化算法等[9],本数据集采用反卷积方法,能够选取最有效、最适合构建模型的原始图像的样本[10]。
本数据集采用的实验设备是一台联想Think ‐station 图形工作站,显卡是Nivida Quadro K4000显存3GB ,GPU 运算能力是3.0。
选定适量的测试集,预先对AlexNet 网络模型进行训练,达到一定效果后,对本数据集收集的害虫图像进行反卷积可视化[11-12],反卷积可视化方法可以有效遴选适合进行模型构建的原始图像样本[8]。
通过所得图像判断当前图像能否有效提取害虫特征,第一层识别图像不显著,再对图像进行第二层反卷积可视化。
如此,便得到原始害虫、低维特征、特征组合以及全局的高位特征图像,如图1所示。
由此,通过反卷积过程提取到有效的害虫的识别特征,将这些样本遴选出来作为高质量的样本集合。
由于每一类害虫的图像数据样本量不一致,分辨率高低不一致,训练精度往往会因此降低。
所以,将每一类害虫的数据样本量控制在一定范围内,适量删减其分辨率不一致的图像,最终得到总样本集合799张显著图,这些高质量的样本图像数据便可以直接用于神经网络的训练和验证。
3数据样本描述
每一类害虫的图像数据保存为一个文件夹,命名
方式为“品种名称”。
该文件夹包含原始数据和两层
表1果园害虫图像样本数据量Tab.1
Orchard pest image sample data
害虫种类
桔小实蝇(bactrocera dorsalis)
金龟子(chafer)
梨小食心虫(grapholitha molesta)
青叶蝉(leaf hopper)星天牛(long icorn)柑桔大实蝇(bactrocera minax)
数量3724184975554
372
图1
害虫图像反卷积可视化
Fig.1
Pest image deconvolution visualization
116
第1期张翔鹤等:桔小实蝇等六种常见果园害虫图像数据集
显著图数据,命名方式为“原始图像”、“第一层识别图像”和“第二层识别图像”。
内部文件命名方式为“品种名+序号”。
部分样本示例如图2所示。
本数据集共收集保存桔小实蝇原始图像372张,第一层识别图像372张,第二层识别图像372张;柑橘大实蝇原始图像217张;金龟子原始图像418张,第一层识别图像38张;梨小食心虫原始图像497张;青叶蝉原始图像58张,第一层识别图像18张;星天牛原始图像54张。
4数据质量控制与验证
在数据收集和整理过程中,原始图像尺寸控制在100-300px之间,并对原始样本图像数据进行机器识别,提取其特征。
运用反卷积遴选方法,对提取出有效特征的样本进行筛选,从而得到高质量的具有有效特征的样本。
再对这些提取出有效特征的样本进行删减,将分辨率控制224。
最终得到高水平的数据集:显著图分辨率一致,并且均具备有效特征。
此外,在拍摄图片的复杂背景下分割出害虫图像,从而提取有效的特征信息,是相对复杂的[13]。
本研究采集的害虫图像背景简单,也为分割图像提取特征提供了方便。
随着现代图像处理技术的发展,复杂图像的识别分割将不会是难题。
5数据价值与使用建议
本数据集是经过大量搜索提纯后得到的高质量数据集,除了原始图像数据集,对于拥有清晰昆虫特征的图像数据,提供机器识别后的显著图,包括神经网络第一层和第二层的识别图,可以直接用以相关研究,如研究建立昆虫识别模型等[14-15]。
利用图像数据,进行特征提取后,借助SVM分类器等进行昆虫种类的智能识别[16-17]。
此外,使用数据集时可以直接对六种害虫,分析其图像特征,针对这些特征研究制定防范虫害的措施等[18]。
数据作者分工职责
张翔鹤(1997—),女,山东青岛人,硕士,研究生,主要从事农业科学数据管理与分析研究。
主要承担工作:数据汇总整理及论文撰写。
王晓丽(1982—),女,河北栾城人,博士,助理研究员,主要从事农业科学数据管理与分析研究。
主要承担工作:数据整理与分类汇总。
刘婷婷(1985—),女,北京人,硕士,助理研究员,主要从事农业科学数据获取与研究。
主要承担工作:数据集整合与处理。
胡林(1967—),男,内蒙古商都县人,博士,研究员,主要从事科学数据管理相关研究。
主要承担工作:总体方案设计与组织实施。
樊景超(1980—),男,辽宁沈阳人,博士,副研究员,主要从事农业科学数据管理与分析研究。
主要承担工作:图像数据采集,总体方案设计与组织实施。
参考文献
[1]高九思,张安全,李泽义.苹果园天敌种类及其对果园主要
害虫的控制效果[J].现代农业科技,2006(04):44-46.
Gao J S,Zhang A Q,Li Z Y.Species of natural enemies in ap‐ple orchards and their control effect on main pests in apple orchards[J].Modern Agricultural Science and Technology, 2006(04):44-46.
[2]乔岩,岳瑾,王品舒,等.北京地区果园害虫绿色防控关键技
术集成示范与推广[J].中国植保导刊,2017,37(05):89-91.
Qiao Y,Yue J,Wang P S,et al.Integrated demonstration
and
图2桔小实蝇原始图像、第一层识别图像、第二层识别图像
Fig.2The original image of Bactrocera dorsalis,the identification image of the first layer and the identification image of the second layer
117
农业大数据学报:数据论文第4卷第1期
promotion of key technologies for green pest control in or‐chards in Beijing[J].China Plant Protection,2017,37(05): 89-91.
[3]孙益知.果园害虫胡蜂的发生与防治[J].西北园艺(果树),
2006(02):27.
Sun Y Z.Occurrence and control of the pest wasp in orchard [J].Northwest Horticulture,2006(02):27.
[4]李文勇.基于机器视觉的果园性诱害虫在线识别与计数方
法研究[D].北京:中国农业大学,2015.
Li W Y.Research on Online Identification and Counting Method of Orchard Sexually Lured Pests Based on Machine Vision[D].Beijing:China Agricultural University,2015. [5]程鲁玉,孟小艳,达新民.关于果林中果害虫图像特征高效
分类识别仿真[J].计算机仿真,2018,35(02):425-428.
Cheng L Y,Meng X Y,Da X M.Efficient classification and recognition simulation of fruit pest in fruit forest[J].Comput‐er Simulation,2018,35(02):425-428.
[6]田冉,陈梅香,董大明,等.红外传感器与机器视觉融合的果
树害虫识别及计数方法[J].农业工程学报,2016,32(20): 195-201.
Tian R,Chen M X,Dong D M,et al.Identification and count‐ing method of fruit tree pests by fusion of infrared sensor and machine vision[J].Transactions of the Chinese Society of Ag‐ricultural Engineering,2016,32(20):195-201.
[7]山东农业大学.2016-2020年北京苹果园病虫害发生数据
库.CSTR:17058.11.E0005.20210706.30.ds.0444.
Shandong Agricultural University.Database of Diseases and insect pests in Beijing Apple orchards from2016to2020.
CSTR:17058.11.E0005.20210706.30.ds.0444.
[8]樊景超.基于MobileNets的果园害虫分类识别模型研究[J].
天津农业科学,2018,24(09):11-13+26.
Fan J C.Research on Orchard Pest Classification and Identifi‐cation Model Based on MobileNets[J].Tianjin Agricultural Sciences,2018,24(09):11-13+26.
[9]张红涛,毛罕平,邱道尹.储粮害虫图像识别中的特征提取
[J].农业工程学报,2009,25(02):126-130.
Zhang H T,Mao H P,Qiu D Y.Feature extraction in image recognition of stored grain pests[J].Transactions of the Chi‐nese Society of Agricultural Engineering,2009,25(02): 126-130.
[10]杨国国,鲍一丹,刘子毅.基于图像显著性分析与卷积神经
网络的茶园害虫定位与识别[J].农业工程学报,2017,33
(06):156-162.
Yang G G,Bao Y D,Liu Z Y.Location and recognition of tea garden pests based on image saliency analysis and con‐volutional neural network[J].Transactions of the Chinese Society of Agricultural Engineering,2017,33(06):156-162.
[11]马梦园.基于深度学习的鳞翅目昆虫图像处理研究[D].
杭州:浙江工商大学,2018.
Ma M Y.Image processing of lepidopteran insects based on deep learning[D].Hangzhou:Zhejiang Gongshang Universi‐ty,2018.
[12]朱芸芸.基于卷积神经网络的图像分类方法研究[D].北
京:北京交通大学,2016.
Zhu Y Y.Research on Image Classification Method Based on Convolutional Neural Network[D].Beijing:Beijing Jiao‐tong University,2016.
[13]姚侃,徐鹏,张广群,等.基于图像的昆虫分类识别研究综述
[J].智能计算机与应用,2019,9(03):29-35.
Yao K,Xu P,Zhang G Q,et al.An overview of research on insect classification and recognition based on image[J].In‐telligent Computer and Application,2019,9(03):29-35. [14]冼鼎翔,姚青,杨保军,等.基于图像的水稻灯诱害虫自动识
别技术的研究[J].中国水稻科学,2015,29(03):299-304.
Xian D X,Yao Q,Yang B J,et al.Research on automatic recognition technology of rice lamp lure pests based on im‐age[J].Chinese Journal of Rice Science,2015,29(03): 299-304.
[15]秦放.基于深度学习的昆虫图像识别研究[D].成都:西南
交通大学,2018.
Qin F.Research on insect image recognition based on deep learning[D].Chengdu:Southwest Jiaotong University,2018.
[16]罗桂兰,王熙,郝鸿俊,等.一种微型昆虫图像智能识别方法
[J].大理大学学报,2020,5(06):7-13.
Luo G L,Wang X,Hao H J,et al.An intelligent image rec‐ognition method for miniature insects is presented[J].Jour‐nal of Dali University,2020,5(06):7-13.
[17]张维彬,李华.果园害虫的生态防控技术[J].现代农业科
技,2008(11):155.
Zhang W B,Li H.Ecological control technology of orchard pests[J].Modern Agricultural Science and Technology,2008
(11):155.
[18]李文勇,陈梅香,李明,等.基于姿态描述的果园靶标害虫自
动识别方法[J].农业机械学报,2014,45(11):54-59.
Li W Y,Chen M X,Li M,et al.A method for automatic iden‐tification of orchard target pests based on attitude descrip‐tion[J].Transactions of The Chinese Society of Agricultural Machinery,2014,45(11):54-59.
引用数据
[1]张翔鹤,王晓丽,刘婷婷,等.桔小实蝇等六种常
见果园害虫图像数据集[DB/OL].国家农业科学数据中心.DOI:10.12205/asda.j00003.00008.
Zhang X H,Wang X L,Liu T T,et al.Image data set of six common orchard pests such as Bactrocera dorsalis[DB/OL].National Agriculture Science Da‐ta Center.DOI:10.12205/asda.j00003.00008.
118。