机器学习技术在现代农业中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
机器学习技术在现代农业中的应用作者:牟文芊
来源:《电子技术与软件工程》2018年第18期
摘要:机器学习是人工智能的核心内容之一,其应用已经渗透到了人类社会的各个领域。本文阐述了机器学习的基本概念和基本原理,介绍了几种常用的机器学习方法的基本概念和基本原理。在此基础上,以农业为背景,介绍了机器学习技术在现代农业中的应用。
【关键词】现代农业机器学习人工智能
1 引言
农业农村发展关系到我国实现小康社会的战略目标能否如期实现,而现代农业则是推动农业农村发展的关键要素。机器学习是人工智能研究的核心之一,将机器学习应用于现代农业生产中,能够有效地推动现代农业的发展,推进实现农业生产自动化和智能化,提高农业生产的效率。
2 机器学习
机器学习是让计算机模拟人的学习活动,获取新知识、不断改善性能和实现自身完善的智能方法。机器学习方法分为有监督学习、半监督学习和无监督学习。
2.1 有监督学习
有监督学习首先利用有标号的样本进行训练,构建相应的学习模型。再利用该模型对未知样本数据进行分類和预测。这个学习过程与人类认识事物的过程非常相似。
2.2 无监督学习
无监督学习是通过对无标签样本进行的学习,即事先并不需要知道样本的类别,而是通过某种方法,按照相似度的大小进行分类。这种学习方法直接对数据进行建模,并不需要任何训练样本。
2.3 半监督学习
半监督学习是有监督学习和无监督学习的结合,是利用有类标号的数据和无类标号的数据进行学习的过程。其特点是利用少量有标号样本和大量无标号样本进行机器学习。现实世界尤其是现代农业中通常存在大量的未标注样本,但有标记样本则比较少,面对大量的无标号样本的标注,费时、费力和成本较高。因此半监督学习的研究对于实际应用是非常有意义的。
下面介绍几种常用的机器学习算法。
2.1 决策树
决策树( Decision Tree,DT)是一种常见的归纳学习,能够从一组无规则的事例中推理出决策树的表示形式,常用来构建或设计分类器和预测模型,对未知数据进行分类或预测等。
决策树算法包括两个步骤:
(1)利用训练样本数据来创建决策树模型;
(2)利用创建的决策树模型对新数据进行分类。创建决策树的流程如图1所示,其中S 表示训练样本集,A表示分类样本集合,N表示叶节点。
2.2 人工神经网络
人工神经网络( Artificial NeuralNetwork,ANN)是一种模仿自然界神经网络的功能和结构,通过调整内部大量人工神经元之间相互连接的权重,对信息进行处理的数学模型。人工神经元结构由输入向量、激活函数及输出向量三部分组成。输入向量X= {xo0,x1.. x n}与对应的权值向量w= {w0,W1…W n}分别相乘,再取和作为输入值(
),w和x倒过来在激活函数的作用下输出对应的f(∑x i.w i+b),其中b为激活函数的闽值,人工神经元的结构如图2所示。目前ANN已经广泛应用于信息处理、预测分析等领域。
2.3 支持向量机
支持向量机是一种建立在统计学习理论基础上的一种机器学习算法。这种算法在解决有限样本、非线性、高维的模式分类等问题中表现出许多独特的优势。在深度学习的热潮来临之前,支持向量机一直在机器学习领域占有重要的地位。
支持向量机通过非线性映射,把样本空间映射到更高维的特征空间中,使非线性可分问题转化为在特征空间中的线性可分。在一般情况下,升维使计算变得更加困难,但是支持向量机应用核函数展开定理解决了这个难题。如图3所示,支持向量机使用一个超平面把训练集中两类样本分开,即两类点分别在超平面的两侧。作为一种有效的机器学习工具,支持向量机广泛地应用于各个领域。
2.4 聚类
聚类是将数据集中的所有样本根据相似度的大小进行划分,形成两个或多个类的过程。聚类没有训练过程,即聚类不需要样本有标号,而分类需要有标号的样本进行训练。常用的聚类算法是基于层次和基于划分的聚类。基于层次的聚类主要有:平衡迭代削减聚类法、基于密度的聚类方法和使用代表点的聚类方法等;基于划分的聚类方法主要有:K均值聚类算法、K中心点算法和随机搜索聚类算法等。聚类算法常用于数据挖掘和模式识别中。其中K均值聚类算法最为常用,它采用距离作为相似性的评价指标,即认为两个样本的距离越近,其相似度就越大。图4为K均值聚类算法流程。
2.5 深度学习
深度学习是机器学习的一个分支,它是在人工神经网络基础上发展起来的,最早由加拿大多伦多大学辛顿教授于2006年提出。深度学习中的“深度”,是相对于支持向量机和多层感知机等“浅层学习”方法而言的。深度学习与“浅层学习”相比,非线性操作的层级数更多。它通过对原始输入进行逐层特征变换,能够自动地学习得到输入数据特征的表示,因此在分类问题上取得了更好的效果。常用的深度学习方法有CNN和自动编码器等。目前深度学习已经在图像识别和语音识别中的应用取得了突破性的进展。2012年,Hinton团队在ImageNet图片分类大赛中,使用深度学习技术取得了冠军。
3 机器学习技术在现代农业中的应用
机器学习技术在现代农业中正在发挥着积极的重要作用,本文主要从5个方面阐述如下。
3.1 作物育种
作物育种是一种通过改良作物的遗传特性,来培育高产优质品种的技术。农业育种专家通过寻找优良性状来提高农作物产量,更高效地利用水分、养分,适应气候变化和抵御病虫害,实现农业作物的高产和稳产等。植株遗传优良性状的关键在于必须找到其对应的基因序列。机器学习技术能够分析以往的农田数据,包括农作物在不同气候条件下的表现和某种特定表型的遗传性等,挖掘出其中的关联规则,然后搭建概率模型,预测哪些基因最有可能参与植物的某种优良性状的表达,帮助育种专家进行合理的育种实验。机器学习技术应用于作物育种,不仅提高了育种的效率,而且能够帮助育种专家对更多的变量进行评估,提高了育种的准确率。
3.2 农作物病害识别
病害是导致农作物减产的重要因素之一,传统的农作物病害识别方法基本上是依靠相关专家的专业知识和工作经验进行识别,费时费力,效率较低,并且容易产生人为误差,严重影响农作物病害防治工作的高效性。深度学习通过训练大量农作物病害图像,能够从中自动学习每种病害特征的表示,并建立相应的预测模型。农户将遥感卫星和无人机等拍下的农田影像资料以及智能手机拍摄的照片上传到云平台后,模型能够自动确定其所属的病害类别,不仅提高了检测的效率,而且实现了更精准的病害诊断,减少了因失误造成的资源浪费。
3.3 农作物虫害预测
虫害是危害农产物产量和品质的重要因素,我国农作物虫害种类多、影响范围广,防治不及时易爆发,对作物生产造成了严重影响。对虫害发生程度进行准确的预测,在我国的农作物安全生产中具有重要的地位。只有准确预测农作物虫害的发生才能为各类农业政策的制定提供有效参考,及时地采取预防措施,做到早防早治,降低造成的经济损失。通过对虫害发生程度与空气气温、土壤湿度、天气状况和农药施用量等多个外部环境因子建立回归模型,掌握其发生规律,能够有效对未来虫害发生程度进行预报。目前,马尔科夫链、支持向量回归、神经网络和深度回归等己被广泛地应用于虫害发生的预测中。
3.3 灌溉用水分析
在确保农作物生长所需用水量的前提下,减少因水量不足或过多所导致农作物旱涝情况的发生,保证农作物高产稳产,是现代农业灌溉中急需解决的问题之一。利用机器学习技术对农作物用水需求量、蒸发蒸腾量和水文气象指数等数据进行挖掘分析,构建智能灌溉控制系统,为农作物提供最有效的灌溉策略。智能灌溉系统可利用物联网技术在监测控制区域部署无线网络、传感器节点和灌溉设备,通过感知土壤水分,对土壤质量实时监测,来设置科学合理的灌溉水量,针对不同环境灵活选择不同的灌溉模式,在保证农作物生长的同时,也节约了灌溉用水。
3.4 农业专家系统