机器学习算法的发展及其在食品领域的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
机器学习算法的发展及其在食品领域的应
用
朱尹
摘要:简介了机器学习,叙述了机器学习的发展,叙述了机器学习算法在食品领域的应用。
关键词:机器学习,人工神经网络,食品
在《机器学习》一书中,机器学习(Machine Learning, ML)的定义为:关于某类任务 T 和性能度量P,如果一个计算机程序能在T上以P衡量的性能随着经验E 而自我完善,那么我们称这个计算机程序在从经验E 中学习。通俗来说,机器学习是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。下面本文就机器学习算法的发展及在食品领域的应用做相关讨论。
1.机器学习的发展
发展过程大体上可分为4个时期
1.1第一阶段:热烈时期
第一阶段是20世纪50年代中叶到60年代中叶,属于热烈时期。在这个时期,所研究的是“没有知识”的学
习,即“无知”学习。其研究目标是各类自组织系统和自适应系统,其主要研究方法是不断修改系统的控制参数和改进系统的执行能力,不涉及与具体任务有关的知识。本阶段的代表性工作是:塞缪尔(Samuel)的下棋程序。但这种学习的结果远不能满足人们对机器学习系统的期望。
1.2第二阶段:冷静时期
第二阶段是在60年代中叶到70年代中叶,被称为机器学习的冷静时期。本阶段的研究目标是模拟人类的概念学习过程,并采用逻辑结构或图结构作为机器内部描述。本阶段的代表性工作有温斯顿(Winston)的结构学习系统和海斯罗思(Hayes-Roth)等的基本逻辑的归纳学习系统。
1.3第三阶段:复兴时期
第三阶段从20世纪70年代中叶到80年代中叶,称为复兴时期。在此期间,人们从学习单个概念扩展到学习多个概念,探索不同的学习策略和方法,且在本阶段已开始把学习系统与各种应用结合起来,并取得很大的成功,促进机器学习的发展。1980年,在美国的卡内基—梅隆(CMU)召开了第一届机器学习国际研讨会,标志着机器学习研究已在全世界兴起。
的最新阶段始于1986年。
1.4新时期
机器学习进入新阶段的重要表现在下列诸方面:(1) 机器学习已成为新的边缘学科并在高校形成一门课程。它综合、生物学和神经生理学以及数学、自动化和形成机器学习理论基础。
(2) 结合各种学习方法,取长补短的多种形式的系统研究正在兴起。特别是连接学习符号学习的耦合可以更好地解决连续性信号处理中知识与技能的获取与求精问题而受到重视。
(3) 机器学习与各种基础问题的统一性观点正在形成。例如学习与结合进行、知识表达便于学习的观点产生了通用智能系统SOAR的组块学习。类比学习与结合的基于案例方法已成为经验学习的重要方向。(4) 各种学习方法的应用范围不断扩大,一部分已形成商品。归纳学习的工具已在诊断分类型中广泛使用。连接学习在声图文识别中占优势。分析学习已用于设计综合型。与在工程控制中有较好的应用前景。与符号系统耦合的神经网络连接学习将在企业的智能管理与智能机器人运动规划中发挥作用。
(5) 与机器学习有关的学术活动空前活跃。国际上除每年一次的机器学习研讨会外,还有计算机学习理论会议以及遗传算法会议。
2.机器学习算法在食品领域的应用
机器学习的目标就是在一定的网络结构基础上,构建数学模型,选择相应的学习方式和训练方法,学习输入数据的数据结构和内在模式,不断调整网络参数,通过数学工具求解模型最优化的预测反馈,提高泛化能力、防止过拟合。机器学习算法主要是指通过数学及统计方法求解最优化问题的步骤和过程,在食品领域具有广泛应用,下面以机器人工神经网络举例介绍。
2.1.人工神经网络简介
人工神经网络(Artificial Neural Network,即ANN)是由大量处理单元互联组成的非线性、自适应信息处理系统。它是在现代研究成果的基础上提出的,试图通过模拟大脑神经网络处理、记忆信息的方式进行信息处理。它从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,
权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。常用的神经网络有BP、RBF、SOM、Hopfield等等,其功能不经相同
2.2.人工神经网络在食品领域的应用
2.2.1 水果分级和分类
杨宝华等人利用BP神经网络研究了西瓜种仁质量的预测。根据园艺试验田多年跟踪测量西瓜生长指标,随机抽取每年的部分数据来预测种仁质量,输出层节点代表种仁质量。其设计的神经网络的预测模型确定输入层为4个神经元,计算隐层神经元数确定为4,输出因子为1个,所以确定输出层为1个神经元。设定最大的迭代次数为100次,系统全局误差小于
0.001。经过6次训练后,网络的目标误差达到要求,用训练好的网络预测输入向量,仿真输出结果。将预测值与待预测目标值比较,计算相对误差,结果相对误差在20%上下波动。考虑到样本的数据较少,还有数据测量的偏差,这个误差是可以接受的。BP网络经有效训练后应用于西瓜仁质量预测,具有较高的预测精度和良好的泛化能力。
Kondo等人通过机器视觉系统采集“Izokan”甜橙图像,以图像红色分量R与绿色分量G的比率、果形指
数、质量和果面粗糙度为输入,以糖酸含量为输出,建立“Izokan”甜橙糖酸度神经网络模型。试验结果表明,糖酸含量的实际值与预测值间相关系数都不高于0.84。
应义斌等人以表面色泽与固酸比为柑橘成熟度指标,建立柑橘成熟度的机器视觉检测系统,柑橘成熟度的判别准确率达到91.67%;以色度值在图像中出现的频率作为柑橘成熟度的依据,通过神经网络映射柑橘是否成熟的正确判断率为77.80%。
2.2.2液体食品的检测
酒陈化的机制至今仍未完全清楚,环境条件、桶的使用、桶的质量和陈化前酒的质量等都会影响陈化的结果。这个建模过程是非常复杂,高度非线性,且对最终产品的质量评定缺乏客观的指标。Raptis等人以陈化的葡萄酒为研究对象,分别建立其风味及口感与各因素的联系。以橡木桶的使用次数、使用长度和葡萄酒的年份作为输入,风味(或口感)作为神经网络输出,风味与口感由专家进行打分得到。对风味与口感分别取140组样品训练,以20组未知样本进行验证,ANN所得结果与专家的评分十分相近。
2.2.3 粮食含水量的检测