玉米品质鉴定

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

玉米营养品质的快速鉴定

摘要:光谱检测法作为玉米营养品质含量的快速分析方法,首先需要根据常规

生化检测数据结合光谱响应数据完成合理的定标与矫正,建立合适的数据分析模型。在进行光谱检测时,由于光谱波长区间大、波长取值点较多,对快速分析带来了不便。首先,本文采用R型聚类的方法,将区间内所有波长分成5类,采用相关性分析,从中筛选出5个代表波长作为研究对象。其次利用多元线性回归的方法,对代表波长的响应数据和蛋白质含量进行回归分析,得出蛋白质含量与光谱响应数据之间的关系,建立了蛋白质含量的光谱分析模型。结合F检验、残差数据分析等方法得出所建立的模型可信的结论。然后,给出以残差平方和为指标的模型评价体系,并讨论了模型的适用范围。其次,对剩余26个样本的蛋白质含量进行了预测。最后,针对多输入多输出的问题,本文采用BP神经网络模型,对样本数据进行学习与训练,在对第81-100个样本进行检验并符合要求之后,建立了三种营养成分的快速检测模型。然后分别对26个样本的蛋白质含量、纤维素含量和脂肪含量进行了预测。

关键词:聚类分析;多元回归;BP神经网络

1 问题重述

玉米是生态农业的关键农作物之一,玉米中富含蛋白质、纤维素、脂肪、水溶性多糖和糖醇类等多种生理活性物质。玉米的营养品质是指玉米中所含的各种营养成分(蛋白、纤维素、脂肪等)。为了实行优质玉米的培养,需要实现玉米营养品质的快速鉴定。

玉米营养品质的鉴定需要对主要营养成分的含量进行检测。光谱检测法是能够检测物质成分含量的快速分析方法,它可以根据物质的光谱响应特征来鉴别物质并确定化学组成和相对含量,具有测定时间短、非破坏性、多指标同时测定等优点,能够实现在线、实时、原位的定量分析与监测。光谱检测分析首先需要根据常规生化检测数据结合光谱响应数据完成合理的定标与矫正过程,建立合适的数据分析模型,进而实现对物质成分的快速检测。

准备126个玉米样品,经过物理方法加工为粉末状。采用Fourier 近红外光谱分析仪采集光谱数据,同一样品对不同频率的光产生不同的响应,光波长变化范围为10000~40001cm -(其中1cm -为光波长单位),得到所有样品的光谱响应数据。为完成光谱建模实现快速检测,采用常规生化方法检测前100个玉米样品的蛋白、纤维素和脂肪的成分含量值。

现需要结合测定的数据建立数学模型解决下列问题:

1、根据前100个样品的光谱响应数据和蛋白含量的生化检测值,建立单一成分的光谱分析模型;拟定模型评价指标,并讨论模型的适用范围。

2、根据所建立的数学模型,估算其余26个玉米样品(编号101~126)的蛋白含量。

3、结合玉米的光谱响应数据和蛋白质、纤维素、脂肪三种营养成分的生化检测值,设计合理的玉米营养品质快速检测方案建立数学模型;进一步利用模型估算其余26个玉米样品中蛋白质、纤维素、脂肪三种营养成分含量。

2 问题分析

问题一的分析:光谱检测可以根据物质的光谱响应特征来鉴别物质并确定化学组成和相对含量。现已知100个样品的光谱响应数据和蛋白质的生化检测含量,建立光谱分析模型,就是根据常规生化检测数据结合光谱响应数据完成合理的定标与矫正。由于不同样品的蛋白质、纤维素、脂肪等营养成分含量的不同,导致不同样品对于不同频率光谱的响应数据也不同。对于一种样品,其蛋白质元素含量与光谱响应数据存在一定的关系,本问就是要通过已知的100个样品的数据,确定两者之间的关系。通过对已知数据的分析知,样品对不同波长的响应特征与蛋白质含量是多对一的关系,本文采用多元线性回归分析建立光谱分析模型,明确了两者的关系函数。同一样品对不同波长的响应有390组数据,这组数据维数过大,为了方便模型的建立与求解,在实际操作过程中,可选取有代表意义,可以更多的体现蛋白质含量和光谱响应数据关系的波长来进行建模。本文采用聚类分析的方法筛选出具有代表意义的波长数据,然后建立多元回归分析模型,求解出蛋白质含量和光谱响应数据之间的关系,即光谱分析模型。最后以误差平方和为评价指标,并对线性回归模型的适用范围进行了分析。

问题二的分析:本问要根据上一问所建立的光谱分析模型,估算剩余样品的蛋白质含量。将剩余样品的光谱响应数据带入上一问求解得到的线性回归方程,

可得到剩余样品的蛋白质含量。

问题三的分析:本问要设计合理的玉米营养品质快速检测方案建立数学模型,就是根据前100个样品的光谱响应数据和蛋白质、纤维素、脂肪三种营养成分含量,建立两者之间的关系。这是一个多输入多输出的模型,本文采用BP 神经网络,通过网络不断地学习,使实际输出与期望尽可能地相近,即使网络输出层的误差平方和达到最小,从而建立玉米营养品质快速检测方案模型。最后本文利用上述检测模型,对其余26种样品的蛋白质、纤维素、脂肪三种营养成分含量进行了预测。

3 模型假设与符号说明

3.1模型假设

(1)在整个光谱检测过程中,不存在人为和外部环境因素的干扰;

(2)假设10000-4000 1cm -为测定玉米中蛋白质、脂肪、纤维素含量的有效波段;

(3)假设蛋白质、脂肪、纤维素含量的检测之间没有相互影响 。

3.2 符号说明

ij x

第i 个玉米样品的第j 个波长指标变量的响应数据; ij x 中心化变换后的响应数据; jk r 两变量

j x 与k x 的样本相关系数; j

β 变量j x 的回归系数; i

y 第i 个样品的蛋白质含量实测数据; ˆi y 第i 个样品的蛋白质含量估计数据;

Q 误差平方和;

U 回归平方和;

R 称为复相关系数;

ij w 表示隐含层第i 个节点到输入层第j 个节点之间的权值;

i θ 表示隐含层第i 个节点的阈值;

()x φ 表示隐含层的激励函数;

ki w 表示输出层第k 个节点到隐含层第i 个节点之间的权值;

k a 表示输出层第k 个节点的阈值;

相关文档
最新文档