智能控制翻译..
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
智能控制导论大作业
学号:021151**
姓名:**
任课教师:吴**
目录
一、说明…………………………………………………………………
I.文章出处…………………………………………………………
二、论文翻译……………………………………………………………
I.摘要……………………………………………………………… II.引言……………………………………………………………… III.背景信息…………………………………………………………… IV.神经网络整体结构……………………………………………… V.神经网络的整体的标定中的应用……………………………… VI.总结………………………………………………………………
三、课程与论文关系……………………………………………………
四、智能导论课程总结…………………………………………………
一、说明
本次大作业针对“Improved Calibration of Near-Infrared Spectra by Using Ensembles of Neural Network Models”文章进行翻译。
这篇文章摘自IEEE SENSORS JOURNAL, VOL. 10, NO. 3, MARCH 2010。
作者是Abhisek Ukil, Member, IEEE, Jakob Bernasconi, Hubert Braendle, Henry Buijs, and Sacha Bonenfant。
二、论文翻译
利用神经网络模型整体对近红外光谱校正改进
摘要:
红外(IR)或近红外(NIR)光谱技术是用来识别一种混合物或来分析材料的组成的方法。
NIR光谱的校准是指利用光谱的多变量描述来预测各组分的浓度。
建立一个校正模型,最先进的软件主要使用线性回归技术。
对于非线性校正问题,基于神经网络的模型已经被证明是一个有意义的选择。
在本文中,我们提出了一个新的基于神经网络的扩展传统的方法,利用神经网络模型整体。
个别神经网络是从重采样与引导或交叉验证技术训练信息数据中获得。
在一个现实的校准实施例中得到的结果表明,该集合为基础的方法,会产生一个比传统的回归方法更显著更精确和鲁棒性强的校准模型。
关键词:
自举,校准,计量学,交叉验证,傅立叶变换,近红外(NIR),近红外光谱仪,神经网络,光谱。
I.引言:
红外(IR)或近红外(NIR)光谱技术是用来识别一种混合物或来分析材料的组成的方法。
这是通过学习物质与红外光间相互作用而完成的。
红外/近红外光谱是指红外光的吸收为波长的函数。
在红外光谱中,考虑的频率范围通常是14000和10厘米分之一。
注意,所施加的频率刻度是波数(以厘米倒数为单位),而不是波长(以微米为单位)。
该材料在不同频率下的吸收测定中的百分比。
“化学计量学”是数学和统计方法的应用,以化学数据的分析,例如,多元校正,信号处理/调节,模式识别,实验设计等。
在化学计量学,校准是通过使用光谱多变量描述符来预测不同成分的浓度来实现。
在本文中,我们提出并分析采用基于神经网络的校正模型整体。
整体的个别型通过重新取样与引导或交叉验证技术的原始训练数据的实现。
该集成模型被示为导致显著改善预测精度和鲁棒性,当与常规的校准方法相比。
在本文的其余部分安排如下。
在第二节中,提供有关工作的背景信息。
这包括使用的光谱仪,数据采样,目前最先进的校准方法和基于神经网络的校准模型的信息。
第三节介绍了
利用神经网络整体的概念。
神经网络模型的集成应用校准的目的的一个例子是在第四节和第五节总结了我们的结论。
II.背景信息:
A.仪器
在这项研究中,傅立叶变换近红外光谱仪,型号ABB FTLA2000-160,FTPA2000-160,从ABB 分析(BOMEM),魁北克,加拿大被使用。
B.数据集和样品光谱
在本研究中使用的数据是一组493个样本的清洗液,主要是用来从计算机芯片的硅表面上去除微粒。
该溶液具有两个化学成分,以下简称为组件1或C 1和组分2或C 2。
部件1的浓度是在大约的范围从0%到3%,并且该组件2从0%至7%,其余成分为水。
这样的解决方案以不同浓度的组分1和2的光谱收集在不同温度下,并用前面提到的光谱仪。
样品光谱的测定在单光束方式,然后转化成相对于一个参考光谱的相对吸收光谱。
这显示在图1
图1.样品的光谱采集
从图1,可以看出,下面5000厘米-1区域不能使用,因为它是低于检测器的截止限制,并且5000-7200厘米-1之间的区域经常被水饱和。
通常,我们使用了范围7600和11000厘米-1之间,其中光谱不是太嘈杂,而吸光率低于1。
采集后,其光谱基线被校正,和用于整个实验
的相应的493光谱示于图2。
图2.493本研究中使用的光谱基线校正
C.校准计量学
发现从频谱,导致在材料的组合物所期望的信息模型参数的过程称为校准。
在化学计量学,校准是通过使用光谱多变量描述符来预测各组分的浓度来实现。
在化学计量校准的顺序的步骤示于下图。
光谱先经过预处理的标准技术,如多元散射校正,基线校正,Savitzsky-Golay平滑等,以补偿由于不同类型的仪器变化,改变在实验室条件下,改变了探针,等等。
在此之后,修正的光谱变换成特征矢量与数据点的数量减少。
使用诸如简单的波长选择(如技术,选择每一个这是通过n次波数),偏最小二乘(PLS),主成分分析(PCA)等数据减少是必要的,以避免校正模型,这将导致不好结果的过度拟合。
之后的预处理和数据还原步骤,回归模型是使用频谱特征向量和从实验室试验所测量的化学物浓度建
立。
相应的校准模型可以是线性的(例如,线性回归)或非线性(如神经网络)。
图3. 在近红外光谱的校准的典型步骤
图4.一个多层感知器的基本结构
D.校正的神经网络为基础的模式
人工神经网络(ANN,或者NNS)是由生物神经系统的启发,并包含简单的处理单元(人工神经元)且由加权连接互连。
主要使用结构是一个多层前馈网络(多层感知器),即在节点(神经元)被布置在多个层(输入层,隐含层,输出层)和信息流是唯一的相邻层,见图4。
一种人工神经元是一个非常简单的处理单元。
它可以计算其输入的加权和,并把它传递通过一个非线性传递函数来产生输出信号。
在主要使用的传递函数是所谓的“S形”或“挤压”作用,压缩一个无限大的输入范围是有限的输出范围。
神经网络可以被“训练”,以解决难以通过常规的计算机算法来解决问题。
训练是指连接权重的调整,基于多个训练实例是由指定的输入和相应的目标输出。
训练是一个渐进的过程,其中一个训练样本的每个演示文稿后,进行权重调整,以减少网络和目标输出之间的差异。
流行的学习算法是梯度下降(例如,误差反向传播),赫布学习,径向基函数的调整等。
虽然目前的最先进的校准软件主要依靠线性回归,神经网络越来越多地用于化学计量校准的目的,特别是当光谱和组分浓度之间的关系被怀疑是非线性的。
例如,讨论了利用人工神经网络作为可能的候选人的近红外光谱数据的多元校正。
Geladi用PLS和ANN建立校正模型,并Duponchel利用人工神经网络用于近红外光谱仪的标准化。
Benoudjit比较了不同的非线性技术和人工神经网络识别为基础的方法是一个很有前途的技术为化学计量校准。
Kohonen 神经网络已用于校准的问题在吸收光谱由海顿和古达克采用基于神经网络技术的标准化和质谱仪实验室间的校准。
对于神经网络的应用程序的校验问题的其他例子由布里尔顿引用。
我们目前工作的动机,超越了利用神经网络的近红外光谱仪的校准。
为了提高基于ANN 的校准方法的精度和鲁棒性,我们建议使用一个的整体的神经网络模型。
在本文的其余部分,相应的方法将被引入讨论,最后施加到所述数据集中的第Ⅱ-B 。
III.神经网络整体结构
A 预测模型的组合
非线性校正模型,如神经网络,有许多比传统的线性回归模型的优势。
神经网络的弱点,就是相应的学习算法只能保证收敛到最近的局部最优。
不同的初始权重,例如,可能会因此导致不同的校准模式。
另一方面,可以变成以神经网络为基础的校准方法的另一个优点。
众所周知,不同的预测模式的组合可以导致预测精度大幅度提高。
此外,相应的集合预测也比单一模型的预测更强劲。
在这里,我们限制我们的讨论,以最简单的组合(即算术平均)n 个人预测。
使用一些代数,我们可以证明下面的有趣的关系:
其中:
也被称为“模糊”,并代表该个体的预测的方差。
方程表明,该集合的预测误差总是比单独预测的平均预测误差小。
我们还看到,在准确的增益与个人的预测(前提是他们的平均预测误差不按比例增长)之间的分歧日益增大。
神经网络特别适合于产生不同的单独的预测模型。
我们可以,例如,改变网络的体系结构(例如,隐藏单元的数量)或简单地使用不同的初始权值或训练样本的不同子集。
在我们的分析中,我们主要用来引导和交叉验证,以产生不同的神经网络的校正模型的整体。
这两种技术进行了简要简要说明。
B .自举
个体神经网络的训练与不同的训练集是从训练样本集随机选择的样本生成。
因此,所有的训练集的样本数与原来的训练集相同,但在每一组中,一些样品发生丢失而一些发生几次丢失。
最初开发估计的统计估计的抽样分布。
从有限的数据,自举技术在无数的工程领域得以应用。
C.交叉验证整体 在神经网络的“交叉验证整体”,从现有的一套产生不同的训练集留出一个给定数量的训练样本样品。
该训练集对个体校正模型,因此,所有的组成样品,并且它们应
优选被选择,使得它们具有最小的重叠。
D.置信区间的估计 可以证明,预测的标准偏差,即模糊的平方根
可以用于构造置信区间的集合预报:
其中取决于所需的置信水平。
必须指出的是,这些置信区间仅反映了模型的不确定性,对于一组给定的训练样本并且不包括出现的。
例如,从测量误差,并从不同的测量条件下预测的不确定性。
标准差之间的相关性和预测误差呈现从一个简单的测试一些说明性的结果与
数据的数量有限(20培训和60的测试样品,从数据集,在所述取第Ⅱ-B )。
结果示于图5,其指的是10线性回归模型的整体对于组分1(基于频谱的前六个主要部件和在该测量是在温度)。
个别线性回归模型对应不同的自举训练集。
图5.置信区间来自对光谱数据校准的一个简单的集成模型,
图1表明,20个训练样本
图2显示60个测试样品从DataSet中提到的第II-B
IV.神经网络的整体的标定中的应用
在本节中,我们使用基于神经网络的校正模型整体这一概念中描述的示例数据集的优势
来进行仿真演示。
对于第一组测试结果,我们开始了训练组包括27个样品,从现有的493样品,即随机选择的,我们有466样本作为测试数据。
在每次迭代中,我们再加入30个随机选择的样本训练集。
对于特征矢量的结构,我们使用PLS 和PCA 与5的系数。
要生成整体的个别型号,我们采用自举(70引导模式)或交叉验证(离开了样本的20%)。
采用的神经网络模型有十隐层节点。
为了防止过度拟合,早期停药(最多20个训练迭代)使用。
此外,为了克服与局部极小的问题,每一个模型被训练10次不同的初始权重,和被选择的模型的最佳训练集的性能。
这产生比平均十个训练运行较好的效果。
我们还比较了对国家的最先进的使用GRAMS 软件方法的结果。
A.分析
对于不同的测试,我们使用PLS 和基于PCA 的特征向量的五个系数。
我们认为与任一自举或交叉验证训练集(交叉验证总称为随机留出的样品的20%)中生成的70 NN 模型整体。
为了便于比较,我们也用单NN 模型(PLS 与特征向量)表示了训练结果,同一组训练样本的均方根误差值的测试样品与输入样本的不同方法的数目绘于图,并总结于表格。
在MATLAB 神经网络工具箱被用于分析。
图6.测试设置均方根误差为组件1对训练样本的数量:不同方法的比较。
图7.测试设置均方根误差为组分2对训练样本的数量:不同方法的比较。
但是应当指出,在图中和表中,后缀5中“PLS5”和“PCA5”表示的系数的数目,如5 PLS或PCA系数。
另外,在本申请中,没有PLS回归被卷入。
PLS因素进行了通过使用频谱的预测的光谱本身(不涉及任何浓度),这是类似于PCA用作数据还原步骤。
对于GRAMS 结果,最佳的测试被认为是计算出来的软件。
这涉及通常的交叉验证法来确定用于构建训练集的模型,从而产生最佳的测试精度的因素(潜变量)的最佳数目。
这就是为什么因素没有具体的数目,提及用于GRAMS结果,这是对于不同的试验样品的不同结果。
我们注意到,相同的训练集和测试集分别在所有不同的方法中使用,也就是说,我们一直跟踪哪些样品加在每个迭代步骤,并一直使用同一组样本的不同方法。
B.讨论
从图和表中,显而易见的是,引导和交叉验证的训练样本,即利用神经网络模型整体通常导致更好的精度来预测未知测试样品的浓度比线性回归或传统的单神经网络方法。
特别
是,我们可以提出如下意见。
1. 对于组件1,我们看到,随着五PLS系数特征向量,引导或交叉验证始终产生了良好的效果。
测试集精度的不同的方法来接近,当我们有一个相当大数量的训练样本(例如,267的训练和测试226个样本)的。
使用5 PCA系数和70自举NN-模型的特征矢量,我们实现了最好的结果。
2. 传统的神经网络为基础的方法,而不涉及整体的概念,产生比GRAMS较好的效果。
这证实了神经网络的传统用法校准为引用的文献。
然而,应用的NN-模型整体导致了显著进一步提高预测精度。
3. 一个有趣的方面是,随着基于神经网络模型的整体,必要的训练样本的数量达到一个特定的测试集精度水平大大降低。
从表中我们可以看到,使用PLS5和引导或交叉验证,我们达到约0.39与57个训练样本测试集均方根误差,同时利用GRAMS®,我们需要大约177样本,以达到同样的精度,并用一个神经网络模型,我们需要约87个样本。
相较于GRAMS®和单神经网络的方法,我们因此获得120和30个样本,分别与整体为基础的方法。
在分析工业,实现特定的精度与校准样本数少是相当大的兴趣,因为这降低了实验室测试的数量,从而建立模型的成本,参见图3.
4. 内集合方法,我们不要求达到测试精度时要有显著差异。
因此,无论是引导和交叉验证技术似乎同样适用于生成校正模型的适当的整体。
5. 对于组分2,我们可以看到,自举或交叉验证整体与特征向量由五个PLS系数产生的所有训练集大小的最好效果。
6. 此外,在组件2的情况下,以整体为基础的方法需要更少的训练样本,以达到给定的测试集精度比基于单个模型的方法。
从表二中,我们可以看到,使用PLS5和引导或交叉验证,我们实现了约0.87有117个训练样本测试集均方根误差,而与单个神经网络模型,我们需要大约147个样本。
我们永远无法达到如此低的均方根误差。
我们已经取得的最佳值是0.97与267样品。
7. 最后,我们观察到的集合方法似乎导致更强大的校正模型比单神经网络方法,其中的预测精度可能有很大差别的不同的训练运行。
这示于表Ⅲ中,在这里我们比较NN-模型(特征向量,由5 PLS或PCA系数,分别)整体的单个神经网络模型和测试集的精确度。
对于单NN-模型,我们观察与PLS和基于PCA的特征向量得到的结果之间存在较大的差异,而对于集合方法,结果非常相似。
这表明集合方法是多向的预处理方法的选择较不敏感比基于单个神经网络模型的方法。
V.总结
在化学计量学,NIR光谱仪的校准是通过使用光谱多变量描述符来预测不同组分的浓度来实现。
采用了多种用于预处理和特征向量的施工方法,但主要依赖于线性回归技术。
然而,经常光谱和组分浓度之间的关系是非线性的。
因此,神经网络被称为万能非线性函数逼近,已被用来作为非线性回归为基础的校准模型。
神经网络的弱点就是相应的学习算法只能保证收敛到最近的局部最优。
在本文中,我们提出了一种新的基于神经网络的校准方法的扩展。
我们提出并讨论了使用基于神经网络的模型重新取样可用校准样品,例如,使用自举或交叉验证技术所产生的一种整体。
所提出的方法被应用到一组测量的近红外光谱的不同浓度的双组分的清洗液。
以该整体为基础的方法对未知测试样本呈显著,更强大的预测精度,与最先进的软件或与传统神经网络为基础的方法的模型进行比较。
特别令人感兴趣的是观察,集合方法效果比较显著。
实现了预先设定的准确度水平所需的校准样本的数目。
三、课程与论文关系
在文章中,用蓝色标注的关键词句,是我们智能专业非常熟悉的词句,这篇论文本身与电子信息方向关系并不大,但是却与智能专业息息相关。
文章是以物理化学为基础,为了达到更好的光谱技术,并制造更优良的产品,人工神经网络被其改良并应用。
人工神经网络算法模型在这篇文章中巧妙的被结合利用,文章用到了化学物理实验设计。
为了更清楚的分析数据,后期处理同样用到了matlab的仿真技术。
在这篇文献中,为了建立一个校正模型,并针对于非线性校正问题,文章采用神经网络的模型,并提出了一个新的基于神经网络的扩展传统的方法,利用神经网络模型整体。
个别神经网络是从重采样与引导或交叉验证技术训练信息数据中获得该集合为基础的方法,产生一个比传统的回归方法更显著更精确和鲁棒性强的校准模型。
在我们智能控制导论课程中,我们学了神经网络基础,典型神经网络,高级神经网络,神经网络控制。
神经网络的研究基础包括:生物学基础、认识科学基础、理论基础(数学、非线性动力学等)以及实现的物质基础。
人工神经网络是对生物神经系统的某种抽象、简化与模拟。
具体人工神经网络是由许多并行互连的相同神经元模型组成。
一个神经网络的神经元模型和结构,描述了一个网络如何将输入矢量转化为输出矢量的过程。
该过程实质是一个计算过程。
也就是说,人工神经网络的实质体现了网络输入和输出之间的一种函数关系。
神经网络结构和工作机理基本上是以人脑的组织结构和活动规律为背景的,它反映了脑的某些基本特征,但并不是要对人脑部分的真正实现,可以说它是某种抽象、简化或模仿。
如果将大量功能简单的形式神经元通过一定的拓扑结构组织起来,构成群体并行分布式处理的计算结构,实现对复杂信息的处理和存储,并表现出各种优越特性,这种结构就是人工神经网络,在不引起混淆的情况下,统称为神经网络。
按学习时是否需要外部指导信息,可将学习分为三种类型,即有导师学习、无导师学习、强化学习。
四、智能导论课程总结
智能控制导论课上我们接触了模糊控制,神经网络,遗传算法,专家控制,博弈控制等。
这些都是和智能专业息息相关的问题及算法。
模糊控制以模糊集合、模糊语言变量、模糊推理为其理论基础,以先验知识和专家经验作为控制规则。
其基本思想是用机器模拟人对系统的控制,就是在被控对象的模糊模型的基础上运用模糊控制器近似推理等手段,实现系统控制。
在实现模糊控制时主要考虑模糊变量的隶属度函数的确定,以及控制规则的制定二者缺一不可。
专家控制是将专家系统的理论技术与控制理论技术相结合,仿效专家的经验,实现对系统控制的一种智能控制。
主体由知识库和推理机构组成,通过对知识的获取与组织,按某种策略适时选用恰当的规则进行推理,以实现对控制对象的控制。
专家控制可以灵活地选取控制率,灵活性高;可通过调整控制器的参数,适应对象特性及环境的变化,适应性好;通过专家规则,系统可以在非线性、大偏差的情况下可靠地工作,鲁棒性强。
智能CAD是指通过运用专家系统、人工神经网络等人工智能技术使在作业过程中具有某种程度人工智能的CAD系统。
专家系统(EXPERT SYSTEM)是一个能在某个特定领域内,用人类专家的知识、经验和能力去解决该领域中复杂困难问题的计算机程序系统。
它不同于通常的问题求解系统,其基本思想是使计算机的工作过程能尽量模拟领域专家解决实际问题的过程。
专家系统在CAD作业中适时给出智能化提示,告诉设计人员下一步该做什么,当前设计存在的问题,建议解决问
题的几何途径;或模拟人的智慧,根据出现的问题提出合理的解决方案。
专家系统是基于知识的系统,专家系统技术是知识获取、处理和运用的技术。
知识工程是专家系统技术的基础。
专家系统通常由知识库、推理机、知识获取系统、解释机构和一些界面组成。
智能控制是通过计算机实现对系统的控制,因此控制技术离不开优化技术。
快速、高效、全局化的优化算法是实现智能控制的重要手段。
遗传算法是模拟自然选择和遗传机制的一种搜索和优化算法,它模拟生物界/生存竞争,优胜劣汰,适者生存的机制,利用复制、交叉、变异等遗传操作来完成寻优。
遗传算法作为优化搜索算法,一方面希望在宽广的空间内进行搜索,从而提高求得最优解的概率;另一方面又希望向着解的方向尽快缩小搜索范围,从而提高搜索效率。
如何同时提高搜索最优解的概率和效率,是遗传算法的一个主要研究方向。
博弈论”原本是数学的一个分支,但由于它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域。
可以说,“博弈论”已经改变了经济学的传统轮廓线。
计算机博弈是人工智能领域的一个重要主题,若采用不同的数据结构、搜索算法与评价函数,对测试数据集的分析和验证的结果也不同。
在智能博弈中,智能博弈并不只是考虑如何实现管理者和被管理者个人效用的最大化,更是要实现企业效益的最大化。
因此,智能博弈不仅仅要考虑管理者和被管理者之间的均衡问题,还要考虑在整个组织内实现组织效用最大化问题。
由于智能博弈是由众多博弈链组织的动态博弈行为,它反映了组织中所有不同结构和层次的管理者与被管理者之间的博弈关系,因此,通过对智能博弈模型的优化,可以合理布置中间环节的数量,实现整个组织的优化,达到有效均衡。
这样的一个优化过程实际上就是一个组织结构职能的设计过程。
所以说,智能博弈的一个重要应用就是进行组织设计。
这也是管理博弈理论最终目的之一。
博弈的用途广泛,这也是对我们学校智能控制的一大启发课题。