SPSA算法及其在函数寻优与控制中的应用研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
basedonSPSAtothecontroloftheship’Sheading,andthesimulationresultsverifytheeffectivenessofthescheme.
Keyword:SimultaneousPerturbationStochasticApproximation;PDControl;FunctionOptimization;HeadingContr01.
IV
青岛科技人学研究生学11:7:论文
第一章绪论
1.1研究的背景及意义
当今社会,一方面控制系统规模越来越大,控制设备、工艺及过程愈来愈复杂的:另一方面人口持续增长而自然资源不断减少。
因此人类针对这两方面所要做出的优化决策日益增多。
所以我们可以预见,在未来里优化算法会大有所为。
研究一种无模型的、高效的、能处理复杂问题的优化算法显得尤为重要。
多变量随机优化在许多工程系统的分析和控制中扮演着重要的角色。
在几乎所有现实世界的优化问题中,由于我们很难利用分析的方法来获得问题的最优解,因此有必要使用一种数学算法,迭代地求出最优方案。
本着这一思想,美国霍普金斯大学APL实验室的J锄es.C.Spalltl’2’3,36’42’431教授提出了用于解决复杂、多元优化问题的同时扰动随机逼近算法(SimultaneousPerturbationStochasticApproximation,简称SPSA)。
SPSA算法已被证明是一种非常有效的随机优化方法。
它的丰要优点是易于实现、不需要损失函数梯度的直接测量、对测量噪声具有鲁棒性,理论和仿真实验都支持其相对有效性。
实验证明,当实际问题中存在多个(局部和全局)极小值时,该算法总能找到一个全局最小值。
相对于其他方法如有限差分法(FDSA)、模拟退火(SimulatedAnnealing)、遗传算法(GeneticAlgorithm),SPSA擅长于梯度信息缺失、损失函数的测量存在噪声、高维度的优化问题。
在各研究和实用领域内的广泛应用是该算法有效性更有力的证明。
SPSA的特征可以简单归结为:1)优化过程或控制过程的无模型性;2)擅长处理存在大规模变量的优化或控制问题;3)算法本身决定的对噪声和干扰的鲁棒性;4)算法简单,易于计算机实现;5)其迭代形式可以更好的同控制算法结合等等。
正是得益于以上优势,SPSA算法逐步发展光大,成为一个新的学科分支。
近二十年来,社会科学和自然科学领域的很多学者致力于这方面的探索,使得SPSA得到很大的发展,例如航天器建模和控制、经济或国防政策制定、地下资源探测、设备故障检测、排队网络、废水处理等等。
由于它的应用非常广泛,并且在其应用领域里不断有新发现,SPSA算法的方法与应用的研究,尤其是在控制系统的应用,形成了新的热点。
国内最近几年也有对SPSA的研究。
国内几所大学像天津大学和北京交通大学等,一直有研究成果出现。
前者在算法的研究和改进方面颇有建树。
例如洪立
SPSA算法及其在函数寻优与控制中的应用研究
【4】将模糊逻辑引入到SPSA算法收敛因子的选择中,一定程度上改进了算法的收敛因子;方红伟【5]提出了一种以改进的自适应同时扰动随机逼近算法和多模型方法为基础的对未建模型的工业过程对象进行控制的新方法,由于改进的自适应同时扰动随机逼近算法具有算式结构简单,对含有噪声的数据有较好的处理能力,可以对数学模型未知的系统进行有效处理等特点以及多模型方法对提高系统暂态响应和具备对含有大不确定性变化的系统的有效控制的特点,使得该方法在未建模型的对象控制中有很好的应用前景:宁玉富【6J设计了集成模拟和神经网络的同步扰动随机逼近算法,首先使用模拟为不确定函数产生一组输入输出数据,然后用这些数据训练神经网络,把训练的神经网络嵌入到同步扰动随机逼近算法中,该算法比基于模拟的同步扰动随机逼近算法能够更快地收敛到局部最优解;张家顺【7】将模糊模拟与蒙特卡洛模拟相结合,给出基于不确定模拟的SPSA算法对模型进行求解。
后者则将SPSA算法应用到交通领域收到良好的效果,例如刘衍希、陈旭梅【8】在公交专用道的设置研究中,对敏感性较高的参数采用SPSA算法与遗传算法相结合的方法对其标定:章玉掣9J针对遗传算法(GA)的不足,建立了基于同步扰动随机逼近(SPSA)算法的微观仿真模型参数标定方法,并实现了程序的自动化标定。
另外,中国民航大学的朱承元、卫宏等【Io】将带有约束限制的SPSA优化算法与基于节点重要度的分层优化模型进行融合,给出具体实现过程中使用参数的设置方式以及优化的执行步骤;东南大学的李铭【ll】等以换乘综合费用最小为优化目标建立目标函数,基于SPSA算法对公交枢纽车辆实时调度进行优化:国防科技大学的孙亮【12】针对以费用为独立变量(CAW)方法,分别采用了两种算法进行了优化计算,并对优化结果进行了比较。
通过建模和计算,验证了在优化算法方面,SPSA算法明显优于其他的优化算法,非常适合于解决CAW优化问题。
国内的其它应用研究在如下文章里有所描述:沙焕滨【13·28】(生产计划制定);吴志伟等114】(电熔镁炉熔炼)。
国内以上文献多是将SPSA算法应用到复杂问题求解或者算法本身的改进。
对于SPSA与控制系统结合方面的研究不多,而且对国内外最近几年最新研究成果缺少一个总体汇报。
但是,SPSA算法凭借本身优异的优化性能(这是内因)和人们对优化及控制品质要求不断的增高(这是外因),在未来里一定会大有作为,在控制领域做出应有的贡献。
一言而概之,关于SPSA算法及其在优化和控制中的应用研究方兴未艾。
1.2最近两年最新的研究成果
青岛科技人学研究生学何论文
在本节里我们将尽量详细的列举最近两年来关于SPSA算法的最新研究成果。
包括国外和国内两个方面。
这些研究成果,理论比较成熟、应用覆盖面很广,有助于更多的仁人志士了解和把握SPSAfl向最新动态和研究热点,并投)k至USPSA算法更深和更广的研究当中。
1.2.1国外最新成果
国外最近两年的研究成果有:Abdulsadda【15】提出了一种改进的SPSA算法,模糊自适应同时扰动逼近算法(FASPA),并用于多层感知器的训练,所提改进算法提高了系统的识别训练、减少了收敛时间、减小了辨识误差;Altatfl6】针对用于北海风暴潮预测的荷兰大陆架模型(DCSM),提出一种基于SPSA的自动模型校正方法,所研究方法不但有效还节约了计算成木:Cao.X【l,J在针对同时扰动量的研究中指出,伯努利±1分布面对小样本优化问题时可能无法保证效率,并讨论了分段均匀分布的性能;Moumen[懈】把SPSA的思想引入到梯度下降法与模拟退火算法结合中,提出SASP算法,新算法提高了鲁棒性和效率,可广泛应用到一类带约束连续函数的全局优化问题:Hahn[¨J基于SPSA开发了一种适用于严格约束条件下可重复运行的开关迭代自适应控制器,所设计的控制器在每次达代仪需要一次传感器的测量和离散电压输入的情况下,使系统输出迅速收敛到期望值;R五dac[20】将两种基于数据的无模型方法迭代反馈正定(IFT)和SPSA结合,用于伺服系统的控制;Tsakalaki[21】针对现实生活中空间关联性和天线耦合效应下的多输入多输出(MIMO)系统,引入SPSA算法,最大限度的提高了通信速率;Wang[22】基于SPSA算法研究了存在嘈杂函数测量值的离散函数优化方法等。
1.2.2国内最新成果
长江大学的Zhao等【2列针对如何获取最佳油藏模型,提出基于SPSA的闭环生产管理策略,实现了降低模型不确定性、经济效益最大化等预期目标;浙江大学的Kong掣24】将SPSA算法引入到大规模生产过程的产品质量控制,在工艺条件改变、模型精确度恶化的情况下较基于模型的优化算法(MBO)提高了质量控制效率;章玉【91等针对遗传算法的不足,建立了基于SPSA算法的微观仿真模型参数标定方法,并实现了程序的自动化标定,仿真证明SPSA算法的速度比遗传算法的速度明显加快、相对误差明显减小;林勇【25'26】针对交通系统优化,对已建立的OD流量在每个子时段内的分配比例参数估计模型进行求解,并用于实际拥堵公路测试,收到良好的反馈效果;邓金秋社7J使用了SPSA算法与Bezier拟合曲线相结合的办法,减少飞机超临界翼优化中的设计变量。
可以看出,国内最近两年的研究多集中于算法的直接应用和复杂问题的优化
SPSA算法及其在函数寻优与控制中的应J}}j研究
求解,关于SPSA在控制方面研究很少,这在无形中限制了SPSA算法在我国的发展。
1.3什么是同时扰动随机逼近算法
同时扰动随机逼近算法(SPSA)Spall…于1987年根据Kiefer-Wolfowitz随机逼近算法(K.W算法)改进而成。
K.W算法是以有限差分梯度通近为基础的,它在每次梯度逼近中需要利用损失函数的2p个量测值(其中P为向量的维数)。
Spall【21改进后的SPSA算法在每次梯度逼近中只利用了损失函数的2个量测值,这与K—W算法形成明显的对比。
并且,与其他的随机逼近算法相比,SPSA算法也有其最显著的特征:它容易执行以及它的高效率的梯度逼近。
1992年,SpallTM又对SPSA进行了全面深入的分析与论证。
他证明了虽然SPSA算法在每次迭代的梯度逼近中仪利用-了Kiefer-Wolfovitz随机逼近算法的1/p倍的损失函数的估计值,但在一般情况下,当迭代次数相同时,两种算法可以达到同样的精度。
因而,SPSA在解决多变量的问题中,有其独特的优越性。
此后,SPSA算法引起了众多著名学者例如:Cauwenberghst291、Chin[30'31,32’34’551、Maexia[331等的普遍关注。
在大规模非线性系统的控制优化问题中,损失函数与待优化参数只间往往是复杂非线性映射,甚至于根本无法建立数学模型。
这时候基于梯度的优化算法便失去了效力,而遗传算法、模拟退火(SA)针对大规模优化时运行速度又差。
我们需要SPSA这种种既有更强的适应性,同时又能确保功效的算法。
假设系统的损失函数为三(p),如果t(01是关于乡可微的函数,那么令g(p):型曼孕,则满足g(o·):o的p·即为损失函数的最优解。
但是如果上(p)为一个不可微函数,或者£(p)形式无法准确得到,那么我们可以用一个近似的梯度来对系统进行求解:
嚷=吼一。
-a。
反I幺一。
l(1—1)其中:
啦,):盟掣警型×△:△是
(1-2)
△:
式中£(反一,±q△。
)是损失函数£(口)带有扰动策略的两个测量值(即所谓的
青岛科技人学研究生学位论文
同时扰动)。
注1.1:从式(卜2)可以看出,要得到逼近梯度,我们只用到损失函数带有扰动的两次测量值,这在工程上是有重要意义的:
1)很多实际问题中存在大量变量,运用SPSA算法可以不顾及问题维度,因为我们需要的仪是所有变量“同时扰动”所产牛的总的效应的测量值,这就减少了优化的代价,特别是对维度高的系统其性价比就更高:
2)SPSA算法的数据驱动本质,使其能很好地解决多元、复杂非线性系统的优化问题;
3)测量过程难免存在误差扰动,但这丝毫不影响优化效果。
注1.2:我们可以这样理解SPSA算法的合理性:在P维优化问题中,所有P个变量同时随机扰动产生的变化所包含的信息,与每个变量各变化一次所产生的信息一样多。
关于SPSA算法更详细的描述,将在本文的第二章同时扰动随机逼近算法简介中给出。
1.4基于SPSA的函数寻优
在函数寻优时一般来讲,当收敛速度用迭代次数来衡量时,基于梯度的算法要比基于梯度逼近的算法收敛快。
但在实践中,可能无法获得待优化系统模型可靠的函数关系,这意味着基于梯度的算法是不可行的(系统模型无法获得)或不可靠的(系统模型不准确,带有噪声)。
现实世界的一些优化问题【34.35】,是除了SPSA算法之外的其他已有优化方法所不能解决的。
SPSA算法的初衷是一种梯度搜寻办法。
基于SPSA算法函数寻优的基本思想是,通过重复迭代寻找线性或非线性损失函数的局部最优值,在每次梯度逼近中只利用了损失函数的两个估计值,体现了其解决高维优化问题方面的优越性。
关于基于SPSA的最优求解步骤和仿真,在本文的第三章将有更详细的说明。
1.5基于SPSA的控制
SPSA算法因为其有算式结构简洁、对含有噪声数据有良好的处理能力、对数学模型未知的系统具有有效的处理方法等特点而被引入到随机非线性系统的控制中。
基于SPSA的控制方法不需要被控对象模型信息,仪利用闭环测量数据整定控制器参数。
Spall[361于1998年成功的将SPSA算法用于随机非线性最优控制
SPSA算法及其在函数寻优与控制中的应用研究
中,其应用形式丰要有两种,直接逼近控制系统和自校正控制系统,在1.5.1节将有所描述。
北京交通大学教授侯忠生【37】将基于SPSA的控制方法归入数据驱动控制的范畴,并给出基于SPSA算法的控制方法的~般形式,在1.5.2节将有所描述。
1.5.1基于SPSA的神经网络控制
该控制策略中,神经网络的权值的训练由SPSA算法来完成。
下面简要介绍控制算法的两种实现形式:直接逼近(DA算法)与自校正(ST算法)。
1)直接逼近控制算法。
我们设系统七+l时刻的输出向量是:
Y川=①^(fk(Yt),‰,心)(卜3)其中,①。
(.),六(·)是动态系统未知非线性函数;‰是足+1时刻系统的控制
输入;岛是噪声干扰。
图卜1是DA算法的控制结构图:
图1-1DA算法控制结构图
Fig.1—1ControlstructureofDAalgorithm
其中,人工神经网络的输出就是控制律‰。
神经网络基于SPSA算法进行权重的学习。
它是对一个被控对象数学模型完全未知的随机非线性系统进行控制,控制器为神经网络。
要求如下的损失函数达到最小:
厶仅)=E眇M—Yd)7"A。
执+。
一儿)J(卜4)最小化厶(幺)相当于寻找一个最优霞,使得:
&他)=a厶los,=钆户幺·‘gL,/Ou,=o(卜5)因为系统未知,砚。
/抛。
这一项不能直接计算,而利用随机逼近算法则可以
青岛科技人学研究生学位论文
用如下形式对充当控制器的神经网络的权值进行调整:
反=反一,一吼反(反一。
)(1—6)其中或(反一。
)为损失函数对于神经网络权值的梯度的估计,它的第,个分量为:
营。
,(幺一。
)=(鬈~‘)/蔓qAⅣ(卜7)E:神经网络的权值变为(只一,+ckA。
)后测得,E=k—Yd厂Ak一。
◇;一儿)J;
石:神经网络的权值变为(吼-i+Ck△。
)后测得,乓:眇i—y。
)r4一,◇i—yd)J;
△灯:表示随机矢量。
这样通过调整神经网络的权值使得损失函数达到极值,从而实现了最优控制。
2)自校正控制算法。
当己知系统的最优控制律“’=Q。
(六(·),儿),Q。
这个函数形式已知,而厶(.)是一个未知函数。
用神经网络去逼近.疋(.),从而得到图卜2所示的控制结构。
在这种结构下,同样是调整神经网络的权值,使系统性能达到最优。
对权值调整的算式与1-_面的相同,只有这样结构利用了先验知识。
8k
『E.目标轨迹Yd坼~“
坊J.L生Z91:lI骢ltzCr
L被控对象
死挽,yd)
JIJL
{t
I溉
l神经网I“I延迟卜
1.-
I殆l—l一一I
▲
SPSA算法
图1-2ST算法控制结构图
Fig.1-2ControlstructureofSTalgorithm
其中,神经网络的输出不是“。
,而是五,然后根据关系式死怃,Yd)。
由控制器产生“t。
SPSA算法及其在函数寻优与控制中的应用研究
1.5.2基于SPSA的无模型控制
图卜3基于SPSAfiO控制方法
Fig.1—3ControlmethodbasedonSPSA
图I-3中受控装置的非线性数学模型未知,控制器为一个诸如多项式、神经网络的函数逼近器(Functionapproximator),该逼近器结构固定,但参数可调。
举例说明,如果逼近器是人工神经网络,则该网络的结构事先确定,而联接权重系数就是图1-3中控制器的参数。
网络的输入为上一时刻的控制量与输出量,以及下一时刻的期望输出,也就是在k时刻,人工神经网络以:
y(尼),),(七一1),…,y(七一M+1),
(1_8)
“(七一1),u(k-2),…,u(k-』v),均(k+1)
作为输入,“伍)为输出。
其中,受控装置在七时刻的输出为y@)、输入为u(k);的受控装置在k+1时刻的期望输出为Yd(k+1):M、N分别是采集数据的时间窗长度。
我们的设计思路是,对于任意时刻k,寻找到一个最优的控制器参数目,使得控制性能评价函数(卜9)最小:
以(Ok)=EI(J,(幺,k+1)--y#(J|}+1))2l(1—9)最小化性能指标函数(1-9),需要知道受控系统的数学模型,但是,由于受控装置的模型信息未知,所以无法求得鱼掣,导致传统的优化方法不能使
∥%
用。
基于SPSA的无模型控制方法采用同时扰动随机逼近算法来解决未知被控对象模型的最优化问题,该方法利用递推公式:
ok=ok—l—ak或慨一lJ(卜10)来估计序列概),其中反为本次迭代得到的估计值:a。
为标量系数;gk限一)为&蛾一,)的同时扰动估计值,其第,个分量的计算公式为:
青岛科技人!学研究生学位论文
誊^胞一,J=鼍·L(卜11)
二C^凸村
其中,,=l,2,…,三,£为控制器参数的个数;夕l±)为以限一。
±c。
A。
)的估计值,利用测量值y慰和“:±’计算得到,鼻+1=◇胤一Ya@+1))2;y龆为被控对象的控制输入等于“:±’时的输出测量值;“:±’为控制器参数目产反一。
±q△。
时产生的控制量,这里△。
=【△Ⅲ△Ⅲ…,A址r为一个随机产生的向量,通常△。
,服从独立有界对称分布;q为标量系数,典型的选取为趋于0的序列或等于常数。
从上述介绍中可看出,每次达代中只需要进行两次闭环实验的测量数据就可以估计得到瓯峨一。
J的估计值雪。
限一。
J,整个过程中不需要被控对象的模型信息。
文献【36】给出了上述控制算法的收敛的充分条件,在满足这些充分条件的前提下,如果存在一个p’,当k趋于无穷时,使得钟趋于目+,那么,当k趋于无穷时,慨一9+J几乎肯定趋于零。
虽然基于SPSA的控制策略也有对试验信号的需求,但是每次更新只需要测量两组长度为一的实验数据。
算法利用的是在线数据,这些数据存在于以固定长度移动的时间窗内,属于梯度估计算法,或者说是控制器参数辨识结构的数据驱动控制方式,在线工作方式。
对象是非线性系统,隐含的假设是需要满足类的广义Lipsehitz条件,否则随机逼近不能给出梯度的估计值。
以上是针对Spall和侯忠生提出的两种基于SPSA算法的控制理论,然而一种算法的生命力在于其在现实中的应用。
PIE}控制【38,39】是当前业已非常成熟的控制办法,工业过程控制领域仍有近90%的回路在应用PID控制策略。
如何将SPSA算法运用至UPID控制器参数的调整中是一个非常有意义的课题。
具体思想是使用高效的SPSA算法逼近PD控制器的性能指标函数的梯度,PD控制器的所有参数都可以通过随机逼近来调整。
基于SPSA的PD控制器以误差e和误差变化否作为输入,可以满足不同时刻的e和每对PD参数的整定要求,利用SPSA优化规则在线对PD参数进行修改。
1.6论文的主要工作和贡献
本文主要进行了SPSA算法及其在优化和控制中的应用研究,其主要工作和贡献如下:
一、深入总结了同时扰动随机逼近算法,包括算法的实质、改进和用途。
汇报了最近两年圜内外最新的研究成果。
本文指出SPSA在控制方面体现出来的特
SPSA算法及其在函数寻优与控制中的应.}}j研究
征:1)控制过程的无模型性(数据驱动性质);2)擅长处理存在大规模变量的控制问题;3)算法本身决定的对噪声和干扰的鲁棒性;4)算法简单,易于计算机实现;5)天然的迭代形式可以更好的同其它控制算法结合。
二、针对存在大规模变量的非线性函数寻优(求解最小值),本文拟研究基于SPSA算法的函数寻优方法。
SPSA求解采用逼近梯度来不断修正搜索方向,以逐步接近最小值。
该方法的特点是能够求解高维的无约束最优化问题。
给出该方法求解的基本步骤,并以两个实例做了仿真研究。
为了能够直观的表现SPSA算法的寻优过程,我们分别选择了一个简单的二元线性函数和一个相对复杂的二元非线性函数作为损失函数。
三、针对船舶的航向控制问题,本文拟提出一种基于SPSA的PD控制方案。
该方案的主要思想是使用高效的SPSA算法逼近PD控制器的损失函数梯度,并以此迭代修正控制器参数。
将该方案应用于船舶航向的调整,并用仿真实验验证该方案的有效性。
仿真实验分为两种情况,分别验证风对船舶输入无影响和有影响的情况下船舶的航行状况。
1.7论文的结构安排
论文的结构安排如下:
第一章绪论。
概述了本文的研究背景及意义;总结了近两年国内外学者对SPSA算法的最新研究成果:介绍了函数寻优策略和有关基于SPSA算法控制的两种理论和设计方法;指出本文研究的主要工作和贡献、结构安排。
第二章同时扰动随机逼近算法研究。
首先回顾了随机逼近算法的提出和发展过程;其次给出SPSA算法的步骤、注意问题和假设;最后介绍了SPSA算法的几种改进形式和在现实生活中的应用实例。
第三章基于SPSA的函数优化。
首先介绍了有关模型最优求解方法的基本概念;其次概述了目前存在的两种无约束优化方法;再次给出SPSA算法寻优的一般过程;最后针对本章研究给出两个仿真实例。
第四章基于SPSA的船舶航向PD控制。
针对船舶航向的控制问题,本章提出一种基于SPSA的PD控制器。
首先简单介绍了传统的P1D控制方法;其次提出基于SPSA的PD控制策略;再次给出船舶的数学建模,以用于仿真研究:最后针对本章研究给出两个仿真实例。
第五章结论与展望。
概述全文,指出论文尚且存在的问题和不足之处,以及今后的研究方向。
青岛科技人学研究生学何论文
第二章同时扰动随机逼近算法研究
现实中大多数优化问题的数学表达是:一些带有可调参数向量的标量损失函数的最小化(或最大化)。
这些优化算法从初始猜测值(或设定值)开始,逐步改变一些可调参数,进而逐步减小损失函数。
许多业已被开发出来优化算法都具有明确的假设,且这些假设一般都是基于损失函数的直接梯度信息。
现在研究人员将更多的兴趣集中于不依赖于梯度信息的递归优化算法,这类递归算法都是基于对损失函数的测量形成的梯度逼近。
这源于对某类问题(例如自适应控制、复杂系统的统计识别、处理大蒙特卡罗模拟优化、神经网络的训练,图像传感器的数据恢复和设计、复杂的排队和离散事件系统等)的处理。
总体而言,无梯度随机算法表现出类似于基于梯度随机算法(例如,RMSA)的收敛特性,并且仪需要损失函数的测量值。
这种算法的一个主要优点是,不需要被调整的参数与损失函数是之间具体的函数关系(无模型本质)。
在控制领域(如非线性反馈控制器的设计)这种函数关系很难用数学描述。
由于基于梯度的算法和无梯度算法在应用时,所需的基本信息不同,故很难找到着实有效的标准来对这两种算法进行比较。
一般来讲,当收敛速度用迭代次数来衡量时,基于梯度的算法要比基于梯度逼近的算法收敛快。
但在实践中,在确定哪种算法最合适的时候,必须考虑以下情形:
1)可能无法获得系统输入和输出之间可靠的函数关系,这意味着基于梯度的算法是不可行的(系统模型无法获得)或不可靠的(系统模型不准确)。
2)实现有效逼近的总成本取决于两方面,其一是所需迭代次数,其二是每次迭代所需要的成本。
基于梯度的算法的成本尤其大(此成本包括:计算负担的加重,人类对确定和编码梯度要求的增加,建立模型所需的人工、材料、燃料等实验成本)。
3)收敛速率是基于渐近理论的,有限采样区间内的收敛速率未必可以代表实际收敛速率。
考虑这些因素的存在,基于梯度逼近的算法要明显优于基于梯度测量的算法。
接下来,2.1节将对随机逼近算法的发展做一个简单的回顾;2.2节着重介绍SPSA算法的多种改进形式;2.3节给出两个应用实例,在这两个例子里出现的优化问题,是除了SPSA算法之外用其它已知方法所不能解决的;2.4节是本章的总结。