【5A文】关于序列二次规划(SQP)算法求解非线性规划问题研究
非线性模型预测控制的若干问题研究
非线性模型预测控制的若干问题研究一、概述随着现代工业技术的快速发展,非线性模型预测控制(Nonlinear Model Predictive Control,NMPC)已成为控制领域的研究热点。
非线性系统广泛存在于实际工业过程中,其特性复杂、行为多样,且具有不确定性,这使得传统的线性控制策略在面对非线性系统时往往难以取得理想的效果。
研究非线性模型预测控制策略,对于提高控制系统的性能、稳定性和鲁棒性具有重要意义。
非线性模型预测控制是一种基于非线性模型的闭环优化控制策略,其核心思想是在每个采样周期,以系统当前状态为起点,在线求解有限时域开环最优问题,得到一个最优控制序列,并将该序列的第一个控制量作用于被控系统。
这种滚动优化的策略使得非线性模型预测控制能够实时地根据系统的状态变化调整控制策略,从而实现对非线性系统的有效控制。
非线性模型预测控制的研究也面临着诸多挑战。
由于非线性系统的复杂性,其预测模型的建立往往较为困难,且模型的准确性对控制效果的影响较大。
非线性模型预测控制需要在线求解优化问题,这对计算资源的需求较高,限制了其在实时性要求较高的系统中的应用。
非线性模型预测控制的稳定性和鲁棒性也是研究的重点问题。
本文旨在深入研究非线性模型预测控制的若干关键问题,包括非线性模型的建立、优化算法的设计、稳定性和鲁棒性的分析等。
通过对这些问题的研究,旨在提出一种高效、稳定、鲁棒的非线性模型预测控制策略,为实际工业过程的控制提供理论支持和实践指导。
1. 非线性模型预测控制(NMPC)概述非线性模型预测控制(Nonlinear Model Predictive Control,简称NMPC)是一种先进的控制策略,广泛应用于各种动态系统的优化控制问题中。
NMPC的核心思想是在每个控制周期内,利用系统的非线性模型预测未来的动态行为,并通过求解一个优化问题来得到最优控制序列。
这种方法能够显式地处理系统的不确定性和约束,因此非常适合于处理那些对控制性能要求较高、环境复杂多变的实际系统。
含VSC-HVDC的交直流系统可用输电能力计算
含VSC-HVDC的交直流系统可用输电能力计算李国庆;张健【摘要】利用等值电压源方法对电压源换流器进行等效,从而导出了适合于优化计算的电压源换流器型直流输电(VSC-HVDC)系统模型.该模型能够考虑换流器的各种控制方式及运行限制,且可用于多端直流系统.建立了含有VSC-HVDC的交直流系统可用输电能力计算模型,在模型中考虑了对换流器控制变量的多种优化方式,并应用序列二次规划法对模型进行求解.通过对修改后的EPRI-36节点交直流系统进行仿真计算,验证了所提出模型的实用性及算法的有效性.%The voltage source converter is equivalently represented by voltage source model, thus the model of voltage source converter-high voltage direct current (VSC-HVDC) system suitable for optimal power flow calculation is developed.The model considers any control mode and operating limits of the converter: moreover, it could be applied to multi-terminal VSC-HVDC.The mathematical model of ATC for AC/DC systems with VSC-HVDC is set up in this paper, in which various methods for optimizing control variables of converters are considered.Sequential quadratic programming method is applied to calculate the ATC model.The modified EPRI-36 bus AC/DC system is simulated and numerical results illustrate the utility and validity of the proposed model and method.【期刊名称】《电力系统保护与控制》【年(卷),期】2011(039)001【总页数】7页(P46-52)【关键词】可用输电能力;电压源换流器;交直流系统;序列二次规划法【作者】李国庆;张健【作者单位】东北电力大学电气工程学院,吉林,吉林,132012;吉林省电力有限公司调度通信中心,吉林,长春,130021【正文语种】中文【中图分类】TM71在电力市场环境下,电力系统区域间可用输电能力不仅是衡量输电网传输能力的一个重要指标,也可以为判断电网是否安全稳定运行提供依据,而且还能够引导市场参与者进行电力交易、刺激商业竞争以充分利用现有资源。
第四章-序列二次规划
x L( x, , ) 0,
i gi ( x) 0, i 1, ..., m
i 0, i 1, 2, ..., m.
m
l
其中L( x, , ) f ( x) i gi ( x) jhj ( x)为Lagrange函数.
i 1
j1
最优化方法之约束非线性规划
当解(1)得到一个迭代点xk时,为求得下一个更好的迭代点xk1时, 一种自然的想法,就是用问题(1)在xk处的二次规划模型代替 问题(1),以一系列二次规划的解逼近(1)的解,这种方法称为 序列二次规划法( SQP ).
一、搜索方向的确定
当运用SQP方法时, 在x k点处的二次规划一般形式为
最优化方法之约束非线性规划
x1 , x2 0.
取x0 (0, 0)T , 用第一种方法构造H0 ,写出求d 0的二次规划.
解.
f
(
x)
2 x1
2
x2
4
, f
(
x0
)
4
0
2
f
(
x)
2, 0,
0 2
,
2
f
(
x0
)
2, 0,
0 2
最优化方法之约束非线性规划
xk
,
k
,
k
)信息的正定阵.
最优化方法之约束非线性规划
二、步长的确定
步长确定的常用方法: (1).固定步长为1,即xk1 xk d k ; (2).可行性优先准则,即若xk d k为(1)的可行解,则取 xk1 xk d k ;
序列二次规划算法
序列二次规划法求解一般线性优化问题:12min (x)h (x)0,i E {1,...,m }s.t.(x)0,i {1,...,m }i i f g I =∈=⎧⎨≥∈=⎩ (1.1) 基本思想:在每次迭代中通过求解一个二次规划子问题来确定一个下降方向,通过减少价值函数来获取当前迭代点的移动步长,重复这些步骤直到得到原问题的解。
1.1等式约束优化问题的Lagrange-Newton 法考虑等式约束优化问题min (x)s.t.h (x)0,E {1,...,m}j f j =∈=(1.2)其中:,n f R R →:()n i h R R i E →∈都为二阶连续可微的实函数. 记1()((),...,())T m h x h x h x =. 则(1.3)的Lagrange 函数为: 1(,)()*()()*()mT i i i L x u f x u h x f x u h x ==-=-∑(1.3)其中12(,,...,)T m u u u u =为拉格朗日乘子向量。
约束函数()h x 的Jacobi 矩阵为:1()()((),...,())T T m A x h x h x h x =∇=∇∇.对(1.3)求导数,可以得到下列方程组:(,)()A()*(,)0(,)()T x u L x u f x x u L x u L x u h x ∇⎡⎤⎡⎤∇-∇===⎢⎥⎢⎥∇-⎣⎦⎣⎦(1.4)现在考虑用牛顿法求解非线性方程(1.4).(,)L x u ∇的Jacobi 矩阵为:(,)()(,)()0T W x u A x N x u A x ⎛⎫-= ⎪-⎝⎭(1.5)其中221(,)L(,)()*()mxx iii W x u x u f x u h x ==∇=∇-∇∑是拉格朗日函数L(,)x u 关于x 的Hessen 矩阵.(,)N x u 也称为K-T 矩阵。
对于给定的点(,)k k k z x u =,牛顿法的迭代格式为:1k k k z z z +=+∆. 其中k k (d ,v )k z ∆=是线性方程组k k k k (,)()(x )A(x )u *()0(x )k k k k T T k k d W x u A x f A x v h ⎛⎫-⎛⎫-∇+⎛⎫= ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭(1.6)的解。
序列二次规划法
n
(1-10)
其中, E 代表等式约束下的集合, I k 代表不等式约束中起作用约束的下标 集合。
此式即式 (1-8) , 可以用同样的方法求解。 在求得式 (1-10) 的解 [ S
k 1
, k 1]T
之后,根据 k-t 条件,若解中对应原等式约束条件的乘子不全为零,对应起作用 约束条件的乘子不小于零,则 S 最优解 S * 。 综上所述,在迭代点 X 上先进行矩阵 H 的变更,在构造和求解相应的二 次规划子问题,并该子问题最优解 S * 作为下一次迭代的搜索方向 S 。然后在 该方向上对原非线性最优化问题目标函数进行约束一维搜索, 得到下一个迭代点
此问题是原约束最优化问题的近似问题,但其解不一定是原问题的可行点。 为此,令
S X Xk
将上述二次规划问题变成关于变量的 S 的问题,即
1 min f ( X ) S T 2 f ( X k ) S f ( X k )T S 2 s. t. gu ( X k )T S gu ( X k ) 0 (u 1,2,..., p) hv ( X k )T S hv ( X k ) 0
T
等于 n m 。由线性代数知,此方程要么无解,要么有惟一解。如果有解,利用 消元变换可以方便的地求出该方程的惟一解, 记作 [ S 若此解中的乘子向量
k 1
k 1
根据 k-t 条件, , k 1]T 。
不全为零, 则S 。
k 1
就是等式约束二次规划问题式 (1-8)
的最优解 S * ,即 S* S
2 序列二次规划的研究
最优化理论及方法是一个具有广泛应用背景的研究领域。 它研究诸如从众多 的方案中选出最优方案等问题,常见的各种模型如线性规划,二次规划,非线性 规划, 多目标规划等。 最优化理论及方法已经在经济计划, 工程设计, 生产管理,
非凸优化问题的模型预测控制应用研究
非凸优化问题的模型预测控制应用研究模型预测控制(Model Predictive Control, MPC)是一种基于数学模型的先进控制方法,广泛应用于工业过程、机器人、交通运输等领域。
MPC通过对系统的数学模型进行优化,预测系统未来的行为,然后根据优化结果进行控制决策。
然而,在实际应用中,MPC常常面临非凸优化问题。
本文旨在研究非凸优化问题在MPC中的应用,并对相关方法进行分析与讨论。
一、非凸优化问题概述1.1 非凸优化问题定义与特点在数学中,一个函数被称为凸函数(Convex Function)当且仅当它满足如下定义:对于任意两个点x1和x2以及0≤λ≤1,有f(λx1+(1-λ)x2) ≤ λf(x1) + (1-λ)f(x2)。
而一个函数被称为非凸函数(Non-convex Function)当它不满足上述定义。
非凸优化问题是指目标函数或约束条件中存在非凸函数的最优化问题。
与传统的线性规划或者二次规划等线性或者二次约束最小二乘问题不同,非凸优化问题的特点在于其目标函数或约束条件存在非凸函数,使得问题的求解变得更加困难。
1.2 非凸优化问题的挑战与困难非凸优化问题在求解过程中存在着许多挑战与困难。
首先,非凸优化问题通常具有多个局部最小值点,而不同的初始点可能导致不同的最优解。
其次,非凸函数通常具有复杂的形状和结构,使得求解过程中需要考虑更多的约束条件和变量。
此外,在实际应用中,非凸优化问题往往需要考虑实时性和计算复杂度等因素。
二、模型预测控制与非凸优化2.1 模型预测控制基本原理模型预测控制是一种基于数学模型进行系统控制的方法。
其基本原理是通过对系统进行建模,并使用该模型对未来系统行为进行预测,并根据预测结果进行控制决策。
MPC通过对系统状态、输入和输出等变量进行建模,并结合目标函数和约束条件,在每个时刻计算出最佳控制输入。
2.2 非凸优化在MPC中的应用在MPC中,非凸优化问题常常出现在目标函数或约束条件中。
第十五章序列二次规划法
第十五章序列二次规划法第十五章序列二次规划法考察一般非线性约束最优化问题m in ( )( ) 0 , { 1 , 2 , , }s . t.( ) 0 , { 1 , 2 , , }i eei efxc x i mc x i m mEI m(15.0.1)其中 )( )), ((i xfc i E Ix ??都二阶连续可微 .序列二次规划法(Sequential Quadratic Programming,简称SQP)的基本思想是在当前迭代点 kx 处,以问题 (15.1.1)的 Lagrange 函数 ( , )Lx? 在 ( ),kkx ? 处关于变量 x 的 Taylor 二阶展开式作为目标函数,以约束条件 ( )( )i x i E Ic ??在 kx 处的 Taylor 一阶展开式作为约束条件,构造一个二次规划子问题来获得搜索方向 kd ,它可以看作是求解无约束优化问题的牛顿法(或拟牛顿法 )在约束情形下的推广 . 由于 2 ( , )kkxxLx?? 的计算量比较大且不一定正定,因此,我们一般采用拟牛顿法思想构造正定矩阵序列{}kB ,并以kB 代替 2 ( , )kkxxLx?? ,即由二次规划子问题m i n ( ) ( ) 0 ,s .t . 12() ((,) )0T k Tkk k Tik k Tiiid B d dc xd Ecxfxc x icx dIi(15.0.2)来确定下降方向 kd .在序列二次规划法中,一般采用某种精确罚函数来作为评价算法产生的迭代点 kx 趋近原问题 (15.1.1)最优解 x 的程度的价值函数 .§15.1 Lagrange-Newton 法本节考察仅有等式约束的情形m i n ( )s .t . ( ) 0 , {1 , 2 , , }i Efxc x i m??? ? (15.1.1)第十五章序列二次规划法272 最优化理论与方法 [乌力吉 ]其中 (( )), )(i xfc ix E? 均二阶连续可微 . 其 Lagrange 函数为1(( ), ) ) (miiif x cLx x????? ?. (15.1.2)由第九章可知,在一定条件下, x 是问题 (15.1.1)的局部解的必要条件是存在 m满足 K-K-T 条件1( , ) ( ) ( ) ,(, ),) ( mx i iiL x f x c cx xxL?(15.1.3)这里 12( ) , ( ) ,( ) ( , ( ) ) Tmxcc xcx xc ? ?.Lagrange-Newton 法的基本思想是利用牛顿法求解非线性方程组 (15.1.3)来得到原问题(15.1.1)的 K-K-T 点及其乘子 .§15.1.1 非线性方程组的阻尼 Newton 法我们先来讨论求解一般非线性方程组()Gx?0 (15.1.4)的 Newton 法,其中 : nnG 连续可微 .在当前迭代点 kx 处,将向量值函数 ()Gx 以其在 kx 处的 T aylor 一阶展开式近似代替,求解线性方程组) ( )( ()k k k TG x dd G x G x? ? ? ? ? 0, (15.1.5)其中 12( ) ( ( ) ( ) ( ) )k k k knG x G x G x G x? ? ? ? ??,这个方程组又称为 Newton 方程,当()Gx 的 Jacobi 矩阵 ()kTGx? 可逆时,可解得 Newton 方向1( ) )( ()k k T kG x G xd ??? ? . (15.1.6)Newton 方向 kd 是价值函数21211|| ( ) |() |22 ()imixGx G x? ?? ??(15.1.7)在点 kx 处的下降方向,这是因为§ 15.1 Lagrange-Newton 法最优化理论与方法 [乌力吉 ] 2731( ) ( ) ( ) ( ) ( )k k kmikkiix x G x G x G xG?, (15.1.8)由此得( ) ) ( ) ) ( )(( ()2k T k k T k T k k T k kx d G x d G xG x G x x??? ? ?? ? ? ?, (15.1.9)因此,当 kx 不是非线性方程组 (15.1.4)的解时,必有 ( ) 0k T kx d.求解非线性方程组的经典 Newton 法迭代格式为1k k kxx d? ??. (15.1.10)设 x 为 ()Gx?0 的解, ( )Gx? 可逆,则由 ()Gx 连续可微可知,当kx 充分靠近 x 时,)( kGx? 也可逆,且由 Von-Neumann 引理知,存在 0M? ,使得1|| ( ) ||kG x M,于是11 | | | | | | | | ( ) ) ( ) | || | (k k k k k T kx x d x x G x xx Gx??? ? ? ? ? ? ??1| | ( ) ) | | ( )( | | (( | |))k T k k T kG x G x G x x x?? ? ? ???| | ( ) | | ( | | | | | ) | | ( | | )|kkM G x o x x o x x? ? ? ??, (15.1.11)这表明非线性方程组的牛顿法具有局部超线性收敛速率,特别地,当 ()Gx? 在点 x 处局部Lipschitz 连续时,由定理 1.2.1,有1 | | | | (| | ( ) ) ( ) ( ) | |k k k T kx G x GxM x G x x x? ? ? ? ? ??2(|| || )kO x x??, (15.1.12)这时,非线性方程组的 Newton 法具有局部二阶收敛速率 .算法 15.1(非线性方程组的阻尼 Newton 法)步 1:给定初始点 0 nx?? ,参数 (0,1)?? 和 (0,1)?? ,容许误差0?? ,置 0k? ;步 2:如果 ()kx ,则算法结束,输出近似解 kx ;步 3:确定牛顿方向,从牛顿方程( ) ( )k k TG x G x d?? ? 0 (15.1.13)解出 kd ,并令 1?? ;步 4:沿 kd 进行简单后退线搜索,如果第十五章序列二次规划法274 最优化理论与方法 [乌力吉 ]( ) (1 ) ( )k k kx d x? ? ? ? ?? ? ?, (15.1.14)则令 ? ??? ,转步 4,否则令 k ;步 5:令 1k k kkx x d?? ?? ,置 1kk??,转步 2.定理 15.1.1 设 : n nG 连续可微,如果 ()kGx? 对每个 k 都可逆,且存在 0M? ,使得 1()|| ||kG x M总成立,则算法 15.1 产生的点列 {}kx 的任何聚点都是 ()Gx?0 的解 .证设x 是点列{}kx 的一个聚点,则存在无穷指标集1 {1,2, }K ? ? ,满足1limkkKk xx??? ?, (15.1.15)由于算法 15.1 是下降算法,故由数列 {( )}kx? 单调减少可知( ) ( )limk kxx???? ? . (15.1.16)由于 1()|| ||kG x M,故对每个 1k K? ,都有1 0| | | | | | | | | | | | | |( ) ) ||( ( )k k kG x G x GdM x?? ?? ?,(15.1.17)即1{}k kKd ?有界,从而存在无穷指标集 21K K? ,使得2limkkKk dd??? ?,且由 ()Gx 连续可微,有2( ) ( ) | || | l i m | | 0( ) ( ) | |T k T k kkKkddG x G x G x G x???? ? ? ???,即( ) ( )T dG x G x? ? ?. (15.1.18)再由算法 15.1 步 4 可知,1 )( ) ( ) (1 ( )k k k kkkdx x x? ? ? ? ? ?? ??? ?, (15.1.19)( ) (1 ( ))k k kkkdxx? ? ? ? ?? ??, (15.1.20)其中 ? /kk? ? ?? .下面用反证法来证明定理的结论成立 . 假设 x 不是 ()Gx?0 的解,这时 ( ) 0x? ? ,由不等式 (15.1.19)和极限 (15.1.16),有 lim 0k k??? ?,因此,§ 15.1 Lagrange-Newton 法最优化理论与方法 [乌力吉 ] 275lim? 0kk ??? ? , (15.1.21)由此得2( ) ( l im 2) ( ) ( ) ( ) ( )? T T Tk kK kkxx x d G x G x xd d? ? ? ???,从而对充分大的 2k K? ,都有3 (1? ?( )2 ) ( )kkdxx? ? ? ???? . (15.1.22) 由于对任意 (0,1)?? ,有22l i m ( ) l i m ? )? (kkkkk K k Kkkx d x x d? ? ? ???? ? ? ?? ? ? ?,故由 ( ) ( ) ( )Tx G x G x?? ? ? 连续以及2limkkKk dd??? ?,有)? ?| ( ) ( ( ) ( |)k k kkkdx x x xd? ? ? ? ? ?? ? ???|? ?| ( ) ( )k k k T k k Tk k k kddx dx d? ? ? ? ? ? ? ?? ? ? ???( ) ? ? ?|( ( ) )k k k k T kk k kdxx dd? ? ? ? ? ? ?? ? ?? ? ?) (|( ? )?k T kkk d d dx? ? ? ?????( || ) ( ( ) || || ||k k k k kk k kdx x dd? ? ? ? ? ? ?? ??????|| ( ) || || || )kkk ddx d? ? ?? ? ? ??2? )( )( ,kok K k? ?? ??, (15.1.23)其中 (0 ,1), (0 ,1)kk对任意 2k K? 成立,故对充分大的 2k K? ,由不等式 (15.1.20) ,(15.1.23)和 (15.1.22),有( ) ( ) ( )k k k kkk dx x x? ? ? ? ? ?? ? ??( ) ( ) ( )kkxod x? ? ? ?? ? ??1? ? ? ?( ) ( ) ( ) ( )2k k k kx x o x? ? ? ? ? ? ?? ? ??? ?, (15.1.24)即有 ( ) ( )kxx?? ?? ,对不等式两边取极限,得第十五章序列二次规划法276 最优化理论与方法 [乌力吉 ]1) ( ) 0( x,由于 (0,1)?? ,故 ( ) 0x? ? ,但这与假设矛盾,矛盾表明假设不成立 .§15.1.2 等式约束优化问题的 Lagrange-Newton 法在本节,我们回过头来考察非线性方程组 (15.1.3)1()),(().miiif x c xcx(15.1.25)以 () mnAx 来表示约束函数 ()cx的 Jacobi 矩阵,即12 mA x c x c x c x? ? ? ? ??, (15.1.26)并记1(, ()()( ) ( ) ( , )) m ii xifGxcxcxx c x Lx? ??, (15.1.27)则 (,)Gx? 的 Jacobi 矩阵为2 ( ) ( ))( ,(, )Txx Lx AxxxG A ?? ?????? ?????O . (15.1.28)假设 A (A1) 约束函数 ()cx的 Jacobi 矩阵 ()Ax 是行满秩的;(A2) Lagrange 函数的 Hesse 矩阵 2 ( ),xxLx?? 在切平面 { | }nd Ad? ? 0? 上正定,即有2 ( |, ) 0 },{Tnxx L x dd d dd A?? ? ? ?? ? ?0 0?. (15.1.29)定理 15.1.2 如果问题 (15.1.25)满足假设 A,则 ( , )Gx?? 是可逆矩阵 .证设存在向量 nmd 满足2 ) ( )) (,,()(T xxx dAxddAxLxGx ??? ??? ? ? ? ??? ? ??? ?? ??? ?????? 00O,则由2 (), )( Txx xLx d A x d ??? ? ? 0, (15.1.30)§ 15.1 Lagrange-Newton 法最优化理论与方法 [乌力吉 ] 277()xA x d??0 , (15.1.31)有2 (, ) ( ) ( ) xT T T Tx x x x xd d d A x d ALx xdd??? ??? ? 0,(15.1.32)这样,由等式 (15.1.31)和 (15.1.32)以及假设 (A2)可知 xd?0 ,将其代入方程等式 (15.1.30),得()TA x d? ?0 ,而由假设 (A1)可知 ()TAx 是列满秩的,故 d??0 ,从而 ( , )Gx?? 是可逆矩阵 .记1( , ) ( , ) ( , )2 Tx G x G x? ? ? ?? .等式约束优化问题的Lagrange-Newton 法就是通过算法15.1 来求解非线性方程组(15.1.14)来得到约束问题(15.1.3)的K-K-T 点及其乘子,具体算法如下:算法 15.2(等式约束优化问题的 Lagrange-Newton 法)步 1:给定初始点 00)(, nmx ? ??? ,参数 (0,1)?? 和 (0,1)?? ,容许误差 0?? ,置 0k? ;步2:如果(),kkx? ? ?? ,则算法结束,输出近似K-K-T 点对( ),kkx ? ;步 3:确定牛顿方向,从牛顿方程2 ( , () ( ) ( )( )())k k k T k k T kxxxkkdAfdAL x x x A xx c xO 0(15.1.33)解出 , )( kkxd d? ,并令 1?? ;步 4:沿 , )( kkxd d? 进行简单后退线搜索,如果( ) ( 1 ) (,, )k k k k k kxx d d x?? ? ? ? ? ? ? ?? ? ? ?,则令 ? ??? ,转步 4,否则令 k ;步 5:令 1kkk kxx x d?? ?? , 1kkk kd????? ?? ,置 1kk??,转步 2.这个算法的全局收敛性和局部收敛速率可由§15.1.1 中相应结论得到 .注对于包含不等式约束的优化问题第十五章序列二次规划法278 最优化理论与方法 [乌力吉 ]m in ( )( ) 0 , { 1 , 2 , , }s . t.( ) 0 , { 1 , 2 , , }i eei efxc x i mc x i m mI m我们可以考虑引入松弛变量,使其成为仅具有等式约束的优化问题2m in ( )( ) 0 , { 1 , 2 , , }s. t.( ) 0 , { 1 , 2 , , }eii eiefxc x i mc x y i m m m EI具体讨论读者自己完成 .当我们恒取 1k?? 时,算法 15.2 就变成经典 Newton 法,这时有迭代格式11,.kkkxkx x dd从而,牛顿方程 (15.1.33)可以写成2 ) ( )(,()()()k k k T kxxkkL x x xxc dAA xf? ?? ? ? ?? ? ??? ?? ? ? ???? ??O 0, (15.1.34)由此解出 kkxdd? 和 1 kkkd???? ??.另一方面,我们注意到非线性方程组 (15.1.34) 完全可以看成是二次规划问题21m in ( ) (2s . t., ) ()))( (T k k k Txxkkd f xq d d L x ddx cxA(15.1.35)的一阶必要条件,即为问题 (15.1.20)的 K-K-T 条件 .当假设 A 满足时,非线性方程组 (15.1.34)的唯一解 1)(,kkd ?? 就是凸二次规划问题(15.1.35)的最优解及其乘子 .因此,等式约束优化问题的 Lagrange-Newton 法可以理解为每次求解一个二次规划子问题来得到在当前迭代点 kx 处关于变量 x 的下降方向 kkxdd? 以及1k k kx x d? ??的乘子1k?? .这给了我们一个启示,对于约束优化问题可以通过解一系列这样的二次规划子问题来产生收敛于原问题 K-K-T 点及其 Lagrange 乘子的迭代序列 {}kx 和{}k? ,这就是序列二次规划法的思想来源 .§ 15.2 序列二次规划法最优化理论与方法 [乌力吉 ] 279§15.2 序列二次规划法本节考察一般非线性约束最优化问题m in ( )( ) 0 , { 1 , 2 , , }s . t.( ) 0 , { 1 , 2 , , }i eei ec x i mc x i m mEI m(15.2.1)其中 )( )), ((i xfc i E Ix ??都二阶连续可微 .类似于二次规划子问题(15.1.35),我们构造一般约束问题(15.2.1)的二次规划子问题()) ( )1m in ( 0 , ,) ( ) 0 , ) 2 (s.t . (T k T kk T k iik T k d f x cdq d d Bc x i Ec d c x i Idxx(15.2.2)其中 kB 是 Lagrange 函数的 Hesse 矩阵 2 ,)( kkxxLx?? 的近似 . 二次规划问题 (15.2.2)的 K-K-T 条件为1( ) ( ) ,( ) ( ) 0 , ,( ) ( ) 0 , 0 , ( ) ( ) .( ) 0 , mkkk i iik T kiik T k k T ki i i i i if x c xx x i Ex x x x IBdc d cc d c c d c i 0(15.2.3)定理 15.2.1 如果 kd 是二次规划问题 (15.2.2)的 K-K-T 点, k? 是相应的乘子,则对于 1l?罚函数() 1|( ) ( ) | ( ) ||kcxP x f x? ? ??? , (15.2.4)有() 110) | | ( ) | | (( () )kk mk T k k k kk i iid cxd P x d B d xd c?, (15.2.5)其中() 1| | ( ) | | | ( ) | | m i n{ 0 , ( ) } |k iii E i Ic x c x c x| ( ) | m a x{ 0 , ( ) }iii E i Ic x c x????? ?? . (15.2.6) 证对任意 , nyz?? , [0,1]?? ,有第十五章序列二次规划法280 最优化理论与方法 [乌力吉 ]() 11| | [ ( 1 | m i n{ 0 , ( 1 } |) ] | | )nii iy z y z? ? ? ??? ? ???? ?1 )m a x{ 0 , (1 }ini iyz??? ?? ? ??1 [ ( 1 m a x{ 0 , } m a x{ 0 ,) }]niii yz???? ? ? ? ??11) m i n{ 0 , m i n{ 0}} ,(1nniiiiyz??????? ??( ) ( )11) | || ||(| ||1 yz.因此,由函数 ()1| || |y? 的凸性和 K-K-T 条件知, ()Px? 在 kx 处沿方向 kd 的方向导数( ) ( )1100) ( ) | | ( ) | |()( | | | |l i mkk k k kk T kd P x cd x d xfx cd d?( ) ( )11((|| [ ) ) ] || ( ) |) || |l im() k k T k kk T k c x A x d xf x d c( ) ( )11( ) ( | ( ( ) ) ] || ( ) ||| ) || )[k T k k k T k kf x d x Accx d x? ???????11 ()( ) ( ) | |||miTk k k k kk i iBd c x xcd?? ????? ? ? ???????() 11|() | ( ) | | ( )mk T k k k kk i iicxd B d cx??? ?? ? ? ? ?,其中矩阵 1 2) ( ( ) ( ) ( ) )( kk mkkc x c x xx cA ? ? ? ??,从而定理得证 .定理 15.2.2 如果 kd 是二次规划问题 (15.2.2)的 K-K-T 点, k? 是相应的乘子,则当( ) 0k T kkd B d ? 且 || ||k 时, kd 是 1l? 罚函数 (15.2.4)在kx 处的下降方向 .证由于1 ( ) ( ) ) ( ))( (m k k k k k ki i i i i ii E Iiic x c x c x? ? ?? ? ??? ? ? ??? ?() 1| ( ) || | | | | | |m a x{ 0 , ( ) } ( ) | ||k k k k k ki i i ii EI ic x c x c x? ? ?,故当 ( ) 0k T kkd B d ? 且 || ||k 时,由 (15.2.5)知 ()Px? 在 kx处沿方向 kd 的方向导数§ 15.2 序列二次规划法最优化理论与方法 [乌力吉 ] 281)( 0kkP d ddx?,这表明 kd 是 1l? 罚函数 (15.2.4)在 kx 处的下降方向 .下面给出序列二次规划法的具体算法,这个算法是韩世平于 1976 年提出来的, Powell在 1977 年给出修改方案 . 由于 Wilson 早在 1963 年就讨论过Lagrange-Newton 法,因此,下面的算法也称作 Wilson-Han-Powell 算法 .算法 15.3(序列二次规划法)步 1:给定初始点 0 nx?? ,罚因子 0?? ,步长上限 0?? ,初始矩阵 0 nnB ,初始参数 0 0?? ,容许误差 0?? ,置 0k? ;步 2:求解二次规划子问题 (15.2.2)得到下降方向 kd ,如果|| ||kd ?? ,则算法结束,输出近似 K-K-T 点 kx ;步 3:求出步长 [0, ]k ,使得0) m i(( n)k k k kkkP d P x dx?? ??? ? ???? ? ? ?; (15.2.7)步 4:令 1kk kkx x d?? ?? ;步 5:产生矩阵 1kB? 和参数 1 0k?? ? ;步 6:置 1kk??,转步 2.注( 1)在算法 15.3 中,价值函数 ()Px? 是 1l? 罚函数 (15.2.4),正数列 {}k? 满足0k k??. (15.2.8)(2)矩阵1kB? 的计算一般是用拟牛顿迭代公式产生,我们希望它是 2 1 1( , )kkxxLx 的近似,因此可取1 1 11( ) ( ) ( ), )( ()mk k k k k k k k ki i iix x f x f x cs xy cx?? ? ??? ? ? ? ? ? ? ? ? ??, (15.2.9)然后利用拟牛顿公式计算1kB? . 由于上述线搜索过程不能保证( )0k T kys ? ,从而不能直接利用 BFGS 方法 . Powell 在 1978 年给出了一种修正策略,即取) 0 . 2 ( )( 1 ), ( ,, ) 0 . 2(,()k k T k k T kk kk k k T k k T kk k k ky s B sBysy y s y s B ss?? ????? ? ?第十五章序列二次规划法282 最优化理论与方法 [乌力吉 ]其中(0 .8 ()( ) )k T kkk k T k k T kks B ssysBs? ? ?,经过这样的修正,我们就可以用 BFGS 方法 .还有一种修正策略是以1 ( ) ( )? 2mk k k kiii c x c xyy ? ?? ?? ?来取代 ky . 这种做法一般能保证 ?( )0k T ks y ? ,如果 ?( )0k T ks y ? ,则可以通过增大 ? 来实现其反号 .定理 15.2.3 设 ()fx和 ( )( )i x i E Ic ??都连续可微,且存在两个常数 0 mM?? ,使得不等式22|| |||| || T km d Bd M dd?? (15.2.10)对一切 k 和 nd?? 都成立 . 如果不等式 || ||k 对一切 k 都成立,则由算法 15.3 产生的点列 {}kx 的任何聚点都是约束优化问题 (15.2.1)的 K-K-T 点 .证设x 是点列{}kx 的任意一个聚点,且存在无穷指标集0 {1, }2,K ? ? ,使得0limkkkK x x?.由定理的条件可知, {}k? 和 {}kB 都有界从而0{}k kK? ?和0{}k k KB ?都有收敛子列,不妨就设00,lim limkkk kKKBB? ???.由于 kd 是二次规划子问题 (15.2.2)的最优解,从而 kd 满足 K-K-T 条件 (15.2.3). 注意到()fx和 ( )( )i x i E Ic ??都连续可微, kB 满足不等式 (15.2.10),由线性方程组的扰动理论,我们在 (15.2.3)式中令 k?? ,不难得出lim kkKk dd??? ? , (15.2.11)且 d 满足 K-K-T 条件§ 15.2 序列二次规划法最优化理论与方法 [乌力吉 ] 2831( ) ( ) ,( ) ( ) 0 , , ( ) ( ) 0 , 0 , ( ) ( ) .( ) 0 , miiiTiiTi i iTi i if x c xx x i ExxBdc d cc d c cdx x Ici(15.2.12)如果 d?0 ,则由 K-K-T 条件 (15.2.12)易见,这时 x 是约束优化问题 (15.2.1)的 K-K-T点,定理得证 .下面讨论 d?0 的情形,这时取 [0, ]? ?? ,满足0) m i((n)P x P xdd????????? ? ?.由于 d 满足 K-K-T 条件 (15.2.12),其中 ? 是 x 的乘子, 0Td Bd? ,|| ||? ??? ,由定理 15.2.2 可知, d 是目标函数 ()Px? 在 x 处的下降方向,从而有)(()P x P xd.记 ) )0((P x P x d??? ??? ?? ,由于kkd x dx ??? ? ? 0,)( kKk ?? ? ,故对充分大的 0k K? ,有() 2 ()kkPPx d x??? ??? ?. (15.2.13)另一方面,由于1 0) m in(( )( )k k k kkkxxP P d P x? ? ??? ? ? ?? ??? ? ? ? ? 对每个 k 成立,故对任意自然数 k 和 m , 1mk??,有111( ) )(mmkiikPxxP?? ?. (15.2.14)再注意到不等式 (15.2.8)蕴含对充分大的 k 有2iki ???? ??,因此,对充分大的 k ,我们在不等式 (15.2.14)中令 m?? ,得第十五章序列二次规划法284 最优化理论与方法 [乌力吉 ]11( ) )(k iikP xP x?? ?0 (m i n )kk iikPdx??? ??。
序列二次规划法
min
1 T S HS C T S 2 s. t. AS B Aeq S Beq
(1-5)
求解此二次规划问题,将其最优解 S * 作为原问题的下一个搜索方向 S , 并在该方向上进行原约束问题目标函数的约束一维搜索, 就可以得到原约束问题 的一个近似解 X
此问题是原约束最优化问题的近似问题,但其解不一定是原问题的可行点。 为此,令
S X Xk
将上述二次规划问题变成关于变量的 S 的问题,即
1 min f ( X ) S T 2 f ( X k ) S f ( X k )T S 2 s. t. gu ( X k )T S gu ( X k ) 0 (u 1,2,..., p) hv ( X k )T S hv ( X k ) 0
k
3 序列二次规划算法推导过程
序列二次规划(SQP)算法是将复杂的非线性约束最优化问题转化为比较 简单的二次规划(QP)问题求解的算法。所谓二次规划问题就是目标函数为二 次函数, 约束函数为线性函数的最优化问题。二次规划问题是最简单的非线性约 束最优化问题。
3.1 序列二次规划算法思想
非线性约束最优化问题:
令
(1-3)
(v 1,2,..., m)
H 2 f ( X k ) C f ( X k ) Aeq [h1 ( X k ), h2 ( X k ),..., hm ( X k )]T A [g1 ( X k ), g 2 ( X k ),..., g p ( X k )]T Beq [h1 ( X k ), h2 ( X k ),..., hm ( X k )]T B [ g1 ( X k ), g 2 ( X k ),..., g p ( X k )]T
解非线性互补问题的非单调可行SQP方法
d + ≥0
s. . t
(. 03 )
ll≤A, II d
得到搜索方向 d .
和 所 有 的二 次子 规 划 一样 ,这个 子 问题 可 能 是 不相 容 的 . 献 f 提 出 一种 S P方 文 6 ] Q 法 ,通 过 利 用 QP子 问题 的 K T点 获得 可 行 下 降 方 向 .为 了方 便 起 见 ,在解 问题 (. — 02 ) 的 时候 ,文 献 『 假 设 点 总是 非 负 的 .但 我 们 知 道 很 多情 况 下初 始 点是 不 可 行 的 . 5 1 受 文 献 『 6 启发 ,本 文 提 出一 种 解 非 线性 互 补 问题 的可 行 S 5] - QP方法 .利用 QP子 问 题 的 K T点得到一个可行下降方 向, 引入一个高 阶校正步以克服 Maao 效应.同 — 并 rts 时 ,算 法 采 用 非 单 调 线 搜 索 技 巧 获得 搜 索步 长 . 18 96年 ,非 单 调 技 巧 由 Gr p i o等 人 p 在 文 献 f 中提 出 .基 于 非 单 调 技 巧也 产 生 了很 多 相 关 方 法 ,例 如 非单 调线 搜 索 方 法 7 ] [-1] 非单调信赖域方法 [-2 非单调技巧可以克服搜索步太小的缺 点, 7 5 1 2. 6 】 改善 由线搜
Chi e e Li a y Cl s i c t on 02 1 n s br r a s f a i 2 i
2 1 a h m a i s S b e t Cl s i c t o 0 0 6 K1 0 0 M t e tc u j c a sf a i n 9 C3 . 5 O i
r s ls a e a s e o t d i h spa e . e u t r lo r p r e n t i p r Ke ywo dsc n t a n d o t m ia i n, e ue ta u r r tcpr g a r o s r i e p i z to s q n i l a d a i o r mm i , c i e s t q ng a tv e , n nmo o o e t c n q e g o lc n e g n e o n t n e h i u , l ba o v rቤተ መጻሕፍቲ ባይዱe c
城市轨道交通系统单列车能耗优化
城市轨道交通系统单列车能耗优化余后伦;熊舒威;郭嫚【摘要】The low-carbon environmental protection and energy-saving emission reduction are the future development trend of railway.To optimize the energy-saving operation of the train, the train is treated as a single particle model and approximately considered as only running the three stages of traction, coasting and braking.On this basis, this paper establishes a typical non-linear programming model for optimizing the energy consumption of single train in the urban rail transit system, uses the sequence quadratic programming (SQP) algorithm to calculate the optimization and gives an example to verify its feasibility.%低碳环保、节能减排是铁路未来的发展趋势,为减少城市轨道列车的能耗,将列车处理为单质点模型,近似地认为城市轨道列车在两站间只经历牵引、惰行和制动3个阶段,在此基础上建立具有代表性的城市轨道交通系统单列车能耗优化的非线性规划模型,利用序列二次规划法(SQP)优化求解,并给出算例验证其可行性.【期刊名称】《山东交通学院学报》【年(卷),期】2017(025)001【总页数】7页(P14-20)【关键词】城市轨道交通;单质点模型;阶段;能耗;序列二次规划法【作者】余后伦;熊舒威;郭嫚【作者单位】西南交通大学交通运输与物流学院,四川成都 610031;西南交通大学交通运输与物流学院,四川成都 610031;西南交通大学交通运输与物流学院,四川成都 610031【正文语种】中文【中图分类】U268.6低碳环保、节能减排是铁路未来的发展趋势,列车运行过程中的能耗问题愈发引人关注。
非线性规划算法分析
非线性规划算法分析非线性规划问题指的是优化问题中约束条件或目标函数存在非线性项的问题。
这种问题往往具有复杂的结构,难以直接求解。
因此,需要使用非线性规划算法求解。
本文将从算法原理、优缺点以及实际应用等方面进行分析。
一、算法原理1. 梯度法梯度法是一种最简单的非线性规划算法,它的主要思想是利用目标函数的梯度信息来寻找局部最优解。
该算法的步骤如下:(1)初始化$x_0$,设置学习率$\alpha$和停止条件。
(2)计算目标函数的梯度$\nabla f(x)$。
(3)更新参数$x_{t+1}=x_t-\alpha\nabla f(x_t)$。
骤(2)。
梯度法的优点是简单易懂,收敛速度较快。
但是,该算法的缺点也十分明显,容易陷入局部最优解。
2. 牛顿法牛顿法是一种基于目标函数二阶导数信息的方法,它可以直接求解二次型非线性规划问题。
该算法的步骤如下:(1)初始化$x_0$,设置停止条件。
(2)计算目标函数的一阶导数$\nabla f(x)$和二阶导数$H_f(x)$。
(3)计算步长$\Delta x=-H_f(x)^{-1}\nabla f(x)$。
(4)更新参数$x_{t+1}=x_t+\Delta x$。
骤(2)。
牛顿法的优点是收敛速度快,但是算法需要计算目标函数二阶导数$H_f(x)$,如果$H_f(x)$存在严重的行列式奇异性,会导致牛顿法无法执行。
3. 共轭梯度法与梯度法和牛顿法不同,共轭梯度法不需要计算目标函数的二阶导数,而是根据目标函数的一阶导数采用一种连续的线性搜索方式来寻找解。
共轭梯度法的步骤如下:(1)初始化$x_0$和$\nabla f(x_0)$,设置停止条件。
(2)计算共轭方向$d_0=\nabla f(x_0)$。
(3)计算步长$\alpha_k=\frac {||\nabla f(x_0)||^2}{d_k^TH_f(x_k) d_k}$。
(4)更新参数$x_{k+1}=x_k+\alpha_k d_k$。
基于序列二次规划算法的插电式混合动力汽车模型预测控制策略
文章编号:1671-7872(2023)03-0313-11基于序列二次规划算法的插电式混合动力汽车模型预测控制策略张代庆 ,俞 聪 ,牛礼民 ,汪 恒 ,张义奇(安徽工业大学 机械工程学院, 安徽 马鞍山 243032)摘要:为提升插电式混合动力汽车(PHEV)的车速预测精度和燃油经济性,提出基于序列二次规划(SQP)算法的模型预测控制能量管理策略。
以卷积神经网络(CNN)构建的车速预测模型为基础,选取三类典型历史工况数据作为CNN 车速预测模型的训练集,使用鲸鱼优化算法(WOA)优化CNN 参数,通过优化的WOA-CNN 模型预测未来时域内的车速;采用SQP 算法对模型预测控制策略进行求解,且与基于规则的电量消耗和电量保持(CD-CS)策略和基于全局优化的动态规划(DP)策略的控制结果进行对比分析,验证所提策略的有效性。
结果表明:通过WOA-CNN 模型可提高车速预测精度,为4.88%~8.39%;与DP 控制策略相比,本文提出策略的燃油消耗量高出1.98%,但计算时间减少了74.32%,能量管理的实时性得到大幅提升;与CD-CS 控制策略相比,提出策略的节油率为20.37%。
综合考虑,本文提出策略的整车能量消耗和计算成本较优,可合理实现对PHEV 转矩分配的智能控制。
关键词:能量管理策略;模型预测控制;卷积神经网络;鲸鱼优化算法;序列二次规划;混合动力汽车中图分类号:U 469.72 文献标志码:A doi :10.12415/j.issn.1671−7872.22264Predictive Control Strategy of PHEV Model Based on Sequential QuadraticProgramming AlgorithmZHANG Daiqing, YU Cong, NIU Limin, WANG Heng, ZHANG Yiqi(School of Mechanical Engineering, Anhui University of Technology, Maanshan 243032, China)Abstract :In order to improve the speed prediction accuracy and fuel economy of plug-in hybrid electric vehicle (PHEV), a model predictive control energy management strategy based on sequential quadratic programming (SQP)algorithm was proposed. Based on the speed prediction model constructed by convolutional neural network (CNN),three types of typical historical working conditions were selected as the training set of CNN speed prediction model.Whale optimization algorithm (WOA) was used to optimize CNN parameters, and the optimized WOA-CNN model was used to predict the future speed in the time domain. SQP algorithm was used to solve the model predictive control strategy, and the control results with the rule-based charge depleting and charge sustaining (CD-CS) control strategy and the global optimization based dynamic programming (DP) control strategy were compared and analyzed to verify the effectiveness of the proposed strategy. The results show that the prediction accuracy of vehicle speed收稿日期:2022-10-24基金项目:先进数控和伺服驱动技术安徽省高校重点实验室开放基金项目(XJSK202104);安徽工程大学电力驱动与控制安徽省重点实验室开放基金项目(DQKJ202204);安徽省大学生创新创业项目(S202110360259)作者简介:张代庆(1997—),男,黑龙江大庆人,硕士生,主要研究方向为新能源汽车控制技术。
二次规划与非线性规划
x2
6
解
编写如下程序: h=[4,-4;-4,8]; g=[-6;-3]; A=[1,1;4,1]; b=[3;9]; [x,value]=quadprog(h,g,A,b,[],[],zeros(2, 1)) 求得
1.9500 x , Min f ( x ) 11.0250 1.0500
MATLAB(youh2)
18
例
2 f ( x) ex1 (4x12 2x2 4x1x2 2x2 1)
s.t.
x1+x2 0 1.5+x1x2 - x1 - x2 0 -x1x2 –10 0
1.先建立M文件fun4.m定义目标函数:
function f=fun4(x); f=exp(x(1)) *(4*x(1)^2+2*x(2)^2+4*x(1)*x(2)+2*x(2)+1);
min f ( x ) 2 x12 -4 x1 x2 4 x2 2 -6 x1-3x 2 x1 x 2 3 4 x1 x2 9 x1 , x2 0
5
转化为matlab求解格式:
1 x1 4 4 min f ( x) 2 x - 4 x1 x2 4 x2 - 6 x1 - 3x2 x1 2 x2 4 8 1 1 x1 3 0 x1 s.t. x , x 4 1 2 9 0 2
Ceq(X)=0 VLB X VUB
其中X为n维变元向量,G(X)与Ceq(X)均为非线性函数组成 的向量。
14
MATLAB求解上述问题,基本步骤分三步 1. 首先建立M文件fun.m,用来定义目标函数F(X): function f=fun(X); f=F(X);
船舶定位系统推力分配方法及策略研究
科技与创新┃Science and Technology&Innovation ·116·2023年第17期文章编号:2095-6835(2023)17-0116-03船舶定位系统推力分配方法及策略研究余祥(安徽省淮河船舶检验局,安徽蚌埠233000)摘要:随着科技的发展,海洋资源的勘探、开发和利用从浅海拓展至深海。
在这种情况下,船舶动力定位和推力分配成为了船舶工程领域的研究热点。
动力定位系统是利用船舶或平台自身推进器产生的推力来抵消外部环境力的技术,以维持预定位置或轨迹[1]。
推力分配模块是该系统的关键组成部分,其主要功能是在有限时间内找到最优的推力和角度组合,以满足控制器对合力和力矩的要求。
首先,总结了国内外动力定位系统中推力分配的研究现状,并说明研究的目标;其次,引入了数学模型,以优化推力分配,该数学模型包括目标函数和约束条件;最后,介绍了2种不同的数学优化算法,即二次规划(Quadratic Programming,QP)算法和序列二次规划(Sequential Quadratic Programming,SQP)算法,并将它们应用于推力分配问题数学模型的求解[2]。
此外,还介绍了一种自适应组合偏置算法,该算法能够根据控制力的大小和方向自适应地调整偏置量的大小及全向推进器的组合方式。
关键词:动力定位;推力分配;数学模型;组合偏置算法中图分类号:U664.82文献标志码:A DOI:10.15913/ki.kjycx.2023.17.034船舶动力定位系统(Dynamic Positioning System,DP)是利用船舶自身设备和先进技术实现船舶在海上进行自主控制的技术[3]。
传统的推力分配方法无法考虑到海洋环境的变化和复杂性,不能实现最优的推力分配,从而影响了DP系统的性能和船舶的操作效率[4]。
推力分配方法和策略的研究可以为船舶动力定位系统的发展提供技术支持和理论指导,提高船舶的定位精度和控制效率,进一步提升海洋工程的安全性和可靠性。
SVI隐含波动率模型的时间指数扩展
SVI隐含波动率模型的时间指数扩展庄颖;吴小燕;王美清【摘要】针对半参数SVI模型提出了避免跨期套利约束模型,根据平稳时间平方根规则,用对数执行价格和剩余期限的特定组合替代了原模型中的对数执行价格.为了使对数执行价格和剩余期限之间的关系更加灵活,引入了新的参数来调整二者之间的组合,并在此基础上提出参数模型构建隐含波动率曲面.最后基于AAPL股票期权进行了实证分析,结果表明,改进半参数模型更具灵活性与精确性,能够较好地构建隐含波动率曲面.%This paper improves the semi-parametric SVImodel.According to the stationary square root of time rule,the logarithmic strike price is replaced with the particular combination of the logarithmic price and maturity,and also add a new parameter to adjust the combination.And on this basis a new parameter model is put forward to rebuild the implied volatility surface.It also carries some empirical analyses based on AAPL stock option.The experimental results show that the modified model is more flexible and accurate,and the parameter model has a better fitting.【期刊名称】《福州大学学报(自然科学版)》【年(卷),期】2018(046)002【总页数】9页(P169-177)【关键词】隐含波动率;半参数模型;SVI模型;无风险套利【作者】庄颖;吴小燕;王美清【作者单位】福州大学数学与计算机科学学院,福建福州 350116;福州大学数学与计算机科学学院,福建福州 350116;福州大学数学与计算机科学学院,福建福州350116【正文语种】中文【中图分类】F830.910 引言期权定价问题是近年来金融数学中的热点之一. 1973年提出的Black-Scholes(B-S)期权定价[1]模型使得期权研究有了新的突破. 该模型假设标的资产服从几何布朗运动,其波动率为常数. 但是大量实证分析表明,通过B-S公式反推得到的隐含波动率并不是常数,而是关于执行价格和剩余期限的函数,具有“波动率微笑”和“期限结构”等特征[2-5]. 该函数所表示的曲面称为隐含波动率曲面. 隐含波动率曲面包含了大量市场的信息,能够指导金融市场的投资方向.隐含波动率曲面的重构方法可根据其函数的参数形式分为参数模型、半参数模型和非参数模型. 参数模型认为隐含波动率与标的资产价格、期权合约的剩余期限和执行价格等因素之间存在确定性的函数关系,如: Derman[6]提出的粘性行权价(sticky strike)关系,粘性delta(sticky delta)关系, 以及Daglish等[7]提出的平稳时间平方根关系(stationary square root of time)等. 1998年Dumas等[8]基于粘性行权价关系,采用S&P500指数期权的数据,提出一组隐含波动率曲面的参数模型. 2004年Cassese等[9]沿用了文献[8]的思想,用在值程度替换了原模型中的执行价格,并证明了新的模型具有更好的拟合效果. 半参数隐含波动率模型描述的是隐含波动率曲面中某一维度的特性,再延伸至整个隐含波动率曲面. 这方面的模型有随机半参数SABR模型[10]和半参数化模型(stochastic volatilityinspired, SVI)[11]. 非参数模型利用非参方法对隐含波动率曲面进行主成分分析再对其进行建模. 由于非参数模型缺乏拓展能力,并且对数据量有一定的要求,因而在实际应用中存在一定的局限.本研究主要针对SVI模型进行改进,该模型提出的隐含波动率函数在对数执行价格方向上逼近市场数据. 根据平稳时间平方根规则,用对数执行价格和剩余期限的特定组合替代原模型中的对数执行价格,并引入了新的参数来调整二者之间的组合,更灵活地表达了对数执行价格与剩余期限之间的关系,从而获得更精确的拟合函数. 最后,将改进模型延伸至参数模型来构建隐含波动率曲面. 本研究通过对AAPL苹果股票期权市场数据进行实证分析,结果表明改进的模型更具灵活性与精确性,能更好地拟合市场隐含波动率和期权价格.1 隐含波动率与SVI模型1.1 隐含波动率Black-Scholes期权定价模型假设标的资产价格遵循几何布朗运动,且波动率为常数. 在不支付红利与交易费用、税费的情况下,针对某一标的资产的欧式看涨期权和看跌期权的定价公式分别如下:(1)其中: N(·)为标准正态分布变量的累积概率分布函数; T为到期日, t为时间,τ=T-t; St为t时刻标的资产的价格; r为年化无风险利率;σ为标的资产的波动率. 由公式(1)计算得到的期权价格统一记作VBS. 在该模型中,标的市场价格、剩余期限、年化无风险利率均为市场给定,只有波动率σ无法从市场直接获取. 因此在已知期权价格、执行价格、剩余期限以及无风险利率的情况下,从Black-Scholes期权定价模型反推得到的波动率称为隐含波动率,即隐含波动率σ由下列公式定义:σ(V, St, K, τ, r)= argσ{VBS(σ, St, K, τ, r)=Vmarket}(2)其中: Vmarket为市场的期权价格.1.2 SVI模型为了便于判断隐含波动率未来走势,需要根据市场数据获取隐含波动率、执行价格和剩余期限三者之间的关系. 通过B-S公式直接反推求隐含波动率是个不适定的反问题[12],在算法实现上存在一定的困难. SVI半参数化模型[11] 把问题限制在一维的情况,在固定剩余期限的情况下考虑隐含波动率与对数执行价格之间的关系. 该模型固定的剩余期限τ,当对数执行价格|k|→时,隐含方差关于k是线性的,并由此建立了总隐含方差(total implied variance)ω与对数执行价格k的函数关系式.总隐含方差定义为:(3)对数执行价格定义为:(4)其中: K为执行价格; St为t时刻标的资产的价格; r为年化无风险利率.固定的剩余期限τ, SVI模型给出的总隐含方差与对数执行价格之间的函数关系式为:(5)其中: τ为剩余期限;στ为隐含波动率为隐含方差; k为考虑了执行价格与标的资产远期价格相对关系的对数执行价格;ω为总隐含方差.2 模型改进2.1 改进SVI模型——时间指数E-SVI模型对SVI模型(即公式(5))进行变形可以得到公式(6):(6)该公式描述了隐含波动率与对数执行价格和剩余期限的确定性函数关系式,这样的关系式满足粘性delta规则,即隐含波动率是关于对数执行价格和剩余期限的函数.Daglish等[7]提出的平稳时间平方根规则认为隐含波动率是关于对数执行价格k 和剩余期限τ的组合的函数:(7)文献[7]用OTC市场S&P500期权的月度数据对粘性delta规则和平稳时间平方根规则进行了实证检验,结果表明平稳时间平方根规则构建的模型参数更少,并且比粘性delta规则的模型更能准确描述隐含波动率曲面.本研究尝试使用平稳时间平方根规则对SVI模型进行改进,即用组合代替SVI模型中的对数执行价格k, 则SVI模型即公式(6)可以改写为:(8)(9)该模型简单易用,隐含波动率与组合的关系不会发生改变,是典型的静态模型. 在市场数据较多且“波动率微笑”明显的情况下,这样的改进对拟合效果不会产生很大的影响,但在市场数据较少或“波动率微笑”不显著的情况下,这样的改进会影响拟合效果. 为了获得更大的灵活性,本研究尝试用τβ代替将组合调整为用参数β来动态调整k和τ的之间的关系,并提出改进的时间指数E-SVI模型:(10)(11)2.2 无套利条件约束模型不存在无风险套利机会是Black-Scholes期权定价公式中重要的假设之一. 套利机会可分为动态套利机会和静态套利机会,在本研究中仅考虑避免静态套利机会,即避免跨期套利和蝶式套利. 隐含波动率模型在建立时,应考虑隐含波动率曲面的无套利条件[11, 13-14]. 隐含波动率曲面无套利条件归纳如下:1) 对任意τ>0, ω(·, τ)是二阶可微的.2) 对任意k∈, τ>0,ω(k, τ)>0成立.3) 对任意k∈, τ>0,满足(12)4) 对任意k∈, ω(k, ·)是增函数,∂τω(k, τ)≥0.5) 对任意k∈, ω(k, 0)=0成立.假设在某一固定的交易日t,定义在标的资产上的看涨期权共有m个到期日,则对应有m个剩余期限,记为τ1, …, τm,且τj<τj+1(j=1, 2,…, m-1);剩余期限为τj的期权合约(不同的执行价格)共有nj个,相应的执行价格和对数执行价格分别记为和同时利用市场数据反算得到隐含波动率相应为用向量表示为:为了表示方便,本研究将剩余期限为τj的参数集合记为χτj={a, b,ρ, m, c,β},并将总隐含方差记为ωτ(k; χτj). 针对上节提出的E-SVI模型引入无套利约束条件,则公式(11)改写为下述非线性约束问题:(13)条件①是为了保证隐含波动率恒大于0,条件②是为了避免蝶式套利,条件③是为了消除跨期套利. 当求解χτm时,非线性约束问题(13)不考虑条件③. 在求解模型时,往往选择从剩余期限最大(即j=m)的隐含波动率曲线的参数开始拟合.本研究使用序列二次规划算法[15](sequential quadratic programming, SQP)求解非线性约束问题(13). 该算法将复杂的非线性约束最优化问题转化为比较简单的二次规划问题,即目标函数为二次函数,约束条件为线性函数的最优化问题.将问题(13)的解作为模型参数带入模型(10)~(11),即可获得由模型拟合的隐含波动率和隐含方差. 将该隐含波动率带入B-S模型,即可求出相应的期权价格.3 隐含波动率曲面在SVI半参数模型中,对总隐含方差的拟合只考虑了一维变量,即总隐含方差与执行价格K(或者对数执行价格k)的关系,没有考虑二维变量,虽然经过公式变化可以拟合隐含波动率曲面,但无法加入跨期套利约束.上节提出的时间指数E-SVI模型在固定剩余期限的情况下,认为隐含波动率是对数执行价格的一维函数. 在剩余期限τ变化的情况下,该一维函数就拓展为二维曲面:(14)(15)该模型的曲面曲率由所决定,即由参数c和β调整曲面的弯曲程度. 求解隐含波动率曲面的模型参数,可参照求解隐含波动率曲线的方法.4 实证分析本研究从隐含波动率和期权价格两个方面来验证模型的有效性. 针对某一确定的标的资产,假设N表示期权的个数,σ1,σ2,…,σN表示相应的市场隐含波动率数据,而表示由模型计算获得的隐含波动率.和表示相应期权的市场买入价和卖出价,表示由模型计算获得的隐含波动率带入B-S公式中计算得到的期权价格,令假设中满足的数量为M.隐含波动率的观察指标如下:1) 相关性系数ρ,用来比较模型结果与市场数据的相关性. 则相关性系数计算如下:2) 隐含波动率均方根误差:3) 隐含波动率平均绝对误差:期权价格的观察指标如下:I) 期权价格均方根误差:II) 期权价格平均绝对误差:III) 期权价格正确率为:4.1 隐含波动率曲线本研究采用AAPL股票期权2016年3月共21个交易日的市场数据对E-SVI模型做实证分析. 图1给出了2016年3月1日市场数据的拟合情况,其中图1(a)给出了到期日为2016年10月21日的隐含波动率拟合曲线,以及与市场隐含波动率的对比情况. 可以看出,该模型较好地拟合了市场数据. 图1(b)给出了到期日分别为2016年10月21日和2017年1月20日的总隐含方差拟合曲线. 可以看出两条曲线之间不存在交叉情况,即无套利机会.图1 E-SVI模型拟合隐含波动率曲线Fig.1 The curve fitting of the E-SVI model 表1~2给出了2016年3月1日对于不同到期日的数据分析. 其中表1给出了E-SVI模型计算结果与市场数据的相关性系数并与SVI模型做比较. 表2分别比较了两个模型获得隐含波动率和期权价格与市场数据的近似程度.通过表1~2可知,对于一个交易日中不同的到期日, E-SVI模型在拟合效果上有一定的改善. 通过相关性比较,原始SVI模型得到的隐含波动率估计值与市场数据已经普遍具有很高的相关性,而E-SVI模型的相关性系数相比原始SVI模型有所提高. 观察表2中数据比较可知,原始SVI对隐含波动率曲线的拟合已经足够接近市场真实数据, E-SVI模型在表2中的5个指标对于与原始SVI均有一定的改善.表1 2016年3月1日隐含波动率曲线模型相关性比较Tab.1 The correlation comparison of implied volatility curve model on Mar. 1st, 2016到期日SVIE-SVI到期日SVIE-SVI到期日SVIE-SVI2016-3-40.9890.9592016-4-10.9960.9962016-6-170.9860.9902016-3-110.9810.9822016-4-80.9020.9992016-7-150.9860.9882016-3-180.9740.9632016-4-150.9980.9982016-10-210.9920.9932016-3-240.9970.9952016-5-200.9940.9932017-1-200.9950.995注:加粗字体表示对应模型得到的数据与市场数据之间的相关性更强表2 2016年3月1日隐含波动率曲线模型拟合误差分析Tab.2 The fitting error analysis of implied volatility curve model on Mar. 1st, 2016到期日模型η/%ivR/%ivM/%VRVM到期日模型η/%ivR/%ivM/%VRVM2016-3-4SVI44.900.3023.830.091.64E55.101.5449.681.124.102016-3-11SVI41.860.0641.460.061.49E51.160.0611.350.041.122016-3-18SVI56.520.2962.940.030.85E55.171.5556.140.031.092016-3-24SVI26.830.0040.430.061.6E26.390.0070.410.041.342016-4-1SVI27.950.0040.300.041.50E28.950.0030.290.041.452016-4-8SVI17.60.0170.630.22.83E17.650.0000.090.041.562016-4-15SVI59.380.0120.820.332.60E59.380.0100.810.232.092016-5-20SVI27.270.0150.880.594.88E45.450.0491.230.061.462016-6-17SVI53.130.0381.320.252.96E28.130.0180.630.242.922016-7-15SVI46.670.0321.040.363.43E33.330.0240.760.343.332016-10-21SVI15.380.0070.431.7611.47E15.380.0060.441.711.27201 7-1-20SVI2.940.0020.272.7511.96E2.940.0020.272.4311.11 注:表中η为期权价格正确率; ivR为隐含波动率的均方根误差; ivM为隐含波动率平均绝对误差; VR为期权价格均方根误; VM为期权价格平均绝对误差. 加粗字体表示对应模型得到结果更好,表4和表6同为了进一步观察E-SVI模型的改进效果,本研究对于2016年3月的其余21个交易日分别进行SVI模型以及E-SVI模型的拟合实验,将一个交易日中所有实验得出的实验数据与该交易日中的市场数据进行对比分析,如表3~4所示. 其中表3给出了两个模型的计算结果与市场数据的相关性系数. 表4分别比较了两个模型获得的隐含波动率和期权价格与市场数据的近似程度.观察表3~4可知, E-SVI模型与原始SVI相比,在拟合效果上有一定的改善. E-SVI模型下的相关性系数相比原始SVI模型有所提高,且E-SVI模型在表4中的5个指标对于与原始SVI均有一定的改善.表3 隐含波动率曲面半参数模型相关性比较Tab.3 The correlation comparison of implied volatility surface semi- parametric model日期SVIE-SVI日期SVIE-SVI日期SVIE-SVI2016-3-20.8280.8602016-3-140.9090.8402016-3-230.9360.9452016-3-30.6620.7552016-3-150.8990.9922016-3-240.9480.9722016-3-70.8760.9692016-3-160.9080.9862016-3-250.9520.9502016-3-80.9040.9652016-3-170.9690.9782016-3-280.9360.9312016-3-90.9000.9412016-3-180.9020.9882016-3-290.8820.9052016-3-100.9180.9442016-3-210.9240.9882016-3-300.9570.9682016-3-110.8770.9812016-3-220.9120.9892016-3-310.6760.640注:加粗字体表示对应模型得到的数据与市场数据之间的相关性更强表4 隐含波动率曲面半参数模型拟合误差分析Tab.4 The fitting error analysis of implied volatility surface semi- parametric model到期日模型η/%ivR/%ivM/%VRVM到期日模型η/%ivR/%ivM/%VRVM2016-3-2SVI36.490.442.550.503.30E38.110.101.460.463.392016-3-3SVI32.170.875.362.327.94E36.550.572.781.766.262016-3-7SVI35.287.656.537.188.04E41.564.207.343.148.142016-3-8SVI30.781.382.313.586.89E41.970.171.941.345.622016-3-9SVI29.547.767.687.607.39E30.801.083.771.767.552016-3-10SVI26.473.5712.887.8515.44E27.712.346.373.9310.28201 6-3-11SVI19.006.185.474.437.07E26.524.054.501.826.582016-3-14SVI21.260.913.383.259.49E24.300.191.602.428.162016-3-15SVI21.831.516.756.557.67E39.303.345.152.387.242016-3-16SVI36.991.253.761.526.66E41.130.522.961.426.082016-3-17SVI16.730.811.563.8412.47E25.100.030.903.6211.462016-3-18SVI31.820.621.266.708.66E33.790.030.894.025.492016-3-21SVI27.990.962.912.778.68E29.240.041.012.038.412016-3-22SVI30.931.451.142.199.78E35.560.041.142.078.902016-3-23SVI25.63381.354.855.479.89E30.542.663.244.968.782016-3-24SVI19.340.575.923.118.91E15.960.252.902.367.202016-3-25SVI18.851.560.454.265.61E20.540.030.693.486.702016-3-28SVI15.382.239.739.846.99E18.282.077.245.985.872016-3-29SVI25.861.646.546.787.83E36.503.755.252.507.122016-3-30SVI21.711.350.567.626.81E25.460.030.866.278.702016-3-31SVI41.130.640.310.600.34E37.380.890.280.660.364.2 隐含波动率曲面对隐含波动率曲面的拟合,选择AAPL股票期权2016年3月1日至2016年3月31日的市场数据在无套利条件约束下的E-SVI模型(14)进行拟合. 由于大规模约束问题会影响算法的稳定性,本研究仅考虑避免跨期套利的条件约束,并对无约束SVI模型和避免跨期套利约束E-SVI模型做了对比实验. 图2(a)为E-SVI模型在无跨期套利约束下对2016年3月1日11组不同到期日组成的隐含波动率曲面的结果图,图2(b)为在SVI模型不加入无套利条件下的拟合曲面.图2 E-SVI和SVI模型拟合隐含波动率曲面Fig.2 The surface fitting of the E-SVI and SVI model表5~6给出了上述实验的数据分析. 其中表5给出了两个模型的计算结果与市场数据的相关性系数;表6比较了两个模型获得的隐含波动率和期权价格与市场数据的近似程度.表5 隐含波动率曲面模型相关性比较Tab.5 The correlation comparison of implied volatility surface model日期SVIE-SVI日期SVIE-SVI日期SVIE-SVI日期SVIE-SVI2016-3-10.9170.9862016-3-100.9210.9712016-3-170.6140.9612016-3-240.5160.9522016-3-20.8860.9382016-3-110.7730.9892016-3-180.8150.9752016-3-280.7630.9512016-3-30.8390.8672016-3-140.5860.9722016-3-210.7860.9722016-3-290.7590.9422016-3-70.7700.9702016-3-150.6030.9652016-3-220.7850.9742016-3-300.4230.9872016-3-80.9330.9712016-3-160.6250.9782016-3-230.4420.8872016-3-310.5560.9672016-3-90.9370.971注:加粗字体表示对应模型得到的数据与市场数据之间的相关性更强表6 隐含波动率曲面模型拟合误差分析Tab.6 The fitting error analysis of implied volatility surface model到期日模型η/%ivR/%ivM/%VRVM到期日模型η/%ivR/%ivM/%VRVM2016-3-1SVI17.400.374.461.280.46E24.480.071.990.020.112016-3-2SVI21.040.454.371.130.42E28.910.242.160.030.112016-3-3SVI35.811.397.471.250.50E39.900.864.110.020.092016-3-7SVI27.933.7210.660.820.40E21.621.427.261.380.612016-3-8SVI21.852.017.490.980.42E36.260.503.810.020.082016-3-9SVI20.051.449.301.350.56E23.370.504.000.020.092016-3-10SVI21.171.928.010.960.44E32.240.513.700.020.082016-3-11SVI28.154.3712.260.770.45E38.951.655.700.390.192016-3-14SVI26.574.1510.781.170.54E44.141.837.670.020.092016-3-15SVI20.774.2213.805.351.00E47.410.804.653.440.172016-3-16SVI32.064.9312.153.731.02E48.900.865.020.020.072016-3-17SVI30.384.2113.072.810.90E50.550.965.290.020.072016-3-18SVI30.463.569.842.240.69E53.613.4411.260.020.082016-3-21SVI28.453.229.892.060.67E42.200.493.870.020.082016-3-22SVI29.863.6310.262.700.74E44.792.5610.210.100.172016-3-23SVI19.445.5014.932.250.74E28.091.294.730.030.112016-3-24SVI16.797.5617.622.440.91E28.458.8215.770.210.282016-3-28SVI16.298.2518.692.450.93E28.459.7116.430.200.282016-3-29SVI16.007.2615.281.820.79E22.105.079.700.270.292016-3-30SVI23.740.976.731.300.60E35.270.875.791.040.362016-3-31SVI21.224.0114.888.181.55E36.703.0610.800.640.27由以上分析可知, E-SVI模型在加入套利条件下,其拟合效果比未加入套利条件的SVI模型好. 将E-SVI模型进行延伸,对整个隐含波动率曲面进行建模,得到的隐含波动率估计值与市场数据之间整体存在强相关性,相对于SVI模型进行延伸对整个隐含波动率曲面进行拟合,其准确度得到了很大的提高. 观察表6数据可知,避免跨期套利约束E-SVI模型的5个指标相对无约束SVI模型有明显的改善. 但根据具体的市场数据,实验过程中会发现避免跨期套利约束E-SVI模型仍存在一些的误差,例如该模型对曲面整体拟合较好,对于近期平价期权附近的隐含波动率存在一些小误差.5 结语本研究基于SVI模型,根据平稳时间平方根规则,用对数执行价格k和剩余期限τ的特定组合替代了原模型中的对数执行价格k,为了使对数执行价格k和剩余期限τ之间的关系更加灵活,引入了参数β来调整二者之间的组合通过实证分析,改进之后的时间指数-SVI半参数模型(E-SVI)更具灵活性与精确性,其拟合效果比SVI模型有一定改进. 在改进SVI模型的基础上,将改进模型延伸至参数模型来构建隐含波动率曲面,该模型对市场数据的拟合效果较好. 由于考虑问题的规模对算法稳定性的影响,本研究在拟合隐含波动率曲面时仅加入避免跨期套利的约束条件,未来将考虑在加入更多无套利约束条件的同时提高E-SVI模型构建隐含波动率曲面的精确度.参考文献:[1] BLACK F, SCHOLES M. The pricing of options and corporateliabilities[J]. Journal of Political Economy, 1973, 81(3): 637-54.[2] Chen R R, Palmon O. A non-parametric option pricing model: theory and empirical evidence[J]. Review of Quantitative Finance and Accounting,2005, 24(2): 115-134.[3] HEYNEN R, VORST T. Analysis of the term structure of implied volatilities[J]. Journal of Financial and Quantitative Analysis, 1994, 29(1): 31-56.[4] MUZZIOLI S, RUGGIERI A, BAETS B D. A comparison of fuzzy regression methods for the estimation of the implied volatility smile function[J]. Fuzzy Sets and Systems, 2015, 266(C): 131-143.[5] HAN Q, LIANG J, WU B. Cross economic determinants of implied volatility smile dynamics: three major european currency options[J]. European Financial Management, 2016, 22(5): 817-852.[6] DERMAN E. Regimes of volatility[J]. Risk, 1999, 12(4): 55-59.[7] DAGLISH T, HULL J, SUO W. Volatility surfaces: theory, rules of thumb, and empirical evidence[J]. Quantitative Finance, 2007, 7(5):507-524.[8] DUMAS B, FLEMING J, WHALEY R E. Implied volatility functions: empirical tests[J]. Social Science Electronic Publishing, 1998, 53(6):2059-2106.[9] CASSESE G, GUIDOLIN M. Modelling the implied volatility surface: does market efficiency matter? : an application to MIB30 index options[J]. Working Papers, 2005, 15(2): 145-178.[10] HAGAN P S, KUMAR D, LESNIEWSKI A S, et al. Managing smile risk[J]. Wilmott, 2002, 1: 84-108.[11] GATHERAL J, JACQUIER A. Arbitrage-free SVI volatility surfaces[J]. Quantitative Finance, 2014, 14(1): 59-71.[12] CHIARELLA C, CRADDOCK M, EL-HASSAN N. An implementation of bouchouev's method for a short time calibration of option pricing models[J]. Computational Economics, 2003, 22(2/3): 113-138.[13] FENGLER M R. Arbitrage-free smoothing of the implied volatility surface[J]. Quantitative Finance, 2009, 9(4): 417-428.[14] BRUNNER B, HAFNER R. Arbitrage-free estimation of the risk-neutral density from the implied volatility smile[J]. Journal of Computational Finance, 2003, 7(1): 75-106.[15] NOCEDAL J, WRIGHT S. Numerical optimization[M]. 2nd. New York: Springer Science and Business Media, 2006.。
求解实对称互补特征值问题的积极集方法
规划方法
(1)的一个 Pareto 特征向量。
主要讨论对称 Pareto 特征值问题,即矩阵 A、B 都是对称矩阵,其中 B 是对称正定矩阵。当矩阵 A
下面定义一个罚函数 Pσ ( x ):
| | Pσ ( x )= f ( x )+ σ
1 2
xT Bx
-
1
(6)
非正定,可以找到一个足够大的正常数 δ > 0,使得 式中:σ 是罚参数,σ > 0。 在经典的序列二次规划算
Tucker)条件:
实可以实现,其罚参数 σ 随着每次迭代而更新。
简单描述用 SQP 算法求解对称正定矩阵 Pareto
特征值的基本框架如下。
(1)初始值。①给定对称正定矩阵 A,B ∈ Sn+;
②
选
取
对称
正
定
矩
阵
M
∈
S
n +
和
罚
参数
σ
>
0;③
选
取误差参数 ε > 0 和初始迭代点 x0 ≥ 0,k = 0。
矩 阵 A+ δB 是 正 定 的 。 若 ( λ,x ) 是 矩 阵 对 ( A+
δB,B ) 的 Pareto 特征值和特征向量,则由式(1)可以
很 容 易 地 得 到 ( λ - δ,x ) 是 矩 阵 对 ( A,B ) 的 一 个称正定矩阵的情况,用符号
ìAx - λBx = z
íïïïï21 xT Bx - 1= 0
îïïïïxz,Txz
= ≥
0 0
(4)
式中:λ
∈
R、z
∈
R
n +
非线性优化问题的光滑化序列二次规划方法
非线性优化问题的光滑化序列二次规划方法宇振盛,张丽娜,秦毅(上海理工大学理学院,上海 200093)【摘要】摘要:为了获得序列二次规划方法的全局收敛性,通常需要借助一个罚函数,但常用的罚函数由于具有不可微性从而给计算带来一定的困难,拉格朗日函数虽然可以克服此困难,但其形式较为复杂,为解决该问题,给出了一类光滑化罚函数.基于一类双曲余弦型光滑化罚函数,提出了等式约束优化问题的一个光滑化序列二次规划方法.该光滑化函数具有良好的连续、可微性和凸性质,在适当条件下,获得了算法的全局收敛性,并给出数值测试说明了算法的有效性.【期刊名称】上海理工大学学报【年(卷),期】2015(000)004【总页数】5【关键词】等式约束优化;光滑化函数;序列二次规划方法;全局收敛性1 问题的提出考虑非线性优化问题其中,x∈Rn,f:Rn→R,g:Rn→Rm是连续可微函数.此类问题广泛应用于随机规划、最优控制以及半无限规划和原始分解算法中[1-3],在过去的几十年里,人们已经提出了许多数值方法来解决这一问题.其中,序列二次规划法(sequential quadratic programming,SQP)是使用最广泛的方法之一,这类算法具有良好的全局收敛性,得到最优解时需要的迭代次数也较少.该方法由Wilson[4]最早针对凸优化问题提出,并由Biggs[5],Han[6]和Powell[7-8]等推广到一般问题,有关综述报告可参见文献[9].由与问题(1)相关的SQP理论可知,可以通过迭代公式来产生出收敛到问题(1)的Karush-Kuhn-Tucker(KKT)点的点列.其中,λk是由某些线搜索方法获得的,用来降低评价函数的函数值的步长,dk是二次规划问题的解.Bk是目标函数的拉格朗日函数的近似Hessen矩阵,通常由拟牛顿法获得.在SQP理论中,最常使用的评价函数是不可微精确罚函数因为函数Ψ(x,α)的不可微性,从而给计算带来一定的困难.为克服此困难,通常可用光滑的罚函数作为其评价函数[10].本文使用逼近光滑罚函数[10-11]来作为SQP算法的评价函数.其中,Φ(x,α,μ)是逼近于Ψ(x,α)的,并且是连续可微的.文献[11]中的数值试验显示,该光滑罚函数的性态良好.2 光滑化SQP算法使用逼近光滑罚函数作为SQP算法的评价函数.首先给出函数Φ(x,α,μ)的性质.引理1 函数Φ(x,α,μ)的性质[11]a.对任意固定的μ,若f(x),gi(x)是k阶连续可微的,i=1,2,…,m,则Φ(x,α,μ)也是k阶连续可微的.若f(x),gi(x)是两阶连续可微的,则有和b.若f(x),gi(x)是凸的,i=1,2,…,m,则Φ(x,α,μ)也是凸的.f.若μ1<μ2,则Φ(x,α,μ1)>Φ(x,α,μ2),x ∈Rn.现在考虑SQP算法的迭代公式其中,dk是下列二次子问题的解式中,Bk是n×n对称正定矩阵.本文中总是假定子问题(5)是可行的.在这种假设下,如果Bk是正定矩阵,那么,子问题(5)有唯一解dk,并且dk是子问题(5)的解当且仅当存在拉格朗日乘数ρk使得KTT条件成立引理2[12]假设Bk是对称正定矩阵,则点对(x—,ρ—)是问题(1)的KTT点对当且仅当(d—,ρ)=(0,ρ—)是子问题(5)的KTT点对.下面叙述基于光滑化罚函数(4)的SQP算法.算法1步骤0 给定x1∈Rn,ρ1∈Rm,β∈(0,1),γ∈(0,1),ε≥0,B1∈Rn×n为对称正定矩阵,μ0>1,α0>1,M>1,令k:=1.步骤1 求解子问题(6),得到dk和.若dk≤ε,则算法终止.步骤2 若,则令αk:=αk-1,μk:=μk-1,转步骤7;否则,转步骤3.步骤3 若其中则令μk:=μk-1,转步骤5;否则,转步骤4.步骤4 令μk-1:=Mμk-1,转步骤3.步骤5 若则令αk:=αk-1,转步骤7;否则,转步骤6.步骤6 令αk-1:=Mαk-1,转步骤5.步骤7 令λk为序列{1,γ,γ2,…}中使下列不等式成立的最大值:步骤8 令,通过BFGS校正公式将Bk修正为Bk+1,令k:=k+1,转步骤1.算法1中提到的BFGS校正公式如下[12]:利用拟牛顿法的基本原理,对Lagrange函数L(xk,ρk)=f(xk)+(xk)的Hessen矩阵)的近似(对称正定)矩阵Bk进行修正.令rk=θkyk+(1-θk)Bksk式中,参数θk定义为于是,矩阵Bk的BFGS校正公式为3 算法的全局收敛性在分析算法1的全局收敛性之前,假设以下的条件成立.假设A:a.{xk}和{ρk}是有界序列;b.存在常数使得假设A的a并不是很强的,因为,M-F限制条件可以确保{ρk}是一个有界序列.首先分析算法1的可行性.引理3 算法1不会在步骤3和步骤4之间无限循环.证明因为和引理3得证.引理4 算法1不会在步骤5和步骤6之间无限循环.证明当αk≥2ρk时,由式(6),有引理4得证.从引理4的证明过程中可以得知,当不等式成立时,步骤5中的不等式成立.由假设A的a,{ρk}是一个有界序列.所以,在有限次的迭代之后,不等式成立,从而步骤5中的不等式成立,αk的值不再增加,即在有限次的迭代之后,αk 变为常数.所以,为了方便起见,不失一般性,可以假设引理5 当算法1到达步骤7时,有引理5的成立是显然的.定理1 由算法1所产生的序列{xk}的任一聚点均为问题(1)的KTT点.证明首先,证明从算法1中可以得知,{μk}是单调非减序列.又由引理1和步骤7,可以知道所以,{Φ(xk,α,μk)}是单调递减序列.由假设A的a和引理1的c,可以知道{Φ(xk,α,μk)}是有下界的,因此,{Φ(xk,α,μk)}是收敛的,即Φ(xk,α,μk)-Φ(xk+1,α,μk+1)→0由式(8),Φ(xk,α,μk)-Φ(xk+1,α,μk)→0.又由步骤7可知现证明λk→0不成立.反证,若λk→0,从算法1中可以得知,有另一方面,由式(10)和式(11),有在上面不等式的两边同时除以,得到然而,由引理5,有于是,导出矛盾.由式(9)和λk→0不成立,有又由式(13),假设A的b和式(14),可以得到dk→0.由文献[13]中的定理3.2.1、定理4.3.3和本文中的引理3,可知定理1的结4 数值测试在一台CPU 1.70GHz,RAM 512 MB的PC上利用Mathematica 7.0.1编程实现了算法1.测试函数取自文献[14-16],计算结果如表1所示,其中,HS (i)表示文献[14]中的第i个算例,S(i)表示文献[15]中的第i个算例.在算法中,各参数分别取为β=0.5,γ=0.5,M=2,μ0=2,α0=2,ρ1=0m×1,B1=In,ε=10-6.表1的算例说明,对于测试的问题,本文的算法在很短的时间和较少的迭代次数内可求得问题较为满意的解.5 结束语结合一类双曲余弦型光滑化罚函数,给出了求解等式约束优化问题的SQP算法,获得了算法的全局收敛性,并验证了算法的有效性.对于该类函数如何结合一般的非光滑问题[17]及其它有效算法,如信赖域算法[18],值得进一步研究.参考文献:[1]Qi L Q.Superlinearly convergent approximate Newton methods for LC1optimization problems[J].Mathematical Programming,1994,64(1/2/3):277-294.[2]Rockafellar R putational for large-scale problems in extended linear-quadratic programming[J].Mathematical Programming,1990,48(1/2/3):447-474.[3]Rockafellar R T,Wets R J B.Generalized linearquadratic problems of deterministic and stochastic optimal control in discrete time [J].SIAM Journal on Control and Optimization,1990,28(4):810-[4]Wilson R B.A simplicial method for convex programming [D].Boston:Harvard University,1963.[5]Biggs M S.Constrained minimization using recursive equality quadratic programming in numerical methods for nonlinear optimization[M]∥Lootsma F A,ed.Numerical Methods for Nonlinear Optimization.London,New York:Academic Press,1972:411-428.[6]Han S P.A globally convergent method for nonlinear programming [J].Journal of Optimization Theory and Applications,1977,22(3):297-309.[7]Powell M J D.A fast algorithm for nonlinearly constrained optimization calculations.Lecture Notes in Mathematics[M]∥Waston G A.Lecture Notes in Mathematics.Berlin:Springer Verlag,1978,630:144-157.[8]Powell M J D.The convergence of variable metric methods for nonlinearly constrained optimization calculations[M]∥Nonlinear Programming.New York:Academic Press,1978:27-63.[9]Gould N I M,Toint P L.SQP methods for large-scale nonlinear programming[C]∥IFIP—the International Federation for Information Processing,2000,46:149-178.[10]Zhang J L,Zhang X S.An SQP method based on smoothing penalty function for nonlinear optimizations with inequality constraint[J].Journal of Systems Science and Complexity,2001,14(2):212-217.[11]Herty M,Klar A,Singh A K,et al.Smoothed penalty algorithms for optimization of nonlinear models[J].Computation Optimization and Application,2007,37(2):157-176.[12]黄红选,韩继业.数学规划[M].北京:清华大学出版社,2006.[13]Bank B,Guddatt J,Klatle D,et al.Nonlinear parametric optimization.Birkhuesr[M].Berlin:Akademie-Verlag,1982.[14]Hock W,Schittkowski K.Test examples for nonlinear programming codes[M]∥Lecture Notes in Economics and Mathematical Systems.Berlin:Springer-Verlag,1981,187.[15]Schittkowski K.More test examples for nonlinear programming codes[M]∥Lecture Notes in Economics and Mathematical Systems.Berlin:Springer-Verlag,1981,282.[16]Andrei N.An unconstrained optimization test functions collection [J].Advanced Modeling and Optimization,2008,10(1):147-161[17]刘晶,高岩.求解一类无限维非光滑算子方程的光滑化牛顿法[J].上海理工大学学报,2008,30(2):167-170.[18]王安琪,宇振盛,曹倩倩.线性约束优化的一个自适应非单调信赖域算法[J].上海理工大学学报,2010,32(6):545-548.(编辑:石瑛)基金项目:国家自然科学基金资助项目(11171221);上海市教委科研创新资助项目(14YZ094);上理工大学国家级项目培育项目(12XGM03)【文献来源】https:///academic-journal-cn_journal-university-shanghai-science-technology_thesis/0201250649657.html。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于序列二次规划(SQP)算法求解非线性规划问题研究兰州大学硕士学位论文关于序列二次规划(SQP)算法求解非线性规划问题的研究姓名:石国春申请学位级别:硕士专业:数学、运筹学与控制论指导教师:王海明20090602兰州大学2009届硕士学位论文摘要非线性约束优化问题是最一般形式的非线性规划NLP问题,近年来,人们通过对它的研究,提出了解决此类问题的许多方法,如罚函数法,可行方向法,Quadratic及序列二次规划SequentialProgramming简写为SOP方法。
本文主要研究用序列二次规划SOP算法求解不等式约束的非线性规划问题。
SOP算法求解非线性约束优化问题主要通过求解一系列二次规划子问题来实现。
本文基于对大规模约束优化问题的讨论,研究了积极约束集上的SOP 算法。
我们在约束优化问题的s一积极约束集上构造一个二次规划子问题,通过对该二次规划子问题求解,获得一个搜索方向。
利用一般的价值罚函数进行线搜索,得到改进的迭代点。
本文证明了这个算法在一定的条件下是全局收敛的。
关键字:非线性规划,序列二次规划,积极约束集Hl兰州人学2009届硕二t学位论文AbstractNonlinearconstrainedarethemostinoptimizationproblemsgenericsubjectsmathematicalnewmethodsareachievedtosolveprogramming.Recently,Manyasdirectionit,suchfunction,feasiblemethod,sequentialquadraticpenaltyprogramming??forconstrainedInthisthemethodspaper,westudysolvinginequalityabyprogrammingalgorithm.optimizationproblemssequentialquadraticmethodaofSQPgeneratesquadraticprogrammingQPsequencemotivationforthisworkisfromtheofsubproblems.OuroriginatedapplicationsinanactivesetSQPandSQPsolvinglarge-scaleproblems.wepresentstudyforconstrainedestablishontheQPalgorithminequalityoptimization.wesubproblemsactivesetofthesearchdirectionisachievedQPoriginalproblem.AbysolvingandExactfunctionsaslinesearchfunctionsubproblems.wepresentgeneralpenaltyunderobtainabetteriterate.theofourisestablishedglobalconvergencealgorithmsuitableconditions.Keywords:nonlinearprogramming,sequentialquadraticprogrammingalgorithm,activesetlv兰州大学2009届硕士学位论文原创性声明本人郑重声明:本人所呈交的学位论文,是在导师的指导下独立进行研究所取得的成果。
学位论文中引用他人已经发表或未发表的成果、数据、观点等,均己明确注明出处。
除文中已经注明引用的内容外,不包含任何其它个人或集体己经发表或撰写过的科研成果。
对本文的研究成果做出重要贡献的个人和集休,均已在文中以明确方式标明。
本声明的法律责任由本人承担。
oo穸.i,歹论文作者签名:丕!鱼盔日期.2授权声明本人在导师指导下所完成的论文及相关的职务作品,知识产权归属兰州大学。
本人完全了解兰州大学有关保存、使用学位论文的规定,同意学校保存或向国家有关部门或机构送交论文的纸质版和电子版,允许论文被查阅或借阅:本人授权兰州大学可以将本学位论文的全部或部分内容输入有关数据库进行检索,可以采用任何复制手段保存和汇编本学位论文。
本人离校后发表、使用学位论文或与该论文直接相关的学术论文或成果时,第一署名单位仍然为兰州大学。
保密论文在解密后应遵守此规定。
论文作者签名:碰导师签名:硇兰i日期:三竺12:互:fⅡ兰州大学2009届硕’:学位论文第一章绪论非线性规划是计算数学和运筹学交叉的学科,由于非线性规划含有深刻的背景和丰富的内容,已经发展成为运筹学的重要分支,无论是在生产系统管理、工程技术,还是在社会科学中都得到极为广泛的应用。
非线性规划的研究始于1939年,是由w.卡鲁什首次进行的,40年代后期进入系统研究,1951年H.w.库恩和A.W.塔克尔提出最优化的判别条件,从而奠定了非线性规划的理论基础。
近几十年来,许多科学家都投身于最优化的研究,使得其在理论研究和实用算法方面都有很大的发展。
本章我们将大概地回顾一下非线性规划的研究发展过程,在此基础上重点回顾和介绍序列二次规划算法的发展与研究现状。
1.1非线性规划的发展过程求解NLP问题的算法,按照发展的时间顺序和不同的设计思路,可以大致分为以下四类。
l、直接法。
其主要思路是:用求解无约束优化问题的各种直接方法推广到求解一般的非线性约束优化问题。
这类方法对原问题不需要作任何的预处理,在按照某种方式选定了一组测试点之后,所需的仅是计算目标和约束的函数值。
因此,这类方法一般都计算简单、直观性强。
其缺点是计算量大、算法无好的理论依据,往往只能找到问题的一个较好的可行解,即使在特殊情况下能保证算法的收敛性,其收敛速度也只能是线性的。
所以,只要不是没有其它的算法可利用,一般不用这类方法。
2、线性约束问题的算法在非线性约束问题上的推广。
如可行方向法、广义简约梯度法和投影梯度法等。
其主要思路是:用线性约束问题的算法进行处理。
因此,这类方法所产生的迭代点均是问题的可行点。
但是,由于约束函数的非线性性,这些方法的具体实现要比在线性约束上复杂的多,且有效性也没那么好。
这类方法的主要优点是它保持迭代点列的可行性并通常可找到问题的局部最优解,其缺点是有关算法的实现往往很复杂、计算量比较大,且收敛速度通常只能兰州大学2009届硕l:学位论文达到线性收敛。
3、罚函数法。
其主要思路是:把非线性约束优化问题转化为无约束优化问题。
由于早期方法均需要求解一系列无约束的罚函数极小化问题,故通常称之为UnconstrainedMinimization序列无约束极小化方法SequentialTechnique,简称SUMT。
依据方法能否保证迭代点列的可行性,可将这些方法分为三类:内点罚函数法、外点罚函数法以及两者相结合的混合罚函数法。
SUMT类方法的优点是简单易行,可直接利用无约束优化的算法来求解约束优化问题。
在很弱的条件下即可保证算法的收敛性。
缺点是这些方法要求解一系列的无约束优化问题,计算量大且收敛速度慢,后来,人们又提出另外两种类型的罚函数:精确罚函数和乘子罚函数。
精确罚函数是在原目标函数上加一些由约束函数组成的惩罚项而构成,其优点是它的无约束极小点就是原问题的最优解。
而乘子罚函数是在约束问题的拉格朗R函数中增加了一个惩罚项。
这两种方法一直是求解约束问题NLP的主要方法。
4、序列二次规划SQP法。
其主要思路是:利用原来非线性约束优化问题的有关信息来构造某一简单的近似优化问题,通过求解它来给出对当前迭代点的修正,主要用一系列的线性规划或二次规划来逐次逼近原非线性规划问题。
尽管开始时的SOP方法存在着QP子问题可能不可行及马洛托斯Maratos效应等不足,但经过人们对其不断进行改进与进一步的发展,现在,SQP类方法已成为求解非线性约束优化问题的一类非常有效的算法。
它不仅可以求解等式约束优化问题,而且很容易处理不等式约束优化问题。
这类算法不仅具有全局收敛性,而且具有超线性收敛的速度。
1.2序列二次规划SQP的发展与研究现状Newton―Lagrange方法,当时就认为该算法是处理非线性约束优化问题很有效的一种方法。
SOP算法的一般形式为:对于非线性约束优化问题NLPrainfx1.12兰州大学2009届硕上学位论文s.t.c,x--o1.2iEE--1,2,…,他qOzO1.3iEIm,+卜??,m设t是当前问题NLP的迭代点,通过求解二次规划子问题minw瓴rd+昙dr也d1.4SI.iEE1.5cfxk+Vq瓴rd0iEl1.6.q瓴+%亿,d≥0得到一个搜索方向畋,然后经过线搜索求得步长吒,于是下一个迭代点%+,气+吼畋。
这就是SOP算法的一般方法。
早期的SOP算法基本上都是针对带有等式约束的非线性优化问题[15][16]。
量,在文章中他利用厶精确罚函数进行线搜索,在一定的条件下建立了算法的收敛性。
然而在1977年Powell却提出Han构造的二次规划子问题有可能造成可行域为空集,即使原问题的可行域是非空的,而子问题的可行域未必非空。
这时Powell建议在每次迭代时,求解如下修正的二次规划子问题min1.7Vfxkrd+三dr日。
d+丢哦1-g2sj.iEE1.8‖q瓴+Vci五rd--0iEl1.9以q瓴+Vc,瓴rd苫01,瓯。
是罚参数。
这个修正看起来天衣其中肛一::,三丧;三三,且。
s‖s无缝,然而,Burke和Han1989却通过一个特殊例子说明这个方法并不完美。
Burke和Han的例子:clO--1一矿0c20一工0任意目标函数厂O,在任一不可行点z一0处,子问题都是不可行的。
虽然这个例子很特殊,但至少说明子问题的不可行性不是都能够通过1.8一1.9解决。
3兰州大学2009届硕上学位论文在约束优化中当非光滑的罚函数作为价值函数进行线搜索时,有可能会破坏算法的超线性收敛,即当迭代点趋近最优解时,得不到单位步长。
因此,以后关于SQP算法的研究主要是围绕克服子问题不可行和Maratos 效应这两方面的困难进行的。
在[19][20]中都提出了对于只有不等式约束的非线性规划问题防止子问题不可行的方法,在[20]中,Liu和Yuan提出了通过求解两个子问题来处理不可行的问题,其中两个子问题分别是分段二次子问题和二次子问题。
后来,Zhou在[21]中又给出了改进的SQP算法,他的方法是求解一个有界约束的线性规划问题和一个二次规划问题,总之,这些方法都是通过求若干个子问题来实现。
改了接受试探步的条件。
在一些迭代中利用Lagrange函数Lx,A,0一罗桃O1.10筒作为价值函数,从而放宽选取步长为1的条件,由于Watchdog技术在总体上还是利用厶罚函数判别点的好坏,所以它的总体收敛性仍可保证,因为他在一代点放宽了线搜索条件,所以,在一定条件下可证明它是超线性收敛的。