蔡晓璇 非线性互补问题(终稿)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘要
非线性互补问题是运筹学与计算数学的一个交叉领域,它与非线性规划、对策论、不动点理论等分支有紧密联系.本文概述了非线性互补问题的来源、发展历程和目前的研究现状,重点介绍了求解非线性互补问题的数值方法,如不动点迭代法、投影法、内点法、光滑方程法等,并通过数值例子验证了不动点迭代法的有效性。
关键词:非线性互补问题;不动点迭代法;投影法;内点法;
ABSTRACT
Nonlinear complementarily problem is a cross field of operational research and computational mathematics. It has close relationship with nonlinear programming, game theory, fixed point theory and so no. In this paper, we present the origin of the nonlinear complementarily problem, its development and current research situation. We stress the numerical method for solving nonlinear complementarily problems, such as fixed point iteration method, the projection method, interior point and smoothing equation method. And we give some numerical result to test the effectiveness of fixed point iteration method.
KEY WORDS: nonlinear complementarily problem; fixed point iteration method; projection method; interior point; smoothing equation method
目录
第一章绪论
1.1互补问题的介绍 (3)
1.2互补问题的模型 (4)
第二章不动点的迭代法
2.1 不动点迭代法的基本性质 (8)
2.2 不动点迭代算法 (8)
2.3 数值试验 (9)
第三章非线性互补问题的其他解法
3.1可微的无约束优化法 (11)
3.2 投影法 (11)
3.2 内点法 (11)
参考文献 (13)
第一章 绪论
1.1 互补问题的介绍
互补问题是运筹学与计算数学的一个交叉研究领域,与数学规划、经济学、对策论、力学、变分学、随机最优控制等学科关系密切,在科学研究和工程技术各领域有着广泛的应用。
互补问题自20世纪60年代开始发展到现在,无论在理论还是在算法研究上都取得了丰硕的成果。
互补问题的研究又可以分为理论和算法。
前者主要研究问题解的存在性、唯一性、稳定性以及灵敏度分析等性质。
后者集中研究如何构造有效算法及其理论分析。
我们首先给出互补问题的定义:
定义1.1(线性互补问题):求一点n x R ∈,满足
0x ≥
()0()0
T
F x x F x ≥= (1)
当()F x 为线性函数时(令()F x Mx q =+,n n M R ⨯∈,n q R ∈)时,称(1)为线性互补问题。
定义1.2(非线性互补问题): 求一个n 维向量x ,使得: 0x ≥
()0F x ≥ (2) ()0T x F x = 其中,()F x 是:n n R R →连续可微。
互补问题与最优化问题关系密切,最优化中的许多问题都可以转化为互补问题求解,下面分别给出说明。
(1)线性规划
考虑原始线性规划问题(PLP):
min ()F x =T
c x
0;
x Ax b ≥≥ (3)
其中:,,m n m n A R b R c R ⨯∈∈∈。
它的对偶问题(DLP)为:
max (),T
h y b y = .0s t y ≥
T
A y c ≤ m y R ∈
设00,x y 分别是(PLP)和的(DLP)可行解,则00,x y 同为最优解的充要条件是:00T T c x b y =
设: 0,()0T
T x c A c A y z f z z y b A
Ax b ⎛⎫⎛⎫-⎛⎫
⎛⎫-==+= ⎪ ⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭⎝⎭⎝⎭, 则:
(),T T
T
T
T T T T
c A y z f z x y x c y b c x b y Ax b ⎛⎫-⎡⎤==-=- ⎪⎣⎦-⎝⎭
在00,x y 同为最优解的条件下,可以构造如下的互补问题(LCP ):求0m n z R ++∈,使
得,000(),()0m n
T f z R z f z ++∈=且。
000x z y ⎛⎫
= ⎪⎝⎭是(LCP )的解当且仅当00,x y 是(PLP )和(DLP )的最优解。
(2)二次规划
考虑二次规划问题(QPP ):
1min ()2T
T f x x Qx c x =
+
.0s t x ≥
Ax b ≤ (4)
其中,,,m m m m m m Q R c R A R b R ⨯⨯∈∈∈∈。
引入松弛变量m v R ∈,使得Ax v b +=。
则由K-T 条件,存在向量乘子,m m
R R λμ++
∈∈,使得:
,,0
0,0
T m m
T T Qx c A u Ax v b
u R R v u x v λλλ++++-=+=∈∈≥==
将上面的条件改成如下形式:
,0T u c x Q A v b A
λ⎛⎫⎡⎤⎡⎤⎡⎤=+ ⎪⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦⎣⎦
⎝⎭
0(),,0T
m n m n u x u x R R v v λλ++++⎡⎤⎡⎤⎡⎤⎡⎤≥∈∈=⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦⎣⎦
若令 ,()0T x c Q x A z f z b A λλ⎫⎡⎤⎡⎤⎛⎡⎤
==+⎪ ⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦⎝⎣⎦
⎭
则K-T 条件等价地可以写为:求,m n z R ++∈使得(),m n
f z R ++∈且()0T z f z =. 而这正是线性互
补问题的形式. (3)非线性规划
考虑非线性规划(NLP )
min ()
..()01,......,0
i f x s t
g x i m x ≥=≥
其中()f x ,()i g x 连续可微。
令
1
(,)()()
m
i i i L x f x u g x μ==+∑
则由约束最优化的K-T 条件:
[][]1
11()()0
0,()00,,,0()(),,()0
m
i i i T T T
m m f x u g x x u g x x u u u g x g x g x λλ=∇+-===≥=≥=≥∑
将上面的式子展开写成:
1111
(,)(,)(,),(,)n L x u L x u h x u h x u x u +∂∂==∂∂
.
(,)(,)
(,),(,)n n m n m L x u L x u h x u h x u x u +∂∂==∂∂
若令 []1,()(,),...,(,)T
n m x z h z h x u h x u u +⎡⎤==⎢⎥⎣⎦
,
则K-T 条件等价于:求m n z R ++∈,使得()m n
h z R ++∈,且()0T z h z =这也是互补问题。
1.1.2 互补问题的模型
生活的各个领域中,线性互补问题的应用十分普遍,本文主要简单的介绍工程力学互补问题模型和供应链互补问题模型。
1.1.
2.1工程力学互补问题模型
因为在研究经济、工程中的许多现象时会自然地出现互补关系, 所以互补问题广泛地应用于经济,工程技术等各个领域,如在工程中的应用有接触力学问题、断裂力学问题、弹塑性问题、润滑问题、最优控制问题及交通平衡问题等。
这里主要讲述互补问题在力学中的部分应用情况。
对工程力学问题而言, 其互补关系主要来自于以下三个方面:塑性流动法则、单侧接触定律以及库仑摩擦定律。
所以可以将力学中的许多问题用互补模型来表述,如接触问题、弹塑性问题及结构优化问题等。
接触问题和弹塑性问题都属于边界待定的变分问题, 对接触类问题, 事先并不能确定可能发生接触的边界哪部分是处于脱离、粘贴或滑动状态; 对弹塑性类问题, 事先无法准确判断出哪部分材料进入到了塑性变形状
态。
而互补条件恰恰能够自动识别出哪些不等式变为等式, 即对弹塑性问题, 能够自动地确定变形是处于弹性状态还是塑性状态, 对接触问题, 可自动确定接触状态。
将力学问题写成互补模型的主要好处是: 一方面是使力学问题有更自然、更精确的数学描述; 另一方面是可以运用互补问题丰富而实用的理论结果, 如可以用解的存在性和唯一性理论来分析力学问题的结构模型, 而且更重要的是能够利用互补问题许多有效和强健的数值算法。
1.1.
2.2供应链互补问题模型
目前,对供应链问题的研究比较流行的模型是分散式的供应链网络模型。
该模型通常包括三层决策者: 制造商、销售商和消费者,它们在商品流通过程中都有自己的目标。
随着各种各样的供应链概念和分析模型的出现,对供应链的研究已经引起了越来越多的研究者的注意。
与对供应链的建模的研究相比较,对其相应算法的研究却很少。
大多数供应链文章是将供应链均衡模型建立为变分不等式模型,然后利用投影方法(或修正的投影方法) 求解。
第二章 不动点迭代法
2.1 不动点迭代法的基本性质
不动点迭代法的基本思想:将NCP(F)转化为一个等价的不动点方程来求解。
n
x R ∈,记1max{0,}x x =,2max{0,}x x =-,其中算子max 指分量的最大,则有12x x x =-及12x x x =+
则显然12
0T
x x =,而不难发现11()2x x x =+, 2
1
()2
x x x =-,令 11()2U x x x =+=,2122=()F U x x x P p =-()
其中p 为常数。
则非线性互补问题等价于下面的不动点问题: 11()2
p
x x F x =- 于是可以构造不动点迭代格式:
1(),0,1,2, (2)
k k k p
x x F x k +++=-
= (5)
2.2 不动点迭代算法
以下根据迭代格式(5)给出求解非线性互补问题的一个不动点迭代算法,并在适当的条件下,证明了其算法是收敛的,且数值结果表明这一方法是有效的。
算法1(不动点迭代算法)
步骤1 给定一个初始点0n z R ∈,精度0eps >以及选择适当0p >,0k = 步骤2 如果min{,()}k k z F z eps ≤,则停止
步骤3 令max{0,}k k i i y z =,1,2,......,i n =,12(,,......,)k k k
k T n y y y y =
步骤4 1121122(),1,2,......,,(,,......,)k k k k k k k T
i i i n z y F y i n z z z z p
++++=-
== 步骤5 k=k+1,转步骤2;
定理1 若:F n n R R →是一致P -函数,即存在一常数0a >,对任意点,,x y R x y ∈≠,存在下标(,),1k k x y k n =≤≤,使得()(()())k k k k x y f x f y a x y --≥-,F 是Lipschitz 连续的,
(Lipschitz 常数为0η>),并且满足
2
40a
p η<<
则存在*n z R ∈满足(5),此外,由算法1产生的序列{}k z 收敛于*z
证明: 由算法1 可知, 2
1
1
1[()()2
k k k k k k
p z
z y y
F y F y +---=--- 22
1
111()()()(()())
4
k k k
k k k T k
k
p y y
F y F y y y F y F y ρ----=-+----
22
1(1)4
k k p pa y y η-≤+-- 又 111m a x {0,}m a x {0,}k k k k k k
y y z z z z ----=-≤-
因此,
1
22
1
12(1)4
k k
k k p z
z pa z z η++-≤+--
由 2
40a
p η
<<
,
则 1
22
2(1)14
p pa ηθ=+-< 从而,不动点迭代(5)有唯一解*n z R ∈,且满足有算法1产生的序列收敛于*z 2.3 数值实验
为了验证算法的有效性,对以下算例进行了数值实验.
算例1 实验函数为
2211223422
112342
24
1122221234322362322()32313233x x x x x x x x x x x f x x x x x x x x x x ⎛⎫++++- ⎪++++- ⎪= ⎪+++- ⎪ ⎪+++-⎝⎭ 这个例子在[4,0,)z K K ∈=∞
上有唯一解*1
(
)22
T z = 对于不同的初始点,数值结果如表1;对于相同的初始点,数值结果如表2;
表1 算例1的数值结果(6
10eps -=)
表2 算例1的数值结果
06 ((1,1,1,1),10)
T
z eps-
==
综合表1和表2可以看出,当参数p=0.37时,不同初始值的收敛性和收敛速度都是较好的.
第三章 非线性互补问题的其他常见的解法
上一章介绍了非线性互补问题不动点迭代法,本章主要介绍非线性互补问题其他几种
常见的解法,如可微的无约束优化法,投影法和内点法,这对于以后我们研究非线性互补问题有很大的帮助。
3.1 可微的无约束优化法
这是把互补问题转化为一个与之等价的可微无约束优化问题,然后用某种大范围或Newton 类型法求解.由于无约束优化法较为成熟,因此,对这类方法的研究重心在于如何转化上。
给出一个可微的势函数
2222
1()(){(())(()()},02MS T x x F x F x x x x F x F x φαααα++=+-+-+-+->
这里∙表示2-范数。
称MS φ为隐Lagrange 函数。
定理6 对1α>,()0MS x φ≥,且()0MS x x φ=⇔解()NCP F
实际上,()MS x φ可由可微的NCP 函数
22221
(,)(max {0,}max {0,})2MS a b ab a ab a b a b φαα
=+
--+-- 并取向量1-范数生成,即
1
()(,())
n
MS MS i i i x x F x φφ==∑
得到。
定理2 假设F 是可微的,且()F x ∇正定,则x 是(2)的稳定点x 的充要条件x 是()NCP F 的一个解。
3.2投影法
投影法是求解互补问题的一类基本而又重要的方法。
基本迭代格式为:
[]*x x aF +
=-(x)
这里 0a >为步长。
然而它的收敛性需要F 是强单调的假设。
为此,Korpelevich 提出外梯度法, 即
[]*()x x aF x aF x ++
⎡⎤=--⎣⎦
()
它的收敛性仅要求()F x 单调且解集不是空集。
3.3内点法
内点法是把互补问题转化为一个与之等价的非负约束方程组,然后用Newton 类型法求解。
现在来考察内点法的基本思想。
令()y F x =,则互补问题(2)可转化为:
()(,)0;..0,0y F x H x y x y s t x y -⎡⎤
==⎢⎥
⎣⎦
≥≥ (6)
这里1122(,,......,)T
n n x y x y x y x y = 。
显然,(6)是一个带有非负约束的2n 阶非线性方程组。
当()F x Mx q =+时,仅第二个方程是非线性的,且有特殊形式的表达式。
容易证明, 当()F x 是0p -函数时,Jacobian 矩阵(,)H x y ∇是非奇异的。
因此,在迭代中可取Newton 方向为搜索方向。
给定点2(,)k k n x y R ++∈,内点法的一般迭代格式为:
1,1()(,)(,)
k k k k k k x y x y x y d d λ++=+
(,)(,),(,)k k k k k k k k
x y H x y d H x y d d d ∇=-=
这里(,)k k H x y 是由经过一个(,)k k H x y 微小扰动而得,其目的是调节迭代的收敛速度;0λ>为步长,它的取法使新点112(,)k k n x y R ++++∈,且效益函数有一定量的下降。
如果在迭代过程中能保证(),0,1,......k k y F x k ==,则称为可行内点法; 否则称为不可行内点法。
如果取
(,)H x y 的自然势函数作为效益函数,则称为路径跟踪法;如果取某种对数函数作为效益函
数,则称为降势函数法。
内点法的收敛结果大致有:
(1)大范围收敛性:若单调,可行集{}(,)(),0,0x y y F x x y Ω==≥≥存在内点,那么由内点法产生的迭代点列{}(,)k k x y 满足0k k x y →且Q-线性.
(2)局部超线性收敛:假设()F x 单调且可行集Ω存在内点.若**(,)x y 是{}(,)k k x y 的一个极限点且有某种正则性,则{}(,)k k x y 超线性收敛于零或**(,)x y 。
(3)多项式复杂性:若()+F x Mx q =单调且可行集Ω存在内点,那么对可行内点法,最
好的复杂性界为o ;对不可行内点法,最好的复杂性界为()o nL 。
参考文献:
[1] 陈宝林.最优化理论与算法[M].北京:清华大学出版社,2005:25-43
[2] Rockefeller, R.T., (1970). Convex Analysis. Princeton University Press, Princeton.
[3] G. Isac , Complementarity problems Lecture Notes in Math. (2nd Edition), Volume 1528 Springer-Verlag, Berlin (1992)
[4] Cottle, RW, Pang, JS, and Stone, RE, The Linear Complementarity Problem, Academic Press, New York, New York, 1992。