最优化理论与算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

最优化理论与算法(数学专业研究生)

第一章 引论

§ 引言

一、历史与现状

最优化理论最早可追溯到古老的极值问题,但成为一门独立的学科则是在20世纪四十年代末至五十年代初。其奠基性工作包括Fritz John 最优性条件(1948),Kuhn-Tucker 最优性条件(1951),和Karush 最优性条件(1939)。近几十年来最优化理论与算法发展十分迅速,应用也越来越广泛。现在已形成一个相当庞大的研究领域。关于最优化理论与方法,狭义的主要指非线性规划的相关内容,而广义的则涵盖:线性规划、非线性规划、动态规划、整数规划、几何规划、多目标规划、随机规划甚至还包括变分、最优控制等动态优化内容。本课程所涉及的内容属于前者。 二、最优化问题的一般形式 1、无约束最优化问题

min ()n

x R

f x ∈ () 2、约束最优化问题

min ()

()0, ..()0, i i f x c x i E s t c x i I

=∈⎧⎨

≥∈⎩ ()

这里E 和I 均为指标集。

§数学基础

一、 范数 1. 向量范数

max i x x ∞= (l ∞范数) ()

11n

i i x x ==∑ (1l 范数) ()

122

21

()n

i i x x ==∑ (2l 范数) ()

11

()n

p p

i p

i x

x ==∑ (p l 范数) ()

12

()T

A

x

x Ax = (A 正定) (椭球范数) ()

事实上1-范数、2-范数与∞-范数分别是 p -范数当 p =1、2和p →∞时情形。 2.矩阵范数

定义 方阵A 的范数是指与A 相关联并记做A 的一个非负数,它具有下列性质: ① 对于0A ≠都有0A >,而0A =时0A =; ② 对于任意k R ∈,都有kA k A =; ③ A B A B +≤+; ④ AB A B ≤; 若还进一步满足: ⑤ p

p Ax

A x ≤

则称之为与向量范数p g 相协调(相容)的方阵范数。若令

max

x Ax

A x

≠= (这里x 是某一向量范数) () 可证这样定义的范数是与向量范数g 相协调的,通常称之为由向量范数g 诱导的方阵范数。特别地,对方阵()ij n n A a ⨯=,有:

11max n

ij j

i A a ==∑(列和的最大者) ()

1

max n

ij i

j A

a ∞

==∑(行和的最大者) ()

1

22()T A A A λ=(T A A λ表示T A A 的特征值的最大者)

称为谱范数(注:方阵A 的特征值的模的最大者称为A 的谱半径,记为()A ρ)。

对于由向量诱导的方阵范数,总有:

101min x A Ax x

-≠=

,1I =(I 为单位阵)

对于方阵范数,除了上述由向量范数诱导的范数之外,还有常用的Frobenius 范数,简称F-范数:

1

1222

11

()[tr()]n n

T

ij F i j A a A A ====∑∑

及加权Frobenius 范数和加权2l 范数:

,M F F

A MAM

=

,22M A MAM =

其中M 为对称正定矩阵。 3. 范数的等价性

定义 设αg 与βg 是n R 上的两个范数,若存在12,0μμ>,使得

12x

x

x α

β

αμμ≤≤, n x R ∀∈

则称范数αg 与βg 是等价的。 容易证明:

212x x ≤≤

2x

x ∞

∞≤≤

1x x n x ∞

∞≤≤ 21x

x x ∞

≤≤

22A x ≤≤

其中1λ是A 的最大特征值,而n λ是A 的最小特征值。由此可见,n

R 中的常用向量范数均等价,事实上还可证明:n

R 中所有向量范数均等价。 4. 关于范数的几个重要不等式。

① Cauchy-Schwarz 不等式

T x y x y ≤(当且仅当x 和y 线性相关时,等式成立)

② 设A 是正定矩阵,则

T A

A x Ay x

y ≤(当且仅当x 与y 线性相关时,等式成立)

由(,)T

x y x Ay =是一种内积,以及一般内积的Cauchy-Schwarz 不等式即得。 ③ 设A 是n n ⨯正定矩阵,则

1

T A

A

x y x

y

-≤(仅当x 与1

A y -线性相关时,等式成立)

1

11T T A

A

A A

x y x AA y x

A y

x

y

---=≤=

其中的不等号由②可得。

④ Young 不等式:假定p 与q 都是大于1的实数,且满足

11

1p q

+=,则,x y R +∀∈,有 p q

x y xy p q

≤+, 当且仅当p

q

x y = 时,等式成立。其证明由算术-几何不等式直接给出,事实上

11()()p q

p

q

p q

x y xy x

y p q

=+≤

(算术-几何不等式) ⑤ H ölder 不等式

1

1

11

()()p

q n

n

p

q

T

i i p

q i i x y x

y x y ==≤=∑∑

其中p 与q 都是大于1的实数,且满足11

1p q

+=,其证明利用Young 不等式可得。 ⑥ Minkowski 不等式

p

p p x y

x y +=≤+,

(1p ≥) 后面将利用凸函数理论予以证明。

二、矩阵求逆与广义逆 1. Von-Neumann 引理

定理 (Von-Neumann 引理) 设n n

E R ⨯∈,n n

I R

⨯∈是单位阵,g 是满足1I =的相容矩阵范数。如

果1E <,则()I E -非奇异,且

相关文档
最新文档