第五专题矩阵的数值特征(行列式、范数、条件数、迹、秩、相对特征根)讲解

合集下载

相关主题

矩阵乘积的特征值

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第五专题矩阵的数值特征
（行列式、迹、秩、相对特征根、范数、条件数）
一、行列式
已知A p×q, B q×p, 则|I p+AB|=|I q+BA|
证明一：参照课本194页，例4.3.
证明二：利用AB和BA有相同的非零特征值的性质；
从而I p+AB，I q+BA中不等于1的特征值的数目相同，大小相同；其余特征值都等于1。

行列式是特征值的乘积，因此|I p+AB|和|I q+BA|等于特征值（不等于1）的乘积，所以二者相等。

二、矩阵的迹
矩阵的迹相对其它数值特征简单些，然而，它在许多领域，如数值计算，逼近论，以及统计估计等都有相当多的应用，许多量的计算都会归结为矩阵的迹的运算。

下面讨论有关迹的一些性质和不等式。

定义：
n n
ii i
i1i1
tr(A)a
==
==λ
∑∑，etrA=exp(trA)
性质：
1. tr(A B)tr(A)tr(B)
λ+μ=λ+μ，线性性质；
2. T
tr(A )tr(A)=；
3. tr(AB)tr(BA)=；
4. 1
tr(P AP)tr(A)-=；
5. H H
tr(x Ax)tr(Axx ),x =为向量；
6. n
n
k k
i i i 1
i 1
tr(A),tr(A )===λ=λ∑∑;
从Schur 定理（或Jordan 标准形）和（4）证明； 7. A 0≥,则tr(A)0≥,且等号成立的充要条件是A=0；
8. A B(A B 0)≥-≥即,则tr(A)tr(B)≥，且等号成立的充要条件是A=B （i i A B (A)(B)≥⇒λ≥λ）；
9. 对于n 阶方阵A ，若存在正整数k,使得A k =0,则tr(A)=0（从Schur 定理或Jordan 标准形证明）。

若干基本不等式
对于两个m ×n 复矩阵A 和B ，tr(A H B)是m ×n 维酉空间上的内积，也就是将它们按列依次排成的两个mn 维列向量的内积，利用Cauchy-schwarz 不等式
[x,y]2≤[x,x]﹒[y,y]
得
定理：对任意两个m ×n 复矩阵A 和B |tr(A H B)|2≤tr(A H A)﹒tr(B H B)
这里等号成立的充要条件是A=cB,c为一常数。

特别当A和B为实对称阵或Hermit矩阵时
0≤|tr(AB)|≤
定理：设A和B为两个n阶Hermite阵,且A≥0，B≥0，则
0≤tr(AB)≤λ1(B)tr(A) ≤tr(A)﹒tr(B)
λ1(B)表示B的最大特征值。

证明：
tr(AB)= tr(A1/2BA1/2) ≥0，又因为
A1/2[λ1(B)I-B]A1/2≥0，所以λ1(B)tr(A)≥A1/2BA1/2，得
tr(AB)= tr(A1/2BA1/2)≤tr(λ1(B) A)
=λ1(B) tr(A)≤tr(A)﹒tr(B)
推论：设A为Hermite矩阵，且A>0，则
tr(A)tr(A-1)≥n
另外，关于矩阵的迹的不等式还有很多，请参考《矩阵论中不等式》。

三、矩阵的秩
矩阵的秩的概念是由Sylvester于1861年引进的。

它是矩阵的最重要的数字特征之一。

下面讨论有关矩阵秩的一些性质和不等式。

定义：矩阵A 的秩定义为它的行（或列）向量的最大无关组所包含的向量的个数。

记为rank(A)
性质：
1. rank(AB)min(rank(A),rank(B))≤；
2. rank(A B)rank(A,B)rank(A)rank(B)+≤≤+；
3.
H H
rank(AA )rank(A )rank(A)==； 4. rank(A)rank(XA)rank(AY)rank(XAY)===，其中X 列满秩，Y 行满秩（消去法则）。

定理（Sylvester ）：设A 和B 分别为m×n 和n×l 矩阵，则
rank(A)rank(B)n rank(AB)+-≤
m i n (r a n k (A ),r a
≤ Sylveste 定理是关于两个矩阵乘积的秩的不等式。

其等号成立的充要条件请参考王松桂编写的《矩阵论中不等式》，三个矩阵乘积的秩的不等式也一并参考上述文献。

四、相对特征根
定义：设A 和B 均为P 阶实对称阵，B>0，方程 |A-λB |=0的根称为A 相对于B 的特征根。

性质：|A-λB |=0等价于|B -1/2AB -1/2-λI|=0
(因为B>0，所以B 1/2>0)
注：求A相对于B的特征根问题转化为求B-1/2AB-1/2的特征根问题或AB-1的特征根。

因B-1/2AB-1/2是实对称阵，所以特征根为实数。

定义：使(A-λi B)l i=0的非零向量l i称为对应于λi 的A相对于B的特征向量。

性质：
①设l是相对于λ的A B-1的特征向量，则
A B-1l=λl 或 A (B-1l)=λB( B-1l)
B-1l 为对应λ的A相对于B的特征向量
（转化为求A B-1的特征向量问题）。

②设l是相对于λ的B-1/2AB-1/2的特征向量，则
B-1/2AB-1/2l=λl
可得
A (B-1/2l)=λB(B-1/2l)
则B-1/2l 为对应λ的A相对于B的特征向量
（转化为求B-1/2AB-1/2对称阵的特征向量问题）。

五、向量范数与矩阵范数
向量与矩阵的范数是描述向量和矩阵“大小”的一种度量。

先讨论向量范数。

1. 向量范数定义：设V为数域F上的线性空间，若对于V的任一向量x，对应一个实值函数x，并满
足以下三个条件：
（1）非负性 x 0≥，等号当且仅当x=0时成立；（2）齐次性 x x ,k,x V;α=α⋅α∈∈ （3）三角不等式x y x y ,x,y V +≤+∈。

则称x 为V 中向量x 的范数，简称为向量范数。

定义了范数的线性空间定义称为赋范线性空间。

例1. n x C ∈，它可表示成[]
T
1
2
n x =ξξξ，i C ξ∈，
1n
2
2i 2i 1x ∆
=⎛
⎫=ξ ⎪
⎝⎭
∑就是一种范数，称为欧氏范数或2-范数。

证明：
（i ）非负性 1n
2
2i 2i 1x 0=⎛
⎫=ξ≥ ⎪
⎝⎭
∑，
当且仅当()i 0i 1,2,,n ξ==时，即x ＝0时，
2
x
＝0
（ii ）齐次性
1
1
n
n 2
2
22i i 22i 1i 1x x ==⎛⎫
⎛⎫
α=αξ=α⋅ξ=α⋅ ⎪
⎪
⎝⎭
⎝⎭
∑∑
（iii ）三角不等式
[]T
1
2
n y =ηηη ，i C η∈
[]T
1122n n x y +=ξ+ηξ+ηξ+η
n
2
2
i i 2i 1x y =+=ξ+η∑
()
222
22
i i i i i i i i i i 2Re 2ξ+η=ξ+η+ξη≤ξ+η+ξη
n
222
i i 222i 1
x y x y 2=+≤++ξη∑
()2
2
2
222222x y x y 2x y +=++
根据Hölder 不等式：
11
n
n
n
p
q
p q i i i i i 1i 1i 1a b a b ===⎛⎫⎛⎫≤ ⎪ ⎪⎝⎭
⎝⎭∑∑∑，i i 11p,q 1,1,a ,b 0p q >+=> 1
1
n
n
n
22
22i i i i 2
2i 1i 1i 1
x y ===⎛⎫⎛
⎫=ξη≥ξη ⎪ ⎪
⎝⎭⎝⎭
∑∑∑
∴ 222x y x y +≤+
2. 常用的向量范数（设向量为[]
T
12
n x =ξξξ）
1-范数：n
i 1
i 1
x
==ξ∑；
∞-范数：1i n
x i max ∞≤≤=ξ；
P-范数：1
n
p
p i p i 1x =⎛
⎫=ξ ⎪⎝⎭
∑ （p>1, p=1, 2,…,∞,）;
2-范数：(
)
1
H
2
2x x x
=;
椭圆范数(2-范数的推广):
(
)
1
H
2
A
x
x Ax
=，A 为Hermite 正定阵.
加权范数：
1n
2
2i i w
i 1x
w =⎛⎫=ξ ⎪⎝⎭
∑，
当[]12
n A W diag w w w ==，i w 0>
证明：
p
x
显然满足非负性和齐次性
（iii ）[]
T
1
2
n y =ηηη
1n
p
p i p i 1x =⎛
⎫=ξ ⎪
⎝⎭
∑，1n p
p i p
i 1y =⎛
⎫=η ⎪⎝⎭
∑，1
n
p
p i
i p i 1x y =⎛⎫
+=ξ+η ⎪⎝⎭
∑
(
)
n
n
p
p
p 1
i i i i
i i
p
i 1
i 1
n
n
p 1
p 1
i i
i i i
i
i 1
i 1
x y
-==--==+=ξ+η=ξ+ηξ+η≤ξ+ηξ+ξ+ηη∑∑∑∑
应用Hölder 不等式
()1
1
n
n
n
q
p
p 1
p 1q p i
i i i i
i i 1i 1
i 1--===⎡
⎤
⎡
⎤ξ
+ηξ≤ξ+ηξ⎢⎥⎢⎥⎣⎦
⎣⎦∑∑∑ ()11
n
n
n
q
p
p 1
p 1q p i
i
i i i
i i 1
i 1i 1--===⎡⎤
⎡
⎤ξ
+ηη≤ξ+ηη⎢⎥
⎢⎥⎣⎦
⎣⎦∑∑∑
()11
1p 1q p p q
+=⇒-= ∴
1
1
1n
n
n
n
q
p
p
p
p p p i
i
i i i i i 1
i 1i 1
i
1
====⎡⎤⎛
⎫⎛⎫⎛⎫⎢⎥ξ+η≤ξ+ξ+η ⎪ ⎪ ⎪⎢⎥⎝⎭⎝⎭
⎝⎭⎣
⎦
∑∑∑∑ 11
1
n
n
n p
p
p
p p p i i i i i 1i 1i 1===⎛
⎫⎛
⎫⎛
⎫ξ+η≤ξ+η ⎪ ⎪ ⎪⎝⎭
⎝⎭
⎝⎭
∑∑∑
即 p p p
x y x y
+≤+
3. 向量范数的等价性定理设
α
、β
为n
C 的两种向量范数，则必定存
在正数m 、M ，使得
m x
x M x
α
βα
≤≤，（m 、M 与x
无关），称此为向量范数的等价性。

同时有1
1x x x M
m
βα
β
≤≤
注：
（1）对某一向量X 而言，如果它的某一种范数小（或大），那么它的其它范数也小（或大）。

（2）不同的向量范数可能大小不同，但在考虑向量序列的收敛性问题时，却表现出明显的一致性。

4、矩阵范数
向量范数的概念推广到矩阵情况。

因为一个m ×
n 阶矩阵可以看成一个mn 维向量，所以m n
C ⨯中任何
一种向量范数都可以认为是m ×n 阶矩阵的矩阵范数。

1. 矩阵范数定义：设m n C ⨯表示数域C 上全体m n
⨯阶矩阵的集合。

若对于m n C ⨯中任一矩阵A ，均对应一个实值函数A ，并满足以下四个条件：
（1）非负性：A 0≥ ，等号当且仅当A=0时成立；（2）齐次性：A A ,C;α=αα∈
（3）三角不等式：m n A B A B ,A,B C ⨯+≤+∈,则称
A 为广义矩阵范数；
（4）相容性：AB A B ≤⋅,则称A 为矩阵范数。

5. 常用的矩阵范数
（1）Frobenius 范数（F-范数）
F-范数：
12
n
2ij F
i j 1A
a =⎛
⎫= ⎪⎝⎭
∑，
=
矩阵和向量之间常以乘积的形式出现，因而需要考虑矩阵范数与向量范数的协调性。

定义：如果矩阵范数A 和向量范数x 满足
Ax A x ≤⋅
则称这两种范数是相容的。

给一种向量范数后，我们总可以找到一个矩阵范数与之相容。

（2）诱导范数
设A ∈C m ×n ，x ∈C n , x 为x 的某种向量范数，记
x 1
A max Ax == 则A 是矩阵A 的且与x 相容的矩阵范数，也称之为
A 的诱导范数或算子范数。

（3）p-范数：
p
p
p
Ax A
max
x
=，
()
ij m n
A a ⨯=,x 为所有可能的向量，[]
T
12
n x =ξξξ，
p
p
x
x
α=α，
()
p p
1
Ax A x =αα
()0α≠
∴
p p p
x 1
A max Ax
==
111
x 1
A max Ax
==，
n
i 1i 1x 1==ξ=∑，n n
ij j
1i 1j 1
Ax a ===ξ∑∑
可以证明下列矩阵范数都是诱导范数：（1）
n
ij
11j n
i 1A max a ≤≤==∑ 列（和）范数；
（2
）21i n A ≤≤= 谱范数； H A A 的最大特征值称为H A A 的谱半径。

当A 是Hermite 矩阵时，i 21i n
A max (A)≤≤=λ是
A 的谱
半径。

注：谱范数有许多良好的性质，因而经常用到。

2
H
H
222
2A
A ; A A A ==
（3）n
ij
1i m
j 1
A
max a ∞
≤≤==∑ 行（和）范数
（
x
∞
=1
n
p
p i i
1i n
i 1p max ≤≤=→∞
⎛
⎫ξ=ξ ⎪⎝⎭
∑ ，
2x =1
n
2
2i i 1=⎛
⎫ξ ⎪
⎝⎭
∑）
定理矩阵A 的任意一种范数A 是A 的元素的连
续函数；矩阵A 的任意两种范数是等价的。

定理设A ∈C n ×n
，x ∈C n , 则F A 和2x 是相容的
即
2F
2Ax A
x ≤⋅
证明：由于222F
2Ax A x A x ≤⋅≤⋅成立。

定理设A ∈C n ×n ，则F A 是酉不变的，即对于任意酉矩阵U,V ∈C n ×n ，有
F F A UAV =
证明：
F
UAV
=
==
F A ===
定义设A ∈C n ×n ，A 的所有不同特征值组成的集合
称为A 的谱；特征值的模的最大值称为A 的谱半径，记为ρ(A)。

定理 ρ(A)不大于A 的任何一种诱导范数，即
ρ(A)≤A
证明：设λ是A 的任意特征值，x 是相应的特征向
量，即
Ax=λx
则
|λ|·||x||= ||Ax||≤||A||·||x||, ||x||≠0
即
|λ|≤||A||
试证：设A是n阶方阵，||A||是诱导范数，当||A||<1时，I-A可逆，且有
||(I-A)-1||≤(1-||A||)-1
证明：
若I-A不可逆，则齐次线性方程组
(I-A)x=0
有非零解x，即x=Ax，因而有
||x||=||Ax||≤||A||﹒||x||<||x||
但这是不可能的，故I-A可逆。

于是(I-A)-1=[ (I-A)+A] (I-A)-1=I+A (I-A)-1
因此||(I-A)-1||≤||I||+||A(I-A)-1||=1+||A(I-A)-1||
≤1+||A||﹒|| (I-A)-1||
即证
||(I-A)-1||≤(1-||A||)-1
补充证明||I||=1：
由相容性可知：
||A||﹒||A -1||≥||A A -1||=||I||
x Ix I x I 1=≤⇒≥
对于诱导范数( x 1
A max Ax ==) x 1I max Ix 1===。

六、条件数
条件数对研究方程的性态起着重要的作用。

定义：设矩阵A 是可逆方阵，称||A||﹒||A -1||为矩阵A 的条件数，记为cond(A)，即
cond(A)= ||A||﹒||A -1||
性质：
（1）cond(A) ≥1,并且A 的条件数与所取的诱导范数的类型有关。

因cond(A)= ||A||﹒||A -1||≥||A A -1||=||I||=1 （2）cond(kA)= cond(A)=cond(A -1)，这里k 为任意非零常数。

当选用不用的范数时，就得到不同的条件数，如：
cond 1(A)= ||A||1﹒||A -1||1 cond ∞(A)= ||A||∞﹒||A -1||∞ cond 2(A)= ||A||2﹒||A -1
||2
，其中1n ,λλ分别
为A H A 的特征值的模的最大值和最小值。

谱条件数
特别地，如果A 为可逆的Hermite 矩阵，则有
cond 2(A)=
1
n
λλ
这里1n ,λλ分别为A 的特征值的模的最大值和最小值。

如果A 为酉阵，则cond 2(A)= 1
例求矩阵A 的条件数cond 1(A)，cond ∞(A)
1
52A 210382-⎛⎫ ⎪=- ⎪ ⎪-⎝⎭
解：
||A||1=max{6;14;4}=14; ||A||∞=max{8;3;13}=14;
1
2621A 4844132311-⎛⎫ ⎪=- ⎪ ⎪⎝⎭
故
||A -1||1=17/4; ||A -1||∞=47/4;
cond 1(A)= ||A||1﹒||A -1||1=14×17/4=259/2; cond ∞(A)= ||A||∞﹒||A -1||∞=611/4。

例设线性方程组Ax=b 的系数矩阵A 可逆。

讨论当b 有误差δb 时，解的相对误差δx 的大小。

解：因矩阵A 可逆，所以Ax=b 有唯一解x=A -1b ，设解的误差为δx ，由
A(x+δx)=b+δb
得
A δx=δb 或δx=A -1δb 得
11x A b A b --δ=δ≤⋅δ （1）
又Ax=b ，可得
b A x ≤⋅，或A 1
x b ≤ （2）
所以由（1）和（2），得
1
x b b A A cond(A)x b b -δδδ≤⋅⋅=⋅
这说明相误差x
x δ的大小与条件数cond(A)密切相关；当右端b 的相对误差b
b δ一定时，cond(A)越大，
解的相对误差就可能越大；cond(A)越小，解的相对误差就可能越小。

因而条件数cond(A)可以反映A 的特性。

一般来说：条件数反映了误差放大的程度，条件
数越大，矩阵越病态。

条件数在最小二乘估计的稳定性研究中有重要应用。

鉴于矩阵A 的条件数范数cond(A)有多种，但最常用的条件数是由谱范数||A||2导出的，称为谱条件数。

在本章中，若无特别声明，讨论的条件数都是谱条件数。

2
A =
12
A -= 谱条件数：()
cond A =
若A 是m ×n 阶矩阵，且rank(A) =t≤n ，则A 的条件数定义为
()()
()
max min A cond A A σ=
σ 即最大奇异值与最小非零奇异值的商。

（3）其它性质
对任意酉矩阵Q ，cond(QAQ H )= cond(A -1)；
()()H 2cond AA cond A cond(A)=≥。

（因
()()()
()H max H
2H min AA cond AA cond A AA σ==σ）。

第五专题 矩阵的数值特征(行列式、范数、条件数、迹、秩、相对特征根)讲解

第五专题矩阵的数值特征(行列式、范数、条件数、迹、秩、相对特征根)讲解