第五专题 矩阵的数值特征(行列式、范数、条件数、迹、秩、相对特征根)讲解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五专题矩阵的数值特征
(行列式、迹、秩、相对特征根、范数、条件数)
一、行列式
已知A p×q, B q×p, 则|I p+AB|=|I q+BA|
证明一:参照课本194页,例4.3.
证明二:利用AB和BA有相同的非零特征值的性质;
从而I p+AB,I q+BA中不等于1的特征值的数目相同,大小相同;其余特征值都等于1。
行列式是特征值的乘积,因此|I p+AB|和|I q+BA|等于特征值(不等于1)的乘积,所以二者相等。
二、矩阵的迹
矩阵的迹相对其它数值特征简单些,然而,它在许多领域,如数值计算,逼近论,以及统计估计等都有相当多的应用,许多量的计算都会归结为矩阵的迹的运算。
下面讨论有关迹的一些性质和不等式。
定义:
n n
ii i
i1i1
tr(A)a
==
==λ
∑∑,etrA=exp(trA)
性质:
1. tr(A B)tr(A)tr(B)
λ+μ=λ+μ,线性性质;
2. T
tr(A )tr(A)=;
3. tr(AB)tr(BA)=;
4. 1
tr(P AP)tr(A)-=;
5. H H
tr(x Ax)tr(Axx ),x =为向量;
6. n
n
k k
i i i 1
i 1
tr(A),tr(A )===λ=λ∑∑;
从Schur 定理(或Jordan 标准形)和(4)证明; 7. A 0≥,则tr(A)0≥,且等号成立的充要条件是A=0;
8. A B(A B 0)≥-≥即,则tr(A)tr(B)≥,且等号成立的充要条件是A=B (i i A B (A)(B)≥⇒λ≥λ);
9. 对于n 阶方阵A ,若存在正整数k,使得A k =0,则tr(A)=0(从Schur 定理或Jordan 标准形证明)。
若干基本不等式
对于两个m ×n 复矩阵A 和B ,tr(A H B)是m ×n 维酉空间上的内积,也就是将它们按列依次排成的两个mn 维列向量的内积,利用Cauchy-schwarz 不等式
[x,y]2≤[x,x]﹒[y,y]
得
定理:对任意两个m ×n 复矩阵A 和B |tr(A H B)|2≤tr(A H A)﹒tr(B H B)
这里等号成立的充要条件是A=cB,c为一常数。
特别当A和B为实对称阵或Hermit矩阵时
0≤|tr(AB)|≤
定理:设A和B为两个n阶Hermite阵,且A≥0,B≥0,则
0≤tr(AB)≤λ1(B)tr(A) ≤tr(A)﹒tr(B)
λ1(B)表示B的最大特征值。
证明:
tr(AB)= tr(A1/2BA1/2) ≥0,又因为
A1/2[λ1(B)I-B]A1/2≥0,所以λ1(B)tr(A)≥A1/2BA1/2,得
tr(AB)= tr(A1/2BA1/2)≤tr(λ1(B) A)
=λ1(B) tr(A)≤tr(A)﹒tr(B)
推论:设A为Hermite矩阵,且A>0,则
tr(A)tr(A-1)≥n
另外,关于矩阵的迹的不等式还有很多,请参考《矩阵论中不等式》。
三、矩阵的秩
矩阵的秩的概念是由Sylvester于1861年引进的。
它是矩阵的最重要的数字特征之一。
下面讨论有关矩阵秩的一些性质和不等式。
定义:矩阵A 的秩定义为它的行(或列)向量的最大无关组所包含的向量的个数。
记为rank(A)
性质:
1. rank(AB)min(rank(A),rank(B))≤;
2. rank(A B)rank(A,B)rank(A)rank(B)+≤≤+;
3.
H H
rank(AA )rank(A )rank(A)==; 4. rank(A)rank(XA)rank(AY)rank(XAY)===,其中X 列满秩,Y 行满秩(消去法则)。
定理(Sylvester ):设A 和B 分别为m×n 和n×l 矩阵,则
rank(A)rank(B)n rank(AB)+-≤
m i n (r a n k (A ),r a
≤ Sylveste 定理是关于两个矩阵乘积的秩的不等式。
其等号成立的充要条件请参考王松桂编写的《矩阵论中不等式》,三个矩阵乘积的秩的不等式也一并参考上述文献。
四、相对特征根
定义:设A 和B 均为P 阶实对称阵,B>0,方程 |A-λB |=0的根称为A 相对于B 的特征根。
性质:|A-λB |=0等价于|B -1/2AB -1/2-λI|=0
(因为B>0,所以B 1/2>0)
注:求A相对于B的特征根问题转化为求B-1/2AB-1/2的特征根问题或AB-1的特征根。
因B-1/2AB-1/2是实对称阵,所以特征根为实数。
定义:使(A-λi B)l i=0的非零向量l i称为对应于λi 的A相对于B的特征向量。
性质:
①设l是相对于λ的A B-1的特征向量,则
A B-1l=λl 或 A (B-1l)=λB( B-1l)
B-1l 为对应λ的A相对于B的特征向量
(转化为求A B-1的特征向量问题)。
②设l是相对于λ的B-1/2AB-1/2的特征向量,则
B-1/2AB-1/2l=λl
可得
A (B-1/2l)=λB(B-1/2l)
则B-1/2l 为对应λ的A相对于B的特征向量
(转化为求B-1/2AB-1/2对称阵的特征向量问题)。
五、向量范数与矩阵范数
向量与矩阵的范数是描述向量和矩阵“大小”的一种度量。
先讨论向量范数。
1. 向量范数定义:设V为数域F上的线性空间,若对于V的任一向量x,对应一个实值函数x,并满
足以下三个条件:
(1)非负性 x 0≥,等号当且仅当x=0时成立; (2)齐次性 x x ,k,x V;α=α⋅α∈∈ (3)三角不等式x y x y ,x,y V +≤+∈。
则称x 为V 中向量x 的范数,简称为向量范数。
定义了范数的线性空间定义称为赋范线性空间。
例1. n x C ∈,它可表示成[]
T
1
2
n x =ξξξ,i C ξ∈,
1n
2
2i 2i 1x ∆
=⎛
⎫=ξ ⎪
⎝⎭
∑就是一种范数,称为欧氏范数或2-范数。
证明:
(i )非负性 1n
2
2i 2i 1x 0=⎛
⎫=ξ≥ ⎪
⎝⎭
∑,
当且仅当()i 0i 1,2,,n ξ==时,即x =0时,
2
x
=0
(ii )齐次性
1
1
n
n 2
2
22i i 22i 1i 1x x ==⎛⎫
⎛⎫
α=αξ=α⋅ξ=α⋅ ⎪
⎪
⎝⎭
⎝⎭
∑∑
(iii )三角不等式
[]T
1
2
n y =ηηη ,i C η∈
[]T
1122n n x y +=ξ+ηξ+ηξ+η
n
2
2
i i 2i 1x y =+=ξ+η∑
()
222
22
i i i i i i i i i i 2Re 2ξ+η=ξ+η+ξη≤ξ+η+ξη
n
222
i i 222i 1
x y x y 2=+≤++ξη∑
()2
2
2
222222x y x y 2x y +=++
根据Hölder 不等式:
11
n
n
n
p
q
p q i i i i i 1i 1i 1a b a b ===⎛⎫⎛⎫≤ ⎪ ⎪⎝⎭
⎝⎭∑∑∑,i i 11p,q 1,1,a ,b 0p q >+=> 1
1
n
n
n
22
22i i i i 2
2i 1i 1i 1
x y ===⎛⎫⎛
⎫=ξη≥ξη ⎪ ⎪
⎝⎭⎝⎭
∑∑∑
∴ 222x y x y +≤+
2. 常用的向量范数(设向量为[]
T
12
n x =ξξξ)
1-范数:n
i 1
i 1
x
==ξ∑;
∞-范数:1i n
x i max ∞≤≤=ξ;
P-范数:1
n
p
p i p i 1x =⎛
⎫=ξ ⎪⎝⎭
∑ (p>1, p=1, 2,…,∞,);
2-范数:(
)
1
H
2
2x x x
=;
椭圆范数(2-范数的推广):
(
)
1
H
2
A
x
x Ax
=,A 为Hermite 正定阵.
加权范数:
1n
2
2i i w
i 1x
w =⎛⎫=ξ ⎪⎝⎭
∑,
当[]12
n A W diag w w w ==,i w 0>
证明:
p
x
显然满足非负性和齐次性
(iii )[]
T
1
2
n y =ηηη
1n
p
p i p i 1x =⎛
⎫=ξ ⎪
⎝⎭
∑,1n p
p i p
i 1y =⎛
⎫=η ⎪⎝⎭
∑,1
n
p
p i
i p i 1x y =⎛⎫
+=ξ+η ⎪⎝⎭
∑
(
)
n
n
p
p
p 1
i i i i
i i
p
i 1
i 1
n
n
p 1
p 1
i i
i i i
i
i 1
i 1
x y
-==--==+=ξ+η=ξ+ηξ+η≤ξ+ηξ+ξ+ηη∑∑∑∑
应用Hölder 不等式
()1
1
n
n
n
q
p
p 1
p 1q p i
i i i i
i i 1i 1
i 1--===⎡
⎤
⎡
⎤ξ
+ηξ≤ξ+ηξ⎢⎥⎢⎥⎣⎦
⎣⎦∑∑∑ ()11
n
n
n
q
p
p 1
p 1q p i
i
i i i
i i 1
i 1i 1--===⎡⎤
⎡
⎤ξ
+ηη≤ξ+ηη⎢⎥
⎢⎥⎣⎦
⎣⎦∑∑∑
()11
1p 1q p p q
+=⇒-= ∴
1
1
1n
n
n
n
q
p
p
p
p p p i
i
i i i i i 1
i 1i 1
i
1
====⎡⎤⎛
⎫⎛⎫⎛⎫⎢⎥ξ+η≤ξ+ξ+η ⎪ ⎪ ⎪⎢⎥⎝⎭⎝⎭
⎝⎭⎣
⎦
∑∑∑∑ 11
1
n
n
n p
p
p
p p p i i i i i 1i 1i 1===⎛
⎫⎛
⎫⎛
⎫ξ+η≤ξ+η ⎪ ⎪ ⎪⎝⎭
⎝⎭
⎝⎭
∑∑∑
即 p p p
x y x y
+≤+
3. 向量范数的等价性 定理 设
α
、β
为n
C 的两种向量范数,则必定存
在正数m 、M ,使得
m x
x M x
α
βα
≤≤,(m 、M 与x
无关),称此为向量范数的等价性。
同时有1
1x x x M
m
βα
β
≤≤
注:
(1)对某一向量X 而言,如果它的某一种范数小(或大),那么它的其它范数也小(或大)。
(2)不同的向量范数可能大小不同,但在考虑向量序列的收敛性问题时,却表现出明显的一致性。
4、矩阵范数
向量范数的概念推广到矩阵情况。
因为一个m ×
n 阶矩阵可以看成一个mn 维向量,所以m n
C ⨯中任何
一种向量范数都可以认为是m ×n 阶矩阵的矩阵范数。
1. 矩阵范数定义:设m n C ⨯表示数域C 上全体m n
⨯阶矩阵的集合。
若对于m n C ⨯中任一矩阵A ,均对应一个实值函数A ,并满足以下四个条件:
(1)非负性:A 0≥ ,等号当且仅当A=0时成立; (2)齐次性:A A ,C;α=αα∈
(3)三角不等式:m n A B A B ,A,B C ⨯+≤+∈,则称
A 为广义矩阵范数;
(4)相容性:AB A B ≤⋅,则称A 为矩阵范数。
5. 常用的矩阵范数
(1)Frobenius 范数(F-范数)
F-范数:
12
n
2ij F
i j 1A
a =⎛
⎫= ⎪⎝⎭
∑,
=
矩阵和向量之间常以乘积的形式出现,因而需要考虑矩阵范数与向量范数的协调性。
定义:如果矩阵范数A 和向量范数x 满足
Ax A x ≤⋅
则称这两种范数是相容的。
给一种向量范数后,我们总可以找到一个矩阵范数与之相容。
(2)诱导范数
设A ∈C m ×n ,x ∈C n , x 为x 的某种向量范数, 记
x 1
A max Ax == 则A 是矩阵A 的且与x 相容的矩阵范数,也称之为
A 的诱导范数或算子范数。
(3)p-范数:
p
p
p
Ax A
max
x
=,
()
ij m n
A a ⨯=,x 为所有可能的向量,[]
T
12
n x =ξξξ,
p
p
x
x
α=α,
()
p p
1
Ax A x =αα
()0α≠
∴
p p p
x 1
A max Ax
==
111
x 1
A max Ax
==,
n
i 1i 1x 1==ξ=∑,n n
ij j
1i 1j 1
Ax a ===ξ∑∑
可以证明下列矩阵范数都是诱导范数: (1)
n
ij
11j n
i 1A max a ≤≤==∑ 列(和)范数;
(2
)21i n A ≤≤= 谱范数; H A A 的最大特征值称为H A A 的谱半径。
当A 是Hermite 矩阵时,i 21i n
A max (A)≤≤=λ是
A 的谱
半径。
注:谱范数有许多良好的性质,因而经常用到。
2
H
H
222
2A
A ; A A A ==
(3)n
ij
1i m
j 1
A
max a ∞
≤≤==∑ 行(和)范数
(
x
∞
=1
n
p
p i i
1i n
i 1p max ≤≤=→∞
⎛
⎫ξ=ξ ⎪⎝⎭
∑ ,
2x =1
n
2
2i i 1=⎛
⎫ξ ⎪
⎝⎭
∑)
定理 矩阵A 的任意一种范数A 是A 的元素的连
续函数;矩阵A 的任意两种范数是等价的。
定理 设A ∈C n ×n
,x ∈C n , 则F A 和2x 是相容的
即
2F
2Ax A
x ≤⋅
证明:由于222F
2Ax A x A x ≤⋅≤⋅成立。
定理 设A ∈C n ×n ,则F A 是酉不变的,即对于任意酉矩阵U,V ∈C n ×n ,有
F F A UAV =
证明:
F
UAV
=
==
F A ===
定义 设A ∈C n ×n ,A 的所有不同特征值组成的集合
称为A 的谱;特征值的模的最大值称为A 的谱半径,记为ρ(A)。
定理 ρ(A)不大于A 的任何一种诱导范数,即
ρ(A)≤A
证明:设λ是A 的任意特征值,x 是相应的特征向
量,即
Ax=λx
则
|λ|·||x||= ||Ax||≤||A||·||x||, ||x||≠0
即
|λ|≤||A||
试证:设A是n阶方阵,||A||是诱导范数,当||A||<1时,I-A可逆,且有
||(I-A)-1||≤(1-||A||)-1
证明:
若I-A不可逆,则齐次线性方程组
(I-A)x=0
有非零解x,即x=Ax,因而有
||x||=||Ax||≤||A||﹒||x||<||x||
但这是不可能的,故I-A可逆。
于是(I-A)-1=[ (I-A)+A] (I-A)-1=I+A (I-A)-1
因此||(I-A)-1||≤||I||+||A(I-A)-1||=1+||A(I-A)-1||
≤1+||A||﹒|| (I-A)-1||
即证
||(I-A)-1||≤(1-||A||)-1
补充证明||I||=1:
由相容性可知:
||A||﹒||A -1||≥||A A -1||=||I||
x Ix I x I 1=≤⇒≥
对于诱导范数( x 1
A max Ax ==) x 1I max Ix 1===。
六、条件数
条件数对研究方程的性态起着重要的作用。
定义:设矩阵A 是可逆方阵,称||A||﹒||A -1||为矩阵A 的条件数,记为cond(A),即
cond(A)= ||A||﹒||A -1||
性质:
(1)cond(A) ≥1,并且A 的条件数与所取的诱导范数的类型有关。
因cond(A)= ||A||﹒||A -1||≥||A A -1||=||I||=1 (2)cond(kA)= cond(A)=cond(A -1),这里k 为任意非零常数。
当选用不用的范数时,就得到不同的条件数,如:
cond 1(A)= ||A||1﹒||A -1||1 cond ∞(A)= ||A||∞﹒||A -1||∞ cond 2(A)= ||A||2﹒||A -1
||2
,其中1n ,λλ分别
为A H A 的特征值的模的最大值和最小值。
谱条件数
特别地,如果A 为可逆的Hermite 矩阵,则有
cond 2(A)=
1
n
λλ
这里1n ,λλ分别为A 的特征值的模的最大值和最小值。
如果A 为酉阵,则cond 2(A)= 1
例 求矩阵A 的条件数cond 1(A),cond ∞(A)
1
52A 210382-⎛⎫ ⎪=- ⎪ ⎪-⎝⎭
解:
||A||1=max{6;14;4}=14; ||A||∞=max{8;3;13}=14;
1
2621A 4844132311-⎛⎫ ⎪=- ⎪ ⎪⎝⎭
故
||A -1||1=17/4; ||A -1||∞=47/4;
cond 1(A)= ||A||1﹒||A -1||1=14×17/4=259/2; cond ∞(A)= ||A||∞﹒||A -1||∞=611/4。
例 设线性方程组Ax=b 的系数矩阵A 可逆。
讨论当b 有误差δb 时,解的相对误差δx 的大小。
解:因矩阵A 可逆,所以Ax=b 有唯一解x=A -1b ,设解的误差为δx ,由
A(x+δx)=b+δb
得
A δx=δb 或δx=A -1δb 得
11x A b A b --δ=δ≤⋅δ (1)
又Ax=b ,可得
b A x ≤⋅,或A 1
x b ≤ (2)
所以由(1)和(2),得
1
x b b A A cond(A)x b b -δδδ≤⋅⋅=⋅
这说明相误差x
x δ的大小与条件数cond(A)密切相关;当右端b 的相对误差b
b δ一定时,cond(A)越大,
解的相对误差就可能越大;cond(A)越小,解的相对误差就可能越小。
因而条件数cond(A)可以反映A 的特性。
一般来说:条件数反映了误差放大的程度,条件
数越大,矩阵越病态。
条件数在最小二乘估计的稳定性研究中有重要应用。
鉴于矩阵A 的条件数范数cond(A)有多种,但最常用的条件数是由谱范数||A||2导出的,称为谱条件数。
在本章中,若无特别声明,讨论的条件数都是谱条件数。
2
A =
12
A -= 谱条件数:()
cond A =
若A 是m ×n 阶矩阵,且rank(A) =t≤n ,则A 的条件数定义为
()()
()
max min A cond A A σ=
σ 即最大奇异值与最小非零奇异值的商。
(3)其它性质
对任意酉矩阵Q ,cond(QAQ H )= cond(A -1);
()()H 2cond AA cond A cond(A)=≥。
(因
()()()
()H max H
2H min AA cond AA cond A AA σ==σ)。