第五章 特征值的估计与表示
矩阵特征值的估计
解
A
m∞
= n max aij = 3 × 2 = 6,
1≤i , j ≤ n
1 A + AH 2 1 A − AH 2
m∞
m∞
1 0 m = 0, = ∞ 2 1 1 H = A− A = 2A m∞ 2 2
m∞
6, =
由定理2知, λ ≤ 6,Re λ = 0,Im λ ≤ 6.
由此可知,A的特征值为0或纯虚数.
= i 1= j 1
证
∑∑ a η η
ij i
n
n
j
≤ ∑∑ aij ηi η j
= i 1= j 1
n
n
≤ max aij
1≤i , j ≤ n
= i 1= j 1
∑∑ η
n
n
i
ηj
n n 1 2 ≤ max aij ∑∑ ηi + η j 2 1≤i , j ≤ n = i 1= j 1
(
2
)
G′j = z ∈ C z − a jj ≤ R′j 为A的第j个列盖尔圆.
{
} ( j =1, 2, , n )
0.02 0.11 1 0.14 如A = 0.01 i 0.02 0.01 0.5 的三个盖尔圆为: G1 = G2 G3
i
R2 = 0.15
于是 AF =
n 2 = i 1 2
R F tr ( R H R ) =
2 1≤i < j ≤ n = i 1
= ∑ λi +
∑
rij ≥ ∑ λi .
2 2
n
§5.2 矩阵特征值的分布区域
一、圆盘定理 1. Gerschgorin圆(盖尔圆) 定义1
第5章 特征值的估计
在例 5.2.1 中,圆盘 S1 与 S 2 相交,S1 S 2 构成一个连通区域,而 S 3 与
S 4 是孤立的.
一般地, 由矩阵的 k 个相交的盖尔圆的并集构成的连通区域称为一个连 通部分, 并说它是由 k 个盖尔圆组成. 一个孤立的盖尔圆组成一个连通部分. 圆盘定理 5.2.1 只说明矩阵的特征值均在其全部盖尔圆的并集内,并没 有明确指出哪个盖尔圆中有多少个特征值,圆盘定理 5.2.2 更准确地说明特 征值的分布情况.
第5章 特征值的估计
矩阵的特征值在理论上和实际应用中都是十分重要的, 但是特征值的计算一般是非常麻烦的,尤其当矩阵的阶数
比较高时,要精确计算出矩阵的特征值是相当困难的,因
此,由矩阵元素的简单关系式估计出特征值的范围就显得 尤为重要.本章将主要给出特征值的估计与圆盘定理,以 及谱半径的估计.
5.1 特征值界的估计
则有
U H BU U H U H CU U H
n
A AH T T H U , 2 2 A AH T T H U , 2 2
2
| Re k | | Re i | |
2 i 1 n
n
i i
2
i 1 n
t ii t ii 2 | | | , 2 i 1
设 A, B, C 的特征值分别为
k , k , i k ( i 1, k 1,2,n) ,且满足 | 1 || 2 | | n | , 1 2 n ,
1 2 n .
定理 5.1.2 设 A (aij ) C 则
值,于是
2 2 2 2 | | | t | | t | | t | i ii ii ij T i 1 n
第五章 特征值与特征向量(0808)
2019/3/31
10
对于 2 3 2而言,求解齐次线性方程组 (2 E A) X 0 即
1 1 1 x1 (2 E A) X 1 1 1 x2 0 1 1 1 x 3
T T
2 3 3
2 A 123 1 ( 3) 2 3
2019/3/31 21
三、特征值与特征向量的性质
m 1 定理5.2 设n阶方阵A有特征值 ,则 kA, A , A , A A m 1 分别有特征值: k , , , ,其中m为正整
A 数, 是A的伴随矩阵。
证明:因为:
E AT E T AT ( E A)T E A
则A与 AT有相同的特征多项式
2019/3/31
15
例4 设n阶方阵A满足 AT A E(为正交矩阵),
则的特征值必为1或 -1 证明:设 为的特征值,且 A ( 0) 对上式两边左乘 AT
这样,寻找F的极值点问题就转化为寻找方程组 (5.1)或(5.2)的非零解的问题。能使方程组 (5.1)或(5.2)有非零的数及相关的非零解, 就是下面要引入的方阵的特征值与特征向量。
定义5.1 设n阶方阵 A (aij )nn (1) E A 称为A的特征矩阵; a11 a12 (2)称 E A
12
n A
(5.7)
2019/3/31
18
证明:注意到A的特征多项式为:
a11 E A
a21 a n1
a12 a22 an 2
a1n a2 n
ann
易知特征多项式中 n与 n1 两项只可能出现在主对 角线的乘积项中,
课件:第五章 特征值与特征向量(2)
A
x 是特征向量
特征值与特征向量的求法
n阶矩阵A的特征值,满足A
特征值满足:E - A 0, 即:(E A) 0
使方程组(E - A)X 0 有 非零解X =的值 满足 E - A 0 的 值
特征多项式:
的一个n 次多项式 E - A
特征方程: E - A 0
则 A1A A1( )
得 A1 1
所以,矩阵A1的一个特征值是 1 ,
也是A-1对应特征值 1 的一个特征向量。证毕。
性质1.3 设1, 2, , t是n阶方阵A两两不同的特征值, i1,i2 , ,iri是对应于特征值i的线性无关的特征向
量(i 1, 2, ,t)。那么向量组:
11,12 , ,1r1 , 21, ,2r2 ,
f (2) 22 -3 2+1=-1,f (1) 12 -3 1+1=-1
0 1
即f
(
A)的特征值为-1,特征向量为
0 1
, 12
例 设是n阶可逆矩阵A的一个特征值,是A对应特征值
的一个特征向量。证明:矩阵A-1的一个特征值是 1 ,也是
A-1对应特征值 1 的一个特征向量。
证: 由条件知,A 且 0
证:A的特征多项式= E A
AT的特征多项式= E AT ET AT E AT
E AT E A
A与AT有相同的特征多项式,所以有相同的特征值。
性质1.2 设n阶方阵A = aij 的n个特征值为1, 2, , n,
则有
(1) A的n个特征值之和等于A的迹。即
n
1 2 n a11 a22 ann ( aii称为A的迹) i 1
推广: 设是n阶矩阵A的一个特征值,是A对应特征值
矩阵理论课件 第五章 特征值的估计与广义逆矩阵
0 2
1
0
0 1
1 0 0
1 2y
y
x1 2z1 z1
x2
2z2 z2
0 2
1 0
0
1
A
1
2
y
y
2( x2 2z2
2z2 )
x1 2z1 z1
x2 2z2
z2
A
A
1 2
y
y
2(1 2 y)
2y
( A A)H
1 2y
2(1
2
y)
y
2
y
2
2(1 2 y) y y
设 A (aij )nn Rnn(n阶实矩阵),则
Im i
n(n 1)
2
max
1i , jn
cij
例1 估计下面矩阵的特征值的界:
0 0.2 0.1 1 0
A
0.2
0
0.2
2 0.3i
解:
0.1 0.2 0 3 0.3i
B 1 ( A AT ) 0,C 1 ( A AT ) A
4个盖尔圆中只有 G4 是孤立的, G1,G2 ,G3 是连通
的,故结论成立。
定义1 (严格对角占优矩阵)
设 A (aij ),若C满n足n
n
aii aij , i 1, 2, n j 1 ji
则称 A 为(行)对角占优矩阵,若不等式严格成立, 则称 为A(行)严格对角占优矩阵;若 为A行T (严格)对角占优矩阵,则称 A列(严格)对角占
5
A
1 5
2( x2
2z2 )
x1 2z1
x2
2
z2
2 5 2z2
z1
矩阵特征值计算
其 中 每个 对角 块 ������������������ 均 为方阵 , 则矩 阵 ������ 的 特征 值为各 对 角块 矩阵 特征 值的合 并 ,即 ������(������) = ⋃������ ������=1 ������(������������������ ). 定理 5.5: 矩阵的相似变换(similarity transformation)不改变特征值. 设矩阵������和������为相似矩阵, 即存在非奇异矩阵������使得������ = ������−1 ������������,则 (1) 矩阵������和������的特征值相等,即 ������(������) = ������(������) ; (2) 若������为������的特征向量,则相应地,������������为������的特征向量. 通过相似变换并不总能把矩阵转化为对角阵,或者说矩阵 ������ 并不总是 可对角化 的 (diagonalizable). 下面给出特征值的代数重数、几何重数,和亏损矩阵的概念,以及几个定 理.. ̃1 , ⋯ , ������ ̃������ ,若������ ̃������ 是特征方程的������������ 重 定义 5.2: 设矩阵������ ∈ ℝ������×������ 有 m 个(mn)不同的特征值������ ̃������ 的代数重数(algebraic multiplicity),并称������ ̃������ 的特征子空间(ℂ������ 的子空间)的维数 根,则称������������ 为������ ̃������ 的几何重数(geometric multiplicity). 为������ ̃1 , ⋯ , ������ ̃������ ,特征值������ ̃������ , (������ = 1, ⋯ , ������)的代数 定理 5.6:设矩阵������ ∈ ℝ������×������ 的 m 个不同的特征值为������ 重数为������������ ,几何重数为������������ ,则 (1) ∑������ ������=1 ������������ = ������,且任一个特征值的几何重数不大于代数重数,即∀������,������������ ≥ ������������ . (2) 不同特征值的特征向量线性无关,并且将所有特征子空间的∑������ ������=1 ������������ 个基(特征向量)放在 一起,它们构成一组线性无关向量. (3) 若每个特征值的代数重数等于几何重数,则总共可得������个线性无关的特征向量,它们是 全空间ℂ������ 的基. 定义 5.3:若矩阵������ ∈ ℝ������×������ 的某个代数重数为 k 的特征值对应的线性无关特征向量数目少于 k(即几何重数小于代数重数) ,则称 ������为亏损阵(defective matrix) ,否则称其为非亏损阵 (nondefective matrix). 定理 5.7:设矩阵������ ∈ ℝ������×������ 可对角化,即存在非奇异矩阵������ ∈ ℂ������×������ 使得 ������−1������������ = ������, 其中������ ∈ ℂ������×������ 为对角阵, 的充要条件是������为非亏损矩阵. 此时,������的对角线元素为矩阵������的特 征值,而矩阵������的列向量为 n 个线性无关的特征向量. 定理 5.7 中方程的等价形式为������ = ������������������−1, 它被称为特征值分解,也叫谱分解(spectrum decomposition). 特征值分解存在的充要条件是������为非亏损矩阵. 但现实中还有很多矩阵是亏 损矩阵,例如例 5.2 中的矩阵,它的特征值 2 的代数重数为 2,而几何重数仅为 1. 这种矩阵
自考线性代数第五章特征值与特征向量 ppt课件
推论:若 n 阶矩阵 A 和 B 相似,则 A 的多项
式 j (A) 和 B 的 多项式 j (B) 相似.
2021/3/30
32
证明:设存在可逆矩阵 P ,使得 P −1AP = B ,则P −1AkP = Bk .
设j (x) = cmxm + cm−1xm−1 + … + c1x + c0,那么 P −1 j (A) P
ann l
• 特征方程
| A−lE | = 0
• 特征多项式 | A−lE |
2021/3/30
9
二、基本性质
• 在复数范围内 n 阶矩阵 A 有 n 个特征值 (重根按重数计算).
• 设 n 阶矩阵 A 的特征值为 l1, l2, …, ln,
则
✓l1 + l2 + … + ln = a11 + a22 + … + ann ✓l1 l2 … ln = |A|
18
• 若 l 是 A 的一个特征值,则齐次线性方程 组的基础解系就是对应于特征值为 l 的全
体特征向量的最大无关组.
• 若 l 是 A 的一个特征值,则 j (l) = a0 + a1 l + … + am l m是矩阵多项式 j (A) = a0 +
a1 A + … + am A m 的特征值.
对应于特征值 l 的特征向量.
2021/3/30
6
例:
3 42 2 2 31 11
则l=1为
3
2
4
3
的特征值,
2 1
于l = 1 的特征向量.
第五章特征值和特征向量PPT课件
设是非零向量, 则 是一个单位向量.
这是因为
1
1
1
(3) xy2xy,xy x ,x 2 x ,y y ,y x ,x 2 x y y ,y
x22x yy2
xy2
所以 x yxy
(以上性质显然成立)
定义2 设x=(x1, x2, …, xn)T
令 x[x,x]x1 2x2 2 xn 2
称为n 维向量 x 的长度(或范数).
显然||x||0, 当||x|| =1时, 称x为单位向量, 零向量的长度为0.
在R2中, =(a1, a2)
a12 a22
在R3中, =(a1, a2 , a3)
注:此处可能是复数, A的元素和x的分量
也可能是复数.
将(1)改写成 (AE )x =0 (2)
( 或改写为 (E A)x=0 ) 此为n 元齐次线性方程组
它有非零解的充要条件是 | A E| =0
即
a11
a21
a12
a22
a1n a2n 0
an1
an2
ann
定义 A为n阶方阵, 含有未知量的矩阵AE
1 n
2
n
n
n
其中
ij
1 0
i j i j
当i=j时, i ia i2 1a i2 2 ...a i2 n 1
当ij时, i j a i1 a j1 ... a in a jn 0
列的情况可以通过 A'A=E 加以证明
这样,性质4. 和5.得证.
定理4 A为正交矩阵的充要条件是 A的行(列)向量组为正交规范向量组. 证: 由性质4,5可以直接推出
第五章特征值与特征向量资料.
3 6 1
2 0
对于1 2 1,
3
1
I
A
3 3
6 6 6
0 00
基础解系:v1
全部特征向量:
1 0
,
v2
0 1
6 6 0
对于
3
2, 2I
1
A
3 3
3 6
03 1
2 0
c1
1 0
c2
0 1
c1,c2不全 为零.
基础解系:
1 1
全部特征向量:c
1 1
证: Ax x A(kx) k Ax k x (kx) (kx≠0)
所以,kx(k≠0)也是A的对应于λ的特征向量;
Ax x, Ay y, A(k1x k2 y) k1Ax k2 Ay k1 x k2 y (k1x k2 y)
因为k1, k2不全为零,所以 k1x k2 y O
所以,k1x+k2y (k1,k2不全为零)是A的对应于λ的特征向量. 同一特征值的特征向量的非零线性组合仍是该特征值的特征向量.
注: 1.一个特征值对应有无穷多个特征向量. 2.一个特征向量只属于一个特征值.
4 6 0
练习:
求A
3 3
5 6
0 1
的特征值及特征向量.
4 6 0
解:I A 3 5 0 ( 1)2( 2) 0 特征值为1 2 1,3 2.
02
0 0
1 0
1
1
2 0
x1 x2
x3 2x3
令x3=1得方程组的基础解系为:v2
2 1
是属于λ2=λ3 =-3的一个
特征向量.
1
则对应于λ2=λ3
=-3的全部特征向量为:c2v2=
线性代数第5章特征值与特征向量
有 n 个根(重根按重数计算), 记为1, 2 , n ,
则特征方程可分解为 fA () ( 1)( 2 ) ( n ) 0.
因此,n 阶方阵在复数域上恰有 n 个特征值.
-9-
例1
求矩阵
0
A
1
1 0
的特征值与特征向量.
解: 求特征多项式
f () E A
1 2 1
1
解特征方程
4 1 3
解 第一步:写出矩阵A的特征方程,求出A E 0 2 0 (2 ) 4 3
4 1 3
( 2)2 ( 1) 特征值为 1 1, 2 3 2.
第二步:对每个特征值 代入齐次线性方程组
A E x 0, 求非零解。
当 2 3 2 时,齐次线性方程组为 ( A 2E) X O
A
2
E
4 1
1 0
0 0
0 0
1 0
0 0
x1 x2
0 0
0
令 x3 1得基础解系:
p1
0 1
k1 p1(k1 0 常数)是对应于 1 2 的全部特征向量。
当 2 3 1 时,齐次线性方程组为 A E x 0
2 1 0 1 0 1
A
E
4 1
2 0
0 1
-34-
定理5.3 n 阶矩阵 A 可对角化的充要条件是 A 有 n 个线性无 关的特征向量。
证: 先证必要性. 设A可对角化,即存在可逆矩阵P使得
P1AP diag(1,2 , , n )
记 P [1,2, ,n ] , 则 A[1,2 , ,n ] [1,2,
,n
]
1
2
n
于是
Ai ii (i 1, , n)
第五章矩阵特征值计算
第五章矩阵特征值计算与线性方程组的求解问题一样,矩阵特征值与特征向量的计算也是数值线性代数的重要内容. 在理论上,矩阵的特征值是特征多项式方程的根,因此特征值的计算可转化为单个多项式方程的求解. 然而对于高阶矩阵,这种转化并不能使问题得到简化,而且在实际应用中还会引入严重的数值误差. 因此,正如第二章指出的,我们一般将多项式方程求解转化为矩阵特征值计算问题,而不是反过来.本章介绍有关矩阵特征值计算问题的基本理论和算法. 与非线性方程求根问题类似,计算矩阵特征值的算法也是迭代方法①.5.1基本概念与特征值分布本节先介绍矩阵特征值、特征向量的基本概念和性质,然后讨论对特征值分布范围的简单估计方法.5.1.1基本概念与性质定义5.1:矩阵A=(a kj)∈ℂn×n,(1) 称φ(λ)=det(λI−A)=λn+c1λn−1+⋯+c n−1λ+c n为A的特征多项式(characteristic polynomial);n次代数方程φ(λ)=0为A的特征方程(characteristic equation),它的n个根:λ1,⋯,λn,被称为A的特征值(eigenvalue). 此外,常用λ(A)表示A的全体特征值的集合,也称为特征值谱(spectrum of eigenvalue).(2) 对于矩阵A的一个给定特征值λ,相应的齐次线性方程组(λI−A)x=0 , (5.1)有非零解(因为系数矩阵奇异),其解向量x称为矩阵A对应于λ的特征向量(eigenvector).根据方程(5.1),我们得出矩阵特征值与特征向量的关系,即Ax=λx .(5.2)第三章的定义3.5就利用公式(5.2)对矩阵特征值和特征向量进行了定义,它与定义5.1是等价的. 另外,同一个特征值对应的特征向量一定不唯一,它们构成线性子空间,称为特征子空间(eigenspace).我们一般讨论实矩阵的特征值问题. 应注意,实矩阵的特征值和特征向量不一定是实数和实向量,但实特征值一定对应于实特征向量(方程(5.1)的解),而一般的复特征值对应的特征向量一定不是实向量. 此外,若特征值不是实数, 则其复共轭也一定是特征值(由于特征方程为实系数方程). 定理3.3表明,实对称矩阵A∈ℝn×n的特征值均为实数,存在n个线性无关、且正交的实特征向量,即存在由特征值组成的对角阵Λ和特征向量组成的正交阵Q,使得:A=QΛQ T.(5.3)例5.1(弹簧-质点系统):考虑图5-1的弹簧-质点系统,其中包括三个质量分别为m1、m2、m3的物体,由三个弹性系数分别为k1,k2,k3的弹簧相连,三个物体的位置均为时间的函数,①如果用有限次运算能求得一般矩阵的特征值,则多项式方程求根问题也可用有限次运算解决,这与阿贝尔证明的“高于4次的多项式并不都有用初等运算表示的求根公式”的理论矛盾.这里考查三个物体偏离平衡位置的位移,分别记为y 1(t), y 2(t), y 3(t). 因为物体在平衡状态所受的重力已经和弹簧伸长的弹力平衡,所以物体的加速度只和偏离平衡位置引起的弹簧伸长相关. 根据牛顿第二定律以及胡克定律(即弹簧的弹力与拉伸长度成正比)可列出如下微分方程组②: My ′′(t)+Ky(t)=0 ,其中y (t )=[y 1(t)y 2(t)y 3(t)]T ,M =[m 1000m 2000m 3],K =[k 1+k 2−k 20−k 2k 2+k 3−k 30−k 3k 3] . 在一般情况下,这个系统会以自然频率ω做谐波振动,而y 的通解包含如下的分量: y j (t )=x j e iωt ,(j =1,2,3)其中i =√−1,根据它可求解出振动的频率ω及振幅x j . 由这个式子可得出:y j ′′(t )=−ω2x j e iωt ,(j =1,2,3)代入微分方程,可得代数方程:−ω2Mx +Kx =0,或Ax =λx ,其中A =M −1K ,λ=ω2. 通过求解矩阵A 的特征值便可求出这个弹簧-质点系统的自然频率(有多个). 再结合初始条件可确定这三个位移函数,它们可能按某个自然频率振动(简正振动),也可能是若干个简正振动的线性叠加.例5.2(根据定义计算特征值、特征向量):求矩阵A =[5−1−131−14−21]的特征值和特征向量.[解]: 矩阵A 的特征方程为:det (λI −A )=|λ−511−3λ−11−42λ−1|=(λ−3)(λ−2)2=0故A 的特征值为λ1=3,λ2=2(二重特征值).当λ=λ1=3时,由(λI −A)x =0,得到方程[−211−321−422][x 1x 2x 3]=[000]它有无穷多个解,若假设x 1=1, 则求出解为x =[1,1,1]T ,记为x 1,则x 1是λ1对应的一个特征向量.当λ=λ2=2时,由(λI −A)x =0,得到方程[−311−311−421][x 1x 2x 3]=[000]它有无穷多个解,若假设x 1=1, 则求出解为x =[1,1,2]T ,记为x 2,则x 2是λ2对应的一个特② 本书第八章将介绍这种常微分方程组的数值求解方法.图5-1 弹簧-质点系统.征向量.下面概括地介绍有关矩阵特征值、特征向量的一些性质,它们可根据定义5.1,以及公式(5.2)加以证明.定理5.1:设λj (j =1,2,…,n)为n 阶矩阵A 的特征值,则(1) ∑λj n j=1=∑a jj n j=1=tr(A) ;(2) ∏λj n j=1=det(A) .这里tr(A)表示矩阵对角线上元素之和,称为矩阵的迹(trace ).从上述结论(2)也可以看出,非奇异矩阵特征值均不为0, 而0一定是奇异矩阵的特征值. 定理5.2:矩阵转置不改变特征值,即λ(A )=λ(A T ).定理5.3:若矩阵A 为对角阵或上(下)三角阵,则其对角线元素即为矩阵的特征值.定理5.4:若矩阵A 为分块对角阵,或分块上(下)三角阵,例如A =[A 11A 12⋯A 1m A 22⋯A 2m ⋱⋮A mm] , 其中每个对角块A jj 均为方阵,则矩阵A 的特征值为各对角块矩阵特征值的合并,即λ(A )=⋃λ(A jj )m j=1.定理5.5:矩阵的相似变换(similarity transformation)不改变特征值. 设矩阵A 和B 为相似矩阵,即存在非奇异矩阵X 使得B =X −1AX ,则(1) 矩阵A 和B 的特征值相等,即 λ(A )=λ(B ) ;(2) 若y 为B 的特征向量,则相应地,Xy 为A 的特征向量.通过相似变换并不总能把矩阵转化为对角阵,或者说矩阵A 并不总是可对角化的(diagonalizable). 下面给出特征值的代数重数、几何重数,和亏损矩阵的概念,以及几个定理..定义5.2: 设矩阵A ∈ℝn×n 有m 个(m n )不同的特征值λ̃1,⋯,λ̃m ,若λ̃j 是特征方程的n j 重根,则称n j 为λ̃j 的代数重数(algebraic multiplicity),并称λ̃j 的特征子空间(ℂn 的子空间)的维数为λ̃j 的几何重数(geometric multiplicity). 定理5.6:设矩阵A ∈ℝn×n 的m 个不同的特征值为λ̃1,⋯,λ̃m ,特征值λ̃j ,(j =1,⋯,m)的代数重数为n j ,几何重数为k j ,则(1) ∑n j m j=1=n ,且任一个特征值的几何重数不大于代数重数,即∀j ,n j ≥k j .(2) 不同特征值的特征向量线性无关,并且将所有特征子空间的∑k j m j=1个基(特征向量)放在一起,它们构成一组线性无关向量.(3) 若每个特征值的代数重数等于几何重数,则总共可得n 个线性无关的特征向量,它们是全空间ℂn 的基.定义5.3:若矩阵A ∈ℝn×n 的某个代数重数为k 的特征值对应的线性无关特征向量数目少于k (即几何重数小于代数重数),则称A 为亏损阵(defective matrix ),否则称其为非亏损阵(nondefective matrix ).定理5.7:设矩阵A ∈ℝn×n 可对角化,即存在非奇异矩阵X ∈ℂn×n 使得X −1AX =Λ,其中Λ∈ℂn×n 为对角阵, 的充要条件是A 为非亏损矩阵. 此时,Λ的对角线元素为矩阵A 的特征值,而矩阵X 的列向量为n 个线性无关的特征向量.定理5.7中方程的等价形式为A =XΛX −1, 它被称为特征值分解,也叫谱分解(spectrum decomposition). 特征值分解存在的充要条件是A 为非亏损矩阵. 但现实中还有很多矩阵是亏损矩阵,例如例5.2中的矩阵,它的特征值2的代数重数为2,而几何重数仅为1. 这种矩阵不能相似变换为对角阵,但存在下面的若当分解(Jordan decomposition).定理5.8:设矩阵A ∈ℝn×n , 存在非奇异矩阵X ∈ℂn×n 使得A =XJX −1,矩阵J 为形如[J 1⋱J p ]的分块对角阵(称为若当标准型),其中J k =[ λk 1λk ⋱⋱1λk ] 称为若当块,其对角线元素为矩阵A 的特征值. 设矩阵A 有m 个不同的特征值为λ̃1,⋯,λ̃m ,特征值λ̃j ,(j =1,⋯,m)的代数重数为n j ,几何重数为k j ,则p =∑k j m j=1, λ̃j 对应于k j 个若当块, 其阶数之和等于n j .在若当分解中,如果所有若当块都是1阶的,则J 为对角阵,这种分解就是特征值分解,相应的矩阵为非亏损阵. 若当分解是很有用的理论工具,利用它还可证明下面关于矩阵运算结果的特征值的定理.定理5.9:设λj (j =1,2,…,n)为n 阶矩阵A 的特征值,则(1) 矩阵cA, c 为常数, 的特征值为cλ1,cλ2,⋯,cλn .(2) 矩阵A +pI, p 为常数, 的特征值为λ1+p,λ2+p,⋯,λn +p.(3) 矩阵A k , k 为正整数, 的特征值为λ1k ,λ2k ,⋯,λn k .(4) 设p (t )为一多项式函数,则矩阵p (A )的特征值为p (λ1),p (λ2),⋯ ,p (λn ) .(5) 若A 为非奇异矩阵,则λj ≠0,(j =1,2,…,n), 且矩阵A −1的特征值为λ1−1,λ2−1,⋯,λn −1.5.1.2特征值分布范围的估计估计特征值的分布范围或它们的界,无论在理论上或实际应用上,都有重要意义. 比如,本书前面的内容曾涉及两个问题:(1). 计算矩阵的2-条件数:cond (A )2=√λmax (A T A)λmin (A T A) ;(2). 考察一阶定常迭代法x (k+1)=Bx (k)+f 的收敛性、收敛速度:收敛的判据是谱半径ρ(B)=max 1≤j≤n |λj (B)|<1 ; 收敛速度为R =−log 10ρ(B) .其中都需要对矩阵特征值分布范围的了解.上一章的定理4.4说明谱半径的大小不超过任何一种算子范数,即ρ(A )≤‖A ‖ ,这是关于特征值的上界的一个重要结论.下面先给出定义5.4,再介绍有关特征值的界的另一个重要结论.定义5.4:设A =(a kj )∈ℂn×n ,记r k =∑|a kj |n j=1j≠k ,(k =1,⋯,n),则集合D k ={z||z −a kk |≤r k ,z ∈ℂ},(k =1,⋯,n)在复平面为以a kk 为圆心、r k 为半径的圆盘,称为A 的Gerschgorin (格什戈林)圆盘.图5-2显示了一个3⨯3复矩阵的格什戈林圆盘.定理5.10 (圆盘定理):设A =(a kj )∈ℂn×n ,则:(1) A 的每一个特征值必属于A 的格什戈林圆盘之中,即对任一特征值λ必定存在k,1≤k ≤n ,使得:|λ−a kk |≤∑|a kj |nj=1j≠k .(5.4)图5-2 复坐标平面,以及3⨯3矩阵A 的格什戈林圆盘.用集合的关系来说明,这意味着λ(A)⊆⋃D k n k=1.(2) 若A 的格什戈林圆盘中有m 个组成一连通并集S ,且S 与余下的n −m 个圆盘分离,则S内恰好包含A 的m 个特征值(重特征值按重数计).对图5-2所示的例子,定理5.10的第(2)个结论的含义是:D 1中只包含一个特征值,而另外两个特征值在D 2,D 3的并集中. 下面对定理5.10的结论(1)进行证明,结论(2)的证明超出了本书的范围.[证明]: 设λ为A 的任一特征值,则有Ax =λx ,x 为非零向量. 设x 中第k 个分量最大,即|x k |=max 1≤j≤n|x j |>0 , 考虑方程(5.2)中第k 个方程:∑a kj x j nj=1=λx k , 将其中与x k 有关的项移到等号左边,其余到右边,再两边取模得:|λ−a kk ||x k |=|∑a kj x j n j=1j≠k |≤∑|a kj ||x j |n j=1j≠k ≤|x k |∑|a kj |nj=1j≠k .(5.5)最后一个不等式的推导利用了“x 中第k 个分量最大”的假设. 将不等式(5.5)除以|x k |,即得到(5.4)式,因此证明了定理 5.10的结论(1). 上述证明过程还说明,若某个特征向量的第k 个分量的模最大,则相应的特征值必定属于第k 个圆盘中.根据定理5.2,还可以按照矩阵的每一列元素定义n 个圆盘,对于它们定理5.10仍然成立. 下面的定理是圆盘定理的重要推论,其证明留给感兴趣的读者.定理5.11:设A ∈ℝn×n ,且A 的对角元均大于0,则(1) 若A 严格对角占优,则A 的特征值的实部都大于0.(2) 若A 为对角占优的对称矩阵,则A 一定是对称半正定矩阵,若同时A 非奇异,则A 为对称正定矩阵.例5.3 (圆盘定理的应用):试估计矩阵A =[41010−111−4]的特征值范围.[解]: 直接应用圆盘定理,该矩阵的三个圆盘如下:D 1: |λ−4|≤1, D 2: |λ|≤2, D 3: |λ+4|≤2.D 1与其他圆盘分离,则它仅含一个特征值,且必定为实数(若为虚数则其共轭也是特征值,这与D 1仅含一个特征值矛盾). 所以对矩阵特征值的范围的估计是:3≤λ1≤5,λ2,λ3∈D 2∪D 3 .再对矩阵A T 应用圆盘定理,则可以进一步优化上述结果. 矩阵A T 对应的三个圆盘为: D ’1: |λ−4|≤2, D ’2: |λ|≤2, D ’3: |λ+4|≤1.这说明D ’3中存在一个特征值,且为实数,它属于区间[-5, -3],经过综合分析可知三个特征值均为实数,它们的范围是:λ1∈[3,5],λ2∈[−2,2],λ3∈[−5,−3].事实上,使用Matlab 的eig 命令可求出矩阵A 的特征值为:4.2030, -0.4429, -3.7601.根据定理5.5,还可以对矩阵A 做简单的相似变换,例如取X 为对角阵,然后再应用圆盘定理估计特征值的范围.例5.4 (特征值范围的估计):选取适当的矩阵X ,应用定理5.5和5.10估计例5.3中矩阵的特征值范围.[解]: 取X−1=[100010000.9] , 则A 1=X −1AX =[41010−109⁄0.90.9−4]的特征值与A 的相同. 对A 1应用圆盘定理,得到三个分离的圆盘,它们分别包含一个实特征值,由此得到特征值的范围估计:λ1∈[3,5],λ2∈[−199,199],λ3∈[−5.8,−2.2]. 此外,还可进一步估计ρ(A)的范围,即3≤ρ(A)≤5.8 .上述例子表明,综合运用圆盘定理和矩阵特征值的性质(如定理5.2, 定理5.5),可对特征值的范围进行一定的估计. 对具体例子,可适当设置相似变换矩阵,尽可能让圆盘相互分离,从而提高估计的有效性.5.2幂法与反幂法幂法是一种计算矩阵最大的特征值及其对应特征向量的方法. 本节介绍幂法、反幂法以及加快幂法迭代收敛的技术.5.2.1幂法定义5.5:在矩阵A 的特征值中,模最大的特征值称为主特征值,也叫“第一特征值”,它对应的特征向量称为主特征向量.应注意的是,主特征值有可能不唯一,因为模相同的复数可以有很多. 例如模为5的特征值可能是5,−5,3+4i,3−4i , 等等. 另外,请注意谱半径和主特征值的区别.如果矩阵A 有唯一的主特征值,则一般通过幂法能方便地计算出主特征值及其对应的特征向量. 对于实矩阵,这个唯一的主特征值显然是实数,但不排除它是重特征值的情况. 幂法(power iteration)的计算过程是,首先任取一非零向量v 0∈ℝn ,再进行迭代计算:v k =Av k−1,(k =1,2,⋯)得到向量序列{v k },根据它即可求出主特征与特征向量. 下面用定理来说明.定理5.12: 设A ∈ℝn×n ,其主特征值唯一,记为λ1,且λ1的几何重数等于代数重数,则对于非零向量v 0∈ℝn ,v 0不与主特征值对应的特征向量正交,按迭代公式进行计算:v k =Av k−1,(k =1,2,⋯),存在如下极限等式:lim k→∞v k λ1k =x 1 , (5.6) lim k→∞(v k+1)j (v k )j =λ1 , (5.7)其中x 1为主特征向量,(v k )j 表示向量v k 的第j 个分量(k =1,2,⋯).[证明]: 为了推导简便,不妨设主特征值λ1不是重特征值,并且假设矩阵A 为非亏损矩阵. 设A 的n 个特征值按模从大到小排列为: |λ1|>|λ2|≥⋯≥|λn |,它们对应于一组线性无关的单位特征向量x ̂1,⋯,x ̂n . 向量v 0可写成这些特征向量的线性组合:v 0=α1x̂1+⋯+αn x ̂n 根据已知条件,α1≠0,则v k =Av k−1=A k v 0=α1λ1k x ̂1+α2λ2k x̂2+⋯+αn λn k x ̂n =λ1k [α1x ̂1+∑αj (λj λ1)kx ̂j n j=2] =λ1k (α1x̂1+εk ) 其中εk =∑αj (λj λ1)k x ̂j n j=2. 由于|λj λ1|<1,(j =2,…,n), 则 lim k→∞εk =0 ⟹lim k→∞v kλ1k =α1x̂1 . 由于特征向量放大、缩小任意倍数后仍是特征向量,设x 1=α1x̂1,则它是主特征对应的一个特征向量. 上式说明,随k 的增大, v k 越来越趋近于主特征值的对应的特征向量.设j 为1到n 之间的整数,且(v k )j ≠0,则(v k+1)j (v k )j =λ1(α1x ̂1+εk+1)j (α1x̂1+εk )j 由于lim k→∞εk =0,随k 的增大上式等号右边趋于一个常数: λ1. 这就证明了定理的结论.若矩阵A 为亏损矩阵,可利用矩阵的若当分解证明这个定理,这里略去. 在这种情况下,“主特征值的几何重数等于代数重数”这一条件很重要,例如,若A =[310030001] ,它的主特征值为3,但其几何重数为1,不满足条件. 对这个矩阵A 进行实验显示无法用幂法求出主特征值.关于定理5.12,再说明几点:● 当主特征值λ1为重特征值时,应要求其几何重数等于代数重数,此时特征子空间维数大于1,向量序列{v k λ1k ⁄}的收敛值是其特征子空间中的某一个基向量.● 公式(5.7)式的含义是相邻迭代向量分量的比值收敛到主特征值. 因此在实际计算时,可任意取j 的值,只需保证比值的分母不为零.● 证明中假设了α1≠0,在实际应用中往往随机选取v 0,由于存在舍入误差,它一般都能满足. 感兴趣的读者也可思考一下,若初始向量v 0恰好与主特征向量都正交,那么幂法中的迭代向量序列会有什么结果?直接使用幂法,还存在如下两方面问题:(1) 溢出:由于v k ≈λ1k x 1,则|λ1|>1时,实际计算v k 会出现上溢出(当k 很大时);|λ1|<1时,实际计算v k 会出现下溢出(当k 很大时).(2) 可能收敛速度很慢. 由于εk =∑αj (λj λ1)kx j n j=2, εk →0的速度取决于求和式中衰减最慢的因子|λ2λ1|,当|λ2λ1|≈1时,收敛很慢. 由此导致v k →λ1k α1x 1, (v k+1)j (v k )j →λ1的收敛速度都将很慢,严重影响计算的效率.下面采用规格化向量的技术防止溢出,导出实用的幂法. 关于加速收敛技术的讨论,见下一小节.定义 5.6:记max ̅̅̅̅̅̅(v )为向量v ∈ℝn 的绝对值最大的分量, max ̅̅̅̅̅̅(v )=v j ,其中j 满足|v j |=max 1≤k≤n |v k |, 若j 的值不唯一,则取最小的那个. 并且,称u =v/max ̅̅̅̅̅̅(v )为向量v 的规格化向量(normalized vector).例5.5(规格化向量):设v =[3,−5,0]T ,max ̅̅̅̅̅̅(v )=−5,对应的规格化向量为u =[−35,1,0]T .根据定义5.6,容易得出规格化向量的两条性质.定理5.13: 定义5.6中的规格化向量满足如下两条性质:(1) 若u 为规格化向量,则‖u ‖ =1,并且max ̅̅̅̅̅̅(u )=1.(2) 设向量v 1和v 2的规格化向量分别为u 1和u 2,若v 1=αv 2, 实数α≠0,则u 1= u 2.在幂法的每一步增加向量规格化的操作可解决溢出问题. 先看第一步,v 1=Av 0,此时计算v 1的规格化向量u 1=v 1max ̅̅̅̅̅̅(v 1)=Av 0max ̅̅̅̅̅̅(Av 0). 然后使用规格化向量计算v 2:v 2=Au 1=A 2v 0max ̅̅̅̅̅̅(Av 0), (5.8) 再进行向量规划化操作,u 2=v 2max ̅̅̅̅̅̅(v 2)=A 2v 0max ̅̅̅̅̅̅(A 2v 0). (5.9) 公式(5.9)的推导,利用了(5.8)式和定理5.13的结论(2). 依次类推,我们得到: { v k =Au k−1=A k v 0max ̅̅̅̅̅̅(A k−1v 0) u k =v k max ̅̅̅̅̅̅(v k )=A k v 0max ̅̅̅̅̅̅(A k v 0) , k =1,2,⋯. (5.10) 根据定理5.12的证明过程, A k v 0=λ1k [α1x ̂1+∑αj (λj λ1)k x ̂j n j=2] ⟹u k =A k v 0max ̅̅̅̅̅̅(A k v 0)=α1x ̂1+∑αj (λj λ1)k x ̂j n j=2max ̅̅̅̅̅̅(α1x ̂1+∑αj (λj λ1)k x ̂j n j=2)k→∞→ x 1max ̅̅̅̅̅̅(x 1) , 即u k 逐渐逼近规格化的主特征向量. 同理,v k =Au k−1=A k v 0max ̅̅̅̅̅̅(A k−1v 0)=λ1k [α1x ̂1+∑αj (λj λ1)k x ̂j n j=2]max ̅̅̅̅̅̅(λ1k−1[α1x ̂1+∑αj (λj λ1)k−1x̂j n j=2]) =λ1α1x ̂1+∑αj(λj λ1)kx ̂j n j=2max ̅̅̅̅̅̅(α1x ̂1+∑αj (λj λ1)k−1x ̂j n j=2) 因此,根据定理5.13的结论(1)有:lim k→∞v k=λ1x1max̅̅̅̅̅̅(x1)⟹limk→∞max̅̅̅̅̅̅(v k)=λ1.基于上述推导,我们得到如下定理,以及如算法5.1描述的实用幂法.定理5.14: 设A∈ℝn×n,其主特征值唯一(且几何重数等于代数重数),记为λ1,取任意非零初始向量v0=u0,它不与主特征值对应的特征向量正交,按迭代公式(5.10)进行计算,则lim k→∞u k=x1max̅̅̅̅̅̅(x1),(5.11)lim k→∞max̅̅̅̅̅̅(v k)=λ1 ,(5.12)其中x1为主特征向量.算法5.1:计算主特征值λ1和主特征向量x1的实用幂法输入:v,A; 输出:x1,λ1.u:=v;While不满足判停准则dov:=Au;λ1:=max̅̅̅̅̅̅(v); {主特征值近似值}u:=v/λ1; {规格化}Endx1:=u. {规格化的主特征向量}在算法5.1中,可根据相邻两步迭代得到的主特征值近似值之差来判断是否停止迭代. 每个迭代步的主要计算是算一次矩阵与向量乘法,若A为稀疏矩阵则可利用它的稀疏性提高计算效率. 实用的幂法保证了向量序列{v k},{u k}不溢出,并且向量v k的最大分量的极限就是主特征值.最后,针对幂法的适用范围再说明两点:(1). 若实矩阵A对称半正定或对称半负定,则其主特征值必唯一(而且是非亏损阵). 有时也可以估计特征值的分布范围,从而说明主特征值的唯一性. 只有满足此条件,才能保证幂法的收敛性.(2). 对一般的矩阵,幂法的迭代过程有可能不收敛,此时序列{u k}有可能包括多个收敛于不同向量的子序列,它趋向于成为多个特征向量的线性组合. 但是,一旦幂法的迭代过程收敛,向量序列的收敛值就一定是特征向量,并可求出相应的特征值.例5.6 (实用的幂法):用实用的幂法求如下矩阵的主特征值:A=[3113] ,[解]: 取初始向量为v0=u0=[01]T . 按算法5.1的迭代过程,计算结果列于表5-1中.表5-1 实用幂法的迭代计算过程从结果可以看出,在每次迭代步中做的规格化操作避免了分量的指数增大或缩小. 经过9步迭代,特征值max ̅̅̅̅̅̅(v k )已非常接近主特征值的准确值4,特征向量也非常接近[1 1]T .5.2.2加速收敛的方法 加速幂法迭代收敛过程的方法主要有两种:原点位移技术和瑞利商(Rayleigh quotient )加速. 下面做些简略的介绍.一. 原点位移技术原点位移技术,也叫原点平移技术,它利用定理5.9的结论(2),即矩阵A −pI 的特征值为A 的特征值减去p 的结果. 对矩阵B =A −pI 应用幂法有可能得到矩阵A 的某个特征值λj 和相应的特征向量. 要使原点位移达到理想的效果,首先要求λj −p 是B 的主特征值,其次还要使幂法尽快收敛,即比例|λ2(B)λj −p |要尽量小,这里的λ2(B)表示矩阵B 的(按模)第二大的特征值. 在某种情况下设置合适的p 值,矩阵A,B 可同时取到主特征值. 图5-3显示了这样一个例子,矩阵A 的特征值分布在阴影区域覆盖的实数轴上,λ1为其主特征值. 按图中所示选取的p 值,将使得λ1−p 是矩阵B =A −pI 的主特征值,并且显然有|λ2(B)λ1−p |<|λ2(A)λ1| . 此时用幂法计算B 的主特征值能更快地收敛,进而得到矩阵的A 的主特征值. 图5-3也解释了原点位移法名字的由来,即将原点(或虚数坐标轴)移到p 的位置上,原始矩阵A 的特征值分布变成了矩阵B 的特征值分布.采用原点位移技术后,执行幂法仅带来很少的额外运算,而且仍然能利用矩阵A 的稀疏性. 它的关键问题是,如何选择合适的参数p 以达到较好的效果?这依赖于具体矩阵的情况,以及对其特征值分布的了解. 在后面,我们还会看到原点位移技术的其他用途.二. 瑞利商加速首先给出瑞利商的定义,以及它与特征值的关系,然后介绍瑞利商加速技术.定义5.7:设A ∈ℝn×n ,且为对称矩阵,对任一非零向量x ≠0,称R (x )=〈Ax,x 〉〈x,x 〉为对应于向量x 的瑞利商(Rayleigh quotient ). 这里符号〈,〉代表向量内积.定理5.15:设A ∈ℝn×n ,且为对称矩阵,其n 个特征值依次为:λ1≥λ2≥⋯≥ λn ,则矩阵A 有关的瑞利商的上下确界分别为λ1和λn . 即∀x ≠0,λn ≤R (x )≤λ1,且当x 为λ1对应的特征向量时R (x )=λ1,当x 为λn 对应的特征向量时R (x )=λn .[证明]: 根据实对称矩阵的特点,即可正交对角化(定理3.3),设特征值λ1,λ2,⋯,λn 对应的单位特征向量为x 1,x 2,⋯,x n ,设x =∑αj x j n j=1,则〈x,x 〉=〈∑αj x j n j=1,∑αj x j n j=1〉=∑αj 2n j=1,而图5-3 原点位移技术示意图.。
特征值
第五章 矩阵特征值问题矩阵特征值的核心问题就是在相似的意义下讨论矩阵的化简,特别是所谓的相似对角化问题.本章我们不仅要给出相似对角化的特征刻画,同时还要建立一个重要的恒等式,即Hamilton-Cayley 定理.这些结论对于以后研究线性变换以及标准型理论都将起到重要的作用.§5.1 特征值与特征向量一、概念定义1 设A 为n 阶方阵,如果存在数λ以及一个n 维非零列向量ξ,使得关系式 λξξ=A (1) 成立,则称λ为A 的一个特征值,非零向量ξ为A 的属于特征值λ的特征向量.注1:从定义看到:属于特征值λ的特征向量的非零线性组合仍是属于λ的特征向量.二、特征值和特征向量计算将(1)式改写为()0=−ξλA E ,这表明ξ是n 元齐次线性方程组()0=−X A E λ (2) 的一个非零解.由齐次线性方程组有非零解的充分必要条件知,其系数矩阵()A E −λ的行列式等于零,即0212222111211=−−−−−−−−−=−nnn n n n a a a a a a a a a A E λλλλL LOL L L L .这是λ的n 次多项式.根据代数基本定理,在复数范围内它有n 个根(k 重根算作k 个根),因此n 阶矩阵在复数范围内就有n 个特征值.将特征值λ代入(2)式,求出它的基础解系,它们的非零线性组合就是属于特征值λ的所有特征向量.为了叙述方便,引入如下术语:定义2 设A 是一个n 阶方阵,λ是一个未知量.称矩阵A E −λ为A 的特征矩阵,其行列式A E −λ为A 的特征多项式,记为)(λf ;A E −λ=0为A 的特征方程,其根即为矩阵A 的特征值.综上所述,求n 阶方阵A 的特征值和特征向量的步骤如下:(1) 计算特征多项式A E −λ;(2) 求A 的特征方程A E −λ=0的全部根,它们就是A 的所有特征值;(3) 对于A 的每一个特征值λ,求解齐次线性方程组()0=−X A E λ.设它的一个基础解系为,,,,21r n −ξξξL (其中)(A E r r −=λ),则A 的属于λ的全部特征向量为,2211r n r n k k k −−+++ξξξL其中r n k k k −,,,21L 是不全为零的任意数.例1 求上三角阵⎟⎟⎟⎟⎟⎠⎞⎜⎜⎜⎜⎜⎝⎛=nn n n a a a a a a A M O L L 22211211的特征值。
大一线性代数特征值知识点
大一线性代数特征值知识点线性代数是大学里一门基础性的数学课程,其中特征值和特征向量是其中一个重要的知识点。
在大一的线性代数课程中,学生通常会首次接触到这个概念,并学习如何计算特征值和特征向量。
本文将介绍一些关于特征值的基本概念和性质,以及常见的计算方法。
首先,什么是特征值和特征向量呢?在矩阵代数中,给定一个n阶方阵A,如果存在一个非零向量x,使得Ax=kx,其中k是一个常数,那么k就是矩阵A的一个特征值,而x则是相应的特征向量。
特征值和特征向量在课程中的应用非常广泛。
在物理学和工程学中,它们可以用来描述物质或者系统在变换过程中的特性和状态。
在经济学中,特征值和特征向量可以用来解释市场中的波动和发展趋势。
在计算机科学中,它们则可以用于图像处理和模式识别等领域。
接下来,我们来看一些特征值的性质。
首先是特征值的数目。
对于一个n阶方阵A,它最多有n个互不相同的特征值。
这是由于特征值的定义,每个特征值都对应着一个不同的特征向量。
除此之外,特征值还有一些重要的性质。
特征值的和等于矩阵的迹,特征值的积等于矩阵的行列式。
这两个性质在计算特征值时非常有用。
另外,如果一个特征值是实数,那么它对应的特征向量也可以是实向量。
但是如果一个特征值是复数,那么它对应的特征向量一般来说就是复数向量了。
在实际计算中,我们通常会用特征方程来求解特征值和特征向量。
特征方程的形式是|A-kI|=0,其中A是一个给定的方阵,k是未知的特征值,I是单位矩阵。
求解这个特征方程可以得到矩阵A 的特征值。
一旦求得了特征值,我们还需要找到它们所对应的特征向量。
常见的方法是通过代入法和高斯消元法来求解。
具体来说,我们可以将特征方程进一步转化为(A-kI)x=0,然后通过高斯消元法将方程组化为阶梯形式,最后得到特征向量。
除了直接计算特征值和特征向量之外,我们还可以通过相似矩阵的转换来简化计算。
相似矩阵指的是具有相同特征值的方阵。
通过相似矩阵的转换,我们可以将一个复杂的方阵转化为一个对角阵,使得特征值的计算更加简便。
第五章特征值new
因为 1. AA* = A* A = A E .
由上结论,易知A6成立. 若有 Aα = λα , 则有 f ( A)α = f (λ )α .
1 A. A
2.若 A ≠ 0, 则A* = A A −1 . 3.若 A ≠ 0, 则( A−1 )* = ( A* ) −1 =
例如( A5 + A 2 + 3 A + 2 E )α = (λ5 + λ2 + 3λ + 2)α .
得同解方程 x1 =
1 2 x3 , x2 = − x3 . 3 3
基础解系为
ξ 3 = (1,−2,3)T
所以对应于 λ 3 = −4的全部特征向量为 k 3ξ 3 , k 3 ≠ 0.
3
定理 2.4 对 n 阶方阵 A, 只要有数 λ 0 及非零向量 α 使 A α = λ 0α 成立 , 则 λ 0必是 A 的特征值 , α 必是 A 对应 于特征值 λ 0的特征向量 .
B的特征值为
1 6 3 1 A +3 = + 3 = + 3( i = 1,2,3); 2 λi λi 2 λi
课堂练习: P124 A7, A10
9 代入 λ1 = 1λ 2 = 2, λ 3 = 3, 得B的特征值为 6, ,4. 2
A10 . 对于方阵 A, 若有正整数 k , 使 A k = O , 则称 A 为一个幂零矩阵 . 试证 : 幂零矩阵的特征值 0.
证明: λ E − A = ψ ( λ ) = λn + cn−1λn −1 + c1λ + c0 ,
由于 λ1 + λ 2 + L + λ n = − c n −1 , 及cn −1 = − ( a11 + a 22 + L + a nn) ,
特征值的估计
⎫⎛⎪⎪⎭⎝=∑∑==ni in i ii r 1212λ)/2, λ1, λ2, , λn 为;,n ;,n前节是对特征值的模长实部和虚部进行估计本第二节圆盘定理前一节是对特征值的模长、实部和虚部进行估计,本节则是对特征值的位置分布进行估计定义:设A =(a ij )∈C n ⨯n , R i =|a i 1|+ +|a i ,i -1|+|a i ,i -1|+ +|a in | , (i =1,2, ,n ), 称复平面上的圆域G i ={z ∈C| |z -a ii |≤R i |} (i =1,2, ,n )为矩阵A 的第i 个Gerschgorin 圆盘,简称盖尔圆。
定理(圆盘定理1):矩阵A ∈C n ⨯n 的n 个特征值λi (i =1,2, ,n )个盖尔圆的并集中即12n都在它的n 个盖尔圆的并集中,即λi ∈(i =1,2, ,n )。
证明:设λ为A 的任一特征值,0 ≠x =(x 1, , x j , , x n )∈C nkk G 1= 为A 的属于特征值λ的特征向量, 即Ax =λx .设0n≠0. 由于, 所以||max ||j j k x x =i j j ij x x a λ=∑=1=⇒=n nx x a x x a )/(λλ∑∑==j k j kj k j j kj 11从而knkj nk j kj kk R a x x a a =≤≤-∑∑|||/|||||λ即:λ∈G k ,从而,λ∈在n 个盖尔圆的并集之中。
kj j kj j ≠=≠=,1,1∙当a kk :是实数时,G k ,关于实轴对称。
当A 为实矩阵时,A 的盖尔圆为圆心都在实轴上的圆的并集。
定义:设矩阵A 的盖尔圆中,相交在一起的盖尔圆构成的最大连通区域称为一个连通部分;规定孤立的盖尔圆也是个连通部分一个连通部分。
G 1G 2G G 34λ1G1 G2510λ2能否做到每个盖尔圆内只有一个特征值?设D =diag(d 1,d 2, , d n ), 其中d 1,d 2, , d n 皆为正数。
小学数学特征值与特征向量的基本概念与应用课件
● * 丰富的动画和视觉效果,激发学生的学习兴趣 ● * 结合实际案例,帮助学生理解抽象概念 ● * 提供多种层次的练习题,满足不同学生的学习需求 ● * 互动性强,方便学生进行自主学习和合作学习
线性方程组的 求解
图像处理中的 图像变换
机器学习中的 数据降维
控制系统中的 稳定性分析
特征值与特征向量的数学模型建立
特征值与特征向量的定义 特征值与特征向量的计算方法 特征值与特征向量的性质 特征值与特征向量的应用实例
特征值与特征向量的数学实 验
第五章
实验目的与要求
掌握特征值与特征向量的基本概念 理解特征值与特征向量的应用场景 能够进行简单的数学实验,验证特征值与特征向量的性质 培养数学实验能力和数学思维能力
实验结果与分析
特征值与特征向量的计算结果 实验数据的分析方法与过程 实验结果与预期结果的比较 实验结论与对实际应用的启示
课件总结与展望
第六章
课件总结
课件内容概述:简 要介绍课件的主题 和主要内容,包括 特征值与特征向量 的基本概念、计算 方法和应用等。
重点与难点:强调 课件中的重点和难 点,帮助学生更好 地理解和掌握相关 知识点。
教学方法:介绍课 件采用的教学方法 ,如案例分析、实 践操作等,以及这 些方法在帮助学生 理解上的作用。
教学效果:评估课 件的教学效果,包 括学生对知识点的 掌握程度、实际应 用能力等方面的反 馈。
未来发展展望
特征值与特征向量 的理论体系将进一 步完善
特征值的估计
返回
Bx x
n t 1
n n
t 1
bit xt xi
n
( i 1,2,, n)
b it x t x i
( i 1,2,, n)
n
s ,t 1 i 1
( bit b is ) x s x t xi x i
i 1
2 i xi i 1
则A相似于对角阵.
推论 4 设n阶实阵A的n个盖尔圆盘两两互不相交,
则A特征值全为实数.
返回
D diag( p1 , p2 , , pn ) pi 0
a11 p1 p a21 1 D AD 2 p1 a n1 pn p2 a12 p1 a22 pn a1n p1 pn a2 n p2 ann
j i
定理 1 (圆盘定理1) 设A C nn ,则A的任一特征值
i S S j ( i 1, 2, , n)
j 1
返回
n
T 证: Ax x ( x ( x1 , x2 , , xn ) 0)
n
| x | max(| x |, ,| x |) 0 a x x ( i 1, 2, , n ) k 1 n ij j i
n
1 H 1 H 令 B ( A A), C ( A A) 2 2 A, B, C的特征值分别为 {1 , 2 ,, n },
{1 , 2 ,, n }, {i 1 , i 2 ,, i n }, 且满足
返回
| 1 || 2 | | n |,
Ax i x (|| x ||2 1)
( x , Ax ) ( x , i x ) i ( x, x ) i
第五章 特征值的估计与表示
* 图论法 aij 0 Pi到Pj画箭头,a ji 0 Pj 到Pi画箭头, 若强连通则 不可约,否则可约.
4 1 1 0 1 0 2 1 4 0 (不可约), C 2 1 2(可约) B . 1 0 4 1 1 0 3 0 1 1 4
T
例
考察矩阵(不可约)
b1 c1 4 1 1 0 a b c2 2 1 4 2 0 1 , , B A 1 0 4 1 an 1 bn 1 cn 1 0 1 1 4 an bn (ai , bi , ci都不为零),
解:A的盖尔圆分别为|z-10|≤8和|z|≤5,这两个
盖尔圆为连通的,因此包含两个特征值。其特征值为 都在盖尔圆 |z-10|≤8 中,而不在盖尔圆|z|≤5内。
1,2 5 i 15)
特征值的隔离
1 a11 a12 2 a21 a22 1 DAD n an1 an 2 a11 a12 1 a1n 1 2 n 2 a21 a22 a2 n 2 1 n a1n 11 1 a2 n 2 1 ann n
j 1 j i
n
(2)按行弱对角占优: | aii | | aij |, (i 1,2,, n) 上式至少有一个不等号严格成立。
j 1 j i
n
定义 设矩阵A R nn (n 2), 如果存在置换阵P使得
A11 A12 P AP , A11 , A 22为方阵, 0 A 22 ( PT AP ) PT x PT b 则称A为可约矩阵; 否则为不可约矩阵. A11 A12 y1 d1 定义 每行每列只有一个元素是1,其余 0 A y d 22 2 2 元素是零的方阵称为置换阵(或排列阵).
第5章 特征值的估计及对称矩阵的极性
1 2 n .
定理 2 设 A (aij ) C nn , A 的特征值为 k (k 1,2,n) ,则
| k | n max | aij | ,
i, j
| Re k | n max | bij | ,
i, j
| Im k | n max | cij | .
定理 8(圆盘定理 1) 设 A (aij ) C nn ,则 A 的一切 特征值都在它的 n 个盖尔圆的并集之内,即 A 的任一特征值 满足
S Si .
i 1
n
设 为 A 的特征值,其对应的特征向量为 x ( x 0) ,即 Ax x ,写成分量形式为 证明
解
A AH 0 , 设 A 的 特 征 值 为 k (k 1,2,3) , B 2
A AH C A .则由定理 2 得 2 | k | 3 max | aij | 0.6 ,
i, j
| Re k | 3 max | bij | 0 ,
i, j
| Im k | 3 max | cij | 0.6 .
A AH A AH B (bij ) , C (cij ) , 2 2 则 B 为 Hermite 矩阵, C 为反 Hermite 矩阵,且 A B C .
设 A, B, C 的特征值分别为
k , k , i k ( i 1, k 1,2,n) ,且满足 | 1 || 2 | | n | , 1 2 n ,
则有
x H Ax k x H x k .
取共轭转置得
x H AH x k ,
于是
A AH Re k xH x x H Bx , 2 2 H k k H A A i Imk x x x H Cx . 2 2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n k | aii || aik aik Ri i k 1 k 1 n k i k i
定理5.5 由矩阵A的所有盖尔圆组成的连通部分中任取一个, 如果它是由 k 个盖尔圆构成的,则在这个连通部分中有 且仅有 A 的 k 个特征值 ( 盖尔圆相重时重复计数.特征值 相同时也重复计数). 证明思路:分裂A=D+B,其中D为A的对角线元素构成的 对角矩阵,即D=diag(a11,a22,…,ann),定义矩阵
D diag(1 , 2 ,, n ) a n a n ann n2 n1 2 1 则矩阵DAD-1与A具有同样的特征值,因此有
将Ri =ji|aij|改作ri=ji(|aij|i/j) (i=l,…,n) ,则两
由引理,于是有 | ||| A || m
推论 Hermite矩阵的特征值都是实数,反Hermite矩 阵的特征值为零或纯虚数. 引理5.2:对任意实数 1 ,2 ,,n ,恒有
(k ) nk2
2 k 1 k 1 n n
A (aij ) nn R nn, C 1 ( A AT ),则A的任 定理5.2:设 2 一特征值 满足
n 1 | Im( ) | C 2n
m
1 0 .8 例:估计矩阵 A 特征值的上界。 0 .5 0
解:由定理5.1,对A特征值 ,有:| | 2, |Re()|2, |Im()|1.3,由定理5.2,知其虚部的另 一逼近为:
2 1 | Im( ) | 1.3 0.65 2 2 其特征值为: 1 (1 i 0.6) | 1, 2 | 0.632456 1,2 2
A(u)=D+uB
则其特征值变化连续依赖于参数u,详细证明请见黄廷祝 所著教材矩阵理论。
需要指出:由两个或者两个以上的盖尔圆构成的连通 部分,特征值分布不一定是平均的,即可以在其中的 某个盖尔圆中有几个特征值,而在另外一些盖尔圆中 无特征值。
10 8 例:讨论矩阵 A 的特征值的分布。 5 0
* 图论法 aij 0 Pi到Pj画箭头, a ji 0 Pj 到Pi画箭头, 若强连通则 不可约,否则可约 .
4 1 1 0 1 0 2 1 4 0 1 (不可约), C 2 1 2(可约) B . 1 0 4 1 1 0 3 0 1 1 4
ai11 ai 2 2 aiii ain n i
即 | aii || i || ai11 aii 1i 1 aii 1i 1 ain n |
i 1 i 1 n 1 | aii || ai1 aii 1 aii 1 ain | i i i i
T
例
考察矩阵(不可约)
b1 c1 4 1 1 0 a b c2 2 1 4 2 0 1 , , B A 1 0 4 1 an 1 bn 1 cn 1 0 1 1 4 an bn (ai , bi , ci都不为零),
H i 1 j 1
n n
n
n
n
n
i 1 j 1
max | aij |
1i , j n i 1 j 1
| i |2 | j |2 2
nn max | aij | 1i , j n 2
|| A ||m
1 1 n×n,B= (A+AH ), C= (A-AH ), 定理5.1:设AC 2 2
解:A的盖尔圆分别为|z-10|≤8和|z|≤5,这两个
盖尔圆为连通的,因此包含两个特征值。其特征值为
1,2 5 i 15)
都在盖尔圆 |z-10|≤8 中,而不在盖尔圆|z|≤5内。
特征值的隔离
1 a11 a12 2 a21 a22 1 DAD n an1 an 2 a11 a12 1 a1n 1 2 n 2 a21 a22 a2 n 2 1 n a1n 11 1 a2 n 2 1 ann n
1 0 2 1 2 3 2 1 2 交换行 1 0 1 2, 2 2 C 1, , 列 1 0 3 0 1 3
5.2 特征值的包含区域
定义5.1 设A=(aij)Cn×n,记 Ri=ji|aij| (i=l,…,n) , 称区域 Gi: |z-aii|Ri 为矩阵A的第i个盖尔圆,其中 Ri称为盖尔圆Gi的半径(i=l,…,n) 。 定理5.4 矩阵A=(aij)C n×n的所有特征值都在它的n个 盖尔圆的并集之内。 T 证明:设λ为其特征值, (1 , 2 ,, n ) 为对应特征 向量,且 i 为其绝对值最大者,则有
则A的任一特征值 满足
(1) ||||A||m
(2) 设A属于的单位特征向量为y,则有Ay= y,即
yHAy= yHy=,因此
H y H AH y
1 1 H | Re( ) | y ( A AH ) y y H By B m 2 2 1 1 H H H | Im( ) | y ( A A ) y y Cy C m 2 2
例: 隔离矩阵A=
的特征值.
• A的3个盖尔圆为G1: |z-20|5.8,G2: |z-10|5,G3: |z10j|3。G1与G2相交;而G3孤立,其中恰好有A的一个 特征值,记作3 (见左图).选取D=diag(1,1,2),则 B=DAD-1的三个盖尔圆为G1’: |z-20|5.4,G2’: |z-10| 4.5,G3’: |z-10j|6。易见,这是3个孤立的盖尔圆,每 个盖尔圆中恰好有B的(也是A的)一个特征值(见右图).
j 1 j i
n
(2)按行弱对角占优: | aii | | aij |, (i 1,2,, n) 上式至少有一个不等号严格成立。
j 1 j i
n
定义 设矩阵A R nn (n 2), 如果存在置换阵P使得
A11 A12 P AP , A11 , A 22为方阵, 0 A 22 ( PT AP) PT x PT b 则称A为可约矩阵; 否则为不可约矩阵. A11 A12 y1 d1 定义 每行每列只有一个元素是1,其余 0 A y d 22 2 2 元素是零的方阵称为置换阵(或排列阵).
个盖尔圆定理仍然成立,其中i 都是正数。
隔离矩阵特征值原则
• 结合使用A的n个行盖尔圆和n个列盖尔圆。
• 选取正对角矩阵D,使得B=DAD-1 ,适当选取D,有 可能使B的每一个盖尔圆包含A的一个特征值。欲使 A的第i个盖尔圆Gi的半径变大(或小)些,就取i>1( 或i<1).而取其它正数=1。此时,B的其余盖尔圆 的半径相对变小(或变大). • 但是,这种隔离矩阵特征值的办法还不能用于任意 的具有互异特征值的矩阵.比如主对角线上有相同 元素的矩阵.
第5章 特征值的估计与表示
5.1 特征值界的估计
引理5.1:设ACn×n,yCn为单位列向量,则
| y H Ay ||| A ||m n max | aij |
1 i , j n
y 证明:设A=(aij) n×n, (1 , 2 ,, n ) ,则
T
| y Ay || aiji j | aij i j
| Re(1, 2 ) | 0.5
| Im(1,2 ) | 0.387298
定理(Schur不等式):设A=(aij)Cn×n 的特征值为
1 , 2 ,, n ,则 1 2 n A F 且等号成立的充要条件是A为正规矩阵。
2 2 2 2
定义(1)按行严格对角占优:| aii | | aij |, (i 1,2,, n)