第5章 特征值的估计

合集下载

矩阵特征值的估计

矩阵特征值的估计


A
m∞
= n max aij = 3 × 2 = 6,
1≤i , j ≤ n
1 A + AH 2 1 A − AH 2
m∞
m∞
1 0 m = 0, = ∞ 2 1 1 H = A− A = 2A m∞ 2 2
m∞
6, =
由定理2知, λ ≤ 6,Re λ = 0,Im λ ≤ 6.
由此可知,A的特征值为0或纯虚数.
= i 1= j 1

∑∑ a η η
ij i
n
n
j
≤ ∑∑ aij ηi η j
= i 1= j 1
n
n
≤ max aij
1≤i , j ≤ n
= i 1= j 1
∑∑ η
n
n
i
ηj
n n 1 2 ≤ max aij ∑∑ ηi + η j 2 1≤i , j ≤ n = i 1= j 1
(
2
)
G′j = z ∈ C z − a jj ≤ R′j 为A的第j个列盖尔圆.
{
} ( j =1, 2, , n )
0.02 0.11 1 0.14 如A = 0.01 i 0.02 0.01 0.5 的三个盖尔圆为: G1 = G2 G3
i
R2 = 0.15
于是 AF =
n 2 = i 1 2
R F tr ( R H R ) =
2 1≤i < j ≤ n = i 1
= ∑ λi +

rij ≥ ∑ λi .
2 2
n
§5.2 矩阵特征值的分布区域
一、圆盘定理 1. Gerschgorin圆(盖尔圆) 定义1

【学习】线性代数学习指导第五章矩阵的特征值与特征向量

【学习】线性代数学习指导第五章矩阵的特征值与特征向量

【关键字】学习第五章矩阵的特征值与特征向量一.内容提要1 . 特征值和特征向量定义1 设是数域P上的n阶矩阵,若对于数域P中的数,存在数域P上的非零n维列向量X,使得则称为矩阵A的特征值,称X为矩阵A属于(或对应于)特征值的特征向量注意:1)是方阵;2)特征向量X 是非零列向量;3)方阵与特征值对应的特征向量不唯一4)一个特征向量只能属于一个特征值.2.特征值和特征向量的计算计算矩阵A的特征值与特征向量的步骤为:(1)计算n阶矩阵A的特征多项式|E-A|;(2)求出特征方程|E-A|=0的全部根,它们就是矩阵A的全部特征值;(3)设1 ,2 ,… ,s 是A的全部互异特征值。

对于每一个i,解齐次线性方程组0,求出它的一个根底解系,该根底解系的向量就是A属于特征值i的线性无关的特征向量,方程组的全体非零解向量就是A属于特征值i的全体特征向量.3.特征值和特征向量的性质性质1 (1)若X是矩阵A属于特征值的特征向量,则kX()也是A属于的特征向量;(2)若是矩阵A属于特征值的特征向量,则它们的非零线性组合也是A属于的特征向量;(3)若A是可逆矩阵,是A的一个特征值,则是A—1的一个特征值,是A*的一个特征值;(4)设是n阶矩阵A的一个特征值,f(x)= amxm + am-1xm-1 + … + a1x + a0为一个多项式,则是f(A)的一个特征值。

性质2(1)(2)性质3 n阶矩阵A和它的转置矩阵有相同的特征值性质4 n阶矩阵A 不同的特征值所对应的特征向量线性无关4. 相似矩阵定义2 设A、B为n阶矩阵,若存在可逆矩阵P,使得B=P―1AP则称A与B相似。

记作A∽B. 并称P为相似变换矩阵.矩阵的相似关系是等价关系,满足:1°反身性:A∽A.2°对称性:若A∽B,则B∽A.3°传递性:若A∽B,B∽C则A∽C.5.矩阵相似的性质:设A、B为n阶矩阵,若A∽B,则(1) ; (2) ;(3)A 、B 有相同的迹和特征多项式,相同的特征值;(4) A ,B 或者都可逆或者都不可逆. 当A ,B 都可逆时,∽;(5)设f (x )= amxm + am-1xm-1 + … + a1x + a0 为一个多项式,则 f (A )∽ f (B ) ; 6.n 阶矩阵A 相似对角化的条件(1)n 阶矩阵A 与对角矩阵Λ相似的充分必要条件是A 有n 个线性无关的特征向量. (2)n 阶矩阵A 与对角阵相似的充要条件是A 的每个k 重特征值恰好对应有k 个线性无关的特征向量.注(1)与单位矩阵相似的 n 阶矩阵只有单位阵 E 本身,与数量矩阵 kE 相似的 n 阶方阵只有数量矩阵 kE 本身(2)有相同特征多项式的矩阵不一定相似。

第五章 特征值问题

第五章 特征值问题

0 0 1 λ 得 A 的三个特征值为 λ = 5, λ = λ = 1. 1 2 3
公共数学教研室李继根
当 λ 1 = 5 时,解方程组 ( A λ 1 I ) x = 0 ,由
4 2 2 2 4 2 A λ1 I = 2 2 4
解得
0 6 6 2 4 2 0 0 0
公共数学教研室李继根
例3 求对称矩阵 A 的特征对,其中 的特征对,
解: 由 A λ I = 0 ,即
1 λ A λI = 2 2 2 2
1 2 2 2 1 2 . A= 2 2 1 1 2 2
1 λ 2 = (5 λ ) 1 1 λ 2 2 1 λ 1 2 1 λ 1 2 2 = (5 λ )(1 + λ ) 2 = 0 0 = (5 λ ) 0 1 λ
x
公共数学教研室李继根
定义1 定义1
阶方阵, A 是 n 阶方阵,如果存在 n 维非零列
向量 x 及数
λ (实数或复数),使 实数或复数), ),使
Ax = λ x
(I )
特征值(eigenvalue), ),称非 λ 为 A 的特征值(eigenvalue),称非 特征向量(eigenvector) 零向量 x 为 A 的属于 λ 的特征向量(eigenvector), 特征对(eigenpair) 或简洁地称 (λ , x ) 为 A 的特征对(eigenpair). 则称数
公共数学教研室李继根
一,特征值与特征向量的概念
第一章曾经提到, 第一章曾经提到,按"变换"的观点,线性方程 变换"的观点, 组 可理解为
y = Ax . A x y = Ax . →
x
显然"变换" 越特殊, 显然"变换"或"算子" A 越特殊, y 与 算子" 的关 系越简单.但反之则未必. 系越简单.但反之则未必.两向量平行显然是一种 简单关系, 倍数关系 关系. 简单关系,此时 y 与 成倍数关系.如果对某些 原像,变换后的像也具有这样的结果,自然极佳. 原像,变换后的像也具有这样的结果,自然极佳.

第5章特征值估计与广义逆矩阵

第5章特征值估计与广义逆矩阵

2
F
B
2 F
n2 max i, j
| bij
|2 ,
i j
n | tii t ii |2
i1
2
n | tij |2 2 i, j1
T TH 2
2
F
C
2 F
n2 max i, j
| cij
|2 ,
i j
所以有
|
Re k
|2
n2
max | i, j
bij
|2

|
Imk
|2
n2
max | i, j
i 1
i j
i , j1
i , j 1
所以得到
n
n
| i |2
T
2 F
A2 F
| aii |2 .
i 1
i , j 1
由式(5-2)知结论中等号成立当且仅当
(5-3)
| tij |2 0 .
i j
即 T 为对角阵,因此结论中等号成立当且仅当 A 酉相似于对角形矩阵, 也就是 A 为正规矩阵(定理 2-8). 证毕.
5.1 特征值的界的估计
下面给出一些利用矩阵元素直接估计矩阵特征值上下界的方法,
为便于表达,对于 A (aij ) C nn ,记矩阵
B (bij )
A AH 2
, bij
aij
a ji 2
C
(cij )
A AH 2
, cij
aij
a ji 2
则 B 为 Hermite矩阵, C 为反 Hermite矩阵,且 A B C .
例 已知矩阵
3 i 2 3i 2i
A 1

线性代数 第5章 特征值

线性代数  第5章 特征值

n , 则有
(1) 1 2 n a11 a22 ann ;
( 2) 12 n A .

i 1 i 1
n
2
n a11 a22 ann aii
i 1
n
tr ( A)称为A的迹.
4
3 1 . 例1 求A 的特征值和特征向量 1 3 解 A的特征多项式为 3 1 2 (3 ) 1 1 3 8 6 2 (4 )( 2 )
k 2 p2 k 3 p3
( k 2 , k 3 不同时为 ). 0
12
例4 证明:若 是矩阵A的特征值,x 是A的属于 的特征向量,则 (1) m是Am的特征值m是任意常数.
(2) 当A可逆时, 1是A1的特征值.
证明
1 Ax x A 2 x 2 x A Ax Ax Ax x
(1) 由 A E 2 2
m 2 次,就得 Am x m x 再继续施行上述步骤
故 m 是矩阵Am的特征值, 且 x 是 Am 对应于m的特 征向量.
13
2 当A可逆时, 0,
1
由Ax x可得 A 1 x 1 x
Ax A1 x A1 x A
的特征向量.
3. 对于特征值 i , 求齐次方程组
A i E x 0
的非零解, 就是对应于 i的特征向量.
18
5.2 方阵的相似变换 一、相似矩阵与相似变换的概念
定义1 设A, B都是n阶矩阵, 若有可逆矩阵P , 使 P AP B , 则称B是A的相似矩阵, 或说矩阵A与B相似.对A进 行运算 P 1 AP称为对A进行相似变换, 可逆矩阵P 称为把A变成B的相似变换矩阵 .

完整版线性代数第五章特征值与特征向量自考经管类精品

完整版线性代数第五章特征值与特征向量自考经管类精品

完整版线性代数第五章特征值与特征向量自考经管类精

特征值和特征向量是线性代数中非常重要的概念,它们在很多实际问题中具有广泛的应用。

本文将从定义、性质、求解方法以及应用等几个方面介绍特征值和特征向量。

特征值(eigenvalue)是一个方阵在一些线性变换下的伸缩因子,而特征向量(eigenvector)则是特征值对应的非零向量。

对于一个给定的方阵A,如果存在一个非零向量x,使得Ax=λx,其中λ是一个标量,那么λ就是矩阵A的特征值,而x就是对应的特征向量。

特征值和特征向量具有以下几个重要性质:
1.特征值是矩阵的本质性质,不依赖于矩阵的表示方式。

2.每个特征值都有对应的特征向量,但一个特征向量可能对应多个特征值。

3.特征值和特征向量可以是复数,不一定是实数。

要求解特征值和特征向量,可以通过以下步骤进行:
1. 求解矩阵的特征方程:det(A-λI)=0,其中det表示矩阵的行列式,I是单位矩阵。

2.解特征方程得到特征值。

3.将特征值代回到特征方程,解得对应的特征向量。

特征值和特征向量在很多应用中具有重要的意义,如以下几个方面:
1.特征值和特征向量可以用于矩阵的对角化,简化复杂计算。

2.特征值和特征向量在数据降维中有广泛应用,如主成分分析(PCA)。

3.特征值和特征向量可用于解决线性方程组、求解线性变换等问题。

4.特征值和特征向量在机器学习算法中有很多应用,如图像处理、聚类算法等。

综上所述,特征值和特征向量是线性代数中的重要概念,具有广泛的应用。

掌握特征值和特征向量的求解方法和性质,有助于理解和应用线性代数的相关知识。

第五章矩阵特征值问题同步复习

第五章矩阵特征值问题同步复习

第五章矩阵特征值问题同步复习第五章矩阵特征值问题一、内容提要§5.1 特征值与特征向量1.定义设A 为阶方阵,如果存在数n λ以及一个非零n 维列向量ξ,使得关系式λξξ=A 成立,则称λ为A 的一个特征值,非零向量ξ为A 的属于特征值λ的特征向量。

2.求特征值和特征向量的步骤:(1)计算特征多项式A I -λ;(2)求A 的特征方程A I -λ=0的全部根,它们就是A 的所有特征值;(3)对于A 的每一个特征值λ,求解齐次线性方程组()0=。

设它的一个-X A I λ基础解系为,,,,21r n -ξξξ (其中)(A I r r -=λ),则A 的属于λ的全部特征向量为,2211r n r n k k k --+++ξξξ其中是不全为零的任意数。

r n -21k k k ,,,3.性质● 方阵A 与其转置矩阵T A 有相同的特征多项式,从而有相同的特征值;● )(21A tr n =+++λλλ , A n =λλλ 21;● 可逆矩阵A 与1-A 的特征值互为倒数;● 设λ是矩阵A 的特征值,)(x g 是一个多项式,则)(λg 是)(A g 的特征值;● 如果n 阶矩阵A 有n 个不同的特征值,则A 有n 个线性无关的特征向量;● 设s λλλ,,,21 是矩阵A 的s 个互不相同的特征值,而i in i i ααα,,,21 是A 的分别对应于特征值i λ的线性无关的特征向量组,则向量组111211,,,n ααα ; 222221,,,n ααα ; ...; ssn s s ααα,,,21 线性无关.§5.2 矩阵的相似性1.定义设A ,都是阶方阵,如果阶可逆矩阵B n P ,使B AP P =-1,则称矩阵A 与相似,记为B B A ~。

如果P 为正交矩阵,则称A 与B 正交相似。

2.命题相似矩阵有相同的特征多项式,从而有相同的特征值,相同的行列式和迹。

3.对角化的条件(1)充要条件:n 阶方阵A 可对角化的充分必要条件是A 有n 个线性无关的特征向量。

第五章矩阵特征值计算

第五章矩阵特征值计算

第五章矩阵特征值计算与线性方程组的求解问题一样,矩阵特征值与特征向量的计算也是数值线性代数的重要内容. 在理论上,矩阵的特征值是特征多项式方程的根,因此特征值的计算可转化为单个多项式方程的求解. 然而对于高阶矩阵,这种转化并不能使问题得到简化,而且在实际应用中还会引入严重的数值误差. 因此,正如第二章指出的,我们一般将多项式方程求解转化为矩阵特征值计算问题,而不是反过来.本章介绍有关矩阵特征值计算问题的基本理论和算法. 与非线性方程求根问题类似,计算矩阵特征值的算法也是迭代方法①.5.1基本概念与特征值分布本节先介绍矩阵特征值、特征向量的基本概念和性质,然后讨论对特征值分布范围的简单估计方法.5.1.1基本概念与性质定义5.1:矩阵A=(a kj)∈ℂn×n,(1) 称φ(λ)=det(λI−A)=λn+c1λn−1+⋯+c n−1λ+c n为A的特征多项式(characteristic polynomial);n次代数方程φ(λ)=0为A的特征方程(characteristic equation),它的n个根:λ1,⋯,λn,被称为A的特征值(eigenvalue). 此外,常用λ(A)表示A的全体特征值的集合,也称为特征值谱(spectrum of eigenvalue).(2) 对于矩阵A的一个给定特征值λ,相应的齐次线性方程组(λI−A)x=0 , (5.1)有非零解(因为系数矩阵奇异),其解向量x称为矩阵A对应于λ的特征向量(eigenvector).根据方程(5.1),我们得出矩阵特征值与特征向量的关系,即Ax=λx .(5.2)第三章的定义3.5就利用公式(5.2)对矩阵特征值和特征向量进行了定义,它与定义5.1是等价的. 另外,同一个特征值对应的特征向量一定不唯一,它们构成线性子空间,称为特征子空间(eigenspace).我们一般讨论实矩阵的特征值问题. 应注意,实矩阵的特征值和特征向量不一定是实数和实向量,但实特征值一定对应于实特征向量(方程(5.1)的解),而一般的复特征值对应的特征向量一定不是实向量. 此外,若特征值不是实数, 则其复共轭也一定是特征值(由于特征方程为实系数方程). 定理3.3表明,实对称矩阵A∈ℝn×n的特征值均为实数,存在n个线性无关、且正交的实特征向量,即存在由特征值组成的对角阵Λ和特征向量组成的正交阵Q,使得:A=QΛQ T.(5.3)例5.1(弹簧-质点系统):考虑图5-1的弹簧-质点系统,其中包括三个质量分别为m1、m2、m3的物体,由三个弹性系数分别为k1,k2,k3的弹簧相连,三个物体的位置均为时间的函数,①如果用有限次运算能求得一般矩阵的特征值,则多项式方程求根问题也可用有限次运算解决,这与阿贝尔证明的“高于4次的多项式并不都有用初等运算表示的求根公式”的理论矛盾.这里考查三个物体偏离平衡位置的位移,分别记为y 1(t), y 2(t), y 3(t). 因为物体在平衡状态所受的重力已经和弹簧伸长的弹力平衡,所以物体的加速度只和偏离平衡位置引起的弹簧伸长相关. 根据牛顿第二定律以及胡克定律(即弹簧的弹力与拉伸长度成正比)可列出如下微分方程组②: My ′′(t)+Ky(t)=0 ,其中y (t )=[y 1(t)y 2(t)y 3(t)]T ,M =[m 1000m 2000m 3],K =[k 1+k 2−k 20−k 2k 2+k 3−k 30−k 3k 3] . 在一般情况下,这个系统会以自然频率ω做谐波振动,而y 的通解包含如下的分量: y j (t )=x j e iωt ,(j =1,2,3)其中i =√−1,根据它可求解出振动的频率ω及振幅x j . 由这个式子可得出:y j ′′(t )=−ω2x j e iωt ,(j =1,2,3)代入微分方程,可得代数方程:−ω2Mx +Kx =0,或Ax =λx ,其中A =M −1K ,λ=ω2. 通过求解矩阵A 的特征值便可求出这个弹簧-质点系统的自然频率(有多个). 再结合初始条件可确定这三个位移函数,它们可能按某个自然频率振动(简正振动),也可能是若干个简正振动的线性叠加.例5.2(根据定义计算特征值、特征向量):求矩阵A =[5−1−131−14−21]的特征值和特征向量.[解]: 矩阵A 的特征方程为:det (λI −A )=|λ−511−3λ−11−42λ−1|=(λ−3)(λ−2)2=0故A 的特征值为λ1=3,λ2=2(二重特征值).当λ=λ1=3时,由(λI −A)x =0,得到方程[−211−321−422][x 1x 2x 3]=[000]它有无穷多个解,若假设x 1=1, 则求出解为x =[1,1,1]T ,记为x 1,则x 1是λ1对应的一个特征向量.当λ=λ2=2时,由(λI −A)x =0,得到方程[−311−311−421][x 1x 2x 3]=[000]它有无穷多个解,若假设x 1=1, 则求出解为x =[1,1,2]T ,记为x 2,则x 2是λ2对应的一个特② 本书第八章将介绍这种常微分方程组的数值求解方法.图5-1 弹簧-质点系统.征向量.下面概括地介绍有关矩阵特征值、特征向量的一些性质,它们可根据定义5.1,以及公式(5.2)加以证明.定理5.1:设λj (j =1,2,…,n)为n 阶矩阵A 的特征值,则(1) ∑λj n j=1=∑a jj n j=1=tr(A) ;(2) ∏λj n j=1=det(A) .这里tr(A)表示矩阵对角线上元素之和,称为矩阵的迹(trace ).从上述结论(2)也可以看出,非奇异矩阵特征值均不为0, 而0一定是奇异矩阵的特征值. 定理5.2:矩阵转置不改变特征值,即λ(A )=λ(A T ).定理5.3:若矩阵A 为对角阵或上(下)三角阵,则其对角线元素即为矩阵的特征值.定理5.4:若矩阵A 为分块对角阵,或分块上(下)三角阵,例如A =[A 11A 12⋯A 1m A 22⋯A 2m ⋱⋮A mm] , 其中每个对角块A jj 均为方阵,则矩阵A 的特征值为各对角块矩阵特征值的合并,即λ(A )=⋃λ(A jj )m j=1.定理5.5:矩阵的相似变换(similarity transformation)不改变特征值. 设矩阵A 和B 为相似矩阵,即存在非奇异矩阵X 使得B =X −1AX ,则(1) 矩阵A 和B 的特征值相等,即 λ(A )=λ(B ) ;(2) 若y 为B 的特征向量,则相应地,Xy 为A 的特征向量.通过相似变换并不总能把矩阵转化为对角阵,或者说矩阵A 并不总是可对角化的(diagonalizable). 下面给出特征值的代数重数、几何重数,和亏损矩阵的概念,以及几个定理..定义5.2: 设矩阵A ∈ℝn×n 有m 个(m n )不同的特征值λ̃1,⋯,λ̃m ,若λ̃j 是特征方程的n j 重根,则称n j 为λ̃j 的代数重数(algebraic multiplicity),并称λ̃j 的特征子空间(ℂn 的子空间)的维数为λ̃j 的几何重数(geometric multiplicity). 定理5.6:设矩阵A ∈ℝn×n 的m 个不同的特征值为λ̃1,⋯,λ̃m ,特征值λ̃j ,(j =1,⋯,m)的代数重数为n j ,几何重数为k j ,则(1) ∑n j m j=1=n ,且任一个特征值的几何重数不大于代数重数,即∀j ,n j ≥k j .(2) 不同特征值的特征向量线性无关,并且将所有特征子空间的∑k j m j=1个基(特征向量)放在一起,它们构成一组线性无关向量.(3) 若每个特征值的代数重数等于几何重数,则总共可得n 个线性无关的特征向量,它们是全空间ℂn 的基.定义5.3:若矩阵A ∈ℝn×n 的某个代数重数为k 的特征值对应的线性无关特征向量数目少于k (即几何重数小于代数重数),则称A 为亏损阵(defective matrix ),否则称其为非亏损阵(nondefective matrix ).定理5.7:设矩阵A ∈ℝn×n 可对角化,即存在非奇异矩阵X ∈ℂn×n 使得X −1AX =Λ,其中Λ∈ℂn×n 为对角阵, 的充要条件是A 为非亏损矩阵. 此时,Λ的对角线元素为矩阵A 的特征值,而矩阵X 的列向量为n 个线性无关的特征向量.定理5.7中方程的等价形式为A =XΛX −1, 它被称为特征值分解,也叫谱分解(spectrum decomposition). 特征值分解存在的充要条件是A 为非亏损矩阵. 但现实中还有很多矩阵是亏损矩阵,例如例5.2中的矩阵,它的特征值2的代数重数为2,而几何重数仅为1. 这种矩阵不能相似变换为对角阵,但存在下面的若当分解(Jordan decomposition).定理5.8:设矩阵A ∈ℝn×n , 存在非奇异矩阵X ∈ℂn×n 使得A =XJX −1,矩阵J 为形如[J 1⋱J p ]的分块对角阵(称为若当标准型),其中J k =[ λk 1λk ⋱⋱1λk ] 称为若当块,其对角线元素为矩阵A 的特征值. 设矩阵A 有m 个不同的特征值为λ̃1,⋯,λ̃m ,特征值λ̃j ,(j =1,⋯,m)的代数重数为n j ,几何重数为k j ,则p =∑k j m j=1, λ̃j 对应于k j 个若当块, 其阶数之和等于n j .在若当分解中,如果所有若当块都是1阶的,则J 为对角阵,这种分解就是特征值分解,相应的矩阵为非亏损阵. 若当分解是很有用的理论工具,利用它还可证明下面关于矩阵运算结果的特征值的定理.定理5.9:设λj (j =1,2,…,n)为n 阶矩阵A 的特征值,则(1) 矩阵cA, c 为常数, 的特征值为cλ1,cλ2,⋯,cλn .(2) 矩阵A +pI, p 为常数, 的特征值为λ1+p,λ2+p,⋯,λn +p.(3) 矩阵A k , k 为正整数, 的特征值为λ1k ,λ2k ,⋯,λn k .(4) 设p (t )为一多项式函数,则矩阵p (A )的特征值为p (λ1),p (λ2),⋯ ,p (λn ) .(5) 若A 为非奇异矩阵,则λj ≠0,(j =1,2,…,n), 且矩阵A −1的特征值为λ1−1,λ2−1,⋯,λn −1.5.1.2特征值分布范围的估计估计特征值的分布范围或它们的界,无论在理论上或实际应用上,都有重要意义. 比如,本书前面的内容曾涉及两个问题:(1). 计算矩阵的2-条件数:cond (A )2=√λmax (A T A)λmin (A T A) ;(2). 考察一阶定常迭代法x (k+1)=Bx (k)+f 的收敛性、收敛速度:收敛的判据是谱半径ρ(B)=max 1≤j≤n |λj (B)|<1 ; 收敛速度为R =−log 10ρ(B) .其中都需要对矩阵特征值分布范围的了解.上一章的定理4.4说明谱半径的大小不超过任何一种算子范数,即ρ(A )≤‖A ‖ ,这是关于特征值的上界的一个重要结论.下面先给出定义5.4,再介绍有关特征值的界的另一个重要结论.定义5.4:设A =(a kj )∈ℂn×n ,记r k =∑|a kj |n j=1j≠k ,(k =1,⋯,n),则集合D k ={z||z −a kk |≤r k ,z ∈ℂ},(k =1,⋯,n)在复平面为以a kk 为圆心、r k 为半径的圆盘,称为A 的Gerschgorin (格什戈林)圆盘.图5-2显示了一个3⨯3复矩阵的格什戈林圆盘.定理5.10 (圆盘定理):设A =(a kj )∈ℂn×n ,则:(1) A 的每一个特征值必属于A 的格什戈林圆盘之中,即对任一特征值λ必定存在k,1≤k ≤n ,使得:|λ−a kk |≤∑|a kj |nj=1j≠k .(5.4)图5-2 复坐标平面,以及3⨯3矩阵A 的格什戈林圆盘.用集合的关系来说明,这意味着λ(A)⊆⋃D k n k=1.(2) 若A 的格什戈林圆盘中有m 个组成一连通并集S ,且S 与余下的n −m 个圆盘分离,则S内恰好包含A 的m 个特征值(重特征值按重数计).对图5-2所示的例子,定理5.10的第(2)个结论的含义是:D 1中只包含一个特征值,而另外两个特征值在D 2,D 3的并集中. 下面对定理5.10的结论(1)进行证明,结论(2)的证明超出了本书的范围.[证明]: 设λ为A 的任一特征值,则有Ax =λx ,x 为非零向量. 设x 中第k 个分量最大,即|x k |=max 1≤j≤n|x j |>0 , 考虑方程(5.2)中第k 个方程:∑a kj x j nj=1=λx k , 将其中与x k 有关的项移到等号左边,其余到右边,再两边取模得:|λ−a kk ||x k |=|∑a kj x j n j=1j≠k |≤∑|a kj ||x j |n j=1j≠k ≤|x k |∑|a kj |nj=1j≠k .(5.5)最后一个不等式的推导利用了“x 中第k 个分量最大”的假设. 将不等式(5.5)除以|x k |,即得到(5.4)式,因此证明了定理 5.10的结论(1). 上述证明过程还说明,若某个特征向量的第k 个分量的模最大,则相应的特征值必定属于第k 个圆盘中.根据定理5.2,还可以按照矩阵的每一列元素定义n 个圆盘,对于它们定理5.10仍然成立. 下面的定理是圆盘定理的重要推论,其证明留给感兴趣的读者.定理5.11:设A ∈ℝn×n ,且A 的对角元均大于0,则(1) 若A 严格对角占优,则A 的特征值的实部都大于0.(2) 若A 为对角占优的对称矩阵,则A 一定是对称半正定矩阵,若同时A 非奇异,则A 为对称正定矩阵.例5.3 (圆盘定理的应用):试估计矩阵A =[41010−111−4]的特征值范围.[解]: 直接应用圆盘定理,该矩阵的三个圆盘如下:D 1: |λ−4|≤1, D 2: |λ|≤2, D 3: |λ+4|≤2.D 1与其他圆盘分离,则它仅含一个特征值,且必定为实数(若为虚数则其共轭也是特征值,这与D 1仅含一个特征值矛盾). 所以对矩阵特征值的范围的估计是:3≤λ1≤5,λ2,λ3∈D 2∪D 3 .再对矩阵A T 应用圆盘定理,则可以进一步优化上述结果. 矩阵A T 对应的三个圆盘为: D ’1: |λ−4|≤2, D ’2: |λ|≤2, D ’3: |λ+4|≤1.这说明D ’3中存在一个特征值,且为实数,它属于区间[-5, -3],经过综合分析可知三个特征值均为实数,它们的范围是:λ1∈[3,5],λ2∈[−2,2],λ3∈[−5,−3].事实上,使用Matlab 的eig 命令可求出矩阵A 的特征值为:4.2030, -0.4429, -3.7601.根据定理5.5,还可以对矩阵A 做简单的相似变换,例如取X 为对角阵,然后再应用圆盘定理估计特征值的范围.例5.4 (特征值范围的估计):选取适当的矩阵X ,应用定理5.5和5.10估计例5.3中矩阵的特征值范围.[解]: 取X−1=[100010000.9] , 则A 1=X −1AX =[41010−109⁄0.90.9−4]的特征值与A 的相同. 对A 1应用圆盘定理,得到三个分离的圆盘,它们分别包含一个实特征值,由此得到特征值的范围估计:λ1∈[3,5],λ2∈[−199,199],λ3∈[−5.8,−2.2]. 此外,还可进一步估计ρ(A)的范围,即3≤ρ(A)≤5.8 .上述例子表明,综合运用圆盘定理和矩阵特征值的性质(如定理5.2, 定理5.5),可对特征值的范围进行一定的估计. 对具体例子,可适当设置相似变换矩阵,尽可能让圆盘相互分离,从而提高估计的有效性.5.2幂法与反幂法幂法是一种计算矩阵最大的特征值及其对应特征向量的方法. 本节介绍幂法、反幂法以及加快幂法迭代收敛的技术.5.2.1幂法定义5.5:在矩阵A 的特征值中,模最大的特征值称为主特征值,也叫“第一特征值”,它对应的特征向量称为主特征向量.应注意的是,主特征值有可能不唯一,因为模相同的复数可以有很多. 例如模为5的特征值可能是5,−5,3+4i,3−4i , 等等. 另外,请注意谱半径和主特征值的区别.如果矩阵A 有唯一的主特征值,则一般通过幂法能方便地计算出主特征值及其对应的特征向量. 对于实矩阵,这个唯一的主特征值显然是实数,但不排除它是重特征值的情况. 幂法(power iteration)的计算过程是,首先任取一非零向量v 0∈ℝn ,再进行迭代计算:v k =Av k−1,(k =1,2,⋯)得到向量序列{v k },根据它即可求出主特征与特征向量. 下面用定理来说明.定理5.12: 设A ∈ℝn×n ,其主特征值唯一,记为λ1,且λ1的几何重数等于代数重数,则对于非零向量v 0∈ℝn ,v 0不与主特征值对应的特征向量正交,按迭代公式进行计算:v k =Av k−1,(k =1,2,⋯),存在如下极限等式:lim k→∞v k λ1k =x 1 , (5.6) lim k→∞(v k+1)j (v k )j =λ1 , (5.7)其中x 1为主特征向量,(v k )j 表示向量v k 的第j 个分量(k =1,2,⋯).[证明]: 为了推导简便,不妨设主特征值λ1不是重特征值,并且假设矩阵A 为非亏损矩阵. 设A 的n 个特征值按模从大到小排列为: |λ1|>|λ2|≥⋯≥|λn |,它们对应于一组线性无关的单位特征向量x ̂1,⋯,x ̂n . 向量v 0可写成这些特征向量的线性组合:v 0=α1x̂1+⋯+αn x ̂n 根据已知条件,α1≠0,则v k =Av k−1=A k v 0=α1λ1k x ̂1+α2λ2k x̂2+⋯+αn λn k x ̂n =λ1k [α1x ̂1+∑αj (λj λ1)kx ̂j n j=2] =λ1k (α1x̂1+εk ) 其中εk =∑αj (λj λ1)k x ̂j n j=2. 由于|λj λ1|<1,(j =2,…,n), 则 lim k→∞εk =0 ⟹lim k→∞v kλ1k =α1x̂1 . 由于特征向量放大、缩小任意倍数后仍是特征向量,设x 1=α1x̂1,则它是主特征对应的一个特征向量. 上式说明,随k 的增大, v k 越来越趋近于主特征值的对应的特征向量.设j 为1到n 之间的整数,且(v k )j ≠0,则(v k+1)j (v k )j =λ1(α1x ̂1+εk+1)j (α1x̂1+εk )j 由于lim k→∞εk =0,随k 的增大上式等号右边趋于一个常数: λ1. 这就证明了定理的结论.若矩阵A 为亏损矩阵,可利用矩阵的若当分解证明这个定理,这里略去. 在这种情况下,“主特征值的几何重数等于代数重数”这一条件很重要,例如,若A =[310030001] ,它的主特征值为3,但其几何重数为1,不满足条件. 对这个矩阵A 进行实验显示无法用幂法求出主特征值.关于定理5.12,再说明几点:● 当主特征值λ1为重特征值时,应要求其几何重数等于代数重数,此时特征子空间维数大于1,向量序列{v k λ1k ⁄}的收敛值是其特征子空间中的某一个基向量.● 公式(5.7)式的含义是相邻迭代向量分量的比值收敛到主特征值. 因此在实际计算时,可任意取j 的值,只需保证比值的分母不为零.● 证明中假设了α1≠0,在实际应用中往往随机选取v 0,由于存在舍入误差,它一般都能满足. 感兴趣的读者也可思考一下,若初始向量v 0恰好与主特征向量都正交,那么幂法中的迭代向量序列会有什么结果?直接使用幂法,还存在如下两方面问题:(1) 溢出:由于v k ≈λ1k x 1,则|λ1|>1时,实际计算v k 会出现上溢出(当k 很大时);|λ1|<1时,实际计算v k 会出现下溢出(当k 很大时).(2) 可能收敛速度很慢. 由于εk =∑αj (λj λ1)kx j n j=2, εk →0的速度取决于求和式中衰减最慢的因子|λ2λ1|,当|λ2λ1|≈1时,收敛很慢. 由此导致v k →λ1k α1x 1, (v k+1)j (v k )j →λ1的收敛速度都将很慢,严重影响计算的效率.下面采用规格化向量的技术防止溢出,导出实用的幂法. 关于加速收敛技术的讨论,见下一小节.定义 5.6:记max ̅̅̅̅̅̅(v )为向量v ∈ℝn 的绝对值最大的分量, max ̅̅̅̅̅̅(v )=v j ,其中j 满足|v j |=max 1≤k≤n |v k |, 若j 的值不唯一,则取最小的那个. 并且,称u =v/max ̅̅̅̅̅̅(v )为向量v 的规格化向量(normalized vector).例5.5(规格化向量):设v =[3,−5,0]T ,max ̅̅̅̅̅̅(v )=−5,对应的规格化向量为u =[−35,1,0]T .根据定义5.6,容易得出规格化向量的两条性质.定理5.13: 定义5.6中的规格化向量满足如下两条性质:(1) 若u 为规格化向量,则‖u ‖ =1,并且max ̅̅̅̅̅̅(u )=1.(2) 设向量v 1和v 2的规格化向量分别为u 1和u 2,若v 1=αv 2, 实数α≠0,则u 1= u 2.在幂法的每一步增加向量规格化的操作可解决溢出问题. 先看第一步,v 1=Av 0,此时计算v 1的规格化向量u 1=v 1max ̅̅̅̅̅̅(v 1)=Av 0max ̅̅̅̅̅̅(Av 0). 然后使用规格化向量计算v 2:v 2=Au 1=A 2v 0max ̅̅̅̅̅̅(Av 0), (5.8) 再进行向量规划化操作,u 2=v 2max ̅̅̅̅̅̅(v 2)=A 2v 0max ̅̅̅̅̅̅(A 2v 0). (5.9) 公式(5.9)的推导,利用了(5.8)式和定理5.13的结论(2). 依次类推,我们得到: { v k =Au k−1=A k v 0max ̅̅̅̅̅̅(A k−1v 0) u k =v k max ̅̅̅̅̅̅(v k )=A k v 0max ̅̅̅̅̅̅(A k v 0) , k =1,2,⋯. (5.10) 根据定理5.12的证明过程, A k v 0=λ1k [α1x ̂1+∑αj (λj λ1)k x ̂j n j=2] ⟹u k =A k v 0max ̅̅̅̅̅̅(A k v 0)=α1x ̂1+∑αj (λj λ1)k x ̂j n j=2max ̅̅̅̅̅̅(α1x ̂1+∑αj (λj λ1)k x ̂j n j=2)k→∞→ x 1max ̅̅̅̅̅̅(x 1) , 即u k 逐渐逼近规格化的主特征向量. 同理,v k =Au k−1=A k v 0max ̅̅̅̅̅̅(A k−1v 0)=λ1k [α1x ̂1+∑αj (λj λ1)k x ̂j n j=2]max ̅̅̅̅̅̅(λ1k−1[α1x ̂1+∑αj (λj λ1)k−1x̂j n j=2]) =λ1α1x ̂1+∑αj(λj λ1)kx ̂j n j=2max ̅̅̅̅̅̅(α1x ̂1+∑αj (λj λ1)k−1x ̂j n j=2) 因此,根据定理5.13的结论(1)有:lim k→∞v k=λ1x1max̅̅̅̅̅̅(x1)⟹limk→∞max̅̅̅̅̅̅(v k)=λ1.基于上述推导,我们得到如下定理,以及如算法5.1描述的实用幂法.定理5.14: 设A∈ℝn×n,其主特征值唯一(且几何重数等于代数重数),记为λ1,取任意非零初始向量v0=u0,它不与主特征值对应的特征向量正交,按迭代公式(5.10)进行计算,则lim k→∞u k=x1max̅̅̅̅̅̅(x1),(5.11)lim k→∞max̅̅̅̅̅̅(v k)=λ1 ,(5.12)其中x1为主特征向量.算法5.1:计算主特征值λ1和主特征向量x1的实用幂法输入:v,A; 输出:x1,λ1.u:=v;While不满足判停准则dov:=Au;λ1:=max̅̅̅̅̅̅(v); {主特征值近似值}u:=v/λ1; {规格化}Endx1:=u. {规格化的主特征向量}在算法5.1中,可根据相邻两步迭代得到的主特征值近似值之差来判断是否停止迭代. 每个迭代步的主要计算是算一次矩阵与向量乘法,若A为稀疏矩阵则可利用它的稀疏性提高计算效率. 实用的幂法保证了向量序列{v k},{u k}不溢出,并且向量v k的最大分量的极限就是主特征值.最后,针对幂法的适用范围再说明两点:(1). 若实矩阵A对称半正定或对称半负定,则其主特征值必唯一(而且是非亏损阵). 有时也可以估计特征值的分布范围,从而说明主特征值的唯一性. 只有满足此条件,才能保证幂法的收敛性.(2). 对一般的矩阵,幂法的迭代过程有可能不收敛,此时序列{u k}有可能包括多个收敛于不同向量的子序列,它趋向于成为多个特征向量的线性组合. 但是,一旦幂法的迭代过程收敛,向量序列的收敛值就一定是特征向量,并可求出相应的特征值.例5.6 (实用的幂法):用实用的幂法求如下矩阵的主特征值:A=[3113] ,[解]: 取初始向量为v0=u0=[01]T . 按算法5.1的迭代过程,计算结果列于表5-1中.表5-1 实用幂法的迭代计算过程从结果可以看出,在每次迭代步中做的规格化操作避免了分量的指数增大或缩小. 经过9步迭代,特征值max ̅̅̅̅̅̅(v k )已非常接近主特征值的准确值4,特征向量也非常接近[1 1]T .5.2.2加速收敛的方法 加速幂法迭代收敛过程的方法主要有两种:原点位移技术和瑞利商(Rayleigh quotient )加速. 下面做些简略的介绍.一. 原点位移技术原点位移技术,也叫原点平移技术,它利用定理5.9的结论(2),即矩阵A −pI 的特征值为A 的特征值减去p 的结果. 对矩阵B =A −pI 应用幂法有可能得到矩阵A 的某个特征值λj 和相应的特征向量. 要使原点位移达到理想的效果,首先要求λj −p 是B 的主特征值,其次还要使幂法尽快收敛,即比例|λ2(B)λj −p |要尽量小,这里的λ2(B)表示矩阵B 的(按模)第二大的特征值. 在某种情况下设置合适的p 值,矩阵A,B 可同时取到主特征值. 图5-3显示了这样一个例子,矩阵A 的特征值分布在阴影区域覆盖的实数轴上,λ1为其主特征值. 按图中所示选取的p 值,将使得λ1−p 是矩阵B =A −pI 的主特征值,并且显然有|λ2(B)λ1−p |<|λ2(A)λ1| . 此时用幂法计算B 的主特征值能更快地收敛,进而得到矩阵的A 的主特征值. 图5-3也解释了原点位移法名字的由来,即将原点(或虚数坐标轴)移到p 的位置上,原始矩阵A 的特征值分布变成了矩阵B 的特征值分布.采用原点位移技术后,执行幂法仅带来很少的额外运算,而且仍然能利用矩阵A 的稀疏性. 它的关键问题是,如何选择合适的参数p 以达到较好的效果?这依赖于具体矩阵的情况,以及对其特征值分布的了解. 在后面,我们还会看到原点位移技术的其他用途.二. 瑞利商加速首先给出瑞利商的定义,以及它与特征值的关系,然后介绍瑞利商加速技术.定义5.7:设A ∈ℝn×n ,且为对称矩阵,对任一非零向量x ≠0,称R (x )=〈Ax,x 〉〈x,x 〉为对应于向量x 的瑞利商(Rayleigh quotient ). 这里符号〈,〉代表向量内积.定理5.15:设A ∈ℝn×n ,且为对称矩阵,其n 个特征值依次为:λ1≥λ2≥⋯≥ λn ,则矩阵A 有关的瑞利商的上下确界分别为λ1和λn . 即∀x ≠0,λn ≤R (x )≤λ1,且当x 为λ1对应的特征向量时R (x )=λ1,当x 为λn 对应的特征向量时R (x )=λn .[证明]: 根据实对称矩阵的特点,即可正交对角化(定理3.3),设特征值λ1,λ2,⋯,λn 对应的单位特征向量为x 1,x 2,⋯,x n ,设x =∑αj x j n j=1,则〈x,x 〉=〈∑αj x j n j=1,∑αj x j n j=1〉=∑αj 2n j=1,而图5-3 原点位移技术示意图.。

第五章特征值(考研精讲)

第五章特征值(考研精讲)

第五章 特征值与特征向量1、数字型矩阵的特征值与特征向量知识点:定义:1º设n A 是阶方阵,如果存在数λ和非零向量x 使得x Ax λ=,则称λ是A 的特征值,称非零向量x 是属于λ的特征向量.2º由0)(,=-=x A E x Ax λλ得称x Ax λ=为A 的特征矩阵A E -λ为A 的特征多项式,它的根就是A 的特征值.求法:1)特征值:0=-A E λ2)特征向量:0)(=-x A E λ即求解线性方程组.注:属于同一个特征值的线性无关的特征向量为 )(A E n --λ秩.例1. ⎪⎪⎪⎭⎫ ⎝⎛----=163053064A 解:2)1)(2(163053064-+=-+--=-λλλλλλA E2、抽象矩阵的特征值与特征向量例2. 设3阶矩阵A 的三个特征值为1,-2,3,则=A -6 ,A-1的特征值为31,21,1- A *的特征值为 -6,3,-2A 2+2A+E 的可逆性 可逆 4,1,16 例3. 设2=λ是可逆矩阵A 的一个特征值,则矩阵1231-⎪⎭⎫ ⎝⎛A 有一个特征值为( 43 ). 例 4. 设向量()T n Tn b b b ),,,(,,,,2121 ==βαααα都是非零向量,且满足条件T T A αββα==记,0,求(1)A 2(2)矩阵A 的特征值和特征向量 例5. 设A 为3阶矩阵,且0322=+=+=-E A E A E A ,则=-E A 32* 解:A 为特征值为:323,2,1=∴--A 2,23,3:*--∴即λA A 7,6,3:32*---∴EA 11=1263、已知矩阵的特征值和特征向量来求矩阵和行列式等问题1)已知特征向量,一般用x Ax λ=求解2)已知全部特征值和特征向量反求矩阵A=),,(21n A ααα ),,(2211n n αλαλαλ则),,(2211n n A αλαλαλ =121),,(-n ααα3)已知部分特征值和特征向量,反求另一部分特征值,特征向量或矩阵A4)已知特征值反求行列式例6.设⎪⎪⎪⎭⎫⎝⎛--=b a A 6633331有特征值4,221=-=λλ,试求参数a,b 的值. 解:分析:用特征议程0=-A E λ可建立两个方程02=--A E 得0)4)(5(3266323333=-+=--------b a ba04=-A E 得0]72)2)(7[(3466343333=++-=------b a ba由①②得4,5=-=b a例7.设矩阵⎪⎪⎪⎭⎫ ⎝⎛=a A 11121112可逆,向量⎪⎪⎪⎭⎫⎝⎛=11b α是A *的一个特征向量,λ是α对应的特征值,求a,b,λ. 解:αλαλααλααA A A A A A =⇒=⇒=)()(**由可逆,知λ≠0,从而αλαAA =. 即⎪⎪⎪⎭⎫⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛⎪⎪⎪⎭⎫ ⎝⎛111111121112b A b a λ. 得⎪⎪⎪⎩⎪⎪⎪⎨⎧=++=+=+λλλA b a b A b A b 1223①②③①-②得 a=2①b -②得 b=1或b=-24211121112==A 故b A +=3λ 当1=b 时,1=λ;当42==λ时b例8.已知3,6321===λλλ是实对称矩阵A 的三个特征值,且对徉332==λλ的特征向量为⎪⎪⎪⎭⎫ ⎝⎛-=⎪⎪⎪⎭⎫ ⎝⎛-=121,10132αα,求A 对应于λ1=6的特征向量及矩阵A解:设A 对应于λ1=6的特征向量()321,,x x x =α,由于A 实对称属于不同特征值正交故⎩⎨⎧=+-==⇒=+-02032132131x x x x x x x x 故()T T Tx x x x )1,1,1(,)1,1,1(,,11321===αα取 ∴属于λ1=6的特征向量为αk进一步 ())3,3,6(,,321321αααααα=A故⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛--⎪⎪⎪⎭⎫ ⎝⎛--=-4111411141112011113366063361A4、矩阵相似和对角化的题目(2000,2001,2002,2003,2005,2007)知识点:1º相似矩阵具有相同的特征多项式2º矩阵A 可对角化的充要条件且属于A 的特征值i x 的线性无关的特征向量个数之和有于n 。

大学线性代数第五章第一节矩阵的特征值与特征向量

大学线性代数第五章第一节矩阵的特征值与特征向量
通过找到一个矩阵的特征值和特征向量,我们可以了解该矩阵所代表的线性变换的性质,例如对称性、 旋转、缩放等。
在解决实际问题时,特征值和特征向量可以帮助我们理解数据的变化趋势和模式,例如在图像处理、信 号处理等领域有广泛应用。
在矩阵分解中的应用
01
矩阵分解是将一个复杂的矩阵 分解为几个简单的、易于处理 的矩阵,例如三角矩阵、对角 矩阵等。
矩阵的分解,如三角分解、 QR分解等,都涉及到特征值 和特征向量的应用,它们是构 造这些分解的基础。
02
矩阵的特征值与特征向量的定义
特征值的概念
特征值是指一个矩阵在某个非零常数倍下的不变性,即当矩阵A 乘以一个非零向量x得到0时,称该非零向量x为矩阵A的对应于 特征值λ的特征向量。
特征值可以通过求解矩阵的特征多项式得到,即|λE-A|=0。
密切的关系。
02
特征值和特征向量的关系可以通过矩阵的行列式、转
置、共轭等运算得到进一步的理解。
03
特征值和特征向量的关系性质在解决实际问题中具有
广泛的应用,如信号处理、控制系统等领域。
05ห้องสมุดไป่ตู้
矩阵特征值与特征向量的应用
在线性变换中的应用
矩阵特征值与特征向量是线性变换的一个重要工具,它们可以描述一个线性变换对一个向量空间的影 响。
特征值和特征向量在解决线性方程组、矩阵的相似变换、矩阵的 分解等领域有广泛应用。
矩阵特征值与特征向量的重要性
在解决线性方程组时,特征值 和特征向量可以提供一种有效 的解法,特别是对于一些特殊 类型的线性方程组。
在矩阵的相似变换中,特征值 和特征向量是确定相似变换的 关键,有助于理解矩阵的性质 和行为。
大学线性代数第五章第一节矩 阵的特征值与特征向量

第五章 求矩阵特征值和特征向量

第五章 求矩阵特征值和特征向量

第五章 求矩阵特征值与特征向量n 阶方阵A 的n 个特征值就是其特征方程det()0λ-=A I的n 个根,方程A 属于特征值λ的特征向量x 是线性方程组λ=A x x的非零解。

本章讨论求方阵A 的特征值和特征向量的两个常用的数值方法。

以及求实对称矩阵特征值的对分法。

5.1 幂 法在实际问题中,矩阵的按模最大特征根起着重要的作用。

例如矩阵的谱半径即矩阵的按模最大特征根的值,它决定了迭代矩阵是否收敛。

本节先讨论求实方阵的按模最大特征根的常用迭代法:幂法。

5.1.1幂法的基本思想幂法是求实方阵A 按模最大特征值及其特征向量的一种迭代方法。

它的基本思想是:先任取非零初始向量0x ,然后作迭代序列1k k +=x A x ,0,1,k =⋅⋅⋅ (5。

1)再根据k 增大时,k x 各分量的变化规律:按模最大的特征向量会愈来愈突出,从而可求出方阵A 的按模最大特征值及其特征向量。

先看一个计算实例。

例1 设矩阵1221⎛⎫=⎪⎝⎭A 用特征方程容易求得A 的两个特征值为11-=λ,32=λ下面用幂法来计算,取初始向量()01,0T=x ,计算向量序列 1k k +=x A x ,0,1,k =⋅⋅⋅ 具体结果如表5.1所示.表5.1 幂法计算结果k()1k x()2k x0 1 01 2 3 1 5 13 2 4 14 4 5 6 741 121 365 109340 122 364 1094考察两个相邻向量对应分量之比:5)1(1)2(1=xx ,6.2)2(1)3(1=xx ,(4)1(3)13.154x x=,(5)1(4)12.951x x=,(6)1(5)13.016x x=,(7)1(6)12.994x x=2)1(2)2(2=x x ,5.3)2(2)3(2=x x ,(4)2(3)22.857x x =,(5)2(4)23.05x x =,(6)2(5)22.983x x =,(7)2(6)23.005x x =由上面计算看出,两相邻向量对应分量之比值,随k 的增大而趋向于一个固定值3,而且这个值恰好就是矩阵A 的按模最大的特征值。

第五章 特征值估计及对称矩阵的极性-1

第五章  特征值估计及对称矩阵的极性-1

三,广义特征值分解算法
3. GEVD的总体最小二乘算法: 步一,对阵A进行SVD: A=U∑VH≈U1∑1V1H , 其中∑1是的主奇异值阵; 步 二 , 把 A-λB 左 乘 U1H 并 右 乘 V1 , 得 ∑ 1λU1HBV1 , 从 而 转 化 成 新 的 矩 阵 束 (∑1 , λU1HBV1)的GEVD问题. 该方法适合于有噪情况下的主特征对的计算. 参见张贤达的《矩阵分析与应用》的第8 参见张贤达的《矩阵分析与应用》的第8.8节.
Api=λipiR(pi)=λi.
§5.3 对称矩阵特征值的极性
推论1:在S上p1和pn分别是R(x)的一个极小点和极 大点,即R(p1)=λ1,R(pn)=λn 推论2 若λ1=…=λk (1≤k≤n).则在||x||2=l上R(x)的所 有极小点为[p1,…,pk]β,||β||2=1. 定理:设x∈L(pr,…,ps) , 1≤r≤s≤n ,则有 ∈ ≤≤≤ minxR(x)=λr,maxxR(x)=λs Courant-Fischer定理:设实对称矩阵A的特征值按升 序排列,则A的第k个特征值λk=minVkmax{xTAx |x∈Vk, || x||2=1},其中Vk是Rn的任意—个k维子空间 ,1<k<n.
2.
§5.3 对称矩阵特征值的极性
性 质 3 x∈L(x0)( x0≠0) 时 , R(x) 是 一 常 数. 性质4 R(x)的最大值和最小值存在,且能 够在单位球面S={x|x∈Rn,||x||2=1}上达到. 证: S 是闭集,在 S 上 R(x)=xTAx 连续,所 以必有 x1 , x2∈S ,使得 minx∈SR(x)=R(x1) , n maxx∈SR(x)=R(x2) ; 任 取 0≠y∈R , 令 y0=Ν(y) , 则 y0∈S , 根 据 性 质 3 , 有 R(y)=R(y0),从而R(x1)≤R(y)≤R(x2).

第五章特征值2013

第五章特征值2013

α 是 A5 − 3 A 的属于 λ5 − 3λ 的特征向量; α 是 2 A + 5 A − 7 E 的属于 2λ + 5λ − 7 的特征向量.
7 3 7 3
矩阵
A
Am
kA kλ
特征值 λ
λm
A−1 1
AT
λ
λ
课堂练习
A3,A4,A5,例2.5 (利用定义)
例2.5 证明 : 若 λ 是A的特征值 , α是A的属于 λ 的特征值向量 ,
再重复 m − 2次 , 得到A mα = λmα,
故 λm 是矩阵Am的特征值 , 且 α 是 Am 对应于λm的特征向量 .
证明: 当A可逆时 , λ ≠ 0(由推论 2.1) 1 1 由Aα = λα , 得到 A−1 ( Aα ) = A−1 (λα ), λ λ 1 1 ⇒ α = A−1α ⇒ A −1α = α
A mα = λ m α , AT α = λα ,
由上结论,易知A6成立.
重要结论
矩阵 A AA * A A* A ( A * )-1 AAT A − 3E
A −1α =
1
λ
α,
( kA)α = ( kλ )α .
特征值 λ
λ
A
λ
λ2
λ -3
因为若有 Aα = λα , 则有 f ( A)α = f (λ )α .
A5 证明 : 若λ 是矩阵 A的特征值 , α是A的属于 λ的特征向量 , 则λm 是Am的特征值 ( m 是任意常数 ), 且α是Am的属于 λm
的特征向量 .
证明:
则当 A可逆时 , 特征值 .
1
λ
是 A −1的特征值 , 且α是 A −1的属于

(完整版)线性代数第五章特征值与特征向量(自考经管类原创)

(完整版)线性代数第五章特征值与特征向量(自考经管类原创)

Ak
( PP 1 )k
Pk P1
0 P
k
5
P1
上例中,对二阶方阵AP,存在可逆矩阵P, 使得P1AP .
对角阵的对角元是A的特征值,可逆阵P 即为相应对角元位置的特征值的线性无关的特 征向量组成.
接下来,主要研究方阵化对角阵的问题.
定义 设 A, B 都是 n 阶矩阵,若存在可逆矩阵P,使得 P1AP B
特征值, A 为 A 的一个特征值.
问题( :1)已知是A的特征值,求f (A)特征值
(2)已知f (A)=O,求A的特征值
例6 设3阶矩阵A的一个特征值是-3,则-A2必有 一个特征值 ___
例7
设A=
1 0
2 3
,求B=A2
-2A+3E 的所有特征值 2
例8 设三阶矩阵A的特征值分别为1,2,3, 则 A 2E __
4 1 3
( 1) 22 ,
令 ( 1) 22 0
得A的特征值为1 1,2 3 2.
当1 1时,解方程E A x 0.由
1 1 1 1 0 1
E
A
0
3
0
0
1
0
,
4 1 4 0 0 0
得基础解系
1 p1 0, 1
故对应于1 1的全体特征向量为
k p1
E A
a21
L
a22 L
LL
an1
an2 L
a1n
a2n
L
ann
称E A 为A的特征方阵 .
记 f E A ,它是 的 n 次多项式,
称其 为方阵 A的 特征多项式 .
称以 为未知数的一元n 次方程 E A 0
为A的特征方程 .

线性代数 第五章第一节 矩阵的特征值与特征向量

线性代数 第五章第一节 矩阵的特征值与特征向量
0 1 1 A 1 0 1 1 1 0
第一步:写出矩阵A的特征方程,求出全 部特征值(注明重数).

l 1 1 lE A 1 l 1 (l 2)( l 1) 2 1 1 l
l 代入齐次线性方程组
所以A的特征值为 l1 2, l2 l3 1.
第二步:对每个特征值
2 1 1 2 1 1 2 E A 1 2 1 1 2 1 1 1 2 0 0 0
A l E x 0, 求基础解系。 当l1 2 时,解方程组 (2 E A) x 0 . 由
1 1ቤተ መጻሕፍቲ ባይዱ
故l0 是矩阵A 的特征值, 且X 0是A
1
1
1
对应于l0 的特征向量.
1
如何求得矩阵A的特征值和特征 向量呢? 式子AX=lX(lE-A)X=0. 由于X是非零向量, 故齐次线性方 程组(lE-A)X=0有非零解, 而这等 价于 |λE-A|=0.
定义 称
为A的特征多项式, 它是以l为未知数的一 元n次多项式, 也记为f(l). 称|lEA|=0为A的特征方程. λE-A称为A的 特征矩阵。
若l0,使得 A(X 1 X 2) l0 X 1 X 2) (
则有
(l1 l0)X 1 l2 l0)X 2 0 (
A左乘 λ1左乘
式两端:l1 l0)l1 X 1 l0 l2)l2 X 2 0 ( ( ( ( 式两端:l1 l0)l1 X 1 l0 l2)l1 X 2 0
(l0 l2)l2 X 2 l0 l2)l1 X 2 (
l2 l1 , X 2 0
l0 l2

线性代数第五章特征值

线性代数第五章特征值
第五节 二次型及其标准形
第六节 用配方法化二次型成标准形
第七节 正定二次型
常见问题
1.将线性无关向量组化为正交单位向量组 2.求方阵的特征值与特征向量
3.已知A的特征值,求A的“多项式”的特征值 和行列式
4.方阵的对角化(WHEN & HOW) 5.对称阵的正交对角化 6.二次型的矩阵、秩、标准形、规范形、正惯性 指数、正定性 7.矩阵的相似、正交阵、正定性
线性代数
孙 志 人 南京师范大学计算机学院 二Ο一二年十二月廿八日
§7 正定二次型
一、惯性定理 二、正(负)定二次型的概念 三、正(负)定二次型的判别 四、小结、思考题
一、惯性定理
一个实二次型,既可以通过正交变换化为标 准形,也可以通过拉格朗日配方法化为标准形, 显然,其标准形一般来说是不唯一的,但标准形 中所含有的项数是确定的,项数等于二次型的秩. 下面我们限定所用的变换为实变换,来研究 二次型的标准形所具有的性质.
则 y C x 0,

i -1
f x f Cy ki yi2 .
n
x ki yi2 0. f
n i 1
必要性
假设有 ks 0, 则当y es (单位坐标向量) 时,
f Ces k s 0.
. 显然 Ces 0, 这与 f 为正定相矛盾
的秩为 . 2.设 A 为 n 阶方阵, 且 det A 2, 则
2 1.二次型 f ( x1 , x2 , x3 ) 2 xx1 4 x1 x2 2 x1 x3
1 1 det ( A) A . 3 2 0 0 1 0 0 3.已知矩阵A 2 x 2 与B 0 2 0 相似, 3 1 1 0 0 y 则x ,y .
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在例 5.2.1 中,圆盘 S1 与 S 2 相交,S1 S 2 构成一个连通区域,而 S 3 与
S 4 是孤立的.
一般地, 由矩阵的 k 个相交的盖尔圆的并集构成的连通区域称为一个连 通部分, 并说它是由 k 个盖尔圆组成. 一个孤立的盖尔圆组成一个连通部分. 圆盘定理 5.2.1 只说明矩阵的特征值均在其全部盖尔圆的并集内,并没 有明确指出哪个盖尔圆中有多少个特征值,圆盘定理 5.2.2 更准确地说明特 征值的分布情况.
第5章 特征值的估计
矩阵的特征值在理论上和实际应用中都是十分重要的, 但是特征值的计算一般是非常麻烦的,尤其当矩阵的阶数
比较高时,要精确计算出矩阵的特征值是相当困难的,因
此,由矩阵元素的简单关系式估计出特征值的范围就显得 尤为重要.本章将主要给出特征值的估计与圆盘定理,以 及谱半径的估计.
5.1 特征值界的估计
则有
U H BU U H U H CU U H
n
A AH T T H U , 2 2 A AH T T H U , 2 2
2
| Re k | | Re i | |
2 i 1 n
n
i i
2
i 1 n
t ii t ii 2 | | | , 2 i 1
设 A, B, C 的特征值分别为
k , k , i k ( i 1, k 1,2,n) ,且满足 | 1 || 2 | | n | , 1 2 n ,
1 2 n .
定理 5.1.2 设 A (aij ) C 则
值,于是
2 2 2 2 | | | t | | t | | t | i ii ii ij T i 1 n
n
n
2 F
. (5.1.2)
i 1
i 1
i j
由于在酉相似下矩阵的 F 范数不变,所以
| i | T
2 i 1
n
2 F
A F.
2
由(5.1.2)式知结论中等号成立当且仅当
定理 5.2.2 (圆盘定理 2) 设矩阵 A 的 n 个盖尔圆中有 k 个互 相连通且与其余 n k 个不相交,则这个连通区域中恰有 A 的 k 个特征值(当 A 的主对角线上有相同元素时,则按重复次数计算, 有特征值相同时也按重复次数计算).
从定理 5.2.2 可知,由一个盖尔圆组成的连通部分有且仅有一个特 征值, 由两个盖尔圆组成的连通部分有且仅有两个特征值, 但可能这两 个特征值都落在一个圆盘中,而另一个圆盘中没有特征值.
j 1 j i n
(7.2.1)
设 xt 为 x 的各分量中模最大的一个,则 xt 0 ,在(5.2.1)式中当
i t 时有
( att ) xt atj x j ,
j 1 j t
n
(5.2.2)
(5.2.2)式的两边除以 xt 并取模得
| att | | atj |
nn
, A 的特征值为 k (k 1,2, n) ,
| k | n max | aij | ,
i, j
| Re k | n max | bij | ,
i, j
| Im k | n max | cij | .
i, j
证明
由定理 5.1.1 得
| k |2 | i |2
T T 2
H
2
B
F
2 F
n 2 max | bij | 2 ,
i, j
i j
| t ij | t ii t ii 2 T T | | 2 2 i 1 i , j 1 2
n
n
2
H
2
C
F
2 F
n 2 max | cij | 2 ,
i, j
i j
所以
| Re k |2 n 2 max | bij |2 ,
切特征值都在它的 n 个盖尔圆的并集之内,即 A 的任一特征值 满足
S Si .
设 为 A 的特征值,其对应的特征向量为 x ( x 0) ,即 Ax x ,写成分量形式为 证明
i 1
n
a
j 1
n
ij
x j xi , ( i 1,2,, n )
或 ( i 1,2,, n ) ( aii ) xi aij x j .
i 1
n
i , j 1
2 2 2 | a | n max | a | , ij ij i, j
n

| k | n max | aij | .
i, j
由舒尔定理,存在酉矩阵 U 使得
U H AU T , U H A H U T H , 其中 T 为上三角矩阵,T 的对角线元素 t ii (i 1,2, n) 为 A 的特征值,
j 1 j t n
n
xj xt
| atj | Rt ( A) ,
j 1 j t
n
所以 S t ,即 S S i .
i 1
0.2 0.1 0.3 1 0.3 0.4 0.1 0 例 5.2.1 估计矩阵 A 的特征值的分布范围. 0.3 0.2 3 0.5 0.2 0.3 0.1 2i 解 A 的四个盖尔圆为 S1 : | z 1 | 0.6 , S 2 : | z | 0.8 , S 4 : | z 2i | 0.6 . S 3 : | z 3 | 1 , 所以 A 的特征值都落在这四个盖尔圆的并集内.
3 (3 1) max | cij | 0.3464 . i, j 2 0.2 0.1 实际上, 得 A的 | E A | 0.2 0.2 3 0.09 , 0.1 0..2 | Im k |
特征值为 1 0 , 2 0.3i , 3 0.3i .
5.2 圆盘定理
上节介绍了利用矩阵的元素估计矩阵特征值的界,本节 介绍利用矩阵的元素更准确地估计其特征值在复平面上的分
布区域.
定义 5.2.1 设 A (aij ) C
n
nn
,记
S i {z | z aii | Ri , z C} ,
其中 Ri Ri ( A)
| a
定理 5.1.1 设 A (aij ) C 则
nn
, A 的特征值为 1 , 2 , , n ,
2
|
i 1
n
i
|
2
i , j 1
| a
n
ij
| AF.
2
(5.1.1)
且等号当且仅当 A 为正规矩阵时成立.
证明 由舒尔定理,存在酉矩阵 U 使得
U H AU T . 其中 T 为上三角矩阵,T 的对角线元素 t ii (i 1,2, , n) 为 A 的特征
A 的其它两个
下面给出一些利用矩阵元素直接估计矩阵特征值上下界的方 法,为便于表达,对于 A (aij ) C nn ,记
A AH A AH B (bij ) , C (cij ) , 2 2 则 B 为 Hermite 矩阵, C 为反 Hermite 矩阵,且 A B C .
0.8 1 2 0.4 0 ,所 例如 矩阵 A 的特征方程为 0.5 0
以 A 的特征值为
1
A 的两个盖尔圆为
由于
1 .
| z 1 | 0.8 ,
| z | 0.5 .
| 1 || 2 | 0.4 0.63 0.5 . 所以这两个特征值都不落在圆盘 | z | 0.5 内.
解 记 1 2 ,A 的其它两个特征值为 2 , 3 , 由定理 5.1.1 得
| 2 | 2 | i | 2 | 1 | 2
i 1
3
i , j 1
2 2 | a | | | 25 , ij 1
3
故 | 2 | 5 .同理可得 | 3 | 5 . 事实上,由 | E A | ( 1)( 2)( i ) 知 特征值为 1, i .
j 1 j i
ij
, | ( i 1,2, , n )
称 Si 为矩阵 A 在复平面上的第 i 个盖尔(Gerschgorin)圆, 称 Ri 为 S i 的半径( i 1,2, , n ) .
定理 5.2.1(圆盘定理 1) 设 A ( aij ) C
nn
,则 A 的一
| k | 3 max | aij | 0.6 ,
i, j
i, j
| Re k | 3 max | bij | 0 , | Im k | 3 max | cij | 0.6 .
i, j
所以, Re k 0 , | Im k | 0.6 .
若用定理 5.1.3 可得
推论 5.2.1 设 n 阶矩阵 A 的 n 个盖尔圆两两互不相交(都是 孤立的) ,则 A 相似于对角矩阵.
推论 5.2.2 设 n 阶实矩阵 A 的 n 个盖尔圆两两互不相交,则
A 的特征值全为实数.
证明 因为 A 为实矩阵,所以 A 的 n 个盖尔圆都关于实轴对 称.又由这 n 个盖尔圆两两互不相交知, A 的 n 个特征值互不相 等,且每个盖尔圆内恰含有一个特征值.因为,如果实矩阵有复 特征值,则一定成对出现,且在复平面上关于实轴对称,所以若 有一个复特征值在某个盖尔圆内,则与其成共轭的特征值也一定 在该盖尔圆内,这与定理 7.2.2 的结论相矛盾,所以 A 的特征值都 是实数.
0.2 0.1 0 A 0.2 0 0.2 0.1 0.2 0
相关文档
最新文档