矩阵特征值计算.ppt

合集下载

计算方法之计算矩阵的特征值和特征量

4
1 取对应于1=4的基础解向量 P1 1 则对应于1=4的全部特征向量为：kP1 (k 0)
（2）2=2 将1=2代入(A-E)X=0得(A-2E)X=0
3 2 1 x1 1 3 2 x 0 2

总可以用 Xi 的线性组合来表示： V(0)=1X1+ 2X2+...+ nXn（其中10）取 V(1)=AV(0) V(2)=AV(1)=A2V(0) ……
10
V(k+1)=AV(k) =Ak+1V(0) 以构成向量迭代序列。由矩阵特征值的定义有： AXi=iXi （i=1,2,...,n）则有

k 1 1
i [ 1 X 1 i i2 1
n
k 1
Xi ]
11
V 同理可得：
(k )
i [ 1 X 1 i X i ] i2 1
n k 1 n k 1
k
V(k+1)的第j个分量：
16
（二）按模最大特征值是互为反号的实根设n 阶方阵A有 n 个线性无关的特征向量 Xi ，其对应的特征值为i （i=1,2,...,n)，且满足： |1| = |2|>|3| … |n|，设其中1>0, 1=- 2
由迭代变换： V ( k ) Ak V ( 0 )
3 1 求矩阵 A 1 3 的特征值与特征向量
3
解：计算特征多项式方程，即 3 1 A E ( 3 )2 1 0 1 3 解得A的两个特征值：1=4， 2=2。（1）1=4 将1=4代入 (A-E)X=0得(A-4E)X=0

第章矩阵特征值的计算

的特征向量的近似值。
规范化乘幂法
令max(x)表示向量x分量中绝对值最大者。即如果有某i0，使
xi0
max
1 i n
xi
则
max (x) = xi
对任取初始向量x(0)，记
y(0) x(0) max( x(0) )
则
x(1) Ay(0)
一般地，若已知x(k)，称公式
y(k ) x(k ) max( x(k ) )
2
S sin sin 2
2C
（4）
aip aiq
aipC aiq S a pi aip s aiqC aqi
a pp a ppC 2 2a pqC S aqq S 2 aqq a pp S 2 2a pqC S aqqC 2 a pq (a pp aqq )C S a pq (C 2 S 2 ) aqp
它们之间有如下的关系：
ai(pk )
a(k ip
1)
cos
a(k iq
1)
sin
a(k) pi
ai(qk )
ai(pk1) sin
a(k iq
1)
cos
a(k qi
)
i p,q
aaq((pqkkp))源自a(k 1) ppa(k 1) pp
cos2 sin2
2a
(k 1) pq
sin
cos
2a
然后对j = 1, 2, …, n 解方程
x (k2) j
px j (k 1)
qx j(k )
0
求出p 、q 后，由公式
1
p 2
i
q
p
2
2
2
p 2
i

计算方法(5)第四章矩阵特征值和特征向量的计算

n
使得u 0

i xi
i 1
n
n
uk Auk1 Aku0 Ak (i xi ) iik xi
i 1
i 1

1k [1x1

n i2
( i 1
)k i xi ]
由1 0, 1 i (i 2, 3,L , n) 得
lim(
对矩阵A1用乘幂法得 uk

A-1u
k
，
1
因为A1 的计算
比较麻烦，而且往往不能保持矩阵A 的一些好性质
（如稀疏性），因此，反幂法在实际计算时以求解
方程组
Auk

u
k
，代替迭代
1
uk
A-1uk1求得uk，每
迭代一次要解一线性方程组。由于矩阵在迭代过
程中不变，故可对A 先进行三角分解，每次迭代只要解两个三角形方程组。
且
2 p 2 n
2 n
2 n 2
1 p 21 2 n 1 n 1 2 1 n 1
因此，用原点平移法求1可使收敛速度加快。
三、反幂法
反幂法是计算矩阵按模最小的特征值及特征向量的方法，也是修正特征值、求相应特征向量的最有效的方法。
0
0.226

0.975
做正交相似变换后得到
3.366
A3 =R2 AR2T

0.0735
0.317
0.0735 1.780
0
0.317
0

1.145
雅可比方法是一个迭代过程，它生成的是一个矩阵的
序列 Ak，当k越大时Ak就越接近于对角矩阵，从而

第7章计算矩阵的特征值和特征向量

A (7)
0 0 2.125825 = 0 8.388761 0.000009 0 0.000009 4.485401
从而A的特征值可取为 A
λ1≈2.125825, λ2≈8.388761, λ3≈4.485401
V
下面分析吉文斯变换作用到对称矩阵后正交相似的变换效果。
注:
bpp = (app cosϑ − aqp sinϑ) cosϑ − (apq cosϑ − aqq sinϑ) sinϑ
注:
1 − s
2 t 1 − t
2
= 0 ⇒
t
2
+ 2 st
− 1 = 0
雅可比方法就是对A连续施行以上变换的方法。取p,q使 a pq = max aij
由于求解高次多项式的根是件困难的事上述方法一般无法解出阶数略大n4的矩阵特征值的精确解在实际计算中难以按定义计算矩阵特征值
第7章计算矩阵的特征值和特征向量
在线性代数中，一个n阶矩阵A，若有数λ及非零n维向量 v满足Av=λv，则称λ为A的特征值，v为属于特征值λ的特征向量。在线性代数中，先计算矩阵A的特征多项式，即计算 det(λ I - A)= λn +…+(-1)ndetA的根，算出A的n个特征值λ i， i=1，2， …，n。然后解线性方程组(A- λiI)v=0，计算出对应于λ i的特征向量。由于求解高次多项式的根是件困难的事，上述方法一般无法解出阶数略大(n>4)的矩阵特征值的精确解，在实际计算中难以按定义计算矩阵特征值。本章介绍一些简单有效的计算矩阵特征值和特征向量的近似值的数值方法。
7 ．2
反幂法
反幂法
Av = λv ⇒ A v =

人教A版高中数学选修4-2-4.1.2-特征值特征向量的计算-课件(共30张PPT)

an1 an2 ann
a11 l A l E a21
a12
a22 l
a11 l
AlE
a21
an1
a12 a22 l
an2
a1n
A11 A12
a2n A21 A22
an1
an 2
ann l An1 An2
1 A A j1 j2 jn 1 j1 2 j2
Anjn
j1 j2 jn
4 2 4 x1 0 2 1 2 x2 0 4 2 4 x3 0
4 2 4 0 2 1 2 0 A 2 1 2 0 0 0 0 0
4 2 4 0 0 0 0 0
2x1 x2 2x3 0
x2 2x1 2x3
令
x1 x3
分别取
10,10 ，得基础解系
定理 3 矩阵A与其转置矩阵A’有相同的特征值
证明：
A lE A (lE) (A lE) A lE
即 A与A’有相同的特征多项式故A与A’有相同的特征值
定理 4 设l1、l2 、…、l n是A的n个特征值，则
（1） l1+l2 +…+ln=a11+ a22+ …+ann （2）l1l2 …l n A
【例5】设A为n阶正交矩阵，证明A的实特征向量所
对应的特征值的绝对值等于1。
证明：因为A为正交矩阵，有AA E
设是A的一个实特征向量，对应的特征值为l
即实向量 0，且满足 A l 要证l 1
由A l
A l
A l
方程两边右乘A
左边= AA E ,
右边=lA ll l2 l2 ,
证明：设l是A的特征值，是A的属于l的特征向量

矩阵特征值计算

其中每个对角块 �� 均为方阵，则矩阵 �� 的特征值为各对角块矩阵特征值的合并，即 ��(��) = ⋃�� =1 ��(�� ). 定理 5.5：矩阵的相似变换(similarity transformation)不改变特征值. 设矩阵��和��为相似矩阵，即存在非奇异矩阵��使得�� = ��−1 ��，则 (1) 矩阵��和��的特征值相等，即 ��(��) = ��(��) ; (2) 若��为��的特征向量，则相应地，��为��的特征向量. 通过相似变换并不总能把矩阵转化为对角阵，或者说矩阵 �� 并不总是可对角化的 (diagonalizable). 下面给出特征值的代数重数、几何重数，和亏损矩阵的概念，以及几个定理.. ̃1 , ⋯ , �� ̃�� ，若�� ̃�� 是特征方程的�� 重定义 5.2: 设矩阵�� ∈ ℝ��×�� 有 m 个（mn）不同的特征值�� ̃�� 的代数重数(algebraic multiplicity)，并称�� ̃�� 的特征子空间(ℂ�� 的子空间)的维数根，则称�� 为�� ̃�� 的几何重数(geometric multiplicity). 为�� ̃1 , ⋯ , �� ̃�� ，特征值�� ̃�� , (�� = 1, ⋯ , ��)的代数定理 5.6：设矩阵�� ∈ ℝ��×�� 的 m 个不同的特征值为�� 重数为�� ，几何重数为�� ，则 (1) ∑�� =1 �� = ��，且任一个特征值的几何重数不大于代数重数，即∀��，�� ≥ �� . (2) 不同特征值的特征向量线性无关，并且将所有特征子空间的∑�� =1 �� 个基(特征向量)放在一起，它们构成一组线性无关向量. (3) 若每个特征值的代数重数等于几何重数，则总共可得��个线性无关的特征向量，它们是全空间ℂ�� 的基. 定义 5.3：若矩阵�� ∈ ℝ��×�� 的某个代数重数为 k 的特征值对应的线性无关特征向量数目少于 k（即几何重数小于代数重数），则称 ��为亏损阵（defective matrix），否则称其为非亏损阵（nondefective matrix）. 定理 5.7：设矩阵�� ∈ ℝ��×�� 可对角化，即存在非奇异矩阵�� ∈ ℂ��×�� 使得 ��−1�� = ��, 其中�� ∈ ℂ��×�� 为对角阵, 的充要条件是��为非亏损矩阵. 此时，��的对角线元素为矩阵��的特征值，而矩阵��的列向量为 n 个线性无关的特征向量. 定理 5.7 中方程的等价形式为�� = ��−1, 它被称为特征值分解，也叫谱分解(spectrum decomposition). 特征值分解存在的充要条件是��为非亏损矩阵. 但现实中还有很多矩阵是亏损矩阵，例如例 5.2 中的矩阵，它的特征值 2 的代数重数为 2，而几何重数仅为 1. 这种矩阵

数值分析ppt第8章-矩阵特征值问题计算

现讨论求λ1及x1旳措施.
上页下页
幂法旳基本思想是: 任取非零旳初始向量v0 , 由矩阵A构造历来量序列{vk}
v1 Av0 , .v.2.......A..v..1......A...2v0 , vk1 Avk Ak1v0 , .........................
(2.2)
(2.5)
即为矩阵A旳相应特征值1 旳一种近似特征向量.
因为 vk1 Avk 1k1a1 x1 1vk , (2.6)
用(vk)i 表达vk旳第i个分量，则当k充分大时，有
vk1 i
vk
i
1.
(2.7)
即为A旳主特征值1旳近似值.
这种由已知非零向量v0及矩阵A旳乘幂Ak构造向
量序列{vk}以计算A旳主特征值1(2.7)及相应特征向量
当A为实矩阵，假如限制用正交相同变换，因为
A有复旳特征值， A不能用正交相同变换约化为上三
角阵. 用正交相同变换能约化到什么程度呢？
上页下页
定理10 (实Schur分解) 设A∈Rn×n，则存在正交矩阵Q使
R11
QT
AQ
R12 R22
R1m
R2m
,
Rmm
其中Rii(i=1,2,,m)为一阶或二阶方阵，且每个一阶 Rii是A旳实特征值，每个二阶对角块Rii旳两个特征值是 A旳两个共轭复特征值.
上页下页
8.2.1 幂法（又称乘幂法）
设实矩阵A=(aij)有一种完全旳特征向量组，即 A有n个线性无关旳特征向量，设矩阵A旳特征值为 λ1,λ2,,λn, 相应旳特征向量为x1,x2,,xn. 已知A旳主特征值λ1是实根，且满足条件
| 1 || 2 | | n |,

矩阵特征值和特征向量计算.ppt

j
＝1
1
1
1
j
i
n 2
i
i 1
k
1
j
i
n 2
i
i 1
k
1
i
j
i
j
( 4.2)
lim
uk
j
k
uk1
j
1 ,
故k充
分
大
时
， uk
j
uk1
j
1 ，
(j
1,2,, n)
由（4.1）显然知k充分大时， 0 ,
x 故 uk ( 1k1 1 )就是1对应的近似特征向量。
v u v u u 如用
m
m
或 m
m
代替继续迭代, m
u( )m max
(u ) min m
u u u 这里(
m )max 和(
m )min 分别表示向量(
)的绝对值
m
最大的分量和最小分量;
4. 由(4.1),乘幂法的速度与比值| 2 | 有关, 1
n
A1
x
1
x
一定是A1的
按
模
最
大
的
征值，故对A1用乘幂法— 反幂法，可得1 的近似值
算法（步1）骤：u0 0
n
( 2) (3)
计算u k
1 A uk 1
(k 1,2,3,)
u 若k充分大后 ( u(
k)j c, ) k 1 j
则n
1 ,
c
uk
就
是n
注：实际相计对算应: A的u特征u向量三。角分解A LU ,

第五章矩阵特征值计算

第五章矩阵特征值计算与线性方程组的求解问题一样，矩阵特征值与特征向量的计算也是数值线性代数的重要内容. 在理论上，矩阵的特征值是特征多项式方程的根，因此特征值的计算可转化为单个多项式方程的求解. 然而对于高阶矩阵，这种转化并不能使问题得到简化，而且在实际应用中还会引入严重的数值误差. 因此，正如第二章指出的，我们一般将多项式方程求解转化为矩阵特征值计算问题，而不是反过来.本章介绍有关矩阵特征值计算问题的基本理论和算法. 与非线性方程求根问题类似，计算矩阵特征值的算法也是迭代方法①.5.1基本概念与特征值分布本节先介绍矩阵特征值、特征向量的基本概念和性质，然后讨论对特征值分布范围的简单估计方法.5.1.1基本概念与性质定义5.1：矩阵A=(a kj)∈ℂn×n，(1) 称φ(λ)=det(λI−A)=λn+c1λn−1+⋯+c n−1λ+c n为A的特征多项式(characteristic polynomial)；n次代数方程φ(λ)=0为A的特征方程(characteristic equation)，它的n个根：λ1,⋯,λn，被称为A的特征值（eigenvalue）. 此外，常用λ(A)表示A的全体特征值的集合，也称为特征值谱(spectrum of eigenvalue).(2) 对于矩阵A的一个给定特征值λ，相应的齐次线性方程组(λI−A)x=0 , (5.1)有非零解（因为系数矩阵奇异），其解向量x称为矩阵A对应于λ的特征向量（eigenvector）.根据方程(5.1)，我们得出矩阵特征值与特征向量的关系，即Ax=λx .(5.2)第三章的定义3.5就利用公式(5.2)对矩阵特征值和特征向量进行了定义，它与定义5.1是等价的. 另外，同一个特征值对应的特征向量一定不唯一，它们构成线性子空间，称为特征子空间(eigenspace).我们一般讨论实矩阵的特征值问题. 应注意，实矩阵的特征值和特征向量不一定是实数和实向量，但实特征值一定对应于实特征向量（方程(5.1)的解），而一般的复特征值对应的特征向量一定不是实向量. 此外，若特征值不是实数, 则其复共轭也一定是特征值（由于特征方程为实系数方程）. 定理3.3表明，实对称矩阵A∈ℝn×n的特征值均为实数，存在n个线性无关、且正交的实特征向量，即存在由特征值组成的对角阵Λ和特征向量组成的正交阵Q，使得:A=QΛQ T.(5.3)例5.1（弹簧－质点系统）：考虑图5-1的弹簧－质点系统，其中包括三个质量分别为m1、m2、m3的物体，由三个弹性系数分别为k1,k2,k3的弹簧相连，三个物体的位置均为时间的函数，①如果用有限次运算能求得一般矩阵的特征值，则多项式方程求根问题也可用有限次运算解决，这与阿贝尔证明的“高于4次的多项式并不都有用初等运算表示的求根公式”的理论矛盾.这里考查三个物体偏离平衡位置的位移，分别记为y 1(t), y 2(t), y 3(t). 因为物体在平衡状态所受的重力已经和弹簧伸长的弹力平衡，所以物体的加速度只和偏离平衡位置引起的弹簧伸长相关. 根据牛顿第二定律以及胡克定律（即弹簧的弹力与拉伸长度成正比）可列出如下微分方程组②： My ′′(t)+Ky(t)=0 ,其中y (t )=[y 1(t)y 2(t)y 3(t)]T ,M =[m 1000m 2000m 3],K =[k 1+k 2−k 20−k 2k 2+k 3−k 30−k 3k 3] . 在一般情况下，这个系统会以自然频率ω做谐波振动，而y 的通解包含如下的分量： y j (t )=x j e iωt ,(j =1,2,3)其中i =√−1，根据它可求解出振动的频率ω及振幅x j . 由这个式子可得出：y j ′′(t )=−ω2x j e iωt ,(j =1,2,3)代入微分方程，可得代数方程:−ω2Mx +Kx =0,或Ax =λx ,其中A =M −1K ，λ=ω2. 通过求解矩阵A 的特征值便可求出这个弹簧－质点系统的自然频率（有多个）. 再结合初始条件可确定这三个位移函数，它们可能按某个自然频率振动（简正振动），也可能是若干个简正振动的线性叠加.例5.2（根据定义计算特征值、特征向量）：求矩阵A =[5−1−131−14−21]的特征值和特征向量.[解]: 矩阵A 的特征方程为：det (λI −A )=|λ−511−3λ−11−42λ−1|=(λ−3)(λ−2)2=0故A 的特征值为λ1=3，λ2=2（二重特征值）.当λ=λ1=3时，由(λI −A)x =0，得到方程[−211−321−422][x 1x 2x 3]=[000]它有无穷多个解，若假设x 1=1, 则求出解为x =[1,1,1]T ，记为x 1，则x 1是λ1对应的一个特征向量.当λ=λ2=2时，由(λI −A)x =0，得到方程[−311−311−421][x 1x 2x 3]=[000]它有无穷多个解，若假设x 1=1, 则求出解为x =[1,1,2]T ，记为x 2，则x 2是λ2对应的一个特② 本书第八章将介绍这种常微分方程组的数值求解方法.图5-1 弹簧－质点系统.征向量.下面概括地介绍有关矩阵特征值、特征向量的一些性质，它们可根据定义5.1，以及公式(5.2)加以证明.定理5.1：设λj (j =1,2,…,n)为n 阶矩阵A 的特征值，则(1) ∑λj n j=1=∑a jj n j=1=tr(A) ;(2) ∏λj n j=1=det(A) .这里tr(A)表示矩阵对角线上元素之和，称为矩阵的迹（trace ）.从上述结论(2)也可以看出，非奇异矩阵特征值均不为0, 而0一定是奇异矩阵的特征值. 定理5.2：矩阵转置不改变特征值，即λ(A )=λ(A T ).定理5.3：若矩阵A 为对角阵或上(下)三角阵，则其对角线元素即为矩阵的特征值.定理5.4：若矩阵A 为分块对角阵，或分块上(下)三角阵，例如A =[A 11A 12⋯A 1m A 22⋯A 2m ⋱⋮A mm] , 其中每个对角块A jj 均为方阵，则矩阵A 的特征值为各对角块矩阵特征值的合并，即λ(A )=⋃λ(A jj )m j=1.定理5.5：矩阵的相似变换(similarity transformation)不改变特征值. 设矩阵A 和B 为相似矩阵，即存在非奇异矩阵X 使得B =X −1AX ，则(1) 矩阵A 和B 的特征值相等，即 λ(A )=λ(B ) ;(2) 若y 为B 的特征向量，则相应地，Xy 为A 的特征向量.通过相似变换并不总能把矩阵转化为对角阵，或者说矩阵A 并不总是可对角化的(diagonalizable). 下面给出特征值的代数重数、几何重数，和亏损矩阵的概念，以及几个定理..定义5.2: 设矩阵A ∈ℝn×n 有m 个（m n ）不同的特征值λ̃1,⋯,λ̃m ，若λ̃j 是特征方程的n j 重根，则称n j 为λ̃j 的代数重数(algebraic multiplicity)，并称λ̃j 的特征子空间(ℂn 的子空间)的维数为λ̃j 的几何重数(geometric multiplicity). 定理5.6：设矩阵A ∈ℝn×n 的m 个不同的特征值为λ̃1,⋯,λ̃m ，特征值λ̃j ,(j =1,⋯,m)的代数重数为n j ，几何重数为k j ，则(1) ∑n j m j=1=n ，且任一个特征值的几何重数不大于代数重数，即∀j ，n j ≥k j .(2) 不同特征值的特征向量线性无关，并且将所有特征子空间的∑k j m j=1个基(特征向量)放在一起，它们构成一组线性无关向量.(3) 若每个特征值的代数重数等于几何重数，则总共可得n 个线性无关的特征向量，它们是全空间ℂn 的基.定义5.3：若矩阵A ∈ℝn×n 的某个代数重数为k 的特征值对应的线性无关特征向量数目少于k （即几何重数小于代数重数），则称A 为亏损阵（defective matrix ），否则称其为非亏损阵（nondefective matrix ）.定理5.7：设矩阵A ∈ℝn×n 可对角化，即存在非奇异矩阵X ∈ℂn×n 使得X −1AX =Λ,其中Λ∈ℂn×n 为对角阵, 的充要条件是A 为非亏损矩阵. 此时，Λ的对角线元素为矩阵A 的特征值，而矩阵X 的列向量为n 个线性无关的特征向量.定理5.7中方程的等价形式为A =XΛX −1, 它被称为特征值分解，也叫谱分解(spectrum decomposition). 特征值分解存在的充要条件是A 为非亏损矩阵. 但现实中还有很多矩阵是亏损矩阵，例如例5.2中的矩阵，它的特征值2的代数重数为2，而几何重数仅为1. 这种矩阵不能相似变换为对角阵，但存在下面的若当分解(Jordan decomposition).定理5.8：设矩阵A ∈ℝn×n , 存在非奇异矩阵X ∈ℂn×n 使得A =XJX −1,矩阵J 为形如[J 1⋱J p ]的分块对角阵（称为若当标准型），其中J k =[ λk 1λk ⋱⋱1λk ] 称为若当块，其对角线元素为矩阵A 的特征值. 设矩阵A 有m 个不同的特征值为λ̃1,⋯,λ̃m ，特征值λ̃j ,(j =1,⋯,m)的代数重数为n j ，几何重数为k j ，则p =∑k j m j=1, λ̃j 对应于k j 个若当块, 其阶数之和等于n j .在若当分解中，如果所有若当块都是1阶的，则J 为对角阵，这种分解就是特征值分解，相应的矩阵为非亏损阵. 若当分解是很有用的理论工具，利用它还可证明下面关于矩阵运算结果的特征值的定理.定理5.9：设λj (j =1,2,…,n)为n 阶矩阵A 的特征值，则(1) 矩阵cA, c 为常数, 的特征值为cλ1,cλ2,⋯,cλn .(2) 矩阵A +pI, p 为常数, 的特征值为λ1+p,λ2+p,⋯,λn +p.(3) 矩阵A k , k 为正整数, 的特征值为λ1k ,λ2k ,⋯,λn k .(4) 设p (t )为一多项式函数，则矩阵p (A )的特征值为p (λ1),p (λ2),⋯ ,p (λn ) .(5) 若A 为非奇异矩阵，则λj ≠0,(j =1,2,…,n), 且矩阵A −1的特征值为λ1−1,λ2−1,⋯,λn −1.5.1.2特征值分布范围的估计估计特征值的分布范围或它们的界，无论在理论上或实际应用上，都有重要意义. 比如，本书前面的内容曾涉及两个问题：(1). 计算矩阵的2-条件数：cond (A )2=√λmax (A T A)λmin (A T A) ;(2). 考察一阶定常迭代法x (k+1)=Bx (k)+f 的收敛性、收敛速度：收敛的判据是谱半径ρ(B)=max 1≤j≤n |λj (B)|<1 ; 收敛速度为R =−log 10ρ(B) .其中都需要对矩阵特征值分布范围的了解.上一章的定理4.4说明谱半径的大小不超过任何一种算子范数，即ρ(A )≤‖A ‖ ,这是关于特征值的上界的一个重要结论.下面先给出定义5.4，再介绍有关特征值的界的另一个重要结论.定义5.4：设A =(a kj )∈ℂn×n ，记r k =∑|a kj |n j=1j≠k ,(k =1,⋯,n)，则集合D k ={z||z −a kk |≤r k ,z ∈ℂ},(k =1,⋯,n)在复平面为以a kk 为圆心、r k 为半径的圆盘，称为A 的Gerschgorin （格什戈林）圆盘.图5-2显示了一个3⨯3复矩阵的格什戈林圆盘.定理5.10 (圆盘定理)：设A =(a kj )∈ℂn×n ，则：(1) A 的每一个特征值必属于A 的格什戈林圆盘之中，即对任一特征值λ必定存在k,1≤k ≤n ，使得：|λ−a kk |≤∑|a kj |nj=1j≠k .(5.4)图5-2 复坐标平面，以及3⨯3矩阵A 的格什戈林圆盘.用集合的关系来说明，这意味着λ(A)⊆⋃D k n k=1.(2) 若A 的格什戈林圆盘中有m 个组成一连通并集S ，且S 与余下的n −m 个圆盘分离，则S内恰好包含A 的m 个特征值（重特征值按重数计）.对图5-2所示的例子，定理5.10的第(2)个结论的含义是：D 1中只包含一个特征值，而另外两个特征值在D 2,D 3的并集中. 下面对定理5.10的结论(1)进行证明，结论(2)的证明超出了本书的范围.[证明]: 设λ为A 的任一特征值，则有Ax =λx ，x 为非零向量. 设x 中第k 个分量最大，即|x k |=max 1≤j≤n|x j |>0 , 考虑方程(5.2)中第k 个方程：∑a kj x j nj=1=λx k , 将其中与x k 有关的项移到等号左边，其余到右边，再两边取模得：|λ−a kk ||x k |=|∑a kj x j n j=1j≠k |≤∑|a kj ||x j |n j=1j≠k ≤|x k |∑|a kj |nj=1j≠k .(5.5)最后一个不等式的推导利用了“x 中第k 个分量最大”的假设. 将不等式(5.5)除以|x k |，即得到(5.4)式，因此证明了定理 5.10的结论(1). 上述证明过程还说明，若某个特征向量的第k 个分量的模最大，则相应的特征值必定属于第k 个圆盘中.根据定理5.2，还可以按照矩阵的每一列元素定义n 个圆盘，对于它们定理5.10仍然成立. 下面的定理是圆盘定理的重要推论，其证明留给感兴趣的读者.定理5.11：设A ∈ℝn×n ，且A 的对角元均大于0，则(1) 若A 严格对角占优，则A 的特征值的实部都大于0.(2) 若A 为对角占优的对称矩阵，则A 一定是对称半正定矩阵，若同时A 非奇异，则A 为对称正定矩阵.例5.3 (圆盘定理的应用)：试估计矩阵A =[41010−111−4]的特征值范围.[解]: 直接应用圆盘定理，该矩阵的三个圆盘如下:D 1: |λ−4|≤1, D 2: |λ|≤2, D 3: |λ+4|≤2.D 1与其他圆盘分离，则它仅含一个特征值，且必定为实数（若为虚数则其共轭也是特征值，这与D 1仅含一个特征值矛盾）. 所以对矩阵特征值的范围的估计是：3≤λ1≤5,λ2,λ3∈D 2∪D 3 .再对矩阵A T 应用圆盘定理，则可以进一步优化上述结果. 矩阵A T 对应的三个圆盘为： D ’1: |λ−4|≤2, D ’2: |λ|≤2, D ’3: |λ+4|≤1.这说明D ’3中存在一个特征值，且为实数，它属于区间[-5, -3]，经过综合分析可知三个特征值均为实数，它们的范围是：λ1∈[3,5],λ2∈[−2,2],λ3∈[−5,−3].事实上，使用Matlab 的eig 命令可求出矩阵A 的特征值为：4.2030, -0.4429, -3.7601.根据定理5.5，还可以对矩阵A 做简单的相似变换，例如取X 为对角阵，然后再应用圆盘定理估计特征值的范围.例5.4 (特征值范围的估计)：选取适当的矩阵X ，应用定理5.5和5.10估计例5.3中矩阵的特征值范围.[解]: 取X−1=[100010000.9] , 则A 1=X −1AX =[41010−109⁄0.90.9−4]的特征值与A 的相同. 对A 1应用圆盘定理，得到三个分离的圆盘，它们分别包含一个实特征值，由此得到特征值的范围估计：λ1∈[3,5],λ2∈[−199,199],λ3∈[−5.8,−2.2]. 此外，还可进一步估计ρ(A)的范围，即3≤ρ(A)≤5.8 .上述例子表明，综合运用圆盘定理和矩阵特征值的性质（如定理5.2, 定理5.5），可对特征值的范围进行一定的估计. 对具体例子，可适当设置相似变换矩阵，尽可能让圆盘相互分离，从而提高估计的有效性.5.2幂法与反幂法幂法是一种计算矩阵最大的特征值及其对应特征向量的方法. 本节介绍幂法、反幂法以及加快幂法迭代收敛的技术.5.2.1幂法定义5.5：在矩阵A 的特征值中，模最大的特征值称为主特征值，也叫“第一特征值”，它对应的特征向量称为主特征向量.应注意的是，主特征值有可能不唯一，因为模相同的复数可以有很多. 例如模为5的特征值可能是5,−5,3+4i,3−4i , 等等. 另外，请注意谱半径和主特征值的区别.如果矩阵A 有唯一的主特征值，则一般通过幂法能方便地计算出主特征值及其对应的特征向量. 对于实矩阵，这个唯一的主特征值显然是实数，但不排除它是重特征值的情况. 幂法(power iteration)的计算过程是，首先任取一非零向量v 0∈ℝn ，再进行迭代计算：v k =Av k−1,(k =1,2,⋯)得到向量序列{v k }，根据它即可求出主特征与特征向量. 下面用定理来说明.定理5.12: 设A ∈ℝn×n ，其主特征值唯一，记为λ1，且λ1的几何重数等于代数重数，则对于非零向量v 0∈ℝn ，v 0不与主特征值对应的特征向量正交，按迭代公式进行计算：v k =Av k−1,(k =1,2,⋯),存在如下极限等式：lim k→∞v k λ1k =x 1 , (5.6) lim k→∞(v k+1)j (v k )j =λ1 , (5.7)其中x 1为主特征向量，(v k )j 表示向量v k 的第j 个分量(k =1,2,⋯).[证明]: 为了推导简便，不妨设主特征值λ1不是重特征值，并且假设矩阵A 为非亏损矩阵. 设A 的n 个特征值按模从大到小排列为: |λ1|>|λ2|≥⋯≥|λn |，它们对应于一组线性无关的单位特征向量x ̂1,⋯,x ̂n . 向量v 0可写成这些特征向量的线性组合：v 0=α1x̂1+⋯+αn x ̂n 根据已知条件，α1≠0，则v k =Av k−1=A k v 0=α1λ1k x ̂1+α2λ2k x̂2+⋯+αn λn k x ̂n =λ1k [α1x ̂1+∑αj (λj λ1)kx ̂j n j=2] =λ1k (α1x̂1+εk ) 其中εk =∑αj (λj λ1)k x ̂j n j=2. 由于|λj λ1|<1,(j =2,…,n), 则 lim k→∞εk =0 ⟹lim k→∞v kλ1k =α1x̂1 . 由于特征向量放大、缩小任意倍数后仍是特征向量，设x 1=α1x̂1，则它是主特征对应的一个特征向量. 上式说明，随k 的增大， v k 越来越趋近于主特征值的对应的特征向量.设j 为1到n 之间的整数，且(v k )j ≠0，则(v k+1)j (v k )j =λ1(α1x ̂1+εk+1)j (α1x̂1+εk )j 由于lim k→∞εk =0，随k 的增大上式等号右边趋于一个常数: λ1. 这就证明了定理的结论.若矩阵A 为亏损矩阵，可利用矩阵的若当分解证明这个定理，这里略去. 在这种情况下，“主特征值的几何重数等于代数重数”这一条件很重要，例如，若A =[310030001] ,它的主特征值为3，但其几何重数为1，不满足条件. 对这个矩阵A 进行实验显示无法用幂法求出主特征值.关于定理5.12，再说明几点：● 当主特征值λ1为重特征值时，应要求其几何重数等于代数重数，此时特征子空间维数大于1，向量序列{v k λ1k ⁄}的收敛值是其特征子空间中的某一个基向量.● 公式(5.7)式的含义是相邻迭代向量分量的比值收敛到主特征值. 因此在实际计算时，可任意取j 的值，只需保证比值的分母不为零.● 证明中假设了α1≠0，在实际应用中往往随机选取v 0，由于存在舍入误差，它一般都能满足. 感兴趣的读者也可思考一下，若初始向量v 0恰好与主特征向量都正交，那么幂法中的迭代向量序列会有什么结果？直接使用幂法，还存在如下两方面问题：(1) 溢出：由于v k ≈λ1k x 1，则|λ1|>1时，实际计算v k 会出现上溢出（当k 很大时）；|λ1|<1时，实际计算v k 会出现下溢出（当k 很大时）.(2) 可能收敛速度很慢. 由于εk =∑αj (λj λ1)kx j n j=2， εk →0的速度取决于求和式中衰减最慢的因子|λ2λ1|，当|λ2λ1|≈1时，收敛很慢. 由此导致v k →λ1k α1x 1, (v k+1)j (v k )j →λ1的收敛速度都将很慢，严重影响计算的效率.下面采用规格化向量的技术防止溢出，导出实用的幂法. 关于加速收敛技术的讨论，见下一小节.定义 5.6：记max ̅̅̅̅̅̅(v )为向量v ∈ℝn 的绝对值最大的分量， max ̅̅̅̅̅̅(v )=v j ，其中j 满足|v j |=max 1≤k≤n |v k |, 若j 的值不唯一，则取最小的那个. 并且，称u =v/max ̅̅̅̅̅̅(v )为向量v 的规格化向量(normalized vector).例5.5（规格化向量）：设v =[3,−5,0]T ，max ̅̅̅̅̅̅(v )=−5，对应的规格化向量为u =[−35,1,0]T .根据定义5.6，容易得出规格化向量的两条性质.定理5.13: 定义5.6中的规格化向量满足如下两条性质：(1) 若u 为规格化向量，则‖u ‖ =1，并且max ̅̅̅̅̅̅(u )=1.(2) 设向量v 1和v 2的规格化向量分别为u 1和u 2，若v 1=αv 2, 实数α≠0，则u 1= u 2.在幂法的每一步增加向量规格化的操作可解决溢出问题. 先看第一步，v 1=Av 0，此时计算v 1的规格化向量u 1=v 1max ̅̅̅̅̅̅(v 1)=Av 0max ̅̅̅̅̅̅(Av 0). 然后使用规格化向量计算v 2:v 2=Au 1=A 2v 0max ̅̅̅̅̅̅(Av 0), (5.8) 再进行向量规划化操作，u 2=v 2max ̅̅̅̅̅̅(v 2)=A 2v 0max ̅̅̅̅̅̅(A 2v 0). (5.9) 公式(5.9)的推导，利用了(5.8)式和定理5.13的结论(2). 依次类推，我们得到： { v k =Au k−1=A k v 0max ̅̅̅̅̅̅(A k−1v 0) u k =v k max ̅̅̅̅̅̅(v k )=A k v 0max ̅̅̅̅̅̅(A k v 0) , k =1,2,⋯. (5.10) 根据定理5.12的证明过程， A k v 0=λ1k [α1x ̂1+∑αj (λj λ1)k x ̂j n j=2] ⟹u k =A k v 0max ̅̅̅̅̅̅(A k v 0)=α1x ̂1+∑αj (λj λ1)k x ̂j n j=2max ̅̅̅̅̅̅(α1x ̂1+∑αj (λj λ1)k x ̂j n j=2)k→∞→ x 1max ̅̅̅̅̅̅(x 1) , 即u k 逐渐逼近规格化的主特征向量. 同理，v k =Au k−1=A k v 0max ̅̅̅̅̅̅(A k−1v 0)=λ1k [α1x ̂1+∑αj (λj λ1)k x ̂j n j=2]max ̅̅̅̅̅̅(λ1k−1[α1x ̂1+∑αj (λj λ1)k−1x̂j n j=2]) =λ1α1x ̂1+∑αj(λj λ1)kx ̂j n j=2max ̅̅̅̅̅̅(α1x ̂1+∑αj (λj λ1)k−1x ̂j n j=2) 因此，根据定理5.13的结论(1)有：lim k→∞v k=λ1x1max̅̅̅̅̅̅(x1)⟹limk→∞max̅̅̅̅̅̅(v k)=λ1.基于上述推导，我们得到如下定理，以及如算法5.1描述的实用幂法.定理5.14: 设A∈ℝn×n，其主特征值唯一（且几何重数等于代数重数），记为λ1，取任意非零初始向量v0=u0，它不与主特征值对应的特征向量正交，按迭代公式(5.10)进行计算，则lim k→∞u k=x1max̅̅̅̅̅̅(x1),(5.11)lim k→∞max̅̅̅̅̅̅(v k)=λ1 ,(5.12)其中x1为主特征向量.算法5.1：计算主特征值λ1和主特征向量x1的实用幂法输入：v,A; 输出：x1,λ1.u:=v;While不满足判停准则dov:=Au;λ1:=max̅̅̅̅̅̅(v); {主特征值近似值}u:=v/λ1; {规格化}Endx1:=u. {规格化的主特征向量}在算法5.1中，可根据相邻两步迭代得到的主特征值近似值之差来判断是否停止迭代. 每个迭代步的主要计算是算一次矩阵与向量乘法，若A为稀疏矩阵则可利用它的稀疏性提高计算效率. 实用的幂法保证了向量序列{v k},{u k}不溢出，并且向量v k的最大分量的极限就是主特征值.最后，针对幂法的适用范围再说明两点：(1). 若实矩阵A对称半正定或对称半负定，则其主特征值必唯一（而且是非亏损阵）. 有时也可以估计特征值的分布范围，从而说明主特征值的唯一性. 只有满足此条件，才能保证幂法的收敛性.(2). 对一般的矩阵，幂法的迭代过程有可能不收敛，此时序列{u k}有可能包括多个收敛于不同向量的子序列，它趋向于成为多个特征向量的线性组合. 但是，一旦幂法的迭代过程收敛，向量序列的收敛值就一定是特征向量，并可求出相应的特征值.例5.6 (实用的幂法)：用实用的幂法求如下矩阵的主特征值：A=[3113] ,[解]: 取初始向量为v0=u0=[01]T . 按算法5.1的迭代过程，计算结果列于表5-1中.表5-1 实用幂法的迭代计算过程从结果可以看出，在每次迭代步中做的规格化操作避免了分量的指数增大或缩小. 经过9步迭代，特征值max ̅̅̅̅̅̅(v k )已非常接近主特征值的准确值4，特征向量也非常接近[1 1]T .5.2.2加速收敛的方法加速幂法迭代收敛过程的方法主要有两种：原点位移技术和瑞利商（Rayleigh quotient ）加速. 下面做些简略的介绍.一. 原点位移技术原点位移技术，也叫原点平移技术，它利用定理5.9的结论(2)，即矩阵A −pI 的特征值为A 的特征值减去p 的结果. 对矩阵B =A −pI 应用幂法有可能得到矩阵A 的某个特征值λj 和相应的特征向量. 要使原点位移达到理想的效果，首先要求λj −p 是B 的主特征值，其次还要使幂法尽快收敛，即比例|λ2(B)λj −p |要尽量小，这里的λ2(B)表示矩阵B 的（按模）第二大的特征值. 在某种情况下设置合适的p 值，矩阵A,B 可同时取到主特征值. 图5-3显示了这样一个例子，矩阵A 的特征值分布在阴影区域覆盖的实数轴上，λ1为其主特征值. 按图中所示选取的p 值，将使得λ1−p 是矩阵B =A −pI 的主特征值，并且显然有|λ2(B)λ1−p |<|λ2(A)λ1| . 此时用幂法计算B 的主特征值能更快地收敛，进而得到矩阵的A 的主特征值. 图5-3也解释了原点位移法名字的由来，即将原点（或虚数坐标轴）移到p 的位置上，原始矩阵A 的特征值分布变成了矩阵B 的特征值分布.采用原点位移技术后，执行幂法仅带来很少的额外运算，而且仍然能利用矩阵A 的稀疏性. 它的关键问题是，如何选择合适的参数p 以达到较好的效果？这依赖于具体矩阵的情况，以及对其特征值分布的了解. 在后面，我们还会看到原点位移技术的其他用途.二. 瑞利商加速首先给出瑞利商的定义，以及它与特征值的关系，然后介绍瑞利商加速技术.定义5.7：设A ∈ℝn×n ，且为对称矩阵，对任一非零向量x ≠0，称R (x )=〈Ax,x 〉〈x,x 〉为对应于向量x 的瑞利商（Rayleigh quotient ）. 这里符号〈,〉代表向量内积.定理5.15：设A ∈ℝn×n ，且为对称矩阵，其n 个特征值依次为：λ1≥λ2≥⋯≥ λn ，则矩阵A 有关的瑞利商的上下确界分别为λ1和λn . 即∀x ≠0,λn ≤R (x )≤λ1,且当x 为λ1对应的特征向量时R (x )=λ1，当x 为λn 对应的特征向量时R (x )=λn .[证明]: 根据实对称矩阵的特点，即可正交对角化（定理3.3），设特征值λ1,λ2,⋯,λn 对应的单位特征向量为x 1,x 2,⋯,x n ，设x =∑αj x j n j=1，则〈x,x 〉=〈∑αj x j n j=1,∑αj x j n j=1〉=∑αj 2n j=1，而图5-3 原点位移技术示意图.。

求矩阵的特征值与特征向量

x (1,1, ,1) xi x mk max i (k ) x(k ) x(k ) y mk x x ( k 1) Ay( k )
(0) T

迭代条件：
y ( k ) y ( k 1)

1
计算结果：
1 mk
u1 y
k k x( k ) Ax( k 1) 11 u1 2k u 2 2 n nun )
k k 2 n k 1 1u1 2 u u n 2 n 1 1
xHale Waihona Puke k )5.1.2 幂法的计算公式

分三种情况讨论： (1) 1 为实根，
且 1 2

x 1 x
( k 1) i (k ) i
, u1 x
1 2
(k )
(2) 1 为实根，且 1 2 及 2 3
xi( k 2 ) 1 ( k ) x i ( k 1) (k ) u1 x 1 x
给出初值x(0)，按迭代公式计算：x(k+1)=Ax(k) 根据迭代序列各分量的变化情况求根：

若各分量单调变化（相邻两个向量的各分量之比趋向于常数c），则按情况一处理。

若奇序列、偶序列的各个分量比趋于常数，则按情况二处理。若序列的各分量表现为其它情况，则结束。

5.1.3 幂法的实际计算公式
Ax( k 1) x( k ) , k 0,1,

实际计算公式：

(1)先对A作LU分解；（ LU分解的要点: ??） (2)再解方程组： ( k 1) (k )

计算矩阵的特征值和特征向量

若 A 有| 1 | | 2 | … > | n |，则
对应同样一组特征向量。
A1 的主特征根
如何计算
A的绝对值最小的特征根
x ( k 1) A1 x ( k )
解线性方程组
Ax ( k 1) x ( k )
规范化反幂法公式为
(k ) (k ) (k ) y x x ( k 1) (k ) Ax y
lim max( x ( k ) ) 1
k
（2）y(k)为相应于主特征值1的特征向量近似值
y ( k ) v1 , ( Av1 1v1 )
§2 反幂法
设ARnn可逆，则无零特征值，由
Ax x
有
( x 0)
A x
1
1

x
A1 有
1 1 … n n 1 1 1
xi( k 2) 2 lim ( k ) 1 k x i
收敛速度取决于 r 3 1 的程度。向量
1
x( k 1) 1x( k )
、
x ( k 1) 1 x ( k ) 分别为主特征值1、2相应的特征向量的近似值。
规范化乘幂法
对任取初始向量x(0)，记
Ak Pk Ak 1 PkT
(k 1, 2,)
1 1
其中Ak (k = 1, 2,…)仍是对称矩阵，Pk的形式
1 1 co s sin 1 1 sin co s i j

我们选取Pk，使得
k) a (pq 0
k 1 ) 2a (pq
，因此需使满足

五章矩阵的特征值和特征向量ppt课件

,n
的列(行)
向量都是单位向量且两两正交．
由此可知A的列向量组构成 Rn的一个标准正交基。
同样的方法，行向量组也是。
例3 判别下列矩阵是否为正交矩阵．
1
1 1
2
1 2 1
1 3 1 2,
1 3 1 2 1
解（2）由于
1
9 8
8 9 1
4
9 4
1
9 8
9 9
4 9
4 9
9 7 9
1 1
,
e2
2 2
,
,er
r r
,
那么 e1, e2 , , er为W的一个标准正交基 .
上述
由线
性无关
向量
组1
,,
构造
r
出正交
向量组1,, r的过程,称为施密特正交化过程 .
例1 用施密特正交化方法，将向量组
a1 (1,1,1,1)T , a2 (1, 1, 0, 4)T , a3 (3, 5,1, 1)T
9 4
9
所以它是正交矩阵．
2
1
9 8
8 9 1
4
9 4
.
9 9 9
4 9
4 9
7 9
8 9 1
4
9 4
T
1 0
0 1
0 0
9 4
9
9 7
9
0
0
1
提示：此法为定义法，利用定理3如何证明？
定理2 设A, B皆是n阶正交矩阵,则
1 A 1或1
2 AT 即A1 也是正交矩阵.
A1 x 1 x 故 1是矩阵A 1的特征值, 且x是A 1对应于 1

矩阵特征值的计算38页PPT

数值分析
第七章矩阵特征值的计算
—— 正交变换与QR 算法
王伟
2
主要内容
正交变换
Givens 变换 Householder 变换
Sturm序列与二分法 QR 算法
基本算法具有移位的QR算法
3
实对称阵特征值的计算
通过正交变换，将实对称矩阵约化为三对角阵，利用Sturm定理隔离特征值，最后用二分法求出所需特征值。
其中 = sgn(x1)||x||2, e1= (1, 0, ..., 0)T ， H uuT I
6
Givens 变换
定义：称矩阵i源自j为 Givens 变换，或旋转变换。
i j
7
Givens 变换
性质
(1) 只有四个元素与单位矩阵不同
(2) 正交： G1GT (3) 如果A是对称阵，则GAGT也是对称阵
(4) 用 G 左乘一个矩阵时，只改变该矩阵中两行的值 (5) 用 G 右乘一个矩阵时，只改变该矩阵中两列的值
a 12 2 .2361
1 0 0 0
G(2,4,)000
0.74750 01
0.66670
0.6667 0.70475
1 3
0
0
A 3G 2,4,A 2G T(2,4,) 0 0 3 2 0 0 ..3 1 .43 4 43 9 7 0 3 1 .2 4 1 247 0 0 .1 .2 1 34 3 9 31 3
14
Householder 变换
定义：设 wRn 且 wTw1，称矩阵
H wI2wwT
为Householder变换。
15
Householder 变换
性质
(1) 对称：HwT Hw (2) 正交：H w 1H w TH w (3) 对合：Hw2 I (4) 保模： Hwx2x2 (5) det(Hw)1

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

6
幂法
幂法（乘幂法，幂迭代）
计算矩阵的主特征值（按模最大）及其特征向量
假设：(1) |1| > |2| … |n| 0
(2) 对应的 n 个线性无关特征向量为：x1, x2, ..., xn
计算过程： (1) 任取一个非零向量 v0，要求满足 (x1,v0) 0 (2) 对 k = 1, 2, ... ，直到收敛，计算
4
圆盘定理
设 A=(aij)Rnn ，记

Di C

n
| aii |
aij
j1, ji
i=1, 2, ... , n
Gerschgorin 圆盘
定理：(Gerschgorin 圆盘定理) 设是 A 的特征值，则
n
Di
i 1
若有 m 的圆盘互相连通，且与其它圆盘都不相连，则这 m 个圆盘内恰好包含 m 个特征值。
vk Avk1
7
幂法的收敛性
收敛性分析设 v0 1x1 2 x2 n xn (1 0) v1 Av0 11x1 22 x2 nn xn
vk

Avk1
11k x1

k
22
x2

k
nn
xn

1k

1 x1
假设：(1) |1| |2| … |n-1| > |n| > 0
(2) 对应的 n 个线性无关特征向量为：x1, x2, ..., xn
A-1 的特征值为：
1
1

1
2

1 1
n1 n
对应的特征向量仍然为 x1, x2, ..., xn
反幂法：对矩阵 A-1 使用幂法
则由改进的幂法生成的向量满足
lim
k
uk

x1 , x1
lim
k
vk

1
13
举例
例：用改进的幂法计算下面矩阵的主特征值和对应的特征向量
1.0 1.0 0.5 A 1.0 1.0 0.25
0.5 0.25 2.0
ex81.m
14
幂法的加速
幂法的收敛速度取决于 r 2 的大小 1
当 r 接近于 1 时，乘幂法收敛会很慢！
幂法的加速：原点平移法
带位移的幂法
令 B = A – pI，则 B 的特征值为：i - p
选择适当的 p 满足： (1) | 1 p || j p | ( j = 2, ... , n )
(2) max j p 2 2 jn 1 p 1
uk
vk Akv0
vk vk 1

Akv0
Auk
Ak 1v0 Akv0

k1 1

1 x1

n
i
i2

i 1
k 1

xi

1k

1 x1

n
i
i2

i 1
k

xi

lim
k
vk

1
12
改进的幂法
改进的幂法
(1) 任取一个非零向量 v0，要求满足 (x1,v0) 0
(2) 对 k = 1, 2, ... ，直到收敛，计算
uk
vk , vk
vk1 Auk
定理：设 A 有 n 个线性无关的特征向量，其特征值满足
1 2 3 n
用幂法计算矩阵 B 的主特征值：1 - p
保持主特征值加快收敛速度
15
举例
例：用带位移的幂法计算下面矩阵的主特征值和对应的特征向
量，取 p=0.75
ex82.m
1.0 1.0 0.5 A 1.0 1.0 0.25
0.5 0.25 2.0
16
反幂法
反幂法
计算矩阵的按模最小的特征值及其特征向量
17
反幂法
反幂法
(1) 任取一个非零向量 v0，要求满足 (x1,v0) 0
(2) 对 k = 1, 2, ... ，直到收敛，计算

2

2 1
k

x2

n

n 1
k

xn

1k1 x1
2 1
越小，收敛越快
8
幂法的收敛性
当 k 充分大时，有
vk 1k1 x1 vk1 1k11 x1
vk1 1vk
又 vk1 Avk
vk1 j vk j

1 ( j =1, 2, ... , n )
Avk 1vk
vk 为 1 的近似特征向量
9
幂法的收敛性
定理：设 A 有 n 个线性无关的特征向量，其特征值满足
1 2 3 n
则由幂法生成的向量满足
lim,
lim (vk1 ) j k (vk ) j
5
Rayleigh 商
定理：设 A 是 n 阶实对称矩阵，其特征值为 1 2 n
则对任意非零向量 x，有
n

( Ax, x) (x, x)

1
且
1

max x0
( Ax, x) (x, x)
,
n

min x0
( Ax, x) (x, x)
R( x) ( Ax, x) 称为矩阵 A 关于 x 的 Rayleigh 商。 (x, x)
1
注：幂法的收敛速度取决于 2 的大小 1
10
幂法
幂法中存在的问题
vk 1k1 x1
, | 1 | 1 0, | 1 | 1
改进方法：规范化
vk1 Avk
uk
vk , vk
vk1 Auk
lim
k
uk

x1 x1
11
幂法
1 的计算
计算方法
第八章矩阵特征值计算
—— 幂法与反幂法
1
本章内容
特征值基本性质幂法与反幂法正交变换与矩阵分解 QR 方法
2
本讲内容
特征值基本性质幂法幂法的加速反幂法
3
特征值性质
特征值与特征向量
A x = x ( C, x 0 )
性质 (1) Ax x ( A I )x ( )x (2) Ax x Ak x k x (3) B P 1AP, Ax x By y, y P 1x (4) 若 A 对称，则存在正交矩阵 Q，使得 QT AQ diag(1, 2, , n )