第9章 矩阵特征值的数值解法
数值计算方法 9矩阵特征值的数值计算
两步算法的思路就是先利用初等反射阵批量约化消元的特点,将原始 矩阵用有限次的初等反射变换约化为与之正交相似的上Hessenberg阵, 然后使用平面旋转变换对实施算法构造相似矩阵序列,以求出亦即的 全部特征值。
4. 两步QR算法计算步骤
显然,初等反射矩阵H具有对称性和正交性,这样y=Hx是一个正交变换。 ➢初等反射变换主要用在以下两个方面: 等模反射变换 向量的约化消元
9.3 矩阵的QR分解
9.3.1 矩阵的初等反射变换
等模反射变换 定理9-3(等模反射定理)设x,y是两个互异的n维列向量,且2范数
相等,则存在一个初等反射阵H,使得Hx=y。 例9-11 等模反射变换。注意不唯一性。
p*Leabharlann 22n时,rB
max{ 2 p 1 p
,
n 1
p }最小。 p
例9-6,例9-7 原点平移加速。
2 原点平移的反幂法 ➢幂法与反幂法可以求矩阵的最大和最小特征值,对其他特征值就无
能为力了。但是可以将原点平移技术与反幂法结合起来,就可求 出任一个特征值(如果对所有的特征值有大概的估计的话)。
➢具体的作法:假设A在p附近有一个特征值,做原点平移B=A-pE, 用反幂法求B的最小特征值,给其加上p,就是要求的特征值。
例9-8,例9-9 原点平移加速。
9.3 矩阵的QR分解
9.3.1 矩阵的初等反射变换
➢ 矩阵的初等反射变换,又称镜面反射变换,或Householder(豪斯 荷尔德)变换,是一种正交变换。
9.4 QR算法
9.4.2 两步QR算法 2. 矩阵与上Hessenberg矩阵的正交相似 引入上Hessenberg阵的原因是,若对上Hessenberg阵进行分解,由 于的次对角线以下元素均为零,只需使用次构造方便的平面旋转变换 即可完成分解,显然这要比对一般矩阵进行分解简便得多。利用这个 特点给出的两步算法,可以降低基本算法的计算过程中对矩阵做分解 的计算量。
矩阵特征值问题的数值方法.
矩阵特征值问题的数值方法矩阵特征值设A 是n 阶矩阵,x 是非零列向量. 如果有数λ 存在,满足那么,称x 是矩阵A 关于特征值λ的特征向量. 很显然一般地有主特征值的乘幂迭代法设n 阶矩阵A 的n 个特征值按模从大到小排序为:n 其对应的n 个线性无关的特征向量分别为:设是任意一个非零的n 维向量,则:假设,构造一个向量序列:则:或者:当时:如果是矩阵A 的关于特征值的一个特征向量,特征值个特征那么对于任意一个给定的,也是特征值的特征向量。
所以,是对主特征值对应的特征向量的近似。
如果则会变得很大或者如果,则会变得很大,或者如果,则会变得非常小,在实际计算中,为避免这种情况的出现需对做归一化处理况的出现,需对做归一化处理:由:左乘得:所以主特征值的近似值所以主特征值的近似值:残余误差向量定义为:当迭代次数充分大时,残余误差将充分小。
逆乘幂法:类似地,也可以求模最小特征值和对应的特征向量特征向量。
上述问题的主特征值问题就是矩阵A 的模最小特征值问题。
结果,逆乘幂法的迭代公式为:在实际应用中,无需计算逆矩阵,但需求解线性系统实对称矩阵的基本定理:对实对称矩阵A ,一定存在一个正交相似变换使得为对角矩阵且其对角矩阵P ,使得:为对角矩阵,且其对角的特征值元素为矩阵A 的特征值。
相似变换:相似变换保持矩阵特征值(但不是特征向量)不变不变。
(证明略)正交相似变换:中。
正交相似变换的例子—坐标旋转:叫旋转矩阵。
容易验证:。
适当选择旋转角,可消去xy 项—得到对角阵D 。
矩阵特征值问题的数值方法实对称矩阵的基本定理再看下面的例子:令:O 平面的坐标旋转变换适当同样地有:。
则是在x-O-z 平面的坐标旋转变换。
适当x z —D 。
选择旋转角可消去z 项得到对角阵实对称矩阵的Jacobi 方法:全部特征值和特征向量根据实对称矩阵的基本定理,求得矩阵A 的全部特征值的关键是找到正交相似变换矩阵P 使部特征值的关键,是找到正交相似变换矩阵P ,使得为对角阵。
(完整word版)第9章 矩阵特征值的数值解法
第9章 矩阵特征值的数值解法9.1 引言矩阵特征值问题有广泛的应用背景. 例如动力系统和结构系统中的振动问题、电力系统的静态稳定分析上、工程设计中的某些临界值的确定等,都归结为矩阵特征值问题. 数学中诸如方阵的对角化及解微分方程组等问题,都要用到特征值的理论. 本章介绍n 阶实矩阵n n ⨯∈R A 的特征值与特征向量的数值解法.定义9.1.1 已知n 阶实矩阵()n n ij a ⨯=∈R A ,如果存在常数λ和非零向量x ,使λ=Ax x 或 ()λ-=0A I x (9.1.1)那么称λ为A 的特征值(eigenvalue),x 为A 的相应于λ的特征向量(eigenvector). 多项式111212122212()det()n n n n n nn a a a a a a p a a a λλλλλ-⎡⎤⎢⎥-⎢⎥=-=⎢⎥⎢⎥-⎣⎦A I (9.1.2)称为特征多项式(characteristic polynomial),det()0λ-=A I (9.1.3)称为特征方程(characteristic equation).注 式(9.1.3)是以λ为未知量的一元n 次代数方程,()det()n p λλ=-A I 是λ的n 次多项式. 显然,A 的特征值就是特征方程(9.1.3)的根. 特征方程(9.1.3)在复数范围内恒有解,其个数为方程的次数(重根按重数计算),因此n 阶矩阵A 在复数范围内有n 个特征值. 除特殊情况 (如2,3n =或A 为上(下)三角矩阵)外,一般不通过直接求解特征方程(9.1.3)来求A 的特征值, 原因是这样的算法往往不稳定. 在计算上常用的方法是幂法与反幂法和相似变换方法. 本章只介绍求矩阵特征值与特征向量的这两种基本方法. 为此将一些特征值和特征向量的性质列在此处.定理9.1.2 设n 阶方阵()ij n n a ⨯=A 的特征值为12,,,n λλλ,那么(1) 121122n nn a a a λλλ+++=+++;(2) 12det n λλλ=A .定理9.1.3 如果λ是方阵A 的特征值,那么(1) kλ是kA 的特征值,其中k 是正整数;(2) 当A 是非奇异阵时,1λ是1-A 的特征值. (3) ()n p λ是()n p A 的特征值,其中()n p x 是多项式2012()n n n p x a a x a x a x =++++.定义9.1.4 设,A B 都是n 阶方阵. 若有n 阶非奇异阵P ,使得1-=P AP B ,则称矩阵A 与B 相似(similar),1-P AP 称为对A 进行相似变换(similarity transformation),P 称为相似变换矩阵(similarity transformation matrix).定理9.1.5 若矩阵A 与B 相似,则A 与B 的特征值相同. 定理9.1.6 如果A 是n 阶正交矩阵,那么 (1) 1T -=A A ,且det 1=A 或1-; (2) 若=y Ax ,则22=yx , 即T T ⋅=⋅x x y y .定理9.1.7 设A 是任意n 阶实对称矩阵,则 (1) A 的特征值都是实数; (2) A 有n 个线性无关的特征向量.定理9.1.8 设A 是任意n 阶实对称矩阵,则必存在n 阶正交矩阵P ,使得1T -==P AP P AP Λ,其中12diag(,,,)n λλλ=Λ是以A 的n 个特征值12,,,n λλλ为对角元素的对角矩阵.定理9.1.9 (圆盘定理) 矩阵()ij n n a ⨯=A 的任意一个特征值至少位于复平面上的几个圆盘1,2,,n ,中的一个圆盘上。
矩阵特征值的计算
矩阵特征值的计算一、特征值的定义和性质矩阵A的特征值是指满足下列条件的数λ:存在一个非零向量x,使得Ax=λx,即为矩阵A作用在向量x上的结果是该向量的数量倍,其中λ为特征值。
定义特征值之后,可以证明如下性质:1.相似矩阵具有相同的特征值;2.矩阵的特征值个数等于矩阵的阶数;3.特征值可以是实数也可以是复数;4.如果一个矩阵的特征向量独立,则该矩阵可对角化。
二、特征值的计算方法特征值的计算方法有多种,包括直接计算、特征向量迭代法等。
以下介绍两种常用的方法,分别是雅可比法和幂法。
1.雅可比法雅可比法是最基本和最直接的求解特征值和特征向量的方法。
首先,构造一个对称阵J,使其主对角线元素等于矩阵A的主对角线元素,非对角线元素等于矩阵A的非对角线元素的平方和的负数。
然后,对J进行迭代计算,直到满足迭代终止条件。
最终得到的J的对角线元素就是矩阵A 的特征值。
雅可比法的优点是计算量相对较小,算法比较简单,可以直接计算特征值和特征向量。
但是,雅可比法的收敛速度较慢,对于大规模矩阵的计算效率较低。
2.幂法幂法是一种迭代算法,用于计算矩阵的最大特征值和对应的特征向量。
首先,随机选择一个非零向量b作为初值。
然后,迭代计算序列b,A*b,A^2*b,...,直到序列趋向于收敛。
最终,特征值是序列收敛时的特征向量的模长,特征向量是序列收敛时的向量。
幂法的优点是可以计算矩阵的最大特征值和对应的特征向量。
此外,幂法对于大规模矩阵的计算效率较高。
然而,幂法只能计算最大特征值,对于其他特征值的计算不适用。
三、特征值的应用1.特征值分解特征值分解是将一个矩阵分解为特征值和特征向量构成的对角矩阵的乘积。
特征值分解是一种重要的矩阵分解方法,它在信号处理、图像压缩、最优化等领域有广泛应用。
通过特征值分解,可以对矩阵进行降维处理、数据压缩和特征提取等操作。
2.矩阵的谱半径矩阵的谱半径是指矩阵的所有特征值的模的最大值。
谱半径在控制系统、网络分析和量子力学等领域有广泛的应用。
矩阵特征值的求法举例
矩阵特征值的求法举例
矩阵的特征值是线性代数中一个非常重要的概念,它对于矩阵的性质和求解问题具有
重要意义。
特征值是一个数,它可以通过解一个特征方程来求得,特征方程是一个关于特
征值的多项式方程。
下面我们将通过几个具体的例子来介绍矩阵特征值的求法。
假设我们有一个2×2矩阵A,其元素如下所示:
A = |a b|
|c d|
我们希望求解矩阵A的特征值。
我们将矩阵A减去一个单位矩阵的倍数,得到新的矩阵B:
B = A - λI
λ是一个未知的数,I是单位矩阵。
具体地,我们有:
接下来,我们需要求解特征方程,即求解方程|B| = 0。
|a-λ b | = (a-λ)(d-λ) - bc = 0
|c d-λ|
展开计算得到:
这个二次方程就是特征方程。
根据一元二次方程的求解公式,我们有:
λ = [(a+d) ± √((a+d)^2 - 4(ad-bc)) ] / 2
这里,√表示开方。
通过求解该二次方程,我们就能够求得矩阵A的特征值。
具体的计算过程比较复杂,可以使用数值方法(如牛顿法)来求解,或者使用专门的
软件工具进行计算。
总结:
通过以上两个例子,我们可以看到求解矩阵特征值的过程其实就是求解一个代数方程
的过程。
对于小规模的矩阵,我们可以通过手工计算来得到特征值,但对于大规模的矩阵,
通常需要借助计算机来进行计算。
矩阵特征值的求法对于理解和应用线性代数有着重要的意义,它在很多领域(如数学、物理、金融等)中都有广泛的应用。
矩阵特征值的数值解法
矩阵特征值的数值解法矩阵的特征值是在矩阵与其特征向量之间的关系中的数值解。
特征值在各个领域中都有广泛应用,包括物理、工程、金融等。
在解决实际问题时,我们经常需要计算矩阵的特征值,因此研究如何求解矩阵特征值的数值方法是非常重要的。
1. 幂迭代法(Power Iteration)幂迭代法是求解矩阵特征值的一种简单而常用的数值方法。
它的基本思想是通过不断迭代矩阵与向量的乘积,使得向量趋近于该矩阵的一个特征向量。
具体步骤如下:(1)初始化一个非零的初始向量x。
(2)进行迭代计算,即$x^{(k+1)}=Ax^{(k)}/,Ax^{(k)},$。
(3)当向量x的相对误差小于一些预设的精度要求时,停止迭代,此时的x即为矩阵A的一个特征向量。
(4)将x带入特征值的定义式$\frac{Ax}{x}$,计算出特征值。
幂迭代法的优点是简单易实现,计算速度较快,缺点是只能求解特征值模最大的特征向量,而且对于存在特征值模相近的情况,容易收敛到错误的特征值上。
2. QR迭代法(QR Iteration)QR迭代法是一种较为稳定的求解矩阵特征值的数值方法。
它的基本思想是通过不断进行QR分解,使得矩阵的特征值逐渐收敛。
具体步骤如下:(1)将矩阵A进行QR分解,得到正交矩阵Q和上三角矩阵R,令$A_1=RQ$。
(2)将$A_1$再次进行QR分解,得到新的矩阵$A_2=R_1Q_1$。
(3)重复步骤(2),直到得到收敛的矩阵$A_k$,此时$A_k$的对角线上的元素即为矩阵A的特征值。
QR迭代法的优点是对于特征值模相近的情况仍然能够收敛到正确的特征值上。
缺点是每次QR分解都需要消耗大量的计算量,迭代次数较多时计算速度较慢。
3. Jacobi迭代法(Jacobi's Method)Jacobi迭代法是一种通过对称矩阵的对角线元素进行迭代操作,逐步将非对角元素变为零的求解特征值的方法。
具体步骤如下:(1)初始化一个对称矩阵A。
求矩阵特征值的方法
求矩阵特征值的方法矩阵特征值是线性代数中一个非常重要的概念,对于矩阵的特征值和特征向量的求解是解线性代数问题和应用的关键之一。
下面将从基本概念、性质、求解方法等方面全面介绍矩阵特征值的方法。
一、基本概念矩阵特征值是指对于一个n阶矩阵A,存在常数λ,使得线性方程组(A-λI)x = 0有非零解x存在。
其中,I是n阶单位矩阵。
λ称为矩阵A的特征值,而满足(A-λI)x = 0的非零向量x称为A的对应于特征值λ的特征向量。
二、性质1. 矩阵A和其转置矩阵A^T具有相同的特征值,但对应的特征向量不同。
2. 矩阵的特征值是与矩阵的倍数无关的。
3. n阶矩阵A的特征值个数不超过n个,包括相同特征值重数。
即重特征值可以有多个线性无关的特征向量。
4. 矩阵的特征向量是线性无关的。
三、求解方法1. 特征值的定义法根据特征值的定义,我们将(A-λI)x = 0进行变换,得到(A-λI)x = 0,即(A-λI)x = 0。
利用行列式的性质求解此方程,得到特征值λ的值,再带入方程组中求解特征向量。
2. 特征值的代数重数和几何重数特征值λ是使(A-λI)x = 0有非零解的λ值,λ称为矩阵的代数重数。
而对应特征值λ的解向量x称为矩阵的特征多项式的零空间,零空间的维数称为矩阵的几何重数。
通常,代数重数大于等于几何重数。
3. 矩阵的特征向量特征向量是矩阵A与特征值λ的关联,通过求解(A-λI)x = 0可以得到特征向量。
特征向量是在特征值确定的情况下,通过解方程组取出的非零向量。
4. 特征值和特征向量的计算法常用的计算特征值和特征向量的方法有幂法、反幂法、QR方法、稀疏特征问题求解方法等。
(1)幂法幂法是求解矩阵最大特征值和特征向量的一种迭代方法。
首先初始化一个非零向量b0,然后进行迭代计算,直到满足迭代终止条件。
迭代过程为:b(k+1) = A*b(k),其中b(k)表示第k次迭代后的向量。
最后得到的向量b即为矩阵A的最大特征值对应的特征向量。
矩阵特征值问题的数值计算
矩阵特征值问题的计算方法特征值问题:A V=λV¾直接计算:A的阶数较小,且特征值分离得较好 特征值:det(λI-A)=0,特征向量:(λI-A)V=0¾迭代法:幂法与反幂法¾变换法:雅可比方法与QR方法内容:一、 特征值的估计及其误差问题二、 幂法与反幂法三、 雅可比方法四、 QR方法一、 特征值的估计及其误差问题 (一)特征值的估计结论 1.1:n 阶矩阵()ij n n A a ×=的任何一个特征值必属于复平面上的n 个圆盘:1,||||,1,2,ni ii ij j j i D z z a a i n =≠⎧⎫⎪⎪=−≤=⎨⎬⎪⎪⎩⎭∑"(10.1) 的并集。
结论1.2:若(10.1)中的m个圆盘形成一个连通区域D,且D与其余的n-m个圆盘不相连,则D中恰有A的m个特征值。
(二)特征值的误差问题结论1.3:对于n 阶矩阵()ij n n A a ×=,若存在n 阶非奇异矩阵H ,使得11(,,)n H AH diag λλ−=Λ=", (10.2)则11min ||||||||||||||i p p p i nH H A λλ−≤≤−≤∆ (10.3)其中λ是A A +∆的一个特征值,而(1,,)i i n λ="是A 的特征值,1,2,p =∞。
结论1.4:若n 阶矩阵A 是实对称的,则1min ||||||i p i nA λλ≤≤−≤∆。
(10.4)注:(10.4)表明,当A 是实对称时,由矩阵的微小误差所引起的特征值摄动也是微小的。
但是对于非对称矩阵而言,特别是对条件数很大的矩阵,情况未必如此。
二、 幂法与反幂法(一) 幂法:求实矩阵按模最大的特征值与特征向量假设n 阶实矩阵A 具有n 个线性无关的特征向量,1,iV i n =",则对于任意的0nX R ∈,有 01ni ii X a V ==∑,从而有01111112((/))n nk k k i i i i ii i nk k i i i i A X a A V a V a V a V λλλλ======+∑∑∑.若A 的特征值分布如下:123||||||||n λλλλ>≥≥≥",则有01111()k kk A X a V λλ→∞⎯⎯⎯→为对应的特征向量须注意的是,若1||1λ<,则10kλ→,出现“下溢”,若1||1λ>,则1kλ→∞,出现“上溢”,为避免这些现象的发生,须对0kA X 进行规范化。
矩阵特征值的求法
矩阵特征值的求法矩阵的特征值是在线性代数中一个非常重要的概念,它在许多领域都有广泛的应用。
特征值的求法有多种方法,其中最常用的是特征多项式的求解方法、特征向量迭代方法和QR分解方法。
下面将详细介绍这三种方法的原理和步骤。
1.特征多项式的求解方法:特征多项式是指一个与矩阵A有关的多项式,它的根就是矩阵A的特征值。
求解特征多项式的步骤如下:(1)设A是n阶方阵,特征多项式为f(λ)=,A-λI,其中λ是待求的特征值,I是单位矩阵。
(2)计算行列式,A-λI,展开成代数余子式的和:A-λI, = (a11-λ)(a22-λ)...(ann-λ) - a12...an1(a21-λ)(a33-λ)...(ann-λ) + ..(3)将上式化简为f(λ)=0的形式,得到特征多项式。
(4)求解特征多项式f(λ)=0,得到矩阵A的所有特征值。
2.特征向量迭代方法:特征向量迭代方法的基本思想是利用矩阵A的特征向量的性质来逐步逼近特征值的求解。
具体步骤如下:(1)选取一个n维向量x0作为初始向量。
(2)通过迭代计算x1 = Ax0,x2 = Ax1,...,xn = Axn-1,直到向量序列xn趋于稳定。
(3)计算极限lim┬(n→∞)((xn)^T Axn)/(,xn,^2),得到特征值的估计值。
(4)将估计值代入特征方程f(λ)=,A-λI,=0中,求解特征方程,得到矩阵A的特征值。
3.QR分解方法:QR分解方法是将矩阵A分解为QR的形式,其中Q为正交矩阵,R为上三角矩阵。
特征值的求解步骤如下:(1)通过QR分解,将矩阵A分解为A=QR,其中Q为正交矩阵,R为上三角矩阵。
(2)将A表示为相似对角矩阵的形式,即A=Q'ΛQ,其中Λ为对角矩阵,其对角线上的元素就是特征值。
(3)求解Λ的对角线元素,即求解特征值。
需要注意的是,这三种方法各自有适用的情况和算法复杂度。
特征多项式的求解方法适用于任意阶数的方阵,但对于高阶矩阵来说计算量比较大;特征向量迭代方法适用于大型矩阵的特征值求解,但需要选取合适的初始向量;QR分解方法适用于方阵的特征值求解,但要求矩阵能够进行QR分解。
第9章矩阵特征值问题的数值方法
先看一个简单的例子.
设A
a11 a21
a12 a22
是二阶实对称矩阵,即a21=a12,
其特征值为λ1,λ2. 令
使得
RT
AR
1
1
记
R
cos sin
sin
cos
B
RT
AR
xH Ax xH x
i
又由定理9.2.2,对任意x≠0,有
1
max
xCni1且x 0
xH Ex xH x
n
从而有 i i 1
另一方面, A=(A+E)-E. 记 1 2 E的特征值,那么, i ni1
为n 矩阵-
重复上面的过程,可得 i i 1
9.2.2 极值定理
定理9.2.4(极值定理) 设Hermite矩阵的n个特 征值为 1 2 ... n,其相应的标准酉交
特征向量为u1, u2 ,..., un. 用Ck表示酉空间
Cn中任意的k维子空间,那么
k
max min R(x) Ck xCk且x0
或
k
max min R(x) Cnk1 xCnk1且x0
Cni1
是由ui,ui+1,…,un生成的n-i+1维子空间.
对 Cni1中任意非零向量x,由极值定理,有
i
max
xCni1且x 0
xH (A E)x xH x
xH Ax
矩阵特征值的详细求法
矩阵特征值的详细求法
特征值的和等于迹。
矩阵的特征多项式xe-a,把行列式展开,是一个n次多项式,由根系关系可得;特征值的和就等于多项式得根得和,是第n-1次项的系数,是
a11+a22+`````+ann。
总之,把那个行列式展开,比较系数即可。
设a是n阶方阵,如果数λ和n维非零列向量x使关系式ax=λx成立,那么这样的
数λ称为矩阵a特征值,非零向量x称为a的对应于特征值λ的特征向量。
式ax=λx
也可写成( a-λe)x=0。
这是n个未知数n个方程的齐次线性方程组,它有非零解的充分
必要条件是系数行列式| a-λe|=0。
所以就是等同于的关系。
矩阵的迹性质:
(1)建有n阶矩阵a,那么矩阵a的迹(用tr(a)则表示)就等同于a的特征值的总和,也即为矩阵a的主对角线元素的总和。
1、迹是所有对角元素的和
2、迹是所有特征值的和
3、某些时候也利用tr(ab)=tr(ba)来求迹
4、tr(ma+nb)=m tr(a)+n tr(b)
(2)奇异值分解(singular value decomposition )
奇特值水解非常有价值,对于矩阵a(p*q),存有u(p*p),v(q*q),b(p*q)(由对角
阵与生员行及或列于共同组成),满足用户a = u*b*v
u和v中分别是a的奇异向量,而b是a的奇异值。
aa'的特征向量组成u,特征值组
成b'b,a'a的特征向量组成v,特征值(与aa'相同)组成bb'。
因此,奇异值分解和特
征值问题紧密联系。
如果a是复矩阵,b中的奇异值仍然是实数。
求矩阵特征值的方法
求矩阵特征值的方法矩阵特征值是矩阵在线性代数中的重要概念之一,它在很多数学和物理问题中都有着重要的应用。
求解矩阵特征值的方法有很多种,下面将介绍常见的几种方法。
1. 通过特征方程求解:设A为一个n阶矩阵,I为n阶单位矩阵,如果存在一个非零向量x使得Ax=λx,其中λ为一个常数,则称λ为矩阵A的一个特征值,x 为对应的特征向量。
特征方程为:A-λI =0。
对于一个n阶矩阵,特征方程是一个n次多项式,其根即为特征值。
根据特征方程求解特征值的一般步骤为:(1) 计算特征方程A-λI =0中的行列式;(2) 求解特征方程,得到特征值。
2. 使用特征值分解:特征值分解是将一个矩阵分解成特征值和特征向量的乘积的形式。
对于一个n阶方阵A,如果存在一个可逆矩阵P和一个对角矩阵D,使得A=PDP^ -1,则称D为A的特征值矩阵,P为A的特征向量矩阵。
特征值分解的一般步骤为:(1) 求解矩阵A的特征值和对应的特征向量;(2) 将特征值按降序排列,将对应的特征向量按列排列,得到特征向量矩阵P;(3) 构造对角矩阵D,将特征值按对角线排列;(4) 计算可逆矩阵P的逆矩阵P^ -1;(5) 得到特征值分解A=PDP^ -1。
特征值分解方法对于对称矩阵和正定矩阵特别有用,可以将这些矩阵转化为对角矩阵,简化了矩阵的计算。
3. 使用幂迭代方法:幂迭代法是一种用于估计矩阵的最大特征值和对应特征向量的迭代方法。
它的基本思想是先任意给定一个非零向量,将其标准化得到单位向量,然后通过矩阵不断作用于该向量使其逐渐趋近于所求的特征向量。
幂迭代法的一般步骤为:(1) 随机选择一个初始向量x(0),其中x(0)的范数为1;(2) 迭代计算向量x(k+1) = A * x(k),直到x(k)收敛于所求的特征向量;(3) 使用向量x(k)计算特征值λ(k) = (A * x(k)) / x(k)。
幂迭代法的收敛性与初始向量的选择有关,在实际应用中通常需要进行多次迭代并取得多个结果进行比较,以获得较准确的特征值。
特征值的求法
特征值的求法
特征值是线性代数中的一个重要概念,主要用于描述矩阵的某些重要性质。
对于方阵,特征值可以通过求解特征多项式得到。
以下是特征值的基本求法:
1.写出矩阵A的特征多项式f(λ)。
对于n阶矩阵A,其特征多项式为f(λ)=|λE-A|,其中E是n阶单位矩阵。
2.求解特征多项式f(λ)=0的根,这些根就是矩阵A的特征值。
这个方程的解可能是一个或多个实数,也可能是复数。
3.对于每个解出的特征值λ,求解齐次线性方程组(λE-A)x=0的非零解x,这个解x就是对应于特征值λ的特征向量。
以上步骤是求解特征值和特征向量的基本方法。
需要注意的是,对于具体的矩阵,可能需要根据其特点选择合适的求解方法,例如对于大型稀疏矩阵,可能需要使用迭代法等数值方法求解特征值和特征向量。
此外,对于一些特殊的矩阵,如对称矩阵、反对称矩阵、正交矩阵等,其特征值和特征向量具有一些特殊的性质,可以利用这些性质简化求解过程。
以上信息仅供参考,如需更多信息,建议查阅线性代数相关书籍或咨询专业教师。
矩阵特征值的求法
矩阵特征值的求法
矩阵特征值是矩阵在特定方向上的伸缩比率,或者说是矩阵在某
些方向上的重要程度,因此它在数学中有很多的应用。
在这篇文章中,我们将介绍矩阵特征值的求法。
一、定义
矩阵特征值是矩阵 A 的特征多项式P(λ) 的根,即
P(λ)=det(A-λI)=0,其中 I 是单位矩阵,det 表示行列式。
该多项
式的阶数等于矩阵 A 的阶数。
二、求法
1. 直接计算
对于小阶的矩阵,可以直接求解特征多项式的根,得到特征值。
2. 特征值分解
对于大阶的矩阵,可以通过特征值分解的方式求得矩阵的特征值。
特征值分解是一种将矩阵分解为特征向量和特征值的方法,即矩阵
A=QΛQ^-1,其中 Q 是正交矩阵,Λ 是对角矩阵,其对角线上的元素
就是特征值。
3. 幂迭代法
幂迭代法是一种通过连续迭代计算矩阵 A 的最大特征值和对应
特征向量的方法。
该方法的基本思想是利用矩阵特征值的性质,通过
不断迭代对特征向量进行单调放缩,最终得到矩阵的最大特征值和对
应特征向量。
4. QR 分解法
QR 分解法是一种通过 QR 分解求解矩阵特征值和特征向量的方法。
该方法的基本思想是将矩阵 A 分解为一个正交矩阵 Q 和一个上
三角矩阵 R,即 A=QR,然后对 R 迭代求解特征值和特征向量。
三、总结
矩阵特征值的求法有多种方法,其中直接计算适用于小阶矩阵,
而特征值分解、幂迭代法和 QR 分解法则适用于大阶矩阵。
在实际应
用中,需要根据具体情况选择合适的方法,以便快速、准确地求解矩阵的特征值和特征向量。
矩阵特征值和特征向量的数值解
风险管理
在风险管理模型中,可以使用风 险矩阵的特征值和特征向量来分 析风险的分布和相关性,从而制 定有效的风险管理策略。
感谢您的观看
THANKS
稳定性分析通常通过比较不同数值解法的计算结果,观察其误差随舍入精 度的变化情况来进行。
稳定性好的算法能够在不同舍入精度下保持一致的计算结果,而稳定性差 的算法则可能导致计算结果的较大偏差。
数值解法的收敛性分析
01
收敛性分析是评估数值解法求解特征值和特征向量问题的有效 性的关键步骤。
02
收敛性分析主要关注算法是否能够收敛到正确的解,以及收敛
通过求解矩阵的特征值和特征向量,可以找到线性变换下的不变量,从而更好地理解和分析线性变换的 性质和行为。
特征值和特征向量在矩阵的奇异值分解和QR分解等矩阵分解方法中也有着重要的应用,这些分解方法在 许多科学计算和工程领域中都有广泛的应用。
在微分方程中的应用
01
矩阵特征值和特征向量在解决微分方程问题中也有着重要 的应用。
速度的快慢。
收敛速度的快慢通常用收敛阶数来衡量,收敛阶数越高,收敛
03
速度越快。
数值解法的误差估计
01
误差估计是对数值解法计算结果的精度进行量化的 重要手段。
02
误差估计通常通过比较数值解法的计算结果与精确 解之间的差异来进行。
03
误差估计可以帮助我们了解算法的精度,从而在实 际应用中选择合适的算法和舍入精度。
在研究热传导问题时,热传导矩阵的特征值和特 征向量可以用来确定温度场的分布和变化。
在工程问题中的应用实例
结构分析
在结构分析中,结构的质量矩阵和刚度矩阵的特征值和特征向量可 以用来确定结构的固有频率和振型,从而评估结构的稳定性和安全 性。
矩阵求特征值的方法
矩阵求特征值的方法矩阵求特征值是线性代数中一项重要的任务。
特征值可以帮助我们了解矩阵的性质,比如对角化、可逆性、相似性等。
在本篇回答中,我将介绍求解特征值的方法以及其原理和应用。
首先,我们来定义矩阵的特征值和特征向量。
对于一个n×n矩阵A,如果存在一个非零向量x,使得Ax=kx,其中k是一个标量,则k称为A的特征值,而x 称为对应于特征值k的特征向量。
换句话说,特征向量在经过矩阵作用后,并没有改变其方向,只是被特征值所缩放。
对于给定的矩阵A,求解特征值的方法有多种,下面将介绍其中的几种常用方法。
1. 特征多项式法:特征多项式法是求解特征值的一种常用方法。
首先,我们定义特征多项式P(λ)= A-λI ,其中I是单位矩阵。
我们求解特征多项式的根,即可得到矩阵A的特征值。
这是因为特征多项式的根恰好是A的特征值。
在具体计算时,可以使用拉普拉斯展开、代数余子式等方法。
2. 幂迭代法:幂迭代法是一种迭代求解特征值的方法。
该方法的基本思想是,通过连续乘以矩阵A的向量来逼近特征向量。
假设矩阵A的特征值按照非零特征值的绝对值大小排列为λ1 ≥λ2 ≥...≥λn ,并设对应于λ1的特征向量x1。
根据线性代数的知识,对于任意初始向量x0,xk≈x1,其中k足够大。
由于特征向量的特点,xk乘以A的结果趋近于x1乘以A,即λ1。
因此,通过不断迭代xk+1=A*xk/ A*xk ,其中A*xk 表示xk的模,可以逼近特征值。
当迭代次数足够多时,可以得到准确的特征值和特征向量。
3. QR方法:QR方法是一种逐步迭代求解特征值的方法。
该方法的基本思想是,将矩阵A迭代地分解为QR,其中Q是正交矩阵,R是上三角矩阵。
通过不断迭代QR分解,可以逐渐使得矩阵趋近于上三角矩阵。
当矩阵趋近于上三角矩阵时,矩阵的对角线元素即为特征值。
在QR分解过程中,可以使用Givens旋转或Householder 变换等方法来实现。
4. 特征向量迭代法:特征向量迭代法是一种同时求解特征值和特征向量的方法。
矩阵的特征值求解技巧
矩阵的特征值求解技巧矩阵的特征值和特征向量是线性代数中重要的概念,对于解决矩阵的性质和应用问题有着重要的作用。
特征值求解是矩阵特征值问题的核心内容,本文将介绍特征值求解的技巧和方法。
一、特征值和特征向量的定义首先,我们需要理解特征值和特征向量的概念。
给定一个n阶矩阵A,如果存在数λ和非零向量X使得AX=λX,则称λ为矩阵A的一个特征值,X称为对应于特征值λ的特征向量。
二、特征值的求解1. 利用特征多项式对于n阶矩阵A,我们可以定义其特征多项式p(λ)=|A-λI|,其中I是n阶单位矩阵。
求解特征多项式的根即为矩阵的特征值。
2. 利用特征值的性质特征值的性质有助于我们求解特征值。
下面列举一些常见的性质:- 特征值与矩阵的行列式相等。
即det(A-λI)=0。
- 矩阵的特征值个数等于其矩阵的阶数。
- 如果矩阵A是n阶矩阵,那么矩阵A的特征值之和等于A的主对角线元素之和。
- 特征值互不相等,特征向量也互不相等。
即不同特征值对应的特征向量是线性无关的。
3. 利用特殊矩阵的性质对于特殊的矩阵,我们可以利用其性质来求解特征值。
例如,对于对称矩阵,其特征值一定是实数;对于三角矩阵,其特征值等于主对角线元素。
三、特征向量的求解特征向量的求解是在已知特征值的情况下进行的。
对于给定的特征值λ,我们可以利用矩阵特征方程(A-λI)X=0,利用高斯消元法或其他行列运算方法求解出特征向量。
四、实际问题中的应用特征值和特征向量在实际问题中有着广泛的应用,如:- 在物理学中,特征值和特征向量可以用来描述量子力学中的量子态和量子力学运算符的本征态和本征值。
- 在工程中,特征值和特征向量可以用来描述系统的振动模态和固有频率。
- 在数据分析中,特征值和特征向量可以用来进行降维处理和特征选取。
总结:特征值和特征向量是矩阵的重要性质,通过求解特征值和特征向量,我们可以了解矩阵的本质、性质和应用。
特征值的求解可以利用特征多项式、特征值的性质和特殊矩阵的性质等方法,特征向量的求解可以通过矩阵特征方程进行求解。
矩阵特征值的求法举例
矩阵特征值的求法举例矩阵是线性代数中的重要概念,它在科学计算、工程领域以及图像处理等领域都有着广泛的应用。
而在矩阵中,特征值是一个非常重要的概念,它不仅能够描述矩阵的性质,还能够在很多实际问题中起到关键作用。
那么,特征值又是如何求解的呢?本文将通过几个具体的例子来说明矩阵特征值的求法。
一、矩阵特征值的定义我们来介绍一下矩阵的特征值是什么。
对于一个n阶矩阵A(n*n),如果存在一个数λ和一个非零向量v,使得Av=λv,那么我们称λ是矩阵A的特征值,v是对应的特征向量。
特征值和特征向量的求解对于矩阵的性质和应用有着非常重要的作用。
下面我们就通过具体的例子来说明矩阵特征值的求法。
二、特征值的求法1. 对角矩阵的特征值我们来看一个简单的例子,对于一个对角矩阵,特征值的求法非常简单。
对于一个对角矩阵D,我们有D=diag{d1, d2, …, dn},其中对角线元素为d1, d2, …, dn。
那么,对角矩阵的特征值为其对角线元素,即λ1=d1, λ2=d2, …, λn=dn。
特征向量可以取对应的单位向量,如e1=[1, 0, 0, …, 0],e2=[0, 1, 0, …, 0],以此类推。
对于一个2*2的对角矩阵A= [3, 0; 0, 5],其特征值为λ1=3, λ2=5,对应的特征向量可以分别取为v1=[1, 0]和v2=[0, 1]。
接下来,我们来看一个稍复杂一点的例子,对于一个3*3的矩阵,特征值的求法比较繁琐,通常采用特征多项式的方法进行求解。
假设矩阵A= [a, b, c; d, e, f; g, h, i],我们可以先求解其特征多项式:|A-λI| = det|a-λ, b, c; d, e-λ, f; g, h, i-λ|简化上式得到:(a-λ)(e-λ)(i-λ) + (b*d*λ + c*f*λ + a*e*λ) - (a*f*λ + c*d*λ + b*i) = 0然后,我们解出多项式的根,即为矩阵A的特征值。
矩阵特征值的求法举例
矩阵特征值的求法举例矩阵特征值的求法是线性代数中一个重要的内容,它在解决相应的数学问题中发挥着关键的作用。
在本文中,我们将重点介绍矩阵特征值的求法的基本概念和方法,并通过具体的例子来解释其求解过程。
让我们来了解一下矩阵特征值的概念。
矩阵特征值是指方阵在特定变换下所呈现的特征性质,它是一种描述矩阵变换行为的重要指标。
在线性代数中,矩阵特征值通常表示为λ,其计算过程是通过对矩阵进行特征值分解来获得的。
我们来介绍一下矩阵特征值的计算方法。
对于一个n阶方阵A,其特征值满足特征多项式的根,即满足方程|A-λI|=0的λ值。
其中I为n阶单位矩阵。
而方程|A-λI|=0又称为特征方程,它是一个n次多项式方程,通过解特征方程即可求得矩阵的特征值。
但是直接求解n次特征方程并不是一种高效的方法,所以我们常常采用其他技巧来简化计算,比如将特征方程转化为二次方程组来求解。
下面,我们通过一个具体的例子来说明矩阵特征值的求法。
假设我们有一个2阶方阵A= [1 2; 3 4],我们要求解其特征值。
我们列出特征方程:|A-λI|=0即,|1-λ 2; 3 4-λ|=0展开计算后得到:(1-λ)(4-λ)-2*3=0化简得到λ^2-5λ+2=0解这个二次方程,我们可以使用求根公式,也可以通过配方法或相乘得到两个因子后分别求解。
我们用求根公式得到:λ1=(5+√17)/2,λ2=(5-√17)/2由此可得该矩阵A的两个特征值分别为(5+√17)/2和(5-√17)/2。
通过这个例子,我们可以清晰地看到矩阵特征值的求解过程。
我们首先列出特征方程,然后通过求解特征方程得到特征值。
这个过程是非常直观的,但是对于更高阶的方阵来说,直接求解特征方程是非常繁琐且复杂的。
所以在实际计算中,我们要采用更加高效的算法来求解特征值。
除了通过特征方程求解特征值外,我们还可以通过其他方法来求解矩阵的特征值。
比如通过矩阵的迹和行列式来计算。
矩阵的迹是指方阵主对角线上元素的和,行列式是矩阵的一种特定性质,对于2阶矩阵A=[a b; c d],其行列式为 ad-bc。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第9章 矩阵特征值的数值解法9.1 引言矩阵特征值问题有广泛的应用背景. 例如动力系统和结构系统中的振动问题、电力系统的静态稳定分析上、工程设计中的某些临界值的确定等,都归结为矩阵特征值问题. 数学中诸如方阵的对角化及解微分方程组等问题,都要用到特征值的理论. 本章介绍n 阶实矩阵n n ⨯∈R A 的特征值与特征向量的数值解法.定义9.1.1 已知n 阶实矩阵()n n ij a ⨯=∈R A ,如果存在常数λ和非零向量x ,使λ=Ax x 或 ()λ-=0A I x (9.1.1)那么称λ为A 的特征值(eigenvalue),x 为A 的相应于λ的特征向量(eigenvector). 多项式111212122212()det()n n n n n nn a a a a a a p a a a λλλλλ-⎡⎤⎢⎥-⎢⎥=-=⎢⎥⎢⎥-⎣⎦A I (9.1.2)称为特征多项式(characteristic polynomial),det()0λ-=A I (9.1.3)称为特征方程(characteristic equation).注 式(9.1.3)是以λ为未知量的一元n 次代数方程,()det()n p λλ=-A I 是λ的n 次多项式. 显然,A 的特征值就是特征方程(9.1.3)的根. 特征方程(9.1.3)在复数范围内恒有解,其个数为方程的次数(重根按重数计算),因此n 阶矩阵A 在复数范围内有n 个特征值. 除特殊情况 (如2,3n =或A 为上(下)三角矩阵)外,一般不通过直接求解特征方程(9.1.3)来求A 的特征值, 原因是这样的算法往往不稳定. 在计算上常用的方法是幂法与反幂法和相似变换方法. 本章只介绍求矩阵特征值与特征向量的这两种基本方法. 为此将一些特征值和特征向量的性质列在此处.定理9.1.2 设n 阶方阵()ij n n a ⨯=A 的特征值为12,,,n λλλ,那么(1) 121122n nn a a a λλλ+++=+++;(2) 12det n λλλ=A .定理9.1.3 如果λ是方阵A 的特征值,那么(1) kλ是kA 的特征值,其中k 是正整数;(2) 当A 是非奇异阵时,1λ是1-A 的特征值. (3) ()n p λ是()n p A 的特征值,其中()n p x 是多项式2012()n n n p x a a x a x a x =++++.定义9.1.4 设,A B 都是n 阶方阵. 若有n 阶非奇异阵P ,使得1-=P AP B ,则称矩阵A 与B 相似(similar),1-P AP 称为对A 进行相似变换(similarity transformation),P 称为相似变换矩阵(similarity transformation matrix).定理9.1.5 若矩阵A 与B 相似,则A 与B 的特征值相同. 定理9.1.6 如果A 是n 阶正交矩阵,那么 (1) 1T -=A A ,且det 1=A 或1-; (2) 若=y Ax ,则22=yx , 即T T ⋅=⋅x x y y .定理9.1.7 设A 是任意n 阶实对称矩阵,则 (1) A 的特征值都是实数; (2) A 有n 个线性无关的特征向量.定理9.1.8 设A 是任意n 阶实对称矩阵,则必存在n 阶正交矩阵P ,使得1T -==P AP P AP Λ,其中12diag(,,,)n λλλ=Λ是以A 的n 个特征值12,,,n λλλ为对角元素的对角矩阵.定理9.1.9 (圆盘定理) 矩阵()ij n n a ⨯=A 的任意一个特征值至少位于复平面上的几个圆盘1,2,,n ,中的一个圆盘上。
9.2 幂法与反幂法9.2.1 幂法及其加速9.2.1.1 幂法幂法是计算矩阵按模最大特征值(largest eigenvalue in magnitude)及相应特征向量的迭代法. 该方法稍加修改,也可用来确定其他特征值. 幂法的一个很有用的特性是:它不仅可以求特征值,而且可以求相应的特征向量. 实际上,幂法经常用来求通过其他方法确定的特征值的特征向量. 下面探讨幂法的具体过程.设矩阵n n⨯∈RA 的n 个特征值满足1230n λλλλ>≥≥≥≥, (9.2.1)且有相应的n 个线性无关的特征向量12,,,n x x x ,则12,,,n x x x 构成n 维向量空间nR 的一组基, 因此1,,1,2,,nni i i i i n αα=⎧⎫==∈=⎨⎬⎩⎭∑R R z z x .在n R 中选取某个满足10α≠的非零向量01ni i i α==∑z x .用矩阵A 同时左乘上式两边,得011n ni i i i i i i ααλ====∑∑Az Ax x .再用矩阵A 左乘上式两边,得2201ni i i i αλ==∑A z x .这样继续下去,一般地有01,1,2,.nkk i i i i k αλ===∑A z x (9.2.2)记10,1,2,kk k k -===z Az A z ,则由式(9.2.2)得0111121, 1,2,.knn k k ki k i i i i i i i k λαλλααλ==⎡⎤⎛⎫⎢⎥===+= ⎪⎢⎥⎝⎭⎣⎦∑∑z A z x x x (9.2.3)由假设(9.2.1),结合式(9.2.3),得111lim,kkk αλ→∞=z x (9.2.4)于是对充分大的k 有111.k k λα≈z x (9.2.5)式(9.2.4)表明随着k 的增大,序列{}1kkλz 越来越接近A 的对应于特征值1λ的特征向量1x 的1α倍, 由此可确定对应于1λ的特征向量1x . 当k 充分大时,可得1x 的近似值.上述收敛速度取决于比值21λ. 事实上,由式(9.2.3)知,321122331111kkkkn nn kλλλααααλλλλ≤++++z x x x x . (9.2.6)再由式(9.2.1)得321111nλλλλλλ>≥≥≥. (9.2.7) 结合式(9.2.6)和式(9.2.7)知,序列{}1k kλz 收敛速度取决于比值21λλ.下面计算1λ. 由式(9.2.3)知1111011121,k n k k ik k i i i A A λλααλ++++=⎡⎤⎛⎫⎢⎥===+ ⎪⎢⎥⎝⎭⎣⎦∑z z z x x当k 充分大时, 11111k k λα++≈z x . 结合式(9.2.5),得11k k λ+≈z z .这表明两个相邻向量大体上只差一个常数倍,这个倍数就是A 的按模最大特征值1λ. 记()T(1)(2)(),,,n k k k k z z z =z , 则有()11()lim ,1,2,,j k j k kz j n z λ+→∞==, (9.2.8)即两个相邻的迭代向量所有对应分量的比值收敛到1λ.定义9.2.1 上述由已知非零向量0z 及矩阵A 的乘幂k A 构造向量序列{}k z 来计算A 的按模最大特征值1λ及相应特征向量的方法称为幂法(power method),其收敛速度由比值21γλλ=来确定,γ越小,收敛越快.注 由幂法的迭代过程(9.2.3)容易看出,如果11λ>(或11λ<),那么迭代向量k z 的各个非零的分量将随着k →∞而趋于无穷(或趋于零),这样在计算机上实现时就可能上溢(或下溢). 为了克服这个缺点,需将每步迭代向量进行规范化: 记()T(1)(2)()1,,,n k k k k k y y y -==y Az .若存在k y 的某个分量0()j ky ,满足0()()1max j j kk j ny y ≤≤=,则记0()max()j k k y =y . 将k y 规范化max()k k k =z y y ,这样就把k z 的分量全部控制在[1,1]-中.例如,设T(2,3,0,5,1)k =--y ,因为k y 的所有分量中,绝对值最大的的是5-,所以max()5k =-y ,故Tmax()(0.4,0.6,0,1,0.2)k k k ==--z y y .综上所述,得到下列算法:算法9.2.1 (幂法) 设A 是n 阶实矩阵,取初始向量0n∈R z ,通常取T 0(1,1,,1)=z ,其迭代过程是:对1,2,k =,有1,max(),.k k k k kk k m m -=⎧⎪=⎨⎪=⎩y Az y z y (9.2.9) 定理9.2.1 对式(9.2.9)中的序列{}k z 和{}k m 有()11lim max k k →∞=x z x , 1lim k k m λ→∞=, (9.2.10)其收敛速度由21γλλ=确定.证明 由迭代过程(9.2.9)知211111k k k k k k k k k k k m m m m m m -----====z y A z A y A z001max()kkk k ii m====∏A z A z A z , (9.2.11)其中01ni i i α==∑z x . 若10α≠,则由(9.2.3)知:011121kn k k ii i i λλααλ=⎡⎤⎛⎫⎢⎥=+ ⎪⎢⎥⎝⎭⎣⎦∑A z x x , 代入式(9.2.11)得11211121max kni i ii k kn i i i i λααλλααλ==⎛⎫+ ⎪⎝⎭=⎛⎫⎛⎫⎪+ ⎪ ⎪⎝⎭⎝⎭∑∑x x z x x , (9.2.12) 故()11lim max k k →∞=x z x . (9.2.13)而()()()21211120max max max k k k k k k k k A A ------=====Ay A z A z y Az y z z 111211111121max kn k ii i i k n k i i i i a a a a λλλλλλ=--=⎡⎤⎛⎫+⎢⎥⎪⎢⎥⎝⎭⎣⎦=⎛⎫⎛⎫ ⎪+ ⎪ ⎪⎝⎭⎝⎭∑∑x x x x , (9.2.14) 于是1121111121max max()max kn i i i i k k k n i i i i a a m a a λλλλλ=-=⎛⎫⎛⎫⎪+ ⎪ ⎪⎝⎭⎝⎭==⎛⎫⎛⎫⎪+ ⎪ ⎪⎝⎭⎝⎭∑∑x x y x x , (9.2.15)故1lim k k m λ→∞=. (9.2.16)由式(9.2.6)和式(9.2.7)知:上述收敛速度由21γλλ=确定. 证毕!例9.2.1 用幂法求方阵123213335⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦A按模最大特征值及相应的特征向量,要求3110k k m m ---<.解 选取初始向量T0(1,1,1)=z ,按式(9.2.9)迭代,结果见表9.2.1.表9.2.1因此,所求按模最大特征值18.3589λ≈,相应特征向量T1(0.559817,0.559817,1)≈x .事实上,A 的按模最大特征值148.3588989λ=≈,相应特征向量T 1(0.55981649,0.55981649,1)=x , 故所得结果具有较高的精度.9.2.1.2 幂法的加速从上面的讨论可知,由幂法求按模最大特征值,可归结为求数列{}k m 的极限值,其收敛速度由21γλλ=确定. 当21γλλ=接近1时, 收敛速度相当缓慢. 为了提高收敛速度,可以利用外推法进行加速.因为序列{}k m 的收敛速度由21γλλ=确定,所以若{}k m 收敛,当k 充分大时,则有()121k k m O λλλ⎡⎤-=⎢⎥⎣⎦,或改写为()121kk m c λλλ-≈,其中c 是与k 无关的常数. 由此可得11211k k m m λλλλ+-≈-, (9.2.17)这表明幂法是线性收敛的. 由式(9.2.17)知1121111k k k k m m m m λλλλ+++--≈--.由上式解出1λ,并记为2k m +,即2221122121()22k k k k k k k k k k k k km m m m m m m m m m m m m ++++++++--==+-+-+, (9.2.18) 这就是计算按模最大特征值的加速公式.将上面的分析归结为如下算法:算法9.2.2 (幂法的加速) 设A 是n 阶实矩阵,给定非零初始向量0n∈R z ,通常取T 0(1,1,,1)=z . 对1,2k =,用迭代式1,max(),k k k k kk k m m-=⎧⎪=⎨⎪=⎩y Az y z y 求出12,m m 及12,z z . 再对3,4,k =,迭代过程为1212212,max(),(),2.k k k k k k k k k k k k k k m m m m m m m m m ------=⎧⎪=⎪⎪-⎨=-⎪-+⎪⎪=⎩y Az y z y (9.2.19) 当1k k m m ε--<(0ε>是预先给定的精度) 时,迭代结束,并计算k z ;否则继续迭代,直至满足迭代停止条件1k k m m ε--<.有关加速收敛技术,读者请参考文献[11].8.2.2 反幂法及其加速反幂法是计算矩阵按模最小特征值及相应特征向量的迭代法, 其基本思想是:设矩阵n n ⨯∈R A 非奇异,用其逆矩阵1-A 代替A , 矩阵A 的按模最小特征值就是矩阵1-A 的按模最大特征值. 这样用1-A 代替A 做幂法,即可求出1-A 的按模最大特征值,也就是矩阵A 的按模最小特征值;这种方法称为反幂法(inverse power method).因为矩阵A 非奇异,所以由i i i λ=Ax x 可知:11i i iλ-=A x x . 这说明:如果A 的特征值满足1210n-n λλλλ≥≥≥>>, (9.2.20)那么1-A 的特征值满足1211111nn-λλλλ>≥≥≥, (9.2.21)且对A 的应于特征值i λ的特征向量i x 也是1-A 的对应于特征值1i λ的特征向量.由上述分析知:对1-A 应用幂法求按模最大的特征值1n λ及相应的特征向量n x ,就是求A 的按模最小的特征值n λ及相应的特征向量n x .算法9.2.3 (反幂法) 任取初始非零向量0n∈R z ,通常取T 0(1,1,,1)=z . 为了避免求1-A ,对1,2,k =,将迭代过程(9.2.9)改写为:1,max(),.k k k k kk k m m -=⎧⎪=⎨⎪=⎩Ay z y z y (9.2.22) 仿定理9.2.1的证明,可得:定理9.2.2 对式(9.2.22)中的序列{}k z 和{}k m 有1lim ,lim max()nk k k k n nm λ→∞→∞==x z x , (9.2.23)其收敛速度由1n n γλλ-=确定.注 按(9.2.22)进行计算,每次迭代都需要解一个方程组1k k -=Ay z . 若利用三角分解法求解方程组,即=A LU ,其中L 是下三角矩阵,U 是上三角矩阵,这样每次迭代只需解两个三角方程组11,.k k --=⎧⎨=⎩L z Uy v ν 9.2.3 原点平移法为了提高收敛速度,下面介绍加速收敛的原点平移法.设矩阵p =-B A I ,其中p 是一个待定的常数,A 与B 除主对角线上的元素外,其他元素相同. 设A 的特征值为12,,,n λλλ,则B 的特征值为12,,,n p p p λλλ---,且A 与B 的特征向量相同.9.2.3.1 原点平移法的幂法设1λ是A 的按模最大的特征值,选择p ,使12,3,4,,i p p p i n λλλ->-≥-=,及2211p p λλλλ-<-. (9.2.24) 对B 应用幂法,得 算法9.2.4 对1,2,k =,有1(),max(),,k k k k kk k p m m -=-⎧⎪=⎨⎪=⎩y A I z y z y (9.2.25) 且()111lim ,lim ,max k k k k m p λ→∞→∞=-=x z x (9.2.26)其收敛速度由21()()p p λλ--确定.由式(9.2.24)知:在计算B 的按模最大特征值1p λ-的过程(9.2.25)中,收敛速度得到加速;算法9.2.4又称为原点平移下的幂法(power method with shift).9.2.3.2 原点平移下的反幂法设n λ是A 的按模最小的特征值,选择p ,使1,1,2,,2n n i p p p i n λλλ--<-≤-=-. (9.2.27)及11n n n n p p λλλλ---<-. (9.2.28)若矩阵p =-B A I 可逆,则1-B 的特征值为12111,,,,n p ppλλλ---且有1111,1,2,,2n n i i n p p pλλλ->≥=----. (9.2.29)对B 应用反幂法,得: 算法9.2.5 对1,2,k =,有1(),max(),,k k k k kk k p m m --=⎧⎪=⎨⎪=⎩A I y z y z y (9.2.30) 且()111lim ,lim ,max k k k k n m p λ→∞→∞==-x z x (9.2.31)其收敛速度由1())n n p p λλ---确定.由式(9.2.28)知:在计算1-B 的按模最大特征值1n pλ-的过程(9.2.30)中,收敛速度得到加速. 算法9.2.5又称为原点平移下的反幂法 (inverse power method with shift).定义9.2.8 原点平移下的幂法与原点平移下的反幂法统称为原点平移法.注 有的资料上的原点平移法专指原点平移下的反幂法;而有的资料上的反幂法指的就是原点平移下的反幂法.原点平移下的反幂法(算法9.2.7)的主要应用是:已知矩阵的近似特征值后,求矩阵的特征向量. 其主要思想是:若已知A 的特征值m λ的近似特征值为m λ,则m A I λ-的特征值就是(1,2,,)i m i m λλ-=,其中(1,2,,)i i m λ=是A 的特征值. 而按模最小的特征值是m m λλ-,相应的特征向量与A 的特征向量相同.利用公式(9.2.30)可求出{}{},k k m z ,并且有1lim ,lim max()mk k k k m mm m λλ→∞→∞==-x z x ,其收敛速度由11(min )m mi m i m i m i mλλλλλλλλ≤≤---=--确定. 于是当k 充分大时,可取m k ≈x z , 1m m km λλ≈+, 只要近似值m λ适当好,收敛速度就很快,往往迭代几次就能得到满意的结果.例9.2.2 已知特征值λ的近似值0.3589λ=-,用原点平移下的反幂法求方阵123213335⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦A得对应特征值λ的特征向量.解 取0.3589p λ==-,对矩阵1.3589230.35892 1.3589333 5.3589A pI A I ⎡⎤⎢⎥-=+=⎢⎥⎢⎥⎣⎦.迭代公式(9.2.30)中的k y 是通过解方程组1()k k p --=A I y z求得的. 为了节省工作量,可先将p -A I 进行LU 分解.在LU 分解中尽量避免较小的rr u 当除数,通常可以先对矩阵p -A I 的行进行调换后再分解. 为此,我们可用001010100⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦P 乘p -A I 后再进行LU 分解,即 6001 1.35892333 5.3589()0102 1.358932 1.3589310033 5.3589 1.35892310033 5.35890.66671000.64110.5726,0.45301100 3.0710p -⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥-===⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦⎡⎤⎡⎤⎢⎥⎢⎥=--⎢⎥⎢⎥⎢⎥⎢⎥--⨯⎣⎦⎣⎦P A I LU 1( 1.2679)k k --=P A I y Pz , 即 1k k -=LUy Pz .令11,.k k k k --==Lv Pz Uy v 选取0z ,使1T10(1,1,1)-==Uy L Pz ,得T 1(290929.45,290927.56,325732.90)=-y ,11max()325732.90m ==-y , T 111(0.8932,0.8931,1)m ==--z y .由121-=Uy L Pz 得T 2(845418.49,845418.49,946558.42)=--y ,22max()946558.42m ==y , T 222(0.8932,0.8932,1)m ==--z y .由于1z 与2z 的对应分量几乎相等,故A 的特征值为2110.35890.35889894354117946558.42m λλ≈+=-+=-, 相应的特征向量为T2(0.8932,0.8932,1)==--x z .而矩阵A 的一个特征值为40.358898943540674λ=-=,相应的特征向量为T (0.89315,0.89315,1)--,由此可见得到的结果具有较高的精度.9.3 QR 算法上一节我们介绍了求矩阵特征值的幂法和反幂法. 幂法主要用来求矩阵的按模最大特征值,而反幂法主要用于求特征向量. 本节将介绍幂法的推广和变形——QR 算法,它是求一般中小型矩阵全部特征值的最有效的方法之一,其基本思想就是利用矩阵的QR 分解. 矩阵n n ⨯∈R A 的QR 分解就是:用Householder 变换将矩阵A 分解成正交矩阵Q 与上三角矩阵R 的乘积,即=A QR . 下面首先介绍Householder 变换.9.3.1 豪斯霍尔德变换定义9.3.1 设()ij n n b ⨯=B 是n 阶方阵,若当1i j >+时,0ij b =,则称矩阵B 为上Hessenberg 矩阵(Hessenberg matrix ),又称为准上三角矩阵,它的一般形式为1112121222323,1n n n n n nn b b b bb b b b b b -⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦B . (9.3.1) 下面讨论如何将矩阵A 用正交相似变换化成(9.3.1)的形式. 为此先介绍一个对称正交矩阵——Householder 矩阵.定义9.3.2 设向量n∈R u 的欧氏长度21=u,I 为n 阶单位矩阵,则称n 阶方阵T ()2==-H H u I uu (9.3.2)为Householder 矩阵(Householder matrix). 对任何n∈R x ,称由()=H H u 确定的变换=y Hx (9.3.3)为镜面反射变换(specular reflection transformation),或Householder (Householder transformation).注 Householder 变换,最初由A.C Aitken 在1932年提出. Alston Scott Householder 在1958年指出了这一变换在数值线性代数上的意义. 这一变换将一个向量变换为由一个超平面反射的镜像,是一种线性变换. 运用线性代数的知识,很容易证明:定理9.3.3 (9.3.2)式定义的矩阵H 是对称正交矩阵;对任何n∈R x ,由线性变换H =y x 得到y 的欧氏长度满足22=y x .反之,有下列结论:定理9.3.4 设,n∈R x y ,≠x y .若22=x y ,则一定存在由单位向量确定的镜面反射矩阵()H u ,使得H =x y .证 令2-=-x yu x y ,显然21=u . 构造单位向量u 确定的镜面反射矩阵T ()2==-H H u I uu ,()T T T T2222()()2()()22⎡⎤----⎢⎥=-=-=---⎢⎥⎣⎦x y x y x y x x y x Hx I uu x I x x x y x y . 又因为22=xy ,即T T =x x y y ,所以————————————————————海森伯格(Karl Adolf Hessenberg 1904年9月8日–1959年2月22日) 是德国数学家和工程师.豪斯霍尔德(Alston Scott Householder 1904年5月5日–1993年7月4日) 是美国数学家,在数学生物学和数值分析等领域卓有建树.2T T T 2T T T T T T T T T T ()()()()2(),-=--=--=--+=--+=-x y x y x y x y x y x x x y y x y y x x x y x y x x x x y x 于是T T 222()()()--=-=--=-x y x x y x Hx x x x y y x y.证毕!由定理9.3.4得: 算法9.3.1 若T 12(,,,)n x x x =x ,其中2,,n x x 不全为零,则由12T 11212T1T22sgn(),,(1,0,,0),(),()2n x x σσρσσρ-⎧=⎪=+=∈⎪⎪=+⎨⎪⎪==-=-⎪⎩R 12其中=x u x e e u uu H H u I I uu u (9.3.4) 确定的镜面反射矩阵H ,使得1σ=Hx e ,其中1,0,sgn()0,0,1,0.a a a a >⎧⎪==⎨⎪-<⎩例9.3.1 设T(1,2,2)=--x ,按式(9.3.4)的方法构造镜面反射矩阵H ,使得T (,0,0)*=Hx (*表示某非零元素).解12sgn()(3x σ==-=-x;T T T 1(1,2,2)(3,0,0)(4,2,2)σ=-=---=--u x e , 其中T 1(1,0,0)=e ;212()3[3(1)]12x ρσσ==+=--+-=12u , 则所求镜面反射矩阵为1T 1004132210102(4,2,2)2211200122123ρ----⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥=-=---=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦H I uu ,且1323213232312021220---⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦Hx .可以证明:定理9.3.6 对任意n 阶方阵()ij n n a ⨯=A ,存在正交矩阵Q ,使得T =B Q AQ为形如式(9.3.1)的上Hessenberg 阵.证 记(1)(1)(1)1112111121(1)(1)(1)21222212221(1)(1)(1)1212n nn n n n nn n n nn a a a a a a a a a a a a a a a a a a ⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥===⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦A A ,(1)21(1)311(1)1n a a a ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦x . 由式(9.3.4)可构造1n -阶对称正交矩阵1H :12121121122T 111111211112121T 1111sgn()sgn(),,(1,0,,0),(),,n i i n a a a a σσρσσρ=--⎧⎛⎫==-⎪ ⎪⎝⎭⎪⎪=+=∈⎨⎪=+⎪⎪=-⎩∑R 12其中=x u x e e u H I u u (9.3.5) 使得1111σ=H x e .记111⎡⎤=⎢⎥⎣⎦I Q H ,且1n n⨯∈R Q ,1I 是1阶单位矩阵. 显然1Q 是对称正交矩阵. 用1Q 对A 作相似变换,得(1)(2)(2)11121(2)(2)12221(2)(2)111112323(2)(2)20nn nn nn a a a a a a a a a σ-⎡⎤⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦记Q AQ Q A Q A . (9.3.6)记(2)(2)(2)T 2232422(,,,)n n a a a -=∈Rx ,同理可构造2n -阶对称正交矩阵2H ,使得2221σ=H x e (T 21(1,0,,0)n -=∈R e ).记222⎡⎤=⎢⎥⎣⎦I Q H ,其中2I 为2阶单位矩阵,则2Q 仍是对称正交矩阵,用2Q 对2A 作相似变换,得(1)(2)(3)(3)1112131(2)(3)(3)122232(3)(3)123332222223(3)(3)434(3)(3)30000nn n n n nn a a a a a a a a a aa a a σσ-⎡⎤⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦记Q A Q Q A Q A . (9.3.7)依此类推,经过k 步对称正交相似变换,得1111111k k k k k k -------=Q A Q Q A Q(1)(2)(3)(1)()()()1112131,111,11(2)(3)(1)()()()122232,122,12(3)(1)()()()2333,133,133(1)()()()1,11,1,11,000000k k k k k k k n k k k k k k k n k k k k k kk nk k k k k k k k k k k na a a a a a a a a a a a a a a a a a a a a a σσσ--+--+--+-----+-=()()()1,1()()()1,1,11,()()(),100000000k k k k k kk k k kn k k k k k k k k n k k k nk n k nna a a a a a a a a σ-++++++⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦记A . (9.3.8)重复上述过程,则有(1)(2)(3)(1)()1112131,11(2)(3)(1)()122232,12(3)(1)()12333,1322222213(1)()1,11,()1n n n n n n n n n n n nn n n n n n n n n n n n nn n nn a a a a a a a a a a a a a a a σσσσ-------------------⎡⎤⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦记Q A QQ A Q A . (9.3.9)由式(9.3.6)-(9.3.9),可得122223332231132n n n n n n n n n n n n n -------------===A Q A Q Q Q A Q Q Q Q Q AQ Q Q .若记1n -=B A ,122n -=Q Q Q Q ,则Q 为正交矩阵,且有T =B Q AQ . 证毕!注1 由定理9.3.6知:因为任意n 阶方阵A 与n 阶上Hessenberg 矩阵B 相似,所以求A 的阵特征值的问题,就可转化为求上Hessenberg 矩阵B 的特征值的问题.注2 若A 是对称矩阵,则B 也是对称矩阵. 再由B 的形式(9.3.1)知,此时B 一定是对称三对角阵. 于是,求对称矩阵A 的阵特征值的问题,便可转化为求对称三对角阵B 的特征值问题.例9.3.2 设矩阵121222*********1⎡⎤⎢⎥-⎢⎥=⎢⎥-⎢⎥⎣⎦A 试用镜面反射变换求正交矩阵Q ,使TQ AQ 为上Hessenberg 矩阵.解 第1步 记1=A A ,(1)(1)(1)T T 1213141(,,)(2,1,2)a a a ==x ,利用式(9.3.4)构造三阶镜面反射阵1H :112sgn(2)3σ===x ;T T T 1111(2,1,2)(3,0,0)(5,1,2)σ=+=+=u x e , 其中T 1(1,0,0)=e ;2(1)1111212()3(32)15a ρσσ==+=+=12u ; 则所求镜面反射矩阵为1T 111110050.66670.33330.666710101(5,1,2)0.33330.93330.1333,1500120.66670.13330.7333ρ----⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥=-=-=--⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦H I u u111100000.66670.33330.6667,00.33330.93330.133300.66670.13330.7333⎡⎤⎢⎥---⎡⎤⎢⎥==⎢⎥⎢⎥--⎣⎦⎢⎥--⎣⎦I Q H T 21111113003 2.33330.46670.066700.4667 1.5733 1.346700.0667 1.34670.0933-⎡⎤⎢⎥--⎢⎥===⎢⎥⎢⎥-⎣⎦A Q A Q Q AQ . 第2步 记(2)(2)T T23242(,)(0.4667,0.0667)a a ==-x , 利用式(9.3.4)构造2阶镜面反射阵2H :222sgn(0.4667)0.4714σ===x ;T T T 2221(0.4667,0.0667)(0.4714,0)(0.9381,0.0667)σ=+=-+=-u x e , 其中T1(1,0)=e ;2(2)2222322()0.4714(0.47140.4667)0.4422a ρσσ==+=+=12u ; 则所求镜面反射矩阵为1T2222100.93810.99010.14151(0.9381,0.0667),010.06670.14150.98990.4422ρ--⎡⎤⎡⎤⎡⎤=-=--=⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦⎣⎦H I u u 222100100,000.99010.1415000.14150.9899⎡⎤⎢⎥⎡⎤⎢⎥==⎢⎥⎢⎥-⎣⎦⎢⎥⎣⎦I Q H T 322222213003 2.33330.4714000.4714 1.5733 1.500000 1.50000.5000-⎡⎤⎢⎥--⎢⎥===⎢⎥--⎢⎥-⎣⎦A Q A Q Q A Q . 由此得正交矩阵12100000.66670.23570.707100.33330.94290.000100.66670.23570.7070⎡⎤⎢⎥--⎢⎥==⎢⎥--⎢⎥-⎣⎦Q Q Q , 使得T 313003 2.33330.4714000.4714 1.1667 1.500000 1.50000.5000-⎡⎤⎢⎥--⎢⎥==⎢⎥--⎢⎥-⎣⎦Q AQ A 为上Hessenberg 矩阵。