第九章矩阵特征值问题的数值方法
矩阵特征值问题的数值方法.
![矩阵特征值问题的数值方法.](https://img.taocdn.com/s3/m/588b72284a7302768e9939a4.png)
矩阵特征值问题的数值方法矩阵特征值设A 是n 阶矩阵,x 是非零列向量. 如果有数λ 存在,满足那么,称x 是矩阵A 关于特征值λ的特征向量. 很显然一般地有主特征值的乘幂迭代法设n 阶矩阵A 的n 个特征值按模从大到小排序为:n 其对应的n 个线性无关的特征向量分别为:设是任意一个非零的n 维向量,则:假设,构造一个向量序列:则:或者:当时:如果是矩阵A 的关于特征值的一个特征向量,特征值个特征那么对于任意一个给定的,也是特征值的特征向量。
所以,是对主特征值对应的特征向量的近似。
如果则会变得很大或者如果,则会变得很大,或者如果,则会变得非常小,在实际计算中,为避免这种情况的出现需对做归一化处理况的出现,需对做归一化处理:由:左乘得:所以主特征值的近似值所以主特征值的近似值:残余误差向量定义为:当迭代次数充分大时,残余误差将充分小。
逆乘幂法:类似地,也可以求模最小特征值和对应的特征向量特征向量。
上述问题的主特征值问题就是矩阵A 的模最小特征值问题。
结果,逆乘幂法的迭代公式为:在实际应用中,无需计算逆矩阵,但需求解线性系统实对称矩阵的基本定理:对实对称矩阵A ,一定存在一个正交相似变换使得为对角矩阵且其对角矩阵P ,使得:为对角矩阵,且其对角的特征值元素为矩阵A 的特征值。
相似变换:相似变换保持矩阵特征值(但不是特征向量)不变不变。
(证明略)正交相似变换:中。
正交相似变换的例子—坐标旋转:叫旋转矩阵。
容易验证:。
适当选择旋转角,可消去xy 项—得到对角阵D 。
矩阵特征值问题的数值方法实对称矩阵的基本定理再看下面的例子:令:O 平面的坐标旋转变换适当同样地有:。
则是在x-O-z 平面的坐标旋转变换。
适当x z —D 。
选择旋转角可消去z 项得到对角阵实对称矩阵的Jacobi 方法:全部特征值和特征向量根据实对称矩阵的基本定理,求得矩阵A 的全部特征值的关键是找到正交相似变换矩阵P 使部特征值的关键,是找到正交相似变换矩阵P ,使得为对角阵。
特征值和特征向量计算的数值方法
![特征值和特征向量计算的数值方法](https://img.taocdn.com/s3/m/8c15f0869fc3d5bbfd0a79563c1ec5da50e2d601.png)
特征值和特征向量计算的数值方法在数学和计算机科学领域中,特征值和特征向量是非常重要的概念。
特征值和特征向量的计算有许多不同的数值方法,本文将介绍其中一些常见的数值方法,并分析它们的优劣和适用范围。
一、特征值和特征向量的定义在矩阵理论中,给定一个n×n的矩阵A,如果存在一个非零向量v和一个标量λ,使得Av=λv,那么称v为矩阵A的特征向量,λ为矩阵A的特征值。
特征值和特征向量的计算可以帮助我们理解矩阵的性质以及解决一些实际问题。
二、幂法幂法是计算特征值和特征向量的常用数值方法之一。
幂法的基本思想是通过多次迭代,逐渐逼近矩阵的特征值和特征向量。
具体操作如下:1. 初始化一个非零向量b0;2. 进行迭代计算:bi+1 = A * bi / ||A * bi||;3. 取出近似特征向量的最后一列:v = bn;4. 进行迭代计算特征值:λ = (Av)T * v / (vT * v)。
幂法的主要优点是简单易懂,且只需要进行矩阵向量乘法和内积计算。
然而,幂法仅能求取具有最大特征值的特征向量,而且对于存在多个特征值相等的情况并不适用。
三、反幂法反幂法是幂法的一种改进方法,用于求取矩阵A的最小特征值和对应的特征向量。
反幂法的基本步骤如下:1. 初始化一个非零向量b0;2. 进行迭代计算:bi+1 = (A - μI)^-1 * bi / ||(A - μI)^-1 * bi||;3. 取出近似特征向量的最后一列:v = bn;4. 进行迭代计算特征值:λ = (Av)T * v / (vT * v)。
反幂法的改进之处在于引入了矩阵的逆运算,通过使用矩阵A减去一个合适的常数μ乘以单位矩阵来实现。
反幂法适用于矩阵A的特征值接近于μ的情况。
四、QR方法QR方法也是一种常用的特征值计算方法,它适用于求解所有特征值以及对应的特征向量。
QR方法的基本思想是将一个矩阵分解为正交矩阵Q和上三角矩阵R的乘积,然后迭代地将矩阵A转化为更接近上三角形的形式。
第九章矩阵特征值和特征向量的计算
![第九章矩阵特征值和特征向量的计算](https://img.taocdn.com/s3/m/37ba68d480eb6294dd886caa.png)
从而:
容易验证:
9.2 幂法的加速与降阶
考虑A-λ0I,因它与A之间特征值有关系:μi=λi-λ0,且特征向量不变, 则:
因为此时:
假定最大特征值λ1和最大特征向量V1已求出,并令A(1)=A,现构造:
9.3 反幂法
反幂法用来求A的按模最小的特征值。思想是A与A-1的特征值互为倒数, 用幂法求A-1的最大特征值。
或写为:
一般的计算公式:
处理对称矩阵,下列正交化方法更为有效:
平行迭代法也可用来求按模最小的p个特征值和特征向量:
9.5 QR算法 1、基本步骤:
令A=A1,对A1进行正交分解:
QR算法产生了一个矩阵序列{Ak},它有两个基本性质: (1)、矩阵序列{Ak}中的每一个矩阵都与A相似:
(2)、若令Hk= Rk Rk-1…. R1则有:
2、QR算法的收敛性问题:
2、定理9.1:假设
2、QR算法举例:求下面矩阵特征值
现用QR算法求解其特征值,首先令A1=A,用Schmidt正交化方法分解:
把A代替A重复上面过程,计算11次得:
9.6 Jacobi算法
其中,D是对角矩阵,它的对角元素是矩阵A的特征值,Jacobi方法 实质上是找一个正交矩阵V,使A正交化。设:
(2)、置k=1,μ=0 (3)、求xr=> λ,| xr |= (4)、计算 Y=X/ λ X=AY
max xi
1 i n
(5)、若| λ- μ|< ε,输出λ,X,停机,否则转步骤6 (6)、若k<N,k+1=>k,,μ=0, λ=>μ,转步骤3;否则输出失败信息
4、例2:用幂法求矩阵
解:取初始向量Y(0)=(1,1,1)T,用前面公式
求特征值的技巧
![求特征值的技巧](https://img.taocdn.com/s3/m/a8d12babb9f67c1cfad6195f312b3169a451ea2c.png)
求特征值的技巧特征值(eigenvalue)是矩阵在线性代数中非常重要的一个概念,它具有广泛的应用。
本文将探讨特征值的求解技巧。
首先,我们来了解一下特征值的定义。
给定一个n阶方阵A,如果存在一个非零向量v,使得满足Av=λv,其中λ为常数,那么λ就是A的特征值,v就是对应于λ的特征向量。
特征值与特征向量的求解可以分为数值方法和解析方法两种。
下面分别介绍这两种方法。
一、数值方法:1. 幂迭代法:幂迭代法是一种较为简单和常用的求矩阵最大特征值的方法。
其基本思想是通过迭代过程不断逼近最大特征值的值和对应的特征向量。
具体步骤如下:(1)取一个初始向量v0,通常为单位向量。
(2)迭代计算出序列:v1 = Av0, v2 = Av1, ..., vn = Avn-1。
(3)计算序列vn的模长:vn = √(vn * vn)。
(4)对vn进行归一化得到单位向量: vn = vn / vn 。
(5)判断收敛条件,如果满足收敛条件,则取vn为最大特征值对应的特征向量。
2. QR算法:QR算法是一种用于求解特征值的数值方法,可以同时求得所有特征值和特征向量。
它的基本思想是通过不断迭代,将矩阵A转化为上三角矩阵R,并使其对角线上的元素逼近A的特征值。
具体步骤如下:(1)将矩阵A分解为QR,其中Q为正交矩阵,R为上三角矩阵。
(2)计算矩阵A的逆:A^-1 = R^-1 * Q^-1。
(3)计算新矩阵B = R * Q。
(4)重复步骤1-3,直到矩阵B对角线上的元素收敛为止。
收敛时,矩阵B 的对角线元素即为矩阵A的特征值。
二、解析方法:1. 特征多项式:给定一个n阶方阵A,A的特征多项式定义为P(λ) = A - λI ,其中I为n 阶单位矩阵。
特征多项式的根即为矩阵A的特征值。
特征多项式可以通过展开矩阵A-λI的行列式来求解。
2. 特征向量的求解:通过求解特征多项式得到的特征值,可以求得对应的特征向量。
对于每个特征值λi,我们需要求解线性方程组(A - λiI)v = 0,其中v为特征向量。
矩阵特征值的求法举例
![矩阵特征值的求法举例](https://img.taocdn.com/s3/m/df715a39e97101f69e3143323968011ca300f722.png)
矩阵特征值的求法举例
矩阵的特征值是线性代数中一个非常重要的概念,它对于矩阵的性质和求解问题具有
重要意义。
特征值是一个数,它可以通过解一个特征方程来求得,特征方程是一个关于特
征值的多项式方程。
下面我们将通过几个具体的例子来介绍矩阵特征值的求法。
假设我们有一个2×2矩阵A,其元素如下所示:
A = |a b|
|c d|
我们希望求解矩阵A的特征值。
我们将矩阵A减去一个单位矩阵的倍数,得到新的矩阵B:
B = A - λI
λ是一个未知的数,I是单位矩阵。
具体地,我们有:
接下来,我们需要求解特征方程,即求解方程|B| = 0。
|a-λ b | = (a-λ)(d-λ) - bc = 0
|c d-λ|
展开计算得到:
这个二次方程就是特征方程。
根据一元二次方程的求解公式,我们有:
λ = [(a+d) ± √((a+d)^2 - 4(ad-bc)) ] / 2
这里,√表示开方。
通过求解该二次方程,我们就能够求得矩阵A的特征值。
具体的计算过程比较复杂,可以使用数值方法(如牛顿法)来求解,或者使用专门的
软件工具进行计算。
总结:
通过以上两个例子,我们可以看到求解矩阵特征值的过程其实就是求解一个代数方程
的过程。
对于小规模的矩阵,我们可以通过手工计算来得到特征值,但对于大规模的矩阵,
通常需要借助计算机来进行计算。
矩阵特征值的求法对于理解和应用线性代数有着重要的意义,它在很多领域(如数学、物理、金融等)中都有广泛的应用。
求矩阵特征值的方法
![求矩阵特征值的方法](https://img.taocdn.com/s3/m/b0d62b5449d7c1c708a1284ac850ad02de8007b4.png)
求矩阵特征值的方法矩阵特征值是矩阵理论中的一个重要概念,它在许多领域中都有着广泛的应用,如物理学、工程学、计算机科学等。
求矩阵特征值的方法有多种,下面将介绍其中的三种常用方法。
一、特征多项式法特征多项式法是求矩阵特征值的一种常用方法。
它的基本思想是将矩阵A与一个未知数λ相乘,得到一个新的矩阵B=A-λI,其中I为单位矩阵。
然后求解矩阵B的行列式,得到一个关于λ的多项式,称为特征多项式。
矩阵A的特征值就是使特征多项式等于零的λ值。
具体步骤如下:1. 构造矩阵B=A-λI。
2. 求解矩阵B的行列式det(B)。
3. 解特征多项式det(B)=0,得到矩阵A的特征值λ。
二、幂法幂法是求矩阵特征值的一种迭代方法。
它的基本思想是从一个任意的非零向量开始,不断地将其乘以矩阵A,直到向量的方向趋于特征向量的方向,同时向量的模长趋于特征值的绝对值。
具体步骤如下:1. 选择一个任意的非零向量x0。
2. 迭代计算xn+1=Axn/||Axn||,其中||Axn||为Axn的模长。
3. 当xn+1与xn的差值小于某个预设的精度时,停止迭代,此时xn 的模长即为矩阵A的最大特征值,xn/||xn||即为对应的特征向量。
三、QR分解法QR分解法是求矩阵特征值的一种数值方法。
它的基本思想是将矩阵A 分解为QR,其中Q为正交矩阵,R为上三角矩阵。
然后对R进行迭代,得到一个对角矩阵,对角线上的元素即为矩阵A的特征值。
具体步骤如下:1. 对矩阵A进行QR分解,得到A=QR。
2. 对R进行迭代,得到一个对角矩阵D,对角线上的元素即为矩阵A的特征值。
以上三种方法都有其优缺点,具体选择哪种方法取决于实际应用场景和计算需求。
在实际应用中,还可以结合多种方法进行求解,以提高计算精度和效率。
矩阵特征值的数值解法
![矩阵特征值的数值解法](https://img.taocdn.com/s3/m/cf43489e51e2524de518964bcf84b9d528ea2cf3.png)
矩阵特征值的数值解法矩阵的特征值是在矩阵与其特征向量之间的关系中的数值解。
特征值在各个领域中都有广泛应用,包括物理、工程、金融等。
在解决实际问题时,我们经常需要计算矩阵的特征值,因此研究如何求解矩阵特征值的数值方法是非常重要的。
1. 幂迭代法(Power Iteration)幂迭代法是求解矩阵特征值的一种简单而常用的数值方法。
它的基本思想是通过不断迭代矩阵与向量的乘积,使得向量趋近于该矩阵的一个特征向量。
具体步骤如下:(1)初始化一个非零的初始向量x。
(2)进行迭代计算,即$x^{(k+1)}=Ax^{(k)}/,Ax^{(k)},$。
(3)当向量x的相对误差小于一些预设的精度要求时,停止迭代,此时的x即为矩阵A的一个特征向量。
(4)将x带入特征值的定义式$\frac{Ax}{x}$,计算出特征值。
幂迭代法的优点是简单易实现,计算速度较快,缺点是只能求解特征值模最大的特征向量,而且对于存在特征值模相近的情况,容易收敛到错误的特征值上。
2. QR迭代法(QR Iteration)QR迭代法是一种较为稳定的求解矩阵特征值的数值方法。
它的基本思想是通过不断进行QR分解,使得矩阵的特征值逐渐收敛。
具体步骤如下:(1)将矩阵A进行QR分解,得到正交矩阵Q和上三角矩阵R,令$A_1=RQ$。
(2)将$A_1$再次进行QR分解,得到新的矩阵$A_2=R_1Q_1$。
(3)重复步骤(2),直到得到收敛的矩阵$A_k$,此时$A_k$的对角线上的元素即为矩阵A的特征值。
QR迭代法的优点是对于特征值模相近的情况仍然能够收敛到正确的特征值上。
缺点是每次QR分解都需要消耗大量的计算量,迭代次数较多时计算速度较慢。
3. Jacobi迭代法(Jacobi's Method)Jacobi迭代法是一种通过对称矩阵的对角线元素进行迭代操作,逐步将非对角元素变为零的求解特征值的方法。
具体步骤如下:(1)初始化一个对称矩阵A。
矩阵特征值问题的数值计算
![矩阵特征值问题的数值计算](https://img.taocdn.com/s3/m/714004df5022aaea998f0ff6.png)
矩阵特征值问题的计算方法特征值问题:A V=λV¾直接计算:A的阶数较小,且特征值分离得较好 特征值:det(λI-A)=0,特征向量:(λI-A)V=0¾迭代法:幂法与反幂法¾变换法:雅可比方法与QR方法内容:一、 特征值的估计及其误差问题二、 幂法与反幂法三、 雅可比方法四、 QR方法一、 特征值的估计及其误差问题 (一)特征值的估计结论 1.1:n 阶矩阵()ij n n A a ×=的任何一个特征值必属于复平面上的n 个圆盘:1,||||,1,2,ni ii ij j j i D z z a a i n =≠⎧⎫⎪⎪=−≤=⎨⎬⎪⎪⎩⎭∑"(10.1) 的并集。
结论1.2:若(10.1)中的m个圆盘形成一个连通区域D,且D与其余的n-m个圆盘不相连,则D中恰有A的m个特征值。
(二)特征值的误差问题结论1.3:对于n 阶矩阵()ij n n A a ×=,若存在n 阶非奇异矩阵H ,使得11(,,)n H AH diag λλ−=Λ=", (10.2)则11min ||||||||||||||i p p p i nH H A λλ−≤≤−≤∆ (10.3)其中λ是A A +∆的一个特征值,而(1,,)i i n λ="是A 的特征值,1,2,p =∞。
结论1.4:若n 阶矩阵A 是实对称的,则1min ||||||i p i nA λλ≤≤−≤∆。
(10.4)注:(10.4)表明,当A 是实对称时,由矩阵的微小误差所引起的特征值摄动也是微小的。
但是对于非对称矩阵而言,特别是对条件数很大的矩阵,情况未必如此。
二、 幂法与反幂法(一) 幂法:求实矩阵按模最大的特征值与特征向量假设n 阶实矩阵A 具有n 个线性无关的特征向量,1,iV i n =",则对于任意的0nX R ∈,有 01ni ii X a V ==∑,从而有01111112((/))n nk k k i i i i ii i nk k i i i i A X a A V a V a V a V λλλλ======+∑∑∑.若A 的特征值分布如下:123||||||||n λλλλ>≥≥≥",则有01111()k kk A X a V λλ→∞⎯⎯⎯→为对应的特征向量须注意的是,若1||1λ<,则10kλ→,出现“下溢”,若1||1λ>,则1kλ→∞,出现“上溢”,为避免这些现象的发生,须对0kA X 进行规范化。
线性方程组与矩阵特征值求解的数值方法
![线性方程组与矩阵特征值求解的数值方法](https://img.taocdn.com/s3/m/4c9cfe3d1611cc7931b765ce050876323112749e.png)
线性方程组与矩阵特征值求解的数值方法线性方程组与矩阵特征值求解是线性代数中的两个重要问题。
线性方程组解决了形如Ax=b的方程组,其中A为一个m×n的矩阵,b为一个m 维的向量,求解x使得该方程组成立。
矩阵特征值求解是求解形如Ax=λx的特征值和特征向量问题,其中A为一个n×n的矩阵,λ为特征值,x为特征向量。
这两个问题在实际应用中有广泛的应用,如计算机图形学、仿真和优化等领域。
本文将介绍线性方程组和矩阵特征值求解的数值方法。
一、线性方程组的求解方法1.1直接法直接法是指通过一系列的代数运算和变换直接求解线性方程组的解。
经典的直接法有高斯消元法、LU分解法和Cholesky分解法等。
这些方法的时间复杂度通常为O(n^3)。
直接法的优点是解的精度高,稳定性好,适用于小规模的问题。
1.2迭代法迭代法是指通过迭代计算逼近线性方程组的解。
迭代法的基本思想是将原方程组转化为递推的形式,并选择一个初始解,通过递推计算得到趋于或精确的解。
常用的迭代法有Jacobi迭代法、Gauss-Seidel迭代法和SOR迭代法等。
这些方法的时间复杂度通常为O(n^2)。
迭代法的优点是适用于大规模问题,但收敛速度慢,精度较差。
二、矩阵特征值求解方法2.1幂法幂法是求解特征值最大的特征值与对应特征向量的方法。
假设有一个n×n的矩阵A,选择一个初始向量x(0),通过迭代计算x(k)=Ax(k-1)/,Ax(k-1),其中,·,表示向量的范数,直到收敛为止。
最后得到的x为特征向量,特征值为λ=(Ax·x)/(x·x)。
幂法的收敛速度较慢,但适用于特征值分布差异较大的情况。
2.2反幂法反幂法是求解特征值最小的特征值与对应特征向量的方法。
和幂法类似,反幂法选择一个初始向量x(0),通过迭代计算x(k)=(A-λI)^-1x(k-1)/,(A-λI)^-1x(k-1),其中I为单位矩阵,λ为近似的特征值,直到收敛为止。
矩阵的特征值与特征向量的计算
![矩阵的特征值与特征向量的计算](https://img.taocdn.com/s3/m/ad52ad92c77da26925c5b0c6.png)
2019/9/21
2
§9.1 乘幂法与反幂法
一、乘幂法
通过求矩阵特征向量求出特征值的一种迭法方法, 它用以求按模最大的特征值和相应的特征向量。
设量实x1,矩x 2阵,A,的x n特线征性值无为关。1,设2A,的…特, 征n,值相按应模的排特序征为向:
1 2 n
则对任一非零向量 V (0) R n ,可以得到: n V(0) c1x1 c2x2 cnxn c j x j
3.1 2 且为实数,1 2 j ( j 3,4, , n)
由于
V(k)
1k c1x1 (1)k c2x2
j
n 3
c
j
j 1
k
x
j
2019/9/21
6
乘幂法(续)
当k充分大以后,有
V(k 2) l V(k) l
由于对任意l均有上面的结论,故只要取另外的l使
V (k) l
0
即可。
2.主特征值是实数,但不是单根,如
1 2 r 而 1 r1 n ,则
2019/9/21
5
乘幂法(续)
r
V(k) 1k c j x j
V(k) 仍然是 j相1 对于
jnr的1c j近 似1j 特k x征j 向量。
1
1
V (k 1) l
V (k) l
,l
1,2,, n
Remark:由于相应于1的特征向量子空间可能不是
一维的,由上式得到的V(k)只是该子空间的一个特
征向量。而且不同的V(0)可能得到线性无关的V(k)。
特征值的求法
![特征值的求法](https://img.taocdn.com/s3/m/d1e76e9d6e1aff00bed5b9f3f90f76c660374c6a.png)
特征值的求法
特征值是线性代数中的一个重要概念,主要用于描述矩阵的某些重要性质。
对于方阵,特征值可以通过求解特征多项式得到。
以下是特征值的基本求法:
1.写出矩阵A的特征多项式f(λ)。
对于n阶矩阵A,其特征多项式为f(λ)=|λE-A|,其中E是n阶单位矩阵。
2.求解特征多项式f(λ)=0的根,这些根就是矩阵A的特征值。
这个方程的解可能是一个或多个实数,也可能是复数。
3.对于每个解出的特征值λ,求解齐次线性方程组(λE-A)x=0的非零解x,这个解x就是对应于特征值λ的特征向量。
以上步骤是求解特征值和特征向量的基本方法。
需要注意的是,对于具体的矩阵,可能需要根据其特点选择合适的求解方法,例如对于大型稀疏矩阵,可能需要使用迭代法等数值方法求解特征值和特征向量。
此外,对于一些特殊的矩阵,如对称矩阵、反对称矩阵、正交矩阵等,其特征值和特征向量具有一些特殊的性质,可以利用这些性质简化求解过程。
以上信息仅供参考,如需更多信息,建议查阅线性代数相关书籍或咨询专业教师。
求特征值的计算技巧
![求特征值的计算技巧](https://img.taocdn.com/s3/m/b3ddd6500a4e767f5acfa1c7aa00b52acfc79c86.png)
求特征值的计算技巧
特征值的计算可以通过多种方法进行,这里介绍两种常用的方法:特征多项式法和幂法。
特征多项式法是求解特征值的一种常用方法。
对于一个n×n的矩阵A,其特征多项式定义为p(λ) = A-λI = det(A-λI),其中,I是n×n单位矩阵,det表示行列式。
特征多项式的根就是矩阵A的特征值。
通过计算特征多项式的根,我们可以求解矩阵A的所有特征值。
幂法是求解矩阵特征值中的最大特征值的一种有效方法。
它的基本思路是通过迭代来逼近最大特征值和对应的特征向量。
具体步骤如下:
1. 选取初始向量v0,通常选取单位向量或随机向量。
2. 计算迭代向量v1 = Av0。
3. 归一化迭代向量v1 = v1 / v1,其中v1表示v1的范数。
4. 计算最大特征值和对应的特征向量。
5. 重复步骤2-4,直到满足收敛条件或达到预设的迭代次数。
在应用幂法时,需要注意以下几点:
1. 初始向量的选取对收敛速度和精度都有影响,应该根据矩阵A的特点选择合适的初始向量。
2. 在迭代过程中,需要保持迭代向量的正交性,避免出现迭代向量之间的相互干扰。
3. 幂法只能求解矩阵特征值中的最大特征值和对应的特征向量,对于其他特征值和特征向量需要采用其他方法进行求解。
4. 在求解过程中,可能会出现数值不稳定或溢出等问题,需要进行适当的数值稳定和误差控制。
除了上述两种方法外,还可以使用其他方法如QR算法、Jacobi方法等来计算矩阵的特征值。
不同方法各有优缺点,需要根据具体情况选择合适的方法进行计算。
矩阵特征值与特征向量的计算
![矩阵特征值与特征向量的计算](https://img.taocdn.com/s3/m/1cad9e20fc4ffe473268ab00.png)
第九章矩阵特征值与特征向量的计算教学目的与要求:掌握用幂法和反幂法求矩阵特征值与特征向量的方法,了解 Jacobi 方法的适用范围和使用方法。
重点和难点:幂法和反幂法■ 教学内容:§1 幂法和反幂法一、幂法幂法的基本思想是给定初始向量(00≠x , 由迭代公式产生向量序列(1( (0,1, 2, +==L k k x Ax k {}(k x :上述向量称为迭代向量。
(1(0(22(0( (0 ⎧=⎪=⎪⎪⎨⎪=⎪⎪⎩LLLLk k x Ax x A x x A x 于是由上式得(1 ( 1(01111( λ++++k i u ======∑∑nnk k k k i i i i i i x Ax A x A a u a 11121112211[]λλλλλ+++⎛⎞⎛⎞=+++⎜⎟⎜⎟⎝⎠⎝⎠L k k k n n n a u a u a u设 ,由10a ≠1(2,3, , i i n λλ>=L 得 1 1lim 0λλ+→∞⎛⎞=⎜⎟⎝⎠k i i i k a u ,于是 121lim 0λλ+→∞=⎛⎞=⎜⎟⎝⎠∑k ni i i k i a u故只要 k 充分大,就有 (1111111121[]λλλ+++=⎛⎞=+≈⎜⎟⎝⎠∑nk k k i i i i 1λx a u a u a u 因此, 可以近似作为与(1 +k x 1λ相应的特征向量。
下面我们通过特征向量来计算特征值1λ。
用 ( k i x 表示的第 i 个分量,由于( k x (1 1111(111( ( λλ++≈k k i i k k i i x a x a u u ,所以 (11( (1,2, , λ+≈=L k i k ix i n x 上式这种由已知非零向量及矩阵 (0x A 的乘幂构造向量序列 kA {}( k x 用来计算矩阵 A 按模最大的特征值1λ与对应的特征向量的方法称为幂法。
例 1 用幂法的规范运算求矩阵的按模最大的特征值及对应的特征向量。
矩阵特征值的求法举例
![矩阵特征值的求法举例](https://img.taocdn.com/s3/m/bd7f58b7f80f76c66137ee06eff9aef8941e48bf.png)
矩阵特征值的求法举例矩阵是线性代数中的重要概念,它在科学计算、工程领域以及图像处理等领域都有着广泛的应用。
而在矩阵中,特征值是一个非常重要的概念,它不仅能够描述矩阵的性质,还能够在很多实际问题中起到关键作用。
那么,特征值又是如何求解的呢?本文将通过几个具体的例子来说明矩阵特征值的求法。
一、矩阵特征值的定义我们来介绍一下矩阵的特征值是什么。
对于一个n阶矩阵A(n*n),如果存在一个数λ和一个非零向量v,使得Av=λv,那么我们称λ是矩阵A的特征值,v是对应的特征向量。
特征值和特征向量的求解对于矩阵的性质和应用有着非常重要的作用。
下面我们就通过具体的例子来说明矩阵特征值的求法。
二、特征值的求法1. 对角矩阵的特征值我们来看一个简单的例子,对于一个对角矩阵,特征值的求法非常简单。
对于一个对角矩阵D,我们有D=diag{d1, d2, …, dn},其中对角线元素为d1, d2, …, dn。
那么,对角矩阵的特征值为其对角线元素,即λ1=d1, λ2=d2, …, λn=dn。
特征向量可以取对应的单位向量,如e1=[1, 0, 0, …, 0],e2=[0, 1, 0, …, 0],以此类推。
对于一个2*2的对角矩阵A= [3, 0; 0, 5],其特征值为λ1=3, λ2=5,对应的特征向量可以分别取为v1=[1, 0]和v2=[0, 1]。
接下来,我们来看一个稍复杂一点的例子,对于一个3*3的矩阵,特征值的求法比较繁琐,通常采用特征多项式的方法进行求解。
假设矩阵A= [a, b, c; d, e, f; g, h, i],我们可以先求解其特征多项式:|A-λI| = det|a-λ, b, c; d, e-λ, f; g, h, i-λ|简化上式得到:(a-λ)(e-λ)(i-λ) + (b*d*λ + c*f*λ + a*e*λ) - (a*f*λ + c*d*λ + b*i) = 0然后,我们解出多项式的根,即为矩阵A的特征值。
第九章_矩阵特征值问题的数值方法讲解
![第九章_矩阵特征值问题的数值方法讲解](https://img.taocdn.com/s3/m/58500c16581b6bd97f19eadf.png)
第9章矩阵特征值问题的数值方法9.1 特征值与特征向量9.2 Hermite矩阵特征值问题9.3 Jacobi方法9.4 对分法9.5 乘幂法9.6 反幂法9.7 QR方法9.1 特征值与特征向量设A是n阶矩阵,x是非零列向量. 如果有数λ存在,满足,(1)那么,称x是矩阵A关于特征值λ的特征向量.如果把(1)式右端写为,那么(1)式又可写为:x λ()0I A x λ-=||0I A λ-=即1110()||...n n n f I A a a a λλλλλ--=-=++++记它是关于参数λ的n 次多项式,称为矩阵A 的特征多项式,其中a 0=(-1)n |A |.(2)显然,当λ是A 的一个特征值时,它必然是的根. 反之,如果λ是的根,那么齐次方程组(2)有非零解向量x ,使(1)式成立. 从而,λ是A 的一个特征值.A 的特征值也称为A 的特征根.()0f λ=()0f λ=矩阵特征值和特征向量有如下主要性质:定理9.1.1 n阶矩阵A是降秩矩阵的充分必要条件是A有零特征值.定理9.1.2 设矩阵A与矩阵B相似,那么它们有相同的特征值.定理9.1.3 n阶矩阵A与A T有相同的特征值.定理9.1.4 设λ≠λj是n阶矩阵A的两个互异特i征值,x、y分别是其相应的右特征向量和左特征向量,那么,x T y=0 .9.2 Hermite矩阵特征值问题•设A为n阶矩阵,其共轭转置矩阵记为A H. 如果A=A H,那么,A称为Hermite矩阵.9.2.1 Hermite 矩阵的有关性质设是Hermite 矩阵A 的n 个特征值. 有以下性质:•全是实数.12,,...,n λλλ12,,...,n λλλ•有相应的n 个线性无关的特征向量,它们可以化为一组标准酉交的特征向量组,即12,,...,n λλλ12,,...,n u u u H i j u u ij δ=•是酉空间中的一组标准酉交基. 12,,...,n u u u•记U=( ),它是一个酉阵,即U H U=UU H =I ,那么即A 与以为对角元的对角阵相似.12,,...,n u u u 1H n U AU D λλ⎛⎫ ⎪== ⎪ ⎪⎝⎭12,,...,n λλλ•A 为正定矩阵的充分必要条件是全为正数.12,,...,n λλλ定理9.2.1 设是Hermite 矩阵A 的n 个特征值,那么证:12,,...,n λλλ21max i i nA λ≤≤=21n i F i Aλ==∑2222()()(())H A A A A A ρρρ===由21max ii n A λ≤≤=因此2221()()n H i F i A tr A A tr A λ====∑又由21n iF i A λ==∑得设x 是一个非零向量,A 是Hermite 矩阵,称为矩阵A 关于向量x 的Rayleigh 商,记为R(x).H H x Ax x x 定理9.2.2 如果A 的n 个特征值为其相应的标准酉交的特征向量为那么有12...n λλλ≥≥≥12,,...,n u u u 1()nR x λλ≥≥定理9.2.3 设A 是Hermite 矩阵,那么100min ()min ()k n k k k x C x x C x R x R x λλ-+∈≠∈≠==且且或9.2.2 极值定理定理9.2.4(极值定理) 设Hermite 矩阵的n 个特征值为,其相应的标准酉交特征向量为. 用C k 表示酉空间C n 中任意的k 维子空间,那么12...n λλλ≥≥≥12,,...,n u u u 1100max min ()max min ()k k n k n k k C x C x k C x C x R x R x λλ-+-+∈≠∈≠==且且或9.2.3 Hermite矩阵特征值问题的性态矩阵特征值问题与求解线性方程组问题一样,都存在当矩阵A的原始数据有小变化(小扰动)时,引起特征值问题的变化有大有小的问题,如果引起的变化小,称该特征值问题是良态的.反之,称为病态的.矩阵特征值问题的性态是很复杂的,通常分别就单个特征值或整体特征值给出状态数进行分析. 对于Hermite矩阵,由于其特征值问题的特殊性质,其特征值都是良态的.下面先证明Hermite矩阵特征值的扰动定理.定理9.2.5 设矩阵A ,E ,A+E 都是n 阶Hermite 矩阵,其特征值分别为那么,证设矩阵A 关于特征值λ1,λ2,…,λn 的标准酉交特征向量为u 1,u 2,…,u n ,是由u i ,u i+1,…,u n 生成的n-i+1维子空间.对中任意非零向量x,由极值定理,有12n λλλ≥≥≥12n εεε≥≥≥12n μμμ≥≥≥1i n i i λεμλε+≤≤+1n i C -+1n i C -+111000()max max max n i n i n i Hi H x C x H H H H x C x x C x x A E x x xx Ax x Ex x x x x μ-+-+-+∈≠∈≠∈≠+≤=+且且且由定理9.2.3,又由定理9.2.2,对任意x≠0,有从而有另一方面, A=(A+E)-E. 记为矩阵-E 的特征值,那么,重复上面的过程,可得从而有10max n i Hi H x C x x Ax x xλ-+∈≠=且110max n i Hn H x C x x Ex x x εε-+∈≠≥≥且1i i μλε≤+12n δδδ≥≥≥1i n i δε-+=-1i i λμδ≤+i i nμλε≥+定理9.2.5通常又称为Hermite 矩阵特征值的扰动定理定理9.2.6 设矩阵A 和A′=A+E 都是n 阶Hermite 矩阵,其特征值分别为和,那么这个定理表明,扰动矩阵E 使A 的特征值的变化不会超过‖E‖2.一般‖E‖2Hermite 矩阵特征值是良态的.12n λλλ≥≥≥12nλλλ'''≥≥≥222i i E E λμλ-≤≤+9.3 Jacobi方法理论上,实对称矩阵A正交相似于以A的特征值为对角元的对角阵. 问题是如何构造这样的正交矩阵呢? Jacobi方法就是通过构造特殊的正交矩阵序列,通过相似变换使A 的非对角线元素逐次零化来实现对角化的.9.3.1 平面旋转矩阵与相似约化先看一个简单的例子.设是二阶实对称矩阵,即a 21=a 12,其特征值为λ1,λ2. 令使得记容易验证B T =B, 且11122122a a A a a ⎛⎫= ⎪⎝⎭cos sin sin cos R θθθθ⎛⎫-= ⎪⎝⎭11T R AR λλ⎛⎫= ⎪⎝⎭11122122T b b B R AR b b ⎛⎫== ⎪⎝⎭22111112222212212211122222111222cos 2sin cos sin ()sin cos (cos sin )sin 2sin cos cos b a a a b b a a a b a a a θθθθθθθθθθθθ=++==-+-=-+解之得:当时当时并规定1122a a ≠12112221arctan 2a a a θ=-1122a a =21arctan 2pq pp qq a a a θ=-4πθ≤9.3.2 经典的Jacobi方法设A是实对称矩阵,记A1=A.Jacobi方法的基本思想是用迭代格式A k+1=Q T k A k Q k, k=1,2,…构造一个相似矩阵序列,使{Ak }收敛于一个对角阵. 其中Qk 为平面旋转矩阵,其旋转角θk 由使Ak的绝对值最大元a(k)pq=a(k)qp=0 或按列依次使A的非对角元零化来确定.定理9.3.1 设A 是n 阶实对称矩阵,那么由Jacobi 方法产生的相似矩阵序列{A k }的非对角元收敛于0. 也就是说,{A k }收敛于以A 的特征值为对角元的对角阵.记其中E k 是A k 除主对角元外的矩阵.由平面旋转矩阵的性质中,对于,有因此,()()k k ii k A diag a E =+1T k pq k pq A R A R +=,i p q ≠(1)2(1)2()2()2()()()()k k k k ip iq ip iq aa a a +++=+22()212()k k k pq F F E E a +=-又由假设,因此,这样,便有从而,当22()()()()1,,1max(1)nk k k k pqijpqpqi j n i ji j i jaaan n a≤≤≠=≠==-∑且且且22()(1)k k pqF E n n a ≤-222112222(1)(1)kk kF FFE E E n nn n+≤-≤---1,0k Fk E +→∞→9.3.3 实用的Jacobi 方法•循环Jacobi 方法必须一次又一次扫描,才能使{A k }收敛于对角阵,计算量很大. 在实际计算中,往往用一些特殊方法来控制扫描次数,减少计算量. 下面介绍一种应用最为广泛的特殊循环Jacobi 方法——阈Jacobi 方法. 阈Jacobi 方法首先确定一个阈值δ,在对非对角元零化的一次扫描中,只对其中绝对值超过阈值的非对角元进行零化. 当所有非对角元素的绝对值都不超过阈值后,将阈值减少,再重复下一轮扫描,直至阈值充分小为止.减少阈值的方法通常是先固定一个正整数M≥n ,扫描一次后,让. 而阈值的下界是根据实际问题的精度要求选定的.Mδδ→9.3.4 用Jacobi 方法计算特征向量•假定经过k 次迭代得到A k+1=R T k …R T 1AR 1…R k ,(15) 这时A k+1是满足精度要求的一个近似的对角阵. 如果记Q k =R 1R 2…R k =Q k-1R k ,(16)那么,Q k 是一个正交矩阵,且(15)式又可表示为A k+1=Q T k AQ k .当A k+1的非对角元素充分小,Q k 的第j 列q j 可以看成是近似特征值a (k+1)jj 相应的特征向量了.在实际计算中,可以按(16)式在迭代过程中形成Q k ,把Q k 看成是Q k-1右乘一个平面旋转矩阵得到. 不妨记Q 0=I ,Q k 的元素按下式计算:()(1)(1)()(1)(1)()(1)cos sin ,sin cos ,,,,1,2,k k k ip ipk ipk k k k iq ipk iqk k k ijijq q q q qqqqj p q i nθθθθ-----=+=-+=≠=9.4 对分法理论上,一个实对称矩阵正交相似于一个以其特征值为对角元的对角阵. 但是,经典的结果告诉我们,一个大于4次的多项式方程不可能用有限次四则运算求根. 因此,我们不可能期望只用有限次相似变换将一个实对称矩阵约化为一个对角阵.下面先介绍将一个实对称矩阵相似约化为实对称三对角矩阵的方法,再讨论求其特征值的对分法.9.4.1 相似约化为实对称三对角矩阵将一个实对称矩阵正交相似约化为一个实对称三对角矩阵的算法,可归纳如下:记A (1)=A,对k=1,2,…,n -2①按(4)式、(5)式和(8)式计算;②按(9)~(12)式,计算A (k+1).,kk k u σβ'和()1,()2,()(4)k k kk k k k k k nk a a u a σ++⎛⎫- ⎪⎪'= ⎪⎪ ⎪⎝⎭()()21,1(()(5)nk k k k k ik i k sign a a σ+=+=-∑()1,()(8)k k k k k k a βσσ+=-1()1(1)(),(9),(10)1,(11)2(),(12)k k kk Tk k kk k k k k k k T T k k k k g A u u g y g u A A u y y u βεβε--+===-=-+9.4.2 Sturm 序列的性质•设实对称三对角矩阵为其中βi ≠0 (i=1,2,…,n-1)其特征矩阵为T-λI. 记T-λI 的第i 阶主子式为111221n n a T a a ββββ-⎛⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭111211()i i i i a a p a λββλλββλ----=-•这是关于λ的i 次多项式,当i=n 时,p n (λ)=|T-λI |是矩阵T 的特征多项式.令p 0(λ)≡1,则有p 1(λ)=α1-λ,p i (λ)=(αi -λ)p i-1(λ)-β2i-1p i-2(λ),i=2,3,…,n.(15)•多项式序列{p i (λ)}(i=0,1,…,n)称为Sturm 序列111211()i i i i a a p a λββλλββλ----=-定理9.4.1{p i (λ)}(i=1,2,…,n)的根都是实根.证由(14)式,p i (λ)是i 阶实对称矩阵的特征多项式,因此,{p i (λ)}(i=1,2,…,n)的根全是实根. 定理9.4.2定理9.4.2 设α是p i (λ)的一个根,那么①p i-1(α)p i+1(α)≠0,即相邻的两个多项式无公共根;②p i-1(α)p i+1(α)<0,即p i-1(α)与p i+1( α)反号.lim ()0,i p λλ→-∞>lim ()0,lim ()0,i i p p λλλλ→+∞→+∞<>当i 为奇数当i 为偶数定理9.4.4 p i (λ)的根都是单根,并且将p i+1(λ)的根严格隔离.9.4.3 同号数和它的应用•定义1 设p 0(λ)≡1,{p i (λ)}(i=1,2,…,n) 是一个Sturm 序列,称相邻的两个数中符号一致的数目为同号数,记为a i (λ). 若某个p i (λ)=0,规定与p i-1(λ)反号.•定理9.4.5 设两个实数x<y ,那么,形如(13)式的实对称三对角矩阵T 的特征多项式在区间(x,y ]上根的数目为a(x)-a(y).9.4.4 求Hermite矩阵特征值的对分法•对分法的计算可归纳为以下4个部分①确定(13)式的矩阵T的全部特征值的分布区间.②在区间[a,b]中,用区间对分的方法找出只含T的一个特征值的子区间.③在只含一个特征值的子区间上的对分法.④同号数的计算.9.5 乘幂法乘幂法是适用于求一般矩阵按模最大特征值及相应特征向量的算法.•设A 是n 阶矩阵,其n 个特征值按模从大到小排序为又假设关于λ1,λ2,…,λn 的特征向量v 1,v 2,…,v n 线性无关.123nλλλλ>≥≥≥201112211[()()]kk kkn n A x a v a v v λλλλλ=+++x k →λk 1a 1v 1 (k→∞).因此,x k 可看成是关于特征值λ1的近似特征向量.迭代格式为1,0,1,kk k k k x z x x Az k ∞+===按模最大特征值λ1及其相应的特征向量v 1的乘幂法的计算公式:111,0,1,k k kk kT k k k T kkx z x x Az z Az k z z λ∞++====9.5.2 收缩方法•设矩阵A 的n 个特征值按模从大到小排序为,其相应的n 个线性无关特征向量为v 1,v 2,…,v n . 在计算A 的最大特征值λ1及相应特征向量v 1后,可以通过收缩方法,继续用乘幂法计算λ2及其相应的特征向量v 2.123n λλλλ>>≥≥•定义n 阶矩阵•把去掉A 1的第1行和第1列的n-1阶矩阵记为2121112221122211111111211211000n n T n n n n nn n n a v a a v a a v a A A v a v a a v a a v a α⎛⎫⎪--- ⎪=-= ⎪⎪---⎝⎭222112232113221132311233311333112112311311n n n n n n n n nn n n a v a a v a a v a a v a a v a a v a B a v a a v a a v a ---⎛⎫⎪--- ⎪= ⎪⎪---⎝⎭•那么,B 有与A 1除λ1外的相同的n-1个特征值|λ2|>|λ3|≥…≥|λn |,可以用乘幂法计算λ2及其相应的特征向量. 在计算λ1和v 1后,按(15)式形成n-1阶矩阵B 的计算过程称为收缩方法.9.6 反幂法•反幂法可以求一个非奇异矩阵A 的逆矩阵A-1的按模最小的特征值及相应的特征向量,又可以求A 的一个近似特征值相应的特征向量.•9.6.1 求按模最小特征值及相应特征向量的反幂法,又称为反迭代法.1(1)1,0,1,kk k k kTk k k T k kx z x LUx z z x k z zξ∞+++====9.6.2 求近似特征值的特征向量的反幂法•先对矩阵进行LU 分解,记那么,(7)下面介绍一种选取特殊的初始向量x 0的反幂法——半迭代法.l I A λ-l I A LU λ-=1,0,1,kk k kkk k x z x Ly zUx y k ∞+====•假设,选取初始向量x 0满足‖x 0‖∞=1,这时z 0=x 0.对照(7)式中的第二个式子.可把z 0看成满足Le=z 0.(8)这里,e=(1,1,…,1)T ,而z 0的各个分量的取值多少是无关重要的.这样,在第一个迭代步的计算中,只需求解(7)式中的上三角方程组Ux 1=e. “半迭代法”的命名也由此而得.l I A λ-9.7 QR 方法定理9.7.1设A 是n 阶矩阵,其n 个特征值为.那么存在一个酉矩阵U ,使U HAU 是以为对角元的上三角矩阵. 12,,,n λλλ12,,,n λλλ9.7.1 两个基本定理定理9.7.2设A 是n 阶实矩阵,那么,存在一个正交矩阵Q ,使Q TAQ 为一个准上三角矩阵,它的对角元是A 的一个特征值,对角元上的二阶块矩阵的两个特征值是A 的一对共轭复特征值.9.7.2 相似约化为上Hessenberg矩阵对一般n阶矩阵,QR算法的每一个迭代步需要O(n3)次乘法运算.如果矩阵阶数稍大,这个算法几乎没有实际的应用价值.通常采用的方法是先将矩阵相似约化为上Hessenberg形式的矩阵,在此基础上应用QR 迭代.这时,一个QR迭代步的乘法运算次数只需O(n2)次.所谓上Hessenberg 矩阵是指一个n 阶矩阵A ,如果当i>j+1时,a ij =0,称A 为上Hessenberg 矩阵.例如:一个5阶的上Hessenberg 矩阵具有如下的形式:**********0****00***000**A ⎛⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭下面介绍QR 方法时,都假设矩阵A 是一个上Hessenberg 矩阵.9.7.3 QR算法•设A是n阶矩阵且有QR分解A=QR,(2)这里,Q是酉矩阵,R是上三角矩阵.如果A 是满秩并规定R有正对角元,这个分解是惟一的.一、QR 算法的基本思想•记A =A 1且有A 1=Q 1R 1.将等号右边两个矩阵因子的次序交换,得A 2=R 1Q 1,且,(3)即A 2~A 1.不难证明:即A k+1~A k ~…~A 1,矩阵序列{A k }有相同的特征值.记12111A Q AQ -=111111k k k k kk k A Q A Q Q Q A Q Q ---+==12k k Q Q Q Q =12k kR R R R =容易得到是A k 的一个QR 分解k k k A Q R 如果A 是一个满秩的上Hessenberg 矩阵,可以证明,经过一个QR 迭代步得到的A 2=Q -11A 1Q 1仍然是上Hessenberg 矩阵. 因为上Hessenberg 矩阵次对角线以下的元素全为0,因此,只要证明,当k→∞时,由迭代格式(4)产生的矩阵A k 的次对角元趋向于零就可以了.二、QR算法的收敛性•定理9.7.3设n阶矩阵A的n个特征值满足|λ1|>|λ2|>…>|λn|>0,其相应的n个线性无关特征向量为x1,x2,…,xn.记X=(x1,x2,…,x n), Y= X-1.如果Y存在LU分解,那么,由(4) 式产生的矩阵A k基本收敛于上三角矩阵R.这里,基本收敛的含义指{Ak }的元素中除对角线以下的元素趋于零外,可以不收敛于R的元素.三、QR 算法的迭代过程•1. 一个QR 迭代步的计算①对l=1,2,…,n-1,构造n-1个平面旋转矩阵P l,l+1,使A 1的次对角元全部零化,实现A 1的QR 分解的计算,这里,,1,1,1,11,1,,1,2,l l l l ll lj l l l l l l l l c s a a j l l n s c a a ++++++⎛⎫⎛⎫⎛⎫→=++ ⎪⎪ ⎪-⎝⎭⎝⎭⎝⎭1,,1,122221,1,,l l lll l l l ll l l ll l l a a c s a aa a +++++==++221,ll l l r a a+=+②用P l,l+1右乘(24),所得结果也放回矩阵A 相应的元素中.,1,1,,1,1,1,1(,)(,),1,2,,1l l l l i l i l il i l l l l l c s a a a a s c i l ++++++-⎛⎫→ ⎪⎝⎭=+2. QR 算法的迭代控制当迭代步数k 充分大时,由迭代格式(4)产生的A k 的次对角元趋于0.在实际计算中,控制迭代次数常用的一种办法是,预先给定一个小的正数ε,在一个迭代步的计算结束后,对l=n-1, n-2,…,1,依次判别次对角元的绝对值是否满足或更严格的准则是或不太严格的准则是如果上面三个不等式中有一个成立,把看做实际上为零. 1,l l a A ε+≤1,1,1min{,}l l ll l l a a a ε+++≤1,1,1{}l l ll l l a a a ε+++≤+1,l l a +。
矩阵特征值求解
![矩阵特征值求解](https://img.taocdn.com/s3/m/103619db0b4c2e3f56276312.png)
矩阵特征值求解的分值算法12组1.1矩阵计算的基本问题(1)求解线性方程组的问题•即给定一个n阶非奇异矩阵A和n维向量b,求一个n维向量X,使得Ax =b (1. 1. 1 )(2)线性最小二乘问题,即给定一个mx n阶矩阵A和m维向量b ,求一个n维向量X,使得|AX -b| =min{ | Ay -比严R n} (1.1.2 )(3)矩阵的特征问题,即给定一个n阶实(复)矩阵A,求它的部分或全部特征值以及对应的特征向量,也就是求解方程(1. 1. 3 )一对解(4 X),其中R(C), x- R n(C n),即A为矩阵A的特征值,X为矩阵Ax = ZxA的属于特征值A的特征向量。
在工程上,矩阵的特征值具有广泛的应用,如大型桥梁或建筑物的振动问题:机械和机件的振动问题;飞机机翼的颤振问题;无线电电子学及光学系统的电磁振动问题;调节系统的自振问题以及声学和超声学系统的振动问题•又如天文、地震、信息系统、经济学中的一些问题都与矩阵的特征值问题密切相关。
在科学上,计算流体力学、统计计算、量子力学、化学工程和网络排队的马尔可夫链模拟等实际问题,最后也都要归结为矩阵的特征值问题.由于特征值问题在许多科学和工程领域中具有广泛的应用,因此对矩阵的特征值问题的求解理论研究算法的开发软件的制作等是当今计算数学和科学与工程计算研究领域的重大课题,国际上这方面的研究工作十分活跃。
1.2矩阵的特征值问题研究现状及算法概述对一个nxn阶实(复)矩阵A,它的特征值问题,即求方程(1.1.3)式的非平凡解,是数值线性代数的一个中心问题•这一问题的内在非线性给计算特征值带来许多计算问题•为了求(1.1.3)式中的A ,—个简单的想法就是显式地求解特征方程det (A 一几I)二0 (121 ) 除非对于个别的特殊矩阵,由于特征方程的系数不能够用稳定的数值方法由行列式的计算来求得,既使能精确计算出特征方程的系数,在有限精度下,其特征多项式f〃)二det(A-ZJ)的根可能对多项式的系数非常敏感能•因此,这个方法只在理论上是有意义的,实际计算中对一般矩阵是不可行的数 _ . _ . 人较大,则行列式det (A -几I)的计算量将非常大;其次,根据•首先,右矩即AfbJ阳数大于四的多项式求根不存在一种通用的方法,基于上述原Galois理论对于次因,人们只能寻求其它途径•因此,如何有效地!精确地求解’矩阵特征值问题,就成为数值线性代数领域的一个中心问题.目前,求解矩阵特征值问题的方法有两大类:一类称为变换方法,另一类称为向量迭代方法•变换方法是直接对原矩阵进行处理,通过一系列相似变换,使之变换成 一个易于求解特征值的形式,如Jacobi 算法,Givens 算法,QR 算法等。
矩阵特征值简单求法
![矩阵特征值简单求法](https://img.taocdn.com/s3/m/a3c88b47a55177232f60ddccda38376bae1fe043.png)
矩阵特征值简单求法矩阵是数学中一种非常重要的概念,它是线性代数中不可或缺的内容。
在矩阵理论中,特征值是最基本的概念之一,对于一些重要的计算有着至关重要的作用。
因此,矩阵特征值求解方法的学习和掌握也非常重要。
接下来,我们将先介绍矩阵特征值的概念,然后再针对其中的一种特定方法进行简单的讲解。
矩阵特征值的概念矩阵特征值是指矩阵在某一方向上的表现力大小,也可以理解为矩阵在该方向上的拉伸或压缩程度。
在解析几何中,我们知道一个几何体的特征值也是相应的方向上的表现力大小。
同理,对于矩阵而言,其特征值就是指其某一方向上的表现力大小。
具体来说,对于任一n阶矩阵A,对它的每一个标量λ以及向量x,若满足Ax=λx,那么λ就是矩阵A的一个特征值, x就是它对应的特征向量。
一个矩阵可以有一个或多个特征值和对应的特征向量,对于一个矩阵而言,其特征值和特征向量是具有特殊性质的,能够被用来分解和刻画矩阵。
矩阵特征值的求解方法目前,有很多方法用于求解矩阵的特征值和特征向量。
其中,Jacobi迭代法、QR分解法、幂法以及反迭代法等算法,都是常见的求解矩阵特征值的方法。
这些算法虽然精度高,但并不适用于处理大规模的矩阵运算,因此还需要针对特殊情况设计一些简便的求解方法。
对于对称矩阵而言,矩阵特征值的求解就变得很简单了,可以通过选择对称矩阵和正交矩阵进行简单的计算和推导。
但是,对于非对称矩阵而言,一般都需要借助于数值计算才能得到矩阵的特征值和特征向量。
因此,在实际计算过程中,往往会希望有一种简单的求解特征值的方法,使得计算更加方便和迅速。
矩阵特征值的简单求解方法Matlab 中有一种重要的函数——特征值函数 eig(eigenvalue)用于计算特征值和特征向量。
这是一种非常普遍的使用方法,但是这种方式并没有揭示矩阵特征值计算的本质内容。
因此,以下我们将介绍一种更加简单的求解矩阵特征值的方法——谱分裂(Spectral Splitting)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第9章矩阵特征值问题的数值方法9.1 特征值与特征向量9.2 Hermite矩阵特征值问题9.3 Jacobi方法9.4 对分法9.5 乘幂法9.6 反幂法9.7 QR方法9.1 特征值与特征向量设A是n阶矩阵,x是非零列向量. 如果有数λ存在,满足, (1)那么,称x是矩阵A关于特征值λ的特征向量.如果把(1)式右端写为 ,那么(1)式又可写为: x λ()0I A x λ-=||0I A λ-=即1110()||...n n n f I A a a a λλλλλ--=-=++++记 它是关于参数λ的n 次多项式,称为矩阵A 的特征多项式, 其中a 0=(-1)n |A |.(2)显然,当λ是A的一个特征值时,它必然是的根. 反之,如果λ是的根,那么齐次方程组(2)有非零解向量x,使(1)式成立. 从而,λ是A的一个特征值.A的特征值也称为A的特征根.()0 fλ=()0 fλ=矩阵特征值和特征向量有如下主要性质:定理9.1.1 n阶矩阵A是降秩矩阵的充分必要条件是A有零特征值.定理9.1.2 设矩阵A与矩阵B相似,那么它们有相同的特征值.定理9.1.3 n阶矩阵A与A T有相同的特征值.定理9.1.4 设λ≠λj是n阶矩阵A的两个互异特i征值,x、y分别是其相应的右特征向量和左特征向量,那么,x T y=0 .9.2 Hermite矩阵特征值问题•设A为n阶矩阵,其共轭转置矩阵记为A H. 如果A=A H,那么,A称为Hermite矩阵.9.2.1 Hermite 矩阵的有关性质设是Hermite 矩阵A 的n 个特征值. 有以下性质:•全是实数. 12,,...,n λλλ12,,...,n λλλ•有相应的n 个线性无关的特征向量,它们可以化为一组标准酉交的特征向量组 ,即 12,,...,n λλλ12,,...,n u u u H i j u u ijδ=•是酉空间中的一组标准酉交基. 12,,...,n u u u•记U=( ),它是一个酉阵,即U H U=UU H =I ,那么即A 与以 为对角元的对角阵相似. 12,,...,n u u u 1H n U AU D λλ⎛⎫ ⎪== ⎪ ⎪⎝⎭12,,...,n λλλ•A 为正定矩阵的充分必要条件是 全为正数.12,,...,n λλλ定理9.2.1 设 是Hermite 矩阵A 的n个特征值,那么证: 12,,...,n λλλ21max i i n A λ≤≤=21n i F i A λ==∑2222()()(())H A A A A A ρρρ===由21max ii n A λ≤≤=因此2221()()n H i F i A tr A A tr A λ====∑又由21n iF i A λ==∑得设x 是一个非零向量,A 是Hermite 矩阵,称 为矩阵A 关于向量x 的Rayleigh 商,记为R(x).H H x Ax x x 定理9.2.2 如果A 的n 个特征值为其相应的标准酉交的特征向量为 那么有12...n λλλ≥≥≥12,,...,n u u u 1()n R x λλ≥≥定理9.2.3 设A 是Hermite 矩阵 ,那么 100min ()min ()k n k k k x C x x C x R x R x λλ-+∈≠∈≠==且且或9.2.2 极值定理定理9.2.4(极值定理) 设Hermite 矩阵的n 个特征值为 ,其相应的标准酉交特征向量为 .用C k 表示酉空间C n 中任意的k 维子空间,那么12...n λλλ≥≥≥12,,...,n u u u 1100max min ()max min ()k k n k n k k C x C x k C x C x R x R x λλ-+-+∈≠∈≠==且且或9.2.3 Hermite矩阵特征值问题的性态矩阵特征值问题与求解线性方程组问题一样,都存在当矩阵A的原始数据有小变化(小扰动)时,引起特征值问题的变化有大有小的问题,如果引起的变化小,称该特征值问题是良态的.反之,称为病态的.矩阵特征值问题的性态是很复杂的,通常分别就单个特征值或整体特征值给出状态数进行分析. 对于Hermite矩阵,由于其特征值问题的特殊性质,其特征值都是良态的.下面先证明Hermite矩阵特征值的扰动定理.定理9.2.5 设矩阵A ,E ,A+E 都是n 阶Hermite 矩阵,其特征值分别为那么, 证 设矩阵A 关于特征值λ1,λ2,…,λn 的标准酉交特征向量为u 1,u 2,…,u n , 是由u i ,u i+1,…,u n 生成的n-i+1维子空间. 对 中任意非零向量x,由极值定理,有 12n λλλ≥≥≥12n εεε≥≥≥12n μμμ≥≥≥1i n i i λεμλε+≤≤+1n i C -+1n i C -+111000()max max max n i n i n i Hi H x C x H H H H x C x x C x x A E x x xx Ax x Ex x x x x μ-+-+-+∈≠∈≠∈≠+≤=+且且且由定理9.2.3, 又由定理9.2.2,对任意x≠0,有从而有 另一方面, A=(A+E)-E. 记 为矩阵-E 的特征值,那么, 重复上面的过程,可得 从而有 10max n i Hi H x C x x Ax x xλ-+∈≠=且110max n i H n H x C x x Ex x x εε-+∈≠≥≥且1i i μλε≤+12nδδδ≥≥≥1i n i δε-+=-1i i λμδ≤+i i n μλε≥+定理9.2.5通常又称为Hermite 矩阵特征值的扰动定理定理9.2.6 设矩阵A 和A′=A+E 都是n 阶Hermite 矩阵,其特征值分别为和 ,那么这个定理表明,扰动矩阵E 使A 的特征值的变化不会超过 ‖E‖2. 一般‖E‖2Hermite 矩阵特征值是良态的.12n λλλ≥≥≥12nλλλ'''≥≥≥222i i E E λμλ-≤≤+9.3 Jacobi方法理论上,实对称矩阵A正交相似于以A的特征值为对角元的对角阵. 问题是如何构造这样的正交矩阵呢? Jacobi方法就是通过构造特殊的正交矩阵序列,通过相似变换使A 的非对角线元素逐次零化来实现对角化的.9.3.1 平面旋转矩阵与相似约化先看一个简单的例子.设 是二阶实对称矩阵,即a 21=a 12,其特征值为λ1,λ2. 令使得 记 容易验证B T =B, 且11122122a a A a a ⎛⎫= ⎪⎝⎭cos sin sin cos R θθθθ⎛⎫-= ⎪⎝⎭11T R AR λλ⎛⎫= ⎪⎝⎭11122122T b b B R AR b b ⎛⎫== ⎪⎝⎭22111112222212212211122222111222cos 2sin cos sin ()sin cos (cos sin )sin 2sin cos cos b a a a b b a a a b a a a θθθθθθθθθθθθ=++==-+-=-+解之得:当 时 当 时并规定 1122a a ≠12112221arctan 2a a a θ=-1122a a =21arctan 2pq pp qq a a a θ=-4πθ≤9.3.2 经典的Jacobi 方法 设A 是实对称矩阵,记A 1=A.Jacobi 方法的基本思想是用迭代格式A k+1=Q T k A k Q k , k=1,2,…构造一个相似矩阵序列,使{A k }收敛于一个对角阵. 其中 Q k 为平面旋转矩阵,其旋转角θk 由使A k 的绝对值 最大元a (k)pq =a (k)qp =0 或按列依次使A 的非对角元 零化来确定.定理9.3.1 设A 是n 阶实对称矩阵,那么由Jacobi 方法产生的相似矩阵序列{A k }的非对角元收敛于0. 也就是说,{A k }收敛于以A 的特征值为对角元的对角阵.记其中E k 是A k 除主对角元外的矩阵.由平面旋转矩阵的性质中,对于 ,有 因此, ()()k k ii k A diag a E =+1T k pq k pq A R A R +=,i p q ≠(1)2(1)2()2()2()()()()k k k k ip iq ip iq a a a a +++=+22()212()k k k pq F F E E a +=-又由假设,因此, 这样,便有从而,当 22()()()()1,,1max (1)n k k k k pq ij pq pq i j n i j i j i j a a a n n a ≤≤≠=≠==-∑且且且22()(1)k k pqF E n n a ≤-222112222(1)(1)k k k F F F E E E n n n n +≤-≤---1,0k F k E +→∞→9.3.3 实用的Jacobi 方法•循环Jacobi 方法必须一次又一次扫描,才能使{A k }收敛于对角阵 ,计算量很大. 在实际计算中,往往用一些特殊方法来控制扫描次数,减少计算量. 下面介 绍一种应用最为广泛的特殊循环Jacobi 方法——阈Jacobi 方法. 阈Jacobi 方法首先确定一个阈值δ,在对非对角元零化的一次扫描中,只对其中绝对值 超过阈值的非对角元进行零化. 当所有非对角元素的绝对值都不超过阈值后,将阈值减少, 再重复下一轮扫描,直至阈值充分小为止. 减少阈值的方法通常是先固定一个正整数M≥n ,扫描一次后,让 . 而阈值的下界是根据实际问题的精度要求选定的.M δδ→9.3.4 用Jacobi 方法计算特征向量 •假定经过k 次迭代得到A k+1=R T k …R T 1AR 1…R k ,(15) 这时A k+1是满足精度要求的一个近似的对角阵. 如果记Q k =R 1R 2…R k =Q k-1R k ,(16)那么,Q k 是一个正交矩阵,且(15)式又可表示为A k+1=Q T k AQ k .当A k+1的非对角元素充分小,Q k 的第 j 列q j 可以看成是近似特征值a (k+1)jj 相应的特征向量了.在实际计算中,可以按(16)式在迭代过程中形成Q k ,把Q k 看成是Q k-1右乘一个平面旋转矩阵得到. 不妨记 Q 0=I ,Q k 的元素按下式计算:()(1)(1)()(1)(1)()(1)cos sin ,sin cos ,,,,1,2,k k k ip ip k ip k k k k iq ip k iq k k k ij ijqq q qq q q q j p q i nθθθθ-----=+=-+=≠=9.4 对分法理论上,一个实对称矩阵正交相似于一个以其特征值为对角元的对角阵. 但是,经典的结果告诉我们,一个大于4次的多项式方程不可能用有限次四则运算求根. 因此,我们不可能期望只用有限次相似变换将一个实对称矩阵约化为一个对角阵.下面先介绍将一个实对称矩阵相似约化为实对称三对角矩阵的方法,再讨论求其特征值的对分法.9.4.1 相似约化为实对称三对角矩阵 将一个实对称矩阵正交相似约化为一个实对称三对角矩阵的算法,可归纳如下:记A (1)=A,对k=1,2,…,n -2①按(4)式、(5)式和(8)式计算; ②按(9)~(12)式,计算A (k+1).,k k k u σβ'和()1,()2,()(4)k k k k k k k k k nk a a u a σ++⎛⎫- ⎪ ⎪'= ⎪ ⎪ ⎪⎝⎭()()21,1()()(5)nk k k k k ik i k sign a a σ+=+=-∑()1,()(8)k k k k k k a βσσ+=-1()1(1)(),(9),(10)1,(11)2(),(12)k k k k T k k kk k k k k k k T T k k k k g A u u g y g u A A u y y u βεβε--+===-=-+9.4.2 Sturm 序列的性质 •设实对称三对角矩阵为其中βi ≠0 (i=1,2,…,n-1) 其特征矩阵为T-λI. 记T-λI 的第i 阶主子式为111221n n a T a a ββββ-⎛⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭111211()i i i i a a p a λββλλββλ----=-•这是关于λ的i 次多项式,当i=n 时, p n (λ)=|T-λI |是矩阵T 的特征多项式. 令p 0(λ)≡1,则有p 1(λ)=α1-λ,p i (λ)=(αi -λ)p i-1(λ)-β2i-1p i-2(λ),i=2,3,…,n.(15)•多项式序列{p i (λ)} (i=0,1,…,n)称为Sturm 序列111211()i i i i a a p a λββλλββλ----=-定理9.4.1{p i (λ)} (i=1,2,…,n)的根都是 实根. 证 由(14)式,p i (λ)是i 阶实对称矩阵的特征多项式,因此,{p i (λ)} (i=1,2,…,n)的根全是实根. 定理9.4.2 定理9.4.2 设α是p i (λ)的一个根,那么 ①p i-1(α)p i+1(α)≠0,即相邻的两个多项式无公共根; ②p i-1(α)p i+1(α)<0,即p i-1(α)与p i+1( α)反号. lim ()0,i p λλ→-∞>lim ()0,lim ()0,i i p p λλλλ→+∞→+∞<>当i 为奇数当i 为偶数定理9.4.4 p i (λ)的根都是单根,并且将p i+1(λ)的根严格隔离.9.4.3 同号数和它的应用•定义1 设p 0(λ)≡1,{p i (λ)}(i=1,2,…,n) 是一个Sturm 序列,称相邻的两个数中符号一致的数目为同号数,记为a i (λ). 若某个p i (λ)=0,规定与p i-1(λ)反号.•定理9.4.5 设两个实数x<y ,那么,形如(13)式的实对称 三对角矩阵T 的特征多项式在区间(x,y ]上根的数目为a(x)-a(y).9.4.4 求Hermite矩阵特征值的对分法•对分法的计算可归纳为以下4个部分①确定(13)式的矩阵T的全部特征值的分布区间.②在区间[a,b]中,用区间对分的方法找出只含T的一个特征值的子区间.③在只含一个特征值的子区间上的对分法.④同号数的计算.9.5 乘幂法乘幂法是适用于求一般矩阵按模最大特征值及相应特征向量的算法. •设A 是n 阶矩阵,其n 个特征值按模从大到小排序为 又假设关于λ1,λ2,…,λn 的特征向量v 1,v 2,…,v n 线性无关.123n λλλλ>≥≥≥201112211[()()]k k k k n n A x a v a v v λλλλλ=+++x k →λk 1a 1v 1 (k→∞).因此,x k 可看成是关于特征值λ1的近似特征向量.迭代格式为 1,0,1,k k k k k x z x x Az k ∞+===按模最大特征值λ1及其相应的特征向量v 1的乘幂法的计算公式:111,0,1,kk k k kT k k k T kk x z x x Az z Az k z z λ∞++====9.5.2 收缩方法•设矩阵A 的n 个特征值按模从大到小排序为,其相应的n 个线性无关特征向量为v 1,v 2,…,v n . 在计算A 的最大特征值λ1及相应特征向量v 1后,可以通过收缩方法,继续用乘幂法计算λ2及其相应的特征向量v 2.123n λλλλ>>≥≥•定义n 阶矩阵•把去掉A 1的第1行和第1列的n-1阶矩阵记为2121112221122211111111211211000n n T n n n n nn n n a v a a v a a v a AA v a v a a v a a v a α⎛⎫ ⎪--- ⎪=-= ⎪ ⎪---⎝⎭222112232113221132311233311333112112311311n n n n n n n n nn n n a v a a v a a v a a v a a v a a v a B a v a a v a a v a ---⎛⎫ ⎪--- ⎪= ⎪ ⎪---⎝⎭•那么,B 有与A 1除λ1外的相同的n-1个特征值 |λ2|>|λ3|≥…≥|λn |,可以用乘幂法计算λ2及其相应的 特征向量. 在计算λ1和v 1后,按(15)式形成n-1阶矩阵B 的计算过程称为收缩方法.9.6 反幂法•反幂法可以求一个非奇异矩阵A 的逆矩阵A -1的按模最小的特征值及相应的特征向量,又可以求A 的一个近似特征值相应的特征向量. •9.6.1 求按模最小特征值及相应特征向量的反幂法,又称为反迭代法. 1(1)1,0,1,k k k k k T k k k Tk kx z x LUx z z x k z z ξ∞+++====9.6.2 求近似特征值的特征向量的反幂法•先对矩阵进行LU 分解,记 那么, (7)下面介绍一种选取特殊的初始向量x 0的反幂法——半迭代法.l I A λ-l I A LU λ-=1,0,1,k k k k k k k x z x Ly z Ux y k ∞+====•假设 ,选取初始向量x 0满足‖x 0‖∞=1,这时z 0=x 0.对照(7)式中的第二个式子.可把z 0看成满足Le=z 0.(8)这里,e=(1,1,…,1)T ,而z 0的各个分量的取值多少是无关重要的.这样,在第一个迭代步的计算中,只需求解(7)式中的上三角方程组Ux 1=e. “半迭代法”的命名也由此而得. l I A λ-9.7 QR 方法定理9.7.1设A 是n 阶矩阵,其n 个 特征值为 .那么存在一个酉矩阵U ,使 U HAU 是以为 对角元的上三角矩阵. 12,,,n λλλ12,,,n λλλ9.7.1 两个基本定理 定理9.7.2设A 是n 阶实矩 阵,那么,存在一个正交矩阵Q ,使Q TAQ 为一个准上三角矩阵,它的对角元是A 的一个特征值,对角元上的二阶块矩阵的两个特征值是A 的一对共轭复特征值.9.7.2 相似约化为上Hessenberg矩阵对一般n阶矩阵,QR算法的每一个迭代步需要O(n3)次乘法运算.如果矩阵阶数稍大,这个算法几乎没有实际的应用价值.通常采用的方法是先将矩阵相似约化为上Hessenberg形式的矩阵,在此基础上应用QR 迭代.这时,一个QR迭代步的乘法运算次数只需O(n2)次.所谓上Hessenberg 矩阵是指一个n 阶矩阵A ,如果当i>j+1时,a ij =0,称A 为上Hessenberg 矩阵.例如:一个5阶的上Hessenberg 矩阵具有如下的形式:**********0****00***000**A ⎛⎫ ⎪ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭下面介绍QR 方法时,都假设矩阵A 是一个上Hessenberg 矩阵.9.7.3 QR算法•设A是n阶矩阵且有QR分解A=QR,(2)这里,Q是酉矩阵,R是上三角矩阵.如果A 是满秩并规定R有正对角元,这个分解是惟一的.一、QR 算法的基本思想 •记A =A 1且有A 1=Q 1R 1.将等号右边两个矩阵因子的次序交换,得A 2=R 1Q 1,且,(3)即A 2~A 1. 不难证明: 即A k+1~A k ~…~A 1,矩阵序列{A k }有相同的特征值.记 12111A Q AQ -=111111k k k k kk k A Q A Q Q Q A Q Q ---+==12k k Q Q Q Q =12k kR R R R =容易得到 是A k 的一个QR 分解 k k k A Q R 如果A 是一个满秩的上Hessenberg 矩阵,可以证明,经过一个QR 迭代步得到的A 2=Q -11A 1Q 1仍然是上Hessenberg 矩阵. 因为上Hessenberg 矩阵次对角线以下的元素全为0,因此,只要证明,当k→∞时,由迭 代格式(4)产生的矩阵A k 的次对角元趋向于零就可以了.二、 QR算法的收敛性•定理9.7.3设n阶矩阵A的n个特征值满足|λ1|>|λ2|>…>|λn|>0,其相应的n个线性无关特征向量为x1,x2,…,xn.记X=(x1,x2,…,x n), Y= X-1.如果Y存在LU分解,那么,由(4) 式产生的矩阵A k基本收敛于上三角矩阵R.这里,基本收敛的含义指{Ak }的元素中除对角线以下的元素趋于零外,可以不收敛于R的元素.三、 QR 算法的迭代过程•1. 一个QR 迭代步的计算①对l=1,2,…,n-1,构造n-1个平面旋转矩阵P l,l+1,使A 1的次对角元全部零化,实现A 1的QR 分解的计算,这里, ,1,1,1,11,1,,1,2,l l l l ll lj l l l l l l l l c s a a j l l n s c a a ++++++⎛⎫⎛⎫⎛⎫→=++ ⎪⎪ ⎪-⎝⎭⎝⎭⎝⎭1,,1,122221,1,,l l ll l l l l ll l l ll l l a a c s a a a a +++++==++221,ll l lr a a +=+②用P l,l+1右乘(24),所得结果也放回矩阵A 相应的元素中.,1,1,,1,1,1,1(,)(,),1,2,,1l l l l i l i l il i l l l l l c s a a a a s c i l ++++++-⎛⎫→ ⎪⎝⎭=+2. QR 算法的迭代控制 当迭代步数k 充分大时,由迭代格式(4)产生的A k 的次对角元趋于0.在 实 际计算中,控制迭代次数常用的一种办法是,预先给定一个小的正数ε,在一个迭代步的计 算结束后,对l=n-1, n-2,…,1,依次判别次对角元的绝对值是否满足 或更严格的准则是 或不太严格的准则是 如果上面三个不等式中有一个成立,把 看做实际上为零. 1,l l a Aε+≤1,1,1min{,}l l ll l l a a a ε+++≤1,1,1{}l l ll l l a a a ε+++≤+1,l l a +。