矩阵特征值的数值解法

合集下载

矩阵特征值与特征向量计算

矩阵特征值与特征向量计算

向量的∞-范数
,
向量的规范化
, k 1, 2, (3.9)
当 |k -k-1| /k ≤ 时,迭代结束,以当前的 k 作为 1 的近似 值,以 yk-1作为属于 1 的特征向量。
例1 求下矩阵的最大特征值及所属特征向量.
误差为0.0001.
6 A 21 12 12 3 12 6 24 51
注:
(1)有些实际问题只需要求出按模最大的特征值和 相应的特征向量,有的要求出全部的特征值和相应的 特征向量。 对于不同的问题有不同的解法。 (2)关于计算A的特征值问题,当n=2,3时,可按 行列式展开的方法求出φ()=0的根,但当n较大时,如 果再按行列式方法求,首先求出φ()的系数,再求φ() 的根,工作量就非常大,用这种方法求φ()的根是不 切实际的,因此需要研究A的特征值及特征向量的数值 解法。 (3)本章将介绍计算机上常用的两类方法,一类是 幂法及反幂法(迭代法),另一类是正交相似变换的 方法(变换法)。
2
(b xT 1 1 b1 x1T
2 T
) A (b x )
1 1 2
b1 x1
T
2


b1 x1 x1 b1 x1
2 2
1
1 .
第一种幂法迭代格式:
任取非零向量u0 ,
T uk 1uk 1 k 1 yk 1 uk 1 / k 1 uk Ayk 1 T k yk 1uk
k 0,1, 2,
任取初始值 u 0
y0 u0 u0 ,
0,
u 1 Ay 0
Au 01

Au 0 Au 0
2 2
,
u 2 Ay 1

特征值与特征向量计算第六章

特征值与特征向量计算第六章
1 2 n
其对应的特征向量为
因为 A xk = k xk
x1 x2 , x3 ,
, xn
所以 A-1 xk = k-1 xk
故k-1就是矩阵A-1的特征值,它们满足
n
1

n1
1

1
1
对应的特征向量仍为 x k 。因此,求矩阵 A 的按模最小特征 值,就相当于求其逆阵A-1的按模最大特征值n-1 ,这只需应用 幂法即可求得。
i
, n , B
1
的特征向量与矩阵
A
相 同 。 为 了 加 速 求 得 , 应 使 1 q 模 最 大 , 且 。
q
2 q 2 1 q 1
易求得,
2 n
2
是一个很好的选择.可以验证,
2 q
1
此时 B 的模最大的特征根仍为 1 q , 且模第二大的特 征根为 2 q 或 n q , 由于 q q 2
i [1 1 i ( ) i ] 1 i 2 n i k k max{ 1 [1 1 i ( ) i ]} 1 i 2
k 1 n
i k ) i 1 i 2 n i k m ax [ 1 1 i ( ) i ] 1 i 2 1 1 i (
1 1 2
n q
2 n

n
2 1
, 因而,
过程可以加速。
这个办法也可用来求按模最小的特征值及相应 特征向量,只需令
1 n1 q 2
即可。
上述加速办法也称为移位法 .由于特征值分布 范围预先可由定理 6.1 先限定一个范围,但此范围 往往太大,实际使用时一般是通过多次实验找到合 适的 q 值使迭代过程有明显加速为止。

矩阵特征值问题

矩阵特征值问题
2
§1、特征值的估计
由于工程计算中求矩阵尤其是高阶矩阵的 精确特征值通常比较困难,而许多情况下我们 只需要知道特征值在什么范围内变化或者落在 什么区域内,例如判断方阵的幂级数是否收敛 只要看方阵的特征值的模或谱半径是否小于1, 因此特征值的估计就显得尤其必要,这方面的 理论在特征值问题中相当经典。
由于
实际上是 的
一个
维子空间,因此我们希望将
搜索极值的空间放大到任意
维子空
间 。而增大后的集合的极大值不会比原集
合的小,极小值也不会比原集合大。
58
设有 则
,并假定
,即
59
并且当
时等号成立。因此
60
一般地,我们有
定理4 (Courant-Fischer)设

Hermite矩阵,其特征值为
,则
存在Hermite矩阵特征值的极值原理
48
一、 Rayleigh商
二次型
,如果存在
,那么
所以如果
,我们自然也希望
49
定义1 设
是Hermite矩阵,称
为矩阵 的Rayleigh商。 注意到
因此我们可以把对 在单位球面
的极性的讨论限定 上。
50
单位球面 是闭集,又因为
是 的连续
函数,因此根据多元函数的最值定理,
在 上存在最大值和最小值。由于特征值与
对于广义特征值问题
,可以通过
适当选择位移(shift)或极点(pole) ,再通过 求逆,将之转化为SEP:
这种方法的优点是特征向量不变,矩阵 奇 异时也可以使用,并且在求解邻近 的特征 值或绝对值很小的特征值时效率较高。缺点仍 然是 一般不是特殊矩阵。

西安科技大学研究生数值分析课件7章矩阵特征值与特征向量计算

西安科技大学研究生数值分析课件7章矩阵特征值与特征向量计算

7 矩阵特征值与特征向量地计算设A 为n 阶方阵,所谓A 地特征值问题是求数λ和非零向量x ,使x Ax λ=成立.数λ称作A 地一个特征值,非零向量x 称作与特征值λ对应地特征向量.求给定方阵地特征值与特征向量是先求解特征方程()||0E A ϕλλ=-=然后对应于每一个特征值i λ,再求解退化地齐次线性方程组()0i E A x λ-=从而得到A 地特征值i λ及对应地特征向量x .但是这种方法计算机很大,计算过程复杂,因此有必要研究相对简单地数值解法.本章主要介绍三类计算特征值地方法:计算大型(稀疏)矩阵主特征地幂法与反幂法,计算中小型(实对称)矩阵全部特征值地Jacobi 法,计算中小型矩阵全部特征值地QR 法.7.1 特征值估计在矩阵特征值计算中,有时需要对特征值所在范围给出一个估计.这里介绍一种从矩阵地元素出发,运用较简便地运算估计特征值地方法.定义7-1 设()n m ij A a C ⨯=∈,称由不等式||ii i z a R -≤在复平面上确定地区域为矩阵A 地第i 个盖尔圆(Gerschgorin 圆),并用i G 表示.其中1||ni ij j j i R a =≠=∑称为盖尔圆i G 地半径(1,2,,)i n =.定理7-1 矩阵()n m ij A a C ⨯=∈地一切特征值均落在它地n 个盖尔圆地并集中,即1(1,2,,)ni jj G i n λ=∈=.证明 设λ是A 地任一特征值,12(,,,)T n x x x x =是λ对应地特征向量.令01||max ||i i i nx x ≤≤=,则00i x ≠.由Ax x λ=,可得001()ni j j i j a x x λ==∑.即∑≠==-ni j j j j i i i i x a x a 000001)(λ于是有 000000011i i jni j j ji ni j j i jji i i R x x ax x aa ≤≤=-∑∑≠=≠=λ这表明任一特征值0i G λ∈,从而也在A 地第n 个盖尔圆地并集中.例7-1 估计矩阵10.10.20.30.530.10.210.310.50.20.30.14A ⎡⎤⎢⎥⎢⎥=⎢⎥-⎢⎥---⎣⎦地特征值范围. 解 A 地4个盖尔圆为:1:|1|0.6G z -≤ 2:|3|0.8G z -≤ 3:|1| 1.8G z +≤ 4:|4|0.6G z +≤画在复平面上其区域如图7-1所示.图7-1 例7-1盖尔圆分布图于是A 地全部特征值就在这4个盖尔圆地并集中.为了更确切地知道某个特征值落在哪个或哪几个盖尔圆地并集中,给出如下第二盖尔圆盘定理.定理7-2 若A 地n 个盖尔圆中,有m 个盖尔圆构成地一个连通域(所谓连通域,是指其中地任意两点都可以用位于该区域内地一条折线连接起来),且该连通域与其余n m -个盖尔圆严格分离,则在该连通域中恰好有A 地m 个特征值(重特征值按重数重复计算).特别地,每个孤立地盖尔圆恰有A 地一个特征值(证明从略).由定理2可知,在例1中2G 与4G 中各有A 地一个特征值,而1G 与3G 构成地连通部分中有两个特征值,但不能确定这两个特征值具体落在哪个盖尔圆中.例7-2 估计矩阵10.80.50A -⎡⎤=⎢⎥⎣⎦地特征值范围. 解 A 地两个盖尔圆为:1:|1|0.8G z -≤,2:|0|0.5G z -≤在复平面上地区域如图7-2所示.图7-2 例7-2盖尔圆分布图此时只能判断A 地两个特征值落在1G 与2G 地并集中,至于是每个盖尔圆中各有一个特征值还是两个特征值都落在其中一个盖尔圆上则无法确定.实际上,由于1,21(12λ=±,1,2||0.5λ=>,所以两个特征值都不会在盖尔圆2G 中,而是落在盖尔圆1G 中.对于某些矩阵,可利用相似变换矩阵具有相同特征值地性质得到更确切地特征值范围.设()ij n m A a ⨯=,取正数12,,,n d d d 构成对角阵12diag(,,,)n D d d d =,对A 作相似变换,令1()iij n n jd B DAD a d -⨯==,由于B 相似于A ,所以B 与A 地特征值完全相同,又由于B 与A 地主对角线元素对应相等,所以B 与A 地盖尔圆圆心相同.这表明,若适当选取正数12,,,n d d d ,可以改变盖尔圆地半径,从而有可能将相交地盖尔圆分离得到仅含一个特征值地孤立盖尔圆.选取12,,,n d d d 地一般方法是:欲使A 地第i 个盖尔圆i G 地半径大而其余盖尔圆变小,就取1i d >,其余1()j d j i =≠.例7-3 求矩阵2050.841011210A j ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦地特征值范围. 解 A 地3个盖尔圆为:1:|20| 5.8G z -≤,2:|10|5G z -≤,3:|10|3G z j -≤其中1G 与2G 相交,而3G 孤立.记3G 中所含地一个特征值为3λ,如图7-3所示.为分离2G 与1G ,可以让A 地第3行元素绝对值变大,第3列元素绝对值变小.现取diag(1,1,2)D =,则12050.44100.52410B DAD j -⎡⎤⎢⎥==⎢⎥⎢⎥⎣⎦图7-3 例3盖尔圆分布图 图7-4 例7-3分离后盖尔圆分布图其3个盖尔圆分别是:1:|20| 5.4G z '-≤,2:|10| 4.5G z '-≤,3:|10|6G z j '-≤ 显然,B 地盖尔圆是3个孤立地盖尔圆,如图7-4,注意,此情况下,3G '地半径变大了.例7-4 设矩阵()ij n n A a ⨯=按行严格对角占优,则A 可逆.证明 由线性代数知,A 可逆地充分条件是||0A ≠,而1||nj j A λ==∏(其中j λ是A 地特征值),所以只要证明0j λ≠即可(1,2,,)j n =. 设λ是A 地任一特征值,则必存在某个盖尔圆i G 使∑≠=≤-ij ij i ii a R a λ.若0j λ=,则有∑≠≤ij ij ii a a ,而这与A 按行严格对角占优矛盾,故应有0λ≠,由λ地任意性,得||0A ≠.7.2 幂法与反幂法在线性代数中,设A 是n 阶方阵,若A 存在n 个线性无关地特征向量,则称这n 个特征向量构成A 地一个完全地特征向量组.例如,对矩阵320230005A -⎡⎤⎢⎥=-⎢⎥⎢⎥⎣⎦,110430102B -⎡⎤⎢⎥=-⎢⎥⎢⎥⎣⎦通过求解特征方程,不难求出A 地三个特征值为1231,5λλλ===,B地三个特征值为1232,1λλλ===.方阵A 可以找到三个线性无关地特征向量,而方阵B 找不到三个线性无关地特征向量.我们称方阵A 可对角化,而B 不可对角化. 7.2.1 幂法幂法地基本思想是构造一个向量序列使之逼近主特征值(矩阵地按模最大地特征值)对应地特征向量,然后求出主特征值.该方法简单易行,但收敛速度较慢.现设()ij n n A a ⨯=有一个完全地特征向量组12,,,n x x x ,其对应地特征值是12,,,n λλλ.已知A 地主特征值是单根1λ,即特征值满足条件12||||||n λλλ>≥≥任取一个非零初始向量0u ,由矩阵A 构造向量序列102210110k k k u Au u Au A u u Au A u++=⎧⎪==⎪⎪⎨⎪==⎪⎪⎩由于A 地完全特征向量组可以作为向量空间n R 地一组基,因此0u 可由12,,,n x x x 线性表示,即有01122n n u a x a x a x =+++ (设10a ≠)于是011122211111121()()k k k k k n n nn kk k i i i k i u A u a x a x a x a x a x a x λλλλλλελ===+++⎡⎤=+=+⎢⎥⎣⎦∑ 其中21()nk i k i i i a x λελ==∑.注意到),,2(11n i i=<λλ,故当k →∞时,0k ε→,因此有111k k u a x λ≈由于1x 是主特征值1λ对应地特征向量,其乘上常数因子11k a λ仍为1λ地特征向量,故当k 充分大时,迭代向量k u 是1λ地特征向量地近似向量.为了利用迭代向量求出主特征值1λ地近似值,设()k i u 表示k u 地第i 个分量,则1111111()()()[]()()()k i i k ik i i k iu a x u a x ελε+++=+ 于是 11()lim()k ik k iu u λ+→∞= 这表明两相邻迭代向量对应分量地比值收敛于主特征值,亦即当k 充分大时,可用两相邻迭代向量地分量比作为主特征值地近似值,即11()()k ik iu u λ+≈若主特征值是A 地r 重实特征值,即12(1)r r n λλλ===≤≤,对应地r 个线性无关特征向量为12,,,n x x x .则有01111()r nkk k i k i i i i i i r u A u a x a x λλλ==+⎡⎤==+⎢⎥⎣⎦∑∑当k 充分大时,11rkk i i i u a x λ=≈∑即k u 仍为主特征值对应地特征向量地近似向量,相邻两迭代向量地分量比仍为主特征值地近似值.综上所述,有定理7-3 设A 是n 阶实矩阵,具有完全地特征向量组,主特征值是r 重根,即112||||||||(1)r r n r n λλλλ++>≥≥≥≤≤则对任意非零初始向量0u ,迭代向量0k k u A u = 满足 111lim(0)rki ikk i u a x a λ→∞==≠∑ ,11()lim ()k ik k iu u λ+→∞= 或 11rk k i i i u a x λ=≈∑,11()()k ik iu u λ+≈ 这样用非零初始向量0u 及矩阵A 构造向量序列{}k u 以计算A 地主特征值1λ及相应地特征向量地方法称为幂法.不过从上面地讨论中可以看到,如果1||1λ>或11<λ,迭代向量k u 当k →∞时,其不为零地分量就会趋于无穷大或趋于零.为克服这个缺点,可以在每步迭代中加上对向量规范化地步骤,使迭代向量地数量级保持在一个稳定地量级上,归纳起来,幂法地计算步骤为:步骤 1 给定非零初始向量0u ,精度12,εε,令00v u =;令(0)10max()v λ=,1=k ;步骤 2 迭代1-=k k Av u ,()1max()k k u λ=,其中)max(k u 表示k u 绝对值最大地分量;步骤3 规范化max()kk k u v u =; 步骤 4 若11k k v v ε--<且()(1)112||k k λλε--<,则k v 即为1λ地近似特征向量,()1k λ即为1λ地近似值;否则,1+=k k ,转步骤2继续迭代.例7-5 用幂法计算1.0 1.00.51.0 1.00.250.50.252.0A ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦地主特征值和相应地特征向量,结果见表7-1.表7-1而此题地准确值为1 2.5365258λ= 1(0.748221,0.649661,1.000000)T x =7.2.2 幂法地加速幂法地收敛速度由比值21r λλ=来确定,r 越小收敛越快,而当1r ≈时收敛可能很慢.为了克服这一缺点,常采用原点平移法对幂法进行加速.设B A pE =-,其中p 是待定参数.显然,若A 地特征值为12,,,n λλλ,则B 地相应特征值(1,2,,)i k i n =为12,,,n p p p λλλ---,且A .B 地特征向量相同.这是因为对A 有特征方程||0i A E λ-=,而对B 有特征方程|||()|0i i B k E A p k E -=-+=,所以,i i i i p k k p λλ=+=-另一方面,若i x 是A 地对应i λ地特征向量,即i i i Ax x λ=则 ()()i i i i i i Bx A pE x Ax px p x λ=-=-=-原点平移法地思想是引入矩阵B ,恰当地选择参数p ,使11k p λ=-是B 地主特征值,且其速比2211maxB A p r r p λλλλ-=<=-,这样用幂法求B 地主特征值1k 地收敛速度就快于用幂法求A 地主特征值1λ,而一旦1k 求出,由11k p λ+=可得A 地主特征值,达到了加速地目地.但是为了选取恰当地选择参数p ,需要对A 地特征值地分布地大致了解. 例7-6 设4阶方阵A 有特征值15(1,2,3,4)j jj λ=-=其速比210.9A r λλ=≈.作变换 (12)B A pEp =-=则B 地特征值为12k =,21k =,30k =,41k =-,其速比2112B A k r r k ==<. 设A 地实特征值满足121n n λλλλ->≥≥>若2,n λλ地值可大致估计出,若要求1λ,考察待定参数p 地选取. 在原点平移法通过变换pE A B -=后,不论p 如何选取,矩阵地B 主特征值也只能是在n p λ-或 1p λ-.若希望求1λ,就应选择p ,使1p λ-称为B 地主特征值,即1||||n p p λλ->-这时B 地收敛速比B r 是比值21||/||p p λλ--和1||/||n p p λλ--中地较大者,即211||||max ,||||n B p p r p p λλλλ⎧⎫--=⎨⎬--⎩⎭显然B r 依赖于p 地选取,记做()B r p .为了使应用幂法求B 地主特征值地收敛速度尽可能快,我们希望选择最佳参数*p ,使*()min ()B B r p r p =由B r 地表示式(求二者之间地较大值)和)(*p r B 对)(p r B 地最小化要求,只有当2||||n p p λλ-=-时,()B r p 达到最小.由于2n p p λλ-=-会有得到矛盾地结果(2n λλ=),所以只能是2()n p p λλ-=--即 *22np λλ+=类似地,若用反幂法求最小特征值n λ,若1n λ-,1λ可大致估计,取最佳平移参数*112n p λλ-+=例7-7 取0.75p =,用原点平移法,计算例7-7中矩阵A 地主特征值.解 作变换B A pE =-,则0.2510.510.250.250.50.25 1.25B ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦对B 应用幂法,计算结果见表7-2.即1 1.7865914k ≈,则A 地主特征值1λ为110.75 2.5365914k λ=+=与例7-5比较,上述结果比例7-5迭代15次还好.表7-27.2.3 反幂法设方阵A 按模最小地特征值是n λ,且0n λ≠,则A 可逆.于是,由n n n Ax x λ=,可得11n n nA x x λ-=,这表明1nλ是1A -地主特征值.反幂法就是将幂法应用于1A -,通过求出1A -地主特征值得到A 地按模最小地特征值及其对应地特征向量.定理7-4 设A 是n 阶实矩阵,具有完全地特征向量组,其特征值满足12||||||0n λλλ≥≥≥>则对任意非零初始向量00u v =,按下述方式构造地迭代向量11k k u A v --= ,max()kk k u v u =满足lim max()n k k n x v x →∞=, 1lim max()k k nu λ→∞= /max()k n n v x x ≈,1max()k nu λ≈在实际计算中,可先对A 进行LU 分解,通过求解1k k Ly v -= ,k k Uu y =来求解方程组1k k Au v -=.反幂法地计算步骤为:步骤1 预先取定非零向量00u v =;给定精度12,εε;取(0)0m a x ()nu μ=; 步骤2 对矩阵A 作LU 分解,A LU =;令1=k ;步骤3 求解方程组1k k Ly v -= ,k k Uu y = 得到迭代向量k u ; 步骤4 规范化max()kk k u v u =步骤5 若11k k v v ε--<且()(1)2||k k n n μμε--<,则k v 即为A 地对应于n λ地近似特征向量,()1k nμ即为n λ地近似值;否则,令1+=k k ,转步骤3继续迭代.7.3 矩阵地两种正交变换本节先介绍镜面(初等)反射变换和平面旋转变换,它们是QR 算法和Jacobi 算法地基础.7.3.1 豪斯荷尔德(House holder )变换定义7-2 设有方阵B ,若当1i j >+时(,1,2,,)i j n =,0ij b =,则称B 是上Hessenberg 矩阵,即1112121222,1n n n n nn b b b b b b B b b -⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦定义7-3 设向量ω满足21ω=,矩阵2T H E ωω=- (ω是列向量)称为初等反射矩阵,又称House holder 矩阵,记为()H ω,即211212212221212222122()2212n n n n n H ωωωωωωωωωωωωωωωω⎡⎤---⎢⎥---⎢⎥=⎢⎥⎢⎥---⎢⎥⎣⎦其中(1,2,,)i i n ω=是ω地分量.可以证明初等反射阵是对称阵()T H H =.正交阵()T H H E =. 例7-8 设向量0α≠,试证矩阵222TH E ααα=- 是一个初等反射阵. 证明 令2αωα=,则 222221||||||||1αωααα=== 由定义7-3,2222TTH E E ααωωα=-=-是初等反射阵.定理7-5 设,x y 是两个不相等地n 维列向量,且22||||||||x y =,则存在一个初等反射阵H,使得Hx y =证明 令2||||x yx y ω-=-,由例7-8可知22()()22||||T T Tx y x y H E E x y ωω--=-=-- 是一个初等反射阵.由于22||||()()T T T T Tx y x y x y x x y x x y y y -=--=--+ 注意到22||||||||x y =,即T T x x y y =,又()T T T T x y x y y x == ,故22||||2()T Tx y x x y x -=-从而22()()2||||T T x y x x y x Hx x x y --=--y y x x =--=)(. 例7-9 设1(1,2,2),(1,0,0)T T x e ==,用Householder 变换将x 化为与1e 同方向地向量.解 因为2||||3x =,可设13y e =,则22||||||||x y = 取21,1,1)||||T x y w x y -==--,构造Householder 矩阵[]11122212111,1,12123311221T H E ww -⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥=-=--=-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦⎣⎦则13Hx e =推论 设向量12(,,,)0T n x x x x =≠,12()||||r sign x x =,且1x r ε≠-,则存在初等反射阵1222||||T T uu H E E uu u ρ-=-=- 使1Hx r ε=- .其中,1(1,0,,0)T ε=,1u x r ε=+,22||||/2u ρ=.设12(,,,)T n u u u u =,则12(,,,)T n u x r x x =+22222122222112111||||[()]221(2)2()n n u x r x x r rx x x x r r x ρ==++++=+++++=+引入初等反射阵地目地,是设法用一系列初等反射阵将原始矩阵约化成上Hessenberg 阵.由于约化过程是逐列进行地,我们先给出计算Hx 地算法步骤,该算法算出H 及r ,使Hx r ε=-,u 地分量冲掉x 地分量.(1)1max ||i i nx η≤≤=;(2)(1,2,,)ii i x x u i n η←==,此步规范化是为避免计算r 时产生溢出;(3) 12211()()nii r sign x x ==∑;(4)11u u r ←+;(5) 1ru ρ=; (6) r r η←;于是初等反射阵1T H E uu ρ-=-,1Hx r ε=-.如果要将H 作用于矩阵A ,设i a 是A 地第i 列向量,则12(,,,)n A a a a =,12(,,,)n HA Ha Ha Ha = 其中,11()()(1,2,,)T T i i i i Ha E uu a a u a ui n ρρ--=-=-=.下面讨论用初等反射阵约化原始矩阵A 称为上Hessenberg 阵地步骤.11121(1)(1)2122211121(1)(1)212212n n n n nn a a a a a a a A A A a a a a a ⎡⎤⎢⎥⎡⎤⎢⎥===⎢⎥⎢⎥⎣⎦⎢⎥⎣⎦步骤1 不妨设(1)210a ≠(否则这一步不需约化),选择初等反射阵1R ,使(1)12111R a r ε=-,其中: 1(1)(1)2212112(1)1211112111121211111()(())(1)1()2ni i T r sign a a u a r n u r r a R E u u εερρ=-⎧=⎪⎪⎪=+-⎨⎪==+⎪⎪=-⎩∑是维单位坐标列向量 令11100U R ⎡⎤=⎢⎥⎣⎦则(2)(2)(2)(1)111213111212111(2)(2)(1)(1)222312112210A a A a A R A U AU a A R a R A R ⎡⎤⎡⎤===⎢⎥⎢⎥⎣⎦⎣⎦其中,(2)11A 是21⨯阵,(2)22a 是2n -维列向量,(2)23A 是2n -阶方阵.步骤k 设对A 已进行了1k -步约化,即111(2)()()()()11121,111,11(2)()()()1222,12,2()()()1,1,()()()1,1,11,()()(),1(2,3,,1)k k k k k k k k k k k n k k k k kn k k k k kk k k k n k k k k k k k k nk k k nkn k nnA U A U k n a a a a a a r a a a a r a a a a a a a a a ----+--++++++==-⎡⎢-⎢=-⎣()()()111213()()22230k k k k k A a A a A ⎤⎥⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎦⎡⎤=⎢⎥⎣⎦其中,()11k A 是(1)k k ⨯-阵,()22k a 是n k -维列向量,()23k A 是n k -阶方阵.设()220k a ≠,选初等反射阵()k R n k -阶,使()221k k k R a r ε=-,其中1ε是n k -维单位坐标向量,可得1()()221,1()221()1,1()(())()nk k k k k ik i k k kk k k k kk nT k k k k r sign a a u a r r r a R E u u ερρ+=++-⎧=⎪⎪⎪=+⎨⎪=+⎪⎪=-⎩∑ 令 00k k E U R ⎡⎤=⎢⎥⎣⎦则 ()()()1112131()()2223()()()111213()12300k k k k k k k k k k k k k k k k k k k k k A a A R A U A U R a R A R A a A R r R A R ε+⎡⎤==⎢⎥⎣⎦⎡⎤=⎢⎥-⎣⎦ 可见1k A +地左上角1k +阶子阵为上Hessenberg 阵,从而约化又进了一步.重复此过程,直到122112211(2)122(3)233(1)1n n n n n nn A U U U AU U U a r a r a r a -----=⨯⨯⨯⎡⎤⎢⎥-⨯⨯⎢⎥⎢⎥=-⨯⎢⎥⎢⎥⎢⎥-⎣⎦使原始矩阵A 在一系列初等反射阵地作用下,约化为上Hessenberg 阵.综上所述,有定理7-6.定理7-6 如果A 是n 阶实矩阵,则存在初等反射阵122,,,n U U U -,使221122n n U U U AU U U C --=(上Hessenberg 阵)例7-10 试证矩阵A 与其约化成为地上Hessenberg 阵C 有相同地特征值.证明 记221n P U U U -=,由于初等反射阵是正交对称阵,故122T n P U U U -=,且P 是正交阵,故T PAP C =.于是||||||||||||T T C E PAP E P A E P A E λλλλ-=-=-=-其中T PP E =,||||1T P P =.这表明A 与C 具有相同地特征多项式,即两者有相同地特征值.进一步,设y 是C 地对应于特征值λ地特征向量,即Cy y λ=,则有T PAP y y λ= ()()T T A P y P y λ=这表明T P y 为A 地对应于λ地特征向量,于是求原始矩阵A 地特征值与特征向量可转化为求上Hessenberg 阵C 地特征值和特征向量.定理7-7 若A 是实对称矩阵,则存在初等反射阵122,,,n U U U -使2211221112211()n n n n n U U U AU U U c b b c b C b b c ----⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎣⎦对称三对角阵 证明 由定理7-6,存在初等反射阵可使A 约化为上Hessenberg 阵C ,当A 是对称矩阵时,C 亦为对称阵,即T C C =,且T C 亦为上Hessenberg 阵,故C 是对称三对角阵.例7-11 用豪斯荷尔德方法将下述矩阵化为上Hessenberg 阵.1437232427A A ---⎡⎤⎢⎥==⎢⎥⎢⎥⎣⎦解 (1)对1k =,确定变换阵111000U R ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦,(1)2124a ⎡⎤=⎢⎥⎣⎦ 其中1R 为初等反射阵,使(1)121110R a r ⎡⎤=-⎢⎥⎣⎦(1)12124.472136r a ==≈(1)12111 6.472136244u a r ε⎡⎡⎤+=+=≈⎢⎢⎥⎣⎦⎣⎦11121()2)28.94427r r a ρ=+≈[]1111110 6.4721361 6.472136401428.944270.4472070.8944230.8944230.447216TR E u u ρ-=-⎡⎤⎡⎤=-⎢⎥⎢⎥⎣⎦⎣⎦--⎡⎤=⎢⎥-⎣⎦(2)计算(1)122R A .记(1)221232(,)27A a a ⎡⎤==⎢⎥⎣⎦,于是 (1)1221112 3.1304967.155419(,) 1.788855 1.341640R A R a R a --⎡⎤==⎢⎥-⎣⎦其中,111111111()()(1,2)T T i i i i R a E u u a a u a u i ρρ--=-=-=(3)计算(1)121A R 及(1)1221()R A R ,即求 1(1)121211(1)1223373.1304967.1554191.788855 1.341640T T T b A R b R R R A b ⎡⎤--⎡⎤⎡⎤⎢⎥⎢⎥==--⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥-⎣⎦⎣⎦7.6026340.4472127.800030.3999990.399999 2.200000-⎡⎤⎢⎥=-⎢⎥⎢⎥-⎣⎦其中,11111()(1,2,3)T T T Ti i i b R b b u u i ρ-=-=(4)计算2111A U AU =.(1)12121(1)1221447.6026340.4472124.4721367.8000030.39999900.399999 2.2000000A R A r R A R ⎡⎤--⎡⎤⎢⎥⎢⎥⎢⎥==--⎢⎥⎢⎥-⎢⎥-⎢⎥⎣⎦⎢⎥⎣⎦为上Hessenberg 阵.7.3.2 平面旋转变换 定义7-4 称矩阵111(,)111i j csi P i j scj ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦第列第列第行第行 为平面旋转矩阵,又称Givens 矩阵,其中cos c θ=,sin s θ=.平面旋转阵(,)P i j 是一个正交阵,与单位阵只有在(,),(,),(,i i i j j j j i四个位置上地元素不一样,用其左乘矩阵A 只改变A 地第i 行和第j 行元素.设12(,,,)T n x x x x =则平面旋转变换Px y =地结果为⎪⎩⎪⎨⎧≠=+-=+=ji k x y cx sx y sx cx y k kj i j j i i ,若令/i c x =,j s x =, 则平面旋转变换向量y 地第i个分两为22j i x x +,第j 个分量为0,其余分量即为x 对应地分量.和初等反射变换一样,用平面旋转变换也可以将一个方阵化为上Hessenberg 矩阵,也可以将将一个方阵化为上三角矩阵.7.4 QR 算法7.4.1 矩阵地QR 分解定理7-8 设A 是可逆矩阵,则存在正交矩阵121,,,n P P P -使121()n P P P A R -=上三角矩阵且R 地主对角元素0(1,2,,1)ii r i n >=-.证明 若10(2,3,,)j a j n ==,则A 地第一列不需约化.若有某个 10(2)j a j n ≠≤≤,则可选择1(1,)j P j P =使A 地第一列中第j 个元素变为零.一般地,可设平面旋转矩阵12131,,,n P P P ,使(2)(2)11121(2)(2)222113122(2)(2)200nn nn nn r a a a a P P P A A a a ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦记111312nP P P P =,则12P A A =.同理,若(2)20(3,4,,)j a j n ≠=,可选取23242,,,n P P P 使(2)(2)(2)1112131(3)(3)22232(3)(3)2212323333(3)(3)3nn n n n n nn r a a a r a a P P P A A a a a a -⎡⎤⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦记2223nP P P =,则213P P A A =.重复上述过程,可得一系列正交阵121,,,n P P P -使11121222121n n n nn r r r r r P P P A R r -⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎣⎦ 定理7-9 (矩阵地QR 分解)如果n 阶实矩阵A 可逆,则A 可分解为一正交阵Q 和上三角阵R 地乘积,即A QR =,且当R 地对角元素都为正数时分解唯一.证明 由定理8知存在正交阵11,,n P P -使121n P P P A R -=为上三角阵,记121T n Q P P P -=,于是T Q A R =由于(1,2,,1)i P i n =-是正交阵,则T Q 亦为正交阵,故A QR =. 若A 有两种QR 分解,记为1122A Q R Q R ==其中12,R R 为上三角阵且主对角元素都为正数,12,Q Q 为正交阵,于是12121T Q Q R R -=注意121R R -是上三角阵地乘积,结果仍为上三角阵,而12,TQ Q 是正交阵,所以121R R -也应是正交阵.若记121D R R -=,由其上三角性T D 应是下三角阵,1D -应是上三角阵;由其正交性由1T D D -=,故D 只能是对角阵,且有2T D D D E ==.又因12,R R 地主对角元素都为正数,即有222212diag[,,,]diag[1,1,,1]n D d d d E ===故1(1,2,,)i d i n ==,则D E =,于是12R R =,12Q Q =.例7-12 求矩阵⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=212240130A 地QR 分解. 解 方法1:利用初等反射阵进行QR 分解令(0)1(0,0,2)T a =,取(0)112||||2d a ==,则)2,0,2(81211)0(111)0(11-=--=e d ae d a u1110012010100TH E u u ⎡⎤⎢⎥=-=⎢⎥⎢⎥⎣⎦,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=1302402121A H 再令(0)2(4,3)T a =,取(0)222||||5d a ==,则(1)2212(2)22121,3)||||T a d e u a d e -==--2224312345TH E u u ⎡⎤=-=⎢⎥-⎣⎦令2210014305534055H H ⎡⎤⎢⎥⎢⎥⎡⎤⎢⎥==⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥-⎣⎦于是21212051002H H A R ⎡⎤⎢⎥=-=⎢⎥⎢⎥-⎣⎦故123405521243005155002100T TA H H R ⎡⎤-⎢⎥⎡⎤⎢⎥⎢⎥⎢⎥==-⎢⎥⎢⎥⎢⎥-⎢⎥⎣⎦⎢⎥⎢⎥⎣⎦方法2:利用平面旋转阵进行QR 分解. 取1202,0100221221=+==+=s c ,则130********T ⎡⎤⎢⎥=⎢⎥⎢⎥-⎣⎦,132********T A ⎡⎤⎢⎥=-⎢⎥⎢⎥--⎣⎦再取53)3(43,54)3(44222222-=-+-==-+=s c ,则231004305534055T ⎡⎤⎢⎥⎢⎥⎢⎥=-⎢⎥⎢⎥⎢⎥⎣⎦,2313212051002T T A R ⎡⎤⎢⎥=-=⎢⎥⎢⎥-⎣⎦ 故13233405521243005155002100T T A T T R ⎡⎤-⎢⎥⎡⎤⎢⎥⎢⎥⎢⎥==-⎢⎥⎢⎥⎢⎥-⎢⎥⎣⎦⎢⎥⎢⎥⎣⎦例7-13 求矩阵⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=110133044A 地QR 分解,使得R 地对角线元素为正数.解 A A =1地第一列T x ]0,3,4[1=,521=x .用1x 构造镜面反射阵1H ,使得T y x H ]0,0,5[111==,令T y x u ]0,3,1[111-=-=,有⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡-=-=10005453053542221111u u u E H T ,⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡-==11054005355112A H A 2A 地第2列对角线以下为T x ]1,0[2=,122=x .用2x 构造镜面反射阵2~H ,使得T y x H ]0,1[~222==,令T y x u ]1,1[222-=-=,易得 ⎥⎦⎤⎢⎣⎡=-=01102~222222u u u E H T,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎦⎤⎢⎣⎡=010100001~122H H 于是有R A H A =⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡-==54001105355333,⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡-==010540535305421H H Q容易验证,QR A =.请读者用平面旋转变换对本例地矩阵A 进行QR 分解.7.5.3 QR 算法QR 算法就是利用QR 分解构造一个矩阵序列{}k A ,当k 充分大时,k A 是近似地上三角矩阵,而该上三角阵地对角元素便是原始矩阵A 地全部特征值.设1()n n ij n n A A a R ⨯⨯==∈,对A 做QR 分解,即A QR =其中R 为上三角阵,Q 为正交阵.利用这个分解可得新矩阵(对QR 交换乘积)2T A RQ Q AQ == 由于2A 是1A 经过正交相似变换得到地,因此2A 与1A 有相同地特征值.再对2A 做QR 分解,按上述方式又可得新矩阵3A ,且3A 与2A 也具有相同地特征值.具体地说,其步骤为:设1A A =,做QR 分解111A Q R =求矩阵211111T A R Q Q A Q ==求得k A 后对k A 作QR 分解k k k A Q R =求矩阵1Tk k k k k k A R Q Q A Q +==只要A 可逆,由定理9可知,按上述方法可唯一确定矩阵序列{}k A ,且序列中任意k A 与原始矩阵有相同特征值.因此只要恰当选择正交相似变换阵12,,,k Q Q Q ,使1111111T T TT TT T k k k k k k k k k k k k k k A Q A Q Q Q A Q Q Q Q Q A Q Q Q +----====当k →∞时,逼近一个上三角阵,便可求出A 地全部特征值(为所逼近上三角阵地主对角元素).可见,QR 算法地关键在于选择正交变换阵(1,2,)k Q k =.从定理7-8地证明看到,正交变换阵k Q 是一系列平面转换矩阵地乘积,这些平面旋转矩阵是用来将k A 地主对角线以下元素约化为零地.如果将QR 算法直接应用于原始矩阵,计算量很大,所以在实际计算中,总是先将原始矩阵用豪斯赫尔德方法约化为上Hessenberg 阵,而后再对上Hessenberg 阵应用QR 算法.可以证明,由上Hessenberg 阵用QR 算法生成地矩阵序列中地每个矩阵仍为上Hessenberg 阵.7.5 雅可比方法雅可比方法是用来计算实对称矩阵地全部特征值及特征向量地一种有效方法.它地基本思想是,通过一组正交相似变换对称矩阵A 化为对角矩阵,得其全部特征值.定理7-10 设A 为n 阶对称矩阵,T C PAP =,其中P 为正交矩阵,则22||||||||F F C A = 证明 一方面2222111||||()()nnnFiji i j i A a tr A A λ======∑∑∑另一方面2221||||()()()nTFi i C tr C C tr C C λ====∑由假设()()i i A C λλ=,故22||||||||F F C A =.设n n A R ⨯∈为对称矩阵,(,)P i j 为一平面旋转矩阵,则T C PAP =(其中()ij n n C c ⨯=)地元素计算公式为:(1)22cos sin 2sin cos ii ii jj ij c a a a θθθθ=++22sin cos 2sin cos jj ii jj ij c a a a θθθθ=+-(2)1()sin 2cos 22ij ji jj ii ij c c a a a θθ==-+ (3)第i 行元素和第j 列元素cos sin (,)ik ki ik jk c c a a k i j θθ==+≠ (4)第j 行元素和第i 列元素 cos sin (,)jk kj jk ik c c a a k i j θθ==+≠(5)(,,)lk lkc a l k i j =≠这说明,当A 经过一初等正交相似变换化为C 时,只需按上述公式计算C 地第i 列.第j 列元素,由对称性可得第i 行和第j 行元素,C 地其余元素与A 地对应元素相同.设A 地非对角元素0ij a ≠,我们可选择平面旋转阵(,)P i j ,使T C PAP =地非对角元素0ij ji c c ==.由定理11可选择(,)P i j ,使sin 2cos 202jj iiij ji ij a a c c a θθ-==+=即选择θ,使22(||)4ij ii jja tg a a πθθ=≤-其中定理7-11 设n n A R ⨯∈为对称阵,0ij a ≠为A 地一个非对角元素,则可选择一平面旋转阵(,)P i j ,使T C PAP =地非对角元素0ij ji c c ==且T C PAP =与A 地元素满足下述关系(1)2222(,)ik jk ik jkc c a a k i j +=+≠(2)222222ii jj ii jj ij c c a a a +=++ (3)22(,,)iklk c a l k i j =≠证明 由上面地计算ij c 公式直接计算可知(1)成立.由(1)及定理7-10可证(2).如果用()S A 表示A 地非对角线元素地平方和,()D A 表示A 地对角线元素平方和,则2()()2ijD C D A a =+ ,2()()2ij S C S A a =- 这说明C 地对角线元素平方和比A 地对角线元素平方和增加了22ij a ,C 地非对角线元素平方和比A 地非对角线元素平方和减少了22ij a .下面介绍雅可比方法.首先在A 地非对角元素中选择绝对值最大地元素(称为主元素),如11||max ||i j lk l ka a ≠=可设110i j a ≠,否则A 已经对角化了.由定理12,选择一平面旋转矩阵111(,)P i j ,使111TAP AP =地非对角元素11110i j j i c c ==. 再选(1)1()lkn n A a ⨯=地非对角元素中地主元素,如 22(1)(1)||max ||0i j lk l ka a ≠=≠由定理12,又可选择一平面旋转矩阵222(,)P i j ,使2212T A P A P =地非对角元素2222(2)(2)i j j i a a ==(注意上次消除了地主元素这次又可能变为不是零). 继续这个过程,连续对A 实行一系列平面旋转变换,消去非对角线绝对值最大地元素,直到将A 地非对角元素全化为充分小为止,从而求得A 地全部(近似)特征值.定理7-12 (雅可比方法地收敛性)设()ij n n A a ⨯=为实对称矩阵,对A 施行上述一系列平面旋转变换1(1,2,)Tm m m mA P A P m -==则 lim ()m m A D→∞=对角矩阵证明 记()()m m lk n n A a ⨯=,()2()m m lk l kS a ≠=∑由定理7-11地(2)可得()212()m m m ij S S a +=-其中 ()()||max ||m m ijlk l ka a ≠= 又由于()2()2()(1)()m m m lk ij l kS a n n a ≠=≤-∑即()2()(1)m m ij S a n n ≤- 由以上得12(1)(1)m m S S n n +≤-- 反复应用上式,即得1102(1)(2)(1)m m S S n n n ++≤->-故 lim 0m m S →∞= 可以证明()lim m ll m a →∞存在(1,2,,)l n =. 下面介绍特征向量地计算.由雅可比收敛定理知,当m 充分大时2112T TTmm P P P AP P P D ≈记12T T T T m m R P P P =,则T m R 地列向量就是A 地近似特征向量.计算Tm R 可采用累积地办法,用一数组R 保存Tm R ,开始时R E ←,以后对A 每进行一次平面旋转变换,就进行计算Tm R RP ←用初等正交阵T m P 右乘R 只需计算R 地两列元素,若记(,)m m P P i j =,则Tm RP 地计算公式为()()cos ()sin (1,,)()()sin ()cos li li lj li li lj l n θθθθ←+⎧⎪=⎨←+⎪⎩R R R R R R关于sin θ和cos θ地计算如下.由定理7-11知,当0ij a ≠时,可选θ满足2tg2ij ii jja a a θ=-方ii jj a a ≠时,由22tg 1tg21tg dθθθ=≡- 得到tg θ地二次方程2tg 2tg 10d θθ+-=解得tg θ=选取tg 0d d θ>=<由此得 |tg |1θ≤可由集合{},,ii jj ij a a a 来计算sin ,cos θθ,设0,||max ||ij ij lk l ka a a ≠≠=,则210tg ,()10cos sin cos ii jj ija a d a d t s d d c t ct sθθθθ-⎧=⎪⎪⎪≥⎧⎪=≡=⎨-<⎨⎩⎪⎪=≡⎪⎪=⋅=≡⎩如果jj ii ij a a a -<<,则12ij ii jja t d a a ≈=-,将c,s 代入定理7-9地(1)中可得ii ii ij jj jj ij ij ji c a ta c a ta c c ⎧=+⎪=-⎨⎪==⎩ 每迭代一次地主要工作是选m A 地非对角线元素中地主元素与计算T 111m m m +++=A P AP .首先计算sin ,cos ,θθ,只需计算1m +A 地第i 列,第j 列元素,再算对称元素,不用做3个矩阵地乘法.计算机计算时,需要两组工作单元,以便存储A (或m A )和R .可用()2()m m lk l ka ε≠=<∑S 控制迭代终止,其中ε是要求地精度.例7-14 用雅可比方法计算对称阵210121012⎡⎤-⎢⎥--⎢⎥⎢⎥-⎣⎦A = 地特征值.解 第1步0=A A ,选非对角线元素中地主元素121(1,2)a i j =-==0,1,1/0.7071068,1/0.7071068d t c s ======T 111100.7071068030.70710680.70710680.70710682⎡⎤-⎢⎥==-⎢⎥⎢⎥--⎣⎦A P AP第2步 在1A 中选非对角元素地主元素(1)130.7071068(1,3)a i j =-==0.7071068,0.5176381,0.8880738,0.4597008d t c s ====T 22120.63397460.325057600.325057630.627963000.62798302.366025-⎡⎤⎢⎥=--⎢⎥⎢⎥-⎣⎦A P A P 第3步 在2A 中选非对角元素地主元素(2)230.627930(2,3)a i j =-==0.5047869,0.6153960,0.8516540,0.5241045d t c s =-=-==-T 33230.63397460.27683660.17036420.27683663.38644600.170364201.979579⎡⎤--⎢⎥=-⎢⎥⎢⎥-⎣⎦A P A P 第4步 在3A 中选非对角元素地主元素(3)120.2768366(1,2)a i j =-==4.971292,0.09958013,0.9950785,0.09909004d t c s ====T 44340.606407200.169525803.4140130.016881400.16952580.016881401.979579⎡⎤-⎢⎥=⎢⎥⎢⎥-⎣⎦A P A P 第5步 在4A 中选非对角元素地主元素(4)130.1695258(1,3)a i j =-==4.050038,0.1216293,0.9926842,0.1207395d t c s ==== 2T 255450.58578790.20382521000.203825210 3.4140130.0167579000.016757902.000198--⎡⎤⨯⎢⎥=⨯⎢⎥⎢⎥⎣⎦A P A P 于是A 地特征值为1233.414013, 2.000198,0.5857879λλλ===A 地精确特征值为12(1 3.414214λ=≈,22λ=,32(10.585786λ=-≈ 且可逐步求出412345T T T T T T R P P P P P =地列向量,即得A 地近似特征向量.雅可比方法是一个求对称矩阵A 地全部特征值及特征向量地迭代方法,精确度较高,但计算量较大,对稀松带状矩阵经过平面旋转变换后其稀松带状将被破坏,所以很少使用.习题71.设911203111(2102113810A j j B ⎡⎤⎡⎤⎢⎥⎢⎥===⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦试估计它们地特征值所在地范围.2.编写幂法程序,并求矩阵732341213A -⎡⎤⎢⎥=⎢⎥⎢⎥--⎣⎦地主特征值及对应地特征向量(准确到小数点后3位).3.若p 是A 地特征值j λ地一个近似值,且||||()j i p p i j λλ-<-≠则1j pλ-是1()A pE --地主特征值.试用反幂法求矩阵134231111A ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦地最接近于6地特征值及对应地特征向量.4.设有向量(2,1,2)Tx=,试构造初等反射阵H,使(3,0,0)THx=.5.设(2,3,0,5)Tx=,(1,0,0,5)Te=,用Householder变换化x为与e同方向向量.6.设031042212A⎡⎤⎢⎥=-⎢⎥⎢⎥⎣⎦,求其QR分解.7.设221022212A⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦,求其QR分解.8.利用初等反射阵将134312421A⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦正交相似约化为对称三对角阵.9.试用平面旋转变换阵对矩阵A作QR分解,其中111021245A⎡⎤⎢⎥=-⎢⎥⎢⎥-⎣⎦.10.按下列要求编写程序框图.(1)将一般矩阵用豪斯赫尔德方法约化称上Hessenberg阵.(2)对矩阵作QR分解.(3)对上Hessenberg阵应用QR算法求全部特征值及相应地特征向量.11.用QR算法求矩阵120211013A⎡⎤⎢⎥=-⎢⎥⎢⎥⎣⎦地全部特征值.12.设A是对称矩阵,λ和(1)x x=是A地一个特征值及相应地特征向量.又设p是一个正交阵,使1(1,0,0,,0)Tpx e==证明T=是第一行和第一列除了λ外,其余元素均为零.B PAP。

对称矩阵特征值反问题的最佳逼近解的一种数值解法

对称矩阵特征值反问题的最佳逼近解的一种数值解法

对称矩阵特征值反问题的最佳逼近解的一种数值解法何欢;孙合明;左环【摘要】利用复合最速下降法,给出了对称矩阵特征值反问题AX=XΛ有解和无解两种情况下最佳逼近解的通用数值算法,对任意给定的初始矩阵A0,经过有限步迭代可以得到对称矩阵特征值反问题的最佳逼近解,并分别给出有解和无解两种情况下的数值实例,证明了此算法的可行性.另外,结合投影算法,可以用此算法来求解其它凸约束下矩阵特征值反问题的最佳逼近解,从而扩大了此算法的求解范围.%By applying the hybrid steepest descent method, this paper gives a general numerical algorithm to find the optimal approximation solution to inverse eigenvalue problem, AX = X(A), for symmetric matrices. For any given initial matrix, the optimal approximation can be derived by finite iteration steps. Some numerical examples are provided to illustrate the feasibility of the algorithm. Moreover, combined with projection algorithm, the numerical algorithm can also be used to calculate the optimal approximation solution to other convex constrained inverse eigenvalue problem, thus extending the applicable scope of this algorithm.【期刊名称】《四川师范大学学报(自然科学版)》【年(卷),期】2012(035)004【总页数】5页(P473-477)【关键词】复合最速下降法;特征值反问题;最佳逼近【作者】何欢;孙合明;左环【作者单位】河海大学理学院,江苏南京211100;河海大学理学院,江苏南京211100;河海大学理学院,江苏南京211100【正文语种】中文【中图分类】O24特征值反问题及其最佳逼近已被广泛地研究与应用.L.Zhang[1]首次提出特征值反问题的对称解及其最佳逼近问题;Z.Y.Peng[2]用谱分解的方法解决了厄尔米特反自反矩阵的特征值反问题及其最佳逼近;郭丽杰等[3]和梁俊平等[4]利用矩阵的奇异值分解解决了二次特征值反问题对称解及其最佳逼近;Y.B.Deng等[5]讨论了对称矩阵的特征值反问题有解的条件,并在有解的情况给出了通解形式及其最佳逼近;F.Z.Zhou等[6]研究了正交对称矩阵的特征值反问题有解的条件及其最佳逼近;于蕾等[7]利用正交对称矩阵的特殊性质,给出了一类对称正交反对称矩阵特征值反问题的最佳逼近解的数值算法;Z.Y.Liu等[8]解决了中心厄尔米特矩阵特征值反问题及其最佳逼近;S.F.Yuan等[9]研究了在谱约束下三对角化对称和三对角化双对称矩阵的特征值反问题及其最佳逼近;郭丽杰[10]和陈亚波[11]利用奇异值分解分别得出子矩阵约束下矩阵特征值反问题的对称、反对称解及其最佳逼近.本文拟给出凸约束下的矩阵特征值反问题最佳逼近解的通用数值解法.记Rn×m表示全体实n×m矩阵的集合,Rn×n代表全体实对称n×n矩阵的集合,AT是A的转置矩阵,‖·‖F表示矩阵的Frobenius范数,H代表一实希尔伯特空间.下面给出特征值反问题及其最佳逼近问题.问题1(a) 给定矩阵X∈Rn×m,Λ=diag(λ1,…,λm)∈Rm×m,求A∈Rn×n使得由于实际情况下X和Λ来自实验数据,所以问题1(a)通常无解.问题1(b) 给定矩阵X∈Rn×m,Λ=diag(λ1,…,λm)∈Rm×m,求A∈Rn×n使得问题2 假设SE是问题1解的集合,对给定的∈Rn×n,求A*∈SE使得复合最速下降法[12-14]作为一个三步优化算法,首次提出是为了最小化实希尔伯特空间里非扩展映射不动点集合上的一些凸函数.目前复合最速下降法已经被成功地用来计算对于给定的对称矩阵的最佳逼近解[15],以及被成功应用到图像记忆[16].本文拟利用复合最速下降法,求问题1有解和无解两种情况下问题2的最佳逼近解A*.1 用复合最速下降法求解问题2定义1.1 设U为H的一个开子集,映射Φ:H→R∪{∞},如果对于所有的u∈U,存在a(u)∈H使得则称映射Φ:H→R∪{∞}是Gateaux可微,称Φ':U→H:u|→a(u)为Φ在U上的Gateaux导数.定义1.2 映射T:H→H,若则映射T:H→H为非扩展映射.特别地,若存在非空集合S⊂H,κ>0,使得对于所有的x,y∈S,恒有则T:H→H在S⊂H上κ-Lipschitzian.定义1.3 非空集合S⊂H,映射Φ:H→H在S⊂H上是单调的,如果存在η>0,使得对于所有的u,v∈S,恒有则称Φ:H→H在S⊂H上η-强单调.设则Ψ(A)=min,Θ(A)=min,分别与问题1和问题2等价.易知其中,B=XΛ.要求解问题2,首先,证明下面的引理.引理1.4 Ψ(A)是凸函数.证明∀A1,A2∈SRn×n,α∈[0,1],则有所以引理1.4得证.引理1.5 Θ(A)是凸函数.证明∀A1,A2∈Rn×n,α∈[0,1],则有所以引理1.5得证.引理1.6 Ψ'(A)满足κ-Lipschitzian.证明Ψ'(A)=AXXT-BXT,其中,B=XΛ,则有其中,κ=‖X‖2,所以引理1.6得证.引理1.7 Θ'(A)满足γ-Lipschitzian且η-强单调.证明那么存在γ≥1,0<η≤1满足引理1.7得证.定理 1.8(复合最速下降法[12-13]) 设 T:H→H是一非扩展映射,且Fix(T)≠Ø.假设Θ:H→R∪{∞}是一凸函数,Θ':H→H在T(H)上满足γ-Lipschitzian和η-强单调.如果非负实数序列(λn)n>1⊂[0,∞)满足:或者(λn)n>1⊂[0,∞)满足:那么对任意的u0∈H,强收敛到唯一解u*∈Fix(T),且定理1.9[14]设K⊂H是一闭凸子集.假设(I)Ψ:H→R∪{∞}是Gateaux可微凸函数,其G-导数Ψ':H→H满足κ-Lipschitzian;(II)Θ:H→R∪{∞}是Gateaux可微凸函数,其G-导数Θ':H→H在T(H)上γ-Lipschitzian和η-强单调,则T:=PK(I-vΨ')是非扩展映射,其中,v∈(0,2/κ]. 另外如果则对任意的u0∈H,应用复合最速下降法迭代公式un+1:=T(un)-λn+1Θ'(T(un))得到的序列(un)n>1强收敛到点.当问题1的解集SE非空时,很容易得到SE是一个闭凸集[17].定理1.10 令那么KΨ是一个闭凸集;Ψ(A)为凸函数且其G-导数Ψ'(A)满足κ-Lipschitzian;Θ(A)为凸函数且其G-导数Θ'(A)满足γ-Lipschitzian;并且η-强单调.对任意的v∈(0,2/κ],T:=PK(I-vΨ')是非扩展映射应用复合最速下降法得到的序列(An)n>1强收敛到点即问题2的解,其中T(An)=PK(An-v(AnXXT-BXT)),PK是到凸集K的投影,λn+1满足定理1.8的条件.证明该定理的条件已证明,仅需证明迭代公式如下:其中定理1.10得证.2 算法和数值例子根据定理1.10,得到下面的数值算法,可以求问题2的解A*.算法2.11)输入2)随机选择初始矩阵A0;3)计算B=XΛ;4)计算κ=‖X‖2,v=1/κ,n=0;5)λn+1=1/(n+1),根据计算An+1,其中6)若‖An+1-An‖≤10-10,A*=An+1,停止迭代;否则,令n=n+1,转5).现在将给出一些数值例子来说明结果,所有的实验数据都由Matlab 7.0计算得到. 例2.2取得到问题2的解A*,并且得到‖A*X-XΛ‖=说明:例2.2中的X和Λ通过某一已知矩阵的特征值分解所得,结果表明在问题1有解的情况下此算法是可行的.例2.3 取X、Λ和并求得A*的值并有8.861 1.说明:例2.3表明通过取部分特征值和特征向量(问题1无解的情况)此算法是可行的.通过上面的例子表明提出的数值算法用来求解问题2是可行的.进而,可以用此算法去求解其它凸约束下的矩阵特征值反问题最佳逼近解.参考文献[1]Zhang L.A class of inverse eigenvalue problems of symmetric matrices[J].Num Math J Chin Univ,1990,12(1):65-71.[2]Peng Z Y.The inverse eigenvalue problem for Hermitian anti-reflexive matrices and its approximation[J].Appl Math Comput,2005,162:1377-1389.[3]郭丽杰,周硕.二次特征值反问题的对称次反对称解及其最佳逼近[J].吉林大学学报:理学版,2009,47(6):1185-1190.[4]梁俊平,卢琳璋.二次特征值反问题的中心斜对称解及其最佳逼近[J].福建师范大学学报:自然科学版,2006,22(3):10-14.[5]Deng Y B,Hu X Y,Zhang L.The solvability conditions for the inverse eigenvalue problem of the symmetrizable matrices[J].J Comput ApplMath,2004,163:101-106.[6]Zhou F Z,Hu X Y,Zhang L.The solvability conditions for the inverse problems of symmetric ortho-symmetric matrices[J].Appl Math Comput,2004,154:153-166.[7]于蕾,张凯院,周丙常.一类对称正交反对称矩阵反问题的最佳逼近[J].数学的实践与认识,2008,38(8):158-163.[8]Liu Z Y,Tan Y X,Tian Z L.Generalized inverse eigenvalue problemfor centrohermitian matrices[J].J Shanghai Univ:Eng Ed,2004,8(4):448-453.[9]Yuan S F,Liao A P,Lei Y.Inverse eigenvalue problems of tridiagonal symmetric matrices and tridiagonal bisymmetric matrices[J].Comput Math Appl,2008,55:2521-2532.[10]郭丽杰.子矩阵约束下矩阵反问题的对称解及其最佳逼近[J].东北电力大学学报,2006,26(4):74-78.[11]陈亚波.子阵约束下矩阵方程反问题的实反对称解及其最佳逼近[J].湖南农业大学学报:自然科学版,2002,28(5):444-446.[12]Yamada I,Ogura N,Yamashita Y,et al.Quadratic optimization of fixed points of nonexpansive mappings in Hilbert space[J].Num Funct Anal Optim,1998,19:165-190.[13]Yamada I.The hybrid steepest descent method for the variational inequality problem over the intersection of fixed point sets of nonexpansive mappings[C]//Butnariu D,Censor Y,Reich S.Inherently Parallel Algorithm for Feasibility and Optimization and Their Applications.New York:Elsevier,2001:473-504.[14]Yamada I,Ogura N,Shirakawa N.A numerically robust hybrid steepest descent method for the convexly constrained generalized inverse problems[C]//Nashed Z,Scherzer O.Inverse Problems,Image Analysis,and Medical Imaging.Contemporary Mathematics,2002,313:269-305. [15]Slavakis K,Yamada I,Sakaniwa putation of symmetric positive definite Toeplitz matrices by the hybrid steepest descent method [J].Signal Processing,2003,83:1135-1140.[16]Sun H M,Hasegawa H,Yamada I.Multidimensional associative memory neural network to recall nearest pattern from input[C]//Nonlinear Signal and Image Processing.Sapporo:IEEE-Eurasip,2005:39.[17]Paulo J,Ferreira S G.The existence and uniqueness of the minimum norm solution to certain linear and nonlinear problems[J].Signal Processing,1996,55:137-139.。

数值分析-第7章 矩阵特征值问题的数值解法n

数值分析-第7章 矩阵特征值问题的数值解法n
(-3.406542,-2.460280, 6.920561) (-2.832406, -2.028615, 6.210333)
7
9 11 12
6.104716
6.026349 6.006637 6.003327
(-0.450275, -0.322058, 1.0)
(-0.445914, -0.318617, 1.0) (-0.444814, -0.31775, 1.0) (-0.444630, -0.317606, 1.0)
其中i为A的特征值,P的各列为相应于i的特征向量。
P -1 AP D
2

n
2
定理7.1.3 ARnn,1, …, n为A的特征值,则
(1)A的迹数等于特征值之和,即 tr ( A) aii i
i 1 i 1
n
n
(2)A的行列式值等于全体特征值之积,即
1 xi(k +1) / xi(k )
i 1,2,, n
可见,当k充分大时, ( k ) 近似于主特征值, ( k +1) 与x ( k )的对应非零分量的比值 x x 近似于主特征值。
在实际计算中需要对计算结果进行规 , 范化。因为当 1 1时,x (k ) 趋于零, 当1 1时, x ( k )的非零分量趋于无穷。 从而计算时会出现下溢 或上溢。
特征值的范围. 解 我们先分别求出各个圆盘区域。 D1 = {z:|z – 1|£0.6};D2 = {z:|z – 3|£0.8} D3 = {z:|z + 1|£1.8};D4 = {z:|z + 4|£0.6}. 易见D2和D4为 弧立圆盘分别 包含A的两个实 特征值.

交替使用幂法和降阶法求解矩阵全部特征值

交替使用幂法和降阶法求解矩阵全部特征值

幂法
• 通过以上公式进行多次迭代,只要满 足精度 x k +1 - x k ∞ 小于某一所需要的数 值即可。就可以求出该矩阵按模最大 的特征值及其对应特征向量。 • 用幂法求解一个3阶矩阵的特征向量
1 A 3 2 -1 2 1 4 -1 -1
幂法
(1,1,1)T 作为初始迭代向量,列表 • 取 x0 =
那么B有与A1除了 1 之外的相同的n-1 个特征值,此时可以用幂法求解B的 按模最大特征值及其对应的特征向量。
幂法的算法
• 在数值计算矩阵的特征值与特征向量 的时候,出于计算量考虑,需要使用 一些数学软件帮助计算。这里我使用 的是Mathematica进行简单的编程计 算。
幂法的算法
数值算例
例:
1 0 A 0 0 0 7 2 2 0 0 8 5 4 1 0 9 8 2 6 0 3 6 2 5 9
用幂法和降阶法求出这个矩阵的 所有特征值。
数值算例
数值算例
数值算例
数值算例
数值算例
数值算例
数值算例
数值算例
总结
在这次的论文写作中,我学习到了 许多知识,但是由于经验的匮乏,难 免有许多考虑不周的地方。例如在论 文中,可以扩展到求出矩阵所有特征 值所对应的特征向量,由于知识水平 所限,我并没有完成这项工作。在以 后的时间里,我会继续学习有关知识, 争取解决这个问题。
1
2
2
降阶法
• 不失一般性,设 一行为 = (a , a 定义n阶矩阵
T 11
v 1 = (1, v 21 , , v n 1 )
12
T
,A的第
, , a1 n )
显然A1是降阶矩阵,有零特征值

矩阵特征值与特征向量的计算-Rung-Kutta方法

矩阵特征值与特征向量的计算-Rung-Kutta方法

每步须算Ki 的个数 2 3
4
5
6
可达到的最高精度 O(h2 ) O(h3 ) O(h4 ) O(h4 ) O(h5 )
7
O(h6 )
n8
O(hn−2 )
由于龙格-库塔法的导出基于泰勒展开,故精度主要受
解函数的光滑性影响。对于光滑性不太好的解,最好 采用低阶算法而将步长h 取小。
R − K方法的主要优缺点
二级R-K方法
二级R-K方法的形式为
其局部截断误差为 将 中的各项作Taylor展开
Taylor展开有 可得 令
二级R-K能达到的 最高阶数是二阶
常用的二级二阶R-K方法

,得
该方法称为改进的Euler公式(梯形公式的预估校正格式)

,得
该方法称为中点公式

,得
该方法称为Heun(休恩)方法
当 为实数时,得Euler法的绝对稳定区间是
二级R-K方法的绝对稳定区间
二阶二级R-K方法的计算公式为
由此可知,二阶二级R-K方法的绝对稳定区间是 当 为实数时,得绝对稳定区间是
一些常用方法的绝对稳定区间
R-K法的绝对稳定区域
k = 4 • 3. k =3
• 2. k=2 k = 1 • 1.
题相容的充分必要条件是该单步法至少是一阶方
法。
我们本章讨论的数值方法都是与原初值问题相容的!
收敛性
定义:对任意固定的 步法产生的解 ,均有
, 若初值问题的单
则称该方法是收敛的。
我们本章讨论的数值方法都是收敛的!
收敛性判别
定理7.3:设增量函数
在区域
上连续,并对变量y和h满足Lipschitz条件。如果单步 法与微分方程初值问题相容,则单步法收敛。

矩阵特征值的数值解法

矩阵特征值的数值解法

矩阵特征值的数值解法矩阵的特征值是在矩阵与其特征向量之间的关系中的数值解。

特征值在各个领域中都有广泛应用,包括物理、工程、金融等。

在解决实际问题时,我们经常需要计算矩阵的特征值,因此研究如何求解矩阵特征值的数值方法是非常重要的。

1. 幂迭代法(Power Iteration)幂迭代法是求解矩阵特征值的一种简单而常用的数值方法。

它的基本思想是通过不断迭代矩阵与向量的乘积,使得向量趋近于该矩阵的一个特征向量。

具体步骤如下:(1)初始化一个非零的初始向量x。

(2)进行迭代计算,即$x^{(k+1)}=Ax^{(k)}/,Ax^{(k)},$。

(3)当向量x的相对误差小于一些预设的精度要求时,停止迭代,此时的x即为矩阵A的一个特征向量。

(4)将x带入特征值的定义式$\frac{Ax}{x}$,计算出特征值。

幂迭代法的优点是简单易实现,计算速度较快,缺点是只能求解特征值模最大的特征向量,而且对于存在特征值模相近的情况,容易收敛到错误的特征值上。

2. QR迭代法(QR Iteration)QR迭代法是一种较为稳定的求解矩阵特征值的数值方法。

它的基本思想是通过不断进行QR分解,使得矩阵的特征值逐渐收敛。

具体步骤如下:(1)将矩阵A进行QR分解,得到正交矩阵Q和上三角矩阵R,令$A_1=RQ$。

(2)将$A_1$再次进行QR分解,得到新的矩阵$A_2=R_1Q_1$。

(3)重复步骤(2),直到得到收敛的矩阵$A_k$,此时$A_k$的对角线上的元素即为矩阵A的特征值。

QR迭代法的优点是对于特征值模相近的情况仍然能够收敛到正确的特征值上。

缺点是每次QR分解都需要消耗大量的计算量,迭代次数较多时计算速度较慢。

3. Jacobi迭代法(Jacobi's Method)Jacobi迭代法是一种通过对称矩阵的对角线元素进行迭代操作,逐步将非对角元素变为零的求解特征值的方法。

具体步骤如下:(1)初始化一个对称矩阵A。

矩阵特征值和特征向量的数值解法

矩阵特征值和特征向量的数值解法
(k )
的常用方法是迭代每一步对向量 u
规范化。引入函数 max( u
(k )
) ,它表示取
向 量 u (k ) 中 按模 最大 的分 量,例 如, u (k ) =(2,-5,4)T,则 max( u (k ) )=-5,这 样
u (k ) 的最大分量为 1,即完成了规范化。 (k ) max (u )
7.1 幂法
7.1.1 幂法原理及实用幂法 幂法主要用于求矩阵按模最大的特征值和相应的特征向量。设矩阵,2,..., n) 满足:
| λ1 |>| λ 2 |≥| λ3 |≥ ... ≥| λ n | (7.1.1)
相应的 n 个特征向量 xi (i = 1,2,..., n) 线性无关。上述假设表明, λ1 为非零单 实根, x1 为实特征向量。
k →∞
k →∞
lim v ( k ) =
x1 max( x1 )
事实上,由式(7.1.5)知
v
(k )
=
Ak u ( 0 )
∏m
i =0
k
i
算法 7.1.1 实用幂法 (1) 输入: aij (i, j = 1,2, L n), ui (i = 1,2, L), ε ; (2) k = 1; m0 = max(ui );
7.1 幂法
幂法基本原理是:任取非零实向量 u
(0)
,做迭代
u ( k ) = Au ( k −1) = Ak u ( 0 ) (k = 1,2,...)

( 7 .1 . 2 )
λ1 = lim
这里 u j 表示向量 u
(k ) (k )
u (jk +1) u (jk )
k →∞

矩阵相乘的特征值分解

矩阵相乘的特征值分解

矩阵相乘的特征值分解是将一个矩阵表示为特征向量和特征值的形式。

特征值分解对于一些特殊的矩阵非常有用,因为它可以简化矩阵的计算和分析。

设有两个矩阵A 和B,它们可以相乘得到矩阵C,即C = A * B。

假设A 是一个n × n 的方阵,且具有n 个线性无关的特征向量。

那么,矩阵A 的特征值分解可以表示为:
A = P * Λ * P^(-1)
其中,P 是一个由A 的特征向量组成的矩阵,Λ 是一个对角矩阵,对角线上的元素是A 的特征值。

P^(-1) 是P 的逆矩阵。

由于矩阵相乘的结合律,矩阵C 的特征值分解可以表示为:
C = A * B = (P * Λ * P^(-1)) * B = P * (Λ * (P^(-1) * B))
可以看出,矩阵C 的特征值分解仍然可以表示为特征向量和特征值的形式。

需要注意的是,特征值分解要求矩阵A 是可对角化的,即存在n 个线性无关的特征向量。

对于一些特殊的矩阵,如对称矩阵或正定矩阵,它们可以保证可对角化,并且特征值都是实数。

特征值分解在很多数学和计算问题中都有广泛的应用,包括线性代数、信号处理、优化等领域。

它可以简化问题的计算和分析,提供了一种有效的方式来研究和理解矩阵的性质。

特征值的解法

特征值的解法

θ
选择的能消去
a
s +1 pq
π / 4
此外,若
a
s pp
− aqsq
= 0 ,那么选择 θ = aspq /
aspq
(π / 4) 。注意,若
a
s pq
=
0
那么就不需要旋转了。(当然按目前的策略,若
a
s pq
= 0 ,那末 A
已经是对角形了。) Jacobi 算法产生一个趋向于确定的对角形矩阵的
的 ∞ − 范数为 1。 改进的算法为给定任一向量 u0 ≠ 0 ,对 k = 0,1,2,L ,计算
3
关于特征值和特征向量问题的综述
βk = max(uk ) ,vk = uk βk ,uk+1 = Avk
其中 max (uk ) 表示 uk 中绝对值最大的分量。
(二) Jacobi 法 1、基本原理 Jacobi 法是求实对称矩阵全部特征值的一种有效方法。它不但能
利用平面旋转 R ( p,q) 的相似变换仅仅影响位于第 p,q 行和列的元素。
4
关于特征值和特征向量问题的综述
被修改的元素由
a s+1 ip
=
aisp
cos
θ
+
aisp
sin θ
=
a s+1 pi
a s+1 iq
=
− aisp
sin θ + aisq
cos θ =
a s+1 qi
,i

p,q
a s+1 pp
在实际应用中,特征值问题有着广泛的应用背景,例如微分方程 的刚性比和数值方法的稳定性;动力系统和结构系统的振动问题;电 力系统的静态稳定分析;因子分析模型中的因子载荷、共同度和特殊 方差的估计等,实质上都是矩阵的特征值问题。

矩阵的特征值与特征向量的数值解法

矩阵的特征值与特征向量的数值解法

第八章 矩阵地特征值与特征向量地数值解法某些工程计算涉及到矩阵地特征值与特征向量地求解 .如果从原始矩阵出发,先求 出特征多项式,再求特征多项式地根,在理论上是无可非议地•但一般不用这种方 法,因为了这种算法往往不稳定•常用地方法是迭代法或变换法•本章介绍求解特 征值与特征向量地一些方法•§ 1乘幂法乘幕法是通过求矩阵地特征向量来求特征值地一种 迭代法,它适用于求矩阵 地按模最大地特征值 及对应地特征向量.b5E2RGbCAP 定理8 • 1设矩阵Ai x n 有n 个线性无关地特征向量 X<i=1,2,…,n ),其对应地特征 值入 i (i =1,2,…,n> 满足 plEanqFDPw|入1|>|入2|三…三|入n |则对任何n 维非零初始向量 乙,构造Z k = AZ k-1(k=1,2.其中(Z k >j 表示向量Z<地第j 个分量. 证明:只就入i 是实数地情况证明如下 因为A 有n 个线性无关地特征向量X,<i = 1,2,用X<i = 1,2, …,n )线性表示,即Z 0=a 1X 1 + 用A 构造向量序列{Z k }其中由矩阵特征值定义知 AXm i X(i=1,2,…,n>,故Z k 二A k Z^ :1A k X^ : 2A k X 2nA kX n 「T ;X1 *〉2';X2- :'n'n Xn同理有li m (ZQ j_______________ <22?=■ 1<8 • 1) Z 1 二 AZ 0,乙二 AZ= A^Z。

,川,Zk-AZ kj-A Zo(8・2>- k' nkTX ii zz2-nJ 2-7k -AZk」=人X ii =2<A1」<8.3)<8.4 ),设a 1工0,并且注意到…,n )所以任何非零向量Z o 都可 a 2茨 + …+a nX <a 1 工 0) DXDiTa9E3d将<8.3 )与<8.4 )所得乙及Z k-1地第j个分量相除| 入i|<| 入…,n> 得RTCrpUDGiT1|(i=1,2,定理8 • 1地证明过程实际上是给出了矩阵地按模最大特征值地计算方法:1) 先任取一非零向量Z 0, 一般可取Z o =(1,1,1> T; 2) 按<8.2 )式计算 乙=AZ -i (k=1,2,…>;3)当K足够大时,即可求出詔;=6为了减少"1对于所选地第j个分量地依赖性,还可用各个分量比地平均值来代替,即关于对应于入1地特征向量地计算:由<8.1 )知,当k 充分大时,Z k =入1Z k-1,又由迭代式 Z k = AZ k-1,可知AZ k-1 =入1Z k-1故 由特征值定义知 Z k-1即为入1对应地特征向量,或Z k =入1Z k-1为入1对应地特征向 量.5PCzVD7HxA这种求矩阵地按模最大特征值及其对应特征向量地方法称为 乘幕法. 应用乘幕法计算A 地按模最大特征值入1和对应特征向量时,由<8.3)易知Z k = *-n厲入+送码J y1X ii 2当|入1|>1或|入1|<1时,Z k 中不为零地分量将会随 K 地增大而无限增大,或随K 地 「 ------------ 增大而趋于零,用计算机计算就会出现“上溢”或“下溢” .为了克服这个缺点,一」无 穷 常将迭代向量 乙先规范化,然后再计算,具体做法是:jLBHrnAILg 一,一用max (Z>S 示向量Z k 地绝对值最大地分量,任取一初始向量Z o =a 1X 1+ a 汎+…+ a n X^V a 1工0)构造与<8.2 )对应地向量序列.xHAQX74J0XAZ o由<8.3)可知Yk = maZk A kZ o max A kZ o max n:X 亠1 1 j ii =2X inM • r ii -2X i丿丿(k tmax X i<8.7J 二 AYA 2Z omax AZ0J 'max 乙max AZ oA 2Z 。

第8章矩阵特征值计算-

第8章矩阵特征值计算-
特征值. 特别地,如果A的一个圆盘Di是与其它圆盘分离
(即孤立圆盘),则Di中精确地包含A的一个特征值.
上页 下页
证明 只就⑴给出证明. 设λ为A的特征值,即
Ax=λx,其中x=(x1,x2,, xn)T0.
记 xkm 1ina xi xx0,考虑Ax=λx的第k个 方程,即
n
akjxj xk ,
上页 下页
定理7(对称矩阵的正交约化) 设A∈Rn×n为对称
矩阵,则
⑴ A的特征值均为实数;
⑵ A有n个线性无关的特征向量;
⑶ 存在一个正交矩阵P使的
1

PT AP
2
,



n

且λ1,λ2,,λn为A的特征值,而P=(u1,u2,,un) 列向量
uj为A的对应于λj 的单位特征向量.
为对应于向量x的瑞利(Rayleigh)商.
定理11 设A∈Rn×n为对称矩阵(其特征值次序记
为λ1≥λ2≥≥λn),则
1.
n

(Ax, x) (x, x)

1
(对任何非零x∈Rn);
2.
1

(Ax, x) max xRn (x, x)

x0
3.
n

(Ax, x) min xRn (x, x)
上页 下页
定理8 (Gerschgorin圆盘定理) ⑴ 设n阶矩阵A=(aij),则A的每一个特征值必属 于下面某个圆盘之中
n
aii ri aij (i1,2, .n) j1 ji
或者说 A的特征值都在n个圆盘的并集中. ⑵ 如果A有m个圆盘组成一个连通的并集S,且
S与余下n-m个圆盘是分离的,则S内恰包含A的m个

特征值解法

特征值解法

《结构动力学》大作业结构大型特征值问题的求解0810020035 吴亮秦1振动系统的特征值问题1.1实特征值问题n 自由度无阻尼线性振动系统的运动微分方程可表示为:[]{}[]{}()M u K u F t += (1.1)其中,{}u 是位移向量,[]M 和[]K 分别是系统的质量矩阵和刚度矩阵,都是n 阶正定矩阵,()F t 是激励向量。

此系统的自由振动微分方程为[]{}[]{}0M u K u += (1.2)设其主振型为: {}{}sin()u v t ωϕ=+ (1.3) 其中,{}v 为振幅向量,ω为圆频率,ϕ为初相位。

将(1.3)代入自由振动微分方程(1.2), 得:[]{}[]{}K v M v λ= (1.4) 其中2λω=,(1.4)具有非零解的条件是()[][]det 0M K λ-= (1.5)式(1.4)称为系统的特征方程,由此可以确定方程的n 个正实根1{}n i i λ=,称为系统的特征值,1{}n i i ω=称为系统的固有频率,{}i v (i=1,2,…..n )为对应于特征值的特征向量或称为系统的振型或模态。

因为[]M 矩阵正定,则[]M 有Cholesky 分解:[][][]TM L L = (1.6)其中,[]L 是下三角矩阵。

引入向量{}x 满足:{}[]{}Tx L v =,则:1{}([]){}T v L x -= (1.7) 代入(1.4),得:([][]){}0I P x λ-= (1.8)其中,()11[][][][]TP L K L --=,式(1.8)称为标准实特征值问题。

1.2复特征值问题多自由度阻尼自由振动系统的运动方程为如下二阶常系数微分方程组:[]{()}[]{()}[]{()}0 M x t C x t K x t ++= (1.9) 其中 []M ,[]C ,[]K 分别是n 阶的质量、阻尼和刚度矩阵,{()}q t 是n 维可微向量函数。

矩阵特征值和特征向量的数值解

矩阵特征值和特征向量的数值解

风险管理
在风险管理模型中,可以使用风 险矩阵的特征值和特征向量来分 析风险的分布和相关性,从而制 定有效的风险管理策略。
感谢您的观看
THANKS
稳定性分析通常通过比较不同数值解法的计算结果,观察其误差随舍入精 度的变化情况来进行。
稳定性好的算法能够在不同舍入精度下保持一致的计算结果,而稳定性差 的算法则可能导致计算结果的较大偏差。
数值解法的收敛性分析
01
收敛性分析是评估数值解法求解特征值和特征向量问题的有效 性的关键步骤。

02
收敛性分析主要关注算法是否能够收敛到正确的解,以及收敛
通过求解矩阵的特征值和特征向量,可以找到线性变换下的不变量,从而更好地理解和分析线性变换的 性质和行为。
特征值和特征向量在矩阵的奇异值分解和QR分解等矩阵分解方法中也有着重要的应用,这些分解方法在 许多科学计算和工程领域中都有广泛的应用。
在微分方程中的应用
01
矩阵特征值和特征向量在解决微分方程问题中也有着重要 的应用。
速度的快慢。
收敛速度的快慢通常用收敛阶数来衡量,收敛阶数越高,收敛
03
速度越快。
数值解法的误差估计
01
误差估计是对数值解法计算结果的精度进行量化的 重要手段。
02
误差估计通常通过比较数值解法的计算结果与精确 解之间的差异来进行。
03
误差估计可以帮助我们了解算法的精度,从而在实 际应用中选择合适的算法和舍入精度。
在研究热传导问题时,热传导矩阵的特征值和特 征向量可以用来确定温度场的分布和变化。
在工程问题中的应用实例
结构分析
在结构分析中,结构的质量矩阵和刚度矩阵的特征值和特征向量可 以用来确定结构的固有频率和振型,从而评估结构的稳定性和安全 性。

数值计算方法第04章矩阵特征值与特征向量的计算

数值计算方法第04章矩阵特征值与特征向量的计算
3 2 7 A1 3 4 1 2 1 3
• 计算出k=2时的x和y。 • (保留四位有效数字)
22
二、幂法的加速
因为幂法的收敛速度是线性的,而且依赖 于比值 2 /1 ,当比值接近于1时,幂法收敛 很慢。幂法加速有多种,介绍两种。
23
幂法的加速—原点移位法 应用幂法计算矩阵A的主特征值的收敛速度主要
26
4 14 0 , 2.9, 用原点移位法求矩 例:A 5 13 0 0 1 0 2.8 -4 阵A的按模最大的特征值,要求误差不超过10 。 解:取x (0) (1,1,1)T , 按x ( k 1) ( A pI )x (k )进行计算 0 6.9 14 A 0 I 5 10.1 0 0 0.1 1 (3.1000568, 2.214326, 0.9687661) 4 3.1000568
在一定条件下, 当k充分大时: 相应的特征向量为:
x 1 x
x
( k 1)
( k 1 ) i (k ) i
10
幂法的理论依据 对任意向量x(0), 有 x ( 0 ) i ui , 设1不为零.
i 1 n
x
( k 1 )
Ax
n i 1
(k )
A
k 1
x
(0) n
1 Ak 1 i ui i k i ui i 1

k 1 1
2 k 1 n k 1 1u1 ( ) 2 u2 ( ) n un 1 1
k 1 1 1u1
故 1 xi( k 1) xi( k ) x(k+1)为1的特征向量的近似向量(除一个因子外).

矩阵与数值分析公式总结

矩阵与数值分析公式总结

第一章绝对误差:121100.x 102k k n na a a a a -=±⨯⋅⋅⋅⋅-≤⨯,则称a 为x 的具有n 位有效数字的近似值相对误差:如果a 有n 位有效数字,则11x 1102n a aa --≤⨯ ;如果11x 11021n a a a --≤⨯+() ,则a 至少有n 位有效数字。

近似绝对误差估计式:'()()()f x f a f a x a -≈- 近似相对误差界为:'()()()()()f a f x f a x a f a f a -≤-N 元函数误差界:1231231(x ,x ,x ,....x )(,,,....)nn n k k k k af f f a a a a x a x =⎛⎫∂-≤-⎪∂⎝⎭∑111222111112max p ,1nii n i i ii nn pp i pi x x p ==∞≤≤==⎛⎫===⎪⎝⎭∞=⎛⎫=≤<+∞⎪⎝⎭∑∑∑向量范数:范数:范数:范数:范数:x x x x x x111112111max max mij j ni nij i mj mnij m i j Fa a a ≤≤=∞≤≤========∑∑∑∑(列和范数)(行和范数)(算子范数谱:范数)A A A AA(A)max i iρλ=谱半径:(A 的最大特征值)第二章,H H H A A AA A A =正规矩阵:是的共轭转置 。

常见的Hermite 阵(A A =H )、实对称矩阵(A A =T )、斜Hermite 阵(A A -=H )、实反对称矩阵(A A -=T )、酉阵(I AA A A ==H H )和正交矩阵(I AA A A ==T T )等均为正规矩阵. 正定的充分必要条件是:A 的各阶顺序主子式都为正。

A 的特征值全为正。

T T A A AA E ==正交矩阵: 1T A A -= 正交矩阵是实数特殊化的酉矩阵,因此总是正规矩阵。

特征值法

特征值法

特征值法对元素为实数或复数的n×n矩阵A,求数λ和n维非零向量x使A x=λx,这样的问题称为代数特征值问题,也称矩阵特征值问题,λ和x分别称为矩阵A的特征值和特征向量。

代数特征值问题的数值解法是计算数学的主要研究课题之一,它常出现于动力系统和结构系统的振动问题中。

在常微分方程和偏微分方程的数值分析中确定连续问题的近似特征系,若用有限元方法或有限差分方法求解,最终也化成代数特征值问题。

此外,其他数值方法的理论分析,例如确定某些迭代法的收敛性条件和初值问题差分法的稳定性条件,以及讨论计算过程对舍入误差的稳定性问题等都与特征值问题有密切联系。

求解矩阵特征值问题已有不少有效而可靠的方法。

矩阵A的特征值是它的特征多项式P n(λ)det(λI-A)的根,其中I为单位矩阵。

但阶数超过4的多项式一般不能用有限次运算求出根,因而特征值问题的计算方法本质上是迭代性质的,基本上可分为向量迭代法和变换方法两类。

向量迭代法是不破坏原矩阵A,而利用A对某些向量作运算产生迭代向量的求解方法,多用来求矩阵的部分极端特征值和相应的特征向量,特别适用于高阶稀疏矩阵。

乘幂法、反幂法都属此类,隆措什方法也常作为迭代法使用。

变换方法是利用一系列特殊的变换矩阵(初等下三角阵、豪斯霍尔德矩阵、平面旋转矩阵等),从矩阵A出发逐次进行相似变换,使变换后的矩阵序列趋于容易求得特征值的特殊形式的矩阵(对角阵、三角阵、拟三角阵等);多用于求解全部特征值问题,其优点是收敛速度快,计算结果可靠,但由于原矩阵A被破坏,当A是稀疏矩阵时,在计算过程中很难保持它的稀疏性,因而大多数变换方法只适于求解中小规模稠密矩阵的全部特征值问题。

雅可比方法、吉文斯-豪斯霍尔德方法以及LR方法、QR方法等都属此类。

乘幂法计算矩阵的按模最大的特征值及对应特征向量的一种向量迭代法。

设A为具有线性初等因子的矩阵,它的n个线性无关的特征向量是u i(i=1,2,…,n),特征值排列次序满足是一个n维非零向量,于是若λ1>λ2,则当α1≠0,且k足够大时,A k z0除相差一个纯量因子外趋于λ1所对应的特征向量,这就是乘幂法的基本思想。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第9章 矩阵特征值的数值解法9.1 引言矩阵特征值问题有广泛的应用背景. 例如动力系统和结构系统中的振动问题、电力系统的静态稳定分析上、工程设计中的某些临界值的确定等,都归结为矩阵特征值问题. 数学中诸如方阵的对角化及解微分方程组等问题,都要用到特征值的理论. 本章介绍n 阶实矩阵n n⨯∈R A 的特征值与特征向量的数值解法.定义9.1.1 已知n 阶实矩阵()n nij a ⨯=∈RA ,如果存在常数λ和非零向量x ,使λ=Ax x 或 ()λ-=0A I x (9.1.1)那么称λ为A 的特征值(eigenvalue),x 为A 的相应于λ的特征向量(eigenvector). 多项式111212122212()det()n n n n n nn a a a a a a p a a a λλλλλ-⎡⎤⎢⎥-⎢⎥=-=⎢⎥⎢⎥-⎣⎦L L M M O M LA I (9.1.2) 称为特征多项式(characteristic polynomial),det()0λ-=A I (9.1.3)称为特征方程(characteristic equation).注 式(9.1.3)是以λ为未知量的一元n 次代数方程,()det()n p λλ=-A I 是λ的n 次多项式. 显然,A 的特征值就是特征方程(9.1.3)的根. 特征方程(9.1.3)在复数范围内恒有解,其个数为方程的次数(重根按重数计算),因此n 阶矩阵A 在复数范围内有n 个特征值. 除特殊情况 (如2,3n =或A 为上(下)三角矩阵)外,一般不通过直接求解特征方程(9.1.3)来求A 的特征值, 原因是这样的算法往往不稳定. 在计算上常用的方法是幂法与反幂法和相似变换方法. 本章只介绍求矩阵特征值与特征向量的这两种基本方法. 为此将一些特征值和特征向量的性质列在此处.定理9.1.2 设n 阶方阵()ij n n a ⨯=A 的特征值为12,,,n λλλL ,那么 (1) 121122n nn a a a λλλ+++=+++L L ; (2)12det n λλλ=L A .定理9.1.3 如果λ是方阵A 的特征值,那么 (1)k λ是k A 的特征值,其中k 是正整数;(2) 当A 是非奇异阵时,1λ是1-A 的特征值.(3) ()n p λ是()n p A 的特征值,其中()n p x 是多项式2012()n n n p x a a x a x a x =++++L .定义9.1.4 设,A B 都是n 阶方阵. 若有n 阶非奇异阵P ,使得1-=P AP B ,则称矩阵A 与B 相似(similar),1-PAP 称为对A 进行相似变换(similarity transformation),P 称为相似变换矩阵(similarity transformation matrix).定理9.1.5 若矩阵A 与B 相似,则A 与B 的特征值相同. 定理9.1.6 如果A 是n 阶正交矩阵,那么(1)1T -=A A ,且det 1=A 或1-;(2) 若=y Ax ,则22=y x , 即T T ⋅=⋅x x y y .定理9.1.7 设A 是任意n 阶实对称矩阵,则 (1) A 的特征值都是实数;(2)A 有n 个线性无关的特征向量.定理9.1.8 设A 是任意n 阶实对称矩阵,则必存在n 阶正交矩阵P ,使得1T -==P AP P AP Λ,其中12diag(,,,)n λλλ=L Λ是以A 的n 个特征值12,,,n λλλL 为对角元素的对角矩阵.定理9.1.9 (圆盘定理) 矩阵()ij n n a ⨯=A 的任意一个特征值至少位于复平面上的几个圆盘中的一个圆盘上。

9.2 幂法与反幂法9.2.1 幂法及其加速9.2.1.1 幂法幂法是计算矩阵按模最大特征值(largest eigenvalue in magnitude)及相应特征向量的迭代法. 该方法稍加修改,也可用来确定其他特征值. 幂法的一个很有用的特性是:它不仅可以求特征值,而且可以求相应的特征向量. 实际上,幂法经常用来求通过其他方法确定的特征值的特征向量. 下面探讨幂法的具体过程.设矩阵n n⨯∈RA 的n 个特征值满足1230n λλλλ>≥≥≥≥L , (9.2.1)且有相应的n 个线性无关的特征向量12,,,n L x x x ,则12,,,n L x x x 构成n 维向量空间nR 的一组基, 因此1,,1,2,,nni i i i i n αα=⎧⎫==∈=⎨⎬⎩⎭∑R R L z z x .在nR 中选取某个满足10α≠的非零向量01ni i i α==∑z x .用矩阵A 同时左乘上式两边,得011n ni i i i i i i ααλ====∑∑Az Ax x .再用矩阵A 左乘上式两边,得2201ni i i i αλ==∑A z x .这样继续下去,一般地有01,1,2,.nkk i i i i k αλ===∑L A z x (9.2.2)记10,1,2,kk k k -===L z Az A z ,则由式(9.2.2)得0111121, 1,2,.knn k k ki k i i i i i i i k λαλλααλ==⎡⎤⎛⎫⎢⎥===+= ⎪⎢⎥⎝⎭⎣⎦∑∑L z A z x x x (9.2.3)由假设(9.2.1),结合式(9.2.3),得111lim,kkk αλ→∞=z x (9.2.4)于是对充分大的k 有111.k k λα≈z x (9.2.5)式(9.2.4)表明随着k 的增大,序列{}1k kλz越来越接近A 的对应于特征值1λ的特征向量1x 的1α倍, 由此可确定对应于1λ的特征向量1x . 当k 充分大时,可得1x 的近似值.上述收敛速度取决于比值21λλ. 事实上,由式(9.2.3)知,321122331111kkkkn nn kλλλααααλλλλ≤++++L z x x x x . (9.2.6)再由式(9.2.1)得321111n λλλλλλ>≥≥≥L . (9.2.7)结合式(9.2.6)和式(9.2.7)知,序列{}1kkλz收敛速度取决于比值21λλ.下面计算1λ. 由式(9.2.3)知 当k 充分大时,11111k k λα++≈z x . 结合式(9.2.5),得11k k λ+≈z z .这表明两个相邻向量大体上只差一个常数倍,这个倍数就是A 的按模最大特征值1λ. 记()T(1)(2)(),,,n k k k k z z z =L z , 则有()11()lim ,1,2,,j k j k kz j n z λ+→∞==L , (9.2.8)即两个相邻的迭代向量所有对应分量的比值收敛到1λ.定义9.2.1 上述由已知非零向量0z 及矩阵A 的乘幂k A 构造向量序列{}k z 来计算A 的按模最大特征值1λ及相应特征向量的方法称为幂法(power method),其收敛速度由比值21γλλ=来确定,γ越小,收敛越快.注 由幂法的迭代过程(9.2.3)容易看出,如果11λ>(或11λ<),那么迭代向量k z 的各个非零的分量将随着k→∞而趋于无穷(或趋于零),这样在计算机上实现时就可能上溢(或下溢). 为了克服这个缺点,需将每步迭代向量进行规范化: 记()T(1)(2)()1,,,n k k kkky y y-==L y Az . 若存在k y 的某个分量0()j ky ,满足0()()1max j j kk j ny y ≤≤=,则记0()max()j k k y =y . 将k y 规范化max()k k k =z y y ,这样就把k z 的分量全部控制在[1,1]-中.例如,设T(2,3,0,5,1)k =--y ,因为k y 的所有分量中,绝对值最大的的是5-,所以max()5k =-y ,故T max()(0.4,0.6,0,1,0.2)k k k ==--z y y .综上所述,得到下列算法:算法9.2.1 (幂法) 设A 是n 阶实矩阵,取初始向量0n∈R z ,通常取T0(1,1,,1)=L z ,其迭代过程是:对1,2,k =L ,有1,max(),.k k k k kk k m m -=⎧⎪=⎨⎪=⎩y Az y z y (9.2.9) 定理9.2.1 对式{}k z 和{}k m 有()11lim max k k →∞=x z x , 1lim k k m λ→∞=, ()其收敛速度由21γλλ=确定.证明 由迭代过程(9.2.9)知001max()kkk k ii m====∏L A z A z A z , (9.2.11)其中01ni i i α==∑z x . 若10α≠,则由(9.2.3)知:011121k n k ki i i i λλααλ=⎡⎤⎛⎫⎢⎥=+ ⎪⎢⎥⎝⎭⎣⎦∑A z x x , 代入式(9.2.11)得11211121max kni i ii k kn i i i i λααλλααλ==⎛⎫+ ⎪⎝⎭=⎛⎫⎛⎫⎪+ ⎪ ⎪⎝⎭⎝⎭∑∑x x z x x , (9.2.12) 故()11lim max k k →∞=x z x . (9.2.13)而111211111121max kn k ii i i k n k i i i i a a a a λλλλλλ=--=⎡⎤⎛⎫+⎢⎥⎪⎢⎥⎝⎭⎣⎦=⎛⎫⎛⎫ ⎪+ ⎪ ⎪⎝⎭⎝⎭∑∑x x x x , (9.2.14) 于是1121111121max max()max kn i i i i k k k n i i i i a a m a a λλλλλ=-=⎛⎫⎛⎫⎪+ ⎪ ⎪⎝⎭⎝⎭==⎛⎫⎛⎫⎪+ ⎪ ⎪⎝⎭⎝⎭∑∑x x y x x , (9.2.15)故1lim k k m λ→∞=. (9.2.16)由式(9.2.6)和式(9.2.7)知:上述收敛速度由21γλλ=确定. 证毕!例9.2.1 用幂法求方阵按模最大特征值及相应的特征向量,要求3110k k m m ---<.解 选取初始向量T0(1,1,1)=z ,按式(9.2.9)迭代,结果见表表9.2.1因此,所求按模最大特征值18.3589λ≈,相应特征向量T1(0.559817,0.559817,1)≈x . 事实上,A 的按模最大特征值148.3588989λ=≈L ,相应特征向量T 1(0.55981649,0.55981649,1)=L L x , 故所得结果具有较高的精度.9.2.1.2 幂法的加速从上面的讨论可知,由幂法求按模最大特征值,可归结为求数列{}k m 的极限值,其收敛速度由21γλλ=确定. 当21γλλ=接近1时, 收敛速度相当缓慢. 为了提高收敛速度, 可以利用外推法进行加速.因为序列{}k m 的收敛速度由21γλλ=确定,所以若{}k m 收敛,当k 充分大时,则有()121k k m O λλλ⎡⎤-=⎢⎥⎣⎦,或改写为()121kk m c λλλ-≈,其中c 是与k 无关的常数. 由此可得11211k k m m λλλλ+-≈-, (9.2.17)这表明幂法是线性收敛的. 由式(9.2.17)知1121111k k k k m m m m λλλλ+++--≈--.由上式解出1λ,并记为2k m +%,即2221122121()22k k k k k k k k k k k k km m m m m m m m m m m m m ++++++++--==+-+-+%, (9.2.18) 这就是计算按模最大特征值的加速公式.将上面的分析归结为如下算法:算法9.2.2 (幂法的加速) 设A 是n 阶实矩阵,给定非零初始向量0n∈R z ,通常取T0(1,1,,1)=L z . 对1,2k =,用迭代式求出12,m m 及12,z z . 再对3,4,k =L ,迭代过程为1212212,max(),(),2.k k k k k k k k k k k k k k m m m m m m m m m------=⎧⎪=⎪⎪-⎨=-⎪-+⎪⎪=⎩%%y Az y z y () 当1k k m m ε--<%%(0ε>是预先给定的精度) 时,迭代结束,并计算k z ;否则继续迭代,直至满足迭代停止条件1k k m m ε--<%%.有关加速收敛技术,读者请参考文献[11].8.2.2 反幂法及其加速反幂法是计算矩阵按模最小特征值及相应特征向量的迭代法, 其基本思想是:设矩阵n n⨯∈R A 非奇异,用其逆矩阵1-A 代替A , 矩阵A 的按模最小特征值就是矩阵1-A 的按模最大特征值. 这样用1-A 代替A 做幂法,即可求出1-A 的按模最大特征值,也就是矩阵A 的按模最小特征值;这种方法称为反幂法(inverse power method).因为矩阵A 非奇异,所以由i i i λ=Ax x 可知:11i i iλ-=A x x . 这说明:如果A 的特征值满足1210n-n λλλλ≥≥≥>>L , (9.2.20)那么1-A 的特征值满足1211111nn-λλλλ>≥≥≥L , (9.2.21)且对A 的应于特征值i λ的特征向量i x 也是1-A 的对应于特征值1i λ的特征向量.由上述分析知:对1-A 应用幂法求按模最大的特征值1n λ及相应的特征向量n x ,就是求A 的按模最小的特征值n λ及相应的特征向量n x .算法9.2.3 (反幂法) 任取初始非零向量0n∈R z ,通常取T0(1,1,,1)=L z . 为了避免求1-A ,对1,2,k =L1,max(),.k k k k kk k m m -=⎧⎪=⎨⎪=⎩Ay z y z y (9.2.22) 仿定理9.2.1的证明,可得: 定理9.2.2 对式{}k z 和{}k m 有1lim ,lim max()nk k k k n nm λ→∞→∞==x z x , ()其收敛速度由1n n γλλ-=%确定.注 按(9.2.22)进行计算,每次迭代都需要解一个方程组1k k -=Ay z . 若利用三角分解法求解方程组,即=A LU ,其中L 是下三角矩阵,U 是上三角矩阵,这样每次迭代只需解两个三角方程组9.2.3 原点平移法为了提高收敛速度,下面介绍加速收敛的原点平移法.设矩阵p =-B A I ,其中p 是一个待定的常数,A 与B 除主对角线上的元素外,其他元素相同.设A 的特征值为12,,,n λλλL ,则B 的特征值为12,,,n p p p λλλ---L ,且A 与B 的特征向量相同.9.2.3.1 原点平移法的幂法 设1λ是A 的按模最大的特征值,选择p ,使12,3,4,,i p p p i n λλλ->-≥-=L ,及2211p p λλλλ-<-. (9.2.24)对B 应用幂法,得 算法9.2.4 对1,2,k=L ,有1(),max(),,k k k k kk k p m m -=-⎧⎪=⎨⎪=⎩y A I z y z y (9.2.25) 且()111lim ,lim ,max k k k k m p λ→∞→∞=-=x z x ()其收敛速度由21()()p p λλ--确定.由式(9.2.24)知:在计算B 的按模最大特征值1p λ-的过程(9.2.25)中,收敛速度得到加速;算法9.2.4又称为原点平移下的幂法(power method with shift).9.2.3.2 原点平移下的反幂法 设n λ是A 的按模最小的特征值,选择p ,使1,1,2,,2n n i p p p i n λλλ--<-≤-=-L . (9.2.27)及11n nn n p p λλλλ---<-. (9.2.28)若矩阵p =-B A I 可逆,则1-B 的特征值为 且有1111,1,2,,2n n i i n p p pλλλ->≥=----L . (9.2.29)对B 应用反幂法,得: 算法9.2.5 对1,2,k=L ,有1(),max(),,k k k k kk k p m m --=⎧⎪=⎨⎪=⎩A I y z y z y () 且()111lim ,lim ,max k k k k n m p λ→∞→∞==-x z x ()其收敛速度由1())n n p p λλ---确定.由式(9.2.28)知:在计算1-B 的按模最大特征值1n pλ-的过程(9.2.30)中,收敛速度得到加速. 算法9.2.5又称为原点平移下的反幂法 (inverse power method with shift).定义9.2.8 原点平移下的幂法与原点平移下的反幂法统称为原点平移法.注 有的资料上的原点平移法专指原点平移下的反幂法;而有的资料上的反幂法指的就是原点平移下的反幂法.原点平移下的反幂法(算法9.2.7)的主要应用是:已知矩阵的近似特征值后,求矩阵的特征向量. 其主要思想是:若已知A 的特征值m λ的近似特征值为m λ%,则mA I λ-%的特征值就是(1,2,,)i mi m λλ-=%L ,其中(1,2,,)i i m λ=L 是A 的特征值. 而按模最小的特征值是m m λλ-%,相应的特征向量与A 的特征向量相同.利用公式(9.2.30)可求出{}{},k k m z ,并且有1lim ,lim max()mk k k k m mm m λλ→∞→∞==-%x z x ,其收敛速度由11(min )m m i m i m i m i mλλλλλλλλ≤≤---=--%%%%确定. 于是当k 充分大时,可取 m k ≈x z , 1m mkm λλ≈+%, 只要近似值mλ%适当好,收敛速度就很快,往往迭代几次就能得到满意的结果. 例9.2.2 已知特征值λ的近似值0.3589λ=-%,用原点平移下的反幂法求方阵 得对应特征值λ的特征向量.解 取0.3589p λ==-%,对矩阵1.3589230.35892 1.3589333 5.3589A pI A I ⎡⎤⎢⎥-=+=⎢⎥⎢⎥⎣⎦.迭代公式(9.2.30)中的k y 是通过解方程组求得的. 为了节省工作量,可先将p -A I 进行LU 分解.在LU 分解中尽量避免较小的rr u 当除数,通常可以先对矩阵p -A I 的行进行调换后再分解. 为此,我们可用001010100⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦P 乘p -A I 后再进行LU 分解,即 6001 1.35892333 5.3589()0102 1.358932 1.3589310033 5.3589 1.35892310033 5.35890.66671000.64110.5726,0.45301100 3.0710p -⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥-===⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦⎡⎤⎡⎤⎢⎥⎢⎥=--⎢⎥⎢⎥⎢⎥⎢⎥--⨯⎣⎦⎣⎦P A I LU 1( 1.2679)k k --=P A I y Pz , 即 1k k -=LUy Pz .令11,.k k k k --==Lv Pz Uy v 选取0z ,使1T 10(1,1,1)-==Uy L Pz ,得T 1(290929.45,290927.56,325732.90)=-y ,11max()325732.90m ==-y , T 111(0.8932,0.8931,1)m ==--z y .由121-=Uy L Pz 得T 2(845418.49,845418.49,946558.42)=--y ,22max()946558.42m ==y , T 222(0.8932,0.8932,1)m ==--z y .由于1z 与2z 的对应分量几乎相等,故A 的特征值为2110.35890.35889894354117946558.42m λλ≈+=-+=-%, 相应的特征向量为T2(0.8932,0.8932,1)==--x z .而矩阵A的一个特征值为40.358898943540674λ==L ,相应的特征向量为T (0.89315,0.89315,1)--,由此可见得到的结果具有较高的精度.9.3 QR 算法上一节我们介绍了求矩阵特征值的幂法和反幂法. 幂法主要用来求矩阵的按模最大特征值,而反幂法主要用于求特征向量. 本节将介绍幂法的推广和变形——QR 算法,它是求一般中小型矩阵全部特征值的最有效的方法之一,其基本思想就是利用矩阵的QR 分解. 矩阵n n⨯∈RA 的QR 分解就是:用Householder 变换将矩阵A 分解成正交矩阵Q 与上三角矩阵R 的乘积,即=A QR . 下面首先介绍Householder 变换.9.3.1 豪斯霍尔德变换定义9.3.1 设()ij n n b ⨯=B 是n 阶方阵,若当1i j >+时,0ij b =,则称矩阵B 为上Hessenberg 矩阵(Hessenberg matrix ),又称为准上三角矩阵,它的一般形式为1112121222323,1n n n n n nn b b b bb b b b b b -⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦L L L L L L OM B . (9.3.1) 下面讨论如何将矩阵A 用正交相似变换化成(9.3.1)的形式. 为此先介绍一个对称正交矩阵——Householder 矩阵.定义9.3.2 设向量n∈R u 的欧氏长度21=u ,I 为n 阶单位矩阵,则称n 阶方阵T ()2==-H H u I uu (9.3.2)为Householder 矩阵(Householder matrix). 对任何n∈R x ,称由()=H H u 确定的变换=y Hx (9.3.3)为镜面反射变换(specular reflection transformation),或Householder (Householder transformation).注 Householder 变换,最初由A.C Aitken 在1932年提出. Alston Scott Householder 在1958年指出了这一变换在数值线性代数上的意义. 这一变换将一个向量变换为由一个超平面反射的镜像,是一种线性变换.运用线性代数的知识,很容易证明:定理9.3.3 (9.3.2)式定义的矩阵H 是对称正交矩阵;对任何n∈R x ,由线性变换H =y x 得到y的欧氏长度满足22=y x .反之,有下列结论:定理9.3.4 设,n∈R x y ,≠x y . 若22=x y ,则一定存在由单位向量确定的镜面反射矩阵()H u ,使得H =x y .证 令2-=-x yu x y ,显然21=u . 构造单位向量u 确定的镜面反射矩阵T ()2==-H H u I uu ,()T T T T2222()()2()()22⎡⎤----⎢⎥=-=-=---⎢⎥⎣⎦x y x y x y x x y x Hx I uu x I x x x y x y .又因为22=x y ,即T T =x x y y ,所以————————————————————海森伯格(Karl Adolf Hessenberg 1904年9月8日–1959年2月22日) 是德国数学家和工程师.豪斯霍尔德(Alston Scott Householder 1904年5月5日–1993年7月4日) 是美国数学家,在数学生物学和数值分析等领域卓有建树.于是T T 222()()()--=-=--=-x y x x y x Hx x x x y y x y.证毕!由定理9.3.4得:算法9.3.1 若T12(,,,)n x x x =L x ,其中2,,n x x L 不全为零,则由12T 11212T1T22sgn(),,(1,0,,0),(),()2n x x σσρσσρ-⎧=⎪=+=∈⎪⎪=+⎨⎪⎪==-=-⎪⎩R L 12其中=x u x e e u uu H H u I I uu u (9.3.4) 确定的镜面反射矩阵H ,使得1σ=Hx e ,其中1,0,sgn()0,0,1,0.a a a a >⎧⎪==⎨⎪-<⎩例9.3.1 设T(1,2,2)=--x ,按式(9.3.4)的方法构造镜面反射矩阵H ,使得T(,0,0)*=Hx (*表示某非零元素).解12sgn()(3x σ==-=-x ;T T T 1(1,2,2)(3,0,0)(4,2,2)σ=-=---=--u x e , 其中T 1(1,0,0)=e ;212()3[3(1)]12x ρσσ==+=--+-=12u ,则所求镜面反射矩阵为1T 1004132210102(4,2,2)221120012231323ρ----⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥=-=---=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦H I uu ,且132323132323132023132320---⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦⎣⎦Hx .可以证明:定理9.3.6 对任意n 阶方阵()ij n n a ⨯=A ,存在正交矩阵Q ,使得 为形如式(9.3.1)的上Hessenberg 阵.证 记(1)(1)(1)1112111121(1)(1)(1)21222212221(1)(1)(1)1212n nn n n n nn n n nn a a a a a a a a a a a a a a a a a a ⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥===⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦LLL L M M M M M M L L A A ,(1)21(1)311(1)1n a a a ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦M x . 由式(9.3.4)可构造1n -阶对称正交矩阵1H :122121121122T 111111211112121T 1111sgn()sgn(),,(1,0,,0),(),,n i i n a a a a σσρσσρ=--⎧⎛⎫==-⎪ ⎪⎝⎭⎪⎪=+=∈⎨⎪=+⎪⎪=-⎩∑R L 12其中=x u x e e u H I u u (9.3.5) 使得1111σ=H x e .记111⎡⎤=⎢⎥⎣⎦IQ H ,且1n n⨯∈R Q ,1I 是1阶单位矩阵. 显然1Q 是对称正交矩阵. 用1Q 对A 作相似变换,得(1)(2)(2)11121(2)(2)12221(2)(2)111112323(2)(2)20n n nn nn a a a a a a a a a σ-⎡⎤⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦LL L M M M L记Q AQ Q A Q A . (9.3.6)记(2)(2)(2)T 2232422(,,,)n n a a a -=∈R L x ,同理可构造2n -阶对称正交矩阵2H ,使得2221σ=H x e(T21(1,0,,0)n -=∈RL e ).记222⎡⎤=⎢⎥⎣⎦I Q H ,其中2I 为2阶单位矩阵,则2Q 仍是对称正交矩阵,用2Q 对2A 作相似变换,得(1)(2)(3)(3)1112131(2)(3)(3)122232(3)(3)123332222223(3)(3)434(3)(3)300000nn n n n nn a a a a a a a a a a a a a σσ-⎡⎤⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦L L L L M M M M L记Q A Q Q A Q A . (9.3.7)依此类推,经过k 步对称正交相似变换,得(1)(2)(3)(1)()()()1112131,111,11(2)(3)(1)()()()122232,122,12(3)(1)()()()2333,133,133(1)()()()1,11,1,11,000000k k k k k k k n k k k k k k k n k k k k k k k nk k k k k k k k k k k na a a a a a a a a a a a a a a a a a aa a a σσσ--+--+--+-----+-=L L LL L L O MMMM O L ()()()1,1()()()1,1,11,()()(),10000000000k k k k k kk k k kn k k k k kk k k n k k k nkn k nna a a aaa a a a σ-++++++⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦O L L L M M M M MMM LL记A . (9.3.8)重复上述过程,则有(1)(2)(3)(1)()1112131,11(2)(3)(1)()122232,12(3)(1)()12333,1322222213(1)()1,11,()1n n n n n n n n n n n nn n n n n n n n n n n n nn n nn a a a a a a a a a a a a a a a σσσσ-------------------⎡⎤⎢⎥⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦L L LO MM O记Q A QQ A Q A . (9.3.9)由式(9.3.6)-(9.3.9),可得122223332231132n n n n n n n n n n n n n -------------===L L A Q A Q Q Q A Q Q Q Q Q AQ Q Q .若记1n -=B A ,122n -=L Q Q Q Q ,则Q 为正交矩阵,且有T=B Q AQ . 证毕!注1 由定理9.3.6知:因为任意n 阶方阵A 与n 阶上Hessenberg 矩阵B 相似,所以求A 的阵特征值的问题,就可转化为求上Hessenberg 矩阵B 的特征值的问题.注2 若A 是对称矩阵,则B 也是对称矩阵. 再由B 的形式(9.3.1)知,此时B 一定是对称三对角阵. 于是,求对称矩阵A 的阵特征值的问题,便可转化为求对称三对角阵B 的特征值问题.例9.3.2 设矩阵试用镜面反射变换求正交矩阵Q ,使TQ AQ 为上Hessenberg 矩阵.解 第1步 记1=A A ,(1)(1)(1)TT 1213141(,,)(2,1,2)a a a ==x ,利用式(9.3.4)构造三阶镜面反射阵1H :112sgn(2)3σ===x ;T T T 1111(2,1,2)(3,0,0)(5,1,2)σ=+=+=u x e , 其中T 1(1,0,0)=e ;2(1)1111212()3(32)15a ρσσ==+=+=12u ; 则所求镜面反射矩阵为T 21111113003 2.33330.46670.066700.4667 1.5733 1.346700.0667 1.34670.0933-⎡⎤⎢⎥--⎢⎥===⎢⎥⎢⎥-⎣⎦A Q A Q Q AQ . 第2步 记(2)(2)TT23242(,)(0.4667,0.0667)a a ==-x , 利用式(9.3.4)构造2阶镜面反射阵2H :222sgn(0.4667)0.4714σ===x ;T T T 2221(0.4667,0.0667)(0.4714,0)(0.9381,0.0667)σ=+=-+=-u x e , 其中T 1(1,0)=e ;2(2)2222322()0.4714(0.47140.4667)0.4422a ρσσ==+=+=12u ; 则所求镜面反射矩阵为T 322222213003 2.33330.4714000.4714 1.5733 1.500000 1.50000.5000-⎡⎤⎢⎥--⎢⎥===⎢⎥--⎢⎥-⎣⎦A Q A Q Q A Q . 由此得正交矩阵12100000.66670.23570.707100.33330.94290.000100.66670.23570.7070⎡⎤⎢⎥--⎢⎥==⎢⎥--⎢⎥-⎣⎦Q Q Q , 使得为上Hessenberg 矩阵。

相关文档
最新文档