第八章__特征值问题
数值分析—矩阵特征值问题的数值计算
( vk +1 )i vk = α1 x1 , lim = λ1 . k k →∞ λ k →∞ ( v ) k i 1
lim
可见,当 k 充分大时, vk 近似于主特征向量(相差一个常数倍) , vk +1 与 vk 的对应非零分 量的比值近似于主特征值。 在实际计算中,需要对计算结果进行规范化。因为当 λ1 <1 时, vk 趋于零;当 λ1 >1 时 , vk 的 非 零 分 量 趋 于 无 穷 , 从 而 计 算 时 会 出 现 下 溢 或 上 溢 。 为 此 , 对 向 量
λ1 ≥ λ2 ≥ L ≥ λn ,
∑x y
i =1 i
n
i
为向量 x 和 y 的内积。
定理 8.3 设 A 为 n 阶实对称矩阵,其特征值都为实数,排列为 对应的特征向量 x1 , x2 ,L , xn 组成正交向量组,则有 1) 对任何非零向量 x ∈ R n ,有 λn ≤ R( x) ≤ λ1 , 2) λ1 = max R ( x) = R( x1 ) ,
Ζ = ( z1 , z2 ,L, zn )T ∈ R n , 记 max( Ζ) = zi ,其中 zi = Ζ ∞ ,这样, 我们有 如 下 乘幂 法 的实 用
的计算公式: 任取 v0 = u0 ≠ 0 ,对于 k = 1, 2,L 分别计算 vk = Auk −1 , uk = vk / max(vk ). 求出对应矩阵的主特征向量和特征值的近似值,有下面的定理。 定理 8.4
m1 0 M = 0 0 0
称为质量矩阵,而
0 m2 0 0 0
0 0 m3 0 0
0 0 0 m4 0
0 0 0 0 m5 0 0 −k4 k 4 + k5 − k5 0 0 0 − k5 k5
第八章__特征值问题
例 2 矩阵
(0,1,0)T , 1、 11 、 A(ε) 的
数学系 李继根( jgli@ )
二、盖尔(Gerschgorin)定理
把矩阵
A 分裂成 A = diag(a11,L , ann ) + B ? D B
A 的扰动矩阵 A(ε) ? D εB ,显然 A(0) = D, A(1) = A 我们有理由猜测,如果 ε 足够小, A(ε) 的特征 L 、a) 值将位于 A(0) 的特征值(即元素 a11、 nn
由此,我们可以将 Gerschgorin定理看成定理 8 的“推论” 。
数学系 李继根( jgli@ )
事实上,设矩阵 A 的特征值 Gerschgorin区域 ,则有
ℓ 不属于 A 的
| ℓ ai i | ⊳ Ri , i ≪1, 2,⋯ , n 因此矩阵 ℓ I A 严格对角占优,根据定理 8 det(ℓ I A ) 0 这与 ℓ 是 A 的特征值相矛盾。
遗憾的是矩阵的特征向量一般不是矩阵元素的 连续函数,因此不一定是稳定的。
1 0 0 A(ε) = 0 1+ ε 1 ε 0 1+ ε 1+ ε、 1,特征向量为 的特征值为 1+ ε、 T (1,1/ ε , 1) - 。而 A(0) 的特征值为 和 特征向量为 (0,1,0)T 和 (1,0,0)T 。矩阵 特征向量在 ε = 0 处不连续。
1
数学系 李继根( jgli@ )
根据定理8,严格对角占优矩阵 征值,而
A 没有零特
| 0 ai i | ≪| ai i | ⊳ Ri , i ≪1, 2,⋯ , n
这说明矩阵
A 的特征值 ℓ 可能满足 | ℓ ai i | ℂ Ri , i ≪1, 2,⋯ , n
̃ ≪ A E , E ≪(⊙ ) 的解。这里 A i j
第8章 矩阵特征值计算
第八章 矩阵特征值计算1 特征值性质和估计工程实践中有许多种振动问题,如桥梁或建筑物的振动,机械机件的振动,飞机机翼的颤动等,这些问题的求解常常归纳为求矩阵的特征值问题。
另外,一些稳定分析问题及相关问题也可以转化为求矩阵特征值与特征向量的问题。
1.1 特征值问题及性质设矩阵n n ⨯∈A R (或n n ⨯C ),特征值问题是:求C λ∈和非零向量n R ∈x ,使λ=Ax x (1.1)其中x 是矩阵A 属于特征值λ的特征向量。
A 的全体特征值组成的集合记为sp()A 。
求A 的特征值问题(1.1)等价于求A 的特征方程()det()0p I λλ=-=A (1.2)的根。
因为一般不能通过有限次运算准确求解()0p λ=的根,所以特征值问题的数值方法只能是迭代法。
反之,有时为了求多项式111()n n n n q a a a λλλλ--=++++的零点,可以把()q λ看成矩阵123101010n a a a a ----⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦的特征多项式(除(1)n -因子不计)。
这是一个Hessenberg 矩阵,可用QR 方法求特征值,从而求出代数方程()0q λ=的根。
矩阵特征值和特征向量的计算问题可分为两类:一类是求矩阵A 的全部特征值及其对应的向量;另一类是求部分特征值(一个或几个、按模最大或最小)及其对应的特征向量。
本章介绍部分特征值和特征向量的幂法、内积法;求实对称矩阵全部特征值的雅可比法、Given 方法和Householder 方法;求任意矩阵全部特征值的QR 算法。
在第5章已给出特征值的一些重要性质,下面再补充一些基本性质。
定理1 设n n R ⨯∈A ,则(1) 设λ为A 的特征值,则λμ-为μ-A I 的特征值;(2) 设12,,,n λλλ是A 的特征值,()p x 是一多项式,则矩阵()p A 的特征值是12(),(),,()n p p p λλλ。
第8章 特征值和特征向量
第8章特征值和特征向量M A T L A B中的命令计算特征值和特征向量很方便,可以得到不同的子结果和分解,这在线性代数教学时很有用。
注意,本章中的命令只能对二维矩阵操作。
8.1 特征值和特征向量的计算假设A是一个m×n的矩阵,A的特征值问题就是找到方程组的解:其中λ是一个标量,x是一个长度为n的列向量。
标量λ是A的特征值,x是相对应的特征向量。
对于实数矩阵A来说,特征值和特征向量可能是复数。
一个n×n的矩阵有n个特征值,表,λ2,. ..,λn。
示为λ1M A T L A B中用命令e i g来确定矩阵A的特征值和特征向量。
特征向量的规格化,就是每个特征向量的欧几里得范数为1;参见7 .6节。
命令e i g自动完成对矩阵A的平衡化。
这就要求M A T L A B找出一个相似变换矩阵Q,满足条件。
求的特征值比求A的特征值条件更好些。
万一A有一个和机器错误大小一样的元素,平衡化对于计算过程是没有好处的。
带有参数n o b a l a n c e的命令e i g可用来计算没有这个变换矩阵的特征值和特征向量。
命令集7 9特征值和特征向量e i g(A)求包含矩阵A的特征值的向量。
[ X,D]=e i g(A)产生一个矩阵A的特征值在对角线上的对角矩阵D和矩阵X,它们的列是相应的特征向量,满足A X=X D。
为了得到有更好条件特征值的矩阵要进行相似变换。
[ X,D]=不经过平衡处理求得矩阵A的特征值和特征向量,也就是e i g(A,’n o b a l a n c e’)不进行平衡相似变换。
b a l a nc e(A)求平衡矩阵。
[ T,B]=b a l a n c e(A)找到一个相似变换矩阵T和矩阵B,使得它们满足B=T-1AT。
B是用命令b a l a n c e求得的平衡矩阵。
e i g s(A)返回一个由矩阵A的部分特征值组成的向量,和命令e i g一样,但是不返回全部的特征值。
Chapter 8特征值问题的计算方法
ɶ ɶ ɶ ɶ Qm+1Rm+1 = AQmRm
ɶ R = A2Q R = ⋯= AmQ R = Am+1 ɶ ɶ Qm+1 ɶm+1 m−1 m−1 1 1
即A
m
ɶ ɶ = QmRm
QR方法的收敛性 方法的收敛 收敛性
方法的收敛性质) 收敛性质 ( Th8.4.1 QR方法的收敛性质) 设 A 的特征值满足 λ1 > λ 2 > ⋯ > λ n > 0 ,且 Y 的 左特征向量 向量; 分解, 第i行是 A 对应于 λi 的左特征向量;若 Y 有 LU分解, 行是 则由QR迭代算法产生的矩阵 Am = [a 下的元素趋于0, 下的元素趋于 ,同时对角元素 a
∗ 其中A2 = α 2 ∗ ɶ A3
1 0 ɶ 令 H2 = ˆ 0 H 2
∗ 1 0 ∗ ∗ 1 0 ∗ ɶ ɶ H2 A2 H2 = = ˆ ɶ 0 H ˆ AH ˆ ˆ H2α2 H2 ɶ3 ˆ 2 0 H2 α2 A3 2
第八章 特征值问题的计算方法
/*Computational Method of Eigenvalue Problem*/ 本章主要介绍矩阵的特征值和特征向量的计算方法。 本章主要介绍矩阵的特征值和特征向量的计算方法。 特征值 的计算方法
§1 基本概念与性质
特征值和特征向量的基本概念与性质 特征值和特征向量的
1 0 令 H2 = ɶ 0 H 2
∗ ∗ ɶ ɶ H2 A2 H2 = ˆ ˆ ɶ ˆ H2α2 H2 A H2 3
det(λ I − A) = (λ − λ1 ) (λ − λ2 ) ...(λ − λ p ) 其中 n1 + n2 + ... + np = n; λi ≠ λ j (i ≠ j )
第8章特征值问题的计算方法
第8章特征值问题的计算方法第8章特征值问题的计算方法本章中讨论求n 阶实矩阵的特征值的数值方法。
8.1 基本概念与性质设A 是n 阶方阵,若数λ和非0向量x 满足:x Ax λ=则λ称为A 的特征值,x 称为A 的对应于λ的特征向量。
A 的特征值的全体()A λ称为A 的谱集。
n 次多项式方程()0det =?A I λ称为A 的特征方程,()A I ?λdet 称为A 的特征多项式。
8.2 幂法矩阵的模最大的特征值称为主特征值。
幂法可用于求矩阵的主特征值及其相应的特征向量。
设n 阶方阵A 有有n 个线性无关的特征向量。
设j j j x Ax λ=,j=1..n,其中j λ是A 的特征值,设A 的主特征值1λ是实数且是单重,n λλλ≥≥>L 21.特征向量乘以非0常数仍然是特征向量,故可增加约束,只求范数为1的向量。
设v 0是任意一个非0向量,则v 0可惟一地表示成n 个特征向量的线性组合,设∑==ni i i x v 10α,假设01≠α,令01v A Av v k k k ==?,则111211111~x x x x v k n i i ki i k ni i k i i k αλλλααλλα+==∑∑==,∞→k ,当k>>1时,11?≈k k v v λ,11λ→?k k v v ,1x v v k k →。
为避免计算机出现上溢或下溢现象,在每步计算中将v k 规格化。
111??≈=k k k v Av u λ,k k k m u v =,,k=1,2,…… 则 1x v k →,()()()111111,,,≈=k k k k k k v v v Av v u λ())1111,,≈k k k k v v v u λ若取2kk u m =(k=0,1,2,…),则()11,?≈k k v u λ,简化了运算。
算法8.1功能:用幂法求矩阵主特征值。
形参:阶数n,矩阵A,特征向量v,误差限e,迭代次数上限m ,主特征值L. 条件:计算前v 是初始近似值,非零。
第8章_特征值问题变分原理
第8章 特征值问题的变分原理8.1 Sturm-Liouville 微分方程与特征值在求解微分方程、结构的稳定性或者求结构的固有频率时,我们经常会遇到下面的微分算子A01d d ()()[()]()(),(,)d d y x Ay x p x q x y x x x x x x=-+∈ (8.1.1) 其中)(),(x q x p 都是已知的函数,0)(≠x p ,那么方程()()()Ay x w x y x λ= (8.1.2)称为Sturm-Liouville 方程,其中权函数0)(≥x w ,当且仅当在01(,)x x 的一个零测度集上等号成立。
当给定了齐次边界条件后,只有某一些特定的λ才能使得该方程有非零解, 使得该方程有非零解的λ称为特征值,相应的解)(x y 称为特征函数。
常见的边界条件为(1) 两端固定∶0)()(10==x y x y 。
(2) 两端自由∶0))(())((1'0'==x py x py 。
(3) 一端固定、另一端自由∶0)(0=x y 或0)(1=x y , 0))((0'=x py 或0))((1'=x py 。
我们可以在复函数空间中定义一个内积运算为11212(),()()()x x y x y x y x y x dx <>=⎰容易证明,1212(),()(),()Ay x y x y x Ay x <>=<>,即A 是对称(自伴)算子。
如果记12,,λλL (......21n λλλ≤≤≤)为Sturm-Liouville 方程的特征值...,...,21n y y y 是相应的特征函数。
也就是说()()()i i i Ay x w x y x λ= (8.1.3)那么,对于特征值和特征函数,我们可以得到以下一些性质:1. 所有特征值是实的若,()y x λ是一组特征值和特征函数,即 ()()()Ay x w x y x λ= (8.1.4)则,()y x λ也是一组特征值和特征函数,即()()()Ay x w x y x λ= (8.1.5)将(8.1.4) 乘()y x 、(8.1.5) 乘()y x 相减并积分可得 1()()()()d 0x x w x y x y x x λλλλ-=⇒=⎰2. 特征函数正交性,0,i j wy y i j <>=≠由算子A 的对称性,,,i j i j j i Ay y y Ay Ay y <>=<>=<>另一方面,由于,i j y y 是算子A 的特征向量,所以有,,,i j i i j i i j Ay y wy y wy y λλ<>=<>=<>,,,,j i j j i j j i j i j Ay y wy y wy y wy y λλλ<>=<>=<>=<>因此`0,)(>=<-j i j i y wy λλ当j i λλ≠时,要求上式成立,只有0,>=<j i y wy当i j λλ=时,若,i j y y 是A 的两个线性无关的特征向量,选择,/,j j i j j i i y y wy y y wy y =-<><>%代替j y ,满足正交性要求,0i j wy y <>=%。
第八章矩阵特征值问题的数值解法
(X (k))j ( X (k1) )
j
1
幂方法
k充
分
大
时
,( X (X(
(k) ) j k1) )
j
1
即1
x ( k 1) i x(k) i
,
i 1,2,...n
此式说明了什么?
当k充分大时,相邻两次迭代向量对应的非零
分量的比值近似等于主特征值。
解题步骤: (1)任给n维初始向量X (0) 0
雅克比方法的一般推广
如果a 0,取使得tan 2 2a /(a a ) ( / 4)则有
ij
ij
jj
ii
a(1) a(1) 0, 得到一个使A中非零的非对角元素a a
ij
ji
ij
ji
变成零的正交相似变换。
对A(1)重复上述过程 A(2) ,得到一个矩阵序列{A(k) }。
可证,虽然这种变换不一定能使矩阵中非对角元中零 元素的个数增加,但是可以保证非对角元的平方和递减。
运行结果:
程序运行结果
预备知识:
E预ig备en知-ve识ctor
定义: 设A Rnn ,若存在数 及非零向量x, 使得
Ax x
则称 为A的特征值,x为A的属于的特征向量。
重要结论:
Eigen-value
(1) c 为cA的特征值(c为常数c 0);
(2) k为Ak的特征值;
(3) 设A为非奇异阵,那么 0且 1 为A1特征值,
Print[“矩阵A的精确特征值及对应的特征向量为”]; Eigensystem[A]
运行结果:
8.3 反幂法运算及程序
原理:设A为非奇异阵,那么 0且 1 为A1特征值,
特征值数值解法
第八章 矩阵特征值问题的数值解法矩阵特征值总是有广泛的应用背景. 例如在科学技术领域中,动力系统和结构系统中的振动问题、电力系统的静态稳定分析上、工程设计中的某些临界值的确定等,都归结为矩阵特征值问题. 本章介绍n 阶实矩阵nn RA ⨯∈的特征值与特征向量的求解方法,即求参数λ和相应的非零向量x ,使Ax=λx ,即(A-λI )x =0,并称λ为A 的特征值,x 为相应于λ的特征向量.而0)(=-x I A λ有非零解的充分必要条件是,0)(det )(111=++++=-=--n n n n a a a I A λλλλλϕ其中),,2,1(n i a i =为常数. 由于上面方程是λ的n 次多项式,因此它有n 个根(实根或复根). 除特殊情况外(如n=2,3或A 为上(下)三角矩阵,一般不直接求解,原因是这样的算法往往不稳定.在计算上常用的方法是乘幂法与反幂法(迭代法)和相似变换方法(变换法). 本章只介绍求矩阵特征值与特征向量的这两种基本方法.第一节 乘幂法及反幂法一、乘幂法 设矩阵nn RA ⨯∈的n 个特征值满足0n 321≥≥≥≥λλλλ (1.1)且有相应的n 个线性无关的特征向量.,,21n x x x 乘幂法是计算矩阵按模最大特征值及相应特征向量的迭代法,其基本思想是对任给的非零向量,0n R z ∈用矩阵A 连续左乘,构造迭代过程,具体过程是: 由假设知∑=≠=ni ii x z 110),0(αα用A 左乘两边得∑∑=====ni i i i ni i i x Ax Az z 1101.λαα再用A 左乘上式,得∑====ni i i x z A Az z 1210212.λα一直这样做下去,一般地有).,2,1( 111111101 =⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫⎝⎛+====∑∑==-k x x x z A Az z n i i ki i kni ik i kk k λλααλλα我们只讨论21λλ>的情况,对其他情况的讨论可根据参考文献[2]参阅有关资料.由(1.2)知,lim111x z kkk αλ=∞→ (1.3)于是对充分大的k 有.111x z kk αλ≈ (1.4)(1.3)表明序列⎭⎬⎫⎩⎨⎧k k z 1λ越来直接近A 的相应于1λ的特征向理(11,0x ≠α是A 的相应于1λ的特征向量的近似向量,其收敛速度取决于比值12λλ. 下面我们来计算1λ. 由于,1111111011⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛+===+=+++∑i k in i i k k k k x x z A Az z λλααλ当k 充分大时, 11111x z k k αλ++≈,于是可知。
《特征值问题》课件
在多元统计分析中,特征值问题用于确定数据集的主成分和方差解释率。通过计算数据矩阵的特征值和特征向量,可以提取数据的主要特征并进行降维处理。
金融风险管理
在金融风险管理中,特征值问题用于确定金融市场的系统风险和脆弱性。通过分析金融数据的特征值和特征向量,可以评估市场的稳定性和潜在的系统性风险。
04
CHAPTER
特征值问题的求解算法
直接法是求解特征值问题的一种基本方法,它通过直接计算矩阵的特征值和特征向量来得到问题的解。这种方法适用于小规模矩阵,但对于大规模矩阵,由于计算量较大,可能会导致计算效率低下。
具体步骤包括:计算矩阵的特征多项式、求解特征多项式的根、验证根是否为特征值等。
迭代法是一种求解特征值问题的间接方法,它通过迭代过程不断逼近真实特征值,最终得到近似解。这种方法适用于大规模矩阵,但需要选择合适的迭代初值和收敛准则。
01
特征值
矩阵的特征值是矩阵的一个重要属性,它描述了矩阵对向量进行变换时所产生的效果。
02
特征向量
与特征值相对应的向量,当矩阵作用于该向量时,结果仍是该向量或与其成比例的向量。
通过矩阵的运算和变换,求出矩阵的特征值和特征向量。
代数法
迭代法
数值方法
软件包
通过不断迭代逼近,求解特征值和特征向量,这种方法适用于大型稀疏矩阵。
采用数值计算方法求解特征值问题,如QR算法、Jacobi方法等。
有许多数学软件包可以用来求解特征值问题,如MATLAB、NumPy等。
03
CHAPTER
特征值问题的应用
量子力学
01
在量子力学中,特征值问题用于描述粒子的能级和波函数。例如,在求解氢原子薛定谔方程时,需要找到满足边界条件的特征值和特征向量。
特征值问题的计算方法
Gi ( A) = { z ∈ C : z − aii ≤ ∑ aij }; i = 1,L , n
j≠i
则 λ ( A) ⊂ G1 ( A) ∪ G2 ( A) ∪ L ∪ Gn ( A)
( 分解定理) Th8.1.4 谱分解定理)/*Spectral Decomposition*/ n× n n× n 对称矩阵 则存在正交 矩阵, 正交矩阵 设 A ∈ R 为对称矩阵,则存在正交矩阵Q ∈ R T 使得 Q AQ = Λ = diag ( λ1 ,L , λn ) 个特征值。 其中 λ1 ,L , λn 是 A 的n个特征值。 个特征值 定理) (极大极小定理 Th8.1.5 极大极小定理) 对称矩阵 矩阵, 设 A ∈ R n× n 为对称矩阵,且 A的特征值为 λ1 ≥ λ2 ≥ L ≥ λn
∀u0 , u0
∞
=1
设
yk = Auk −1 µk = yk ∞ yk uk =
For k=1,2,3,…
uk 和 µk均收敛,由算法知 收敛, 算法知 Auk −1 = µk uk
lim Auk −1 = lim µk lim uk
k →∞ k →∞ k →∞
Ax = λ1 x
uk
∞
µk → λ1
其中J (λi ) = diag( J1 (λi ), ,L , J k (λi )) ∈ C ni ×ni ;1 ≤ i ≤ r i
λi J j ( λi ) =
1
λi
且除了 J j (λi ) 的排列 O 次序外 J 唯一的 次序外, 是唯一的。 O 1 λi J 称作 A 的Jordan标准型 标准型
n× n
是可对角化的 存在如下分解: 是可对角化的,即 A 存在如下分解: 对角化
第八章 特征值问题
n
| x p | ¹ 0 ,因此
a p k xk
k 1, k p
k 1, k p
n
| a p k | | xk |
| xp |
从而
n
| a p k | | x p | Rp
| app | Rp
例 5
矩阵
骣 5 0.8 20 琪 A = 琪 10 1 4 琪 琪 琪 2 10i 1 桫
工程计算中,求解特征值问题 的特征对 ( , x ) 时,由于数据往往带有误差, 因此我们计算出的特征对 ( , x ) ,实际上是 扰动后的特征值问题
Ax x
xx A
的解。这里 A A E, E ( i j )
我们希望知道矩阵元素的变化对特征对的影响。 | 或j | ||的某个上界, i E || 由于我们一般只知道 因此有必要研究如何利用这样的上界,尽可能 x 准确地估计 与 、 与 x之间的差距,从 而可确定特征值问题的稳定性。 由于矩阵的特征多项式的系数是矩阵元素的连 续函数,而多项式的根都是其系数的连续函数, 因此矩阵的特征值作为特征多项式的零点都连 续地依赖于矩阵的元素。因此矩阵元素的连续 变化时,必有对应特征值的连续变化。
骣 5 0.4 20 琪 B = D- 1 AD = 琪 10 0.5 4 琪 琪 琪 4 10i 2 桫
三个行Gerschgorin圆分别收缩为:
G1¢( A) = { z ? C | z 20 | G2¢( A) = { z ? C | z 10 | G3¢( A) = { z ? C | z 10i |
i , j 1 i j
n
三、特征值的界
首先,根据矩阵 A 的Cartesian分解,有
第八章矩阵特征值
第八章矩阵特征值8.1特征值的定义在线性代数中,一个n阶方阵A的特征值(Eigenvalue)是指一个标量λ,使得下面的等式成立:Ax=λx其中x是一个非零的n维向量,被称为对应于特征值λ的特征向量(Eigenvector)。
特别地,一些情况下,我们有:AX=λX。
这是一个常见的特殊情况,被称为多重特征值(Multiple Eigenvalues)。
8.2特征值与特征向量的求解我们可以通过以下方式求解矩阵的特征值与特征向量。
1.设A是一个n阶方阵,特征值为λ,特征向量为X,我们有AX=λX。
2.将等式重写为AX–λX=0,再移项得到(A–λI)x=0。
3.构造(A–λI)矩阵,其中I是单位矩阵。
4.解方程组(A–λI)X=0,求解零空间的基础解系(基础特征向量)。
5.基础特征向量的线性组合即为所有特征向量。
8.3特征值的性质矩阵的特征值具有一些性质,包括:1.特征值的个数等于矩阵的阶数。
一个n阶矩阵A最多有n个不同的特征值。
2.特征值的乘积等于矩阵的行列式。
即特征值λ1,λ2,…,λn与矩阵A的特征多项式p(λ)=,A-λI,的系数关系为λ^n+a_{n-1}λ^(n-1)+…+a_1λ+a_0。
3.特征值的和等于矩阵的迹。
即矩阵A的特征值λ1,λ2,…,λn 满足λ1+λ2+…+λn=Tr(A),其中Tr(A)为矩阵A的迹(对角线上元素之和)。
4.特征值与行列式的关系。
矩阵A的特征值λ1,λ2,…,λn都满足,A-λI,=0,即他们是矩阵A的特征方程的根。
8.4矩阵的对角化对角化是指将一个矩阵通过相似变换,将其转化为对角矩阵的过程。
对角化的主要目的是将矩阵的运算简化为对角矩阵的运算,从而更易于求解。
一个n阶方阵可以对角化的条件是它有n个线性无关的特征向量,即A的特征向量数量等于A的阶数。
通过对角化,可以将矩阵A表示为:A=P^(-1)DP其中D是对角矩阵,P是可逆矩阵,P的列向量是A的特征向量。
第八章 特征值问题的计算方法
1
其中 B是n-1阶方阵
2为 B 的模最大特征值
二、反幂法的基本思想与算法
反幂法是求一个矩阵的模最小的特征值和对应的特征 向量的一种迭代方法(又称为反迭代法)。 设 Ax x ,则 A x
1
1
不妨假设 A的特征值为 则 A 的特征值为
1
n n1 1
i
特征多项式
( A)
pA ( ) det( I A) 的根的集合:谱集
det( I A) ( 1 ) ( 2 ) ( p ) 其中 n1 n2 np n; i j (i j )
n1 n2
np
称 ni 为i 的代数重数(简称重数);
A u0
k
1
1k
X1 y1 X 2 (
1 1 i
J2
1
) y2 X p (
k
Jp
1
1
)k y p
( J ) i / 1 1 ( J ) 0
1 k 1 i
lim
k
A u0
k
k 1
X1 y1 ( 0)
X1 y1 记 x1 X1 y1
n n
mi n rank(i I A) 为i 的几何重数。
mi ni
Def 2 设 A C ,对于矩阵 A 的特征值 i ,如果 mi ni ,则称该特征值 i 为 A 的一个半单特征值。
若 A 的所有特征值都是半单的,则称 A是非亏损的。
A是非亏损的等价条件是 A有n个线性无关的特征向量
1
将 y 和 X 如下分块:
1
y ( y , y ,, y ) n1 n2 n p
数值分析课件第8章 矩阵特征值问题计算
特征值. 特别地,如果A的一个圆盘Di是与其它圆盘分离
(即孤立圆盘),则Di中精确地包含A的一个特征值.
上页 下页
证明 只就⑴给出证明. 设λ为A的特征值,即 Ax=λx,其中x=(x1,x2,, xn)T0.
记 xk max xi x 1 i n 方程,即
0 ,考虑Ax=λx的第k个
i 1
i 1 i 1
上页
下页
定理5 设A与B为相似矩阵(即存在非奇异矩阵
P使B=P-1AP),则 ⑴ A与B有相同的特征值; ⑵ 如果y是B的特征向量,则Py是A的特征向量.
定理5说明,一个矩阵A经过相似变换,其特征 值不变. 定义2 如果实矩阵A有一个重数为k的特征值λ, 且对应于λ的A的线性无关的特征向量个数< k,则A
其中Rii(i=1,2,,m)为一阶或二阶方阵,且每个一阶
Rii是A的实特征值,每个二阶对角块Rii的两个特征值
是 A的两个共轭复特征值.
上页 下页
我们转向实Schur型的实际计算. 定义4 设A∈Rn×n为对称矩阵,对于任一非零 向量x,称 ( Ax, x ) R( x ) , ( x, x ) 为对应于向量x的瑞利(Rayleigh)商. 定理11 设A∈Rn×n为对称矩阵(其特征值次序记 为λ1≥λ2≥≥λn),则 ( Ax , x ) 1. n 1 (对任何非零x∈Rn); ( x, x ) 2. 3.
x0为Rn中任一向量,则有
x i xi ,
i 1 n
x2
n
i 1
n
2 i
0.
于是
( Ax, x ) n ( x, x )
2 i i i 1 n 2 i i 1
数值分析第8章——矩阵特征值问题计算
2
定理2: 设AR nn具有完全的特征向量系,即存在n个线性无关
的特征向量构成Rn的一组基底,则经相似变换可化A为 对角阵,即有可逆阵P,使
1
P 1 AP D
2
n
其中i为A的特征值,P的各列为相应于i的特征向量。
征向量 x1 , x2, …, xn ,即
Axi i xi (i 1,2,, n)
任取非零向量 v0 , 则可
唯一表示为 v0 a1x1 a2 x2
an xn
15
v0 a1x1 a2 x2 an xn
则
vk Akv0 Ak a1x1 a2 x2 an xn
a11k x1 a2k2 x2 ankn xn
(k 1,2,)
uk vk k
v1
2,4,1T
,
1
4, u1
1
1
v1
0.5, 1,0.25T
23
直到k=8 时的计算结果见下表
k
vk
k
1 2, 4, 1,
4
uk
0.5, 1, 0.25
2 4.5, 9, 7.75
9
0.5, 1, 0.8611
3 5.7222, 11.4444, 8.361 4 5.4621, 10.9223, 8.2306 5 5.5075, 11.0142, 8.2576
第八章 矩阵特征值问题计算
对n 阶方阵A求数 和非零向量x ,使其满足Ax=x 这样的 值称为矩阵A的特征值,非零向量 x 称为矩 阵A的与特征值 相对应的一个特征向量。
1
8.1 预备知识
定义1 设矩阵A, BR nn,若有可逆阵P,使 B P1AP
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A = H1 + iH 2 ? B C H 1 ( A - AH ) ( A A ), H + = 这里H1 = 1 都 2 2 2i
是Hermite矩阵。 如果 C = O ,则 A 是Hermite矩阵,特征值 全为实数。当 C 的元素在 0附近变化时, A的 特征值出现复数,因此矩阵 C 可用于确定矩 阵 A 的特征值的虚部变化范围。
数学系 李继根( jgli@ )
(1)的证明:
设
T A 有特征对 (λ, x) ,这里 x = ( x1,L , xn) ,则
令
n
a j k xk ≪ℓ x j , j ≪1,⋯ , n
k≪ 1 n n
| xp | = max| xj | ,则 | xp | ¹ 0,因此 j
̃ ≪ A E , E ≪(⊙ ) 的解。这里 A i j
数学系 李继根( jgli@ )
我们希望知道矩阵元素的变化对特征对的影响。 |或 ⊙ ||的某个上 E || 由于我们一般只知道 ij | 界,因此有必要研究如何利用这样的上界,尽 x ̃ x ℓ̃ 与 可能准确地估计 ℓ 与 、 之间的差 距,从而可确定特征值问题的稳定性。 由于矩阵的特征多项式的系数是矩阵元素的连 续函数,而多项式的根都是其系数的连续函 数,因此矩阵的特征值作为特征多项式的零点 都连续地依赖于矩阵的元素。因此矩阵元素的 连续变化时,必有对应特征值的连续变化。
1
数学系 李继根( jgli@ )
根据定理8,严格对角占优矩阵 征值,而
A 没有零特
| 0 ai i | ≪| ai i | ⊳ Ri , i ≪1, 2,⋯ , n
这说明矩阵
A 的特征值 ℓ 可能满足 | ℓ ai i | ℂ Ri , i ≪1, 2,⋯ , n
1/ n 1 /n (1 || B A || ) m1 n
(1)对 A 的任意特征值 ℓ i ,存在 征值 ∓ i ,使得 | ℓ i ∓ j |⊲ ○ (2)存在 1,L , n 的排列
B 的特
π(1),L , π(n),使得 | ℓ i ∓≺ ( i ) | ⊲ (2n 1)○
数学系 李继根( jgli@ )
历史上Gerschgorin定理的确是从 “严格对角占 优矩阵是非奇异的 ” 这一事实推导出来的。
数学系 李继根( jgli@ )
除了Gerschgorin区域外, Brauer发现优美的 Cassini椭圆形也可以用于估计特征值。 椭圆形 定理9 (Brauer)方阵 A = ( ai j ) C n´ n 的任意 特征值 ℓ 都位于 n( n 1) / 2 个Cassini椭圆 形的并集内,即
例 2 矩阵
(0,1,0)T , 1、 11 、 A(ε) 的
数学系 李继根( jgli@ )
二、盖尔(Gerschgorin)定理
把矩阵
A 分裂成 A = diag(a11,L , ann ) + B ? D B
A 的扰动矩阵 A(ε) ? D εB ,显然 A(0) = D, A(1) = A 我们有理由猜测,如果 ε 足够小, A(ε) 的特征 L 、a) 值将位于 A(0) 的特征值(即元素 a11、 nn
遗憾的是矩阵的特征向量一般不是矩阵元素的 连续函数,因此不一定是稳定的。
1 0 0 A(ε) = 0 1+ ε 1 ε 0 1+ ε 1+ ε、 1,特征向量为 的特征值为 1+ ε、 T (1,1/ ε , 1) - 。而 A(0) 的特征值为 和 特征向量为 (0,1,0)T 和 (1,0,0)T 。矩阵 特征向量在 ε = 0 处不连续。
数学系 李继根( jgli@ )
下述定理是特征值的这种连续性的定量分析。 定理1 (Ostrowski)设矩阵 A = ( ai j ), B = ( bi j ) 的特征值分别为 λi , μi ( i = 1, 2, L , n) 。令
δ = ( n + 2) [max(| ai j |,| bi j |)]1i, j
由此,我们可以将 Gerschgorin定理看成定理 8 的“推论” 。
数学系 李继根( jgli@ )
事实上,设矩阵 A 的特征值 Gerschgorin区域 ,则有
ℓ 不属于 A 的
| ℓ ai i | ⊳ Ri , i ≪1, 2,⋯ , n 因此矩阵 ℓ I A 严格对角占优,根据定理 8 det(ℓ I A ) 0 这与 ℓ 是 A 的特征值相矛盾。
数学系 李继根( jgli@ )
§1、特征值的估计
由于工程计算中求矩阵尤其是高阶矩阵的 精确特征值通常比较困难,而许多情况下我们 只需要知道特征值在什么范围内变化或者落在 什么区域内,例如判断方阵的幂级数是否收敛 只要看方阵的特征值的模或谱半径是否小于 1,因此特征值的估计就显得尤其必要,这方 面的理论在特征值问题中相当经典。
Ri �
j≪ 1, j i
| ai j |
类似地,可定义矩阵
A 的列盖尔圆。 列盖尔圆
数学系 李继根( jgli@ )
定理4 (Gerschgorin )对方阵 A = ( ai j ) (1)矩阵
C n´ n
A 的特征值都位于其行盖尔区域内; (2)若矩阵 A 有 m 个盖尔圆构成的并集 G 是 连通区域,并且与其余 n m 个盖尔圆均不相 交,则 G 中恰好有 A 的 m 个特征值。
数学系 李继根( jgli@ )
定理10(Schur)设 A 的特征值为 λ1 , L , λn ,则 (1) | λ1 |2 +
2 | λ | L+ n 2 || A ||F 2 || B ||F
(2) | Re( λ1 ) |2 + L (3) | Im( λ1 ) |2 + L 这里 B = 1 2 (A+
数学系 李继根( jgli@ )
例 6 矩阵
20 5 0.8 A = 4 10 1 1 2 10i
经过对角相似变换
D = diag(1,1,0.5) 后,得
5 10 4 0.4 0.5 10i
20 B = D- 1AD = 4 2
数学系 李继根( jgli@ )
数学系 李继根( jgli@ )
第八章 特征值问题
数学系 李继根( jgli@ )
特征值问题是线性代数的研究重点,在理论和 特征值问题 应用上都非常重要。 理论上 ,矩阵的特征值就是线性算子的 谱。 应用上,常微分方程( ODE)、偏微分方程 (PDE)中许多问题都可以转化为矩阵特征值 问题。矩阵特征值问题的算法也是高性能计算 机的主要计算任务之一。可大致分为求解稠密、 中小型矩阵全部特征值的变换类方法和求解稀 疏、大型矩阵部分特征值的投影类方法。
+ | Re( λn ) |2 + | Im( λn ) |
2
|| C ||
2 F
H AH ), C = 1 A ) ( A 2
。
并且当且仅当 A 是正规矩阵时,等号成立。
数学系 李继根( jgli@ )
(1)的证明:
A 的Schur分解为 A= UTUH ,上三角阵 T T = ( tr s ), ( r、s = 1, 2, L , n) 的主对角元就是 矩阵 A 的特征值。所以根据 F-范数的酉不变
例 5 矩阵
20 A= 4 1
5 10 2
0.8 1 10i
的三个行 Gerschgorin圆分别是:
G1( A) = {z ? C | z G2( A) = {z ? C | z G3( A) = {z ? C | z
20| 5.8} 10| 5} 10i | 3}
数学系 李继根( jgli@ )
C n´ n ,如果
| ai i | Ri , i ≪1, 2,⋯ , n 则称矩阵 A 为按行对角占优矩阵。如果 按行对角占优矩阵 | ai i | ⊳ Ri , i ≪1, 2,⋯ , n
则称矩阵
A 为按行严格对角占优矩阵。 按行严格对角占优矩阵
数学系 李继根( jgli@ )
构造 的某些小邻域内。
数学系 李继根( jgli@ )
定义3 对方阵 A = ( ai j )
C n´ n ,称
Gi ( A) �{ z C | z ai i | ℂ Ri }, i ≪1, ⋯ , n
为矩阵 A 的行盖尔(Gerschgorin)圆。称并 )圆 n 集 ∪ Gi ( A) 为矩阵 A 的行盖尔(Gerschgorin ) i≪ 1 区域。这里 区域 n
1, k p k≪
| ℓ a pp | | x p | ≪
a p k xk ℂ
1, k p k≪
| a p k | | xk |
ℂ | x p |
从而
k≪ 1, k p
n
| apk | ≪ | x p | R p
| ℓ app | ℂRp
数学系 李继根( jgli@ )
因为相似变换不改变特征值,为了得到特征值 的更加准确的估计, Gerschgorin发现可以将矩 阵 A 变换为其相似矩阵 B = D- 1 AD ,以减少 Gerschgorin圆的半径,达到隔离Gerschgorin 圆的目的。为计算方便,常常取 D为对角矩阵 Wilkson在名著《代数特征值问题》中,先将矩 阵变换成 Jordan标准型,再用 Gerschgorin定理 和对角相似变换,对不同特征值结构的特征值 问题进行了细致的扰动分析。
n
=
i= 1 n
λi + λi
2
2
+
r s
t r s + ts r
2
=
i= 1 n
| Re( λi ) |2 +
r< s
| tr s | 2 2