第八章 特征值问题
特征值计算方法
y2
=
Au1
=
⎡151 / 13⎤
⎢ ⎣
25
/
13
⎥ ⎦
=
⎡11.6154⎤
⎢ ⎣
1.9231
⎥ ⎦
,
u2
=
y2
max( y2 )
=
⎡1⎤ ⎢⎣25 /151⎥⎦
=
⎡1⎤ ⎢⎣0.1656⎥⎦
μ2 = max( y2 ) = 151/13 = 11.6154 --------------------------------------------(6 分)
⎢⎣ 0
0 1⎥⎦ ⎢⎣ 0
0
1⎥⎦
⎡2.236068
A1
=
R1 A0 R1T
=
⎢ ⎢
0
⎢⎣0.525731
0 −2.236068 0.850651
0.525731⎤ 0.850651⎥⎥ ,-------------------------(10 分)
3 ⎥⎦
⎡0.850651
H1T
=
H
T 0
R1T
五、(12 分)
解:(1)因为 w = x + v = x + Hx = 2x − 2(uT x)u ,则
wT u = [2 xT − 2(uT x)uT ]u = 2 xT u − 2(uT x)uT u = 0 。----------------------------(3 分)
⎛0⎞
(2)由 Hb = (0
=
IR1T
=
⎢⎢0.525731
⎢⎣ 0
−0.525731 0.850651
0
0⎤ 0⎥⎥ (列存放相应的特征向量), 1⎥⎦
第八章矩阵的特征值与特征向量的数值解法
第八章 矩阵的特征值与特征向量的数值解法某些工程计算涉及到矩阵的特征值与特征向量的求解。
如果从原始矩阵出发,先求出特征多项式,再求特征多项式的根,在理论上是无可非议的。
但一般不用这种方法,因为了这种算法往往不稳定。
常用的方法是迭代法或变换法。
本章介绍求解特征值与特征向量的一些方法。
§1 乘幂法乘幂法是通过求矩阵的特征向量来求特征值的一种迭代法,它适用于求矩阵的按模最大的特征值及对应的特征向量。
定理8·1 设矩阵A n ×n 有n 个线性无关的特征向量X i (i=1,2,…,n ),其对应的特征值λi (i =1,2,…,n)满足|λ1|〉|λ2|≧…≧|λn |则对任何n 维非零初始向量Z 0,构造Z k = AZ k —1(k=1,11()lim()k j k k jZ Z λ→∞-= (8·1)其中(Z k )j 表示向量Z k 的第j 个分量。
证明 : 只就λi 是实数的情况证明如下. 因为A 有n 个线性无关的特征向量X i ,(i = 1,2,…,n 可用X i (i = 1,2,…,n)线性表示,即Z 0=α1X 1 + α2X 2 +用A 构造向量序列{Z k }其中 21021010,,k k k Z AZ Z AZ A Z Z AZ A Z -=====, (8.2)由矩阵特征值定义知AX i =λi X i (i=1,2, …,n),故0112211122211121k k k k k n nk k k n n nknki i i i Z A Z A X A X A X X X X X X ααααλαλαλλλααλ===+++=+++⎡⎤⎛⎫⎢⎥=+⎪⎢⎥⎝⎭⎣⎦∑ (8。
3)同理有11111121k nk i k i i i Z X X λλααλ---=⎡⎤⎛⎫⎢⎥=+ ⎪⎢⎥⎝⎭⎣⎦∑ (8.4) 将(8。
3)与(8。
4)所得Z k 及Z k —1的第j 个分量相除,设α1≠0,并且注意到 |λi |<|λ1|(i=1,2,…,n)得11()lim()k j k k jZ Z λ→∞-= 证毕定理8·1的证明过程实际上是给出了矩阵的按模最大特征值的计算方法:1) 先任取一非零向量Z 0,一般可取Z 0=(1,1,1)T ; 2) 按(8.2)式计算Z k =AZ k-1(k=1,2,…); 3) 当K 足够大时,即可求出11()()k j k jZ Z λ-=,为了减少λ1对于所选的第j 个分量的依赖性,还可用各个分量比的平均值来代替,即111()()nk jjk jZ Z nλ=-=∑关于对应于λ1的特征向量的计算:由(8。
第8章特征值问题的计算方法
第8章特征值问题的计算方法第8章特征值问题的计算方法本章中讨论求n 阶实矩阵的特征值的数值方法。
8.1 基本概念与性质设A 是n 阶方阵,若数λ和非0向量x 满足:x Ax λ=则λ称为A 的特征值,x 称为A 的对应于λ的特征向量。
A 的特征值的全体()A λ称为A 的谱集。
n 次多项式方程()0det =?A I λ称为A 的特征方程,()A I ?λdet 称为A 的特征多项式。
8.2 幂法矩阵的模最大的特征值称为主特征值。
幂法可用于求矩阵的主特征值及其相应的特征向量。
设n 阶方阵A 有有n 个线性无关的特征向量。
设j j j x Ax λ=,j=1..n,其中j λ是A 的特征值,设A 的主特征值1λ是实数且是单重,n λλλ≥≥>L 21.特征向量乘以非0常数仍然是特征向量,故可增加约束,只求范数为1的向量。
设v 0是任意一个非0向量,则v 0可惟一地表示成n 个特征向量的线性组合,设∑==ni i i x v 10α,假设01≠α,令01v A Av v k k k ==?,则111211111~x x x x v k n i i ki i k ni i k i i k αλλλααλλα+==∑∑==,∞→k ,当k>>1时,11?≈k k v v λ,11λ→?k k v v ,1x v v k k →。
为避免计算机出现上溢或下溢现象,在每步计算中将v k 规格化。
111??≈=k k k v Av u λ,k k k m u v =,,k=1,2,…… 则 1x v k →,()()()111111,,,≈=k k k k k k v v v Av v u λ())1111,,≈k k k k v v v u λ若取2kk u m =(k=0,1,2,…),则()11,?≈k k v u λ,简化了运算。
算法8.1功能:用幂法求矩阵主特征值。
形参:阶数n,矩阵A,特征向量v,误差限e,迭代次数上限m ,主特征值L. 条件:计算前v 是初始近似值,非零。
特征值数值解法
第八章 矩阵特征值问题的数值解法矩阵特征值总是有广泛的应用背景. 例如在科学技术领域中,动力系统和结构系统中的振动问题、电力系统的静态稳定分析上、工程设计中的某些临界值的确定等,都归结为矩阵特征值问题. 本章介绍n 阶实矩阵nn RA ⨯∈的特征值与特征向量的求解方法,即求参数λ和相应的非零向量x ,使Ax=λx ,即(A-λI )x =0,并称λ为A 的特征值,x 为相应于λ的特征向量.而0)(=-x I A λ有非零解的充分必要条件是,0)(det )(111=++++=-=--n n n n a a a I A λλλλλϕ其中),,2,1(n i a i =为常数. 由于上面方程是λ的n 次多项式,因此它有n 个根(实根或复根). 除特殊情况外(如n=2,3或A 为上(下)三角矩阵,一般不直接求解,原因是这样的算法往往不稳定.在计算上常用的方法是乘幂法与反幂法(迭代法)和相似变换方法(变换法). 本章只介绍求矩阵特征值与特征向量的这两种基本方法.第一节 乘幂法及反幂法一、乘幂法 设矩阵nn RA ⨯∈的n 个特征值满足0n 321≥≥≥≥λλλλ (1.1)且有相应的n 个线性无关的特征向量.,,21n x x x 乘幂法是计算矩阵按模最大特征值及相应特征向量的迭代法,其基本思想是对任给的非零向量,0n R z ∈用矩阵A 连续左乘,构造迭代过程,具体过程是: 由假设知∑=≠=ni ii x z 110),0(αα用A 左乘两边得∑∑=====ni i i i ni i i x Ax Az z 1101.λαα再用A 左乘上式,得∑====ni i i x z A Az z 1210212.λα一直这样做下去,一般地有).,2,1( 111111101 =⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫⎝⎛+====∑∑==-k x x x z A Az z n i i ki i kni ik i kk k λλααλλα我们只讨论21λλ>的情况,对其他情况的讨论可根据参考文献[2]参阅有关资料.由(1.2)知,lim111x z kkk αλ=∞→ (1.3)于是对充分大的k 有.111x z kk αλ≈ (1.4)(1.3)表明序列⎭⎬⎫⎩⎨⎧k k z 1λ越来直接近A 的相应于1λ的特征向理(11,0x ≠α是A 的相应于1λ的特征向量的近似向量,其收敛速度取决于比值12λλ. 下面我们来计算1λ. 由于,1111111011⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛+===+=+++∑i k in i i k k k k x x z A Az z λλααλ当k 充分大时, 11111x z k k αλ++≈,于是可知。
《特征值问题》课件
在多元统计分析中,特征值问题用于确定数据集的主成分和方差解释率。通过计算数据矩阵的特征值和特征向量,可以提取数据的主要特征并进行降维处理。
金融风险管理
在金融风险管理中,特征值问题用于确定金融市场的系统风险和脆弱性。通过分析金融数据的特征值和特征向量,可以评估市场的稳定性和潜在的系统性风险。
04
CHAPTER
特征值问题的求解算法
直接法是求解特征值问题的一种基本方法,它通过直接计算矩阵的特征值和特征向量来得到问题的解。这种方法适用于小规模矩阵,但对于大规模矩阵,由于计算量较大,可能会导致计算效率低下。
具体步骤包括:计算矩阵的特征多项式、求解特征多项式的根、验证根是否为特征值等。
迭代法是一种求解特征值问题的间接方法,它通过迭代过程不断逼近真实特征值,最终得到近似解。这种方法适用于大规模矩阵,但需要选择合适的迭代初值和收敛准则。
01
特征值
矩阵的特征值是矩阵的一个重要属性,它描述了矩阵对向量进行变换时所产生的效果。
02
特征向量
与特征值相对应的向量,当矩阵作用于该向量时,结果仍是该向量或与其成比例的向量。
通过矩阵的运算和变换,求出矩阵的特征值和特征向量。
代数法
迭代法
数值方法
软件包
通过不断迭代逼近,求解特征值和特征向量,这种方法适用于大型稀疏矩阵。
采用数值计算方法求解特征值问题,如QR算法、Jacobi方法等。
有许多数学软件包可以用来求解特征值问题,如MATLAB、NumPy等。
03
CHAPTER
特征值问题的应用
量子力学
01
在量子力学中,特征值问题用于描述粒子的能级和波函数。例如,在求解氢原子薛定谔方程时,需要找到满足边界条件的特征值和特征向量。
特征值问题的计算方法
Gi ( A) = { z ∈ C : z − aii ≤ ∑ aij }; i = 1,L , n
j≠i
则 λ ( A) ⊂ G1 ( A) ∪ G2 ( A) ∪ L ∪ Gn ( A)
( 分解定理) Th8.1.4 谱分解定理)/*Spectral Decomposition*/ n× n n× n 对称矩阵 则存在正交 矩阵, 正交矩阵 设 A ∈ R 为对称矩阵,则存在正交矩阵Q ∈ R T 使得 Q AQ = Λ = diag ( λ1 ,L , λn ) 个特征值。 其中 λ1 ,L , λn 是 A 的n个特征值。 个特征值 定理) (极大极小定理 Th8.1.5 极大极小定理) 对称矩阵 矩阵, 设 A ∈ R n× n 为对称矩阵,且 A的特征值为 λ1 ≥ λ2 ≥ L ≥ λn
∀u0 , u0
∞
=1
设
yk = Auk −1 µk = yk ∞ yk uk =
For k=1,2,3,…
uk 和 µk均收敛,由算法知 收敛, 算法知 Auk −1 = µk uk
lim Auk −1 = lim µk lim uk
k →∞ k →∞ k →∞
Ax = λ1 x
uk
∞
µk → λ1
其中J (λi ) = diag( J1 (λi ), ,L , J k (λi )) ∈ C ni ×ni ;1 ≤ i ≤ r i
λi J j ( λi ) =
1
λi
且除了 J j (λi ) 的排列 O 次序外 J 唯一的 次序外, 是唯一的。 O 1 λi J 称作 A 的Jordan标准型 标准型
n× n
是可对角化的 存在如下分解: 是可对角化的,即 A 存在如下分解: 对角化
第八章矩阵特征值
第八章矩阵特征值8.1特征值的定义在线性代数中,一个n阶方阵A的特征值(Eigenvalue)是指一个标量λ,使得下面的等式成立:Ax=λx其中x是一个非零的n维向量,被称为对应于特征值λ的特征向量(Eigenvector)。
特别地,一些情况下,我们有:AX=λX。
这是一个常见的特殊情况,被称为多重特征值(Multiple Eigenvalues)。
8.2特征值与特征向量的求解我们可以通过以下方式求解矩阵的特征值与特征向量。
1.设A是一个n阶方阵,特征值为λ,特征向量为X,我们有AX=λX。
2.将等式重写为AX–λX=0,再移项得到(A–λI)x=0。
3.构造(A–λI)矩阵,其中I是单位矩阵。
4.解方程组(A–λI)X=0,求解零空间的基础解系(基础特征向量)。
5.基础特征向量的线性组合即为所有特征向量。
8.3特征值的性质矩阵的特征值具有一些性质,包括:1.特征值的个数等于矩阵的阶数。
一个n阶矩阵A最多有n个不同的特征值。
2.特征值的乘积等于矩阵的行列式。
即特征值λ1,λ2,…,λn与矩阵A的特征多项式p(λ)=,A-λI,的系数关系为λ^n+a_{n-1}λ^(n-1)+…+a_1λ+a_0。
3.特征值的和等于矩阵的迹。
即矩阵A的特征值λ1,λ2,…,λn 满足λ1+λ2+…+λn=Tr(A),其中Tr(A)为矩阵A的迹(对角线上元素之和)。
4.特征值与行列式的关系。
矩阵A的特征值λ1,λ2,…,λn都满足,A-λI,=0,即他们是矩阵A的特征方程的根。
8.4矩阵的对角化对角化是指将一个矩阵通过相似变换,将其转化为对角矩阵的过程。
对角化的主要目的是将矩阵的运算简化为对角矩阵的运算,从而更易于求解。
一个n阶方阵可以对角化的条件是它有n个线性无关的特征向量,即A的特征向量数量等于A的阶数。
通过对角化,可以将矩阵A表示为:A=P^(-1)DP其中D是对角矩阵,P是可逆矩阵,P的列向量是A的特征向量。
第8章 特征值问题的计算方法
设 uk 和 k均收敛,由算法知 Auk1 k uk
lim
k
Auk 1
lim
k
k
lim
k
uk
Ax 1x k 1
uk 1
幂法可以计算矩阵的模最大 的特征值和对应的特征向量
例1:利用幂法求下列矩阵A 的模 2 1 0
最大的特征值及相应的特征向量. A 1 3 1
u0 1x1 2 x2 n xn;i C
n
n
Aku0
j Ak x j
j
k j
x
j
j
n 2
j
(
j 1
)k )x j )
Ak u0
1k
(1x1
n j2
j
(
j 1
)k
)
x
j
)
1x1(k
)
说明:当k充分大时, 1的一个近似特征向量为
uk
Ak u0
1k
特征向量可以相差一个倍数
因为向量 uk
Ak u0
1k
中含有未知量 1,实际不能计算
但我们关心的仅是 uk 的方向,故作如下处理:
令 uk
Ak u0
k
Ak u0
其中 k为 Ak u0 的模最大分量
1k (1x1
3 4.92
u3 y3 3 (0.3659 0.8537 1)T
Step4 y4 Au3 (1.5854 3.9268
4.8537)T
4 4.8537 u4 y4 4 (0.3266 0.8090 1)T
八矩阵特征值问题的数值解法PPT课件
(3)设 A 为 非 奇 异 0且 阵 1为 , A1特 那 征
即
A1x1x.
预备知识
(4) 设A与B为相似矩阵(即奇存异在矩P非 使 阵
BP1AP) ,A则 与B有 相 同 的 特 征 值 ;
(5) ARnn可对角化,即存 异在 矩非 P阵 使奇
1
P1AP
2
...
n
的充要条件 A具 是有n个线性无关的特征 . 向量
1
1
i 2
1
Байду номын сангаас
i 1 1
k
幂方法
lim i
k 1
0 则 k充分X(大 k)a1 时 1 kv1。
X(k) a1 1kv1 此式说明了什么?
当k足够大时,X(k)近似等于主特征向量
设v1 0,为求 1,观察:
(X(k))j (X(k1))j
1
a1(v1)j in2ai(1i )k(vi)j a1(v1)j in2ai(1i )k1(vi)j
( 2 ) 按 X ( k ) A ( k 1 ) X A k X ( 0 ) 计 X ( k ) 算
(3)如 果 k从 某 个 数 后(分 (XX( ( kk量 ) 1) ))jj比 c( 常 数 )
则 取 1 c,而X(k)就 是与 1对 应 的 一 个 近量 似。 特
幂方法说明
几点说明: 1)如果x (0的) 选取恰恰使得a1=0,幂法计算仍能进行。
A={{2,-1,0},{0,2,-1},{0,-1,2}};
v0={0.5,0.5,1.1};
Do[v1=A.v0;Print[k," ","v",k,"=",v1," ","v",k,"与 v",k-1,"的第1个分量比值是",v1[[1]]/v0[[1]]," ","v",k,"与v",k-1,"的第2个分量比值是 ",v1[[2]]/v0[[2]]];v0=v1/Max[Abs[v1]],{k,1,35}]
第8章_矩阵特征值问题计算1
其中Q为正交矩阵, R为上三角阵. 且当R具有正对角元 素时, 分解唯一.
上页 下页
证明 (1)由定理29可得. (2) 由设及定理29存在初等反射阵H1, H2, , Hn-1 使
r11 r12 r1n r22 r2 n H n 1 H 2 H 1 A R. r nn 记QT=Hn-1H2H1, 则上式为 QTA=R, 即 A=QR, 其中Q为正交矩阵, R为上三角阵.
上页
下页
5.7.3 矩阵的QR分解 下面讨论用正交矩阵来约化矩阵,可得到下述结果. 设ARm×n且为非零矩阵,则存在初等反射矩阵 H1, H2, , Hs使
H s H 2 H 1 A A( s 1) (上梯形).
设有
a11 a12 a1n a21 a22 a2 n (1) A A (a1 a2 an ) ( 按列分块). a a a mn m1 m 2
上页 下页
下面考察初等反射阵的几何意义. 考虑以w为法 向量且过原点O的超平面S: wTx=0. 设任意向量vRn, 则v=x+y, 其中xS, yS⊥. 于是
Hx=(I-2wwT)x=x-2wwTx=x.
对于yS⊥, 易知Hy=-y,
w x
v
y
从而对任意向量vRn, 总有
Hv=x-y=v′,
(2) H是正交矩阵, 即H-1=H. (3) 设A为对称矩阵, 那么A1=H-1AH=HAH亦是对
称矩阵. 证明 只证H的正交性, 其它显然. H T H H 2 ( I 2wwT )( I 2wwT )
I 4wwT 4w( w T w )w T I . uuT 设向量u≠0, 则显然 H I 2 2 是一个初等反射阵. u2
数值分析第8章——矩阵特征值问题计算
2
定理2: 设AR nn具有完全的特征向量系,即存在n个线性无关
的特征向量构成Rn的一组基底,则经相似变换可化A为 对角阵,即有可逆阵P,使
1
P 1 AP D
2
n
其中i为A的特征值,P的各列为相应于i的特征向量。
征向量 x1 , x2, …, xn ,即
Axi i xi (i 1,2,, n)
任取非零向量 v0 , 则可
唯一表示为 v0 a1x1 a2 x2
an xn
15
v0 a1x1 a2 x2 an xn
则
vk Akv0 Ak a1x1 a2 x2 an xn
a11k x1 a2k2 x2 ankn xn
(k 1,2,)
uk vk k
v1
2,4,1T
,
1
4, u1
1
1
v1
0.5, 1,0.25T
23
直到k=8 时的计算结果见下表
k
vk
k
1 2, 4, 1,
4
uk
0.5, 1, 0.25
2 4.5, 9, 7.75
9
0.5, 1, 0.8611
3 5.7222, 11.4444, 8.361 4 5.4621, 10.9223, 8.2306 5 5.5075, 11.0142, 8.2576
第八章 矩阵特征值问题计算
对n 阶方阵A求数 和非零向量x ,使其满足Ax=x 这样的 值称为矩阵A的特征值,非零向量 x 称为矩 阵A的与特征值 相对应的一个特征向量。
1
8.1 预备知识
定义1 设矩阵A, BR nn,若有可逆阵P,使 B P1AP
矩阵的特征值问题
{( xi , yi ), i 1, 2, , m}
A 有 n 个线性无关的
特征向量
x1 , x2
xn
, 使得
Axi xi
且假设相应的特征值满足条件
(i 1 , 2,
n)
(8.1)
|1 | |2 |
|n |
第八章 矩阵的特征值问题
8.1 幂法和反幂法 8.2 对称矩阵的雅可比方法
8.3 QR方法
8.4 求实对称三对角阵特征值的二分法
引言
矩阵特征值问题是数值代数的一个重要研究课题. 在自然科学和工程设计中 的许多问题, 如电磁振荡、桥梁或建筑物的振动、机械振动、飞机机翼的振 动等, 均可归结为矩阵的特征值问题.
矩阵特征值问题的计算方法本质上都是迭代法.
引言
矩阵特征值问题按照所求特征值个数的不同可分为部分特征值问题和 全部特征值问题. 针对所求特征值个数的不同,分别给出有效的求解方法. (1)部分特征值的求解:幂法和反幂法. 特点:利用矩阵产生迭代向量, 而不破坏原始矩阵. (2)全部特征值的求解:雅可比方法、QR方法和求解三对角矩阵的二 分法. 特点:对矩阵逐次进行特殊的相似变换,从而破坏了原始矩阵.
(vk )i 1 ( x1 )i (εk )i 1 1 (vk 1 )i 1 ( x1 )i (εk 1 )i
(k )
(8.8)
这说明两相邻迭代向量分量的比值收敛到主特征值 1 .
(v k )i 1 的收敛速度由比值 此外, ( v k 1 ) i
r | 2 1 |
=(1 , 2 ,
n ) T ,
用 max 表示向量
《特征值问题》课件
求解特征值与特征向量
1
幂法
通过反复迭代,逐渐逼近矩阵的特征值和特征向量。
2
反特征向量。
3
QR分解法
将矩阵分解为正交矩阵和上三角矩阵的乘积,通过逐步迭代求解。
特征值问题
特征值问题是矩阵理论中的重要概念。本课件将介绍特征值问题的定义、特 征向量和求解方法,以及其在机器学习和图像处理中的应用。
特征值问题简介
特征值问题是矩阵理论中的一个重要概念,涉及到矩阵的特征值和特征向量。 了解特征值问题的定义和求解方法对于理解矩阵方程的解法也很有帮助。
特征值与特征向量
应用案例
机器学习
特征值问题在机器学习中广泛应用,如主成 分分析、特征选择和维度降低。
图像处理
通过分析图像的特征值和特征向量,可以实 现图像的压缩、增强和识别等操作。
总结与展望
重要性与价值
特征值问题在科学和工程领域中具有重要的应用 价值,为解决实际问题提供了有力支持。
研究现状与未来
特征值问题的研究仍在不断发展,未来有望提出 更加高效和精确的求解方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n
| x p | ¹ 0 ,因此
a p k xk
k 1, k p
k 1, k p
n
| a p k | | xk |
| xp |
从而
n
| a p k | | x p | Rp
| app | Rp
例 5
矩阵
骣 5 0.8 20 琪 A = 琪 10 1 4 琪 琪 琪 2 10i 1 桫
工程计算中,求解特征值问题 的特征对 ( , x ) 时,由于数据往往带有误差, 因此我们计算出的特征对 ( , x ) ,实际上是 扰动后的特征值问题
Ax x
xx A
的解。这里 A A E, E ( i j )
我们希望知道矩阵元素的变化对特征对的影响。 | 或j | ||的某个上界, i E || 由于我们一般只知道 因此有必要研究如何利用这样的上界,尽可能 x 准确地估计 与 、 与 x之间的差距,从 而可确定特征值问题的稳定性。 由于矩阵的特征多项式的系数是矩阵元素的连 续函数,而多项式的根都是其系数的连续函数, 因此矩阵的特征值作为特征多项式的零点都连 续地依赖于矩阵的元素。因此矩阵元素的连续 变化时,必有对应特征值的连续变化。
骣 5 0.4 20 琪 B = D- 1 AD = 琪 10 0.5 4 琪 琪 琪 4 10i 2 桫
三个行Gerschgorin圆分别收缩为:
G1¢( A) = { z ? C | z 20 | G2¢( A) = { z ? C | z 10 | G3¢( A) = { z ? C | z 10i |
i , j 1 i j
n
三、特征值的界
首先,根据矩阵 A 的Cartesian分解,有
A = H1 + iH2 ? B C 1 这里H1 = 1 ( A + AH ), H2 = 2i ( A- AH )都 2
是Hermite矩阵。 如果 C = O ,则 A 是Hermite矩阵,特征值 全为实数。当 C 的元素在0附近变化时, 的 A 特征值出现复数,因此矩阵 C 可用于确定矩 阵 A 的特征值的虚部变化范围。
=
邋
i= 1 n
n
λi + λi 2
i
2
+
r s
t r s + ts r
2
= ³
邋| Re( λ ) | + å | Re( λ ) |
2 i= 1 n 2 i i= 1
| tr s | 2 2
2
r< s
在上述证明中,当且仅当 A 是正规矩阵时, 上三角阵 T 为对角矩阵,即
tr s = 0 ( r < s)
按推论11所得特征值的变化范围为带型区域:
{z | z| # 60}
z I{ |Re( )| z
60,|Im( )| 30} z
这个结果显然比相应的Gerschgorin区域差。
§2、多项式特征值问题
多项式特征值问题在Matlab中可分别利用 Matlab函数eig、eigs、Polyeig等来解决。所涉 及的算法主要还是变换类算法,核心思想就是 通过各类变换尤其是相似变换将高阶特征值问 题转化为低阶特征值问题,例如QEP可以线性 化为GEP再转化为SEP来求解。因此这些函数 比较适合于稠密、中小型的矩阵。
5.4} 4.5} 6}
Gerschgorin定理与对角占优矩阵有密切关系。
定义7 对方阵 A = (ai j )
C n´ n ,如果
| ai i | Ri , i 1, 2,, n | ai i | Ri , i 1, 2,, n
则称矩阵 A 为按行对角占优矩阵。如果
则称矩阵 A 为按行严格对角占优矩阵。
下述定理是特征值的这种连续性的定量分析。 定理1 (Ostrowski)设矩阵 A = (ai j ), B = (bi j ) 的特征值分别为 λi , μi ( i = 1, 2, L , n) 。令
δ = ( n + 2) 鬃 [max(| ai j |,| bi j |)]1i, j 1/ n
Ri
j 1, j i
| ai j |
类似地,可定义矩阵 A 的列盖尔圆。
定理4 (Gerschgorin)对方阵 A = (ai j )
C
n´ n
(1)矩阵 A 的特征值都位于其行盖尔区域内;
(2)若矩阵 A 有 m 个盖尔圆构成的并集 G 是 连通区域,并且与其余 n m 个盖尔圆均不相 交,则 G 中恰好有 A 的 m 个特征值。
的三个行Gerschgorin圆分别是:
G1 ( A) = {z ? C | z 20 | G2 ( A) = {z ? C | z 10 | G3 ( A) = {z ? C | z 10i |
5.8} 5} 3}
因为相似变换不改变特征值,为了得到特征值 的更加准确的估计,Gerschgorin发现可以将矩 阵 A 变换为其相似矩阵 B = D- 1 AD ,以减少 Gerschgorin圆的半径,达到隔离Gerschgorin 圆的目的。为计算方便,常常取 D为对角矩阵
的某些小邻域内。 构造 A 的扰动矩阵 A( ε ) ?
定义3 对方阵 A = (ai j )
C n´ n ,称
Gi ( A) { z C | z ai i | Ri }, i 1, , n
为矩阵 A 的行盖尔(Gerschgorin)圆。称并 n 集 Gi ( A) 为矩阵 A 的行盖尔(Gerschgorin) i 1 区域。这里 n
第八章
特征值问题
特征值问题是线性代数的研究重点,在理论和应 用上都非常重要。 理论上 ,矩阵的特征值就是线性算子的谱。因此 可以从泛函分析里找到理论的支撑和生长点。 应用上,常微分方程(ODE)和偏微分方程(PDE)中 许多问题都可以转化为矩阵特征值问题。 矩阵特征值问题的算法也是高性能计算机的主要 计算任务之一。可大致分为求解稠密、中小型矩 阵全部特征值的变换类方法和求解稀疏、大型矩 阵部分特征值的投影类方法。
定理8 (Levy--Desplanques) 严格对角占优矩阵是可逆矩阵。
证明:令 D diag(a11 ,, ann ) ,则矩阵
BID A
的元素
1
i j 0, bi j ai j / ai i , i j 1 因此 || B || 1 ,所以矩阵 I B D A 可逆,即矩阵 A 可逆。
定理10(Schur)设 A 的特征值为 λ1 , L , λn ,则
(1) | λ
1
| + L + | λn |
2
2
|| A ||
2 F
(2) | Re( λ
) |2 + L + | Re( λn ) |2 1 ) |2 + L + | Im( λn ) |2 1
|| B ||2 F || C ||2 F
一、从 矩阵的视角看特征值问题
因此等号都成立。
推论11(Hirsch)对 A 的任意特征值 λ ,有
(1) | λ |
W n max | ai j |
1#i , j n
n (2) | Re( λ ) | W max | ai j + a j i | 2 1#i , j n n (3) | Im( λ ) | W max | ai j + a j i | 2 1#i , j n
根据定理8,严格对角占优矩阵 A 没有零特 征值,而
| 0 ai i | | ai i | Ri , i 1, 2,, n
这说明矩阵 A 的特征值 可能满足
| ai i | Ri , i 1, 2,, n
由此,我们可以将Gerschgorin定理看成定理8 的“推论” 。
骣 0 1 0 琪 A( ε ) = 琪 1 + ε 1 0 琪 琪 琪 0 1+ ε ε 桫 的特征值为 1 + ε、+ ε、 ,特征向量为 (0,1,0)T 1 1 和 (1,1 / ε, - 1)T。而 A(0) 的特征值为 1、、, 11 特征向量为 (0,1,0)T 和 (1,0,0)T。矩阵 A( ε ) 的 特征向量在 ε = 0 处不连续。
(1)的证明:
| λ| ?
2
å
n
| λi |
2
|| A ||
2 F
=
2
i= 1
邋
n
n
| ai j |
2
W n ( max | ai j |)
2 1#i , j n
i= 1 j = 1
因此
| λ| £
|| A || F W n max | ai j |
1#i , j n
例 12
矩阵
骣 5 0.8 20 琪 A = 琪 10 1 4 琪 琪 琪 2 10i 1 桫
§1、特征值的估计
由于工程计算中求矩阵尤其是高阶矩阵的 精确特征值通常比较困难,而许多情况下我们 只需要知道特征值在什么范围内变化或者落在 什么区域内,例如判断方阵的幂级数是否收敛 只要看方阵的特征值的模或谱半径是否小于1, 因此特征值的估计就显得尤其必要,这方面的 理论在特征值问题中相当经典。
一、从特征值问题的稳定性说起
例 2
矩阵
二、盖尔(Gerschgorin)定理
把矩阵 A 分裂成
A = diag(a11 , L , ann ) + B ? D B
D εB ,显然 A(0) = D, A(1) = A 我们有理由猜测,如果 ε 足够小,A( ε ) 的特征 L 值将位于 A( 0 ) 的特征值(即元素 a11、 、ann )