矩阵特征值计算
第章矩阵特征值的计算
的特征向量的近似值。
规范化乘幂法
令max(x)表示向量x分量中绝对值最大者。即如果有某i0,使
xi0
max
1 i n
xi
则
max (x) = xi
对任取初始向量x(0),记
y(0) x(0) max( x(0) )
则
x(1) Ay(0)
一般地,若已知x(k),称公式
y(k ) x(k ) max( x(k ) )
2
S sin sin 2
2C
(4)
aip aiq
aipC aiq S a pi aip s aiqC aqi
a pp a ppC 2 2a pqC S aqq S 2 aqq a pp S 2 2a pqC S aqqC 2 a pq (a pp aqq )C S a pq (C 2 S 2 ) aqp
它们之间有如下的关系:
ai(pk )
a(k ip
1)
cos
a(k iq
1)
sin
a(k) pi
ai(qk )
ai(pk1) sin
a(k iq
1)
cos
a(k qi
)
i p,q
aaq((pqkkp))源自a(k 1) ppa(k 1) pp
cos2 sin2
2a
(k 1) pq
sin
cos
2a
然后对j = 1, 2, …, n 解方程
x (k2) j
px j (k 1)
qx j(k )
0
求出p 、q 后,由公式
1
p 2
i
q
p
2
2
2
p 2
i
第8章矩阵特征值计算
(2) 如果 A∈Rn×n 有 m 个(m≤n)不同的特征值 λ1 ,λ2 ,…,λm , 则对应的特征向 量 x1 ,x2 ,…xm 线性无关.
5
数值分析
第8章 矩阵特征值计算
定理 7(对称矩阵的正交约化) 设 A∈Rn×n 为对称矩阵,则 (1) A 的特征值均为实数; (2) A 有 n 个线性无关的特征向量; (3) 存在一个正交矩阵 P 使得
定理 8 (Gerschgorin 圆盘定理) (1) 设 A=(aij)n×n ,则的每一个特征值必属于下属某个圆盘之中
n
| aii | ri
| aij |
j 1, j i
或者说, A 的特征值都在复平面上 n 个圆盘的并集中. (2) 如果 A 有 m 个圆盘组成一个连通的并集 S, 且 S 与余下 n-m 个圆盘 是分
uk
vk
k
vk1 Auk
if
vk1 vk
输出vk 1和k
26
数例值分1析:利用幂法求下列矩阵A 的模 第82章 矩1阵特0征值计算
最大的特征值及相应的特征向量. A 1 3 1
(取初始向量为 v0 (1 1 1)T )
0 1 4
解:Step0
0 u0
v1
vv00
1
(1
0
Au0 (3
1
10
数值分析
D2 :
第8章 矩阵特征值计算
n
| | r2 | a2 j | 2 j 1 j2
D3 :
n
| 4 | r3 | a3 j | 2 j 1 j3
由上述定理结论可知A的三个特征值位于 三个圆盘的并集中,
11
数值分析
第8章 矩阵特征值计算
矩阵特征值的计算
矩阵特征值的计算一、特征值的定义和性质矩阵A的特征值是指满足下列条件的数λ:存在一个非零向量x,使得Ax=λx,即为矩阵A作用在向量x上的结果是该向量的数量倍,其中λ为特征值。
定义特征值之后,可以证明如下性质:1.相似矩阵具有相同的特征值;2.矩阵的特征值个数等于矩阵的阶数;3.特征值可以是实数也可以是复数;4.如果一个矩阵的特征向量独立,则该矩阵可对角化。
二、特征值的计算方法特征值的计算方法有多种,包括直接计算、特征向量迭代法等。
以下介绍两种常用的方法,分别是雅可比法和幂法。
1.雅可比法雅可比法是最基本和最直接的求解特征值和特征向量的方法。
首先,构造一个对称阵J,使其主对角线元素等于矩阵A的主对角线元素,非对角线元素等于矩阵A的非对角线元素的平方和的负数。
然后,对J进行迭代计算,直到满足迭代终止条件。
最终得到的J的对角线元素就是矩阵A 的特征值。
雅可比法的优点是计算量相对较小,算法比较简单,可以直接计算特征值和特征向量。
但是,雅可比法的收敛速度较慢,对于大规模矩阵的计算效率较低。
2.幂法幂法是一种迭代算法,用于计算矩阵的最大特征值和对应的特征向量。
首先,随机选择一个非零向量b作为初值。
然后,迭代计算序列b,A*b,A^2*b,...,直到序列趋向于收敛。
最终,特征值是序列收敛时的特征向量的模长,特征向量是序列收敛时的向量。
幂法的优点是可以计算矩阵的最大特征值和对应的特征向量。
此外,幂法对于大规模矩阵的计算效率较高。
然而,幂法只能计算最大特征值,对于其他特征值的计算不适用。
三、特征值的应用1.特征值分解特征值分解是将一个矩阵分解为特征值和特征向量构成的对角矩阵的乘积。
特征值分解是一种重要的矩阵分解方法,它在信号处理、图像压缩、最优化等领域有广泛应用。
通过特征值分解,可以对矩阵进行降维处理、数据压缩和特征提取等操作。
2.矩阵的谱半径矩阵的谱半径是指矩阵的所有特征值的模的最大值。
谱半径在控制系统、网络分析和量子力学等领域有广泛的应用。
第8章-矩阵特征值计算
min P1 P I ,
( A)
p
pp
(1.5)
其中||·||p为矩阵的p范数,p=1,2,.
证明 由于σ(A)时显然成立,故只考虑̄σ(A).这
时D-I非奇异,设x是A+I对应于的特征向量,由
(A+I-I)x=0左乘P-1可得 (D I )(P1 x) (P1IP)(P1 x), P1 x (D I )1 (P1 IP)(P1 x),
上页 下页
定理7 设A∈Rn×n有n个线性无关的特征向量,
主特征值1满足 |1|>|2||n|,
则对任何非零向量v0(a10),(2.4)式和(2.7)式成立.
如果A的主特征值为实的重根, 即1=2==r, 且 |r|>|r+1||n|,
又设A有n个线性无关的特征向量,1对应的r个线性
无关的特征向量为x1,x2,,xr,则由(2.2)式有
3 1 5.
A的其它两个特征值2, 3包含在D2, D3的并集中.
上页 下页
现在取对角阵
1 0 0
D1 0 1 0 ,
0 0 0.9
做相似变换
4 1 0
A A1 D1 AD 1
0
10 9
.
0.9 0.9 4
矩阵A1的3个圆盘为
E1 : 4 1,
E2 :
19 , 9
矩阵,则
(1) A的特征值均为实数;
(2) A有n个线性无关的特征向量;
(3) 存在一个正交矩阵P使的
1
PT AP
2
,
n
且1, 2,, n为A的特征值,而P=(u1,u2,,un)的列
向量uj为A的对应于j 的单位特征向量.
矩阵特征值的求法举例
矩阵特征值的求法举例
矩阵的特征值是线性代数中一个非常重要的概念,它对于矩阵的性质和求解问题具有
重要意义。
特征值是一个数,它可以通过解一个特征方程来求得,特征方程是一个关于特
征值的多项式方程。
下面我们将通过几个具体的例子来介绍矩阵特征值的求法。
假设我们有一个2×2矩阵A,其元素如下所示:
A = |a b|
|c d|
我们希望求解矩阵A的特征值。
我们将矩阵A减去一个单位矩阵的倍数,得到新的矩阵B:
B = A - λI
λ是一个未知的数,I是单位矩阵。
具体地,我们有:
接下来,我们需要求解特征方程,即求解方程|B| = 0。
|a-λ b | = (a-λ)(d-λ) - bc = 0
|c d-λ|
展开计算得到:
这个二次方程就是特征方程。
根据一元二次方程的求解公式,我们有:
λ = [(a+d) ± √((a+d)^2 - 4(ad-bc)) ] / 2
这里,√表示开方。
通过求解该二次方程,我们就能够求得矩阵A的特征值。
具体的计算过程比较复杂,可以使用数值方法(如牛顿法)来求解,或者使用专门的
软件工具进行计算。
总结:
通过以上两个例子,我们可以看到求解矩阵特征值的过程其实就是求解一个代数方程
的过程。
对于小规模的矩阵,我们可以通过手工计算来得到特征值,但对于大规模的矩阵,
通常需要借助计算机来进行计算。
矩阵特征值的求法对于理解和应用线性代数有着重要的意义,它在很多领域(如数学、物理、金融等)中都有广泛的应用。
矩阵特征值求法的十种求法(非常经典)
矩阵特征值求法的十种求法(非常经典)以下是矩阵特征值求法的十种经典求法:1. 幂法(Power Method)幂法(Power Method)幂法是求解特征值的常用方法之一。
它基于一个重要的数学原理:对于一个非零向量$x$,当它连续乘以矩阵$A$的$k$次幂后,$Ax$的方向将趋于特征向量相应的特征值。
这种方法通常需要进行归一化,以防止向量过度增长。
2. 反幂法(Inverse Power Method)反幂法(Inverse Power Method)反幂法是幂法的一种变体。
它通过计算矩阵$A$的逆来求解最小的特征值。
使用反幂法时,我们需要对矩阵$A$进行LU分解,以便更高效地求解线性方程组。
3. QR方法QR方法QR方法是一种迭代方法,可以通过将矩阵$A$分解为$QR$形式来逐步逼近特征值。
这种方法是通过多次应用正交变换来实现的,直到收敛为止。
QR方法不仅可以求解特征值,还可以求解特征向量。
4. Jacobi方法Jacobi方法Jacobi方法是一种迭代方法,通过施加正交相似变换将矩阵逐步变为对角矩阵。
在每个迭代步骤中,Jacobi方法通过旋转矩阵的特定元素来逼近特征值。
这种方法适用于对称矩阵。
5. Givens旋转法Givens旋转法Givens旋转法是一种用于特征值求解的直接方法。
它通过施加Givens旋转矩阵将矩阵逐步变为对角矩阵。
这种方法是通过旋转矩阵的特定元素来实现的。
6. Householder变换法Householder变换法Householder变换法是一种用于特征值求解的直接方法。
它通过施加Householder变换将矩阵逐步变为Hessenberg形式,然后再进一步将其变为上三角形式。
这种方法是通过对矩阵的列向量进行反射来实现的。
7. Lanczos方法Lanczos方法Lanczos方法是一种迭代方法,用于对称矩阵的特征值求解。
该方法创建一个Krylov子空间,并使用正交投影找到最接近特征值的Krylov子空间中的特征值。
矩阵特征值计算矩阵的特征值和特征向量
矩阵特征值计算矩阵的特征值和特征向量矩阵是线性代数中的重要概念之一,它在众多学科领域中都有广泛的应用。
而矩阵的特征值和特征向量则是矩阵分析与应用中的核心内容之一。
本文将详细介绍矩阵特征值的计算方法,以及如何求解矩阵的特征向量。
1. 特征值和特征向量的定义首先,我们来了解一下什么是矩阵的特征值和特征向量。
给定一个n阶方阵A,如果存在一个数λ以及一个非零n维列向量X,使得满足下述条件:AX = λX那么,λ就是矩阵A的一个特征值,而X则是对应于特征值λ的特征向量。
特征值和特征向量的求解在很多应用中都具有重要的意义。
2. 特征值的计算方法接下来,我们介绍几种常见的特征值计算方法。
2.1 特征多项式法特征多项式法是求解特征值的一种常用方法。
它利用方阵A减去λ乘以单位矩阵I之后的行列式为零的性质,构造出特征多项式,并求解多项式的根即可得到特征值。
举个例子,对于二阶方阵A = [a, b; c, d],其特征多项式为:| A - λI | = | a-λ, b; c, d-λ | = (a-λ)(d-λ) - bc = 0解这个方程可以得到A的特征值。
2.2 幂迭代法幂迭代法也是一种常见的特征值计算方法。
它利用特征向量的性质,通过迭代计算来逼近矩阵的特征值。
其基本思想是,给定一个初始向量X0,不断迭代计算:Xk+1 = AXk然后对得到的向量序列进行归一化处理,直到收敛为止。
最后得到的向量X就是对应的特征向量,而特征值可以通过如下公式计算:λ = X^TAX / X^TX2.3 QR方法QR方法是一种数值稳定性较好的特征值计算方法。
它利用矩阵的QR分解的性质来逐步逼近矩阵的特征值。
首先,对矩阵A进行QR分解,得到一个正交矩阵Q和一个上三角矩阵R。
然后,将分解后的矩阵R与矩阵Q逆序相乘,得到一个新的矩阵A'。
重复进行QR分解和相乘的操作,直到收敛为止。
最后,得到的矩阵A'的对角线上的元素即为矩阵A的特征值。
矩阵特征值的计算
物理、力学和工程技术中的许多问题在数学上都归结为求矩 阵的特征值和特征向量问题。
� 计算方阵 A 的特征值,就是求特征多项式方程:
| A − λI |= 0 即 λn + p1λn−1 + ⋅ ⋅ ⋅ + pn−1λ + pn = 0
的根。求出特征值 λ 后,再求相应的齐次线性方程组:
(13)
为了防止溢出,计算公式为
⎧ Ay k = xk −1
⎪ ⎨
m
k
=
max(
yk )
( k = 1, 2, ⋅ ⋅⋅)
⎪ ⎩
x
k
=
yk
/ mk
(14)
相应地取
⎧ ⎪
λ
n
⎨
≈
1 mk
⎪⎩ v n ≈ y k ( 或 x k )
(15)
9
(13)式中方程组有相同的系数矩阵 A ,为了节省工作量,可先对
11
11
≤ ≤ ⋅⋅⋅ ≤
<
λ1 λ2
λn −1
λn
对应的特征向量仍然为 v1, v2 ,⋅⋅⋅, vn 。因此,计算矩阵 A 的按模
最小的特征值,就是计算 A−1 的按模最大的特征值。
� 反幂法的基本思想:把幂法用到 A−1 上。
任取一个非零的初始向量 x0 ,由矩阵 A−1 构造向量序列:
xk = A−1xk−1 , k = 1, 2, ⋅⋅⋅
如果 p 是矩阵 A 的特征值 λi 的一个近似值,且
| λi − p |<| λ j − p | , i ≠ j
1 则 λ i − p 是矩阵 ( A − pI )−1 的按模最大的特征值。因此,当给
矩阵特征值问题的数值计算
矩阵特征值问题的计算方法特征值问题:A V=λV¾直接计算:A的阶数较小,且特征值分离得较好 特征值:det(λI-A)=0,特征向量:(λI-A)V=0¾迭代法:幂法与反幂法¾变换法:雅可比方法与QR方法内容:一、 特征值的估计及其误差问题二、 幂法与反幂法三、 雅可比方法四、 QR方法一、 特征值的估计及其误差问题 (一)特征值的估计结论 1.1:n 阶矩阵()ij n n A a ×=的任何一个特征值必属于复平面上的n 个圆盘:1,||||,1,2,ni ii ij j j i D z z a a i n =≠⎧⎫⎪⎪=−≤=⎨⎬⎪⎪⎩⎭∑"(10.1) 的并集。
结论1.2:若(10.1)中的m个圆盘形成一个连通区域D,且D与其余的n-m个圆盘不相连,则D中恰有A的m个特征值。
(二)特征值的误差问题结论1.3:对于n 阶矩阵()ij n n A a ×=,若存在n 阶非奇异矩阵H ,使得11(,,)n H AH diag λλ−=Λ=", (10.2)则11min ||||||||||||||i p p p i nH H A λλ−≤≤−≤∆ (10.3)其中λ是A A +∆的一个特征值,而(1,,)i i n λ="是A 的特征值,1,2,p =∞。
结论1.4:若n 阶矩阵A 是实对称的,则1min ||||||i p i nA λλ≤≤−≤∆。
(10.4)注:(10.4)表明,当A 是实对称时,由矩阵的微小误差所引起的特征值摄动也是微小的。
但是对于非对称矩阵而言,特别是对条件数很大的矩阵,情况未必如此。
二、 幂法与反幂法(一) 幂法:求实矩阵按模最大的特征值与特征向量假设n 阶实矩阵A 具有n 个线性无关的特征向量,1,iV i n =",则对于任意的0nX R ∈,有 01ni ii X a V ==∑,从而有01111112((/))n nk k k i i i i ii i nk k i i i i A X a A V a V a V a V λλλλ======+∑∑∑.若A 的特征值分布如下:123||||||||n λλλλ>≥≥≥",则有01111()k kk A X a V λλ→∞⎯⎯⎯→为对应的特征向量须注意的是,若1||1λ<,则10kλ→,出现“下溢”,若1||1λ>,则1kλ→∞,出现“上溢”,为避免这些现象的发生,须对0kA X 进行规范化。
矩阵特征值的求法举例
矩阵特征值的求法举例矩阵的特征值是矩阵在特征向量上的变化率,可以用于矩阵的分析和求解问题。
在数学中,特征值的求法有不同的方法,下面举例介绍其中几种常用的方法。
1. 幂迭代法幂迭代法是求解矩阵最大特征值的一种常用方法。
假设A是一个n阶方阵,且有一个特征值λ1使得|λ1|>|λ2|≥|λ3|≥...≥|λn|,那么在随机选取的一个m维向量x0上进行迭代操作,可以得到一个序列x1、x2、…、xm,最终收敛到特征值为λ1的特征向量。
具体迭代过程如下:(1) 选取一个初始向量x0,进行归一化处理: x0 = x0 / ||x0||(2) 迭代计算xm的值: xm = Axm-1(3) 对xm进行归一化处理: xm = xm / ||xm||(4) 判断结束条件:判断向量xm与xm-1的差别是否小于一个给定的阈值,如果是则结束迭代,返回最终结果。
2. Jacobi方法Jacobi方法是一种迭代方法,用于求解对称矩阵的全部特征值和特征向量。
假设有一个n阶实对称矩阵A,那么Jacobi方法的步骤如下:(1) 将A初始化为对角矩阵,即通过旋转操作将非对角元素都变为0: A' = R^TAR(2) 计算A'的非对角线元素的绝对值之和,如果小于一个给定的阈值,则结束迭代,返回矩阵A'的对角线元素作为矩阵A的特征值的近似解。
(3) 否则,选择一个非对角元素a_ij的绝对值最大的位置(i,j),对矩阵A'进行旋转操作,使a_ij=0。
(4) 返回步骤(2)。
(1) 初始化矩阵A: A0 = A(2) 对矩阵A0进行QR分解,得到A0=Q1R1。
(3) 计算A0的近似第一特征值λ1的估计值:λ1 = R1(n,n)。
(4) 将A0更新为A1: A1 = R1Q1。
(5) 判断矩阵A1是否满足结束条件,如果是则迭代结束,返回A1的对角线元素作为矩阵A的特征值的近似解。
(6) 否则,返回步骤(2)。
求矩阵特征值方法
求矩阵特征值方法
求矩阵特征值的常见方法有以下几种:
1. 特征值分解:对于方阵A,特征值分解就是将其表示为特征向量的线性组合的形式,即A = PDP^-1,其中D是一个对角矩阵,对角线上的元素就是A的特征值,P是一个由A的特征向量组成的矩阵。
特征向量分解可通过求解矩阵的特征方程来实现。
2. 幂迭代法:幂迭代法是一种迭代计算特征值的方法,通过不断迭代向量与矩阵的乘积来逼近特征向量,从而得到特征值。
3. Jacobi方法:Jacobi方法通过不断迭代将矩阵A化为对角矩阵,每次迭代都通过旋转操作使得矩阵A中非对角线元素逐渐趋近于0,最终得到对角矩阵。
4. QR算法:QR算法通过迭代将矩阵A转化为上三角矩阵,从而得到对角线上的特征值。
5. 奇异值分解:奇异值分解将矩阵A分解为A=UDV^T的形式,其中U和V 是正交矩阵,D是一个对角矩阵,对角线上的元素即为A的奇异值。
这些方法具有不同的适用范围和计算复杂度,选择合适的方法取决于矩阵的特点和计算需求。
第七章—矩阵特征值计算
定义4 设A是n阶实对称阵, 对于任一非零向量x R n , 称 ( Ax, x ) R( x ) ( x, x ) 为关于向量x的瑞雷( Rayleigh)商.
定理11 设A为n阶实对称阵, 1 n为A的特征值. 则 ( 1 ) (2) ( Ax, x ) 1 n , 对于任何非零向量x R n , ( x, x ) ( Ax, x ) 1 max , xR n ( x, x )
为了避免“溢出”下面做改进. 记 max(v )为向量v的绝对 v 值最大的分量,规范化得 u (v 0). 就有 max(v ) 定理13 设A R nn有n个线性无关的特征向量, 其特征值
1 2 n ,
对任何非零初始向量v0 (a1 0), 计算 u0 v0 , v Au , k k 1 (k 1,2, ) k max(vk ), uk vk / k . x1 lim uk , lim k 1. k max(x1 ) k
定理2 若i (i 1,, n)是矩阵A的特征值, 则 n n (1) i aii tr ( A), i 1 i 1 (2) det( A) 1 n .
定理3 设A R nn , 则
( A ) ( A).
T
定理4 设A为分块上三角阵, A11 A A12 A22 A1m A2 m Amm
对任何非零初始向量u0 v0,计算 vk ( A pI ) 1 uk 1, (k 1,2, ). u vk , k max(vk ) 如果p是A的特征值 j的近似,并且满足 (2.12)
0 j p i p , ( j i )
矩阵特征值计算
第五章矩阵特征值计算与线性方程组的求解问题一样,矩阵特征值与特征向量的计算也是数值线性代数的重要内容. 在理论上,矩阵的特征值是特征多项式方程的根,因此特征值的计算可转化为单个多项式方程的求解. 然而对于高阶矩阵,这种转化并不能使问题得到简化,而且在实际应用中还会引入严重的数值误差. 因此,正如第二章指出的,我们一般将多项式方程求解转化为矩阵特征值计算问题,而不是反过来.本章介绍有关矩阵特征值计算问题的基本理论和算法. 与非线性方程求根问题类似,计算矩阵特征值的算法也是迭代方法①.5.1基本概念与特征值分布本节先介绍矩阵特征值、特征向量的基本概念和性质,然后讨论对特征值分布范围的简单估计方法.5.1.1基本概念与性质定义5.1:矩阵A=(a kj)∈ℂn×n,(1) 称φ(λ)=det(λI−A)=λn+c1λn−1+⋯+c n−1λ+c n为A的特征多项式(characteristic polynomial);n次代数方程φ(λ)=0为A的特征方程(characteristic equation),它的n个根:λ1,⋯,λn,被称为A的特征值(eigenvalue). 此外,常用λ(A)表示A的全体特征值的集合,也称为特征值谱(spectrum of eigenvalue).(2) 对于矩阵A的一个给定特征值λ,相应的齐次线性方程组(λI−A)x=0 , (5.1)有非零解(因为系数矩阵奇异),其解向量x称为矩阵A对应于λ的特征向量(eigenvector).根据方程(5.1),我们得出矩阵特征值与特征向量的关系,即Ax=λx .(5.2)第三章的定义3.5就利用公式(5.2)对矩阵特征值和特征向量进行了定义,它与定义5.1是等价的. 另外,同一个特征值对应的特征向量一定不唯一,它们构成线性子空间,称为特征子空间(eigenspace).我们一般讨论实矩阵的特征值问题. 应注意,实矩阵的特征值和特征向量不一定是实数和实向量,但实特征值一定对应于实特征向量(方程(5.1)的解),而一般的复特征值对应的特征向量一定不是实向量. 此外,若特征值不是实数, 则其复共轭也一定是特征值(由于特征方程为实系数方程). 定理3.3表明,实对称矩阵A∈ℝn×n的特征值均为实数,存在n个线性无关、且正交的实特征向量,即存在由特征值组成的对角阵Λ和特征向量组成的正交阵Q,使得:A=QΛQ T.(5.3)例5.1(弹簧-质点系统):考虑图5-1的弹簧-质点系统,其中包括三个质量分别为m1、m2、m3的物体,由三个弹性系数分别为k1,k2,k3的弹簧相连,三个物体的位置均为时间的函数,①如果用有限次运算能求得一般矩阵的特征值,则多项式方程求根问题也可用有限次运算解决,这与阿贝尔证明的“高于4次的多项式并不都有用初等运算表示的求根公式”的理论矛盾.这里考查三个物体偏离平衡位置的位移,分别记为y 1(t), y 2(t), y 3(t). 因为物体在平衡状态所受的重力已经和弹簧伸长的弹力平衡,所以物体的加速度只和偏离平衡位置引起的弹簧伸长相关. 根据牛顿第二定律以及胡克定律(即弹簧的弹力与拉伸长度成正比)可列出如下微分方程组②: My ′′(t)+Ky(t)=0 ,其中y (t )=[y 1(t)y 2(t)y 3(t)]T ,M =[m 1000m 2000m 3],K =[k 1+k 2−k 20−k 2k 2+k 3−k 30−k 3k 3] . 在一般情况下,这个系统会以自然频率ω做谐波振动,而y 的通解包含如下的分量: y j (t )=x j e iωt ,(j =1,2,3)其中i =√−1,根据它可求解出振动的频率ω及振幅x j . 由这个式子可得出:y j ′′(t )=−ω2x j e iωt ,(j =1,2,3)代入微分方程,可得代数方程:−ω2Mx +Kx =0,或Ax =λx ,其中A =M −1K ,λ=ω2. 通过求解矩阵A 的特征值便可求出这个弹簧-质点系统的自然频率(有多个). 再结合初始条件可确定这三个位移函数,它们可能按某个自然频率振动(简正振动),也可能是若干个简正振动的线性叠加.例5.2(根据定义计算特征值、特征向量):求矩阵A =[5−1−131−14−21]的特征值和特征向量.[解]: 矩阵A 的特征方程为:det (λI −A )=|λ−511−3λ−11−42λ−1|=(λ−3)(λ−2)2=0故A 的特征值为λ1=3,λ2=2(二重特征值).当λ=λ1=3时,由(λI −A)x =0,得到方程[−211−321−422][x 1x 2x 3]=[000]它有无穷多个解,若假设x 1=1, 则求出解为x =[1,1,1]T ,记为x 1,则x 1是λ1对应的一个特征向量.当λ=λ2=2时,由(λI −A)x =0,得到方程[−311−311−421][x 1x 2x 3]=[000]它有无穷多个解,若假设x 1=1, 则求出解为x =[1,1,2]T ,记为x 2,则x 2是λ2对应的一个特② 本书第八章将介绍这种常微分方程组的数值求解方法.图5-1 弹簧-质点系统.征向量.下面概括地介绍有关矩阵特征值、特征向量的一些性质,它们可根据定义5.1,以及公式(5.2)加以证明.定理5.1:设λj (j =1,2,…,n)为n 阶矩阵A 的特征值,则(1) ∑λj n j=1=∑a jj n j=1=tr(A) ;(2) ∏λj n j=1=det(A) .这里tr(A)表示矩阵对角线上元素之和,称为矩阵的迹(trace ).从上述结论(2)也可以看出,非奇异矩阵特征值均不为0, 而0一定是奇异矩阵的特征值. 定理5.2:矩阵转置不改变特征值,即λ(A )=λ(A T ).定理5.3:若矩阵A 为对角阵或上(下)三角阵,则其对角线元素即为矩阵的特征值.定理5.4:若矩阵A 为分块对角阵,或分块上(下)三角阵,例如A =[A 11A 12⋯A 1m A 22⋯A 2m ⋱⋮A mm] , 其中每个对角块A jj 均为方阵,则矩阵A 的特征值为各对角块矩阵特征值的合并,即λ(A )=⋃λ(A jj )m j=1.定理5.5:矩阵的相似变换(similarity transformation)不改变特征值. 设矩阵A 和B 为相似矩阵,即存在非奇异矩阵X 使得B =X −1AX ,则(1) 矩阵A 和B 的特征值相等,即 λ(A )=λ(B ) ;(2) 若y 为B 的特征向量,则相应地,Xy 为A 的特征向量.通过相似变换并不总能把矩阵转化为对角阵,或者说矩阵A 并不总是可对角化的(diagonalizable). 下面给出特征值的代数重数、几何重数,和亏损矩阵的概念,以及几个定理..定义5.2: 设矩阵A ∈ℝn×n 有m 个(m n )不同的特征值λ̃1,⋯,λ̃m ,若λ̃j 是特征方程的n j 重根,则称n j 为λ̃j 的代数重数(algebraic multiplicity),并称λ̃j 的特征子空间(ℂn 的子空间)的维数为λ̃j 的几何重数(geometric multiplicity). 定理5.6:设矩阵A ∈ℝn×n 的m 个不同的特征值为λ̃1,⋯,λ̃m ,特征值λ̃j ,(j =1,⋯,m)的代数重数为n j ,几何重数为k j ,则(1) ∑n j m j=1=n ,且任一个特征值的几何重数不大于代数重数,即∀j ,n j ≥k j .(2) 不同特征值的特征向量线性无关,并且将所有特征子空间的∑k j m j=1个基(特征向量)放在一起,它们构成一组线性无关向量.(3) 若每个特征值的代数重数等于几何重数,则总共可得n 个线性无关的特征向量,它们是全空间ℂn 的基.定义5.3:若矩阵A ∈ℝn×n 的某个代数重数为k 的特征值对应的线性无关特征向量数目少于k (即几何重数小于代数重数),则称A 为亏损阵(defective matrix ),否则称其为非亏损阵(nondefective matrix ).定理5.7:设矩阵A ∈ℝn×n 可对角化,即存在非奇异矩阵X ∈ℂn×n 使得X −1AX =Λ,其中Λ∈ℂn×n 为对角阵, 的充要条件是A 为非亏损矩阵. 此时,Λ的对角线元素为矩阵A 的特征值,而矩阵X 的列向量为n 个线性无关的特征向量.定理5.7中方程的等价形式为A =XΛX −1, 它被称为特征值分解,也叫谱分解(spectrum decomposition). 特征值分解存在的充要条件是A 为非亏损矩阵. 但现实中还有很多矩阵是亏损矩阵,例如例5.2中的矩阵,它的特征值2的代数重数为2,而几何重数仅为1. 这种矩阵不能相似变换为对角阵,但存在下面的若当分解(Jordan decomposition).定理5.8:设矩阵A ∈ℝn×n , 存在非奇异矩阵X ∈ℂn×n 使得A =XJX −1,矩阵J 为形如[J 1⋱J p ]的分块对角阵(称为若当标准型),其中J k =[ λk 1λk ⋱⋱1λk ] 称为若当块,其对角线元素为矩阵A 的特征值. 设矩阵A 有m 个不同的特征值为λ̃1,⋯,λ̃m ,特征值λ̃j ,(j =1,⋯,m)的代数重数为n j ,几何重数为k j ,则p =∑k j m j=1, λ̃j 对应于k j 个若当块, 其阶数之和等于n j .在若当分解中,如果所有若当块都是1阶的,则J 为对角阵,这种分解就是特征值分解,相应的矩阵为非亏损阵. 若当分解是很有用的理论工具,利用它还可证明下面关于矩阵运算结果的特征值的定理.定理5.9:设λj (j =1,2,…,n)为n 阶矩阵A 的特征值,则(1) 矩阵cA, c 为常数, 的特征值为cλ1,cλ2,⋯,cλn .(2) 矩阵A +pI, p 为常数, 的特征值为λ1+p,λ2+p,⋯,λn +p.(3) 矩阵A k , k 为正整数, 的特征值为λ1k ,λ2k ,⋯,λn k .(4) 设p (t )为一多项式函数,则矩阵p (A )的特征值为p (λ1),p (λ2),⋯ ,p (λn ) .(5) 若A 为非奇异矩阵,则λj ≠0,(j =1,2,…,n), 且矩阵A −1的特征值为λ1−1,λ2−1,⋯,λn −1.5.1.2特征值分布范围的估计估计特征值的分布范围或它们的界,无论在理论上或实际应用上,都有重要意义. 比如,本书前面的内容曾涉及两个问题:(1). 计算矩阵的2-条件数:cond (A )2=√λmax (A T A)λmin (A T A) ;(2). 考察一阶定常迭代法x (k+1)=Bx (k)+f 的收敛性、收敛速度:收敛的判据是谱半径ρ(B)=max 1≤j≤n |λj (B)|<1 ; 收敛速度为R =−log 10ρ(B) .其中都需要对矩阵特征值分布范围的了解.上一章的定理4.4说明谱半径的大小不超过任何一种算子范数,即ρ(A )≤‖A ‖ ,这是关于特征值的上界的一个重要结论.下面先给出定义5.4,再介绍有关特征值的界的另一个重要结论.定义5.4:设A =(a kj )∈ℂn×n ,记r k =∑|a kj |n j=1j≠k ,(k =1,⋯,n),则集合D k ={z||z −a kk |≤r k ,z ∈ℂ},(k =1,⋯,n)在复平面为以a kk 为圆心、r k 为半径的圆盘,称为A 的Gerschgorin (格什戈林)圆盘.图5-2显示了一个3⨯3复矩阵的格什戈林圆盘.定理5.10 (圆盘定理):设A =(a kj )∈ℂn×n ,则:(1) A 的每一个特征值必属于A 的格什戈林圆盘之中,即对任一特征值λ必定存在k,1≤k ≤n ,使得:|λ−a kk |≤∑|a kj |nj=1j≠k .(5.4)图5-2 复坐标平面,以及3⨯3矩阵A 的格什戈林圆盘.用集合的关系来说明,这意味着λ(A)⊆⋃D k n k=1.(2) 若A 的格什戈林圆盘中有m 个组成一连通并集S ,且S 与余下的n −m 个圆盘分离,则S内恰好包含A 的m 个特征值(重特征值按重数计).对图5-2所示的例子,定理5.10的第(2)个结论的含义是:D 1中只包含一个特征值,而另外两个特征值在D 2,D 3的并集中. 下面对定理5.10的结论(1)进行证明,结论(2)的证明超出了本书的范围.[证明]: 设λ为A 的任一特征值,则有Ax =λx ,x 为非零向量. 设x 中第k 个分量最大,即|x k |=max 1≤j≤n|x j |>0 , 考虑方程(5.2)中第k 个方程:∑a kj x j nj=1=λx k , 将其中与x k 有关的项移到等号左边,其余到右边,再两边取模得:|λ−a kk ||x k |=|∑a kj x j n j=1j≠k |≤∑|a kj ||x j |n j=1j≠k ≤|x k |∑|a kj |nj=1j≠k .(5.5)最后一个不等式的推导利用了“x 中第k 个分量最大”的假设. 将不等式(5.5)除以|x k |,即得到(5.4)式,因此证明了定理 5.10的结论(1). 上述证明过程还说明,若某个特征向量的第k 个分量的模最大,则相应的特征值必定属于第k 个圆盘中.根据定理5.2,还可以按照矩阵的每一列元素定义n 个圆盘,对于它们定理5.10仍然成立. 下面的定理是圆盘定理的重要推论,其证明留给感兴趣的读者.定理5.11:设A ∈ℝn×n ,且A 的对角元均大于0,则(1) 若A 严格对角占优,则A 的特征值的实部都大于0.(2) 若A 为对角占优的对称矩阵,则A 一定是对称半正定矩阵,若同时A 非奇异,则A 为对称正定矩阵.例5.3 (圆盘定理的应用):试估计矩阵A =[41010−111−4]的特征值范围.[解]: 直接应用圆盘定理,该矩阵的三个圆盘如下:D 1: |λ−4|≤1, D 2: |λ|≤2, D 3: |λ+4|≤2.D 1与其他圆盘分离,则它仅含一个特征值,且必定为实数(若为虚数则其共轭也是特征值,这与D 1仅含一个特征值矛盾). 所以对矩阵特征值的范围的估计是:3≤λ1≤5,λ2,λ3∈D 2∪D 3 .再对矩阵A T 应用圆盘定理,则可以进一步优化上述结果. 矩阵A T 对应的三个圆盘为: D ’1: |λ−4|≤2, D ’2: |λ|≤2, D ’3: |λ+4|≤1.这说明D ’3中存在一个特征值,且为实数,它属于区间[-5, -3],经过综合分析可知三个特征值均为实数,它们的范围是:λ1∈[3,5],λ2∈[−2,2],λ3∈[−5,−3].事实上,使用Matlab 的eig 命令可求出矩阵A 的特征值为:4.2030, -0.4429, -3.7601.根据定理5.5,还可以对矩阵A 做简单的相似变换,例如取X 为对角阵,然后再应用圆盘定理估计特征值的范围.例5.4 (特征值范围的估计):选取适当的矩阵X ,应用定理5.5和5.10估计例5.3中矩阵的特征值范围.[解]: 取X−1=[100010000.9] , 则A 1=X −1AX =[41010−109⁄0.90.9−4]的特征值与A 的相同. 对A 1应用圆盘定理,得到三个分离的圆盘,它们分别包含一个实特征值,由此得到特征值的范围估计:λ1∈[3,5],λ2∈[−199,199],λ3∈[−5.8,−2.2]. 此外,还可进一步估计ρ(A)的范围,即3≤ρ(A)≤5.8 .上述例子表明,综合运用圆盘定理和矩阵特征值的性质(如定理5.2, 定理5.5),可对特征值的范围进行一定的估计. 对具体例子,可适当设置相似变换矩阵,尽可能让圆盘相互分离,从而提高估计的有效性.5.2幂法与反幂法幂法是一种计算矩阵最大的特征值及其对应特征向量的方法. 本节介绍幂法、反幂法以及加快幂法迭代收敛的技术.5.2.1幂法定义5.5:在矩阵A 的特征值中,模最大的特征值称为主特征值,也叫“第一特征值”,它对应的特征向量称为主特征向量.应注意的是,主特征值有可能不唯一,因为模相同的复数可以有很多. 例如模为5的特征值可能是5,−5,3+4i,3−4i , 等等. 另外,请注意谱半径和主特征值的区别.如果矩阵A 有唯一的主特征值,则一般通过幂法能方便地计算出主特征值及其对应的特征向量. 对于实矩阵,这个唯一的主特征值显然是实数,但不排除它是重特征值的情况. 幂法(power iteration)的计算过程是,首先任取一非零向量v 0∈ℝn ,再进行迭代计算:v k =Av k−1,(k =1,2,⋯)得到向量序列{v k },根据它即可求出主特征与特征向量. 下面用定理来说明.定理5.12: 设A ∈ℝn×n ,其主特征值唯一,记为λ1,且λ1的几何重数等于代数重数,则对于非零向量v 0∈ℝn ,v 0不与主特征值对应的特征向量正交,按迭代公式进行计算:v k =Av k−1,(k =1,2,⋯),存在如下极限等式:lim k→∞v k λ1k =x 1 , (5.6) lim k→∞(v k+1)j (v k )j =λ1 , (5.7)其中x 1为主特征向量,(v k )j 表示向量v k 的第j 个分量(k =1,2,⋯).[证明]: 为了推导简便,不妨设主特征值λ1不是重特征值,并且假设矩阵A 为非亏损矩阵. 设A 的n 个特征值按模从大到小排列为: |λ1|>|λ2|≥⋯≥|λn |,它们对应于一组线性无关的单位特征向量x ̂1,⋯,x ̂n . 向量v 0可写成这些特征向量的线性组合:v 0=α1x̂1+⋯+αn x ̂n 根据已知条件,α1≠0,则v k =Av k−1=A k v 0=α1λ1k x ̂1+α2λ2k x̂2+⋯+αn λn k x ̂n =λ1k [α1x ̂1+∑αj (λj λ1)kx ̂j n j=2] =λ1k (α1x̂1+εk ) 其中εk =∑αj (λj λ1)k x ̂j n j=2. 由于|λj λ1|<1,(j =2,…,n), 则 lim k→∞εk =0 ⟹lim k→∞v kλ1k =α1x̂1 . 由于特征向量放大、缩小任意倍数后仍是特征向量,设x 1=α1x̂1,则它是主特征对应的一个特征向量. 上式说明,随k 的增大, v k 越来越趋近于主特征值的对应的特征向量.设j 为1到n 之间的整数,且(v k )j ≠0,则(v k+1)j (v k )j =λ1(α1x ̂1+εk+1)j (α1x̂1+εk )j 由于lim k→∞εk =0,随k 的增大上式等号右边趋于一个常数: λ1. 这就证明了定理的结论.若矩阵A 为亏损矩阵,可利用矩阵的若当分解证明这个定理,这里略去. 在这种情况下,“主特征值的几何重数等于代数重数”这一条件很重要,例如,若A =[310030001] ,它的主特征值为3,但其几何重数为1,不满足条件. 对这个矩阵A 进行实验显示无法用幂法求出主特征值.关于定理5.12,再说明几点:● 当主特征值λ1为重特征值时,应要求其几何重数等于代数重数,此时特征子空间维数大于1,向量序列{v k λ1k ⁄}的收敛值是其特征子空间中的某一个基向量.● 公式(5.7)式的含义是相邻迭代向量分量的比值收敛到主特征值. 因此在实际计算时,可任意取j 的值,只需保证比值的分母不为零.● 证明中假设了α1≠0,在实际应用中往往随机选取v 0,由于存在舍入误差,它一般都能满足. 感兴趣的读者也可思考一下,若初始向量v 0恰好与主特征向量都正交,那么幂法中的迭代向量序列会有什么结果?直接使用幂法,还存在如下两方面问题:(1) 溢出:由于v k ≈λ1k x 1,则|λ1|>1时,实际计算v k 会出现上溢出(当k 很大时);|λ1|<1时,实际计算v k 会出现下溢出(当k 很大时).(2) 可能收敛速度很慢. 由于εk =∑αj (λj λ1)kx j n j=2, εk →0的速度取决于求和式中衰减最慢的因子|λ2λ1|,当|λ2λ1|≈1时,收敛很慢. 由此导致v k →λ1k α1x 1, (v k+1)j (v k )j →λ1的收敛速度都将很慢,严重影响计算的效率.下面采用规格化向量的技术防止溢出,导出实用的幂法. 关于加速收敛技术的讨论,见下一小节.定义 5.6:记max ̅̅̅̅̅̅(v )为向量v ∈ℝn 的绝对值最大的分量, max ̅̅̅̅̅̅(v )=v j ,其中j 满足|v j |=max 1≤k≤n |v k |, 若j 的值不唯一,则取最小的那个. 并且,称u =v/max ̅̅̅̅̅̅(v )为向量v 的规格化向量(normalized vector).例5.5(规格化向量):设v =[3,−5,0]T ,max ̅̅̅̅̅̅(v )=−5,对应的规格化向量为u =[−35,1,0]T .根据定义5.6,容易得出规格化向量的两条性质.定理5.13: 定义5.6中的规格化向量满足如下两条性质:(1) 若u 为规格化向量,则‖u ‖ =1,并且max ̅̅̅̅̅̅(u )=1.(2) 设向量v 1和v 2的规格化向量分别为u 1和u 2,若v 1=αv 2, 实数α≠0,则u 1= u 2.在幂法的每一步增加向量规格化的操作可解决溢出问题. 先看第一步,v 1=Av 0,此时计算v 1的规格化向量u 1=v 1max ̅̅̅̅̅̅(v 1)=Av 0max ̅̅̅̅̅̅(Av 0). 然后使用规格化向量计算v 2:v 2=Au 1=A 2v 0max ̅̅̅̅̅̅(Av 0), (5.8) 再进行向量规划化操作,u 2=v 2max ̅̅̅̅̅̅(v 2)=A 2v 0max ̅̅̅̅̅̅(A 2v 0). (5.9) 公式(5.9)的推导,利用了(5.8)式和定理5.13的结论(2). 依次类推,我们得到: { v k =Au k−1=A k v 0max ̅̅̅̅̅̅(A k−1v 0) u k =v k max ̅̅̅̅̅̅(v k )=A k v 0max ̅̅̅̅̅̅(A k v 0) , k =1,2,⋯. (5.10) 根据定理5.12的证明过程, A k v 0=λ1k [α1x ̂1+∑αj (λj λ1)k x ̂j n j=2] ⟹u k =A k v 0max ̅̅̅̅̅̅(A k v 0)=α1x ̂1+∑αj (λj λ1)k x ̂j n j=2max ̅̅̅̅̅̅(α1x ̂1+∑αj (λj λ1)k x ̂j n j=2)k→∞→ x 1max ̅̅̅̅̅̅(x 1) , 即u k 逐渐逼近规格化的主特征向量. 同理,v k =Au k−1=A k v 0max ̅̅̅̅̅̅(A k−1v 0)=λ1k [α1x ̂1+∑αj (λj λ1)k x ̂j n j=2]max ̅̅̅̅̅̅(λ1k−1[α1x ̂1+∑αj (λj λ1)k−1x̂j n j=2]) =λ1α1x ̂1+∑αj(λj λ1)kx ̂j n j=2max ̅̅̅̅̅̅(α1x ̂1+∑αj (λj λ1)k−1x ̂j n j=2) 因此,根据定理5.13的结论(1)有:lim k→∞v k=λ1x1max̅̅̅̅̅̅(x1)⟹limk→∞max̅̅̅̅̅̅(v k)=λ1.基于上述推导,我们得到如下定理,以及如算法5.1描述的实用幂法.定理5.14: 设A∈ℝn×n,其主特征值唯一(且几何重数等于代数重数),记为λ1,取任意非零初始向量v0=u0,它不与主特征值对应的特征向量正交,按迭代公式(5.10)进行计算,则lim k→∞u k=x1max̅̅̅̅̅̅(x1),(5.11)lim k→∞max̅̅̅̅̅̅(v k)=λ1 ,(5.12)其中x1为主特征向量.算法5.1:计算主特征值λ1和主特征向量x1的实用幂法输入:v,A; 输出:x1,λ1.u:=v;While不满足判停准则dov:=Au;λ1:=max̅̅̅̅̅̅(v); {主特征值近似值}u:=v/λ1; {规格化}Endx1:=u. {规格化的主特征向量}在算法5.1中,可根据相邻两步迭代得到的主特征值近似值之差来判断是否停止迭代. 每个迭代步的主要计算是算一次矩阵与向量乘法,若A为稀疏矩阵则可利用它的稀疏性提高计算效率. 实用的幂法保证了向量序列{v k},{u k}不溢出,并且向量v k的最大分量的极限就是主特征值.最后,针对幂法的适用范围再说明两点:(1). 若实矩阵A对称半正定或对称半负定,则其主特征值必唯一(而且是非亏损阵). 有时也可以估计特征值的分布范围,从而说明主特征值的唯一性. 只有满足此条件,才能保证幂法的收敛性.(2). 对一般的矩阵,幂法的迭代过程有可能不收敛,此时序列{u k}有可能包括多个收敛于不同向量的子序列,它趋向于成为多个特征向量的线性组合. 但是,一旦幂法的迭代过程收敛,向量序列的收敛值就一定是特征向量,并可求出相应的特征值.例5.6 (实用的幂法):用实用的幂法求如下矩阵的主特征值:A=[3113] ,[解]: 取初始向量为v0=u0=[01]T . 按算法5.1的迭代过程,计算结果列于表5-1中.表5-1 实用幂法的迭代计算过程从结果可以看出,在每次迭代步中做的规格化操作避免了分量的指数增大或缩小. 经过9步迭代,特征值max ̅̅̅̅̅̅(v k )已非常接近主特征值的准确值4,特征向量也非常接近[1 1]T .5.2.2加速收敛的方法 加速幂法迭代收敛过程的方法主要有两种:原点位移技术和瑞利商(Rayleigh quotient )加速. 下面做些简略的介绍.一. 原点位移技术原点位移技术,也叫原点平移技术,它利用定理5.9的结论(2),即矩阵A −pI 的特征值为A 的特征值减去p 的结果. 对矩阵B =A −pI 应用幂法有可能得到矩阵A 的某个特征值λj 和相应的特征向量. 要使原点位移达到理想的效果,首先要求λj −p 是B 的主特征值,其次还要使幂法尽快收敛,即比例|λ2(B)λj −p |要尽量小,这里的λ2(B)表示矩阵B 的(按模)第二大的特征值. 在某种情况下设置合适的p 值,矩阵A,B 可同时取到主特征值. 图5-3显示了这样一个例子,矩阵A 的特征值分布在阴影区域覆盖的实数轴上,λ1为其主特征值. 按图中所示选取的p 值,将使得λ1−p 是矩阵B =A −pI 的主特征值,并且显然有|λ2(B)λ1−p |<|λ2(A)λ1| . 此时用幂法计算B 的主特征值能更快地收敛,进而得到矩阵的A 的主特征值. 图5-3也解释了原点位移法名字的由来,即将原点(或虚数坐标轴)移到p 的位置上,原始矩阵A 的特征值分布变成了矩阵B 的特征值分布.采用原点位移技术后,执行幂法仅带来很少的额外运算,而且仍然能利用矩阵A 的稀疏性. 它的关键问题是,如何选择合适的参数p 以达到较好的效果?这依赖于具体矩阵的情况,以及对其特征值分布的了解. 在后面,我们还会看到原点位移技术的其他用途.二. 瑞利商加速首先给出瑞利商的定义,以及它与特征值的关系,然后介绍瑞利商加速技术.定义5.7:设A ∈ℝn×n ,且为对称矩阵,对任一非零向量x ≠0,称R (x )=〈Ax,x 〉〈x,x 〉为对应于向量x 的瑞利商(Rayleigh quotient ). 这里符号〈,〉代表向量内积.定理5.15:设A ∈ℝn×n ,且为对称矩阵,其n 个特征值依次为:λ1≥λ2≥⋯≥ λn ,则矩阵A 有关的瑞利商的上下确界分别为λ1和λn . 即∀x ≠0,λn ≤R (x )≤λ1,且当x 为λ1对应的特征向量时R (x )=λ1,当x 为λn 对应的特征向量时R (x )=λn .[证明]: 根据实对称矩阵的特点,即可正交对角化(定理3.3),设特征值λ1,λ2,⋯,λn 对应的单位特征向量为x 1,x 2,⋯,x n ,设x =∑αj x j n j=1,则〈x,x 〉=〈∑αj x j n j=1,∑αj x j n j=1〉=∑αj 2n j=1,而图5-3 原点位移技术示意图.。
矩阵特征值的计算
1 3 0
0
3
7
7
1
A2
H1
A1
H
T
1
0
3 7
15
15
118 101
15 75 75
0
1
101
7
15 75 75
k 2, xT (3, 7 , 7 , 1 ) 3 15 15
x3
7, 15
y
1 15
s
[(
7
)2
(
1
)(
1
1
)] 2
0.4713
15
15 15
7 v3 15 s 0.9310
(1) 构造 H1 使得 H1 a1 = 1e1 ,令
1
a(2) 12
A2 H1A H1[a1, a2,
,
an
]
0
a(2) 22
a(2) 2
0
a(2) n2
a(2) 1n
a(2) 2n
a(2) nn
(2) 构造
H2
使得
H
a(2)
22
2 e1
,令
1
a(2) 12
a(2) 13
1 0
0
Hw I 2wwT
为Householder变换。
13
Householder 变换
性质
(1) 对称:HwT Hw (2) 正交:Hw1 HwT Hw
(3) 对合:Hw2 I
(4) 保模: Hw x 2
x 2
(5) det(Hw) 1
14
Householder 变换
定理:设 x, y Rn, x y 且 ||x||2 = ||y||2,则存在 n 阶 Householder 变换 H,使得
方法求矩阵全部特征值
方法求矩阵全部特征值要求矩阵全部特征值的方法有多种,其中最常用的方法是使用特征值分解或者通过求解矩阵的特征多项式来得到。
特征值分解是一种将矩阵表示为特征向量和特征值的形式的方法。
对于一个nxn的矩阵A,特征向量x满足Ax=λx,其中λ为特征值。
特征向量x可以通过求解方程(A-λI)x=0来获得,其中I为单位矩阵。
步骤如下:1. 对于给定矩阵A,求解特征多项式det(A-λI)=0,可以得到一个关于λ的n次方程。
2.解这个n次方程,求得n个特征值λ1,λ2,...,λn。
这些特征值可能是重复的。
3. 对于每个特征值λi,解方程(A-λiI)x=0,可以得到对应的特征向量xi。
4.可以验证Ax=λx是否成立来验证特征值和特征向量的正确性。
特征值分解的优点是准确性高,能得到精确的特征值和特征向量。
但是它的计算量较大,对于大型矩阵来说可能需要较长的计算时间。
除了特征值分解,还有一些其他的方法可以用来求解矩阵的全部特征值。
以下是一些常用的方法:1. 幂迭代法(Power Iteration Method):该方法通过反复迭代矩阵与一个初始向量的乘积来不断逼近最大的特征值。
通过迭代,该方法可以找到矩阵的一个特征值及其对应的特征向量。
2. 反幂迭代法(Inverse Power Iteration Method):该方法是幂迭代法的变种,用来求解最小特征值及其对应的特征向量。
3. QR迭代法(QR Iteration Method):该方法通过迭代进行QR分解,逐渐将矩阵转化为上三角矩阵,在迭代的过程中得出矩阵的全部特征值。
4. 特征值转换法(Eigenvalue Transformation Method):该方法通过变换矩阵的形式,转化为带有一些特殊特征的矩阵,例如Hessenberg矩阵或Schur矩阵,从而更容易求解特征值。
这些方法各有优缺点,应根据具体情况选择合适的方法。
另外,对于一些特殊类型的矩阵,例如对称矩阵或正定矩阵,还可以使用更为高效的方法来求解特征值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其 中 每个 对角 块 ������������������ 均 为方阵 , 则矩 阵 ������ 的 特征 值为各 对 角块 矩阵 特征 值的合 并 ,即 ������(������) = ⋃������ ������=1 ������(������������������ ). 定理 5.5: 矩阵的相似变换(similarity transformation)不改变特征值. 设矩阵������和������为相似矩阵, 即存在非奇异矩阵������使得������ = ������−1 ������������,则 (1) 矩阵������和������的特征值相等,即 ������(������) = ������(������) ; (2) 若������为������的特征向量,则相应地,������������为������的特征向量. 通过相似变换并不总能把矩阵转化为对角阵,或者说矩阵 ������ 并不总是 可对角化 的 (diagonalizable). 下面给出特征值的代数重数、几何重数,和亏损矩阵的概念,以及几个定 理.. ̃1 , ⋯ , ������ ̃������ ,若������ ̃������ 是特征方程的������������ 重 定义 5.2: 设矩阵������ ∈ ℝ������×������ 有 m 个(mn)不同的特征值������ ̃������ 的代数重数(algebraic multiplicity),并称������ ̃������ 的特征子空间(ℂ������ 的子空间)的维数 根,则称������������ 为������ ̃������ 的几何重数(geometric multiplicity). 为������ ̃1 , ⋯ , ������ ̃������ ,特征值������ ̃������ , (������ = 1, ⋯ , ������)的代数 定理 5.6:设矩阵������ ∈ ℝ������×������ 的 m 个不同的特征值为������ 重数为������������ ,几何重数为������������ ,则 (1) ∑������ ������=1 ������������ = ������,且任一个特征值的几何重数不大于代数重数,即∀������,������������ ≥ ������������ . (2) 不同特征值的特征向量线性无关,并且将所有特征子空间的∑������ ������=1 ������������ 个基(特征向量)放在 一起,它们构成一组线性无关向量. (3) 若每个特征值的代数重数等于几何重数,则总共可得������个线性无关的特征向量,它们是 全空间ℂ������ 的基. 定义 5.3:若矩阵������ ∈ ℝ������×������ 的某个代数重数为 k 的特征值对应的线性无关特征向量数目少于 k(即几何重数小于代数重数) ,则称 ������为亏损阵(defective matrix) ,否则称其为非亏损阵 (nondefective matrix). 定理 5.7:设矩阵������ ∈ ℝ������×������ 可对角化,即存在非奇异矩阵������ ∈ ℂ������×������ 使得 ������−1������������ = ������, 其中������ ∈ ℂ������×������ 为对角阵, 的充要条件是������为非亏损矩阵. 此时,������的对角线元素为矩阵������的特 征值,而矩阵������的列向量为 n 个线性无关的特征向量. 定理 5.7 中方程的等价形式为������ = ������������������−1, 它被称为特征值分解,也叫谱分解(spectrum decomposition). 特征值分解存在的充要条件是������为非亏损矩阵. 但现实中还有很多矩阵是亏 损矩阵,例如例 5.2 中的矩阵,它的特征值 2 的代数重数为 2,而几何重数仅为 1. 这种矩阵
5.1 基本概念与特征值分布
本节先介绍矩阵围的简 单估计方法.
5.1.1 基本概念与性质
定义 5.1:矩阵������ = (������������������ ) ∈ ℂ������×������ , (1) 称 ������(������) = det(������������ − ������) = ������������ + ������1 ������������−1 + ⋯ + ������������−1 ������ + ������������ 为������的特征多项式(characteristic polynomial);n 次代数方程 ������(������) = 0 为 ������ 的 特 征 方 程 (characteristic equation) , 它 的 n 个 根 : ������1 , ⋯ , ������������ , 被 称 为 ������ 的 特 征 值 (eigenvalue). 此外,常用������(������)表示������的全体特征值的集合,也称为特征值谱(spectrum of eigenvalue). (2) 对于矩阵������的一个给定特征值������,相应的齐次线性方程组 (������������ − ������)������ = ������ , (5.1) 有非零解(因为系数矩阵奇异) ,其解向量������称为矩阵������对应于������的特征向量(eigenvector). 根据方程(5.1),我们得出矩阵特征值与特征向量的关系,即 (5.2) ������������ = ������������ . 第三章的定义 3.5 就利用公式(5.2)对矩阵特征值和特征向量进行了定义,它与定义 5.1 是等 价的. 另外,同一个特征值对应的特征向量一定不唯一,它们构成线性子空间,称为特征子 空间(eigenspace). 我们一般讨论实矩阵的特征值问题. 应注意, 实矩阵的特征值和特征向量不一定是实数 和实向量,但实特征值一定对应于实特征向量(方程(5.1)的解) ,而一般的复特征值对应的 特征向量一定不是实向量. 此外,若特征值不是实数, 则其复共轭也一定是特征值(由于特 征方程为实系数方程). 定理 3.3 表明,实对称矩阵������ ∈ ℝ������×������ 的特征值均为实数,存在 n 个 线性无关、且正交的实特征向量,即存在由特征值组成的对角阵������和特征向量组成的正交阵 ������,使得: (5.3) ������ = ������������������������ . 例 5.1 (弹簧-质点系统) : 考虑图 5-1 的弹簧-质点系统, 其中包括三个质量分别为������1、 ������2、 ������3的物体,由三个弹性系数分别为������1 , ������2 , ������3的弹簧相连,三个物体的位置均为时间的函数,
−1 2
5 −1 −1 ������ = [3 1 −1] 4 −2 1 的特征值和特征向量. [解]: 矩阵������的特征方程为: ������ − 5 1 1 det(������������ − ������) = | −3 ������ − 1 1 | = (������ − 3)(������ − 2)2 = 0 −4 2 ������ − 1 故������的特征值为������1 = 3,������2 = 2(二重特征值). 当������ = ������1 = 3时,由(������������ − ������)������ = ������,得到方程 −2 1 1 ������1 0 [−3 2 1] [������2 ] = [0] −4 2 2 ������3 0 它有无穷多个解,若假设������1 = 1, 则求出解为������ = [1,1,1]������ ,记为������1,则������1是������1对应的一个特 征向量. 当������ = ������2 = 2时,由(������������ − ������)������ = ������,得到方程 −3 1 1 ������1 0 [−3 1 1] [������2 ] = [0] −4 2 1 ������3 0 它有无穷多个解,若假设������1 = 1, 则求出解为������ = [1,1,2]������ ,记为������2,则������2是������2对应的一个特
②
本书第八章将介绍这种常微分方程组的数值求解方法. –3–
征向量. 下面概括地介绍有关矩阵特征值、特征向量的一些性质,它们可根据定义 5.1,以及公 式(5.2)加以证明. 定理 5.1:设������������ (������ = 1,2, … , ������)为 n 阶矩阵������的特征值,则 ������ (1) ∑������ ������=1 ������������ = ∑������=1 ������������������ = tr(������) ; (2) ∏������ ������=1 ������������ = det(������) . 这里tr(������)表示矩阵对角线上元素之和,称为矩阵的迹(trace). 从上述结论(2)也可以看出, 非奇异矩阵特征值均不为 0, 而 0 一定是奇异矩阵的特征值. 定理 5.2:矩阵转置不改变特征值,即������(������) = ������(������������ ). 定理 5.3:若矩阵������为对角阵或上(下)三角阵,则其对角线元素即为矩阵的特征值. 定理 5.4:若矩阵������为分块对角阵,或分块上(下)三角阵,例如 ������11 ������ = [ ������12 ������22 ⋯ ⋯ ⋱ ������1������ ������2������ ], ⋮ ������������������
其中������ = √−1,根据它可求解出振动的频率������及振幅������������ . 由这个式子可得出: ������������′′ (������) = −������2������������ ������ ������������������ , (������ = 1, 2, 3) 代入微分方程,可得代数方程: −������2 ������������ + ������������ = ������, 或 ������������ = ������������ , 其中������ = ������ ������, ������ = ������ . 通过求解矩阵������的特征值便可求出这个弹簧-质点系统的自然频率 (有多个). 再结合初始条件可确定这三个位移函数,它们可能按某个自然频率振动(简正 振动) ,也可能是若干个简正振动的线性叠加. 例 5.2(根据定义计算特征值、特征向量) :求矩阵