第8章 矩阵特征值计算
数值分析—矩阵特征值问题的数值计算
( vk +1 )i vk = α1 x1 , lim = λ1 . k k →∞ λ k →∞ ( v ) k i 1
lim
可见,当 k 充分大时, vk 近似于主特征向量(相差一个常数倍) , vk +1 与 vk 的对应非零分 量的比值近似于主特征值。 在实际计算中,需要对计算结果进行规范化。因为当 λ1 <1 时, vk 趋于零;当 λ1 >1 时 , vk 的 非 零 分 量 趋 于 无 穷 , 从 而 计 算 时 会 出 现 下 溢 或 上 溢 。 为 此 , 对 向 量
λ1 ≥ λ2 ≥ L ≥ λn ,
∑x y
i =1 i
n
i
为向量 x 和 y 的内积。
定理 8.3 设 A 为 n 阶实对称矩阵,其特征值都为实数,排列为 对应的特征向量 x1 , x2 ,L , xn 组成正交向量组,则有 1) 对任何非零向量 x ∈ R n ,有 λn ≤ R( x) ≤ λ1 , 2) λ1 = max R ( x) = R( x1 ) ,
Ζ = ( z1 , z2 ,L, zn )T ∈ R n , 记 max( Ζ) = zi ,其中 zi = Ζ ∞ ,这样, 我们有 如 下 乘幂 法 的实 用
的计算公式: 任取 v0 = u0 ≠ 0 ,对于 k = 1, 2,L 分别计算 vk = Auk −1 , uk = vk / max(vk ). 求出对应矩阵的主特征向量和特征值的近似值,有下面的定理。 定理 8.4
m1 0 M = 0 0 0
称为质量矩阵,而
0 m2 0 0 0
0 0 m3 0 0
0 0 0 m4 0
0 0 0 0 m5 0 0 −k4 k 4 + k5 − k5 0 0 0 − k5 k5
8 矩阵的特征值和特征向量的计算
由上可见经过7次迭代, m7的值已稳定到小数后5位,故所 求的按模最大特征值和对应的特征向量可取作:
1 44 . 9995 , x 1 (1, 0 . 333 , 0 . 6667 )
T
(2)反幂法
基本思路: 设A没有零特征值,则A非奇异,即A的逆阵存 在,设的特征值为 1 2 n 0 其对应的特征向量为 2 , 3 , , n 因为 A xk = k xk
8.2 按模最大与最小特征值的计算
(1)幂法
定理:设矩阵A的特征值为
1 2 n
并设A有完全的特征向量系 1 , 2 , , n (它们线性无关), 则对任意一个非零向量V0Rn 所构造的向量序列 V AV
k k 1
有
lim
(V k ) j (V k 1 ) j
k j 1 k 1 j
若按上述计算过程,有一严重缺点,当|1|>1 (或| 1 |<1时) {Vk}中不为零的分量将随K的增大而无限增大,计算机就可 能出现上溢(或随K的增大而很快出现下溢),因此,在实 际计算时,须按规范法计算,每步先对向量Vk进行“规范 化”, 即取Vk中绝对值最大的一个分量记作 mk =max(Vk ),用mk遍除的所有向量Vk ,得到规范化向量。 为说明上述算法的正确性,我们试证明下述定理 定理二:在定理一的条件下,规范化向量序列{uk}收敛于 矩阵A按模最大的特征值1对应的特征向量,而向量序列 {Vk}的绝对值最大的分量mk收敛于1,即
k k k k
1 [ 1 1
k
i k i( ) i] 1 i2
n
同理可得 V k 1 1 [ 1 1 i (
特征值计算方法
y2
=
Au1
=
⎡151 / 13⎤
⎢ ⎣
25
/
13
⎥ ⎦
=
⎡11.6154⎤
⎢ ⎣
1.9231
⎥ ⎦
,
u2
=
y2
max( y2 )
=
⎡1⎤ ⎢⎣25 /151⎥⎦
=
⎡1⎤ ⎢⎣0.1656⎥⎦
μ2 = max( y2 ) = 151/13 = 11.6154 --------------------------------------------(6 分)
⎢⎣ 0
0 1⎥⎦ ⎢⎣ 0
0
1⎥⎦
⎡2.236068
A1
=
R1 A0 R1T
=
⎢ ⎢
0
⎢⎣0.525731
0 −2.236068 0.850651
0.525731⎤ 0.850651⎥⎥ ,-------------------------(10 分)
3 ⎥⎦
⎡0.850651
H1T
=
H
T 0
R1T
五、(12 分)
解:(1)因为 w = x + v = x + Hx = 2x − 2(uT x)u ,则
wT u = [2 xT − 2(uT x)uT ]u = 2 xT u − 2(uT x)uT u = 0 。----------------------------(3 分)
⎛0⎞
(2)由 Hb = (0
=
IR1T
=
⎢⎢0.525731
⎢⎣ 0
−0.525731 0.850651
0
0⎤ 0⎥⎥ (列存放相应的特征向量), 1⎥⎦
第8章矩阵特征值计算
(2) 如果 A∈Rn×n 有 m 个(m≤n)不同的特征值 λ1 ,λ2 ,…,λm , 则对应的特征向 量 x1 ,x2 ,…xm 线性无关.
5
数值分析
第8章 矩阵特征值计算
定理 7(对称矩阵的正交约化) 设 A∈Rn×n 为对称矩阵,则 (1) A 的特征值均为实数; (2) A 有 n 个线性无关的特征向量; (3) 存在一个正交矩阵 P 使得
定理 8 (Gerschgorin 圆盘定理) (1) 设 A=(aij)n×n ,则的每一个特征值必属于下属某个圆盘之中
n
| aii | ri
| aij |
j 1, j i
或者说, A 的特征值都在复平面上 n 个圆盘的并集中. (2) 如果 A 有 m 个圆盘组成一个连通的并集 S, 且 S 与余下 n-m 个圆盘 是分
uk
vk
k
vk1 Auk
if
vk1 vk
输出vk 1和k
26
数例值分1析:利用幂法求下列矩阵A 的模 第82章 矩1阵特0征值计算
最大的特征值及相应的特征向量. A 1 3 1
(取初始向量为 v0 (1 1 1)T )
0 1 4
解:Step0
0 u0
v1
vv00
1
(1
0
Au0 (3
1
10
数值分析
D2 :
第8章 矩阵特征值计算
n
| | r2 | a2 j | 2 j 1 j2
D3 :
n
| 4 | r3 | a3 j | 2 j 1 j3
由上述定理结论可知A的三个特征值位于 三个圆盘的并集中,
11
数值分析
第8章 矩阵特征值计算
计算方法第八章矩阵特征值计算
R(vk
)
( Avk , vk ) (vk , vk )
1
o
2 1
2k
由幂法迭代向量 uk , 得
max(
uk
)
1
o
2 1
k
23
3 反幂法 (1) 计算矩阵按模最小特征值
反幂法是用幂法计算矩阵A的逆矩阵 A1 按模最大
特征值的方法,即计算矩阵A的按模最小特征值的
方法。
设A为n阶非奇异矩阵,其特征值排列次序为
于是
n
n
n
vk Akv0 Ak ( ai xi ) ai Ak xi aiik xi
i 1
i 1
i 1
9
幂法
以下只考虑主特征值是单重实值的情形。
设 1 2 n , 则
vk
a11k x1
n i2
aiik xi
1k
a1
x1
n i2
ai
(
i 1
)k
xi
对于充分的k,i
1
21
幂法的加速
(2)Rayleigh(瑞利)商加速 设A为n阶实对称矩阵,x为任一n维非零向量,称数
R(x) (Ax, x) (x, x)
为对应于向量x的Rayleigh商。
R( x1 )
( Ax1, x1) (x1, x1)
1
22
幂法的加速
可证,对应于幂法中迭代向量vk 的Rayleigh商为
AR(p,q)只改变 A的第p列,第q列元素; 3 若A为对称矩阵, 则 RT ( p, q)AR( p, q)
亦为对称矩阵,且与A具有相同的特征值。
35
Jacobi方法
考虑到A的第k次相似变换
第8章-矩阵特征值计算
min P1 P I ,
( A)
p
pp
(1.5)
其中||·||p为矩阵的p范数,p=1,2,.
证明 由于σ(A)时显然成立,故只考虑̄σ(A).这
时D-I非奇异,设x是A+I对应于的特征向量,由
(A+I-I)x=0左乘P-1可得 (D I )(P1 x) (P1IP)(P1 x), P1 x (D I )1 (P1 IP)(P1 x),
上页 下页
定理7 设A∈Rn×n有n个线性无关的特征向量,
主特征值1满足 |1|>|2||n|,
则对任何非零向量v0(a10),(2.4)式和(2.7)式成立.
如果A的主特征值为实的重根, 即1=2==r, 且 |r|>|r+1||n|,
又设A有n个线性无关的特征向量,1对应的r个线性
无关的特征向量为x1,x2,,xr,则由(2.2)式有
3 1 5.
A的其它两个特征值2, 3包含在D2, D3的并集中.
上页 下页
现在取对角阵
1 0 0
D1 0 1 0 ,
0 0 0.9
做相似变换
4 1 0
A A1 D1 AD 1
0
10 9
.
0.9 0.9 4
矩阵A1的3个圆盘为
E1 : 4 1,
E2 :
19 , 9
矩阵,则
(1) A的特征值均为实数;
(2) A有n个线性无关的特征向量;
(3) 存在一个正交矩阵P使的
1
PT AP
2
,
n
且1, 2,, n为A的特征值,而P=(u1,u2,,un)的列
向量uj为A的对应于j 的单位特征向量.
8、矩阵特征值问题计算
对应的特征向量x1, x2 ,, xm线性无关.
定理7(对称矩阵的正交约化 ) 设A R nn为对称矩阵 , 则
(1) A的特征值均为实数; (2) A有n个线性无关的特征向量; (3) 存在正交矩阵P使得
1 2 , P 1 AP n 且i (i 1,2,, n)为A的特征值, 而P (u1,u2 , ,un )的列 向量u j为对应于 j的特征向量.
k
k
k A v0 max(vk ) max max(Ak 1v ) 0 k k 2 n 1 maxa1 x1 a2 x2 an xn 1 1 k 1 k 1 2 n maxa1 x1 a2 x2 an xn 1 1 1 (k )
k k 1
lim
vk
a1 x1.
即vk 是1的近似的特征向量. 而主特征值 (vk 1 ) j 1 n (vk 1 ) j 1 , 或1 . (v k ) j n j 1 (v k ) j
定理12 设A R nn有n个线性无关的特征向量, 其特征值
1 2 n ,
并设A的主特征值是实根,且满足
1 2 n ,
现在讨论求1及x1的基本方法.
(2.1)
v0 a1 x1 a2 x2 an xn , (设a1 0)
v1 Av0 a11 x1 a22 x2 ann xn ,
k k 2 n k vk Avk 1 1 a1 x1 a2 x2 an xn . 1 1 k 当k很大时,k 1 a1 x1, vk 1 1vk , Avk 1vk, v
矩阵特征值计算矩阵的特征值和特征向量
矩阵特征值计算矩阵的特征值和特征向量矩阵是线性代数中的重要概念之一,它在众多学科领域中都有广泛的应用。
而矩阵的特征值和特征向量则是矩阵分析与应用中的核心内容之一。
本文将详细介绍矩阵特征值的计算方法,以及如何求解矩阵的特征向量。
1. 特征值和特征向量的定义首先,我们来了解一下什么是矩阵的特征值和特征向量。
给定一个n阶方阵A,如果存在一个数λ以及一个非零n维列向量X,使得满足下述条件:AX = λX那么,λ就是矩阵A的一个特征值,而X则是对应于特征值λ的特征向量。
特征值和特征向量的求解在很多应用中都具有重要的意义。
2. 特征值的计算方法接下来,我们介绍几种常见的特征值计算方法。
2.1 特征多项式法特征多项式法是求解特征值的一种常用方法。
它利用方阵A减去λ乘以单位矩阵I之后的行列式为零的性质,构造出特征多项式,并求解多项式的根即可得到特征值。
举个例子,对于二阶方阵A = [a, b; c, d],其特征多项式为:| A - λI | = | a-λ, b; c, d-λ | = (a-λ)(d-λ) - bc = 0解这个方程可以得到A的特征值。
2.2 幂迭代法幂迭代法也是一种常见的特征值计算方法。
它利用特征向量的性质,通过迭代计算来逼近矩阵的特征值。
其基本思想是,给定一个初始向量X0,不断迭代计算:Xk+1 = AXk然后对得到的向量序列进行归一化处理,直到收敛为止。
最后得到的向量X就是对应的特征向量,而特征值可以通过如下公式计算:λ = X^TAX / X^TX2.3 QR方法QR方法是一种数值稳定性较好的特征值计算方法。
它利用矩阵的QR分解的性质来逐步逼近矩阵的特征值。
首先,对矩阵A进行QR分解,得到一个正交矩阵Q和一个上三角矩阵R。
然后,将分解后的矩阵R与矩阵Q逆序相乘,得到一个新的矩阵A'。
重复进行QR分解和相乘的操作,直到收敛为止。
最后,得到的矩阵A'的对角线上的元素即为矩阵A的特征值。
求矩阵特征值方法
求矩阵特征值方法特征值是线性代数中一个重要的概念,用于描述矩阵的性质和变换特征。
求矩阵特征值的方法有很多种,包括直接求解特征值方程和使用特征值分解等。
下面将介绍这些方法的原理和具体步骤。
1. 直接求解特征值方程直接求解特征值方程是一种常见的求解矩阵特征值的方法。
对于一个n阶矩阵A,特征值方程的定义为:det(A-λI) = 0其中,det表示矩阵的行列式,λ是特征值,I是单位矩阵。
通过求解这个特征值方程,可以得到矩阵A的所有特征值。
具体步骤如下:1) 将矩阵A减去λ倍的单位矩阵I,形成一个新的矩阵B=A-λI。
2) 计算矩阵B的行列式,即det(B)。
3) 将det(B)等于0,得到一个关于λ的方程,即特征值方程。
4) 求解方程,得到矩阵的特征值。
2. 特征值分解特征值分解是将一个矩阵表示为特征向量和特征值的乘积的形式。
特征值分解的基本思想是,将一个矩阵A分解为一个特征向量矩阵P和一个对角矩阵D的乘积,其中P的列向量是A的特征向量,D的对角线上的元素是A的特征值。
具体步骤如下:1) 求解矩阵A的特征值和相应的特征向量。
2) 将特征向量按列排成一个矩阵P,特征值按对应的顺序排成一个对角矩阵D。
3) 验证特征值分解的正确性,即验证A=PD(P的逆矩阵)。
特征值分解具有很多应用,如对角化、对称矩阵的谱定理等。
3. 幂法幂法是求解矩阵特征值中的一种迭代方法,适用于对称矩阵或有且仅有一个最大特征值的情况。
幂法的基本思想是通过多次迭代得到矩阵A的一个特征向量,这个特征向量对应于矩阵A的最大特征值。
具体步骤如下:1) 初始化一个n维向量x0,可以是任意非零向量。
2) 进行迭代计算:xn=A*xn-1,其中A是待求特征值的矩阵。
3) 归一化向量xn,得到新的向量xn+1=xn/ xn 。
迭代的过程中,xn的方向趋向于特征向量,而xn的模长趋于特征值的绝对值。
当迭代次数足够多时,得到的向量xn就是特征值对应的特征向量。
第八章矩阵特征值
第八章矩阵特征值8.1特征值的定义在线性代数中,一个n阶方阵A的特征值(Eigenvalue)是指一个标量λ,使得下面的等式成立:Ax=λx其中x是一个非零的n维向量,被称为对应于特征值λ的特征向量(Eigenvector)。
特别地,一些情况下,我们有:AX=λX。
这是一个常见的特殊情况,被称为多重特征值(Multiple Eigenvalues)。
8.2特征值与特征向量的求解我们可以通过以下方式求解矩阵的特征值与特征向量。
1.设A是一个n阶方阵,特征值为λ,特征向量为X,我们有AX=λX。
2.将等式重写为AX–λX=0,再移项得到(A–λI)x=0。
3.构造(A–λI)矩阵,其中I是单位矩阵。
4.解方程组(A–λI)X=0,求解零空间的基础解系(基础特征向量)。
5.基础特征向量的线性组合即为所有特征向量。
8.3特征值的性质矩阵的特征值具有一些性质,包括:1.特征值的个数等于矩阵的阶数。
一个n阶矩阵A最多有n个不同的特征值。
2.特征值的乘积等于矩阵的行列式。
即特征值λ1,λ2,…,λn与矩阵A的特征多项式p(λ)=,A-λI,的系数关系为λ^n+a_{n-1}λ^(n-1)+…+a_1λ+a_0。
3.特征值的和等于矩阵的迹。
即矩阵A的特征值λ1,λ2,…,λn 满足λ1+λ2+…+λn=Tr(A),其中Tr(A)为矩阵A的迹(对角线上元素之和)。
4.特征值与行列式的关系。
矩阵A的特征值λ1,λ2,…,λn都满足,A-λI,=0,即他们是矩阵A的特征方程的根。
8.4矩阵的对角化对角化是指将一个矩阵通过相似变换,将其转化为对角矩阵的过程。
对角化的主要目的是将矩阵的运算简化为对角矩阵的运算,从而更易于求解。
一个n阶方阵可以对角化的条件是它有n个线性无关的特征向量,即A的特征向量数量等于A的阶数。
通过对角化,可以将矩阵A表示为:A=P^(-1)DP其中D是对角矩阵,P是可逆矩阵,P的列向量是A的特征向量。
求矩阵特征值的方法
求矩阵特征值的方法介绍在线性代数中,矩阵特征值是一个重要的概念。
特征值可以帮助我们了解矩阵的性质和特点。
求解矩阵特征值的方法有很多种,每种方法都有其适用的场景和优缺点。
本文将介绍几种常用的方法,包括幂法、QR方法、雅可比方法和特征值问题的迭代解法。
幂法幂法是一种用于估计矩阵最大特征值和对应特征向量的迭代算法。
该方法的基本思想是通过不断迭代矩阵与向量的乘积,使得向量逐渐趋近于特征向量。
具体步骤如下:1.随机选择一个向量b作为初始向量。
2.计算矩阵A与向量b的乘积,得到向量c。
3.对向量c进行归一化处理,得到向量b。
4.重复步骤2和步骤3,直到向量b的变化趋于稳定。
5.向量b的模即为矩阵A的最大特征值的估计值,向量b即为对应的特征向量的估计值。
幂法的收敛速度取决于矩阵A的特征值分布。
如果矩阵A的最大特征值与其他特征值之间的差距较大,那么幂法往往能够快速收敛。
QR方法QR方法是一种迭代算法,用于计算实对称矩阵的特征值。
该方法的基本思想是通过不断迭代矩阵的QR分解,使得矩阵逐渐趋近于上三角矩阵,从而得到特征值的估计值。
具体步骤如下:1.对矩阵A进行QR分解,得到正交矩阵Q和上三角矩阵R。
2.计算矩阵R与矩阵Q的乘积,得到新的矩阵A。
3.重复步骤1和步骤2,直到矩阵A的变化趋于稳定。
4.矩阵A的对角线元素即为矩阵A的特征值的估计值。
QR方法的收敛速度较快,并且对于任意实对称矩阵都适用。
但是,QR方法只能计算实对称矩阵的特征值,对于一般的矩阵则不适用。
雅可比方法雅可比方法是一种用于计算实对称矩阵的特征值和特征向量的迭代算法。
该方法的基本思想是通过不断迭代交换矩阵的非对角线元素,使得矩阵逐渐趋近于对角矩阵,从而得到特征值和特征向量的估计值。
具体步骤如下:1.初始化一个单位矩阵J,将其作为迭代的初始矩阵。
2.在矩阵J中找到非对角线元素的绝对值最大的位置,记为(i, j)。
3.构造一个旋转矩阵P,使得P^T * J * P的(i, j)位置元素为0。
矩阵特征值的求法举例
矩阵特征值的求法举例特征值是线性代数中一个重要的概念,它能够描述一个矩阵对应的线性变换的特性。
在实际应用中,我们经常需要计算一个矩阵的特征值。
本文将通过举例来讲解矩阵特征值的求法。
我们来介绍一下什么是特征值。
给定一个n×n的矩阵A,如果存在一个非零向量v,使得Av=λv,其中λ为常数,那么我们称λ为矩阵A的特征值,而v称为矩阵A对应于特征值λ的特征向量。
计算矩阵特征值的方法有很多,包括特征值分解、幂法、反幂法、QR方法等。
下面我们来逐一介绍这些方法,并通过具体的例子进行说明。
1. 特征值分解法特征值分解是指将一个矩阵分解成特征值和特征向量的乘积的形式,即A=QΛQ^-1,其中Q是特征向量组成的矩阵,Λ是对角矩阵,其对角线上的元素是矩阵A的特征值。
举例:假设有一个2×2的矩阵A=[4, 2; 1, 3],我们来计算其特征值。
首先我们要求解方程det(A-λI)=0,其中I是单位矩阵,λ是待求的特征值。
展开方程可得(4-λ)(3-λ)-2·1=0,解这个二次方程可得λ1=5,λ2=2。
2. 幂法幂法是一种迭代法,用于求解特征值模最大的特征值和对应的特征向量。
举例:假设有一个3×3的矩阵A=[1, 2, 3; 1, 3, 2; 3, 2, 1],我们来计算其特征值和特征向量。
首先我们随机选取一个初始向量x^(0),计算向量序列x^(k+1)=Ax^(k),迭代到收敛后,我们取得到的向量x^(k+1)的模最大的分量作为矩阵A的特征值模最大的特征向量。
然后,我们将这个特征向量归一化,即除以特征值模最大的分量,得到单位特征向量。
我们将单位特征向量与矩阵A相乘,可得到特征值l。
通过幂法计算可得矩阵A的特征值l≈2.863,以及对应的特征向量v≈[0.618, 0.618, 0.486]。
3. QR方法QR方法是一种迭代法,用于求解特征值。
举例:假设有一个5×5的矩阵A=[3, -1, 0, 0, 0; -1, 3, -1, 0, 0; 0, -1, 3, -1, 0; 0, 0, -1, 3, -1; 0, 0, 0, -1, 3],我们来计算其特征值。
矩阵特征值的求法
矩阵特征值的求法
矩阵特征值是矩阵在特定方向上的伸缩比率,或者说是矩阵在某
些方向上的重要程度,因此它在数学中有很多的应用。
在这篇文章中,我们将介绍矩阵特征值的求法。
一、定义
矩阵特征值是矩阵 A 的特征多项式P(λ) 的根,即
P(λ)=det(A-λI)=0,其中 I 是单位矩阵,det 表示行列式。
该多项
式的阶数等于矩阵 A 的阶数。
二、求法
1. 直接计算
对于小阶的矩阵,可以直接求解特征多项式的根,得到特征值。
2. 特征值分解
对于大阶的矩阵,可以通过特征值分解的方式求得矩阵的特征值。
特征值分解是一种将矩阵分解为特征向量和特征值的方法,即矩阵
A=QΛQ^-1,其中 Q 是正交矩阵,Λ 是对角矩阵,其对角线上的元素
就是特征值。
3. 幂迭代法
幂迭代法是一种通过连续迭代计算矩阵 A 的最大特征值和对应
特征向量的方法。
该方法的基本思想是利用矩阵特征值的性质,通过
不断迭代对特征向量进行单调放缩,最终得到矩阵的最大特征值和对
应特征向量。
4. QR 分解法
QR 分解法是一种通过 QR 分解求解矩阵特征值和特征向量的方法。
该方法的基本思想是将矩阵 A 分解为一个正交矩阵 Q 和一个上
三角矩阵 R,即 A=QR,然后对 R 迭代求解特征值和特征向量。
三、总结
矩阵特征值的求法有多种方法,其中直接计算适用于小阶矩阵,
而特征值分解、幂迭代法和 QR 分解法则适用于大阶矩阵。
在实际应
用中,需要根据具体情况选择合适的方法,以便快速、准确地求解矩阵的特征值和特征向量。
矩阵特征值计算方法
)。
(1)按照行列指标的自然顺序选取旋转平面;
(2)每次迭代选取矩阵中绝对值最大的元素所在的行列作为旋转平面;
(3)每次迭代选取矩阵中非对角元素绝对值最大者所在的行列作为旋转平面;
(4)选取旋转平面的原则是使每次迭代矩阵的 F − 范数尽可能地减少。
二、填空题(每小题 3 分,共计 15 分)
⎡2 1、设 A = ⎢⎢−1
。
1
⎡6 2 1⎤
四、(14
分)已知矩阵
A
=
⎢ ⎢
2
3
1⎥⎥ ,试用带位移的反幂法计算其最接近 6 的特征值及对
⎢⎣1 1 1⎥⎦
应的特征向量,初始向量取
u0
=
(9 5
1
3 )T ,迭代两步。 2
五、(12 分)(1)设 uT u = 1, H = I − 2uuT ,且 v = Hx, x ∈ Rn , w = x + v ,证明 wT u = 0 ;
2 0
−1 1
1 3
⎟ ⎟⎟⎠
,则区间 [0,
4]
内包含矩阵
A
的
5、计算矩阵特征值的雅可比迭代过程中采用
个特征值。 变换方法产生矩阵序列。
三、(10
分)利用幂法求矩阵 A =
⎡11
⎢ ⎣
1
2⎤ 3⎥⎦
的模最大的特征值以及相应的一个特征向量,迭
[ ] 代至相邻两次特征值的误差不超过 0.5 ,取初始向量 x0 = 1 1 T 。
⎢⎣ 2
−1⎤
2
⎥ ⎥
,求一正交矩阵
P
=
2 ⎥⎦
,使得 PA 为上梯形矩阵。
2、如果 A ∈ Rm×n 的所有特征值都是半单的,则称 A 为____
矩阵特征值的求法举例
矩阵特征值的求法举例矩阵特征值的求法是线性代数中一个重要的内容,它在解决相应的数学问题中发挥着关键的作用。
在本文中,我们将重点介绍矩阵特征值的求法的基本概念和方法,并通过具体的例子来解释其求解过程。
让我们来了解一下矩阵特征值的概念。
矩阵特征值是指方阵在特定变换下所呈现的特征性质,它是一种描述矩阵变换行为的重要指标。
在线性代数中,矩阵特征值通常表示为λ,其计算过程是通过对矩阵进行特征值分解来获得的。
我们来介绍一下矩阵特征值的计算方法。
对于一个n阶方阵A,其特征值满足特征多项式的根,即满足方程|A-λI|=0的λ值。
其中I为n阶单位矩阵。
而方程|A-λI|=0又称为特征方程,它是一个n次多项式方程,通过解特征方程即可求得矩阵的特征值。
但是直接求解n次特征方程并不是一种高效的方法,所以我们常常采用其他技巧来简化计算,比如将特征方程转化为二次方程组来求解。
下面,我们通过一个具体的例子来说明矩阵特征值的求法。
假设我们有一个2阶方阵A= [1 2; 3 4],我们要求解其特征值。
我们列出特征方程:|A-λI|=0即,|1-λ 2; 3 4-λ|=0展开计算后得到:(1-λ)(4-λ)-2*3=0化简得到λ^2-5λ+2=0解这个二次方程,我们可以使用求根公式,也可以通过配方法或相乘得到两个因子后分别求解。
我们用求根公式得到:λ1=(5+√17)/2,λ2=(5-√17)/2由此可得该矩阵A的两个特征值分别为(5+√17)/2和(5-√17)/2。
通过这个例子,我们可以清晰地看到矩阵特征值的求解过程。
我们首先列出特征方程,然后通过求解特征方程得到特征值。
这个过程是非常直观的,但是对于更高阶的方阵来说,直接求解特征方程是非常繁琐且复杂的。
所以在实际计算中,我们要采用更加高效的算法来求解特征值。
除了通过特征方程求解特征值外,我们还可以通过其他方法来求解矩阵的特征值。
比如通过矩阵的迹和行列式来计算。
矩阵的迹是指方阵主对角线上元素的和,行列式是矩阵的一种特定性质,对于2阶矩阵A=[a b; c d],其行列式为 ad-bc。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章 矩阵特征值计算1 特征值性质和估计工程实践中有许多种振动问题,如桥梁或建筑物的振动,机械机件的振动,飞机机翼的颤动等,这些问题的求解常常归纳为求矩阵的特征值问题。
另外,一些稳定分析问题及相关问题也可以转化为求矩阵特征值与特征向量的问题。
1.1 特征值问题及性质设矩阵n n ⨯∈A R (或n n ⨯C ),特征值问题是:求C λ∈和非零向量n R ∈x ,使λ=Ax x (1.1)其中x 是矩阵A 属于特征值λ的特征向量。
A 的全体特征值组成的集合记为sp()A 。
求A 的特征值问题(1.1)等价于求A 的特征方程()det()0p I λλ=-=A (1.2)的根。
因为一般不能通过有限次运算准确求解()0p λ=的根,所以特征值问题的数值方法只能是迭代法。
反之,有时为了求多项式111()n n n n q a a a λλλλ--=++++L的零点,可以把()q λ看成矩阵123101010n a a a a ----⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦L O O 的特征多项式(除(1)n -因子不计)。
这是一个Hessenberg 矩阵,可用QR 方法求特征值,从而求出代数方程()0q λ=的根。
矩阵特征值和特征向量的计算问题可分为两类:一类是求矩阵A 的全部特征值及其对应的向量;另一类是求部分特征值(一个或几个、按模最大或最小)及其对应的特征向量。
本章介绍部分特征值和特征向量的幂法、内积法;求实对称矩阵全部特征值的雅可比法、Given 方法和Householder 方法;求任意矩阵全部特征值的QR 算法。
在第5章已给出特征值的一些重要性质,下面再补充一些基本性质。
定理1 设n n R ⨯∈A ,则(1) 设λ为A 的特征值,则λμ-为μ-A I 的特征值;(2) 设12,,,n λλλL 是A 的特征值,()p x 是一多项式,则矩阵()p A 的特征值是12(),(),,()n p p p λλλL 。
特别地,k A 的特征值是12,,,k k k n λλλL 。
定理2 (1)设n n R ⨯∈A 可对角化,即存在非奇异矩阵P 使121n P P λλλ-⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭A O 的充分必要条件是A 具有几个线性无关的特征向量。
(2) 如果A 有m 个()m n ≤不同的特征值12,,,m λλλL ,则对应的特征向量12,,,m x x x L 线性无关。
定理3 设n n R ⨯∈A 为对称矩阵,则(1) A 的特征值均为实数。
(2) A 有n 个线性无关的特征向量。
(3) 存在一个正交矩阵P 使12T n P P λλλ⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭A O 且(1,2,,)i i n λ=L 为A 的特征值,而12(,,,)n =P u u u L 的列向量j u 为A 对应于j λ的特征向量。
定理4 设n n R ⨯∈A 为对称矩阵(其特征值依次记为12n λλλ≥≥≥L ),则 (1) 1(,)(,)n x x x x λλ≤≤A (对任何非零向量n R ∈x )。
(2) 100(,)(,)max ,min (,)(,)n n n x R x R x x x x x x x x x x λλ∈∈≠≠==A A (1.3) 记(,)(),0(,)x x R x x x x =≠A ,称为矩阵A 的瑞利(Rayleigh)商。
证明 只证(1), (2)留作习题。
由于A 为实对称矩阵,可将12,,,n λλλL 对应的特征向量12,,,n x x x L 正交规范化,则有(,)i j ij δ=x x 。
设0≠x 为n R 中任一向量,则有1n i i i α==∑x x ,21/221()0ni i α==≠∑x于是2211(,)(,)n ni i i i i x x x x αλα===∑∑A 从而(1)成立。
结论(1)说明瑞利商必位于n λ和1λ之间。
1.2特征值估计与扰动定义1 设()ij n n a ⨯=A 。
令 (1) 1(1,2,)ni ij j j i r a i n =≠==∑L ;(2)集合{},i ii i D z z a r z C =-≤∈。
称复平面上以ii a 为圆心,以i r 为半径的所有圆盘为A 的格什戈林(Gershgorin)圆盘定理5(格什戈林圆盘定理)(1) 设()ij n n a ⨯=A ,则A 的每一个特征值必属于下述某个圆盘之中1,1,2,nii i ij j j i a r a i n λ=≠-≤==∑L (1。
4)或者说,A 的特征值都在复平面上n 个圆盘的并集中。
(2) 如果A 有m 个圆盘组成一个连通的并集S ,且S 与其余n m -个圆盘是严格分离,则S 中恰有A 的m 个特征值,其中重特征根按其重数重复计算。
特别地,如果A 的一个圆盘i D 是与其他圆盘分离的(即孤立圆盘),则i D 中只包含A 的一个特征值。
证明 只给出(1)的证明。
设λ为A 的任一特征值,x 是相应的特征向量,即λ=Ax x 。
记1max k i i nx x ∞≤≤==x ,考虑x x λ=A 的第k 个方程,即 1n kj j k j ax x λ==∑,或()kk k kj j j ka x a x λ≠-=∑ 于是kk k kj j kkj j k j k a x a x x a λ≠≠-≤≤∑∑即kk kj k j ka a r λ≠-≤=∑。
这说明,A 的每一个特征值必位于A 的一个圆盘中,并且相应的特征值λ一定位于第k 个圆盘中(其中k 是对应特征向量x 绝对值最大的分量的下标)。
利用相似矩阵性质,有时可以获得A 的特征值进一步的估计,即选取非奇异对角矩阵111121n D ααα----⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭O 作相似变换1ij j i a αα-⎛⎫= ⎪⎝⎭D AD 。
适当选取(1,i i α= 2,,)n L 可使某些圆盘半径及连通性发生变化。
例1 估计矩阵410101114⎛⎫ ⎪=- ⎪ ⎪-⎝⎭A 特征值的范围。
解 A 的3个圆盘为123:41,:2,:4 2.D D D λλλ-≤≤+≤由定理5,可知A 的3个特征值位于3个圆盘的并集中,由于1D 是孤立圆盘,所以1D 内恰好包含A 的一个特征值1λ(为实特征值),即135λ≤≤。
A 的其他两个特征值2λ,3λ包含在2D ,3D 的并集中。
现选取对角矩阵1110.9-⎛⎫ ⎪= ⎪ ⎪⎝⎭D 做相似变换11410101090.90.94-⎛⎫ ⎪ ⎪→==- ⎪ ⎪-⎝⎭A A D AD 1A 的3个圆盘为12319:41,:,:4 1.8.9E E E λλλ-≤≤+≤ 显然,3个圆盘都是孤立圆盘,所以,每一个圆盘都包含A 的一个特征值(为实特征值)且有估计12335,1919,995.8 2.2.λλλ≤≤⎧⎪⎪-≤≤⎨⎪-≤≤-⎪⎩ 下面讨论当A 有扰动时产生的特征值扰动,即A 有微小变化时特征值的敏感性。
定理6(Bauer-Fike 定理) 设μ是n n R ⨯+∈A E 的一个特征值,且112diag(,,,)n λλλ-==P AP D L ,则有1()min p p p λσλμ-∈-≤A P P E (1.5) 其中p g 为矩阵的p 范数,1,2,.p =∞证明 只要考虑()μσ∉A 。
这时μ-D I 非奇异,设x 是+A E 对应于μ的特征向量,由()0μ+-=A E I x 左乘1-P 可得111()()()()μ----=-D I P x P EP P x1111()()()μ----=--P x D I P EP P x1-P x 是非零向量。
上式两边取范数有11()()1pμ---≥D I P EP 。
而对角矩阵1()μ--D I 的范数为1()1(),min p m mλσμλμ-∈-==-A D I , 所以有1p p p m -≥P E P这就得到(1.5)式。
这时总有()σA 中的一个λ取到m 值。
由定理6可知1cond()P P P -=是特征值扰动的放大系数,但将A 对角化的相似变换矩阵P 不是唯一的,所以取cond()P 的下确界{}11()inf cond()diag(,)n νλλ-==A P P AP L (1.6) 称为特征值问题的条件数.只要()νA 不很大,矩阵微小扰动只带来特征值的微小扰动.但是()νA 难以计算,有时只对一个P ,用cond()P 代替()νA .特征值问题的条件数和解线性方程组时的矩阵条件数是两个不同的概念,对于一个矩阵A ,两者可能一大一小,例如矩阵10diag(1,10)-=A ,有()1ν=A ,但解线性方程组的矩阵条件数10cond()10=A .本章将介绍一些计算机上常用的两类方法,一类是幂法及反幂法(迭代法),另一类是正交相似交换的方法(变换法).2 幂法及反幂法2.1 幂法把矩阵A 的按绝对值(模)最大的特征值,叫做A 的主特征值。
幂法是一种计算矩阵主特征值及对应特征向量的迭代方法,特别适用于大型稀疏矩阵.设A 是非亏损矩阵,即A 有n 个线性无关的特征向量12,,,n x x x L ,设其对应的特征值是12,,,n λλλL ,而且满足123,n λλλλ>≥≥≥L (2.1)现讨论求1λ及1x 的方法.设0v 是任一非零向量,则必存在n 个不全为零的数(1,,)i a i n =L ,使得01nj jj a ==∑v x (并假定10a ≠)。
按照迭代公式1 (1,2,)k k k -==v Av L (2.2)由初始向量0v 开始计算,就可得到一个向量列{}k v ,并且212011=()k k k k nnkk j j jj jj j a a λ--=======∑∑v Av A v A v A x x L11121kn j k j j j a λλαλ=⎡⎤⎛⎫⎢⎥=+ ⎪⎢⎥⎝⎭⎣⎦∑x x (2.3)由于11 (2,3,,)jj n λλ<=L ,所以当k 充分大时,由上式可知有1111k k k λα-=≈v Av x (2.4)因为1111111()()k k λαλλα≈A x x所以当k 充分大时,k v 就是A 的属于特征值1λ的特征向量的近似向量。
用max()x 表示向量x 的按模为最大的分量,容易证明对任何实数t ,总有max()max()t t =x x 。
由(2.4)式,得111111111max()max()max()max()k k k k λαλλα--≈=v x v x因此,当k 充分大时,有11max()max()k k k μλ-=≈v v (2.5)用公式(2.5)、(2.4)计算矩阵A 的主特征值及主特征向量的方法叫幂法。