第五章 矩阵的相似变换和特征值.
线性代数第五章
又因为c1 c 2 即
1 2
0
1 0 2 0
这与1 , 2 互异矛盾,所以假设不成立 即 c1 1 c 2 2 不是 A 的特征向量.
5. 实对称矩阵不相等的特征值所对应的特征向量正交 例 设3阶实对称矩阵 A 的特征值为6,3,3,特征值6对应 的特征向量为 p1
关于实对称矩阵的特征值和特征向量有非常好的 性质,尤其是实对称矩阵正交相似对角阵的过程, 综合考查了求行列式、求解齐次线性方程组、求特 征值和特征向量、正交化及规范化、相似对角化等 内容,加之有二次型的应用背景,非常重要,应熟 练掌握.
典型题目
1. 求方阵的 k 次方
例
2 设A 0 4 1 2 1 1 0 3
A 的 2 重特征值刚好有两个线性无关的特征向量, 所以 A 可以对角化. 即存在可逆的矩阵
1 P ( p1 , p 2 , p 3 ) 0 1 2 1 4 0 0 1 1
使得
1 1 P AP
2
以上就是判断 A 是否可对角化,以及求相似变换 矩阵的过程。这一过程在实对称矩阵和二次型里还 经常用到。
证明 反证法 假设 c1 1 c 2 2 是 A 的特征向量,所对应的特征值为 则有 展开
A ( c1 1 c 2 2 ) ( c1 1 c 2 2 )
Α ( c 1 1 c 2 2 ) c 1 ( Α 1 ) c 2 ( Α 2 ) c 1 1 1 c 2 2 2
det A 1 2 n
1 2 n a11 a 22 a nn
② 设 Ax x ,则有 f ( A ) x f ( ) x 这个式子说明 f ( A ) 的特征值是 f ( ) ,特征向 量不变.
矩阵相似特征向量之间的关系
矩阵相似特征向量之间的关系矩阵相似性是线性代数中一个重要的概念,而特征向量则是矩阵相似性的重要组成部分。
特征向量是在矩阵运算中具有特殊性质的向量,它们在矩阵相似性的研究中扮演了重要的角色。
特征向量的研究不仅帮助我们理解矩阵相似性的本质,还在实际问题中有着广泛的应用。
我们来看一下什么是矩阵相似性。
矩阵相似性是指对于两个矩阵A 和B,如果存在一个可逆矩阵P,使得PAP^{-1}=B,那么我们称矩阵A和B是相似的。
简单来说,矩阵相似性就是通过相似变换将一个矩阵转化为另一个矩阵。
而特征向量则是在这个相似变换中起到了关键的作用。
特征向量是指在矩阵A的线性变换下,只发生长度的伸缩而不改变方向的非零向量。
数学上,对于一个n阶方阵A,如果存在一个非零向量v和一个实数λ,使得Av=λv,那么v就是矩阵A的一个特征向量,λ就是对应的特征值。
特征向量与特征值之间存在着紧密的关系,特征向量描述了矩阵的变换方向,而特征值则描述了变换的比例因子。
在矩阵相似性的研究中,特征向量起到了重要的作用。
首先,我们知道相似矩阵具有相同的特征值,也就是说它们具有相似的特征向量。
这是因为相似矩阵之间的相似变换不改变特征值。
因此,如果两个矩阵相似,它们的特征向量一定是相似的。
特征向量的研究帮助我们理解矩阵相似性的本质。
特征向量描述了矩阵的变换方向,而特征值则描述了变换的比例因子。
通过研究特征向量,我们可以了解矩阵的变换性质,进而推导出矩阵相似性的一些性质。
例如,如果一个矩阵的特征向量都是线性无关的,那么这个矩阵就是对角化的,也就是说它与一个对角矩阵相似。
这样的矩阵具有简单的性质,更易于研究和计算。
特征向量还在实际问题中有着广泛的应用。
在物理学中,特征向量被用来描述物理系统的稳定性和振动模式。
在工程学中,特征向量被用来解决信号处理和图像处理等问题。
在计算机科学中,特征向量被用来进行数据降维和模式识别等任务。
特征向量的研究不仅帮助我们理解矩阵相似性,还为实际问题的求解提供了有效的工具。
【学习】线性代数学习指导第五章矩阵的特征值与特征向量
【关键字】学习第五章矩阵的特征值与特征向量一.内容提要1 . 特征值和特征向量定义1 设是数域P上的n阶矩阵,若对于数域P中的数,存在数域P上的非零n维列向量X,使得则称为矩阵A的特征值,称X为矩阵A属于(或对应于)特征值的特征向量注意:1)是方阵;2)特征向量X 是非零列向量;3)方阵与特征值对应的特征向量不唯一4)一个特征向量只能属于一个特征值.2.特征值和特征向量的计算计算矩阵A的特征值与特征向量的步骤为:(1)计算n阶矩阵A的特征多项式|E-A|;(2)求出特征方程|E-A|=0的全部根,它们就是矩阵A的全部特征值;(3)设1 ,2 ,… ,s 是A的全部互异特征值。
对于每一个i,解齐次线性方程组0,求出它的一个根底解系,该根底解系的向量就是A属于特征值i的线性无关的特征向量,方程组的全体非零解向量就是A属于特征值i的全体特征向量.3.特征值和特征向量的性质性质1 (1)若X是矩阵A属于特征值的特征向量,则kX()也是A属于的特征向量;(2)若是矩阵A属于特征值的特征向量,则它们的非零线性组合也是A属于的特征向量;(3)若A是可逆矩阵,是A的一个特征值,则是A—1的一个特征值,是A*的一个特征值;(4)设是n阶矩阵A的一个特征值,f(x)= amxm + am-1xm-1 + … + a1x + a0为一个多项式,则是f(A)的一个特征值。
性质2(1)(2)性质3 n阶矩阵A和它的转置矩阵有相同的特征值性质4 n阶矩阵A 不同的特征值所对应的特征向量线性无关4. 相似矩阵定义2 设A、B为n阶矩阵,若存在可逆矩阵P,使得B=P―1AP则称A与B相似。
记作A∽B. 并称P为相似变换矩阵.矩阵的相似关系是等价关系,满足:1°反身性:A∽A.2°对称性:若A∽B,则B∽A.3°传递性:若A∽B,B∽C则A∽C.5.矩阵相似的性质:设A、B为n阶矩阵,若A∽B,则(1) ; (2) ;(3)A 、B 有相同的迹和特征多项式,相同的特征值;(4) A ,B 或者都可逆或者都不可逆. 当A ,B 都可逆时,∽;(5)设f (x )= amxm + am-1xm-1 + … + a1x + a0 为一个多项式,则 f (A )∽ f (B ) ; 6.n 阶矩阵A 相似对角化的条件(1)n 阶矩阵A 与对角矩阵Λ相似的充分必要条件是A 有n 个线性无关的特征向量. (2)n 阶矩阵A 与对角阵相似的充要条件是A 的每个k 重特征值恰好对应有k 个线性无关的特征向量.注(1)与单位矩阵相似的 n 阶矩阵只有单位阵 E 本身,与数量矩阵 kE 相似的 n 阶方阵只有数量矩阵 kE 本身(2)有相同特征多项式的矩阵不一定相似。
1、矩阵的特征值与特征向量及方阵的相似-2022年学习资料
线性代数-同理对λ 2=23=-1,求相应线性方程组12E--Ax=0的一个基础解系:--4x1-2x2-4 3=0,--2x1-x2-2x3=0,-求解得此方程组的一基础解系:-C2=
线性代数-于是A的属于λ 2=入3=-1的全部特征向量为-k2a2+k3a3,-k2,k3是不全为零的实数而A的全部特征向量为11;k22+k3a3,这-里k1≠0为实数k2,k3是不全为零的实数-①⊙O
线性代数-∴.2E-P-1APP-ax-=P-12:E-APP-1a-=P2:E-Aa=0,-即P1APP a=:P-a,-故P-1au:是P-1AP属于;的特征向量-①,⊙O
线性代数-五、求方降A的特征多项式-例5-设A是n阶方阵,其特征多项式为-f42=2E-A=”+an-12 -1+…+a12+ao,-求:1求AT的特征多项式-2当A非奇异时,求A1的特征多项式-解1f2=2E-A 2E-AY-=2E-A=∫42,-·.A与AT有相同的特征多项式
线性代数-9和似拒降-定义设A,B都是n阶矩阵,若有可逆矩阵P,使-P-AP=B,-则称B是A的相似矩阵, 说矩阵A与B相似,-对A进行运算P-1AP称为对A进行相似变换,-可逆矩阵P称为把A变成B的相似变换矩阵。 矩阵之间的相似具有1自反性;2对称性;-3传递性.
线性代数-10-有芙和似拒降的性质-1喏A与B相似,则A与B的特征多项式-相同,从而A与B的特征值亦相同. 2若A与对角矩阵-λ 2-Λ =-n-相似,则1,元2,…,2m是A的n个特征值,
线性代数-三、特狃值与特狃向量的求法-第一步-计算A的特征多项式;-第二步-求出特征多项式的全部根,即得A 全部-特征值;-第三步将每一个特征值代入相应的线性方程组,-求出基础解系,即得该特征值的特征向量.
第五章方阵的相似变换
n
A p 1 , p 2 , , p n Ap 1 , Ap 2 , , Ap n
1 p1 , p 2 , , p n
于是有 Ap i i p i
i 1 , 2 , , n .
可见 i 是 A 的特征值 , 而 P 的列向量 p i 就是 A 的对应于特征值
T
所以 1 , 2 , 3 线性无关 .
即 A 有 3 个线性无关的特征向量 化.
, 因而 A 可对角
2 1 (2) A 5 3 1 0 2 A E 5 1
2 3 2 1 3 0
2 3 2
1
解之得基础解系
2 0 1 0 , 2 1 . 1 1
同理 , 对 3 7 ,由 A E x 0 ,
求得基础解系 3 1 , 2 , 2
2 由于 0 1 0 1 1 1 2 0, 2
( 4 )若 A 与 B 相似 , 而 f ( x )是一多项式 , 则 f ( A )与 f ( B )相似 .
1
1
2.相似变换与相似变换矩阵
相似变换是对方阵进行的一种运算,它把A 变成 P 1 AP ,而可逆矩阵 P 称为进行这一变换的 相似变换矩阵.
这种变换的重要意义在于简化对矩阵的各种 运算,其方法是先通过相似变换,将矩阵变成与 之等价的对角矩阵,再对对角矩阵进行运算,从 而将比较复杂的矩阵的运算转化为比较简单的对 角矩阵的运算.
n1
, A 的特征值为
1 n , 2 n 0 .又 A 是实对称矩阵 , 存在可逆
矩阵 P 1 , 使得
矩阵的相似变换
矩阵的相似变换首先,对矩阵的相似变换可以概括为:它是将一个矩阵变换为另一个矩阵的自变量和因变量的变换形式,使得两个矩阵的形状、行列式的值相等。
它是一种用来描述线性变换的抽象概念,它能够将特定的线性映射应用于任意的矩阵,实现两个矩阵之间的等价转换,并实现相应的几何变换。
1. 概述矩阵的相似变换是一种类似于线性变换的特殊变换,它能够将一个矩阵M和一个特定矩阵P变换为相同的形状和行列式值,实现矩阵M与P的等价转换,从而实现几何变换的效果。
2. 形式由于矩阵的相似变换是一种线性变换的抽象概念,它可以用一个特殊的矩阵P,实现一种类似于线性变换的方式,使得一个矩阵M变换为一个另外一个矩阵P,实现两者之间的等价转换。
因此,矩阵的相似变换可以定义为:若存在一个m×n矩阵M和一个n×n非奇异矩阵P,且满足P-1MP=P*P-1,则称矩阵M受相似变换P的影响,变换后得到一个n×n矩阵Q,称M和Q受相似变换P的影响,记为M~P=Q。
3. 特点矩阵的相似变换有几个特点:(1)由于是线性变换的抽象概念,因此矩阵的相似变换是可逆的,即可以从结果求原矩阵;(2)矩阵的相似变换可以实现两个矩阵之间等价的变换,实现形式和行列式的指定;(3)在实现矩阵的相似变换的过程中,其结果的矩阵的元素值并不会发生变化,只是形式的变换;(4)相似变换也可以通过调整元素的位置、行与列的变换等方式实现,只要最终的结果是和原矩阵的行列式值一致即可。
4. 应用矩阵的相似变换可以应用在各种线性变换中,如几何变换、线性代数运算等,都可以使用矩阵的相似变换实现。
此外,由于矩阵的相似变换能够实现可逆的结果,并且形式、行列式值不变,因此也可以用于数据安全加密以及数据处理中。
矩阵的相似变换和特征值
§5.2 相似矩阵
定理5.5. 设n阶方阵A与B相似, 则有相同的特 征多项式和特征值.
事实上, 设P –1AP = B, 则
|I–A| = |P –1|·|I–A|·|P|= |I–B|.
注: 特征多项式相同的矩阵未必相似.
例如 A =
1 0
1 1
, B=
1 0
0 1
,
它们的特征多项式都是(1)2.
注: A的零化多项式的根未必都是A的特征值.
例如f(x) = x21,
A1 =
1 0
0 1
,
A2 =
1 0 0 1
,
A3 =
0 1
1 0
.
第五章 矩阵的相似变换和特征值
§5.2 相似矩阵
§5.2 相似矩阵
一. 相似矩阵的定义和性质
设A, B都是n阶方阵, 若有可逆矩阵P, 使得
P 1AP =B, 则称矩阵A与B相似. 记为A~B.
P称为相似变换矩阵或过渡矩阵.
易见, 矩阵间的相似关系满足
(1) 反身性: A~A;
(2) 对称性: A~B B~A; (3) 传递性: A~B, B~C A~C. 即矩阵间的相似关系是一种等价关系.
且A与B相似 A与B相抵. 但反之未必.
第五章 矩阵的相似变换和特征值
§5.2 相似矩阵
命题: 设A~B, f是一个多项式, 则f(A)~ f(B).
证明: 设P 1AP =B, f(x) = anxn+…+a1x+a0, 则 P 1f(A)P
= P 1(anAn+…+a1A+a0I)P
= anP 1AnP+…+A1p 1AP+a0 P 1IP = an(P 1AP)n+…+a1P 1AP+a0I = anBn+…+a1B+a0I
矩阵的相似与相合
解方程
(I
A) xr
r 0.
由
8
当 1 1 时,
解方程
(
I
r A) x
r 0.
由
~ 1 1 1
I
A
0
3
0
1 1 1
0
1
0
,
4 1 4 0 0 0
1
得基础解系
r p1
0 1
,
故对应于 1 1 的全体特征向量为 kpr1 (k 0).
9
当 2 3 2 时,
解方程
(2I
例3. 已知三阶方阵A的特征值为 1,1, 2,求 A2 2A1-4I 的特征值及 A2 2A1-4I .
解. A2 2A1-4I的特征值为
(1)2 2(1)1 4= 5, 12 2(1)1 4= 1 (2)2 2(2)1 4=1
故 A2 2A1-4I =(-5)(1) 1 5. 14
特征向量
xr
r 0,
特征值问题是对方阵而言的.
2. 若向量 xr 是 A 的对应于特征值 的特征向量,
则 kxr (k 0) 也是 A 的对应于特征值 的特征向量.
且对应特征向量的非零线性组合也是 的特征向量.
3
3. n 阶方阵 A 的特征值, 就是使齐次线性方程组
( I
A) xr
r 0
有非零解的
值,
即满足方程
I A 0 的 都是矩阵 A 的特征值.
a11 a12 L
4. I A 0 a21 a22 L
L
LL
an1 an2 L
a1n a2n 0 L
ann
称以 为未知数的一元 n 次方程 I A 0 为
第5章特征值与相似
k , , g ( ) 的特征向量.即有相同的特征向量 .
10
第 五 章 矩阵的相似对角化
Theorem 4 的证明 Proof : 由 Ax x 有
(kA) x k ( Ax) k ( x) (k ) x
所以, k 是 kA 的特征值,且 x 也是 kA 属于
由 Ax x
a11 a12 a22 an 2
(1)
a1n a2 n
可得 ( A E ) x 0
(2)
显然,(2)有非零解的充要条件是 det( A E ) 0 即
a21 an1
) 0 说明满足 det( A E
0 的
是 A 的特征值.
值,而xi1,xi2,…,xiri( i = 1, 2,…, m ) 是属于特征值
i ( i = 1, 2,…, m ) 的线性无关的特征向量,则向量组
x11,x12, ,x1r1,x21,x22, ,x2r2, ,xm1,xm2, ,xmrm
是线性无关的.
Theorem 8 设 0 为 n 阶方阵 A 的 r 重特征值,则对 应于 0 的线性无关的特征向量最多只有 r 个 .
n
E A (a11 a22
ann )
n1
(1) A
n
()
又因为 1,2, ,n 是 A 的全部特征值,故
E A ( 1 )( 2 ) ( n )
a 比较 ()与() 得 11
a21
(1 2
det特征值与特征向量example对应于全部特征向量为对应于全部特征向量为是不为零的任意常数未必有两第五章矩阵的相似对角化二特征值与特征向量的性质特征值与特征向量的性质theorem有相同的特征值
矩阵相似变换
矩阵相似变换矩阵相似变换是线性代数中一个重要的概念,它在很多领域中都有广泛的应用。
本文将从基本概念、相似矩阵的性质以及实际应用等方面对矩阵相似变换进行解读。
一、基本概念矩阵相似变换是指对一个矩阵进行线性变换,使得变换后的矩阵与原矩阵有相同的特征值。
具体来说,对于一个n阶矩阵A和一个可逆矩阵P,如果存在一个可逆矩阵P,使得P⁻¹AP=B,那么矩阵B与矩阵A相似。
二、相似矩阵的性质1. 相似矩阵具有相同的特征值:相似矩阵不仅特征值相同,对应的特征向量也相同。
这一性质在矩阵的谱分解、对角化等问题中有广泛的应用。
2. 相似矩阵的迹相等:矩阵的迹是指矩阵主对角线上元素的和,相似矩阵的迹相等。
这一性质在矩阵的特征值求和、矩阵的迹运算等问题中有重要的应用。
3. 相似矩阵的行列式相等:矩阵的行列式是指矩阵的特征值的乘积,相似矩阵的行列式相等。
这一性质在矩阵的特征值求积、矩阵的行列式运算等问题中有重要的应用。
三、实际应用1. 特征值分析:通过矩阵相似变换,可以将一个复杂的矩阵转化为对角矩阵,从而更方便地进行特征值分析。
这在物理、化学、生物等领域中有广泛的应用,例如求解量子力学中的能级问题。
2. 线性方程组求解:通过矩阵相似变换,可以将一个线性方程组转化为一个更简单的形式。
这在工程、经济学等领域中有广泛的应用,例如求解电路中的电流和电压分布问题。
3. 图像处理:矩阵相似变换在图像处理中起着重要的作用。
通过对图像矩阵进行相似变换,可以实现图像的旋转、缩放、平移等操作,从而达到图像处理的目的。
四、总结矩阵相似变换是线性代数中的一个重要概念,它在特征值分析、线性方程组求解、图像处理等领域中有广泛的应用。
通过矩阵相似变换,可以将复杂的问题转化为简单的形式,从而更方便地进行分析和求解。
同时,相似矩阵具有一些重要的性质,如相同的特征值、相等的迹和行列式等,这些性质在实际应用中也起到了重要的作用。
因此,熟练掌握矩阵相似变换的概念和性质,对于理解和应用线性代数具有重要意义。
线性代数矩阵特征值及特征向量
a a ... a
11
12
1n
E A
a 21
a ... 22
a 2n
a a ... a
n1
n2
nn
称为A的特征多项式. 方程 E A 0 称为A的
特征方程,其根称为A的特征根,即A的特征值. 注. n阶方阵A在复数范围内有n个特征值.
§1 特征值与特征向量、相似矩阵
(1 ) 若 是A的属于特征值 的特征向量,则 k (k 0) 也是A的属于 的特征向量. (2) 若 1,2, ,s 是A的属于特征值 的特征向量,
§1 特征值与特征向量、相似矩阵
例1. 问A是否可对角化?若可,求可逆矩阵P,使
1 2 2
P1AP 为对角矩阵.
这里
A
2 2
2 4
4 2
解: A的特征多项式为
1 2 2 E A 2 2 4
2 4 2
22 7
得A的特征值是2,2,-7 .
§1 特征值与特征向量、相似矩阵
定理3. 相似矩阵的特征多项式相同,从而特征值相同.
§1 特征值与特征向量、相似矩阵
推论. 设n阶矩阵A与对角矩阵
1
2
n
相似,则 1,2 , ,n 就是A的n个特征值.
注. 若矩阵A与对角矩阵相似,则可方便求出A的幂 Ak 及A的多项式.
§1 特征值与特征向量、相似矩阵
§2 矩阵可对角化的条件、实对称矩阵的对角化 一、矩阵可对角化的条件 二、实对称矩阵的对角化
§1 特征值与特征向量、相似矩阵
一、矩阵可对角化的条件
定义1:矩阵A是一个n 阶方阵,若存在可逆矩阵
P ,使 P1AP 为对角矩阵,即A与对角矩阵相似,则 称矩阵A可对角化.
第五章矩阵特征值计算
第五章矩阵特征值计算与线性方程组的求解问题一样,矩阵特征值与特征向量的计算也是数值线性代数的重要内容. 在理论上,矩阵的特征值是特征多项式方程的根,因此特征值的计算可转化为单个多项式方程的求解. 然而对于高阶矩阵,这种转化并不能使问题得到简化,而且在实际应用中还会引入严重的数值误差. 因此,正如第二章指出的,我们一般将多项式方程求解转化为矩阵特征值计算问题,而不是反过来.本章介绍有关矩阵特征值计算问题的基本理论和算法. 与非线性方程求根问题类似,计算矩阵特征值的算法也是迭代方法①.5.1基本概念与特征值分布本节先介绍矩阵特征值、特征向量的基本概念和性质,然后讨论对特征值分布范围的简单估计方法.5.1.1基本概念与性质定义5.1:矩阵A=(a kj)∈ℂn×n,(1) 称φ(λ)=det(λI−A)=λn+c1λn−1+⋯+c n−1λ+c n为A的特征多项式(characteristic polynomial);n次代数方程φ(λ)=0为A的特征方程(characteristic equation),它的n个根:λ1,⋯,λn,被称为A的特征值(eigenvalue). 此外,常用λ(A)表示A的全体特征值的集合,也称为特征值谱(spectrum of eigenvalue).(2) 对于矩阵A的一个给定特征值λ,相应的齐次线性方程组(λI−A)x=0 , (5.1)有非零解(因为系数矩阵奇异),其解向量x称为矩阵A对应于λ的特征向量(eigenvector).根据方程(5.1),我们得出矩阵特征值与特征向量的关系,即Ax=λx .(5.2)第三章的定义3.5就利用公式(5.2)对矩阵特征值和特征向量进行了定义,它与定义5.1是等价的. 另外,同一个特征值对应的特征向量一定不唯一,它们构成线性子空间,称为特征子空间(eigenspace).我们一般讨论实矩阵的特征值问题. 应注意,实矩阵的特征值和特征向量不一定是实数和实向量,但实特征值一定对应于实特征向量(方程(5.1)的解),而一般的复特征值对应的特征向量一定不是实向量. 此外,若特征值不是实数, 则其复共轭也一定是特征值(由于特征方程为实系数方程). 定理3.3表明,实对称矩阵A∈ℝn×n的特征值均为实数,存在n个线性无关、且正交的实特征向量,即存在由特征值组成的对角阵Λ和特征向量组成的正交阵Q,使得:A=QΛQ T.(5.3)例5.1(弹簧-质点系统):考虑图5-1的弹簧-质点系统,其中包括三个质量分别为m1、m2、m3的物体,由三个弹性系数分别为k1,k2,k3的弹簧相连,三个物体的位置均为时间的函数,①如果用有限次运算能求得一般矩阵的特征值,则多项式方程求根问题也可用有限次运算解决,这与阿贝尔证明的“高于4次的多项式并不都有用初等运算表示的求根公式”的理论矛盾.这里考查三个物体偏离平衡位置的位移,分别记为y 1(t), y 2(t), y 3(t). 因为物体在平衡状态所受的重力已经和弹簧伸长的弹力平衡,所以物体的加速度只和偏离平衡位置引起的弹簧伸长相关. 根据牛顿第二定律以及胡克定律(即弹簧的弹力与拉伸长度成正比)可列出如下微分方程组②: My ′′(t)+Ky(t)=0 ,其中y (t )=[y 1(t)y 2(t)y 3(t)]T ,M =[m 1000m 2000m 3],K =[k 1+k 2−k 20−k 2k 2+k 3−k 30−k 3k 3] . 在一般情况下,这个系统会以自然频率ω做谐波振动,而y 的通解包含如下的分量: y j (t )=x j e iωt ,(j =1,2,3)其中i =√−1,根据它可求解出振动的频率ω及振幅x j . 由这个式子可得出:y j ′′(t )=−ω2x j e iωt ,(j =1,2,3)代入微分方程,可得代数方程:−ω2Mx +Kx =0,或Ax =λx ,其中A =M −1K ,λ=ω2. 通过求解矩阵A 的特征值便可求出这个弹簧-质点系统的自然频率(有多个). 再结合初始条件可确定这三个位移函数,它们可能按某个自然频率振动(简正振动),也可能是若干个简正振动的线性叠加.例5.2(根据定义计算特征值、特征向量):求矩阵A =[5−1−131−14−21]的特征值和特征向量.[解]: 矩阵A 的特征方程为:det (λI −A )=|λ−511−3λ−11−42λ−1|=(λ−3)(λ−2)2=0故A 的特征值为λ1=3,λ2=2(二重特征值).当λ=λ1=3时,由(λI −A)x =0,得到方程[−211−321−422][x 1x 2x 3]=[000]它有无穷多个解,若假设x 1=1, 则求出解为x =[1,1,1]T ,记为x 1,则x 1是λ1对应的一个特征向量.当λ=λ2=2时,由(λI −A)x =0,得到方程[−311−311−421][x 1x 2x 3]=[000]它有无穷多个解,若假设x 1=1, 则求出解为x =[1,1,2]T ,记为x 2,则x 2是λ2对应的一个特② 本书第八章将介绍这种常微分方程组的数值求解方法.图5-1 弹簧-质点系统.征向量.下面概括地介绍有关矩阵特征值、特征向量的一些性质,它们可根据定义5.1,以及公式(5.2)加以证明.定理5.1:设λj (j =1,2,…,n)为n 阶矩阵A 的特征值,则(1) ∑λj n j=1=∑a jj n j=1=tr(A) ;(2) ∏λj n j=1=det(A) .这里tr(A)表示矩阵对角线上元素之和,称为矩阵的迹(trace ).从上述结论(2)也可以看出,非奇异矩阵特征值均不为0, 而0一定是奇异矩阵的特征值. 定理5.2:矩阵转置不改变特征值,即λ(A )=λ(A T ).定理5.3:若矩阵A 为对角阵或上(下)三角阵,则其对角线元素即为矩阵的特征值.定理5.4:若矩阵A 为分块对角阵,或分块上(下)三角阵,例如A =[A 11A 12⋯A 1m A 22⋯A 2m ⋱⋮A mm] , 其中每个对角块A jj 均为方阵,则矩阵A 的特征值为各对角块矩阵特征值的合并,即λ(A )=⋃λ(A jj )m j=1.定理5.5:矩阵的相似变换(similarity transformation)不改变特征值. 设矩阵A 和B 为相似矩阵,即存在非奇异矩阵X 使得B =X −1AX ,则(1) 矩阵A 和B 的特征值相等,即 λ(A )=λ(B ) ;(2) 若y 为B 的特征向量,则相应地,Xy 为A 的特征向量.通过相似变换并不总能把矩阵转化为对角阵,或者说矩阵A 并不总是可对角化的(diagonalizable). 下面给出特征值的代数重数、几何重数,和亏损矩阵的概念,以及几个定理..定义5.2: 设矩阵A ∈ℝn×n 有m 个(m n )不同的特征值λ̃1,⋯,λ̃m ,若λ̃j 是特征方程的n j 重根,则称n j 为λ̃j 的代数重数(algebraic multiplicity),并称λ̃j 的特征子空间(ℂn 的子空间)的维数为λ̃j 的几何重数(geometric multiplicity). 定理5.6:设矩阵A ∈ℝn×n 的m 个不同的特征值为λ̃1,⋯,λ̃m ,特征值λ̃j ,(j =1,⋯,m)的代数重数为n j ,几何重数为k j ,则(1) ∑n j m j=1=n ,且任一个特征值的几何重数不大于代数重数,即∀j ,n j ≥k j .(2) 不同特征值的特征向量线性无关,并且将所有特征子空间的∑k j m j=1个基(特征向量)放在一起,它们构成一组线性无关向量.(3) 若每个特征值的代数重数等于几何重数,则总共可得n 个线性无关的特征向量,它们是全空间ℂn 的基.定义5.3:若矩阵A ∈ℝn×n 的某个代数重数为k 的特征值对应的线性无关特征向量数目少于k (即几何重数小于代数重数),则称A 为亏损阵(defective matrix ),否则称其为非亏损阵(nondefective matrix ).定理5.7:设矩阵A ∈ℝn×n 可对角化,即存在非奇异矩阵X ∈ℂn×n 使得X −1AX =Λ,其中Λ∈ℂn×n 为对角阵, 的充要条件是A 为非亏损矩阵. 此时,Λ的对角线元素为矩阵A 的特征值,而矩阵X 的列向量为n 个线性无关的特征向量.定理5.7中方程的等价形式为A =XΛX −1, 它被称为特征值分解,也叫谱分解(spectrum decomposition). 特征值分解存在的充要条件是A 为非亏损矩阵. 但现实中还有很多矩阵是亏损矩阵,例如例5.2中的矩阵,它的特征值2的代数重数为2,而几何重数仅为1. 这种矩阵不能相似变换为对角阵,但存在下面的若当分解(Jordan decomposition).定理5.8:设矩阵A ∈ℝn×n , 存在非奇异矩阵X ∈ℂn×n 使得A =XJX −1,矩阵J 为形如[J 1⋱J p ]的分块对角阵(称为若当标准型),其中J k =[ λk 1λk ⋱⋱1λk ] 称为若当块,其对角线元素为矩阵A 的特征值. 设矩阵A 有m 个不同的特征值为λ̃1,⋯,λ̃m ,特征值λ̃j ,(j =1,⋯,m)的代数重数为n j ,几何重数为k j ,则p =∑k j m j=1, λ̃j 对应于k j 个若当块, 其阶数之和等于n j .在若当分解中,如果所有若当块都是1阶的,则J 为对角阵,这种分解就是特征值分解,相应的矩阵为非亏损阵. 若当分解是很有用的理论工具,利用它还可证明下面关于矩阵运算结果的特征值的定理.定理5.9:设λj (j =1,2,…,n)为n 阶矩阵A 的特征值,则(1) 矩阵cA, c 为常数, 的特征值为cλ1,cλ2,⋯,cλn .(2) 矩阵A +pI, p 为常数, 的特征值为λ1+p,λ2+p,⋯,λn +p.(3) 矩阵A k , k 为正整数, 的特征值为λ1k ,λ2k ,⋯,λn k .(4) 设p (t )为一多项式函数,则矩阵p (A )的特征值为p (λ1),p (λ2),⋯ ,p (λn ) .(5) 若A 为非奇异矩阵,则λj ≠0,(j =1,2,…,n), 且矩阵A −1的特征值为λ1−1,λ2−1,⋯,λn −1.5.1.2特征值分布范围的估计估计特征值的分布范围或它们的界,无论在理论上或实际应用上,都有重要意义. 比如,本书前面的内容曾涉及两个问题:(1). 计算矩阵的2-条件数:cond (A )2=√λmax (A T A)λmin (A T A) ;(2). 考察一阶定常迭代法x (k+1)=Bx (k)+f 的收敛性、收敛速度:收敛的判据是谱半径ρ(B)=max 1≤j≤n |λj (B)|<1 ; 收敛速度为R =−log 10ρ(B) .其中都需要对矩阵特征值分布范围的了解.上一章的定理4.4说明谱半径的大小不超过任何一种算子范数,即ρ(A )≤‖A ‖ ,这是关于特征值的上界的一个重要结论.下面先给出定义5.4,再介绍有关特征值的界的另一个重要结论.定义5.4:设A =(a kj )∈ℂn×n ,记r k =∑|a kj |n j=1j≠k ,(k =1,⋯,n),则集合D k ={z||z −a kk |≤r k ,z ∈ℂ},(k =1,⋯,n)在复平面为以a kk 为圆心、r k 为半径的圆盘,称为A 的Gerschgorin (格什戈林)圆盘.图5-2显示了一个3⨯3复矩阵的格什戈林圆盘.定理5.10 (圆盘定理):设A =(a kj )∈ℂn×n ,则:(1) A 的每一个特征值必属于A 的格什戈林圆盘之中,即对任一特征值λ必定存在k,1≤k ≤n ,使得:|λ−a kk |≤∑|a kj |nj=1j≠k .(5.4)图5-2 复坐标平面,以及3⨯3矩阵A 的格什戈林圆盘.用集合的关系来说明,这意味着λ(A)⊆⋃D k n k=1.(2) 若A 的格什戈林圆盘中有m 个组成一连通并集S ,且S 与余下的n −m 个圆盘分离,则S内恰好包含A 的m 个特征值(重特征值按重数计).对图5-2所示的例子,定理5.10的第(2)个结论的含义是:D 1中只包含一个特征值,而另外两个特征值在D 2,D 3的并集中. 下面对定理5.10的结论(1)进行证明,结论(2)的证明超出了本书的范围.[证明]: 设λ为A 的任一特征值,则有Ax =λx ,x 为非零向量. 设x 中第k 个分量最大,即|x k |=max 1≤j≤n|x j |>0 , 考虑方程(5.2)中第k 个方程:∑a kj x j nj=1=λx k , 将其中与x k 有关的项移到等号左边,其余到右边,再两边取模得:|λ−a kk ||x k |=|∑a kj x j n j=1j≠k |≤∑|a kj ||x j |n j=1j≠k ≤|x k |∑|a kj |nj=1j≠k .(5.5)最后一个不等式的推导利用了“x 中第k 个分量最大”的假设. 将不等式(5.5)除以|x k |,即得到(5.4)式,因此证明了定理 5.10的结论(1). 上述证明过程还说明,若某个特征向量的第k 个分量的模最大,则相应的特征值必定属于第k 个圆盘中.根据定理5.2,还可以按照矩阵的每一列元素定义n 个圆盘,对于它们定理5.10仍然成立. 下面的定理是圆盘定理的重要推论,其证明留给感兴趣的读者.定理5.11:设A ∈ℝn×n ,且A 的对角元均大于0,则(1) 若A 严格对角占优,则A 的特征值的实部都大于0.(2) 若A 为对角占优的对称矩阵,则A 一定是对称半正定矩阵,若同时A 非奇异,则A 为对称正定矩阵.例5.3 (圆盘定理的应用):试估计矩阵A =[41010−111−4]的特征值范围.[解]: 直接应用圆盘定理,该矩阵的三个圆盘如下:D 1: |λ−4|≤1, D 2: |λ|≤2, D 3: |λ+4|≤2.D 1与其他圆盘分离,则它仅含一个特征值,且必定为实数(若为虚数则其共轭也是特征值,这与D 1仅含一个特征值矛盾). 所以对矩阵特征值的范围的估计是:3≤λ1≤5,λ2,λ3∈D 2∪D 3 .再对矩阵A T 应用圆盘定理,则可以进一步优化上述结果. 矩阵A T 对应的三个圆盘为: D ’1: |λ−4|≤2, D ’2: |λ|≤2, D ’3: |λ+4|≤1.这说明D ’3中存在一个特征值,且为实数,它属于区间[-5, -3],经过综合分析可知三个特征值均为实数,它们的范围是:λ1∈[3,5],λ2∈[−2,2],λ3∈[−5,−3].事实上,使用Matlab 的eig 命令可求出矩阵A 的特征值为:4.2030, -0.4429, -3.7601.根据定理5.5,还可以对矩阵A 做简单的相似变换,例如取X 为对角阵,然后再应用圆盘定理估计特征值的范围.例5.4 (特征值范围的估计):选取适当的矩阵X ,应用定理5.5和5.10估计例5.3中矩阵的特征值范围.[解]: 取X−1=[100010000.9] , 则A 1=X −1AX =[41010−109⁄0.90.9−4]的特征值与A 的相同. 对A 1应用圆盘定理,得到三个分离的圆盘,它们分别包含一个实特征值,由此得到特征值的范围估计:λ1∈[3,5],λ2∈[−199,199],λ3∈[−5.8,−2.2]. 此外,还可进一步估计ρ(A)的范围,即3≤ρ(A)≤5.8 .上述例子表明,综合运用圆盘定理和矩阵特征值的性质(如定理5.2, 定理5.5),可对特征值的范围进行一定的估计. 对具体例子,可适当设置相似变换矩阵,尽可能让圆盘相互分离,从而提高估计的有效性.5.2幂法与反幂法幂法是一种计算矩阵最大的特征值及其对应特征向量的方法. 本节介绍幂法、反幂法以及加快幂法迭代收敛的技术.5.2.1幂法定义5.5:在矩阵A 的特征值中,模最大的特征值称为主特征值,也叫“第一特征值”,它对应的特征向量称为主特征向量.应注意的是,主特征值有可能不唯一,因为模相同的复数可以有很多. 例如模为5的特征值可能是5,−5,3+4i,3−4i , 等等. 另外,请注意谱半径和主特征值的区别.如果矩阵A 有唯一的主特征值,则一般通过幂法能方便地计算出主特征值及其对应的特征向量. 对于实矩阵,这个唯一的主特征值显然是实数,但不排除它是重特征值的情况. 幂法(power iteration)的计算过程是,首先任取一非零向量v 0∈ℝn ,再进行迭代计算:v k =Av k−1,(k =1,2,⋯)得到向量序列{v k },根据它即可求出主特征与特征向量. 下面用定理来说明.定理5.12: 设A ∈ℝn×n ,其主特征值唯一,记为λ1,且λ1的几何重数等于代数重数,则对于非零向量v 0∈ℝn ,v 0不与主特征值对应的特征向量正交,按迭代公式进行计算:v k =Av k−1,(k =1,2,⋯),存在如下极限等式:lim k→∞v k λ1k =x 1 , (5.6) lim k→∞(v k+1)j (v k )j =λ1 , (5.7)其中x 1为主特征向量,(v k )j 表示向量v k 的第j 个分量(k =1,2,⋯).[证明]: 为了推导简便,不妨设主特征值λ1不是重特征值,并且假设矩阵A 为非亏损矩阵. 设A 的n 个特征值按模从大到小排列为: |λ1|>|λ2|≥⋯≥|λn |,它们对应于一组线性无关的单位特征向量x ̂1,⋯,x ̂n . 向量v 0可写成这些特征向量的线性组合:v 0=α1x̂1+⋯+αn x ̂n 根据已知条件,α1≠0,则v k =Av k−1=A k v 0=α1λ1k x ̂1+α2λ2k x̂2+⋯+αn λn k x ̂n =λ1k [α1x ̂1+∑αj (λj λ1)kx ̂j n j=2] =λ1k (α1x̂1+εk ) 其中εk =∑αj (λj λ1)k x ̂j n j=2. 由于|λj λ1|<1,(j =2,…,n), 则 lim k→∞εk =0 ⟹lim k→∞v kλ1k =α1x̂1 . 由于特征向量放大、缩小任意倍数后仍是特征向量,设x 1=α1x̂1,则它是主特征对应的一个特征向量. 上式说明,随k 的增大, v k 越来越趋近于主特征值的对应的特征向量.设j 为1到n 之间的整数,且(v k )j ≠0,则(v k+1)j (v k )j =λ1(α1x ̂1+εk+1)j (α1x̂1+εk )j 由于lim k→∞εk =0,随k 的增大上式等号右边趋于一个常数: λ1. 这就证明了定理的结论.若矩阵A 为亏损矩阵,可利用矩阵的若当分解证明这个定理,这里略去. 在这种情况下,“主特征值的几何重数等于代数重数”这一条件很重要,例如,若A =[310030001] ,它的主特征值为3,但其几何重数为1,不满足条件. 对这个矩阵A 进行实验显示无法用幂法求出主特征值.关于定理5.12,再说明几点:● 当主特征值λ1为重特征值时,应要求其几何重数等于代数重数,此时特征子空间维数大于1,向量序列{v k λ1k ⁄}的收敛值是其特征子空间中的某一个基向量.● 公式(5.7)式的含义是相邻迭代向量分量的比值收敛到主特征值. 因此在实际计算时,可任意取j 的值,只需保证比值的分母不为零.● 证明中假设了α1≠0,在实际应用中往往随机选取v 0,由于存在舍入误差,它一般都能满足. 感兴趣的读者也可思考一下,若初始向量v 0恰好与主特征向量都正交,那么幂法中的迭代向量序列会有什么结果?直接使用幂法,还存在如下两方面问题:(1) 溢出:由于v k ≈λ1k x 1,则|λ1|>1时,实际计算v k 会出现上溢出(当k 很大时);|λ1|<1时,实际计算v k 会出现下溢出(当k 很大时).(2) 可能收敛速度很慢. 由于εk =∑αj (λj λ1)kx j n j=2, εk →0的速度取决于求和式中衰减最慢的因子|λ2λ1|,当|λ2λ1|≈1时,收敛很慢. 由此导致v k →λ1k α1x 1, (v k+1)j (v k )j →λ1的收敛速度都将很慢,严重影响计算的效率.下面采用规格化向量的技术防止溢出,导出实用的幂法. 关于加速收敛技术的讨论,见下一小节.定义 5.6:记max ̅̅̅̅̅̅(v )为向量v ∈ℝn 的绝对值最大的分量, max ̅̅̅̅̅̅(v )=v j ,其中j 满足|v j |=max 1≤k≤n |v k |, 若j 的值不唯一,则取最小的那个. 并且,称u =v/max ̅̅̅̅̅̅(v )为向量v 的规格化向量(normalized vector).例5.5(规格化向量):设v =[3,−5,0]T ,max ̅̅̅̅̅̅(v )=−5,对应的规格化向量为u =[−35,1,0]T .根据定义5.6,容易得出规格化向量的两条性质.定理5.13: 定义5.6中的规格化向量满足如下两条性质:(1) 若u 为规格化向量,则‖u ‖ =1,并且max ̅̅̅̅̅̅(u )=1.(2) 设向量v 1和v 2的规格化向量分别为u 1和u 2,若v 1=αv 2, 实数α≠0,则u 1= u 2.在幂法的每一步增加向量规格化的操作可解决溢出问题. 先看第一步,v 1=Av 0,此时计算v 1的规格化向量u 1=v 1max ̅̅̅̅̅̅(v 1)=Av 0max ̅̅̅̅̅̅(Av 0). 然后使用规格化向量计算v 2:v 2=Au 1=A 2v 0max ̅̅̅̅̅̅(Av 0), (5.8) 再进行向量规划化操作,u 2=v 2max ̅̅̅̅̅̅(v 2)=A 2v 0max ̅̅̅̅̅̅(A 2v 0). (5.9) 公式(5.9)的推导,利用了(5.8)式和定理5.13的结论(2). 依次类推,我们得到: { v k =Au k−1=A k v 0max ̅̅̅̅̅̅(A k−1v 0) u k =v k max ̅̅̅̅̅̅(v k )=A k v 0max ̅̅̅̅̅̅(A k v 0) , k =1,2,⋯. (5.10) 根据定理5.12的证明过程, A k v 0=λ1k [α1x ̂1+∑αj (λj λ1)k x ̂j n j=2] ⟹u k =A k v 0max ̅̅̅̅̅̅(A k v 0)=α1x ̂1+∑αj (λj λ1)k x ̂j n j=2max ̅̅̅̅̅̅(α1x ̂1+∑αj (λj λ1)k x ̂j n j=2)k→∞→ x 1max ̅̅̅̅̅̅(x 1) , 即u k 逐渐逼近规格化的主特征向量. 同理,v k =Au k−1=A k v 0max ̅̅̅̅̅̅(A k−1v 0)=λ1k [α1x ̂1+∑αj (λj λ1)k x ̂j n j=2]max ̅̅̅̅̅̅(λ1k−1[α1x ̂1+∑αj (λj λ1)k−1x̂j n j=2]) =λ1α1x ̂1+∑αj(λj λ1)kx ̂j n j=2max ̅̅̅̅̅̅(α1x ̂1+∑αj (λj λ1)k−1x ̂j n j=2) 因此,根据定理5.13的结论(1)有:lim k→∞v k=λ1x1max̅̅̅̅̅̅(x1)⟹limk→∞max̅̅̅̅̅̅(v k)=λ1.基于上述推导,我们得到如下定理,以及如算法5.1描述的实用幂法.定理5.14: 设A∈ℝn×n,其主特征值唯一(且几何重数等于代数重数),记为λ1,取任意非零初始向量v0=u0,它不与主特征值对应的特征向量正交,按迭代公式(5.10)进行计算,则lim k→∞u k=x1max̅̅̅̅̅̅(x1),(5.11)lim k→∞max̅̅̅̅̅̅(v k)=λ1 ,(5.12)其中x1为主特征向量.算法5.1:计算主特征值λ1和主特征向量x1的实用幂法输入:v,A; 输出:x1,λ1.u:=v;While不满足判停准则dov:=Au;λ1:=max̅̅̅̅̅̅(v); {主特征值近似值}u:=v/λ1; {规格化}Endx1:=u. {规格化的主特征向量}在算法5.1中,可根据相邻两步迭代得到的主特征值近似值之差来判断是否停止迭代. 每个迭代步的主要计算是算一次矩阵与向量乘法,若A为稀疏矩阵则可利用它的稀疏性提高计算效率. 实用的幂法保证了向量序列{v k},{u k}不溢出,并且向量v k的最大分量的极限就是主特征值.最后,针对幂法的适用范围再说明两点:(1). 若实矩阵A对称半正定或对称半负定,则其主特征值必唯一(而且是非亏损阵). 有时也可以估计特征值的分布范围,从而说明主特征值的唯一性. 只有满足此条件,才能保证幂法的收敛性.(2). 对一般的矩阵,幂法的迭代过程有可能不收敛,此时序列{u k}有可能包括多个收敛于不同向量的子序列,它趋向于成为多个特征向量的线性组合. 但是,一旦幂法的迭代过程收敛,向量序列的收敛值就一定是特征向量,并可求出相应的特征值.例5.6 (实用的幂法):用实用的幂法求如下矩阵的主特征值:A=[3113] ,[解]: 取初始向量为v0=u0=[01]T . 按算法5.1的迭代过程,计算结果列于表5-1中.表5-1 实用幂法的迭代计算过程从结果可以看出,在每次迭代步中做的规格化操作避免了分量的指数增大或缩小. 经过9步迭代,特征值max ̅̅̅̅̅̅(v k )已非常接近主特征值的准确值4,特征向量也非常接近[1 1]T .5.2.2加速收敛的方法 加速幂法迭代收敛过程的方法主要有两种:原点位移技术和瑞利商(Rayleigh quotient )加速. 下面做些简略的介绍.一. 原点位移技术原点位移技术,也叫原点平移技术,它利用定理5.9的结论(2),即矩阵A −pI 的特征值为A 的特征值减去p 的结果. 对矩阵B =A −pI 应用幂法有可能得到矩阵A 的某个特征值λj 和相应的特征向量. 要使原点位移达到理想的效果,首先要求λj −p 是B 的主特征值,其次还要使幂法尽快收敛,即比例|λ2(B)λj −p |要尽量小,这里的λ2(B)表示矩阵B 的(按模)第二大的特征值. 在某种情况下设置合适的p 值,矩阵A,B 可同时取到主特征值. 图5-3显示了这样一个例子,矩阵A 的特征值分布在阴影区域覆盖的实数轴上,λ1为其主特征值. 按图中所示选取的p 值,将使得λ1−p 是矩阵B =A −pI 的主特征值,并且显然有|λ2(B)λ1−p |<|λ2(A)λ1| . 此时用幂法计算B 的主特征值能更快地收敛,进而得到矩阵的A 的主特征值. 图5-3也解释了原点位移法名字的由来,即将原点(或虚数坐标轴)移到p 的位置上,原始矩阵A 的特征值分布变成了矩阵B 的特征值分布.采用原点位移技术后,执行幂法仅带来很少的额外运算,而且仍然能利用矩阵A 的稀疏性. 它的关键问题是,如何选择合适的参数p 以达到较好的效果?这依赖于具体矩阵的情况,以及对其特征值分布的了解. 在后面,我们还会看到原点位移技术的其他用途.二. 瑞利商加速首先给出瑞利商的定义,以及它与特征值的关系,然后介绍瑞利商加速技术.定义5.7:设A ∈ℝn×n ,且为对称矩阵,对任一非零向量x ≠0,称R (x )=〈Ax,x 〉〈x,x 〉为对应于向量x 的瑞利商(Rayleigh quotient ). 这里符号〈,〉代表向量内积.定理5.15:设A ∈ℝn×n ,且为对称矩阵,其n 个特征值依次为:λ1≥λ2≥⋯≥ λn ,则矩阵A 有关的瑞利商的上下确界分别为λ1和λn . 即∀x ≠0,λn ≤R (x )≤λ1,且当x 为λ1对应的特征向量时R (x )=λ1,当x 为λn 对应的特征向量时R (x )=λn .[证明]: 根据实对称矩阵的特点,即可正交对角化(定理3.3),设特征值λ1,λ2,⋯,λn 对应的单位特征向量为x 1,x 2,⋯,x n ,设x =∑αj x j n j=1,则〈x,x 〉=〈∑αj x j n j=1,∑αj x j n j=1〉=∑αj 2n j=1,而图5-3 原点位移技术示意图.。
矩阵的相似变换和特征向量的应用
矩阵的相似变换和特征向量的应用矩阵是现代数学中一个十分重要的概念,它在各个领域都有广泛的应用。
其中,矩阵的相似变换和特征向量的应用是矩阵理论中的两个重要概念,有着极其重要的数学实践应用。
本文将主要讨论这两个概念的数学意义和应用。
1. 矩阵的相似变换矩阵的相似变换是指,对于两个矩阵A和B,如果存在一个可逆矩阵P,使得PAP^-1=B,则称矩阵A和B相似。
这个概念在矩阵理论中有着非常重要的地位,因为相似矩阵有许多相同的性质和特征,在矩阵的计算和分析中有着非常重要的作用。
例如,对于矩阵A,如果我们需要求它的n次幂,可以将其分解成相似矩阵的形式,即A=PBP^-1,其中B是对角矩阵,它可以很容易地进行幂的计算。
这个方法被称为矩阵的对角化,是线性代数中一个重要的理论。
除此之外,相似矩阵还有着其他的性质和应用。
例如,相似矩阵的行列式、迹、特征根都是相等的,即A和B的行列式、迹、特征根都是相等的。
因此,当我们需要计算这些指标的时候,可以通过矩阵相似的方式,进行更加简便的计算。
2. 特征向量的应用特征向量是指矩阵A满足方程Ax=λx的非零解x。
其中,λ被称为特征根,x被称为特征向量。
特征向量和特征根在矩阵理论和应用中具有非常重要的作用。
首先,特征向量和特征根可以帮助我们对矩阵进行对角化。
当一个矩阵拥有n个线性无关的特征向量时,可以将其对角化为对角矩阵,方便进行矩阵的计算和分析。
其次,特征向量和特征根也有着广泛的应用。
例如,在图像处理领域中,矩阵的特征向量和特征根被广泛应用于图像的压缩和恢复。
另外,在数据分析中,特征向量和特征根也被用来进行数据降维和分类分析。
总结矩阵的相似变换和特征向量的应用是矩阵理论中的两个重要概念,有着极其重要的数学实践应用。
相似矩阵具有许多相同的性质和特征,在矩阵的计算和分析中有着非常重要的作用。
特征向量和特征根则被广泛应用于图像的压缩和恢复、数据降维和分类分析等领域。
因此,我们需要深入理解这些概念的数学意义和应用,以便更好地应用它们进行各类问题的研究和解决。
大学线性代数第五章第一节矩阵的特征值与特征向量
在解决实际问题时,特征值和特征向量可以帮助我们理解数据的变化趋势和模式,例如在图像处理、信 号处理等领域有广泛应用。
在矩阵分解中的应用
01
矩阵分解是将一个复杂的矩阵 分解为几个简单的、易于处理 的矩阵,例如三角矩阵、对角 矩阵等。
矩阵的分解,如三角分解、 QR分解等,都涉及到特征值 和特征向量的应用,它们是构 造这些分解的基础。
02
矩阵的特征值与特征向量的定义
特征值的概念
特征值是指一个矩阵在某个非零常数倍下的不变性,即当矩阵A 乘以一个非零向量x得到0时,称该非零向量x为矩阵A的对应于 特征值λ的特征向量。
特征值可以通过求解矩阵的特征多项式得到,即|λE-A|=0。
密切的关系。
02
特征值和特征向量的关系可以通过矩阵的行列式、转
置、共轭等运算得到进一步的理解。
03
特征值和特征向量的关系性质在解决实际问题中具有
广泛的应用,如信号处理、控制系统等领域。
05ห้องสมุดไป่ตู้
矩阵特征值与特征向量的应用
在线性变换中的应用
矩阵特征值与特征向量是线性变换的一个重要工具,它们可以描述一个线性变换对一个向量空间的影 响。
特征值和特征向量在解决线性方程组、矩阵的相似变换、矩阵的 分解等领域有广泛应用。
矩阵特征值与特征向量的重要性
在解决线性方程组时,特征值 和特征向量可以提供一种有效 的解法,特别是对于一些特殊 类型的线性方程组。
在矩阵的相似变换中,特征值 和特征向量是确定相似变换的 关键,有助于理解矩阵的性质 和行为。
大学线性代数第五章第一节矩 阵的特征值与特征向量
第五章相似矩阵
k 1
a1 x a0 .
则定义矩阵多项式
g( A) ak A ak 1 A
k
k 1
a1 A a0 I .
用例5的方法,读者可自证: 若g(A)是矩阵多项式, 0 为A的特征值,则g(0 )为
g( 0) a k k a k 1 k 1 a1 0 a 0 0 0 的特征值。
例4 设n 阶方阵A 满足等式 A2 A, 证明A 的特征值为1或0。
证 设 由此
为A 特征值,则存在向量 X 0, 使 AX X .
2 2
A X A( AX ) A(X ) X . 又 A2 A, 故有 2 X X ,
即 ( ) X 0.
T
X k [0, 1, 1] , k 0 .
问题:从上面例子可以看到,的一个特征值对应着无 穷多个特征向量. 那么的一个重特征值对应着多少个 线性无关的特征向量?而一个特征向量又能否对应不 同的特征值?这都是有待讨论的问题.
注意:上面给出的特征值和特征向量的计算步骤主要 是针对具体的数值矩阵的. 求具有某些性质的非数值矩 阵的特征值,往往需要用定义讨论.
T
k 0 给出A关于
X k [1, 1, 2] .
4 的全体特征向量.
4 只对应一个线性无关的特征向量
[1, 1, 2] .
T
例3 求
3 1 1 7 5 1 A 6 6 2
的特征值和特征向量。 1 3 1 解 | I A | 7 5 1 ( 2 ) 2 ( 4) . 6 6 2
2
因此 X 0, 所以 2 0,即 1或0.
矩阵的相似变换和特征值_几何与线性代数
第五章 矩阵的相似变换和特征值
§5.1 方阵的特征值和特征向量
例1.
3 1 求 A 的特征值和特征向量. 1 3
解: | I A|
3
1
1
3
( 4)( 2),
所以A的特征值为1=2, 2=4.
对于1=2, (2I–A)x =
例1.
3 1 求 A 的特征值和特征向量. 1 3
解: | I A|
3
1
1
3
( 4)( 2),
所以A的特征值为1=2, 2=4.
对于2=4, (4I–A)x =
x1 x 2 0 即 x1 x 2 0
i =1 n n
i =1 n
i =1
i = detA = |A|
第五章 矩阵的相似变换和特征值
§5.1 方阵的特征值和特征向量
定理5.2. 设是方阵A的一个特征值, f是一个 多项式, 则f()是方阵f(A)的一个特 征值. 推论. 若f是多项式, A是一个方阵, 使f(A) = O (这时称f为A的一个零化多项式), 则A 的任一特征值 必满足f() = 0.
第五章 矩阵的相似变换和特征值
§5.2 相似矩阵
定理5.5. 设n阶方阵A与B相似, 则有相同的特 征多项式和特征值. 事实上, 设P –1AP = B, 则 |I–A| = |P –1|· I–A|· |I–B|. | |P|= 注: 特征多项式相同的矩阵未必相似. 1 1 1 0 , 例如 A = 0 1 , B = 0 1 它们的特征多项式都是(1)2. 但是若有P –1AP = B, 则A = PBP –1 = B. 矛盾!
第五章 方阵的特征值 特征向量与相似化简(第二讲)
性质6 性质 若A~B,则对于任意的多项式f(λ),必有f(A)~ f(B). 证明 设可逆矩阵P使P-1AP=B,对于任何正整数m及任 意数k ,容易验证如下等式 P-1(kA)P=(kB), P-1AmP= (P-1AP)m= Bm, 利用以上两式又可验证,对任意多项式f(λ),总有 P-1 f(A)P= f(B), 即知f(A)~ f(B). 性质7 性质 若A~B,则A与B的特征多项式相同,从而A与B的 特征值相同. 证明 因A与B相似,即有可逆矩阵P, 使 1AP = B 故 P
λ1 λ1 λ2 λ2 = P . =P1,P2, …,Pn λn λn
即 AP = P∧ , 所以P –1AP =∧.
机动 目录 上页 下页 返回 结束
定理3.1的证明过程告诉我们:当n阶矩阵A相似对角矩阵 时,该对角矩阵的主对角元素恰是矩阵A的全部特征值;相似 因子的个列恰是矩阵A的n个线性无关的特征向量.并且这些 特征向量与分布在对角矩阵主对角线上的特征值依序对应. 由于一个矩阵的特征向量是不惟一的,所以当方阵相 似于对角矩阵时,相似因子是不惟一的,但是能与A相似的 对角矩阵,除主对元素的相互次序可能不同之外,是由矩 阵A的特征值完全确定的. A . 通常我们把方阵相似于对角矩阵的问题称为矩阵的相似 相似 对角化问题,能与对角矩阵相似的方阵又称为可对角化矩阵 可对角化矩阵. 对角化 可对角化矩阵 注意到:n阶矩阵A的特征向量都是n维向量,因此A的 线性无关特征向量的个数不会超过n.为了最大限度地找到A 的线性无关特征向量组,应先弄清楚如下两个问题:一是A 的ni重特征值λi对应的特征向量最多能有多少个线性无关? 二是不同的特征值的各自线性无关的特征向量组合在一起 是否能保持线性无关? 下面的两个定理将回答这两个问题.
矩阵的特征值、特征向量和矩阵的相似
特征值和特征向量与矩阵相似的关系
01
特征值和特征向量是矩阵的重要属性,它们与矩阵 的相似性有着密切的联系。
02
如果两个矩阵相似,它们的特征值和特征向量也必 须相同。
03
特征值和特征向量的性质决定了矩阵的稳定性、可 逆性和可约性等重要性质。
特征值和特征向量在矩阵相似中的应用
在解决线性方程组时,可以利用特征值和特征向量的性质,将原方程组转 化为易于求解的形式。
|λ|=√aii,其中aii为矩阵A的对角线元素。
特征值和特征向量的计算方法
定义法
根据特征值和特征向量的定义, 通过解方程组Av=λv来计算特征 值和特征向量。
幂法
通过迭代计算矩阵A的幂,然后观 察幂的迹的变化,从而找到特征 值和特征向量。
谱分解法
将矩阵A分解为若干个简单的矩阵 的乘积,然后通过计算这些简单 矩阵的特征值和特征向量来得到 原矩阵的特征值和特征向量。
矩阵的特征值、特 征向量和矩阵的相 似
目录
• 矩阵的特征值和特征向量 • 矩阵的相似 • 矩阵的特征值、特征向量和矩阵的相似的
关系 • 矩阵的特征值、特征向量和矩阵的相似的
应用
01
CATALOGUE
矩阵的特征值和特征向量
特征值和特征向量的定义
特征值
对于给定的矩阵A,如果存在一个标 量λ和对应的非零向量v,使得Av=λv 成立,则称λ为矩阵A的特征值。
02
CATALOGUE
矩阵的相似
矩阵相似的定义
定义:如果存在一个可逆矩阵P,使 得$P^{-1}AP=B$,则称矩阵A与B相 似。
相似矩阵具有相同的行列式值、迹、 秩和特征多项式。
矩阵相似的性质
01 相似的矩阵具有相同的特征多项式和行列式值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例5. 设为方阵A的特征值, 证明() = 22 –3 +4.
为(A) = 2A2 –3A +4I的特征值.
证明: 因为为A的特征值, 即有非零向量x使Ax = x,
于是(A)x = (2A2 –3A +4I)x
1
(k1p1, k2p2, …, kmpm) 1
1 2
m1 1
m1 2
=
O.
1
m
m1 m
由此可得(k1p1, k2p2, …, kmpm) = O.
因而k1 = k2 = … = km = 0.
这就证明了p1, p2, …, pm是线性无关的.
第五章 矩阵的相似变换和特征值
§5.1 方阵的特征值和特征向量
第五章 矩阵的相似变换和特征值
§5.1 方阵的特征值和特征向量
一. 特征值, 特征向量的定义和计算
1. 设A是n阶方阵, 为数, 为n维非零向量. 若A = , 则称为A的特征值, 称为A 的对应于的特征向量.
2. 由A =得齐次线性方程组(I–A) =, 它有非零解系数行列式|I–A|=0, 这个 关于的一元n次方程, 称为A的特征方程, |I–A|称为A的特征多项式.
二. 特征值, 特征向量的性质
定理5.1. 设1, …, n(实数或复数, 可以重复)
是n阶方阵A=[aij]的n个特征值, 即
|I–A| = (–1) (–2)…(–n).
则
n
n
i=1i = trA =i=1aii
n
i =1
i
=
detA
=
|A|
第五章 矩阵的相似变换和特征值
§5.1 方阵的特征值和特征向量
定理5.2. 设是方阵A的一个特征值, f是一个 多项式, 则f()是方阵f(A)的一个特
征值.
推论. 若f是多项式, A是一个方阵, 使f(A) = O (这时称f为A的一个零化多项式), 则A
的任一特征值 必满足f() = 0.
注: A的零化多项式的根未必都是A的特征值.
例如f(x) = x21,
§5.2 §5.3
第五章 矩阵的相似变换和特征值
§5.1 方阵的特征值和特征向量
例1.
求
A
3 1
1 3
的特征值和特征向量.
解:
|I
A|
3 1
1 3
(
4)(
2),
所以A的特征值为1=2, 2=4.
对于1=2,
(2I–A)x
=
即
x1 x1
x2 x2
0 0
解之得
x1 x2
k
1 1
(0 kR).
求得(2I–A)x = 的基础解系: p1=(0,0,1)T.
对应于1=2的特征向量为kp1 (0kR).
对于2=3=1,
求得(I–A)x = 的基础解系: p2=(–1, –2,1)T.
对应于2=3 =1的特征向量为kp2 (0kR).
第五章 矩阵的相似变换和特征值
§5.1 方阵的特征值和特征向量
A的对应于1=2的特征向量为
k k
(0
k
R
).
第五章 矩阵的相似变换和特征值
§5.1 方阵的特征值和特征向量
例1.
求
A
3 1
1 3
的特征值和特征向量.
解:
|I
A|
3 1
1 3
(
4)(
2),
所以A的特征值为1=2, 2=4.
对于2=4,
(4I–A)x
=
即
x1 x1
x2 x2
0 0
解之得
x1 x2
= 2(A2)x–3Ax +4x
= 22x–3x +4x
= (22 –3 +4)x
= ()x,
所以()为(A)的特征值.
例6. 设1, 2, …, m为方阵A的m个不同的特征值,
p1, p2, …, pm为依次对应于这些特征值的特
征向量, 证明p1, p2, …, pm线性无关.
证明: 若k1p1 +k2p2 +…+kmpm = , 则
k
1 1
(0 kR).
A的对应于2=4的特征向量为
k k
(0
kR).
第五章 矩阵的相似变换和特征值
§5.1 方阵的特征值和特征向量
1 1 0
例2. 求 A 4 3 0的特征值和特征向量.
1
0
2
解: |I–A| = (–2)(–1)2.
所以A的特征值为1=2, 2= 3= 1.
对于1=2,
2 1 1
例3. 求 A 0 2 0的特征值和特征向量.
4 1 3
解: |I–A| = (+1)( –2)2.
所以A的特征值为1= –1, 2= 3= 2. (–I–A)x = 的基础解系: p1=(1,0,1)T. 对应于1= –1的特征向量为kp1 (0kR). (2I–A)x = 的基础解系:
§5.2 相似矩阵
定理5.5. 设n阶方阵A与B相似, 则有相同的特 征多项式和特征值.
事实上, 设P –1AP = B, 则
|I–A| = |P –1|·|I–A|·|P|= |I–B|.
注: 特征多项式相同的矩阵未必相似.
例如 A =
1 0
1 1
, B=
p2=(0, 1, –1)T, p3=(1, 0, 4)T.
对应于2=3 =2的特征向量为k2p2 +k3p3
(k2, k3不同时为零).
第五章 矩阵的相似变换和特征值
§5.1 方阵的特征值和特征向量
例4. 设为方阵A的特征值, 证明2为A2的特征值. 证明: 因为为A的特征值, 即有非零向量x使Ax = x,
A1 =
1 0
0 1
,
A2 =
1 0 0 1
,
A3 =
0 1
1 0
.
第五章 矩阵的相似变换和特征值
§5.2 相似矩阵
§5.2 相似矩阵
一. 相似矩阵的定义和性质
设A, B都是n阶方阵, 若有可逆矩阵P, 使得
P 1AP =B, 则称矩阵A与B相似. 记为A~B.
P称为相似变换矩阵或过渡矩阵.
易见, 矩阵间的相似关系满足
证明: 设P 1AP =B, f(x) = anxn+…+a1x+a0, 则 P 1f(A)P
= P 1(anAn+…+a1A+a0I)P
= anP 1AnP+…+a1P 1AP+a0 P 1IP = an(P 1AP)n+…+a1P 1AP+a0I = anBn+…+a1B+a0I
= f(B).
第五章 矩阵的相似变换和特征值
(1) 反身性: A~A;
(2) 对称性: A~B B~A; (3) 传递性: A~B, B~C A~C. 即矩阵间的相似关系是一种等价关系.
且A与B相似 A与B相抵. 但反之未必.
第五章 矩阵的相似变换和特征值
§5.2 相似矩阵
命题: 设A~B, f是一个多项式, 则f(A)~ f(B).