西安科技大学研究生数值分析课件7章矩阵特征值与特征向量计算

7 矩阵特征值与特征向量地计算

设A 为n 阶方阵,所谓A 地特征值问题是求数λ和非零向量x ,使x Ax λ=成立.数λ称作A 地一个特征值,非零向量x 称作与特征值λ对应地特征向量.求给定方阵地特征值与特征向量是先求解特征方程

()||0E A ϕλλ=-=

然后对应于每一个特征值i λ,再求解退化地齐次线性方程组

()0i E A x λ-=

从而得到A 地特征值i λ及对应地特征向量x .

但是这种方法计算机很大,计算过程复杂,因此有必要研究相对简单地数值解法.本章主要介绍三类计算特征值地方法:计算大型(稀疏)矩阵主特征地幂法与反幂法,计算中小型(实对称)矩阵全部特征值地Jacobi 法,计算中小型矩阵全部特征值地QR 法.

7.1 特征值估计

在矩阵特征值计算中,有时需要对特征值所在范围给出一个估计.这里介绍一种从矩阵地元素出发,运用较简便地运算估计特征值地方法.

定义7-1 设()n m ij A a C ⨯=∈,称由不等式

||ii i z a R -≤

在复平面上确定地区域为矩阵A 地第i 个盖尔圆(Gerschgorin 圆),并用i G 表示.

其中1||n

i ij j j i R a =≠=∑称为盖尔圆i G 地半径(1,2,,)i n =.

定理7-1 矩阵()n m ij A a C ⨯=∈地一切特征值均落在它地n 个盖尔圆地并集中,即

1

(1,2,

,)n

i j

j G i n λ=∈

=.

证明 设λ是A 地任一特征值,12(,,,)T n x x x x =是λ对应地特征向量.

令0

1||max ||i i i n

x x ≤≤=,则0

0i x ≠.由Ax x λ=,可得00

1

()n

i j j i j a x x λ==∑.即

∑≠==-n

i j j j j i i i i x a x a 0

00001)(λ

于是有 00

00

00011i i j

n

i j j j

i n

i j j i j

j

i i i R x x a

x x a

a ≤≤

=

-∑∑≠=≠=λ

这表明任一特征值0

i G λ∈,从而也在A 地第n 个盖尔圆地并集中.

例7-1 估计矩阵10.10.20.30.530.10.210.310.50.20.30.14A ⎡⎤⎢⎥⎢⎥=⎢⎥-⎢

⎥---⎣⎦

地特征值范围. 解 A 地4个盖尔圆为:

1:|1|0.6G z -≤ 2:|3|0.8G z -≤ 3:|1| 1.8G z +≤ 4:|4|0.6G z +≤

画在复平面上其区域如图7-1所示.

图7-1 例7-1盖尔圆分布图

于是A 地全部特征值就在这4个盖尔圆地并集中.为了更确切地知道某个特征值落在哪个或哪几个盖尔圆地并集中,给出如下第二盖尔圆盘定理.

定理7-2 若A 地n 个盖尔圆中,有m 个盖尔圆构成地一个连通域(所谓连通域,是指其中地任意两点都可以用位于该区域内地一条折线连接起来),且该连通域与其余n m -个盖尔圆严格分离,则在该连通域中恰好有A 地m 个特征值(重特征值按重数重复计算).特别地,每个孤立地盖尔圆恰有A 地一个特征值(证明从略).

由定理2可知,在例1中2G 与4G 中各有A 地一个特征值,而1G 与3

G 构成地连通部分中有两个特征值,但不能确定这两个特征值具体落在哪个盖尔圆中.

例7-2 估计矩阵10.80.50A -⎡⎤

=⎢⎥⎣⎦

地特征值范围. 解 A 地两个盖尔圆为:

1:|1|0.8G z -≤,2:|0|0.5G z -≤

在复平面上地区域如图7-2所示.

图7-2 例7-2盖尔圆分布图

此时只能判断A 地两个特征值落在1G 与2G 地并集中,至于是每个盖尔圆中各有一个特征值还是两个特征值都落在其中一个盖尔圆上

则无法确定.实际上,由于1,21

(12

λ=±,1,2||0.5λ=>,所以两个特征值都不会在盖尔圆2G 中,而是落在盖尔圆1G 中.

对于某些矩阵,可利用相似变换矩阵具有相同特征值地性质得到更确切地特征值范围.

设()ij n m A a ⨯=,取正数12,,,n d d d 构成对角阵12diag(,,,)n D d d d =,对

A 作相似变换,令1(

)i

ij n n j

d B DAD a d -⨯==,由于B 相似于A ,所以B 与A 地特征值完全相同,又由于B 与A 地主对角线元素对应相等,所以B 与A 地盖尔圆圆心相同.这表明,若适当选取正数12,,,n d d d ,可以改变盖尔圆地半径,从而有可能将相交地盖尔圆分离得到仅含一个特征值地孤立盖尔圆.选取12,,,n d d d 地一般方法是:欲使A 地第i 个盖尔圆i G 地半径大而其余盖尔圆变小,就取1i d >,其余1()j d j i =≠.

例7-3 求矩阵2050.841011210A j ⎡⎤

⎢⎥=⎢⎥

⎢⎥⎣⎦

地特征值范围. 解 A 地3个盖尔圆为:

1:|20| 5.8G z -≤,2:|10|5G z -≤,3:|10|3G z j -≤

其中1G 与2G 相交,而3G 孤立.记3G 中所含地一个特征值为3λ,如图7-3所示.

为分离2G 与1G ,可以让A 地第3行元素绝对值变大,第3列元素绝对值变小.

现取diag(1,1,2)D =,则

12050.44100.52410B DAD j -⎡⎤

⎢⎥==⎢⎥

⎢⎥⎣⎦

图7-3 例3盖尔圆分布图 图7-4 例7-3分离后盖尔圆分布图

其3个盖尔圆分别是:1:|20| 5.4G z '-≤,2

:|10| 4.5G z '-≤,3:|10|6G z j '-≤ 显然,B 地盖尔圆是3个孤立地盖尔圆,如图7-4,注意,此情况下,3G '地半径变大了.

例7-4 设矩阵()ij n n A a ⨯=按行严格对角占优,则A 可逆.

证明 由线性代数知,A 可逆地充分条件是||0A ≠,而1

||n

j j A λ==∏(其

中j λ是A 地特征值),所以只要证明0j λ≠即可(1,2,,)j n =. 设λ是A 地任一特征值,则必存在某个盖尔圆i G 使

∑≠=≤-i

j ij i ii a R a λ.

若0j λ=,则有∑≠≤i

j ij ii a a ,而这与A 按行严格对角占优矛盾,故应有

0λ≠,由λ地任意性,得||0A ≠.

7.2 幂法与反幂法

在线性代数中,设A 是n 阶方阵,若A 存在n 个线性无关地特征向量,则称这n 个特征向量构成A 地一个完全地特征向量组.

例如,对矩阵

320230005A -⎡⎤⎢⎥=-⎢⎥⎢⎥⎣⎦,110430102B -⎡⎤

⎢⎥=-⎢⎥

⎢⎥⎣⎦

通过求解特征方程,不难求出A 地三个特征值为1231,5λλλ===,B

地三个特征值为1232,1λλλ===.方阵A 可以找到三个线性无关地特征向量,而方阵B 找不到三个线性无关地特征向量.我们称方阵A 可对角化,而B 不可对角化. 7.2.1 幂法

幂法地基本思想是构造一个向量序列使之逼近主特征值(矩阵地按模最大地特征值)对应地特征向量,然后求出主特征值.该方法简单易行,但收敛速度较慢.

现设()ij n n A a ⨯=有一个完全地特征向量组12,,,n x x x ,其对应地特征值是12,,,n λλλ.已知A 地主特征值是单根1λ,即特征值满足条件

12||||||n λλλ>≥≥

任取一个非零初始向量0u ,由矩阵A 构造向量序列

10221011

0k k k u Au u Au A u u Au A u

++=⎧⎪==⎪⎪

⎪==⎪⎪⎩

由于A 地完全特征向量组可以作为向量空间n R 地一组基,因此0

u 可由12,,,n x x x 线性表示,即有

01122n n u a x a x a x =++

+ (设10a ≠)

于是

01112221

1111121()()

k k k k k n n n

n k

k k i i i k i u A u a x a x a x a x a x a x λλλλ

λλελ===+++⎡⎤=+=+⎢⎥⎣⎦∑ 其中2

1()n

k i k i i i a x λελ==∑.注意到

),,2(11

n i i

=<λλ,故当k →∞时,0k ε→,因此有

111k k u a x λ≈

由于1x 是主特征值1λ对应地特征向量,其乘上常数因子11k a λ仍为1λ地特征向量,故当k 充分大时,迭代向量k u 是1λ地特征向量地近似向量.

为了利用迭代向量求出主特征值1λ地近似值,设()k i u 表示k u 地第i 个分量,则

1111111()()()[]()()()k i i k i

k i i k i

u a x u a x ελε+++=+ 于是 11()lim

()k i

k k i

u u λ+→∞

= 这表明两相邻迭代向量对应分量地比值收敛于主特征值,亦即当k 充分大时,可用两相邻迭代向量地分量比作为主特征值地近似值,即

11()()k i

k i

u u λ+≈

若主特征值是A 地r 重实特征值,即12(1)r r n λλλ===≤≤,对应

地r 个线性无关特征向量为12,,,n x x x .则有

01

111()r n

k

k k i k i i i i i i r u A u a x a x λ

λλ==+⎡⎤==+⎢⎥⎣⎦

∑∑

当k 充分大时,

1

1

r

k

k i i i u a x λ

=≈∑

即k u 仍为主特征值对应地特征向量地近似向量,相邻两迭代向量地分量比仍为主特征值地近似值.综上所述,有

定理7-3 设A 是n 阶实矩阵,具有完全地特征向量组,主特征值是r 重根,即

112||||||||

(1)r r n r n λλλλ++>≥≥≥≤≤

则对任意非零初始向量0u ,迭代向量

0k k u A u = 满足 11

1lim

(0)r

k

i i

k

k i u a x a λ→∞

==≠∑ ,11()lim ()k i

k k i

u u λ+→∞= 或 1

1

r

k k i i i u a x λ

=≈∑,

11()()k i

k i

u u λ+≈ 这样用非零初始向量0u 及矩阵A 构造向量序列{}k u 以计算A 地主

特征值1λ及相应地特征向量地方法称为幂法.不过从上面地讨论中可以看到,如果1||1λ>或11<λ,迭代向量k u 当k →∞时,其不为零地分量就会趋于无穷大或趋于零.为克服这个缺点,可以在每步迭代中加上对向量规范化地步骤,使迭代向量地数量级保持在一个稳定地量级上,归纳起来,幂法地计算步骤为:

步骤 1 给定非零初始向量0u ,精度12,εε,令00v u =;令

(0)10max()v λ=,1=k ;

步骤 2 迭代1-=k k Av u ,()1max()k k u λ=,其中)max(k u 表示k u 绝对值最大地分量;

步骤3 规范化max()

k

k k u v u =

; 步骤 4 若11k k v v ε--<且()(1)112||k k λλε--<,则k v 即为1λ地近似特征向量,()1k λ即为1λ地近似值;否则,1+=k k ,转步骤2继续迭代.

例7-5 用幂法计算

1.0 1.00.51.0 1.00.250.50.25

2.0A ⎡⎤

⎢⎥=⎢⎥

⎢⎥⎣⎦

地主特征值和相应地特征向量,结果见表7-1.

表7-1

而此题地准确值为

1 2.5365258λ= 1(0.748221,0.649661,1.000000)T x =

7.2.2 幂法地加速

幂法地收敛速度由比值2

1

r λλ=

来确定,r 越小收敛越快,而当1r ≈时收敛可能很慢.为了克服这一缺点,常采用原点平移法对幂法进行加速.

设B A pE =-,其中p 是待定参数.显然,若A 地特征值为12,,,n λλλ,则B 地相应特征值(1,2,,)i k i n =为12,,,n p p p λλλ---,且A .B 地特征向量相同.这是因为对A 有特征方程||0i A E λ-=,而对B 有特征方程|||()|0i i B k E A p k E -=-+=,所以

,i i i i p k k p λλ=+=-

另一方面,若i x 是A 地对应i λ地特征向量,即

i i i Ax x λ=

则 ()()i i i i i i Bx A pE x Ax px p x λ=-=-=-

原点平移法地思想是引入矩阵B ,恰当地选择参数p ,使11k p λ=-是B 地主特征值,且其速比2211

max

B A p r r p λλ

λλ-=<=-,这样用幂法求B 地主特征值1k 地收敛速度就快于用幂法求A 地主特征值1λ,而一旦1k 求

出,由11k p λ+=可得A 地主特征值,达到了加速地目地.但是为了选取恰当地选择参数p ,需要对A 地特征值地分布地大致了解. 例7-6 设4阶方阵A 有特征值

15(1,2,3,4)j j

j λ=-=

其速比2

1

0.9A r λλ=

≈.作变换 (12)B A pE

p =-=

则B 地特征值为12k =,21k =,30k =,41k =-,其速比211

2

B A k r r k =

=<. 设A 地实特征值满足

121n n λλλλ->≥

≥>

若2,n λλ地值可大致估计出,若要求1λ,考察待定参数p 地选取. 在原点平移法通过变换pE A B -=后,不论p 如何选取,矩阵地B 主特征值也只能是在n p λ-或 1p λ-.若希望求1λ,就应选择p ,使1p λ-称为B 地主特征值,即

1||||n p p λλ->-

这时B 地收敛速比B r 是比值21||/||p p λλ--和1||/||n p p λλ--中地较大者,即

211||||max ,||||n B p p r p p λλλλ⎧⎫

--=⎨

⎬--⎩⎭

显然B r 依赖于p 地选取,记做()B r p .为了使应用幂法求B 地主特征值

地收敛速度尽可能快,我们希望选择最佳参数*p ,使

*()min ()B B r p r p =

由B r 地表示式(求二者之间地较大值)和)(*p r B 对)(p r B 地最小化要求,只有当

2||||n p p λλ-=-

时,()B r p 达到最小.由于2n p p λλ-=-会有得到矛盾地结果(2n λλ=),所以只能是

2()n p p λλ-=--

即 *22

n

p λλ+=

类似地,若用反幂法求最小特征值n λ,若1n λ-,1λ可大致估计,取最佳平移参数

*11

2

n p λλ-+=

例7-7 取0.75p =,用原点平移法,计算例7-7中矩阵A 地主特征值.

解 作变换B A pE =-,则

0.25

10.510.250.250.50.25 1.25B ⎡⎤⎢⎥=⎢⎥

⎢⎥⎣⎦

对B 应用幂法,计算结果见表7-2.即1 1.7865914k ≈,则A 地主特征值1

λ为

110.75 2.5365914k λ=+=

与例7-5比较,上述结果比例7-5迭代15次还好.

表7-2

7.2.3 反幂法

设方阵A 按模最小地特征值是n λ,且0n λ≠,则A 可逆.于是,由

n n n Ax x λ=,可得11

n n n

A x x λ-=

,这表明

1

n

λ是1A -地主特征值.反幂法就是将

幂法应用于1A -,通过求出1A -地主特征值得到A 地按模最小地特征值及其对应地特征向量.

定理7-4 设A 是n 阶实矩阵,具有完全地特征向量组,其特征值满足

12||||||0n λλλ≥≥≥>

则对任意非零初始向量00u v =,按下述方式构造地迭代向量

11k k u A v --= ,max()

k

k k u v u =

满足

lim max()n k k n x v x →∞

=

, 1

lim max()k k n

u λ→∞= /max()k n n v x x ≈,1

max()k n

u λ≈

在实际计算中,可先对A 进行LU 分解,通过求解

1k k Ly v -= ,k k Uu y =

来求解方程组1k k Au v -=.反幂法地计算步骤为:

步骤1 预先取定非零向量00u v =;给定精度12,εε;取(

0)0m a x ()n

u μ=; 步骤2 对矩阵A 作LU 分解,A LU =;令1=k ;

步骤3 求解方程组

1k k Ly v -= ,k k Uu y = 得到迭代向量k u ; 步骤4 规范化max()

k

k k u v u =

步骤5 若11k k v v ε--<且()(1)2||k k n n μμε--<,则k v 即为A 地对应于n λ地近似特征向量,()1

k n

μ即为n λ地近似值;否则,令1+=k k ,转步骤3继续

迭代.

7.3 矩阵地两种正交变换

本节先介绍镜面(初等)反射变换和平面旋转变换,它们是QR 算法和Jacobi 算法地基础.

7.3.1 豪斯荷尔德(House holder )变换

定义7-2 设有方阵B ,若当1i j >+时(,1,2,,)i j n =,0ij b =,则称B 是上

Hessenberg 矩阵,即

111212122

2,1

n n n n nn b b b b b b B b b -⎡⎤⎢⎥⎢

⎥=⎢⎥⎢⎥⎣

定义7-3 设向量ω满足21ω=,矩阵

2T H E ωω=- (ω是列向量)

称为初等反射矩阵,又称House holder 矩阵,记为()H ω,即

2112122122212

12222122()2212n n n n n H ωωωωωωωωωωωωωωωω⎡⎤

---⎢⎥

---⎢⎥

=⎢⎥⎢⎥---⎢⎥⎣⎦

其中(1,2,,)i i n ω=是ω地分量.

可以证明初等反射阵是对称阵()T H H =.正交阵()T H H E =. 例7-8 设向量0α≠,试证矩阵

22

2T

H E ααα=- 是一个初等反射阵. 证明 令2

α

ωα=

,则 22222

1||||||

||1αωααα=== 由定义7-3,22

22T

T

H E E ααωωα=-=-是初等反射阵.

定理7-5 设,x y 是两个不相等地n 维列向量,且22||||||||x y =,则存在一个初等反射阵H,使得

Hx y =

证明 令2

||||x y

x y ω-=

-,由例7-8可知

2

2

()()

22||||T T T

x y x y H E E x y ωω--=-=-- 是一个初等反射阵.

由于22||||()()T T T T T

x y x y x y x x y x x y y y -=--=--+ 注意到22||||||||x y =,即T T x x y y =,又()T T T T x y x y y x == ,故

22||||2()T T

x y x x y x -=-

从而

22

()()

2

||||T T x y x x y x Hx x x y --=--y y x x =--=)(. 例7-9 设1(1,2,2),(1,0,0)T T x e ==,用Householder 变换将x 化为与1

e 同方向地向量.

解 因为2||||3x =,可设13y e =,则22||||||||x y = 取

21,1,1)||||T x y w x y -=

=--,构造Householder 矩阵

[]11122212111,1,121233

11221T H E ww -⎡⎤⎡⎤⎡⎤

⎢⎥⎢⎥⎢⎥=-=--=-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦⎣⎦

则13Hx e =

推论 设向量12(,,,)0T n x x x x =≠,12()||||r sign x x =,且1x r ε≠-,则存在初等反射阵

12

2

2||||T T uu H E E uu u ρ-=-=- 使1Hx r ε=- .

其中,1(1,0,,0)T ε=,1u x r ε=+,22||||/2u ρ=.

设12(,,,)T n u u u u =,则

12(,,

,)T n u x r x x =+

222

22122222112111

||||[()]

221(2)

2

()

n n u x r x x r rx x x x r r x ρ==

++++=+++++=+

引入初等反射阵地目地,是设法用一系列初等反射阵将原始矩阵

约化成上Hessenberg 阵.由于约化过程是逐列进行地,我们先给出计算Hx 地算法步骤,该算法算出H 及r ,使Hx r ε=-,u 地分量冲掉x 地分量.

(1)1max ||i i n

x η≤≤=;

(2)(1,2,

,)i

i i x x u i n η

←==,此步规范化是为避免计算r 时产生溢

出;

(3) 12211

()()n

i

i r sign x x ==∑;

(4)11u u r ←+;

(5) 1ru ρ=; (6) r r η←;

于是初等反射阵1T H E uu ρ-=-,1Hx r ε=-.

如果要将H 作用于矩阵A ,设i a 是A 地第i 列向量,则

12(,,

,)n A a a a =,

12(,,

,)n HA Ha Ha Ha = 其中,11()()(1,2,

,)T T i i i i Ha E uu a a u a u

i n ρρ--=-=-=.

下面讨论用初等反射阵约化原始矩阵A 称为上Hessenberg 阵地步骤.

11121(1)

(1)21

2221112

1(1)

(1)212212

n n n n nn a a a a a a a A A A a a a a a ⎡⎤

⎢⎥⎡⎤⎢⎥===⎢

⎥⎢⎥⎣⎦

⎥⎣⎦

步骤1 不妨设(1)

21

0a ≠(否则这一步不需约化),选择初等反射阵1R ,使(1)

121

11R a r ε=-,其中: 1(1)(1)2212112(1)1211112111121211111

()(())

(1)

1()2n

i i T r sign a a u a r n u r r a R E u u εερρ=-⎧=⎪⎪

⎪=+-⎨

⎪==+⎪⎪=-⎩∑是维单位坐标列向量 令

11100U R ⎡⎤=⎢⎥⎣⎦

(2)(2)(2)

(1)

11

1213

11

1212111

(2)(2)(1)(1)

22

23121

12210

A a A a A R A U AU a A R a R A R ⎡⎤⎡⎤===⎢⎥⎢⎥⎣⎦⎣⎦

其中,(2)11A 是21⨯阵,(2)22a 是2n -维列向量,(2)

23A 是2n -阶方阵.

步骤k 设对A 已进行了1k -步约化,即

111

(2)()()

()

()

11121,111,1

1(2)()()

()122

2,1

2,2()()

()1

,1,()()()1,1,1

1,()

()

(),1

(2,3,

,1)k k k k k k k k k k k n k k k k k

n k k k k kk k k k n k k k k k k k k n

k k k nk

n k nn

A U A U k n a a a a a a r a a a a r a a a a a a a a a ----+--++++++==-⎡⎢-⎢=-⎣

()()()

111213()()22

230

k k k k k A a A a A ⎤⎥⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎦

⎡⎤=⎢⎥⎣⎦

其中,()11k A 是(1)k k ⨯-阵,()22k a 是n k -维列向量,()

23k A 是n k -阶方阵.设()

220k a ≠,选初等反射阵()k R n k -阶,使()22

1k k k R a r ε=-,其中1ε是n k -维单位坐标向量,可得

1()()221,1()221()1,1()(())

()

n

k k k k k ik i k k k

k k k k k

k n

T k k k k r sign a a u a r r r a R E u u ε

ρρ+=++-⎧=⎪⎪

⎪=+⎨⎪=+⎪⎪=-⎩∑ 令 00k k E U R ⎡⎤

=⎢⎥

⎣⎦

则 ()()()1112131()()

2223()()()

111213()

1230

0k k k k k k k k k k k k k k k k k k k k k A a A R A U A U R a R A R A a A R r R A R ε+⎡⎤

==⎢⎥⎣

⎦⎡⎤=⎢⎥-⎣

⎦ 可见1k A +地左上角1k +阶子阵为上Hessenberg 阵,从而约化又进了一步.重复此过程,直到

12

21122

11

(2)

122

(3)

2

33

(1)1

n n n n n nn A U U U AU U U a r a r a r a -----=⨯

⨯⨯⎡⎤⎢⎥-⨯

⨯⎢⎥⎢⎥=-⨯⎢⎥⎢⎥⎢⎥-⎣

使原始矩阵A 在一系列初等反射阵地作用下,约化为上Hessenberg 阵.综上所述,有定理7-6.

定理7-6 如果A 是n 阶实矩阵,则存在初等反射阵122,,,n U U U -,

使

2

2112

2n n U U U AU U U C --=(上Hessenberg 阵)

例7-10 试证矩阵A 与其约化成为地上Hessenberg 阵C 有相同地特征值.

证明 记221n P U U U -=,由于初等反射阵是正交对称阵,故

12

2T n P U U U -=,且P 是正交阵,故T PAP C =.于是

||||||||||||T T C E PAP E P A E P A E λλλλ-=-=-=-

其中T PP E =,||||1T P P =.这表明A 与C 具有相同地特征多项式,即两者有相同地特征值.

进一步,设y 是C 地对应于特征值λ地特征向量,即Cy y λ=,则有

T PAP y y λ= ()()T T A P y P y λ=

这表明T P y 为A 地对应于λ地特征向量,于是求原始矩阵A 地特征值与特征向量可转化为求上Hessenberg 阵C 地特征值和特征向量.

定理7-7 若A 是实对称矩阵,则存在初等反射阵122,,,n U U U -使

2

2112

2

1112211

()n n n n n U U U AU U U c b b c b C b b c ----⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎣

对称三对角阵 证明 由定理7-6,存在初等反射阵可使A 约化为上Hessenberg 阵C ,当A 是对称矩阵时,C 亦为对称阵,即T C C =,且T C 亦为上Hessenberg 阵,故C 是对称三对角阵.

例7-11 用豪斯荷尔德方法将下述矩阵化为上Hessenberg 阵.

1437232427A A ---⎡⎤

⎢⎥==⎢⎥

⎢⎥⎣⎦

解 (1)对1k =,确定变换阵

11

1

000

U R ⎡⎤

⎢⎥=⎢⎥⎢⎥⎣⎦

,(1)2124a ⎡⎤=⎢⎥⎣⎦ 其中1R 为初等反射阵,使

(1)

121110R a r ⎡⎤=-⎢⎥⎣⎦

(1)

121

2

4.472136r a ==≈

(1)121

11 6.472136244u a r ε⎡⎡⎤

+=+=≈⎢⎢⎥⎣

⎦⎣⎦

11121()2)28.94427r r a ρ=+≈

[]11111

10 6.4721361 6.472136401428.944270.4472070.8944230.8944230.447216T

R E u u ρ-=-⎡⎤⎡⎤=-⎢⎥⎢⎥⎣⎦⎣⎦--⎡⎤=⎢⎥-⎣⎦

(2)计算(1)

122R A .

记(1)

22

1232(,)27A a a ⎡⎤==⎢⎥⎣⎦

,于是 (1)

122

1112 3.1304967.155419(,) 1.788855 1.341640R A R a R a --⎡⎤

==⎢⎥-⎣⎦

其中,111111111

()()(1,2)T T i i i i R a E u u a a u a u i ρρ--=-=-=

(3)计算(1)12

1A R 及(1)1221()R A R ,即求 1(1)

12

1211

(1)1223373.1304967.1554191.788855 1.341640T T T b A R b R R R A b ⎡⎤--⎡⎤

⎡⎤⎢⎥⎢⎥==--⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥-⎣⎦

⎣⎦

7.602634

0.4472127.800030.3999990.399999 2.200000-⎡⎤

⎢⎥=-⎢⎥

⎢⎥-⎣⎦

其中,11111()(1,2,3)T T T T

i i i b R b b u u i ρ-=-=

(4)计算2111A U AU =.

(1)

12121(1)

12214

47.6026340.4472124.4721367.8000030.39999900.399999 2.2000000

A R A r R A R ⎡⎤

--⎡

⎤⎢⎥⎢⎥⎢

⎥==--⎢

⎥⎢⎥-⎢⎥-⎢⎥⎣⎦⎢⎥⎣⎦

为上Hessenberg 阵.

7.3.2 平面旋转变换 定义7-4 称矩阵

11

1

(,)1

11i j c

s

i P i j s

c

j ⎡⎤⎢⎥⎢⎥⎢⎥

⎢⎥⎢⎥⎢⎥⎢

⎥=⎢

⎥⎢⎥⎢⎥

-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣

第列

第列

第行第行 为平面旋转矩阵,又称Givens 矩阵,其中cos c θ=,sin s θ=.

平面旋转阵(,)P i j 是一个正交阵,与单位阵只有在

(,),(,),(,i i i j j j j i

四个位置上地元素不一样,用其左乘矩阵A 只改变A 地第i 行和第j 行元素.设

12(,,

,)T n x x x x =

则平面旋转变换Px y =地结果为

⎪⎩⎪

⎨⎧≠=+-=+=j

i k x y cx sx y sx cx y k k

j i j j i i ,

若令/i c x =

,j s x =, 则平面旋转变换向量y 地第i

个分两为22j i x x +,第j 个分量为0,其余分量即为x 对应地分量.

和初等反射变换一样,用平面旋转变换也可以将一个方阵化为上Hessenberg 矩阵,也可以将将一个方阵化为上三角矩阵.

7.4 QR 算法

7.4.1 矩阵地QR 分解

定理7-8 设A 是可逆矩阵,则存在正交矩阵121,,,n P P P -使

121()n P P P A R -=上三角矩阵

且R 地主对角元素0(1,2,,1)ii r i n >=-.

证明 若10(2,3,,)j a j n ==,则A 地第一列不需约化.若有某个 10(2)j a j n ≠≤≤,则可选择1(1,)j P j P =使A 地第一列中第j 个元素变为零.一般地,可设平面旋转矩阵12131,,,n P P P ,使

(2)

(2)11121(2)(2)222113122(2)(2)200n

n n

n nn r a a a a P P P A A a a ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣

记111312n

P P P P =,则12P A A =.同理,若(2)

20(3,4,

,)j a j n ≠=,可选取

2324

2,,,n P P P 使

(2)

(2)

(2)1112131(3)(3)22

232(3)(3)221232333

3(3)(3)3

n

n n n n n nn r a a a r a a P P P A A a a a a -⎡⎤⎢

⎥⎢

⎥⎢

⎥==⎢⎥⎢⎥⎢⎥⎣

记2223n

P P P =,则213P P A A =.

重复上述过程,可得一系列正交阵121,,,n P P P -使

1112

1222121n n n nn r r r r r P P P A R r -⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥

⎦ 定理7-9 (矩阵地QR 分解)如果n 阶实矩阵A 可逆,则A 可分解

为一正交阵Q 和上三角阵R 地乘积,即A QR =,且当R 地对角元素都为正数时分解唯一.

证明 由定理8知存在正交阵11,,n P P -使

121n P P P A R -=

为上三角阵,记121T n Q P P P -=,于是

T Q A R =

由于(1,2,,1)i P i n =-是正交阵,则T Q 亦为正交阵,故A QR =. 若A 有两种QR 分解,记为

1122A Q R Q R ==

其中12,R R 为上三角阵且主对角元素都为正数,12,Q Q 为正交阵,于是

12121T Q Q R R -=

注意121R R -是上三角阵地乘积,结果仍为上三角阵,而12,T

Q Q 是正交阵,所以121R R -也应是正交阵.若记121D R R -=,由其上三角性T D 应是下三角阵,1D -应是上三角阵;由其正交性由1T D D -=,故D 只能是对角阵,且有2T D D D E ==.又因12,R R 地主对角元素都为正数,即有

2222

12diag[,,,]diag[1,1,,1]n D d d d E ===

故1(1,2,,)i d i n ==,则D E =,于是12R R =,12Q Q =.

例7-12 求矩阵⎥⎥

⎥⎦

⎢⎢⎢⎣⎡-=212240130A 地QR 分解. 解 方法1:利用初等反射阵进行QR 分解

令(0)1(0,0,2)T a =,取(0)112||||2d a ==,则

)2,0,2(8

12

1

1)0(1

11)0(11-=

--=

e d a

e d a u

1110012010100T

H E u u ⎡⎤

⎢⎥=-=⎢⎥

⎢⎥⎣⎦,⎥⎥⎥⎦

⎤⎢⎢⎢⎣⎡-=1302402121A H 再令(0)

2

(4,3)T a =,取(0)

222||||5d a ==,则

(1)

2212(2)22121,3)||||T a d e u a d e -==--

2224312345T

H E u u ⎡⎤=-=⎢

⎥-⎣⎦

221001430553405

5H H ⎡⎤⎢⎥⎢

⎥⎡⎤⎢⎥

==⎢⎥

⎥⎣⎦⎢⎥⎢⎥-⎣

于是

21212051002H H A R ⎡⎤

⎢⎥=-=⎢⎥

⎢⎥-⎣⎦

123

4055212430

0515500210

0T T

A H H R ⎡⎤-⎢⎥

⎡⎤⎢⎥⎢⎥⎢⎥==-⎢

⎥⎢⎥⎢⎥-⎢⎥⎣⎦⎢⎥⎢⎥⎣

方法2:利用平面旋转阵进行QR 分解. 取12

02

,01

002

2

12

2

1=+=

=+=

s c ,则

130********T ⎡⎤⎢⎥=⎢⎥⎢⎥-⎣⎦,132********T A ⎡⎤

⎢⎥=-⎢⎥

⎢⎥--⎣⎦

西安科技大学研究生数值分析课件7章矩阵特征值与特征向量计算

7 矩阵特征值与特征向量地计算 设A 为n 阶方阵,所谓A 地特征值问题是求数λ和非零向量x ,使x Ax λ=成立.数λ称作A 地一个特征值,非零向量x 称作与特征值λ对应地特征向量.求给定方阵地特征值与特征向量是先求解特征方程 ()||0E A ϕλλ=-= 然后对应于每一个特征值i λ,再求解退化地齐次线性方程组 ()0i E A x λ-= 从而得到A 地特征值i λ及对应地特征向量x . 但是这种方法计算机很大,计算过程复杂,因此有必要研究相对简单地数值解法.本章主要介绍三类计算特征值地方法:计算大型(稀疏)矩阵主特征地幂法与反幂法,计算中小型(实对称)矩阵全部特征值地Jacobi 法,计算中小型矩阵全部特征值地QR 法. 7.1 特征值估计 在矩阵特征值计算中,有时需要对特征值所在范围给出一个估计.这里介绍一种从矩阵地元素出发,运用较简便地运算估计特征值地方法. 定义7-1 设()n m ij A a C ⨯=∈,称由不等式 ||ii i z a R -≤ 在复平面上确定地区域为矩阵A 地第i 个盖尔圆(Gerschgorin 圆),并用i G 表示. 其中1||n i ij j j i R a =≠=∑称为盖尔圆i G 地半径(1,2,,)i n =. 定理7-1 矩阵()n m ij A a C ⨯=∈地一切特征值均落在它地n 个盖尔圆地并集中,即 1 (1,2, ,)n i j j G i n λ=∈ =. 证明 设λ是A 地任一特征值,12(,,,)T n x x x x =是λ对应地特征向量. 令0 1||max ||i i i n x x ≤≤=,则0 0i x ≠.由Ax x λ=,可得00 1 ()n i j j i j a x x λ==∑.即 ∑≠==-n i j j j j i i i i x a x a 0 00001)(λ

矩阵特征值与特征向量

矩阵特征值与特征向量 在线性代数中,矩阵的特征值和特征向量是非常重要的概念。它们 在很多数学和工程领域都有广泛的应用。本文将详细介绍矩阵特征值 和特征向量的定义、性质以及计算方法。 一、特征值与特征向量的定义 1. 特征值:对于一个n阶方阵A,如果存在一个非零向量X使得 AX=kX,其中k为一个常数,那么k就是矩阵A的特征值。我们可以 把这个等式改写为(A-kI)X=0,其中I是单位矩阵。这样,求解特征值 就等价于求解矩阵(A-kI)的零空间。 2. 特征向量:特征向量是与特征值相对应的非零向量。对于一个特 征值k,其对应的特征向量X满足AX=kX。 二、特征值与特征向量的性质 1. 特征值与特征向量是成对出现的,一个特征值对应一个特征向量。 2. 特征值的个数等于矩阵A的阶数。特征值可以是实数或复数。 3. 特征向量可以乘以一个非零常数得到一个新的特征向量。 4. 如果矩阵A是实对称矩阵,那么其特征值一定是实数。如果矩阵 A是正定或负定矩阵,那么其特征值一定大于0或小于0。 5. 特征向量相互之间线性无关。 三、特征值与特征向量的计算方法

1. 求特征值:求解特征值的常用方法是求解矩阵A的特征多项式的根。特征多项式的形式为|A-kI|=0,其中|A-kI|表示矩阵A-kI的行列式。 2. 求特征向量:已知特征值k后,将k代入(A-kI)X=0即可得到特 征向量。可以使用高斯-约当消元法或者迭代法来求解。 四、矩阵特征值与特征向量的应用 1. 特征值与特征向量广泛应用于机器学习和数据分析领域。在主成 分分析(PCA)中,我们可以通过计算数据的协方差矩阵的特征向量 来实现数据降维和特征提取。 2. 特征值与特征向量也在图像处理和信号处理中有许多应用。例如,在图像压缩算法中,我们可以利用矩阵的特征值和特征向量来实现图 像的降噪和压缩。 3. 特征值和特征向量还可以应用于动力系统的稳定性分析。通过求 解动力系统的雅可比矩阵的特征值,我们可以判断系统的稳定性和临 界点的类型。 结语 矩阵的特征值和特征向量是线性代数中的重要概念,具有广泛的应 用价值。通过求解特征值和特征向量,我们可以了解矩阵的性质以及 其在各个领域中的应用。对于进一步深入学习和研究线性代数和矩阵 理论来说,掌握特征值和特征向量的定义、性质和计算方法是至关重 要的。希望本文对读者有所帮助。

特征值与特征向量_

特征值与特征向量_ 一、特征值与特征向量的定义 在线性代数中,对于一个nxn的矩阵A,如果存在一个非零向量v, 使得Av=λv,其中λ是一个常数,则称λ为矩阵A的特征值,v为对应 的特征向量。 特征向量是指矩阵在一些方向上的不发生变化的向量,而特征值则表 示该方向上的缩放比例。矩阵乘以特征向量v等于用特征值λ来放缩这 个向量。 二、特征值与特征向量的性质 1.特征值和特征向量总是成对出现,即一个特征向量对应一个特征值,可能有多个特征向量对应同一个特征值。 2.特征值可以为复数,但如果A是实对称矩阵,则特征值一定是实数。 3.矩阵的特征值可以通过求解方程,A-λI,=0得到,其中I是单位 矩阵。 4.特征向量可以通过求解方程(A-λI)v=0得到,其中0是全零向量。 5.特征值的和等于矩阵的迹(所有主对角线上的元素之和),特征值的 乘积等于矩阵的行列式。 三、特征值与特征向量的应用 1.特征值分解

特征值分解是矩阵分析中非常重要的一种分解方法,对于一个nxn的 矩阵A,其特征值分解为A=VΛV^(-1),其中V是由特征向量构成的矩阵,Λ是由特征值构成的对角矩阵。 特征值分解可以用于求解线性方程组、矩阵的幂次计算、矩阵的逆等 问题,也可以用于降维和数据压缩等领域。 2.特征值与特征向量的几何意义 特征向量可以表示矩阵的一些方向上的不变性,通过求解矩阵的特征 向量,可以了解矩阵对于不同方向上的变化情况。例如,在计算机图形学中,可以通过矩阵的特征向量来描述形状的变化、旋转、缩放等操作。 3.矩阵的谱分析 通过分析矩阵的特征值和特征向量,可以了解矩阵的性质和结构。例如,对于对角矩阵,其特征值就是主对角线上的元素,特征向量为标准基 向量。 四、总结 特征值与特征向量是线性代数中的重要概念,具有广泛的应用。特征 值与特征向量可以用于矩阵分解、线性方程组求解、数据压缩和图形变换 等问题,对于理解和分析矩阵的性质和结构有着重要的意义。深入理解特 征值与特征向量的概念和性质,对于掌握线性代数和应用数学具有重要的 作用。

矩阵的特征值与特征向量的计算

矩阵的特征值与特征向量的计算矩阵特征值与特征向量是线性代数中一个重要的概念,应用广泛于数学、物理、计算机科学等领域。本文将介绍矩阵的特征值与特征向量的定义、计算方法,以及其在实际问题中的应用。 一、矩阵特征值与特征向量的定义 对于一个n阶矩阵A,若存在一个非零向量X使得AX=kX,其中k 为一个标量,则称k为矩阵A的一个特征值,X为对应于特征值k的特征向量。 特征值与特征向量的计算是一个求解矩阵特征值问题的过程,这在实际中具有很大的意义。接下来,我们将介绍矩阵特征值与特征向量的计算方法。 二、矩阵特征值与特征向量的计算方法 计算矩阵的特征值与特征向量有多种方法,其中比较常用的方法是特征值分解和特征方程。 1. 特征值分解 特征值分解是将一个矩阵表示为特征向量矩阵和特征值矩阵相乘的形式,即A=VΛV^-1。其中,V是由特征向量构成的矩阵,Λ是由特征值构成的对角矩阵。 特征值分解的计算步骤如下: (1)求解矩阵A的特征方程det(A-λI)=0,其中I为单位矩阵。

(2)解特征方程,得到矩阵A的特征值λ1、λ2、...、λn。 (3)代入特征值,求解方程组(A-λI)X=0,其中X为特征向量。 (4)将得到的特征向量按行组成矩阵V,特征值按对角线组成矩 阵Λ。 2. 特征方程法 特征方程法是直接求解矩阵A的特征值的方法。计算步骤如下: (1)求解矩阵A的特征方程det(A-λI)=0。 (2)解特征方程,得到矩阵A的特征值λ1、λ2、...、λn。 (3)代入特征值,求解方程组(A-λI)X=0,其中X为特征向量。 在实际计算中,可以利用计算机软件或在线计算器进行特征值与特 征向量的计算,提高计算的效率。 三、矩阵特征值与特征向量的应用 矩阵的特征值与特征向量在实际问题中具有广泛的应用,下面将介 绍两个常见的应用场景。 1. 矩阵对角化 对于一个n阶矩阵A,若能找到一个可逆矩阵P,使得P^-1AP=Λ,其中Λ为对角矩阵,则称矩阵A可对角化。此时,Λ的对角线上的元 素为矩阵A的特征值。

求矩阵的特征值和特征向量技巧

求矩阵的特征值和特征向量技巧 求矩阵的特征值和特征向量是线性代数中的一个重要课题,它在许多科学和工程领域中都有广泛的应用。特征值和特征向量可以帮助我们揭示矩阵的性质,解决许多实际问题。在本文中,我们将一步一步了解如何计算矩阵的特征值和特征向量以及相关的技巧和应用。 什么是特征值和特征向量? 在介绍如何计算特征值和特征向量之前,我们先来了解一下它们的定义。 给定一个n×n的方阵A,如果存在一个非零向量v,使得满足下面的等式: AV = λV 其中,λ为常数,称为矩阵A的特征值,有时也用符号λ表示。而V称为A 对应于特征值λ的特征向量。 特征值和特征向量反映了矩阵A在某个方向上的变换结果不变,即只会进行伸缩。特征向量是伸缩方向,特征值是伸缩的比例。 计算特征值和特征向量的步骤 下面我们将一步一步来计算矩阵的特征值和特征向量,具体步骤如下: Step 1: 计算特征值 对于给定的矩阵A,我们首先需要求解它的特征值。特征值是通过求解矩

阵的特征值方程来获得的。 特征值方程可以表示为: det(A - λI) = 0 其中,det表示矩阵的行列式,I为单位矩阵,λ为特征值。 根据上述方程,我们需要计算矩阵A减去λ乘以单位矩阵I的行列式,并使其等于0。这将得到一个关于λ的多项式方程,解该方程即可得到矩阵A 的特征值。 Step 2: 计算特征向量 在得到特征值λ后,我们需要计算对应于每个特征值的特征向量。 对于每个特征值λ,我们将其代入特征值方程,并求解该方程得到特征向量。特征向量是通过将λ带入齐次线性方程组(A - λI)v = 0来获得的。 在这里,齐次线性方程组的解空间是一个向量空间,我们需要找到一个非零向量v,使得(A - λI)v = 0成立。这样的向量v就是对应于特征值λ的特征向量。 特征向量的计算可以使用高斯消元法或矩阵求逆来完成。我们需要求解一个线性方程组,将(A - λI)表示为增广矩阵形式并进行行变换,最终得到矩

矩阵特征值与特征向量的求法

矩阵特征值与特征向量的求法 1. 什么是矩阵的特征值和特征向量? 矩阵是线性代数中的一种重要概念,它由行和列组成的二维数组。在矩阵运算中,特征值和特征向量是非常重要的概念。 特征值(eigenvalue)是一个标量,表示线性变换在某个方向上的缩放因子。一个方针的特征值是该线性变换在该方向上对原始向量进行缩放或拉伸的倍数。 特征向量(eigenvector)是与特定特征值相关联的非零向量。它表示在某个方向上进行线性变换后不改变其方向,只改变其长度。 2. 特征值与特征向量的定义 设A为n阶矩阵,如果存在数λ和非零列向量x使得 Ax = λx 则称λ为矩阵A的一个特征值,称x为对应于λ的一个特征向量。 3. 求解矩阵的特征值和特征向量 要求解矩阵A的特征值和对应的特征向量,可以通过以下步骤进行: 步骤1:求解特征方程 特征方程是一个关于λ的多项式方程,可以通过以下公式得到: det(A - λI) = 0 其中,A为矩阵,λ为特征值,I为单位矩阵。 步骤2:解特征方程 将特征方程化简后,可以得到一个关于λ的代数方程。解这个方程即可得到矩阵A的特征值。

步骤3:求解特征向量 对于每个特征值λ,将其带入原始的特征方程中,并解出对应的特征向量x。求解过程可以使用高斯消元法或其他方法。 4. 示例 假设有一个2x2的矩阵A: A = [[a, b], [c, d]] 我们想要求解这个矩阵的特征值和对应的特征向量。 步骤1:求解特征方程 根据步骤1,我们需要计算det(A - λI) = 0。其中, A - λI = [[a-λ, b], [c, d-λ]] det(A - λI) = (a-λ)(d-λ) - bc = 0 化简上述等式得到一个二次多项式关于λ: λ^2 - (a+d)λ + (ad-bc) = 0 这就是特征方程。 步骤2:解特征方程 通过求解特征方程,我们可以得到矩阵A的特征值。 步骤3:求解特征向量 对于每个特征值λ,将其带入原始的特征方程中,并解出对应的特征向量x。假设λ1和λ2是我们求解得到的两个特征值,那么对应的特征向量x1和x2可以通过以下公式计算: (A - λ1I)x1 = 0 (A - λ2I)x2 = 0 其中,I为单位矩阵。

矩阵特征值计算矩阵的特征值和特征向量

矩阵特征值计算矩阵的特征值和特征向量矩阵是线性代数中的重要概念之一,它在众多学科领域中都有广泛的应用。而矩阵的特征值和特征向量则是矩阵分析与应用中的核心内容之一。本文将详细介绍矩阵特征值的计算方法,以及如何求解矩阵的特征向量。 1. 特征值和特征向量的定义 首先,我们来了解一下什么是矩阵的特征值和特征向量。给定一个n阶方阵A,如果存在一个数λ以及一个非零n维列向量X,使得满足下述条件: AX = λX 那么,λ就是矩阵A的一个特征值,而X则是对应于特征值λ的特征向量。特征值和特征向量的求解在很多应用中都具有重要的意义。 2. 特征值的计算方法 接下来,我们介绍几种常见的特征值计算方法。 2.1 特征多项式法 特征多项式法是求解特征值的一种常用方法。它利用方阵A减去λ乘以单位矩阵I之后的行列式为零的性质,构造出特征多项式,并求解多项式的根即可得到特征值。 举个例子,对于二阶方阵A = [a, b; c, d],其特征多项式为: | A - λI | = | a-λ, b; c, d-λ | = (a-λ)(d-λ) - bc = 0

解这个方程可以得到A的特征值。 2.2 幂迭代法 幂迭代法也是一种常见的特征值计算方法。它利用特征向量的性质,通过迭代计算来逼近矩阵的特征值。其基本思想是,给定一个初始向 量X0,不断迭代计算: Xk+1 = AXk 然后对得到的向量序列进行归一化处理,直到收敛为止。最后得到 的向量X就是对应的特征向量,而特征值可以通过如下公式计算:λ = X^TAX / X^TX 2.3 QR方法 QR方法是一种数值稳定性较好的特征值计算方法。它利用矩阵的QR分解的性质来逐步逼近矩阵的特征值。首先,对矩阵A进行QR分解,得到一个正交矩阵Q和一个上三角矩阵R。然后,将分解后的矩 阵R与矩阵Q逆序相乘,得到一个新的矩阵A'。重复进行QR分解和 相乘的操作,直到收敛为止。最后,得到的矩阵A'的对角线上的元素 即为矩阵A的特征值。 3. 特征向量的求解 一般情况下,求解特征向量的方法与求解特征值相结合。已知一个 特征值λ,我们可以通过求解线性方程组(A-λI)X = 0来得到对应的特征向量X。这是因为此时矩阵A-λI不满秩,线性方程组有非零解。

矩阵的特征值和特征向量的计算

矩阵的特征值和特征向量的计算在线性代数中,矩阵的特征值和特征向量是一对重要的概念。它们可以帮助我们了解矩阵的性质和特点,对于很多问题的求解具有重要的意义。本文将详细介绍矩阵特征值和特征向量的计算方法。 一、特征值和特征向量的定义 对于 n 阶方阵 A,如果存在非零向量 v 使得Av = λv,其中λ 是一个常数,则称λ 为矩阵 A 的特征值,v 称为对应于特征值λ 的特征向量。 特征值和特征向量的计算可以帮助我们理解矩阵的线性变换效果,以及在某些问题中起到重要的作用。 二、特征值和特征向量的计算方法 要计算一个矩阵的特征值和特征向量,我们可以按照以下步骤进行:

1. 首先,我们需要求解特征方程 det(A - λI) = 0,其中 A 是待求矩阵,λ 是一个待定常数,I 是单位矩阵。这个方程是由特征向量 的定义出发得到的。 2. 解特征方程可以得到一组特征值λ1, λ2, ... , λn。这些特征值 就是矩阵的特征值,它们可以是实数或复数。 3. 对于每一个特征值λi,我们需要求解方程组 (A - λiI)v = 0, 其中 v 是待求特征向量。这个方程组的解空间就是对应于特征值 λi 的特征向量的集合。 4. 对于每一个特征值λi,我们需要求解出它对应的特征向量 vi。特征向量的计算需要利用高斯消元法或其他适用的方法。 这样,我们就可以计算出矩阵的所有特征值和对应的特征向量。 三、特征值和特征向量的应用 矩阵的特征值和特征向量在很多领域有着广泛的应用,以下是 其中一些常见的应用:

1. 特征值和特征向量可以帮助我们理解矩阵的性质。例如,特征值的数量可以告诉我们矩阵的维度,而特征向量可以描述矩阵的线性变换效果。 2. 特征值和特征向量在图像处理和模式识别领域有着重要的应用。通过矩阵的特征向量,我们可以提取图像的特征,进而进行分类和识别。 3. 特征值和特征向量在物理学中也有着广泛的应用。它们可以用于描述量子力学中的粒子运动,电路中的振动模式等。 总结: 矩阵的特征值和特征向量是线性代数中的重要概念,可以用于分析矩阵的性质和解决一些相关问题。计算矩阵的特征值和特征向量需要通过解特征方程和方程组来实现。特征值和特征向量在多个领域中都有着广泛的应用,对于理解和解决实际问题具有重要的意义。

求矩阵特征值和特征向量

求矩阵特征值和特征向量 矩阵特征值和特征向量是矩阵理论中的重要概念,它们在各种应用领域都有广泛的应用,比如物理、工程、计算机科学和金融等领域。本文将介绍矩阵特征值和特征向量的定义、性质、计算方法以及在实际问题中的应用。 矩阵特征值和特征向量是矩阵的两个特殊属性,它们对于描述矩阵的性质和解决实际 问题都有重要的作用。 矩阵特征值指的是一个矩阵在一个数域内的某个数λ,使得矩阵与该数的乘积可以表示成该矩阵与某个向量v的乘积,用符号表示为: Av = λv 其中,A表示矩阵,v表示非零向量,λ表示矩阵A的特征值。当v存在时,称v是矩阵A关于特征值λ的一个特征向量。 矩阵特征值和特征向量的定义表明,矩阵的特征值和特征向量是矩阵变换的重要性质。矩阵的特征值和特征向量不仅描述了矩阵的本质特点,还可以用于解决实际问题,如图像 处理、信号处理、统计学和机器学习等。 1. 对于一个n阶矩阵,它有n个特征值和n个特征向量。 2. 一个矩阵的特征向量组成的向量空间称为矩阵的特征向量空间,特征向量空间的 维度不超过矩阵的阶数。 3. 如果矩阵A的一个特征值λ的代数重数为k,其对应的特征向量的个数最多为k 个。 4. 如果矩阵A的两个特征值λ1和λ2不同,它们对应的特征向量一定线性无关。 5. 如果矩阵A是实对称矩阵,它的特征值一定是实数,对应的特征向量可以选取为正交向量。 6. 如果矩阵A是正定矩阵,所有特征值都是正实数。 计算矩阵的特征值和特征向量是矩阵理论中的一个基本问题。下面将介绍几种常用的 计算方法。 1. 利用矩阵的行列式求特征值 特征值λ是矩阵A满足如下方程的根:

|A - λI|=0 其中,I表示n阶单位矩阵。解出方程得到的根即为矩阵的特征值。 矩阵A的特征值之和等于矩阵A的迹,即: λ1 + λ2 + ... + λn = tr(A) 其中,tr(A)表示矩阵A的迹,即主对角线上元素的和。 3. 利用特征向量递推求特征值和特征向量 如果矩阵A有n个不同的特征值λ1、λ2、…、λn,则每个特征值都对应一个线性无关的特征向量。设第r个特征值λr的特征向量为vr,则有: 从而得到以下递推公式: Ar-1 vr = λr-1 vr … 这个递推公式可以用来计算未知特征值的特征向量。 矩阵特征值和特征向量在实际问题中有广泛的应用。下面分别介绍几个应用案例。 1. 图像处理中的应用 在图像处理中,矩阵特征值和特征向量可以用来对图像进行压缩和降维。将图像矩阵A分解为特征向量矩阵和特征值矩阵的乘积,可以找到与图像最相关的信息,减少冗余信息,从而实现图像的压缩和降维。 3. 统计学中的应用 总结:

矩阵特征值与特征向量的计算

第3章 矩阵特征值与特征向量的计算 一些工程技术问题需要用数值方法求得矩阵的全部或部分特征值及相关的特征向量。 3.1 特征值的估计 较粗估计ρ(A ) ≤ ||A || 欲将复平面上的特征值一个个用圆盘围起来。 3.1.1 盖氏图 定义3.1-1 设A = [a ij ]n ⨯n ,称由不等式∑≠=≤-n i j j ij ii a a z 1 所确定的复区域为A 的第i 个盖氏 图,记为G i ,i = 1,2,…,n 。 >≤-=<∑≠=}:{1n i j j ij ii i a a z z G 定理3.1-1 若λ为A 的特征值,则 n i i G 1 =∈ λ 证明:设Ax = λx (x ≠ 0),若k 使得∞ ≤≤==x x x i n i k 1max 因为 k n j j kj x x a λ=∑=1 ⇒∑≠= -n k j j kj k kk x a x a )(λ ⇒∑∑∑ ≠=≠=≠≤≤= -n k j j kj n k j j k j kj n k j k j kj kk a x x a x x a a 11λ ⇒ n i i k G G 1 =⊂ ∈λ 例1 估计方阵⎥⎥⎥⎥⎦ ⎤⎢ ⎢⎢⎢⎣⎡----=41 .03.02.05.013.012.01.035.03.02.01.01A 特征值的范围 解:

G 1 = {z :|z – 1|≤ 0.6};G 2 = {z :|z – 3|≤ 0.8}; G 3 = {z :|z + 1|≤ 1.8};G 4 = {z :|z + 4|≤ 0.6}。 注:定理称A 的n 个特征值全落在n 个盖氏圆上,但未说明每个圆盘内都有一个特征值。 3.1.2 盖氏圆的连通部分 称相交盖氏圆之并构成的连通部分为连通部分。 孤立的盖氏圆本身也为一个连通部分。 定理3.1-2 若由A 的k 个盖氏圆组成的连通部分,含且仅含A 的k 个特征值。 证明: 令D = diag(a 11,a 12,…,a nn ),M = A – D ,记 )10(000)(2122111222 11≤≤⎪⎪ ⎪ ⎪ ⎪ ⎭ ⎫ ⎝⎛+⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=+=εεεε n n n n nn a a a a a a a a a M D A 则显然有A (1) = A ,A (0) = D ,易知A (ε)的特征多项式的系数是ε的多项式,从而A (ε)的 特征值λ1(ε),λ2(ε),…,λn (ε)为ε的连续函数。 A (ε)的盖氏圆为:)10(,}||||:{)(11≤≤⊂=≤ -=∑∑≠=≠=εεεεi n i j j ij n i j j ij ii i G a a a z z G 因为A (0) = D 的n 个特征值a 11,a 12,…,a nn ,恰为A 的盖氏圆圆心,当ε由0增大到1时,λi (ε)画出一条以λi (0) = a ii 为始点,λi (1) = λi 为终点的连续曲线,且始终不会越过G i ; 不失一般性,设A 开头的k 个圆盘是连通的,其并集为S ,它与后n – k 个圆盘严格分离,显然,A (ε)的前k 个盖氏圆盘与后n – k 个圆盘严格分离。 当ε = 0时,A (0) = D 的前k 个特征值刚好落在前k 个圆盘G 1,…,G k 中,而另n – k 个特征值则在区域S 之外,ε从0变到1时, k i i G 1)(=ε与 n k i i G 1 )(+=ε始终分离(严格) 。连续曲线始终在S 中,所以S 中有且仅有A 的k 个特征值。 注:1) 每个孤立圆中恰有一个特征值。 2) 例1中G 2,G 4为仅由一个盖氏圆构成的连通部分,故它们各有一个特征值,而G 1,G 3构成的连通部分应含有两个特征值。 3) 因为例1中A 为实方阵,所以若λ为A 的特征值,则λ也是A 的特征值,所以G 2,G 4中各

求矩阵的特征值和特征向量例题

求矩阵的特征值和特征向量例题 一、背景 特征值和特征向量是矩阵理论中的重要概念,它们是描述矩阵特性的两个重要参数,在数学、物理、工程等领域有着广泛的应用。本例题将介绍如何求矩阵的特征值和特征向量,并通过例题加深对相关概念和方法的理解。 二、方法 求矩阵的特征值和特征向量的方法主要有两种:特征多项式法和特征向量法。 1.特征多项式法:通过求解矩阵的行列式,得到其特征多项式,进而求得特征值,再通过解特征方程得到特征向量。这种方法适用于求解特征值不重合且特征向量个数等于矩阵阶数的情况。 2.特征向量法:通过求解矩阵与向量间的关系,得到特征向量。这种方法适用于求解任意矩阵的特征值和特征向量。 三、例题解析 【例1】已知矩阵A=1-120求它的特征值和特征向量。 解法1:特征多项式为f(λ)=|-λ-A|=0,即: (-λ-1)(λ²+3λ+2)=0 解得:λ1=1,λ2=-2 由于λ2=-2是重根,只需解方程|A-2E|=0得一个特征向量。 得:(-2-ξ)ξ²-4ξ+1=0,解得:ξ=1或ξ=0.5 当ξ=0.5时,λ=λ¹=1时,A-2E的行列式为0,所以舍去。 所以特征值为λ¹=1,λ₂=-2,对应的特征向量为(1,-1,0)T和(0,2,1)T。 解法2:设Aξ=λξ,代入数据得: (-1,-ξ)×(ξ²-3ξ-2)=0,解得:ξ=1或ξ=-2 当ξ=-2时,λ¹=1时,A-2E的行列式为0,所以舍去。 所以特征值为λ₁=1,λ₂=-2,对应的特征向量为(ξ₁,-ξ₁,0)T和(0,ξ₂,ξ₂)T。 【例2】设三阶矩阵A=3-45-6-389求它的特征值及对应的特征向量。 根据矩阵的特征多项式F(x)=|3xI-A|=0,得到6x³+5x²-5x+7=0.分解因式得: x²(x+1)(x-7)=0.解得x₁=-1,x₂=x₃=7.分别代入F(x)=0中可得矩阵A的三个特征值为λ₁=- 1,λ₂=7,λ₃=7.当λ₁=-1时,对应的一个基础解系为(4,-6,5)T;当λ₂=7时,因为矩阵的阶数大于零且特征值所对角线上的元素不可能全为零(它还有第二个特征值λ₃≠0),因此至少有两个相同的非零特征向量可以分别求出对应于λ₁=-1和λ₂=7的线性无关的特征向量,记这两个

矩阵的特征值与特征向量

矩阵的特征值与特征向量 矩阵是线性代数中的基本概念之一,它在许多科学领域中都有广泛 的应用。在矩阵中有两个与之相关的重要概念,即特征值和特征向量。特征值和特征向量是矩阵在线性变换中非常有用的性质,它们可以帮 助我们理解和描述线性变换的特点。本文将重点探讨矩阵的特征值和 特征向量的定义、性质以及应用。 1. 特征值与特征向量的定义 矩阵A的特征值是指满足方程Av=λv的非零向量v以及对应的常 数λ。其中v是特征向量,λ是特征值。换句话说,特征向量是矩阵作 用后与自身平行(或成比例)的向量,而特征值则表示该向量在作用 后的缩放倍数。 2. 计算特征值与特征向量的方法 要计算一个矩阵的特征值与特征向量,需要解决特征值问题,即求 解方程|A-λI|=0,其中I是单位矩阵。解这个方程可以得到特征值的集合。对于每个特征值λ,再解方程(A-λI)v=0,可以得到特征向量的集合。 3. 特征值与特征向量的性质 特征值和特征向量有一些重要的性质: - 特征值与特征向量是成对出现的,一个特征值对应一个特征向量。 - 矩阵的特征值与它的转置矩阵的特征值是相同的。 - 对于n阶矩阵,特征值的个数不超过n个。

- 特征向量可以线性组合,线性组合后的向量仍然是对应特征值的特征向量。 4. 特征值与特征向量的应用 特征值与特征向量在许多领域都有广泛的应用,下面列举几个常见的应用: - 特征值分解:通过特征值与特征向量的计算,可以将一个矩阵分解为特征值和特征向量的乘积形式,这在数值计算和信号处理中非常有用。 - 矩阵对角化:特征值与特征向量可以将一个矩阵对角化,使得计算和处理更加简化和高效。 - 特征值的物理意义:在物理学中,特征值可以表示物理系统的某些性质,如量子力学中的能级等。 总结: 矩阵的特征值和特征向量是矩阵理论中非常重要的概念。通过计算特征值与特征向量,可以帮助我们理解和描述线性变换的性质,进行矩阵的对角化处理,以及在数值计算和信号处理中应用。矩阵的特征值和特征向量是线性代数学习中不可或缺的内容,对于深入理解线性变换和矩阵的性质具有重要的作用。

矩阵的运算与特征值特征向量

矩阵的运算与特征值特征向量矩阵是线性代数中一个重要的概念,它广泛应用于各个领域,包括计算机科学、物理学、经济学等等。而矩阵的运算和特征值特征向量是矩阵理论中的基础知识,对于深入理解矩阵以及其在实际问题中的应用具有重要意义。 一、矩阵的运算 1. 矩阵的加法和减法 矩阵的加法和减法是指将两个相同大小的矩阵进行逐元素的相加或相减。如果两个矩阵的维度相同,则它们可以进行加法或减法运算。具体计算方法是将两个矩阵对应位置的元素进行相加或相减,得到的结果构成一个新的矩阵。 2. 矩阵的乘法 矩阵的乘法是指将一个矩阵的行与另一个矩阵的列进行逐元素的相乘,并将结果相加得到新的矩阵。在矩阵乘法中,乘法的前提是左边矩阵的列数等于右边矩阵的行数。乘法的结果是一个新的矩阵,其行数等于左矩阵的行数,列数等于右矩阵的列数。 3. 矩阵的转置 矩阵的转置是指将矩阵的行和列互换得到一个新的矩阵。转置后的矩阵行和列的顺序发生了变化,原矩阵的第i行转置后变为新矩阵的第i列。矩阵的转置操作可以通过交换矩阵中元素的索引实现。

二、特征值与特征向量 1. 特征值 在矩阵理论中,特征值是与方阵相对应的一个数量。如果存在一个非零向量,使得这个向量与矩阵相乘后仍然是这个向量的一个倍数,并且这个倍数就是一个实数λ,则称实数λ为矩阵的特征值。特征值可以帮助我们了解矩阵变换的重要性质和特征。 2. 特征向量 特征向量是与特征值对应的向量,它描述了矩阵变换过程中的不变方向。特征向量和特征值是一一对应的关系,一个特征值可能对应多个特征向量。特征向量可以用来描述矩阵变换的轴线和缩放比例。 三、矩阵的运算与特征值特征向量的关系 矩阵的运算与特征值特征向量之间有着密切的联系。通过矩阵的运算,我们可以求解矩阵的特征值和特征向量。 1. 矩阵的运算与特征值 矩阵的运算可以帮助我们求解矩阵的特征值。通过对矩阵进行特征值运算,我们可以得到矩阵的特征值。特征值具有重要的物理和几何意义,可以帮助我们分析矩阵的性质和变换过程。 2. 矩阵的运算与特征向量

矩阵变换的特征值与特征向量

矩阵变换的特征值与特征向量 矩阵变换是线性代数中一个非常重要的概念,其涉及特征值和特征向量的理论是矩阵理论的核心内容之一、特征值和特征向量给出了矩阵变换的重要性质和结构信息,它们在数学和物理等领域具有广泛的应用。 首先,我们来定义矩阵变换。设V为n维线性空间,T是一个从V到V的线性变换,我们称T为V上的矩阵变换。对于任意非零向量v∈V,如果存在一个标量λ使得T(v)=λv,那么v称为T的一个特征向量,而λ称为T的对应于特征向量v的特征值。 特征值和特征向量的求解是一个矩阵变换中非常重要的问题。给定一个n×n矩阵A,我们要求解它的特征值和特征向量。设v是A的一个特征向量,λ是对应的特征值。我们转化为求解方程Av=λv,即(A- λI)v=0,其中I是单位矩阵。由于v不为零向量,所以(A-λI)必须是奇异矩阵,即其行列式为零。因此,我们可以得到一个关于λ的方程 det(A-λI)=0,这个方程称为A的特征方程。 特征值和特征向量的求解过程是一个涉及到多项式方程的问题,常常依靠数值方法进行计算。对于一个n阶矩阵,其特征值和特征向量的计算复杂度为O(n^3),在高维情况下,直接求解特征值和特征向量可能不切实际。因此,人们发展了各种高效的算法来求解特征值和特征向量的近似值。 特征值和特征向量的求解是很多问题的关键步骤。它们具有以下重要性质和应用:

1.矩阵的特征值之和等于矩阵的迹(主对角线元素之和)。具体来说,对于一个n×n矩阵A,其特征值λ1,λ2,...,λn满足 λ1+λ2+...+λn=Tr(A)。 2.矩阵的特征值决定了矩阵的性质。例如,对于一个对称矩阵,其特 征值都是实数,并且特征向量可以正交化;对于一个正定矩阵,其特征值 都是正数。 3.特征值和特征向量在物理学、工程学等领域中有广泛的应用。例如,特征值和特征向量可以用于描述振动问题中的固有频率和振动模态;在图 像处理中,特征值和特征向量可以用于图像压缩和人脸识别等问题。 4.特征值和特征向量的性质也与矩阵的奇异值和奇异向量有关。矩阵 的奇异值可以看作是特征值的一种推广,奇异向量可以看作是特征向量的 一种推广。奇异值和奇异向量在数据降维、矩阵逆的计算等问题中具有重 要作用。 综上所述,特征值和特征向量是矩阵变换的重要性质和结构信息。它 们的求解和应用在数学和物理等领域具有广泛的应用和研究意义。对于理 解矩阵变换和解决实际问题都是至关重要的。

矩阵的特征值和特征向量

矩阵的特征值和特征向量 矩阵是线性代数中重要的概念之一,其特征值和特征向量也是矩阵理论中的核心内容。本文将全面介绍矩阵的特征值和特征向量,包括 定义、性质、求解方法以及应用等方面,为读者深入理解和应用矩阵 的特征值和特征向量提供帮助。 一、特征值和特征向量的定义 矩阵A是由m×n个数构成的矩形数表,其特征值和特征向量是矩 阵的重要性质。对于一个n阶矩阵A,如果存在一个非零向量x,使得Ax=kx,其中k为常数,那么k就是矩阵A的特征值,而非零向量x称为A对应于特征值k的特征向量。 特征值和特征向量的定义说明了矩阵在线性变换下的不变性。特征向量表示了矩阵在该线性变换下的一个不变方向,而特征值则表示了 该方向上的伸缩倍数。 二、特征值和特征向量的性质 矩阵的特征值和特征向量具有以下性质: 1. 特征值与矩阵的行列式和迹有关。对于n阶矩阵A,其特征值λ1, λ2, …, λn满足λ1 + λ2 + … + λn = tr(A),λ1 × λ2 × … × λn = |A|。 2. n阶方阵的特征向量个数不超过n,且特征向量线性无关。 3. 若λ是方阵A的特征值,则对于任意非零常数c,cλ也是A的特征值。

4. 若λ是方阵A的特征值,且x是A对应于λ的特征向量,则对于任意正整数k,λ^k是A^k的特征值,x是A^k对应于特征值λ^k的特征向量。 三、特征值和特征向量的求解方法 求解特征值和特征向量是矩阵理论中一个重要的问题。下面介绍两种常用的求解方法: 1. 特征方程法:设A是一个n阶矩阵,λ是其特征值,x是对应于λ的特征向量,那么Ax = λx可以变形为(A - λI)x = 0,其中I是n阶单位矩阵。由于x是非零向量,所以矩阵(A - λI)的行列式必须为零,即|A - λI| = 0,这样就可以得到特征值λ的值。然后,通过解(A - λI)x = 0可以求得特征向量x。 2. 幂迭代法:这是一种迭代法的方法,通过矩阵的幂次迭代来逼近特征向量。首先随机选择一个向量x0,然后通过迭代计算得到xk+1 = Axk/||Axk||,其中||Axk||表示Axk的范数。当迭代次数足够多时,xk将逼近矩阵A的特征向量。 四、特征值和特征向量的应用 矩阵的特征值和特征向量在实际应用中具有广泛的应用价值,下面列举几个典型的应用: 1. 特征值分解:通过求解特征值和特征向量,可以将一个矩阵分解为对角矩阵和相似变换矩阵的乘积,即A = PDP^-1,其中D是对角矩

数值分析第四章矩阵特征值与特征向量的计算

数值分析第四章矩阵特征值与特征向量的计算矩阵的特征值与特征向量是数值分析中重要的概念之一、它们在线性 代数、物理学、工程学等领域中有着广泛的应用。本文将介绍矩阵特征值 与特征向量的计算方法。 一、特征值与特征向量的定义 对于一个n阶矩阵A,如果存在一个非零向量x,使得Ax=λx,其中 λ为常数,则称λ为矩阵A的特征值,x为对应的特征向量。 特征值与特征向量的计算方法有多种,以下将介绍最常用的两种方法。 二、特征值与特征向量的计算方法 1.特征值与特征向量的定义方程 特征值与特征向量的计算可以通过解矩阵的特征方程来实现。设A是 一个n阶矩阵,则满足特征值与特征向量定义方程的特征值λ和特征向 量x必须满足以下方程: (A-λI)x=0 其中,I为n阶单位矩阵。解这个方程可以得到特征值和对应的特征 向量。 2.特征值与特征向量的计算方法 (1)通过特征多项式计算特征值 设A是一个n阶矩阵,其特征多项式定义为: p(λ) = det(A-λI)

即特征多项式p(λ)是A的特征值λ的多项式表达式。 通过求解特征多项式的根,可以得到矩阵A的特征值。 (2)通过幂法计算特征向量 幂法是一种迭代方法,用于计算矩阵A的最大特征值及其对应的特征 向量。 首先,给定一个任意的n维非零向量x0,然后通过以下迭代公式进 行迭代计算: x(k+1)=A*x(k) 其中,k为迭代次数。随着迭代次数的增加,x(k)趋向于矩阵A的最 大特征值对应的特征向量。 在实际计算中,为了避免特征值与特征向量的溢出或下溢问题,需要 对迭代结果进行标准化处理,即: x(k+1)=x(k+1)/,x(k+1) 其中,x(k+1),为向量x(k+1)的二范数。 通过幂法迭代计算可以得到矩阵A的最大特征值及其对应的特征向量。 三、应用举例 特征值与特征向量在实际问题中有着广泛的应用。以下举例说明其应用。 1.特征值与特征向量可以用于图像压缩和图像旋转等图像处理问题。

矩阵的特征值与特征向量专题讲解

矩阵的特征值与特征向量专题讲解 一、内容提要 一、矩阵的特征值和特征向量 1、基本概念 设A 为n 阶方阵,若存在数λ和n 为非零向量0,a ≠使Aa a λ=,则称λ是A 的特征值,a 是属于λ的特征向量;矩阵E A λ-称为A 的特征矩阵;E A λ-是 λ的n 次多项式,称为A 的特征多项式;E A λ-=0称为A 的特征方程; 2、特征值、特征向量的求法 (1)计算A 的特征值,即解特征方程E A λ-=0; (2)对每一个特征值0λ,求出相应的齐次线性方程组()00E A X λ-= 一个基础解系123,ξξξ,,...,则属于0λ的全部特征向量为11...s s k k ξξ++,其中1,...,s k k 为不全为零的任意常数; 3、特征值、特征向量的性质 (1)A 与T A 的特征值相同(但特征向量一般不同); (2)属于同一特征值的特征向量的线性组合仍是属于该特征值的特征向量; (3)属于不同特征值的特征向量线性无关; (4)设()0A a a a λ=≠,则(),,m kA A P A 的特征值分别为(),,m k P λλλ,其中 ()P x 为任一多项式,而a 仍为相应的特征向量; (5)若A 可逆,()0Aa a a λ=≠,则 1 λ 是1 A -的特征值; A λ 是*A 的特征值, a 仍为相应的特征向量; (6)设12n λλλ,,...是n 阶方阵的特征值,则有()1 1 n n i ii i i a tr A λ====∑∑(迹);

1 n i i A λ ==∏;推论:A 可逆当且仅当A 的特征值全不为零; (7)若A 为实对称阵,则A 的所有特征值均为实数,且属于不同特征值的特征向量彼此正交。 二、相似矩阵 1、定义 设,A B 为n 阶方阵,若存在n 阶可逆阵P ,使1P AP B -=,称A 与B 相似,记为A ~B ; 2、A ~B 的性质 T T A B ,,,M M kA kB A B ~~~ ()(),P A P B ~其中P 为任一多项式;()(),,,r A r B A B E A E B λλ==-=- ⇒特征值相同,()()tr A tr B =;若A 可逆,则B 也可逆,且11A B --~。 三、矩阵对角化的条件及方法 1、若矩阵A 与对角阵相似,则称A 可对角化, (1)n 阶方阵A 可对角化的充分必要条件是A 有n 个线性无关的特征向量; (2)若A 的特征值两两不同,则必可对角化。 2、实对称阵A 必可对角化,且存在正交阵P ,使1P AP -=Λ 实对称矩阵正交对角化具体计算步骤如下: (1)求出实对称矩阵A 的全部特征值; (2)若特征值是单根,则求出一个线性无关的特征向量,并加以单位化; 若特征值是重根,则求出重数个线性无关的特征向量,然后用施密特正交化方法化为正交组,再单位化;

特征值与特征向量定义与计算

特征值与特征向量 特征值与特征向量的概念及其计算 定义1. 设A是数域P上的一个n阶矩阵,λ是一个未知量, 称为A的特征多项式,记ƒ(λ)=| λE-A|,是一个P上的关于λ 的n次多项式,E是单位矩阵。 ƒ(λ)=| λE-A|=λn+α1λn-1+…+αn= 0是一个n次代数方程,称为A的特征方程。特征方程ƒ(λ)=| λE-A|=0的根(如:λ0) 称为A 的特征根(或特征值)。n次代数方程在复数域内有且仅有n 个根,而在实数域内不一定有根,因此特征根的多少和有无,不仅与A有关,与数域P也有关。 以A的特征值λ0代入(λE-A)X=θ,得方程组(λ0E-A)X=θ,是一个齐次方程组,称为A的关于λ0的特征方程组。因为 |λ0E-A|=0,(λ0E-A)X=θ必存在非零解X(0),X(0) 称为A的属

于λ0的特征向量。所有λ0的特征向量全体构成了λ0的特征向量空间。 一.特征值与特征向量的求法 对于矩阵A,由AX=λ0X,λ0EX=AX,得: [λ0E-A]X=θ即齐次线性方程组 有非零解的充分必要条件是: 即说明特征根是特征多项式|λ0E-A| =0的根,由代数基本定理

有n个复根λ1, λ2,…, λn,为A的n个特征根。 当特征根λi (I=1,2,…,n)求出后,(λi E-A)X=θ是齐次方程,λi 均会使|λi E-A|=0,(λi E-A)X=θ必存在非零解,且有无穷个解向量,(λi E-A)X=θ的基础解系以及基础解系的线性组合都是A的特征向量。 例1. 求矩阵的特征值与特征向量。 解:由特征方程 解得A有2重特征值λ1=λ2=-2,有单特征值λ3=4 对于特征值λ1=λ2=-2,解方程组(-2E-A)x=θ 得同解方程组x1-x2+x3=0 解为x1=x2-x3 (x2,x3为自由未知量)

矩阵特征值与特征向量的计算

第九章矩阵特征值与特征向量的计算 教学目的与要求: 掌握用幂法和反幂法求矩阵特征值与特征向量的方法,了解 Jacobi 方法的适用范围和使用方法。重点和难点:幂法和反幂法 ■ 教学内容: §1 幂法和反幂法 一、幂法 幂法的基本思想是给定初始向量(00≠x , 由迭代公式产生向量序列 (1 ( (0,1, 2, +==L k k x Ax k {} ( k x :上述向量称为迭代向量。 (1(0 (22(0( (0 ⎧=⎪=⎪⎪⎨⎪=⎪⎪⎩LL LL k k x Ax x A x x A x 于是由上式得 (1 ( 1(0 1111( λ++++k i u ======∑∑n n k k k k i i i i i i x Ax A x A a u a 1

1 121112211[]λλλλλ+++⎛⎞ ⎛⎞ =+++⎜⎟⎜⎟ ⎝⎠ ⎝⎠ L k k k n n n a u a u a u 设 ,由10a ≠1(2,3, , i i n λλ>=L 得 1 1lim 0λλ+→∞⎛⎞ =⎜⎟ ⎝⎠ k i i i k a u ,于是 1 21lim 0λλ+→∞ =⎛⎞ =⎜⎟⎝⎠ ∑k n i i i k i a u 故只要 k 充分大,就有 (1 111

111121[]λλ λ+++=⎛⎞ =+≈⎜⎟⎝⎠ ∑n k k k i i i i 1λx a u a u a u 因此, 可以近似作为与(1 +k x 1λ相应 的特征向量。 下面我们通过特征向量来计算特征值1λ。用 ( k i x 表示的第 i 个分量,由于 ( k x (1 1111( 111( ( λλ++≈k k i i k k i i x a x a u u ,所以 (1 1( (1,2, , λ+≈=L k i k i x i n x 上式这种由已知非零向量及矩阵 (0x A 的乘幂构造向量序列 k A {} ( k x 用来计算矩阵 A 按模最大的特征值1λ与对应的特征向量的方法称为幂法。 例 1 用幂法的规范运算求矩阵的按模最大的特征值及对应的特征向量。 ⎥⎦ ⎤⎢⎣⎡−=1439A 幂法的收敛速度取决于比值 2

相关主题
相关文档
最新文档