特征值特征向量及其应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
特征值特征向量及其应用
毕业论文
特征值特征向量及其应用
院系名称:
专业名称:
学生姓名:
学号:
指导教师:
完成日期年月日
特征值特征向量及应用
摘要
特征值与特征向量在现代科学中有重要的应用。
本文介绍了特征值与特征向量的定义以及性质,并且给出了在线性空间中线性变换的特征值、特征向量与矩阵中的特征值、特征向量之间的关系。
然后介绍了几种特征值与特征向量的求解方法:特征方程法;行列互逆变换法;初等变换法。
最后介绍了特征值与特征向量在实际中的应用,如在数学领域中n阶矩阵的高次幂的求解;在物理中对于振动模型的求解问题;以及经济发展与环境污染增长模型等等。
关键词:特征值;特征向量;应用;矩阵;初等变换
Applications of Eigenvalues and Eigenvectors
Abstract
Eigenvalue and eigenvector play an important role in modern science. This thesis firstly introduces the definition and properties of the eigenvalue and eigenvector, and provides the relationship between the eigenvalue and eigenvector of linear transformation in linear space and the eigenvalue and eigenvector of the matrix. Secondly this thesis introduces several methods to find the eigenvalue and eigenvector: the characteristic function method, the dual inverse transform method and the elementary transform method. At last, this thesis introduces the application of eigenvalue and eigenvector, such as find the power of large matrix in mathematics, solving vibration model problems in physics, and solving the models of economic development, environmental pollution and so on.
Key words: eigenvalue;eigenvector;application;matrix;elementary;transformation
目录
第1章前言 (1)
1.1 研究背景 (1)
1.2 研究现状 (1)
1.3 研究内容 (2)
第2章特征值与特征向量的理论 (4)
2.1 特征值与特征向量的一般理论 (4)
2.1.1 特征值与特征向量的定义 (4)
2.1.2 特征值与特征向量的性质 (5)
2.2 特征值与特征向量的一般求解方法 (8)
2.2.1 一般数字矩阵的简单求解 (8)
2.2.2 初等变换法求矩阵的特征值与特征向量 (9)
第3章特征值与特征向量在数学领域简单应用 (14)
3.1 高阶高次幂矩阵的求解 (14)
3.2 在线性递推关系的应用 (15)
3.3 在一阶线性常微分方程中的应用 (17)
3.3.1 矩阵特征值为一重 (18)
3.3.2 当有重根的情况 (20)
第4章特征值与特征向量在物理学中的应用 (22)
4.1 简单理想状态双振动系统 (22)
4.2 关于物理振动模型的解释和举例说明 (26)
4.2.1 二阶系统 (27)
4.2.2 三阶系统 (28)
第5章特征值与特征向量在生活中的简单应用 (31)
5.1 环境污染及经济增长模型中的应用 (31)
5.2 种群增长及分布模型中的应用 (33)
5.3 常染色体遗传问题中的应用 (34)
总结 (38)
参考文献 (1)
致谢 ........................................... 错误!未定义书签。
第1章前言
1.1 研究背景
矩阵是一个贯穿了整个大学课程的基础内容,作为一个尤为重要的基本概念,它也是代数学中的主要研究对象,而且矩阵的特征值与特征向量的出现,更是成为了解决一些数学问题或者其他领域问题的重要方法和手段,由此可以看出,它不仅在代数学中有着举足轻重的地位,在其他的领域也不可缺少。
矩阵几乎贯穿了整个代数学中的各个重要方面,所以对于矩阵的特征值与特征向量的深入研究,不仅仅可以提高对代数问题的了解,并且还可以灵活的应用到实际生活中来解决实际的问题。
本文首先通过论述特征值与特征向量在代数学中的基础概念和性质,以及有关这些性质的一些证明方法,通过灵活运用这些相关的性质,可以更加容易的解决一些相关问题。
然后通过举例的方法对于特征值与特征向量的求解问题,比如常用的矩阵的初等变化、逆变换和将矩阵转化为特征方程来求解特征值和特征向量等。
由于二者的应用是多方面的,所以会着重介绍特征值与特征向量在各个领域中的应用,例如在数学方面对高阶矩阵运算的简化,以及数值分析方面的高次幂的求解;物理方面对不同振动模型的应用。
本文就是主要采用举例说明的方法,通过实际问题的求解应用,并对于相关问题进行系统的归纳与分析,来体现出矩阵特征值与特征向量在解决问题中的优势。
1.2 研究现状
汤正华[1]在2008年讨论了矩阵的特征值与特征向量的定义、性质;特征值与特征向量的求法等问题。
李延敏[2]在2004年通过对矩阵进行行列互换,同步求出矩阵特征值与特征向量,解决了不少带参数求特征值问题,并给出一些新定理。
赵院娥、李顺琴[3]在2009年进一步研究几种矩阵的特征值问题。
邵丽丽[4]在2006年通过对n阶矩阵的特征值与特征向量的研究,针对n阶矩阵的特征值与特征向量的应用进行了3方面的探讨,并给出了相关命题的证明及相应的例题。
黄金伟[5]在2007年给出求解矩阵的特征值与特征向量的两种简易方法:列行互逆变换方法与列初等变换方法。
向以华[6]在对矩阵特征值与特征向量相关问题进行系统的归纳,得出了通过对矩阵进行行列互逆变换就可同时求出特征值与特征向量的结论,同时讨论了反问题。
张红玉[7]在2009年通过n阶方阵A的特征值得出一系列相关矩阵的特征值,再由特征值与正定矩阵关系得出正定矩阵的结论。
王英瑛[8]在2008年利用矩阵的初等变换理论,详细讨论了矩阵特征值和特征向量的求法。
夏慧明、周永权[9]在2008年提出一种基于进化策略求解矩阵特征值及特征向量的新方法。
郭华、刘小明[10]在2004年从方阵的特征值与特征向量的性质出发,结合具体例子阐述了特征值与特征向量在简化矩阵运算中所起的作用。
k 岳嵘[11]在2007年通过对已知n阶对称矩阵A的k个互不相等的特征值及1个特征向量,给出矩阵A的计算公式,并给出证明及应用举例。
贤锋[12]在2006年通过建模实例介绍了最大特征值及特征向量的应用。
王秀芬[13]在2004年推导出一种方法,通过此方法可以利用特征值与特征向量求线性递推关系中的通项公式。
吴江、许耿[14]等在“浅谈特征值与特征向量”一文中,根据线性变换的规律,引出了矩阵的相似性,以及特征值与特征向量的定义。
刘国琪[15]在矩阵的运算中,从二者的性质出发,结合例子给出了特征值特征向量对于矩阵化简问题的作用。
杨廷俊[16]运用计算机语言,以及MATLAB程序进行编程,从实际入手,给出了应用计算机来解决问题的全过程。
戴华[17]等人,通过研究n阶矩阵的特征值与特征向量,给出了矩阵正定性的性质。
近年来,对矩阵特征值与特征向量的研究已经很深入,本课题将对矩阵特征值与特征向量的相关问题进行系统的归纳。
对矩阵的特征值与特征向量的基本性质进行介绍,根据其性质对矩阵特征值与特征向量的应用进行更深一步的探讨。
1.3 研究内容
由于本文为综述类论文,所以在基于前人的研究基础上,本文首先给出了特征值与特征向量的基本意义,以及一些相关的性质,这些内容会使得在后续的应用解题过程中,步骤更加简便。
然后继续讨论了不同的对于矩阵特征值和特征向量的解法,例如定义法、初等变化法以及一些特殊方法,并给出实例加以验证。
由以上过程作为基础,本文重点给出了特征值特征向量在各个领域中的应用,如数学领域、物理领域以及生活中的一般应用。
数学中着重介绍了特征值与特征向量在线性递推关系和解常微分方程组中的应用;物理领域中则给出了从一般到复杂的振动系统中的分析,如2阶、3阶振动模型;在生活中则给出具体模型来研究
并分析二者的应用。
总体上本文就是通过大量的举例说明,来研究特征值与特征向量的各种应用,来体现其优越性。
第2章 特征值与特征向量的理论 第4页
第2章 特征值与特征向量的理论
2.1 特征值与特征向量的一般理论
为了研究矩阵的线性变换,并且希望能够在线性空间中通过一些线性变换找到一个比较简单的形式,所以引入了特征值与特征向量这一概念。
我们知道,在一个有限维的线性空间中,确定一组基之后,线性变化就可以通过矩阵的方法来表示,当然对于一些复杂的形式来说,这种变化过程也十分繁琐。
那接下来就是要讨论如何会使得这些方法变得简洁,首先介绍一下特征值与特征向量的定义。
2.1.1 特征值与特征向量的定义
线性空间中的定义:设A 是数域P 上线性空间V 的一个线性变换,如果对于数域P 中的任意一个数0λ,存在一个非零的向量ξ,使得
0=A ξλξ (2.1)
那么就称0λ是A 的一个特征值,而ξ称为A 的属于特征值0λ的一个特征向量[18]。
从几何上来看,特征向量的方向经过线性变换后,保持在同一条直线上,这时或者方向不变(0λ>0),或者方向相反(0λ<0),至于0λ=0时,特征向量就被线性变化成零向量。
如果ξ是线性变换A 的属于特征值0λ的特征向量,那么ξ的任何一个非零倍数k ξ也是A 的属于0λ的特征向量。
因为从定义式(2.1)中可以推出
()()0A k k ξλξ= (2.2)
这说明特征向量不是被特征值所唯一确定的。
相反,特征值却是被特征向量所唯一决定的,因为一个特征向量只属于一个特征值。
矩阵中的定义:设A 是数域P 中的一个n 阶矩阵,如果存在数域P 中的任意一个数0λ,和一个属于n 维数域中的一个非零的列向量x ,使得
0Ax x λ= (2.3)
那么我们就称0λ是矩阵A 的一个特征值,向量x 称为矩阵A 的关于特征值0λ的特征向量。
上式可以改写为()0-0A E x λ=,这种形式就是常见的对于n 个方程和未知数的齐次线性方程组求解的问题。
很显然它有非零解的充分必要条件就是:它的系数行列式0-0A E λ=。
由此就可以看出,矩阵A 的特征值就是此方程的解,对于解的个数就有了如下的定理。
定理2.1 设存在一个n 阶的矩阵()ij A a =,并且它的特征值为12,,...n λλλ,则
有
(1)121122......n nn a a a λλλ+++=+++; (2)12...n A λλλ=; 证明 因为
1112121222111221
2
......=
=(1)(...)..................n n
n n n nn n n nn a a a a a a A E a a a A
a a a λλλλλλ
------+++++-
上式通过多项式分解定理,可以得出12=()()...()n A E λλλλλλλ----,观察
1n λ-的系数有112212......nn n a a a λλλ+++=+++,又有120...n A A E λλλ=-=,所以定理得证。
2.1.2 特征值与特征向量的性质
对于特征值与特征向量性质的研究,可以简化我们对矩阵求解问题的运算步骤,有时合理的利用某些性质也会更快的解决实际生活中的问题。
性质2.1 相似的矩阵具有相同的特征多项式[19]。
证明 给出两个矩阵A 和B ,设它们相似,那么就存在一个可逆的矩阵X ,成立1B X AX -=,于是
111()E B E X AX X E A X
X E A X E A
λλλλλ----=-=-=-=- (2.4)
但是需要指出的是,有相同的特征值的矩阵未必相似,我们可以举出很多这样的例子,比如
10110101A B ⎡⎤⎡⎤==⎢⎥⎢⎥⎣⎦⎣⎦
, (2.5) 两个矩阵具有相同的特征值,但是A 的相似矩阵只能是A 本身。
性质2.2 属于不同特征值的特征向量线性无关[19]。
证明 首先设不同的特征值与特征向量分别为12,,...,m λλλ和12,,...,m p p p ,二者一一对应。
设有常数12,,...,m x x x ,使得
1122...0m m x p x p x p +++= (2.6)
则有
1122(...)0m m A x p x p x p +++= (2.7)
即
111222...0m m m x p x p x p λλλ+++= (2.8)
同理,以此类推有
111222...0k k k
m m m x p x p x p λλλ+++= (1,2,...,1)k m =- (2.9)
综合以上各式,并将其整合成一个矩阵的形式,得
11
112
2112211...1...(...)(0,0,...,0)............1...m m m m m m m x p x p x p λλλλλ
λ---⎛⎫
⎪
⎪
+++= ⎪ ⎪ ⎪⎝
⎭
(2.10) 从上式中可以看出,当j λ各不相同时,那么此行列式就不等于0,那么此行
列式可逆,就可以得到
1122(,,...,)(0,0,..0)m m x p x p x p = (2.11)
即对每一个j (1,2,...,)j m =,都有0j j x p =。
但是0j p ≠,即0(1,2,...)j x j m ==。
所以,向量组12,,...,m p p p 线性无关。
性质2.3 如果λ是矩阵A 的特征值,并且当矩阵A 可逆时,那么2λ和1λ
分别是矩阵2A 和1A -的特征值[19]。
证明 因为λ是A 的特征值,所以存在一个0p ≠,使得Ap p λ=.于是 (1)22()()A p A Ap A p Ap p λλλ====,所以可以看出2λ是2A 的特征值。
(2)对于另一个性质,当矩阵A 可逆时,由Ap p λ=,有1p A p λ-=,因为0p ≠,
知0λ≠,故1
1
A p p λ
-=
,所以,
1
λ
是1A -的特征值。
由上述的证明过程不难发现,它也间接的说明了矩阵特征值全不为零是可逆的必要条件。
从平方可以继续演变至n 次方,即若λ是A 的特征值,则k λ是k A 的特征值。
性质2.4 设A 是数域P 上的一个n n ⨯矩阵,()f E A λλ=-是A 的特征值多项式,则()()()11122331n
n n nn f A A a a a a A A E -=-++++
+-=O (此性质又被称
为Hamilton-Caylay 定理)[19]。
证明 设()B λ是-E A λ的一个伴随矩阵,通过行列式的有关性质有
()()()--B E A E A E f E λλλλ== (2.12)
因为矩阵()B λ的元素是-E A λ的每一个的代数余子式,并且都是λ的多项式,其次数不会超过n -1。
因此由矩阵的运算性质()B λ可以写为
()-1-201-1n n n B B B B λλλ=++
(2.13)
其中01-1,n B B B ,,都是n n ⨯的数字矩阵。
再设()1
11n n n n f a a a λλλλ--=++
+则()11n n n f E E a E a E λλλ-=++。
而
()()()()1201-1--n n n B E A B B B E A λλλλλ--=++
+
()()
()-1-201021-1-2-1----n n n n n n B B B A B B A B B A B A
λλλλ=+++
+ (2.14)
比较(2.14)式可以得出
010
1212-1-2-1-1----n n n n n B E
B B A a E
B B A a E
B B A a E B A a E
=⎧⎪=⎪⎪=⎪⎨
⎪
⎪=⎪=⎪⎩ (2.15) 以-1n n A A A E ,,,依次乘以第一式,第二式,,一直到第n 式和n +1式,
可得
0111101121
2111n n n n n n n n n n n n n B A EA A B A B A a EA a A B A B A a EA a A
B A a E --------⎧==⎪-==⎪⎪
⎨
⎪-==⎪⎪-=⎩
(2.16) 将上面的n +1个式子逐个相加,左边变成零,右边就是()f A ,所以得证。
性质2.5 如果λ是A 的特征值,那么()f λ为()f A 的特征值[19]
()f x =n n a x +11011n n a x a x a --+
++ (2.17)
证明 设ξ为A 的关于λ的特征向量,那么就有A ξ=λξ,所以
()f A ξ=(n
n A a +E a A a A a n n 0111+++-- )ξ
= n
n A a ξ+ 11--n n A a ξ+… +E a 0 ξ (2.18)
=n
n a λξ+11n n a λξ--+…+0a ξE
=()f λξ 且ξ≠0,所以命题得证。
性质2.6 ()()11122+
+-1n
n n nn E A a a a A λλλ--=-+++。
如果E A λ-在
数域P 中能够分解为一次因式的乘积的形式,那么根据根与系数的关系可知,A
的全体特征值的和等于1122nn a a a ++
,而A 的全体特征值的积为A
[19]。
2.2 特征值与特征向量的一般求解方法
2.2.1 一般数字矩阵的简单求解
通过对于矩阵特征值与特征向量的定义,我们对于一个确定的线性变换A 的特征值与特征向量的求解方法,可以分成以下几个步骤:
1、在线性空间V 中取一组基12n εεε,,,写出线性变换在这组基下的矩阵A ;
2、求出矩阵A 的特征多项式E A λ-在数域P 中的所有的根,这些根就是线性变换下所有的特征值;
3、把所求得的特征值逐个带入方程组中,对于每一个特征值,求解方程组,都可以得到一组基础解系,它们就是属于这个特征值的几个线性无关的特征向量在基12n εεε,,下的坐标,这样我们也就求出了属于每个特征值的全部线性无关的特征向量。
例2.1 在基123,,εεε下的一组线性变换A 的矩阵形式为R ⎛⎫
⎪
= ⎪ ⎪ ⎝⎭122212221,求A
的特征值与特征向量。
解 先求出此矩阵的特征多项式
()()E R λλλλλλ----=---=+----2
1
22
2
1
2152
2
1
(2.19)
可以看出当E A λ-为零时,特征值分别为-1(二重)和5。
并先将-1代入齐次方程组
()()()x x x x x x x x x λλλ---=⎧⎪
-+--=⎨⎪--+-=⎩
1231231231220
21202210
(2.20) 可以得到
x x x x x x x x x -⎧--=---=--⎨⎩=⎪
⎪-1231231
23222022202220
(2.21) 它的基础解系为
⎛⎫ ⎪ ⎪ ⎪-⎝⎭101,⎛⎫ ⎪
⎪ ⎪-⎝⎭
011 (2.22) 由此便可以看出关于特征值-1的两个线性无关的特征向量为
ξεε=-113 (2.23)
223ξεε=- (2.24)
再根据定义可以得出关于-1的特征向量为1122k k ξξ+,其中的1k 和2k 取不全为零的任意值,然后再将5代入,可得
x x x x x x x x x --=⎧⎪
-+-=⎨⎪--+=⎩1231231
23422024202240
(2.25) 基础解系为
⎛⎫ ⎪
⎪ ⎪⎝⎭
111 (2.26) 所以,对于特征值5的线性无关向量是
3123ξεεε=++ (2.27)
可以看出特征值5的全部特征向量为3k ξ,k 的值同上,为不全为零的数。
2.2.2 初等变换法求矩阵的特征值与特征向量
在开始介绍之前首先应该了解什么叫做矩阵的初等变换。
矩阵的初等变换一般就分为初等行变换和初等列变换,先给出初等行变换的定义:
(1)调换矩阵的任意两行(如i ,j 行);
(2) 将一个非零的数k 乘以矩阵中某一行的所有元素;(例如第i 行乘以k ); (3)将某一行元素的k 倍加到另一行对应的元素上去;
这就是矩阵的初等行变换,以同样的方法可以定义初等列变换。
而经过这种初等变换后所得到的矩阵称为初等矩阵。
定理2.2 设A 是一个n 阶的矩阵,它的特征矩阵E A λ-可以经过一系列的
初等变换转化为一个下三角矩阵,记做()()
()()12***n l l L l λλλλ⎡⎤
⎢⎥⎢
⎥
=⎢
⎥⎢
⎥⎢⎥⎣⎦
,则对角线上元素乘积为零的方程()()
()120n l l l λλλ=的解就是A 的特征值。
证明 根据矩阵的初等变化,存在一个n 阶的可逆矩阵()Q λ,使得
()()()I A Q L λλλ-=,即为
()()()()()12n I A Q L l l l λλλλλλ-⋅== (2.28)
由(2.28)就可以看出对角线元素的乘积为零()()
()120n l l l λλλ=的解就是
特征矩阵E A λ-的解。
这样我们就可以得出一种求特征值与特征向量的方法。
首先第一步先求出特征向量:设A 是一个n 阶矩阵,E 是一个单位阵。
λ为所要求的特征值,然后由上定理可知,对特征方程进行一系列的初等变换就可得出一个三角阵()B λ,然后使对角线元素乘积为零解方程即可求得λ。
具体过程如下,设
()
112111222212n T
n n n nn a a a a a a A E a a a λ
λλλ-⎛⎫
⎪- ⎪
-= ⎪
⎪-⎝⎭
(2.29) 可以看出()T
R A E n λ-=。
观察特征矩阵的第一列元素,如果1i a 中有非零元素,那么任取其中一个,记
做()i c λ,经过矩阵的初等变换可得()
()11*0c d λλ⎛⎫ ⎪⎝
⎭,若1i a =0,()2,
i n =,那么
对于()T
A E λ-本身就具有这样的形式,在对其中的()1d λ进行行变换,可得
()()22*0
c d λλ⎛⎫ ⎪⎝⎭,以此类推,直至()T
A E λ-转换为
()
()()12*
0n c c c λλλ⎛⎫
⎪
⎪ ⎪ ⎪ ⎪⎝
⎭
=()B λ (2.30) 由以上的证明过程就可以知道,()T
A E λ-与()
B λ是等价的,所以二者具有相同的初等因子,那么主对角线上元素乘积所构成的线性方程组的解,就是矩阵的特征值,接下来继续求特征向量,引入如下定理。
定理 2.3 若对于特征矩阵()T
i A E λ-进行初等变换,将其转换为一个阶梯型的矩阵,同时对于一个相同形式的单位矩阵进行相同的变换,那么就存在一个n 阶阵,n n P ,使得
(),,,,,,0r n r n T
n n i n n
n r n n r n D P P A E E P λ--⎛⎫
⎪
⎡⎤-= ⎪⎣
⎦
⎪⎝⎭
(2.31) 其中的()i r R A E λ=-且,r n D 是满秩矩阵,那么,n r n P -中的n -r 个n 维行向量就是矩阵A 的特征值所对应的特征向量。
证明 对于特征多项式的转置()T
i A E λ-,经过一系列的初等变换,总是可以转换成标准型,这样就存在两个可逆的n 阶矩阵,,,n n n n P Q ,满足
(),,,,,,000T
r r r n r n n i n n n r n
n r n r E P A E Q λ----⎛⎫
-=
⎪⎝⎭,所以 ()
,,,,,,1,,,,,r
,,,0000000T
r r r n r r r
r n r r n r n n n i n n n r n
n r n r n r n r n r n r n n r n E E Q D P A E Q Q λ-----------'⎛⎫⎡⎤⎛⎫⎛⎫
-===
⎪ ⎪ ⎪⎢⎥''⎝⎭⎣⎦⎝⎭⎝⎭
(2.32)
其中,1
,,,,r n n n
r n n r n Q Q
D Q --'⎛⎫= ⎪''⎝⎭又是满秩矩阵,且,,,r n n n n r n P P P -⎛⎫= ⎪⎝⎭
,所以 ()
()()(),,,,,T
T
T r n r n i
n n i i T
n r n n r n i P P A E P A E A E P P A E λλλλ--⎛⎫-⎛⎫ ⎪-=-= ⎪ ⎪-⎝⎭⎝⎭
(2.33) 可得(),0T
i n r n A E P λ--=,
所以就可以求出特征向量,即,n r n P -中的n-r 个n 维向量的转置。
具体步骤如下:
(1)先写出()T
A E E λ⎡⎤-⎣⎦
,经过初等行变换得出()()D P λλ⎡⎤⎣⎦,其中的D 是含有λ的上三角矩阵,P 是单位阵经过变形后得到的矩阵;
(2)从()D λ中求出特征值,即令主对角元素乘积为零的线性方程组的解,即为λ;
(3)将求出的特征值λ代入()()D P λλ⎡⎤⎣⎦,进行初等变换,当非零行向量的个数为r 时,在矩阵P 中的后n-r 个行向量就是特征向量。
例2.2 求矩阵A =110430102-⎛⎫
⎪
- ⎪ ⎪⎝⎭
的特征值和特征向量。
解
()T A E E λ⎡⎤-⎣
⎦
=141100130010002001λλλ
---⎛⎫
⎪
-→ ⎪ ⎪-⎝
⎭
(2.34) ()1
300101+41100002001λλλ
-⎛⎫
⎪
--→ ⎪ ⎪-⎝
⎭
(2.35) ()()()21
300
1
00-11010=002-001D P λλλλλλ
-⎛⎫ ⎪
-+⎡⎤ ⎪⎣⎦ ⎪
⎝
⎭
(2.36)
然后使()D λ中的主对角元素乘积为零,从(2.36)式可得()()2
210,λλ---=所以特征值为123=2==1λλλ,;分别代入 当1=2λ时,()
()11110
010011
030000001D P λλ⎛⎫
⎪
=-⎡⎤⎣⎦ ⎪ ⎪⎝
⎭
,()()12R D λ=,所以当1=2λ时对应的特征向量为()
100,0,101T
P ⎛⎫
⎪
== ⎪ ⎪⎝⎭。
当23==1λλ时代入得 ()
()22120
010001
020001001D P λλ⎛⎫
⎪=→⎡⎤⎣⎦ ⎪ ⎪⎝
⎭120
1
0001
020000
021⎛⎫
⎪
⎪ ⎪-⎝⎭
(2.37)
所以23==1λλ得特征向量为()
200,2,121T
P ⎛⎫ ⎪=-=- ⎪ ⎪⎝⎭。
上面的例子给出了做初等行变换的方法,同样的对于列变换也可以用相同的方法解决,下面给出例子;
例2.3 求矩阵A --⎡⎤
⎢⎥
=--⎢⎥⎢⎥--⎣⎦311751662的特征值与特征向量。
解
()()
c c E A E λλλλλλλ↔+--+⎡⎤⎡⎤⎢⎥⎢⎥--⎢⎥⎢⎥⎢⎥⎢⎥--++-⎡⎤=−−−−→⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥
⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦
133111
13751157662266100001010010001100 (2.38)
同理,使得主对角线元素乘积为零,即()()λλλ----=2
4440,所以可看
出特征值为,λλλ==-=12324,将λ=-12代入其中,可得
()()L Q λλ⎡⎤⎢⎥-⎢⎥
⎢⎥
⎡⎤-=⎢
⎥⎢⎥⎣⎦⎢⎥
⎢⎥⎢⎥⎣⎦
11100160060001011110 (2.39) 可以得出特征值λ=-12所对应的特征向量为,(),,T
η=1110,然后再将λ=34代
入,结果如下所示
()()()()c c L Q λλ↔⎡⎤⎡⎤
⎢⎥⎢⎥⎢
⎥⎢
⎥⎢⎥⎢⎥
⎡⎤--=−−−−
→⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥⎢⎥
⎢⎥⎢⎥⎢⎥--⎣⎦⎣⎦
23331
0010
01001006036636
00
0101
00110111
1
6161 (2.40) 可以得出特征值λ=34所对应的特征向量为(),,T
η=2011。
第3章 特征值与特征向量在数学领域简单应用 第14页
第3章 特征值与特征向量在数学领域简单应用
作为一个重要的概念,特征值与特征向量在数学中的应用也是最为广泛的,首先它贯穿了整个代数学,同时在对于解决某些较为特殊和复杂的函数问题时,也会使得问题更加简便,接下来就简略探究其在数学领域中的应用。
3.1 高阶高次幂矩阵的求解
对于一个高阶甚至于n 阶的矩阵进行求解,若采用以往的方法会比较麻烦,所以就引入了较为简单的方法。
当一个n 阶的矩阵A 可对角化时,就是说原矩阵与其对角阵相似,那么在计算它的高次幂矩阵k A 时有简便算法。
何为可对角化,如下条件即说该矩阵可对角化:前提是A 为对称的矩阵,再有矩阵A 有n 个不相等的特征值,且特征值所对应的特征向量线性无关,对于每一个特征值λ均有
m ρλλ=。
满足如上条件即可说A 可对角化,1A P P -=Λ。
对1A P P -=Λ来说,其中12,,n P x x x ⎡⎤=⎣
⎦,它由A 的n 个特征向量构成。
并且由A 的n 个特征值构成的对角矩阵为()12,,
n diag λλλΛ=,有
()()()()111
1111
1
1
k
k k A P P P P P P P P P P P P P P P P
P P ---------=Λ=Λ⋅ΛΛ=ΛΛΛΛ=Λ其中()12,,k k k
k n diag λλλΛ=,所以()121,,
k k k k n A Pdiag P λλλ-=。
例3.1 已知矩阵A ⎡⎤⎢⎥
=⎢⎥⎢⎥⎣⎦
122212221,求k A (k 是正整数)
解 从题中可以看出,A 是一个对称矩阵,所以可以采用上述的简便算法, 通过特征值的解法,可以得出矩阵A 的特征值为,λλλ==-=12315,设特征向量是123,,x x x ,所以对角阵为(),,diag Λ=--115,[]P x x x ⎡⎤
⎢⎥==⎢⎥⎢⎥--⎣⎦
1
2
3101011110,
且矩阵P 的逆为P --⎡⎤
⎢⎥=--⎢⎥⎢⎥⎣⎦
121111213111,又(),,P AP diag -=Λ=--1
115,化简后可以
看出1A P P -=Λ,有
()()
k
k
k k k A P P -⎡⎤---⎡⎤⎡⎤⎢
⎥
⎢⎥⎢⎥⎢⎥=Λ=---⎢⎥⎢⎥⎢⎥
⎢⎥⎢⎥--⎣⎦⎣⎦⎢⎥⎣
⎦
110
0101211101101012131110
5111 (3.1)
()()()()()()()()()k k k k k k k k k k k k
k k k k k k
++++++⎡⎤
-+-+-+⎢⎥⎢⎥=-+-+-+⎢⎥-+-+-+⎢⎥⎣⎦
11
1
11
121515151152151531515215 (3.2)
3.2 在线性递推关系的应用
线性递推关系与矩阵之间有着密不可分的联系,特征值与特征向量在其中也有着广泛的应用,接下来就讨论对于一般的线性递推关系中的应用。
首先设一个K 阶的线性数列,且是循环的,满足如下递推关系
(),,n n n k n k x a x a x a x n k k ---=++
+=++112212 (3.3)
其中(),,
,i a i k =12为常数且其中任意k a ≠0。
那么方程
1122,
112211n n n k n k n n n n n k n k x a x a x a x x x x x x x --------+-+=+++⎧⎪=⎪⎪
=⎨
⎪⎪
=⎪⎩
(3.4) 经矩阵表示为
n k k n n n n n k n k x a a a a x x x x x x -------+⎡⎤⎡⎤
⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢
⎥⎢⎥⎢⎥=⎢
⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎢
⎥⎣⎦
⎣⎦1
2
1112211000010000
1
0 (3.5) 让
,,n n k k n n n k n n k n k n k x x a a a a x x x A x x αα-----+----+⎡⎤
⎡⎤
⎡⎤⎢⎥
⎢⎥⎢⎥⎢⎥
⎢⎥⎢
⎥⎢⎥===⎢⎥⎢⎥
⎢⎥
⎢⎥⎢⎥
⎢⎥
⎣⎦⎣⎦
⎢⎥⎣⎦
112
112121100000
1
0 (3.6) 那么(3.5)式可以写成
1n k n k A αα-+-= (3.7)
通过递推关系( 3.7)式变为2
111n k n k n k A A ααα--+--==
=,
[]1121,,,,T
k k x x x x α-=,所以求n x 就变成了求1n k α-+,即求n k A -。
假设矩阵A 可转化为对角阵,那么就存在可逆矩阵P ,使得1P AP -=Λ,则
1n k n k A P P ---=Λ,于是
1
21100
01000
1
k k
a a a a E A λλ
λλ
-------=
-
- (3.8)
在上面行列式的第一列上乘以λ,加到下一列,以此类推,就得到:
k k k k k k k a a a a a a a a λλλλλλλλ-----⎡⎤
-----
---
--⎢
⎥
-⎢⎥
⎢⎥-⎢⎥⎢⎥⎢⎥-⎣
⎦
2121112
11111
00
00100
001
111k k k k a a a λλλ--=--
--
当λ是矩阵A 的特征值时,可以得到()1R E A k λ-=-,那么齐次线性方程组
()0E A X λ-=的基础解系中只有一个解,所以当矩阵A 有k 个特征值12,,
,k
λλλ时,分别对应着特征向量为12,,,k P P P ,那么以其作为矩阵的列,所构成的矩阵p
就是可逆矩阵,且1P AP -=Λ
1
2
0000
n A λλλ⎡⎤⎢⎥⎢
⎥=⎢⎥⎢⎥⎣⎦
(3.9) 例3.2 设数列{}n x 满足如下递推的关系:()n n n n x x x x n ---=+-≥123224,其中
,,x x x ==-=123123,求n x 的通项。
解 由题可得数列是三阶循环的,n n n n n n n n x x x x x x x x -------=+-⎧⎪
=⎨⎪=⎩
123
112222,将方程组写成矩
阵的形式
n n n n n n x x x x x x ------⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦11223212100010,让A -⎡⎤
⎢⎥=⎢⎥⎢⎥⎣⎦
212100010 (3.10) 经过递推得
n n n n n n n n n n x x x x x A x A x A x x x x x ---------⎡⎤⎡⎤⎡⎤⎡⎤
⎢⎥⎢⎥⎢⎥⎢⎥====⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦
⎣⎦
1232312322341 (3.11)
又由于,,x x x ==-=123123,且E A λ-=0,可得
λλλλλλ
---=-+-=-322121022001 (3.12) 特征值为:,,λλλ==-=123112,再由矩阵的特征方程求解,所得到的特征向量为:
,,P P P ⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥==-=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦
123114112111 (3.13) 令:
[]P P P P ⎡⎤
⎢⎥==-⎢⎥⎢⎥⎣⎦
1
2
3114112111 (3.14)
则
,P P P ---⎡⎤⎡⎤
⎢⎥⎢⎥=-Λ=-⎢
⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦
11
33610011320106202002 (3.15) ()()()()()()()()()n n n n n n n n n n n n n n n n n P P ----------------⎡⎤
-+-+--+--⎡⎤⎢⎥⎢⎥⎢⎥
Λ=-=-+-+--+--⎢⎥
⎢⎥⎢⎥⎣⎦
-+-+--+--⎢⎥⎣⎦
3333
2223
111
31322
31233162121001010312331621260023123316212代入(3.10)中有:
()()()()()()
n n n n n n x x x x ---⎡⎤=-+-++--++--⎣
⎦333
321131233162126
()()n n n n --+-⎡⎤=-+-+=-+-+⋅⎣⎦33
111311291112126263
(3.16)
3.3 在一阶线性常微分方程组中的应用
一阶线性常微分方程组出现在数学以及工程等许多领域,例如在控制理论和电路的分析中。
在每种情况下,基本未知量是每个时间变量t 的函数。
然而同样也可以用特征值与特征向量的方法求解,首先我们第一个步骤就是重铸常微分方程组中的矩阵形式,X AX =,其中A 是n ×n 常系数矩阵,X 是未知函数中n-1列的列向量,X 是含有未知量所衍生出来的n-1列的列向量。
其主要步骤是使A 的特征矩阵变成沿对角线方向的微分方程系统。
这一过程将使得X AX =变为
Y DY =,其中D 是对角矩阵。
我们会发现,微分方程这一新的对角系统可以轻松解决。
如下的一阶线性常微分方程组
⎪
⎪⎪⎩
⎪⎪⎪⎨⎧+++=+++=+++=n nn n n n
n
n n n y a a a dt dy y a y a y a dt
dy
y a y a y a dt dy (212222121212121111)
(3.17) 令
Y =()
T
n y y y ,...,,21,
T
n dt dy dt dy dt dy dt dY ⎪⎭
⎫ ⎝⎛=,...,,2
1 (3.18) 设A =()ij a 为上式的系数矩阵,那么方程就可以写为矩阵的形式:
AY dt
dY
= (3.19) 3.3.1 矩阵特征值为一重
设微分方程的解为:
Y =X e x (3.20)
即
⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n y y y 21=⎪⎪⎪⎪
⎪⎭
⎫ ⎝⎛n x x x x e 21 (3.21) 由前面的叙述可知,对于常微分方程所转化的系数矩阵A ,当A 可对角化时,根据矩阵A 的特征值1λ,2λ, … ,n λ和特征向量1X ,2X , … ,n X ,可以求出(3.21)中的基础解系:
n t t t X e X e X e n λλλ,,,2121 (3.22)
将其进行线性组合
Y =111X e c t λ+222X e c t
λ+ … +n t n X e c n
λ (3.23)
上式就是方程(3.20)的通解,对于上式改写成矩阵的形式为:
Y =()n X X X ,,,21 ⎪⎪⎪⎪⎪⎭⎫
⎝
⎛t t
t n e e e λλλ 21⎪⎪
⎪⎪
⎪⎭
⎫ ⎝⎛n c c c 21. (3.24)
记
P =()n X X X ,,,21 ,),...,,(21n diag λλλ=Λ=AP P 1- (3.25)
令
Λ
λe =⎪⎪⎪⎪⎪⎭⎫
⎝
⎛t t
t n e e e λλλ 21,C =⎪⎪
⎪⎪
⎪⎭
⎫ ⎝⎛n c c c 21 (3.26)
那么方程(3.20)和(3.24)可写成:
Y =P Λλe C (3.27)
例3.3 求下列一阶线性常微分方程组的通解:
⎪⎩⎪⎨⎧--=--=2
12211
41412165y y dt
dy y y dt dy (3.28) 解 首先将方程改写为矩阵的形式:
Y =⎪⎪⎭⎫ ⎝⎛21y y ,⎪
⎪⎪⎪⎭⎫
⎝⎛=dt dy dt dy dt dY 21
, A =⎪⎪⎪⎪
⎭
⎫
⎝⎛----4141216
5 (3.29) AY dt
dY
= (3.30) 特征方程为
414
12
16
5++
=
-λλλA E =()1+λ(λ+121
) (3.31) 从上式可以看出,矩阵的特征值为-1和12
1
-
,二者分别对应的特征向量为 1X =⎪⎪⎭
⎫ ⎝⎛13,2X =⎪⎪⎭⎫
⎝⎛-32 (3.32) 令
P =⎪⎪⎭
⎫
⎝⎛-3123 (3.33)
由通解的形式C P Y Λ=λ可知
Y =⎪⎪⎭⎫ ⎝⎛-3123⎪⎪⎭
⎫
⎝
⎛--t t
e e 121⎪⎪⎭
⎫
⎝⎛21c c (3.34)
所以最终求得的解为
⎪⎪⎪⎩
⎪
⎪⎪⎨⎧-=+=----t
t t t e c e c y e c e c y 12
12
1212
1211323 (3.35) 3.3.2 当有重根的情况
定理 3.1 设矩阵A 中m 个不同的特征值分别为m λλλ,,,21 ,重数为
m k k k ,,,21 ,那么对于每一个特征值,方程()1.2.3由如下
()()()()()()x k k x x
i i i i i e x P x Y e x P x Y e
x P x Y λλλ===,,,2211 (3.36) 形式的i k 个线性无关的解,这里()()j j k j x P ,,2,1 =的分量不高于多项式1-i k 的次数,然后取尽()m i i ,,2,1 =λ,就得到了基础解系。
具体过程如下,设i k 重特征根为:
()()
x k k i i i e x R x R R x Y λ1110--+++= (3.37)
其中的110,,,-i k R R R 可以通过如下的矩阵求出
()()()()()⎪⎪⎪⎩
⎪
⎪⎪⎨
⎧
=--=-=-=---01201
22110R E A R k R
E A R R E A R R E A i i i k i k i k i i i λλλλ (3.38) 然后接触所有的特征值,就可以得到方程的基础解。
例3.4 求解常微分方程 ⎪⎪⎪⎩⎪⎪⎪⎨⎧+=+=+=2
13312
321
x
x dt dx x x dt
dx x x dt dx 解 系数矩阵A 为
⎪⎪⎪
⎭
⎫ ⎝⎛=011101110A (3.39)
从特征方程()()0122
=+-λλ中可以看出矩阵的特征根为,
1,2321-===λλλ。
21=λ的基础解系为
()⎪⎪⎪⎭
⎫ ⎝⎛=11121x
e x Y (3.40)
然后求2重特征根的解,从定理3.1中可以得出解的形式为:
()()x e x R R x Y -+=10 (3.41)
其中的系数10,R R 满足
()()⎩
⎨⎧=+=+002
1
0R E A R R E A (3.42) 且
()⎪⎪⎪⎭⎫ ⎝⎛=+111111111E A ,()⎪⎪⎪⎭
⎫ ⎝⎛=+3333333332
E A (3.43)
对(3.43)式的求解可以得出线性无关向量为:
⎪⎪⎪⎭⎫ ⎝⎛-011,⎪⎪⎪
⎭
⎫
⎝⎛-101 (3.44) 然后将向量分别代入()10R R E A =+中,可以对于二重根的线性无关解为:
()⎪⎪⎪⎭⎫ ⎝⎛-=-0112x e x Y ,()⎪⎪⎪⎭
⎫ ⎝⎛-=-1013x
e x Y (3.45)
所以最终求得的方程组的通解:
()⎪⎪⎪⎭
⎫ ⎝⎛-+⎪⎪⎪⎭⎫ ⎝⎛-+⎪⎪⎪⎭⎫ ⎝⎛=--1010111113221x
x x e C e C e C x Y (3.46)
第4章特征值与特征向量在物理学中的应用
在开始说明特征值与特征向量在物理中的应用前,首先应该给出二者的物理意义。
特征值表示矩阵的整体扩大或缩小了多少,在物理学中则表示做刚体运动,相当于整体外表发生变化,但是内部的结构没变,但是对于不同的情况有不同的解释,例如动力学中的频率,稳定分析中的载荷,以及主应力。
特征向量表示在某一个方向上,发生旋转,平移,拉伸等变化后的组合,它主要应用于类似的旋转空间及振动模型当中。
这一部分主要探究了特征值特征向量在振动模型中的应用及特性。
4.1 简单理想状态双振动系统
首先给出一个简单的双质量振动系统,如下图4.1中由3个弹簧及两个物体构成的系统(系统被限制在仅能水平方向上移动,不可上下平移)。
图4.1 简单双振动系统
可以借鉴最简单的自由落体系统
图4.2 自由落体运动系统。