矩阵指数函数的性质与计算
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
毕业论文
矩阵指数函数的性质与计算PROPERTIES AND CALCULATION OF MATRIX EXPONENTIAL FUNCTION
指导教师姓名:
申请学位级别:学士
论文提交日期:
摘要
矩阵函数是矩阵理论的重要组成部分,而矩阵函数中的一个最重要的函数就是矩阵指数函数,它广泛地应用于自控理论和微分方程。
本文深入浅出地介绍了矩阵指数函数,并进一步探讨如何借助矩阵指数函数分析相关问题。
文章以齐次线性微分方程组求解基解矩阵为出发点引出矩阵指数函数的概念,证明求解矩阵指数函数就是求解齐次线性微分方程组的基解矩阵,然后得到矩阵指数函数的一些基本性质。
本文的重点是讨论矩阵指数函数的五种计算方法。
其中,前三种方法广泛适用于各种矩阵,虽然计算过程复杂程度不同,但都需要计算矩阵特征值,如遇高阶矩阵或复特征值,则特征值的计算会变得异常麻烦。
后两种方法较特殊,虽然缺乏普适性,只能计算特殊矩阵的指数函数,但却避过了特征值计算,简化了运算过程。
最后,本文具体阐述矩阵指数函数在微分方程求解中的应用。
关键词:矩阵指数函数;Jordon 标准形;微分方程组
ABSTRACT
Matrix function is an important part of the matrix theory. And among the matrix function, there is a special and important function that is matrix exponential function. It has been widely used in automatic control theory and differential equations. This paper introduces profound theories on matrix exponential function in simple language, furthermore, it explores how to use matrix exponential function analysis related issues. Through the basic solution matrix of homogeneous linear differential equations, this paper draws out the concept of matrix exponential function. In this part, the author proves that solving matrix exponential function is to solve the basic solution matrix of the homogeneous linear differential equations. Then, some basic properties of matrix exponential function can be derived. The focus of this paper is on the discussion of five kinds of calculation on matrix exponential function. The first three methods can be applied to general cases. Although each method is different, in complexity, all of them need to compute the matrix eigenvalues. The calculation on high-order matrix or complex eigenvalues will be in trouble frequently. The latter two methods is more special for they can only calculate special matrix exponential function. These methods simplify the operation process instead of calculating eigenvalues, but their shortcomings are obvious. At the final part of this paper, the article expounds the application of matrix exponential function in different equations when solving the function in reality.
Key words: Matrix exponential function; Jordon normal form; Differential equations
目录
1 前言 (1)
1.1 矩阵(Matrix)的发展与历史 (1)
1.2 本文的主要内容 (2)
2 预备知识 (3)
3 矩阵指数函数的性质 (7)
3.1 矩阵指数 (7)
3.1.1 关于级数
! k k
k A t k
∞
=
∑的收敛性 (7)
3.1.2 矩阵指数A e的性质 (8)
3.1.3 常系数线性微分方程基解矩阵 (10)
3.2 矩阵指数函数的性质 (10)
3.2.1 矩阵函数 (10)
3.2.2 矩阵指数函数的性质 (11)
4 矩阵指数函数的计算方法 (17)
4.1 矩阵指数函数的一般计算方法 (17)
4.1.1 Hamilton‐Cayley求解法 (17)
4.1.2 微分方程系数求解法 (21)
4.1.3 Jordon块求解法 (23)
4.2 矩阵指数函数的特殊计算方法 (26)
4.2.1 矩阵指数函数展开法 (27)
4.2.2 Laplace变换法 (27)
4.3 矩阵指数函数方法比较 (28)
5 矩阵指数函数在微分方程中的应用 (30)
6 总结 (33)
参考文献 (34)
致谢 (35)
1 前言
1.1 矩阵(Matrix)的发展与历史
在数学中,矩阵(Matrix)是很常用的工具,虽然Matrix亦有“子宫,或者控制中心的母体,孕育生命的地方”此类含义,然而矩阵却与生物没有太大的关联,矩阵(Matrix)是指在二维空间里的数据纵横分布形成的表格,最先起源于方程组的各项系数和常数所组成的方阵。
矩阵的系统概念首先被英国的著名数学家凯利提出。
实际上,虽然矩阵(Matrix)这个概念诞生于19世纪,矩阵本身却有着非常古老的历史,早在很久以前就已发现幻方以及古老的拉丁方阵等关于矩阵方面相关研究记录。
在我们平时遇到的相关问题中,在解决线性方程方面问题的时候都会用到矩阵,在古代中国,也有很多类似于矩阵方面研究载,在魏晋的刘徽所编著的数学巨著《九章算术》中,就已经提到了怎样求解线性方程组增广矩阵。
书理用类似分离系数法的方法来表示线性方程组,在其一行乘以一个非零实数、把其中一行中和另一行相减等运算技巧,类似现在矩阵变换里面的初等变换。
然而由于当时世界各地并没有系统的矩阵研究,也没有相关概念,所以仅仅以线性方程内的表示方法为标准和相关的处理方式记录在书中。
在正常的逻辑中,矩阵系统这个概念应该在行列式之前被提出,但是在实际的数学历史中却正好相反。
在对行列式研究的体系慢慢完善起来之后,矩阵才慢慢进入数学家们的视野。
在该领域的数学家中,日本非常有名的关孝和(1683年)与戈特弗里德·威廉·莱布尼茨(1693年)(微积分理论的提出者之一)在大致相同的时地独自建立了行列式理论。
在这以后这一理论不断发展,其经常被用来求解线性方程组。
1750年,加布里尔·克拉默提出了克莱姆法则。
随后,由于研究的需要,行数等于列数的行列式在解决重要的数学问题是有很大的局限性,无法满足实际需要。
于是矩阵便应运而生。
矩阵的当代概念体系在19世纪慢慢完成。
实际上矩阵的概念与行列式的概念有本质上的区别,其使用也有很大的不同。
在这一领域的数学家中,1850年,英国的詹姆斯(James Joseph Sylvester)最开始使用矩阵这个名字将数字构成的矩形阵列和最开始的行列式分离。
矩阵论体系的创立者一般被认为是英国著名数学家凯莱(Cayley),他将矩阵这个数学概念完全独立为一个新的数学对象,矩阵里面很多相关性质先在行列式问题的讨论中业已被发现,所以矩阵的概念的提出很容易被人接受。
在1858年,凯莱(Cayley)在他所写的《矩阵论的研究报告》里面有体系地说明了矩阵的一些基本理论。
在这篇报告里面作者规定了矩阵相等、算法、转置和矩阵基本概念,
如逆矩阵的加法,给出了系列,互换性和约束力的概念。
除此之外,凯莱(Cayley)亦在报告里写下了方阵的特征方程以及特征根还有矩阵的少许基本结论。
此外,在之后关于矩阵系统的研究中,也有很多其他的数学家做出了重要的发现。
德国数学家弗洛伯纽斯(Frobenius)最先提出了最小多项式的概念,矩阵中秩的概念介绍、不变的因素和主要因素、正交矩阵的相似变换,矩阵的其他概念,如合同、不变的因素和主要因素理论的逻辑排列的形式等等。
在1854年,约丹首次发现了把一般矩阵化为标准型的方法。
1892年,梅茨勒(Metzler)使用并发展了矩阵函数及其相关概念并用它们整理出矩阵幂级数的形式。
另外,庞加莱(Poincare)以及傅立叶(Fourier)还探讨了与无限阶矩阵相关的一些问题。
到了这个时候,矩阵体系业已很完善了。
1.2 本文的主要内容
矩阵函数是矩阵理论的重要内容,矩阵函数中最简单的是矩阵多项式,是研究其他矩阵函数的基础.本文讨论的是矩阵函数中的一类函数——矩阵指数函数。
本论文的题目是矩阵指数函数的性质和计算,所以主要论述便是性质和计算。
在文章的开始,本文会论述矩阵的相关发展与历史,在第二章会对本文用到的基本数学知识进行介绍,在文章的第三章,本文将会从齐次微分方程引入矩阵指数的概念,关于性质和计算部分主要在第四与第五章进行论述,性质部分论述了矩阵函数的性质,同时介绍了矩阵指数函数的相关特性;第五章将会介绍三种矩阵指数函数的计算方法,并会对这三种方法进行对比。
最后本文将会介绍矩阵指数函数在微分方程中的应用。
2 预备知识
为了课题讨论中便于理解,引入研究此论文所需矩阵的相关知识概念:在这里,n n F ⨯表示对数域F 上n n ⨯矩阵的全部线性空间,因此n n C ⨯表示n n ⨯复矩阵集。
1、矩阵的谱
矩阵A 通过数学运算计算出来的特征值的集合就是一个矩阵的谱,通过数学表达式表示出来也就是:
()A σ表示A 的谱,即(){}A A σλλ=是的特征值; 2、矩阵的谱半径
设A 是阶数为n n ⨯的矩阵,其中矩阵的特征值是i λ,1,2,
,i n =,若写作数学表达式也就是:(){}max A A ρλλ= 是的特征值为A 的谱半径。
即矩阵A 的谱半径是矩阵A 中所有的特征值中最大模的值;如果矩阵特征值是虚数,则谱半径是特征值实部与虚部的平方和的算术平方根。
3、矩阵的化零多项式与它的最小多项式
定义 2.1给定矩阵, 如果多项式1110()m m m m p λαλαλαλαλ--=++
++满足()0p A =,则称()p λ是A 的化零多项式。
定义2.2 在A 的化零多项式中,各项中次数最低同时首项的系数为1的化零多项式可以称作是A 的最小多项式,记为()A λψ。
依据高等代数的基本定理,在复数域的范围里可以有如下证明:
性质2.1 设 n n A C ⨯∈,12,,...,r λλλ是A 中的r 个特征值,他们互不相同,()A λψ为矩阵A 的最小多项式同时1212()()()()r d d d A r λλλλλλλψ=--⋅⋅⋅-,其中
11(1,2,,),r
i i i d i r d m =≥=⋅⋅⋅=∑
如果函数()f x 的导数值拥有足够多阶,同时一下m 个值(称()f x 在影谱上的值) (1)'(),(),...,(),1,2,...,i d i i i f f f i r λλλ-=有意义,则可以说函数()f x 在A 矩阵的谱影上有定义。
一个函数在给定矩阵的谱上可以没有定义。
4、 矩阵级数
定义2.3:设{}k A 是m n c ⨯的矩阵序列,在这里()k k m n ij A a C ⨯=∈,矩阵集{}k A 的无穷和123k A A A A +++⋅⋅⋅++⋅⋅⋅称为矩阵的级数,记为1
k k A ∞
=∑.这里相对正整数1k ≥而言,可以记作1k k i i S A ==∑。
()k S 可以被称为矩阵级数1
k k A ∞
=∑的部分和,如果此矩阵序列是收敛,同时此矩阵序列有极限S ,即lim k
k S S →∞=,则矩阵级数1k k A ∞
=∑可以被证为收敛的,同时S 可以称为矩阵级数1k
k A ∞=∑的和,记作1k k A S ∞
==∑。
如果矩阵级数不收敛,则可称作发散的。
定义2.4:设n n A C ⨯∈,矩阵级数形如
20120k k k
k k c A c I c A c A c A ∞==+++++∑,
可以被称为矩阵幂级数。
5、齐次微分方程组
在线性微分方程组
'()()x A t x f t =+ (2.1)
如果()0f t ≠则称(2.1)为非齐次线性的,
如果()0f t =则为齐次线性的,此时方程形式为
'()x A t x =
通常上式称为对应于(2.1)的齐次线性微分方程组。
6、正定矩阵
在线性代数的领域中,一个正定矩阵(positive definite matrix)偶尔会被简称作正定阵。
在双线性代数的领域中,正定矩阵似复数中的正实数的性质。
对称正定双线性形式(复域中则对应埃尔米特正定双线性形式)是和正定矩阵相对应的线性算子。
正定矩阵的定义分为广义的定义和狭义的定义。
广义的定义:设一个n 阶方阵M ,如果对任何z (z 是非零向量),如果都存在 '0z Mz >,在这里z 的
转置表示为'z ,就可以将M 称作一个正定矩阵。
例如:一个n 阶的矩阵B ,E 表示一个单位矩阵,a 指正实数。
aE B +在a 足够大的时候,aE B +就可以被称作一个正定矩阵(在这里B 必须是一个对称矩阵)。
狭义定义:M 是n 阶的实对称矩阵,同时M 是正定的,在这里当且仅当,M 对于所有的非零实系数向量z ,都存在'0z Mz >。
在这里z 的转置可以表示为'z 。
7、Hermitian 矩阵
A 是n 阶复方阵,在这里如果A 的对称单元互为共轭,也就是说A 的共轭转置矩阵就是它自己,则方阵A 是埃尔米特矩阵(Hermitian Matrix)。
明显可以看出Hermitian 矩阵是实对称阵的推广。
推论 A 是n 阶Hermitian 矩阵,同时A 也是正定(半正定)矩阵的充分必要的条件是矩阵A 中所求得的所有的特征值都大于等于0。
8、Jordan 矩阵
形如下列的由主对角线为特征值,次对角线为1的Jordan 块按对角排列组成的矩阵称为Jordan 形矩阵,而主对角线上的小块方阵i J 称为Jordan 块.
1200s J J J J ⎡⎤⎢
⎥⎢⎥=⎢⎥⎢⎥⎣⎦
, 1010
i i
i i i i n n J λλλ⨯⎡⎤⎢
⎥⎢⎥=⎢⎥⎢⎥⎣⎦。
9、范德蒙矩阵 范德蒙矩阵是法国数学家范德蒙(Vandermonde,AlexandreTheophile, 1735~1796) 提出的一种各列为几何级数的矩阵。
其形式如下:
2111121222213332111
11n n n n m m m V αααααααααααα----⎡⎤⋅⋅⋅⎢⎥⋅⋅⋅⎢⎥⎢⎥=⋅⋅⋅⎢⎥⎢⎥⎢⎥⋅⋅⋅⎣⎦ 在范德蒙矩阵中,矩阵的行数是m ,矩阵的列数是n ,则矩阵拥有最大的秩
min(,)m n 。
10、酉矩阵
定义2.5 如果一个n n ⨯的复数矩阵,这个矩阵满足条件:
**n U U UU E ==
在这里,*U 是U 的共轭转置,n E 是n 阶单位矩阵,U 可以被称作酉矩阵。
3 矩阵指数矩阵指数函数的性质
在计算常系数线性微分方程的时候时,主要考虑的是齐次线性微分方程组
'x Ax =,这个方程组的基解矩阵的结构非常重要,在这里,本文所研究的主要问
题--矩阵指数函数At e 和齐次线性微分方程组'
x Ax =的基解矩阵的求解密切相
关。
在本章中,将从齐次线性微分方程组基解矩阵的求解开始,对矩阵指数的概念进行研究,然后再对矩阵指数函数的性质进行详细讨论,在本章的3.1矩阵指数函数中,本文将会一步一步将矩阵指数函数和齐次线性微分方程组'x Ax =联系起来,并证明矩阵()At t e Φ=就是齐次线性微分方程组'x Ax =的基解矩阵。
在3.2 节矩阵指数函数的性质中,本文将先简单介绍矩阵函数的概念,在介绍矩阵指数函数时,会先从指数函数的概念中推出类似的矩阵指数函数的性质,并对它们进行一一证明。
3.1矩阵指数
首先,齐次线性微分方程组可以简单的表示为
'x Ax = (3.1)
这里A 是n n ⨯常数矩阵。
本文将运用代数的方法寻求(3.1)的一个基解矩阵。
为了求解(3.1)的基解矩阵,需要定义矩阵指数A e 。
如果A 为一个是n n ⨯常数矩阵,那么我们可以将A e 定义为下面的矩阵级数的和
20!
2!!k m
A
k A A A e E A k m ∞
===+++⋅⋅⋅++⋅⋅⋅∑, (3.2)
其中E 是指n 阶的单位矩阵,矩阵m A 是A 的m 次幂。
特别的,在这里,我们可以设定0A E =,0!1=。
这个级数对于所有的A 都是收敛的,所以A e 是个确定的矩阵。
特别的,对所有的元都为0的零矩阵0,有0e E =。
此时,若令
0()
!k k
k A t x k ∞
==∑
代入(3.1)中
03212
0'()'
!
02!!
()!
k k
k m m
k k
k A t x k A t A t A A t m A t A Ax
k ∞
=+∞
===++++⋅⋅⋅++⋅⋅⋅+==∑∑
这与At
e 十分相似,但是此时并不能确定二者关系如何,接下来,会对二者的
关系进行讨论。
3.1.1关于级数At e 的收敛性
易知对于一切正整数k ,有
!!
k
k
A A k k ≤, 又因为任意矩阵A ,A 是一个确定的实数,所以数值级数
2
2!
!
m
A
A
E A m ++
+⋅⋅⋅+
+⋅⋅⋅
是收敛的(上式和为1A
n e -+)。
假设矩阵级数任意项的范数都小于相对应的收敛数值级数的相应项,那么我们可以推得此矩阵级数为收敛的,所以(3.2)先对所有矩阵A 全是绝对收敛的。
进一步指出,级数
0!
k k
At
k A t e k ∞
==∑ (3.3) 在所有有限区间上是一致收敛的。
实际上,相对所有正整数k ,当
c
t ≤(c 为一个正常数)时,可以存在
!!
!
k
k
k
k
k k
A t A c A t k k k ≤≤
, 而数值级数()0!
k
k A c k ∞
=∑
是收敛的,所以(3.3)是一致收敛的。
因为(3.3)是一致收敛的,所以可以对(3.3)进行求导。
在3.1.3节的证明过程中会用到此证明结果。
3.1.2矩阵指数A e 的性质
1.如果矩阵A 和B 是可交换的,即BA AB =,则
()A B A B e e e += (3.4)
事实上,由于矩阵级数(3.3)是绝对收敛的,因而关于绝对收敛数值级数运算的一些定理,其中包含级数的收敛性不受项的重新排列影响和级数的和以及乘法运算的性质等都能够运用到这里来,由二项式定理以及BA AB =可得到
()
000()!!()!k
l k l A B K k l A B A B e
k l k l -∞
∞
∞+===⎡⎤+==⎢⎥-⎣⎦∑∑∑ (3.5) 另一方面,由绝对收敛级数的乘法定理得
0000!!!()!i j
l k l A B
i j k l A B A B e e i j l k l -∞
∞∞
∞====⎡⎤==⎢⎥-⎣⎦∑∑∑∑ (3.6) 比较(3.5)以及(3.6),推得(3.4). 2.对于任何矩阵A ,存在1()A e -,且
1()()A A e e --=
实际上,A 和A -是可交换的,所以在(3.4)中,令B A =-,本文推得
(())0A A A A e e e e E -+-===,
因此,可以推得
1()()A A e e --=.
如果T 是非奇异矩阵,则
1
1()T
AT
A e T e T --=. (3.7)
事实上
()
1
1()
1111
11!
!!()k
T
AT k k k k k A T AT e E k T A T
E k A E T T
k T e T
--∞
=-∞
=∞-=-=+=+⎛⎫
=+ ⎪⎝⎭
=∑
∑
∑
这就是本文所需要证明的。
3.1.3常系数线性微分方程基解矩阵
在之前的两个小节中,本文已经证明了(3.3)的收敛性同时也介绍了矩阵指数相关性质。
在本节,会阐明矩阵指数函数与常系数线性微分方程的基解矩阵的关系(即定理3.1),并对此关系进行证明。
定理3.1 矩阵
()At t e Φ= (3.8)
是(3.1)的基解矩阵。
且(0)E Φ=.
证明
有定义易知(0)E Φ=.(3.8)对t 求导,我们得到
2321
'()()'
1!2!(1)!()
At k k At
t e A t A t A t A k Ae A t -Φ==+++⋅⋅⋅++⋅⋅⋅+
-==Φ
这就表明,()t Φ是(3.1)的解矩阵。
又有det (0)det 1E Φ==。
因此(1)Φ是(3.1)的基解矩阵。
证毕。
根据定理3.1,我们能够使用此基解矩阵得知(3.1)的解()t ϕ全拥有以下形式
()()At t e c ϕ= (3.9)
这里c 是一个常数向量。
由此,求解(3.1)基解矩阵的问题便可以转化为对矩阵指数函数的求解。
3.2 矩阵指数函数的性质
在上一章矩阵指数中我们从求解常系数线性微分方程组的过程中认识到了矩阵指数的概念,并且了解到了(3.8)就是就是常系数微分方程组的基解矩阵。
在本章开始我们将简单的介绍矩阵函数的性质,再对矩阵指数函数的性质进行描述与证明. 3.2.1矩阵函数
定理3.2.1 假设()p λ和()q λ是两个互相不一样的多项式,在这里A 是一个n 阶矩阵,那么()()p A q A =他的充要条件就是在A 的影谱上()p λ和()q λ的值对应相等,即
()()()(),(1,2,...,1)k k i i i p q i d λλ==-
通过利用矩阵多项式,以下将写出矩阵函数的定义. 定义3.2.2 设在n 阶矩阵A 的影谱上函数()f x 有定义,即
()(),(1,2,...,;0,1,2,...,1)k i i f i s k d λ==-
它的值是确定值.如果()p λ是一个多项式,同时符合
()()()(),(1,2,...,;0,1,2,...,1)k k i i i f p i s k d λλ===-
那么矩阵函数()f A 可以定义作()()f A p A =。
定理 3.2.3 设n n A C ⨯∈,在这里矩阵A 的谱()f x 半径为ρ,如果函数()f x 的幂级数的表示式是
0()k k k f x c x x ρ∞
==<∑,
则当ρ<+∞时
0()k k k f A c A ∞
==∑
根据定理3.2.3 可以推出很多关于矩阵函数的幂级数表示式,列举其中3个
211
2!!
A n e E A A A n =+++⋅⋅⋅++⋅⋅⋅;
3521111
sin (1)3!5!(21)!n n A A A A A n +=-
+⋅⋅⋅+-+⋅⋅⋅+; 242111cos (1)2!4!(2)!
n n A E A A A n =-
+⋅⋅⋅+-+⋅⋅⋅; 3.2.2矩阵指数函数的性质
若把矩阵指数函数At e 中A 换为11⨯矩阵,会发现,此时矩阵指数函数便变成了指数函数,作为基本函数之一的指数函数,同时也作为特殊的矩阵指数函数,指数函数的性质在矩阵指数函数中是否可以应用,接下来,本文将会以此对矩阵指数函数的性质一一列举出来,并进行论证。
定理 3.2.4 设,n n A B C ⨯∈,()e f λλ=是复值函数,并且在()A σ有定义,那么矩阵指数函数At e ,拥有下面7条性质:
(1)(),A A A e e e C λμλμλμ+=+∈ (2
)cos sin ,(iA e A i A i =+=
(3)如果A 和B 可交换,也就是说当AB BA =时,有A B B A A B e e e e e +==; (4)对于任何矩阵A ,A e 总是可逆的,同时1()A A e e --=; (5)
()At
At At d e Ae e A dt
==; (6)det()At trA e e =,其中1122nn trA a a a =++⋅⋅⋅+是A 的迹。
(7)设定B 是Hermite 正定矩阵,那么有唯一Hermite 矩阵Q ,使Q B e =。
证明
(1) 由定理3.2.1 知
()
00()!1()()!k k
A k k
m m K m k k m A e
k C A A k λμλμλλ∞
+=∞-==+=⎡⎤
=⎣
⎦∑
∑∑
若命1k m -=,则
()
001
()()(1)!
A m m l
l m m l e
C A A m λμλμ∞
∞
++===+∑∑
但由于()
!!
m l m l m C l m ++=
,于是有 ()
00
()()()()!!m l
A A A m l A A e
e e m l λμλμλλ∞
∞+====∑∑
反之亦然.
(2)由定理3.2.1 知
0234
2435!
1112!3!4!
1111
()()
2!4!3!5!cos sin k k
iA
k A i e k E iA A iA A E A A i A A A A i A ∞
===+-
-+-⋅⋅⋅
=-+-⋅⋅⋅+-+-⋅⋅⋅=+∑ (3)在满足()AB BA =的情况下,二项式公式
()k
k
m k m m k m A B C A B -=+=∑
成立,因此
000
1
()!
1
()!A B
k
m k
m k m m k m m e
A B k C A B k ∞
+=∞
-===+=∑∑
∑
在证明(1)过程中的式子可以整理为
00!!m I m I A B m I ∞
∞==∑∑或00!!m I
m I B A m I ∞
∞==∑∑ 故A B B A A B e e e e e +==。
(4)矩阵指数函数满足0e E =,根据(1)得
()A A A A e e e E +--==
故1()A A e e --=
(5)矩阵指数函数的幂级数表示式对于给定矩阵A 和对所有t 都是绝对收敛的,同时满足对所有的t 都是一致收敛,因此
01
100()!(1)!
!
!k k At k k k k I I
I I I I At At d d A t e dt dt k kA t k A t A I A t A I Ae e A
∞
=-∞
=∞
=∞=⎛⎫= ⎪⎝⎭
=-=⎛⎫= ⎪⎝⎭
==∑∑
∑∑
(6)设1112(,,,)r A PJP Pdiag J J J P --==⋅⋅⋅,在这里J 为A 的Jordan 标准型,则
121(,,,)i J J J A e Pdiag e e e P -=⋅⋅⋅,
1
112!(1)!
i i i
i i
i
i
i
i
i
i J d d
e e e e d e e e e
e λλλλλλλλ⨯⎡⎤
⋅⋅⋅
⎢⎥
-⎢⎥⎢⎥
=⎢
⎥⎢⎥⎢⎥⎢⎥⎣
⎦, 所以
1212112211221det det det((,,,))det()
det det det i r r r r J J J A J J Jr d d d d d d trA
e P diag e e e P e e e e e e e e λλλλλλ-++⋅⋅⋅+=⋅⋅⋅=⋅⋅⋅=⋅⋅⋅==
(7)因B 是正定的Hermite 阵,其特征值均为正数。
因此令 ()ln f λλ=,那么()f λ在()B σ上有定义,
又设()g e λλ= ,()g λ为整函数,()B λσ∀∈,()(())f g f e λλλ== ,
()f B B e =,
又()(())f g f e λλ=也是整函数,若()B λσ∈,()(())f g f e λλλ== , 从而()f B B e = .
同时()(())T T f B f B =.如果将H B B =表示为矩阵B 的共轭转置, 即知H B B =,且(())()H f B f B =. 令()Q f B =,Q 唯一,并有Q B e =
假使()n A M C ∈是正规矩阵,()H
A A H e e =,可以推导得
()H
A A H e e = (3.10)
另一方面,若n n A C ⨯∈符合式(3.10),那么A e 是正规矩阵,即
定理3.2.5 设n n A C ⨯∈,A e 是正规矩阵的充分必要的条件为()H
A A H e e =成立。
接下来研究的问题是:如果一个非正规的矩阵A 符合式(3.10)的条件,那么这个
矩阵A 拥有什么样的结构呢?为了研究此问题,需要提前证明一个引理 引理 1 设n n A C ⨯∈, ()f z 为一个复值函数,定义域f D C ⊂.矩阵方程 ()f X A =能够求解的充分必要的条件为:对任何()a A σ∈,总存在f z D ∈,使得()f z a =。
证明 必要性.
设存在 ()n X M C ∈,有()f X A =. 记的Jordan 标准形是
1,det 0X X PJ P P -=≠
式中:{}
1212(),(),...,()r X n n n r J diag J z J z J z =
i n 是Jordan 块的阶数,1i r ≤≤,由引理可知
{}
{}
1211
2()(),((),...,())r n n n r A f x Pdiag J z f J z J z P
-==,
从而有 ()(),1,2,...,k f z A k r σ∈=, 即存在()a A σ∈,有
()f z a =
充分性.
设对任何()a A σ∈,方程()f z a =有解存在. 令A 的Jordan 标准形是
{}
1111111(),(),...,(),...,()r A t r r rt r J diag J a J a J a J a =
于是存在可逆矩阵()A P M C ∈,使()f z a =,于是作
{}112,,...,X X r x J P diag X X X P -=
式中:(),1,2,...,;1,2,...,k kt k X M C k r i t ∈==
{}
1()(),...,(),1k k k k kt k f X diag J a J a k r =≤≤
从而有
{}112()(),()...,()X x r x f J P diag f X f X f X P -=
()A X J f J =
故知
{}111
12()(),()...,()A A A A X A
r A P J P P f J P Pdiag f X f X f X P
---=== (3.11)
若令{}12,,...,r X diag X X X =,则()A f X = 式(3.11)中A X P P P =.
定理3.2.6 设n n A C ⨯∈,式(7)成立的充要条件是:存在酉矩阵n n Q C ⨯∈,使得
{}112,,...,s A Qdiag A A A Q -=
(3.12)
式中:,1t A t s <<是可以对角化的矩阵. 证明 必要性.
设式(7)成立,A e 是正规矩阵,存在酉矩阵Q ,使得
A H e QTQ =
(3.13)
式中:
{}{}
112212,,...,,,...,(),()
n n s ns s nj nj T diag I I I diag T T T T I M C μμμμσ==∈∈
是单位阵,
1
1,n
j j j s n n =≤≤=∑。
,A A H H A e e A Q AQT TQ AQ ⋅=⋅=
即{}12,,...,H S Q AQ diag A A A = 式中:(),1J j A M C j s ∈≤≤.
易证方程,1j A
e T j s =≤≤有解存在,j A 可逆,1j s ≤≤ 故ln ,1j A T j s =≤≤,而j A 可对角化,1j s ≤≤, 从而,1A j s ≤≤是可以对角化的 充分性 显然。
4 矩阵指数函数的计算方法
4.1矩阵指数函数的一般计算方法
矩阵指数函数的计算,即At e 的计算有很多种计算方法。
日常的计算中有许多常用的方法。
本文在本节会提到的三种方法,此三种方法并没确定A 矩阵,因此对矩阵A 并没有特殊的要求,即矩阵A 并不是特殊矩阵。
因此可以解决一般性情况,前二种方法建立在微分方程的基础上,主要利用微分方程来对At e 进行计算,但解法与基本思路并不相同;第三种方法从运用到了Jordon 表示式的知识,主要根据矩阵函数的Jordon 表示式的变化求解,此方法经过计算At e 的Jordon 表示式计算At e ,但是变化Jordon 标准形阶段有点复杂,而且整理之后变换矩阵P 也需要计算,这里所需计算相当大,并且如果矩阵A 的阶数较大,这里所需的计算也会变复杂.虽然如此,但是此方法也有优点,计算步骤很清楚,过程也很明了,容易理解,除了计算,在使用时也很方便. 4.1.1 Hamilton ‐Cayley 求解法
在这节探究的计算方法使用了Hamilton ‐Cayley 定理和定理4.1.2,通过定理4.1.2 能够推知At e 是一个初值条件的微分方程的解,通过求解这个微分方程 来计算At e .
定理4.1.1 (Hamilton ‐Cayley 定理)
n 阶方阵A 的特征多项式
1
()det()
()(1)det n
n n
c E A trA A
λλλλ
-=-=-+⋅⋅⋅+-
是A 的化零多项式,即()0c A =
定理4.1.2 在这里n 阶方阵A 的特征多项式是
1110
()det()
n n n c E A c c c λλλλλ--=-=++⋅⋅⋅++。
当d
D dt
=
时,矩阵指数函数At e 的每个元素都满足n 阶线性微分方程()0c D y =, 并且()At t e Φ=是n 阶矩阵线性微分方程
()(1)110'0n n n c c c --Φ+Φ+⋅⋅⋅+Φ+Φ= (4.1)
(1)1(0),'(0),...,(0)n n E A A --Φ=Φ=Φ= (4.2)
的唯一解。
证明: 首先证明问题(4.1)~(4.2)解的唯一性.设12,ΦΦ都是n 阶矩阵线性 微分方程(4.1)的解,并且满足初值条件(4.2),令12Φ=Φ-Φ.所以Φ满足阵线性微分方程(4.1) ,且满足初值条件(1)(0)'(0)(0)0n -Φ=Φ=⋅⋅⋅=Φ= .所以,Φ内所有元素全部符合以下常系数n 阶线性微分方程
()(1)110'0n n n x c x c x c x --++⋅⋅⋅++=,
(1)(0)'(0)(0)0n x x x -==⋅⋅⋅==
易知此方程的解为()0x t =,所以()0,t t C Φ=∈,因此12Φ=Φ。
下面证明这唯一解就是矩阵指数函数.
n 阶方阵A 的特征多项式:
1110()n n n c c c c λλλλ--=++⋅⋅⋅++
如果()At t e Φ=,则
(1)1()(),'(),...,(),()At At n n At n n At t Ee t Ae t A e t A e --Φ=Φ=Φ=Φ=,
(1)110110()()'()()()()0
n n n n At n At
t c t c t c t A c A A c E e c A e λ----Φ+Φ+⋅⋅⋅+Φ+Φ=++⋅⋅⋅++==
(Hamilton ‐Cayley 定理).
同时(1)1000(1)(),...,()n At
At At
n t t t n d d e E e A e A dt dt
--===-===满足初值条件(4.2).
所以At e 是n 阶矩阵线性微分方程
()(1)'1100
n n n c c c --Φ+Φ+⋅⋅⋅+K +Φ=,
(1)1(0),'(0),...,(0)n n E A A --Φ=Φ=Φ=
的唯一解.证毕.
在这里本文设定矩阵A 存在n 个互不相等的特征值12,,...,n λλλ.
所以微分方程()()0c D t Φ=的通解是
1212(),(1,2,...,)n t t t n k t C e C e C e C k n λλλΦ=++⋅⋅⋅+=
为n 阶常数矩阵。
由初始条件(1)1(0),'(0),...,(0)n n E A A --Φ=Φ=Φ=可得一个关于未知量
12,,...,n C C C 的n 阶线性方程组:
1211222222112211111122,,,,.
n n n n n n n n n n n E C C C A C C C A C C C A C C C λλλλλλλλλ----=++⋅⋅⋅+=++⋅⋅⋅+=++⋅⋅⋅+⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅=++⋅⋅⋅+
设系数矩阵为c V ,那么这个矩阵是范德蒙矩阵,那么
0det ()c j i i j n
V λλ<<≤=
-∏
,
因为此矩阵的特征值都不一样,因此这个系数矩阵行列式不等于0,所以这个方程组存在解.
1212n t t t At n e C e C e C e λλλ=++⋅⋅⋅+,
11
n
j i ij j C v A -==∑,ij v 是1c V -的元素。
通常矩阵A 有重复的特征值,假设A 有k 个互不相同的特征值12,,...,k λλλ, 每个特征值的重复次数是1212,,...,(...)k k s s s n s s s =+++
因此微分方程()()0c D t Φ=的通解是:
111111112112()()k k k s t s t s k k ks C tC t C e C tC t C e λλ--++⋅⋅⋅++⋅⋅⋅+++⋅⋅⋅+.
同样,由初始条件(1)1(0),'(0),...,(0)n n G E G A G A --===可得一个关于未知量
12,,...,n C C C 的n 阶线性方程组,其系数矩阵c V 是
1
122
111
212
1
11
111
00100
10102020
(1)!(1)!(1)(1)()!
()!k k k k
n s n s n n n n k k k n n n n n s n s λλλλλλλλλλλλ------⋅⋅⋅⋅⋅⋅⋅⋅⋅⎡⎤⎢⎥⋅⋅⋅⋅⋅⋅⋅⋅⋅⎢⎥⎢⎥⋅⋅⋅
⋅⋅⋅
⋅⋅⋅⎢⎥⎢⎥
⎢⎥---⋅⋅⋅
⋅⋅⋅-⋅⋅⋅⎢⎥
--⎣⎦
通过解此方程组可求得,1,2,...,i iS C i k =,即可求出At e .
例1计算矩阵指数函数At e ,其中
211632413A ---⎡⎤
⎢⎥=⎢⎥
⎢⎥⎣⎦
解:
特征方程为: 2()det()(1)(2)c E A λλλλ=-=-- 所以矩阵A 的特征值为1,1,2.所以
101112124c V ⎡⎤
⎢⎥=⎢⎥
⎢⎥⎣⎦ 10
21231121c V --⎡⎤⎢⎥=--⎢⎥
⎢⎥-⎣⎦
因此,
2123()At t t e C tC e C e =++
3
11
j i ij j C V A ===∑,ij V 是1c V -的元素。
同时
262314561027A ---⎡⎤
⎢⎥=⎢⎥
⎢⎥⎣⎦
,
最后算出
222222222422222222t t t t t t At t t t
t t
t t t t t t
t t e te e te e e e e te e e te e e e te e te e e ⎡⎤
----⎢
⎥
=-+++-+⎢⎥⎢⎥-++-+⎣
⎦
4.1.2 微分方程系数求解法
这一节阐述的是计算矩阵指数函数At e 的第二种方法,和上节的方法部分相似,使用了微分方程,不过此方法开始求得At e 的一个表达式,接着经过求解一些常系数的微分方程来计算At e 表达式的系数,最后算出At e . 定理4.1.3 设n 阶方阵A 的特征多项式是
1110()det()n n n c E A c c c λλλλλ--=-=++⋅⋅⋅++,
则
112()()()At n n e x t E x t A x t A -=++⋅⋅⋅+,
其中(),1k x t k n ≤≤,是n 阶常系数线性微分方程
()(1)110'0n n n x c x c x c x --++⋅⋅⋅++=
的解,各自满足且初值条件:
1212(1)(1)(1)
12(0)0(0)1(0)0'(0)0'(0)0'(0)1(0)1(0)0(0)0n n n n n n x x x x x x x x x ---===⎫⎫⎫
⎪⎪⎪===⎪⎪
⎪⋅⋅⋅⎬⎬⎬⎪⎪⎪
⎪⎪⎪===⎭⎭⎭。
证明: 设n 阶方阵A 的特征多项式是
1110()det()n n n c E A c c c λλλλλ--=-=++⋅⋅⋅++。
令
112()()()()n n t x t E x t A x t A -Φ=++⋅⋅⋅+,
其中(),1k x t k n ≤≤,是n 阶常系数线性微分方程
()(1)'1100
n n n x c x c x c x --++⋅⋅⋅++=
的解,且满足定理的初值条件.则
()(1)'110()(1)1111101()(1)2121202()(1)11101()()()()(')(')(')0000
n n n n n n n n n n n n n n n n n n t c t c t c t x c x c x c x E x c x c x c x A x c x c x c x A E A A ----------Φ+Φ+⋅⋅⋅+Φ+Φ=++⋅⋅⋅+++++⋅⋅⋅+++++⋅⋅⋅++=++⋅⋅⋅+=
所以
()(1)'110()()()()0n n n t c t c t c t --Φ+Φ+⋅⋅⋅+Φ+Φ=
并且
112112(1)(1)(1)(1)11
12(0)(0)(0)(0)'(0)'(0)'(0)'(0)(0)(0)(0)(0)n n n n n n n n n n n x E x A x A E x E x A x A A
x E x A x A A --------Φ=++⋅⋅⋅+=Φ=++⋅⋅⋅+=Φ=++⋅⋅⋅+
=
所以
112()()()()n n t x t E x t A x t A -Φ=++⋅⋅⋅+
是
()(1)110()0n n n c t c c --Φ+Φ+⋅⋅⋅+Φ+Φ=
(1)1(0),'(0),...,(0)n n E A A --Φ=Φ=Φ=
的解。
由定理 4.1.2 可知
112()()()()At n n t e x t E x t A x t A -Φ==++⋅⋅⋅+
证毕.
例1有矩阵指数函数At e ,对其求解,在这里
211632413A ---⎡⎤
⎢⎥=⎢⎥
⎢⎥⎣⎦
解:
特征方程为:
2()det()(1)(2)c E A λλλλ=-=--,所以矩阵A 的特征值为1,1,2. 所以(3)210'''0x c x c x c x +++=的通解为:
2123()t t t x t te e e ααα=++
当(0)1,'(0)0,''(0)0x x x ===时,21()2t t x t te e =-+。
当(0)0,'(0)1,''(0)0x x x ===时,22()322t t t x t te e e =+- 当(0)0,'(0)0,''(0)1x x x ===时,23()t t t x t te e e =--+。
同时
211632413A ---⎡⎤
⎢⎥=⎢⎥
⎢⎥⎣⎦ 262314561027A ---⎡⎤
⎢⎥=⎢⎥
⎢⎥⎣⎦
,
所以2222(2)(322)()At t t t t t t t t e te e E te e e A te e e A =-+++-+--+ 最后算出
222222222422222222t t t
t t t At t t t
t t
t t t t t t
t t e te e te e e e e te e e te e e e te e te e e ⎡⎤
----⎢
⎥
=-+++-+⎢⎥⎢⎥-++-+⎣
⎦
4.1.3 Jordon 块求解法
在这一节中阐述的计算比之前的计算方法计算较为麻烦,原理和过程同样不一样,这个计算方法用到了矩阵函数的Jordon 表示式的知识,此方法利用At e 的Jordon 表示式的计算间接的求得At e . 已知n n A C ⨯∈和变量λ的多项式
1110()m m m m p λαλαλαλα--=++⋅⋅⋅++,
则称
1110()m m m m p A A A A E αααα--=++⋅⋅⋅++
是A 的矩阵多项式.()p A 和A 同为n 阶方阵 若i J 为i d 阶Jordon 块矩阵
1
1
1i i
i i
i i d d J λλλ⨯⎡⎤
⎢⎥⎢⎥⎢
⎥=⎢⎥⎢⎥⎢⎥⎣
⎦ 则
111111
i i i i
d k d k
k i k i
k i k k i k i
k
i k i d d C C C J λλλλλλ--+--⨯⎡⎤
⎢⎥⎢⎥⎢
⎥=⎢⎥⎢⎥⎢⎥⎣
⎦
关于i d 阶矩阵()i J λ的矩阵多项式
1110()m m i m i m i i i p J J J J E αααα--=++⋅⋅⋅++
由(1)式可引入多项式()p λ的各阶导数,然后
()
i p J 能够表达为
(1)()()'()(1)!()
'()
()()i i i
d i i i i i i i i d d p p p d p p p J p λλλλλλ-⨯⎡
⎤
⎢⎥
-⎢⎥
⎢
⎥
=⎢
⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣
⎦ 若J 为Jordon 标准型,12(,,...,)r J diag J J J =,则
12()((),(),...,())r p J diag p J p J p J =.
这里假设A 是一个n 阶方阵,J 表示此方阵Jordon 标准形,那么会有一个满秩的矩阵P ,使得
1112(,,...,)r A PJP Pdiag J J J P --==,
因此
112()((),(),...,())r A P A Pdiag p J p J p J P -==
为矩阵多项式()P A 的Jordon 表示式。
定理4.1.4 设n n A C ⨯∈,J 是此矩阵Jordon 的标准形,1,n n
n P C A PJP ⨯-∈=,如果
在A 的影谱上函数()f x 有定义,那么
112()((),(),...,())r f A Pdiag f J f J f J P -=
其中
(1)()()'()(1)!()
'()
()'()()i i i
d i i i i i i i i i d d f f f d f f f J f p λλλλλλλ-⨯⎡
⎤
⎢⎥
-⎢⎥
⎢
⎥
=⎢
⎥⎢⎥
⎢⎥
⎢⎥⎢⎥⎣
⎦
依据定理4.1.4,计算矩阵指数函数就可利用矩阵函数的Jordon 标准型了. 计算步骤:
1. 求A 的Jordon 标准形,12(,,...,)r J diag J J J =;n
2. 由J 写出12()((J ),(J ),...,(J ))r f J diag f f f =,其中(A)Ar f e =;
3. 由J 计算变换矩阵P ,其中AP PJ =;
4. 写出(A)f 的Jordon 表示式
1(A)P (J)P f f -=
把矩阵指数函数(A)f 所对应的函数(x)f 代入1P (J)P f -即可. 例1
有矩阵指数函数At e ,对其求解,在这里
211632413A ---⎡⎤⎢⎥=⎢⎥
⎢⎥⎣⎦
解:
求矩阵的初等因子:。