矩阵论矩阵分析

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三章 矩阵分析
在此之前我们只研究了矩阵的代数运算,但在数学的许多分支和工程实际中,特别是涉及到多元分析时,还要用到矩阵的分析运算.本章首先讨论矩阵序列的极限和矩阵级数,然后介绍矩阵函数和它的计算,最后介绍矩阵的微积分,以及矩阵分析在解微分方程组和线性矩阵方程中的应用.
§3.1 矩阵序列 定义 3.1 设有C
m n
⨯中的矩阵序列
{}
()
k A ,其中()
()
()
k k ij m n
A
a ⨯=.若
()
lim (1,2,
,;1,2,
,)k ij ij k a a i m j n →+∞
===,则称矩阵序列{}()k A 收敛于()ij m n A a ⨯=,或称
A 为矩阵序列{}
()k A 的极限,记为
()lim k k A A →+∞
=或()()k A A k →→+∞
不收敛的矩阵序列称为发散. 由定义可见,C
m n
⨯中一个矩阵序列的收敛相当于mn 个数列同时收敛.因此,可以用
初等分析的方法来研究它.但同时研究mn 个数列的极限未免繁琐.与向量序列一样,可以
利用矩阵范数来研究矩阵序列的极限. 定理 3.1 设()
k A
,C
(012)m n
A k ,,,
⨯∈=.则()lim k k A A →+∞
=的充分必要条件是
()lim 0k k A A →+∞
-=,其中
是C
m n
⨯上的任一矩阵范数.
证 先取C
m n
⨯上矩阵的G-范数.由于
()()()()
1=1
k k k ij ij ij ij G
i,j
m n
k ij
ij
i j a a a a A A
a
a =-≤-=-≤-
所以()
lim k k A
A →+∞
=的充分必要条件是()lim 0k G
k A A
→+∞
-=.
又由范数的等价性知,对C m n
⨯上任一矩阵范数
,存在正常数α,β,使得
()()()k k k G G A A A A A A αβ-≤-≤-
故()
lim 0k G
k A
A
→+∞
-=的充分必要条件是()lim 0k k A A →+∞
-=.证毕
推论 设()
k A
,C
(012)m n
A k ,,,
⨯∈=,()lim k k A A →+∞
=.则
()lim k k A A →+∞
=
其中是C
m n
⨯上任一矩阵范数.
证 由()
()k k A
A A A -≤-即知结论成立.证毕
需要指出的是,上述推论的相反结果不成立.如矩阵序列
()
1(1)112k k A k ⎛
⎫- ⎪=+ ⎪ ⎪⎝⎭
不收敛.但
()
F
lim lim k k x A →+∞
== 收敛的矩阵序列的性质,有许多与收敛数列的性质相类似. 定理3.2 设()
lim k k A
A →+∞
=,()lim k k B B →+∞
=,其中()k A ,()k B ,A ,B 为适当阶的矩阵,
α,β∈C .则
(1)()
()lim ()k k k A
B A B αβαβ→+∞
+=+;
(2) ()
()
lim k k k A B
AB →+∞
=;
(3)当()
k A
与A 均可逆时,()1
1lim ()
k k A A --→+∞
=.
证 取矩阵范数
,有
()()()()()()()
()
()
()
()()()()()k k k k k k k k k k k k k A B A B A A B B
A B AB A B
A B A B AB
A B B A A B
αβαβαβ+-+≤-+--=-+-≤-+-
由定理3.1和推论知(1)和(2)成立. 因为()1
()k A
-,1A -存在,所以()lim det det 0k k A A →+∞
=≠,又有()lim adj adj k k A A →+∞
=.于
是()()1
1()adj adj lim ()lim det det k k k k k A A
A A A A
--→+∞→+∞=== 证毕 定理3.2(3)中条件()
k A
与A 都可逆是不可少的,因为即使所有的()
k A
可逆也不能保证A
一定可逆.例如()
11111k A k
⎛⎫+ ⎪
= ⎪ ⎪⎝⎭
对每一个()k A 都有逆矩阵()1()1k k k A k k --⎛⎫
=
⎪-+⎝⎭
,但 ()11lim 11k k A A →+∞
⎛⎫
== ⎪⎝⎭
而A 是不可逆的. 在矩阵序列中,最常见的是由一个方阵的幂构成的序列.关于这样的矩阵序列有以下的概念和收敛定理. 定义3.2 设n n
A C ⨯∈,若()
lim 0k k A
→+∞
=,则称A 为收敛矩阵.
定理3.3 设n n
A C
⨯∈,则A 为收敛矩阵的充分必要条件是ρ(A )<1.
证 必要性.已知A 为收敛矩阵,则由谱半径的性质,有
(())()k k k A A A ρρ=≤
其中
是C
n n
⨯上任一矩阵范数,即有lim (())0k
k A ρ→+∞
=,故ρ(A )<1.
充分性.由于ρ(A )<1,则存在正数ε,使得ρ(A )+ε<1.根据定理2.14,存在C n n
⨯上
的矩阵范数
m
,使得()1m A A ρε≤+<从而由k
k m m
A A ≤得lim 0k
m
k A →+∞
=.故
lim 0k k A →+∞
=. 证毕
推论 设n n
A C ⨯∈.若对C
n n
⨯上的某一矩阵范数
有1A <,则A 为收敛矩阵.
例3.1 判断下列矩阵是否为收敛矩阵:
(1)181216A -⎛⎫= ⎪-⎝⎭; (2)0.20.10.20.50.50.40.10.30.2A ⎛⎫ ⎪
= ⎪ ⎪
⎝⎭
. 解 (1)可求得A 的特征值为156λ=
,212λ=-,于是5()16
A ρ=<,故A 是收敛矩阵; (2)因为10.91A =<,所以A 是收敛矩阵.
§3.2 矩阵级数
定义3.3 由C
m n
⨯中的矩阵序列{}
()k A 构成的无穷和(0)
(1)()k A
A A ++++
称为矩
阵级数,记为
()
k k A
+∞
=∑.对任一正整数N ,称()
()0
N
N k k S
A ==∑为矩阵级数的部分和.如果由部
分和构成的矩阵序列{}()
N S
收敛,且有极限S ,即()
lim N N S
S →+∞
=,则称矩阵级数()0
k k A +∞
=∑收
敛,而且有和S ,记为()
k k S A
+∞
==
∑不收敛的矩阵级数称为发散的.
如果记()
()()
k k ij m n A
a ⨯=,
()ij m n S s ⨯=,显然()0
k k S A +∞
==∑相当于
()
(1,2,,;1,2,,)k ij
ij
k a
s i m j n +∞
====∑
即mn 个数项级数都收敛. 例3.2 已知
()
1π24(0,1,)10(1)(2)k k
k A k k k ⎛⎫
⎪ ⎪== ⎪ ⎪++⎝⎭
研究矩阵级数
()
k A
+∞
∑的敛散性.
解 因为
k 00()
()0
01π2410(1)(2)1π1242341012N N
k N
k k N k N k k N N S A k k N ====⎛⎫
⎪ ⎪== ⎪ ⎪
++⎝⎭⎛⎫⎛⎫-- ⎪ ⎪⎝⎭ ⎪= ⎪
- ⎪
+⎝
⎭∑∑∑∑
所以
()4π2lim 301N N S S →+∞⎛⎫ ⎪= ⎪ ⎪⎝⎭
故所给矩阵级数收敛,且其和为S . 定义3.4 设()
()
()C (0,1,)k k m n ij m n A
a k ⨯⨯=∈=.如果mn 个数项级数
()
0(1,2,,;1,2,
,)k ij
k a
i m j n +∞
===∑都绝对收敛,即()
k ij k a +∞
=∑都收敛,则称矩阵级数
()
k k A
+∞
=∑绝对收敛.
利用矩阵范数,可以将判定矩阵级数是否绝对收敛转化为判定一个正项级数是否收敛的
问题.
定理3.4 设()
()()
C
(0,1,)k k m n
ij m n
A
a k ⨯⨯=∈=.则矩阵级数()0
k k A +∞
=∑绝对收敛的充分
必要条件是正项级数
()0
k k A +∞
=∑
收敛,其中
是C
m n
⨯上任一矩阵范数.
证 先取矩阵的1m -范数.若
1
()
k k m A +∞
=∑
收敛,由于
1
()
()
()
11
(1,2,,;1,2,
,)m
n
k k k ij
ij i j m a
a A i m j n ==≤===∑∑
从而由正项级数的比较判别法知
()
k ij
k a
+∞
=∑都收敛,故
()
k k A
+∞
=∑绝对收敛.
反之,若
()
k k A
+∞
=∑绝对收敛,则
()0
k ij
k a
+∞
=∑都收敛,从而其部分和有界,即
()0
(1,2,
,;1,2,
,)N
k ij
ij
k a
M i m j n =≤==∑记,max ij i j
M M =,则有
1
()
()()00
11
110
()()N
N
m
n
m
n
N
k k k ij
ij
k k i j i j k m A
a
a
mnM =========≤∑
∑∑∑∑∑∑故
1
()
k k m A +∞
=∑
收敛.这表明
()
k k A
+∞=∑绝对收敛的充分必要条件是
1
()
k k m A +∞
=∑
收敛.由矩阵范数的等价性和正项级数的比
较判别法知,
1
()
k k m A
+∞
=∑
收敛的充分必要条件是
()0
k k A +∞
=∑
收敛,其中
是C
m n
⨯上任一矩阵
范数. 证毕
利用矩阵级数收敛和绝对收敛的定义,以及数学分析中的相应结果,可以得到以下一些结论.
定理3.5 设
()
k k A
A +∞
==∑,()0
k k B B +∞
==∑,其中()k A ,()k B ,A ,B 是适当阶的矩阵,则
(1)
()
()0
()k k k A
B A B +∞
=+=+∑;
(2)对任意λ∈C ,有
()
k k A
A λλ+∞
==∑;
(3)绝对收敛的矩阵级数必收敛,并且任意调换其项的顺序所得的矩阵级数仍收敛,且
其和不变; (4)若矩阵级数
()
k k A
+∞
=∑收敛(或绝对收敛),则矩阵级数
()
k k PA
Q +∞
=∑也收敛(或绝对收敛),
并且有
()
()0
()(3.1)k k k k PA
Q P A Q
+∞
+∞
===∑∑
(5)若
()
0k k A
+∞
=∑与
()
k k B
+∞
=∑均绝对收敛,则它们按项相乘所得的矩阵级数
(0)
(0)
(0)(1)(1)(0)(0)()(1)(1)()(0)()()(3.2)k k k A B
A B A B A B A B A B -++++++++

绝对收敛,且其和为AB . 证 只证(4)和(5).若
()
0k k A
+∞
=∑收敛,记()
()0
N
N k k S
A ==∑,则()lim N N S A →+∞
=.从而
()
()
00
lim
(lim
)N
N
k k N N k k PA
Q P A
Q PAQ →+∞
→+∞
====∑∑
可见
()
k k PA
Q +∞
=∑收敛,且式(3.1)成立.

()
k k A
+∞
=∑绝对收敛,则由定理3.4知
()
k k A +∞
=∑
收敛,但
()()
()
k k k PA Q P A
Q A
α≤≤其中α是与k 是无关的正数,从而
()0
k k PA Q +∞
=∑
收敛,

()
k k PA
Q +∞
=∑绝对收敛.

()
k k A
+∞
=∑和
()
k k B
+∞
=∑绝对收敛时,由定理3.4知
()
k k A
+∞
=∑

()0
k k B +∞
=∑
收敛,设其和分
别为1σ与2σ,从而它们按项相乘所得的正项级数
(0)(0)(0)(1)(1)(0)(0)
()
(1)
(1)
(
)
(0)
()()k k k A B A B A B A
B
A
B
A
B
-++++++++
也收敛,其和为12σσ.因为
(0)()(1)(1)()(0)(0)
()
(1)
(1)
()
(0)
k k k k k k A B A B A B A
B
A
B
A
B
--+++≤+++
所以矩阵级数(3.2)绝对收敛.记()()
1
N
N k k S
A
==∑,()()2
N
N k k S
B ==∑,
()(0)()(1)(1)()(0)3
()N
N k k k k S
A B A B A B -==++
+∑
则()()()(1)()(2)(1)
(2)()()(1)()()123N N N N N N N N N S S S A B A B
A B A B A B --=+++++
+
又记()
()
1
N
N k k A
σ
==∑,()()2
N
N k k B σ
==∑,
()(0)()(1)(1)()(0)3
()N
N k k k k A B A B A B σ
-==++
+∑
显然()()()()()()
123123
N N N N N N S S S σσσ-≤- 故由()()
12
lim N N N S S AB →+∞
=和()()()
123lim ()0N N N N σσσ→+∞
-=,得()3lim N N S AB →+∞
=证毕
下面讨论一类特殊的矩阵级数——矩阵幂级数. 定义3.5 设n n
A C
⨯∈,C(0,1,
)k a k ∈=.称矩阵级数0
k k k a A +∞
=∑为矩阵A 的幂级数.
利用定义来判定矩阵幂级数的敛散性,需要判别2
n 个数项级数的敛散性,当矩阵阶数n 较大时,这是很不方便的,且在许多情况下也无此必要.显然,矩阵幂级数是复变量z 的幂级数
0k
k k a z
+∞
=∑的推广.如果幂级数
k
k k a z
+∞
=∑的收敛半径为r ,则对收敛圆z r <内的所有z ,
k
k k a z
+∞
=∑都是绝对收敛的.因此,讨论
k
k k a A
+∞
=∑的收敛性问题自然联系到
k
k k a z
+∞
=∑的收敛半
径.
定理3.6 设幂级数
k
k k a z
+∞
=∑的收敛半径为r ,C
n n
A ⨯∈.则
(1)当ρ(A )<r 时,矩阵幂级数
0k
k k a A
+∞
=∑绝对收敛;
(2)当ρ(A )>r 时,矩阵幂级数
k
k k a A
+∞
=∑发散.
证 (1)因为ρ(A )<r ,所以存在正数ε,使得ρ(A )+ε<r .根据定理2.14,存在C
n n
⨯上
的矩阵范数
m
,使得m ()A A r ρε≤+<从m m
(())k
k k k k k a A a A a A ρε≤≤+而由于
幂级数
(())k
k
k a
A ρε+∞
=+∑收敛,故矩阵幂级数0
k k k a A +∞
=∑绝对收敛.
(2)当ρ(A )>r 时,设A 的,n 个特征值为12,,,n λλλ,则有某个l λ满足l r λ>.由Jordan
定理,存在n 阶可逆矩阵P ,使得
11112
(10)i n n P AP J λδδδλλ--⎛⎫


== ⎪ ⎪⎝

代表或而
k
k k a J
+∞
=∑的对角线元素为
0(1,2,
,)k k j
k a j n λ
+∞
==∑.由于0
k k l
k a λ+∞
=∑发散,从而0
k k k a J +∞
=∑发散.故由定理 3.5(4)知,
k
k
k a A
+∞
=∑也发散. 证毕
推论 设幂级数
k
k k a z
+∞
=∑的收敛半径为r ,C
n n
A ⨯∈.若存在C
n n

上的某一矩阵范数
使得A r <,则矩阵幂级数
k
k k a A
+∞
=∑绝对收敛.
例3.3 判断矩阵幂级数018216
k
k
k k
+∞
=-⎛⎫ ⎪-⎝⎭
∑的敛散性. 解 令181216A -⎛⎫= ⎪-⎝⎭.例3.1中已求得5()6A ρ=.由于幂级数0
k
k kz +∞
=∑的收敛半径
为r =1,故由ρ(A )<1知矩阵幂级数
k
k kA
+∞
=∑绝对收敛.
最后,考虑一个特殊的矩阵幂级数. 定理3.7 设C
n n
A ⨯∈.矩阵幂级数
k
k A
+∞
=∑(称为Neumann 级数)收敛的充分必要条件是
ρ(A )<1,并且在收敛时,其和为1()I A --.
证 当ρ(A )<1时,由于幂级数
k
k z
+∞
=∑的收敛半径r =1,故由定理 3.6知矩阵幂级数
k
k A
+∞
=∑收敛.反之,若
k
k A
+∞
=∑收敛,记0
k
k S A
+∞
==
∑,()
()0
N
N k k S
A ==∑则()lim N N S S →+∞
=.由于
()(1)()(1)lim lim ()=lim lim N N N N N N N N N A S S S S O --→+∞
→+∞
→+∞
→+∞
==--故由定理3.3知ρ(A )<1.

k
k A
+∞
=∑收敛时,ρ(A )<1,因此I -A 可逆,又因为()
1()N N S
I A I A +-=-所以
()111()()N N S I A A I A -+-=---故()1lim ()N N S S I A -→+∞
==- 证毕
例3.4 已知0.20.10.20.50.50.40.10.30.2A ⎛⎫ ⎪= ⎪ ⎪⎝⎭
,判断矩阵幂级数0k
k A +∞=∑的敛散性.若收敛,试求
其和.
解 因为10.91A =<,所以
k
k A
+∞
=∑收敛,且
1
02814141()44624214202535k k A I A +∞
-=⎛⎫ ⎪=-= ⎪ ⎪
⎝⎭
∑ §3.3 矩阵函数
矩阵函数是以矩阵为变量且取值为矩阵的一类函数.本节介绍矩阵函数的定义和计算方法,并讨论常用矩阵函数的性质. 一、矩阵函数的定义 定义3.5 设幂级数
0k k k a z +∞
=∑的收敛半径为r ,且当z r <时,幂级数收敛于函数f (z ),即0
()()k
k k f z a z
z r +∞
==
<∑
如果C
n n
A ⨯∈满足ρ(A )<r ,则称收敛的矩阵幂级数
k
k k a A
+∞
=∑的和为矩阵函数,记为f (A ),
即0
()(3.3)k
k k f A a A
+∞
==

根据这个定义,可以得到在形式上和数学分析中的一些函数类似的矩阵函数.例如,对
于如下函数的幂级数展开式
021
201
01
e ()!
(1)sin ()(21)!(1)cos ()(2)!
(1)(1)(1)ln(1)(1)
1k
z
k k k k k k
k k
k k k k z r k z z
r k z z
r k z z r z z
r k +∞
=+∞
+=+∞
=+∞
-=+∞
+===+∞-==+∞+-==+∞-==-+==+∑∑∑∑∑ 相应地有矩阵函数
01e !
k
k A A k +∞
==∑
(C n n A ⨯∈) 210(1)sin (21)!k
k k A A k +∞
+=-=+∑ (C n n A ⨯∈)
20(1)cos (2)!
k k
k A A k +∞
=-=∑ (C n n A ⨯∈)
1
0()k k I A A +∞
-=-=∑ (ρ(A )<1)
1
(1)ln()1k k k I A A k +∞
+=-+=+∑ (ρ(A )<1)
称e A
为矩阵指数函数,sin A 为矩阵正弦函数,cos A 为矩阵余弦函数.
如果把矩阵函数f (A )的变元A 换成At ,其中t 为参数,则相应得到
()()(3.4)k
k k f At a At +∞
==∑
在实际应用中,经常需要求含参数的矩阵函数.
二、矩阵函数值的计算
以上利用收敛的矩阵幂级数的和定义了矩阵函数f (A ),在具体应用中,要求将f (A )所代表的具体的矩阵求出来,即求出矩阵函数的值.这里介绍几种求矩阵函数值的方法.以下均假设式(3.3)或式(3.4)中的矩阵幂级数收敛. 方法一 利用Hamilton-Cayley 定理
利用Hamilton-Cayley 定理找出矩阵方幂之间的关系,然后化简矩阵幂级数求出矩阵函数的值.举例说明如下. 例3.5 已知0110A ⎛⎫=
⎪-⎝⎭
,求e At

解 可求得2
det()1I A λλ-=+.由Hamilton-Cayley 定理知2
A I O +=,从而
2A I =-,3A A =-,4A I =,5A A =,…即
2(1)k k A I =-,21(1)(1,2,)k k A A
k +=-=

24
3501e 1!2!4!
3!5!cos sin (cos )(sin )sin cos At
k k k t t t t A t I t A k t
t t I t A t
t +∞=⎛⎫⎛⎫==-+-
+-+- ⎪ ⎪⎝⎭⎝⎭
⎛⎫
=+=
⎪-⎝⎭

例3.6 已知4阶方阵A 的特征值为π,-π,0,0,求sin A ,cos A .
解 因为2
4
2
2
det()(π)(π)πI A λλλλλλ-=-+=-,所以422
πA A O -=.于是
422πA A =,523πA A =,642πA A =,743πA A =,…
即2222πk
k A A -=,21223
π(2,3,)k k A A k +-==

21
32230233213233
32
(1)1(1)sin π(21)!3!(21)!
11(1)π3!π(21)!sin ππ1ππk k k k k k k k k A A A A A
k k A A A k A A A A +∞
+∞+-==+∞+=--==-+++⎛⎫
-=-+ ⎪
+⎝⎭=+=-∑∑∑-
22222
0222
22
(1)1(1)cos π(2)!2!(2)!cos π12ππ
k k k k k k A A I A A
k k I A I A +∞
+∞-==--==-+=+=-∑∑-
方法二 利用相似对角化 设C n n
A ⨯∈是可对角化的,即存在C n n
n P ⨯∈,使得112diag(,,
,)n P AP A λλλ-==则

11
1
1
2
1
12()()()diag(,,
,)diag((),(),
,())k
k
k k k k k k k k k k k k k n k k k n f A a A a P P P a P P a a a P P f f f P λλλλλλ+∞+∞+∞
--===+∞+∞
+∞
-===-==Λ=Λ==∑∑∑∑∑∑
同理可得
112()diag((),(),
,())n f At P f t f t f t P λλλ-=
例3.7 已知460350361A ⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭
,求e At
,cos A .
解 可求得2
det()(2)(1)I A λλλ-=+-,即A 的特征值为12λ=-,231λλ==.对
应12λ=-的特征向量为T
1(1,1,1)p =-,对应231λλ==的两个线性无关的特征向量为
T 2(2,1,0)p =-,T 3(0,0,1)p =.于是
120110101P --⎛⎫ ⎪= ⎪ ⎪⎝⎭ 使得1211P AP --⎛⎫ ⎪= ⎪ ⎪⎝⎭

22212222e 2e e 2e 2e 0e e e e
2e e 0e e e 2e 2e e t
t t t t
At t
t t t t t t t t t
t P P --------⎛⎫⎛⎫-- ⎪ ⎪==--
⎪ ⎪ ⎪ ⎪--⎝
⎭⎝

1
cos(2)cos cos1cos12cos1cos 22cos12cos 2
0cos 2cos12cos 2cos10cos 2cos12cos 22cos1cos1A P
--⎛⎫
⎪= ⎪ ⎪⎝⎭
--⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭
方法三 利用Jordan 标准形 设C
n n
A ⨯∈,且C n n
n P ⨯∈,使得
1
2
1s J J P AP J J -⎛⎫
⎪ ⎪==
⎪ ⎪⎝

其中
×1
(1,2,,)1i i
i i
i i r r
J i s λλλ⎛⎫ ⎪
⎪== ⎪ ⎪⎝

由定理1.12得
11
111100
1
(1)01
(1C C ()C ()()1!
(1)!()1!
()()1!(1)!i i i i i i i r k r k k i k i
k i
k
k k k i i k i k k k k k i
k i r r k k k i k
k k k k t r r i f J t a J t a t t t r a t t
t f f f r λλλλλλλλλλλλλλλλ--+-+∞+∞
-==--+∞
==--⎛⎫ ⎪
⎪== ⎪ ⎪ ⎪⎝

⎛⎫' ⎪- ⎪
⎪= ⎪
⎪'
⎪ ⎪

⎭'-=∑∑∑)()()()
1!
()i
t
t
f t f f λλλλλ=⎛⎫


⎪ ⎪
⎪' ⎪ ⎪


从而
10
10
1
10011()()()()()k k
k k
k k k k k k
k k k k k k k k k s k s f At a A t a PJP t a J t P a J t P P P a J t f J t P P
f J t +∞+∞
-==+∞=+∞--=+∞
=-==⎛⎫
⎪ ⎪==

⎪ ⎪ ⎪⎝

⎛⎫ ⎪= ⎪ ⎪⎝⎭
∑∑∑∑∑ 例3.8 已知101120403A -⎛⎫
⎪= ⎪ ⎪-⎝⎭
,求e A
,sin At .
解 例1.9已求得
100111210P ⎛⎫ ⎪=-- ⎪ ⎪⎝⎭,11112P AP J -⎛⎫
⎪== ⎪ ⎪⎝⎭
于是12
222e e e 0e
e e 3e e e 2e+e e 4e 0
3e A P P -⎛⎫⎛⎫
⎪ ⎪
==- ⎪
⎪ ⎪ ⎪-⎝⎭⎝⎭
-- 1
sin cos sin sin sin 2sin 2cos 0cos sin 2cos sin 2sin 2cos sin sin 24cos 02cos sin t t t At P t P
t t t t t t t t t t t t t t t t t t t t -⎛⎫
⎪= ⎪ ⎪⎝⎭-⎛⎫

=+---+ ⎪
⎪-+⎝

根据Jordan 标准形理论可得 定理3.8 设C
n n
A ⨯∈,1λ,2λ,…,n λ是A 的n 个特征值,则矩阵函数f (A )的特征
值为1()f λ,2()f λ,…,()n f λ. 方法四 待定系数法 设C
n n
A ⨯∈,且A 的特征多项式为
1
2
12()det()()()()(3.5)s
r r r s I A ψλλλλλλλλ=-=---
其中1λ,2λ,…,s λ是A 的全部互异特征值,12s r r r n +++=.为计算矩阵函数
()k k
k k f At a A t +∞==∑,记0
()k k k k f t a t λλ+∞
==∑.将f (λt )改写为
()(,)()(,)(3.6)f t q t r t λλψλλ=+
其中q (λ,t )是含参数t 的λ的幂级数,r (λ,t )是含参数t 且次数不超过n -1的λ的多项
式,即
1110(,)()()()n n r t b t b t b t λλλ--=+++
由Hamilton-Cayley 定理知ψ(A )=O ,于是由式(3.6)得
1
110()(,)()(,)
()()()n n f At q A t A r A t b t A
b t A b t I
ψ--=+=+
++
可见,只要求出()(0,1,
,1)k b t k n =-即可得到f (At ).注意到
()()0
(0,1,
,1;1,2,
,)l i i l r i s ψλ==-=
将式(3.6)两边对λ求导,并利用上式,得
d d ()(,)d d i
i
l l
l
l f t r t λλλλ
λλλλ=== 即
d d ()(,)(0,1,
,1;1,2,
,)(3.7)d d i
i
l l l
i l l t t f r t l r i s μλλλ
μλμλ====-=
由式(3.7)即得到以0()b t ,1()b t ,…,1()n b t -为未知量的线性方程组. 综上分析,用待定系数法求矩阵函数f (At )或f (A )的步骤如下: 第一步:求矩阵A 的特征多项式(3.5); 第二步:设1
110()n n r b b b λλ
λ--=+
++.根据
()()()()
(0,1,
,1;1,2,
,)i l l l i i t
r t f l r i s λλλλ===-=

()()()()
(0,1,
,1;1,2,
,)l l i i i r f l r i s λλ==-=
列方程组求解0b ,1b ,…,1n b -;
第三步:计算1
110()(())()n n f At f A r A b A b A b I --==+
++或.
例3.9 已知101120403A -⎛⎫ ⎪= ⎪ ⎪-⎝⎭
,求e At
,cos A .
解 可求得2
det()(1)(2)I A λλλ-=--.设2210()r b b b λλλ=++
则由21021
2210(1)e (1)2e (2)42e t t t r b b b r b b t r b b b ⎧=++=⎪'=+=⎨⎪=++=⎩
解得222120e e e 2e 2e 3e e 2e t t t t t t t t b t b t b t ⎧=--⎪
=-++⎨⎪=-⎩ 于是2222210e 2e 0
e e e e 2e
e e e e 4e 0
2e e t t
At t t t
t t t t t t
t
t t b A b A b I t t t t t ⎛⎫-

=++=-++-- ⎪ ⎪ ⎪-+⎝

而由21021
210(1)cos1(1)2sin1(2)42cos 2r b b b r b b r b b b =++=⎧⎪'=+=-⎨⎪=++=⎩
解得210sin1cos1cos 2
3sin12cos12cos 22sin1cos 2
b b b =-+⎧⎪
=-+-⎨⎪=+⎩
从而2
2102sin1cos 20sin1cos 2sin1cos1cos 2cos 2sin1cos1cos 24sin102sin1cos1A b A b A b I +-⎛⎫ ⎪=++=-+--+ ⎪ ⎪-+⎝⎭
如果求得矩阵A 的最小多项式,且其次数低于A 的特征多项式的次数,则计算矩阵函数就
要容易一些.
例3.10 已知311202113A -⎛⎫ ⎪=- ⎪ ⎪--⎝⎭
,求e At
,sin A .
解 例1.9已求得A 的Jordan 标准形为
2212J ⎛⎫
⎪= ⎪ ⎪⎝⎭
于是A 的最小多项式为2
()(2)A m λλ=-.设10()r b b λλ=+
由21021(2)2e (2)e t t
r b b r b t ⎧=+=⎪⎨'==⎪⎩ 解得2120e (12)e
t t b t b t ⎧=⎪⎨=-⎪⎩ 于是2101e e 21221At t t
t t b A b I t t
t t t t +-⎛⎫ ⎪=+=-- ⎪ ⎪--+⎝⎭
又由101(2)2sin 2(2)cos 2r b b r b =+=⎧⎨'==⎩ 解得10
cos 2
sin 22cos 2b b =⎧⎨=-⎩
从而10sin 2cos 2
cos 2cos 2sin 2cos 2
sin 22cos 22cos 2cos 2cos 2sin 2cos 2A b A b I +-⎛⎫ ⎪
=+=-- ⎪ ⎪--+⎝⎭
三、常用矩阵函数的性质
常用的矩阵函数有e A
,sin A ,cos A ,它们有些性质与普通的指数函数和三角函数相同,但由于矩阵乘法不满足交换律,从而有些性质与一般指数函数和三角函数不相同. 定理3.9 对任意C
n n A ⨯∈,总有
(1)sin(-A )=-sin A ,cos(-A )=cos A ; (2)i e cos isin A
A A =+,i -i 1cos (e e )2A A A =
+,i -i 1
sin (e e )2i
A A A =-. 证 (1)由sin A 与cos A 的矩阵幂级数形式直接得到;
(2)i 221
000
i (1)(1)e i !(2)!(21)!cos isin k k k A
k k k k k k A A A k k k A A
+∞
+∞+∞+===--==++=+∑∑∑
又有-i e
cos()isin()cos isin A
A A A A =-+-=-
从而i -i 1cos (e e )2A A A =
+,i -i 1
sin (e e )2i
A A A =- 定理3.10 设A ,C n n
B ⨯∈,且AB =BA ,则
(1)e
e e e e A B
A B B A +==;
(2)sin(A +B )=sin A cos B +cos A sin B ;
(3)cos(A +B )=cos A cos B -sin A sin B .
证 (1)
0022011e e !!1
()(2)2!
1
()e !
A B
k k k k k A B k A B k k I A B A AB B A B k +∞+∞==+∞
+=⎛⎫⎛⎫= ⎪⎪
⎝⎭⎝⎭
=++++++=+=∑∑

(2)
i()-i()i i -i -i i -i i -i i -i i -i 11sin()(e e )(e e e e )2i 2i 1111
(e e )(e e )(e e )(e e )2i 222i sin cos cos sin A B A B A B A B A A B B A A B B A B A B A B
+++=
-=-=-+++-=+ 同理可证(3). 证毕
在定理3.10中,取A =B ,即得 推论 对任意C
n n
A ⨯∈,有
2
2
cos 2cos sin A A A =-,sin2A =2sin A cos A 值得注意的是,当AB ≠BA 时,e
e e A B
A B +=或e e e A B B A +=不成立.如取0010A ⎛⎫
= ⎪⎝⎭

0100B ⎛⎫= ⎪⎝⎭,则0110A B ⎛⎫+= ⎪⎝⎭,00100100AB BA ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭
且10e 11A
⎛⎫= ⎪⎝⎭,11e 01B
⎛⎫= ⎪⎝⎭
,-1-1-1-1e+e e e 1e 2e e e+e A B +⎛⎫= ⎪⎝⎭-- 可见1121e e e e 1211A B
B A ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭
e e e A B A B +≠,e e e A B B A +≠
定理3.11 设C
n n
A ⨯∈,则有
(1)tr dete e A A
=;
(2)1
(e )
e A A --=.
证 (1)设A 的特征值为1λ,2λ,…,n λ.则由定理3.8知,e A
的特征值为1e λ,2e λ
,…,
e n λ,从而1212tr dete =e e e e e n n A A λλλλλλ++==…+…
(2)由于tr dete =e 0A A
≠,所以e A 总是可逆的.又由定理3.10,得e e e e A A A A O I
--===故1
(e )
e A A --=. 证毕
需要指出的是,对任何n 阶方阵A ,e A
总是可逆的,但sin A 与cos A 却不一定可逆.如取π00π/2A ⎛⎫=
⎪⎝⎭,则00sin 01A ⎛⎫= ⎪⎝⎭,10cos 00A -⎛⎫
= ⎪⎝⎭
.可见sin A 与cos A 都不可逆.
§3.4 矩阵的微分和积分
在研究微分方程组时,为了简化对问题的表述及求解过程,需要考虑以函数为元素的矩阵的微分和积分.在研究优化等问题时,则要碰到数量函数对向量变量或矩阵变量的导数,以及向量值或矩阵值函数对向量变量或矩阵变量的导数.本节简单地介绍这些内容. 一、函数矩阵的微分和积分
定义 3.6 以变量t 的函数为元素的矩阵()(())ij m n A t a t ⨯=称为函数矩阵,其中
()(1,2,
,;1,2,,)ij a t i m j n ==都是变量t 的函数.若t ∈[a ,b ],则称A (t )是定义在[a ,
b )上的;又若每个()ij a t 在[a ,b ]上连续、可微、可积,则称A (t )在[a ,b ]上是连续、可微、
可积的.当A (t )可微时,规定其导数为()(())ij
m n A t a t ⨯''=或d d ()()d d ij m n
A t a t t t ⨯⎛⎫
= ⎪⎝⎭而当A (t )在[a ,b ]上可积时,规定A (t )在[a ,b ]上的积分为
()
()d ()d b
b ij
a
a
m n
A t t a t t ⨯=


例3.11 求函数矩阵23sin cos ()2
e 01t t t t t A t t t ⎛⎫

= ⎪ ⎪⎝⎭的导数. 解2cos sin 1d ()2ln 2e 2d 003t t t t A t t t t -⎛⎫
⎪= ⎪ ⎪⎝⎭
关于函数矩阵,有下面的求导法则.
定理3.12 设A (t )与B (t )是适当阶的可微矩阵,则
(1)
d d d
(()())()()d d d A t B t A t B t t t t
+=+ (2)当λ(t )为可微函数时,有
d d d (()())()()()()d d d t A t t A t t A t t t t λλλ⎛⎫
=+ ⎪⎝⎭
(3)
d d d (()())()()()()d d d A t B t A t B t A t B t t t t ⎛⎫
=+ ⎪⎝⎭
; (4)当u =f (t )关于t 可微时,有
d d
()()()d d A u f t A u t u
'= (5)当1
()A t -是可微矩阵时,有
111d d (())()()()d d A t A t A t A t t t ---⎛⎫
=- ⎪⎝⎭
证 只证(2)和(5).设()(())ij m n A t a t ⨯=,()(())ij n p B t b t ⨯=,则
1
11d d (()())(()())d d d d ()()()()d d d d ()()()()
d d n
ik kj m n k n n
ik kj ik kj k k m n
A t
B t a t b t t t a t b t a t b t t t A t B t A t B t t t ⨯===⨯=⎛⎫⎛⎫
=+ ⎪ ⎪⎝⎭⎝⎭⎛⎫
=+ ⎪⎝⎭
∑∑∑
由于1
()()A t A t I -=,两边对t 求导,得11d d ()()()()d d A t A t A t A t O t t --⎛⎫
+=
⎪⎝⎭
从而
111d d ()()()()d d A t A t A t A t t t ---⎛⎫
=- ⎪⎝⎭
证毕 定理3.13 设C n n
A ⨯∈,则有
(1)
d e e e d At
At At A A t ==; (2)d
sin cos (cos )d At A At At A t ==;
(3)d
cos sin (sin )d At A At At A t
=-=-.
证 这里只证(1).(2)和(3)的证明与(1)类似.
由0e !
k At
k
k t A k +∞
==∑,并利用绝对收敛级数可以逐项求导,得
1
011
11d d e d d !(1)!
e (1)!
k k At k k k k k k At
k t t A A t t k k t
A A A k -+∞+∞==-+∞
-===-==-∑∑∑
同样11111d e ==e d (1)!(1)!k k At k k At k k t t A A A A t k k --+∞+∞
-==⎛⎫= ⎪--⎝⎭
∑∑ 证毕
根据定义和积分的有关性质,可得
定理3.14 设A (t ),B (t )是区间[a ,b ]上适当阶的可积矩阵,A ,B 是适当阶的常数矩阵,λ∈C ,则 (1)(()())d ()d ()d b
b b
a a
a
A t
B t t A t t B t t +=+⎰⎰⎰;
(2)()d ()d b
b
a
a
A t t A t t λλ=⎰
⎰;
(3)
()
()d ()d b
b
a
a
A t
B t A t t B =


,()d ()d b b
a
a
AB t t A B t t =⎰⎰;
(4)当A (t )在[a ,b ]上连续时,对任意t ∈(a ,b ),有()d ()d ()
d t a
A A t t
ττ=⎰
(5)当A (t )在[a ,b]上连续可微时,有
()d ()()b
a
A t t A b A a '=-⎰
以上介绍了函数矩阵的微积分概念及一些运算法则.由于
d
()d A t t
仍是函数矩阵,如果它仍是可导矩阵,即可定义其二阶导数.不难给出函数矩阵的高阶导数
1
1d d d ()()d d d k k k k A t A t t t t --⎛⎫= ⎪⎝⎭
二、数量函数对矩阵变量的导数
定义 3.7 设f (X )是以矩阵()ij m n X x ⨯=为自变量的mn 元函数,且
(1,2,,;1,2,,)ij
f
i m j n x ∂==∂都存在,规定f 对矩阵变量X 的导数
d d f X
为 1111d d ij m n
m mn f f x x n f f X x f f x x ⨯∂∂⎛⎫ ⎪∂∂ ⎪⎛⎫
∂ ⎪== ⎪ ⎪ ⎪∂⎝⎭∂∂ ⎪ ⎪∂∂ ⎪
⎝⎭
特别地,以T 12(,,
,)n x ξξξ=为自变量的函数f (x )的导数
T
12
d (,,,
)d n
f f f
f x ξξξ∂∂∂=∂∂∂称为数量函数对向量变量的导数,即为在数学分析中学过的函数f 的梯度向量,记为grad f .
例 3.12 设T 12(,,
,)n a a a a =是给定的向量,T 12(,,,)n x ξξξ=是向量变量,且
T T ()f x a x x a ==求
d d f x
. 解 因为1
()n
k k
k f x a ξ
==
∑而
(1,2,,)j j
f
a j n ξ∂==∂所以
T
T 1212
d (,,,
)(,,,)d n n
f f f f a a a a x ξξξ∂∂∂===∂∂∂
例3.13 设()ij m n A a ⨯=是给定的矩阵,()ij n m X x ⨯=是矩阵变量,且()tr()f x Ax =求
d d f X
. 解 因为1
(
)n
ik
kj m m k AX a
x ⨯==∑.所以11
()tr()m n
sk ks s k f X AX a x ====∑∑而
(1,2,,;1,2,
,)ij
f
i n j m x ∂==∂故T d ()d ji n m ij n m
f f a A X x ⨯⨯⎛⎫
∂===
⎪ ⎪∂⎝⎭ 例 3.14 设()ij n n A a ⨯=是给定的矩阵,T 12(,,
,)n x ξξξ=是向量变量,且
T ()f x x Ax =求
d d f x
. 解 因为T
11
1
1
()()n n
n n
s sk k
s sk k s k s k f x x Ax a
a ξξξξ======
=∑∑∑∑而
1111,11,1
1
1
()n
j j j j jk k j jj j j j n nj
k j
n n
sj s jk k
s k f
a a a a a a a a ξξξξξξξξξ--++===∂=++++++
+∂=+∑∑∑
所以
111111
1T T d d ()n n
s s k k s k n n
sn s nk k s k n f a a f x f a a A x Ax A A x
ξξξξξξ====∂⎛⎫⎛⎫
+ ⎪ ⎪∂
⎪ ⎪ ⎪== ⎪
⎪ ⎪∂ ⎪ ⎪+ ⎪
⎪∂⎝⎭⎝⎭=+=+∑∑∑∑ 特别地,当A 是对称矩阵时,有
d 2d f
Ax x
=
例3.15 设()ij n n X x ⨯=是矩阵变量,且det X ≠0.证明
1T d
det (det )()d X X X X
-= 证 设ij x 的代数余子式为ij X .把det X 按等i 行展开,得1
det n
ik
ik k X x
X ==
∑于是
det ij ij
X X x ∂
=∂故 T
1T 1T
d
det det ()(adj )d ((det ))(det )()ij n n ij n n
X X X X X x X X X X ⨯⨯--⎛⎫∂=== ⎪ ⎪∂⎝⎭== 三、矩阵值函数对矩阵变量的导数
定义3.8 设矩阵()(())ij s t F X f X ⨯=的元素()(1,2,
,;1,2,,)ij f X i s j t ==都是矩
阵变量()ij m n X x ⨯=的函数,则称F (X )为矩阵值函数,规定F (X )对矩阵变量X 的导数
d d F
X
为111d d 1
F F x x n F X F F x x m mn ∂∂⎛⎫
⎪∂∂ ⎪
⎪=
⎪∂∂ ⎪
⎪∂∂ ⎪⎝⎭,其中1111t ij s st f f x
x ij ij F x f f x x ij ij ∂∂⎛⎫
⎪∂∂ ⎪∂ ⎪
=
⎪∂ ⎪
∂∂
⎪∂∂ ⎪⎝⎭
即其结果为(ms )×(nt )矩阵. 作为特殊情形,这一定义包括了向量值函数对于向量变量的导数,向量值函数对于矩阵变量的导数,矩阵值函数对于向量变量的导数等. 例3.16 设T
12(,,
,)n x ξξξ=是向量变量,求T T d d d d x x
x x
=.
解 由定义,得T 1T
T 2
T 100010d d 001n n
x x x I x x ξξξ⎛⎫∂ ⎪
∂ ⎪⎛⎫ ⎪∂

⎪ ⎪
===∂ ⎪ ⎪

⎪ ⎪⎝⎭
⎪∂ ⎪∂⎝⎭
同理可得
T 12
d ,,,
d n n x x x
x I x ξξξ⎛⎫
∂∂∂== ⎪∂∂∂⎝⎭
例3.17 设T
1234(,,,)a a a a a =是给定向量,24()ij X x ⨯=是矩阵变量,求T
d()d Xa X

d()
d Xa X
. 解 因为
41121k k k n k k k x a Xa x a ==⎛⎫
⎪ ⎪= ⎪ ⎪⎝⎭
∑∑,44T 1211
()(,)k k k k k k Xa x a x a ===∑∑ 所以
T T T
T T 13
1411
12
T T T T 2122232431
2431
24()()()()d()d ()()()()000000
00Xa Xa Xa Xa x x x x Xa X
Xa Xa Xa Xa x
x x x a a a a a a a a ⎛⎫
∂∂∂∂
⎪∂∂∂∂ ⎪
=

∂∂∂∂ ⎪ ⎪∂∂∂∂⎝
⎭⎛⎫
= ⎪
⎝⎭

131411
12212223
2412341
2
3
4()()()()d()()()()()d 00000000Xa Xa Xa Xa x x x x Xa Xa Xa Xa Xa X
x
x x x a a a a a a a a ∂∂∂∂⎛⎫

∂∂∂∂ ⎪=
⎪∂∂∂∂ ⎪∂∂∂∂⎝

⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭
§3.5 矩阵分析应用举例
本节介绍矩阵函数及矩阵微积分的一些应用. 一、求解一阶线性常系数微分方程组
在数学或工程技术中,经常要研究一阶常系数微分方程组
1111122112211222221122d ()
()()()()d d ()
()()()()d d ()
()()()()d n n n n n n n nn n n x t a x t a x t a x t f t t x t a x t a x t a x t f t t x t a x t a x t a x t f t t ⎧=++++⎪⎪
⎪=++++⎨
⎪⎪=++++⎪⎩
满足初始条件0()(1,2,,)i i
x t c i n ==
的解.如果记T 12(),(,,
,)ij n n n A a c c c c ⨯==
T 12()((),(),
,())n x t x t x t x t =,T 12()((),(),
,())n f t f t f t f t =
则上述微分方程组可写为0d ()
()()(3.8)d ()x t Ax t f t t
x t c
⎧=+⎪
⎨⎪=⎩
因为d d ()
(e ())e ()()e d d d ()e ()e ()
d At At At At At x t x t A x t t t x t Ax t f t t -----=-+⎛⎫
=-= ⎪⎝⎭
将上式两边在[0t ,t ]上积分,得00d (e ())d e ()d d t
t A A t t x f ττ
τττττ--=⎰⎰ 即00
0e ()e ()e ()d t
At A A t x t x t f ττττ----=⎰
于是微分方程组的解为
00
()
()e
e
e ()d t
A t t At
A t x t c f τττ--+⎰
=
例3.18 求解微分方程组初值问题
113212
313123d ()
()
()1d d ()()2()1d d ()
4()3()2d (0)1,(0)0,(0)1
x t x t x t t x t x t x t t
x t x t x t t x x x ⎧=-++⎪⎪
⎪=+-⎪⎨⎪=-++⎪
⎪⎪===⎩ 解 记
123()10111120,0,()(),()140312()x t A c x t x t f t x t -⎛⎫⎛⎫⎛⎫⎛⎫
⎪ ⎪ ⎪ ⎪
====- ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎝⎭
则微分方程组可以写成式(3.8)的矩阵形式.例3.9已求得
222e 2e 0e e e e 2e e e e e 4e 0
2e e t t t
At t t t
t t t t t t t t t t t t t ⎛⎫
-

=-++-- ⎪ ⎪-+⎝

依次计算下列各量
e e e e e 2e t t At t t t t c t t ⎛⎫- ⎪= ⎪ ⎪-⎝⎭,00e 1e e ()d e 1e 2e 22e t t t A t
t f d τττττττ-------⎛⎫⎛⎫
- ⎪ ⎪=-=-+ ⎪
⎪ ⎪ ⎪-⎝⎭⎝⎭⎰⎰, 0e 1e e ()d e 12e 2t t
At A t t f τ
ττ-⎛⎫
- ⎪
=-+ ⎪ ⎪-⎝⎭

故微分方程组的解为
123e e e 1(2)e 1()()()e e 1(1)e 1()e 2e 2e 2(32)e 2t t t t
t t t t t t t t t x t x t x t t t x t t ⎛⎫⎛⎫⎛⎫
----⎛⎫
⎪ ⎪ ⎪ ⎪==+-+=-+ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪----⎝⎭⎝⎭⎝⎭⎝⎭
二、求解矩阵方程
在控制论与系统理论中,要遇到形如AX +XB =F 的矩阵方程求解问题,这个矩阵方程也称为Lyapunov 方程.关于这个矩阵方程的解有如下结果. 定理3.15 给定矩阵方程 AX +XB =F (3.9) 其中C
m m
A ⨯∈,C
n n
B ⨯∈,C
m n
F ⨯∈.如果A 和B 的所有特征值具有负实部(这种矩阵称
为稳定矩阵),则该矩阵方程有惟一解
e e d At Bt X F t +∞
=-⎰
证 记()e e At Bt
Y t F =.则有Y (0)=F ,且
d ()
e e e e ()()(3.10)d At Bt At Bt Y t A F F B AY t Y t B t
=+=+
设12,,
,m λλλ是A 的m 个特征值,12,,
,n μμμ是B 的n 个特征值.根据利用Jordan
标准形求矩阵函数的方法(见§3.3)知,e At
的元素是形如e (0)j t
r t r λ≥的项的线性组合.因
为A 的所有特征值j λ的实部是负的,所以lim e
At
t O →+∞
=.同理lim e Bt t O →+∞
=.于是
lim ()lim e e At Bt t t Y t F O →+∞
→+∞==
又由于e e At
Bt
F 的元素是形如()e (0)i j t
r t r λμ+≥的项的线性组合,且积分()0
e
d i j t
r t t λμ+∞
+⎰都存
在,故积分
e e d At Bt F t +∞

存在.
对式(3.10)两边从0到+∞积分,得
()()0
()(0)()d ()d Y Y A
Y t t Y t t B
+∞
+∞
+∞-=+⎰⎰

()()0
()d ()d A Y t t Y t t B F
+∞+∞-+-=⎰⎰
这说明0
e e d At Bt
X F t +∞
=-⎰是矩阵方程(3.9)的解.
惟一性的证明见第七章. 证毕 推论1 设C
m m
A ⨯∈,C
n n
B ⨯∈,C
m n
F ⨯∈,则矩阵微分方程
d ()
()()d (0)X t AX t X t B t
X F
⎧=+⎪⎨⎪=⎩的解为()e e At Bt
X t F =
推论2 设A ,C n n
F ⨯∈,且A 的所有特征值具有负实部,则矩阵方程H A X XA F
+=-的惟一解为H 0
e
e d (3.11)A t
At X F t
+∞
=

如果F 是Hermite 正定矩阵,则解矩阵X 也是Hermite 正定矩阵.
证 只需证明后一结论.当F 是Hermite 正定矩阵时,由式(3.11)可知X 是Hermite 矩阵.又对0C
n
x ≠∈,由于e
At
总是可逆的,所以e 0At
x ≠,于是
H
H H e e (e )(e )0A t At At At x F x x F x =>.
从而H
H 0
(e )(e )d 0At At x Xx x F x t +∞
=
>⎰
故X 是Hermite 正定矩阵. 证毕
三、最小二乘问题 设C
m n
A ⨯∈,C n b ∈.当线性方程组Ax =b 无解时,则对任意C n
x ∈都有Ax -b ≠0.此
时希望找出这样的向量0C n
x ∈,它使2Ax b -达到最小,即
022
C
lim (3.12)n
x Ax b Ax b ∈-=-
称这个问题为最小二乘问题,称0x 为矛盾方程组Ax =b 的最小二乘解.
以下结论给出了当A ,b 分别是实矩阵和实向量时,Ax =b 的最小二乘解所满足的代数
方程.
定理3.16 设R m n
A ⨯∈,R m b ∈,0R n x ∈.若0R n
x ∈是Ax =b 的最小二乘解,则0
x 是方程组T
T
(3.13)A Ax A b
=
的解.称式(3.13)为Ax =b 的法方程组.
证 由于
2
T 2T
T
T
T
T
T
()()()
f x Ax b Ax b Ax b x A Ax x A b b Ax b b
=-=--=--+
若0x 为Ax =b 的最小二乘解,则它应是f (x )的极小值点,从而
d 0
(3.14)d x f x
=
根据例3.12和例3.14,得
T T d 22d f
A Ax A b x
=- 由式(3.14)即知T T
00A Ax A b -=,故0x 是式(3.13)的解. 证毕
对于含约束条件的最小二乘问题,有如下的结果. 例3.19 设R
m n
A ⨯∈,R m b ∈,R
k n
B ⨯∈,R k
d ∈,且Bx =d 有解.试求约束极小。

相关文档
最新文档