教材第五章矩阵分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章 矩阵分析
本章将介绍矩阵微积分的一些内容.包括向量与矩阵序列的收敛性、矩阵的三种导数和矩阵微分与积分的概念,首先简要介绍向量与矩阵范数的有关知识.
§5.1 向量与矩阵的范数
从计算数学的角度看,在研究计算方法的收敛性和稳定性问题时,范数起到了十分重要的作用.
一、向量的范数
定义1 设V 是数域F 上n 维(数组)向量全体的集合,x 是定义在V 上的一个实值函数,如果该函数关系还满足如下条件
1)非负性 对V 中任何向量x ,恒有0x ≥,并且仅当0=x 时,才有
x =0;
2)齐次性 对V 中任意向量x 及F 中任意常数k ,有;x k kx = 3)三角不等式 对任意V y x ∈,,有
y x y x +≤+,
则称此函数x (有时为强调函数关系而表示为⋅) 为V 上的一种向量范数.
例1 对n C 中向量()T n x x x x ,,,21 =,定义
2
22212
n
x x x x
+++=
=H x x ,
则2x 为n C 上的一种向量范数[i x 表示复数i x 的模],称为2-范数.
证 首先,2n x C 是上的实值函数,并且满足
1)非负性 当0x ≠时,0x >;当0x =时,0x =; 2)齐次性 对任意k C ∈及n x C ∈,有
22
21222||||||||n kx kx kx kx k x =
+++= ;
3)三角不等式 对任意复向量1212(,,,),(,,,)T T n n x x x x y y y y == ,有
2
222
21122||||||||n n x y x y x y x y +=++++++
2221122()()()n n x y x y x y ≤++++++
2
21
1
1
||2||||||n
n
n
i i i i i i i x x y y ====++∑∑∑ (由Cauchy-ВуНЯКОВСКИЙ不等式)
22
2222
2
22||||2||||||||||||(||||||||),
x x y y x y ≤++=+
因此 222||||||||
||||
x y x y +≤+. 所以2||||x 确为n C 上的一种向量范数. 例2 对n C [或n R ]上向量12(,,,)T n x x x x = 定义 112||||||||||n x x x x =+++ , 1m a x i i n
x
x ∞
≤≤=,
则1||||x 及x ∞都是n C [或n R ]上的向量范数,分别称为1-范数和∞-范数.
证 仅对后者进行证明. 1)非负性 当0x ≠时,max 0i i
x
x ∞
=>,又显然有00∞=;
2)齐次性 对任意向量()T n x x x x ,,,21 =及复数k , m a x m a x ;
i i i
i
kx
kx k
x k x
∞
∞
===
3)三角不等式 对任意向量1212(,,,),(,,,),T T n n x x x x y y y y ==
()i i i
i i i
y x y x y
x +≤+=+∞
max max
i i
i i
y x m a x m a x
+≤ =∞∞
+y x .
综上可知∞x 确为向量范数.
上两例中的∞x x x ,,21是常用的三种向量范数.
一般地,对于任何不小于1的正数p ,向量()T n x x x x ,,,21 =的函数
p
n
i p i p
x x
1
1⎪⎭
⎫ ⎝⎛=∑= 也构成向量范数,称为向量的p -范数.
注:(1)当1p =时,1p
x
x =;
(2)当2p =时,2x 为2-范数,它是酉空间范数;当i x 为实数时,
122
21
()n
i i x x ==∑为欧氏空间范数.
由p -范数的存在,可知向量的范数有无穷多种,而且向量的范数并不仅限于p -范数.在验证向量的范数定义中,三角不等式的过程中常涉及到两个著名的不等式,即
1、Hölder 不等式 设正实数,p q 满足
11
1,p q
+=则对任意的,,n x y C ∈有 111
1
1
()()n
n
n
p q p
q
i i
i i i i i x y
x y ===≤∑∑∑.
2、Minkowski 不等式 对任意实数1p ≥,及,,n x y C ∈有
1111
1
1
()()()n
n
n
p
p p
p
p
p
i i i i i i i x y x y ===+≤+∑∑∑.
例3 设()T
x 1,,1,1 =为n 维向量,则
1,
,
21===∞
x
n x n x .
各种范数值差距很大.但是,各种范数之间却存在着内在的制约关系,
称为范数的等价性.
定理1 设βα⋅⋅,为有限维线性空间V 的任意两种向量范数(它们不限于p -范数),则存在正的常数12,C C ,使对一切向量x ,恒有
βα
β
x C x
x
C 21≤≤. (1)
证 如果范数x α和x β都与一固定范数,譬如2-范数2x 满足式(1)的
关系,则这两种范数之间也存在式(1)的关系,这是因为若存在正常数12
,C C ''和12
,C C '''',使 12
2212
2,C x x C x C x
x C x α
β
β
''≤≤''''≤≤
成立,则显然有
112
2||||||||||||C C x x C C x βαβ''''''≤≤. 令11122
2,C C C C C C ''''''==,则得式(1),因此只要对2β=证明式(1)成立即可.设V 是n 维的,它的一个基是12,,,n x x x ,于是V 中的任意向量x 可表示为1122n n x x x x ξξξ=+++ .
从而,1122n n x x x x ααξξξ=+++ 可视为n 个变量12,,,n ξξξ 的函数,记为12(,,,)n x αϕξξξ= ,易证12(,,,)n ϕξξξ 是连续函数,事实上,若令
112
2n n x x x x V ξξξ''''=+++∈ ,则 12
(,,,)n x αϕξξξ''''= . 12
12(,,,)(,,,)n n x x x x ααα
ϕξξξϕξξξ'''''-=-≤-
11111()()n
n n n
n n x x x x α
ααξξξξξξξξ''''=-++-≤-++- . 由于i
x α
(1,2,,)i n = 是常数,因此i ξ'与i ξ充分接近时,12
(,,,)n ϕξξξ''' 就与12(,,,)n ϕξξξ 充分接近,所以12(,,,)n ϕξξξ 是连续函数.
所以在有界闭集{
}
222
1212(,,,)1n S ξξξξξξ=+++= 上,函数
12(,,,)n ϕξξξ 可达到最大值2C 及最小值1C .因为在S 中,i ξ不能全为零,
所以10C >.记向量
1
2
12222n
n y x x x x
x
x
ξξξ=
+
++
,
则其坐标分量满足
2
2
2
1
2
2
2
2
1n
x
x
x
ξξξ+
++
= ,
因此,y S ∈.从而有11122220,,n C y
C x x x α
ξξξϕ⎛⎫<≤=≤ ⎪ ⎪⎝⎭
.但2
,x
y x =
故122x C C x α≤≤.即 1222C x x C x α≤≤.
二、矩阵的范数
定义2 设V 是数域F 上所有n m ⨯矩阵的集合,A 是定义在V 上的一个实值函数,如果该函数关系还满足如下条件:对V 中任意矩阵A 、B 及F 中任意常数k 总有
1)非负性 0≥A ,并且仅当0=A 时,才有0=A ;
2)齐次性 A k kA =;
3)三角不等式 B A B A +≤+, 则称()⋅A
是V 上的一种矩阵范数.
例4 对n m C ⨯(或n m R ⨯)上的矩阵()ij A a =定义
∑∑===m i n
j ij M a A
11
1
,
∑∑===
m
i n
j ij
M a A
112
2
,
11max ij M i m j n
A
a ∞
≤≤≤≤=,
则∞
⋅
⋅
⋅
M M M ,,2
1
都是n m C ⨯(或n m R ⨯)上的矩阵范数.
实用中涉及较多的是方阵的范数,即m n =的情形.
定义 3 设F 是数域,⋅是n n F ⨯上的方阵范数.如果对任意的
,n n A B F ⨯∈,总有
AB A B ≤⋅,
则说方阵范数⋅具有乘法相容性.
注意 在某些教科书上,往往把乘法相容性直接纳入方阵范数的定义中作为第4个条件,在读书时,只要注意到各自定义的内涵就可以了.
例5 对n n C ⨯上的矩阵][ij a A =,定义ij n
j i a n A ≤≤⋅=,1max ,则⋅是一种矩
阵范数,并且具备乘法相容性.
证 非负性与齐次性显然成立,另两条证明如下. 三角不等式
ij ij b a n B A +⋅=+max
()
m a x m a x i j i j n a b ≤+
B A +=; 乘法相容性
⎪⎭
⎫
⎝⎛⋅≤⋅=∑∑==n k kj ik n
k kj ik b a n b a n AB 11max max
()()
B A b n a n ij ij =⋅≤max max , 证得A 为矩阵范数且具有乘法相容性.
并不是所有的方阵范数都具有乘法相容性.例如对于22⨯R 上的方阵范数.M ∞
就不具备相容性条件.此时ij j i M a A
2
,1max ≤≤=∞
.
取1110,0111A B ⎛⎫⎛⎫
== ⎪ ⎪⎝⎭⎝⎭
,则有1==∞
∞
M M B
A
,而
2M M M AB
A
B
∞
∞
∞
=>.
定义4 如果n 阶矩阵A 的范数A 与n 维向量x 的范数x ,使对任意n 阶矩阵A 及任意n 维向量x 均有x A
Ax ≤,则称矩阵范数A 与向量范数
x 是相容的.
定理2 设x 是某种向量范数,对n 阶矩阵A 定义
Ax x
Ax A x x 1
max max
=≠== (2)
则A 为方阵范数,称为由向量范数x 导出的矩阵范数,而且它具有乘法相容性并且与向量范数x 相容.
证 首先可证,由(2)式定义的函数关系||||A 满足与向量范数||||x 的相容
性.对于任意n 阶矩阵A 及n 维向量x ,当0x ≠时,有
0||||||||
max ||||||||
||||y Ax Ay A x y ≠≤=, 即 ||||||||||||;Ax A x ≤ (3) 而当0x =时,||||0||||||||Ax A x ==,于是总有(3)式成立.
容易验证||||A 满足范数定义中的非负性、齐次性及三角不等式三个条件,因而A 是一种方阵范数.并且,对任意n 阶矩阵,A B ,利用(2)式和(3)式可得
00max
max max x x x A Bx ABx Bx AB A A B x x x
≠≠≠=≤==.
即说矩阵范数A 具备乘法相容性.
一般地,把由向量p -范数p x 导出的矩阵范数记作p A .下面看常用的三种矩阵范数
例6 证明对n 阶复矩阵[]i j A a =,有 1)111max n
ij j n
i A a ≤≤==∑,称为A 的列和范数.
2)11
max n
ij i n
j A a ∞≤≤==∑,称为A 的行和范数.
证 1)设11
1
max n n
ij ik j n
i i w a a ≤≤====∑∑.若A 按列分块为12(,,,)n A ααα=
则11
1max k j j n
w αα≤≤==.对任意n 维向量12(,,)T n x x x x = ,有
1122112211111
121
11()max .
n n n n
n j
j n
Ax x x x x x x x x x x w ααααααα≤≤+++≤+++≤+++≤
于是,对任意非零向量x 有
11
Ax w x ≤. 以下证明存在非零向量k e 使
1
1
k k
Ae w e =.事实上,设k e 是第k 个分量为1
而其余分量全为0的向量,则1k e =1,且
n
=11k ik i Ae a w ==∑,
即
1
1
k k
Ae w e =.
2)的证明与1)相仿,留给读者去完成. 例7 证明对n 阶复矩阵A ,有
21max i i n
A σ≤≤=,
这里()n i i ,,2,1 =σ是A 的奇异值,称此范数为A 的谱范数.
证 设H A A 的全部特征根为12,,n λλλ .不妨设11max i i n
λλ≤≤=.于是
111max i i n
σλσ≤≤==.因为H A A 为H -矩阵,故有酉矩阵U ,使得
12n (,),,H H U A AU diag λλλ=Λ= .
如设12(,,,)n U u u u = 则i u 是H A A 相应于特征根i λ的单位特征向量,即有
,H i i i A A u u λ= 2
1i
u =.
对任意满足2||||1x =的复向量12(,,,)T n x x x x = ,有
22
||||()()H H
Ax Ax Ax x ==H U U x Λ.
令H y U x =,则22
2222
||||||||||||1H y U x x ===,说明y 亦为单位向量.若设12(,,,)T n y y y y = ,则
2
221
||
||||1n
i
i y y ===∑,
于是2
22
11
||||||n H
i i i Ax y y y λλ==Λ=≤∑.即有12Ax σ≤.由x 的任意性,便得
21221
max x A Ax σ==≤ .特别取1x u =,则有21
1111112
H H H Au u A Au u u λλ===,
即
112Au σ=.这说明2Ax 在单位球面{}
21,n x x x C =∈上可取到
最大值1σ,从而证明了
21221
max x A Ax σ===.
各种矩阵范数之间也具有范数的等价性
定理3 设,a A A β是任意两种矩阵范数,则有正实数12,,C C 使对一切矩阵A 恒有
12a C A
A C A β
β≤≤.
§5.2 向量与矩阵序列的收敛性
在这一节里,我们将把数列极限的概念,扩展到向量序列与矩阵序列上去.
可数多个向量(矩阵)按顺序成一列,就成为一个向量(矩阵)序列.例如
()()(
12(,,,)k k k T k n x x x x = ,
1,2,3,k = 是一个n 维向量序列,记为{}k x ,诸k x 的相应分量则形成数列{}k i x .
定义5 设有向量序列()()()12{}:(,,,)k k k T
k k n x x x x x = .
如果对1,2,,i n = , 数列(){}k i x 均收敛且有()lim k i i k x x →∞
=,则说向量序列{}k x 收敛.如记
12(,,,)T n x x x x = ,则称x 为向量序列{}k x 的极限,记为lim k k x x →∞
=,或简记
为k x x →.
如果向量序列{}k x 不收敛,则称为发散.类似于数列的收敛性质,读者不难证明向量序列的收敛具有如下性质.
设{},{}k k x y 是n C 中两个向量序列,,a b 是复常数,n ,m A C ⨯∈如果
l i m ,l i m k k k k x x y y →∞
→∞
==,则
1lim();
2lim .
k k k k k ax by ax by Ax Ax →∞
→∞
>+=+>=
定理4 对向量序列{}k x ,x x k =∞
→k lim 的充分必要条件是0lim =-∞
→x x k k ,
其中⋅是任意一种向量范数.
证 1)先对向量范数i n
i x x
≤≤∞
=1max 证明定理成立.
i k i k k k x x x x =⇔=∞
→∞
→)(lim lim ,n i ,...,2,1=;
,0lim )(=-⇔∞
→i k i k x x n i ,...,2,1=;
0max lim )(1=-⇔≤≤∞→i k i n
i k x x ;
0lim =-⇔∞
∞
→x
x k k .
2)由向量范数等价性,对任一种向量范数⋅,有正实数21,b b ,使
∞∞-≤-≤-x x b x x x x b k k k 21.令∞→k 取极限即知
lim 0lim 0k k k k x x x x
∞
→∞
→∞
-=⇔-=.
于是定理对任一种向量范数都成立.
根据上述定义,向量序列有极限的根本之处在于各分量形成的数列都有极限.
由于m n C ⨯中矩阵可以看作一个mn 维向量,其收敛性可以和mn C 中的向量一样考虑.因此,我们可以用矩阵各个元素序列的同时收敛来规定矩阵序列的收敛性.
定义6 设有矩阵序列{}n m k ij k k a A A ⨯=][:)
(,如果对任何,(1,i j i m ≤≤
1j ≤)n ≤均有
ij k ij k a a =∞
→)
(lim , 则说矩阵序列{}k A 收敛,如令n m ij a A ⨯=][,又称A 为{}k A 的极限.记为
,lim A A k k =∞
→或A A k →.
矩阵序列不收敛时称为发散.
讨论矩阵序列极限的性质,以下设所涉及的矩阵为n 阶矩阵. 1) 若A A k k =∞
→lim ,{}k a 为数列且a a k k =∞
→lim ,则()aA A a k k k =∞
→lim .特别,
当a 为常数时,()k k k k A a aA ∞
→∞
→=lim lim .
2) 若A A k k =∞
→lim ,B B k k =∞
→lim ,则()B A B A k k k ±=±∞
→lim .
3) 若A A k k =∞
→lim ,B B k k =∞
→lim ,则()AB B A k k k =∞
→lim .
4) 若A A k k =∞
→lim 且诸k A 及A 均可逆,则{}
1-k A 收敛,并且
11lim --∞
→=A A k k .
容易证明性质1)-3)成立,对性质4)注意到行列式k A 值定义的和式无非是k A 中元素()(,1,2,,)k ij a i j n = 的乘法与加法之组合,再由
lim k →∞
(),k ij ij a a =
即可知
lim k k A A →∞
=.
用()k ij A 表示k A 中(,)i j 元素的代数余子式,用ij A 表示A 中(,i j )元素的代数余子式,便有
()lim k ij ij k A A →∞
=.
进而 **lim k k A A →∞
=.这里*
k A 是k A 的伴随矩阵,*A 是A 的伴随矩阵.又
*
1k
k
k A A A -=, 所以*1
1lim k
k A A A A
--→∞
==. 定理 5 对于矩阵序列{}k A ,lim k k A A →∞
=的充分必要条件是对任何一种矩阵范数⋅,有lim 0k k A A →∞
-=.
定理5的证明与定理4类似,由于矩阵范数的等价性,只需证明对矩阵范数,max ij i j
A a =定理成立,其方法也与定理4的证明一致,这里从略.
以下主要介绍范数在特征值估计方面的应用.
定义7 设n n A C ⨯∈,1,,,,j n λλλ 为A 的n 个特征值,称
()max j j
A ρλ=
为A 的谱半径.
有了谱半径的概念,可以对矩阵范数作如下的初步估计. 定理6 设n n A C ⨯∈,则对n n C ⨯上的任一矩阵范数⋅,皆有
()A A ρ≤.
证 设λ是A 的特征值,x 为A 的属于特征值λ的特征向量,故0x ≠,所以0x ≠.另设v ⋅是n C 上与矩阵范数⋅相容的向量范数,由Ax x λ=,应有
v v Ax x λ=,
而v v Ax A x ≤,于是有
v v x A x λ≤,
同除0v x ≠,有A λ≤.故max j
A λ≤,于是
()A A ρ≤.
定理7 设n n A C ⨯∈,lim 0k k A →∞
=的充分必要条件是()1A ρ<.
证 对n n A C ⨯∈,由第三章定理15知,存在n 阶的逆矩阵P 使得
112(,,,)s P AP J diag J J J -== ,
其中
1
0110i i
i i
i i i n n J λλλλ⨯⎛⎫ ⎪
⎪
⎪= ⎪ ⎪
⎪⎝
⎭
, 则112(,,)k k k k k s P A P J diag J J J -== .因此
lim 0lim 0lim 0(1,2,,)k k k i k k k A J J i s →∞
→∞
→∞
=⇔=⇔== .
而
(1)11()()()()2(1)()
()1
()2()()i n k i k i k i k i i k i k i k
i k i k i k i f f f f n f f J f f f λλλλλλλλλ-⎛
⎫''' ⎪- ⎪' ⎪ ⎪
⎪= ⎪'' ⎪ ⎪' ⎪
⎪
⎝
⎭
!!
!,
其中()k k f λλ=,因为对任一多项式(),g λ当k →∞时,
()01k i i g λλ→⇔<.而1(1,2,,)()1i i s A λρ<=⇔< .
由定理6和定理7即得如下结果.
定理8 设n n A C ⨯∈,如果存在n n C ⨯上的一种相容矩阵范数.使1A <,则lim k →∞
0k A =.
定理9 设λ是n 阶矩阵A 的任一特征根,那么对任一种矩阵范数⋅,都有A λ≤.
证 设,A a =则0a ≥,对任意给定的0ε>,令A
B a ε
=
+.于是,若设A 的全部特征根为12,,,,n λλλ 则B 的全部特征根恰是
1
2
,
,,
n
a a a λλλεεε+++ .
又11a
B A a a εε
=
=<++.由定理8知0k B →,再由定理6知1,1,2,,,i
i n a λε
<=+ 即,1,2,,.i a i n λε<+= 由ε的任意性,令0ε→取极
限,便有,1,2,,.i a i n λ≤= 即知对任一特征根λ,有a λ≤.
§5.3 矩阵的导数
本节讨论三种导数:矩阵对变量的导数、函数对矩阵的导数、矩阵对矩阵的导数.
一、函数矩阵对变量的导数
如果矩阵中诸元素都是某实变量x 的函数,则称这种矩阵为函数矩阵.它的一般形式是
()⎪⎪
⎪⎪
⎪
⎭
⎫
⎝⎛=)()
()()()()()()()(2122221
11211x a x a x a x a x a x a x a x a x a x A mn m m n n , 其中()()1,2,,;
1,2,,ij a x i m j n == 都是实变量x 的函数.
定义8 设函数矩阵()[()]ij m n A x a x ⨯=,如果对一切正整数,i j ,1i m ≤≤
1j n ≤≤,均有
()0
lim ij ij x x a x b →=,
则说当0x x →时函数矩阵()A x 有极限,n m ij b B ⨯=][叫做()A x 的极限,记为
()0
lim x x A x B →=.
该定义的实质是如果()A x 的所有各元素()ij a x 在0x 处都有极限,则说
()A x 在0x 处有极限.
如果()A x 的所有各元素()ij a x 在0x 处连续,即0
0lim ()()ij ij x x a x a x →=,
(1,2,,;1,i m j
n == ,则称()A x 在0x x =处连续,且记
0lim ()()x x A x A x →=.如果()A x 在某区间[,]a b 上处处连续,则说()A x 在[,]a b 上
连续.
容易验证下列等式是成立的: 设()()0
lim ,lim x x x x A x A B x B →→==,则
(1)0
lim(()())x x A x B x A B →±=±;
(2)()0
lim ()x x kA x kA →=;
(3)()0
lim ()()x x A x B x AB →=.
定义9 对于函数矩阵()n m ij x a x A ⨯=)]([,如果所有元素ij a ()x (1,2,i =
,;1,2,,)m j n = 在某点x 处[或在某区间上]均可导,则称()x A 在x 处[或在
某区间上]可导.导数[或导函数]记为
()d
A x dx ,简记为()x A '.并规定 ()()()()()()()()()()()111212122212n n m m mn a x a x a x a x a x a x d A x A x dx
a x a x a x '''⎛⎫ ⎪''' ⎪'== ⎪ ⎪ ⎪
'''⎝⎭
, 其中()ij
a x '表示()x a ij 对x 的一阶导数. 矩阵对变量的导数运算具有如下一些性质
1°若函数矩阵()()x B x A ,都可导,则它们的和亦可导,并且
()()[]()()x B dx
d x A dx d x B x A dx d
+=+. 2°若()x A 可导,()f x 是x 的可导函数,则()x f ()x A 可导,且
()()[]()()()()x A dx d x f x A x f dx d x A x f dx d +⎥⎦
⎤
⎢⎣⎡=, 特别地,当()x f 为常数k 时,有
()[]()x A dx
d k x kA dx d
=. 3°若()x A 可导,则()x A T 可导,并且
()()T
T dx x dA x A dx d ⎪⎭
⎫ ⎝⎛=. 4°若()x A ,()x B 可导且二者可乘,则()x A ()x B 亦可导,且
()()[]()()()()x B dx d x A x B x A dx d x B x A dx d +⎥⎦
⎤
⎢⎣⎡=⋅. 推论 若()x A 可导,Q P ,为数字矩阵,则
()[]()x A dx
d P x PA dx d
=, ()[]()Q x A dx d Q x A dx d ⎥⎦
⎤
⎢⎣⎡=. 5° 若()x A 为可逆的可导函数矩阵,则()x A 1-亦可导,且
()[]
()()()x A dx
x dA x A x A dx d 1
11----=. 证 因为1()(),A x A x E -=所以
111()()[()()]()()0d dA x dA x A x A x A x A x dx dx dx
---=+=. 于是
111()()()()dA x dA x A x A x dx dx
---=-. 函数矩阵的导数本身也是一个函数矩阵,它可以再进行求导运算,下面我们给出函数矩阵对变量的高阶导数
22
()()
()d A x d dA x dx dx dx =, 3232
()()
()d A x d d A x dx dx dx =,
1()()
()k k k
d A x d d A x dx dx dx
-=. 例1 设)(x A 为n 阶可导函数矩阵,求()x A 2的一、二阶导数. 解
()()()[]()()()()x A x A x A x A x A x A dx
d
x A dx d '+'==
2 [注意一般 2
()2()()d A x A x A x dx
'≠]
()()()()()[]x A x A x A x A dx d
x A dx
d '+'=22
2
()()()[]()()x A x A x A x A x A ''+'+''=2
2.
例2 设()()()⎪⎪⎪⎪
⎪⎭
⎫ ⎝⎛=t x t x t x x n
21,其中()t x i 均为t 的可导函数,n n ij a A ⨯=][为n 阶实对称矩阵,求二次型Ax x T 对t 的导数.
解 []()
x A x x A x Ax x Ax x dt
d T T T T
'+'+'=.又A 为数字矩阵,故0='A ,又
x A x T '为t 的函数.而有()()()Ax x x A x x A x x A x T T T
T T T '='='='.所以
()
x A x Ax x dx
d T T
'=2. 二、函数对矩阵的导数
定义10 设n m ij x X ⨯=][为多元实变量矩阵,
()()1111,,,,,,n m mn f X f x x x x =
是以X 中诸元素为变量的多元函数,并且偏导数
ij
x f
∂∂()1,2,,;1,2,,i m j n == 都存在,则定义函数)(X f 对矩阵X 的导数为
⎪⎪⎪⎪⎪⎪⎪⎪⎭
⎫
⎝⎛∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂=mn m m n
n x f x f x f x f x f x f x f x f x f dX df
2
1
2222111211. 特别,当X 为向量()T
n x x x x ,,,21 =时,函数()n x x x f ,,,21 对x 之导数为
()x f x f x f x f dx df T
n ∇=⎪⎪⎭
⎫
⎝⎛∂∂∂∂∂∂=,,,21 . 例3 设[]
()∑∑==⨯==m i n
j ij n
m ij
x X f x X 11
2
,,求dX
df . 解
2,1,2,,;
1,2,,ij ij
f
x i m j n x ∂===∂ .
X x x x x x x x x x dX df mn m m n n 22222222222
1
22221
11211
=⎪⎪
⎪
⎪
⎪
⎭⎫
⎝⎛=
.
例4 设112
2,n n a x a x a x a x ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭
,1122()T n n f x a x a x a x a x ==+++ ,则
12n a a df a dx a ⎛⎫
⎪ ⎪== ⎪
⎪⎝⎭
. 三、矩阵对矩阵的导数
定义11 设矩阵n m kl a A ⨯=][中每一个元素kl a 都是矩阵q p ij b B ⨯=][中各元素(1,2,...,;1,2,...,)ij b i p j q ==的函数,当A 对B 中各元素都可导时,则称矩阵A 对矩阵B 可导,且规定A 对B 的导数为
11121212221
2
q q p p pq A A A b b b A A A dA b b b dB A A A b b b ∂∂∂⎛⎫ ⎪∂∂∂ ⎪ ⎪∂∂∂ ⎪
∂∂∂= ⎪
⎪
⎪∂∂∂ ⎪ ⎪∂∂∂⎝⎭
, 其中11112221
2212n ij ij ij n ij
ij ij ij m m mn ij
ij
ij a a a b b b a a a A b b b b a a a b b b ∂∂∂⎛⎫
⎪
∂∂∂ ⎪ ⎪∂∂∂ ⎪∂∂∂∂= ⎪∂
⎪ ⎪∂∂∂ ⎪ ⎪∂∂∂⎝⎭
,dB
dA
是一个nq mp ⨯矩阵.
例5 设n m ij a A ⨯=][,求
dA
dA 解 ⎪⎪
⎪⎪
⎪
⎭
⎫
⎝⎛=⎪⎪⎪⎪⎪⎪⎪⎪
⎭
⎫
⎝⎛∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂=mn m m n n mn m m n n E E E E E E E E E a A a A a A a A a A a A a A a A a A dA dA
21
22221112112
1
22221
11211. 这里),(j i E ij 是元素都是1,其余元素都是0的n m ⨯矩阵.
例6 设()n x x x x ,,,21 =,()T
n y y y y ,,,21 =,其中()n i i x x x f y ,,,21 =,
()m i ,,2,1 =.如果()1,2,,;1,2,i j
y i m j n x ∂==∂ 都存在,则y 对x 可导且
⎪⎪⎪⎪⎪⎪⎪⎪⎭
⎫
⎝⎛∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂∂=⎪⎪⎭⎫ ⎝⎛∂∂∂∂∂∂=n m
m m n n n x y x y x y x y x y x y
x y x y x y x y x y x y dx dy
21
2
221
2
1211121,,. 例7 设12(,,,)n x x x x = ,求T
dx dx
.
解 11
1122221212n T n n
n n n x x x x x x x x x dx x x x E dx
x x x x x x ∂∂∂⎛⎫ ⎪∂∂∂ ⎪
⎪∂∂∂ ⎪∂∂∂== ⎪ ⎪ ⎪∂∂∂ ⎪ ⎪∂∂∂⎝⎭
. 以下我们考虑向量对向量的导数.
设12(,,),n x x x x = 12
n y y y y ⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭
,其中12(,)(1,2,,).i i n y f x x x i m == 如果
(1,2,,;1,2)i
j
y i m j n x ∂==∂ 都存在,则y 对x 可导,且 11
11
222
2121212(,,,)n n n
m m m n y y y x x x y y y dy y y y
x x x dx x x x y y y x x x ∂∂∂⎡⎤⎢⎥∂∂∂⎢⎥
∂∂∂⎢⎥∂∂∂⎢⎥∂∂∂==⎢⎥∂∂∂⎢⎥⎢⎥∂∂∂⎢⎥⎢⎥∂∂∂⎣⎦
(1) 在一些书上,往往对行向量和列向量不加区别,而规定任何一个m 维向
量y 对另一个n 维向量x 的导数都以上面(1)式最后的矩阵形式来表达,这主
要是为了应用的方便.
例8 设数量函数()n x x x f y ,,,21 =的所有二阶偏导数都存在,记
()
T
n x x x x ,,,21 =,求梯度()dy f x dx ∇=,及海森[Hessian]矩阵22()d y
H x dx
=.
解 12(),,,T
n dy y y y f x dx x x x ⎛⎫
∂∂∂∇== ⎪∂∂∂⎝⎭
. 2222
11212222221
222222
2
1
2
()n n n n n y
y y x x x x x y
y y d y d dy H x x x x x x dx dx dx y y y x x x x x ⎛⎫∂∂∂ ⎪
∂∂∂∂∂
⎪ ⎪∂∂∂
⎪
⎛⎫===∂∂∂∂∂ ⎪ ⎪⎝⎭
⎪
⎪ ⎪∂∂∂
⎪∂∂∂∂∂⎝⎭
. 当y 的所有二阶偏导数都连续时,Hessian 矩阵为n 阶对称矩阵.
§5.4 矩阵的微分与积分
定义12 当函数矩阵()[()]ij m n A x a x ⨯=可导时,其微分
11
121212221
2
[]n n ij m n
m m mn da da da da da da dA da da da da ⨯⎡⎤⎢⎥⎢⎥==⎢⎥
⎢⎥
⎣⎦
,其中()ij ij da a x dx '=. (1) 矩阵的微分实质上就是各个元素分别微分,因此,相应于每一个导数运算性质都可以得到一个关于微分的相应性质,例如
();d A B dA dB +=+ ()();d AB dA B AdB =+
();d kA kdA =(k 为常数);
()()()d fA df A f dA =+ (()
f f x =为可微函数) 都是正确的.
如果矩阵A 中每个元素都是以矩阵B 中诸元素为变量的多元函数,则称矩阵A 是矩阵B 的函数,记为()A B .此时矩阵A 作为一个多元函数矩阵,它的全微分仍可按(1)式定义,只不过其中元素ij da 应该换成全微分,即
11
p q
ij ij kl k l kl
a da d
b b ==∂=∂∑∑
,
这里,p q 分别是矩阵B 的行数和列数.
定义13 若函数矩阵()(())ij m n A x a x ⨯=的所有各元素()(1,2,,;
ij a x i m = 1,2,,)j n = 都在[,]a b 上可积,则称()A x 在[,]a b 上可积,且
111212122212()()()()()()()()()()n
n m m mn b
b
b a x dx a x dx a x dx a a a b
b
b
a x dx a x dx a x dx
b A x dx a
a a a
b b b a x dx a x dx a x dx a a a ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢
⎥
⎢⎥⎢⎥
⎣⎦
⎰⎰⎰⎰⎰⎰⎰⎰⎰⎰
.
函数矩阵的定积分有如下简单性质
(1)()()b b
kA x dx k A x dx a a
=⎰⎰, k R ∈
(2)[]()()()()b
b b A x B x dx A x dx B x dx a a a
+=+⎰
⎰⎰, 函数矩阵的不定积分也有类似的情况.
例1 设sin cos ()cos sin x x A x x x -⎛⎫= ⎪⎝⎭
,求()0x A x dx ⎰及2
()0x d A x dx dx ⎰.
解 s i n
(c o s )0
01
c o s s i n ()0
sin 1cos cos sin 00
x
x xdx x dx x x x A x dx x x x x xdx xdx ⎛⎫- ⎪--⎛⎫
⎪== ⎪ ⎪-⎝⎭ ⎪⎝⎭
⎰⎰⎰⎰⎰. 因为若以()ij a x 表示()A x 中各元素(,1,2)i j =,则有
22
()2()0
ij ij x d a x dx xa x dx =⎰. 所以有2222
2
2sin cos ()2()20cos sin x x x d A x dx xA x x dx x
x ⎛⎫
-== ⎪⎝⎭
⎰. 习 题 五
1、设n
n n n ij C
a A ⨯⨯∈=)(,令12
2
11
()n n
ij F
i j A
a ===∑∑,则F A 为方阵范数,证明:
F A 是一种与向量的2-范数2x 相容的方阵范数.称它为方阵A 的Frobenius 范数,
简称F-范数.
2、设V 是n 维(复的或实的)线性空间,n e e e ,,,21 是V 的一组基,则对任意的
V x ∈,x 有唯一表示式
n n e x e x e x x +++= 2211,
规定 2
11
2
)(∑==n
i i E
x x
.证明:E x 是V 中元素的一种范数.
3、对下列矩阵A ,求21,A A 及∞A .
1)⎪⎪⎭⎫ ⎝⎛-=0123A 2)⎪⎪⎭
⎫ ⎝⎛--+i i i i 11
4、证明:对n 阶矩阵][ij a A =,有
∑=≤≤∞=n
j ij n
i a A 1
1max .
5、考察下列向量序列}{k x 的敛散性: 1)T
k k x )2
1,
1(=; 2)T
k
i k
i i k i
x )1,0,21(11∑∑===.
6、设
⎪⎪⎭
⎫
⎝⎛-+=)1(2121)(2x x x x A 计算
)(),(1
x A dx
d x A dx d -. 7、计算矩阵对矩阵的导数
dA
dx
. 1)⎪⎪⎭
⎫
⎝⎛=32121x x x e A x x ,),,(321x x x x =;
2)222
1
21233
34242,sin(3)x x x x e x x A x x x x x ⎛⎫+⎛⎫
== ⎪ ⎪-⎝⎭
⎝⎭
. 8、设==⨯)(,][A f a A n n ij 迹A .试求dA
df . 9、设∑∑==+=
=n
i n
i i i
T
n x x ix x f x x x x 1
2
1221)(,),,,( .试求梯度dx
df
x f =
∇)(及海森矩阵2
2)(dx f
d x H =.
10、已知函数矩阵
⎪⎪⎪⎭
⎫ ⎝
⎛=-00
302)(222x e e
x xe e x A x x
x x ,
试求⎰1
0)(dx x A 和⎪⎭
⎫ ⎝⎛⎰20)(x dt t A dx d .。