矩阵微分法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

矩 阵 微 分 法
在现代控制理论中,经常会遇到矩阵的微分(导数),如对表达式
d d A
B
来说,由于A 和B 都可能是数量、向量或矩阵,可代表九种不同的导数。

除数量函数对数量变量的导数外,还剩下八种。

下面分别介绍八种导数的定义和运算公式。

一、 相对于数量变量的微分(自变量是数量变量,如时间t )
定义1 对于n 维向量函数
[]12()()()......()T
n t a t a t a t = a
定义它对t 的导数为
12()()
()()T
n d a t d a t d a t d t dt dt
dt dt ⎡⎤⎢⎥⎣⎦
a ……… (1-1)
定义2 对于n × m 维矩阵函数
1112112()()()()()()()()n i j nm n n nn a t a t a t t a t a t a t a t ⎡⎤
⎢⎥⎡⎤= =⎢⎥⎣⎦⎢⎥ ⎣⎦
A
定义它对t 的导数为
1111212()()()()()()()()T
n i j n m n n
n n da t da t da t dt dt dt da t d t dt dt da t da t da t dt dt dt ⎡⎤ ⎢⎥⎢
⎥⎡⎤ =⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥ ⎢⎥⎣
⎦ A ………(1-2)
我们不难看出,上述两个定义是一致的。

当矩阵A (t) 退化为向量a (t)时,定义2就变为定义1。

再退一步讲,当向量a (t) 退化为数量函数a (t)时,定义1就变为一般的导数定义。

这说明这样定义是合理的,是统一的。

根据上述的两个定义,我们还可以推出下列的运算公式
{}()()
()()d d t d t t t dt dt dt ±=
±A B A B ………(1-3) {}()()
()()()()d d t d t t t t t dt dt dt
⋅=
⋅+⋅A A A λλλ ………(1-4) (t )λ——为变量t 的数量函数
{}()()
()()()()d d t d t t t t t dt dt dt
⋅=
⋅+⋅A B A B B A ………(1-5) 这些公式都很容易证明,现证明最后一式(1-5),设矩阵A (t) 和B (t) 分别为n ×m 和m ×l 矩阵
证:
11121112()()()()()()()()()T n T n n nm n a t a t a t t t a t a t a t t ⎡⎤⎡⎤ ⎢⎥⎢⎥
= = ⎢⎥⎢⎥⎢⎥⎢⎥
⎣⎦⎣⎦
a A a
[]111211212()()()()()()()()()()m m m b t b t b t t t t t b t b t b t ⎡⎤ ⎢⎥= = ⎢⎥⎢⎥ ⎣⎦
B b b b
1111()()()()()()()()()()()()T T
T
i j n T T n n t t t t t t t t t t t t ⎡⎤ ⎢⎥⎡⎤⋅= =⋅⎢⎥⎣⎦⎢⎥
⎣⎦
a b a b A B a b a b a b
从而根据矩阵导数定义2,有
[]()()()()()()()()()()()()T
i j n T j T
i j i n d d t t t t dt dt
d t d t d t d t t t t t dt
dt dt dt ⎡⎤⋅=⋅⎣⎦⎡⎤ =⋅+⋅=
⋅+⋅⎢⎥⎣⎦
A B a b b a A B b a B A
证毕
例1:求T X A X 对t 的导数,其中
1()()n x t x t ⎡⎤
⎢⎥= ⎢⎥
⎢⎥⎣⎦ X 1111n n n n a a a a ⎡⎤⎢⎥= ⎢⎥⎢⎥⎣⎦
A —— 对称常系数矩阵 解
()[]()2d d d dt dt dt
d d d dt dt dt ⋅⋅⋅=⋅+⋅ =⋅+⋅⋅ =⋅⋅+⋅⋅⋅⋅+⋅⋅ =+ = T X A X X A X A X X X A X
A X X X A X
A X X A X X A X X A X X AX
X AX X AX T T
T T T T T T T T T T +=()

2T T d ()dt
=X A X X A X ………(1-6) 注:T X
A X 和T X A X 都是数量函数且A 为对称阵,它们等于自己的转置。

习题
1.若 12 ⎡⎤
=⎢⎥2 1⎣⎦A 12()()x t x t ⎡⎤=⎢⎥⎣⎦X 证明上式。

2.若 1 1⎡⎤
=⎢⎥
2 1⎣⎦A 12()()x t x t ⎡⎤=⎢⎥⎣⎦X 证明上式。

3.若 1 0⎡⎤=⎢⎥0 1⎣⎦
A 12()()x t x t ⎡⎤=⎢⎥⎣⎦X 求 []T d X A X dt
二、 相对于向量的微分(自变量是向量X )
1、数量函数的导数
设函数 12 ()(,,,)n f f x x x =X 是以向量X 为自变量的数量函数,即以n 个变量 x i 为自变量的数量函数。

定义3
我们将列向量 1n f x f x ∂⎡⎤⎢⎥∂⎢⎥
⎢⎥⎢⎥∂⎢⎥⎢⎥∂⎣⎦
叫做数量函数f 对列向量X 的导数,
记作
1n f x df
f f d f x ∂⎡⎤
⎢⎥∂⎢⎥= ∇⎢⎥⎢⎥
∂⎢⎥⎢⎥∂⎣⎦
grad X
1
2T n df f f f d x x x ⎡⎤∂∂∂=⎢⎥∂∂∂⎣⎦X
例2.求函数222
12 ()T n
f x x x =+++ X X X = 对X 的导数 解:根据定义
1112222n n n f x x x df d f x x x ∂⎡⎤
⎢⎥∂⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥= = = =⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥∂⎣⎦
⎣⎦⎢⎥⎢⎥∂⎣⎦
X X 即 ()2T d d =X X X X ………(1-7)
2、向量函数的导数
设函数 1()()()m a a ⎡⎤⎢⎥
= ⎢⎥⎢⎥⎣⎦
X a X X , 12()T n x ,x ,,x =X
定义4 n ×m 阶矩阵函数
11
11()()()
()()m T j i nm
m n n a a x x a d x d a a x x ∂∂⎡⎤⎢⎥∂∂⎢⎥∂⎡⎤ ==
⎢⎥⎢⎥∂⎢⎥⎣⎦∂∂⎢⎥⎢⎥∂∂⎣⎦
X X a X X X X ………(1-8) 称之为m 维向量函数T ()a X 对n 维列向量X 的导数。

m ×n 阶矩阵函数
11
11()()
()()()m n i T
j m n
m n a a x x a d x d a a x x ∂∂⎡⎤⎢⎥∂∂⎢⎥⎡⎤∂⎢ ⎥==⎢⎥∂⎢⎥⎢⎥⎣⎦∂∂⎢⎥⎢⎥∂∂⎣⎦
X X a X X X X ………(1-9) 称之为m 维向量函数()a X 对n 维横向量X T 的导数。

从定义可看出 ()()T T d d d d ≠a X a X X X ()(
)
T
T T d d d d ⎡⎤=⎢⎥⎣⎦
a X a X X X
……(1-10)
若()a X 和()b X 是m 维列向量函数,()λX 是数量函数,X 是m 维列向量,有以下3个运算公式
[()()]()()
T T T T d d d d d d ±=±a X b X a X b X X X X
加法运算公式……(1-11)
[()()]()()
()()T T T d d d d d d λλλ=⋅+⋅X a X X a X a X X X X X 数乘运算公式……(1-12)
[()()]()()
()()T T T d d d d d d ⋅=⋅+⋅a X b X a X b X b X a X X X X
乘法运算公式……(1-13)
证明最后一个公式,前两个公式请同学们根据定义去证明。

证:为简明起见隐去X
111()[()()]()()T T T T T T T i i i T T T n n n x x x d d x x x x x x ⎛⎫∂∂⎛⎫∂⋅+⋅ ⎪ ⎪∂∂∂ ⎪ ⎪
⎪ ⎪
∂∂∂ ⎪⋅==⋅+⋅
⎪∂∂∂ ⎪

⎪∂∂∂ ⎪⋅+⋅ ⎪ ∂∂∂⎝⎭⎝⎭
a b b a a b a b a X b X a b b a X a b a b b a
1
1
()()
()()T T T
T T T i
i T
T n
n x x x x x x ⎪⎪⎪⎪
⎪⎪⎪⎪⎪⎛⎫∂∂⋅+⋅
⎪∂∂ ⎪ ⎪ ⎪∂∂∂∂ ⎪ =⋅+⋅
=⋅+⋅ ⎪∂∂∂∂ ⎪
⎪ ⎪∂∂ ⎪⋅+⋅ ⎪∂∂⎝⎭a a b b a
a a X a X
b b b X b X X X
a a
b b 证毕
例3: 求 ??T
T
d d d d = =X X X
X
其中X 为n 维列向量 解:根据定义4
11()()()n m x x ⎡⎤⎡⎤⎢⎥⎢⎥= = ⎢
⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦
a X a X a X 111
11
111
()()1()
()()n n T
n n
n n n n a a x x x x x x d d a a x x x x x x ∂∂∂∂⎡⎤⎡⎤ 0 0⎡⎤
⎢⎥⎢⎥∂∂∂∂⎢⎥⎢⎥⎢⎥0 1 0⎢⎥= = ==⎢⎥⎢⎥⎢⎥
⎢⎥⎢⎥∂∂∂∂⎢⎥⎢⎥⎢⎥0 0 1⎣⎦
⎢⎥⎢⎥∂∂∂∂⎣⎦⎣⎦X X a X I X X X

T
d d =X
I X
……(1-14) 同理 T
d d =X I X
注意:移乘作除要加转置 ……(1-15) 例4:求
()T d
d X A X
X —— n 维列向量,A —— n ×m 维常数阵 解:设[]12m = A a a a ,i a =T 12[]i i ni a ,a ,,a 为n ×1列向量
因此 12T T T T
m ⎡⎤= ⎣⎦X A X a X a X a
根据定义
()()()()12T T T T m d d d d d d d d ⎡⎤
= ⎢⎥⎣⎦
X A X a X a X a X X X X 其中每一个列向量()T T T
i i i i d d d d d d =⋅+⋅a X X a a X =a X
X X
因此有
()[]12T m d
d = =X A a a a A X
……(1-16)
推论:若A 为n ×n 方阵,有 ()T d
d =T T X A A X
……(1-17) 例5:求
()T
d
d BX X X —— n 维列向量, B —— m ×n 矩阵 解:设 12m T T T ⎡⎤⎢⎥⎢⎥⎢⎥ ⎢⎥⎢⎥⎣⎦ b b B =b 则 12m T T T ⎡⎤⎢⎥⎢⎥
⎢⎥ ⎢⎥⎢⎥⎣⎦
b X b X BX =b X
类似可得:()T
d
d BX =B X ……(1-18)
例6:求二次型T X AX 对X 的导数,A 为对称方阵 解:根据乘法运算公式(1-13)
()()()()
()2T
T T
T T T T d d d d d d d d =+⋅A X X X A X A X X X X X
X A =A X +X =A X +A X X
=A+A X =A X

()2T d
d X A X =A X
X
……(1-19) 根据(1-10)式 ()()
T
T
T d d d d ⎡⎤=⎢⎥⎣⎦a X a X X X →→ ()()T
T T d d d d ⎡⎤=⎢⎥⎣⎦
a X a X X X (两边同取转置) 有 ()()[2]T
T T
T
T
T d d d d ⎡⎤
=⎢⎥⎣⎦
X A X =X A X A X =2X A
X X
例7:求函数T AX λ对X 的导数, 其中T λ—— 1×n 行向量,
A —— n ×n 常数阵,X —— n 维列向量
解:
()()()T
T
T
T T T
T T T d d d d ==AX =AX X A AX =X A A X X
λλλ
λλλ 因为T AX λ是标量,所以它与它的转置相等
例8:求方程AX =b 的最小范数的平方解,其中A 是m ×n 阶常数矩阵,其秩为m(m<n), b 为m ×1常数列向量。

解:这实际上就是求数量函数()2T f x =⋅ X X =X ,在约束条件=AX b 的条件极小值,采用拉格朗日乘数法,作函数
()()T T F =⋅+-X X X AX b λ
()2T d d =+=F X X A 0X λ 解出1
2T -X =A λ 代入约束方程
1
2
T -
=AA b λ 其中T AA 是m ×m 常数矩阵,根据给定条件,秩为m ,其逆存在 因而有:()1
2T --=AA b λ 代入X 的表达式 ()
1
T
T
-X =A
AA b
再由
()()22T
T T
d d d d d d ⎡⎤==⎢⎥⎣⎦F X X +A I >0X X X
λ 可知所得的解是最小范数解。

三、 相对于矩阵的微分(自变量是矩阵 )
1、数量函数的导数
设函数()f f =A 是以P ×m 矩阵A 的P ×m 元素i j a 为自变量的数量函数,简称以矩阵A 为自变量的数量函数。

例如
()()[]()32
111211212223112122
11
1211112122111T
f a a a a a a a a a a a a a f a a =+++++++⎛⎫⎛⎫= == ⎪⎪ ⎝⎭⎝⎭
a A a A 11122122
a
a a a ⎛⎫ ⎪⎝⎭A =
定义:P ×m 矩阵
1111()
m i j p m
p p m f f a a f d f a d f f a a ⎛⎫
∂∂ ⎪∂∂ ⎪⎡⎤∂ ⎪==
⎢⎥∂ ⎪⎢⎥⎣⎦∂∂ ⎪ ⎪∂∂⎝⎭
A A ……(1-20) 称为数量函数f 对矩阵A 的导数,记作()
d f d A A
例9:求()T f A =X AX 对矩阵A 的导数,其中向量X 是定常的,A 是对称的。

解:[]1111222
121111212122122221222()x a a f x x x a x x a x x a x a a a x ⎡⎤⎛⎫ =+++ ⎪⎢⎥⎝⎭⎣⎦A =
根据定义有
[]211
12112112221222122()T f f a a x x x x df x x f f x d x x x a a ∂∂⎛⎫
⎪⎡⎤∂∂ ⎡⎤ ⎪== =⎢⎥⎢⎥ ⎪∂∂ ⎢⎥⎣⎦⎣⎦ ⎪∂∂⎝⎭
A =XX A

()=T d
d T X A X X X A
……(1-21)
2. 向量函数的导数 设函数
12
()()()()n Z Z Z ⎡⎤
⎢⎥
⎢⎥=⎢⎥
⎢⎥⎢⎥⎣⎦
A A Z A A 是以矩阵A 为自变量的n 维列向量函数,1111m p pm a a a a ⎛⎫ ⎪ ⎪ ⎪⎝⎭ A = 定义:
1111()
m ij pm
p pm a a d d a a a ⎛⎫
∂∂ ⎪∂∂ ⎪
⎛⎫
∂ ⎪==

⎪∂
⎪⎝⎭∂∂ ⎪ ⎪∂∂⎝⎭
Z
Z Z A Z A Z Z ……(1-22) 其中 1
()()1ij
ij n ij n z a a z a ⨯∂⎡⎤⎢⎥
∂⎢⎥∂⎢⎥= ∂⎢⎥
∂⎢⎥⎢⎥∂⎣⎦
A Z
A
3. 矩阵函数的导数
设函数 1111
()()()()()n n f f f f ⎛⎫

= ⎪ ⎪⎝⎭
A A F A A A 1111m p p m a a a a ⎛⎫ ⎪ ⎪ ⎪⎝⎭
A =
定义:
1111()
()()()()m p p m a a d d a a ∂∂⎛⎫ ⎪∂∂
⎪ ⎪= ⎪
∂∂ ⎪ ⎪∂∂⎝⎭
F A F A F A A F A F A ……(1-23) 其中每个分块矩阵
1111()()()()()i j i j i j n n i j i j f f a a a f f a a ⎛⎫
∂∂ ⎪
∂∂
⎪⎡⎤∂ ⎪=⎢⎥ ⎪∂⎢⎥⎣⎦∂∂ ⎪ ⎪∂∂⎝⎭A A F A A A
例10:X 是n 维列向量,Y 是m 维列向量,A 是n ×m 矩阵,求:
?T ∂=∂X AY
A
解:根据矩阵乘法
T n
T
i j i j
i j i j
a x y x y a ∂=>=∂∑∑m j=1i=1
X AY X AY =
根据数量函数导数的定义
T T
i j nm x y ∂⎡⎤==⋅⎣⎦∂X AY X Y A
……(1-24) 顺便说一下,T X AY 是一个数量函数,与它的转置相等,即T
T T T T
⎡⎤=⎣⎦
X AY =X AY Y A X 所以又有
()T T T ∂=⋅∂Y A X X Y A
……(1-25)
四、 复合函数的微分
公式1 设()f f =Y ,()=Y Y X ,则
T T T T
d f d d f
d d d d f d f d d d d ⎧=⎪⎪⎨
⎪=⎪⎩Y X X Y Y X Y X ……(1-26) 证明:由给定条件有
T df df d d =⋅Y Y 和
T
d d d d =⋅Y Y X X 将上式结合起来
T T T T T df d df df d df d d d d d d =⋅⋅=⋅Y Y X =>Y X X Y X
公式2 设()f f =X,Y ,()=Y Y X ,则
T T T
T
T df f d f
d d df df f d d d d ⎧∂∂=+⎪⎪∂∂⎨
∂⎪=+⎪∂⎩Y X X X Y
Y X
X Y X ……(1-27)。

相关文档
最新文档