矩阵微分(变分)法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

×X
=
ai
( ) 因此有
d dX
X T A = [a1 a2 L am ] = A
……(1-16)
( ) 推论:若 A 为 n×n 方阵,有
d dX
X T AT
= AT
……(1-17)

5:求
d dX T
( BX
)
X —— n 维列向量, B —— m×n 矩阵
解:设
ébT ù
ê 1ú
B
=
êbT
ê ê
a1n M
ù ú ú
êëan1 L ann úû
—— 对称常系数矩阵

d [X T dt
×A×X ]=
dX T dt
A×X
+XT
×
d
(A × dt
X
)
=
dX T dt
A×X
+
X
T
(
dA dt
×
X
+
A
×
dX dt
)
= X& T × A × X + X T × A × X& = (X& T × A × X )T + X T × A × X&
(A
X
)+
d
(A X
dX
)T
X
( ) d
=AX+
X T AT dX
× X = A X + AT X
= ( A + AT ) X = 2A X

d dX
(
X
T
A
X
)
=
2
A
X
……(1-19)
根据(1-10)式
daT ( X dX
)
=
é êë
da( X dX T
)
ùT úû
→→
da( X ) é daT ( X ) ùT
X
)
êë ¶xn
L O L
¶am (X ) ù
¶x1
ú ú

¶am
(
X
)
ú ú
¶xn úû
=
é ¶a j
ê ë
¶xi
ù ú û nm
=
daT ( X dX
)
称之为 m 维向量函数 aT ( X ) 对 n 维列向量 X 的导数。
m×n 阶矩阵函数
é ¶a1(X )
ê ê
¶x1
L
¶am ( X ) ù
daT ( X dX
)
=
é da( X êë dX T
)
ùT úû
……(1-10)
若 a( X ) 和 b( X ) 是 m 维列向量函数,l( X ) 是数量函数,X 是 m 维列向量,有以下 3 个
运算公式
d[aT
(X)± dX
bT
(X
)]
=
daT ( X dX
)
±
dbT (X dX
)
加法运算公式……(1-11)
)
=
é ê ê ê ê ê êë
¶a1( X ¶x1
)
L
¶a1( X ¶xn
)
M OM
¶an ( X ¶x1
)
L
¶an ( X ¶xn
)
ù ú ú ú ú ú úû
=
é ¶x1
ê ê
¶x1
êM
ê ê
¶xn
êë ¶x1
L O
¶x1 ¶xn
M
ù ú ú ú
=
é1 êê0
L
¶xn
ú ú
¶xn úû
êM ëê0
ç ççè
¶ ¶xn
÷ (aT b) ÷÷ø
ç ç çè
¶aT ¶xn
×b + aT
×
¶b ¶xn
÷ ÷ ø÷
æ ç ç
¶aT ¶x1
× b + bT
×
¶a ¶x1
ö ÷ ÷
ç
M
÷
=
ç ç
¶aT
ç ç
¶xi
× b + bT
×
¶a ¶xi
÷ ÷ ÷ ÷
=
¶aT ( X ¶X
)
×
b(
X
)
+
bT
(
X
)
×
¶a( X ¶X
证:为简明起见隐去 X
æ ç ç
¶ ¶x1
(aT
b)
ö ÷ ÷
æ ç ç
¶aT ¶x1
×b + aT
×
¶b ¶x1
ö ÷ ÷
d dX
[aT
(
X
)
×
b(
X
)]
=
çM ÷
ç
÷
ç ç ç
¶ ¶xi
(aT b)
÷ ÷ ÷
=
ç
M
÷
ç ç
¶aT
ç ç
¶xi
×b + aT
×
¶b ¶xi
÷ ÷ ÷ ÷
çM÷ ç
M
÷
4
d[l( X )aT ( X )] dX
=
dl(X dX
)
×
aT
(X
)
+
l(X
)
×
daT ( X dX
)
d[aT
(X )×b(X dX
)]
=
daT ( X dX
)
×b(X )
+
dbT (X dX
)
×a(X
)
数乘运算公式……(1-12) 乘法运算公式……(1-13)
证明最后一个公式,前两个公式请同学们根据定义去证明。
0ù 1úû
X
=
é x1(t) ù
ê ë
x2
(t
)
ú û
X
=
é x1(t) ù
ê ë
x2
(t
)
ú û
X
=
é x1(t) ù
ê ë
x2
(t
)úû
证明上式。
证明上式。

d [XT A X]
dt
二、 相对于向量的微分(自变量是向量 X )
1、数量函数的导数 设函数 f ( X ) = f ( x1 , x2 , L , xn ) 是以向量 X 为自变量的数量函数,即以 n 个变
B(t)}
=
dA(t dt
)
×
B(t)
+
A(t)
×
dB(t dt
)
………(1-5)
这些公式都很容易证明,现证明最后一式(1-5),设矩阵 A(t) 和 B(t) 分别为 n×
m 和 m×l 矩阵
证:
A(t) = éêêa11M(t)
a12 (t) M
L a1n (t) OM
ù ú ú
=
éêa1T ê
L
dan
n
(t
)
ú ú
dt úû
=
é ê ë
dai j (t dt
)
ù ú û
n
m
………(1-2)
我们不难看出,上述两个定义是一致的。当矩阵 A(t) 退化为向量 a(t)时,定义 2 就 变为定义 1。再退一步讲,当向量 a(t) 退化为数量函数 a(t)时,定义 1 就变为一般的导数 定义。这说明这样定义是合理的,是统一的。
dX T
=ê ë
dX
ú û

( ) d
dX T
XTA X
=
éd êë dX
(XT A
X
)
ùT úû
= [2
A X ]T
=
2X T A
(两边同取转置)
例 7:求函数 lT AX 对 X 的导数, 其中 lT —— 1×n 行向量,
解:
( ) lT AX = lT AX T = X T AT l
( ) ( ) d
a12 (t) M
L a1n (t) OM
ù ú ú
=
éëai j (t)ùûnm
an2 (t) L ann (t)úû
定义它对 t 的导数为
dA(t)
é ê ê
da11 (t dt
)
dt
@ê M
ê ê
dan1
(t
)
êë dt
da12 (t) dt
L
da1n (t) dt
ùT ú ú
M O Mú
dan2 (t) dt
0 1
0
L L O L

0
ú ú
=
I

1úû
5

dX dX T
=
I
同理
dX T dX
=I
注意:移乘作除要加转置
……(1-14) ……(1-15)
例 4:求 d ( X T A) dX
X —— n 维列向量, A —— n×m 维常数阵
[ ] 解:设 A = a1 a2 L am , ai =[a1i , a2i ,L , ani ]T 为 n×1 列向量
dX
l T AX
=d dX
X T AT l
= AT l
A —— n×n 常数阵, X —— n 维列向量 因为 lT AX 是标量,所以它与它的转置相等
例 8:求方程 AX = b 的最小范数的平方解,其中 A 是 m×n 阶常数矩阵,其秩为 m(m<n), b 为 m×1 常数列向量。
解:这实际上就是求数量函数 f ( x) = X T × X =P X P2 ,在约束条件 AX = b 的条件极小值,
= X T AX& + X T AX& = 2X T AX&

d dt
(
X
T
A
X
)
=
2X
T
A
X&
………(1-6)
注: X& T A X 和 X T A X& 都是数量函数且 A 为对称阵,它们等于自己的转置。
2
习题 1.若
A
=
é1 êë2
2ù 1úû
2.若
A
=
é1 êë2
1ù 1úû
3.若
A
=
é1 êë0
( ) X = AT AAT -1 b
7
( ) 再由
d dX T
é dF ( X
ê ë
dX

ú û
=
d dX T
2 X + AT l
= 2I > 0
可知所得的解是最小范数解。
(t M
)
ù ú ú
êëan1(t) an2 (t) L anm (t)úû
êëanT (t)úû
B(t) = éêêb11M(t)
b12 (t) M
L O
b1l (t) M
ù
ú ú
=
[b1
(t
)
b2 (t) L bl (t)]
êëbm1(t) bm2 (t) L bm l (t)úû
A(t) × B(t)
)
ç
M
÷
ç ç çè
¶aT ¶xn
× b + bT
×
¶a ¶xn
÷ ÷ ÷ø
证毕
例 3: 求
dX dX T
=?
d XT dX
=?
其中 X 为 n 维列向量
解:根据定义 4
a(
X
)
=
é ê ê
x1 M
ù ú ú
=ห้องสมุดไป่ตู้
éêa1 ê
( M
X
)
ù ú ú
êë xn úû êëam ( X )úû
da( X dX T
矩阵微分法
在现代控制理论中,经常会遇到矩阵的微分(导数),如对表达式 dA 来说,由于 dB
A 和 B 都可能是数量、向量或矩阵,可代表九种不同的导数。除数量函数对数量变量的 导数外,还剩下八种。下面分别介绍八种导数的定义和运算公式。
一、 相对于数量变量的微分(自变量是数量变量,如时间 t )
定义 1 对于 n 维向量函数
量 xi 为自变量的数量函数。
定义 3 记作
我们将列向量
é ¶f ù
ê ê
¶x1
ú ú
êM ú
ê ê
¶f
ú ú
êë ¶xn úû
叫做数量函数 f 对列向量 X 的导数,
é ¶f ù
df dX
ê ê
¶x1
ú ú
= ê M ú @ grad f @ Ñ f
ê ê
¶f
ú ú
êë ¶xn úû
df dX T
根据上述的两个定义,我们还可以推出下列的运算公式
d dt
{
A(t)
±
B(t)}
=
dA(t) dt
±
dB(t) dt
d dt
{l
(t
)
×
A(t)}
=
dl (t) dt
×
A(t)
+
l
(t)
×
dA(t) dt
λ( t ) ——为变量 t 的数量函数
………(1-3) ………(1-4)
1
d dt
{
A(t)
×
a(t) = [a1(t) a2 (t) ...... an (t)]T
定义它对 t 的导数为
d
a(t) dt
@
éd êë
a1(t) dt
d a2 (t) dt
L
d an (t) ùT dt úû
定义 2 对于 n × m 维矩阵函数
……… (1-1)
A(t) = êéêaM11(t) êëan1 (t )
=
éêa1T ê
(t )b1 (t ) M
L O
a1T
(t
)bl M
(t
)
ù ú ú
=
éëaiT
(t) × bj (t)ùûnl
êëanT (t)b1(t) L anT (t)bl (t)úû
从而根据矩阵导数定义 2,有
d dt
[
A(t) ×
B(t)]
=
d dt
éëaiT
(t) × bj
(t ) ùû n l
2
M
ú ú ú
êëbTm
ú û
ébT X ù
ê1 ú

BX
=
êbT X
ê ê
2
M
ú ú ú
êëbTm
X
ú û
类似可得:
d dX T
( BX
)
=
B
……(1-18)
例 6:求二次型 X T AX 对 X 的导数,A 为对称方阵 解:根据乘法运算公式(1-13)
6
( ) d
dX
XTA X
=
dX T dX
=
é ¶f
ê ë
¶x1
¶f ¶x2
L
¶f ù
¶xn
ú û
例 2.求函数 f (X ) = X T X = x12 + x22 +L + xn2 对 X 的导数 解:根据定义
3
é ¶f ù
df dX
ê ê
¶x1
=ê M
ê ê
¶f
ú ú ú= ú ú
é2x1 ù
ê ê
M
ú ú
êë2xn úû
éx1 ù
因此 X T A = éë X T a1 X T a2 L X T am ùû
( ) ( ) ( ) ( ) 根据定义 d dX
XT A
=
é êë
d dX
X T a1
d dX
X T a2
L
d dX
X T am
ù úû
( ) 其中每一个列向量 d dX
X T ai
=
dX T dX
× ai
+
daiT dX
采用拉格朗日乘数法,作函数
F ( X ) = X T × X + lT ( AX - b)
dF ( X
dX
)
=
2X
+
AT
l
=
0
解出
X
=
-
1 2
AT l
代入约束方程
-
1 2
AAT
l
=
b
其中 AAT 是 m×m 常数矩阵,根据给定条件,秩为 m,其逆存在
( ) 因而有: l = -2 AAT -1 b 代入 X 的表达式
=
2
ê ê
M
ú ú
êëxn úû
=
2X
êë ¶xn úû
2、向量函数的导数

d(XT X dX
)
=
2X
设函数
a(
X
)
=
éêa1 ê
( M
X
)
ù ú ú
êëam ( X )úû
, X = (x1 , x2 ,L , xn )T
定义 4
n×m 阶矩阵函数
é ¶a1( X )
ê ê
¶x1
êM
ê ê
¶a1
(
=
é ê ë
daiT (t dt
)
× bj (t) +
aiT
(t) ×
dbj (t) ù
dt
ú ûnl
=
dA(t) dt
× B(t)
+
A(t) ×
dB(t) dt
证毕
例 1:求 X T A X 对 t 的导数,其中
é x1(t) ù
X
=
ê ê
M
ú ú
êë xn (t)úû
A
=
é ê ê
a11 M
L O
¶xn
ú ú
êM O Mú
ê ê
¶a1
(
X
)
êë ¶x1
L
¶am
(
X
)
ú ú
¶xn úû
=
é ê êë
¶ai ¶x j
ù ú úûm n
=
da( X ) dX T
称之为 m 维向量函数 a( X ) 对 n 维横向量 XT 的导数。
………(1-7)
………(1-8) ………(1-9)
从定义可看出
daT ( X ) da( X ) dX ¹ dX T
相关文档
最新文档