矩阵行列式求导
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
矩阵函数求导
首先要区分两个概念:矩阵函数和函数矩阵
(1) 函数矩阵,简单地说就是多个一般函数的阵列,包括单变量和多变量函数。
函数矩阵的求导和积分是作用在各个矩阵元素上,没有更多的规则。 单变量函数矩阵的微分与积分
考虑实变量t 的实函数矩阵
()()()ij m n X t x t ×=,所有分量函数()ij x t 定义域相同。
定义函数矩阵的微分与积分
0()(),()().t t ij ij t t d d X t x t X d x d dx dx ττττ⎛⎞⎛⎞⎟⎜⎟⎜⎟==⎜⎟⎜⎟⎟⎜⎜⎟⎝⎠⎝⎠∫∫ 函数矩阵的微分有以下性质:
(1) ()()()()()d d d X t Y t X t t dt dt dt
+=+; (2) ()()()()()()()d dX t dY t X t Y t t X t dt dt dt
=+; 特殊情形
(a ) 若K 是常数矩阵,则()()()d d KX t K X t dt dt
=; (b ) 若()X t 是方阵,则2()()()()()d dX t dX t X t X t X t dt dt dt
=+; (3) ()
111()()()()d dX t X t X t X t dt dt =----; (4) 对任意的方阵A 和时变量t ,恒有At At At d e Ae e A dt
==; (5) 若AB BA =,则A B B A A B e e e e e +==。如果,A B 可交换,则许多三角不等
式可以推广到矩阵上。如sin(),sin(2)A b A +等。
参考文献:余鄂西,矩阵论,高等教育出版社。
(2) 矩阵函数,就是自变量为矩阵的函数映射;根据函数的自变量和因变量的
形式可分为多种。
矩阵函数的导数
定义(向量导数):映射:n m f →\\,()()12(),(),,()
(), 1...T m i f f x f x f x f x i m ===",
定义映射的导数为一个m n ×的偏导数矩阵 (), 1..., 1...i ij j df x Df i m j n dx ⎡⎤===⎢⎥⎣⎦. 例如 dAx A dx
=, ⇒
()()()(),,D f x g x Df x Dg x αβαβαβ⎡⎤+=+∈∈⎢⎥⎣⎦\\
()()''()()()D f g x f g x g x ⎡⎤=⎢⎥⎣⎦
''()()()()()(),,T T T n m D f x g x g x f x f x g x f g ⎡⎤=+∈→⎢⎥⎣⎦
\\ ⇒
()()T T T T T dx Ax x A Ax x A A dx
=+=+
定义(矩阵导数):
()vec ()()vec()
d A X dA X dX d X 有
符号说明
•d/dx (y)是一个向量,其第(i)个元素是dy(i)/dx
•d/d x (y) 是一个向量,其第(i)个元素是dy/dx(i)
•d/d x (y T) 是一个矩阵,其第(i,j)个元素是dy(j)/dx(i)•d/dx (Y) 是一个矩阵,其第(i,j)个元素是dy(i,j)/dx •d/d X (y) 是一个矩阵,其第(i,j)个元素是dy/dx(i,j)
注意 Hermitian 转置不能应用,因为复共轭不可解析,x,y是向量,X,Y是矩阵,x,y是标量。
在下面的表达中 A, B, C 是不依赖于 X的矩阵,a,b是不依赖于x的向量, 线性积
•d/dx (AYB) =A * d/dx (Y) * B
o d/dx (Ay) =A * d/dx (y)
•d/d x(x T A) =A
o d/d x(x T) =I
o d/d x(x T a) = d/d x(a T x) = a
•d/d X(a T Xb) = ab T
o d/d X(a T Xa) = d/d X(a T X T a) = aa T
•d/d X(a T X T b) = ba T
•d/dx (YZ) =Y * d/dx (Z) + d/dx (Y) * Z
二次积
•d/d x (Ax+b)T C(D x+e) = A T C(Dx+e) + D T C T(Ax+b)
o d/d x (x T Cx) = (C+C T)x
[C: symmetric]: d/d x (x T Cx) = 2Cx
d/d x (x T x) = 2x
o d/d x (Ax+b)T (D x+e) = A T (Dx+e) + D T (Ax+b)
d/d x (Ax+b)T (A x+b) = 2A T (Ax+b)
o[C: symmetric]: d/d x (Ax+b)T C(A x+b) = 2A T C(Ax+b)
•d/d X(a T X T Xb) = X(ab T + ba T)
o d/d X(a T X T Xa) = 2Xaa T
•d/d X(a T X T CXb) = C T Xab T + CXba T
o d/d X(a T X T CXa) = (C + C T)Xaa T
o[C:Symmetric]d/d X(a T X T CXa) = 2CXaa T
•d/d X((Xa+b)T C(Xa+b)) = (C+C T)(Xa+b)a T
三次积
•d/d x(x T Axx T) = (A+A T)xx T+x T AxI
逆
•d/dx (Y-1) = -Y-1d/dx (Y)Y-1