矩阵行列式求导

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

矩阵函数求导

首先要区分两个概念:矩阵函数和函数矩阵

(1) 函数矩阵,简单地说就是多个一般函数的阵列,包括单变量和多变量函数。

函数矩阵的求导和积分是作用在各个矩阵元素上,没有更多的规则。 单变量函数矩阵的微分与积分

考虑实变量t 的实函数矩阵

()()()ij m n X t x t ×=,所有分量函数()ij x t 定义域相同。

定义函数矩阵的微分与积分

0()(),()().t t ij ij t t d d X t x t X d x d dx dx ττττ⎛⎞⎛⎞⎟⎜⎟⎜⎟==⎜⎟⎜⎟⎟⎜⎜⎟⎝⎠⎝⎠∫∫ 函数矩阵的微分有以下性质:

(1) ()()()()()d d d X t Y t X t t dt dt dt

+=+; (2) ()()()()()()()d dX t dY t X t Y t t X t dt dt dt

=+; 特殊情形

(a ) 若K 是常数矩阵,则()()()d d KX t K X t dt dt

=; (b ) 若()X t 是方阵,则2()()()()()d dX t dX t X t X t X t dt dt dt

=+; (3) ()

111()()()()d dX t X t X t X t dt dt =----; (4) 对任意的方阵A 和时变量t ,恒有At At At d e Ae e A dt

==; (5) 若AB BA =,则A B B A A B e e e e e +==。如果,A B 可交换,则许多三角不等

式可以推广到矩阵上。如sin(),sin(2)A b A +等。

参考文献:余鄂西,矩阵论,高等教育出版社。

(2) 矩阵函数,就是自变量为矩阵的函数映射;根据函数的自变量和因变量的

形式可分为多种。

矩阵函数的导数

定义(向量导数):映射:n m f →\\,()()12(),(),,()

(), 1...T m i f f x f x f x f x i m ===",

定义映射的导数为一个m n ×的偏导数矩阵 (), 1..., 1...i ij j df x Df i m j n dx ⎡⎤===⎢⎥⎣⎦. 例如 dAx A dx

=, ⇒

()()()(),,D f x g x Df x Dg x αβαβαβ⎡⎤+=+∈∈⎢⎥⎣⎦\\

()()''()()()D f g x f g x g x ⎡⎤=⎢⎥⎣⎦

''()()()()()(),,T T T n m D f x g x g x f x f x g x f g ⎡⎤=+∈→⎢⎥⎣⎦

\\ ⇒

()()T T T T T dx Ax x A Ax x A A dx

=+=+

定义(矩阵导数):

()vec ()()vec()

d A X dA X dX d X 有

符号说明

•d/dx (y)是一个向量,其第(i)个元素是dy(i)/dx

•d/d x (y) 是一个向量,其第(i)个元素是dy/dx(i)

•d/d x (y T) 是一个矩阵,其第(i,j)个元素是dy(j)/dx(i)•d/dx (Y) 是一个矩阵,其第(i,j)个元素是dy(i,j)/dx •d/d X (y) 是一个矩阵,其第(i,j)个元素是dy/dx(i,j)

注意 Hermitian 转置不能应用,因为复共轭不可解析,x,y是向量,X,Y是矩阵,x,y是标量。

在下面的表达中 A, B, C 是不依赖于 X的矩阵,a,b是不依赖于x的向量, 线性积

•d/dx (AYB) =A * d/dx (Y) * B

o d/dx (Ay) =A * d/dx (y)

•d/d x(x T A) =A

o d/d x(x T) =I

o d/d x(x T a) = d/d x(a T x) = a

•d/d X(a T Xb) = ab T

o d/d X(a T Xa) = d/d X(a T X T a) = aa T

•d/d X(a T X T b) = ba T

•d/dx (YZ) =Y * d/dx (Z) + d/dx (Y) * Z

二次积

•d/d x (Ax+b)T C(D x+e) = A T C(Dx+e) + D T C T(Ax+b)

o d/d x (x T Cx) = (C+C T)x

[C: symmetric]: d/d x (x T Cx) = 2Cx

d/d x (x T x) = 2x

o d/d x (Ax+b)T (D x+e) = A T (Dx+e) + D T (Ax+b)

d/d x (Ax+b)T (A x+b) = 2A T (Ax+b)

o[C: symmetric]: d/d x (Ax+b)T C(A x+b) = 2A T C(Ax+b)

•d/d X(a T X T Xb) = X(ab T + ba T)

o d/d X(a T X T Xa) = 2Xaa T

•d/d X(a T X T CXb) = C T Xab T + CXba T

o d/d X(a T X T CXa) = (C + C T)Xaa T

o[C:Symmetric]d/d X(a T X T CXa) = 2CXaa T

•d/d X((Xa+b)T C(Xa+b)) = (C+C T)(Xa+b)a T

三次积

•d/d x(x T Axx T) = (A+A T)xx T+x T AxI

•d/dx (Y-1) = -Y-1d/dx (Y)Y-1

相关文档
最新文档