矩阵函数和函数矩阵
第四章 矩阵分析及矩阵函数
4.1 矩阵分析 4.2 矩阵函数 4.3 线性常系数微分方程 4.4 变系数微分方程组
4.1 矩阵分析
4.1.1基本概念 4.1.1基本概念 定义4 定义 4.1.1 令 A 1 , A 2 , L 是 m× n的矩阵序 × 列 , 假 如 存 在 一 个 ×n m×
k →∞
令 A 1 , A 2 , L是 m× n 矩阵序列 , × 矩阵序列,
构造部分和序列 A 1 , A1 + A 2 , A 1 + A 2 + A 3 ,L 假如其收敛到 A , 记
∞
∑A
∞
k
= A
k =1
则级数∑ A k ,收敛到 A .
k =1
定理4 (Cauchy收敛准则 收敛准则) 定理4.1.3 (Cauchy收敛准则) 收敛, ∑ A 收敛,当且仅当矩阵序列
∞
Ak
收敛, 收敛,则矩
k =1
特别地,对于方阵 A ,如果级数 ∑ 特别地, 收敛, 收敛,则矩阵幂级数 收敛. ∑ A 收敛.
k
∞
Ak
∞
k =1
k =1
定理4 定理 4.1.5
设幂级数
∑
∞
a k λk
的收敛半径 时 , 矩阵
k =0
是 R , 则当方阵 A 的范数 幂级数 ∑ a k A k 收敛。 收敛。
于是矩阵幂级数
1 1 2 1 3 I + A + A + A + LL 1! 2! 3!
1 2 1 4 I − A + A − LL 2! 4! 1 3 1 5 A − A + A − LL 3! 5!
MATLAB常用矩阵函数
1. 矩阵的构造与操作zeros 生成元素全为0的矩阵ones 生成元素全为1的矩阵eye 生成单位矩阵rand 生成随机矩阵randn 生成正态分布随机矩阵sparse 生成稀疏矩阵full 将稀疏矩阵化为普通矩阵diag 对角矩阵tril 矩阵的下三角部分triu 矩阵的上三角部分flipud 矩阵上下翻转fliplr 矩阵左右翻转MATLAB还能够构造一些常用的特殊矩阵2. 矩阵运算函数norm 矩阵或向量范数normest 稀疏矩阵(或大规模矩阵)的2-范数估计rank 矩阵的秩det 方阵的行列式trace 方阵的迹null 求基础解系(矩阵的零空间)orth 正交规范化rref 矩阵的行最简形(初等行变换求解线性方程组)subspace 计算两个子空间的夹角3. 与线性方程有关的矩阵运算函数inv 方阵的逆cond 方阵的条件数condest 稀疏矩阵1-范数的条件数估计chol 矩阵的Cholesky分解(矩阵的平方根分解)cholinc 稀疏矩阵的不完全Cholesky分解linsolve 矩阵方程组的求解lu 矩阵的LU分解ilu 稀疏矩阵的不完全LU分解luinc 稀疏矩阵的不完全LU分解qr 矩阵的正交三角分解pinv 矩阵的广义逆4. 与特征值或奇异值有关的矩阵函数eig 方阵的特征值与特征向量svd 矩阵的奇异值分解eigs 稀疏矩阵的一些(默认6个)最大特征值与特征向量svds 矩阵的一些(默认6个)最大奇异值与向量hess 方阵的Hessenberg形式分解schur 方阵的Schur分解。
矩阵论第七章函数矩阵与矩阵微分方程
矩阵论第七章函数矩阵与矩阵微分方程北京理工大学高数教研室* 第一章第一节函数第七章函数矩阵与矩阵微分方程函数矩阵定义: 以实变量的函数为元素的矩阵称为函数矩阵, 其中所有的元素都是定义在闭区间上的实函数。
函数矩阵与数字矩阵一样也有加法, 数乘, 乘法, 转置等几种运算, 并且运算法则完全相同。
例:已知计算定义:设为一个阶函数矩阵, 如果存在阶函数矩阵使得对于任何都有那么我们称在区间是可逆的。
称是的逆矩阵, 一般记为例 :已知那么在区间上是可逆的, 其逆为函数矩阵可逆的充分必要条件定理 : 阶矩阵在区间上可逆的充分必要条件是在上处处不为零, 并且其中为矩阵的伴随矩阵。
定义:区间上的型矩阵函数不恒等于零的子式的最高阶数称为的秩。
特别地, 设为区间上的阶矩阵函数, 如果的秩为 , 则称一个满秩矩阵。
注意:对于阶矩阵函数而言, 满秩与可逆不是等价的。
即:可逆的一定是满秩的, 但是满秩的却不一定是可逆的。
例 :已知那么。
于是在任何区间上的秩都是2。
即是满秩的。
但是在上是否可逆, 完全依赖于的取值。
当区间包含有原点时, 在上有零点, 从而是不可逆的。
函数矩阵对纯量的导数和积分定义:如果的所有各元素在处有极限, 即其中为固定常数。
则称在处有极限, 且记为其中如果的各元素在处连续, 即则称在处连续, 且记为其中容易验证下面的等式是成立的: 设则定义:如果的所有各元素在点处(或在区间上)可导, 便称此函数矩阵在点处(或在区间上)可导, 并且记为函数矩阵的导数运算有下列性质: 是常数矩阵的充分必要条件是设均可导, 则设是的纯量函数, 是函数矩阵,与均可导, 则特别地, 当是常数时有 (4) 设均可导, 且与是可乘的, 则因为矩阵没有交换律,所以 (5) 如果与均可导, 则 (6) 设为矩阵函数, 是的纯量函数, 与均可导, 则定义: 如果函数矩阵的所有各元素在上可积, 则称在上可积, 且函数矩阵的定积分具有如下性质: 例1 :已知函数矩阵试计算证明: 由于 , 所以下面求。
矩阵分析及矩阵函数
xi , 称为1 范数,
i 1
x
max
1in
xi
,
称为 范数,
n
1
x ( p
xi p ) p(, 1 p ), 称为p 范数,
i 1
n
1
当p=2时,x ( 2
xi 2 )2,称为2 范数,它是酉空间范数;
i 1
n
1
当xi为实数时,x 2 ( xi2 )2 为欧氏空间范数;
i 1
定义 设a1 ( X ), a2 ( X ), , am ( X )对xi的偏导数都存在, 定义向量函数aT ( X )对向量X的导数为
a1( X )
x1
daT ( X ) dX
a1 ( X x2
)
a1( X ) xn
a2 ( X ) x1
a2 ( X ) x2
a2 ( X ) xn
例 设 y 是Cm上的一种向量范数,给定矩阵ACmn ,
且矩阵A的n个列向量线性无关,对任意x (x1, , xn )T
Cn ,规定 x Ax ,则 x 是Cn中的向量范数。
证
(1)设A 1
,
...,
An是矩阵A的n个线性无关的列向量,
那么x=(x1,..., xn )T 0,有
Ax
( A1,..., An )(x1,..., xn )T
dX
dX dX
(2) d ( f ( X )g( X )) g( X ) df (X ) f ( X ) dg( X ) .
dX
dX
dX
向量函数对向量的微分
x1
a1( X )
设
X
x2
,
a(
X
第七章 矩阵函数
第七章 矩阵函数在定义了矩阵范数之后,便可以度量线性空间中矩阵的大小和矩阵间的接近程度,进而引入极限的概念,并基于此建立矩阵分析理论。
本章将介绍矩阵序列和矩阵级数的定义和收敛性判断,并给出矩阵函数的定义和计算方法。
§7.1 矩阵序列与极限本章中数域F 均指R (或C ),所讨论矩阵均为方阵,非方阵的情况按照相应的范数也可类似定义。
我们把n n ⨯阶矩阵序列12k ,,,,A A A ,简记为{}k A ,其中()()()11121()()()21222()()()12=k k k nk k k n k k k k n n nn a a a a a a a a a ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦A ,1,2,k = 显然,一个n n ⨯阶矩阵序列{}k A ()n n k ⨯∈A C 中各矩阵的所有对应位置构成n n⨯个数列{}()k ij a ,其中()(,1,2,,)k ij a C i j n ∈= 。
定义1 设矩阵序列{}k A (1,2,...k =),其中()()C k n n k ij a ⨯=∈A ,若n n ⨯个数列(){}(,1,2,...,)k ij a i j n =都收敛,即存在数ij a ∈C ,使得()lim ,,1,2,...,k ij ij k a a i j n →∞== 则称矩阵序列{}k A 是收敛的,并把矩阵()C n n ij a ⨯=∈A 称为{}k A 的极限,或称矩阵序列{}k A 收敛于A ,简记为lim k k →∞=A A 或()k k →→∞A A若这n n ⨯个数列(){}(,1,2,...,)k ij a i j n =中至少有一个不收敛,则称矩阵序列{}k A 是发散的。
例1 讨论22⨯阶矩阵序列{}k A 和{}k B 的敛散性,其中1sin (1)(1)1k k kk k kk⎡⎤+⎢⎥=⎢⎥-⎢⎥⎢⎥⎣⎦A ,1(0.5)2+1021k k k k k e k ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣-⎦B 1,2,k = 。
矩阵级数与矩阵函数
第七讲 矩阵级数与矩阵函数一、 矩阵序列1. 定义: 设有矩阵序列{}()k A , 其中()()()k k ij A a =, 且当k →∞时()k ij ij a a →, 则称{}()k A 收敛, 并把()ijA a =叫做{}()k A 的极限, 或称{}()k A 收敛于A , 记为()lim k k A A →∝= 或 ()k k A A →∝→不收敛的矩阵序列则称为发散的,其中又分为有界和无界的情况.2. 收敛矩阵序列的性质:设{}()k A ,{}()k B 分别收敛于A ,B 则(1) ()()k k k A B A B αβαβ→∝+→+(2) ()()k k k A B AB →∝→(3) ()11()k k A A --→∝→,若()11(),k A A --存在(4) ()k k PA Q PAQ →∝→3 收敛矩阵: 设A 为方阵,且当k →∝时0k A →, 则称A 为收敛矩阵.[定理] 方阵A 为收敛矩阵的充要条件是A 的所有特征值的模值均小于1.证明: 对任何方阵A ,均存在可逆矩阵P , 使得 1A PJP -= 其中J 为A 的Jordan 标准形12s J J J J ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦, 1010i iii J λλλ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦1112k kk k k s J J A PJ P P P J --⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦11!...(1)!(1)!,i k m kk i i i i i ki k k m k m J λλλ-+-⎡⎤⎢⎥--+⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦当i k m > 0k A →就等价于0(1,2,...,)k i J i s →=, 等价于0(1,2,...,)k i i s λ→=,而这只有1i λ<才可能也必能.[得证]二、 矩阵级数1.定义: 矩阵序列{}()k A 的无穷和(1)(2)()k A A A ++++叫做矩阵级数, 而()()1NN k k SA ==∑称为其部分和, 若矩阵序列{}()N S 收敛,且有极限S , 则称该级数收敛,且有和S . 记为()1k k A S ∝==∑ 不收敛的级数必为发散的.若矩阵级数()1k k A∝=∑的所有元素()1k ij k a ∝=∑均绝对收敛,则称该级数为绝对收敛.2. 绝对收敛矩阵级数的性质(1)绝对收敛级数一定收敛,且任意调换它的项所得的级数仍收敛,并具有相同的和.(2) ()1k k A ∝=∑绝对收敛,则()1k k PA Q ∝=∑也绝对收敛且等于()1k k P A Q ∝=∑(3) ()1k k A ∝=∑, ()1k k B ∝=∑均绝对收敛,且和分别为12,S S 则()(1)1211()ki k i k i AB S S ∝+-===∑∑三、 方阵的幂级数A 为方阵, 0,()kk k c A A I ∝==∑称为A 的幂级数. 0k k A ∝=∑称为A 的Neumann 级数.1. Neumann 级数收敛的充要条件[定理] Neumann 级数收敛的充要条件是A 为收敛矩阵,且在收敛时其和为1()I A --. 证明: [必要性]级数0k k A ∝=∑收敛, 其元素为23()()()ij ij ij ij A A A δ++++显然也是收敛的. 作为数项级数, 其通项趋于零是级数收敛的必要条件. 故()0k ij k A →∝→,即0k k A →∝→也就是说A 为收敛矩阵. [充分性]:A 为收敛矩阵, 则其特征值的模值均小于1. 设A 的特征值为λ, ()I A -的特征值为μ. 则由det(())det((1))(1)det((1))n I I A I A I A μμμ--=-+=---可见11μλμλ-=→=-故020μμ<<→≠, ()I A -的行列式不为零,1()I A --存在. 而21(...)()k k I A A A I A I A +++++-=- 右乘1()I A --得211...()()k k I A A A I A I A +-++++=--当k →∝时, 10k A +→, 故11()0k A I A +--→. 所以10lim ()kii k i i AA I A ∝-→∝====-∑∑即Neumann 级数收敛于1()I A --.2. 收敛圆[定理] 若矩阵A 的特征值全部落在幂级数0()k k k z c z ϕ∝==∑的收敛圆内, 则矩阵幂级数00(),()k k k A c A A I ϕ∝===∑是绝对收敛的. 反之, 若A 存在落在()z ϕ的收敛圆外的特征值, 则()A ϕ是发散的. 证明略.[推论] 若幂级数在整个复平面上收敛, 则对任何的方阵A , ()A ϕ均收敛.四、 矩阵函数 如: A e , sin A , cos A以矩阵为自变量的“函数”(实际上是“函矩阵”)我们知道, 201112!!znn e z z z n ∝==+++=∑210(1)sin()(21)!n n n z z n ∝+=-=+∑20(1)cos()(2)!n nn z z n ∝=-=∑均为整个复平面上收敛的级数, 故对任何的方阵A01!Ann e A n ∝==∑210(1)sin()(21)!nn n A A n ∝+=-=+∑20(1)cos()(2)!n nn A A n ∝=-=∑均绝对收敛. 三者分别称为矩阵指数函数、矩阵正弦函数、矩阵余弦函数。
矩阵函数的性质
2 主 要 结论
根据文献 [ ] 1 1页的说 明 , 2第 6 有下 面的结论 ( 录于下 , 摘 文字 稍有改 动 ) .
( )如 果 厂 z 一f ( ) 2z , 厂 A) 。A) f ( ; i i ( ) 。z +f ( ) 则 ( 一f ( + 2A) ( i 果 厂 z 一 f ( ) 2z , 厂 A) f ( f ( . i)如 i ( ) 。z f ( ) 则 ( 一 。A) 2A)
根 据这个 定义 , 显然 有 以下结 论 : 函数 厂( ) g z 在 矩 阵 A 的谱 d A) 有定 义 , 矩 阵 函数 设 2与 () ( 上 则 厂 A) ( 的充分必 要条件 是 厂 z 与 g z 在矩 阵 A 的谱 d A) 的值全 相 同. 别 , ( 一g A) () () ( 上 特 我们 总 可 以找 多 项式 pz , ( ) 使得
如果 函数 - ) 厂 在 ( 上有 定义 , ( A) 令
f2 ()ቤተ መጻሕፍቲ ባይዱ
f( 一 d)
-( ) 厂
…
’.
广
;
)
)
f( a)
厂 A) da { ( 1 , ( z , , ( } 一 , 厂 A) ( =P i 厂 J )f d ) … f d )P 称 ( 为对应 于 - ) g 厂 的矩阵 函数. (
文献 [ ] 出 了矩 阵函数 的定义 , 2给 摘录 于下 : 定 义 设 A∈C 的 J ra 标 准形 为 ‘ ig d ,。… , , od n , a { 。J , ‘ } 即存 在可逆 矩阵 P, 得 一d 『 , 使
矩阵函数知识点总结
矩阵函数知识点总结
一、矩阵函数的概念
矩阵函数指的是以矩阵为自变量的函数。
在矩阵函数中,矩阵被视为一个整体,即矩阵的元素相对整体而言是自变量,而不是单独的变量。
矩阵函数可以使用不同的方法来进行计算,比如按照矩阵的规定进行运算或者使用矩阵分解等方法。
矩阵函数在很多领域都有着广泛的应用,比如线性代数、微分方程、概率统计、物理学等等。
二、矩阵函数的性质
矩阵函数的性质包括可加性、齐性、乘积法则等。
其中可加性指的是如果一个函数的自变量是两个矩阵的和,那么函数值就等于这两个矩阵各自作为自变量的函数值的和;齐性指的是函数值的倍数等于自变量的倍数与函数值的积;乘积法则指的是函数值乘以一个矩阵的乘积等于矩阵乘积分别作为函数值的乘积。
三、求导、积分和极限
对于矩阵函数的求导、积分和极限等运算,在矩阵分析中都有着一些特殊的方法和规则。
比如对于矩阵函数的求导,使用分量法则可以将矩阵函数的求导规则推广到矩阵函数的情况;对于矩阵函数的积分,可以使用行列式和矩阵的性质来进行计算;而对于矩阵函数的极限,需要根据矩阵函数的性质和定义来进行推导和计算。
总之,矩阵函数是一种以矩阵为自变量的函数,它具有可加性、齐性、乘积法则等性质,并且在求导、积分和极限等运算中有着一些特殊的方法和规则。
矩阵函数在数学和实际问题中都有着广泛的应用,在线性代数、微分方程、概率统计、物理学等领域都有着重要的地位。
希望通过这篇文章的介绍,读者能够对矩阵函数有更深的理解,并且能够应用到实际问题中去。
矩阵函数
1.1.1 矩阵函数的定义定义1.1 设幂级数za kk k ∑+∞=0的r,且当∣z ∣<r 时,该幂级数收敛于f(z),即 f(z)=za kk k∑+∞=0,∣z ∣<r.如果A ∈cnn ⨯满足p(A)<r,则矩阵幂级数A a k k k∑+∞=0是绝对收敛的,其和称为矩阵函数,记为f(A),即f(A)= A a kk k∑+∞=0最常用的函数的幂级数展开有:∑∞+==!k kzk ze(+∞=r )z sin =z k k kk 120)!12()1(+∞+=∑-+(+∞=r )z cos =z kk kk 20!21-∑∞+=)()( (+∞=r ) ∑-+∞=-=1)1(k kz z (r=1)㏑(1+z)=z k k kk 10)1()1(+∞+=∑-+(r=1)根据定义1.1,它们所对应的矩阵函数为:∑∞+==0!k kAk Ae (c nn A ⨯∈∀)sin=Ak k kk 120)!12()1(+∞+=∑-+(cnn A ⨯∈∀)A cos=A kk kk 20!21-∑∞+=)()((c nn A ⨯∈∀) ∑-+∞=-=1)1(k kA A (p(A)<1)㏑(I+A)=Ak k kk 1)1()1(+∞+=∑-+( p(A)<1)(其中e A称为矩阵指数函数,sinA 称为矩阵正弦函数,cosA 称为矩阵余弦函数)定理1.1 假设∈A cnn ⨯,则有:(1) )sin(A -=-A sin ,A A cos )cos(=- (2) A i A e iAsin cos +=,A cos =21(ee iAiA -+),A sin =i21 (ee iAiA --).证明:(1)因为A sin =Ak k kk 120)!12()1(+∞+=∑-+,所以)sin(A -=)(A k k kk -)1(120)!12(+∞+=∑-+=Ak k kk 120)!12(-)1(+∞+=∑-+=A sin -,又因为A c o s =A kk kk 20!21-∑∞+=)()(,所以)(A -cos =)()()(A kk k k -1-20!2∑∞+==A kk kk 20!21-∑∞+=)()(=A cos ,因此证得。
常用矩阵函数
请特别注意红色字体的命令eye 单位矩阵zeros 全零矩阵ones 全1矩阵rand 均匀分布随机阵genmarkov 生成随机Markov矩阵linspace 线性等分向量logspace 对数等分向量logm 矩阵对数运算cumprod 矩阵元素累计乘cumsum 矩阵元素累计和toeplitz Toeplitz矩阵disp 显示矩阵和文字内容length 确定向量的长度size 确定矩阵的维数diag 创建对角矩阵或抽取对角向量find 找出非零元素1的下标matrix 矩阵变维rot90 矩阵逆时针旋转90度sub2ind 全下标转换为单下标tril 抽取下三角阵triu 抽取上三角阵conj 共轭矩阵companion 伴随矩阵det 行列式的值norm 矩阵或向量范数nnz 矩阵中非零元素的个数null 清空向量或矩阵中的某个元素orth 正交基rank 矩阵秩trace 矩阵迹cond 矩阵条件数inv 矩阵的逆rref 求矩阵的行阶梯形rcond 逆矩阵条件数lu LU分解或高斯消元法pinv 伪逆qr QR分解givens Givens变换linsolve 求解线性方程lyap Lyapunov方程hess Hessenberg矩阵poly 特征多项式schur Schur分解expm 矩阵指数expm1 矩阵指数的Pade逼近expm2 用泰勒级数求矩阵指数expm3 通过特征值和特征向量求矩阵指数funm 计算一般矩阵函数logm 矩阵对数sqrtm 矩阵平方根spec 矩阵特征值gspec 矩阵束特征值bdiag 块矩阵,广义特征向量eigenmar- 正则化Markov特征kov 向量pbig 特征空间投影svd 奇异值分解sva 奇异值分解近似cumprod 元素累计积cumsum 元素累计和hist 统计频数直方图max 最大值min 最小值mean 平均值median 中值prod 元素积sort 由大到小排序std 标准差sum 元素和trapz 梯形数值积分corr 求相关系数或方差sparse 稀疏矩阵adj2sp 邻接矩阵转换为稀疏矩阵full 稀疏矩阵转换为全矩阵mtlb_sparse 将scilab稀疏矩阵转换为matlab稀疏矩阵格式sp2adj 将稀疏矩阵转换为邻接矩阵speye 稀疏矩阵方式单位矩阵sprand 稀疏矩阵方式随机矩阵spzeros 稀疏矩阵方式全零阵lufact 稀疏矩阵LU分解lusolve 稀疏矩阵方程求解spchol 稀疏矩阵Cholesky分解1、将四个顶点的坐标写成如下形式:1 -1 -1 11 1 -1 -12、再写成齐次坐标形式,从而构成一个矩阵:A =1 -1 -1 11 1 -1 -11 1 1 13、向量缩放:采用数乘的方法,k = 0.8000各点齐次坐标为:A =0.8 -0.8 -0.8 0.80.8 0.8 -0.8 -0.80.8 0.8 0.8 0.84、旋转:采用如下的变换矩阵:X=[cos(fai) -sin(fai) 0sin(fai) cos(fai) 00 0 1]X*A即为旋转后的齐次坐标。
函数和矩阵:矩阵的运算和应用
函数和矩阵:矩阵的运算和应用函数和矩阵是数学中重要的概念和工具。
函数是描述变量之间关系的一种数学表达方式,而矩阵则是一种方阵形式的数组,可用于表示多个变量和它们之间的线性关系。
本文将介绍函数和矩阵的基本概念,并讨论它们在数学和实际应用中的运算和应用。
一、函数的定义和性质函数是将一个数集映射到另一个数集的规则。
通常用f(x)表示函数,其中x是自变量,f(x)是因变量。
函数可以是显式定义的,也可以是隐式定义的。
例如,y = f(x) = 2x+1是一个显式函数,而x^2 + y^2 = 1则是一个隐式函数。
函数具有许多重要性质,包括定义域、值域、单调性等。
定义域是函数的自变量可取值的范围,值域则是函数的因变量的可能取值。
单调性描述了函数的增减情况,可以分为递增和递减两种。
二、矩阵的定义和运算矩阵是一个按照长方形排列的数表,可以用于表示线性关系和进行线性变换。
矩阵由行和列组成,通常用大写字母表示。
例如,A是一个m行n列的矩阵,可以表示为A=[a_ij],其中1≤i≤m,1≤j≤n。
矩阵的运算包括加法、减法和乘法等。
矩阵加法是将两个矩阵对应位置的元素相加得到新矩阵,矩阵减法则是将对应位置的元素相减。
矩阵乘法是将矩阵的行与列按照一定规则相乘并相加得到新矩阵。
三、矩阵的应用矩阵在数学和实际应用中有广泛的应用。
在数学中,矩阵可用于求解线性方程组和描述线性变换。
通过矩阵求解线性方程组可以简化计算过程,而线性变换可应用于几何、物理等领域的模型建立和分析。
在实际应用中,矩阵可用于数据处理和图像处理。
例如,矩阵与向量的乘法可用于对数据进行线性变换,提取数据的特征。
矩阵还可以表示图像的像素值,通过矩阵运算可以对图像进行模糊、锐化等处理。
另外,矩阵还可应用于网络分析和优化问题。
例如,在社交网络中,矩阵可用于描述用户之间的关系,通过矩阵运算可以发现社交网络中的影响力节点和社群结构。
在优化问题中,矩阵可用于表示约束条件和目标函数,通过矩阵运算可以求解最优解。
矩阵函数及函数矩阵矩阵函数及函数矩阵
第六章矩阵矩阵函数及函数矩阵函数及函数矩阵第一节矩阵多项式、最小多项式定义:设nn m m mm CA a a a a p ⨯--∈++++=,)(0111λλλλ m m1-则称E a A a A a A a A p m m 011)(++++=- 为A 的矩阵多项式.块i ⎥⎤⎢⎡λλ1例1:设J i 为d i 阶Jordan ii J ⎥⎥⎥⎢⎢⎢=1 iidd i ⨯⎦⎣λJ d di ()例2:设J 为Jordan 标准形, J =diag(J 1, J 2, , J r ), 则:diag J J J J =))(,),(),((g )(21r p p p p 例3:设A 为n 阶矩阵, J 为其Jordan 标准形, A =PJP -1=P diag(J 1, J 2, , J r )P -1,则:11--== (以上表达式称为p (A )的Jordan 表示)21))(,),(),((diag )()(PJ p J p J p P P J Pp A p r 例4:设34,12)(-+-=p λλλλ1020*********-⎥⎥⎤⎢⎡=⎥⎥⎤⎢⎡=PP A 200311⎦⎢⎣⎦⎢⎣-⎥⎤⎢⎢⎡-=⎥⎤⎢⎡=-111010,0011101P P 其中:⎥⎥⎦⎢⎣-⎥⎥⎦⎢⎢⎣-110101则:=-)()(1PJ Pp A p ⎤⎡-⎤⎡'⎤⎡0100)2()2(0110p p ⎥⎥⎦⎢⎢⎣-⎥⎥⎦⎢⎢⎣⎥⎥⎦⎢⎢⎣-=0110111)2(000)2(010101p p ⎥⎤⎢⎡--=⎥⎥⎤⎢⎢⎡''-'''-'=98901)2()2()2()2(00)2(p p p p p ⎥⎦⎢⎣⎦⎣+1099)2()2()2()2(p p p p定义:设0111)(,a a a a p C A m m m m nn ++++=∈--⨯λλλλ 若-满足则称(λ)为A 的化零多项式.0)(0111=++++=-E a A a A a A a A p m m mm p 定理:设是A 的化零多项)det()(,A E D CA nn -=∈⨯λλ则式,即D (A ) =0. (Hamilton Hamilton--Cayley 定理)))))证明:设J =diag(J 1(λ1), J 2(λ2), , J r (λr )) 是A 的若当标准型,即A =PJP -1=P diag(J 1, J 2, , J r )P -1, 则:1211))(,),(),((diag )()(--==PJ D J D J D P P J PD A D r)()()(λλλλf p id i i -=⇒id 即: Jordan 块的最小多项式为其初等因子.ii J )()(λλλψ-=⇒定理:设, 则:的任一化零多项式都能被nn CA ⨯∈(1)A 的任化零多项式都能被ψA (λ)整除;(2)A 的最小多项式ψA (λ)是唯一的;(3)相似矩阵的最小多项式相同证明:(1) 设f (λ)为A 的化零多项式, 则∃多项式q (λ)及次数小于ψA (λ)次数的多项式r (λ),使)()()()(λλλψλr q f A +=⇒)()()()(=+=A r A q A A f A ψ即: r (λ)也是A 的化零多项式. 从而r (λ) =0, 否则与ψA (λ)为A 0)(=A r 再由⇒)(=A A ψ的最小多项式矛盾,因为r (λ)的次数<ψA (λ)的次数.(2)(2)设ψA (λ)及ξA (λ)都为A 的最小多项式, 则ψA (λ)能被ξA (λ)整除, ξA (λ)也能被ψA (λ)整除,从而ψA (λ) =ξA (λ).(3) 设B =P -1AP , A 和B 的最小多项式为p (λ)和q (λ). 由B =-1)=-1=0,P AP 知:p (B ) P p (A )P 0, 从而p (λ)是B 的化零多项式, p (λ)的次数≥q (λ)的次数.同理, q (λ)的次数≥p (λ)的次数.))所以p (λ)的次数=q (λ)的次数.从而, p (λ) =q (λ).定理:定理:设分别是的最小多项式,则A 的最小多项式是)(,),(),(),,,,(diag 2121λψλψλψs s A A A A =s A A A ,,,21 的最低公倍式.)(,),(),(21λψλψλψs 证明:设是A 的最小多项式, 则:)(λψA 0))(,),(),((diag )(21==s A A A A A A A A ψψψψ 于是: , 即0)(,,0)(,0)(21===s A A A A A A ψψψ )(λψA ))是的化零多项式⇒是的公倍式.s A A A ,,,21 )(,λψs )(λψA ),(),(21λψλψ⇒若不是的公倍式,:)(,),(),(21λψλψλψs )(λψA 则0)(≠A A ψ另一方面, 若是的最低公倍式,则: .从而是A 的化零多项式. 次数)(λψA )(,),(),(21λψλψλψs 0)(=A A ψ)(λψA 更低的多项式必定不是的公倍式,从而不是A 的化零多项式.定理得证.)(,),(),(21λψλψλψs ⎥⎤⎢⎢⎡=⎥⎤⎢⎡---=11621例5:⎥⎥⎦⎢⎣→⎥⎥⎦⎢⎢⎣--11411301)1(J A 2)1()(-=λλψA ⇒⎤⎡-⎤⎡-1111⎥⎥⎦⎢⎢=→⎥⎥⎢⎢--=01017215)2(J A ⎥⎢⎣⎥⎦⎢⎣-212662)1()(λλλψ+=A ⇒J d 第二节矩阵函数及其Jordan 表示定义:设A 的最小多项式为,)()()()(2121sd s d d A λλλλλλλψ---= 其中为A 的互异特征值. 若函数f (x )具有足够多且下列s λλλ,,,21 d d d m +++= 阶的导数值,个值),,2,1(),(,),(),()1(s i ff f i d i i i ='-λλλs 21都有确定的值,则称f (x )在A 的影谱上有定义.-⎡-111例1:⎥⎥⎤⎢⎢⎡--=⎥⎥⎤⎢⎢-=112103,0340B A ⎥⎦⎢⎣-⎥⎦⎢⎣30201p(x)不唯一例2:⎤⎡⎤⎡⎥⎤⎡11012002⎥⎥⎥⎦⎢⎢⎢-=⎥⎥⎥⎦⎢⎢⎢==⎥⎥⎢⎢⎢-=-101001,22,3111111P J PJP A ⎣⎣⎦⎣⎤⎡⎤⎡'010)2()2(f f ⎥⎥⎥⎦⎢⎢⎢--=⎥⎥⎥⎢⎢⎢=-110111,)2()2()(1P f f J f ⎣⎦⎣⎤⎡00)2(f ⎥⎥⎥⎢⎢⎢'+'-'''-'==-2222)2()2()2()2()()(1f f f f P J Pf A f ⎦⎣)()()()(f f f fA e At cos 例3:求f (A )的Jordan 表示, 并计算e , e , cos A⎡50⎥⎥⎤⎢⎢⎡=⎥⎥⎦⎤⎢⎢⎡==⎥⎥⎤⎢⎢--=-13000120,2123,130903025171P J PJP A ⎦⎣⎣⎦⎣⎡1⎥⎥⎤⎢⎢⎡--=⎥⎥⎦⎤⎢⎢'=-50320100,2()2()2()3()(1P f f f J f ⎡''⎦⎣⎣)f ⎥⎥⎤⎢⎢'-'-+==-21520290)3(0)2(250)2(15)2()()(1f f f f P J Pf A f ⎦⎣)()()(f f f⎡⎥⎥⎤⎢⎢--+=⎥⎥⎦⎤⎢⎢⎡--=1510900250)151(,140900250162232222322t e te e te t e e e e ee e e tt t t t At A ⎥⎦⎢⎣⎣)(⎤⎡-()2sin(250)2sin(15)2cos((⎥⎥⎦⎢⎢⎣+-=)2sin(15)2cos(0)2sin(90)3cos(0)cos(A •用矩阵函数Jordan 表示计算f (A )的一般步骤:(1) 求A 的Jordan 标准形J ; (2) 求f (J );(3) 由AP =PA 计算变换矩阵P ; (4) 求f (A ) =Pf (J )P -1;(5) x Pf J P -1A ).()将具体f ()代入f ()即可求出f ()定理:设f (x )与g (x )在A 的影谱上有定义, 则:f (A ) =g (A ) ⇔f (x )与g (x )在A 的影谱上有相同的值第三节矩阵函数的多项式表示定义:设n 阶矩阵A 的最小多项式为,)()()()(2121sd s d d A λλλλλλλψ---= , 函数f (x )在A 的影谱上有定义, m -1次多项式s d d d m +++= 21满足1110)(--+++=m m a a a p λλλ 为什么是m -1次?1,,1,0;,,2,1),()()()(-===i i k i k d k s i fp λλ从而:1110)()(--+++==m m Aa A a E a A p A f 称f (A )的以上表达式为f (A )的多项式表示.⎡0例1: 设, 求矩阵函数f (A )的多项式表示,⎥⎤⎢=11102A 并计算e At⎥⎥⎦⎢⎢⎣-311解:前已求得, A 的Jordan 标准形为:⎥⎥⎤⎢⎢⎡=020012J 因此, 其最小多项式为(x ) =(x -2)2⇒m =2 ⇒⎥⎦⎢⎣200ψA 110)()(a x p x a a x p ='⇒+=满足:⎨⎧''-=⇒⎨⎧''=+=)2(2)2()2(2)2(010a f f a f a a p ⎩=⎩==)2()2()2(11f f a p从而:AE A a E a A 2222'+'-=+=f f f f )()]()([)(10此即f (A )的多项式表示. 将E 和A 代入, 可得:⎤⎡⎥⎢''-'=)2()2()2()2(00)2()(f f f f f A f ⎥⎥⎦⎢⎢⎣'+'-')2()2()2()2(f f f f 与第一节例4t 的结果相同⎡当f (x ) =e tx时, f (2) =e 2t , f'(x ) =t e 2t , 从而⎥⎥⎤⎢⎢-=t t t t e et At110012⎥⎦⎢⎣+-t t⎡1例2: 设, 求矩阵函数f (A )的多项式表示.⎥⎤⎢--=03401A 解)⎥⎥⎦⎢⎢⎣201解:前已求得, A 的最小多项式为ψA (x ) =(x -1)2(x -2)xa a x p x a x a a x p m 2122102)(,)(312+='++=⇒=+=⇒满足:'⎧⎪⎨⎧-'+=-=⇒⎪⎨'=+='=++=)2(2)1(3)1(2)1(2)2()1(2)1()1()1(1021210f f f a f f a f a a p f a a a p ⎪⎩'--=⎪⎩=++=)1()1()2()2(42)2(2210f f f a f a a a p=++=2210)(A a A a E a A f(m -1次)sd s )λ1-i d因此:⎤⎡+-+sk k k E A a E a 21)(λ ∑=-⎥⎥⎦⎢⎢⎣-+==k k d k kd A E A a A p A f kk11)()()()(ϕλsk k d s d k d k d k E A E A E A E A A )()()()()(111111λλλλϕ----=+-+- 称以上f (A )的表达式为f (A )的Lagrange-Selvester 内插多项式表示.3:设⎥⎤⎢⎡002例3: , 求矩阵函数f (A )的Lagrange-⎥⎥⎦⎢⎢⎣-=311111A Selvester 内插多项式表示.•与例1得到的多项式表示Af E f f A a E a A f )2()]2(2)2([)(10'+'-=+=相比, 结果是一致的, 只是表示方式不一样.第四节矩阵函数的幂级数表示第五章定义过矩阵幂级数. 设A 的Jordan 标准 -1∑∞=0k kk A c 形J =diag(J 1(λ1),J 2(λ2),,J r (λr )),A =PJP ⇒A k =PJ k P -1=P diag(J 1k (λ1), J 2k (λ2), , J r k (λr ))P -1⇒⎛100220110)(,,)(,)(diag -∞=∞=∞=∞=⎪⎪⎭⎫ ⎝=∑∑∑∑P J c J c J c P A c k r kr k k k k k k k k k k λλλ i i kk d k id k k k k ikk k k ik Cc C c c ∞∞=+--∞=-∞=⎥⎤⎢⎡∑∑∑0110110λλλk k k ik k k ik k i ki k C c c J c ∞=-=∞=⎥⎥⎥⎢⎢⎢=∑∑∑01100)(λλλiidd k ikc ⨯∞=⎥⎦⎢⎣∑0λ与前页结果相同⎥⎤⎢⎡1310041285⎥⎥⎦⎢⎢⎣-511第五节函数矩阵⎛x a x a 定义:设()⎪⎪⎫ ==⨯)()()()(111a x a x A n nm ij 其中: x ∈R , a ij (x )∈R , 称A (x )为函数矩阵——以实函数为⎪⎭⎝)()(1x x a mn m 元素的矩阵•函数行向量、函数列向量、函数矩阵的转置函数矩阵加法纯量函数与函数矩阵乘法函数矩阵与•函数矩阵加法、纯量函数与函数矩阵乘法、函数矩阵与函数矩阵乘法))))定义:设A (x ) =(a ij (x ))为n 阶函数矩阵, 若∃B (x ) =(b ij (x )), 使得∀x ∈[a , b ],A xB x ) =B x A x ) =E ()()()()则称A (x )在[a, b ]上可逆, B (x )是A (x )的逆的逆矩阵矩阵, 记为A -1(x ).x A x B x B x )()()]()+=x d ?)(d )(2)(d 2x A x A x A =d d xx ,可逆时()21)(x A -A x A x A x x A x A x d )()(d )(d )()(211---≠-=))()((1得到可由E x A x A =-。
矩阵函数与矩阵值函数ppt课件
7.1.2 矩阵函数的另一种定义
设矩阵A的最小多项式为
m () ( 1 ) m 1 ( 2 ) m 2 ( k ) m k ( 7 .1 .1 )6
其中 1,2,,k为 A的 k个 互 异.对 特任 征意 值
f(z),如 果
f(i)f, (i) ,,f( m i 1 )(i) ,i 1 ,2 , ,k
b
A(x)d
a
x
b
aij(x)dx
a
为 A(x)在[a,b]上的积分。
矩阵值函数的积分具有如下性质:
b
b
b
( 1 )a [A (x ) B (x )d ] x aA (x ) d x aB (x ) d ;x
(2 )对k 常 R ,有 b 数 k(x A )d x kbA (x )d;x
sin(
A
)
sin
A
定理7.1.1 设 A C n n ,如 A B 果 B ,则 A
eA eBeB eAeA B
推论 7.1.1 设 A C n n ,则 ( 1 )e A e A e A e A I ,( e A ) 1 e A ;
(2) 设 m 为,整 则 (eA )m 数 em.A
定理7.1.4 设 1,2,,k是 k个 互,m 异 1,m2,数 ,mk
k
是 k个 正 整 m 数 mi.给 且定 一 组 数 i1 fi,0 ,fi,1 , ,fi,m i 1 , i 1 ,2 , ,k
则 存 在 次 m的 数多 小p项 于 ()使 式得
p ( j ) (i) f i ,j,i 1 , ,k , j 0 , 1 , ,m i 1 ( 7 . 1 . 2 )
其中
f(i)
矩阵论-第六章--矩阵函数
(1)
3 2 2 3 0 8 1 (2) B 8 2 A 3 1 6 2 14 3 2 0 5
1 2 6 (3) C 1 0 3 1 1 4
求其最小多项式。
解:注意到其特征多项式为 f ( ) ( i ) 则由上面的定理可知其最小多项式
di
,
m( )
一定具有如下形状 m() ( i )k 其中 1 k di。 但是当 k di 时 m( J i ) ( J i i I ) k
0 0 0 0 0 1 0 0 0 1 Odi di 0 0
f (1) sin1, f (1) cos1
'
同样可得
4 3
与矩阵
3 0 8 A 3 1 6 2 0 5 求 f ( A) 。
解:首先求出矩阵的 A 的Jordan标准形 J 及其相 似变换矩阵 P
1 0 0 J 0 1 1 0 0 1
0 4 1 P 1 3 0 0 2 0
(2)矩阵的任何一个零化多项式均能被m ( )
整除。
(3)相似矩阵有相同的最小多项式。 如何求一个矩阵的最小多项式?首先我们考 虑Jordan标准形矩阵的最小多项式。 例1 :已知一个Jordan块
i Ji
1
i
1 i di di
3 0 (4) D 0 0
1 3 0 0
0 0 3 0
0 0 0 5
解: (1)首先求出其Jordan标准形为
第4讲(1)矩阵序列与矩阵函数
=
⎜ ⎜⎜⎝
0 1
1 1
0 0
⎟ ⎟⎟⎠
⎜ ⎜⎜⎝
0 0
sin 2 0
cos sin
2 2
⎟ ⎟⎟⎠
⎜ ⎜⎜⎝
0 1
1 1
−01⎟⎟⎟⎠
⎛ sin 2
0
0⎞
=
⎜ ⎜⎜⎝
cos cos
2 2
sin 2 + cos 2 cos 2
− cos 2 sin 2 − cos
2
⎟ ⎟⎟⎠
⎛ 1 0 1⎞ ⎛ e2t 0 0 ⎞ ⎛ 0 −1 1 ⎞
lim A(k ) = A.
k→∞
若对某一组i和j,aij(k)不收敛,则称{A(k)}发散.
3
性质1:设A(k)和B(k)分别收敛到A和B,则 limα A(k) + β B(k) = α A + β B,
k→∞
lim A(k )B(k ) = AB.
k→∞
性质2:设A(k)收敛到A,且A(k)和A都可逆,则
n 阶矩阵 A的谱半径为 ρ ( A),P −1 AP = J
∞
∑ 则当 ρ( A) < R 时,幂级数 ak Ak 收敛, 且 k=0
∑⎡
⎢
∞
a
k
J
k 1
⎤ ⎥
∑∞
ak Ak
=
⎢k=0 P⎢
O
⎥ ⎥
P
−1
k=0
⎢
⎢⎣
∑∞
k=0
ak
J
k s
⎥ ⎥⎦
17
18
3
⎡J1
⎤
P −1 AP
=
J
=
⎢ ⎢
矩阵函数和函数矩阵
矩阵函数求导首先要区分两个概念:矩阵函数和函数矩阵(1) 函数矩阵,简单地说就是多个一般函数的阵列,包括单变量和多变量函数。
函数矩阵的求导和积分是作用在各个矩阵元素上,没有更多的规则。
单变量函数矩阵的微分与积分考虑实变量t 的实函数矩阵()()()ij m n X t x t ×=,所有分量函数()ij x t 定义域相同。
定义函数矩阵的微分与积分0()(),()().t t ij ij t t d d X t x t X d x d dx dx ττττ⎛⎞⎛⎞⎟⎜⎟⎜⎟==⎜⎟⎜⎟⎟⎜⎜⎟⎝⎠⎝⎠∫∫ 函数矩阵的微分有以下性质:(1) ()()()()()d d d X t Y t X t t dt dt dt+=+; (2) ()()()()()()()d dX t dY t X t Y t t X t dt dt dt=+; 特殊情形(a ) 若K 是常数矩阵,则()()()d d KX t K X t dt dt=; (b ) 若()X t 是方阵,则2()()()()()d dX t dX t X t X t X t dt dt dt=+; (3) ()111()()()()d dX t X t X t X t dt dt =----; (4) 对任意的方阵A 和时变量t ,恒有At At At d e Ae e A dt==; (5) 若AB BA =,则A B B A A B e e e e e +==。
如果,A B 可交换,则许多三角不等式可以推广到矩阵上。
如sin(),sin(2)A b A +等。
参考文献:余鄂西,矩阵论,高等教育出版社。
(2) 矩阵函数,就是自变量为矩阵的函数映射;根据函数的自变量和因变量的形式可分为多种。
矩阵函数的导数定义(向量导数):映射:n m f →\\,()()12(),(),,()(), 1...T m i f f x f x f x f x i m ===",定义映射的导数为一个m n ×的偏导数矩阵 (), 1..., 1...i ij j df x Df i m j n dx ⎡⎤===⎢⎥⎣⎦. 例如 dAx A dx=, ⇒()()()(),,D f x g x Df x Dg x αβαβαβ⎡⎤+=+∈∈⎢⎥⎣⎦\\()()''()()()D f g x f g x g x ⎡⎤=⎢⎥⎣⎦''()()()()()(),,T T T n m D f x g x g x f x f x g x f g ⎡⎤=+∈→⎢⎥⎣⎦\\ ⇒()()T T T T T dx Ax x A Ax x A A dx=+=+定义(矩阵导数):()vec ()()vec()d A X dA X dX d X 有符号说明•d/dx (y)是一个向量,其第(i)个元素是dy(i)/dx•d/d x (y) 是一个向量,其第(i)个元素是dy/dx(i)•d/d x (y T) 是一个矩阵,其第(i,j)个元素是dy(j)/dx(i)•d/dx (Y) 是一个矩阵,其第(i,j)个元素是dy(i,j)/dx •d/d X (y) 是一个矩阵,其第(i,j)个元素是dy/dx(i,j)注意 Hermitian 转置不能应用,因为复共轭不可解析,x,y是向量,X,Y是矩阵,x,y是标量。
函数与矩阵的概念和性质
函数与矩阵的概念和性质函数是一种数学对象,描述了输入与输出之间的关系。
一个函数通常由三个要素组成:定义域、值域和对应关系。
函数通常表示为f(x),其中x是定义域的元素,f(x)是x在函数中对应的值。
矩阵是一个由m行n列元素组成的矩形阵列。
每个元素可以是实数、复数或其他数学对象。
一个矩阵的大小通常表示为m x n,其中m是矩阵的行数,n是矩阵的列数。
函数和矩阵有许多重要的概念和性质。
下面我将对其中一些进行详细介绍。
1.函数的复合:给定两个函数f(x)和g(x),它们的复合函数(g∘f)(x)定义为先应用f(x),然后将结果作为g(x)的输入。
复合函数可以用来描述多个函数的组合效果。
2.函数的反函数:对于一个函数f(x),如果存在一个函数g(x),使得f(g(x))=x,且g(f(x))=x对于定义域和值域中的所有元素成立,那么g(x)就是f(x)的反函数。
反函数可以用来将函数的输出映射回输入。
3.矩阵的乘法:给定两个矩阵A和B,它们的乘积A B定义为将A的每一行与B的每一列进行逐个元素的乘法,然后将乘积相加得到的结果。
矩阵乘法可以用来描述线性变换的组合效果。
4.矩阵的转置:给定一个矩阵A,它的转置矩阵A^T定义为将A的行与列进行交换所得到的矩阵。
转置操作可以改变矩阵的形状,同时保持矩阵的性质不变。
5.矩阵的逆:对于一个方阵A,如果存在一个矩阵B,使得A B=B A=I,其中I是单位矩阵,那么B就是A的逆矩阵。
逆矩阵可以用来将矩阵的乘法操作逆转回来。
6.矩阵的行空间和列空间:给定一个矩阵A,它的行空间是由A的行向量张成的向量空间,而列空间是由A的列向量张成的向量空间。
行空间和列空间可以用来描述矩阵所表示的线性变换的影响。
7.矩阵的秩:给定一个矩阵A,它的秩是指A中线性无关的行或列的最大数量。
秩可以用来描述矩阵的线性相关性和维度。
8.矩阵的特征值和特征向量:给定一个方阵A,如果存在一个标量λ和一个非零向量x,使得A x=λx,那么λ就是A的一个特征值,x就是对应于λ的特征向量。
微积分中的矩阵函数应用
微积分中的矩阵函数应用矩阵是数学中的一个重要概念,矩阵函数则是矩阵中的一类重要运算。
矩阵函数运算的作用是将矩阵与一个函数进行组合,得到一个新的矩阵。
在微积分中,矩阵函数应用极为广泛,本篇文章将对微积分中的矩阵函数应用进行简要介绍。
一、矩阵函数的定义及特点矩阵函数是指将矩阵与一个函数进行组合得到一个新的矩阵的运算,记作$f(A)$,其中$f(x)$是一个函数,$A$是一个矩阵。
矩阵函数的特点是:矩阵函数是一个矩阵,其元素为函数值,而不是常数。
例如,设$f(x)=x^2$,$A=\begin{bmatrix} 1 & 2 \\ 3 & 4\end{bmatrix}$,则$f(A)=\begin{bmatrix} 1^2 & 2^2 \\ 3^2 & 4^2 \end{bmatrix}=\begin{bmatrix} 1 & 4 \\ 9 & 16 \end{bmatrix}$。
二、矩阵函数的求导及应用对于可导函数$f(x)$,矩阵函数$f(A)$的导数也存在。
其中,矩阵函数$f(A)$的导数定义为$\frac{d}{dA}f(A)$,表示当$A$沿某个方向变化时,矩阵函数的变化率。
矩阵函数的导数是一个矩阵,其元素为函数的导数。
例如,设$f(x)=x^2$,$A=\begin{bmatrix} 1 & 2 \\ 3 & 4\end{bmatrix}$,则$\frac{d}{dA}f(A)=\begin{bmatrix}\frac{df(A)}{dA_{11}} & \frac{df(A)}{dA_{12}} \\\frac{df(A)}{dA_{21}} & \frac{df(A)}{dA_{22}}\end{bmatrix}=\begin{bmatrix} 2A_{11} & 2A_{12} \\ 2A_{21} &2A_{22} \end{bmatrix}=\begin{bmatrix} 2 & 4 \\ 6 & 8\end{bmatrix}$。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
矩阵函数求导
首先要区分两个概念:矩阵函数和函数矩阵
(1) 函数矩阵,简单地说就是多个一般函数的阵列,包括单变量和多变量函数。
函数矩阵的求导和积分是作用在各个矩阵元素上,没有更多的规则。
单变量函数矩阵的微分与积分
考虑实变量t 的实函数矩阵
()()()ij m n X t x t ×=,所有分量函数()ij x t 定义域相同。
定义函数矩阵的微分与积分
0()(),()().t t ij ij t t d d X t x t X d x d dx dx ττττ⎛⎞⎛⎞⎟⎜⎟⎜⎟==⎜⎟⎜⎟⎟⎜⎜⎟⎝⎠⎝⎠∫∫ 函数矩阵的微分有以下性质:
(1) ()()()()()d d d X t Y t X t t dt dt dt
+=+; (2) ()()()()()()()d dX t dY t X t Y t t X t dt dt dt
=+; 特殊情形
(a ) 若K 是常数矩阵,则()()()d d KX t K X t dt dt
=; (b ) 若()X t 是方阵,则2()()()()()d dX t dX t X t X t X t dt dt dt
=+; (3) ()
111()()()()d dX t X t X t X t dt dt =----; (4) 对任意的方阵A 和时变量t ,恒有At At At d e Ae e A dt
==; (5) 若AB BA =,则A B B A A B e e e e e +==。
如果,A B 可交换,则许多三角不等
式可以推广到矩阵上。
如sin(),sin(2)A b A +等。
参考文献:余鄂西,矩阵论,高等教育出版社。
(2) 矩阵函数,就是自变量为矩阵的函数映射;根据函数的自变量和因变量的
形式可分为多种。
矩阵函数的导数
定义(向量导数):映射:n m f →\\,()()12(),(),,()
(), 1...T m i f f x f x f x f x i m ===",
定义映射的导数为一个m n ×的偏导数矩阵 (), 1..., 1...i ij j df x Df i m j n dx ⎡⎤===⎢⎥⎣⎦. 例如 dAx A dx
=, ⇒
()()()(),,D f x g x Df x Dg x αβαβαβ⎡⎤+=+∈∈⎢⎥⎣⎦\\
()()''()()()D f g x f g x g x ⎡⎤=⎢⎥⎣⎦
''()()()()()(),,T T T n m D f x g x g x f x f x g x f g ⎡⎤=+∈→⎢⎥⎣⎦
\\ ⇒
()()T T T T T dx Ax x A Ax x A A dx
=+=+
定义(矩阵导数):
()vec ()()vec()
d A X dA X dX d X 有
符号说明
•d/dx (y)是一个向量,其第(i)个元素是dy(i)/dx
•d/d x (y) 是一个向量,其第(i)个元素是dy/dx(i)
•d/d x (y T) 是一个矩阵,其第(i,j)个元素是dy(j)/dx(i)•d/dx (Y) 是一个矩阵,其第(i,j)个元素是dy(i,j)/dx •d/d X (y) 是一个矩阵,其第(i,j)个元素是dy/dx(i,j)
注意 Hermitian 转置不能应用,因为复共轭不可解析,x,y是向量,X,Y是矩阵,x,y是标量。
在下面的表达中 A, B, C 是不依赖于 X的矩阵,a,b是不依赖于x的向量, 线性积
•d/dx (AYB) =A * d/dx (Y) * B
o d/dx (Ay) =A * d/dx (y)
•d/d x(x T A) =A
o d/d x(x T) =I
o d/d x(x T a) = d/d x(a T x) = a
•d/d X(a T Xb) = ab T
o d/d X(a T Xa) = d/d X(a T X T a) = aa T
•d/d X(a T X T b) = ba T
•d/dx (YZ) =Y * d/dx (Z) + d/dx (Y) * Z
二次积
•d/d x (Ax+b)T C(D x+e) = A T C(Dx+e) + D T C T(Ax+b)
o d/d x (x T Cx) = (C+C T)x
[C: symmetric]: d/d x (x T Cx) = 2Cx
d/d x (x T x) = 2x
o d/d x (Ax+b)T (D x+e) = A T (Dx+e) + D T (Ax+b)
d/d x (Ax+b)T (A x+b) = 2A T (Ax+b)
o[C: symmetric]: d/d x (Ax+b)T C(A x+b) = 2A T C(Ax+b)
•d/d X(a T X T Xb) = X(ab T + ba T)
o d/d X(a T X T Xa) = 2Xaa T
•d/d X(a T X T CXb) = C T Xab T + CXba T
o d/d X(a T X T CXa) = (C + C T)Xaa T
o[C:Symmetric]d/d X(a T X T CXa) = 2CXaa T
•d/d X((Xa+b)T C(Xa+b)) = (C+C T)(Xa+b)a T
三次积
•d/d x(x T Axx T) = (A+A T)xx T+x T AxI
逆
•d/dx (Y-1) = -Y-1d/dx (Y)Y-1
迹
Note: matrix dimensions must result in an n*n argument for tr().
•d/d X(tr(X)) = I
•d/d X(tr(X k)) =k(X k-1)T
•d/d X(tr(AX k)) =SUM r=0:k-1(X r AX k-r-1)T
•d/d X(tr(AX-1B)) = -(X-1BAX-1)T
o d/d X(tr(AX-1)) =d/d X(tr(X-1A)) = -X-T A T X-T
•d/d X(tr(A T XB T)) = d/d X(tr(BX T A)) = AB
o d/d X(tr(XA T)) = d/d X(tr(A T X)) =d/d X(tr(X T A)) = d/d X(tr(AX T)) = A •d/d X(tr(AXBX T)) = A T XB T + AXB
o d/d X(tr(XAX T)) = X(A+A T)
o d/d X(tr(X T AX)) = X T(A+A T)
o d/d X(tr(AX T X)) = (A+A T)X
•d/d X(tr(AXBX)) = A T X T B T + B T X T A T
•
•[C:symmetric]d/d X(tr((X T CX)-1A) = d/d X(tr(A (X T CX)-1) =
-(CX(X T CX)-1)(A+A T)(X T CX)-1
•[B,C:symmetric]d/d X(tr((X T CX)-1(X T BX)) = d/d X(tr( (X T BX)(X T CX)-1) = -2(CX(X T CX)-1)X T BX(X T CX)-1 + 2BX(X T CX)-1
•
行列式
•d/d X(det(X)) = d/d X(det(X T)) = det(X)*X-T
o d/d X(det(AXB)) = det(AXB)*X-T
o d/d X(ln(det(AXB))) = X-T
•d/d X(det(X k)) = k*det(X k)*X-T
o d/d X(ln(det(X k))) = k X-T
•[Real] d/d X(det(X T CX)) = det(X T CX)*(C+C T)X(X T CX)-1
o[C: Real,Symmetric]d/d X(det(X T CX)) = 2det(X T CX)* CX(X T CX)-1•[C: Real,Symmetricc]d/d X(ln(det(X T CX))) = 2CX(X T CX)-1
Jacobian
如果y 是x的函数,则d y T/d x是y关于x的Jacobian 矩阵。
其行列式|d y T/d x|是表示了d y和d x的超体积比值. Jacobian行列式出现在变元积分中: Integral(f(y)d y)=Integral(f(y(x)) |d y T/d x| d x).
Hessian矩阵
如果f是x的函数,则对称矩阵d2f/d x2= d/d x T(df/d x)就是f(x)的Hessian 矩阵。
满足df/d x = 0 的x的值,当Hessian是正定、负定、不定时,就是相应的最小值、最大值、或者是鞍点。
•d2/d x2 (a T x) = 0
•d2/d x2 (Ax+b)T C(D x+e) = A T CD + D T C T A
o d2/d x2 (x T Cx) = C+C T
d2/d x2 (x T x) = 2I
o d2/d x2 (Ax+b)T (D x+e) = A T D + D T A
d2/d x2 (Ax+b)T (A x+b) = 2A T A
o[C: symmetric]: d2/d x2 (Ax+b)T C(A x+b) = 2A T CA。