矩阵级数与矩阵函数
《矩阵分析》课程教学大纲
《矩阵分析》课程教学大纲课程编号:20821105总学时数:32(理论32)总学分数:2课程性质:专业选修课适用专业:信息与计算科学一、课程的任务和基本要求:本课程的任务是介绍六个内容,分别是线性空间与线性变换,λ---矩阵与Jordan标准形,矩阵函数及矩阵方法,矩阵微分方程,矩阵分解和广义逆矩阵。
要求学生系统掌握这六个内容所涉及的基本概念、基本理论和基本方法,并能熟练地运用这些方法和工具解决理论和实际中遇到的各种问题。
二、基本内容和要求:(一)线性空间与线性变换1、线性空间的定义、性质、基变换与坐标变换公式。
2、子空间的概念、运算及相关定理3、内积空间、正交化方法,空间的正交分解4、线性变换的概念、运算、矩阵表示、线性变换的值域与核的性质5、特征值与特征向量的概念、求法、矩阵的化简要求:理解线性空间、子空间、线性变换、特征值、特征向量的概念,掌握基变换公式,坐标变换公式,正交化方法,特征值和特征向量的求法,矩阵的化简的应用。
(二)λ---矩阵与Jordan标准形a)λ---矩阵的概念,λ---矩阵的标准形b)不变因子与初等因子的概念、求法、性质c)若当标准形理论推导,若当标准形的求法d)Cayley定理、最小多项式的性质及求法要求:理解λ---矩阵、不变因子、初等因子等相关概念,掌握不变因子、初等因子、标准形、Jordan标准形的求法,掌握Cayley定理,最小多项式的应用。
(三)矩阵分析和矩阵函数e)矩阵序列、矩阵函数收敛性f)函数矩阵的极限、连续性、微分与积分g)数量函数关于矩阵的微分及其性质h)向量的范数、范数的等价、按范数的收敛、矩阵的相容范数、算子范数的概念及其性质i)矩阵函数的定义、性质、计算方法要求:理解矩阵序列的极限,矩阵级数的收敛性,函数矩阵的极限,连续性概念,掌握与这些概念相关的命题和定理,会求函数矩阵的微分和积分,会求数量函数关于矩阵的微分,函数向量关于向量的微分,能正确计算矩阵函数(四)矩阵微分方程j)线性常系数齐次微分方程组的定解问题k)线性常系数非齐次微分方程组的定解问题l)n阶常系数微分方程的定解问题m)线性变系数微分方程组的定解问题,转移矩阵的概念、性质、求法。
矩阵函数
0 0 0 0 0 , A 0 1 0
5
(c) 对角形法 假设A可对角化,即存在非奇异矩阵P,使得 l1 , P 1 AP ln 则
f (l1 ) P 1 . f ( A) P f ( ln )
4 6 0 例3 设 A 3 5 0 , 求eA,etA和cosA。 3 6 1
6
(d) Jordan标准型法 一般的,设A的Jordan标准型为J,即存在非奇异 矩阵P,使得
J1 P 1 AP J , Js
则
f ( J1 ) 1 P . f ( A) P f ( J s )
7
f ( A) ck Ak .
例如:
1 1 k e I A A , 1! k! 1 3 1 2 sin A A A , cos A I A 3! 2A=cosA+isinA; (2) cosA=(eiA+e-iA)/2; (3) sinA=(eiA-e-iA)/(2i); (4) cos(-A)=cosA,sin(-A)=sinA; (5) eAe-A=e-AeA=I,(eA)-1=e-A; (6) (eA)m=emA; (7) 一般的,eAeB≠eA+B;如 A 1 1 , B 1 1 . 0 0 0 0
(b) 数项级数求和法 给定A后,确定首1多项式g(l),满足g(A)=0。(特 征多项式或最小多项式均可) Am b1 Am 1 bm 1 A bm I 0. 这表明Am可以用Am-1,…,I线性表出。 A的更高次幂也可以用Am-1,…,I线性表出。
矩阵函数的泰勒展开及应用
矩阵函数的泰勒展开及应用矩阵函数的泰勒展开是将一个矩阵函数表示为一个无穷级数的形式,类似于实数函数的泰勒展开。
矩阵函数的泰勒展开在物理、工程和数学领域有广泛的应用。
首先,我们来看矩阵函数的定义。
一个矩阵函数是将一个矩阵映射到另一个矩阵的函数。
例如,标量函数f(x)将一个实数x映射到另一个实数,而矩阵函数F(A)将一个n×n矩阵A映射到另一个n×n矩阵。
矩阵函数可以是多项式函数、指数函数、三角函数、对数函数等。
矩阵函数的泰勒展开是将一个矩阵函数表示为一个幂级数的形式。
假设F(A)是一个n×n矩阵函数,我们希望将它展开为一个级数的形式。
泰勒展开给出了一个方法来实现这一目标。
如果一个矩阵A是一个n×n矩阵,那么它有特征值λ1,λ2,...,λn,以及它的特征向量v1,v2,...,vn。
根据线性代数的理论,我们可以使用这些特征值和特征向量来表示这个矩阵。
对于一个可以通过对角化的矩阵,我们可以写出矩阵A的特征值和特征向量的关系式为A = PDP^-1,其中P是一个由特征向量组成的矩阵,D是一个对角矩阵,对角线上的元素是特征值。
根据泰勒展开的原理,我们可以将矩阵函数F(A)表示为幂级数的形式F(A) =F(PDP^-1) = PF(D)P^-1 = P(F(D))P^-1。
在这个幂级数中,矩阵函数F(D)可以用特征值的函数来表示。
根据F(D) = diag(f(λ1), f(λ2), ..., f(λn)),其中f(λ1),f(λ2),...,f(λn)是特征值λ1,λ2,...,λn的函数。
将这个表达式代入幂级数F(A) = PF(D)P^-1中,我们得到F(A) = P(diag(f(λ1), f(λ2), ..., f(λn)))P^-1。
矩阵函数的泰勒展开有许多应用。
首先,它可以用于矩阵方程的求解。
对于给定的矩阵方程AX = B,我们可以将矩阵A的矩阵函数展开为幂级数形式,然后将其代入方程,得到一个无穷级数的形式。
矩阵论知识点
矩阵论知识点第一章:矩阵的相似变换1. 特征值,特征向量特殊的:Hermite矩阵的特征值,特征向量2. 相似对角化充要条件:(1)(2)(3)(4)3. Jordan标准形计算:求相似矩阵P及Jordan标准形求Jordan标准形的方法:特征向量法,初等变换法,初等因子法4. Hamilton-Cayley定理应用:待定系数法求解矩阵函数值计算:最小多项式5. 向量的内积6. 酉相似下的标准形特殊的:A酉相似于对角阵当且仅当A为正规阵。
第二章:范数理论1. 向量的范数计算:1,2,范数2. 矩阵的范数计算:1,2,,m , F 范数,谱半径3. 谱半径、条件数第三章:矩阵分析1. 矩阵序列2. 矩阵级数特别的:矩阵幂级数计算:判别矩阵幂级数敛散性,计算收敛的幂级数的和3. 矩阵函数计算:矩阵函数值,At e ,Jordan 矩阵的函数值4. 矩阵的微分和积分计算:函数矩阵,数量函数对向量的导数如,dt dA(t),dt dA(t),)()(X R AXX X X X f T T T 等5. 应用计算:求解一阶常系数线性微分方程组第四章:矩阵分解1. 矩阵的三角分解计算:Crout分解,Doolittle分解,Choleskey分解2. 矩阵的QR分解计算:Householder矩阵,Givens矩阵,矩阵的QR分解或者把向量化为与1e同方向3. 矩阵的满秩分解计算:满秩分解,奇异值分解4. 矩阵的奇异值分解第五章:特征值的估计与表示1. 特征值界的估计计算:模的上界,实部、虚部的上界2. 特征值的包含区域计算:Gerschgorin定理隔离矩阵的特征值3. Hermite矩阵特征值的表示计算:矩阵的Rayleigh商的极值4. 广义特征值问题AX转化为一般特征值问题计算:BX第六章:广义逆矩阵1. 广义逆矩阵的概念2. {1}逆及其应用计算:)(1A ,判别矩阵方程D AXB ,b Ax 解的情况3. Moore-Penrose 逆A计算:利用A 判别方程组b Ax 解的情况,并求极小范数解或极小范数最小二乘解第七章:矩阵的直积1. 矩阵的直积计算:B A 的特征值,行列式,迹2. 矩阵的行拉直计算:AXB 的行拉直,求解矩阵方程FXBAX 第八章:线性空间与线性变换1. 线性空间的基、维数、坐标计算:基、维数、坐标,值域和核空间2. 线性变换计算:线性变换的矩阵,线性变换的值域与核的基与维数3. 欧氏空间1. 求相似矩阵P 及Jordan 标准形2. 求解一阶常系数线性微分方程组3. Crout 分解,Doolittle 分解4. 矩阵的QR 分解或者把向量化为与1e 同方向5. 奇异值分解6. Gerschgorin 定理隔离矩阵的特征值7. 利用A 判别方程组b Ax 解的情况,并求极小范数解或极小范数最小二乘解8. 求解矩阵方程FXB AX 1.向量1,2,范数,矩阵的1,2,,m , F 范数,谱半径2.判别矩阵幂级数敛散性,计算收敛的幂级数的和3.矩阵函数值,At e ,Jordan 矩阵的函数值4.函数矩阵,数量函数对向量的导数如,dt dA(t),dt dsinAt ,)()(X R AX X X X X f TTT 等5.模的上界,实部、虚部的上界6.矩阵的Rayleigh 商的极值7.广义特征值BX AX 转化为一般特征值问题8.)(1A ,B A 的特征值,行列式,迹9.基、维数、坐标,值域和核空间10.线性变换的矩阵,线性变换的值域与核的基与维数。
矩阵函数及其应用
二、 矩阵函数的初步计算
1. Jordan 标准形法
对于矩阵的多项式,我们曾导出 f(A)= Pf(J)P-1 , f:多项式
f(J)= ⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣f(J1)
f(J2 ) %
%
f(Js )⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦
f(Ji)= ⎡⎢⎢⎢⎢⎢⎢⎣f(λi)
f′(λi) %
21!f′′(λi) %
A2 = ⎡⎣⎢⎢01 01⎤⎦⎥⎥ = A3 = A4 = "
B2 = ⎡⎣⎢⎢01 -01⎤⎦⎥⎥ = B3 = B4 = "
∑ eA
=I+(
∝ n=1
1 )A n!
=I+(e
- 1)A
=
⎡⎢⎢⎣e0
e
1
1⎤⎥⎥⎦
∑ eB
=I+(
∝ n=1
1 )B n!
=I+(e
- 1)B
=
⎡⎢⎢⎣e0
1-1e⎤⎥⎥⎦
= an1x1(t)+ an2x2(t)+ " + annxn(t)
式中 t 是自变量,xi = xi(t)是 t 的一元函数(i= 1,2,",n),aij(i,j = 1,2,",n)
是常系数。
令
x(t)=[x1(t),x2(t),",xn(t)]T , A = ⎡⎢⎢⎢⎢⎢⎢⎣aaa#1n2111
1 λi
1 λi
% %
λ01i ⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦
有非奇异矩阵 P 使得: P-1AP = J
对于函数 f(z),若下列函数
f(λi),f′(λi),...,f(mi-1)(λi)
矩阵论-矩阵级数
例:判断矩阵序列Ak的敛散性.
1 0 0
(1)
A
1 0
11,
(2)
A
0.9
0
01.9,
(3)
A
0 0
0.9 0
1 , 0.9
0.3 0.8 (4)A 0.6 0.1
1 0
0
1 0 0
解:(3)Ak 0
0.9k
k
0.9k
1
,
故
limA k
k
0
0 0.
0 0 0.9k
0 0 0
(4) A 0.9 1,故Ak收敛,且lim Ak 0.
Ck2i k2 kik1
i
ik
例:判断矩阵序列Ak的敛散性.
1 0 0
(1)
A
1 0
11,
(2)
A
0.9
0
01.9,
(3)
A
0 0
0.9 0
1 , 0.9
0.3 0.8 (4)A 0.6 0.1
解:(1)Ak
1 0
k 1
,
故
limA k
k
发散.
(2)(A) 0.9 1,故limA k 0. k
yH ( cmAm ) y cm yH Am y cm yH km y cmkm yH y
m0
m0
m0
m0
cmkm也收敛. 与Able定理矛盾. m0
故当(A) R时, cmAm发散. m0
注:定理1实际上定义了一种映射f(z)= cmzm , z R(收敛半径), m0
A Cnn满足(A) R, f (A)= cmAm收敛,所以对应一个矩阵, m0
矩阵函数的定义与性质
矩阵函数的定义与性质矩阵函数是一类涉及矩阵运算的多元函数,广泛应用于数学、物理、工程等领域。
矩阵函数的定义与性质对于深入理解矩阵运算非常重要,本文将介绍矩阵函数的基本定义以及一些常见的性质。
矩阵函数的定义矩阵函数通常可以表示为f(A),其中A是一个矩阵,$f(\\cdot)$是一个函数。
对于一个$n \\times n$的矩阵A,其矩阵函数可以通过泰勒级数展开来定义:$$f(A) = c_0I + c_1A + c_2A^2 + \\cdots + c_kA^k + \\cdots$$其中,I是单位矩阵,c i是函数f(x)在点i处的导数。
矩阵函数的性质1. 线性性质若f(A)和g(A)是矩阵A的函数,c1和c2为常数,则有:$$ \\begin{aligned} & f(A) + g(A) = g(A) + f(A) \\\\ & c_1f(A) = f(c_1A)\\end{aligned} $$2. 矩阵的幂运算对于矩阵函数f(A)=A k,其性质如下:•若A是可对角化的矩阵,则f(A)也可对角化。
•若A是对称矩阵,则f(A)也是对称矩阵。
•若A是幂等矩阵(即A2=A),则f(A)也是幂等矩阵。
3. 矩阵函数的微分对于矩阵函数f(A),其微分形式如下:df(A)=f′(A)dA其中,f′(A)表示f(A)的导数,dA表示矩阵A的微小变化。
4. 特征值与特征向量矩阵函数f(A)的特征值与特征向量也与矩阵A的特征值与特征向量有密切联系。
若$\\lambda$是矩阵A的特征值,v是对应的特征向量,则$f(\\lambda)$是矩阵f(A)的特征值,v是对应的特征向量。
结语通过以上介绍,我们对矩阵函数的定义与性质有了初步了解。
矩阵函数的研究不仅有助于理解矩阵运算的复杂性,还在实际问题中有着广泛的应用。
希望本文的介绍能够对读者有所帮助。
矩阵级数与矩阵函数
第七讲 矩阵级数与矩阵函数一、 矩阵序列1. 定义: 设有矩阵序列{}()k A , 其中()()()k k ij A a =, 且当k →∞时()k ij ij a a →, 则称{}()k A 收敛, 并把()ijA a =叫做{}()k A 的极限, 或称{}()k A 收敛于A , 记为()lim k k A A →∝= 或 ()k k A A →∝→不收敛的矩阵序列则称为发散的,其中又分为有界和无界的情况.2. 收敛矩阵序列的性质:设{}()k A ,{}()k B 分别收敛于A ,B 则(1) ()()k k k A B A B αβαβ→∝+→+(2) ()()k k k A B AB →∝→(3) ()11()k k A A --→∝→,若()11(),k A A --存在(4) ()k k PA Q PAQ →∝→3 收敛矩阵: 设A 为方阵,且当k →∝时0k A →, 则称A 为收敛矩阵.[定理] 方阵A 为收敛矩阵的充要条件是A 的所有特征值的模值均小于1.证明: 对任何方阵A ,均存在可逆矩阵P , 使得 1A PJP -= 其中J 为A 的Jordan 标准形12s J J J J ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦, 1010i iii J λλλ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦1112k kk k k s J J A PJ P P P J --⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦11!...(1)!(1)!,i k m kk i i i i i ki k k m k m J λλλ-+-⎡⎤⎢⎥--+⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦当i k m > 0k A →就等价于0(1,2,...,)k i J i s →=, 等价于0(1,2,...,)k i i s λ→=,而这只有1i λ<才可能也必能.[得证]二、 矩阵级数1.定义: 矩阵序列{}()k A 的无穷和(1)(2)()k A A A ++++叫做矩阵级数, 而()()1NN k k SA ==∑称为其部分和, 若矩阵序列{}()N S 收敛,且有极限S , 则称该级数收敛,且有和S . 记为()1k k A S ∝==∑ 不收敛的级数必为发散的.若矩阵级数()1k k A∝=∑的所有元素()1k ij k a ∝=∑均绝对收敛,则称该级数为绝对收敛.2. 绝对收敛矩阵级数的性质(1)绝对收敛级数一定收敛,且任意调换它的项所得的级数仍收敛,并具有相同的和.(2) ()1k k A ∝=∑绝对收敛,则()1k k PA Q ∝=∑也绝对收敛且等于()1k k P A Q ∝=∑(3) ()1k k A ∝=∑, ()1k k B ∝=∑均绝对收敛,且和分别为12,S S 则()(1)1211()ki k i k i AB S S ∝+-===∑∑三、 方阵的幂级数A 为方阵, 0,()kk k c A A I ∝==∑称为A 的幂级数. 0k k A ∝=∑称为A 的Neumann 级数.1. Neumann 级数收敛的充要条件[定理] Neumann 级数收敛的充要条件是A 为收敛矩阵,且在收敛时其和为1()I A --. 证明: [必要性]级数0k k A ∝=∑收敛, 其元素为23()()()ij ij ij ij A A A δ++++显然也是收敛的. 作为数项级数, 其通项趋于零是级数收敛的必要条件. 故()0k ij k A →∝→,即0k k A →∝→也就是说A 为收敛矩阵. [充分性]:A 为收敛矩阵, 则其特征值的模值均小于1. 设A 的特征值为λ, ()I A -的特征值为μ. 则由det(())det((1))(1)det((1))n I I A I A I A μμμ--=-+=---可见11μλμλ-=→=-故020μμ<<→≠, ()I A -的行列式不为零,1()I A --存在. 而21(...)()k k I A A A I A I A +++++-=- 右乘1()I A --得211...()()k k I A A A I A I A +-++++=--当k →∝时, 10k A +→, 故11()0k A I A +--→. 所以10lim ()kii k i i AA I A ∝-→∝====-∑∑即Neumann 级数收敛于1()I A --.2. 收敛圆[定理] 若矩阵A 的特征值全部落在幂级数0()k k k z c z ϕ∝==∑的收敛圆内, 则矩阵幂级数00(),()k k k A c A A I ϕ∝===∑是绝对收敛的. 反之, 若A 存在落在()z ϕ的收敛圆外的特征值, 则()A ϕ是发散的. 证明略.[推论] 若幂级数在整个复平面上收敛, 则对任何的方阵A , ()A ϕ均收敛.四、 矩阵函数 如: A e , sin A , cos A以矩阵为自变量的“函数”(实际上是“函矩阵”)我们知道, 201112!!znn e z z z n ∝==+++=∑210(1)sin()(21)!n n n z z n ∝+=-=+∑20(1)cos()(2)!n nn z z n ∝=-=∑均为整个复平面上收敛的级数, 故对任何的方阵A01!Ann e A n ∝==∑210(1)sin()(21)!nn n A A n ∝+=-=+∑20(1)cos()(2)!n nn A A n ∝=-=∑均绝对收敛. 三者分别称为矩阵指数函数、矩阵正弦函数、矩阵余弦函数。
矩阵函数的性质及其应用
矩阵函数的性质及其应用-1-矩阵函数的性质及其应用摘要本文从多项式和幂级数两个方面给出了矩阵函数的两种定义方式,从定义出发推导了若干性质及其多种矩阵函数的求法,在计算中根据适当的情况进行选择,起到事半功倍的作用,文章末尾还给出了其在实际中的应用,为解决实际问题带来很多方便。
关键词:矩阵级数矩阵函数 Jordan标准型线性微分方程Matrix function calculus and its applicationAbstractThis paper, from the polynomial and power series two aspects of the matrix function are given two definition way, is derived from the definition of some properties of matrix function and the method, the method of according to choose appropriate, rise to get twice the result with half the effect, the article also gives the end in the actual application, to solve practical problems bring many convenient Keywords: Matrix series Matrix function Jordan canonical formLinear differential equation-I-目录摘要 (I)关键词 ........................................................... I 第一章引言 ................................... 错误~未定义书签。
电子科技大学矩阵理论!
1.上三角矩阵R 的逆 R 1 也是上三角矩阵,且对角 元是R 对角元的倒数;
2.两个上三角矩阵 R1、R2 的乘积 R1R2也是上三角
矩阵,且对角元是 R1与R2对角元之积; 3.酉矩阵U 的逆 U 1也是酉矩阵; 4.两个酉矩阵之积 U1U2也是酉矩阵.
返回
返回
返回
返回
(3 )三角 |A | 不 B | ||A ||等 ||B || |式 ,A ,B P m n .
则称映 |||射 |为pmn上的矩阵 . 范数
返回
例 1 设APmn, 则
nm
|| A||m1
| aij |
j1i1
nm
1
|| A||m2(
| aij |2)2
j1i1
|A ||m | m i,j{a a i||j} x 1 i m 1 j n
返回
定义 2 设 |||a | : P m l R ,|||b | : P l n R ,
||||c:Pmn R是 矩 阵 范 数 , 如 果 ||A|c B | ||A |a |||B |b |
则 称 矩 |||a |阵 ,|||b |和 范 |||c |数 相. 容 如果 ||A|B |||A ||||B ||
0 0 0 0 0 0
返回
定理 2 设 A C r m n ,且 A B 1 D 1 B 2 D 2 均 为 A 的最大秩分解,则
(1) 存在 r阶可逆Q, 矩使 阵得 B 1 B 2 Q D 1 Q 1 D 2
( 2 ) D 1 H ( D 1 D 1 H ) 1 ( B 1 H B 1 ) 1 B 1 H D 2 H (D 2 D 2 H ) 1 (B 2 H B 2 ) 1 B 2 H
函数和矩阵:矩阵的运算和应用
函数和矩阵:矩阵的运算和应用函数和矩阵是数学中重要的概念和工具。
函数是描述变量之间关系的一种数学表达方式,而矩阵则是一种方阵形式的数组,可用于表示多个变量和它们之间的线性关系。
本文将介绍函数和矩阵的基本概念,并讨论它们在数学和实际应用中的运算和应用。
一、函数的定义和性质函数是将一个数集映射到另一个数集的规则。
通常用f(x)表示函数,其中x是自变量,f(x)是因变量。
函数可以是显式定义的,也可以是隐式定义的。
例如,y = f(x) = 2x+1是一个显式函数,而x^2 + y^2 = 1则是一个隐式函数。
函数具有许多重要性质,包括定义域、值域、单调性等。
定义域是函数的自变量可取值的范围,值域则是函数的因变量的可能取值。
单调性描述了函数的增减情况,可以分为递增和递减两种。
二、矩阵的定义和运算矩阵是一个按照长方形排列的数表,可以用于表示线性关系和进行线性变换。
矩阵由行和列组成,通常用大写字母表示。
例如,A是一个m行n列的矩阵,可以表示为A=[a_ij],其中1≤i≤m,1≤j≤n。
矩阵的运算包括加法、减法和乘法等。
矩阵加法是将两个矩阵对应位置的元素相加得到新矩阵,矩阵减法则是将对应位置的元素相减。
矩阵乘法是将矩阵的行与列按照一定规则相乘并相加得到新矩阵。
三、矩阵的应用矩阵在数学和实际应用中有广泛的应用。
在数学中,矩阵可用于求解线性方程组和描述线性变换。
通过矩阵求解线性方程组可以简化计算过程,而线性变换可应用于几何、物理等领域的模型建立和分析。
在实际应用中,矩阵可用于数据处理和图像处理。
例如,矩阵与向量的乘法可用于对数据进行线性变换,提取数据的特征。
矩阵还可以表示图像的像素值,通过矩阵运算可以对图像进行模糊、锐化等处理。
另外,矩阵还可应用于网络分析和优化问题。
例如,在社交网络中,矩阵可用于描述用户之间的关系,通过矩阵运算可以发现社交网络中的影响力节点和社群结构。
在优化问题中,矩阵可用于表示约束条件和目标函数,通过矩阵运算可以求解最优解。
矩阵论定义定理总结
矩阵论1.行列式的相关知识:1.1定义:由2n 个数ij a (,1,2,...,)i j n =组成的一个n 阶行列式为1212121112121222(...)12 (12)(1)...n j j jnnn n j j j n j j j n n nna a a a a a D a a a a a a τ==-∑即所有取自不同行不同列的n 个元素的乘积1212...j j j n n a a a 的代数和,其中每一项的符合由排列12...n j j j 的奇偶性决定。
n 阶行列式的展开原理:定义1.1.2在n 阶行列式D 中,任选k 行和 k 列(k n ≤),将其交叉点上的2k 个元素按原来位置排成一个k 阶行列式M ,称为D 的一个k 阶子式。
在D 中划去M 所在之k 行k 列后余下的2()n k -个元素按照原来位置排成的n-k 阶行列式M ',称为M 的余子式。
定义1.1.3设D 的k 阶子式M 在D 中所在行列指标分别是12,,...,k i i i和12,,...,k j j j ,则称1212()()(1)k k i i i j j j A M ++++++'=-•为M 的代数余子式,其中M '为M 的余子式。
定理1.1.1(拉普拉斯定理)设在行列式D 中任意取定k 行(11)k n ≤≤-,则由这k 行元素所组成的一切k 阶子式与其对应的代数余子式的乘积之和等于和列式D 。
定理1.1.4(克莱姆法则):若线性方程组11112211211222221122n n n n n n nn n na x a x a xb a x a x a x b a x a x a x b +++=⎧⎪+++=⎪⎨⎪⎪+++=⎩ (1.1.7)的系数行列式1112121222120n n n n nna a a a a a D a a a =≠则方程组(1.1.7)有唯一解,且/(1,2,)i i x D D i n ==,其中i D 是将D 中第i 列换成(1.1.7)式右端的常数项12,,,n b b b 所得的行列式,即1,11,111112,12,22122,1,1i i n i i n i n i n i nn nnna a ab a a a a b a D a a a b a -+-+-+=(1,2,,)i n =该定理通常称为克莱姆法则。
04.矩阵理论与方法_矩阵分析及其应用
0 0 0 0
0 0 1 0
求 sin A
16
矩阵函数值的求法
求法三(对角形法) 前提:矩阵 A 相似于对角矩阵 ,即有可逆矩阵 P ,使得
1 P 1 AP n 1k 则 1 Ak P k P 1 P P k n k c k 1 f (1 ) k 0 f ( A) Pf ( ) P 1 P P 1 P k c k n k 0
12
矩阵函数值的求法
求法一(待定系数法) 第一步:求 n 阶矩阵 A 的特征多项式 ( ) det( I A),以及多项
( ) 整除 ( ) ,并求 ( ) 的互异零点及相应 式 ( ) ,满足 ( A) 0 ,
的重数 1 ,..., s , r1,..., rs 。
(k )
(k )
(k )
mn
lim A( k ) A 或 k
A( k ) A
不收敛的矩阵序列称为发散的。 性质
(k ) (k ) A( k ) B ( k ) ) A B, , C 。 若 A A, B B ,则 lim( k
13
矩阵函数值的求法
例:设
2 0 0 A 1 1 1 1 1 3
求 e A , e A , etA
14
矩阵函数值的求法
求法二(数项级数求和法) 第一步:同待定系数法找到首1多项式 ( ),即有
Am b1 Am1 ... bm1 A bm I 0
4
矩阵级数的收敛性
矩阵论矩阵分析
第三章 矩阵分析在此之前我们只研究了矩阵的代数运算,但在数学的许多分支和工程实际中,特别是涉及到多元分析时,还要用到矩阵的分析运算.本章首先讨论矩阵序列的极限和矩阵级数,然后介绍矩阵函数和它的计算,最后介绍矩阵的微积分,以及矩阵分析在解微分方程组和线性矩阵方程中的应用.§3.1 矩阵序列 定义 3.1 设有Cm n⨯中的矩阵序列{}()k A ,其中()()()k k ij m nAa ⨯=.若()lim (1,2,,;1,2,,)k ij ij k a a i m j n →+∞===,则称矩阵序列{}()k A 收敛于()ij m n A a ⨯=,或称A 为矩阵序列{}()k A 的极限,记为()lim k k A A →+∞=或()()k A A k →→+∞不收敛的矩阵序列称为发散. 由定义可见,Cm n⨯中一个矩阵序列的收敛相当于mn 个数列同时收敛.因此,可以用初等分析的方法来研究它.但同时研究mn 个数列的极限未免繁琐.与向量序列一样,可以利用矩阵范数来研究矩阵序列的极限. 定理 3.1 设()k A,C(012)m nA k ,,,⨯∈=.则()lim k k A A →+∞=的充分必要条件是()lim 0k k A A →+∞-=,其中是Cm n⨯上的任一矩阵范数.证 先取Cm n⨯上矩阵的G-范数.由于()()()()1=1k k k ij ij ij ij Gi,jm nk ijiji j a a a a A Aaa =-≤-=-≤-所以()lim k k AA →+∞=的充分必要条件是()lim 0k Gk A A→+∞-=.又由范数的等价性知,对C m n⨯上任一矩阵范数,存在正常数α,β,使得()()()k k k G G A A A A A A αβ-≤-≤-故()lim 0k Gk AA→+∞-=的充分必要条件是()lim 0k k A A →+∞-=.证毕推论 设()k A,C(012)m nA k ,,,⨯∈=,()lim k k A A →+∞=.则()lim k k A A →+∞=其中是Cm n⨯上任一矩阵范数.证 由()()k k AA A A -≤-即知结论成立.证毕需要指出的是,上述推论的相反结果不成立.如矩阵序列()1(1)112k k A k ⎛⎫- ⎪=+ ⎪ ⎪⎝⎭不收敛.但()Flim lim k k x A →+∞== 收敛的矩阵序列的性质,有许多与收敛数列的性质相类似. 定理3.2 设()lim k k AA →+∞=,()lim k k B B →+∞=,其中()k A ,()k B ,A ,B 为适当阶的矩阵,α,β∈C .则(1)()()lim ()k k k AB A B αβαβ→+∞+=+;(2) ()()lim k k k A BAB →+∞=;(3)当()k A与A 均可逆时,()11lim ()k k A A --→+∞=.证 取矩阵范数,有()()()()()()()()()()()()()()()k k k k k k k k k k k k k A B A B A A B BA B AB A BA B A B ABA B B A A Bαβαβαβ+-+≤-+--=-+-≤-+-由定理3.1和推论知(1)和(2)成立. 因为()1()k A-,1A -存在,所以()lim det det 0k k A A →+∞=≠,又有()lim adj adj k k A A →+∞=.于是()()11()adj adj lim ()lim det det k k k k k A AA A A A--→+∞→+∞=== 证毕 定理3.2(3)中条件()k A与A 都可逆是不可少的,因为即使所有的()k A可逆也不能保证A一定可逆.例如()11111k A k⎛⎫+ ⎪= ⎪ ⎪⎝⎭对每一个()k A 都有逆矩阵()1()1k k k A k k --⎛⎫=⎪-+⎝⎭,但 ()11lim 11k k A A →+∞⎛⎫== ⎪⎝⎭而A 是不可逆的. 在矩阵序列中,最常见的是由一个方阵的幂构成的序列.关于这样的矩阵序列有以下的概念和收敛定理. 定义3.2 设n nA C ⨯∈,若()lim 0k k A→+∞=,则称A 为收敛矩阵.定理3.3 设n nA C⨯∈,则A 为收敛矩阵的充分必要条件是ρ(A )<1.证 必要性.已知A 为收敛矩阵,则由谱半径的性质,有(())()k k k A A A ρρ=≤其中是Cn n⨯上任一矩阵范数,即有lim (())0kk A ρ→+∞=,故ρ(A )<1.充分性.由于ρ(A )<1,则存在正数ε,使得ρ(A )+ε<1.根据定理2.14,存在C n n⨯上的矩阵范数m,使得()1m A A ρε≤+<从而由kk m mA A ≤得lim 0kmk A →+∞=.故lim 0k k A →+∞=. 证毕推论 设n nA C ⨯∈.若对Cn n⨯上的某一矩阵范数有1A <,则A 为收敛矩阵.例3.1 判断下列矩阵是否为收敛矩阵:(1)181216A -⎛⎫= ⎪-⎝⎭; (2)0.20.10.20.50.50.40.10.30.2A ⎛⎫ ⎪= ⎪ ⎪⎝⎭. 解 (1)可求得A 的特征值为156λ=,212λ=-,于是5()16A ρ=<,故A 是收敛矩阵; (2)因为10.91A =<,所以A 是收敛矩阵.§3.2 矩阵级数定义3.3 由Cm n⨯中的矩阵序列{}()k A 构成的无穷和(0)(1)()k AA A ++++称为矩阵级数,记为()k k A+∞=∑.对任一正整数N ,称()()0NN k k SA ==∑为矩阵级数的部分和.如果由部分和构成的矩阵序列{}()N S收敛,且有极限S ,即()lim N N SS →+∞=,则称矩阵级数()0k k A +∞=∑收敛,而且有和S ,记为()k k S A+∞==∑不收敛的矩阵级数称为发散的.如果记()()()k k ij m n Aa ⨯=,()ij m n S s ⨯=,显然()0k k S A +∞==∑相当于()(1,2,,;1,2,,)k ijijk as i m j n +∞====∑即mn 个数项级数都收敛. 例3.2 已知()1π24(0,1,)10(1)(2)k kk A k k k ⎛⎫⎪ ⎪== ⎪ ⎪++⎝⎭研究矩阵级数()k A+∞∑的敛散性.解 因为k 00()()001π2410(1)(2)1π1242341012N Nk Nk k N k N k k N N S A k k N ====⎛⎫⎪ ⎪== ⎪ ⎪++⎝⎭⎛⎫⎛⎫-- ⎪ ⎪⎝⎭ ⎪= ⎪- ⎪+⎝⎭∑∑∑∑所以()4π2lim 301N N S S →+∞⎛⎫ ⎪= ⎪ ⎪⎝⎭故所给矩阵级数收敛,且其和为S . 定义3.4 设()()()C (0,1,)k k m n ij m n Aa k ⨯⨯=∈=.如果mn 个数项级数()0(1,2,,;1,2,,)k ijk ai m j n +∞===∑都绝对收敛,即()k ij k a +∞=∑都收敛,则称矩阵级数()k k A+∞=∑绝对收敛.利用矩阵范数,可以将判定矩阵级数是否绝对收敛转化为判定一个正项级数是否收敛的问题.定理3.4 设()()()C(0,1,)k k m nij m nAa k ⨯⨯=∈=.则矩阵级数()0k k A +∞=∑绝对收敛的充分必要条件是正项级数()0k k A +∞=∑收敛,其中是Cm n⨯上任一矩阵范数.证 先取矩阵的1m -范数.若1()k k m A +∞=∑收敛,由于1()()()11(1,2,,;1,2,,)mnk k k ijij i j m aa A i m j n ==≤===∑∑从而由正项级数的比较判别法知()k ijk a+∞=∑都收敛,故()k k A+∞=∑绝对收敛.反之,若()k k A+∞=∑绝对收敛,则()0k ijk a+∞=∑都收敛,从而其部分和有界,即()0(1,2,,;1,2,,)Nk ijijk aM i m j n =≤==∑记,max ij i jM M =,则有1()()()0011110()()NNmnmnNk k k ijijk k i j i j k m AaamnM =========≤∑∑∑∑∑∑∑故1()k k m A +∞=∑收敛.这表明()k k A+∞=∑绝对收敛的充分必要条件是1()k k m A +∞=∑收敛.由矩阵范数的等价性和正项级数的比较判别法知,1()k k m A+∞=∑收敛的充分必要条件是()0k k A +∞=∑收敛,其中是Cm n⨯上任一矩阵范数. 证毕利用矩阵级数收敛和绝对收敛的定义,以及数学分析中的相应结果,可以得到以下一些结论.定理3.5 设()k k AA +∞==∑,()0k k B B +∞==∑,其中()k A ,()k B ,A ,B 是适当阶的矩阵,则(1)()()0()k k k AB A B +∞=+=+∑;(2)对任意λ∈C ,有()k k AA λλ+∞==∑;(3)绝对收敛的矩阵级数必收敛,并且任意调换其项的顺序所得的矩阵级数仍收敛,且其和不变; (4)若矩阵级数()k k A+∞=∑收敛(或绝对收敛),则矩阵级数()k k PAQ +∞=∑也收敛(或绝对收敛),并且有()()0()(3.1)k k k k PAQ P A Q+∞+∞===∑∑(5)若()0k k A+∞=∑与()k k B+∞=∑均绝对收敛,则它们按项相乘所得的矩阵级数(0)(0)(0)(1)(1)(0)(0)()(1)(1)()(0)()()(3.2)k k k A BA B A B A B A B A B -++++++++也绝对收敛,且其和为AB . 证 只证(4)和(5).若()0k k A+∞=∑收敛,记()()0NN k k SA ==∑,则()lim N N S A →+∞=.从而()()00lim(lim)NNk k N N k k PAQ P AQ PAQ →+∞→+∞====∑∑可见()k k PAQ +∞=∑收敛,且式(3.1)成立.若()k k A+∞=∑绝对收敛,则由定理3.4知()k k A +∞=∑收敛,但()()()k k k PA Q P AQ Aα≤≤其中α是与k 是无关的正数,从而()0k k PA Q +∞=∑收敛,即()k k PAQ +∞=∑绝对收敛.当()k k A+∞=∑和()k k B+∞=∑绝对收敛时,由定理3.4知()k k A+∞=∑和()0k k B +∞=∑收敛,设其和分别为1σ与2σ,从而它们按项相乘所得的正项级数(0)(0)(0)(1)(1)(0)(0)()(1)(1)()(0)()()k k k A B A B A B ABABAB-++++++++也收敛,其和为12σσ.因为(0)()(1)(1)()(0)(0)()(1)(1)()(0)k k k k k k A B A B A B ABABAB--+++≤+++所以矩阵级数(3.2)绝对收敛.记()()1NN k k SA==∑,()()2NN k k SB ==∑,()(0)()(1)(1)()(0)3()NN k k k k SA B A B A B -==+++∑则()()()(1)()(2)(1)(2)()()(1)()()123N N N N N N N N N S S S A B A BA B A B A B --=++++++又记()()1NN k k Aσ==∑,()()2NN k k B σ==∑,()(0)()(1)(1)()(0)3()NN k k k k A B A B A B σ-==+++∑显然()()()()()()123123N N N N N N S S S σσσ-≤- 故由()()12lim N N N S S AB →+∞=和()()()123lim ()0N N N N σσσ→+∞-=,得()3lim N N S AB →+∞=证毕下面讨论一类特殊的矩阵级数——矩阵幂级数. 定义3.5 设n nA C⨯∈,C(0,1,)k a k ∈=.称矩阵级数0k k k a A +∞=∑为矩阵A 的幂级数.利用定义来判定矩阵幂级数的敛散性,需要判别2n 个数项级数的敛散性,当矩阵阶数n 较大时,这是很不方便的,且在许多情况下也无此必要.显然,矩阵幂级数是复变量z 的幂级数0kk k a z+∞=∑的推广.如果幂级数kk k a z+∞=∑的收敛半径为r ,则对收敛圆z r <内的所有z ,kk k a z+∞=∑都是绝对收敛的.因此,讨论kk k a A+∞=∑的收敛性问题自然联系到kk k a z+∞=∑的收敛半径.定理3.6 设幂级数kk k a z+∞=∑的收敛半径为r ,Cn nA ⨯∈.则(1)当ρ(A )<r 时,矩阵幂级数0kk k a A+∞=∑绝对收敛;(2)当ρ(A )>r 时,矩阵幂级数kk k a A+∞=∑发散.证 (1)因为ρ(A )<r ,所以存在正数ε,使得ρ(A )+ε<r .根据定理2.14,存在Cn n⨯上的矩阵范数m,使得m ()A A r ρε≤+<从m m(())kk k k k k a A a A a A ρε≤≤+而由于幂级数(())kkk aA ρε+∞=+∑收敛,故矩阵幂级数0k k k a A +∞=∑绝对收敛.(2)当ρ(A )>r 时,设A 的,n 个特征值为12,,,n λλλ,则有某个l λ满足l r λ>.由Jordan定理,存在n 阶可逆矩阵P ,使得11112(10)i n n P AP J λδδδλλ--⎛⎫⎪⎪== ⎪ ⎪⎝⎭代表或而kk k a J+∞=∑的对角线元素为0(1,2,,)k k jk a j n λ+∞==∑.由于0k k lk a λ+∞=∑发散,从而0k k k a J +∞=∑发散.故由定理 3.5(4)知,kkk a A+∞=∑也发散. 证毕推论 设幂级数kk k a z+∞=∑的收敛半径为r ,Cn nA ⨯∈.若存在Cn n⨯上的某一矩阵范数使得A r <,则矩阵幂级数kk k a A+∞=∑绝对收敛.例3.3 判断矩阵幂级数018216kkk k+∞=-⎛⎫ ⎪-⎝⎭∑的敛散性. 解 令181216A -⎛⎫= ⎪-⎝⎭.例3.1中已求得5()6A ρ=.由于幂级数0kk kz +∞=∑的收敛半径为r =1,故由ρ(A )<1知矩阵幂级数kk kA+∞=∑绝对收敛.最后,考虑一个特殊的矩阵幂级数. 定理3.7 设Cn nA ⨯∈.矩阵幂级数kk A+∞=∑(称为Neumann 级数)收敛的充分必要条件是ρ(A )<1,并且在收敛时,其和为1()I A --.证 当ρ(A )<1时,由于幂级数kk z+∞=∑的收敛半径r =1,故由定理 3.6知矩阵幂级数kk A+∞=∑收敛.反之,若kk A+∞=∑收敛,记0kk S A+∞==∑,()()0NN k k SA ==∑则()lim N N S S →+∞=.由于()(1)()(1)lim lim ()=lim lim N N N N N N N N N A S S S S O --→+∞→+∞→+∞→+∞==--故由定理3.3知ρ(A )<1.当kk A+∞=∑收敛时,ρ(A )<1,因此I -A 可逆,又因为()1()N N SI A I A +-=-所以()111()()N N S I A A I A -+-=---故()1lim ()N N S S I A -→+∞==- 证毕例3.4 已知0.20.10.20.50.50.40.10.30.2A ⎛⎫ ⎪= ⎪ ⎪⎝⎭,判断矩阵幂级数0kk A +∞=∑的敛散性.若收敛,试求其和.解 因为10.91A =<,所以kk A+∞=∑收敛,且102814141()44624214202535k k A I A +∞-=⎛⎫ ⎪=-= ⎪ ⎪⎝⎭∑ §3.3 矩阵函数矩阵函数是以矩阵为变量且取值为矩阵的一类函数.本节介绍矩阵函数的定义和计算方法,并讨论常用矩阵函数的性质. 一、矩阵函数的定义 定义3.5 设幂级数0k k k a z +∞=∑的收敛半径为r ,且当z r <时,幂级数收敛于函数f (z ),即0()()kk k f z a zz r +∞==<∑如果Cn nA ⨯∈满足ρ(A )<r ,则称收敛的矩阵幂级数kk k a A+∞=∑的和为矩阵函数,记为f (A ),即0()(3.3)kk k f A a A+∞==∑根据这个定义,可以得到在形式上和数学分析中的一些函数类似的矩阵函数.例如,对于如下函数的幂级数展开式02120101e ()!(1)sin ()(21)!(1)cos ()(2)!(1)(1)(1)ln(1)(1)1kzk k k k k kk kk k k k z r k z zr k z zr k z z r z zr k +∞=+∞+=+∞=+∞-=+∞+===+∞-==+∞+-==+∞-==-+==+∑∑∑∑∑ 相应地有矩阵函数01e !kk A A k +∞==∑(C n n A ⨯∈) 210(1)sin (21)!kk k A A k +∞+=-=+∑ (C n n A ⨯∈)20(1)cos (2)!k kk A A k +∞=-=∑ (C n n A ⨯∈)10()k k I A A +∞-=-=∑ (ρ(A )<1)1(1)ln()1k k k I A A k +∞+=-+=+∑ (ρ(A )<1)称e A为矩阵指数函数,sin A 为矩阵正弦函数,cos A 为矩阵余弦函数.如果把矩阵函数f (A )的变元A 换成At ,其中t 为参数,则相应得到()()(3.4)kk k f At a At +∞==∑在实际应用中,经常需要求含参数的矩阵函数.二、矩阵函数值的计算以上利用收敛的矩阵幂级数的和定义了矩阵函数f (A ),在具体应用中,要求将f (A )所代表的具体的矩阵求出来,即求出矩阵函数的值.这里介绍几种求矩阵函数值的方法.以下均假设式(3.3)或式(3.4)中的矩阵幂级数收敛. 方法一 利用Hamilton-Cayley 定理利用Hamilton-Cayley 定理找出矩阵方幂之间的关系,然后化简矩阵幂级数求出矩阵函数的值.举例说明如下. 例3.5 已知0110A ⎛⎫=⎪-⎝⎭,求e At.解 可求得2det()1I A λλ-=+.由Hamilton-Cayley 定理知2A I O +=,从而2A I =-,3A A =-,4A I =,5A A =,…即2(1)k k A I =-,21(1)(1,2,)k k A Ak +=-=故243501e 1!2!4!3!5!cos sin (cos )(sin )sin cos Atk k k t t t t A t I t A k tt t I t A tt +∞=⎛⎫⎛⎫==-+-+-+- ⎪ ⎪⎝⎭⎝⎭⎛⎫=+=⎪-⎝⎭∑例3.6 已知4阶方阵A 的特征值为π,-π,0,0,求sin A ,cos A .解 因为2422det()(π)(π)πI A λλλλλλ-=-+=-,所以422πA A O -=.于是422πA A =,523πA A =,642πA A =,743πA A =,…即2222πkk A A -=,21223π(2,3,)k k A A k +-==故213223023321323332(1)1(1)sin π(21)!3!(21)!11(1)π3!π(21)!sin ππ1ππk k k k k k k k k A A A A Ak k A A A k A A A A +∞+∞+-==+∞+=--==-+++⎛⎫-=-+ ⎪+⎝⎭=+=-∑∑∑-22222022222(1)1(1)cos π(2)!2!(2)!cos π12ππk k k k k k A A I A Ak k I A I A +∞+∞-==--==-+=+=-∑∑-方法二 利用相似对角化 设C n nA ⨯∈是可对角化的,即存在C n nn P ⨯∈,使得112diag(,,,)n P AP A λλλ-==则有11112112()()()diag(,,,)diag((),(),,())kkk k k k k k k k k k k k k n k k k n f A a A a P P P a P P a a a P P f f f P λλλλλλ+∞+∞+∞--===+∞+∞+∞-===-==Λ=Λ==∑∑∑∑∑∑同理可得112()diag((),(),,())n f At P f t f t f t P λλλ-=例3.7 已知460350361A ⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭,求e At,cos A .解 可求得2det()(2)(1)I A λλλ-=+-,即A 的特征值为12λ=-,231λλ==.对应12λ=-的特征向量为T1(1,1,1)p =-,对应231λλ==的两个线性无关的特征向量为T 2(2,1,0)p =-,T 3(0,0,1)p =.于是120110101P --⎛⎫ ⎪= ⎪ ⎪⎝⎭ 使得1211P AP --⎛⎫ ⎪= ⎪ ⎪⎝⎭故22212222e 2e e 2e 2e 0e e e e2e e 0e e e 2e 2e e tt t t tAt tt t t t t t t t tt P P --------⎛⎫⎛⎫-- ⎪ ⎪==--⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭1cos(2)cos cos1cos12cos1cos 22cos12cos 20cos 2cos12cos 2cos10cos 2cos12cos 22cos1cos1A P--⎛⎫⎪= ⎪ ⎪⎝⎭--⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭方法三 利用Jordan 标准形 设Cn nA ⨯∈,且C n nn P ⨯∈,使得121s J J P AP J J -⎛⎫⎪ ⎪==⎪ ⎪⎝⎭其中×1(1,2,,)1i ii ii i r rJ i s λλλ⎛⎫ ⎪⎪== ⎪ ⎪⎝⎭由定理1.12得111111001(1)01(1C C ()C ()()1!(1)!()1!()()1!(1)!i i i i i i i r k r k k i k ik ikk k k i i k i k k k k k ik i r r k k k i kk k k k t r r i f J t a J t a t t t r a t tt f f f r λλλλλλλλλλλλλλλλ--+-+∞+∞-==--+∞==--⎛⎫ ⎪⎪== ⎪ ⎪ ⎪⎝⎭⎛⎫' ⎪- ⎪⎪= ⎪⎪'⎪ ⎪⎝⎭'-=∑∑∑)()()()1!()ittf t f f λλλλλ=⎛⎫⎪⎪⎪ ⎪⎪' ⎪ ⎪⎝⎭从而1010110011()()()()()k kk kk k k k k kk k k k k k k k k s k s f At a A t a PJP t a J t P a J t P P P a J t f J t P Pf J t +∞+∞-==+∞=+∞--=+∞=-==⎛⎫⎪ ⎪==⎪⎪ ⎪ ⎪⎝⎭⎛⎫ ⎪= ⎪ ⎪⎝⎭∑∑∑∑∑ 例3.8 已知101120403A -⎛⎫⎪= ⎪ ⎪-⎝⎭,求e A,sin At .解 例1.9已求得100111210P ⎛⎫ ⎪=-- ⎪ ⎪⎝⎭,11112P AP J -⎛⎫⎪== ⎪ ⎪⎝⎭于是12222e e e 0ee e 3e e e 2e+e e 4e 03e A P P -⎛⎫⎛⎫⎪ ⎪==- ⎪⎪ ⎪ ⎪-⎝⎭⎝⎭-- 1sin cos sin sin sin 2sin 2cos 0cos sin 2cos sin 2sin 2cos sin sin 24cos 02cos sin t t t At P t Pt t t t t t t t t t t t t t t t t t t t -⎛⎫⎪= ⎪ ⎪⎝⎭-⎛⎫⎪=+---+ ⎪⎪-+⎝⎭根据Jordan 标准形理论可得 定理3.8 设Cn nA ⨯∈,1λ,2λ,…,n λ是A 的n 个特征值,则矩阵函数f (A )的特征值为1()f λ,2()f λ,…,()n f λ. 方法四 待定系数法 设Cn nA ⨯∈,且A 的特征多项式为1212()det()()()()(3.5)sr r r s I A ψλλλλλλλλ=-=---其中1λ,2λ,…,s λ是A 的全部互异特征值,12s r r r n +++=.为计算矩阵函数()k kk k f At a A t +∞==∑,记0()k k k k f t a t λλ+∞==∑.将f (λt )改写为()(,)()(,)(3.6)f t q t r t λλψλλ=+其中q (λ,t )是含参数t 的λ的幂级数,r (λ,t )是含参数t 且次数不超过n -1的λ的多项式,即1110(,)()()()n n r t b t b t b t λλλ--=+++由Hamilton-Cayley 定理知ψ(A )=O ,于是由式(3.6)得1110()(,)()(,)()()()n n f At q A t A r A t b t Ab t A b t Iψ--=+=+++可见,只要求出()(0,1,,1)k b t k n =-即可得到f (At ).注意到()()0(0,1,,1;1,2,,)l i i l r i s ψλ==-=将式(3.6)两边对λ求导,并利用上式,得d d ()(,)d d iil lll f t r t λλλλλλλλ=== 即d d ()(,)(0,1,,1;1,2,,)(3.7)d d iil l li l l t t f r t l r i s μλλλμλμλ====-=由式(3.7)即得到以0()b t ,1()b t ,…,1()n b t -为未知量的线性方程组. 综上分析,用待定系数法求矩阵函数f (At )或f (A )的步骤如下: 第一步:求矩阵A 的特征多项式(3.5); 第二步:设1110()n n r b b b λλλ--=+++.根据()()()()(0,1,,1;1,2,,)i l l l i i tr t f l r i s λλλλ===-=或()()()()(0,1,,1;1,2,,)l l i i i r f l r i s λλ==-=列方程组求解0b ,1b ,…,1n b -;第三步:计算1110()(())()n n f At f A r A b A b A b I --==+++或.例3.9 已知101120403A -⎛⎫ ⎪= ⎪ ⎪-⎝⎭,求e At,cos A .解 可求得2det()(1)(2)I A λλλ-=--.设2210()r b b b λλλ=++则由210212210(1)e (1)2e (2)42e t t t r b b b r b b t r b b b ⎧=++=⎪'=+=⎨⎪=++=⎩解得222120e e e 2e 2e 3e e 2e t t t t t t t t b t b t b t ⎧=--⎪=-++⎨⎪=-⎩ 于是2222210e 2e 0e e e e 2ee e e e 4e 02e e t tAt t t tt t t t t ttt t b A b A b I t t t t t ⎛⎫-⎪=++=-++-- ⎪ ⎪ ⎪-+⎝⎭而由21021210(1)cos1(1)2sin1(2)42cos 2r b b b r b b r b b b =++=⎧⎪'=+=-⎨⎪=++=⎩解得210sin1cos1cos 23sin12cos12cos 22sin1cos 2b b b =-+⎧⎪=-+-⎨⎪=+⎩从而22102sin1cos 20sin1cos 2sin1cos1cos 2cos 2sin1cos1cos 24sin102sin1cos1A b A b A b I +-⎛⎫ ⎪=++=-+--+ ⎪ ⎪-+⎝⎭如果求得矩阵A 的最小多项式,且其次数低于A 的特征多项式的次数,则计算矩阵函数就要容易一些.例3.10 已知311202113A -⎛⎫ ⎪=- ⎪ ⎪--⎝⎭,求e At,sin A .解 例1.9已求得A 的Jordan 标准形为2212J ⎛⎫⎪= ⎪ ⎪⎝⎭于是A 的最小多项式为2()(2)A m λλ=-.设10()r b b λλ=+由21021(2)2e (2)e t tr b b r b t ⎧=+=⎪⎨'==⎪⎩ 解得2120e (12)et t b t b t ⎧=⎪⎨=-⎪⎩ 于是2101e e 21221At t tt t b A b I t tt t t t +-⎛⎫ ⎪=+=-- ⎪ ⎪--+⎝⎭又由101(2)2sin 2(2)cos 2r b b r b =+=⎧⎨'==⎩ 解得10cos 2sin 22cos 2b b =⎧⎨=-⎩从而10sin 2cos 2cos 2cos 2sin 2cos 2sin 22cos 22cos 2cos 2cos 2sin 2cos 2A b A b I +-⎛⎫ ⎪=+=-- ⎪ ⎪--+⎝⎭三、常用矩阵函数的性质常用的矩阵函数有e A,sin A ,cos A ,它们有些性质与普通的指数函数和三角函数相同,但由于矩阵乘法不满足交换律,从而有些性质与一般指数函数和三角函数不相同. 定理3.9 对任意Cn n A ⨯∈,总有(1)sin(-A )=-sin A ,cos(-A )=cos A ; (2)i e cos isin AA A =+,i -i 1cos (e e )2A A A =+,i -i 1sin (e e )2iA A A =-. 证 (1)由sin A 与cos A 的矩阵幂级数形式直接得到;(2)i 221000i (1)(1)e i !(2)!(21)!cos isin k k k Ak k k k k k A A A k k k A A+∞+∞+∞+===--==++=+∑∑∑又有-i ecos()isin()cos isin AA A A A =-+-=-从而i -i 1cos (e e )2A A A =+,i -i 1sin (e e )2iA A A =- 定理3.10 设A ,C n nB ⨯∈,且AB =BA ,则(1)ee e e e A BA B B A +==;(2)sin(A +B )=sin A cos B +cos A sin B ;(3)cos(A +B )=cos A cos B -sin A sin B .证 (1)0022011e e !!1()(2)2!1()e !A Bk k k k k A B k A B k k I A B A AB B A B k +∞+∞==+∞+=⎛⎫⎛⎫= ⎪⎪⎝⎭⎝⎭=++++++=+=∑∑∑(2)i()-i()i i -i -i i -i i -i i -i i -i 11sin()(e e )(e e e e )2i 2i 1111(e e )(e e )(e e )(e e )2i 222i sin cos cos sin A B A B A B A B A A B B A A B B A B A B A B+++=-=-=-+++-=+ 同理可证(3). 证毕在定理3.10中,取A =B ,即得 推论 对任意Cn nA ⨯∈,有22cos 2cos sin A A A =-,sin2A =2sin A cos A 值得注意的是,当AB ≠BA 时,ee e A BA B +=或e e e A B B A +=不成立.如取0010A ⎛⎫= ⎪⎝⎭,0100B ⎛⎫= ⎪⎝⎭,则0110A B ⎛⎫+= ⎪⎝⎭,00100100AB BA ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭且10e 11A⎛⎫= ⎪⎝⎭,11e 01B⎛⎫= ⎪⎝⎭,-1-1-1-1e+e e e 1e 2e e e+e A B +⎛⎫= ⎪⎝⎭-- 可见1121e e e e 1211A BB A ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭e e e A B A B +≠,e e e A B B A +≠定理3.11 设Cn nA ⨯∈,则有(1)tr dete e A A=;(2)1(e )e A A --=.证 (1)设A 的特征值为1λ,2λ,…,n λ.则由定理3.8知,e A的特征值为1e λ,2e λ,…,e n λ,从而1212tr dete =e e e e e n n A A λλλλλλ++==…+…(2)由于tr dete =e 0A A≠,所以e A 总是可逆的.又由定理3.10,得e e e e A A A A O I--===故1(e )e A A --=. 证毕需要指出的是,对任何n 阶方阵A ,e A总是可逆的,但sin A 与cos A 却不一定可逆.如取π00π/2A ⎛⎫=⎪⎝⎭,则00sin 01A ⎛⎫= ⎪⎝⎭,10cos 00A -⎛⎫= ⎪⎝⎭.可见sin A 与cos A 都不可逆.§3.4 矩阵的微分和积分在研究微分方程组时,为了简化对问题的表述及求解过程,需要考虑以函数为元素的矩阵的微分和积分.在研究优化等问题时,则要碰到数量函数对向量变量或矩阵变量的导数,以及向量值或矩阵值函数对向量变量或矩阵变量的导数.本节简单地介绍这些内容. 一、函数矩阵的微分和积分定义 3.6 以变量t 的函数为元素的矩阵()(())ij m n A t a t ⨯=称为函数矩阵,其中()(1,2,,;1,2,,)ij a t i m j n ==都是变量t 的函数.若t ∈[a ,b ],则称A (t )是定义在[a ,b )上的;又若每个()ij a t 在[a ,b ]上连续、可微、可积,则称A (t )在[a ,b ]上是连续、可微、可积的.当A (t )可微时,规定其导数为()(())ijm n A t a t ⨯''=或d d ()()d d ij m nA t a t t t ⨯⎛⎫= ⎪⎝⎭而当A (t )在[a ,b ]上可积时,规定A (t )在[a ,b ]上的积分为()()d ()d bb ijaam nA t t a t t ⨯=⎰⎰例3.11 求函数矩阵23sin cos ()2e 01t t t t t A t t t ⎛⎫⎪= ⎪ ⎪⎝⎭的导数. 解2cos sin 1d ()2ln 2e 2d 003t t t t A t t t t -⎛⎫⎪= ⎪ ⎪⎝⎭关于函数矩阵,有下面的求导法则.定理3.12 设A (t )与B (t )是适当阶的可微矩阵,则(1)d d d(()())()()d d d A t B t A t B t t t t+=+ (2)当λ(t )为可微函数时,有d d d (()())()()()()d d d t A t t A t t A t t t t λλλ⎛⎫=+ ⎪⎝⎭(3)d d d (()())()()()()d d d A t B t A t B t A t B t t t t ⎛⎫=+ ⎪⎝⎭; (4)当u =f (t )关于t 可微时,有d d()()()d d A u f t A u t u'= (5)当1()A t -是可微矩阵时,有111d d (())()()()d d A t A t A t A t t t ---⎛⎫=- ⎪⎝⎭证 只证(2)和(5).设()(())ij m n A t a t ⨯=,()(())ij n p B t b t ⨯=,则111d d (()())(()())d d d d ()()()()d d d d ()()()()d d nik kj m n k n nik kj ik kj k k m nA tB t a t b t t t a t b t a t b t t t A t B t A t B t t t ⨯===⨯=⎛⎫⎛⎫=+ ⎪ ⎪⎝⎭⎝⎭⎛⎫=+ ⎪⎝⎭∑∑∑由于1()()A t A t I -=,两边对t 求导,得11d d ()()()()d d A t A t A t A t O t t --⎛⎫+=⎪⎝⎭从而111d d ()()()()d d A t A t A t A t t t ---⎛⎫=- ⎪⎝⎭证毕 定理3.13 设C n nA ⨯∈,则有(1)d e e e d AtAt At A A t ==; (2)dsin cos (cos )d At A At At A t ==;(3)dcos sin (sin )d At A At At A t=-=-.证 这里只证(1).(2)和(3)的证明与(1)类似.由0e !k Atkk t A k +∞==∑,并利用绝对收敛级数可以逐项求导,得101111d d e d d !(1)!e (1)!k k At k k k k k k Atk t t A A t t k k tA A A k -+∞+∞==-+∞-===-==-∑∑∑同样11111d e ==e d (1)!(1)!k k At k k At k k t t A A A A t k k --+∞+∞-==⎛⎫= ⎪--⎝⎭∑∑ 证毕根据定义和积分的有关性质,可得定理3.14 设A (t ),B (t )是区间[a ,b ]上适当阶的可积矩阵,A ,B 是适当阶的常数矩阵,λ∈C ,则 (1)(()())d ()d ()d bb ba aaA tB t t A t t B t t +=+⎰⎰⎰;(2)()d ()d bbaaA t t A t t λλ=⎰⎰;(3)()()d ()d bbaaA tB t A t t B =⎰⎰,()d ()d b baaAB t t A B t t =⎰⎰;(4)当A (t )在[a ,b ]上连续时,对任意t ∈(a ,b ),有()d ()d ()d t aA A t tττ=⎰(5)当A (t )在[a ,b]上连续可微时,有()d ()()baA t t A b A a '=-⎰以上介绍了函数矩阵的微积分概念及一些运算法则.由于d()d A t t仍是函数矩阵,如果它仍是可导矩阵,即可定义其二阶导数.不难给出函数矩阵的高阶导数11d d d ()()d d d k k k k A t A t t t t --⎛⎫= ⎪⎝⎭二、数量函数对矩阵变量的导数定义 3.7 设f (X )是以矩阵()ij m n X x ⨯=为自变量的mn 元函数,且(1,2,,;1,2,,)ijfi m j n x ∂==∂都存在,规定f 对矩阵变量X 的导数d d f X为 1111d d ij m nm mn f f x x n f f X x f f x x ⨯∂∂⎛⎫ ⎪∂∂ ⎪⎛⎫∂ ⎪== ⎪ ⎪ ⎪∂⎝⎭∂∂ ⎪ ⎪∂∂ ⎪⎝⎭特别地,以T 12(,,,)n x ξξξ=为自变量的函数f (x )的导数T12d (,,,)d nf f ff x ξξξ∂∂∂=∂∂∂称为数量函数对向量变量的导数,即为在数学分析中学过的函数f 的梯度向量,记为grad f .例 3.12 设T 12(,,,)n a a a a =是给定的向量,T 12(,,,)n x ξξξ=是向量变量,且T T ()f x a x x a ==求d d f x. 解 因为1()nk kk f x a ξ==∑而(1,2,,)j jfa j n ξ∂==∂所以TT 1212d (,,,)(,,,)d n nf f f f a a a a x ξξξ∂∂∂===∂∂∂例3.13 设()ij m n A a ⨯=是给定的矩阵,()ij n m X x ⨯=是矩阵变量,且()tr()f x Ax =求d d f X. 解 因为1()nikkj m m k AX ax ⨯==∑.所以11()tr()m nsk ks s k f X AX a x ====∑∑而(1,2,,;1,2,,)ijfi n j m x ∂==∂故T d ()d ji n m ij n mf f a A X x ⨯⨯⎛⎫∂===⎪ ⎪∂⎝⎭ 例 3.14 设()ij n n A a ⨯=是给定的矩阵,T 12(,,,)n x ξξξ=是向量变量,且T ()f x x Ax =求d d f x. 解 因为T1111()()n nn ns sk ks sk k s k s k f x x Ax aa ξξξξ=======∑∑∑∑而1111,11,111()nj j j j jk k j jj j j j n njk jn nsj s jk ks k fa a a a a a a a ξξξξξξξξξ--++===∂=+++++++∂=+∑∑∑所以1111111T T d d ()n ns s k k s k n nsn s nk k s k n f a a f x f a a A x Ax A A xξξξξξξ====∂⎛⎫⎛⎫+ ⎪ ⎪∂⎪ ⎪ ⎪== ⎪⎪ ⎪∂ ⎪ ⎪+ ⎪⎪∂⎝⎭⎝⎭=+=+∑∑∑∑ 特别地,当A 是对称矩阵时,有d 2d fAx x=例3.15 设()ij n n X x ⨯=是矩阵变量,且det X ≠0.证明1T ddet (det )()d X X X X-= 证 设ij x 的代数余子式为ij X .把det X 按等i 行展开,得1det nikik k X xX ==∑于是det ij ijX X x ∂=∂故 T1T 1Tddet det ()(adj )d ((det ))(det )()ij n n ij n nX X X X X x X X X X ⨯⨯--⎛⎫∂=== ⎪ ⎪∂⎝⎭== 三、矩阵值函数对矩阵变量的导数定义3.8 设矩阵()(())ij s t F X f X ⨯=的元素()(1,2,,;1,2,,)ij f X i s j t ==都是矩阵变量()ij m n X x ⨯=的函数,则称F (X )为矩阵值函数,规定F (X )对矩阵变量X 的导数d d FX为111d d 1F F x x n F X F F x x m mn ∂∂⎛⎫⎪∂∂ ⎪⎪=⎪∂∂ ⎪⎪∂∂ ⎪⎝⎭,其中1111t ij s st f f xx ij ij F x f f x x ij ij ∂∂⎛⎫⎪∂∂ ⎪∂ ⎪=⎪∂ ⎪∂∂⎪∂∂ ⎪⎝⎭即其结果为(ms )×(nt )矩阵. 作为特殊情形,这一定义包括了向量值函数对于向量变量的导数,向量值函数对于矩阵变量的导数,矩阵值函数对于向量变量的导数等. 例3.16 设T12(,,,)n x ξξξ=是向量变量,求T T d d d d x xx x=.解 由定义,得T 1TT 2T 100010d d 001n nx x x I x x ξξξ⎛⎫∂ ⎪∂ ⎪⎛⎫ ⎪∂⎪⎪ ⎪===∂ ⎪ ⎪⎪⎪ ⎪⎝⎭⎪∂ ⎪∂⎝⎭同理可得T 12d ,,,d n n x x xx I x ξξξ⎛⎫∂∂∂== ⎪∂∂∂⎝⎭例3.17 设T1234(,,,)a a a a a =是给定向量,24()ij X x ⨯=是矩阵变量,求Td()d Xa X,d()d Xa X. 解 因为41121k k k n k k k x a Xa x a ==⎛⎫⎪ ⎪= ⎪ ⎪⎝⎭∑∑,44T 1211()(,)k k k k k k Xa x a x a ===∑∑ 所以T T TT T 13141112T T T T 2122232431243124()()()()d()d ()()()()00000000Xa Xa Xa Xa x x x x Xa XXa Xa Xa Xa xx x x a a a a a a a a ⎛⎫∂∂∂∂⎪∂∂∂∂ ⎪=⎪∂∂∂∂ ⎪ ⎪∂∂∂∂⎝⎭⎛⎫= ⎪⎝⎭而131411122122232412341234()()()()d()()()()()d 00000000Xa Xa Xa Xa x x x x Xa Xa Xa Xa Xa Xxx x x a a a a a a a a ∂∂∂∂⎛⎫⎪∂∂∂∂ ⎪=⎪∂∂∂∂ ⎪∂∂∂∂⎝⎭⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭§3.5 矩阵分析应用举例本节介绍矩阵函数及矩阵微积分的一些应用. 一、求解一阶线性常系数微分方程组在数学或工程技术中,经常要研究一阶常系数微分方程组1111122112211222221122d ()()()()()d d ()()()()()d d ()()()()()d n n n n n n n nn n n x t a x t a x t a x t f t t x t a x t a x t a x t f t t x t a x t a x t a x t f t t ⎧=++++⎪⎪⎪=++++⎨⎪⎪=++++⎪⎩满足初始条件0()(1,2,,)i ix t c i n ==的解.如果记T 12(),(,,,)ij n n n A a c c c c ⨯==T 12()((),(),,())n x t x t x t x t =,T 12()((),(),,())n f t f t f t f t =则上述微分方程组可写为0d ()()()(3.8)d ()x t Ax t f t tx t c⎧=+⎪⎨⎪=⎩因为d d ()(e ())e ()()e d d d ()e ()e ()d At At At At At x t x t A x t t t x t Ax t f t t -----=-+⎛⎫=-= ⎪⎝⎭将上式两边在[0t ,t ]上积分,得00d (e ())d e ()d d tt A A t t x f τττττττ--=⎰⎰ 即000e ()e ()e ()d tAt A A t x t x t f ττττ----=⎰于是微分方程组的解为00()()eee ()d tA t t AtA t x t c f τττ--+⎰=例3.18 求解微分方程组初值问题113212313123d ()()()1d d ()()2()1d d ()4()3()2d (0)1,(0)0,(0)1x t x t x t t x t x t x t tx t x t x t t x x x ⎧=-++⎪⎪⎪=+-⎪⎨⎪=-++⎪⎪⎪===⎩ 解 记123()10111120,0,()(),()140312()x t A c x t x t f t x t -⎛⎫⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪====- ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎝⎭则微分方程组可以写成式(3.8)的矩阵形式.例3.9已求得222e 2e 0e e e e 2e e e e e 4e 02e e t t tAt t t tt t t t t t t t t t t t t ⎛⎫-⎪=-++-- ⎪ ⎪-+⎝⎭依次计算下列各量e e e e e 2e t t At t t t t c t t ⎛⎫- ⎪= ⎪ ⎪-⎝⎭,00e 1e e ()d e 1e 2e 22e t t t A tt f d τττττττ-------⎛⎫⎛⎫- ⎪ ⎪=-=-+ ⎪⎪ ⎪ ⎪-⎝⎭⎝⎭⎰⎰, 0e 1e e ()d e 12e 2t tAt A t t f τττ-⎛⎫- ⎪=-+ ⎪ ⎪-⎝⎭⎰故微分方程组的解为123e e e 1(2)e 1()()()e e 1(1)e 1()e 2e 2e 2(32)e 2t t t tt t t t t t t t t x t x t x t t t x t t ⎛⎫⎛⎫⎛⎫----⎛⎫⎪ ⎪ ⎪ ⎪==+-+=-+ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪----⎝⎭⎝⎭⎝⎭⎝⎭二、求解矩阵方程在控制论与系统理论中,要遇到形如AX +XB =F 的矩阵方程求解问题,这个矩阵方程也称为Lyapunov 方程.关于这个矩阵方程的解有如下结果. 定理3.15 给定矩阵方程 AX +XB =F (3.9) 其中Cm mA ⨯∈,Cn nB ⨯∈,Cm nF ⨯∈.如果A 和B 的所有特征值具有负实部(这种矩阵称为稳定矩阵),则该矩阵方程有惟一解e e d At Bt X F t +∞=-⎰证 记()e e At BtY t F =.则有Y (0)=F ,且d ()e e e e ()()(3.10)d At Bt At Bt Y t A F F B AY t Y t B t=+=+设12,,,m λλλ是A 的m 个特征值,12,,,n μμμ是B 的n 个特征值.根据利用Jordan标准形求矩阵函数的方法(见§3.3)知,e At的元素是形如e (0)j tr t r λ≥的项的线性组合.因为A 的所有特征值j λ的实部是负的,所以lim eAtt O →+∞=.同理lim e Bt t O →+∞=.于是lim ()lim e e At Bt t t Y t F O →+∞→+∞==又由于e e AtBtF 的元素是形如()e (0)i j tr t r λμ+≥的项的线性组合,且积分()0ed i j tr t t λμ+∞+⎰都存在,故积分e e d At Bt F t +∞⎰存在.对式(3.10)两边从0到+∞积分,得()()0()(0)()d ()d Y Y AY t t Y t t B+∞+∞+∞-=+⎰⎰即()()0()d ()d A Y t t Y t t B F+∞+∞-+-=⎰⎰这说明0e e d At BtX F t +∞=-⎰是矩阵方程(3.9)的解.惟一性的证明见第七章. 证毕 推论1 设Cm mA ⨯∈,Cn nB ⨯∈,Cm nF ⨯∈,则矩阵微分方程d ()()()d (0)X t AX t X t B tX F⎧=+⎪⎨⎪=⎩的解为()e e At BtX t F =推论2 设A ,C n nF ⨯∈,且A 的所有特征值具有负实部,则矩阵方程H A X XA F+=-的惟一解为H 0ee d (3.11)A tAt X F t+∞=⎰如果F 是Hermite 正定矩阵,则解矩阵X 也是Hermite 正定矩阵.证 只需证明后一结论.当F 是Hermite 正定矩阵时,由式(3.11)可知X 是Hermite 矩阵.又对0Cnx ≠∈,由于eAt总是可逆的,所以e 0Atx ≠,于是HH H e e (e )(e )0A t At At At x F x x F x =>.从而HH 0(e )(e )d 0At At x Xx x F x t +∞=>⎰故X 是Hermite 正定矩阵. 证毕三、最小二乘问题 设Cm nA ⨯∈,C n b ∈.当线性方程组Ax =b 无解时,则对任意C nx ∈都有Ax -b ≠0.此时希望找出这样的向量0C nx ∈,它使2Ax b -达到最小,即022Clim (3.12)nx Ax b Ax b ∈-=-称这个问题为最小二乘问题,称0x 为矛盾方程组Ax =b 的最小二乘解.以下结论给出了当A ,b 分别是实矩阵和实向量时,Ax =b 的最小二乘解所满足的代数方程.定理3.16 设R m nA ⨯∈,R m b ∈,0R n x ∈.若0R nx ∈是Ax =b 的最小二乘解,则0x 是方程组TT(3.13)A Ax A b=的解.称式(3.13)为Ax =b 的法方程组.证 由于2T 2TTTTTT()()()f x Ax b Ax b Ax b x A Ax x A b b Ax b b=-=--=--+若0x 为Ax =b 的最小二乘解,则它应是f (x )的极小值点,从而d 0(3.14)d x f x=根据例3.12和例3.14,得T T d 22d fA Ax A b x=- 由式(3.14)即知T T00A Ax A b -=,故0x 是式(3.13)的解. 证毕对于含约束条件的最小二乘问题,有如下的结果. 例3.19 设Rm nA ⨯∈,R m b ∈,Rk nB ⨯∈,R kd ∈,且Bx =d 有解.试求约束极小。
第4讲(1)矩阵序列与矩阵函数
=
⎜ ⎜⎜⎝
0 1
1 1
0 0
⎟ ⎟⎟⎠
⎜ ⎜⎜⎝
0 0
sin 2 0
cos sin
2 2
⎟ ⎟⎟⎠
⎜ ⎜⎜⎝
0 1
1 1
−01⎟⎟⎟⎠
⎛ sin 2
0
0⎞
=
⎜ ⎜⎜⎝
cos cos
2 2
sin 2 + cos 2 cos 2
− cos 2 sin 2 − cos
2
⎟ ⎟⎟⎠
⎛ 1 0 1⎞ ⎛ e2t 0 0 ⎞ ⎛ 0 −1 1 ⎞
lim A(k ) = A.
k→∞
若对某一组i和j,aij(k)不收敛,则称{A(k)}发散.
3
性质1:设A(k)和B(k)分别收敛到A和B,则 limα A(k) + β B(k) = α A + β B,
k→∞
lim A(k )B(k ) = AB.
k→∞
性质2:设A(k)收敛到A,且A(k)和A都可逆,则
n 阶矩阵 A的谱半径为 ρ ( A),P −1 AP = J
∞
∑ 则当 ρ( A) < R 时,幂级数 ak Ak 收敛, 且 k=0
∑⎡
⎢
∞
a
k
J
k 1
⎤ ⎥
∑∞
ak Ak
=
⎢k=0 P⎢
O
⎥ ⎥
P
−1
k=0
⎢
⎢⎣
∑∞
k=0
ak
J
k s
⎥ ⎥⎦
17
18
3
⎡J1
⎤
P −1 AP
=
J
=
⎢ ⎢
函数与矩阵的概念和性质
函数与矩阵的概念和性质函数是一种数学对象,描述了输入与输出之间的关系。
一个函数通常由三个要素组成:定义域、值域和对应关系。
函数通常表示为f(x),其中x是定义域的元素,f(x)是x在函数中对应的值。
矩阵是一个由m行n列元素组成的矩形阵列。
每个元素可以是实数、复数或其他数学对象。
一个矩阵的大小通常表示为m x n,其中m是矩阵的行数,n是矩阵的列数。
函数和矩阵有许多重要的概念和性质。
下面我将对其中一些进行详细介绍。
1.函数的复合:给定两个函数f(x)和g(x),它们的复合函数(g∘f)(x)定义为先应用f(x),然后将结果作为g(x)的输入。
复合函数可以用来描述多个函数的组合效果。
2.函数的反函数:对于一个函数f(x),如果存在一个函数g(x),使得f(g(x))=x,且g(f(x))=x对于定义域和值域中的所有元素成立,那么g(x)就是f(x)的反函数。
反函数可以用来将函数的输出映射回输入。
3.矩阵的乘法:给定两个矩阵A和B,它们的乘积A B定义为将A的每一行与B的每一列进行逐个元素的乘法,然后将乘积相加得到的结果。
矩阵乘法可以用来描述线性变换的组合效果。
4.矩阵的转置:给定一个矩阵A,它的转置矩阵A^T定义为将A的行与列进行交换所得到的矩阵。
转置操作可以改变矩阵的形状,同时保持矩阵的性质不变。
5.矩阵的逆:对于一个方阵A,如果存在一个矩阵B,使得A B=B A=I,其中I是单位矩阵,那么B就是A的逆矩阵。
逆矩阵可以用来将矩阵的乘法操作逆转回来。
6.矩阵的行空间和列空间:给定一个矩阵A,它的行空间是由A的行向量张成的向量空间,而列空间是由A的列向量张成的向量空间。
行空间和列空间可以用来描述矩阵所表示的线性变换的影响。
7.矩阵的秩:给定一个矩阵A,它的秩是指A中线性无关的行或列的最大数量。
秩可以用来描述矩阵的线性相关性和维度。
8.矩阵的特征值和特征向量:给定一个方阵A,如果存在一个标量λ和一个非零向量x,使得A x=λx,那么λ就是A的一个特征值,x就是对应于λ的特征向量。
矩阵的函数
矩阵的函数主要有以下几种:1.矩阵转置:用符号“`”来表示和实现。
对于复数矩阵,其转置会有所不同。
2.矩阵的翻转和旋转:如flipud(a)实现a矩阵的上下翻转,rot(90)使矩阵逆时针旋转90度,fliplr(a)实现矩阵的左右翻转。
3.矩阵的求最值函数:max(a)默认返回每列的最大值,也可以指定维度来寻找最值。
4.矩阵的取整函数:包括ceil(a)(向上取整)、floor(a)(向下取整)、fix(a)(向0取整)以及round(a)(四舍五入取整)。
5.矩阵大小函数:size(A)返回一个行向量,表示矩阵各维度的大小;length(a)返回a最大维度的长度;还有isempty(a)判断数组是否为空。
6.矩阵合并:可以通过指定k值实现矩阵的行或列添加合并,要求合并的矩阵具有相应的维度相等。
以下是一些其他常用的矩阵函数:1.矩阵的迹(trace):矩阵对角线上元素的和。
迹的性质包括迹是所有特征值的总和,是相似不变量等。
2.矩阵的行列式(determinant):一个用来判断矩阵是否可逆的数。
对于方阵A,其行列式记为det(A)或者|A|。
3.矩阵的逆(inverse):一个矩阵A如果存在逆矩阵,则满足A*A^(-1)=I,其中I是单位矩阵。
4.矩阵的秩(rank):矩阵中非零子式的最高阶数。
秩反映了矩阵中有用的信息数量。
5.矩阵的特征值(eigenvalue)和特征向量(eigenvector):对于一个方阵A,如果存在非零向量v,使得Av=λv,那么λ就是A的一个特征值,v是对应的特征向量。
6.矩阵的范数(norm):用来度量矩阵大小的一种量。
常用的有1-范数、∞-范数和Frobenius范数等。
7.矩阵的分解(decomposition):包括LU分解、QR分解、SVD分解等,这些分解方法有助于解决一些特定的问题。
8.矩阵的指数函数、对数函数等:这些都是扩展了实数函数的概念到矩阵上的结果。
矩阵函数及函数矩阵矩阵函数及函数矩阵
第六章矩阵矩阵函数及函数矩阵函数及函数矩阵第一节矩阵多项式、最小多项式定义:设nn m m mm CA a a a a p ⨯--∈++++=,)(0111λλλλ m m1-则称E a A a A a A a A p m m 011)(++++=- 为A 的矩阵多项式.块i ⎥⎤⎢⎡λλ1例1:设J i 为d i 阶Jordan ii J ⎥⎥⎥⎢⎢⎢=1 iidd i ⨯⎦⎣λJ d di ()例2:设J 为Jordan 标准形, J =diag(J 1, J 2, , J r ), 则:diag J J J J =))(,),(),((g )(21r p p p p 例3:设A 为n 阶矩阵, J 为其Jordan 标准形, A =PJP -1=P diag(J 1, J 2, , J r )P -1,则:11--== (以上表达式称为p (A )的Jordan 表示)21))(,),(),((diag )()(PJ p J p J p P P J Pp A p r 例4:设34,12)(-+-=p λλλλ1020*********-⎥⎥⎤⎢⎡=⎥⎥⎤⎢⎡=PP A 200311⎦⎢⎣⎦⎢⎣-⎥⎤⎢⎢⎡-=⎥⎤⎢⎡=-111010,0011101P P 其中:⎥⎥⎦⎢⎣-⎥⎥⎦⎢⎢⎣-110101则:=-)()(1PJ Pp A p ⎤⎡-⎤⎡'⎤⎡0100)2()2(0110p p ⎥⎥⎦⎢⎢⎣-⎥⎥⎦⎢⎢⎣⎥⎥⎦⎢⎢⎣-=0110111)2(000)2(010101p p ⎥⎤⎢⎡--=⎥⎥⎤⎢⎢⎡''-'''-'=98901)2()2()2()2(00)2(p p p p p ⎥⎦⎢⎣⎦⎣+1099)2()2()2()2(p p p p定义:设0111)(,a a a a p C A m m m m nn ++++=∈--⨯λλλλ 若-满足则称(λ)为A 的化零多项式.0)(0111=++++=-E a A a A a A a A p m m mm p 定理:设是A 的化零多项)det()(,A E D CA nn -=∈⨯λλ则式,即D (A ) =0. (Hamilton Hamilton--Cayley 定理)))))证明:设J =diag(J 1(λ1), J 2(λ2), , J r (λr )) 是A 的若当标准型,即A =PJP -1=P diag(J 1, J 2, , J r )P -1, 则:1211))(,),(),((diag )()(--==PJ D J D J D P P J PD A D r)()()(λλλλf p id i i -=⇒id 即: Jordan 块的最小多项式为其初等因子.ii J )()(λλλψ-=⇒定理:设, 则:的任一化零多项式都能被nn CA ⨯∈(1)A 的任化零多项式都能被ψA (λ)整除;(2)A 的最小多项式ψA (λ)是唯一的;(3)相似矩阵的最小多项式相同证明:(1) 设f (λ)为A 的化零多项式, 则∃多项式q (λ)及次数小于ψA (λ)次数的多项式r (λ),使)()()()(λλλψλr q f A +=⇒)()()()(=+=A r A q A A f A ψ即: r (λ)也是A 的化零多项式. 从而r (λ) =0, 否则与ψA (λ)为A 0)(=A r 再由⇒)(=A A ψ的最小多项式矛盾,因为r (λ)的次数<ψA (λ)的次数.(2)(2)设ψA (λ)及ξA (λ)都为A 的最小多项式, 则ψA (λ)能被ξA (λ)整除, ξA (λ)也能被ψA (λ)整除,从而ψA (λ) =ξA (λ).(3) 设B =P -1AP , A 和B 的最小多项式为p (λ)和q (λ). 由B =-1)=-1=0,P AP 知:p (B ) P p (A )P 0, 从而p (λ)是B 的化零多项式, p (λ)的次数≥q (λ)的次数.同理, q (λ)的次数≥p (λ)的次数.))所以p (λ)的次数=q (λ)的次数.从而, p (λ) =q (λ).定理:定理:设分别是的最小多项式,则A 的最小多项式是)(,),(),(),,,,(diag 2121λψλψλψs s A A A A =s A A A ,,,21 的最低公倍式.)(,),(),(21λψλψλψs 证明:设是A 的最小多项式, 则:)(λψA 0))(,),(),((diag )(21==s A A A A A A A A ψψψψ 于是: , 即0)(,,0)(,0)(21===s A A A A A A ψψψ )(λψA ))是的化零多项式⇒是的公倍式.s A A A ,,,21 )(,λψs )(λψA ),(),(21λψλψ⇒若不是的公倍式,:)(,),(),(21λψλψλψs )(λψA 则0)(≠A A ψ另一方面, 若是的最低公倍式,则: .从而是A 的化零多项式. 次数)(λψA )(,),(),(21λψλψλψs 0)(=A A ψ)(λψA 更低的多项式必定不是的公倍式,从而不是A 的化零多项式.定理得证.)(,),(),(21λψλψλψs ⎥⎤⎢⎢⎡=⎥⎤⎢⎡---=11621例5:⎥⎥⎦⎢⎣→⎥⎥⎦⎢⎢⎣--11411301)1(J A 2)1()(-=λλψA ⇒⎤⎡-⎤⎡-1111⎥⎥⎦⎢⎢=→⎥⎥⎢⎢--=01017215)2(J A ⎥⎢⎣⎥⎦⎢⎣-212662)1()(λλλψ+=A ⇒J d 第二节矩阵函数及其Jordan 表示定义:设A 的最小多项式为,)()()()(2121sd s d d A λλλλλλλψ---= 其中为A 的互异特征值. 若函数f (x )具有足够多且下列s λλλ,,,21 d d d m +++= 阶的导数值,个值),,2,1(),(,),(),()1(s i ff f i d i i i ='-λλλs 21都有确定的值,则称f (x )在A 的影谱上有定义.-⎡-111例1:⎥⎥⎤⎢⎢⎡--=⎥⎥⎤⎢⎢-=112103,0340B A ⎥⎦⎢⎣-⎥⎦⎢⎣30201p(x)不唯一例2:⎤⎡⎤⎡⎥⎤⎡11012002⎥⎥⎥⎦⎢⎢⎢-=⎥⎥⎥⎦⎢⎢⎢==⎥⎥⎢⎢⎢-=-101001,22,3111111P J PJP A ⎣⎣⎦⎣⎤⎡⎤⎡'010)2()2(f f ⎥⎥⎥⎦⎢⎢⎢--=⎥⎥⎥⎢⎢⎢=-110111,)2()2()(1P f f J f ⎣⎦⎣⎤⎡00)2(f ⎥⎥⎥⎢⎢⎢'+'-'''-'==-2222)2()2()2()2()()(1f f f f P J Pf A f ⎦⎣)()()()(f f f fA e At cos 例3:求f (A )的Jordan 表示, 并计算e , e , cos A⎡50⎥⎥⎤⎢⎢⎡=⎥⎥⎦⎤⎢⎢⎡==⎥⎥⎤⎢⎢--=-13000120,2123,130903025171P J PJP A ⎦⎣⎣⎦⎣⎡1⎥⎥⎤⎢⎢⎡--=⎥⎥⎦⎤⎢⎢'=-50320100,2()2()2()3()(1P f f f J f ⎡''⎦⎣⎣)f ⎥⎥⎤⎢⎢'-'-+==-21520290)3(0)2(250)2(15)2()()(1f f f f P J Pf A f ⎦⎣)()()(f f f⎡⎥⎥⎤⎢⎢--+=⎥⎥⎦⎤⎢⎢⎡--=1510900250)151(,140900250162232222322t e te e te t e e e e ee e e tt t t t At A ⎥⎦⎢⎣⎣)(⎤⎡-()2sin(250)2sin(15)2cos((⎥⎥⎦⎢⎢⎣+-=)2sin(15)2cos(0)2sin(90)3cos(0)cos(A •用矩阵函数Jordan 表示计算f (A )的一般步骤:(1) 求A 的Jordan 标准形J ; (2) 求f (J );(3) 由AP =PA 计算变换矩阵P ; (4) 求f (A ) =Pf (J )P -1;(5) x Pf J P -1A ).()将具体f ()代入f ()即可求出f ()定理:设f (x )与g (x )在A 的影谱上有定义, 则:f (A ) =g (A ) ⇔f (x )与g (x )在A 的影谱上有相同的值第三节矩阵函数的多项式表示定义:设n 阶矩阵A 的最小多项式为,)()()()(2121sd s d d A λλλλλλλψ---= , 函数f (x )在A 的影谱上有定义, m -1次多项式s d d d m +++= 21满足1110)(--+++=m m a a a p λλλ 为什么是m -1次?1,,1,0;,,2,1),()()()(-===i i k i k d k s i fp λλ从而:1110)()(--+++==m m Aa A a E a A p A f 称f (A )的以上表达式为f (A )的多项式表示.⎡0例1: 设, 求矩阵函数f (A )的多项式表示,⎥⎤⎢=11102A 并计算e At⎥⎥⎦⎢⎢⎣-311解:前已求得, A 的Jordan 标准形为:⎥⎥⎤⎢⎢⎡=020012J 因此, 其最小多项式为(x ) =(x -2)2⇒m =2 ⇒⎥⎦⎢⎣200ψA 110)()(a x p x a a x p ='⇒+=满足:⎨⎧''-=⇒⎨⎧''=+=)2(2)2()2(2)2(010a f f a f a a p ⎩=⎩==)2()2()2(11f f a p从而:AE A a E a A 2222'+'-=+=f f f f )()]()([)(10此即f (A )的多项式表示. 将E 和A 代入, 可得:⎤⎡⎥⎢''-'=)2()2()2()2(00)2()(f f f f f A f ⎥⎥⎦⎢⎢⎣'+'-')2()2()2()2(f f f f 与第一节例4t 的结果相同⎡当f (x ) =e tx时, f (2) =e 2t , f'(x ) =t e 2t , 从而⎥⎥⎤⎢⎢-=t t t t e et At110012⎥⎦⎢⎣+-t t⎡1例2: 设, 求矩阵函数f (A )的多项式表示.⎥⎤⎢--=03401A 解)⎥⎥⎦⎢⎢⎣201解:前已求得, A 的最小多项式为ψA (x ) =(x -1)2(x -2)xa a x p x a x a a x p m 2122102)(,)(312+='++=⇒=+=⇒满足:'⎧⎪⎨⎧-'+=-=⇒⎪⎨'=+='=++=)2(2)1(3)1(2)1(2)2()1(2)1()1()1(1021210f f f a f f a f a a p f a a a p ⎪⎩'--=⎪⎩=++=)1()1()2()2(42)2(2210f f f a f a a a p=++=2210)(A a A a E a A f(m -1次)sd s )λ1-i d因此:⎤⎡+-+sk k k E A a E a 21)(λ ∑=-⎥⎥⎦⎢⎢⎣-+==k k d k kd A E A a A p A f kk11)()()()(ϕλsk k d s d k d k d k E A E A E A E A A )()()()()(111111λλλλϕ----=+-+- 称以上f (A )的表达式为f (A )的Lagrange-Selvester 内插多项式表示.3:设⎥⎤⎢⎡002例3: , 求矩阵函数f (A )的Lagrange-⎥⎥⎦⎢⎢⎣-=311111A Selvester 内插多项式表示.•与例1得到的多项式表示Af E f f A a E a A f )2()]2(2)2([)(10'+'-=+=相比, 结果是一致的, 只是表示方式不一样.第四节矩阵函数的幂级数表示第五章定义过矩阵幂级数. 设A 的Jordan 标准 -1∑∞=0k kk A c 形J =diag(J 1(λ1),J 2(λ2),,J r (λr )),A =PJP ⇒A k =PJ k P -1=P diag(J 1k (λ1), J 2k (λ2), , J r k (λr ))P -1⇒⎛100220110)(,,)(,)(diag -∞=∞=∞=∞=⎪⎪⎭⎫ ⎝=∑∑∑∑P J c J c J c P A c k r kr k k k k k k k k k k λλλ i i kk d k id k k k k ikk k k ik Cc C c c ∞∞=+--∞=-∞=⎥⎤⎢⎡∑∑∑0110110λλλk k k ik k k ik k i ki k C c c J c ∞=-=∞=⎥⎥⎥⎢⎢⎢=∑∑∑01100)(λλλiidd k ikc ⨯∞=⎥⎦⎢⎣∑0λ与前页结果相同⎥⎤⎢⎡1310041285⎥⎥⎦⎢⎢⎣-511第五节函数矩阵⎛x a x a 定义:设()⎪⎪⎫ ==⨯)()()()(111a x a x A n nm ij 其中: x ∈R , a ij (x )∈R , 称A (x )为函数矩阵——以实函数为⎪⎭⎝)()(1x x a mn m 元素的矩阵•函数行向量、函数列向量、函数矩阵的转置函数矩阵加法纯量函数与函数矩阵乘法函数矩阵与•函数矩阵加法、纯量函数与函数矩阵乘法、函数矩阵与函数矩阵乘法))))定义:设A (x ) =(a ij (x ))为n 阶函数矩阵, 若∃B (x ) =(b ij (x )), 使得∀x ∈[a , b ],A xB x ) =B x A x ) =E ()()()()则称A (x )在[a, b ]上可逆, B (x )是A (x )的逆的逆矩阵矩阵, 记为A -1(x ).x A x B x B x )()()]()+=x d ?)(d )(2)(d 2x A x A x A =d d xx ,可逆时()21)(x A -A x A x A x x A x A x d )()(d )(d )()(211---≠-=))()((1得到可由E x A x A =-。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
{ A } 收敛于 A, 记为
(k )
lim A( k ) = A 或 A( k ) → A
k →∝ k →∝
不收敛的矩阵序列则称为发散的,其中又分为有界和无界的情况。 对于矩阵序列 A
(k ) aij <M
{ } ,若存在常数 M > 0 ,使得对一切 k 都有
(k )
则称 A
{ } 为有界的。
(k )
k =1
N
{S } 收敛,且有极限 S , 则称该矩阵级数收敛,且有和 S . 记为
S = ∑ A(k )
k =1 ∞
不收敛的矩阵级数称为是发散的。
6
若矩阵级数 对收敛。
∑A
k =1
∝
(k )
的所有元素
∑a
k =1
∝
(k ) ij
均绝对收敛,则称该级数为绝
2. 绝对收敛矩阵级数的性质 (1) 绝对收敛矩阵级数一定收敛,且任意调换它的项所得的级数仍收
k 0 k =0 k
∝
I ) 是绝对收敛的。 反之, 若 A 存
在落在 ϕ ( z ) 的收敛圆外的特征值, 则 ϕ ( A) 是发散的。 证明略. [推论] 若幂级数在整个复平面上收敛, 则对任何的方阵 A , ϕ ( A) 均收 敛。
11
四、 矩阵函数 如: e , sin A , cos A 以矩阵为自变量的“函数”(实际上是“函矩阵”)
三、 方阵的幂级数
A 为方阵 ,
Neumann 级数。
∑ c A ,( A
k =0 k
∝
= I ) 称为 A 的幂级数 .
∑A
k =0
∝
k
称为 A 的
1. Neumann 级数收敛的充要条件 [定理] Neumann 级数收敛的充要条件是 A 为收敛矩阵,且在收敛时其和 为 ( I − A) 。 证明: [必要性]
敛,且其和不变。 (2)
∑A
k =1 ∝
∝
(k )
绝对收敛,则
∑ PA
k =1
∝
(k )
Q 也绝对收敛且等于 P ∑ A( k )Q 。
k =1
∝
(3)
∑A
k =1
(k )
,
∑B
k =1
∝
(k )
均绝对收敛,且和分别为 S1 , S 2 则
7
= k 1= i 1
∑ (∑ A
k 0
∝
k
(i )
B ( k +1−i ) ) = S1S 2
5
而这只有 λi < 1才可能也必能。 [得证] 二、 矩阵级数 1. 定义 : 矩阵序列 A 级数, 记为
(N )
{ } 的无穷和 A
(k )
(1)
+ A(2) + + A( k ) + 叫做矩阵
∑A
k =1
∞
(k )
。而 S
(N )
= ∑ A( k ) 称 为 其 部 分 和 , 若 矩 阵 序 列
k J2
P −1 J sk
k λik −1
k! λik − mi +1 (mi − 1)!(k − mi + 1)! , 当 k > mi ...
1, 2,..., s ) , 等价于 λik → 0(i = 1, 2,..., s ) , Ak → 0 就等价于 J ik → 0(i =
(k ) k →∝
( k ) −1
) → A−1
k →∝
3 收敛矩阵的定义: 设 A 为方阵,若当 k →∝ 时 A → 0 , 则称 A 为收敛
k
矩阵。
3
[定理] 方阵 A 为收敛矩阵的充要条件是 A 的所有特征值的模值均小于 1. 证明: 对任何方阵 A ,均存在可逆矩阵 P , 使得
A = PJP −1
∝ 1 2 1 我们知道, e =1 + z + z + = ∑ z n 2! n =0 n! z A
−1
而 ( I + A + A + ... + A )( I − A) = I − A
2 k
k +1
右乘 ( I − A) 得
−1
I + A + A2 + ... + Ak = ( I − Ak +1 )( I − A) −1
当 k →∝ 时, A
k &1 ( I − A) −1 → 0 . 所以
第七讲 矩阵级数与矩阵函数
1
一、 矩阵序列 1. 定 义 : 设 有 矩 阵 序 列 A
(k ) aij → aij , 则称 { A( k ) } 收敛 , 并把 A = ( aij ) 叫做 { A( k ) } 的极限 , 或称
{ },
(k )
其中 A
(k )
(k ) = ( aij ) , 且当 k → ∞ 时
其中 J 为 A 的 Jordan 标准形
J1 J =
J2
λi , Ji = Js 0
1
λi
0 1 λi
4
J1k k k −1 = = A PJ P P k λi k Ji =
8
−1
级数
∑A
k =0
∝
k
收敛, 其元素为
δ ij + ( A)ij + ( A2 )ij + ( A3 )ij +
显然也是收敛的 . 作为数项级数, 其通项趋于零是级数收敛的必要条 件。 故
( Ak )ij → 0 ,即 Ak → 0
k →∝ k →∝
也就是说 A 为收敛矩阵。 [充分性]:
k →∝ = i 0= i 0
∑ A=
i
∝
i lim ∑ A= ( I − A) −1
k
10
即 Neumann 级数收敛于 ( I − A) 。 2. 收敛圆 [定理] 若矩阵 A 的特征值全部落在幂级数 ϕ ( z ) = 则矩阵幂级数 = ϕ ( A)
−1
∑c z
k =0 k
∝
k
的收敛圆内,
= c A ,( A ∑
A 为收敛矩阵, 则其特征值的模值均小于 1。 设 A 的特征值为 λ ,
9
( I − A) 的特征值为 µ . 则由 det( µ I − ( I − A)) = det(( µ − 1) I + A) =− ( 1) n det((1 − µ ) I − A)
可见1 − µ =λ → µ = 1− λ 故 0 < µ < 2 → µ ≠ 0 , ( I − A) 的行列式不为零, ( I − A) 存在.
2
2. 收敛矩阵序列的性质: 设
{ A } ,{B } 分别收敛于 A, B 则
(k ) (k )
(k )
(1) α A
+ β B(k ) → α A + β B
k →∝ (k ) k →∝
(2) A B
(k )
→ AB
−1
( k ) −1
(3) 若 ( A ) , A 存在,则 ( A (4) PA Q → PAQ