矩阵分析
矩阵分析期末总结
矩阵分析期末总结引言:在矩阵分析这门课程中,我们系统学习了矩阵的基本概念、运算、性质和应用等知识。
通过学习矩阵分析,我们能够更好地解决线性方程组、矩阵特征值和特征向量、矩阵的相似性等问题。
本文将对我在矩阵分析课程中的学习内容和收获进行总结与归纳。
一、矩阵的基本概念与性质矩阵作为线性代数的基础概念,具有以下基本性质:1. 矩阵的定义与表示,包括行矩阵、列矩阵、方阵和零矩阵等。
2. 矩阵的大小与维度,用行数与列数来表示矩阵的大小,例如m x n矩阵表示有m行n列的矩阵。
3. 矩阵的运算,包括矩阵的加法、数乘和乘法等。
4. 矩阵的转置与共轭转置,将矩阵的行与列进行互换,并对矩阵元素取共轭得到的转置矩阵。
5. 矩阵的逆与伴随,如果一个矩阵A存在逆矩阵A^-1,则称A为可逆矩阵或非奇异矩阵。
二、矩阵的特征值与特征向量1. 特征值与特征向量的定义,对于一个n阶方阵A,如果存在一个非零向量x使得Ax=λx,则称λ为矩阵A的特征值,x为对应的特征向量。
2. 特征值与特征向量的计算方法,通过解方程(A-λI)x=0可以求得特征值λ和特征向量x。
3. 特征值与特征向量的性质,特征值与特征向量满足一系列重要的性质,例如特征值的重数与特征向量的线性无关性等。
4. 对称矩阵的特征值与特征向量,对称矩阵的特征值都是实数,并且存在一组相互正交的特征向量。
5. 正交矩阵的特征值与特征向量,正交矩阵的特征值的模长都等于1,特征向量是正交归一化的。
三、矩阵的相似性与对角化1. 相似矩阵与对角化,如果存在一个可逆矩阵P,使得P^(-1)AP=D,其中D是一个对角矩阵,则称矩阵A与D相似,且称A可对角化。
2. 相似矩阵的性质,相似矩阵具有一系列重要的性质,例如特征多项式、迹、行列式等。
3. 矩阵的谱分解与Jordan标准形,对于n维方阵A,如果存在P使得P^(-1)AP=J,其中J 是一个Jordan标准形矩阵,则称矩阵A可谱分解。
四、矩阵分析的应用矩阵分析在实际应用中具有广泛的应用,例如:1. 线性方程组的求解,可以通过矩阵分析中的逆矩阵、伴随矩阵等方法求解线性方程组。
矩阵论五矩阵分析
矩阵论五矩阵分析矩阵论作为数学中的一个重要分支,研究的是矩阵的性质、运算和应用。
在实际应用中,矩阵论广泛应用于线性代数、计算机科学、物理学、经济学等领域,起到了重要的作用。
本文将介绍矩阵分析这一矩阵论的重要内容。
矩阵分析是矩阵论中的一个重要分支,它研究的是矩阵的各种性质和内在结构。
矩阵分析包括矩阵的行列式、特征值、特征向量、正交变换、相似矩阵等概念和定理。
首先,矩阵的行列式是一个非常重要的概念。
行列式是一个把方阵映射到实数的函数,用于判断矩阵是否可逆、求解线性方程组等问题。
行列式的计算可以通过对矩阵进行列展开、代数余子式等方法来进行。
同时,行列式还具有一系列重要的性质,如行列式的线性性、行列式的性质、Cramer法则等,这些性质为行列式的计算和应用提供了便利。
其次,矩阵的特征值和特征向量也是矩阵分析的重要内容。
特征值和特征向量描述了矩阵在线性变换下的性质,是矩阵的本征特性。
通过求解特征方程,可以得到矩阵的特征值,通过求解对应的特征向量,可以得到矩阵的特征向量。
特征值和特征向量在很多应用中起着重要的作用,如在物理学中用于描述物理量在变换下的特性,亦或者在图像处理中用于图像压缩和分解等。
此外,矩阵的正交变换也是矩阵分析中的一个重要概念。
正交变换是指保持向量长度和夹角不变的线性变换,可以通过一个正交矩阵来实现。
正交变换在几何学中起到了非常重要的作用,如在三维空间中的旋转变换、投影变换等。
正交矩阵具有很多重要的性质,如正交矩阵的逆等于其转置、正交矩阵的行列式为1或-1等。
最后,相似矩阵也是矩阵分析中的一个重要概念。
相似矩阵是指可以通过一个可逆矩阵相似变换得到的矩阵。
相似矩阵具有相同的特征值,特征向量和行列式。
相似矩阵在矩阵的相似性和等价性判断、矩阵的对角化等问题中起到了重要的作用。
总之,矩阵分析作为矩阵论的重要分支,研究的是矩阵的各种性质和内在结构,是矩阵论的重要内容之一、矩阵分析包括矩阵的行列式、特征值、特征向量、正交变换和相似矩阵等概念和定理。
矩阵分析第一章
类似地, 还可定义多个集
注 1.1.3 (表示映射的带尾与不带尾的箭头的区别) 从集合 S 到集合 S 的映射 f 这一事实用不带尾的箭头表示, 即 f :S →S ; 而映射 f 把集合 S 中的元素 a ∈ S 映为集合 S 中的元素 b ∈ S 这一事实, 用带尾的箭头表示, 即 f :a ab. 这种记号约定在数学文献中已很普遍. 另外, 要习惯于将运算视为映射的观点. 例如, 整数集合 Z 上的加法运算+就决定了如下映射
[α1
α2
理解; 右边的 0 为线性空间 V 中的零元素. 另一方面, V 中的向量组 α ,α ,K,α 线性无关, 就是以该向量组拼成的抽象矩阵为系数矩阵的抽象齐次 线性方程组
n n n n n
几何空间中的有向线段} = { AB : A, B两点都取遍几何空间} ,
这里第二个加号“+”按例 1.1.1 中的(1.1.2)式来理解; 给定 f ∈ F ( I , R ) ,
n
f + g : t a f (t ) + g (t ) , f ⋅ k : t a f (t ) ⋅ k ,
n n 1 2 p 1 2 p
称为向量组 α ,α ,K,α 拼成的抽象矩阵.
1 2 p
[α1
α2 L α p ]
定义 1.1.3 (向量组的线性相关性) 设 V 是 F 上的线性空间, α ,α ,K,α 是V 中的一个向量组. (1) 向量组 α , α ,K, α 称为线性相关的, 如果存在不全为零的 p 个数 k ∈ F ,
2
或写成列
( s1 , s2 ) ≠ ( s2 , s1 ) .
依赖于约定, 或有时只是为了节省书写篇幅. 这里应注意顺序: 合的积. 特别地, 我们有
matrix解析
在数学中,矩阵(Matrix)是一个由m×n个数排成的矩形阵列,其中的每个数称为矩阵的一个元素或项。
矩阵中的行数m和列数n分别被称为矩阵的阶数或维度。
例如,一个3×4的矩阵有3行4列。
矩阵通常用大写字母表示,如A、B等,其元素则通过下标来标识,如Aij表示矩阵A中第i行第j列的元素。
形式化定义如下:对于一个m×n的矩阵A,可以写作: A = [ a11 a12 ... a1n ] [ a21 a22 ...a2n ] ... [ am1 am2 ... amn ]其中,aij是矩阵中的任意一个元素,且i=1,2,...,m;j=1,2,...,n。
矩阵在很多数学分支以及工程领域中有广泛应用,包括线性代数、概率论、统计学、计算机图形学、机器学习等。
常见的矩阵运算包括加法、减法、数乘、矩阵乘法、转置、求逆、特征值与特征向量等。
1.矩阵加法和减法:两个同型矩阵(即行数和列数相同)可以相加或相减,对应位置的元素进行加减操作。
2.数乘:给定一个标量c和一个矩阵A,可以计算c与A的乘积,结果矩阵的每个元素都是原矩阵对应元素与c的乘积。
3.矩阵乘法:矩阵乘法不满足交换律,只有当第一个矩阵的列数等于第二个矩阵的行数时,才能进行乘法运算。
结果矩阵的行数为第一个矩阵的行数,列数为第二个矩阵的列数。
其运算法则是按照“逐行逐列”相乘再求和的方式进行。
4.转置:矩阵A的转置记作A^T,它将原矩阵的行变为列,列变为行,即A^(i,j) = A^(j,i)。
5.求逆:对于方阵(即行数等于列数的矩阵),若存在,则可求逆,记作A^-1,满足AA^-1=A^-1A=E(E为单位矩阵)。
6.特征值与特征向量:对一个方阵A,如果存在非零向量x和标量λ,使得Ax=λx,则称λ是矩阵A的特征值,x是对应的特征向量。
以上是对矩阵的基本解析和分析,实际应用中矩阵的概念和性质远比这丰富和复杂。
矩阵分析知识点总结
矩阵分析知识点总结一、矩阵的基本概念1.1 矩阵的定义矩阵是由数个数排成的矩形阵列。
矩阵可以用大写字母表示。
1.2 矩阵的基本要素- 元素:矩阵中的每一个数称为矩阵的元素。
- 维数:矩阵的行数和列数称为矩阵的维数。
行和列的个数分别称为行数和列数。
1.3 矩阵的类型- 方阵:行数等于列数的矩阵称为方阵。
- 零矩阵:所有元素都是 0 的矩阵称为零矩阵。
- 对角矩阵:除了主对角线上的元素外,其它元素都是 0 的矩阵称为对角矩阵。
1.4 矩阵的表示- 横标法:按行标的顺序把元素排列成一串数,两个 4× 3 的矩阵可以表示为 12 个数。
- 纵标法:按纵标的顺序把元素排列成一串数。
1.5 矩阵的运算- 矩阵的加法- 矩阵的数乘- 矩阵的乘法1.6 矩阵的转置- 行变列,列变行,得到的新矩阵称为原矩阵的转置。
- 性质: (AT)T = A1.7 矩阵的逆- 若矩阵 A 有逆矩阵 A-1, 则 A × A-1 = A-1 × A = E- 矩阵 A 有逆矩阵的充分必要条件是 A 是可逆的。
- 克拉默法则:若一个 n 阶矩阵可逆,且 Ax = b,则 x = A-1b1.8 矩阵的秩- 行最简形矩阵都是行等价的。
其秩等于不为零的行数。
- 同样列最简形矩阵都是列等价的。
其秩等于不为零的列数。
- 行秩等于列秩。
1.9 矩阵的特征值和特征向量- 特征值:如果数λ和非零向量 x ,使得Ax = λx 成立,则称λ 是矩阵 A 的特征值。
非零向量x 称为特征值λ 对应的特征向量。
- 矩阵 A 所有特征值的集合称为 A 的谱。
- 若λ1,λ2,···,λn 互不相同,相应的特征向量组 x1,x2,···,xn 线性无关,则它们构成一组 A 的特征向量基。
1.10 矩阵的奇异值- 奇异值:对于矩阵A(λ1, λ2, ···, λn),λ1,λ2,···,λn称为矩阵 A 的奇异值。
矩阵分析1
矩阵分析矩阵分析是数学中一门重要的分支,主要研究矩阵及其运算规律、性质和应用。
矩阵分析被广泛应用于各个领域,如物理学、经济学、工程学、信息科学、生物学等,成为现代科技和工程中不可或缺的一部分。
一、矩阵介绍矩阵是一种数学对象,由m行n列的元素数排列成一个矩形阵列。
一般用大写字母A、B、C等表示矩阵,而用小写字母a、b、c等表示元素。
如下所示:A = [a11 a12 (1)a21 a22 (2)… … …am1 am2 … amn]其中,a11、a12、a21和a22等都是矩阵A的元素,其中第i行第j列的元素表示为aij,i表示行数,j表示列数。
二、矩阵的运算矩阵的运算包括加、减、乘和求逆,下面分别介绍。
1、加法令A、B是两个矩阵,则矩阵的加法定义为相加其对应的元素。
例如,如果A和B都是两行两列的矩阵,则A + B的结果为:A +B = [a11+b11 a12+b12a21+b21 a22+b22]2、减法矩阵的减法也是按照对应元素相减的规则。
例如,如果A和B都是两行两列的矩阵,则A - B的结果为:A -B = [a11-b11 a12-b12a21-b21 a22-b22]3、乘法矩阵乘法是指将一个矩阵的行乘以另外一个矩阵的列的结果所组成的矩阵。
例如,如果A是m行n列的矩阵,B是n行p列的矩阵,则它们的乘积C是m行p列的矩阵,C中第i行第j列的元素可以表示为:Cij = Σk=1,2,…n aikbkj其中,Σ表示求和符号,k表示矩阵A和B相乘的公共维度,即行数或列数。
4、求逆如果矩阵A是非奇异矩阵,即其行列式不为0,则可以求出其逆矩阵A-1,使得A×A-1=I,其中I为单位矩阵。
求逆矩阵的公式如下:A-1 = 1/|A| adj(A)其中,|A|表示A的行列式,adj(A)表示A的伴随矩阵。
三、矩阵的性质矩阵有很多基本的性质,其中包括:1、矩阵的行和列数可以不相等;2、矩阵可以相加和相乘,但不可以相减和相除;3、矩阵加法和乘法有结合律、分配律和交换律;4、矩阵乘法不满足交换律,即AB≠BA。
第3讲 矩阵分析
2.4.5 向量和矩阵的范数
矩阵或向量的范数用来度量矩阵或向量在某种意义下的 长度。范数有多种方法定义,其定义不同,范数值也就 不同。 1.向量的3种常用范数及其计算函数 在MATLAB中,求向量范数的函数为: (1) norm(V)或norm(V,2):计算向量V的2—范数。 (2) norm(V,1):计算向量V的1—范数。 (3) norm(V,inf):计算向量V的∞—范数。 2.矩阵的范数及其计算函数 MATLAB提供了求3种矩阵范数的函数,其函数调用格 式与求向量的范数的函数完全相同。
2.6.3.字符串操作
1、字符串比较
(1)比较两个字符串是否完全相同:strcmp (2)比较两个字符串的前n个字符是否相同。strncmp
(3)比较两个字符串是否完全相同,不区分大小写。 Strcmpi
两个字符串还可以逐个字符的比较,MATLAB中用关系 运算符等于(==)实现这一比较。需要注意的是,待比较的 两个字符串必须长度相等,或者其中之一为单个字符。
2.4 矩阵分析
矩阵是线性代数研究的基本元素,实际上相当于MATLAB 中的普通二维数组。矩阵分析主要是研究矩阵的各种特性 及其表征方法。
2.4.1矩阵的行列式
矩阵的行列式是一个数值,它可以用来表示矩阵是否奇异 (矩阵行列式等于0),这主要用在线性方程组特性分析 上。MATLAB中求解矩阵行列式的函数是det. 例如:A=magic(3) det(A)
矩阵分析课件精品PPT
典型例题解析
例1
求矩阵A的特征值和特征向量,其中A=[[3,1],[2,2]]。
例2
已知矩阵A的特征值为λ1=2, λ2=3,对应的特征向量为 α1=[1,1]T, α2=[1,-1]T,求矩阵A。
解析
首先求出矩阵A的特征多项式为f(λ)=(λ-1)(λ-4),解得特 征值为λ1=1, λ2=4。然后分别将特征值代入(A-λI)x=0求 解对应的特征向量。
应用举例
通过克拉默法则求解二元、三元线性方程组,并验证解的正确性 。
典型例题解析
01
例题1
求解三元线性方程组,通过高斯消元 法得到增广矩阵的上三角形式,然后 回代求解未知数列向量x。
02
03
例题2
例题3
判断四元线性方程组的解的情况,通 过计算系数矩阵的行列式|A|以及替换 列向量后的矩阵行列式|Ai|,根据克 拉默法则判断方程组的解是唯一解、 无解还是无穷多解。
特殊类型矩阵介绍
01
02
03
04
方阵
行数和列数相等的矩阵称为方 阵。
零矩阵
所有元素都是零的矩阵称为零 矩阵。
对角矩阵
除主对角线外的元素全为零的 方阵称为对角矩阵。
单位矩阵
主对角线上的元素全为1,其 余元素全为0的方阵称为单位 矩阵。
矩阵性质总结
Байду номын сангаас
01
结合律
02
交换律
03 分配律
04
数乘结合律
数乘分配律
• 对于每一个特征值m,求出齐次线性方程组(A-mI)x=0的一个基础解系,则A对应于特征值m的全部特征向量(其中I是与A 同阶的单位矩阵)。
特征值和特征向量求解方法
第三章矩阵分析及其应用
第三章矩阵分析及其应用矩阵是线性代数中的重要概念,不仅在理论上有广泛应用,也在实际问题中具有重要的应用价值。
本章将介绍矩阵的基本概念和常用运算,以及矩阵在各个领域中的应用。
1.矩阵的基本概念矩阵是由m行n列的数排成的矩形阵列,通常用A、B、C等大写字母表示,其中A的第i行第j列的元素记作a_ij。
矩阵的大小用m×n表示,m表示行数,n表示列数。
特殊的矩阵有零矩阵、单位矩阵等。
矩阵的转置、相等、相加、相乘等运算是矩阵分析中的基础。
2.线性方程组与矩阵运算线性方程组是线性代数中的基本问题,可以使用矩阵运算来求解。
矩阵运算包括矩阵的相加、相乘等,可以用来简化计算过程,提高求解效率。
矩阵的转置能够将列向量转换为行向量,从而方便计算。
3.矩阵的逆与行列式行列式是矩阵的一个重要特征,可以判断矩阵是否可逆。
如果一个矩阵的行列式不等于0,则称该矩阵可逆,且可以使用其逆矩阵来求解线性方程组。
逆矩阵的计算方法有求伴随矩阵、幻方阵等多种方法。
4.矩阵的应用矩阵在各个领域中都有广泛应用。
在物理学中,矩阵可以描述电磁场、力学系统等;在经济学中,矩阵可以描述供求关系、价格变动等;在计算机科学中,矩阵可以用于图像处理、模式识别等。
总的来说,矩阵分析及其应用是线性代数中一个重要的分支,它不仅有着广泛的理论基础,还具有重要的实际应用价值。
掌握矩阵的基本概念和常用运算,能够帮助我们解决实际问题,提高计算效率。
同时,矩阵也是其他高级数学领域的重要工具,如微积分、概率论等。
因此,矩阵分析的学习和应用具有非常重要的意义。
矩阵分析法
矩阵分析法
矩阵分析法在做智能决策时是一种有效的技术。
矩阵分析法的思路是将复杂的决策问题变成一个一维模型进行分析,以达到减低系统复杂性的目的。
可以使用矩阵分析法来测量任何一维问题,以便对给定变量进行研究和决策分析。
矩阵分析法的基本步骤如下:首先,列出所有决策变量及其详细的可能值的选择集合。
比如在购买一部电脑时,决策变量可能是价格、品牌、电脑性能等,可能的值比如可以按价格区间分为高、中、低三档以及各个品牌型号,具体到电脑性能可以从硬盘容量、内存密度等方面加以考虑。
其次,为建立矩阵,在决策变量及其详细可能值之间划定一个权值。
权值可以建立在基本信息之上,可以看做是每个决策变量的重要性或价值,比如从价格角度,在购置电脑时轻量的机身会被赋予更高的权值,而电脑性能的提升可以被赋予更低的权值。
接下来,根据权值构建矩阵,它可以把所有可能的变量进行横向对比,形成概况及其决策结果,一维化,可直观地显示出决策的路线及其最终的结果,方便快捷。
再次,观察矩阵,准确地分析不同决策及其结果,并且根据自身资源及实际情况,有效地发现最优决策结果,并将其作为最终结果操作。
最后,对最终决策实施跟踪分析,根据一维分析结果作出下一步决策。
以上是矩阵分析法的基本步骤,矩阵分析法可以满足系统复杂性的需求,帮助更加准确快速地做出智能决策,并能够跟踪及有效分析决策的结果。
矩阵分析教案
矩阵分析教案一、引言矩阵分析是高等数学中的重要概念和工具,具有广泛的应用领域,包括线性代数、统计学和物理学等。
本教案旨在通过系统的教学设计,引导学生全面理解矩阵分析的基本概念和运算方法,培养学生的逻辑思维和问题分析能力。
二、教学目标1. 掌握矩阵的基本定义和性质;2. 熟练运用矩阵的加法、减法和数乘等运算;3. 理解矩阵乘法的定义,能够进行矩阵乘法运算;4. 掌握矩阵的转置、逆矩阵和行列式的计算方法;5. 运用矩阵分析解决实际问题。
三、教学内容及安排1. 矩阵的基本概念- 了解矩阵的定义和表示方法;- 认识行、列、元素和维数的概念;- 学习零矩阵、单位矩阵和对角矩阵的特点。
2. 矩阵的基本运算- 学习矩阵的加法和减法运算;- 掌握数乘矩阵的运算规则;- 理解矩阵的乘法定义和性质。
3. 矩阵乘法- 通过示例引导学生理解矩阵乘法的概念; - 讲解矩阵乘法的定义和计算规则;- 练习矩阵乘法运算,加强巩固。
4. 矩阵的转置与逆矩阵- 讲解矩阵的转置定义和性质;- 引导学生理解逆矩阵的概念和计算方法; - 练习矩阵转置和逆矩阵的计算。
5. 矩阵的行列式- 介绍行列式的概念和计算方法;- 探索行列式在线性方程组中的应用;- 练习行列式的计算和应用。
6. 矩阵分析的实际应用- 将矩阵分析应用于实际问题的解决;- 通过案例分析加深学生对矩阵分析的理解;- 强化解题思路和方法的训练。
四、教学方法与手段1. 讲授法:通过讲解矩阵分析的概念、定义和运算规则,向学生传递相关知识;2. 案例分析法:通过具体案例引导学生分析和解决问题,提升实际应用能力;3. 练习与应用:设计一系列练习和应用题,巩固学生的知识和技能。
五、教学评价与反馈1. 课堂练习:布置与教学内容相关的练习题,检验学生对知识点的掌握程度;2. 作业评查:批改学生的作业,及时给予评价和指导;3. 期中、期末考试:以闭卷形式考查学生对矩阵分析的掌握情况。
六、教学资源准备1. 教材:选择一本合适的教材,提供理论知识和练习题;2. 多媒体设备:准备投影仪、电脑等设备,展示教学内容;3. 计算工具:在教学过程中使用计算器或电脑软件辅助计算。
矩阵分析技术综述
矩阵分析技术综述矩阵分析技术是一种数学方法,在不同领域的应用中发挥着重要的作用。
矩阵分析技术可以用来建模、求解、优化等。
在机器学习、信号处理、计算机科学等领域都有广泛的应用。
本文将对矩阵分析技术进行综述,包括矩阵的基本概念、特征分解、奇异值分解、矩阵多项式、矩阵分解等。
矩阵的基本概念矩阵是由一个数集合按照一定规律排列成的一个矩形数组。
矩阵通常用方括号或圆括号来表示。
矩阵中每一个元素都可以用下标表示,如$A_{ij}$表示矩阵A中第i行第j列的元素。
矩阵的加、减、乘法以及转置等运算也是基本的矩阵操作,在很多算法中都有应用。
特征分解矩阵的特征分解是指将一个矩阵分解成特定形式的矩阵乘积,其中第一因子是一个特征向量矩阵,第二因子是由特征值构成的对角矩阵。
特征分解是线性代数中的一个重要概念,在很多领域的应用中都有应用。
例如,在机器学习中,特征分解可以用来降维,加快计算速度;在信号处理中,特征分解可以用来提取信号的特征信息。
奇异值分解奇异值分解是将一个矩阵分解成三个矩阵乘积的形式,其中第一因子是一个列正交矩阵,第二因子是一个对角线上的奇异值矩阵,第三因子是一个行正交矩阵。
奇异值分解是矩阵分析中的另一个重要概念。
奇异值分解可以用来求解线性方程组、求解最小二乘问题、降维等。
在图像处理以及信号处理中也有很广泛的应用。
矩阵多项式矩阵多项式是将矩阵看作一个多项式的形式,即是将多项式中的常数项、一次项、二次项以及高次项分别对应为矩阵中的常数矩阵、矩阵本身、矩阵相乘、矩阵的高次幂等。
矩阵多项式可以用来求解矩阵的特征值、特征向量,还可以用来解决自然科学领域相关的微分方程问题、动力学问题等。
矩阵分解矩阵分解是一种将一个矩阵分解为多个子矩阵的技术,这些子矩阵能够同时刻画矩阵的核心信息。
矩阵分解可以分为多种方法,包括LU分解、QR分解、Cholesky分解等等。
在很多领域中,如机器学习、推荐系统、计算机视觉等,矩阵分解都是一个非常重要的技术。
矩阵分析 总结
矩阵分析总结矩阵分析是一门数学领域中的重要课程,它研究的是关于矩阵的性质、操作和应用的内容。
通过矩阵分析,我们能够更好地理解和解决许多实际问题,如线性方程组、最小二乘法、特征值问题等。
本文将对矩阵分析的基本概念、相关定理以及应用进行总结。
矩阵是一个按照矩形排列的数表,它可以用来表示线性映射或线性变换。
矩阵的基本运算包括加法、数乘、矩阵乘法和转置。
其中,矩阵乘法是矩阵分析的核心内容之一,它能够将一个矩阵与另一个矩阵相乘,得到一个新的矩阵。
矩阵乘法满足结合律,但不满足交换律。
在矩阵分析中,我们还常常关注矩阵的行列式和逆矩阵。
行列式是一个标量值,它可以用来判断一个矩阵是否可逆。
当行列式不等于零时,我们可以通过一系列运算求得矩阵的逆矩阵。
逆矩阵可以将原矩阵与其逆矩阵相乘得到单位矩阵。
矩阵分析还研究了特征值和特征向量的问题。
特征值是一个数,它可以描述矩阵线性变换的特征。
特征向量是一个非零向量,与特征值相关联。
特征值与特征向量满足一个基本关系式,即矩阵乘以特征向量等于特征值乘以特征向量。
通过求解特征值和特征向量,我们可以对矩阵进行相似变换或对称双对角化处理。
除了上述基本概念和定理,矩阵分析还有许多重要的应用。
其中包括线性方程组的求解、最小二乘法、矩阵的奇异值分解、矩阵的多项式表达等。
线性方程组的求解是矩阵分析中的基本问题之一,通过高斯消元法或矩阵的LU分解,我们可以较快地求解出线性方程组的解。
最小二乘法是矩阵分析的另一个重要应用,它主要用于解决数据拟合和参数估计的问题。
通过最小二乘法,我们可以找到一个近似解,使得观测值和模型的预测值之间的残差平方和最小。
矩阵的奇异值分解是对矩阵的一种分解形式,它可以将矩阵分解为三个矩阵的乘积,其中一个是奇异值矩阵,表示矩阵的奇异值。
奇异值分解在图像处理、数字信号处理等领域有广泛的应用。
总的来说,矩阵分析是一门重要的数学课程,它研究了矩阵的基本性质、运算和应用。
通过学习矩阵分析,我们能够更好地理解线性代数和线性方程组的相关概念,掌握常见的运算方法,并能够应用于实际问题的求解。
(2024年)矩阵分析
2024/3/26
1
contents
目录
2024/3/26
• 矩阵基本概念与性质 • 矩阵变换与等价性 • 方程组求解与矩阵应用 • 特征值与特征向量计算 • 矩阵对角化与相似变换 • 总结与展望
2
01
矩阵基本概念与性质
2024/3/26
3
矩阵定义及表示方法
2024/3/26
矩阵定义
由$m times n$个数按一定次序 排成的$m$行$n$列的矩形数表 称为$m times n$矩阵。
不改变矩阵的秩,保持矩阵的等价性。
2024/3/26
9
矩阵等价性判断方法
2024/3/26
秩相等法
01
若两个矩阵的秩相等,则它们等价。
初等变换法
02
若一个矩阵可以通过初等变换化为另一个矩阵,则它们等价。
标准形法
03
若两个矩阵的标准形相同,则它们等价。
10
秩与行列式关系研究
2024/3/26
秩与行列式的关系
2024/3/26
在工程和科学计算中,矩阵分 析可以用于解决各种复杂的数 学问题和物理问题,例如线性 方程组、最优化问题、偏微分 方程等。
在量子计算和量子信息中,矩 阵分析可以用于描述和操作量 子比特和量子门等基本概念, 以及设计和分析量子算法和量 子协议等。
在金融和经济中,矩阵分析可 以用于分析和预测市场趋势、 评估投资风险和回报、以及构 建和优化投资组合等。
矩阵表示方法
通常用大写字母表示,如$A, B, C, ldots$,矩阵的行数称为矩阵 的阶数,列数称为矩阵的维数。
4
矩阵基本运算规则
加法运算
两个矩阵只有当它们是同型矩阵时才能进行加法运算,即对应元素相加。
2024版第5章矩阵分析ppt课件
矩阵函数以及矩阵微分方程等问题时,都可以利用若尔当标准型来简化
计算。
05
二次型及其标准型
二次型定义及性质
二次型定义
对称性
线性变换下的不变性
二次型的值
二次型是n个变量的二次多项式, 其一般形式为$f(x_1, x_2, ..., x_n) = sum_{i=1}^{n}sum_{ j=1}^{n} a_{ij}x_ix_j$,其中$a_{ij}$为常 数,且$a_{ij} = a_{ ji}$。
若尔当标准型简介
01
若尔当标准型定义
对于任意一个n阶方阵A,都存在一个可逆矩阵P,使得$P^{-1}AP=J$
为若尔当标准型,其中J由若干个若尔当块组成。
02
若尔当块
一个若尔当块是一个上三角矩阵,它的对角线上的元素相等,且对角线
上方的元素或者是1,或者是0。
03
若尔当标准型的应用
若尔当标准型在矩阵分析中有着广泛的应用,例如在求解矩阵的高次幂、
矩阵性质总结
结合律 $(AB)C = A(BC)$。
数乘结合律 $(kA)(lB) = kl(AB)$。
分配律
$(A + B)C = AC + BC, C(A + B) = CA + CB$。
数乘分配律
$(k + l)A = kA + lA, k(A + B) = kA + kB$。
02
矩阵变换与等价类
求解过程
先求出矩阵A的特征值,然后将其代 入(A-λE)X=0,解出对应的特征向量。
特征值和特征向量在矩阵分析中的应用
判断矩阵是否可对角化
如果矩阵A有n个线性无关的特征向量,则A可对角化。
《矩阵分析》教学大纲
《矩阵分析》教学大纲一、课程介绍二、教学目标1.掌握矩阵的基本性质和运算法则;2.熟悉矩阵的特殊类型和分解方法;3.了解不同领域中矩阵的应用,如线性系统、最优化问题和图论等;4.能够利用矩阵分析方法解决实际问题,并具备独立思考和解决问题的能力。
三、教学内容1.矩阵的基本概念和基本运算-矩阵的定义和表示方法-矩阵的加法、减法和数乘-矩阵的乘法和幂运算-矩阵的转置和共轭转置-矩阵的逆和行列式2.矩阵的特殊类型和分解方法-方阵、对称矩阵和对角阵的性质和特点-相似矩阵和对称相似矩阵-特征值和特征向量及其应用-奇异值分解和QR分解3.线性系统与矩阵分析-线性方程组的解和解的存在唯一性-矩阵的秩和线性相关性的判定-逆矩阵的存在条件和求解方法-初等矩阵和高斯消元法的应用4.矩阵在最优化问题中的应用-线性规划和线性规划的基本概念-半正定规划的基本概念和性质-二次规划和二次规划的基本概念-松弛问题和松弛算法的基本原理5.图论与矩阵分析-图的基本概念和性质-图的邻接矩阵和度矩阵-图的路径和环的计算方法-最短路径问题和最小生成树问题的矩阵分析方法四、教学方法1.理论教学与实践结合,通过理论讲解和实例演练相结合的方式提高学生的学习兴趣和实际应用能力;2.提供案例分析和应用实例,帮助学生理解和掌握矩阵分析方法在实际问题中的应用;3.引导学生进行团队合作和小组讨论,提升学生的合作与沟通能力;4.使用多媒体技术辅助教学,如演示软件、数学建模软件等,提高教学效果。
五、教学评估方式1.平时成绩(30%):包括课堂参与、作业完成情况和小组讨论等。
2.期中考试(30%):考查学生对于矩阵分析的理论知识的掌握程度。
3.期末考试(40%):考查学生对于矩阵分析的理论知识和实际应用能力的综合运用。
六、参考书目2. Cullen, Charles G. Matrix analysis[M]. CambridgeUniversity Press, 2024.。
矩阵分析及其应用范围
矩阵分析及其应用范围矩阵作为数学中一种基础结构,被广泛地应用在科学技术领域中。
因为矩阵可以对向量空间中的线性变换进行描述,利用矩阵运算可以方便地进行数据的处理和计算。
矩阵分析是研究矩阵的性质、结构和变换的学问,它不仅是数学分析的一个重要分支,而且在工程、科学和自然科学中都有广泛应用。
矩阵分析的基础知识矩阵分析的基础知识包括矩阵的性质、矩阵的运算以及矩阵的特征值和特征向量等方面。
其中,矩阵的性质包括行列式、秩、迹、特征多项式等;矩阵的运算包括加减乘除、逆矩阵、转置矩阵、伴随矩阵等;矩阵的特征值和特征向量包括矩阵的对角化和相似矩阵。
矩阵分析的应用范围1. 矩阵运算在计算机科学中的应用矩阵运算在计算机科学中有广泛的应用,例如图像处理、数据压缩和编码等。
在图像处理中,利用矩阵运算可以进行图像的变换、去噪、增强、分割和识别等。
在数据压缩和编码中,利用矩阵运算可以进行数据压缩和编码以及信号恢复和解码等。
2. 矩阵分析在物理学中的应用矩阵分析在物理学中有很大的应用,例如量子力学中的波函数描述、离散元素法计算、有限元素法分析和时间序列分析等。
在量子力学中,矢量可以用波函数表示,而波函数则通过矩阵运算来描述量子态之间的关系。
在离散元素法计算中,矩阵可以描述初始条件、边界条件和物理模型,通过矩阵运算可以求解精确的数值解。
在有限元素法分析中,矩阵可以描述材料力学特性、温度场、流动场和电场等,通过矩阵运算可以解决复杂的力学问题。
在时间序列分析中,矩阵可以描述时间序列之间的线性关系,通过矩阵运算可以预测未来的数据趋势和变化。
3. 矩阵分析在生物学中的应用矩阵分析在生物学中也有很大的应用,例如基因芯片中的基因表达分析、蛋白质序列分析和生态系统分析等。
在基因芯片中,矩阵可以描述基因和样本之间的关系,通过矩阵运算可以分析基因表达的差异和相似性。
在蛋白质序列分析中,矩阵可以描述蛋白质序列之间的相似性和差异性,通过矩阵运算可以预测蛋白质的结构和功能。
矩阵论矩阵分析
第三章 矩阵分析在此之前我们只研究了矩阵的代数运算,但在数学的许多分支和工程实际中,特别是涉及到多元分析时,还要用到矩阵的分析运算.本章首先讨论矩阵序列的极限和矩阵级数,然后介绍矩阵函数和它的计算,最后介绍矩阵的微积分,以及矩阵分析在解微分方程组和线性矩阵方程中的应用.§3.1 矩阵序列 定义 3.1 设有Cm n⨯中的矩阵序列{}()k A ,其中()()()k k ij m nAa ⨯=.若()lim (1,2,,;1,2,,)k ij ij k a a i m j n →+∞===,则称矩阵序列{}()k A 收敛于()ij m n A a ⨯=,或称A 为矩阵序列{}()k A 的极限,记为()lim k k A A →+∞=或()()k A A k →→+∞不收敛的矩阵序列称为发散. 由定义可见,Cm n⨯中一个矩阵序列的收敛相当于mn 个数列同时收敛.因此,可以用初等分析的方法来研究它.但同时研究mn 个数列的极限未免繁琐.与向量序列一样,可以利用矩阵范数来研究矩阵序列的极限. 定理 3.1 设()k A,C(012)m nA k ,,,⨯∈=.则()lim k k A A →+∞=的充分必要条件是()lim 0k k A A →+∞-=,其中是Cm n⨯上的任一矩阵范数.证 先取Cm n⨯上矩阵的G-范数.由于()()()()1=1k k k ij ij ij ij Gi,jm nk ijiji j a a a a A Aaa =-≤-=-≤-所以()lim k k AA →+∞=的充分必要条件是()lim 0k Gk A A→+∞-=.又由范数的等价性知,对C m n⨯上任一矩阵范数,存在正常数α,β,使得()()()k k k G G A A A A A A αβ-≤-≤-故()lim 0k Gk AA→+∞-=的充分必要条件是()lim 0k k A A →+∞-=.证毕推论 设()k A,C(012)m nA k ,,,⨯∈=,()lim k k A A →+∞=.则()lim k k A A →+∞=其中是Cm n⨯上任一矩阵范数.证 由()()k k AA A A -≤-即知结论成立.证毕需要指出的是,上述推论的相反结果不成立.如矩阵序列()1(1)112k k A k ⎛⎫- ⎪=+ ⎪ ⎪⎝⎭不收敛.但()Flim lim k k x A →+∞== 收敛的矩阵序列的性质,有许多与收敛数列的性质相类似. 定理3.2 设()lim k k AA →+∞=,()lim k k B B →+∞=,其中()k A ,()k B ,A ,B 为适当阶的矩阵,α,β∈C .则(1)()()lim ()k k k AB A B αβαβ→+∞+=+;(2) ()()lim k k k A BAB →+∞=;(3)当()k A与A 均可逆时,()11lim ()k k A A --→+∞=.证 取矩阵范数,有()()()()()()()()()()()()()()()k k k k k k k k k k k k k A B A B A A B BA B AB A BA B A B ABA B B A A Bαβαβαβ+-+≤-+--=-+-≤-+-由定理3.1和推论知(1)和(2)成立. 因为()1()k A-,1A -存在,所以()lim det det 0k k A A →+∞=≠,又有()lim adj adj k k A A →+∞=.于是()()11()adj adj lim ()lim det det k k k k k A AA A A A--→+∞→+∞=== 证毕 定理3.2(3)中条件()k A与A 都可逆是不可少的,因为即使所有的()k A可逆也不能保证A一定可逆.例如()11111k A k⎛⎫+ ⎪= ⎪ ⎪⎝⎭对每一个()k A 都有逆矩阵()1()1k k k A k k --⎛⎫=⎪-+⎝⎭,但 ()11lim 11k k A A →+∞⎛⎫== ⎪⎝⎭而A 是不可逆的. 在矩阵序列中,最常见的是由一个方阵的幂构成的序列.关于这样的矩阵序列有以下的概念和收敛定理. 定义3.2 设n nA C ⨯∈,若()lim 0k k A→+∞=,则称A 为收敛矩阵.定理3.3 设n nA C⨯∈,则A 为收敛矩阵的充分必要条件是ρ(A )<1.证 必要性.已知A 为收敛矩阵,则由谱半径的性质,有(())()k k k A A A ρρ=≤其中是Cn n⨯上任一矩阵范数,即有lim (())0kk A ρ→+∞=,故ρ(A )<1.充分性.由于ρ(A )<1,则存在正数ε,使得ρ(A )+ε<1.根据定理2.14,存在C n n⨯上的矩阵范数m,使得()1m A A ρε≤+<从而由kk m mA A ≤得lim 0kmk A →+∞=.故lim 0k k A →+∞=. 证毕推论 设n nA C ⨯∈.若对Cn n⨯上的某一矩阵范数有1A <,则A 为收敛矩阵.例3.1 判断下列矩阵是否为收敛矩阵:(1)181216A -⎛⎫= ⎪-⎝⎭; (2)0.20.10.20.50.50.40.10.30.2A ⎛⎫ ⎪= ⎪ ⎪⎝⎭. 解 (1)可求得A 的特征值为156λ=,212λ=-,于是5()16A ρ=<,故A 是收敛矩阵; (2)因为10.91A =<,所以A 是收敛矩阵.§3.2 矩阵级数定义3.3 由Cm n⨯中的矩阵序列{}()k A 构成的无穷和(0)(1)()k AA A ++++称为矩阵级数,记为()k k A+∞=∑.对任一正整数N ,称()()0NN k k SA ==∑为矩阵级数的部分和.如果由部分和构成的矩阵序列{}()N S收敛,且有极限S ,即()lim N N SS →+∞=,则称矩阵级数()0k k A +∞=∑收敛,而且有和S ,记为()k k S A+∞==∑不收敛的矩阵级数称为发散的.如果记()()()k k ij m n Aa ⨯=,()ij m n S s ⨯=,显然()0k k S A +∞==∑相当于()(1,2,,;1,2,,)k ijijk as i m j n +∞====∑即mn 个数项级数都收敛. 例3.2 已知()1π24(0,1,)10(1)(2)k kk A k k k ⎛⎫⎪ ⎪== ⎪ ⎪++⎝⎭研究矩阵级数()k A+∞∑的敛散性.解 因为k 00()()001π2410(1)(2)1π1242341012N Nk Nk k N k N k k N N S A k k N ====⎛⎫⎪ ⎪== ⎪ ⎪++⎝⎭⎛⎫⎛⎫-- ⎪ ⎪⎝⎭ ⎪= ⎪- ⎪+⎝⎭∑∑∑∑所以()4π2lim 301N N S S →+∞⎛⎫ ⎪= ⎪ ⎪⎝⎭故所给矩阵级数收敛,且其和为S . 定义3.4 设()()()C (0,1,)k k m n ij m n Aa k ⨯⨯=∈=.如果mn 个数项级数()0(1,2,,;1,2,,)k ijk ai m j n +∞===∑都绝对收敛,即()k ij k a +∞=∑都收敛,则称矩阵级数()k k A+∞=∑绝对收敛.利用矩阵范数,可以将判定矩阵级数是否绝对收敛转化为判定一个正项级数是否收敛的问题.定理3.4 设()()()C(0,1,)k k m nij m nAa k ⨯⨯=∈=.则矩阵级数()0k k A +∞=∑绝对收敛的充分必要条件是正项级数()0k k A +∞=∑收敛,其中是Cm n⨯上任一矩阵范数.证 先取矩阵的1m -范数.若1()k k m A +∞=∑收敛,由于1()()()11(1,2,,;1,2,,)mnk k k ijij i j m aa A i m j n ==≤===∑∑从而由正项级数的比较判别法知()k ijk a+∞=∑都收敛,故()k k A+∞=∑绝对收敛.反之,若()k k A+∞=∑绝对收敛,则()0k ijk a+∞=∑都收敛,从而其部分和有界,即()0(1,2,,;1,2,,)Nk ijijk aM i m j n =≤==∑记,max ij i jM M =,则有1()()()0011110()()NNmnmnNk k k ijijk k i j i j k m AaamnM =========≤∑∑∑∑∑∑∑故1()k k m A +∞=∑收敛.这表明()k k A+∞=∑绝对收敛的充分必要条件是1()k k m A +∞=∑收敛.由矩阵范数的等价性和正项级数的比较判别法知,1()k k m A+∞=∑收敛的充分必要条件是()0k k A +∞=∑收敛,其中是Cm n⨯上任一矩阵范数. 证毕利用矩阵级数收敛和绝对收敛的定义,以及数学分析中的相应结果,可以得到以下一些结论.定理3.5 设()k k AA +∞==∑,()0k k B B +∞==∑,其中()k A ,()k B ,A ,B 是适当阶的矩阵,则(1)()()0()k k k AB A B +∞=+=+∑;(2)对任意λ∈C ,有()k k AA λλ+∞==∑;(3)绝对收敛的矩阵级数必收敛,并且任意调换其项的顺序所得的矩阵级数仍收敛,且其和不变; (4)若矩阵级数()k k A+∞=∑收敛(或绝对收敛),则矩阵级数()k k PAQ +∞=∑也收敛(或绝对收敛),并且有()()0()(3.1)k k k k PAQ P A Q+∞+∞===∑∑(5)若()0k k A+∞=∑与()k k B+∞=∑均绝对收敛,则它们按项相乘所得的矩阵级数(0)(0)(0)(1)(1)(0)(0)()(1)(1)()(0)()()(3.2)k k k A BA B A B A B A B A B -++++++++也绝对收敛,且其和为AB . 证 只证(4)和(5).若()0k k A+∞=∑收敛,记()()0NN k k SA ==∑,则()lim N N S A →+∞=.从而()()00lim(lim)NNk k N N k k PAQ P AQ PAQ →+∞→+∞====∑∑可见()k k PAQ +∞=∑收敛,且式(3.1)成立.若()k k A+∞=∑绝对收敛,则由定理3.4知()k k A +∞=∑收敛,但()()()k k k PA Q P AQ Aα≤≤其中α是与k 是无关的正数,从而()0k k PA Q +∞=∑收敛,即()k k PAQ +∞=∑绝对收敛.当()k k A+∞=∑和()k k B+∞=∑绝对收敛时,由定理3.4知()k k A+∞=∑和()0k k B +∞=∑收敛,设其和分别为1σ与2σ,从而它们按项相乘所得的正项级数(0)(0)(0)(1)(1)(0)(0)()(1)(1)()(0)()()k k k A B A B A B ABABAB-++++++++也收敛,其和为12σσ.因为(0)()(1)(1)()(0)(0)()(1)(1)()(0)k k k k k k A B A B A B ABABAB--+++≤+++所以矩阵级数(3.2)绝对收敛.记()()1NN k k SA==∑,()()2NN k k SB ==∑,()(0)()(1)(1)()(0)3()NN k k k k SA B A B A B -==+++∑则()()()(1)()(2)(1)(2)()()(1)()()123N N N N N N N N N S S S A B A BA B A B A B --=++++++又记()()1NN k k Aσ==∑,()()2NN k k B σ==∑,()(0)()(1)(1)()(0)3()NN k k k k A B A B A B σ-==+++∑显然()()()()()()123123N N N N N N S S S σσσ-≤- 故由()()12lim N N N S S AB →+∞=和()()()123lim ()0N N N N σσσ→+∞-=,得()3lim N N S AB →+∞=证毕下面讨论一类特殊的矩阵级数——矩阵幂级数. 定义3.5 设n nA C⨯∈,C(0,1,)k a k ∈=.称矩阵级数0k k k a A +∞=∑为矩阵A 的幂级数.利用定义来判定矩阵幂级数的敛散性,需要判别2n 个数项级数的敛散性,当矩阵阶数n 较大时,这是很不方便的,且在许多情况下也无此必要.显然,矩阵幂级数是复变量z 的幂级数0kk k a z+∞=∑的推广.如果幂级数kk k a z+∞=∑的收敛半径为r ,则对收敛圆z r <内的所有z ,kk k a z+∞=∑都是绝对收敛的.因此,讨论kk k a A+∞=∑的收敛性问题自然联系到kk k a z+∞=∑的收敛半径.定理3.6 设幂级数kk k a z+∞=∑的收敛半径为r ,Cn nA ⨯∈.则(1)当ρ(A )<r 时,矩阵幂级数0kk k a A+∞=∑绝对收敛;(2)当ρ(A )>r 时,矩阵幂级数kk k a A+∞=∑发散.证 (1)因为ρ(A )<r ,所以存在正数ε,使得ρ(A )+ε<r .根据定理2.14,存在Cn n⨯上的矩阵范数m,使得m ()A A r ρε≤+<从m m(())kk k k k k a A a A a A ρε≤≤+而由于幂级数(())kkk aA ρε+∞=+∑收敛,故矩阵幂级数0k k k a A +∞=∑绝对收敛.(2)当ρ(A )>r 时,设A 的,n 个特征值为12,,,n λλλ,则有某个l λ满足l r λ>.由Jordan定理,存在n 阶可逆矩阵P ,使得11112(10)i n n P AP J λδδδλλ--⎛⎫⎪⎪== ⎪ ⎪⎝⎭代表或而kk k a J+∞=∑的对角线元素为0(1,2,,)k k jk a j n λ+∞==∑.由于0k k lk a λ+∞=∑发散,从而0k k k a J +∞=∑发散.故由定理 3.5(4)知,kkk a A+∞=∑也发散. 证毕推论 设幂级数kk k a z+∞=∑的收敛半径为r ,Cn nA ⨯∈.若存在Cn n⨯上的某一矩阵范数使得A r <,则矩阵幂级数kk k a A+∞=∑绝对收敛.例3.3 判断矩阵幂级数018216kkk k+∞=-⎛⎫ ⎪-⎝⎭∑的敛散性. 解 令181216A -⎛⎫= ⎪-⎝⎭.例3.1中已求得5()6A ρ=.由于幂级数0kk kz +∞=∑的收敛半径为r =1,故由ρ(A )<1知矩阵幂级数kk kA+∞=∑绝对收敛.最后,考虑一个特殊的矩阵幂级数. 定理3.7 设Cn nA ⨯∈.矩阵幂级数kk A+∞=∑(称为Neumann 级数)收敛的充分必要条件是ρ(A )<1,并且在收敛时,其和为1()I A --.证 当ρ(A )<1时,由于幂级数kk z+∞=∑的收敛半径r =1,故由定理 3.6知矩阵幂级数kk A+∞=∑收敛.反之,若kk A+∞=∑收敛,记0kk S A+∞==∑,()()0NN k k SA ==∑则()lim N N S S →+∞=.由于()(1)()(1)lim lim ()=lim lim N N N N N N N N N A S S S S O --→+∞→+∞→+∞→+∞==--故由定理3.3知ρ(A )<1.当kk A+∞=∑收敛时,ρ(A )<1,因此I -A 可逆,又因为()1()N N SI A I A +-=-所以()111()()N N S I A A I A -+-=---故()1lim ()N N S S I A -→+∞==- 证毕例3.4 已知0.20.10.20.50.50.40.10.30.2A ⎛⎫ ⎪= ⎪ ⎪⎝⎭,判断矩阵幂级数0kk A +∞=∑的敛散性.若收敛,试求其和.解 因为10.91A =<,所以kk A+∞=∑收敛,且102814141()44624214202535k k A I A +∞-=⎛⎫ ⎪=-= ⎪ ⎪⎝⎭∑ §3.3 矩阵函数矩阵函数是以矩阵为变量且取值为矩阵的一类函数.本节介绍矩阵函数的定义和计算方法,并讨论常用矩阵函数的性质. 一、矩阵函数的定义 定义3.5 设幂级数0k k k a z +∞=∑的收敛半径为r ,且当z r <时,幂级数收敛于函数f (z ),即0()()kk k f z a zz r +∞==<∑如果Cn nA ⨯∈满足ρ(A )<r ,则称收敛的矩阵幂级数kk k a A+∞=∑的和为矩阵函数,记为f (A ),即0()(3.3)kk k f A a A+∞==∑根据这个定义,可以得到在形式上和数学分析中的一些函数类似的矩阵函数.例如,对于如下函数的幂级数展开式02120101e ()!(1)sin ()(21)!(1)cos ()(2)!(1)(1)(1)ln(1)(1)1kzk k k k k kk kk k k k z r k z zr k z zr k z z r z zr k +∞=+∞+=+∞=+∞-=+∞+===+∞-==+∞+-==+∞-==-+==+∑∑∑∑∑ 相应地有矩阵函数01e !kk A A k +∞==∑(C n n A ⨯∈) 210(1)sin (21)!kk k A A k +∞+=-=+∑ (C n n A ⨯∈)20(1)cos (2)!k kk A A k +∞=-=∑ (C n n A ⨯∈)10()k k I A A +∞-=-=∑ (ρ(A )<1)1(1)ln()1k k k I A A k +∞+=-+=+∑ (ρ(A )<1)称e A为矩阵指数函数,sin A 为矩阵正弦函数,cos A 为矩阵余弦函数.如果把矩阵函数f (A )的变元A 换成At ,其中t 为参数,则相应得到()()(3.4)kk k f At a At +∞==∑在实际应用中,经常需要求含参数的矩阵函数.二、矩阵函数值的计算以上利用收敛的矩阵幂级数的和定义了矩阵函数f (A ),在具体应用中,要求将f (A )所代表的具体的矩阵求出来,即求出矩阵函数的值.这里介绍几种求矩阵函数值的方法.以下均假设式(3.3)或式(3.4)中的矩阵幂级数收敛. 方法一 利用Hamilton-Cayley 定理利用Hamilton-Cayley 定理找出矩阵方幂之间的关系,然后化简矩阵幂级数求出矩阵函数的值.举例说明如下. 例3.5 已知0110A ⎛⎫=⎪-⎝⎭,求e At.解 可求得2det()1I A λλ-=+.由Hamilton-Cayley 定理知2A I O +=,从而2A I =-,3A A =-,4A I =,5A A =,…即2(1)k k A I =-,21(1)(1,2,)k k A Ak +=-=故243501e 1!2!4!3!5!cos sin (cos )(sin )sin cos Atk k k t t t t A t I t A k tt t I t A tt +∞=⎛⎫⎛⎫==-+-+-+- ⎪ ⎪⎝⎭⎝⎭⎛⎫=+=⎪-⎝⎭∑例3.6 已知4阶方阵A 的特征值为π,-π,0,0,求sin A ,cos A .解 因为2422det()(π)(π)πI A λλλλλλ-=-+=-,所以422πA A O -=.于是422πA A =,523πA A =,642πA A =,743πA A =,…即2222πkk A A -=,21223π(2,3,)k k A A k +-==故213223023321323332(1)1(1)sin π(21)!3!(21)!11(1)π3!π(21)!sin ππ1ππk k k k k k k k k A A A A Ak k A A A k A A A A +∞+∞+-==+∞+=--==-+++⎛⎫-=-+ ⎪+⎝⎭=+=-∑∑∑-22222022222(1)1(1)cos π(2)!2!(2)!cos π12ππk k k k k k A A I A Ak k I A I A +∞+∞-==--==-+=+=-∑∑-方法二 利用相似对角化 设C n nA ⨯∈是可对角化的,即存在C n nn P ⨯∈,使得112diag(,,,)n P AP A λλλ-==则有11112112()()()diag(,,,)diag((),(),,())kkk k k k k k k k k k k k k n k k k n f A a A a P P P a P P a a a P P f f f P λλλλλλ+∞+∞+∞--===+∞+∞+∞-===-==Λ=Λ==∑∑∑∑∑∑同理可得112()diag((),(),,())n f At P f t f t f t P λλλ-=例3.7 已知460350361A ⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭,求e At,cos A .解 可求得2det()(2)(1)I A λλλ-=+-,即A 的特征值为12λ=-,231λλ==.对应12λ=-的特征向量为T1(1,1,1)p =-,对应231λλ==的两个线性无关的特征向量为T 2(2,1,0)p =-,T 3(0,0,1)p =.于是120110101P --⎛⎫ ⎪= ⎪ ⎪⎝⎭ 使得1211P AP --⎛⎫ ⎪= ⎪ ⎪⎝⎭故22212222e 2e e 2e 2e 0e e e e2e e 0e e e 2e 2e e tt t t tAt tt t t t t t t t tt P P --------⎛⎫⎛⎫-- ⎪ ⎪==--⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭1cos(2)cos cos1cos12cos1cos 22cos12cos 20cos 2cos12cos 2cos10cos 2cos12cos 22cos1cos1A P--⎛⎫⎪= ⎪ ⎪⎝⎭--⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭方法三 利用Jordan 标准形 设Cn nA ⨯∈,且C n nn P ⨯∈,使得121s J J P AP J J -⎛⎫⎪ ⎪==⎪ ⎪⎝⎭其中×1(1,2,,)1i ii ii i r rJ i s λλλ⎛⎫ ⎪⎪== ⎪ ⎪⎝⎭由定理1.12得111111001(1)01(1C C ()C ()()1!(1)!()1!()()1!(1)!i i i i i i i r k r k k i k ik ikk k k i i k i k k k k k ik i r r k k k i kk k k k t r r i f J t a J t a t t t r a t tt f f f r λλλλλλλλλλλλλλλλ--+-+∞+∞-==--+∞==--⎛⎫ ⎪⎪== ⎪ ⎪ ⎪⎝⎭⎛⎫' ⎪- ⎪⎪= ⎪⎪'⎪ ⎪⎝⎭'-=∑∑∑)()()()1!()ittf t f f λλλλλ=⎛⎫⎪⎪⎪ ⎪⎪' ⎪ ⎪⎝⎭从而1010110011()()()()()k kk kk k k k k kk k k k k k k k k s k s f At a A t a PJP t a J t P a J t P P P a J t f J t P Pf J t +∞+∞-==+∞=+∞--=+∞=-==⎛⎫⎪ ⎪==⎪⎪ ⎪ ⎪⎝⎭⎛⎫ ⎪= ⎪ ⎪⎝⎭∑∑∑∑∑ 例3.8 已知101120403A -⎛⎫⎪= ⎪ ⎪-⎝⎭,求e A,sin At .解 例1.9已求得100111210P ⎛⎫ ⎪=-- ⎪ ⎪⎝⎭,11112P AP J -⎛⎫⎪== ⎪ ⎪⎝⎭于是12222e e e 0ee e 3e e e 2e+e e 4e 03e A P P -⎛⎫⎛⎫⎪ ⎪==- ⎪⎪ ⎪ ⎪-⎝⎭⎝⎭-- 1sin cos sin sin sin 2sin 2cos 0cos sin 2cos sin 2sin 2cos sin sin 24cos 02cos sin t t t At P t Pt t t t t t t t t t t t t t t t t t t t -⎛⎫⎪= ⎪ ⎪⎝⎭-⎛⎫⎪=+---+ ⎪⎪-+⎝⎭根据Jordan 标准形理论可得 定理3.8 设Cn nA ⨯∈,1λ,2λ,…,n λ是A 的n 个特征值,则矩阵函数f (A )的特征值为1()f λ,2()f λ,…,()n f λ. 方法四 待定系数法 设Cn nA ⨯∈,且A 的特征多项式为1212()det()()()()(3.5)sr r r s I A ψλλλλλλλλ=-=---其中1λ,2λ,…,s λ是A 的全部互异特征值,12s r r r n +++=.为计算矩阵函数()k kk k f At a A t +∞==∑,记0()k k k k f t a t λλ+∞==∑.将f (λt )改写为()(,)()(,)(3.6)f t q t r t λλψλλ=+其中q (λ,t )是含参数t 的λ的幂级数,r (λ,t )是含参数t 且次数不超过n -1的λ的多项式,即1110(,)()()()n n r t b t b t b t λλλ--=+++由Hamilton-Cayley 定理知ψ(A )=O ,于是由式(3.6)得1110()(,)()(,)()()()n n f At q A t A r A t b t Ab t A b t Iψ--=+=+++可见,只要求出()(0,1,,1)k b t k n =-即可得到f (At ).注意到()()0(0,1,,1;1,2,,)l i i l r i s ψλ==-=将式(3.6)两边对λ求导,并利用上式,得d d ()(,)d d iil lll f t r t λλλλλλλλ=== 即d d ()(,)(0,1,,1;1,2,,)(3.7)d d iil l li l l t t f r t l r i s μλλλμλμλ====-=由式(3.7)即得到以0()b t ,1()b t ,…,1()n b t -为未知量的线性方程组. 综上分析,用待定系数法求矩阵函数f (At )或f (A )的步骤如下: 第一步:求矩阵A 的特征多项式(3.5); 第二步:设1110()n n r b b b λλλ--=+++.根据()()()()(0,1,,1;1,2,,)i l l l i i tr t f l r i s λλλλ===-=或()()()()(0,1,,1;1,2,,)l l i i i r f l r i s λλ==-=列方程组求解0b ,1b ,…,1n b -;第三步:计算1110()(())()n n f At f A r A b A b A b I --==+++或.例3.9 已知101120403A -⎛⎫ ⎪= ⎪ ⎪-⎝⎭,求e At,cos A .解 可求得2det()(1)(2)I A λλλ-=--.设2210()r b b b λλλ=++则由210212210(1)e (1)2e (2)42e t t t r b b b r b b t r b b b ⎧=++=⎪'=+=⎨⎪=++=⎩解得222120e e e 2e 2e 3e e 2e t t t t t t t t b t b t b t ⎧=--⎪=-++⎨⎪=-⎩ 于是2222210e 2e 0e e e e 2ee e e e 4e 02e e t tAt t t tt t t t t ttt t b A b A b I t t t t t ⎛⎫-⎪=++=-++-- ⎪ ⎪ ⎪-+⎝⎭而由21021210(1)cos1(1)2sin1(2)42cos 2r b b b r b b r b b b =++=⎧⎪'=+=-⎨⎪=++=⎩解得210sin1cos1cos 23sin12cos12cos 22sin1cos 2b b b =-+⎧⎪=-+-⎨⎪=+⎩从而22102sin1cos 20sin1cos 2sin1cos1cos 2cos 2sin1cos1cos 24sin102sin1cos1A b A b A b I +-⎛⎫ ⎪=++=-+--+ ⎪ ⎪-+⎝⎭如果求得矩阵A 的最小多项式,且其次数低于A 的特征多项式的次数,则计算矩阵函数就要容易一些.例3.10 已知311202113A -⎛⎫ ⎪=- ⎪ ⎪--⎝⎭,求e At,sin A .解 例1.9已求得A 的Jordan 标准形为2212J ⎛⎫⎪= ⎪ ⎪⎝⎭于是A 的最小多项式为2()(2)A m λλ=-.设10()r b b λλ=+由21021(2)2e (2)e t tr b b r b t ⎧=+=⎪⎨'==⎪⎩ 解得2120e (12)et t b t b t ⎧=⎪⎨=-⎪⎩ 于是2101e e 21221At t tt t b A b I t tt t t t +-⎛⎫ ⎪=+=-- ⎪ ⎪--+⎝⎭又由101(2)2sin 2(2)cos 2r b b r b =+=⎧⎨'==⎩ 解得10cos 2sin 22cos 2b b =⎧⎨=-⎩从而10sin 2cos 2cos 2cos 2sin 2cos 2sin 22cos 22cos 2cos 2cos 2sin 2cos 2A b A b I +-⎛⎫ ⎪=+=-- ⎪ ⎪--+⎝⎭三、常用矩阵函数的性质常用的矩阵函数有e A,sin A ,cos A ,它们有些性质与普通的指数函数和三角函数相同,但由于矩阵乘法不满足交换律,从而有些性质与一般指数函数和三角函数不相同. 定理3.9 对任意Cn n A ⨯∈,总有(1)sin(-A )=-sin A ,cos(-A )=cos A ; (2)i e cos isin AA A =+,i -i 1cos (e e )2A A A =+,i -i 1sin (e e )2iA A A =-. 证 (1)由sin A 与cos A 的矩阵幂级数形式直接得到;(2)i 221000i (1)(1)e i !(2)!(21)!cos isin k k k Ak k k k k k A A A k k k A A+∞+∞+∞+===--==++=+∑∑∑又有-i ecos()isin()cos isin AA A A A =-+-=-从而i -i 1cos (e e )2A A A =+,i -i 1sin (e e )2iA A A =- 定理3.10 设A ,C n nB ⨯∈,且AB =BA ,则(1)ee e e e A BA B B A +==;(2)sin(A +B )=sin A cos B +cos A sin B ;(3)cos(A +B )=cos A cos B -sin A sin B .证 (1)0022011e e !!1()(2)2!1()e !A Bk k k k k A B k A B k k I A B A AB B A B k +∞+∞==+∞+=⎛⎫⎛⎫= ⎪⎪⎝⎭⎝⎭=++++++=+=∑∑∑(2)i()-i()i i -i -i i -i i -i i -i i -i 11sin()(e e )(e e e e )2i 2i 1111(e e )(e e )(e e )(e e )2i 222i sin cos cos sin A B A B A B A B A A B B A A B B A B A B A B+++=-=-=-+++-=+ 同理可证(3). 证毕在定理3.10中,取A =B ,即得 推论 对任意Cn nA ⨯∈,有22cos 2cos sin A A A =-,sin2A =2sin A cos A 值得注意的是,当AB ≠BA 时,ee e A BA B +=或e e e A B B A +=不成立.如取0010A ⎛⎫= ⎪⎝⎭,0100B ⎛⎫= ⎪⎝⎭,则0110A B ⎛⎫+= ⎪⎝⎭,00100100AB BA ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭且10e 11A⎛⎫= ⎪⎝⎭,11e 01B⎛⎫= ⎪⎝⎭,-1-1-1-1e+e e e 1e 2e e e+e A B +⎛⎫= ⎪⎝⎭-- 可见1121e e e e 1211A BB A ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭e e e A B A B +≠,e e e A B B A +≠定理3.11 设Cn nA ⨯∈,则有(1)tr dete e A A=;(2)1(e )e A A --=.证 (1)设A 的特征值为1λ,2λ,…,n λ.则由定理3.8知,e A的特征值为1e λ,2e λ,…,e n λ,从而1212tr dete =e e e e e n n A A λλλλλλ++==…+…(2)由于tr dete =e 0A A≠,所以e A 总是可逆的.又由定理3.10,得e e e e A A A A O I--===故1(e )e A A --=. 证毕需要指出的是,对任何n 阶方阵A ,e A总是可逆的,但sin A 与cos A 却不一定可逆.如取π00π/2A ⎛⎫=⎪⎝⎭,则00sin 01A ⎛⎫= ⎪⎝⎭,10cos 00A -⎛⎫= ⎪⎝⎭.可见sin A 与cos A 都不可逆.§3.4 矩阵的微分和积分在研究微分方程组时,为了简化对问题的表述及求解过程,需要考虑以函数为元素的矩阵的微分和积分.在研究优化等问题时,则要碰到数量函数对向量变量或矩阵变量的导数,以及向量值或矩阵值函数对向量变量或矩阵变量的导数.本节简单地介绍这些内容. 一、函数矩阵的微分和积分定义 3.6 以变量t 的函数为元素的矩阵()(())ij m n A t a t ⨯=称为函数矩阵,其中()(1,2,,;1,2,,)ij a t i m j n ==都是变量t 的函数.若t ∈[a ,b ],则称A (t )是定义在[a ,b )上的;又若每个()ij a t 在[a ,b ]上连续、可微、可积,则称A (t )在[a ,b ]上是连续、可微、可积的.当A (t )可微时,规定其导数为()(())ijm n A t a t ⨯''=或d d ()()d d ij m nA t a t t t ⨯⎛⎫= ⎪⎝⎭而当A (t )在[a ,b ]上可积时,规定A (t )在[a ,b ]上的积分为()()d ()d bb ijaam nA t t a t t ⨯=⎰⎰例3.11 求函数矩阵23sin cos ()2e 01t t t t t A t t t ⎛⎫⎪= ⎪ ⎪⎝⎭的导数. 解2cos sin 1d ()2ln 2e 2d 003t t t t A t t t t -⎛⎫⎪= ⎪ ⎪⎝⎭关于函数矩阵,有下面的求导法则.定理3.12 设A (t )与B (t )是适当阶的可微矩阵,则(1)d d d(()())()()d d d A t B t A t B t t t t+=+ (2)当λ(t )为可微函数时,有d d d (()())()()()()d d d t A t t A t t A t t t t λλλ⎛⎫=+ ⎪⎝⎭(3)d d d (()())()()()()d d d A t B t A t B t A t B t t t t ⎛⎫=+ ⎪⎝⎭; (4)当u =f (t )关于t 可微时,有d d()()()d d A u f t A u t u'= (5)当1()A t -是可微矩阵时,有111d d (())()()()d d A t A t A t A t t t ---⎛⎫=- ⎪⎝⎭证 只证(2)和(5).设()(())ij m n A t a t ⨯=,()(())ij n p B t b t ⨯=,则111d d (()())(()())d d d d ()()()()d d d d ()()()()d d nik kj m n k n nik kj ik kj k k m nA tB t a t b t t t a t b t a t b t t t A t B t A t B t t t ⨯===⨯=⎛⎫⎛⎫=+ ⎪ ⎪⎝⎭⎝⎭⎛⎫=+ ⎪⎝⎭∑∑∑由于1()()A t A t I -=,两边对t 求导,得11d d ()()()()d d A t A t A t A t O t t --⎛⎫+=⎪⎝⎭从而111d d ()()()()d d A t A t A t A t t t ---⎛⎫=- ⎪⎝⎭证毕 定理3.13 设C n nA ⨯∈,则有(1)d e e e d AtAt At A A t ==; (2)dsin cos (cos )d At A At At A t ==;(3)dcos sin (sin )d At A At At A t=-=-.证 这里只证(1).(2)和(3)的证明与(1)类似.由0e !k Atkk t A k +∞==∑,并利用绝对收敛级数可以逐项求导,得101111d d e d d !(1)!e (1)!k k At k k k k k k Atk t t A A t t k k tA A A k -+∞+∞==-+∞-===-==-∑∑∑同样11111d e ==e d (1)!(1)!k k At k k At k k t t A A A A t k k --+∞+∞-==⎛⎫= ⎪--⎝⎭∑∑ 证毕根据定义和积分的有关性质,可得定理3.14 设A (t ),B (t )是区间[a ,b ]上适当阶的可积矩阵,A ,B 是适当阶的常数矩阵,λ∈C ,则 (1)(()())d ()d ()d bb ba aaA tB t t A t t B t t +=+⎰⎰⎰;(2)()d ()d bbaaA t t A t t λλ=⎰⎰;(3)()()d ()d bbaaA tB t A t t B =⎰⎰,()d ()d b baaAB t t A B t t =⎰⎰;(4)当A (t )在[a ,b ]上连续时,对任意t ∈(a ,b ),有()d ()d ()d t aA A t tττ=⎰(5)当A (t )在[a ,b]上连续可微时,有()d ()()baA t t A b A a '=-⎰以上介绍了函数矩阵的微积分概念及一些运算法则.由于d()d A t t仍是函数矩阵,如果它仍是可导矩阵,即可定义其二阶导数.不难给出函数矩阵的高阶导数11d d d ()()d d d k k k k A t A t t t t --⎛⎫= ⎪⎝⎭二、数量函数对矩阵变量的导数定义 3.7 设f (X )是以矩阵()ij m n X x ⨯=为自变量的mn 元函数,且(1,2,,;1,2,,)ijfi m j n x ∂==∂都存在,规定f 对矩阵变量X 的导数d d f X为 1111d d ij m nm mn f f x x n f f X x f f x x ⨯∂∂⎛⎫ ⎪∂∂ ⎪⎛⎫∂ ⎪== ⎪ ⎪ ⎪∂⎝⎭∂∂ ⎪ ⎪∂∂ ⎪⎝⎭特别地,以T 12(,,,)n x ξξξ=为自变量的函数f (x )的导数T12d (,,,)d nf f ff x ξξξ∂∂∂=∂∂∂称为数量函数对向量变量的导数,即为在数学分析中学过的函数f 的梯度向量,记为grad f .例 3.12 设T 12(,,,)n a a a a =是给定的向量,T 12(,,,)n x ξξξ=是向量变量,且T T ()f x a x x a ==求d d f x. 解 因为1()nk kk f x a ξ==∑而(1,2,,)j jfa j n ξ∂==∂所以TT 1212d (,,,)(,,,)d n nf f f f a a a a x ξξξ∂∂∂===∂∂∂例3.13 设()ij m n A a ⨯=是给定的矩阵,()ij n m X x ⨯=是矩阵变量,且()tr()f x Ax =求d d f X. 解 因为1()nikkj m m k AX ax ⨯==∑.所以11()tr()m nsk ks s k f X AX a x ====∑∑而(1,2,,;1,2,,)ijfi n j m x ∂==∂故T d ()d ji n m ij n mf f a A X x ⨯⨯⎛⎫∂===⎪ ⎪∂⎝⎭ 例 3.14 设()ij n n A a ⨯=是给定的矩阵,T 12(,,,)n x ξξξ=是向量变量,且T ()f x x Ax =求d d f x. 解 因为T1111()()n nn ns sk ks sk k s k s k f x x Ax aa ξξξξ=======∑∑∑∑而1111,11,111()nj j j j jk k j jj j j j n njk jn nsj s jk ks k fa a a a a a a a ξξξξξξξξξ--++===∂=+++++++∂=+∑∑∑所以1111111T T d d ()n ns s k k s k n nsn s nk k s k n f a a f x f a a A x Ax A A xξξξξξξ====∂⎛⎫⎛⎫+ ⎪ ⎪∂⎪ ⎪ ⎪== ⎪⎪ ⎪∂ ⎪ ⎪+ ⎪⎪∂⎝⎭⎝⎭=+=+∑∑∑∑ 特别地,当A 是对称矩阵时,有d 2d fAx x=例3.15 设()ij n n X x ⨯=是矩阵变量,且det X ≠0.证明1T ddet (det )()d X X X X-= 证 设ij x 的代数余子式为ij X .把det X 按等i 行展开,得1det nikik k X xX ==∑于是det ij ijX X x ∂=∂故 T1T 1Tddet det ()(adj )d ((det ))(det )()ij n n ij n nX X X X X x X X X X ⨯⨯--⎛⎫∂=== ⎪ ⎪∂⎝⎭== 三、矩阵值函数对矩阵变量的导数定义3.8 设矩阵()(())ij s t F X f X ⨯=的元素()(1,2,,;1,2,,)ij f X i s j t ==都是矩阵变量()ij m n X x ⨯=的函数,则称F (X )为矩阵值函数,规定F (X )对矩阵变量X 的导数d d FX为111d d 1F F x x n F X F F x x m mn ∂∂⎛⎫⎪∂∂ ⎪⎪=⎪∂∂ ⎪⎪∂∂ ⎪⎝⎭,其中1111t ij s st f f xx ij ij F x f f x x ij ij ∂∂⎛⎫⎪∂∂ ⎪∂ ⎪=⎪∂ ⎪∂∂⎪∂∂ ⎪⎝⎭即其结果为(ms )×(nt )矩阵. 作为特殊情形,这一定义包括了向量值函数对于向量变量的导数,向量值函数对于矩阵变量的导数,矩阵值函数对于向量变量的导数等. 例3.16 设T12(,,,)n x ξξξ=是向量变量,求T T d d d d x xx x=.解 由定义,得T 1TT 2T 100010d d 001n nx x x I x x ξξξ⎛⎫∂ ⎪∂ ⎪⎛⎫ ⎪∂⎪⎪ ⎪===∂ ⎪ ⎪⎪⎪ ⎪⎝⎭⎪∂ ⎪∂⎝⎭同理可得T 12d ,,,d n n x x xx I x ξξξ⎛⎫∂∂∂== ⎪∂∂∂⎝⎭例3.17 设T1234(,,,)a a a a a =是给定向量,24()ij X x ⨯=是矩阵变量,求Td()d Xa X,d()d Xa X. 解 因为41121k k k n k k k x a Xa x a ==⎛⎫⎪ ⎪= ⎪ ⎪⎝⎭∑∑,44T 1211()(,)k k k k k k Xa x a x a ===∑∑ 所以T T TT T 13141112T T T T 2122232431243124()()()()d()d ()()()()00000000Xa Xa Xa Xa x x x x Xa XXa Xa Xa Xa xx x x a a a a a a a a ⎛⎫∂∂∂∂⎪∂∂∂∂ ⎪=⎪∂∂∂∂ ⎪ ⎪∂∂∂∂⎝⎭⎛⎫= ⎪⎝⎭而131411122122232412341234()()()()d()()()()()d 00000000Xa Xa Xa Xa x x x x Xa Xa Xa Xa Xa Xxx x x a a a a a a a a ∂∂∂∂⎛⎫⎪∂∂∂∂ ⎪=⎪∂∂∂∂ ⎪∂∂∂∂⎝⎭⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭§3.5 矩阵分析应用举例本节介绍矩阵函数及矩阵微积分的一些应用. 一、求解一阶线性常系数微分方程组在数学或工程技术中,经常要研究一阶常系数微分方程组1111122112211222221122d ()()()()()d d ()()()()()d d ()()()()()d n n n n n n n nn n n x t a x t a x t a x t f t t x t a x t a x t a x t f t t x t a x t a x t a x t f t t ⎧=++++⎪⎪⎪=++++⎨⎪⎪=++++⎪⎩满足初始条件0()(1,2,,)i ix t c i n ==的解.如果记T 12(),(,,,)ij n n n A a c c c c ⨯==T 12()((),(),,())n x t x t x t x t =,T 12()((),(),,())n f t f t f t f t =则上述微分方程组可写为0d ()()()(3.8)d ()x t Ax t f t tx t c⎧=+⎪⎨⎪=⎩因为d d ()(e ())e ()()e d d d ()e ()e ()d At At At At At x t x t A x t t t x t Ax t f t t -----=-+⎛⎫=-= ⎪⎝⎭将上式两边在[0t ,t ]上积分,得00d (e ())d e ()d d tt A A t t x f τττττττ--=⎰⎰ 即000e ()e ()e ()d tAt A A t x t x t f ττττ----=⎰于是微分方程组的解为00()()eee ()d tA t t AtA t x t c f τττ--+⎰=例3.18 求解微分方程组初值问题113212313123d ()()()1d d ()()2()1d d ()4()3()2d (0)1,(0)0,(0)1x t x t x t t x t x t x t tx t x t x t t x x x ⎧=-++⎪⎪⎪=+-⎪⎨⎪=-++⎪⎪⎪===⎩ 解 记123()10111120,0,()(),()140312()x t A c x t x t f t x t -⎛⎫⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪====- ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎝⎭则微分方程组可以写成式(3.8)的矩阵形式.例3.9已求得222e 2e 0e e e e 2e e e e e 4e 02e e t t tAt t t tt t t t t t t t t t t t t ⎛⎫-⎪=-++-- ⎪ ⎪-+⎝⎭依次计算下列各量e e e e e 2e t t At t t t t c t t ⎛⎫- ⎪= ⎪ ⎪-⎝⎭,00e 1e e ()d e 1e 2e 22e t t t A tt f d τττττττ-------⎛⎫⎛⎫- ⎪ ⎪=-=-+ ⎪⎪ ⎪ ⎪-⎝⎭⎝⎭⎰⎰, 0e 1e e ()d e 12e 2t tAt A t t f τττ-⎛⎫- ⎪=-+ ⎪ ⎪-⎝⎭⎰故微分方程组的解为123e e e 1(2)e 1()()()e e 1(1)e 1()e 2e 2e 2(32)e 2t t t tt t t t t t t t t x t x t x t t t x t t ⎛⎫⎛⎫⎛⎫----⎛⎫⎪ ⎪ ⎪ ⎪==+-+=-+ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪----⎝⎭⎝⎭⎝⎭⎝⎭二、求解矩阵方程在控制论与系统理论中,要遇到形如AX +XB =F 的矩阵方程求解问题,这个矩阵方程也称为Lyapunov 方程.关于这个矩阵方程的解有如下结果. 定理3.15 给定矩阵方程 AX +XB =F (3.9) 其中Cm mA ⨯∈,Cn nB ⨯∈,Cm nF ⨯∈.如果A 和B 的所有特征值具有负实部(这种矩阵称为稳定矩阵),则该矩阵方程有惟一解e e d At Bt X F t +∞=-⎰证 记()e e At BtY t F =.则有Y (0)=F ,且d ()e e e e ()()(3.10)d At Bt At Bt Y t A F F B AY t Y t B t=+=+设12,,,m λλλ是A 的m 个特征值,12,,,n μμμ是B 的n 个特征值.根据利用Jordan标准形求矩阵函数的方法(见§3.3)知,e At的元素是形如e (0)j tr t r λ≥的项的线性组合.因为A 的所有特征值j λ的实部是负的,所以lim eAtt O →+∞=.同理lim e Bt t O →+∞=.于是lim ()lim e e At Bt t t Y t F O →+∞→+∞==又由于e e AtBtF 的元素是形如()e (0)i j tr t r λμ+≥的项的线性组合,且积分()0ed i j tr t t λμ+∞+⎰都存在,故积分e e d At Bt F t +∞⎰存在.对式(3.10)两边从0到+∞积分,得()()0()(0)()d ()d Y Y AY t t Y t t B+∞+∞+∞-=+⎰⎰即()()0()d ()d A Y t t Y t t B F+∞+∞-+-=⎰⎰这说明0e e d At BtX F t +∞=-⎰是矩阵方程(3.9)的解.惟一性的证明见第七章. 证毕 推论1 设Cm mA ⨯∈,Cn nB ⨯∈,Cm nF ⨯∈,则矩阵微分方程d ()()()d (0)X t AX t X t B tX F⎧=+⎪⎨⎪=⎩的解为()e e At BtX t F =推论2 设A ,C n nF ⨯∈,且A 的所有特征值具有负实部,则矩阵方程H A X XA F+=-的惟一解为H 0ee d (3.11)A tAt X F t+∞=⎰如果F 是Hermite 正定矩阵,则解矩阵X 也是Hermite 正定矩阵.证 只需证明后一结论.当F 是Hermite 正定矩阵时,由式(3.11)可知X 是Hermite 矩阵.又对0Cnx ≠∈,由于eAt总是可逆的,所以e 0Atx ≠,于是HH H e e (e )(e )0A t At At At x F x x F x =>.从而HH 0(e )(e )d 0At At x Xx x F x t +∞=>⎰故X 是Hermite 正定矩阵. 证毕三、最小二乘问题 设Cm nA ⨯∈,C n b ∈.当线性方程组Ax =b 无解时,则对任意C nx ∈都有Ax -b ≠0.此时希望找出这样的向量0C nx ∈,它使2Ax b -达到最小,即022Clim (3.12)nx Ax b Ax b ∈-=-称这个问题为最小二乘问题,称0x 为矛盾方程组Ax =b 的最小二乘解.以下结论给出了当A ,b 分别是实矩阵和实向量时,Ax =b 的最小二乘解所满足的代数方程.定理3.16 设R m nA ⨯∈,R m b ∈,0R n x ∈.若0R nx ∈是Ax =b 的最小二乘解,则0x 是方程组TT(3.13)A Ax A b=的解.称式(3.13)为Ax =b 的法方程组.证 由于2T 2TTTTTT()()()f x Ax b Ax b Ax b x A Ax x A b b Ax b b=-=--=--+若0x 为Ax =b 的最小二乘解,则它应是f (x )的极小值点,从而d 0(3.14)d x f x=根据例3.12和例3.14,得T T d 22d fA Ax A b x=- 由式(3.14)即知T T00A Ax A b -=,故0x 是式(3.13)的解. 证毕对于含约束条件的最小二乘问题,有如下的结果. 例3.19 设Rm nA ⨯∈,R m b ∈,Rk nB ⨯∈,R kd ∈,且Bx =d 有解.试求约束极小。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定理 1.10.7 设 A, B C nn 都可以对角化,则 A, B 同时对角化的充要条件是 AB BA.
nn 证明:必要性 若存在 P C n 使得
P 1 AP diag(1 , 2 , P 1 BP diag( 1 , 2 ,
, n ) , n )
这里
k1 , k2 为数域 K 中不全为零的数对。
对于特征值 6,解齐次线性方程组
(6 I A) X 0
得到一个基础解系:
1
2 2
T
从而 f 的属于 6 的极大线性无关特征向量组是
3 1 22 23
于是
f
的属于 6 的全部特征向量
k3 , k K
这里
对于特征值
3 ,解齐次线性方程组 (3 I A) X 0
1 0 ,
T
得到一个基础解系:
2
2
0 1
T
从而 f 的属于 3 的极大线性无关特征向量组是
1 21 2 , 2 21 3
于是
f 的属于 3 的全部特征向量是 k11 k2 2 , k1 , k2 K
矩阵(线性变换)的特征值与特征向量
定义 设 f 是数域 F 上的线性空间 V 的一个线 性变换,如果在 V 中存在一个非零向量 使得
f ( ) 0, 0 F
那么称 0 为 f 的一个特征值,而 属于特征值 0 的一个特征向量。
称为 f 的
现在设 V 是数域 F 上的 取定一个基
P 1 AP
P 1 BP diag(1 , , n )diag(1 ,
n i 1
a nn
aii tr( A)
称为矩阵 A 的迹。(主对角元素之和)
2)
i 1
n
i
12
n= A
几个概念:特征子空间,特征根的代数重复度、 几何重复度。 (1) n 阶矩阵 A 的属于特征值 0 的全部特征向 量再添上零向量,可以组成 R n 的一个子空间,称 之为矩阵 A 的属于特征值 0 的特征子空间,记 为 V0 ,不难看出 V0 正是特征方程组
定义:若 n 阶矩阵 A与对角形矩阵相似,则称 A 可 对角化,也称 A 是单纯矩阵。
定理1.10.2 n 阶矩阵 A 可对角化的充要条件是有 n 个 线性无关的特征向量。
不妨假设 n 阶方阵 A 可相似于对角阵,即 存在可逆矩阵 P ,使得 或
令
P X 1, X 2 ,
P 1 AP diag 1 , 2 ,, n AP Pdiag1 , 2 ,, n
qi 为 (i I A) X 0 基础解系中向量个数,所以
qi n rank(i I A), qi pi
推论
若n阶方阵A有n个互异的特征值(即特征
多项式无重根),则A可相似对角化。
同时对角化
A 0 引理:设 A C , B C , 且 C , 0 B 则 C 可以对角化的充要条件是 A, B 都可以 对角化。
k 为数域 K 中任意非零数。
特征值和特征向量的性质
设 A aij ,易见,它的特征多项式是关于 的 nn n次多项式,不妨设之为
f I A C0 n C1 n1
a11
a21 a n1 a12 a22 an 2 a1n a2 n ann
C0 1
C1 a11 a22 ann
在式(5.1.5)中,令
0 ,得
n
C n 1 A
另外,根据多项式理论,n 次多项式
f I A
又由于 f 的首项系数 C 0 1 ,于是有 在复数域上有 n个根,不妨设为
1
,
2
,
,
qi
特征值 i 的几何重复度 qi 不大于 它的代数重复度 pi .
矩阵的可对角化条件
n 维线性空间 V上的线性变换 f,是否存在 V 的 一个基使得 f 在这个基下的矩阵为对角矩阵?
f 在给定的一个基下的矩阵表示为 A,那么 A 是否相似于一个对角矩阵? 矩阵 A 相似于一个对角矩阵的条件是什么?
2 2 2 A 2 1 4 2 4 1
求 f 的全部特征值与特征向量。 解: A 的特征多项式为
2 I A
ቤተ መጻሕፍቲ ባይዱ2 2
2 2 1 4 4 1
( 3)2 ( 6)
所以
A 的特征值是 3(二重)与 6 。
AX i i X i
此时,令
i 1,2,, n
P X 1 , X 2 ,, X n
显然 P 可逆,且有
P AP diag 1 , 2 ,, n
1
即矩阵 A 相似于对角阵.
定理1.10.3 n 阶矩阵 A 可对角化的充要条件是 A 的每一个特征值的几何重复度等于代数重复度。
因此,只要将 A 的全部特征值求出来,它们 就是线性变换 f 的全部特征值;只要将矩阵 A 的 属于 0 的全部特征向量求出来,分别以它们为坐 标的向量就是 f 的属于 0 的全部特征向量。
例 1 设 V 是数域 K上的3维线性空间, f 是 V 上 的一个线性变换,f 在 V 的一个基 1 , 2 ,3 下的 矩阵是
m , 1 的特征向量。
(4) f ( x ) 为x的多项式,则 f ( A) 的特征值为 f ( ).
性质2: 矩阵 A 和 A 的特征值相同。 性质3:设 n 阶方阵 A aij 则
T
的 n 个特征值为 , ,
1 2
, n
1)
1+2+ +n a11 a22
每个列向量都可以由 P 的列向量组线性表出
[ i 1, i 2,
, iqi , 1 , 2 ,
P
i P 1 AP
i
0
1
* A1
i , n qi ]
i
0
* A1
| En A || En P AP | ( i ) | Enqi A1 |
, iqi , 1 , 2 ,
R 的一组基
, nqi ] 则
, A nqi ] , A nqi ]
n
令 P [ i 1, i 2,
AP [ A i 1, A i 2, [i i 1, i i 2,
, iqi , 1 , 2 ,
, A iqi , A1 , A 2 , , i iqi , A1 , A 2 ,
定义:设 A 是数域 F 上的 n 阶矩阵,矩阵 E A
称为A的特征矩阵。
行列式
a11
| En A | a21 a n1
称为 A 的特征多项式。
a12 a22 an 2
a1n a2 n
ann
n 次代数方程 En A 0 称为 A的特征方程.
1
0
2
( r ) pr
特征子空间 V 的维数 qi 为 i 的几何重复度。
qi n rank(i I A)
(4)设 1 , 2 , , r 是 A 的 r 个互不相同的特征值, qi 是 的几何重复度, i 1, i 2, , iq 是对应于 i i i 的 qi 个线性无关的特征向量,则 A 的所有这 些特征向量 11,12, ,1q1 ; 21, 22, , 2 q2 ; ; r 1, r 2, , rq 线性无关。
, Xn
并将之代入上式,得
X 1 , X 2 ,, X n diag 1 , 2 ,, n
A X 1 , X 2 ,, X n
即 AX 1 , AX 2 ,, AX n 1 X 1 , 2 X 2 ,, n X n 从而有
由 P 可逆知, X i 0i 1,2,, n 且
r
r 个特征子空间的和是直和 V1 V2
Vr
(5)一个特征向量不能属于不同的特征值。
(6) 矩阵 A 的任一特征值 i 的几何重复度 qi 不大于
它的代数重复度 pi .
i 1, i 2, 证: 特征向量:
, iqi 对应于特征值 i , nqi
i 1, i 2,
n
,
f
I
1 n
A
2 n 1 1 n 2 n n
1n
1
比较 (5.1.5) 和 (5.1.9), 得
C1 1 n
C n 1 12 n
n
于是可得特征值的重要性质:
1 A 12 n 2
i 1
aii i
i 1
n
n
由 (1) 易见,矩阵A 可逆的充要条件是它的所
AX i i X i
i 1,2,, n
X 1 , X 2 , , X n
线性无关从而 X 1 , X 2 ,, X n 是 A 的 n 个线 性无关的特征向量, 1 , 2 ,, n 是 A 的 n 个
特征值。
反之,若 n 阶方阵 A有 n 个线性无关的特
征向量,不妨设为 X , X ,, X ,则存在相应 1 2 n 的特征值 1 , 2 ,, n ,使得
n
维线性空间,在 V 中
1 , 2 ,
, n ,设线性变换 f 在这组
基下的矩阵是 A ,0 F 是一特征值,它的一个特 征向量 在这组基下的坐标是 X , 那么我们有
f ( ) 0 AX 0 X
x1 x 2 f ( ) 0 f ( ) f 1 , 2 , , n x n x1 x 2 AX 0 X f (1 ), f ( 2 ), , f ( n ) xn x1 x1 x x 2 2 , , , 1 , 2 , , n A 0 0 1 2 n xn xn