某211高校研究生课程矩阵论l矩阵的因子分解剖析
矩阵理论课件-第二章 矩阵的分解
故xH AH Ax=xH x= 2 xH x,因为AH A=I,所以 2 =1.
(因为xH x= x 2 0)
:由条件UHAU=diag{1, , n}共轭转秩得UHAHU=
diag{1,
, n},所以UHAAT U=diag{ 1 2 ,
,
n
2
}=I
,
n
所以AAT =In .
注1:设A Cnn ,则
Cmr r
,
C
Ir
D
Crn r
.
下设A的前r个列向量线性相关,只需先做列变换,变成
线性无关,
因此存在P
Cmmm,Q
Cnn n
,
满足
PAQ=
Ir 0
D 0
或A=P-1
Ir 0
D 0
Q-1
=P-1
Ir 0
I
r
=BC
D Q-1
其中B=P-1
Ir 0
Cmr r
,C
Ir
D
讨论知AH x1, , AH xp为AH A属于i 0的特征向量,只要证明
AH x1, , AH xp线性无关,就证明了AAH的p重特征值也是AH A 的p重特征值.
下证AH x1, , AH xp线性无关.
设k1AH x1
k p AH xp 0.则( AH x1,
,
AH
xp
)
k1
0
kp
H
=
1 2
11,可知|I-A|无重根,
A为单纯矩阵,但AAH AH A.
推论1:A为正规矩阵,当且仅当A有n个特征向量构成Cn的一组 标基,且A的不同特征值的特征向量正交.
推论2:设A R nn ,则
矩阵论之矩阵的分解
矩阵的分解一、矩阵的三角分解 定义 3.1 设.n nA F⨯∈(1) 若,n n L U F ⨯∈分别为下三角矩阵和上三角矩阵,,A LU =则称A 可作LU 分解。
(2) 若,n n L U F ⨯∈分别是对角线元素为1的下三角矩阵和上三角矩阵,D 为对角矩阵。
,A LDU = 则称A 可作LDU 分解。
用Gauss 消去法,一个方阵总可以用行初等变换化为上三角矩阵,若只用第i 行乘以数k 加到第j 行(i j <)型初等变换就能把A 化为上三角矩阵U ,则有下三角形可逆矩阵,P 使,PA U =从而有LU 分解:1.A P U -=例1 设223477245A ⎡⎤⎢⎥=⎢⎥⎢⎥-⎣⎦,求A 的LU 分解和LDU 分解。
解 为求,P 对下面的矩阵做如下行初等变换:3223100223100()477010031210245001068101223100031210006521A I ⎡⎤⎡⎤⎢⎥⎢⎥=→-⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦⎡⎤⎢⎥→-⎢⎥⎢⎥-⎣⎦因此 100223210,031521006P PA ⎡⎤⎡⎤⎢⎥⎢⎥=-=⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦. 令1100223210,031121006L P U -⎡⎤⎡⎤⎢⎥⎢⎥===⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦则223031.006A L LU ⎡⎤⎢⎥==⎢⎥⎢⎥⎣⎦再利用初等变换,有31121002121030131216001A ⎡⎤⎢⎥⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥-⎢⎥⎣⎦⎣⎦⎢⎥⎢⎥⎣⎦就得到A LDU =其中 311210021210,3,0131216001L D U ⎡⎤⎢⎥⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥===⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥-⎢⎥⎣⎦⎣⎦⎢⎥⎢⎥⎣⎦一般来说,,LU LDU 分解一般不是惟一的。
下面讨论方阵的LU 和LDU 分解的 存在性和唯一性。
定理 3.1 设(),n nij n n A a F ⨯⨯=∈ 则A 有惟一LDU 分解A LDU =的充分必要条件是A 的顺序主子式1112121222012......0,1,2,...,;1,...............k k k k k kka a a a a a k n a a a ∆=≠=∆=其中 121,;1,2,...,...k k k n d d D d k n d -⎡⎤⎢⎥∆⎢⎥===⎢⎥∆⎢⎥⎣⎦证明:只证充分性:对A 的阶数n 进行归纳证明11111111,()(1)()(1)n A a a L DU ==== 所以定理对1n =成立,设定理对1n -成立,即 (1)(1)111()ij n n n n n A a L D U -⨯----== 则对,n 将A 分块成1n n Tnnn A A u a τ-⎡⎤=⎢⎥⎣⎦其中 121,12,1(,,...,),(,,...,),TTn n n n n n n n n n a a a u a a a τ--==设111100,1001n n n n n n T T n nn nn A L D V v u a l d τ----⎡⎤⎡⎤⎡⎤⎡⎤=⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦⎣⎦ 比较两边,则有1111,n n n n A L D U ----= (3.1)11n n n n L D v τ--= (3.2)11T Tn n n n u l D U --= (3.3) 1T nn n n n n a l D v d -=+ (3.4)由归纳假设(3.1)式成立。
矩阵分解及其的综述
96《矩阵论》课程论文题目:矩阵分解与其应用李影赵礼峰摘要:本文主要归纳和总结了代数学中的矩阵分解理论与理论应用。
根据本学期所学知识,本文把矩阵分解分为三角分解、正交三角分解、奇异值分解和满秩分解。
在论文中对相关理论进展了简要的说明与描述,并在应用方面,展示了矩阵分解在一些常见领域的重要以与广泛的应用。
关键词:矩阵分解,应用,三角分解,满秩分解,奇异值分解。
一、引言在有限维线性空间中,线性变换问题可以转化为矩阵问题进展讨论。
因此,将一个矩阵分解为假如干个特殊矩阵的乘积意味着将一个线性变换分解为假如干个特殊线性变换的乘积。
矩阵的三角分解、正交三角分解、满秩分解与奇异值分解是将矩阵分解为形式比拟简单或性质比拟熟悉的一些矩阵的乘积,这些分解式能够明显的反映出原矩阵的许多数值特征,如矩阵的秩、行列式、特征值与奇异值等。
另一方面,构造分解式的方法和过程也能够为某些数值计算方法的建立提供理论依据。
矩阵的分解给予了我们将线性变换转化成矩阵问题讨论的方法,将以往复杂而且性质不“好〞的矩阵分解成为大家所熟知并且性质“好〞的常用矩阵的乘积。
通过对常用矩阵的分析获取复杂矩阵的相关性质,这在实际的应用中也具有很大的意义。
二、矩阵分解简介1.矩阵的三角分解如果方阵A 可表示为一个下三角矩阵L 和一个上三角矩阵U 之积,即A=LU ,如此称A 可作三角分解。
矩阵三角分解是以Gauss 消去法为根据导出的,因此矩阵可以进展三角分解的条件也与之一样,即矩阵A 的前n-1个顺序主子式都不为0,即.所以在对矩阵A 进展三角分解的着手的第一步应该是判断是否满足这个前提条件,否如此怎么分解都没有意义。
矩阵的三角分解不是唯一的,但是在一定的前提下,A=LDU 的分解可以是唯一的,其中D 是对角矩阵。
矩阵还有其他不同的三角分解,比如Doolittle 分解和Crout 分解,它们用待定系数法来解求A 的三角分解,当矩阵阶数较大的时候有其各自的优点,使算法更加简单方便。
南京航空航天大学研究生课程《矩阵论》内容总结与习题选讲
《矩阵论》复习提纲与习题选讲Chapter1 线性空间和内积空间内容总结:z 线性空间的定义、基和维数;z 一个向量在一组基下的坐标;z 线性子空间的定义与判断;z 子空间的交z 内积的定义;z 内积空间的定义;z 向量的长度、距离和正交的概念;z Gram-Schmidt 标准正交化过程;z 标准正交基。
习题选讲:1、设表示实数域3]x [R R 上次数小于3的多项式再添上零多项式构成 的线性空间(按通常多项式的加法和数与多项式的乘法)。
(1) 求的维数;并写出的一组基;求在所取基下的坐标;3]x [R 3]x [R 221x x ++ (2) 在中定义3]x [R , ∫−=11)()(),(dx x g x f g f n x R x g x f ][)(),(∈ 证明:上述代数运算是内积;求出的一组标准正交基;3][x R (3)求与之间的距离;221x x ++2x 2x 1+−(4)证明:是的子空间;2][x R 3]x [R (5)写出2[][]3R x R x ∩的维数和一组基;二、 设22R ×是实数域R 上全体22×实矩阵构成的线性空间(按通常矩阵的加 法和数与矩阵的乘法)。
(1) 求22R ×的维数,并写出其一组基;(2) 在(1)所取基下的坐标; ⎥⎦⎤⎢⎣⎡−−3111(3) 设W 是实数域R 上全体22×实对称矩阵构成的线性空间(按通常矩阵的加法和数与矩阵的乘法)。
证明:W 是22R ×的子空间;并写出W 的维数和一组基;(4) 在W 中定义内积, )A B (tr )B ,A (T =W B ,A ∈求出W 的一组标准正交基;(5)求与之间的距离; ⎥⎦⎤⎢⎣⎡0331⎥⎦⎤⎢⎣⎡−1221 (6)设V 是实数域R 上全体22×实上三角矩阵构成的线性空间(按通常矩阵的加法和数与矩阵的乘法)。
证明:V 也是22R ×的子空间;并写出V 的维数和一组基;(7)写出子空间的一组基和维数。
《矩阵分析》课程教案
讨 论
练 习
作 业
作业:第3章练习题中任选5题
教学要求
熟练掌握线性空间与线性变换,矩阵的Jordan标准型,内积空间,正规矩阵,Hermite矩阵,二次型,矩阵分解,特征值的估计与计算,矩阵的扰动问题,向量范数与矩阵范数,矩阵序列和级数,广义逆矩阵,矩阵函数等基本概念和基本方法。
教学方法
课堂讲述+实验演示+实际动手操作+作业+研究报告
教学手段
多媒体课件+案例+理论推导+编程实现
考核方式
结合课堂所学写一篇论文/开卷考试二者选一
教学参考资料
[1]《矩阵分析》,史荣昌,魏丰编著,北京理工大学出版社,2010.6,第3版
[2]《Matrix Methods in Data Mining and Pattern Recognition》,Lars Eldén,The SIAM series on Fundamentals of Algorithms,2007.2
本课程针对计算机应用技术专业研究生的知识结构背景,在其本科阶段所学的《线性代数》的基础之上,进一步深化和提高矩阵理论的相关知识,并着重培养学生运用矩阵分析的知识和方法解决计算机应用领域相关问题的能力。通过本课程的学习,使学生掌握矩阵理论的基本概念,基本理论和基本方法,全面了解和掌握矩阵的标准形、特征值与特征向量、矩阵分解、范数与矩阵函数等重点内容,了解近代矩阵理论中十分活跃的若干分支,为今后的进一步学习和研究打下扎实的基础。
山西财经大学研究生课程教案
课程名称
矩阵分析
课程编码
同济大学--矩阵分析课件---矩阵论§1.1
= −2.
方阵行列式的运算性质
(1) (2)
AT = A ;
λ A = λn A ;
(3)
AB = A B
6. 方阵的迹
定义: n 阶方阵 A 的对角元素的和称为 A 的迹, 记作 tr( A),即
tr( A) = a11 + a 22 +
方阵迹的运算性质
(1) tr( A) + tr( B ) = tr( A + B ) ;
(1) (2) (3) (4)
(AT)T = A; (A+B)T = AT + BT; (λA)T = λAT; (AB)T = BTAT;
5. 方阵的行列式
定义: 由n 阶方阵A 的元素所构成的行列式叫做 方阵A 的行列式, 记作 | A | 或 detA .
⎛ 2 3 ⎞, 则 A = 2 3 例如: A = ⎜ ⎟ 6 8 6 8⎠ ⎝
• • • • • • 基础知识和矩阵的分解 矩阵的标准形 线性空间与线性变换 内积空间 矩阵分析 矩阵的广义逆
线性代数基础知识
• 矩阵的基本运算 • 线性方程组的解的结构以及求解方法 • 矩阵的特征值与特征向量 • 实对称矩阵的基本性质
§1.1 矩阵的基本运算
定义: 由m×n个数 aij ( i =1, 2, ···, m; j =1, 2, ···, n ) 排成的 m 行 n 列的数表: a11 a12 a1 n a 21 a 22 a2n
+ a nn
( 2) tr( kA) = k tr( A) ;
( 3) tr( AB ) = tr( BA) ;
7. 共轭矩阵
定义: 当 A = (aij) 为复矩阵时, 用 a ij 表示aij 的共轭 复数, 记 A = (a ij ), 称 A 为A 的共轭矩阵. 运算性质 设A, B为复矩阵, λ为复数, 且运算都是可行的, 则:
矩阵的分解分析
矩阵的奇异值分解
H mn 定义 2.2.5 设 A Cr ,A A 的特征值为
1 2 r r 1 n 0
则称 i i (i 1,2,, n) 为 A的奇异值;当 A为零矩阵时,它 的奇异值都是0. 定理 2.2.6 设 A Crmn (r 0) ,则存在m 阶酉阵 U 和 n阶 酉矩阵 V , 0 U H AV 使得 (2-2-5)
矩阵QR分解的求法
(1)Schmidt正交化法
(2)用初等旋转矩阵左乘矩阵A (3)用初等反射矩阵左乘矩阵 A
矩阵的满秩分解
定理 2.2.4设 m n 矩阵 A C mn , rankA r (r 0) .如果存 在一个列满秩矩阵 C C mr (rankC r )
D C rn (rankD r ) 使得
矩阵的分解及其应用
内容简介
矩阵分解对矩阵理论及近世计算数学的发展起了关键作用 .矩阵 分解是把一个矩阵写成性质比较熟悉或结构比较简单的另一些矩阵的 乘积,其本质是通过建立相应的矩阵分解使有些问题能够得以简化和 分解,从而更加清晰地得到矩阵的相关特性.本文的具体安排如下:
(1)第一章的主要内容是矩阵的概念、分类、运算以及矩阵的秩 及其特征值和特征向量的等;
V ;
(2)求 A的秩
1 , 2 ,, r diag
r ,奇异值
i
i (i 1,2,, n) 及
(3)计算 i
1 Ai (i 1,2,, n) ,从而得正交矩阵U ; i
A U 0 0 T V 0
(4)的奇异值分解为
矩阵分解的应用
5 0 0 0
2 1 5 2 5 1
某211高校研究生课程《矩阵论》第4章l矩阵的因子分解剖析
(4.6.1)
引理4.6.2 设A C mn ,则
(1) AH A与AAH的特征值均为非负实数 ; (2) AH A与AAH的非零特征值相同,并且非零特征
值的个数(重特征值按重数计算)等于rank ( A).
定义4.6.1 设ACmn ,如果存在非负实数和非零向量
u Cn, v Cm使得
Au v, AH v u
定理4.6.1 若A是正规矩阵,则 A的奇异值是A的特征 值的模。
定理4.6.2 设 A是 m n 矩阵,且rank(A) = r,则存在 m阶酉矩阵V 和 n 阶酉矩阵U使得
V
H
AU
0
0 0
(4.6.5)
其中 diag(1,, r ),且1 r 0.
(4.6.5)称为矩阵 A的奇异值分解.
d1 a11 ,
dk
k k 1
,
k 2,, n
分解式 A LDU称为矩阵A的LDU分解。
一般说来,即使A是n阶非奇异矩阵, A未必 能作LU分解和LDU分解。
定义4.3.1 设ei是n 阶单位矩阵的第i列(i=1,2,…n), 以e1, e2,, en为列作成的矩阵[ei1 , ei2 , , ein ] 称为 n 阶 排列矩阵,其中 i1, i2 ,, in 是1,2,…n的一个排列。
推论4.5.2 若 A是n 阶实对称矩阵,则 A正交相似于实 对角矩阵,即存在n 阶正交矩阵 Q 使得
QT AQ
(4.5.13)
其中 diag(1,, n ),i (i 1,, n)是A的实
特征值。
4.6 奇异值分解
引理4.6.1 设A C mn ,则
rank( AH A) rank( AAH ) rank( A)
南京航空航天大学2007-2014硕士研究生矩阵论matrixTheory试题
2 3 4 A 4 6 8 6 7 8 。 一(20 分) (1)设
2010 ~ 2011 学年《矩阵论》 课程考试 A 卷
(i)求 A 的特征多项式和 A 的全部特征值; (ii)求 A 的行列式因子,不变因子和初等因子; (iii)写出 A 的 Jordan 标准形;
1 A* A2 A* (3)证明: n 。
1 1 1 1 A 0 0 0 0 四、 (20 分)已知矩阵
(1)求矩阵 A 的 QR 分解;
1 2 0 1 b 1 1 2 1 ,向量 ,
(2)计算 A ;
17 6 14 60 A , B 45 16 3 13 ,试问 A 和 B 是否相似?并说明 (2)设
原因。
2 1 A 1 2 3 1 ,求 A 1 , A 2 , A , A F ; 二(20 分) (1)设
(3)用广义逆判断方程组 Ax b 是否相容?若相容,求其通解;若不相容,求其极小最小二乘解。
五、 (20 分)
(1)设矩阵
问当 t 满足什么条件时, A B 成立?
5 3 2 0 1 A 3 2 t , B 1 1 2 t 2 2 0 .5 t
五(20 分)设
A ( a ij )
为 n 阶 Hermite 矩阵,证明:
3
存在唯一 Hermite 矩阵 B 使得 A B ;
2
(2)
(3) 如果 A 0 ,则 tr ( A)tr ( A ) n 。
1
如果 A 0 ,则 tr ( A ) (tr ( A)) ;
2
矩阵的因子分解PPT课件
1 2 1 1 0 0
0 5
3
3 1 0
0 0 12 / 5 2 / 5 1 / 5 1
从而得 L1 A U , 这里
第16页/共101页
1 0 0 1 2 1
L1
3
1 0 ,U 0 5
3
2 / 5 1 / 5 1 0 0 12 / 5
因为 所以
1 0 0
L
L11
3
1 0
1 1 / 5 1
2
|
3 3
|
(0,0,1)T
第34页/共101页
所以A的QR分解为:A=QR
1
2
Q
( 1 , 2 , 3 )
1
2 0
2 0
R
QT
A
0
2
0
0
1
0
2
1 2
0
0
1
1
2
1
2 2
第35页/共101页
二、Householder 变换法 步骤:
1. 取A的列向量1, 2 ,… n,对1,由Householder矩阵性
交规范矩阵Q1和rn行满秩矩阵R,使得
A=Q1R,
Q1H Q1 I
➢列正交规范矩阵指的是mr矩阵Q1满足
。
矩阵Q1是列正交规范矩阵的充要条件是Q1的列向量组是 标准正交向量组
第31页/共101页
矩阵的QR分解方法
一、Schmidt 方法
步骤:1.将矩阵A的列向量1, 2 ,… n施以Schmidt标 准正交化,得到1, 2 ,… n 标准正交组:
的充要条件是A的所有顺序主子式均非零,即
1...k k A1...k 0,k 1,2,...n 1
研究生矩阵分析课程课件
矩阵分析
02
矩阵的三角分解
三角分解是一种将一个矩阵分解为一个下三角矩阵和一个上三角矩阵之和的方法,这种方法在解决线性方程组、计算行列式和求逆矩阵等问题中有着广泛的应用。
矩阵的QR分解
QR分解是一种将一个矩阵分解为一个正交矩阵和一个上三角矩阵之积的方法,这种方法在解决最小二乘问题、求解线性方程组和计算矩阵的范数等问题中有着重要的应用。
神经网络是一种模拟人脑神经元结构的计算模型,由多个神经元组成,用于处理复杂的数据模式。参数矩阵在神经网络中起到传递信息的作用,通过调整参数矩阵的值,可以训练神经网络以适应不同的任务和数据集。参数矩阵的学习和优化是神经网络训练过程中的核心步骤。
课程总结与展望
06
矩阵基本概念:矩阵作为线性代数中的基本概念,是解决实际问题的有力工具。课程中详细介绍了矩阵的定义、性质以及矩阵的运算规则,如矩阵加法、数乘、乘法等。
矩阵的范数
线性方程组与矩阵
03
高斯消元法是一种求解线性方程组的直接方法,通过消元和回代步骤求解方程组。
高斯消元法的基本思想是将增广矩阵通过行变换化为阶梯形矩阵,然后回代求解未知数。在每一步消元过程中,通过将某一行的倍数加到其他行上,使得当前未知数的系数变为0,从而简化方程组。
总结词
详细描述
总结词
大数据与矩阵分析
在大数据时代,如何有效地处理和分析大规模数据成为亟需解决的问题。矩阵分析作为处理线性代数问题的有力工具,未来可以进一步研究如何将其应用于大数据处理和分析中。
数值计算与矩阵分析
数值计算是解决各种数学问题的重要手段,而矩阵分析作为数值计算的基础,其重要性不言而喻。未来可以进一步研究如何提高矩阵分析的数值计算精度和效率,以满足各种复杂数学问题的求解需求。
华中科技大学研究生矩阵论课件
子空间的“和”为“直和”的充要–条件 :
定理1·8 设W=W1+W2,则下列各条等价:
(1)
W=W1W2
(2)
X W,X=X 1+X2的表
是惟一的
(3) W中零向量的表示是惟一的
(4)
dim W =dimW1+dimW2
.
26
例1
P12 eg18
例2 设在Rn×n中,子空间
W 1={A AT =A } , W2={B BT= –B }, 证明Rn×n=W1W2。
线性空间的一般性的观点:
线性空间的一般形式:
V(F),元素被统称为向量:, ,,
线性空间的简单性质(共性):
定理1 . 1:V(F)具有性质:
(1) V(F)中的零元素是惟一的。
(2) V(F)中任何元素的负元素是惟一的。
(3)数零和零元素的性质: 数0 0=0,k0=0,k =0 =0 或k=0
例3 子空间W的“直和补子空间”
.
27
1·2 内积空间
主题:定义内积的概念,借助于内积建立线性 空间的度量关系。
一、 欧氏空间和酉空间 1 几何空间中度量关系的定义基础 2 内积的定义 定义1·7 (P13) :要点 • 内积(,)是二元运算:Vn(F) F • (,)的公理性质 • (,)是任何满足定义的运算。 • 讨论(,1+2), (,k)
(II);{ 2 1 0 1 0 0 0 0 }
0
0
1
0
3
1
0
3
1. 求从基(I)到基(II)的过渡矩阵C。
2. 求向量 7 3 在基(II)的坐标Y。
1
2
§1.1 五、 子空间
概述:线性空间Vn(F)中,向量集合V可 以有集合的运算和关系: Wi V, W1W2, W1W2, 问题: 这些关系或运算的结果是否仍然为 线性空间 ?
《高等工程数学》课程总结与体会
短暂又充实的学习时光结束了,这学期我学习了《高等工程数学》这门课程,这门课程是一门研究生重要的数学基础课,涵盖了矩阵论、数值分析、数理统计等内容。
要求以掌握和应用高等工程数学问题的数学方法为主导,使工学硕士研究生掌握一定的数学理论基础知识,能为今后的进一步学习和解决生活、工作中遇到的实际工程数学问题打下坚实的基础。
通过学习这门课程,我的学习总结与体会如下:1.矩阵论。
一个方阵化为对角形的条件十分苛刻,对于n阶矩阵A,其可对角化的充要条件是有n个线性无关特征向量。
具体来说,就是要求A有n个互异的特征值。
显然不是每一个矩阵都可以化为对角形,但是在实数范围内,任意矩阵却可以化为一个分块对角形,而这个分块对角形就是所谓的Jordan标准型。
矩阵化Jordan型的方法总结如下:对λ矩阵经过一系列三类初等行(列)变换,先观察矩阵的特点,使得左上角的元素次数逐渐降低,最终降低到可以整除矩阵内的其他所有元素。
然后得到λ矩阵的不变因子,求出Smith标准型,再求出初等因子,最后通过定义组合出Jordan型矩阵。
这个地方我在计算的时候,老是化出来的矩阵不对,我的错误主要在于:三类初等变换的运用。
在第二类初等变换中所乘的项必须为非0常数,且不可使用多项式。
在第三类初等变换中只能使用多项式,不能使用分式。
在经过大量题目的训练后,我再也不会犯这种概念不清的错误了,解题正确率也上去了。
由此可见,理解数学概念十分重要。
2.误差分析。
在很多情况下,对于实际问题的描述,我们往往得不到最为精确的函数表达,我们只有通过对所描述的问题进行抽象、简化,得到它的近似模型,通过近似模型来反应真实的函数关系。
在这个过程中,就会产生误差,而由误差带来的影响,有时会很严重。
运用计算机进行数值计算的时候,需要注意以下几个原则:1.避免两相近的数相减。
2.避免大数“吃”小数的现象。
3.避免接近零的数做除数。
4.注意计算步骤的简化,减小运算次数。
其中1、3条准则在实际应用时十分重要。
某211高校研究生课程《矩阵论》
间 R[ x]n
例5 集合 V { x x [x 1 ,x 2 ,1 ] T ,x 1 ,x 2 R }不是
一个线性空间。因为加法不封闭。
例6 线性非齐次方程组 Axb 的解集
V { R n | C 1 1 C n r n r , A R m n }
nn,标准基为Eij:(i=1,2…n;j=1,2…n)
第i行第j列的元素为1,其它的都为0。
例1.3.4 在线性空间 P [ x ]3 中,显然
1 1 , 2 x , 3 x 2
是 P [ x ]3 的一组基,此时多项式
3 2 x 4 x 2
在这组基下的坐标就是 (3,2,4)T.
证明 1 1 ,2 ( x 2 ) ,3 ( x 2 ) 2也是 P [ x ]3
取V1 V2的一组基1,,m,把它扩充成
V1的一组基1,,m,1,,n1m,并且
把1,,m也扩充成V2的一组基1,,m,
1,,
n2
,则
V m1 sp (1 , a ,m ,1 n , n 1 m ),
V 2 sp (1 , a ,m ,1 n , n 2 m ),
并 V 1 V 2 s ( 且 1 p , ,m ,1 a , ,n 1 m n , 1 , , n 2 m )
其基可取为 { 1 , i } ,即C中任一复数k=a+bi
(a,bR)都有a+bi=(1,i)( a ),所以(a,b) T即为k的坐
标。
b
例 1.3.2 实数域 R上的线性空间R [x]n中的向量组 1,x, x2 ,… xn-1
是 基底, R [x]n的维数为 n。
例1.3.3 实数域 R上的线性空间 R nn 的维数为
《矩阵的分解》课件
高斯消元法
基本思想:通过行变换将矩阵 化为上三角矩阵或对角矩阵
步骤:选择主元素、消元、回 代
应用:求解线性方程组、求逆 矩阵、求特征值和特征向量
优点:计算量小,易于实现, 适用于稀疏矩阵和带状矩阵
迭代法
迭代法的基本思想:通过不断迭代, 逐步逼近目标解
迭代法的应用:在矩阵分解、数值 优化、图像处理等领域有广泛应用
U:上三角矩阵,对角线以上元素为0
LDU分解的应用:求解线性方程组、计算矩阵的逆矩阵等
平方根分解
平方根分解的定义:将矩阵分解为 两个矩阵的乘积,其中一个矩阵是 单位矩阵,另一个矩阵是矩阵的平 方根。
平方根分解的应用:平方根分解在 数值计算、线性代数、优化等领域 有着广泛的应用。
添加标题
添加标题
添加标题
添加标题
添加标题
添加标题
迭代法的步骤:设定初始值,计算 迭代函数,更新迭代值,直到满足 停止条件
迭代法的优缺点:优点是简单易实 现,缺点是收敛速度慢,容易陷入 局部最优解
共轭梯度法
共轭梯度法是一种求解线性方程组的迭代方法 共轭梯度法的基本思想是利用共轭梯度方向进行迭代 共轭梯度法的优点是收敛速度快,稳定性好 共轭梯度法的缺点是计算量大,需要存储大量的中间结果
a. 选取一组向量 b. 计算向量组的内积 c. 计算向量组的正交化向量 d. 重复步骤b和c,直到所有向量都正交
优点: a. 简单易行 b. 适用于任意维数的向量组
a. 简单易行 b. 适用于任意维数的向量组
应用: a. 矩阵的正交分解 b. 线性代数的其他领域
a. 矩阵的正交分解 b. 线性代数的其他领域
添加标题
添加标题
矩阵论矩阵分析报告
第三章 矩阵分析在此之前我们只研究了矩阵的代数运算,但在数学的许多分支和工程实际中,特别是涉及到多元分析时,还要用到矩阵的分析运算.本章首先讨论矩阵序列的极限和矩阵级数,然后介绍矩阵函数和它的计算,最后介绍矩阵的微积分,以及矩阵分析在解微分方程组和线性矩阵方程中的应用.§3.1 矩阵序列 定义 3.1 设有Cm n⨯中的矩阵序列{}()k A ,其中()()()k k ij m nAa ⨯=.若()lim (1,2,,;1,2,,)k ij ij k a a i m j n →+∞=== ,则称矩阵序列{}()k A 收敛于()ij m n A a ⨯=,或称A 为矩阵序列{}()k A 的极限,记为()lim k k A A →+∞=或()()k A A k →→+∞不收敛的矩阵序列称为发散. 由定义可见,Cm n⨯中一个矩阵序列的收敛相当于mn 个数列同时收敛.因此,可以用初等分析的方法来研究它.但同时研究mn 个数列的极限未免繁琐.与向量序列一样,可以利用矩阵范数来研究矩阵序列的极限. 定理 3.1 设()k A,C (012)m n A k ,,,⨯∈= .则()lim k k AA →+∞=的充分必要条件是()lim 0k k A A →+∞-=,其中 是C m n ⨯上的任一矩阵范数.证 先取Cm n⨯上矩阵的G-范数.由于()()()()1=1k k k ij ij ij ij Gi,jm nk ijiji j a a a a A Aaa =-≤-=-≤-所以()lim k k A A →+∞=的充分必要条件是()lim 0k Gk A A→+∞-=.又由范数的等价性知,对C m n⨯上任一矩阵范数 ,存在正常数α,β,使得()()()k k k GGAAAA AA αβ-≤-≤-故()lim 0k Gk AA→+∞-=的充分必要条件是()lim 0k k A A →+∞-=.证毕推论 设()k A,C(012)m nA k ,,,⨯∈= ,()lim k k A A →+∞=.则()lim k k A A →+∞=其中 是Cm n⨯上任一矩阵范数.证 由()()k k AA A A -≤-即知结论成立.证毕需要指出的是,上述推论的相反结果不成立.如矩阵序列()1(1)112k k A k ⎛⎫- ⎪=+ ⎪ ⎪⎝⎭不收敛.但()Flim lim k k x A →+∞== 收敛的矩阵序列的性质,有许多与收敛数列的性质相类似. 定理3.2 设()lim k k AA →+∞=,()lim k k B B →+∞=,其中()k A ,()k B ,A ,B 为适当阶的矩阵,α,β∈C .则 (1)()()lim ()k k k AB A B αβαβ→+∞+=+;(2) ()()lim k k k A BAB →+∞=;(3)当()k A与A 均可逆时,()11lim ()k k AA --→+∞=.证 取矩阵范数 ,有()()()()()()()()()()()()()()()k k k k k k k k k k k k k A B A B A A B B A B ABA B A B A B AB A B B A A Bαβαβαβ+-+≤-+--=-+-≤-+-由定理3.1和推论知(1)和(2)成立.因为()1()k A -,1A -存在,所以()lim det det 0k k AA →+∞=≠,又有()lim adj adj k k A A →+∞=.于是()()11()adj adj lim ()lim det det k k k k k A AA A A A--→+∞→+∞=== 证毕 定理3.2(3)中条件()k A与A 都可逆是不可少的,因为即使所有的()k A可逆也不能保证A一定可逆.例如()11111k Ak ⎛⎫+ ⎪= ⎪ ⎪⎝⎭对每一个()k A都有逆矩阵()1()1k kk A k k --⎛⎫=⎪-+⎝⎭,但()11lim 11k k A A →+∞⎛⎫== ⎪⎝⎭而A 是不可逆的. 在矩阵序列中,最常见的是由一个方阵的幂构成的序列.关于这样的矩阵序列有以下的概念和收敛定理. 定义3.2 设n nA C ⨯∈,若()lim 0k k A→+∞=,则称A 为收敛矩阵.定理3.3 设n nA C⨯∈,则A 为收敛矩阵的充分必要条件是ρ(A )<1.证 必要性.已知A 为收敛矩阵,则由谱半径的性质,有(())()k k k A A A ρρ=≤其中 是Cn n⨯上任一矩阵范数,即有lim (())0kk A ρ→+∞=,故ρ(A )<1.充分性.由于ρ(A )<1,则存在正数ε,使得ρ(A )+ε<1.根据定理2.14,存在C n n⨯上的矩阵范数m ,使得()1m A A ρε≤+<从而由kk m mAA ≤得lim 0kmk A →+∞=.故lim 0k k A →+∞=. 证毕推论 设n nA C ⨯∈.若对Cn n⨯上的某一矩阵范数 有1A <,则A 为收敛矩阵.例3.1 判断下列矩阵是否为收敛矩阵:(1)181216A -⎛⎫= ⎪-⎝⎭; (2)0.20.10.20.50.50.40.10.30.2A ⎛⎫⎪= ⎪ ⎪⎝⎭. 解 (1)可求得A 的特征值为156λ=,212λ=-,于是5()16A ρ=<,故A 是收敛矩阵; (2)因为10.91A =<,所以A 是收敛矩阵.§3.2 矩阵级数定义3.3 由Cm n⨯中的矩阵序列{}()k A 构成的无穷和(0)(1)()k A A A ++++ 称为矩阵级数,记为()k k A+∞=∑.对任一正整数N ,称()()NN k k SA ==∑为矩阵级数的部分和.如果由部分和构成的矩阵序列{}()N S收敛,且有极限S ,即()lim N N SS →+∞=,则称矩阵级数()0k k A +∞=∑收敛,而且有和S ,记为()k k S A+∞==∑不收敛的矩阵级数称为发散的.如果记()()()k k ij m n Aa ⨯=,()ij m n S s ⨯=,显然()0k k S A +∞==∑相当于()(1,2,,;1,2,,)k ij ij k a s i m j n +∞====∑即mn 个数项级数都收敛. 例3.2 已知()1π24(0,1,)10(1)(2)k kk A k k k ⎛⎫⎪ ⎪== ⎪ ⎪++⎝⎭研究矩阵级数()k A+∞∑的敛散性.解 因为k 00()()001π2410(1)(2)1π1242341012N Nk Nk k N k N k k N N S A k k N ====⎛⎫⎪ ⎪== ⎪ ⎪++⎝⎭⎛⎫⎛⎫-- ⎪ ⎪⎝⎭ ⎪= ⎪- ⎪+⎝⎭∑∑∑∑所以()4π2lim 301N N S S →+∞⎛⎫⎪= ⎪ ⎪⎝⎭故所给矩阵级数收敛,且其和为S . 定义3.4 设()()()C (0,1,)k k m n ij m n Aa k ⨯⨯=∈= .如果mn 个数项级数()0(1,2,,;1,2,,)k ijk ai m j n +∞===∑ 都绝对收敛,即()k ijk a +∞=∑都收敛,则称矩阵级数()k k A+∞=∑绝对收敛.利用矩阵范数,可以将判定矩阵级数是否绝对收敛转化为判定一个正项级数是否收敛的问题.定理3.4 设()()()C(0,1,)k k m nij m nAa k ⨯⨯=∈= .则矩阵级数()0k k A +∞=∑绝对收敛的充分必要条件是正项级数()0k k A +∞=∑收敛,其中 是C m n ⨯上任一矩阵范数.证 先取矩阵的1m -范数.若1()k k m A +∞=∑收敛,由于1()()()11(1,2,,;1,2,,)mnk k k ijij i j m aa A i m j n ==≤===∑∑从而由正项级数的比较判别法知()k ijk a+∞=∑都收敛,故()k k A+∞=∑绝对收敛.反之,若()k k A+∞=∑绝对收敛,则()0k ijk a+∞=∑都收敛,从而其部分和有界,即()0(1,2,,;1,2,,)Nk ijijk aM i m j n =≤==∑ 记,max ij i jM M =,则有1()()()0011110()()NNmnm n Nk k k ijijk k i j i j k m AaamnM =========≤∑∑∑∑∑∑∑故1()k k m A +∞=∑收敛.这表明()k k A+∞=∑绝对收敛的充分必要条件是1()k k m A +∞=∑收敛.由矩阵范数的等价性和正项级数的比较判别法知,1()k k m A+∞=∑收敛的充分必要条件是()0k k A +∞=∑收敛,其中 是C m n ⨯上任一矩阵范数. 证毕利用矩阵级数收敛和绝对收敛的定义,以及数学分析中的相应结果,可以得到以下一些结论.定理3.5 设()k k AA +∞==∑,()0k k B B +∞==∑,其中()k A ,()k B ,A ,B 是适当阶的矩阵,则(1)()()0()k k k AB A B +∞=+=+∑;(2)对任意λ∈C ,有()k k AA λλ+∞==∑;(3)绝对收敛的矩阵级数必收敛,并且任意调换其项的顺序所得的矩阵级数仍收敛,且其和不变; (4)若矩阵级数()k k A+∞=∑收敛(或绝对收敛),则矩阵级数()k k PAQ +∞=∑也收敛(或绝对收敛),并且有()()0()(3.1)k k k k PAQ P A Q+∞+∞===∑∑(5)若()k k A+∞=∑与()k k B+∞=∑均绝对收敛,则它们按项相乘所得的矩阵级数(0)(0)(0)(1)(1)(0)(0)()(1)(1)(()()(3.2)k k k A B AB A B A B A B A B -++++++++ 也绝对收敛,且其和为AB . 证 只证(4)和(5).若()0k k A+∞=∑收敛,记()()0NN k k SA ==∑,则()lim N N S A →+∞=.从而()()00lim(lim)NNk k N N k k PAQ P AQ PAQ →+∞→+∞====∑∑可见()k k PAQ +∞=∑收敛,且式(3.1)成立.若()k k A+∞=∑绝对收敛,则由定理3.4知()k k A +∞=∑收敛,但()()()k k k PA Q P AQ Aα≤≤其中α是与k 是无关的正数,从而()k k PAQ +∞=∑收敛,即()k k PAQ +∞=∑绝对收敛.当()k k A+∞=∑和()k k B+∞=∑绝对收敛时,由定理3.4知()k k A+∞=∑和()0k k B +∞=∑收敛,设其和分别为1σ与2σ,从而它们按项相乘所得的正项级数(0)(0)(0)(1)(1)(0)(0)()(1)(1)()(0)()()k k k A B A B A B ABABAB-++++++++也收敛,其和为12σσ.因为(0)()(1)(1)()(0)(0)()(1)(1)()(0)k k k k k k A B A B A B ABABAB--+++≤+++所以矩阵级数(3.2)绝对收敛.记()()1NN k k SA==∑,()()2NN k k SB ==∑,()(0)()(1)(1)()(0)3()NN k k k k SA B A B A B -==+++∑则()()()(1)()(2)(1)(2)()()(1)()()123N N N N N N N N N S S S A B A B A B A B A B --=++++++又记()()1NN k k Aσ==∑,()()2NN k k B σ==∑,()(0)()(1)(1)()(0)3()NN k k k k A B A B A B σ-==+++∑显然()()()()()()123123N N N N N N S S S σσσ-≤-故由()()12lim N N N S S AB →+∞=和()()()123lim ()0N N N N σσσ→+∞-=,得()3lim N N S AB →+∞=证毕下面讨论一类特殊的矩阵级数——矩阵幂级数. 定义3.5 设n nA C⨯∈,C(0,1,)k a k ∈= .称矩阵级数kk k a A+∞=∑为矩阵A 的幂级数.利用定义来判定矩阵幂级数的敛散性,需要判别2n 个数项级数的敛散性,当矩阵阶数n 较大时,这是很不方便的,且在许多情况下也无此必要.显然,矩阵幂级数是复变量z 的幂级数0kk k a z+∞=∑的推广.如果幂级数kk k a z+∞=∑的收敛半径为r ,则对收敛圆z r <内的所有z ,kk k a z+∞=∑都是绝对收敛的.因此,讨论kk k a A+∞=∑的收敛性问题自然联系到kk k a z+∞=∑的收敛半径.定理3.6 设幂级数kk k a z+∞=∑的收敛半径为r ,Cn nA ⨯∈.则(1)当ρ(A )<r 时,矩阵幂级数0kk k a A+∞=∑绝对收敛;(2)当ρ(A )>r 时,矩阵幂级数kk k a A+∞=∑发散.证 (1)因为ρ(A )<r ,所以存在正数ε,使得ρ(A )+ε<r .根据定理2.14,存在Cn n⨯上的矩阵范数m ,使得m ()A A r ρε≤+<从m m(())kk k k k k a A a A a A ρε≤≤+而由于幂级数(())kkk aA ρε+∞=+∑收敛,故矩阵幂级数0k k k a A +∞=∑绝对收敛.(2)当ρ(A )>r 时,设A 的,n 个特征值为12,,,n λλλ ,则有某个l λ满足l r λ>.由Jordan 定理,存在n 阶可逆矩阵P ,使得11112(10)i n n P AP J λδδδλλ--⎛⎫⎪⎪== ⎪⎪⎝⎭代表或而kk k a J+∞=∑的对角线元素为0(1,2,,)k k jk a j n λ+∞==∑ .由于0k k lk a λ+∞=∑发散,从而0k k k a J +∞=∑发散.故由定理 3.5(4)知,kkk a A+∞=∑也发散. 证毕推论 设幂级数kkk a z +∞=∑的收敛半径为r ,C n n A ⨯∈.若存在C n n ⨯上的某一矩阵范数 使得A r <,则矩阵幂级数0kk k a A+∞=∑绝对收敛.例3.3 判断矩阵幂级数018216kkk k+∞=-⎛⎫ ⎪-⎝⎭∑的敛散性. 解 令181216A -⎛⎫= ⎪-⎝⎭.例3.1中已求得5()6A ρ=.由于幂级数0kk kz +∞=∑的收敛半径为r =1,故由ρ(A )<1知矩阵幂级数kk kA+∞=∑绝对收敛.最后,考虑一个特殊的矩阵幂级数. 定理3.7 设Cn nA ⨯∈.矩阵幂级数kk A+∞=∑(称为Neumann 级数)收敛的充分必要条件是ρ(A )<1,并且在收敛时,其和为1()I A --. 证 当ρ(A )<1时,由于幂级数kk z+∞=∑的收敛半径r =1,故由定理 3.6知矩阵幂级数0kk A+∞=∑收敛.反之,若kk A+∞=∑收敛,记0kk S A+∞==∑,()()0NN k k SA ==∑则()lim N N S S →+∞=.由于()(1)()(1)lim lim ()=lim lim N N N N N N N N N A S S S S O --→+∞→+∞→+∞→+∞==--故由定理3.3知ρ(A )<1.当kk A+∞=∑收敛时,ρ(A )<1,因此I -A 可逆,又因为()1()N N S I A I A +-=-所以()111()()N N S I A A I A -+-=---故()1lim ()N N S S I A -→+∞==- 证毕 例3.4 已知0.20.10.20.50.50.40.10.30.2A ⎛⎫ ⎪= ⎪ ⎪⎝⎭,判断矩阵幂级数0k k A +∞=∑的敛散性.若收敛,试求其和.解 因为10.91A =<,所以kk A+∞=∑收敛,且102814141()44624214202535k k A I A +∞-=⎛⎫ ⎪=-= ⎪ ⎪⎝⎭∑ §3.3 矩阵函数矩阵函数是以矩阵为变量且取值为矩阵的一类函数.本节介绍矩阵函数的定义和计算方法,并讨论常用矩阵函数的性质. 一、矩阵函数的定义 定义3.5 设幂级数0k k k a z +∞=∑的收敛半径为r ,且当z r <时,幂级数收敛于函数f (z ),即0()()kk k f z a zz r +∞==<∑如果Cn nA ⨯∈满足ρ(A )<r ,则称收敛的矩阵幂级数kk k a A+∞=∑的和为矩阵函数,记为f (A ),即0()(3.3)kk k f A a A+∞==∑根据这个定义,可以得到在形式上和数学分析中的一些函数类似的矩阵函数.例如,对于如下函数的幂级数展开式02120101e ()!(1)sin ()(21)!(1)cos ()(2)!(1)(1)(1)ln(1)(1)1kzk k k k k kk kk k k k z r k z zr k z zr k z z r z zr k +∞=+∞+=+∞=+∞-=+∞+===+∞-==+∞+-==+∞-==-+==+∑∑∑∑∑ 相应地有矩阵函数01e !kk A A k +∞==∑(C n n A ⨯∈) 210(1)sin (21)!kk k A A k +∞+=-=+∑ (C n n A ⨯∈)20(1)cos (2)!k kk A A k +∞=-=∑ (C n n A ⨯∈)1()k k I A A +∞-=-=∑ (ρ(A )<1)1(1)ln()1k k k I A A k +∞+=-+=+∑ (ρ(A )<1)称e A为矩阵指数函数,sin A 为矩阵正弦函数,cos A 为矩阵余弦函数.如果把矩阵函数f (A )的变元A 换成At ,其中t 为参数,则相应得到()()(3.4)kk k f At a At +∞==∑在实际应用中,经常需要求含参数的矩阵函数.二、矩阵函数值的计算以上利用收敛的矩阵幂级数的和定义了矩阵函数f (A ),在具体应用中,要求将f (A )所代表的具体的矩阵求出来,即求出矩阵函数的值.这里介绍几种求矩阵函数值的方法.以下均假设式(3.3)或式(3.4)中的矩阵幂级数收敛. 方法一 利用Hamilton-Cayley 定理利用Hamilton-Cayley 定理找出矩阵方幂之间的关系,然后化简矩阵幂级数求出矩阵函数的值.举例说明如下. 例3.5 已知0110A ⎛⎫=⎪-⎝⎭,求e At.解 可求得2det()1I A λλ-=+.由Hamilton-Cayley 定理知2A I O +=,从而2A I =-,3A A =-,4A I =,5A A =,…即2(1)k k A I =-,21(1)(1,2,)k k A Ak +=-=故243501e 1!2!4!3!5!cos sin (cos )(sin )sin cos Atk k k t t t t A t I t Ak t t t I t A t t +∞=⎛⎫⎛⎫==-+-+-+- ⎪ ⎪⎝⎭⎝⎭⎛⎫=+= ⎪-⎝⎭∑例3.6 已知4阶方阵A 的特征值为π,-π,0,0,求sin A ,cos A .解 因为2422det()(π)(π)πI A λλλλλλ-=-+=-,所以422πA A O -=.于是422πA A =,523πA A =,642πA A =,743πA A =,…即2222πkk A A -=,21223π(2,3,)k k A A k +-==故213223023321323332(1)1(1)sin π(21)!3!(21)!11(1)π3!π(21)!sin ππ1ππk k k k k k k k k A A A A Ak k A A A k A A A A +∞+∞+-==+∞+=--==-+++⎛⎫-=-+ ⎪+⎝⎭=+=-∑∑∑-22222022222(1)1(1)cos π(2)!2!(2)!cos π12ππk k k k k k A A I A Ak k I A I A +∞+∞-==--==-+=+=-∑∑-方法二 利用相似对角化 设C n nA ⨯∈是可对角化的,即存在C n n n P ⨯∈,使得112diag(,,,)n P AP A λλλ-== 则有11112112()()()diag(,,,)diag((),(),,())kkk k k k k k k kk k k k k n k k k n f A a A a P P P a P P a a a P P f f f P λλλλλλ+∞+∞+∞--===+∞+∞+∞-===-==Λ=Λ==∑∑∑∑∑∑同理可得112()diag((),(),,())n f At P f t f t f t P λλλ-=例3.7 已知460350361A ⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭,求e At,cos A .解 可求得2det()(2)(1)I A λλλ-=+-,即A 的特征值为12λ=-,231λλ==.对应12λ=-的特征向量为T 1(1,1,1)p =-,对应231λλ==的两个线性无关的特征向量为T 2(2,1,0)p =-,T 3(0,0,1)p =.于是120110101P --⎛⎫ ⎪= ⎪ ⎪⎝⎭ 使得1211P AP --⎛⎫⎪= ⎪ ⎪⎝⎭故22212222e 2e e 2e 2e 0e e e e2e e 0e e e 2e 2e e tt t t t At tt t t t t t t t tt P P --------⎛⎫⎛⎫-- ⎪ ⎪==--⎪ ⎪ ⎪ ⎪--⎝⎭⎝⎭1cos(2)cos cos1cos12cos1cos 22cos12cos 20cos 2cos12cos 2cos10cos 2cos12cos 22cos1cos1A P--⎛⎫⎪= ⎪ ⎪⎝⎭--⎛⎫ ⎪=-- ⎪ ⎪--⎝⎭方法三 利用Jordan 标准形 设Cn nA ⨯∈,且C n nn P ⨯∈,使得121s J J P AP J J -⎛⎫ ⎪⎪== ⎪ ⎪⎝⎭ 其中×1(1,2,,)1i iii i i r rJ i s λλλ⎛⎫ ⎪⎪== ⎪⎪⎝⎭由定理1.12得111111001(1)01(1C C ()C ()()1!(1)!()1!()()1!(1)!i i i i i i i r k r k k i k i k ik k k k i i k i k k k k k ik i r r k k k i k k k k k tr r i f J t a J t a t t t r a t t t f f f r λλλλλλλλλλλλλλλλ--+-+∞+∞-==--+∞==--⎛⎫ ⎪⎪== ⎪ ⎪ ⎪⎝⎭⎛⎫' ⎪- ⎪⎪= ⎪⎪'⎪ ⎪⎝⎭'-=∑∑∑)()()()1!()i tt f t f f λλλλλ=⎛⎫ ⎪ ⎪⎪ ⎪⎪' ⎪ ⎪⎝⎭从而1010110011()()()()()k kk kk k k k k k k k k k k k k k k s k s f At a A t a PJP t a J tP a J t P P P a J t f J t P Pf J t +∞+∞-==+∞=+∞--=+∞=-==⎛⎫⎪ ⎪== ⎪⎪ ⎪ ⎪⎝⎭⎛⎫ ⎪= ⎪ ⎪⎝⎭∑∑∑∑∑例3.8 已知101120403A -⎛⎫⎪= ⎪ ⎪-⎝⎭,求e A,sin At .解 例1.9已求得100111210P ⎛⎫ ⎪=-- ⎪ ⎪⎝⎭,11112P AP J -⎛⎫⎪== ⎪ ⎪⎝⎭于是12222e e e 0ee e 3e e e 2e+e e 4e 03e A P P -⎛⎫⎛⎫ ⎪ ⎪==- ⎪⎪ ⎪ ⎪-⎝⎭⎝⎭-- 1sin cos sin sin sin 2sin 2cos 0cos sin 2cos sin 2sin 2cos sin sin 24cos 02cos sin t t t At P t Pt t t t t t t t t t t t t t t t t t t t -⎛⎫⎪= ⎪ ⎪⎝⎭-⎛⎫ ⎪=+---+ ⎪ ⎪-+⎝⎭根据Jordan 标准形理论可得 定理3.8 设Cn nA ⨯∈,1λ,2λ,…,n λ是A 的n 个特征值,则矩阵函数f (A )的特征值为1()f λ,2()f λ,…,()n f λ. 方法四 待定系数法 设Cn nA ⨯∈,且A 的特征多项式为1212()det()()()()(3.5)srr r s I A ψλλλλλλλλ=-=---其中1λ,2λ,…,s λ是A 的全部互异特征值,12s r r r n +++= .为计算矩阵函数()k kk k f At a A t +∞==∑,记0()k k k k f t a t λλ+∞==∑.将f (λt )改写为()(,)()(,)(3.6)f t q t r t λλψλλ=+其中q (λ,t )是含参数t 的λ的幂级数,r (λ,t )是含参数t 且次数不超过n -1的λ的多项式,即1110(,)()()()n n r t b t b t b t λλλ--=+++由Hamilton-Cayley 定理知ψ(A )=O ,于是由式(3.6)得1110()(,)()(,)()()()n n f At q A t A r A t b t Ab t A b t Iψ--=+=+++可见,只要求出()(0,1,,1)k b t k n =- 即可得到f (At ).注意到()()0(0,1,,1;1,2,,)l i i l r i s ψλ==-=将式(3.6)两边对λ求导,并利用上式,得d d ()(,)d d iil ll l f t r t λλλλλλλλ=== 即d d ()(,)(0,1,,1;1,2,,)(3.7)d d iil l li l l t t f r t l r i s μλλλμλμλ====-=由式(3.7)即得到以0()b t ,1()b t ,…,1()n b t -为未知量的线性方程组. 综上分析,用待定系数法求矩阵函数f (At )或f (A )的步骤如下: 第一步:求矩阵A 的特征多项式(3.5);第二步:设1110()n n r b b b λλλ--=+++ .根据()()()()(0,1,,1;1,2,,)i l l l i i tr t f l r i s λλλλ===-=或()()()()(0,1,,1;1,2,,)l l i i i r f l r i s λλ==-=列方程组求解0b ,1b ,…,1n b -;第三步:计算1110()(())()n n f At f A r A b A b A b I --==+++ 或.例3.9 已知101120403A -⎛⎫ ⎪= ⎪ ⎪-⎝⎭,求e At,cos A .解 可求得2det()(1)(2)I A λλλ-=--.设2210()r b b b λλλ=++则由210212210(1)e (1)2e (2)42e tt t r b b b r b b t r b b b ⎧=++=⎪'=+=⎨⎪=++=⎩解得222120e e e 2e 2e 3e e 2e t t t t t t t t b t b t b t ⎧=--⎪=-++⎨⎪=-⎩于是2222210e 2e 0e e e e 2ee e e e 4e 02e e t tAt t t tt t t t t ttt t b A b A b I t t t t t ⎛⎫-⎪=++=-++-- ⎪ ⎪ ⎪-+⎝⎭而由21021210(1)cos1(1)2sin1(2)42cos 2r b b b r b b r b b b =++=⎧⎪'=+=-⎨⎪=++=⎩解得210sin1cos1cos 23sin12cos12cos 22sin1cos 2b b b =-+⎧⎪=-+-⎨⎪=+⎩从而22102sin1cos 20sin1cos 2sin1cos1cos 2cos 2sin1cos1cos 24sin102sin1cos1A b A b A b I +-⎛⎫ ⎪=++=-+--+ ⎪ ⎪-+⎝⎭如果求得矩阵A 的最小多项式,且其次数低于A 的特征多项式的次数,则计算矩阵函数就要容易一些.例3.10 已知311202113A -⎛⎫ ⎪=- ⎪ ⎪--⎝⎭,求e At ,sin A . 解 例1.9已求得A 的Jordan 标准形为2212J ⎛⎫⎪= ⎪ ⎪⎝⎭于是A 的最小多项式为2()(2)A m λλ=-.设10()r b b λλ=+由21021(2)2e (2)e t tr b b r b t ⎧=+=⎪⎨'==⎪⎩ 解得2120e (12)et t b t b t ⎧=⎪⎨=-⎪⎩ 于是2101e e 21221At t tt t b A b I t tt t t t +-⎛⎫ ⎪=+=-- ⎪ ⎪--+⎝⎭又由101(2)2sin 2(2)cos 2r b b r b =+=⎧⎨'==⎩ 解得10cos 2sin 22cos 2b b =⎧⎨=-⎩从而10sin 2cos 2cos 2cos 2sin 2cos 2sin 22cos 22cos 2cos 2cos 2sin 2cos 2A b A b I +-⎛⎫ ⎪=+=-- ⎪ ⎪--+⎝⎭三、常用矩阵函数的性质常用的矩阵函数有e A,sin A ,cos A ,它们有些性质与普通的指数函数和三角函数相同,但由于矩阵乘法不满足交换律,从而有些性质与一般指数函数和三角函数不相同. 定理3.9 对任意Cn nA ⨯∈,总有(1)sin(-A )=-sin A ,cos(-A )=cos A ; (2)i e cos isin AA A =+,i -i 1cos (e e )2A A A =+,i -i 1sin (e e )2iA A A =-. 证 (1)由sin A 与cos A 的矩阵幂级数形式直接得到;(2)i 221000i (1)(1)e i !(2)!(21)!cos isin k k k Ak k k k k k A A A k k k A A+∞+∞+∞+===--==++=+∑∑∑又有-i e cos()isin()cos isin A A A A A =-+-=- 从而i -i 1cos (e e )2A A A =+,i -i 1sin (e e )2iA A A =- 定理3.10 设A ,C n nB ⨯∈,且AB =BA ,则(1)ee e e e A BA B B A +==;(2)sin(A +B )=sin A cos B +cos A sin B ;(3)cos(A +B )=cos A cos B -sin A sin B .证 (1)0022011e e !!1()(2)2!1()e !A Bk k k k k A B k A B k k I A B A AB B A B k +∞+∞==+∞+=⎛⎫⎛⎫= ⎪⎪⎝⎭⎝⎭=++++++=+=∑∑∑(2)i()-i()i i -i -i i -i i -i i -i i -i 11sin()(e e )(e e e e )2i 2i 1111(e e )(e e )(e e )(e e )2i 222i sin cos cos sin A B A B A B A B A A B B A A B B A B A B A B+++=-=-=-+++-=+ 同理可证(3). 证毕在定理3.10中,取A =B ,即得 推论 对任意Cn nA ⨯∈,有22cos 2cos sin A A A =-,sin2A =2sin A cos A 值得注意的是,当AB ≠BA 时,ee e A BA B +=或e e e A B B A +=不成立.如取0010A ⎛⎫= ⎪⎝⎭,0100B ⎛⎫= ⎪⎝⎭,则0110A B ⎛⎫+= ⎪⎝⎭,00100100AB BA ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭且10e 11A⎛⎫= ⎪⎝⎭,11e 01B ⎛⎫= ⎪⎝⎭,-1-1-1-1e+e e e 1e 2e e e+e A B+⎛⎫= ⎪⎝⎭-- 可见1121e e e e 1211A BB A ⎛⎫⎛⎫=≠= ⎪ ⎪⎝⎭⎝⎭e e e A B A B +≠,e e e A B B A +≠定理3.11 设Cn nA ⨯∈,则有(1)tr dete eA A=;(2)1(e )e A A --=.证 (1)设A 的特征值为1λ,2λ,…,n λ.则由定理3.8知,e A的特征值为1e λ,2e λ,…,e n λ,从而1212tr dete =e e e e e n n A A λλλλλλ++==…+…(2)由于tr dete =e0AA≠,所以e A 总是可逆的.又由定理3.10,得e e e e A A A A OI--===故1(e )e A A --=. 证毕需要指出的是,对任何n 阶方阵A ,e A总是可逆的,但sin A 与cos A 却不一定可逆.如取π00π/2A ⎛⎫=⎪⎝⎭,则00sin 01A ⎛⎫= ⎪⎝⎭,10cos 00A -⎛⎫= ⎪⎝⎭.可见sin A 与cos A 都不可逆.§3.4 矩阵的微分和积分在研究微分方程组时,为了简化对问题的表述及求解过程,需要考虑以函数为元素的矩阵的微分和积分.在研究优化等问题时,则要碰到数量函数对向量变量或矩阵变量的导数,以及向量值或矩阵值函数对向量变量或矩阵变量的导数.本节简单地介绍这些内容. 一、函数矩阵的微分和积分定义 3.6 以变量t 的函数为元素的矩阵()(())i j m n A t a t ⨯=称为函数矩阵,其中()(1,2,,;1,2,,)ij a t i m j n == 都是变量t 的函数.若t ∈[a ,b ],则称A (t )是定义在[a ,b )上的;又若每个()ij a t 在[a ,b ]上连续、可微、可积,则称A (t )在[a ,b ]上是连续、可微、可积的.当A (t )可微时,规定其导数为()(())ijm n A t a t ⨯''=或d d ()()d d ij m nA t a t t t ⨯⎛⎫= ⎪⎝⎭而当A (t )在[a ,b ]上可积时,规定A (t )在[a ,b ]上的积分为()()d ()d bb ijaam nA t t a t t ⨯=⎰⎰例3.11 求函数矩阵23sin cos ()2e 01t t t t t A t t t ⎛⎫⎪= ⎪ ⎪⎝⎭的导数. 解2cos sin 1d ()2ln 2e 2d 003t t t t A t t t t -⎛⎫⎪= ⎪ ⎪⎝⎭关于函数矩阵,有下面的求导法则.定理3.12 设A (t )与B (t )是适当阶的可微矩阵,则(1)d d d(()())()()d d d A t B t A t B t t t t+=+ (2)当λ(t )为可微函数时,有d d d (()())()()()()d d d t A t t A t t A t t t t λλλ⎛⎫=+ ⎪⎝⎭(3)d d d (()())()()()()d d d A t B t A t B t A t B t t t t ⎛⎫=+ ⎪⎝⎭; (4)当u =f (t )关于t 可微时,有d d()()()d d A u f t A u t u'= (5)当1()A t -是可微矩阵时,有111d d (())()()()d d A t A t A t A t t t ---⎛⎫=- ⎪⎝⎭证 只证(2)和(5).设()(())ij m n A t a t ⨯=,()(())ij n p B t b t ⨯=,则111d d (()())(()())d d d d ()()()()d d d d ()()()()d d nik kj m n k n nik kj ik kj k k m nA tB t a t b t t t a t b t a t b t t t A t B t A t B t t t ⨯===⨯=⎛⎫⎛⎫=+ ⎪ ⎪⎝⎭⎝⎭⎛⎫=+ ⎪⎝⎭∑∑∑由于1()()A t A t I-=,两边对t 求导,得11d d ()()()()d d A t A t A t A t O t t --⎛⎫+= ⎪⎝⎭从而111d d ()()()()d d A t A t A t A t t t ---⎛⎫=- ⎪⎝⎭证毕 定理3.13 设C n nA ⨯∈,则有(1)d e e e d AtAt At A A t ==; (2)dsin cos (cos )d At A At At A t ==;(3)dcos sin (sin )d At A At At A t=-=-.证 这里只证(1).(2)和(3)的证明与(1)类似.由0e !k Atkk t A k +∞==∑,并利用绝对收敛级数可以逐项求导,得101111d d e d d !(1)!e (1)!k k At k k k k k k Atk t t A A t t k k tA A A k -+∞+∞==-+∞-===-==-∑∑∑同样11111d e ==e d (1)!(1)!k k At k k At k k t t A A A A t k k --+∞+∞-==⎛⎫= ⎪--⎝⎭∑∑ 证毕根据定义和积分的有关性质,可得定理3.14 设A (t ),B (t )是区间[a ,b ]上适当阶的可积矩阵,A ,B 是适当阶的常数矩阵,λ∈C ,则 (1)(()())d ()d ()d bb baaaA tB t t A t t B t t +=+⎰⎰⎰;(2)()d ()d bba aA t t A t t λλ=⎰⎰;(3)()()d ()d bbaaA tB t A t t B =⎰⎰,()d ()d b baaAB t t A B t t =⎰⎰;(4)当A (t )在[a ,b ]上连续时,对任意t ∈(a ,b ),有()d ()d ()d t aA A t tττ=⎰(5)当A (t )在[a ,b]上连续可微时,有()d ()()baA t t A b A a '=-⎰以上介绍了函数矩阵的微积分概念及一些运算法则.由于d()d A t t仍是函数矩阵,如果它仍是可导矩阵,即可定义其二阶导数.不难给出函数矩阵的高阶导数11d d d ()()d d d k k k k A t A t t t t --⎛⎫= ⎪⎝⎭二、数量函数对矩阵变量的导数定义 3.7 设f (X )是以矩阵()ij m n X x ⨯=为自变量的mn 元函数,且(1,2,,;1,2,,)ijfi m j n x ∂==∂ 都存在,规定f 对矩阵变量X 的导数d d f X 为 1111d d ij m nm mn ff x x n f fX x ff x x ⨯∂∂⎛⎫ ⎪∂∂ ⎪⎛⎫∂ ⎪== ⎪ ⎪ ⎪∂⎝⎭∂∂ ⎪ ⎪∂∂ ⎪⎝⎭特别地,以T12(,,,)n x ξξξ= 为自变量的函数f (x )的导数T12d (,,,)d nf f f f x ξξξ∂∂∂=∂∂∂ 称为数量函数对向量变量的导数,即为在数学分析中学过的函数f 的梯度向量,记为grad f .例 3.12 设T 12(,,,)n a a a a = 是给定的向量,T 12(,,,)n x ξξξ= 是向量变量,且T T ()f x a x x a ==求d d f x. 解 因为1()nk kk f x a ξ==∑而(1,2,,)j jfa j n ξ∂==∂ 所以 TT 1212d (,,,)(,,,)d n nf f f f a a a a x ξξξ∂∂∂===∂∂∂ 例3.13 设()ij m n A a ⨯=是给定的矩阵,()ij n m X x ⨯=是矩阵变量,且()tr()f x Ax =求d d fX. 解 因为1()nikkj m m k AX ax ⨯==∑.所以11()tr()m nsk ks s k f X AX a x ====∑∑而(1,2,,;1,2,,)ijfi n j m x ∂==∂ 故T d ()d ji n m ij n mf f a A X x ⨯⨯⎛⎫∂=== ⎪ ⎪∂⎝⎭ 例 3.14 设()ij n n A a ⨯=是给定的矩阵,T 12(,,,)n x ξξξ= 是向量变量,且T ()f x x Ax =求d d f x. 解 因为T1111()()n nn ns sk ks sk k s k s k f x x Ax aa ξξξξ=======∑∑∑∑而1111,11,111()nj j j j jk k j jj j j j n nj k j n nsj s jk ks k fa a a a a a a a ξξξξξξξξξ--++===∂=+++++++∂=+∑∑∑所以1111111T T d d ()n ns s k k s k n nsn s nk k s k n f a a f x f a a A x Ax A A xξξξξξξ====∂⎛⎫⎛⎫+ ⎪ ⎪∂⎪ ⎪ ⎪== ⎪ ⎪ ⎪∂ ⎪ ⎪+ ⎪⎪∂⎝⎭⎝⎭=+=+∑∑∑∑ 特别地,当A 是对称矩阵时,有d 2d fAx x=例3.15 设()ij n n X x ⨯=是矩阵变量,且det X ≠0.证明1T ddet (det )()d X X X X-= 证 设ij x 的代数余子式为ij X .把det X 按等i 行展开,得1det nikik k X xX ==∑于是det ij ijX X x ∂=∂故 T1T 1Tddet det ()(adj )d ((det ))(det )()ij n n ij n nX X X X X x X X X X ⨯⨯--⎛⎫∂=== ⎪ ⎪∂⎝⎭== 三、矩阵值函数对矩阵变量的导数定义3.8 设矩阵()(())ij s t F X f X ⨯=的元素()(1,2,,;1,2,,)ij f X i s j t == 都是矩阵变量()ij m n X x ⨯=的函数,则称F (X )为矩阵值函数,规定F (X )对矩阵变量X 的导数d d FX为111d d 1FF x x n F X FF x x m mn ∂∂⎛⎫ ⎪∂∂ ⎪⎪= ⎪∂∂ ⎪ ⎪∂∂ ⎪⎝⎭ ,其中1111tij s stf f x x ij ij F x f f x x ij ij ∂∂⎛⎫ ⎪∂∂ ⎪∂⎪=⎪∂ ⎪∂∂ ⎪∂∂ ⎪⎝⎭即其结果为(ms )×(nt )矩阵. 作为特殊情形,这一定义包括了向量值函数对于向量变量的导数,向量值函数对于矩阵变量的导数,矩阵值函数对于向量变量的导数等.例3.16 设T12(,,,)n x ξξξ= 是向量变量,求T T d d d d x xx x=. 解 由定义,得T 1TT 2T 100010d d 001n nx x x I x x ξξξ⎛⎫∂ ⎪∂ ⎪⎛⎫ ⎪∂ ⎪⎪ ⎪===∂ ⎪ ⎪⎪ ⎪⎪⎝⎭ ⎪∂ ⎪∂⎝⎭同理可得T 12d ,,,d n n x x x x I x ξξξ⎛⎫∂∂∂== ⎪∂∂∂⎝⎭例3.17 设T1234(,,,)a a a a a =是给定向量,24()ij X x ⨯=是矩阵变量,求Td()d Xa X,d()d Xa X. 解 因为41121k k k n k k k x a Xa x a ==⎛⎫⎪ ⎪= ⎪ ⎪⎝⎭∑∑,44T 1211()(,)k k k k k k Xa x a x a ===∑∑ 所以T T TT T 13141112T T T T 2122232431243124()()()()d()d ()()()()00000000Xa Xa Xa Xa x x x x Xa XXa Xa Xa Xa xx x x a aa a a a a a ⎛⎫∂∂∂∂⎪∂∂∂∂ ⎪=⎪∂∂∂∂ ⎪ ⎪∂∂∂∂⎝⎭⎛⎫= ⎪⎝⎭而131411122122232412341234()()()()d()()()()()d 00000000Xa Xa Xa Xa x x x x Xa Xa Xa Xa Xa Xxx x x a a a a a a a a ∂∂∂∂⎛⎫⎪∂∂∂∂ ⎪=⎪∂∂∂∂ ⎪∂∂∂∂⎝⎭⎛⎫⎪ ⎪=⎪⎪⎝⎭§3.5 矩阵分析应用举例本节介绍矩阵函数及矩阵微积分的一些应用. 一、求解一阶线性常系数微分方程组在数学或工程技术中,经常要研究一阶常系数微分方程组1111122112211222221122d ()()()()()d d ()()()()()d d ()()()()()d n n n n n n n nn n n x t a x t a x t a x t f t t x t a x t a x t a x t f t t x t a x t a x t a x t f t t ⎧=++++⎪⎪⎪=++++⎨⎪⎪=++++⎪⎩满足初始条件0()(1,2,,)i ix t c i n ==的解.如果记T12(),(,,,)ij n n n A a c c c c ⨯==T 12()((),(),,())n x t x t x t x t = ,T 12()((),(),,())n f t f t f t f t =则上述微分方程组可写为0d ()()()(3.8)d ()x t Ax t f t tx t c⎧=+⎪⎨⎪=⎩因为d d ()(e ())e ()()e d d d ()e ()e ()d At At At At At x t x t A x t t t x t Ax t f t t -----=-+⎛⎫=-= ⎪⎝⎭将上式两边在[0t ,t ]上积分,得00d (e ())d e ()d d tt A A t t x f τττττττ--=⎰⎰ 即00e()e()e ()d tAt A A t x t x t f ττττ----=⎰于是微分方程组的解为00()()e e e ()d tA t t At A t x t c f τττ--+⎰=例3.18 求解微分方程组初值问题113212313123d ()()()1d d ()()2()1d d ()4()3()2d (0)1,(0)0,(0)1x t x t x t t x t x t x t tx t x t x t t x x x ⎧=-++⎪⎪⎪=+-⎪⎨⎪=-++⎪⎪⎪===⎩ 解 记123()10111120,0,()(),()140312()x t A c x t x t f t x t -⎛⎫⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪====- ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎝⎭则微分方程组可以写成式(3.8)的矩阵形式.例3.9已求得222e 2e 0e e e e 2e e e e e 4e 02e e t t tAt t t tt t t t t t t t t t t t t ⎛⎫-⎪=-++-- ⎪ ⎪-+⎝⎭依次计算下列各量e e e e e 2e t t At t t t t c t t ⎛⎫- ⎪= ⎪ ⎪-⎝⎭,00e 1e e ()d e 1e 2e 22e t t t A t tf d τττττττ-------⎛⎫⎛⎫- ⎪ ⎪=-=-+ ⎪⎪ ⎪ ⎪-⎝⎭⎝⎭⎰⎰, 0e 1e e ()d e 12e 2t t At A t tf τττ-⎛⎫- ⎪=-+ ⎪ ⎪-⎝⎭⎰故微分方程组的解为123e e e 1(2)e 1()()()e e 1(1)e 1()e 2e 2e 2(32)e 2t t t tt t t t t t t t t x t x t x t t t x t t ⎛⎫⎛⎫⎛⎫----⎛⎫⎪ ⎪ ⎪ ⎪==+-+=-+ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪----⎝⎭⎝⎭⎝⎭⎝⎭二、求解矩阵方程在控制论与系统理论中,要遇到形如AX +XB =F 的矩阵方程求解问题,这个矩阵方程也称为Lyapunov 方程.关于这个矩阵方程的解有如下结果. 定理3.15 给定矩阵方程 AX +XB =F (3.9) 其中Cm mA ⨯∈,Cn nB ⨯∈,Cm nF ⨯∈.如果A 和B 的所有特征值具有负实部(这种矩阵称为稳定矩阵),则该矩阵方程有惟一解e e d At Bt X F t +∞=-⎰证 记()e e At Bt Y t F =.则有Y (0)=F ,且d ()e e e e ()()(3.10)d At Bt At Bt Y t A F F B AY t Y t B t=+=+设12,,,m λλλ 是A 的m 个特征值,12,,,n μμμ 是B 的n 个特征值.根据利用Jordan 标准形求矩阵函数的方法(见§3.3)知,e At的元素是形如e (0)j tr t r λ≥的项的线性组合.因为A 的所有特征值j λ的实部是负的,所以lim eAtt O →+∞=.同理lim e Bt t O →+∞=.于是lim ()lim e e At Bt t t Y t F O →+∞→+∞==又由于e e At BtF 的元素是形如()e (0)i j tr t r λμ+≥的项的线性组合,且积分()0ed i j tr t t λμ+∞+⎰都存在,故积分e e d At Bt F t +∞⎰存在.对式(3.10)两边从0到+∞积分,得()()0()(0)()d ()d Y Y AY t t Y t t B +∞+∞+∞-=+⎰⎰即()()0()d ()d A Y t t Y t t B F+∞+∞-+-=⎰⎰这说明0e e d At Bt X F t +∞=-⎰是矩阵方程(3.9)的解.惟一性的证明见第七章. 证毕 推论1 设Cm mA ⨯∈,Cn nB ⨯∈,Cm nF ⨯∈,则矩阵微分方程d ()()()d (0)X t AX t X t B tX F⎧=+⎪⎨⎪=⎩的解为()e e At BtX t F =推论2 设A ,C n nF ⨯∈,且A 的所有特征值具有负实部,则矩阵方程HA X XA F+=-的惟一解为H 0ee d (3.11)A tAt X F t+∞=⎰如果F 是Hermite 正定矩阵,则解矩阵X 也是Hermite 正定矩阵.证 只需证明后一结论.当F 是Hermite 正定矩阵时,由式(3.11)可知X 是Hermite 矩阵.又对0Cnx ≠∈,由于eAt总是可逆的,所以e 0Atx ≠,于是HH H e e (e )(e )0A t At At At x F x x F x =>.从而HH 0(e )(e )d 0At At x Xx x F x t +∞=>⎰故X 是Hermite 正定矩阵. 证毕三、最小二乘问题 设Cm nA ⨯∈,C n b ∈.当线性方程组Ax =b 无解时,则对任意C nx ∈都有Ax -b ≠0.此时希望找出这样的向量0C n x ∈,它使2Ax b -达到最小,即022Clim (3.12)nx Ax b Ax b ∈-=-称这个问题为最小二乘问题,称0x 为矛盾方程组Ax =b 的最小二乘解.以下结论给出了当A ,b 分别是实矩阵和实向量时,Ax =b 的最小二乘解所满足的代数方程.定理3.16 设R m nA ⨯∈,R mb ∈,0R n x ∈.若0R n x ∈是Ax =b 的最小二乘解,则0x 是方程组TT(3.13)A Ax A b=的解.称式(3.13)为Ax =b 的法方程组.证 由于2T 2TTTTTT()()()f x Ax b Ax b Ax b x A Ax x A b b Ax b b=-=--=--+若0x 为Ax =b 的最小二乘解,则它应是f (x )的极小值点,从而d 0(3.14)d x f x=根据例3.12和例3.14,得T T d 22d fA Ax A b x=- 由式(3.14)即知T T00A Ax A b -=,故0x 是式(3.13)的解. 证毕 对于含约束条件的最小二乘问题,有如下的结果. 例3.19 设Rm nA ⨯∈,R m b ∈,Rk nB ⨯∈,R kd ∈,且Bx =d 有解.试求约束极小。
矩阵论矩阵分解精品
【关键字】方法、条件、问题、矛盾、有效、继续、充分、保持、提出、研究、位置、需要、需求、作用、标准、反映、检验、分析、逐步、推广、满足、保证、解决、优化、方向、转变、规范、不改变、规范化第四章 矩阵分解把矩阵分解为形式比较简单或具有某种特性的一些矩阵的乘积,在矩阵理论的研究与应用中,都是十分重要的.因为这些分解式的特殊形式一方面能明显地反映出原矩阵的某些数值特征,如矩阵的秩、行列式、特征值及奇异值等,另一方面分解的方法与过程往往提供了某些有效的数值计算方法和理论分析根据.本章将介绍几种常用的矩阵分解形式.§4.1 矩阵的三角分解三角矩阵的计算,如求行列式、求逆矩阵、求解线性方程组等,都是很方便的,因此首先研究是否可将矩阵分解成一些三角矩阵的乘积. 一、三角分解及其存在惟一性问题定义4.1 设C n n A ⨯∈,如果存在下三角矩阵C n n L ⨯∈和上三角矩阵C n n R ⨯∈,使得A =LR则称A 可以作三角分解.关于三角分解的存在性有如下一些结论.定理4.1 设C n nn A ⨯∈,则A 可以作三角分解的充分必要条件是0k ∆≠(k =1,2,…,n -1),其中det k k A ∆=为A 的k 阶顺序主子式,而k A 为A 的k 阶顺序主子阵。
证 必要性.已知A 可以作三角分解,即A =LR ,其中L =()()0ijijn nl li j ⨯=,<,()()0ij ijn nR r ri j ⨯==,>.将A ,L 和R 进行分块,得这里k A ,k L 和k R 分别是A ,L 和R 的k 阶顺序主子阵,且k L 和k R 分别是上三角矩阵和下三角矩阵.由矩阵的分块乘法运算,得 由于 所以=11110(1,2,,1)kk kk l l r r k n =-≠充分性.对阶数n 用归纳法证明.当n =1时,()()()111111A a a ==,结论成立.设对n =k 结论成立,即k k k A L R =,其中k L 和k R 分别是上三角矩阵和下三角矩阵,且由det det det 0k k k k A L R ∆==≠知,k L 与k R 均可逆.则当n =k +1时,有其中()T 111,,,,k k k k c a a ++=,()T 111,,,,k k k k r a a ++=.故由归纳假设知A 可以作三角分解. 证毕这个定理说明,并不是每个可逆矩阵都可以作三角分解.如矩阵0110A ⎛⎫= ⎪⎝⎭就不能作三解分解.定理4.2 设C n nr A ⨯∈,且A 的前r 个顺序主子式不为零,即0k ∆≠(k =1,2,…,r ),见A 可以作三角分解.证 由定理4.1知,r A 可以作三角分解,即r r r A L R =,且r L 和r R 分别是可逆的上三角矩阵和下三角矩阵.将矩阵A 分块为由于rank r A =rank A =r ,所以A 的后n -r 行可由前r 行线性表示,即存在矩阵()C n r rB -⨯∈,使得21r A BA =,2212A BA =,从而 即得到A 的一种三角分解.证毕该定理的条件仅是充分的.如矩阵0012A ⎛⎫= ⎪⎝⎭的秩为1,不满足定理的条件,但等,都是A 的三角分解.需要指出的是,即使一个方阵的三角分解存在,它也不是惟一的.这是因为如果A =LR 是A 的一个三角分解,令D 是对角元素都不为零的对角矩阵,则A =(LD )()1D R LR -=,其中L LD =,1R D R -=也分别是下三角矩阵和上三角矩阵,即又得到了A 的另一个三角分解.为讨论惟一性问题,需规范化三角分解.定义4.2 设C n n A ⨯∈.如果A 可分解成A =LR ,其中L 是对角元素为1的下三角矩阵(称为单位下三角矩阵),R 是上三角矩阵,则称之为A 的Doolittle 分解;如果A 可分解为A =LR ,其中L 是下三角矩阵,R 是对角元素为1的上三角矩阵(称为单位上三角矩阵),则称之为A 的Crout 分解;如果A 可分解为A =LDR ,其中L 是单位下三角矩阵,D 是对角矩阵,R 是单位上三角矩阵,则称之为A 的LDR 分解.定理4.3 设C n nn A ⨯∈,则A 有惟一LDR 分解的充分必要条件是k ∆≠0(k =1,2,…,n -1).此时对角矩阵D =diag(1d ,2d ,…,n d )的元素满足证 由定理4.1,A 可作三角分解A =LR 的充分必要条件是k ∆≠0(k =1,2,…,n -1).记()1122diag ,,,L nn D l l l =,()1122diag ,,,R nn D r r r =由L 和R 可逆知L D 与R D 也可逆,从而这是A 的LDR 分解.再证惟一性.设A 有两个LDR 分解 于是上式左边是单位下三角矩阵,右边是上三角矩阵,所以都应该是单位矩阵,即有 从而又由1RR -是单位上三角矩阵知11,RR I D D I --==,故 故A 的LDR 分解是惟一的. 将A ,L ,D ,R 进行分块,得其中k A ,k L ,k D ,k R 分别是A ,L ,D ,R 的k 阶顺序主子阵.则有k k k k A L D R = (k =1,2,…,n )根据 得1111,kkk k d d -∆=∆=∆ (k =2,3,…,n ) 证毕推论 设C n nn A ⨯∈.则A 有惟一Doolittle 分解或Crout 分解的充分必要条件是k ∆≠0(k =1,2,…,n -1).上述定理4.3的结论可以适当放宽,即当C n n A ⨯∈(不要求A 可逆)时,A 有惟一LDR 分解的充分必要条件是k ∆≠0(k =1,2,…,n -1).证明略去. 二、三角分解的紧凑计算格式现在阐述直接计算三角分解的方法,以下总假设C n nn A ⨯∈,且A 可以作三角分解,即A 的所有顺序主子式不为零.由A 的Doolittle 分解A =LR ,得 于是由上式可导出求A 的Doolittle 分解的紧凑计算格式为 具体计算时,可按下图所示一框一框地逐步进行.对同一框中的元素,kk r 必须在计算ik l 之前先算出,其余元素的计算先后没有影响.由算法公式可知,在计算出ij r 或ij l 后,ij a 就不再使用了,因此算出的ij r 或ij l 就可以放在A 的相应元素的位置上.图4.1与上面的推导类似,可以得到Crout 分解的紧凑计算格式:例4.1 求矩阵A =213121243-⎛⎫ ⎪⎪ ⎪⎝⎭的Doolittle 分解和Crout 分解.解 由Doolittle 分解的紧凑计算格式得11112r a ==,12121r a ==-,13133r a ==21211112a l r ==,3131111a l r == 故A 的Doolittle 分解为而由Crout 分解的紧凑计算格式得考虑Hermite 正定矩阵的三角分解,有如下的结果.定理4.4 设C n n A ⨯∈是Hermite 正定矩阵,则存在下三角矩阵C n n G ⨯∈,使得 称之为A 的Cholesky 分解.证 由定理1.27知k ∆>0(k =1,2,…,n ),故A 有惟一的LDR 分解A =LDR根据H A A =和LDR 分解的惟一性得HR L =,即又由定理4.3知,对角矩阵D=diag(1d ,2d ,…,n d )的对角元素i d >0(i =1,2,…,n ),于是A =LH L 令G =L则G 是下三角矩阵,且H A GG =.证毕设()ijn nA a ⨯=,()()0ijijn nG g gi j ⨯==,<,则由H A GG =(只比较下三角部分的元素)得从而得到求Hermite 正定矩阵A 的Cholesky 分解的紧凑计算格式:例4.2 已知矩阵A =520231011-⎛⎫ ⎪-- ⎪ ⎪-⎝⎭,求A 的Cholesky 分解.解 容易验证A 是实对称正定矩阵.由Cholesky 分解的紧凑计算格式得故A 的Cholesky 分解为如果线性方程组Ax =b 的系数矩阵C n nn A ⨯∈,且k ∆≠0(k =1,2,…,n -1),则A 可作三角分解A =LR .于是便得与Ax =b 同解的、具有以三角矩阵为系数矩阵的两个线性方程组Ly =b , Rx =y由第一个方程组递推求得y ,再代入第二个方程组通过回代解出x . 例4.3 求解线性方程组Ax =b ,其中 解 例4.1已求得 由Ly =b 递推求得而由Rx =y 通过回代求得§4.2 矩阵的QR 分解矩阵的QR 分解在解决最小二乘问题、特征值计算等方面,都是十分重要的.本节首先介绍Householder 矩阵和Givens 矩阵,这也是在求矩阵的QR 分解时用到的主要工具. 一、Householder 矩阵与Givens 矩阵定义4.3 设n u C ∈是单位向量,即H1u u =,称为Householder 矩阵或初等反射矩阵.由Householder 矩阵H 确定的n C 上的线性变换y =Hx 称为Householder 变换或初等反射变换. Householder 矩阵具有下列性质.定理4.5 设C n n H ⨯∈是Householder 矩阵,则 (1)H H H =(Hermite 矩阵); (2)H H H I =(酉矩阵); (3)2H I =(对合矩阵); (4)1H H -=(自逆矩阵); (5)r I O O H ⎛⎫⎪⎝⎭是n +r 阶Householder 矩阵; (6)det H =-1.证 只证(5)和(6).由于H 是Householder 矩阵,所以存在C n u ∈,且H 1u u =,使得H 2H I uu =-.从而其中0u u ⎛⎫= ⎪⎝⎭,由于故r I O O H ⎛⎫⎪⎝⎭是n +r 阶Householder 矩阵. 因为取行列式即得证毕Householde 矩阵的应用主要基于下述结果.定理4.6 设C n z ∈是单位向量,则对任意C n x ∈,存在Householder 矩阵H ,使得Hx =αz ,其中2x α=,且H x z α为实数. 证 当x =0时,任取单位向量u ,则当x =αz ≠0时,取单位向量u 满足H 0u x =,则有 当x ≠αz 时,取2x zu x z αα-=- (4.1)则有()()()()()()H22HH22x z x z Hx I x x z x z xx x z x z x z ααααααα⎛⎫-- ⎪=- ⎪-⎝⎭-=---- (4.2)由于代入式(4.2)得证毕推论1 对任意C n x ∈,存在Householder 矩阵H2H I uu =-,使得1Hx e α=,其中2x α=,且H 1x e α为实数.推论2 对任意R nx ∈,存在Householder 矩阵T 2H I uu =- (R n u ∈且T1u u =) 使得1Hx e α=,其中2x α=±.以上两推论的结果称为用Householder 变换化向量x 与1e 共线(或同方向).例4.4 用Householder 变换化下列向量与1e 共线: (1)()T1,2,2x =;(2)()T2i,i,2x =- 解 (1)取23xα==,计算于是T122122123221H I uu ⎛⎫⎪=-=- ⎪ ⎪-⎝⎭,使得13Hx e =.(2)由于23x =,为使23x α==且H12i x e αα=为实数,可取α=3i ,于是使13i Hx e =.读者可分别取α=-3和α=-3i 计算之.以下在3R 中说明将Householder 矩阵称为初等反射矩阵的原因.考虑法向量为单位向量u 且过原点O 的平面π(见图4.2).任取向量3R x ∈,将x 分解为x =v +w (v ∈π, w ⊥π)图4.2从而 故可见向量x 经过Householder 变换后,变成了以u 为法向量的平面π的对称向量x ,也即关于平面π的反射向量x .在平面解析几何中,任一向量x 依顺时针方向旋转角度θ后变为向量y (见图4.3),则显然x 与y 有相等的长度,且在给定的直角坐标系下,如果x 的坐标为(1ξ,2ξ),y 的坐标为(1η,2η),则它们满足称T 为平面旋转矩阵.显然它是正交矩阵,且det T =1.推广到C n 上,有图4.3 定义4.4 设c ,s C n ∈,且满足221c s +=,称n 阶方阵(4.3)为Givens 矩阵或初等旋转矩阵.由Givens 矩阵pq T 确定的C n上的线性变换pq y T x =称为Givens 变换或初等旋转变换.容易验证,当221c s +=时,存在实数α,β,θ,使得i cos c e αθ-=,i sin s e βθ-=.特别地,当c ,s 为实数且221c s +=时,存在实数θ,使得c =cos θ,s =sin θ,此时pq T 可以解释为R n 上由p e 和q e 构成的平面旋转矩阵.由定义可直接得到Givens 矩阵的有关性质:Givens 矩阵pq T 是酉矩阵,且det 1pq T =. Givens 矩阵的应用主要基于下述定理和推论. 定理4.7 对任意义()T12,,,C n n x ξξξ=∈,存在Givens 矩阵pq T ,使得pq T x 的等q个分量为零,第p 个分量为非负实数,其余分量不变.证 设()T12,,,n pq T x ηηη=,其中pq T 如式(4.3),则有当220p q ξξ+=时,取c =1,s =0.则pq T I =,此时0p q ηη==,(),k k k p q ηξ=≠,结论成立.当220p q ξξ+≠时,取c ξ=s ξ=(4.4)则推论 设()T12,,,n n x C ξξξ=∈.则存在Givens 矩阵12T ,13T ,…,1n T ,使得称之为用Givens 变换化向量x 与1e 同方向. 证 由定理4.7,存在Givens 矩阵12T ,使得 对12T x ,又存在Givens 矩阵13T ,使得 如此继续下去,最后得T211312121,0,,0nnk k T T T x x e ξ=⎛⎫==⎪ ⎪⎝⎭∑ 证毕 例4.5 用Givens 变换化下列向量与1e 同方向: (1)()T1,2,2x =;(2)()T2i,i,2x =-. 解(1)取1c =,1s = 使得1202T x =⎪ ⎪⎝⎭.又取2c =,223s =则使得131213030T T x e ⎛⎫ ⎪== ⎪ ⎪⎝⎭.(2)取1c =,1s =使得1202T x = ⎪ ⎪⎝⎭.又取23c =,223s =,则使得131213030T T x e ⎛⎫ ⎪== ⎪ ⎪⎝⎭.二、矩阵的QR 分解定义4.5 设C n n A ⨯∈.如果存在n 阶酉矩阵Q 和n 阶上三角矩阵R ,使得A =QR (4.5)则称之为A 的QR 分解或酉-三角分解.当R n n A ⨯∈时,称式(4.5)为A 的正交-三角分解. 定理4.8 任意C n n A ⨯∈都可以作QR 分解. 证法1 将矩阵A 按列分块为()12,,,n A a a a =,由定理4.6知,存在n 阶Householder 矩阵1H ,使得1111H a a e =,于是 其中()()111C n n n B -⨯--∈.再将1n B -按列分块为()12,,n n B b b -=,则存在n -1阶Householder矩阵2H ,使得2212H b e α=,这里()T111,0,,0C n e -=∈.记则2H 是n 阶Houscholder 矩阵,且有 其中()()222C n n n C -⨯--∈.继续这一步骤,在第n -1步得其中()1,2,,1k H k n =-都是n 阶Houscholder 矩阵.注意到k H 均是自逆矩阵,则有这里121n Q H H H -=是酉矩阵,R 是上三角矩阵.法2 将矩阵A 按列分块A =()12,,,n a a a ,由定理4.7的推论知,存在n 阶Givens矩阵12T ,…,1n T ,使得于是对于其第2列,又存在n 阶Givens 矩阵23T ,…,2n T ,使得 从而其中2C n k c -∈ (k =3,…,n ).如此进行下去,最后得于是 其中HH HH H 1212321,n n n n Q T T T T T -=是酉矩阵,R 是上三角矩阵.证毕该定理的证明过程给出了用Householder 变换和Givens 变换求矩阵QR 分解的方法. 当A 是可逆矩阵时,有如下的结论.定理4.9 设C n nn A ⨯∈.则A 可惟一地分解为A =QR其中Q 是n 阶酉矩阵,C n nn R ⨯∈是具有正对角元的上三角矩阵. 证 将矩阵A 按列分块为()12,,,n A a a a =.由于A 可逆,所以1a ,2a ,…,n a 线性无关.用Schmidt 正交化方法将其正交化:其中,,i j ij j ja p p p λ⎡⎤⎣⎦=.再将kp (k =1,2,…,n )单位化得则有 故其中()12,,,n Q q q q =是酉矩阵,R 是具有正对角元的上三角矩阵.再证惟一性.设A 有两个QR 分解其中Q ,1Q 是酉矩阵,R ,1R 是具有正对角元的上三角矩阵.于是 式中11D R R -=仍是具有正对角元的上三角矩阵.由于()()HH H 11I Q Q Q D Q D D D === (4.6)即D 还是酉矩阵,所以D 是单位矩阵(请读者证明之),故11Q Q D Q ==,1R DR R ==即这种QR 分解是惟一的.证毕在定理4.9中,如果不要求上三角矩阵R 具有正对角元,则矩阵A 的不同QR 分解仅在于酉矩阵Q 的列和上三角矩阵R 的对应行相差模为1的因子.这是因为11D R R -=只保证是可逆的上三角矩阵,又由式(4.6)知D 是酉矩阵,从而D 是对角元素的模为1的对角矩阵.于是11Q QD -=,1R DR = 可见1Q 与Q 的列,且1R 与R 的对应行相差模为1的因子.定理4.9的推证过程,给出了用Schmidt 正交化方法求可逆矩阵QR 分解的方法.例4.6 已知矩阵031042212A ⎛⎫ ⎪=- ⎪ ⎪⎝⎭,求A 的QR 分解.解法1 利用Householder 变换. 因为()T10,0,2a =,取1122a α==,作单位向量于是T 1110012010100H I u u ⎛⎫ ⎪=-= ⎪ ⎪⎝⎭,1212042031H A ⎛⎫⎪=- ⎪ ⎪⎝⎭又因()T24,3b =,取2225b α==,作单位向量于是T 2224312345H I u u ⎛⎫=-=⎪-⎝⎭,记 故A 的QR 分解为法2 利用Givens 变换. 取110,1c s ==,则 又取2243,55c s ==-,则 故A 的QR 分解为法3 利用Schmidt 正交化方法.设()T10,0,2a =,()T23,4,1a =,()T31,2,2a =-,则1a ,2a ,3a 线性无关.正交化得()T110,0,2p a ==,()T22113,4,02p a p =-=, 再单位化()T 1110,0,12q p ==,T22134,,0555q p ⎛⎫== ⎪⎝⎭于是故A 的QR 分解为QR 分解有许多应用,兹举一例说明之.对于线性方程组Ax =b 来说,如果C n nn A ⨯∈,则有A =QR ,其中Q 是n 阶酉矩阵,C n nn R ⨯∈是上三角矩阵.在Ax =b 两边同时左乘HQ ,则有H H Q Ax Q b =,即H Rx Q b =.通过回代即可求出x .又由于HQ 是一个酉矩阵,它左乘任一向量都不改变其2-范数,故可抑制计算过程中的误差积累.所以QR 分解在数值计算中是常用的工具之一定理4.9还可以作如下的推广.定理4.10 设C m nn A ⨯∈,则A 可惟一分解为A =QR其中C m nn Q ⨯∈且满足H Q Q I =,C n nn Q ⨯∈是具有正对角元的上三角矩阵. 三、矩阵酉相似于Hessenberg 矩阵Schur 定理1.22表明n 阶方阵A 总可以酉相似于上三角矩阵T ,这一结论在矩阵理论中起着重要的作用.但Schur 定理的证明过程并未给出如何求酉矩阵和相应的上三角矩阵T 的方法,且由于T 的对角元素就是A 的特征值,要求出它是不容易的.现在考虑是否能使n 阶方阵A 酉相似于一个与上三角矩阵比较接近的矩阵? 定义4.5 如果()C ijn n n nA a ⨯⨯=∈的元素满足()01ij a j i =+>,即则称A 为上Hessenberg 矩阵.如果A 的元素满足()01ij a i j =+>,则称A 为下Hessenberg矩阵.如果A 的元素满足()01ij a i j =->,则称A 为三对角矩阵. 定理4.10 设C n n A ⨯∈,则A 可酉相似于上Hessenberg 矩阵.证 将矩阵A 分块为选择n -1阶Householder 矩阵1H ,使得1111H a e α=,其中()T111,0,,0C n e -=∈.令T 11100H H ⎛⎫= ⎪⎝⎭,则1H 是n 阶Householder 矩阵,且其中2a ,2b ,22C n c -∈,()()222C n n A -⨯-∈.选择n -2阶Householder 矩阵2ˆH ,使得2221ˆˆH a e α=,其中()T 21ˆ1,0,,0C n e -=∈,令222ˆI O H OH ⎛⎫= ⎪ ⎪⎝⎭,则2H 是n 阶Householder 矩阵,且其中3a ,3b ,3c ,()33C n d -∈,()()333C n n A -⨯-∈.继续这一过程共n -2步,即可得到上Hessenberg 矩阵H ,即 令122n Q H H H -=,则Q 是酉矩阵,且H Q AQ H =.证毕该定理的证明过程给出了用Householder 变换化矩阵酉相似于上Hessenberg 矩阵的方法.同样,用Givens 变换也能完成这一过程,只需注意在化简时对矩阵左乘Givens 矩阵后,右边应相应乘上该矩阵的共轭转置(读者考虑其原因).推论1 设R n n A ⨯∈,则A 可正交相似于实的上Hessenberg 矩阵. 推论2 设C n n A ⨯∈是Hermite 矩阵,则A 可酉相似于三对角矩阵. 证 由定理4.10,存在n 阶酉矩阵Q ,使得其中H 是上Hessenberg 矩阵.注意到H A A =,于是 即H 也是Hermite 矩阵,故H 是三对角矩阵.证毕推论3 设R n n A ⨯∈是对称矩阵,则A 可正交相似于实的三对角矩阵. 例4.7 化实对称矩阵 正交相似于三对角矩阵.解法1 利用Householder 变换. 因为()T10,0,1a =,取1121a α==,计算则又因为()T23,4a =,取2225a α==,计算则故正交矩阵120010430055340055100Q H H ⎛⎫ ⎪ ⎪- ⎪==⎪ ⎪ ⎪ ⎪⎝⎭,使得TQ AQ H =. 法2 利用Givens 变换. 取10c =,11s =,则又取2234,55c s ==-,则 故正交矩阵T T243400104300553400551000Q T T ⎛⎫ ⎪ ⎪- ⎪==⎪ ⎪ ⎪ ⎪⎝⎭,使得TQ AQ H =. 作为本节结论的应用,以下叙述计算一般方阵求全部特征值的QR 方法,该方法由J .G .F .Francis 于1961年首先提出,至今被认为是求全部特征值和特征向量的最有效方法之一.设C n n A ⨯∈.记1A A =,求1A 的QR 分解111A Q R =;记211A R Q =,再求出2A 的QR 分解222A Q R =;如此一直做下去,一般的迭代格式为k k k A Q R =,1k k k A R Q += (k =1,2,…)其中k Q 为酉矩阵,k R 是上三角矩阵.这就是QR 方法.可以证明,QR 方法生成的矩阵序列{}k A 中每一矩阵都与A 酉相似,且在一定条件下,当k →+∞时,k A 将收敛于一个上三角矩阵,此上三角矩阵的对角元素即为A 的全部特征值.在QR 方法中,每一步需要做一次QR 分解和一次矩阵乘法,计算量较大,所以在实际计算时总是先将A 经酉相似化为上Hessenberg 矩阵H ,然后对H 用QR 方法计算,此时由QR 方法生成的矩阵序列保持是上Hessenberg 矩阵,但当k →+∞时,其第i +1行、i 列元素趋于0(i =1,2,…,n -1).§4.3 矩阵的满秩分解本节论述将非零矩阵分解为一个列满秩矩阵和一个行满秩矩阵的乘积问题,这种分解在广义逆矩阵的研究中是一个有力的工具.本节首先介绍矩阵的Hermite 标准形,为后面的讨论作些准备.一、Hermite 标准形在线性代数中已研究过等价矩阵的概念.定义4.6 设A ,C m n B ⨯∈.如果A 经过有限次初等变换变成矩阵B ,则称矩阵A 与B文档收集于互联网,已重新整理排版.word 版本可编辑,有帮助欢迎下载支持.等价. 关于等价矩阵有如下结论(证明参见线性代数教材).定理 4.11 设 A, B Cmn .则(1)A 与 B 等价的充分必要条件是 rankA=rankB;(2)A与B等价的充分必要条件是,存在SCmm m和TCnn n,使得SAT=B如果只对 A 作初等行变换,则有定理 4.12设ACmn r(r>0),则A可通过初等行变换化为满足如下条件的矩阵H:(1)H 的前 r 行中每一行至少含一个非零元素,且第一个非零元素是 1,而后 m-r 行元素均为 0;(2)若 H 中第 i 行的第一个非零元素 1 位于第 ji 列(i=1,2,…,r),则j1 < j2 <…< jr(3)H 的第 j1 , j2 ,…, jr 列为 Im 的前 r 列.即有称H为A的Hermite标准形或行最简形.采用矩阵说法即为,存在SCmm m,使得SA=H.为了求出定理 4.12 中的变换矩阵 S,可采用下述方法:构造 m×(m+n)矩阵(A, Im ),由可见,对(A,Im )作初等行变换,当把其左边一半 A 化为 Hermite 标准形 H 时,右边一半 Im就把 S 记录下来了.定义 4.7 以 n 阶单位矩阵 I n 的 n 个列向量 e1 , e2 ,…, en 为列构成的 n 阶方阵称为 n 阶置换矩阵,这里 i1 , i2 ,…, in 是 1,2,…,n 的一个全排列.置换矩阵有如下一些性质(证明留给读者). 定理 4.13 设 P ei1 , ei 2 , , ei n 是置换矩阵.则(1)P 是正交矩阵;(2)对任意 A Cmn ,AP 是将 A 的列按 i1 , i2 ,…, in 的次序重新排列所得到的矩阵.如果将 A 的 Hermite 标准形 H 的第 j1 , j2 ,…, jr 列依次调换到前 r 列的位置,相当于用置换矩阵 P=( e j1 , e j 2 ,…, e j r ,…)右乘矩阵 H,则有定理 4.14设ACmn r(r>0),则存在SCmm m和n阶置换矩阵P,使得 SAP Ir OKO K Crnr(4.8)如果对上面的矩阵再进行初等列变换,可得到 A 的等价标准形定理 4.15设ACmn r(r>0),则存在SCmm m和TCnn n,使得SAT Ir OOO (4.9)为求出定理 4.15 中的变换矩阵 S 和 T,可采用如下两种方法.方法一A,Im初等行变换H,S, HIn 初等列变换 Ir OTO O 方法二 以化成A对矩阵 InIm O 的前m行仅施行初等行变换,对前n列仅施行初等列变换,就可11文档来源为:从网络收集整理.word 版本可编辑.文档收集于互联网,已重新整理排版.word 版本可编辑,有帮助欢迎下载支持.从而记录到 S 和 T 2 4 1 1例 4.8已知矩阵 A 112 21 22 1 .(1)求 A 的 Hermite 标准形 H 和所用的变换矩阵 S;(2)求置换矩阵 P,化 A 为式(4.8)的形式;(3)求 A 的等价标准形和所用的变换矩阵 S 和 T.解 (1)因为所以 A 的 Hermite 标准形 H 和所用的变换矩阵 S 为1 2 0 1 1 31 30 H 0 00 01 001,S 1 3 12 310 1 (2)取 4 阶置换矩阵(4.10)则(3)由得变换矩阵变换矩阵 S 同式(4.10),使得二、矩阵的满秩分解定义 4.8设ACmn r(r>0),如果存在FCmr r和GCrn r,使得则称之为 A 的满秩分解.A=FG定理 4.16设ACmn r(r>0),则A的满秩分解总是存在的.证 当 r=m 时, A Im A 是 A 的一个满秩分解;而当 r=n 时, A AIn 是 A 的一个满秩分解.下设0<r<min{m,n}.由定理4.15,存在SCmm m和TCnn n,使得于是 其中FS 1 Ir O Cmn r,GIrOT1Crn r.该定理的证明过程即给出求满秩分解的一种方法.证毕2 4 例 4.9 求矩阵 A 1 2 1 21 112 的满秩分解.2 1 解 例 4.8 已求出了 A 的等价标准形和所用的变换矩阵 S 和 T.可求得取 S 1 的前 2 列,T 1 的前 2 行即得到 F 和 G,故 A 的满秩分解为需要指出的是,矩阵 A 的满秩分解不是惟一的.这是因为任取 D Crrr ,则其中FFDCmr r,GD1GCrn r,又得到A的另一个满秩分解.利用定理 4.16 所给出的方法求满秩分解的计算工作量较大.下面介绍较简便的一种方法.定理 4.17设ACmn r(r>0),且A的Hermite标准形H如式(4.7).取A的第j1,j2 ,, jr列构成矩阵 F,又取 H 的前 r 行构成矩阵 G,则 A=FG 即为 A 的一个满秩分解.12文档来源为:从网络收集整理.word 版本可编辑.文档收集于互联网,已重新整理排版.word 版本可编辑,有帮助欢迎下载支持.证 取 n 阶置换矩阵 P=( e j1 , e j 2 ,…, e j r ,…),由 G 的取法知 GP= Ir , KK Crnr 令 P1 ej1 , ej 2 , , ej r ,则有 GP1 Ir .为确定矩阵 F 使得 A=FG,给其两边右乘矩阵 P1 ,得可见 F 由 A 的 j1 , j2 ,…, jr 列构成.又由r=rankA=rank(FG)≤rankF知FCmr r.显然GCrn r.证毕利用定理 4.17 所述方法求 A 的满秩分解时,需要首先求出 A 的 Hermite 标准形 H,但 并未用到变换矩阵 S,因此不需求之. 2 4 1 1例 4.10求矩阵A 1 12 21 22 1 的满秩分解.解 例 4.8 已求得可见 j1 1 , j2 3 ,故 A 的满秩分解为利用矩阵的满秩分解处理一些矩阵问题时,有时会十分方便.例 4.11设ACmn r(r>0).证明A可分解为A=QD其中 QCmr r且 QHQIr,DCrn r.证 作 A 的满秩分解由定理 4.10 可将 F 分解为F=QR其中 QCmr r且 QHQIr,RCrr r是具有正对角元的上三角矩阵.于是A=QRG=QD其中DRGCrn r.§4.4 矩阵的奇异值分解矩阵的等价标准型具有很简单的形式(见式 4.9),但他仅反映了矩阵的秩特性,如果对变换矩阵 S 和 T 增加更多的限制,如要求 S 和 T 取为酉矩阵,则可以保留矩阵更多的特性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
QA
R 0
定理4.4.3 设A 是 m n矩阵,且 rank(A) r 0 ,
则存在 m 阶正交(酉)矩阵 Q 和 r n 行满秩矩
则存在 m×r 矩阵B 和 r×n 矩阵 C 使得
A BC
并且rank(B) = rank(C) = r.
满秩分解的应用: • 有关结论的证明。 • 计算广义逆矩阵。
4.3 三角分解
设A = (aij)是n 阶矩阵,如果 A 的对角线下(上)方 的元素全为零,即对i >j, aij = 0(对i < j,aij = 0),则 称矩阵 A 为上(下)三角矩阵。上三角矩阵和下三角 矩阵统称为三角矩阵。对角元全为1的上(下)三角 矩阵称为单位上(下)三角矩阵。
并且若上述条件成立,则使H(w)a = b 成立的单位向
量w可取为
w ei (a b) a b
(4.1.9)
其中θ为任一实数。
4.2 满秩分解
• 什么是矩阵的满秩分解? • 矩阵的满秩分解是否存在?如果存在,满秩
分解是否唯一? • 如何计算矩阵的满秩分解? • 满秩分解有什么应用?
定理4.2.1(满秩分解定理)设 m×n 矩阵 A的秩为r>0,
上(下)三角矩阵的性质
• 什么是矩阵的LU分解? • 矩阵的LU分解是否存在?如果存在, LU分解
是否唯一? • 如何计算矩阵的LU分解? • LU分解有什么应用?
定理4.3.1(LU分解定理)设 A 是 n 阶非奇异矩 阵,则 存在唯一的单位下三角矩阵L和上三角矩 阵U使得
A LU
的充分必要条件是A的所有顺序主子式均非零, 即
,n
(4.1.6)
则Li A的(i 1, j), , (n, j)元素全为零.这就是消去法的一步
4.1.3 Householder矩阵
取u = v = w, σ=2,并且w是单位向量,即
||w|| =1,初等矩阵
H (w) E(w, w,2) I 2wwH
(4.1.7)
称为Householder矩阵或初等Hermite矩阵。
定理4.1.2 Householder矩阵H(w)具有如下性质:
(1) det(H (w)) 1;
(2) H (w)H H (w) H (w)1 ;
(3) 设a,b Cn且a b,则存在单位向量w使得H (w)a b 的充分必要条件是
aH a bH b, aH b bH a (4.1.8)
I
lieiT
l jeTj
li1,i
0
lni
1
0
l j1, j
lnj
0
1
(4.1.5)
用初等下三角矩阵Li左乘一个矩阵A,等于从A的
第 k 行减去第 i 行乘以 lki(k i 1, , n) 。
对于A (a
ij)l,ki 如aa果kijj ,aij
0 ,取 k i 1,
d1 a11 ,
dk
k k 1
,
k 2, , n
分解式 A LDU称为矩阵A的LDU分解。
一般说来,即使A是n阶非奇异矩阵, A未必 能作LU分解和LDU分解。
定义4.3.1 设ei是n 阶单位矩阵的第i列(i=1,2,…n), 以e1, e2, , en为列作成的矩阵[ei1 , ei2 , , ein ] 称为 n 阶 排列矩阵,其中 i1, i2 , , in 是1,2,…n的一个排列。
1
.
(4.1.2)
(3) 对任意非零向量 a,b C n ,可适当选取 u, v和使得
E(u,v, )a b
(4.1.3)
4.1.2 初等下三角矩阵
令u li (0, ,0,li1,i , ,lni )T ,v ei , 1,则
Li Li (li ) E(li , ei ,1)
称为初等下三角矩阵, 即
1 k k A1 k 0, k 1, , n 1
定理4.3.2(LDU分解定理)设A是n阶非奇异矩阵,
则存在唯一的单位下三角矩阵L,对角矩阵
D=diag(d1, d2,…,dn )和单位上三角矩阵U使得
A LDU
的充分必要条件是A的所有顺序主子式均非零,即
k 0 (i 1, , n 1) ,并且
1
0
1
Li Li (li ) I lieiT
li1,i 1
0
0
ln,i
1
(4.1.4)
由定理4.1.1知det(Li ) 1,并且Li 1 E(li , ei ,1) Li (li ) .
对初等下三角矩阵,当i <j 时,有
1
0
1
Li (li )Lj (l j )
• 排列矩阵的性质。 • 排列矩阵的作用。
定理4.3.3 设 A是 n 阶非奇异矩阵,则存在排列
矩阵P 使得
PA LU~ LDU
其中L是单位下三角矩阵, U~ 是上三角矩阵,U是
单位上三角矩阵,D是对角矩阵。
LU分解的应用: • 求解线性方程组。 • 求解矩阵特征值么是矩阵的QR分解? • 矩阵的QR分解是否存在?如果存在,QR分解
第4章 矩阵的因子分解
4.1 初等矩阵 4.2 满秩分解 4.3 三角分解 4.4 QR分解 4.5 Schur定理与正规矩阵 4.6 奇异值分解
4.1 初等矩阵
4.1.1 初等矩阵 4.1.2 初等下三角矩阵 4.1.3 Householder矩阵
4.1.1 初等矩阵
定义4.1.1 设 u, v C n,σ为一复数,如下形式的 矩阵
E(u, v, ) I uvH
(4.1.1)
称为初等矩阵.
定理4.1.1 初等矩阵E(u,v,σ)具有如下性质:
(1) det(E(u, v, )) 1vHu; (2) 如果vHu 1,则E(u, v, )可逆,并且其逆
矩阵也是初等矩阵
E(u, v, )1 E(u, v, )
其中
vH u
是否唯一?
• 如何计算矩阵的QR分解? • QR分解有什么应用?
定理4.4.1 设 A是 n 阶非奇异实(复)矩阵,则 存在正交(酉)矩阵 Q 和非奇异实(复)上三 角矩阵 R使得
A QR
(4.4.1)
且除去相差一个对角元绝对值(模)全等于1的对角
矩阵因子外分解式(4.4.1)是唯一的。
定理4.4.2 设 A 是 m n 实(复)矩阵,且其n 个 列向量线性无关,则存在m 阶正交(酉)矩阵Q 和 n阶非奇异实(复)上三角矩阵R使得