(完整word版)矩阵分解及其简单应用
矩阵分解及其应用
《线性代数与矩阵分析》课程小论文矩阵分解及其应用学生姓名:******专业:*******学号:*******指导教师:********2015年12月Little Paper about the Course of "Linear Algebra and MatrixAnalysis"Matrix Decomposition and its ApplicationCandidate:******Major:*********StudentID:******Supervisor:******12,2015中文摘要将特定类型的矩阵拆解为几个矩阵的乘机称为矩阵的分解。
本文主要介绍几种矩阵的分解方法,它们分别是矩阵的等价分解、三角分解、谱分解、奇异值分解和 Fitting 分解等。
矩阵的分解理论和方法是矩阵分析中重要的部分,在求解矩阵的特征值、解线性方程组以及实际工程中有着广泛的运用。
因此,本文将介绍矩阵等价分解、三角分解、奇异值分解的理论运用以及三角分解的工程运用。
关键词:等价分解,三角分解,奇异值分解,运用AbstractMany particular types of matrix are split into the product of a matrix of several matrices, which is called decomposition of matrix. In this paper, we introduce some methods of matrix decomposition, which are equivalent decomposition, triangular decomposition, spectral decomposition, singular value decomposition, Fitting decomposition and so on. The decomposition theory and method of matrix is an important part of matrix analysis, which is widely used in solving the characteristic value, solving linear equations and the practical engineering. In this paper, we will introduce the theory of matrix equivalence decomposition, triangular decomposition, singular value decomposition and the engineering application of triangular decomposition.Key words:Equivalent Decomposition, Triangular Decomposition, Singular Value Decomposition, Application目录中文摘要 (1)ABSTRACT (1)1 绪论 (1)2 矩阵分解的常用方法 (1)2.1矩阵的等价分解 (1)2.2矩阵的三角分解 (2)2.2.1 矩阵的三角分解 (2)2.2.2 矩阵的正三角分解 (2)2.3矩阵的谱分解 (5)2.3.1 单纯形矩阵的谱分解 (5)2.3.2 正规矩阵与酉对角化 (6)2.3.3 正规矩阵的谱分解 (6)2.4矩阵的奇异值分解 (7)2.4.1 矩阵的奇异值分解(SVD分解) (7)2.5矩阵的FITTING分解 (7)3矩阵分解的理论应用 (8)3.1矩阵等价分解的理论应用 (8)3.2矩阵三角分解的理论应用 (8)3.3矩阵奇异值分解的理论应用 (9)4 矩阵分解在递推系统辨识中的应用 (10)4.1递推系统辨识中的困难 (10)4.1.1 病态问题 (10)4.1.2 效率和计算量问题 (10)4.2QR分解的实现方法 (11)4.2.1 GIVENS变换 (13)4.3递推算法 (13)5 结论 (18)6 参考文献 (18)1 绪论矩阵的分解是将一个矩阵分解为较为简单的或具有某种特性的若干矩阵的乘积,这是矩阵理论及其应用中比较常见的方法。
第五章 矩阵分解
, yn 即可(其实 y r 1 , 可以是任意数, 它们是自由变量)。那么
c1 / 1 c2 / 2 H V x cr / r 0 0 c1 / 1 c2 / 2 x V c r / r 0 0
设A是 m 矩阵, b是n维列向量,考虑如 n 下线性方程组
Ax b
在很多情形下,上述方程组没有解,
因此,我们计算其最小二乘解,即求x使 得 Ax 最小。 b2
设 A的奇异值分解为
0 r Vn A U , 0 0
其中U,V是酉矩阵。可以证明2-范数具
有酉不变性,因此
A , Q R
则称此分解为A的QR分解(或酉三角分解)。
n n 当A R 时称为 A的正交三角分解。
例 5.2.3
m n 定理5.2.3 设 A C ,则存在酉矩阵
m m 使得 QC
,其中 A QR
是 R C m n
阶梯型矩阵。
例 5.2.4
5.2.3 QR分解的应用
的解,通常只需迭代几步就可以得到很精确 Ax b
的解。
5.2 QR分解
QR分解在解决最小二乘问题,特征值的 计算等方面有十分重要的应用。
5.2.1 Householder变换 在平面解析几何中,将向量 x 映射为关
于 x 轴对称的向量 y 的变换称为关于 x 轴的
x (x1 , x 2,则 )T 镜像变换(见图5.2.1)。设
D diag(1 ,, n ), i 0(i 1,, n)
矩阵分解的方法和应用
矩阵分解的方法和应用在机器学习和数据分析领域,矩阵分解是一个常用的技术手段。
通过对数据矩阵进行分解,我们可以得到数据的潜在特征和规律,从而更好地理解和利用数据。
本文将介绍矩阵分解的常见方法和应用。
一、基本概念矩阵分解是指将一个矩阵表示为若干个小矩阵(或向量)的乘积的形式。
这些小矩阵一般是具有特定结构或意义的,例如对称矩阵、正定矩阵、特征矩阵等等。
矩阵分解可以应用到各种场景,例如数据降维、矩阵压缩、矩阵重构、协同过滤等等。
二、矩阵分解的方法常见的矩阵分解方法有以下几种:1. 奇异值分解(SVD)奇异值分解是一种基础的矩阵分解方法。
它将一个矩阵分解为三个小矩阵的乘积形式:$A=U\Sigma V^T$,其中$U$和$V$是正交矩阵,$\Sigma$是奇异值矩阵。
通过特征值分解可以得到奇异值矩阵,从而实现矩阵分解。
奇异值分解可以用来进行数据降维和矩阵重构。
例如,我们可以将一个高维度的数据矩阵分解为低维度的奇异向量,从而实现数据降维;或者我们可以使用奇异向量重构原始的矩阵,从而实现数据压缩。
2. QR分解QR分解是一种将矩阵分解为正交矩阵和上三角矩阵的方法。
具体来说,对于一个矩阵$A$,可以分解为$A=QR$,其中$Q$是正交矩阵,$R$是上三角矩阵。
QR分解可以应用到求解线性方程组、估计模型参数等领域。
3. 特征值分解(EVD)特征值分解是指将一个方阵分解为正交矩阵和对角矩阵的乘积形式。
具体来说,对于一个方阵$A$,可以分解为$A=V\LambdaV^{-1}$,其中$V$是正交矩阵,$\Lambda$是对角矩阵,对角线上的元素就是矩阵$A$的特征值。
特征值分解可以用于矩阵压缩和数据降维。
三、矩阵分解的应用1. 推荐系统推荐系统是一种常见的应用场景,它可以根据用户历史行为和兴趣,向用户推荐可能感兴趣的物品。
矩阵分解可以应用到推荐系统中,其基本思路是利用用户对物品的评分矩阵,对其进行分解,得到用户和物品的特征向量,然后通过计算余弦距离等方法,计算出用户和物品之间的相似度,从而推荐给用户可能感兴趣的物品。
矩阵分解法
矩阵分解法
矩阵分解法是一种被广泛应用于矩阵和数据分析领域的数学方法,它能够对复杂的数据集进行简单而有效的分解,为更深入的分析提供基础。
本文将详细介绍矩阵分解法的基本原理及各种应用,以及它能够解决的相关问题。
矩阵分解法的基本概念是使用矩阵的特定分解技术,将一个大的复杂的矩阵分解成若干较小的更简单的矩阵,这些矩阵之间可能存在一定的关系。
最常用的矩阵分解方法是奇异值分解(Singular Value Decomposition,SVD),它能够有效地将一个矩阵分解成三个矩阵,这三个矩阵可以用来描述矩阵的行、列和特征。
其中,最重要的矩阵是特征值矩阵,它能够描述矩阵中特征之间的关系,这些特征信息可以作为进一步分析的依据。
同时,这些特征也能够影响到矩阵的值,从而有助于解决机器学习和数据挖掘中的关系推断问题,从而获得新的结论。
此外,矩阵分解还可以用于对数据进行统计和预测,这是因为矩阵分解能够提取出高维数据中隐藏的模式,从而将复杂的数据集简化为易于理解的表示形式。
因此,矩阵分解法在实际的数据分析中有着重要的应用,如文本分类、推荐系统和图像识别等。
另外,矩阵分解法还能够帮助数据科学家们解决压缩和特征选择的问题。
首先,矩阵分解能够帮助我们压缩数据集,从而节省存储空间;其次,这种方法也可以帮助我们提取出有用的特征,从而达到减少计算负担的目的。
(尾)总之,矩阵分解法是一种极其重要的数学方法,它可以帮助我们对复杂的数据集进行分解,提取有用信息,从而为进一步分析提供基础,同时还可以用于压缩和特征选择等目的。
因此,矩阵分解法可以说是数据科学领域的一个重要的数学工具,值得进一步关注和研究。
矩阵分解应用
矩阵分解应用矩阵分解是一种将一个大型矩阵分解成多个小矩阵的数学方法。
它在各个领域都有着广泛的应用,包括图像处理、推荐系统、自然语言处理等。
本文将介绍矩阵分解的一些应用,并从实际案例中探讨其作用和优势。
矩阵分解在图像处理中有着重要的作用。
图像可以看作是由像素点组成的矩阵,每个像素点的数值代表了其在图像中的亮度或颜色。
通过对图像矩阵进行分解,可以提取出图像的特征,如边缘、纹理等。
这些特征对于图像的识别、分类和重建非常重要。
例如,在人脸识别中,可以将人脸图像矩阵进行分解,得到表示人脸特征的小矩阵,再通过比对数据库中的小矩阵,可以实现人脸的识别。
矩阵分解在推荐系统中也有广泛的应用。
推荐系统旨在根据用户的历史行为和偏好,为用户推荐个性化的商品或服务。
矩阵分解可以将用户对商品的评分矩阵分解为用户特征矩阵和商品特征矩阵,通过计算它们的内积来预测用户对未评分商品的评分。
这种方法不仅可以提高推荐准确度,还可以解决数据稀疏性和冷启动等问题。
例如,Netflix就使用了矩阵分解方法来实现其著名的电影推荐系统。
矩阵分解在自然语言处理中也有重要的应用。
自然语言处理是研究如何使计算机能够理解和处理人类语言的一门学科。
在文本分类、情感分析和机器翻译等任务中,矩阵分解可以将文本矩阵分解为词向量矩阵和语义矩阵,从而提取出文本的语义特征。
这些特征可以用于计算文本之间的相似度、进行情感分析和实现机器翻译等任务。
例如,Google的Word2Vec模型就是基于矩阵分解思想实现的,它可以将单词表示为低维向量,并通过向量之间的相似度来计算单词之间的关联性。
矩阵分解作为一种强大的数学工具,在图像处理、推荐系统和自然语言处理等领域都有着广泛的应用。
通过对大型矩阵的分解,可以提取出其潜在的结构和特征,从而实现更高效、更准确的数据处理和分析。
随着技术的不断发展和创新,相信矩阵分解在更多领域会有更多的应用机会。
第3章 矩阵的分解
2,正规矩阵的基本特性 定理3 .78 定理3.10 (P.78 ) : A∈Cn×n正规A酉相似于对角形. 正规 酉相似于对角形.
推论:正规A 推论:正规A∈Cn×nA有n个标准正交的特征 向量构成空间C 的标准正交基. 向量构成空间Cn 的标准正交基.
定理3 11( .80 )(正规矩阵的谱分解 定理3.11(P.80 )(正规矩阵的谱分解) 正规矩阵的谱分解) Hermite A正规A有如下谱分解: 正规 有如下谱分解: 性
已知:欧氏空间中的对称矩阵A 已知:欧氏空间中的对称矩阵A可以正交 相似于对角形. 相似于对角形. 讨论:一般方阵A 讨论:一般方阵A ,在什么条件下可以 酉相似于对角矩阵? 酉相似于对角矩阵? 在内积空间中讨论问题,涉及: 在内积空间中讨论问题,涉及:
空间 Cn, Cn×n, 酉矩阵U 酉矩阵U,UHU=I, U – 1=UH U=I, 酉相似: 酉相似: UHAU=J U–1 AU=J 重点: 重点:理论结果
三角分解 满秩分解 等价标准形 相似标准形
可对角化矩阵的谱分解
一,矩阵的三角分解
方阵的LU和LDV分解 方阵的LU和LDV分解(P.61) 分解( .61
LU分解:A∈Fn×n, 存在下三角形矩阵L , LU分解: 存在下三角形矩阵L 分解 上三角形矩阵U 使得A=LU. 上三角形矩阵U ,使得A=LU. LDV分解 LDV分解:A∈Fn×n, L,V分别是主对角线 分解: 元素为1的下三角形和上三角形矩阵, 元素为1的下三角形和上三角形矩阵,D为 对角矩阵,使得A=LDV. 对角矩阵,使得A=LDV. 已知的方法:Gauss已知的方法:Gauss-消元法 例题1 .61eg1 例题1 (P.61eg1)设 2 2 3
A∈C m×n,AHA∈C n×n,AAH∈C m×m , A 都是Hermite矩阵 矩阵. 都是Hermite矩阵. 定理3 12 定理3.12(P.82)
矩阵分解及其简单应用
矩阵分解及其简单应用x=b,即有如下方程组:Ly=bUx=y 先由Ly=b依次递推求得y1, y2,……,yn,再由方程Ux=y依次递推求得 xn,xn-1,……,x1、必须指出的是,当可逆矩阵A不满足∆k≠0时,应该用置换矩阵P左乘A以便使PA的n个顺序主子式全不为零,此时有:Ly=pbUx=y 这样,应用矩阵的三角分解,线性方程组的解求就可以简单很多了。
2、矩阵的QR分解矩阵的QR分解是指,如果实非奇异矩阵A可以表示为A=QR,其中Q为正交矩阵,R为实非奇异上三角矩阵。
QR分解的实际算法各种各样,有Schmidt正交方法、Givens方法和Householder方法,而且各有优点和不足。
2、1.Schmidt正交方法的QR分解Schmidt正交方法解求QR分解原理很简单,容易理解。
步骤主要有:1)把A写成m个列向量a=(a1,a2,……,am),并进行Schmidt正交化得=(α1,α2,……,αm);2)单位化,并令Q=(β1,β2,……,βm),R=diag(α1,α2,……,αm)K,其中a=K;3)A=QR、这种方法来进行QR分解,过程相对较为复杂,尤其是计算量大,尤其是阶数逐渐变大时,就显得更加不方便。
2、2.Givens方法的QR分解Givens方法求QR分解是利用旋转初等矩阵,即Givens矩阵Tij(c,s)来得到的,Tij(c,s)是正交矩阵,并且det(Tij(c,s))=1。
Tij(c,s)的第i行第i列和第j行第j列为cos,第i行第j列和第j行第i列分别为sin和-sin,其他的都为0、任何n阶实非奇异矩阵A可通过左连乘Tij(c,s)矩阵(乘积为T)化为上三角矩阵R,另Q=T-,就有A=QR。
该方法最主要的是在把矩阵化为列向量的基础上找出c和s,然后由此把矩阵的一步步向上三角矩阵靠近。
Givens方法相对Schmidt正交方法明显的原理要复杂得多,但是却计算量小得多,矩阵Tij(c,s)固有的性质很特别可以使其在很多方面的应用更加灵活。
第4章矩阵的分解
例 求下列特殊矩阵的广义逆; 零矩阵0; 0 + m×n =0 对角矩阵
n×m
2、M-P 广义逆的惟一性
Theorem 如果A有M-P广义逆,则A的M-P广义逆 是惟一的。 3、M-P广义逆的存在性及其求法
Theorem 任何矩阵都有M-P广义逆。 求法: • 设A满秩分解A=BC,则
A +与A–1 性质的差异比较:
(AB)–1=B –1 A –1 ,一般不成立(AB)+=B+A+。(只有满秩分解成立) (A–1)k =(Ak) –1 ,但不成立(A+)k=(Ak)+
1. 秩(A)=秩(AHA)=秩(AAH)。 2. AHA 和AAH 的非零特征值相等。 3. AHA和AAH 是半正定矩阵。 AHA和AAH 的特征值是非负实数:1 2 n
2、奇异值的定义: (P099) AC m×n,秩(A)=r,设AHA的特征值1 2 r 0,r+1= r+2 == n =0,则矩阵的奇异值
1
d2
dr
奇异值分解基本适用于内积空间中与矩阵秩相 关的问题 A的奇异值分解依赖于正规矩阵A HA 的酉相似 分解的。
一、矩阵A的奇异值及其性质
1、矩阵AHA和AAH的性质:
AC m×n,AHAC n×n,AAHC m×m , 都是Hermite矩阵。 Theorem 2.7.8(P052)
列 满 秩
行满秩
满秩分解的实现:向量组最大无关组的求法
例 求矩阵A的满秩分解
1 1 2 3 A (1 , 2 , 3 , 4 ) 1 0 1 0 0 1 1 3 1 0 1 0 1 1 0 1 1 3 , B 1 0 , A BC 行初等 0 0 0 0 0 1 1 0 1 0 C 0 1 1 3
第3章-矩阵的分解
§3 3 矩阵的奇异值分解
Singular value decomposition (SVD)
2021/3/11
16
§33 矩阵的奇异值分解
概述:
矩阵的奇异值分解是酉等价型的分解: AC m×n,
酉矩阵UC m×m, VC n×n ,使得A=U VH。
矩阵A等价于=
0
0
1
0
mn
2
r
定理3.11(P.80 )(正规矩阵的谱分解)
A正规A有如下谱分解:
Hermite 性
Pi2Pi , PiHPi
s
A i Pi i1
PiPj 0 ij
s
Pi I
i1
3、正规性质的应用举例
例题1(P.79 ,eg12)
例题2 设ARnn,AT=–A,证明
1. A的特征值是零和纯虚数。 2. 矩阵A的秩是偶数。
奇异值分解基本适用于内积空间中与矩阵秩相 关的问题
A的奇异值分解依赖于正规矩阵A HA 的酉相似 分解的。
2021/3/11
17
一、矩阵A的奇异值及其性质
1、矩阵AHA和AAH的性质:
AC m×n,AHAC n×n,AAHC m×m , 都是Hermite矩阵。
定理312(P82)
1. 秩(A)=秩(AHA)=秩(AAH)。 2. AHA 和AAH 的非零特征值相等。 3. AHA和AAH 是半正定矩阵。
N(P)=V =0 ,R(P)=V=1 P和(I – P)的关系 N(I – P)=R(P),R( I – P )=N(P)
Hermite 矩阵的谱分解
定理3 .6(P.73)设A是秩为k的半正定的Hermite
矩阵,则A可以分解为下列半正定矩阵的和。
(完整word版)矩阵分解及其简单应用
(完整word版)矩阵分解及其简单应用对矩阵分解及其应用矩阵分解是指将一个矩阵表示为结构简单或具有特殊性质若干矩阵之积或之和,大体分为三角分解、QR分解、满秩分解和奇异值分解。
矩阵的分解是很重要的一部分内容,在线性代数中时常用来解决各种复杂的问题,在各个不同的专业领域也有重要的作用。
秩亏网平差是测量数据处理中的一个难点,不仅表现在原理方面,更表现在计算方面,而应用矩阵分解来得到未知数的估计数大大简化了求解过程和难度。
1.矩阵的三角分解如果方阵A可表示为一个下三角矩阵L和一个上三角矩阵U之积,即A=LU,则称A可作三角分解。
矩阵三角分解是以Gauss消去法为根据导出的,因此矩阵可以进行三角分解的条件也与之相同,即矩阵A的前n-1个顺序主子式都不为0,即?k≠0.所以在对矩阵A进行三角分解的着手的第一步应该是判断是否满足这个前提条件,否则怎么分解都没有意义。
矩阵的三角分解不是唯一的,但是在一定的前提下,A=LDU的分解可以是唯一的,其中D是对角矩阵。
矩阵还有其他不同的三角分解,比如Doolittle分解和Crout分解,它们用待定系数法来解求A 的三角分解,当矩阵阶数较大的时候有其各自的优点,使算法更加简单方便。
矩阵的三角分解可以用来解线性方程组Ax=b。
由于A=LU,所以Ax=b可以变换成LU x=b,即有如下方程组:{Ly=b Ux=y先由Ly=b依次递推求得y1, y2,......,y n,再由方程Ux=y依次递推求得x n,x n?1, (x1)必须指出的是,当可逆矩阵A不满足?k≠0时,应该用置换矩阵P 左乘A以便使PA的n个顺序主子式全不为零,此时有:{Ly=pb Ux=y这样,应用矩阵的三角分解,线性方程组的解求就可以简单很多了。
2.矩阵的QR分解矩阵的QR分解是指,如果实非奇异矩阵A可以表示为A=QR,其中Q为正交矩阵,R为实非奇异上三角矩阵。
QR分解的实际算法各种各样,有Schmidt正交方法、Givens方法和Householder方法,而且各有优点和不足。
第九章 矩阵分解
第一节 矩阵的满秩分解 第二节 矩阵的正交三角分解 第三节 矩阵的奇异值分解 第四节 矩阵的谱分解
2013-12-02
1
第一节 矩阵的满秩分解
满秩分解的基本思想
存在非奇异矩阵 P 和 Q 化矩阵 A 成为标准型,即
PAQ
=
0
0
0
1
取P−1的前两列为B , 取Q−1的前两行为 C
2013-12-02
则得 A 的一种满秩分解
1 A = BC = 2
1
−101
1 0
2 3
0 1
−03
2013-12-02
1
第二节 矩阵的正交三角分解
定理1 设A则∈可C以nn×n唯, 一A分解为 =A U= R 或 A RU1 其中U(,酉U1阵∈)U n是×n 正线上,三R 角矩阵, R1是正线下三角矩阵(主对角线上元素均为正)。
= (b) 因为,BC有 B= 1C1 B*BC B*B1C1
= 所以 C (= B*B)−1 B*B1C1 R2C1
(2)
其中 R2 = (B*B)−1 B*B1
2013-12-02
1
所= 以 BC B= 1R1 R2C1 B1C1
所以 B1*B1R1 R2C1C1* = B1*B1C1C1* (3)
0
为 A的奇异值矩阵。
2013-12-02
1
定理4:对于秩为 r 的复矩阵 Am×n , 必有 m 阶酉 矩阵U 及 n 阶酉矩阵V 使得 U *AV = S 。
这里S是 A 的奇异值矩阵。
证明:设 A的非零奇异值为 σ1,σ 2,,σ r , 则
σ
《矩阵的分解》课件
高斯消元法
基本思想:通过行变换将矩阵 化为上三角矩阵或对角矩阵
步骤:选择主元素、消元、回 代
应用:求解线性方程组、求逆 矩阵、求特征值和特征向量
优点:计算量小,易于实现, 适用于稀疏矩阵和带状矩阵
迭代法
迭代法的基本思想:通过不断迭代, 逐步逼近目标解
迭代法的应用:在矩阵分解、数值 优化、图像处理等领域有广泛应用
U:上三角矩阵,对角线以上元素为0
LDU分解的应用:求解线性方程组、计算矩阵的逆矩阵等
平方根分解
平方根分解的定义:将矩阵分解为 两个矩阵的乘积,其中一个矩阵是 单位矩阵,另一个矩阵是矩阵的平 方根。
平方根分解的应用:平方根分解在 数值计算、线性代数、优化等领域 有着广泛的应用。
添加标题
添加标题
添加标题
添加标题
添加标题
添加标题
迭代法的步骤:设定初始值,计算 迭代函数,更新迭代值,直到满足 停止条件
迭代法的优缺点:优点是简单易实 现,缺点是收敛速度慢,容易陷入 局部最优解
共轭梯度法
共轭梯度法是一种求解线性方程组的迭代方法 共轭梯度法的基本思想是利用共轭梯度方向进行迭代 共轭梯度法的优点是收敛速度快,稳定性好 共轭梯度法的缺点是计算量大,需要存储大量的中间结果
a. 选取一组向量 b. 计算向量组的内积 c. 计算向量组的正交化向量 d. 重复步骤b和c,直到所有向量都正交
优点: a. 简单易行 b. 适用于任意维数的向量组
a. 简单易行 b. 适用于任意维数的向量组
应用: a. 矩阵的正交分解 b. 线性代数的其他领域
a. 矩阵的正交分解 b. 线性代数的其他领域
添加标题
添加标题
矩阵分解及应用
引言数学是人类历史中发展最早,也是发展最为庞大的基础学科。
许多人说数学是万理之源,因为许多学科的研究都是以数学做为基础,有了数学的夯实基础,人类才铸就起了众多学科的高楼大厦,所以数学的研究和发展一直在不断的发展壮大。
在数学中有一支耀眼的分支,那就是矩阵。
在古今矩阵的研究发展长河中产生了许多闪耀星河的大家。
英国数学大家詹姆斯•约瑟夫•西尔维斯特,一个数学狂人,正是他的孜孜不倦的研究使得矩阵理论正式被确立并开启了矩阵发展的快速发展通道。
凯莱和西尔维斯特是非常要好的朋友,他也是一位非常伟大的数学大师,正是他们伟大的友谊,加上两人的齐心协力最后他们共同发展了行列式和矩阵的理论。
后来高斯在矩阵方面的研究取得重要的成就,尤其是高斯消去法的确立,加速了矩阵理论的完善和发展。
而在我国,矩阵的概念古已有之。
从最早的数学大家刘徽开始我们古代数学大家都已或多或少的研究了矩阵。
尤其在数学大家刘徽写的《九章算术》中,它最早提出了矩阵的类似定义。
而且是将矩阵的类似定义用在了解决遍乘直除问题里了。
这已经开始孕育出了最早的矩阵形式。
随着时间转移,矩阵的理论不断的完善,在对于那些大型矩阵的计算中如果用基本方法显得过于繁重,于是发展出了矩阵的分解,随着对矩阵分解的不断研究完善,矩阵分解方法和理论也日趋成熟矩阵经常被当做是数学工具,因为在数学问题中要经常用上矩阵的知识。
矩阵是一个表格,要掌握其运算法则,作为表格的运算与数的运算既有联系又有差别,在所有矩阵的运算方法中,矩阵的分解是他们中一种最重要并且也是应用最广泛。
矩阵分解主要是对高斯消去法的延续和拓展。
在一些大型的矩阵计算中,其计算量大,化简繁杂,使得计算非常复杂。
如果运用矩阵的分解,将那些大型矩阵分解成简单的矩阵的乘积形式,则可大大降低计算的难度以及计算量。
这就是矩阵分解的主要目的。
而且对于矩阵的秩的问题,特征值的问题,行列式的问题等等,通过矩阵的分解后都可以清楚明晰的反应出来。
第四章 矩阵分解
矩阵分析第四章 矩阵分解§4.1: 矩阵的满秩分解 §4.2: 矩阵的正交三角分解 §4.3: 矩阵的奇异值分解 §4.4: 矩阵的极分解 §4.5: 矩阵的谱分解矩阵分解前言矩阵分解定义: 将一个已知矩阵表示为另一些较为简单或 较为熟悉的矩阵的积(或和)的过程称为矩阵分解. 例:(1)对任意n阶正规矩阵A,存在酉阵U∈Un×n使 A=Udiag(λ1,…,λn)U*, 其中λ1,…,λn为A的所有特征值的任一排列. (2)对任意n阶正定矩阵A,存在可逆阵Q∈Cnn×n使A=Q*Q,或存 在唯一正定阵B使A=BB. 矩阵分解意义:有利于研究已知的矩阵. 例如,利用正定阵A的平方根B为正定阵可证: 对任意Hermite阵H,AH或HA都有实特征值.1( AH∼(A1/2)-1AHA1/2=A1/2HA1/2∈Hn×n )2初等变换与初等矩阵(p73)三类初等变换: (行(列)变换←→左(右)乘) (1)将矩阵A的两行互换等价于用第一类初等矩阵P(i,j)左 乘A; (2)将矩阵A的第i行乘以k≠0等价于用第二类初等矩阵 P(i(k))=diag(1,…,1,k,1,…,1)左乘A. (3)将矩阵A的第j行乘以k≠0后再加到第i行等价于左乘第 三类初等矩阵P(i,j(k)).P (i , j ) =⎛1 ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ 1 0 1 1 1 0 1 1初等变换与初等矩阵举例⎛1 ⎞⎛ 1 4 7 ⎞ ⎛ 1 4 7 ⎞ ⎜ 0 1 ⎟⎜ 2 5 8 ⎟ = ⎜ 3 6 9 ⎟ ; ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ 1 0 ⎟⎜ 3 6 9 ⎟ ⎜ 2 5 8 ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠ ⎛1 4 7⎞⎛1 ⎞ ⎛ 1 7 4⎞ ⎜ 2 5 8⎟⎜ 0 1⎟ = ⎜ 2 8 5⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ 3 6 9⎟⎜ 1 0⎟ ⎜ 3 9 6⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠⎛1 ⎞⎛1 4 7⎞ ⎛ 1 4 7 ⎞ ⎜ ⎟⎜ ⎟ ⎜ ⎟ 0.2 ⎟ ⎜ 2 5 8 ⎟ = ⎜ 0.4 1 1.6 ⎟ ; ⎜ ⎜ 1⎟⎜ 3 6 9 ⎟ ⎜ 3 6 9 ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠⎛1 4 7⎞⎛1 ⎞ ⎛ 1 4 7 / 9⎞ ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ 2 5 8⎟⎜ 1 ⎟ = ⎜ 2 5 8/9⎟ ⎜ 3 6 9⎟⎜ 1/ 9 ⎟ ⎜ 3 6 1 ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠---- i ---- j⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ 1⎠P (i , j ( k )) =⎛1 ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝1k 1⎞ ⎟ ⎟ ⎟ ---⎟ ⎟ ⎟ ---⎟ ⎟ ⎟ 1⎠i j3⎛1 ⎞⎛ 1 2 3⎞ ⎛ 1 2 3 ⎞ ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ −4 1 ⎟ ⎜ 4 5 6 ⎟ = ⎜ 0 −3 −6 ⎟ ; ⎜ 1⎟⎜ 7 8 9⎟ ⎜ 7 8 9 ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠−3 ⎞ ⎛ 1 2 0 ⎞ ⎛ 1 2 3⎞⎛1 ⎜ ⎟⎜ ⎟ ⎜ ⎟ ⎜ 4 5 6⎟⎜ 1 ⎟ = ⎜ 4 5 −6 ⎟ ⎜7 8 9⎟⎜ 1 ⎟ ⎜ 7 8 −12 ⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠4初等变换与初等矩阵的性质3类初等矩阵都是可逆的(行列式不为0). 将A依次作初等矩阵P1,…,Pr对应的行(列)初等变换等价 于左(右)乘A以可逆矩阵Pr…P1(P1…Pr). 可适当选第一类初等矩阵的乘积P使PA(AP)的行(列)是A 的行(列)的任意排列; 可适当选第三类初等矩阵 P(i,j(k))中的k使P(i,j(k))A的(i,j)元变为0; 可适当选第二类初等矩阵P(i(k))中的k使P(i(k))A的非 零(i,i)元变为1. 存在初等矩阵的乘积P和Q,使PAQ= ,其中r=rankA.初等变换与初等矩阵的性质续命题:设A∈Crm×n前r列线性无关,则用初等行变换可把A变为⎛ Er ⎜ ⎝ 0 ⎛1 ⎜ ⎜ D⎞ ⎜ = ⎜ ⎟ 0 ⎠ ⎜ ⎜ ⎜ ⎜ ⎝ 1 1 * * * * *⎞ ⎟ *⎟ *⎟ ⎟ *⎟ ⎟ ⎟ ⎟ ⎠一般地,∀A∈Crm×n都存在m,n阶可逆阵P和Q使PAQ=5证:因前r列线性无关,故用第一类初等矩阵左乘可使A的 (1,1)元≠0. 再用第二类初等矩阵左乘可使a11=1; 最后用若干第三类初等矩阵左乘可使A的第一列=e1. 因前2列线性无关,故新的第2列与e1线性无关且≠0, 故用第一类行变换可使(2,2)元≠0,…可使A的第2列=e2. ….可使A的第r列=er.此时空白处必为0元.安徽大学 章权兵1矩阵分析§4.1: 矩阵的满秩分解⎛ 1 ⎜ A = ⎜ −2 ⎜ 0 ⎝ 0 0 0 0⎞ ⎛1 ⎟ ⎜ 1 ⎟ , 没 有 P ∈ C 33 × 3 使 P A = ⎜ ⎟ ⎜ 0⎠ ⎝0 0 0 0⎞⎛1 ⎟⎜ 1⎟⎜0 0⎟⎜0 ⎠⎝ 0 0 1 0⎞ ⎛ 1 ⎟ ⎜ 1 ⎟ = ⎜ −2 0⎟ ⎜ 0 ⎠ ⎝ 0 1 0 0⎞ ⎟ 0⎟ 0⎟ ⎠1⎞ ⎟ ⎟. 0⎟ ⎠定义:对任意矩阵A∈Crm×n,A=BC 称为A的一个满秩分 解,如果B∈Crm×r,C∈Crr×n. 例:⎛1 ⎜ ⎜1 ⎜0 ⎝ 1 2 1 2 3 1 3 ⎞ ⎛1 ⎟ ⎜ 2 ⎟ = ⎜1 − 1⎟ ⎜ 0 ⎠ ⎝ 1⎞ ⎟⎛ 1 2 ⎟⎜ ⎜0 1 ⎟⎝ ⎠ ⎛1 4 ⎞ ⎜ ⎟ = ⎜1 ⎟ 1 1 − 1⎠ ⎜ ⎝0 0 1 2⎞ ⎟⎛ 1 3 ⎟⎜ ⎜0 1 ⎟⎝ ⎠ −1 0 1 1 5 ⎞ ⎟ − 1⎟ ⎠⎛ 1 ⎜ A P ( 2, 3) = ⎜ − 2 ⎜ 0 ⎝⎛ 1 0 0 ⎞ ⎛ 1 0 0 ⎞ ⎛ 1 0.5 0 ⎞ ⎜ ⎟⎜ ⎟ ⎜ ⎟ PAQ = P (2,1(0.5)) AP (2, 3) = ⎜ 0.5 1 0 ⎟ ⎜ −2 1 0 ⎟ = ⎜ 0 1 0 ⎟ ⎜ 0 0 1⎟⎜ 0 0 0⎟ ⎜ 0 0 0⎟ ⎝ ⎠⎝ ⎠ ⎝ ⎠m=3,n=4,r=2. 注:可能存在不仅是常数差别的两个实质不同的满 秩分解.矩阵满秩分解的存在定理定理4.1.1:任意矩阵A∈Crm×n,都有满秩分解: A=BC,B∈Crm×r,C∈Crr×n. 证:由初等矩阵性质知: 存在可逆阵P∈Cmm×m和Q∈Cnn×n,使 PAQ= 从而 A⎛ Er ⎜ ⎜ 0 ⎝ 0 ⎞ ⎛ Er ⎟=⎜ 0⎟ ⎜ 0 ⎠ ⎝ ⎛ Er ⎞ -1 ⎜ ⎟ ( E r =P ⎝ 0 ⎠ ⎞ ⎟ ⎟ (E r ⎠ 0)存在定理中矩阵B,C的决定对于A的前r列线性无关的情形:⎛E PA = ⎜ r ⎝ 0 D ⎞ ⎛ Er ⎞ = (Er 0 ⎟ ⎜ 0 ⎟ ⎠ ⎝ ⎠ D)⎛E A = P −1 ⎜ r ⎝ 0D⎞ Er ⎞ −1 ⎛ ⎟= P ⎜ ⎟ (Er 0 ⎠ ⎝ 0 ⎠D ) = BC其中0)⎛E ⎞ B = P −1 ⎜ r ⎟ ; C = ( Er ⎝0⎠D)Q-10)= BC,⎛ 其中B=P-1 ⎜Er ⎞ ⎜ 0 ⎟ ,C= ⎟ ⎝ ⎠(ErQ-1满足所要求的条件.C是PA的前r行(即所有非0行)组成的矩阵, B和C的秩显然都是r.10矩阵B的进一步决定对于A的前r列线性无关的情形: 要求PA的前r列化为(Er,0)T,故有 B=P-1(Er,0)T ⇒ PB=(Er,0)T=PA1, 其中,A1为A前r列组成的子矩阵,由此推出B=A1. (参看P.183-184定理的证明及例4.1.1,例4.1.2) 对下例,A的第1,3两列也线性无关. 令A1为A第1,3两列组成的子矩阵,并将A的第1,3 两列化为(E2,0)T,C为所得矩阵的前2行. 则不难看出也有 A=BC和B=A1.求矩阵满秩分解的初等变换方法再以A= ⎜ 1 ⎜⎛1 1 2 3 ⎞ ⎟ 2 3 2 ⎟ 为例作说明如下: ⎜ 0 1 1 −1⎟ ⎝ ⎠①用初等行变换把A前两列变为(E2 0)T⎛1 1 2 3 ⎞ ⎛1 1 2 3 ⎞ ⎛1 0 1 4 ⎞ ⎛1 1⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎛1 0 1 4 ⎞ ⎜ 1 2 3 2 ⎟ → ⎜ 0 1 1 −1 ⎟ → ⎜ 0 1 1 −1⎟ = ⎜ 1 2 ⎟ ⎜ 0 1 1 −1⎟ ⎠ ⎜ 0 1 1 −1 ⎟ ⎜ 0 1 1 −1 ⎟ ⎜ 0 0 0 0 ⎟ ⎜ 0 1 ⎟ ⎝ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠ a1 a2 ②用初等行变换把A的1,3两列变为(E2 0)T ⎛1 1 2 3 ⎞ ⎛1 1 2 ⎜ ⎟ ⎜ ⎜1 2 3 2 ⎟ → ⎜0 1 1 ⎜ 0 1 1 −1 ⎟ ⎜ 0 1 1 ⎝ ⎠ ⎝ 3 ⎞ ⎛ 1 −1 0 5 ⎞ ⎛ 1 2 ⎞ ⎟ ⎜ ⎟ ⎜ ⎟ ⎛ 1 −1 0 5 ⎞ −1 ⎟ → ⎜ 0 1 1 − 1 ⎟ = ⎜ 1 3 ⎟ ⎜ ⎟ 0 1 1 −1 ⎠ −1 ⎟ ⎜ 0 0 0 0 ⎟ ⎜ 0 1 ⎟ ⎝ ⎠ ⎝ ⎠ ⎝ ⎠a1 a3安徽大学 章权兵2矩阵分析关于矩阵满秩分解的注矩阵满秩分解不唯一;但同一矩阵的两个满秩分 解的因式矩阵之间存在密切关系(见定理4.1.2). A∈Crm×n ⇒ r=rank A ≤ min{m,n} A的秩等于它的行秩,列秩或行列式秩. A的行(列)秩是它的行(列)最大线性无关组的行 (列)数;A的行列式秩是其非0子式的最大阶数. A=BC ⇒ rank A≤rank B 且 rank A≤rank C rank A=rank A*13引理4.3.1引理4.3.1:对任意矩阵A∈Crm×n有 rank(AA*)=rank(A*A)=rank A*=rank A=r. 证:因方程组Ax=0的解空间维数等于n-rank A, (*) 故为了证明 rank(A*A)=rank A 只须证明下列两个方程组有相同的解空间即可 Ax=0 ⑴ ⑵ A*Ax=0 显然,x满足⑴ ⇒ x满足⑵. x满足⑵ ⇒ x*A*Ax=0,即(Ax,Ax)=0 ⇒ Ax=0,即x满足⑴. 注:利用A的任意性以A*代A由(*)得 rank A=rank A*=rank((A*)*A*)=rank(AA*)同一矩阵两个满秩分解间的关系定理4.1.2:若A=BC=B1C1均为A∈Crm×n 的满秩分解, 则存在θ∈Crr×r,使得B=B1θ,C=θ-1C1. 证:若A=BC=B1C1,则BCC*=B1C1C*. 由p.190引理4.3.1知:rank(CC*)=rank C=r, 从而 CC*∈Crr×r为可逆矩阵,且满足B=B1C1C*(CC*)-1. 由上式推出r≥rank(C1C*)≥rank B=r,即rank(C1C*)=r. 进而 θ=C1C*(CC*)-1∈Crr×r,满足B=B1θ. 同理可证 C=(B*B)-1B*B1C1=θ′C1,θ′∈Crr×r. 因此,BC=B1C1 ⇒ B1θθ′C1=B1C1 ⇒ B1*B1θθ′C1C1* = B1*B1C1C1* 引理4.3.1 ⇒ θθ′=E ⇒ θ′=θ-1定理4.1.2的补充命题:设A=B1C1为A∈Crm×n的满秩分解, 则A=BC是A的满秩分解,当且仅当 ∃θ∈Crr×r, B=B1θ,C=θ-1C1. 证: 必要性由定理4.1.2给出. 充分性. 若存在θ使(*)成立,则B,C给出A的满秩分解: BC=B1C1=A. (*)§4.2: 矩阵的正交三角分解满秩矩阵的分解 行(列)满秩矩阵的分解 一般矩阵的分解满秩矩阵的正交三角分解定理4.2.1:∀A∈Cnn×n都可唯一地分解为A=UR(或A=LU),其中 U∈Un×n,R(L)为正线上(或下)三角矩阵. 证:(存在性)令A=(α1, … ,αn),则α1, … ,αn线性无关, 用Schmidt方法从α1, … ,αn得标准正交组ν1,…,νn满足⎧ ⎪ ⎪ ⎨ ⎪ ⎪α ⎩α 1 = C 11ν 11αn2= C 21ν1+ C 22 ν22∀i,Cii=‖βi‖>0n= C n 1ν+ Cn2ν+ ... + C nn νC 21 C 22于是其中,U=(ν1,…,νn)为酉矩阵,R为正线上三角矩阵.⎛ C 11 ⎜ A= (α 1 ,..., α n ) = (ν 1 ,..., ν n ) ⎜ ⎜ ⎜ ⎜ ⎝C n1 ⎞ ⎟ C n2 ⎟ ⎟ ⎟ C nn ⎟ ⎠=UR,安徽大学 章权兵3矩阵分析β1=α1 , β2=α2-((α2,β1)/(β1,β1))β1 , β3=α3-((α3,β1)/(β1,β1))β1-((α3,β2)/(β2,β2))β2 , . . . νi=(1/‖βi‖)βi, βi=‖βi‖νi, i=1,2,… α1=β1=‖β1‖ν1; C11=‖β1‖>0 α2=((α2,β1)/(β1,β1))β1+β2=C21ν1+‖β2‖ν2;C22=‖β2‖>0正交三角分解唯一性证明定理4.2.1:∀A∈Cnn×n都可唯一地分解为A=UR(或A=LU), 其中U∈Un×n,R(L)为正线上三角矩阵. (唯一性) 设还有U′∈Un×n和正线上三角矩阵R′使A=U′R′. 则有 UR=U′R′ ⇒ U′*U = R′R-1 = W 矩阵 W=U′*U∈Un×n,且W=R′R-1 仍然是正线上三角矩阵. (正线上三角阵的逆和积仍是正线上三角阵) 于是,由p.162的引理3.9.1知 W=E. 即 (U′)*U=R′R-1=E. 由此式立即推出:U=U′E=U′ & R′=ER=R. 得证唯一性.α3=C31ν1+C32ν2+‖β3‖ν3; . . .C33=‖β3‖>0正交三角分解下三角情形的证明定理4.2.1:∀A∈Cnn×n都可唯一地分解为A=LU,其中 U∈Un×n,L为正线下三角矩阵. 证: ∀A∈Cnn×n ⇒ AT∈Cnn×n. 存在唯一的U′∈Un×n和正线上三角矩阵R,使AT=U′R. 于是A=(AT)T=(U′R)T=RTU′T=LU, 其中,U=U′T∈Un×n,L=RT为正线下三角矩阵.列(行)满秩矩阵的正交三角分解定理4.2.2:∀A∈Crm×r(Crr×n)都可唯一地分解为A=UR (A=LU), 其中U∈Urm×r(Urr×n),R(L)为r阶正上线(下)三角矩阵. (定理4.2.1为m=n=r时的特例) 证:(存在性)令A=(α1, … ,αr),则α1, … ,αr线性无关, 用Schmidt方法求得标正组ν1,…,νr满足⎧ ⎪ ⎪ ⎨ ⎪ ⎪α ⎩αr2α 1 = C 1 1ν 1 = C 2 1ν 1 + C 2 2ν22∀i,Cii>0.r= C r 1ν 1 + C r 2ν+ . . . + C r rν因此A=UR,其中U=(ν1,…,νr)∈Urm×r, R=⎛ C 11 ⎜ ⎜ ⎜ ⎜ ⎝C 21 C 22C r1 ⎞ ⎟ Cr2 ⎟ ⎟ ⎟ C rr ⎠定理4.2.2唯一性证明定理4.2.2: ∀A∈Crm×r都可唯一地分解为A=UR,其中 U∈Urm×r,R为r阶正线上三角矩阵. (唯一性) 设还有U′∈Urm×r和正线上三角矩阵R′∈Cr×r 使A=U′R′. 则有 R*R=A*A=(R′)*R′, 于是由定理3.9.1⑹,A*A是正定Hermite矩阵. 故A*A可唯一地表示为乘积R*R,其中R为正线上三角阵. 因此必有R=R′. 进而,由UR=U′R′给出U=U′,得证唯一性.一般矩阵的正交三角分解定理4.2.3:∀A∈Crm×n可分解为A=U1R1L2U2,其中U1∈Urm×r, U2∈Urr×n,R1和L2分别为r阶正线上三角和下三角矩阵. 证:由矩阵的满秩分解知: 存在列满秩矩阵B和行满秩矩阵C使A=BC. 存在U1∈Urm×r和r阶正上线上三角矩阵R1使得B=U1R1. 存在r阶正线下三角矩阵L2和U2∈Urr×n使得C=L2U2. 从而A=U1R1L2U2满足条件.安徽大学 章权兵4矩阵分析用UR(LU)分解方法解方程组例4.2.1:用UR(LU)方法解方程组 Ax=b (*) − 2 ⎞ 1 ⎛ 1 ⎞ 其中 ⎛ − 3 ⎜ ⎟ ⎜ ⎟⎜ 1 A = ⎜ 1 ⎜ ⎜ 2 ⎝ 1 1 − 1 − 1 0 1 ⎟ ⎜ 0 ⎟, b = ⎜ 2 ⎟ ⎜ ⎟ ⎜ 1 ⎠ ⎝ ⎟ ⎟. ⎟ ⎟ ⎠§4.3: 矩阵的奇异值分解引理4.3.1:对任意矩阵A∈Crm×n有 rank(AA*)=rank(A*A)=rank A*=rank A=r. 引理4.3.2: ∀A∈Cm×n,AA*∈Cm×m 与 A*A∈Cn×n 均为 半正定Hermite矩阵. 证:由(A*A)*=A*A 和 ∀x∈Cn,x*A*Ax=(Ax,Ax)≥0 得证:A*A∈Cn×n 为半正定Hermite矩阵. 同理可证: AA*∈Cm×m 为半正定Hermite矩阵.解:令A=(α1,α2,α3),易见α1,α2,α3线性无关, 用Schmidt方法得标准正交组ν1,ν2,ν3如教本所示. 则A=UR,R为正线上三角矩阵,U=(ν1,ν2,ν3)∈U34×3 于是 R=U*A,代入(*)式得 URx=b ⇒ Rx=U*b ⇒ x=R-1U*b 最后求得 x=(-5/2,-1/2,3)T.AA*∈Cm×m与A*A∈Cn×n的特征值定理4.3.1: ∀A∈Cm×n, AA*∈Cm×m与A*A∈Cn×n的非零特 征值(正特征值)全同. 证法1:不难验证下列矩阵等式:⎛ AA* 0 ⎞⎛ Em A ⎞ ⎛ AA* ⎜ * ⎟⎜ ⎟=⎜ ⎜ A 0 ⎟⎜ En ⎟ ⎜ A* ⎠ ⎝ ⎝ ⎠⎝⎜ 因S= ⎜ ⎝ ⎛ Em定理4.3.1的另一证法证法2:设λ≠0是AA*的非零特征值: AA*x=λx, λ≠0,x≠0 则 A*x≠0, A*A(A*x)=λ(A*x) 所以λ也是A*A的非零特征值. 同理可证: A*A的任一非零特征值也是AA*的非零特征值.AA* A⎞ ⎛ Em A ⎞⎛ 0 ⎟=⎜ ⎟⎜ En ⎟⎜ A* A* A ⎟ ⎜ ⎠⎝ ⎠ ⎝0 ⎞ ⎟ A* A⎟ ⎠0 ⎞ −1 0 ⎞ ⎛ AA * 0 ⎞ A⎞ ⎛ 0 ⎛ 0 ⎟ = S⎜ * ⎜ ⎜ ⎟S ~ ⎜ * ⎜ ⎟ ⎟ * ⎟ * ⎟ En ⎟ 可逆,故 ⎜ A* 0 ⎟ ⎝ A A A⎠ ⎝ A A A⎠ ⎠ ⎠ ⎝ *)=0与det(λE-A*A)=0有相同非零解, 从而det(λE-AA得证AA*与A*A有相同的非零特征值.奇异值的概念定义4.3.1:∀A∈Crm×n,AA*∈Cm×m或A*A∈Cn×n 的正特征 值的算术平方根称为A的正奇异值(简称奇异值, 共有r个记为 α1,…,αr). 例:求A= ⎜ − 1 ⎜⎜ 0 ⎝ ⎛ 1 0⎞ ⎟ 1⎟∈ C 0⎟ ⎠3× 2 2正规矩阵的奇异值定理4.3.2:正规矩阵的奇异值是其非零特征值的模. 证:设A为正规矩阵,则有U∈Un×n使 A=Udiag(λ1, … ,λn)U* A*=Udiag(λ 1 ,..., λ n )U* 从而 AA*=Udiag(|λ1|2, … ,|λn|2)U* 得证A的正奇异值是A的非零特征值的模.的奇异值.解: A*A=⎜ −1 ⎜⎝⎛2−1⎞ ⎟ 1⎟ ⎠,det(λE-A)=λ2-3λ+1的两个根:(3±√5)/2 均为正, A的奇异值为:α1=((3+√5)/2)1/2;α2=((3-√5)/2)1/2. 例4.3.1:见P.191.安徽大学 章权兵5矩阵分析矩阵的酉等价关系定义:设A,B∈Cm×n,若有S∈Cmm×m,T∈Cnn×n 使B=SAT,则称B 与A等价;若有U∈Um×m,V∈Un×n使B=UAV,则称B与A酉等价. 不难证明Cm×n中的等价或酉等价关系R是等价关系. ∀A∈Cm×n,ARA:A=EmAEn (ARB⇒BRA): A=UBV⇒B=U*AV*,U*∈Um×m,V*∈Un×n (ARB & BRC⇒ARC):A=UBV & B=U′CV′⇒A=UU′CV′V 注1: A与B酉等价当且仅当它们有相同的奇异值. 注2: ∀A∈Cm×n的酉等价类中有一个最简单形状的矩阵 (见定理4.3.3). ( A∈Crm×n等价于diag(Er,0)=PAQ )奇异值分解定理1定理4.3.3:令α1,…,αr为A∈Crm×n的全部正奇异值; ∆=diag(α1,…,αr),则有U∈Um×m,V∈Un×n使 U*AV= ⎜ 0 ⎜⎛ ∆ 0⎞ ⎟ =D∈C m×n r 0⎟ ⎝ ⎠(*)U满足U*AA*U是对角矩阵,V满足V*A*AV是对角矩阵. ( A=UDV*称为A的奇异值分解式) 证: 因AA*为m阶半正定矩阵,故有U∈Um×m使⎛ ∆2 0⎞ ⎟ 0⎟ ⎝ ⎠ 分块U=(U1,U2),则U1∈Urm×r,U2∈Um-rm×(m-r)U*AA*U=diag(α12,…,αr2,0,…0)= ⎜ 0 ⎜对角阵 次酉阵奇异值分解定理1续⎛ ∆2 ⎜ ⎝ 0 ⎛ U1* ⎞ ⎛ U1* AA *U1 U1* AA *U 2 ⎞ 0 ⎞ ⎛ U1* ⎞ ⎟ ⎟ = ⎜ * ⎟ AA *(U1 , U 2 ) = ⎜ * ⎟ ( AA *U1 , AA *U 2 ) = ⎜ * * U2 ⎠ 0 ⎠ ⎝U 2 ⎠ ⎝ ⎝ U 2 AA *U1 U 2 AA *U 2 ⎠奇异值分解定理1续令 V1=(v1,…,vr),则v1,…,vr为标准正交组. 将此标正组扩大为Cn的标正基:v1,…,vr,vr+1,…,vn, 令V=(v1,…,vn)=(V1,V2)∈Un×n,其中V2=(vr+1,…,vn). 易见 0=V1*V2=∆-1U1*AV2 ⇒ U1*AV2=0 综合以上得⎛ U * AV U 1* AV2 ⎞ ⎛U * ⎞ ⎟ U * AV = ⎜ 1* ⎟ A(V1 , V2 ) = ⎜ 1* 1 ⎜ U AV U * AV ⎟ ⎜U ⎟ 2 2⎠ ⎝ 2 1 ⎝ 2⎠ ⎛ U * AA * U 1∆−1 =⎜ 1 ⎜ 0 ⎝ 0 ⎞ ⎛ ∆2 ∆−1 ⎟=⎜ 0⎟ ⎜ 0 ⎠ ⎝ 0⎞ ⎛ ∆ 0⎞ ⎟=⎜ ⎟ 0⎟ ⎜ 0 0⎟ ⎠ ⎠ ⎝比较(1,1)块得 ∆2=U1*AA*U1 比较(2,2)块得 0=U2*AA*U2=(U2*A)(U2*A)* ⇒ U2*A=0. ( ∀M∈Cm×n,MM*=0 ⇒ 0=tr(MM*)=Σ2 i,j|mij|⇒ ∀i,j,mij=0 ⇒ M=0 ) 令 V1=A*U1∆-1∈Cn×r 则 V1*V1=∆-1U1*AA*U1∆-1=∆-1∆2∆-1=E ⇒ V1∈Urn×r奇异值分解定理2定理4.3.4:令α1,…,αr为A∈Crm×n的全部正奇异值; ∆=diag(α1,…,αr),则有U1∈Urm×r,V1∈Urn×r 使 A=U1ΔV1 . 证:由定理4.3.3直接推出⎛∆ A = U ⎜ ⎜ 0 ⎝ 0 0 ⎞ ⎟V ⎟ ⎠*关于奇异值分解定理的注(1)定理4.3.3的证明同时给出了因子矩阵U,V的求法. (U(V)是使AA*(A*A)酉相似对角化的变换矩阵) (2)矩阵U,V的列分别是AA*,A*A的对应特征向量. 证: 只证U(类似可证V). U*AA*U=diag(λ1,…,λm),λi为AA*的特征值. 令 U=(u1,…,um), 则 (AA*u1,…,AA*um)=AA*(u1,…,um) =(u1,…,um)diag(λ1,…,λm) =(λ1u1,…,λmum) ⇒ ∀i,AA*ui=λiui A*A=VD*U*UDV*=Vdiag(λ1,…,λm)V* ⇒ ∀i,A*Avi=λivi= (U 1 , U2⎛∆ )⎜ ⎜ 0 ⎝0 0⎞ ⎛ V 1* ⎟⎜ * ⎟⎜ V ⎠⎝ 2⎞ ⎟ ⎟ ⎠⎛V * ⎞ = (U 1∆ , 0 )⎜ 1* ⎟ = U 1∆ V1* ⎜V ⎟ ⎝ 2⎠安徽大学 章权兵6矩阵分析奇异值分解例1例4.3.1: 求 A=⎛1 ⎜ ⎜0 ⎜0 ⎝ 2⎞ ⎟ 0⎟ 0⎟ ⎠奇异值分解例2例:求 A= 解: AA* =⎛1 ⎜ ⎜2 ⎝ 0 0 0⎞ ⎟ 0⎟ ⎠的奇异值分解式.的奇异值分解式.解: AA*=diag(5,0,0),σ(AA*)={5,0,0},Δ=(√5). U1∈U13×1是AA*对应于5的单位特征向量x=(1,0,0)T,U=E3. V1=A*U1∆-1= ⎜ ⎜⎛1 ⎝2 0 0 ⎛1⎞ 0 ⎞⎜ ⎟ ⎟⎜ 0 ⎟ ⎟ 0 ⎠⎜ ⎟ ⎝0⎠⎛1 ⎜ ⎜2 ⎝2⎞ * ⎟ 4 ⎟ ,σ(AA )={5,0},r=1,Δ=(√5). ⎠U1∈U12×1是AA*对应于5的单位特征向量x=(1/√5,2/√5)T V1=A*U1∆-1 = ⎜ 0⎜0 ⎝ ⎛1 ⎜ 2⎞ ⎟⎛ 0 ⎟⎜ ⎜ 0 ⎟⎝ ⎠1 5 2 5( )=1 51 5⎛1⎞ ⎜ ⎟ ⎜ 2⎟ ⎝ ⎠, V=1 5⎛1 ⎜ ⎜2 ⎝− 2⎞ ⎟ 1 ⎟ ⎠⎞ ⎟ ⎟ ⎠( )=1 51 5⎛1 ⎜ ⎜0 ⎜0 ⎝2⎞ ⎛1⎞ ⎟⎛ 1 ⎞ ⎜ ⎟ 0 ⎟⎜ ⎟ = ⎜ 0 ⎟ ⎜2⎟ 0 ⎟⎝ ⎠ ⎜ 0 ⎟ ⎠ ⎝ ⎠所以A的奇异值分解式是 A=UDV*= ⎜ 0 ⎜⎝0 ⎛1 ⎜ 0 1 0 0⎞⎛ 5 ⎜ 0⎟⎜ 0 ⎟ 1⎟⎜ 0 ⎠⎝ 0⎞ ⎟⎛ 0⎟⎜ 0⎟⎝ ⎠1 5 −2 5 1 2 5⎛1⎞ ⎞ ⎜ ⎟ ⎟ = ⎜0⎟ 5 ⎠ ⎜0⎟ ⎝ ⎠( 5 )(1 52 5)=U1∆ V 1*所以A的奇异值分解式是 ⎛ 15 * = ⎜ A = U1ΔV1 ⎜ 2 ⎝ 5⎞ ⎟( ⎟ ⎠5 ) (1, 0 , 0 )§4.4: 矩阵的极分解定义:令A∈Cn×n,A=HU或A=UH称为A的极分解式,如果 U∈Un×n,H∈Cn×n 是半正定Hermite矩阵. 特例: n=1时,由复数的指数表示式 a=ρeiθ 有 A=(a)=(ρ)(eiθ)=HU, H=(ρ)是半正定Hermite矩阵,U=(eiθ)是酉矩阵. 下面的定理证明: 矩阵的极分解式存在并且是唯一的.满秩方阵的极分解定理4.4.1: ∀A∈Cnn×n,存在U∈Un×n 和n阶正定Hermite矩阵 H1,H2 使 A=H1U (H12=AA*,即H1=√(AA*))或 A=UH2;并且这 样的分解式是唯一的. 证: 由定理3.9.1和定理3.9.4, 正定Hermite矩阵A*A存在唯一正定矩阵H2=(A*A)1/2. 令U=AH2-1, 则 U*U=(AH2-1)*AH2-1 =H2-1A*AH2-1=H2-1H22H2-1=E, 从而U∈Un×n使A=UH2;因H2可逆且唯一,故U也唯一. ( 另一半的证明: A=UH2=UH2U*U=H1U, H1=UH2U*为正定Hermite矩阵. AA*=H1UU*H1=H12 & H1为正定Hermite阵 ⇒ H1唯一. )非满秩方阵的极分解定理4.4.2: ∀A∈Crn×n,存在U∈Un×n和唯一n阶秩r半正定 Hermite矩阵H1,H2使A=H1U (H12=AA*,即H1=√(AA*)) 或 A=UH2 (即H2=√(A*A)). 证:存在性 由奇异值分解定理有U1,V∈Un×n使A=U1DV*, D=diag(α1,…,αr,0,…,0). 令H1=U1DU1*,H2=VDV*,U=U1V*,则H1,H2,U满足要求 A=U1DU1*U1V*=H1U; A=U1V*VDV*=UH2. 唯一性 若A=H1U,则AA*=H12 ⇒H1=(AA*)1/2唯一. 注:也可用上述方法证明定理4.4.1. 思考:定理4.4.2中U是否唯一? 不一定唯一! 没有U=AH2-1矩阵极分解的一个经典应用定理4.4.3: ∀A∈Cn×n 为正规矩阵当且仅当存在 U,U′∈Un×n和(同一个)n阶半正定Hermite矩阵H使 A=HU=U′H. 证:必要性 设A*A=AA*.由定理4.4.2,存在U∈Un×n和n 阶半正定Hermite矩阵H1,H′使A=H1U=UH′. 因此 H1=(AA*)1/2=(A*A)1/2 =H′. (AA*=H1UU*H1=(H1)2,A*A=H′U*UH′=(H′)2) 充分性 设A=HU=U′H. 则 AA*=HU(HU)*=H2 , A*A=(U′H)*U′H=H2 =AA*安徽大学 章权兵7。
第四章 矩阵分解(改)
第四章 矩阵分解基于理论研究和计算的需要,往往有必要把矩阵分解为具有某种特性的矩阵之和或积,这就是我们所说的矩阵分解.本章将介绍一些常用的分解方法,某些在《计算方法》中已涉及的分解,我们这里就不再提起了.§4.1 矩阵的正交三角分解60年代后以Givens 与Householden 变换发展起来的矩阵的QR 分解在计算数学中扮演了十分重要的角色,尤其是以QR 分解所建立的QR 方法,已对数值线性代数理论的近代发展起了关键作用.定义1 如果一个上三角矩阵的主对角线元素全为正实数,则称该矩阵为一个正线上三角矩阵.定理1 (正交三角分解) 设A 为n 阶实满秩矩阵,则必有n 阶正交矩阵Q 及n 阶正线上三角矩阵R ,使得QR A =.证 设A 按列分块为()n A ααα ,,21=,则12,,,n ααα 为欧氏空间n R 的一组基,利用施密特正交化方法可以得到一组正交基11βα=, ()(),,,21122111122ααιαββββαβ+=+-=… … … …n n n n n n n ααιαιαιβ++++=--1,12211再单位化得一组标准正交基1111αεb =,2221122ααεb b += , (1)… … … …n nn n n n n n n b b b b ααααε++++=--1,12211其中iii b β1=>0,令⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n b b b b b b B 22211211, 显然B 为正线上三角矩阵.且有()()1212,,,,,,n n B εεεααα= .(2)再令()12,,,n Q εεε= ,则Q 为正交矩阵.记1-=B R ,则R 仍为正线上三角矩阵.由(2)即得QR A =.定理证毕.实满秩矩阵的QR 分解是唯一的. 例1 求矩阵122212121A ⎛⎫⎪= ⎪ ⎪⎝⎭的QR 分解解 记A 的三个列向量依次为123,,ααα,用施密特正交化方法得11(1,2,1)T βα==, 212(1,1,1)T ββα=-+=-,32131711(,0,)3622T βββα=--+=-.单位化得111Tε===,2212T ε==+=, 33123(322T ε==-=-. 令⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛--=22316103162223161),,(321εεεQ ,则Q 为正交矩阵.且 ()123,,,Q B ααα=其中030B ⎪⎪=-⎪ ⎪ ⎪ ⎪⎝⎭,经计算得10002R B - ⎪⎪== ⎪ ⎪ ⎪ ⎪⎝⎭,便有QR A =. 对于复满秩矩阵,类似地有UR 分解定理。
矩阵的分解及简单应用
矩阵的分解及简单应用矩阵的分解是对矩阵的一种操作和处理,可以将矩阵拆分成不同形式的矩阵。
矩阵的分解可以被广泛地应用于各种领域中,包括机器学习、信号处理、图像处理等。
在本文中,我们将介绍矩阵的分解以及其简单应用。
1. 矩阵的分解矩阵的分解可以分为以下几种:1.1 LU分解LU分解是一种矩阵分解方法,可以将一个矩阵分解为下三角矩阵和上三角矩阵的乘积。
这种分解方法可以用于解线性方程组、求矩阵的逆和计算行列式等。
LU 分解的思路是通过高斯消元的方法将矩阵化为上三角矩阵,再将对角线以上的元素置0。
这样做是为了加速计算过程,比如在解线性方程组时,可以只用求解两个三角矩阵的乘积,而不需要进行高斯消元。
1.2 QR分解QR分解是一种将矩阵分解为正交矩阵乘上上三角矩阵的方法。
这种分解方法可以用于求解矩阵的特征值和特征向量、计算最小二乘问题、求解线性方程组等。
QR分解的基本思路是通过对一个矩阵进行正交变换,使得其变为上三角矩阵。
这个正交变换也可以表示为一个正交矩阵的乘积,这样就可以将原始矩阵分解为正交矩阵乘上上三角矩阵的乘积。
1.3 奇异值分解奇异值分解(singular value decomposition, SVD)是一种广泛应用于矩阵分解的方法。
SVD将一个矩阵分解为三个矩阵的乘积,分别是一个正交矩阵、一个含有奇异值的矩阵和另一个正交矩阵的转置。
SVD可以用于特征提取、图像压缩、推荐系统等方面。
2. 矩阵分解的应用矩阵的分解可以广泛应用于各种领域中,包括以下几个方面。
2.1 机器学习在机器学习中,矩阵的分解被广泛应用于推荐系统中。
推荐系统的目标是预测用户对商品的喜好或评分,并根据这些信息为用户推荐商品。
通过对用户与商品评分矩阵进行奇异值分解或因子分解,可以得到用户和商品的隐含特征,从而较准确地预测用户对商品的评分。
2.2 信号处理在信号处理领域中,矩阵的分解被广泛应用于降噪滤波、雷达信号处理、图像处理等方面。
矩阵分解及应用
矩阵分解及应用1 引言矩阵是研究图形(向量)变换的基本工具许多数学模型都可以用矩阵表示,矩阵理论既是学习数学的基础,又是一门最有实用价值的数学理论.它不仅是数学的一个重要分支,而且业已成为现代各科领域处理大量有限维空间形式与数量关系强有力的工具.矩阵在代数学习课程中占有重要的地位,而矩阵的分解在矩阵理论研究及其应用中有着重要意义,是其他一些研究课题解决问题的工具.本文介绍了矩阵的几种分解方法:三角分解、正交分解、满秩分解、奇异值分解以及各种分解方法的应用.三角分解在求线性方程组的过程中占有十分重要的作用;正交三角)(QR 分解在计算数学中扮演十分重要的角色,尤其是以QR 分解所建立的QR 方法,已对数值线性代数理论的近代发展起了关键的作用;矩阵的满秩分解和奇异值分解是近几十年来求各类最小二乘问题和最优化问题的重要数学工具. 2 矩阵的三角分解及应用 2.1 杜利特尔分解法定义 2.1]1[ 对于n 阶矩阵A =)(ij a ,n j i ,,2,1, =.如果LU A =,其中L 为单位下三角矩阵,U 为上三角矩阵,则称LU A =为矩阵A 的杜利特尔分解. 确定三角矩阵L 和U 的方法:设LU A =,其中L =⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡1112121 n n l l l ,U =⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡nn n n u u u u u u 22211211 按矩阵的乘法有ij a =∑=),m in(1j i s sj isu l,n j i ,,2,1, =由于kk l =1所以有kj a =+kj u ∑-=11k s sj ksu l,n k k j ,,1, +=所以kj u =-kj a ∑-=11k s sj ksu l,n k k j ,,1, +=同理ik l =kkskk s is ik u u l a ∑-=-11,n k k i ,,2,1 ++=这样便可以得到三角矩阵L 和U . 2.2 克劳特分解法定义 2.2]1[ 对于n 阶矩阵A =)(ij a ,n j i ,,2,1, =,如果LU A =,其中L 为下三角矩阵,U 为单位上三角矩阵,称LU A =为矩阵A 的克劳特分解.确定三角矩阵L 和U 的方法:设LU A =,其中L =⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡nn n n l l l l l l 21212111,U =⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡1112112 n n u u u 按矩阵的乘法有ij a =∑=),m in(1j i s sj isu l,n j i ,,2,1, =由于kk u =1所以有ik a =+ik l ∑-=11k s sk isu l,n k k i ,,1, +=所以ik l =-ik a ∑-=11k s sk is u l .n k k i ,,1, +=.同理=kj u kksjk s ks kj l u l a ∑-=-11,1,2,,j k k n =++这样便可以得到三角矩阵L 和U . 2.3 矩阵三角分解的应用例2.1 用LU 分解法求解下列方程组123121325282117x x x x x x x ++=⎧⎪+=⎨⎪+=⎩ 解 (1)杜利特尔分解法:原方程组的系数矩阵为A =⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡1102021211 令 ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡101001323121l l l 111213222333000u u u uu u ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡1102021211 则有=j u 1j a 1;=1i l 111u a i 1i a = =22u -22a 21l 12u 1=;=23u -23a 21l =13u 2- =32l 22123132a u u l -2-=;=33u 33a 31(l -13u 32l +)23u 3=所以=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡101001323121l l l ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-122011001 , ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡232322131211000u u uu u u ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=300210211 这样原方程组就化为依次求下列两个三角方程组⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-122011001⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡321y y y ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=785 (2-1) ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-300210211⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡321x x x ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=321y y y (2-2)解方程组(2-1)可得=1y 5,=2y 3,=3y 3 代入(2-2)可得=1x 2-,=2x 5,=3x 1.(2)克劳特分解法:令 ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡333231222111000l l l l l l ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡10010*******u u u ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=1102021211 则有=1i l 1i a ;=i u 1111l a ii a 1= =22l 22a 21l -12u 1= ;=32l 31l 12u 2-= =23u 22132123l u l a -2-=;=33l -33a 31(l +13u 32l 3)23=u所以⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡322011001000333231222111l l l l l l ,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡10021021110010*******u u u 这样原方程组就化为依次求下列两个三角方程组⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-322011001⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡321y y y ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=785 (2-3) ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-100210211⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡321x x x ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=321y y y (2-4) 则由方程组(2-3)可得51=y ,=2y 3,=3y 1 代入(2-4)可得21-=x ,52=x ,13=x .由上述解题过程可以看出,为求方程组的解,可先把方程组的系数矩阵进行分解,方程组化为b LUX =,则求解此方程组要化为依次求方程组Ly bUx y =⎧⎨=⎩,由Ly b =可求出y ,再将y代入Ux y =,求出x 即得方程组的解.这两种方法在解更多元的方程组中比其它的消元法更加方便.3 矩阵的正交三角)(QR 分解及应用 3.1 矩阵的正交三角)(QR 分解定义3.1]3[ 如果实(复)非奇异矩阵A 能够化成正交(酉)矩阵Q 与实(复)非奇异上三角矩阵R 的乘积,即QR A =,则称式QR A =为矩阵A 的QR 分解.把一个矩阵A 进行正交分解的方法:设n 阶实(复)非奇异矩阵A 的n 个列向量依次为n 21α,,α,α ,由于A 非奇异,所以这n 个向量线性无关,将它们正交化,可得到n 个标准正交列向量n q q q ,,,21 ,将n21α,,α,α 正交化,可得⎪⎪⎩⎪⎪⎨⎧---=-==--1111,1212211ββαββαβαβn n n n n n k k k 其中,(,)()(,)i j ij j j k j i =<αβββ,将上式改写为⎪⎪⎩⎪⎪⎨⎧+++=+==--nn n n n n k k k βββαββαβα11,112121211 用矩阵形式表示为)(n 21α,,α,α =C n ),,,(21βββ ,其中C =⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡1112121 n n k k k 再将n βββ,,,21 单位化,可得1i i i=q ββ,(1,2,)i n =…, 于是有()=12n α,α,,α()n C 12=β,β,,β()n 12q ,q ,,q ⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡n βββ21C 令⎩⎨⎧⋅==C diag R Q n n ),,,(),,,(2121βββq q q (3-1) 则Q 是正交(酉)矩阵,R 是上三角矩阵,且有QR A =.例3.1 求矩阵011110101A ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦的QR 分解. 解 令 1230111,1,0101⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥===⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦ααα 将它们进行正交化可得1122133212130111121,,2232311223⎡⎤⎡⎤⎢⎥⎢⎥⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥===-==--=-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥-⎢⎥⎣⎦⎣⎦βαβαββαββ 根据(3-1)构造矩阵0Q ⎡⎤⎢⎥⎢⎥=⎥⎥⎦111221131R ⎤⎡⎤⎥⎢⎥⎥⎢⎢⎥⎢⎥⎢⎢⎥==⎢⎥⎢⎢⎥⎢⎥⎢⎢⎥⎢⎢⎢⎥⎢⎢⎢⎥⎣⎦⎣⎣则有QR A =.3.2 矩阵正交三角()QR 分解的应用通过对实系数n 次方程求根问题及上Hessenberg 阵的QR 分解理论的分析和研究,将实系数n 次方程的求根问题转化为求上Hessenberg 阵的特征值问题,利用上Hessenberg 阵的QR 分解法求实系数n 次方程11100n n n n a x a x a x a --++⋅⋅⋅++=的全部实根.对于实系数n 次方程1110()0n n n n n P x a x a x a x a --=++⋅⋅⋅++=,令ii na b a =,(0,1,2,,1)i n =-则()0n P x =化为首项系数为1的代数方程1110()0n n n n Q x x b x b x b --=++⋅⋅⋅++=由线性代数可知,()0n Q x =可以看成是实矩阵A 的特征多项方程0E A λ-=, 即1110()0n n n n Q b b b λλλλ--=++⋅⋅⋅++=,其中⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡-----=---01001000000100000101321b b b b b A n n n 因此,求方程()0n Q x =的全部实根就转化为求上述矩阵A 的全部实特征值.可以直接用QR 分解法求出矩阵A 的全部实特征值. 4 矩阵的满秩分解及应用 4.1 矩阵的满秩分解定义 4.1[5] 设矩阵(0)m n r A C r ⨯∈>,如果存在矩阵m r r n r r F C G C ⨯⨯∈∈和,使得A FG =,则称式A FG =为矩阵A 的满秩分解.对矩阵A 作满秩分解的方法:设矩阵(0)m n r A C r ⨯∈>,rankA r =,根据矩阵的初等变换理论,对矩阵A 进行初等行变换,可将矩阵A 化为阶梯形矩阵B ,即0G A B ⎡⎤→=⎢⎥⎣⎦行,r n r G C ⨯∈,于是存在有限个m 阶初等矩阵的乘积,记作P ,使得PA B = 或者 A P B -1=将P -1分块为[]P FS -1=,m r m r n rF C S C ⨯⨯-∈∈(n-r ), 则有[]10G A P B FS FG -⎡⎤===⎢⎥⎣⎦其中F 是列满秩矩阵,G 是行满秩矩阵.例4.1 求矩阵02042100036330211441j j jA j j +⎡⎤⎢⎥=----⎢⎥⎢⎥-⎣⎦(j =. 解 根据上述的理论提供的算法,需要求出阶梯形矩阵B 及诸初等矩阵的乘积P ,为此,对矩阵[]A I 进行初等行变换,当A 所在的位置成为阶梯形矩阵B 时,I 所在的位置就是进行初等变换对应的初等矩阵的乘积P .[]=I A ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-----+10014411200103363000001124020j j jj j ⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡-+---−→−13100000003101210000021212102110j j j j j 行所以11100010122221000121003000000113j j j B j j ⎡⎤-⎡⎤⎢⎥--⎢⎥⎢⎥⎢⎥⎢⎥=+-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎣⎦,P=可求得1200030211j P -⎡⎤⎢⎥=-⎢⎥⎢⎥⎣⎦所以201101012032200012121j j j A j ⎡⎤⎡⎤--⎢⎥⎢⎥=-⎢⎥⎢⎥+⎢⎥⎣⎦⎣⎦.4.2 矩阵满秩分解的应用利用矩阵的满秩分解处理一些问题时,有时会十分方便,下面介绍运用矩阵的满秩分解,给出线性方程组最小二乘解和极小范数最小二乘解.定理 4.1[3] 设矩阵{13}m n m A C b C A A ⨯∈∈∈(1,3),,,,则x A b =(1,3)是方程组b Ax =的最小二乘解.定理 4.2[6] 设矩阵m n m A C b C ⨯∈∈,,则x A b +=是方程组Ax b =的极小范数最小二乘解.例4.2 取例4.1中的矩阵A 和11j b -⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦,求方程组Ax b =的极小范数最小二乘解. 解 由例4.1知矩阵A 的一个满秩分解式为201101012032200012121j j j A FG j ⎡⎤⎡⎤--⎢⎥⎢⎥==-⎢⎥⎢⎥+⎢⎥⎣⎦⎣⎦ 于是有82210HF F ⎡⎤=⎢⎥⎣⎦,H 1339222GG 39722j j ⎡⎤-⎢⎥=⎢⎥⎢⎥+⎢⎥⎣⎦从而H H H H F F F GG G A 11)()(--+=⎥⎦⎤⎢⎣⎡--⎥⎦⎤⎢⎣⎡--⎥⎦⎤⎢⎣⎡--+-⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡-+=130202411538113939314461121221100210100j j j j j j⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡--+-++-------+-+---+---=j j j j j j j j jj j jj j j 2091177138137399682636709481121655690960543973918120108781461800017481所以方程组Ax b =的极小范数最小二乘解为⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡+-------==+j j j j j b A x 59462129551813362608741.5 矩阵的奇异值分解及应用矩阵的奇异值分解不仅是矩阵理论和矩阵计算的最基本和最重要的工具之一,而且在控制论、系统辨识、信号处理、最优化问题、特征值问题、最小二乘问题及统计学等方面都有直接而重要的应用,以下介绍矩阵奇异值分解及在广义逆中的应用. 5.1矩阵的奇异值分解定义5.1[6] 设矩阵(0)m n r A C r ⨯∈>,H A A 的特征值为12r r 1n 0λλλλλ+≥≥≥>===则称i σ=n i ,,2,1 =)为矩阵A 的奇异值.定义5.2]6[ 设矩阵(0)m n r A C r ⨯∈>,则存在m 阶酉矩阵U 和n 阶酉矩阵V ,使得000H U AV ⎡⎤=⎢⎥⎣⎦∑(5-1)其中∑=),,,(21r diag σσσ ,而i σ),,2,1(r i =为矩阵A 的全部非零奇异值,则000H A U V ⎡⎤=⎢⎥⎣⎦∑为矩阵A 的奇异值分解.对一个矩阵A 作奇异值分解的方法:设矩阵(0)m n r A C r ⨯∈>,记Hermite 矩阵H A A 的特征值为12r r 1n 0λλλλλ+≥≥≥>===则存在n 阶酉矩阵V ,使得120()00H H n V A A V λλ⎡⎤⎡⎤⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎣⎦∑ (5-2)将V 分块为[]()1212,,n r n n r r n rV V V V C V C ⨯⨯--=∈∈ 并改写式(5-2)为2000HA AV V ⎡⎤=⎢⎥⎢⎥⎣⎦∑则有2112,0H H A AV V A AV ==∑(5-3) 由式(5-3)的第一式可得211H H V A AV =∑ 或者 1111)()Hr AV AV I --=∑∑(由式(5-3)的第二式可得22()()0H AV AV = 或者 2AV =0令111U AV -=∑,则11H r U U I =,即1U 的r 个列是两两正交的单位向量,记作1(,,,)r U 12=υυυ.所以可将,,,r 12υυυ,扩充为m C 的标准正交基,记增添的向量为,,r m +1υυ,并构造矩阵2,,r m U +1=(υυ),则[]121,,,,,r r m U U U 12+==(υυυυυ),是m 阶酉矩阵,且有11210H H r U U I U U ==, 于是可得 []111121212000H H HHH H U U U U AV UAV AV U U UU ⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦∑∑∑=== 000⎡⎤⎢⎥⎣⎦∑= 改写式(5-1)为000HA U V ⎡⎤=⎢⎥⎣⎦∑所以矩阵A 可以进行奇异值分解,其分解式为 HV U A ⎥⎦⎤⎢⎣⎡=∑000. 例5.1 求矩阵100111A ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦的奇异值分解. 解 2112TB A A ⎡⎤==⎢⎥⎣⎦的特征值是13λ=,21λ=,对应的特征向量依次为 111ξ⎡⎤=⎢⎥⎣⎦, 211ξ-⎡⎤=⎢⎥⎣⎦于是可得2=rankA,001⎤=⎥⎣⎦∑所以存在正交矩阵V =⎥⎥⎦此时 V V =1,计算1110U AV -⎥==⎥⎥⎥⎥⎦∑构造 []120U U U ==⎥⎥⎦ 则A 的奇异值分解为00100H A U V ⎤⎥=⎢⎥⎢⎥⎣⎦.5.2 奇异值分解在广义逆中的应用定义5.2[10] 矩阵m n A C ⨯∈,满足方程AXA A = (1) XAX X = (2) ()H AX AX = (3)()H XA XA = (4)中的)(i )(,j ,, )(l 的n m X C ⨯∈称为A 的一个},,,{l j i -逆,记作(,,,)i j l A ,另外还可以记作{,,,}X A i j l ∈,其中{,,,}A i j l 表示(,,,)i j l A 的全体,特别记(1,2,3,4)A A +=,称A +为A 的Penrose Moore -广义逆,有了奇异值分解,我们就能很容易地利用矩阵A 的奇异值分解表示出矩阵A 的各种广义逆(,,,)i j l A .矩阵A 的奇异值分解的应用:设m n A C ⨯∈有奇异值分解HV U A ⎥⎦⎤⎢⎣⎡=∑000(5-4) 其中U 和V 均为酉矩阵,01>⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=∑r σσ . )(A rank r =,对于 X =(,,,)i j l A ,记⎥⎦⎤⎢⎣⎡==22211211^X X X X XU V X H 则)1HU X X X V A⎥⎥⎦⎤⎢⎢⎣⎡=-∑2221121)1( (5-5))2HU X X X X V A⎥⎥⎦⎤⎢⎢⎣⎡=∑∑-122121121)2,1( (5-6) )3HU X X V A⎥⎥⎦⎤⎢⎢⎣⎡=-∑22211)3,1(0 (5-7))4HU X X V A⎥⎥⎦⎤⎢⎢⎣⎡=-∑22121)4,1(0 (5-8))5HU X V A⎥⎥⎦⎤⎢⎢⎣⎡=-∑00211)3,2,1( (5-9))6HU X V A⎥⎥⎦⎤⎢⎢⎣⎡=-∑00121)4,2,1((5-10) )7HU V A ⎥⎥⎦⎤⎢⎢⎣⎡=-+∑0001(5-11)证明 )1 由式AXA A =可知,HHHV U V XU V U ⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡∑∑∑000000000 即⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡∑∑∑00000000022211211X X X X 故可知∑∑∑=11X ,即111-∑=X ,则式(5-5)得证.)2 把(5-4)式和(5-5)式代入式XAX X =可得 HHU X X X V U X X X X X X V ⎥⎥⎦⎤⎢⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎥⎦⎤⎢⎢⎣⎡---∑∑∑∑222112122211212221121000 即⎥⎥⎦⎤⎢⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡--∑∑∑2221121122121121X X X X X X X 亦即122122X X X ∑=,则(5-6)式得证.)3 由(5-4)式和(5-5)式可知 HHU X I U U X X X U AX ⎥⎦⎤⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡⎥⎦⎤⎢⎣⎡=∑∑∑-00000122221121但由式H AX AX )(=,故必有12X =0,则(5-7)式得证.)4 由(5-4)式和(5-5)式可知 HHH V X I V V U U X X X V XA ⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎥⎦⎤⎢⎢⎣⎡=∑∑∑-0000021*******但由式()HXA XA =,则21210()000HHHI I X XA V V V V X⎡⎤⎡⎤==⎢⎥⎢⎥⎣⎦⎣⎦∑∑ 故必有021=X ,则(5-8)式得证.)5 由(5-4)式和(5-6)式可知HH H U X IU U X X X X V V U AX ⎥⎦⎤⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡⎥⎦⎤⎢⎣⎡=∑∑∑∑-0000021211221121但由式()H AX AX =,则有HH H U X I U U X IU AX ⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡=∑∑0000)(1212 所以有012=X .由(5-4)式和(5-7)式可知HHH H U X V U X X V V U U X X V XAX ⎥⎥⎦⎤⎢⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎥⎦⎤⎢⎢⎣⎡=---∑∑∑∑00000002112221122211但由式XAX X =,则有HHU X X V U X V ⎥⎥⎦⎤⎢⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡--∑∑22211211000 所以有022=X ,则(5-9)式得证.)6 由(5-4)式和(5-6)式可知HHH V X I V V U U X X X X V XA ⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎥⎦⎤⎢⎢⎣⎡=∑∑∑∑-0000021211221121但由式()H XA XA =,则有HHV X I V V X IV ⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡∑∑00002121 所以有021=X .由(5-4)式和(5-8)式可知HHH H U X V U X X V V U U X X V XAX ⎥⎥⎦⎤⎢⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡⎥⎦⎤⎢⎣⎡⎥⎥⎦⎤⎢⎢⎣⎡=---∑∑∑∑00000001212212122121但由式XAX X =,则有HHU X X V U X V ⎥⎥⎦⎤⎢⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡--∑∑2212112100所以有022=X ,则(5-10)式得证.)7 由(5-4)式和(5-9)式可知HHH V X I V V U U X V XA ⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎥⎦⎤⎢⎢⎣⎡=∑∑∑-000000021211但由式()H XA XA =,则有HH V X IV X I V ⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡∑∑00002121 所以有021=X .由(5-4)式和(5-10)式可知HHH U X I U U X V V U AX ⎥⎦⎤⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡⎥⎦⎤⎢⎣⎡=∑∑∑-000000012121但由式()H AX AX =,则有HH U X I U U X IU ⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡∑∑00001212 所以有012=X ,由)5的证法可知022=X .则(5-11)式得证. 6 结束语本文论述了矩阵的分解及这些分解在其它学科中的应用,在论述过程中着重讨论了三角分解、QR 分解、满秩分解及奇异值分解的具体应用.对于矩阵的分解可以借助计算机和一些数学软件进行分解,利用这些工具可以很方便的求出矩阵的某一种分解,这样在计算矩阵分解时就可以节省很多的时间.但矩阵的分解并不是只有这四种分解,还存在有其它的分解及其相应的应用,在这就不再做深入的研究了,要进行更深入的分析,使其更加完善,有待于今后的进一步研究.参考文献[1] 石东洋.数值计算方法[M].郑州:郑州大学出版社,2007.[2] 关红钧,苏艳华.关于n阶矩阵的三角分解[J].沈阳航空工业学院学报,2001,18(4):38-39.[3] 程云鹏,张凯院,徐仲.矩阵论[M].西安:西北工业大学出版社,1999.[4] 禹利萍.用QR分解法求实系数代数方程的全部实根[J].承德民族师专学报,2001,21(2):14-15.[5] 刘轩黄.矩阵的满秩分解及其应用[J].江西电力职工大学学报,1999,12(4):5-7.[6] 戴华.矩阵论[M].北京:科学出版社,2001.[7] 黄有度,狄成恩,朱士信.矩阵论及其应用[M].合肥:中国科学科技大学出版社,1995.[8] 张凯院,徐仲等.矩阵论典型试题解析及自我测试题[M].西安:西北工业大学出社,2001.[9] 燕列雅.初变换进行矩阵的QR分解[J].数学通讯报,1998,12(1):13-15.[10] 骈俊生.奇异值分解在广义逆中的若干应用[J].阜阳师范学院学报,2005,22(1):16-17.[11] 刘轩黄.满秩分解的两种简单实现方法及应用[J].华中师范大学学报,1986,20(4):425-426.[12] 北京大学数学系.高等代数[M].北京:高等教育出版社,1978.。
矩阵分解及其应用前言怎么写示范
矩阵分解及其应用前言怎么写示范下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。
文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!本店铺为大家提供各种类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you! In addition, this shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!矩阵分解及其应用前言1. 发展背景。
自20世纪80年代矩阵分解概念被提出以来,相继出现了很多基于矩阵分解的算法和应用。
第六章 矩阵的分解
第六章 矩阵的分解6.1 方阵的三角分解定义1 如果方阵可以分解成一个下三角矩阵和一个上三角矩阵的乘积,,则称方阵可做三角分解(或LU分解)若方阵可做三角分解,则分解不唯一. ,其中是任意可逆对角阵.定理1 n阶方阵可做三角分解的充分必要条件是的顺序主子式.且这时可以唯一地分解为.其中分别为对角线元素为1的上下三角阵,.6.2 单纯矩阵分解定义1 若n阶方阵相似于对角阵,则称为单纯矩阵.定理1 设n阶方阵为单纯矩阵,是的互异特征值,是其对应重数.则唯一存在使得(i) , 称的谱分解, 称的谱族.(ii) (iii) , (iv)(v)推论 设,单纯矩阵的谱分解为,则.6.3 矩阵的最大秩分解定理1 设,,则可经过有限次初等行变换把化为行最简形式其中,号的元素可以不为零,的第个列向量为,第i个元素为1,.引理 分块矩阵经过一次初等行变换后化为矩阵,则证明 ,其中是相应的初等矩阵.,而,由初等变换不改变方程组的解,即.定理2 设, ,则可将做满秩分解(或称最大秩分解), .其中,且,即是列满秩的,是行满秩的.证明 对作初等行变换化为行最简形式,令,则.取为的前r行所构成的矩阵,即则.下面验证事实上,易见的任一列向量均可由表示出来,且表示系数为的第j个列向量,即.由引理知道得第j个列向量可由表示出来,且表示系数为的第j个列向量,即.故.例1 求矩阵的最大秩分解解则注意,由,其中为任意r阶可逆方阵,所以矩阵的最大秩分解不唯一.定理3 设, .若均为的最大秩分解,则(i) 存在r阶可逆方阵,使得(ii)证明 (a) 首先证明可逆.注意到是一个r阶Hermit矩阵,考虑二次型,,将按行分块,则,由,所以,从而是正定矩阵,所以可逆.同理可证可逆.(b) ,令,,则,从而,注意到,记,则,所以(i)成立.(c) 由于,所以注1 矩阵的最大秩分解不唯一,但是矩阵是唯一的,它在后面要讲的广义逆中有重要作用.注2 若矩阵的最大秩分解中的满足,则称这种最大秩分解为QR分解,且记.矩阵的QR分解总是存在的,事实上对最大秩分解的矩阵的列向量组实事Gram‐Schmidt正交化得,其中为正交正(酉矩阵),是一个可逆上三角阵.从而,其中.矩阵的QR分解不唯一.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对矩阵分解及其应用矩阵分解是指将一个矩阵表示为结构简单或具有特殊性质若干矩阵之积或之和,大体分为三角分解、QR 分解、满秩分解和奇异值分解。
矩阵的分解是很重要的一部分内容,在线性代数中时常用来解决各种复杂的问题,在各个不同的专业领域也有重要的作用。
秩亏网平差是测量数据处理中的一个难点,不仅表现在原理方面,更表现在计算方面,而应用矩阵分解来得到未知数的估计数大大简化了求解过程和难度。
1. 矩阵的三角分解如果方阵A可表示为一个下三角矩阵L和一个上三角矩阵U之积,即A=LU 则称A可作三角分解。
矩阵三角分解是以Gauss消去法为根据导出的,因此矩阵可以进行三角分解的条件也与之相同,即矩阵A的前n-1个顺序主子式都不为0, 即?k工0.所以在对矩阵A进行三角分解的着手的第一步应该是判断是否满足这个前提条件,否则怎么分解都没有意义。
矩阵的三角分解不是唯一的,但是在一定的前提下,A=LDU勺分解可以是唯一的,其中D是对角矩阵。
矩阵还有其他不同的三角分解,比如Doolittle 分解和Crout 分解,它们用待定系数法来解求 A 的三角分解,当矩阵阶数较大的时候有其各自的优点,使算法更加简单方便。
矩阵的三角分解可以用来解线性方程组Ax=b。
由于A=LU,所以Ax=b可以变换成LU x=b,即有如下方程组:Ly = b{{Ux = y先由Ly = b依次递推求得y i, y2, ........ ,y n,再由方程Ux = y依次递推求得X n,x n-1 , ... ,X1 .必须指出的是,当可逆矩阵A不满足?k工0时,应该用置换矩阵P左乘A以便使PA 的n个顺序主子式全不为零,此时有:Ly = pb{{ Ux = y 这样,应用矩阵的三角分解,线性方程组的解求就可以简单很多了。
2. 矩阵的QF分解矩阵的QR分解是指,如果实非奇异矩阵A可以表示为A=QR其中Q为正交矩阵,R为实非奇异上三角矩阵。
QR分解的实际算法各种各样,有Schmidt正交方法、Give ns方法和Householder方法,而且各有优点和不足。
2.1 . Schmidt正交方法的QR分解Schmidt正交方法解求QR分解原理很简单,容易理解。
步骤主要有:1)把A写成m个列向量a= (a〔,a2, ... ,a m),并进行Schmidt正交化得ct = (a 1,a 2,.. , a m ) ;2)单位化,并令Q= (B 1,B 2, . , B m ),R=diag (a 1,,a m ) K其中a= K; 3) A=QR.这种方法来进行QR分解,过程相对OC 2,较为复杂,尤其是计算量大,尤其是阶数逐渐变大时,就显得更加不方便。
2.2 . Give ns方法的QR分解Give ns方法求QR分解是利用旋转初等矩阵,即Give ns矩阵T j (c,s)来得到的,T j (c,s)是正交矩阵,并且det(T j (c,s))=1 。
T j (c,s)的第i行第i列和第j行第j列为cos=,第i行第j列和第j行第i列分别为sinO和-sin 2,其他的都为0.任何n阶实非奇异矩阵A可通过左连乘T j (c,s)矩阵(乘积为T)化为上三角矩阵R,另Q=T,就有A=QR该方法最主要的是在把矩阵化为列向量的基础上找出c和s,然后由此把矩阵的一步步向上三角矩阵靠近。
Give ns方法相对Schmidt正交方法明显的原理要复杂得多,但是却计算量小得多,矩阵T j (c,s)固有的性质很特别可以使其在很多方面的应用更加灵活。
2.3 . Householder 方法的QR分解Householder方法分解矩阵是利用反射矩阵,即Householder矩阵H= E-2uu T,其中u是单位列向量,H是正交矩阵,detH = -1。
可以证明,两个H矩阵的乘积就是Give ns矩阵,并且任何实非奇异矩阵A可通过连乘Householder 矩阵(乘积为S)化为上三角矩阵R,则A= QR这种方法首要的就是寻找合适的单位列向量去构成矩阵H,过程和Give ns方法基本相似,但是计算量要小一些。
矩阵的QR分解可以用来解决线性最小二乘法的问题,也可以用来降低矩阵求逆的代价。
矩阵的求逆是件不小的工程,尤其是阶数慢慢变大的情况时,而用先把矩阵QR分解成正交矩阵和上三角矩阵,就容易多了,况且正交矩阵的转置就是逆,这一点是其他的矩阵分解无法比拟的。
在解求线性方程组中,如果系数矩阵的阶数比较大,可以利用QR分解来使计算简单化。
另外,QR分解考虑的是n阶矩阵,其他的矩阵是不能用这种方法进行分解,由于QR分解的这一前提条件,使得下面提到的满秩矩阵分解和奇异值分解就有了其特殊的意义。
3. 满秩分解满秩分解也称最大秩分解,前面的QR分解是面对n阶矩阵的,而满秩分解可以处理长方阵。
满秩分解是指,把秩为r的mxn矩阵A分解成A=FG其中F 是秩为r的mxr阶矩阵,G是秩为r的rxn阶矩阵。
满秩矩阵的解求可以通过初等变换法,但是必须经过多次求逆,所以就利用Hermite 行标准形来完成。
把矩阵A经过变换成为Hermite行标准形B,B的j i,j 2, ......................................................................................... ,j r列为单位矩阵I m的前r列,另A的第j i,j 2,……,j r列为矩阵F,B的前r行为矩阵G,则有A=FG 在广义逆中,满秩分解有很多的应用。
在证明A{1}的存在性时就需要用到Hermite行标准形来得到“对于任一的矩阵,总是存在非奇异矩阵Q和置换矩阵P,使QAP= (E r 00) ”,之后才能构造X= P(E r:)Q来证明A {1}是存在的。
用矩阵的满秩分解还能构造A+,若矩阵A有满秩分解,即A=FG则可以证明有A+ =G H(F H AG H)-1 F H。
4. 奇异值分解矩阵的奇异值分解是线性代数中一种重要的矩阵分解,在最优化问题、特征值问题、最小二乘问题和广义逆问题及统计学问题中都有重要的应用。
对秩为r 的mxn阶矩阵A进行奇异值分解的步骤是:1)求得AA的特征值Y,Y,……Y,2及对应的特征向量并正交单位化,得矩阵V,使得V H(A H A)V=M 00], M =diag(仃Y,……Y n); 2)将V的前r列作为V,令5 = AV1H-1,再扩张U成m 阶的矩阵U; 3)那么A= 5》0] V H。
从计算过程中可以看出,矩阵的奇异值分解解求是由矩阵的特征值开始的,因此这种分解自然和特征值的问题有莫大联系的。
在广义逆问题中,矩阵的奇异值分解的作用一样不可代替。
在证明A{1,2,3}的存在性时,首先就需要用奇异分解来得到一个结论:r(A H A)= r(AA H)= r(A H)=r(A),由此得到的A H可以由AA表示,再去证明A {1,2,3}应该满足的条件就方便得多了。
另外,在构造A+的过程中也有应用,若A有奇异值分解A+ =U(M 0))V H,则有可以得到A = V(M-1 0 )。
5. 奇异值分解应用于秩亏网平差在经典平差中,都是以已知的起算数据为基础,将控制网固定在已知数据上,比如水准网必须至少知道已知网中某一点的高程,平面网至少要已知一个点的坐标、一条边的边长和一条边的方位角。
此时,误差方程的系数矩阵B 总是列满秩的,由此得出的法方程系数阵N = B T PB是个对称的满秩方阵,即R(N) = R(B), 法方程有唯一解。
当网中没有必要的起算数据时(引起秩亏的原因),网中所有点均为待定点,就为自由网,B为列亏矩阵,秩亏数为d(必要的起算数据个数), 误差方程为:V = Bx~ - l 组成的法方程为:B T PBx~ - B T Pl = 0若是按照直接解法用如下的方程组来解求x 的解:V= Bx~ - l{B T PBx~ - B T Pl = 0 (a)V T PV= min可以得到|B T PB| = 0,即该方程组有解但不唯一,虽然满足最小二乘准则,但有x~无穷多组解,无法求得x~的唯一解,这是与经典平差的根本区别。
为了求得唯一解,必须增加新的约束条件。
秩亏自由网平差就是在满足最小二乘V T PV= min和最小范数x~T x~ = min的条件下,求参数一组最佳估值的平差方法,也就是通过对如下的方程组来解求x~的唯一解:V = Bx~ - l{B T PBx~ - B T Pl = 0{ V T PV= minx~T x~ = min这是个复杂的方程组,如果按部就班按照正常求解的方法是很困难的,下面我们把矩阵的奇异值分解融合进来。
我们首先根据前面矩阵奇异分解的步骤求得矩阵 B 的奇异值分解: B =U[M 0] V H,在此基础上令矩阵G = V[M-1°] U H。
通过矩阵理论的学习我们知0 0 0 0道,我们可以通过如下的方式来验证G就是B的广义逆:(1)BGB= U[M 0]V H V[M 0]U H U[M 0]V H= U[M 0]V H= B0 0 0 0 0 0 0 0(2)GBG=V[M0-10] U H U[M000] V H V[M000]-1U H = V[M-10] U H00=G(3)(BG)H= (U[M000]V H V[M0-10] U H)H =BG(4)(GB)H = (V [ M0-100]U H U[M000]V H)H=GB我们知道,对于不相容方程组Bx = b,使得x =:Gb为极小范数最小—乘的充(b)要条件是G为B的广义逆。
而我们已经得到了G就是B的广义逆,那么就说明G是满足该方程式的极小范数最小二乘解。
也就是说,我们得到未知参数的估值x~ = -1Gl= V[M 0]U H|。
通过这种方式,我们求解方程组(b)就简单多了,矩阵00的奇异分解令问题很容易的简单化了。
6. 结论矩阵的分解还有很多的应用,比如可以用来求矩阵的秩,对于阶数偏大的矩阵,即使用初等变换的方法,也是计算量很大的,而把矩阵分解后可以使计算简单。
再如,在线性代数中求矩阵的n 次幂是很常见的,若是一板一眼的进行矩阵相乘,当n 较大时计算量可想而知,况且,当n逐渐增大或是非纯数据间的运算的情况下,根本就没有计算的可能,此时,矩阵分解方法的应用可以令问题变得简单而易懂。
判断矩阵的正定性需要不断的计算行列式,计算量大而复杂,矩阵分解可以使之更简单直接。
矩阵的分解作用很广泛,在不同的领域都发挥着其独特的作用,只要应用得好,肯定可以使原有的问题简单而易于理解。
我们知道,矩阵理论就其理论来说,对于除了数学本专业的人而言,意义是不大的。
纯理论的学习是枯燥而乏味的,只有和是具体问题的结合才会显出它的强大生命力。