矩阵理论3.1 特征值界的估计
矩阵特征值和特征向量的求法与应用
毕业论文(设计)题目:矩阵特征值和特征向量的求法与应用毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。
尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。
对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。
作者签名:日期:指导教师签名:日期:使用授权说明本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。
作者签名:日期:学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。
除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。
对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
本人完全意识到本声明的法律后果由本人承担。
作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
涉密论文按学校规定处理。
作者签名:日期:年月日导师签名:日期:年月日注意事项1.设计(论文)的内容包括:1)封面(按教务处制定的标准封面格式制作)2)原创性声明3)中文摘要(300字左右)、关键词4)外文摘要、关键词5)目次页(附件不统一编入)6)论文主体部分:引言(或绪论)、正文、结论7)参考文献8)致谢9)附录(对论文支持必要时)2.论文字数要求:理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。
矩阵特征值的估计
解
A
m∞
= n max aij = 3 × 2 = 6,
1≤i , j ≤ n
1 A + AH 2 1 A − AH 2
m∞
m∞
1 0 m = 0, = ∞ 2 1 1 H = A− A = 2A m∞ 2 2
m∞
6, =
由定理2知, λ ≤ 6,Re λ = 0,Im λ ≤ 6.
由此可知,A的特征值为0或纯虚数.
= i 1= j 1
证
∑∑ a η η
ij i
n
n
j
≤ ∑∑ aij ηi η j
= i 1= j 1
n
n
≤ max aij
1≤i , j ≤ n
= i 1= j 1
∑∑ η
n
n
i
ηj
n n 1 2 ≤ max aij ∑∑ ηi + η j 2 1≤i , j ≤ n = i 1= j 1
(
2
)
G′j = z ∈ C z − a jj ≤ R′j 为A的第j个列盖尔圆.
{
} ( j =1, 2, , n )
0.02 0.11 1 0.14 如A = 0.01 i 0.02 0.01 0.5 的三个盖尔圆为: G1 = G2 G3
i
R2 = 0.15
于是 AF =
n 2 = i 1 2
R F tr ( R H R ) =
2 1≤i < j ≤ n = i 1
= ∑ λi +
∑
rij ≥ ∑ λi .
2 2
n
§5.2 矩阵特征值的分布区域
一、圆盘定理 1. Gerschgorin圆(盖尔圆) 定义1
矩阵特征值和特征向量的研究
矩阵特征值和特征向量的研究首先,我们来定义矩阵的特征值和特征向量。
对于一个n阶方阵A,如果存在一个非零向量X使得AX=λX,其中λ为一个常数,则称λ为矩阵A的一个特征值,称X为对应于特征值λ的特征向量。
特征值和特征向量满足这个特殊的关系,可以用来研究矩阵的性质和变换。
接下来,我们来讨论一些矩阵特征值和特征向量的性质。
首先,矩阵的特征值和特征向量与矩阵的行列式和迹有关。
设A为一个n阶方阵,其特征值为λ1,λ2,...,λn,特征向量为X1,X2,...,Xn,则有以下性质:1. 所有特征值的和等于矩阵的迹:λ1+λ2+...+λn=tr(A)。
2.所有特征值的积等于矩阵的行列式:λ1λ2...λn=,A。
3.如果一个方阵A是可逆方阵,那么它的特征值都不为0。
4.如果一个方阵A的特征向量X对应的特征值λ,那么对于任意实数c,cX也是对应于λ的特征向量。
另外,矩阵的特征向量也具有以下一些性质:1.特征向量是线性无关的,即对应不同特征值的特征向量之间线性无关。
2.如果一个特征向量X对应的特征值λ是一个n重特征值,那么X 的一个非零分量为1,其他分量为0的向量也是对应于λ的特征向量,称为属于λ的基本特征向量。
矩阵特征值和特征向量在许多实际问题中有着广泛的应用。
其中,最常见的一种应用是在理解和分析线性变换和空间变换中。
对于一个线性变换T,其变换矩阵A的特征值和特征向量可以帮助我们理解该变换对于不同方向上的伸缩或压缩程度。
特别地,当特征值为1时,相应的特征向量表示空间中不变的方向。
另外,矩阵特征值和特征向量还可以用于解决大规模矩阵的特征值计算问题,例如在机器学习算法中的主成分分析(PCA)和奇异值分解(SVD)。
此外,矩阵特征值和特征向量还在图论、电力系统、量子力学等领域有重要应用。
在图论中,矩阵的特征值和特征向量可以用于研究图的结构和性质。
在电力系统中,通过矩阵特征值和特征向量的分析,可以评估系统的稳定性和准确地计算功率流分布。
矩阵特征值问题
§1、特征值的估计
由于工程计算中求矩阵尤其是高阶矩阵的 精确特征值通常比较困难,而许多情况下我们 只需要知道特征值在什么范围内变化或者落在 什么区域内,例如判断方阵的幂级数是否收敛 只要看方阵的特征值的模或谱半径是否小于1, 因此特征值的估计就显得尤其必要,这方面的 理论在特征值问题中相当经典。
由于
实际上是 的
一个
维子空间,因此我们希望将
搜索极值的空间放大到任意
维子空
间 。而增大后的集合的极大值不会比原集
合的小,极小值也不会比原集合大。
58
设有 则
,并假定
,即
59
并且当
时等号成立。因此
60
一般地,我们有
定理4 (Courant-Fischer)设
是
Hermite矩阵,其特征值为
,则
存在Hermite矩阵特征值的极值原理
48
一、 Rayleigh商
二次型
,如果存在
,那么
所以如果
,我们自然也希望
49
定义1 设
是Hermite矩阵,称
为矩阵 的Rayleigh商。 注意到
因此我们可以把对 在单位球面
的极性的讨论限定 上。
50
单位球面 是闭集,又因为
是 的连续
函数,因此根据多元函数的最值定理,
在 上存在最大值和最小值。由于特征值与
对于广义特征值问题
,可以通过
适当选择位移(shift)或极点(pole) ,再通过 求逆,将之转化为SEP:
这种方法的优点是特征向量不变,矩阵 奇 异时也可以使用,并且在求解邻近 的特征 值或绝对值很小的特征值时效率较高。缺点仍 然是 一般不是特殊矩阵。
第五章矩阵的特征值
第五章矩阵的特征值矩阵的特征值是线性代数中一个重要的概念。
它不仅在理论上具有重要意义,也在实际问题的求解中有广泛的应用。
本章将介绍特征值的定义和性质,以及求解特征值和特征向量的方法。
1.特征值的定义对于一个n阶方阵A,如果存在一个非零向量x使得Ax=kx,其中k 为常数,则称k为矩阵A的特征值,x为对应的特征向量。
特征值和特征向量总是成对出现的,且特征向量是非零的。
2.特征值与特征向量的性质2.1特征值的性质(1)特征值的个数等于矩阵的阶数n。
(2)特征值的和等于矩阵的迹,即trace(A)。
(3)特征值的乘积等于矩阵的行列式,即det(A)。
2.2特征向量的性质(1)特征向量的线性组合仍然是特征向量,对应的特征值不变。
(2)特征向量与特征值的对应关系是一一对应的。
3.求解特征值和特征向量的方法3.1特征方程法给定一个n阶方阵A,求解特征值和特征向量的方法之一是通过求解特征方程。
特征方程的定义是:det(A-kI)=0,其中I是单位矩阵,k是变量。
通过求解特征方程,即求解多项式det(A-kI)的根,可以得到所有的特征值。
特别地,对于二阶矩阵A的特征方程det(A-kI)=0可以化简为k^2-(a+d)k+ad-bc=0,其中a,b,c,d是矩阵A的元素。
这是一个一元二次方程,可以通过求根公式求解。
3.2幂法幂法是一种迭代算法,用于求解矩阵的最大特征值和对应的特征向量。
基本思想是通过迭代计算矩阵A的幂,使得向量序列收敛到A的最大特征向量对应的特征向量。
具体步骤如下:(1)选择一个初始的非零向量x0;(2)计算新的向量x1=Ax0;(3)归一化向量x1,即x1=x1/,x1,其中,x1,表示向量x1的模;(4)重复步骤(2)和(3),直到向量序列收敛。
经过多次迭代后,向量序列将收敛到A的特征向量。
4.应用举例特征值和特征向量在许多实际问题中有广泛的应用,例如:(1)求解线性方程组:矩阵A的特征值可以用于判断线性方程组的解的情况。
31矩阵的特征值和特征向量
31矩阵的特征值和特征向量矩阵的特征值和特征向量是线性代数中非常重要的概念,它们在许多领域,包括物理学、工程学和计算机科学等领域都有广泛的应用。
在这篇文章中,我们将详细介绍特征值和特征向量的概念,以及它们的性质和计算方法。
矩阵的特征值和特征向量是描述矩阵性质的重要工具,它们可以通过以下的定义来形式化地描述:设A是一个n阶矩阵,非零向量x是一个特征向量,如果存在一个标量λ使得Ax=λx,那么λ称为矩阵A的特征值,x称为对应于特征值λ的特征向量。
特征值和特征向量之间的关系可以通过下面的等式来表示:A*x=λ*x其中A是n阶矩阵,x是n维列向量,λ是常数。
特征向量x可以通过在矩阵A上进行变换获得。
特征值和特征向量的重要性在于它们可以帮助我们理解矩阵的性质和结构。
特征值告诉我们矩阵在特定方向上的伸缩比例,而特征向量告诉我们这个伸缩是在哪个方向上进行的。
接下来我们将详细讨论特征值和特征向量的计算方法以及它们的性质。
首先是特征值的计算方法。
特征值的计算通常需要解决矩阵的特征方程,即det(A-λI) = 0,其中det表示行列式,A是矩阵,λ是特征值,I是单位矩阵。
解特征方程可以得到矩阵的特征值。
特征值的计算是一个重要的数值计算问题,通常需要使用特征值分解等方法来求解。
接下来是特征向量的计算方法。
特征向量可以通过特征值代入矩阵方程A*x=λ*x来求解。
特征向量并不唯一,通常需要进行归一化处理来得到标准化的特征向量。
特征值和特征向量具有一些重要的性质:1.矩阵的特征值的个数等于矩阵的阶数。
一个n阶矩阵有n个特征值。
2.特征值是矩阵的一个不变量,即矩阵相似的矩阵具有相同的特征值。
3.特征向量构成的集合是矩阵的一个子空间,称为特征子空间。
4.特征值和特征向量可以帮助进行矩阵的对角化,即将矩阵表示为对角矩阵的形式。
特征值和特征向量在实际应用中有广泛的应用。
例如在物理学中,特征值和特征向量可以描述量子力学中的能级和波函数;在工程学中,特征值和特征向量可以用来优化矩阵和向量的运算;在计算机科学中,特征值和特征向量可以用来进行图像处理和模式识别等任务。
矩阵的特征值与特征向量 正文
引言众所周知,矩阵理论在历史上至少可以追溯到Sylvester与Cayley,特别是Cayley1858年的工作。
自从Cayley建立矩阵的运算以来,矩阵理论便迅速发展起来,矩阵理论已是高等代数的重要组成部分。
近代数学的一些学科,如代数结构理论与泛函分析可以在矩阵理论中寻找它们的根源。
另一方面,作为一种基本工具,矩阵理论在应用数学与工程技术学科,如微分方程、概率统计、最优化、运筹学、计算数学、控制论与系统理论等方面有着广泛的应用。
同时,这些学科的发展反过来又极大地促进了矩阵理论的发展。
特征值与特征向量是矩阵理论中既具有基本理论意义,又具有重要应用价值的知识,与矩阵理论的其它知识也有着密切的联系。
可以说,特征值与特征向量问题是矩阵理论的基本核心问题。
因此,掌握这方面的知识对于培养新的高素质科技人才来说是必备的非常重要的。
矩阵是高等代数课程的一个基本概念是研究高等代数的基本工具。
线性空间、线性变换等,都是以矩阵作为手段,由此演绎出丰富多彩的理论画卷。
求解矩阵的特征值和特征向量,是高等数学中经常碰到的问题。
一般的线性代数教材中,都是先计算特征多项式,然后求得特征值,再通过解线性方程组得到对应的特征向量。
特征多项式和特征根在整个矩阵理论体系中具有举足轻重的作用,并且在于生活现实中的应用也很广泛。
“特征”一词来自德语的eigen,由希尔伯特在1904年首先在这个意义下使用(亥尔姆霍尔兹在更早的时候也在类似意义下使用过这一概念)。
eigen一词可翻译为“自身的”,“特定于...的”,“有特征的”或者“个体的”,这强调了特征值对于定义特定的变换上是很重要的。
矩阵特征值是高等代数研究的中心问题之一,也是硕士研究生招生考试的热点.而且在自然科学(如物理学、控制论、弹性力学、图论等)和工程应用(如结构设计、振动系统、矩阵对策)的研究中也同样离不开矩阵特征值问题,因而对其研究具有重要的理论和应用价值。
随着计算机的迅速发展,现代社会的进步和科技的突飞猛进,高等代数作为一门基础的工具学科已经向一切领域渗透,它的作用越来越为世人所重视。
矩阵的特征值与特征向量认识矩阵的特征值与特征向量的计算方法
矩阵的特征值与特征向量认识矩阵的特征值与特征向量的计算方法矩阵在数学与物理等领域中起着重要的作用,而矩阵的特征值与特征向量是矩阵理论中的重要概念。
本文将介绍矩阵的特征值与特征向量的定义与性质,并探讨了计算矩阵特征值与特征向量的方法。
一、矩阵的特征值与特征向量的定义在介绍矩阵的特征值与特征向量之前,我们先来了解一下矩阵的基本概念。
矩阵是由若干个数按照一定的规则排列成的矩形阵列。
矩阵可以表示成一个二维数组,其中的元素用于表示矩阵中的各个数值。
矩阵的特征值与特征向量是对矩阵进行分析与求解时非常有用的工具。
特征值可以理解为矩阵在某个方向上的缩放因子,而特征向量则表示在特征值对应的方向上的向量。
对于一个n阶矩阵A,如果存在一个非零向量X,使得AX=λX,其中λ是一个常数,那么称λ为矩阵A的特征值,X为矩阵A对应于特征值λ的特征向量。
特征值与特征向量的定义虽然比较抽象,但是通过对矩阵进行相应的计算可以得到具体的数值结果。
二、计算特征值与特征向量的方法1. 特征值的计算方法计算特征值的方法之一是通过求解矩阵特征方程来完成。
对于一个n阶矩阵A,其特征方程可以表示为det(A-λI)=0,其中det表示矩阵的行列式,I是单位矩阵,λ是特征值。
解特征方程可以得到矩阵的特征值。
由于特征方程是一个n次多项式方程,所以一般情况下可以得到n个特征值。
特征值的个数与矩阵的阶数相等。
2. 特征向量的计算方法计算特征值后,我们可以通过特征值来求解特征向量。
对于特征值λ,我们需要求解矩阵(A-λI)X=0的非零解,其中X是特征向量。
解特征向量的过程可以通过高斯消元法或者矩阵的初等变换来完成,得到的非零解即为特征向量。
三、特征值与特征向量的性质矩阵的特征值与特征向量具有一些重要的性质,这些性质在矩阵理论与应用过程中都具有重要作用。
1. 特征值和特征向量的对应关系对于一个n阶矩阵A,它有n个特征值与n个相应的特征向量。
特征值与特征向量是一一对应的关系,即每个特征值对应一个特征向量。
矩阵的运算与特征值特征向量
矩阵的运算与特征值特征向量矩阵是线性代数中一个重要的概念,它广泛应用于各个领域,包括计算机科学、物理学、经济学等等。
而矩阵的运算和特征值特征向量是矩阵理论中的基础知识,对于深入理解矩阵以及其在实际问题中的应用具有重要意义。
一、矩阵的运算1. 矩阵的加法和减法矩阵的加法和减法是指将两个相同大小的矩阵进行逐元素的相加或相减。
如果两个矩阵的维度相同,则它们可以进行加法或减法运算。
具体计算方法是将两个矩阵对应位置的元素进行相加或相减,得到的结果构成一个新的矩阵。
2. 矩阵的乘法矩阵的乘法是指将一个矩阵的行与另一个矩阵的列进行逐元素的相乘,并将结果相加得到新的矩阵。
在矩阵乘法中,乘法的前提是左边矩阵的列数等于右边矩阵的行数。
乘法的结果是一个新的矩阵,其行数等于左矩阵的行数,列数等于右矩阵的列数。
3. 矩阵的转置矩阵的转置是指将矩阵的行和列互换得到一个新的矩阵。
转置后的矩阵行和列的顺序发生了变化,原矩阵的第i行转置后变为新矩阵的第i列。
矩阵的转置操作可以通过交换矩阵中元素的索引实现。
二、特征值与特征向量1. 特征值在矩阵理论中,特征值是与方阵相对应的一个数量。
如果存在一个非零向量,使得这个向量与矩阵相乘后仍然是这个向量的一个倍数,并且这个倍数就是一个实数λ,则称实数λ为矩阵的特征值。
特征值可以帮助我们了解矩阵变换的重要性质和特征。
2. 特征向量特征向量是与特征值对应的向量,它描述了矩阵变换过程中的不变方向。
特征向量和特征值是一一对应的关系,一个特征值可能对应多个特征向量。
特征向量可以用来描述矩阵变换的轴线和缩放比例。
三、矩阵的运算与特征值特征向量的关系矩阵的运算与特征值特征向量之间有着密切的联系。
通过矩阵的运算,我们可以求解矩阵的特征值和特征向量。
1. 矩阵的运算与特征值矩阵的运算可以帮助我们求解矩阵的特征值。
通过对矩阵进行特征值运算,我们可以得到矩阵的特征值。
特征值具有重要的物理和几何意义,可以帮助我们分析矩阵的性质和变换过程。
第章矩阵特征值的计算
第章矩阵特征值的计算矩阵特征值是矩阵理论中的一个重要概念,它在很多领域中都有广泛的应用,如物理、化学、工程等。
本文将从特征值的定义、计算方法和应用举例等方面进行阐述。
一、特征值的定义对于一个n阶方阵A,如果存在一个非零向量x,使得Ax=kx,其中k 是一个常数,那么k称为A的特征值,x称为A的对应于特征值k的特征向量。
从定义可以看出,矩阵A的特征值和特征向量是成对出现的,特征向量可以是一个实数或是一个向量,特征值可以是实数或是复数。
二、特征值的计算方法1.直接计算法此方法适合于较小的矩阵。
给定一个n阶矩阵A,首先构造特征方程det(A-λI)=0,其中I是n阶单位矩阵,λ是未知数,然后求解特征方程得到特征值,将特征值代入(A-λI)x=0求解对应的特征向量。
2.幂法幂法是一种迭代方法,适用于大型矩阵。
假设特征值的绝对值最大,那么从非零向量b开始迭代过程,令x0=b,求解x1=A*x0,然后再将x1作为初始值,求解x2=A*x1,以此类推,直到收敛为止。
最后,取最终得到的向量xn,其模即为特征值的近似值。
3.QR方法QR方法是一种迭代方法,可以用于寻找特征值和特征向量。
首先将矩阵A分解为QR,其中Q是正交矩阵,R是上三角矩阵,然后对R进行迭代,重复进行QR分解,直到收敛。
最后,得到的上三角矩阵的对角元素即为特征值的近似值,在QR分解的过程中,特征向量也可以得到。
三、特征值的应用举例1.物理学中的量子力学量子力学中的哈密顿算符可以表示为一个矩阵,物理量的测量值就是对应的特征值。
例如,电子的自旋可以有上自旋和下自旋两种状态,上自旋对应的特征值为1,下自旋对应的特征值为-12.工程中的振动问题在工程中,矩阵特征值可以用来求解振动问题。
例如,振动系统的自由度决定了特征向量的个数,而特征值则表示了振动的频率。
通过计算矩阵的特征值和特征向量,可以预测系统的振动频率和振型。
3.网络分析中的中心性度量在网络分析中,矩阵特征值可以用来计算节点的中心性度量。
求矩阵特征值的方法
求矩阵特征值的方法矩阵特征值是矩阵理论中的一个重要概念,它在许多领域中都有着广泛的应用,如物理学、工程学、计算机科学等。
求矩阵特征值的方法有多种,下面将介绍其中的三种常用方法。
一、特征多项式法特征多项式法是求矩阵特征值的一种常用方法。
它的基本思想是将矩阵A与一个未知数λ相乘,得到一个新的矩阵B=A-λI,其中I为单位矩阵。
然后求解矩阵B的行列式,得到一个关于λ的多项式,称为特征多项式。
矩阵A的特征值就是使特征多项式等于零的λ值。
具体步骤如下:1. 构造矩阵B=A-λI。
2. 求解矩阵B的行列式det(B)。
3. 解特征多项式det(B)=0,得到矩阵A的特征值λ。
二、幂法幂法是求矩阵特征值的一种迭代方法。
它的基本思想是从一个任意的非零向量开始,不断地将其乘以矩阵A,直到向量的方向趋于特征向量的方向,同时向量的模长趋于特征值的绝对值。
具体步骤如下:1. 选择一个任意的非零向量x0。
2. 迭代计算xn+1=Axn/||Axn||,其中||Axn||为Axn的模长。
3. 当xn+1与xn的差值小于某个预设的精度时,停止迭代,此时xn 的模长即为矩阵A的最大特征值,xn/||xn||即为对应的特征向量。
三、QR分解法QR分解法是求矩阵特征值的一种数值方法。
它的基本思想是将矩阵A 分解为QR,其中Q为正交矩阵,R为上三角矩阵。
然后对R进行迭代,得到一个对角矩阵,对角线上的元素即为矩阵A的特征值。
具体步骤如下:1. 对矩阵A进行QR分解,得到A=QR。
2. 对R进行迭代,得到一个对角矩阵D,对角线上的元素即为矩阵A的特征值。
以上三种方法都有其优缺点,具体选择哪种方法取决于实际应用场景和计算需求。
在实际应用中,还可以结合多种方法进行求解,以提高计算精度和效率。
特征值特征向量的判定
特征值特征向量的判定特征值和特征向量是矩阵理论中非常重要的概念,它们在线性代数、计算机视觉、信号处理等领域都有广泛应用。
本文将从特征值和特征向量的定义、计算方法以及判定条件三个方面进行详细介绍。
一、特征值和特征向量的定义1.1 特征值的定义对于一个n阶方阵A,如果存在一个数λ和一个n维非零向量x,使得下式成立:Ax = λx则称λ为矩阵A的一个特征值,x为对应于λ的特征向量。
1.2 特征向量的定义对于一个n阶方阵A和它的一个特征值λ,如果存在一个n维非零向量x,使得下式成立:Ax = λx则称x是矩阵A对应于特征值λ的一个特征向量。
二、特征值和特征向量的计算方法2.1 计算方法一:求解矩阵A减去λI后的行列式为0所得到的方程组假设矩阵A是一个3×3矩阵,则其对应的特征值λ满足以下方程:| A - λI | = 0其中I是单位矩阵,| · |表示行列式。
将上式展开可得:( a11 - λ ) ( a22 - λ ) ( a33 - λ ) - a12 a23 a31 - a13 a21 a32 = 0 解这个方程可以得到矩阵A的特征值。
2.2 计算方法二:使用特征多项式特征多项式是一个关于λ的n次多项式,定义为:| A - λI | = det( A - λI )其中det表示行列式。
将特征多项式展开后,可以得到:λ^n + c1λ^(n-1) + c2λ^(n-2) + … + cn-1λ + cn = 0其中c1、c2、…、cn-1、cn都是矩阵A的元素和单位矩阵I的函数。
解这个方程可以得到矩阵A的特征值。
2.3 计算方法三:幂迭代法幂迭代法是一种迭代求解矩阵最大特征值和对应特征向量的算法。
其基本思想是将一个初始向量x通过不断迭代和归一化,使其逐渐趋近于最大特征值所对应的特征向量。
具体来说,假设矩阵A有一个最大特征值λ1和对应的特征向量x1,则有:A^kx → λ1^k x1 (k → ∞)其中“→”表示趋近于。
线性代数中的矩阵理论及其应用
线性代数中的矩阵理论及其应用线性代数是近年来非常热门的学科,它广泛应用于物理和工程等领域,包括机器学习、图像和信号处理、网络分析和优化,数学建模等等。
而矩阵理论是线性代数中的重要分支,是许多应用的基础。
本文将介绍矩阵理论的基本概念和应用,以及其中一些重要的定理和算法。
一、矩阵的基本概念在矩阵理论中,矩阵是指一个由m行n列元素组成的矩形阵列,通常用A=[aij]表示,其中i代表行号,j代表列号,aij代表矩阵A中的第i行第j列的元素。
当m=n时,矩阵A称为方阵,元素aij对应于A的第i个行向量和第j个列向量的内积。
对于矩阵A和B,它们的和C=A+B是一个矩阵,其中C的每个元素都等于对应位置上A和B的元素之和。
同样地,矩阵的差和数乘分别为D=A-B和E=kA,其中D的每个元素都等于对应位置上A和B的元素之差,E的每个元素都等于A的对应元素乘以k。
此外,矩阵的转置AT是一个矩阵,其中AT的第i行第j列的元素等于A的第j行第i列的元素。
二、矩阵的应用矩阵理论的应用非常广泛,以下介绍一些常见的应用。
1.线性方程组的求解线性方程组的求解是矩阵理论的基础应用之一。
对于一个n元线性方程组Ax=b,其中A是一个n行n列的矩阵,x和b都是n 维列向量,x的每个元素都代表方程组的一个未知数,b的每个元素都代表方程组的一个常数项。
则方程组的解为x=A-1b,其中A-1是矩阵A的逆矩阵。
若A没有逆矩阵,则方程组无解或有无穷解。
2.特征值和特征向量特征值和特征向量也是矩阵理论中的重要概念之一。
对于一个n阶方阵A,若存在一个非零向量x,以及一个标量λ,使得Ax=λx,则λ是矩阵A的一个特征值,x是对应的特征向量。
特征值和特征向量可以用来描述矩阵的几何特性和运动轨迹,以及在状态空间中的扭曲和伸缩等现象。
3.奇异值分解奇异值分解(SVD)是矩阵理论中的另一个重要概念,可以用来分析矩阵的结构和性质。
对于一个m行n列的矩阵A,它的奇异值分解为A=UΣVT,其中U是一个m行m列的正交矩阵,VT是一个n行n列的正交矩阵,Σ是一个m行n列的矩形对角矩阵。
矩阵特征值计算
其 中 每个 对角 块 ������������������ 均 为方阵 , 则矩 阵 ������ 的 特征 值为各 对 角块 矩阵 特征 值的合 并 ,即 ������(������) = ⋃������ ������=1 ������(������������������ ). 定理 5.5: 矩阵的相似变换(similarity transformation)不改变特征值. 设矩阵������和������为相似矩阵, 即存在非奇异矩阵������使得������ = ������−1 ������������,则 (1) 矩阵������和������的特征值相等,即 ������(������) = ������(������) ; (2) 若������为������的特征向量,则相应地,������������为������的特征向量. 通过相似变换并不总能把矩阵转化为对角阵,或者说矩阵 ������ 并不总是 可对角化 的 (diagonalizable). 下面给出特征值的代数重数、几何重数,和亏损矩阵的概念,以及几个定 理.. ̃1 , ⋯ , ������ ̃������ ,若������ ̃������ 是特征方程的������������ 重 定义 5.2: 设矩阵������ ∈ ℝ������×������ 有 m 个(mn)不同的特征值������ ̃������ 的代数重数(algebraic multiplicity),并称������ ̃������ 的特征子空间(ℂ������ 的子空间)的维数 根,则称������������ 为������ ̃������ 的几何重数(geometric multiplicity). 为������ ̃1 , ⋯ , ������ ̃������ ,特征值������ ̃������ , (������ = 1, ⋯ , ������)的代数 定理 5.6:设矩阵������ ∈ ℝ������×������ 的 m 个不同的特征值为������ 重数为������������ ,几何重数为������������ ,则 (1) ∑������ ������=1 ������������ = ������,且任一个特征值的几何重数不大于代数重数,即∀������,������������ ≥ ������������ . (2) 不同特征值的特征向量线性无关,并且将所有特征子空间的∑������ ������=1 ������������ 个基(特征向量)放在 一起,它们构成一组线性无关向量. (3) 若每个特征值的代数重数等于几何重数,则总共可得������个线性无关的特征向量,它们是 全空间ℂ������ 的基. 定义 5.3:若矩阵������ ∈ ℝ������×������ 的某个代数重数为 k 的特征值对应的线性无关特征向量数目少于 k(即几何重数小于代数重数) ,则称 ������为亏损阵(defective matrix) ,否则称其为非亏损阵 (nondefective matrix). 定理 5.7:设矩阵������ ∈ ℝ������×������ 可对角化,即存在非奇异矩阵������ ∈ ℂ������×������ 使得 ������−1������������ = ������, 其中������ ∈ ℂ������×������ 为对角阵, 的充要条件是������为非亏损矩阵. 此时,������的对角线元素为矩阵������的特 征值,而矩阵������的列向量为 n 个线性无关的特征向量. 定理 5.7 中方程的等价形式为������ = ������������������−1, 它被称为特征值分解,也叫谱分解(spectrum decomposition). 特征值分解存在的充要条件是������为非亏损矩阵. 但现实中还有很多矩阵是亏 损矩阵,例如例 5.2 中的矩阵,它的特征值 2 的代数重数为 2,而几何重数仅为 1. 这种矩阵
随机矩阵特征值分布极限定理
随机矩阵特征值分布极限定理随机矩阵是指矩阵中的元素是随机变量的矩阵。
在数学和统计学中,随机矩阵特征值分布极限定理是研究随机矩阵的性质和分布的重要结果。
它在多领域中有着广泛的应用,例如统计学、物理学和工程学等。
1. 引言随机矩阵在现实世界中有着广泛的应用,它可以用来描述复杂系统的行为。
特征值是矩阵的一个重要属性,它可以反映矩阵的特性和结构。
随机矩阵特征值分布极限定理研究的目的是探究随机矩阵的特征值在大规模情况下的分布情况。
2. 雅克比矩阵和性质在随机矩阵的研究中,雅克比矩阵是一个重要的工具。
雅克比矩阵是对称矩阵的一个变换,它在随机矩阵特征值分布极限定理的证明中发挥了重要作用。
3. 马尔可夫链马尔可夫链是一种随机过程,它具有无记忆性。
在随机矩阵特征值分布极限定理中,马尔可夫链的性质被用来研究特征值的分布。
4. 随机矩阵特征值的分布随机矩阵特征值的分布是一个重要的研究内容,它可以帮助我们了解随机矩阵的性质和结构。
随着矩阵维数的增加,特征值的分布呈现出一定的规律性,并且可以用数学模型进行描述。
5. 极限定理的证明随机矩阵特征值分布极限定理的证明是一个复杂而严谨的过程。
在证明中,我们需要运用数学分析和概率论的知识,通过推理和推导来得到结论。
6. 应用领域和意义随机矩阵特征值分布极限定理在多个领域有着广泛的应用和意义。
在统计学中,它可以用来分析和推断数据集的特征;在物理学中,它可以帮助我们理解和解释自然界中复杂系统的行为;在工程学中,它可以用来设计和优化系统的性能。
7. 发展趋势和挑战随机矩阵特征值分布极限定理作为一个重要的研究领域,仍然存在许多未解决的问题和挑战。
如何推广和拓展这一理论,以适应更加复杂和多样化的实际问题,是未来的发展方向。
结论随机矩阵特征值分布极限定理是研究随机矩阵的分布特性的重要结果。
它通过数学模型和推理推导,揭示了随机矩阵特征值的分布规律,并在多个领域中有着广泛的应用。
随着科学技术的进步和理论的发展,随机矩阵特征值分布极限定理将会在更多实际问题中得到应用,并推动相关领域的发展。
矩阵特征值计算
第五章矩阵特征值计算与线性方程组的求解问题一样,矩阵特征值与特征向量的计算也是数值线性代数的重要内容. 在理论上,矩阵的特征值是特征多项式方程的根,因此特征值的计算可转化为单个多项式方程的求解. 然而对于高阶矩阵,这种转化并不能使问题得到简化,而且在实际应用中还会引入严重的数值误差. 因此,正如第二章指出的,我们一般将多项式方程求解转化为矩阵特征值计算问题,而不是反过来.本章介绍有关矩阵特征值计算问题的基本理论和算法. 与非线性方程求根问题类似,计算矩阵特征值的算法也是迭代方法①.5.1基本概念与特征值分布本节先介绍矩阵特征值、特征向量的基本概念和性质,然后讨论对特征值分布范围的简单估计方法.5.1.1基本概念与性质定义5.1:矩阵A=(a kj)∈ℂn×n,(1) 称φ(λ)=det(λI−A)=λn+c1λn−1+⋯+c n−1λ+c n为A的特征多项式(characteristic polynomial);n次代数方程φ(λ)=0为A的特征方程(characteristic equation),它的n个根:λ1,⋯,λn,被称为A的特征值(eigenvalue). 此外,常用λ(A)表示A的全体特征值的集合,也称为特征值谱(spectrum of eigenvalue).(2) 对于矩阵A的一个给定特征值λ,相应的齐次线性方程组(λI−A)x=0 , (5.1)有非零解(因为系数矩阵奇异),其解向量x称为矩阵A对应于λ的特征向量(eigenvector).根据方程(5.1),我们得出矩阵特征值与特征向量的关系,即Ax=λx .(5.2)第三章的定义3.5就利用公式(5.2)对矩阵特征值和特征向量进行了定义,它与定义5.1是等价的. 另外,同一个特征值对应的特征向量一定不唯一,它们构成线性子空间,称为特征子空间(eigenspace).我们一般讨论实矩阵的特征值问题. 应注意,实矩阵的特征值和特征向量不一定是实数和实向量,但实特征值一定对应于实特征向量(方程(5.1)的解),而一般的复特征值对应的特征向量一定不是实向量. 此外,若特征值不是实数, 则其复共轭也一定是特征值(由于特征方程为实系数方程). 定理3.3表明,实对称矩阵A∈ℝn×n的特征值均为实数,存在n个线性无关、且正交的实特征向量,即存在由特征值组成的对角阵Λ和特征向量组成的正交阵Q,使得:A=QΛQ T.(5.3)例5.1(弹簧-质点系统):考虑图5-1的弹簧-质点系统,其中包括三个质量分别为m1、m2、m3的物体,由三个弹性系数分别为k1,k2,k3的弹簧相连,三个物体的位置均为时间的函数,①如果用有限次运算能求得一般矩阵的特征值,则多项式方程求根问题也可用有限次运算解决,这与阿贝尔证明的“高于4次的多项式并不都有用初等运算表示的求根公式”的理论矛盾.这里考查三个物体偏离平衡位置的位移,分别记为y 1(t), y 2(t), y 3(t). 因为物体在平衡状态所受的重力已经和弹簧伸长的弹力平衡,所以物体的加速度只和偏离平衡位置引起的弹簧伸长相关. 根据牛顿第二定律以及胡克定律(即弹簧的弹力与拉伸长度成正比)可列出如下微分方程组②: My ′′(t)+Ky(t)=0 ,其中y (t )=[y 1(t)y 2(t)y 3(t)]T ,M =[m 1000m 2000m 3],K =[k 1+k 2−k 20−k 2k 2+k 3−k 30−k 3k 3] . 在一般情况下,这个系统会以自然频率ω做谐波振动,而y 的通解包含如下的分量: y j (t )=x j e iωt ,(j =1,2,3)其中i =√−1,根据它可求解出振动的频率ω及振幅x j . 由这个式子可得出:y j ′′(t )=−ω2x j e iωt ,(j =1,2,3)代入微分方程,可得代数方程:−ω2Mx +Kx =0,或Ax =λx ,其中A =M −1K ,λ=ω2. 通过求解矩阵A 的特征值便可求出这个弹簧-质点系统的自然频率(有多个). 再结合初始条件可确定这三个位移函数,它们可能按某个自然频率振动(简正振动),也可能是若干个简正振动的线性叠加.例5.2(根据定义计算特征值、特征向量):求矩阵A =[5−1−131−14−21]的特征值和特征向量.[解]: 矩阵A 的特征方程为:det (λI −A )=|λ−511−3λ−11−42λ−1|=(λ−3)(λ−2)2=0故A 的特征值为λ1=3,λ2=2(二重特征值).当λ=λ1=3时,由(λI −A)x =0,得到方程[−211−321−422][x 1x 2x 3]=[000]它有无穷多个解,若假设x 1=1, 则求出解为x =[1,1,1]T ,记为x 1,则x 1是λ1对应的一个特征向量.当λ=λ2=2时,由(λI −A)x =0,得到方程[−311−311−421][x 1x 2x 3]=[000]它有无穷多个解,若假设x 1=1, 则求出解为x =[1,1,2]T ,记为x 2,则x 2是λ2对应的一个特② 本书第八章将介绍这种常微分方程组的数值求解方法.图5-1 弹簧-质点系统.征向量.下面概括地介绍有关矩阵特征值、特征向量的一些性质,它们可根据定义5.1,以及公式(5.2)加以证明.定理5.1:设λj (j =1,2,…,n)为n 阶矩阵A 的特征值,则(1) ∑λj n j=1=∑a jj n j=1=tr(A) ;(2) ∏λj n j=1=det(A) .这里tr(A)表示矩阵对角线上元素之和,称为矩阵的迹(trace ).从上述结论(2)也可以看出,非奇异矩阵特征值均不为0, 而0一定是奇异矩阵的特征值. 定理5.2:矩阵转置不改变特征值,即λ(A )=λ(A T ).定理5.3:若矩阵A 为对角阵或上(下)三角阵,则其对角线元素即为矩阵的特征值.定理5.4:若矩阵A 为分块对角阵,或分块上(下)三角阵,例如A =[A 11A 12⋯A 1m A 22⋯A 2m ⋱⋮A mm] , 其中每个对角块A jj 均为方阵,则矩阵A 的特征值为各对角块矩阵特征值的合并,即λ(A )=⋃λ(A jj )m j=1.定理5.5:矩阵的相似变换(similarity transformation)不改变特征值. 设矩阵A 和B 为相似矩阵,即存在非奇异矩阵X 使得B =X −1AX ,则(1) 矩阵A 和B 的特征值相等,即 λ(A )=λ(B ) ;(2) 若y 为B 的特征向量,则相应地,Xy 为A 的特征向量.通过相似变换并不总能把矩阵转化为对角阵,或者说矩阵A 并不总是可对角化的(diagonalizable). 下面给出特征值的代数重数、几何重数,和亏损矩阵的概念,以及几个定理..定义5.2: 设矩阵A ∈ℝn×n 有m 个(m n )不同的特征值λ̃1,⋯,λ̃m ,若λ̃j 是特征方程的n j 重根,则称n j 为λ̃j 的代数重数(algebraic multiplicity),并称λ̃j 的特征子空间(ℂn 的子空间)的维数为λ̃j 的几何重数(geometric multiplicity). 定理5.6:设矩阵A ∈ℝn×n 的m 个不同的特征值为λ̃1,⋯,λ̃m ,特征值λ̃j ,(j =1,⋯,m)的代数重数为n j ,几何重数为k j ,则(1) ∑n j m j=1=n ,且任一个特征值的几何重数不大于代数重数,即∀j ,n j ≥k j .(2) 不同特征值的特征向量线性无关,并且将所有特征子空间的∑k j m j=1个基(特征向量)放在一起,它们构成一组线性无关向量.(3) 若每个特征值的代数重数等于几何重数,则总共可得n 个线性无关的特征向量,它们是全空间ℂn 的基.定义5.3:若矩阵A ∈ℝn×n 的某个代数重数为k 的特征值对应的线性无关特征向量数目少于k (即几何重数小于代数重数),则称A 为亏损阵(defective matrix ),否则称其为非亏损阵(nondefective matrix ).定理5.7:设矩阵A ∈ℝn×n 可对角化,即存在非奇异矩阵X ∈ℂn×n 使得X −1AX =Λ,其中Λ∈ℂn×n 为对角阵, 的充要条件是A 为非亏损矩阵. 此时,Λ的对角线元素为矩阵A 的特征值,而矩阵X 的列向量为n 个线性无关的特征向量.定理5.7中方程的等价形式为A =XΛX −1, 它被称为特征值分解,也叫谱分解(spectrum decomposition). 特征值分解存在的充要条件是A 为非亏损矩阵. 但现实中还有很多矩阵是亏损矩阵,例如例5.2中的矩阵,它的特征值2的代数重数为2,而几何重数仅为1. 这种矩阵不能相似变换为对角阵,但存在下面的若当分解(Jordan decomposition).定理5.8:设矩阵A ∈ℝn×n , 存在非奇异矩阵X ∈ℂn×n 使得A =XJX −1,矩阵J 为形如[J 1⋱J p ]的分块对角阵(称为若当标准型),其中J k =[ λk 1λk ⋱⋱1λk ] 称为若当块,其对角线元素为矩阵A 的特征值. 设矩阵A 有m 个不同的特征值为λ̃1,⋯,λ̃m ,特征值λ̃j ,(j =1,⋯,m)的代数重数为n j ,几何重数为k j ,则p =∑k j m j=1, λ̃j 对应于k j 个若当块, 其阶数之和等于n j .在若当分解中,如果所有若当块都是1阶的,则J 为对角阵,这种分解就是特征值分解,相应的矩阵为非亏损阵. 若当分解是很有用的理论工具,利用它还可证明下面关于矩阵运算结果的特征值的定理.定理5.9:设λj (j =1,2,…,n)为n 阶矩阵A 的特征值,则(1) 矩阵cA, c 为常数, 的特征值为cλ1,cλ2,⋯,cλn .(2) 矩阵A +pI, p 为常数, 的特征值为λ1+p,λ2+p,⋯,λn +p.(3) 矩阵A k , k 为正整数, 的特征值为λ1k ,λ2k ,⋯,λn k .(4) 设p (t )为一多项式函数,则矩阵p (A )的特征值为p (λ1),p (λ2),⋯ ,p (λn ) .(5) 若A 为非奇异矩阵,则λj ≠0,(j =1,2,…,n), 且矩阵A −1的特征值为λ1−1,λ2−1,⋯,λn −1.5.1.2特征值分布范围的估计估计特征值的分布范围或它们的界,无论在理论上或实际应用上,都有重要意义. 比如,本书前面的内容曾涉及两个问题:(1). 计算矩阵的2-条件数:cond (A )2=√λmax (A T A)λmin (A T A) ;(2). 考察一阶定常迭代法x (k+1)=Bx (k)+f 的收敛性、收敛速度:收敛的判据是谱半径ρ(B)=max 1≤j≤n |λj (B)|<1 ; 收敛速度为R =−log 10ρ(B) .其中都需要对矩阵特征值分布范围的了解.上一章的定理4.4说明谱半径的大小不超过任何一种算子范数,即ρ(A )≤‖A ‖ ,这是关于特征值的上界的一个重要结论.下面先给出定义5.4,再介绍有关特征值的界的另一个重要结论.定义5.4:设A =(a kj )∈ℂn×n ,记r k =∑|a kj |n j=1j≠k ,(k =1,⋯,n),则集合D k ={z||z −a kk |≤r k ,z ∈ℂ},(k =1,⋯,n)在复平面为以a kk 为圆心、r k 为半径的圆盘,称为A 的Gerschgorin (格什戈林)圆盘.图5-2显示了一个3⨯3复矩阵的格什戈林圆盘.定理5.10 (圆盘定理):设A =(a kj )∈ℂn×n ,则:(1) A 的每一个特征值必属于A 的格什戈林圆盘之中,即对任一特征值λ必定存在k,1≤k ≤n ,使得:|λ−a kk |≤∑|a kj |nj=1j≠k .(5.4)图5-2 复坐标平面,以及3⨯3矩阵A 的格什戈林圆盘.用集合的关系来说明,这意味着λ(A)⊆⋃D k n k=1.(2) 若A 的格什戈林圆盘中有m 个组成一连通并集S ,且S 与余下的n −m 个圆盘分离,则S内恰好包含A 的m 个特征值(重特征值按重数计).对图5-2所示的例子,定理5.10的第(2)个结论的含义是:D 1中只包含一个特征值,而另外两个特征值在D 2,D 3的并集中. 下面对定理5.10的结论(1)进行证明,结论(2)的证明超出了本书的范围.[证明]: 设λ为A 的任一特征值,则有Ax =λx ,x 为非零向量. 设x 中第k 个分量最大,即|x k |=max 1≤j≤n|x j |>0 , 考虑方程(5.2)中第k 个方程:∑a kj x j nj=1=λx k , 将其中与x k 有关的项移到等号左边,其余到右边,再两边取模得:|λ−a kk ||x k |=|∑a kj x j n j=1j≠k |≤∑|a kj ||x j |n j=1j≠k ≤|x k |∑|a kj |nj=1j≠k .(5.5)最后一个不等式的推导利用了“x 中第k 个分量最大”的假设. 将不等式(5.5)除以|x k |,即得到(5.4)式,因此证明了定理 5.10的结论(1). 上述证明过程还说明,若某个特征向量的第k 个分量的模最大,则相应的特征值必定属于第k 个圆盘中.根据定理5.2,还可以按照矩阵的每一列元素定义n 个圆盘,对于它们定理5.10仍然成立. 下面的定理是圆盘定理的重要推论,其证明留给感兴趣的读者.定理5.11:设A ∈ℝn×n ,且A 的对角元均大于0,则(1) 若A 严格对角占优,则A 的特征值的实部都大于0.(2) 若A 为对角占优的对称矩阵,则A 一定是对称半正定矩阵,若同时A 非奇异,则A 为对称正定矩阵.例5.3 (圆盘定理的应用):试估计矩阵A =[41010−111−4]的特征值范围.[解]: 直接应用圆盘定理,该矩阵的三个圆盘如下:D 1: |λ−4|≤1, D 2: |λ|≤2, D 3: |λ+4|≤2.D 1与其他圆盘分离,则它仅含一个特征值,且必定为实数(若为虚数则其共轭也是特征值,这与D 1仅含一个特征值矛盾). 所以对矩阵特征值的范围的估计是:3≤λ1≤5,λ2,λ3∈D 2∪D 3 .再对矩阵A T 应用圆盘定理,则可以进一步优化上述结果. 矩阵A T 对应的三个圆盘为: D ’1: |λ−4|≤2, D ’2: |λ|≤2, D ’3: |λ+4|≤1.这说明D ’3中存在一个特征值,且为实数,它属于区间[-5, -3],经过综合分析可知三个特征值均为实数,它们的范围是:λ1∈[3,5],λ2∈[−2,2],λ3∈[−5,−3].事实上,使用Matlab 的eig 命令可求出矩阵A 的特征值为:4.2030, -0.4429, -3.7601.根据定理5.5,还可以对矩阵A 做简单的相似变换,例如取X 为对角阵,然后再应用圆盘定理估计特征值的范围.例5.4 (特征值范围的估计):选取适当的矩阵X ,应用定理5.5和5.10估计例5.3中矩阵的特征值范围.[解]: 取X−1=[100010000.9] , 则A 1=X −1AX =[41010−109⁄0.90.9−4]的特征值与A 的相同. 对A 1应用圆盘定理,得到三个分离的圆盘,它们分别包含一个实特征值,由此得到特征值的范围估计:λ1∈[3,5],λ2∈[−199,199],λ3∈[−5.8,−2.2]. 此外,还可进一步估计ρ(A)的范围,即3≤ρ(A)≤5.8 .上述例子表明,综合运用圆盘定理和矩阵特征值的性质(如定理5.2, 定理5.5),可对特征值的范围进行一定的估计. 对具体例子,可适当设置相似变换矩阵,尽可能让圆盘相互分离,从而提高估计的有效性.5.2幂法与反幂法幂法是一种计算矩阵最大的特征值及其对应特征向量的方法. 本节介绍幂法、反幂法以及加快幂法迭代收敛的技术.5.2.1幂法定义5.5:在矩阵A 的特征值中,模最大的特征值称为主特征值,也叫“第一特征值”,它对应的特征向量称为主特征向量.应注意的是,主特征值有可能不唯一,因为模相同的复数可以有很多. 例如模为5的特征值可能是5,−5,3+4i,3−4i , 等等. 另外,请注意谱半径和主特征值的区别.如果矩阵A 有唯一的主特征值,则一般通过幂法能方便地计算出主特征值及其对应的特征向量. 对于实矩阵,这个唯一的主特征值显然是实数,但不排除它是重特征值的情况. 幂法(power iteration)的计算过程是,首先任取一非零向量v 0∈ℝn ,再进行迭代计算:v k =Av k−1,(k =1,2,⋯)得到向量序列{v k },根据它即可求出主特征与特征向量. 下面用定理来说明.定理5.12: 设A ∈ℝn×n ,其主特征值唯一,记为λ1,且λ1的几何重数等于代数重数,则对于非零向量v 0∈ℝn ,v 0不与主特征值对应的特征向量正交,按迭代公式进行计算:v k =Av k−1,(k =1,2,⋯),存在如下极限等式:lim k→∞v k λ1k =x 1 , (5.6) lim k→∞(v k+1)j (v k )j =λ1 , (5.7)其中x 1为主特征向量,(v k )j 表示向量v k 的第j 个分量(k =1,2,⋯).[证明]: 为了推导简便,不妨设主特征值λ1不是重特征值,并且假设矩阵A 为非亏损矩阵. 设A 的n 个特征值按模从大到小排列为: |λ1|>|λ2|≥⋯≥|λn |,它们对应于一组线性无关的单位特征向量x ̂1,⋯,x ̂n . 向量v 0可写成这些特征向量的线性组合:v 0=α1x̂1+⋯+αn x ̂n 根据已知条件,α1≠0,则v k =Av k−1=A k v 0=α1λ1k x ̂1+α2λ2k x̂2+⋯+αn λn k x ̂n =λ1k [α1x ̂1+∑αj (λj λ1)kx ̂j n j=2] =λ1k (α1x̂1+εk ) 其中εk =∑αj (λj λ1)k x ̂j n j=2. 由于|λj λ1|<1,(j =2,…,n), 则 lim k→∞εk =0 ⟹lim k→∞v kλ1k =α1x̂1 . 由于特征向量放大、缩小任意倍数后仍是特征向量,设x 1=α1x̂1,则它是主特征对应的一个特征向量. 上式说明,随k 的增大, v k 越来越趋近于主特征值的对应的特征向量.设j 为1到n 之间的整数,且(v k )j ≠0,则(v k+1)j (v k )j =λ1(α1x ̂1+εk+1)j (α1x̂1+εk )j 由于lim k→∞εk =0,随k 的增大上式等号右边趋于一个常数: λ1. 这就证明了定理的结论.若矩阵A 为亏损矩阵,可利用矩阵的若当分解证明这个定理,这里略去. 在这种情况下,“主特征值的几何重数等于代数重数”这一条件很重要,例如,若A =[310030001] ,它的主特征值为3,但其几何重数为1,不满足条件. 对这个矩阵A 进行实验显示无法用幂法求出主特征值.关于定理5.12,再说明几点:● 当主特征值λ1为重特征值时,应要求其几何重数等于代数重数,此时特征子空间维数大于1,向量序列{v k λ1k ⁄}的收敛值是其特征子空间中的某一个基向量.● 公式(5.7)式的含义是相邻迭代向量分量的比值收敛到主特征值. 因此在实际计算时,可任意取j 的值,只需保证比值的分母不为零.● 证明中假设了α1≠0,在实际应用中往往随机选取v 0,由于存在舍入误差,它一般都能满足. 感兴趣的读者也可思考一下,若初始向量v 0恰好与主特征向量都正交,那么幂法中的迭代向量序列会有什么结果?直接使用幂法,还存在如下两方面问题:(1) 溢出:由于v k ≈λ1k x 1,则|λ1|>1时,实际计算v k 会出现上溢出(当k 很大时);|λ1|<1时,实际计算v k 会出现下溢出(当k 很大时).(2) 可能收敛速度很慢. 由于εk =∑αj (λj λ1)kx j n j=2, εk →0的速度取决于求和式中衰减最慢的因子|λ2λ1|,当|λ2λ1|≈1时,收敛很慢. 由此导致v k →λ1k α1x 1, (v k+1)j (v k )j →λ1的收敛速度都将很慢,严重影响计算的效率.下面采用规格化向量的技术防止溢出,导出实用的幂法. 关于加速收敛技术的讨论,见下一小节.定义 5.6:记max ̅̅̅̅̅̅(v )为向量v ∈ℝn 的绝对值最大的分量, max ̅̅̅̅̅̅(v )=v j ,其中j 满足|v j |=max 1≤k≤n |v k |, 若j 的值不唯一,则取最小的那个. 并且,称u =v/max ̅̅̅̅̅̅(v )为向量v 的规格化向量(normalized vector).例5.5(规格化向量):设v =[3,−5,0]T ,max ̅̅̅̅̅̅(v )=−5,对应的规格化向量为u =[−35,1,0]T .根据定义5.6,容易得出规格化向量的两条性质.定理5.13: 定义5.6中的规格化向量满足如下两条性质:(1) 若u 为规格化向量,则‖u ‖ =1,并且max ̅̅̅̅̅̅(u )=1.(2) 设向量v 1和v 2的规格化向量分别为u 1和u 2,若v 1=αv 2, 实数α≠0,则u 1= u 2.在幂法的每一步增加向量规格化的操作可解决溢出问题. 先看第一步,v 1=Av 0,此时计算v 1的规格化向量u 1=v 1max ̅̅̅̅̅̅(v 1)=Av 0max ̅̅̅̅̅̅(Av 0). 然后使用规格化向量计算v 2:v 2=Au 1=A 2v 0max ̅̅̅̅̅̅(Av 0), (5.8) 再进行向量规划化操作,u 2=v 2max ̅̅̅̅̅̅(v 2)=A 2v 0max ̅̅̅̅̅̅(A 2v 0). (5.9) 公式(5.9)的推导,利用了(5.8)式和定理5.13的结论(2). 依次类推,我们得到: { v k =Au k−1=A k v 0max ̅̅̅̅̅̅(A k−1v 0) u k =v k max ̅̅̅̅̅̅(v k )=A k v 0max ̅̅̅̅̅̅(A k v 0) , k =1,2,⋯. (5.10) 根据定理5.12的证明过程, A k v 0=λ1k [α1x ̂1+∑αj (λj λ1)k x ̂j n j=2] ⟹u k =A k v 0max ̅̅̅̅̅̅(A k v 0)=α1x ̂1+∑αj (λj λ1)k x ̂j n j=2max ̅̅̅̅̅̅(α1x ̂1+∑αj (λj λ1)k x ̂j n j=2)k→∞→ x 1max ̅̅̅̅̅̅(x 1) , 即u k 逐渐逼近规格化的主特征向量. 同理,v k =Au k−1=A k v 0max ̅̅̅̅̅̅(A k−1v 0)=λ1k [α1x ̂1+∑αj (λj λ1)k x ̂j n j=2]max ̅̅̅̅̅̅(λ1k−1[α1x ̂1+∑αj (λj λ1)k−1x̂j n j=2]) =λ1α1x ̂1+∑αj(λj λ1)kx ̂j n j=2max ̅̅̅̅̅̅(α1x ̂1+∑αj (λj λ1)k−1x ̂j n j=2) 因此,根据定理5.13的结论(1)有:lim k→∞v k=λ1x1max̅̅̅̅̅̅(x1)⟹limk→∞max̅̅̅̅̅̅(v k)=λ1.基于上述推导,我们得到如下定理,以及如算法5.1描述的实用幂法.定理5.14: 设A∈ℝn×n,其主特征值唯一(且几何重数等于代数重数),记为λ1,取任意非零初始向量v0=u0,它不与主特征值对应的特征向量正交,按迭代公式(5.10)进行计算,则lim k→∞u k=x1max̅̅̅̅̅̅(x1),(5.11)lim k→∞max̅̅̅̅̅̅(v k)=λ1 ,(5.12)其中x1为主特征向量.算法5.1:计算主特征值λ1和主特征向量x1的实用幂法输入:v,A; 输出:x1,λ1.u:=v;While不满足判停准则dov:=Au;λ1:=max̅̅̅̅̅̅(v); {主特征值近似值}u:=v/λ1; {规格化}Endx1:=u. {规格化的主特征向量}在算法5.1中,可根据相邻两步迭代得到的主特征值近似值之差来判断是否停止迭代. 每个迭代步的主要计算是算一次矩阵与向量乘法,若A为稀疏矩阵则可利用它的稀疏性提高计算效率. 实用的幂法保证了向量序列{v k},{u k}不溢出,并且向量v k的最大分量的极限就是主特征值.最后,针对幂法的适用范围再说明两点:(1). 若实矩阵A对称半正定或对称半负定,则其主特征值必唯一(而且是非亏损阵). 有时也可以估计特征值的分布范围,从而说明主特征值的唯一性. 只有满足此条件,才能保证幂法的收敛性.(2). 对一般的矩阵,幂法的迭代过程有可能不收敛,此时序列{u k}有可能包括多个收敛于不同向量的子序列,它趋向于成为多个特征向量的线性组合. 但是,一旦幂法的迭代过程收敛,向量序列的收敛值就一定是特征向量,并可求出相应的特征值.例5.6 (实用的幂法):用实用的幂法求如下矩阵的主特征值:A=[3113] ,[解]: 取初始向量为v0=u0=[01]T . 按算法5.1的迭代过程,计算结果列于表5-1中.表5-1 实用幂法的迭代计算过程从结果可以看出,在每次迭代步中做的规格化操作避免了分量的指数增大或缩小. 经过9步迭代,特征值max ̅̅̅̅̅̅(v k )已非常接近主特征值的准确值4,特征向量也非常接近[1 1]T .5.2.2加速收敛的方法 加速幂法迭代收敛过程的方法主要有两种:原点位移技术和瑞利商(Rayleigh quotient )加速. 下面做些简略的介绍.一. 原点位移技术原点位移技术,也叫原点平移技术,它利用定理5.9的结论(2),即矩阵A −pI 的特征值为A 的特征值减去p 的结果. 对矩阵B =A −pI 应用幂法有可能得到矩阵A 的某个特征值λj 和相应的特征向量. 要使原点位移达到理想的效果,首先要求λj −p 是B 的主特征值,其次还要使幂法尽快收敛,即比例|λ2(B)λj −p |要尽量小,这里的λ2(B)表示矩阵B 的(按模)第二大的特征值. 在某种情况下设置合适的p 值,矩阵A,B 可同时取到主特征值. 图5-3显示了这样一个例子,矩阵A 的特征值分布在阴影区域覆盖的实数轴上,λ1为其主特征值. 按图中所示选取的p 值,将使得λ1−p 是矩阵B =A −pI 的主特征值,并且显然有|λ2(B)λ1−p |<|λ2(A)λ1| . 此时用幂法计算B 的主特征值能更快地收敛,进而得到矩阵的A 的主特征值. 图5-3也解释了原点位移法名字的由来,即将原点(或虚数坐标轴)移到p 的位置上,原始矩阵A 的特征值分布变成了矩阵B 的特征值分布.采用原点位移技术后,执行幂法仅带来很少的额外运算,而且仍然能利用矩阵A 的稀疏性. 它的关键问题是,如何选择合适的参数p 以达到较好的效果?这依赖于具体矩阵的情况,以及对其特征值分布的了解. 在后面,我们还会看到原点位移技术的其他用途.二. 瑞利商加速首先给出瑞利商的定义,以及它与特征值的关系,然后介绍瑞利商加速技术.定义5.7:设A ∈ℝn×n ,且为对称矩阵,对任一非零向量x ≠0,称R (x )=〈Ax,x 〉〈x,x 〉为对应于向量x 的瑞利商(Rayleigh quotient ). 这里符号〈,〉代表向量内积.定理5.15:设A ∈ℝn×n ,且为对称矩阵,其n 个特征值依次为:λ1≥λ2≥⋯≥ λn ,则矩阵A 有关的瑞利商的上下确界分别为λ1和λn . 即∀x ≠0,λn ≤R (x )≤λ1,且当x 为λ1对应的特征向量时R (x )=λ1,当x 为λn 对应的特征向量时R (x )=λn .[证明]: 根据实对称矩阵的特点,即可正交对角化(定理3.3),设特征值λ1,λ2,⋯,λn 对应的单位特征向量为x 1,x 2,⋯,x n ,设x =∑αj x j n j=1,则〈x,x 〉=〈∑αj x j n j=1,∑αj x j n j=1〉=∑αj 2n j=1,而图5-3 原点位移技术示意图.。
矩阵特征值、特征向量的求法与应用
摘要矩阵的特征值、特征向量是高等代数的重要内容,在数学和其他科学领域中都有着广泛的应用。
本文先介绍了矩阵特征值、特征向量的定义及其基本性质;然后归纳了求矩阵特征值、特征向量的方法,包括常规方法、行列互逆变换法和列初等变换法,还论述了抽象矩阵的特征值、特征向量的求法,并举例说明;最后探讨了矩阵的特征值、特征向量在求条件极值、化简二次曲面方程以及在解有关矩阵问题中的应用。
关键词:矩阵;特征值;特征向量;条件极值;二次曲面AbstractMatrix eigenvalue and eigenvector is an important content of higher algebra, is used widely in mathematics and other sciences. This paper first introduces the definition of matrix eigenvalue, eigenvector and its basic properties. Then introduces the method of matrix eigenvalue, eigenvector, including conventional method, the ranks of reciprocal transformation method and column elementary transformation method.And we also discusses the characteristic value of the matrix, the abstract feature vector method. Illustrate the end, we discussion on the matrix eigenvalue, eigenvector of the conditional extreme value, simplification of two surface equation and the application in the solution of the problem of matrix.Key words:matrix; eigenvalue; eigenvector;conditional extremum;quadric目录1 引言 (1)2 特征值、特征向量的定义与性质 (1)3 特征值、特征向量的求法 (2)3.1常规方法 (2)3.2列行互逆变换法 (3)3.3列初等变换法 (3)3.4抽象矩阵的特征值、特征向量的求法 (5)4 特征值、特征向量的应用 (6)4.1在条件极值中的应用 (6)4.2在化简二次曲面方程中的应用 (7)4.3在解有关矩阵问题中的应用 (9)5 总结 (9)致谢......................................... 错误!未定义书签。
矩阵理论中的特征值与特征向量
矩阵理论是现代数学中非常重要的一个分支,广泛运用于各个领域,如物理学、计算机科学和经济学等。
在矩阵理论中,特征值与特征向量是其中的重要概念。
它们不仅在理论中有着深刻的意义,而且在实际应用中也具有广泛的应用价值。
首先,我们来了解一下特征值与特征向量的定义。
给定一个n阶方阵A,如果存在一个非零向量x,使得A与x的线性变换之后的结果与x只相差一个标量lambda(可正可负),那么lambda称为A的一个特征值,而对应的x称为其对应的特征向量。
也就是说,特征向量在矩阵A作用下只发生了伸缩变化,而方向保持不变。
特征值与特征向量在矩阵理论中具有重要的性质和应用。
首先,特征值与特征向量能够描述矩阵的性质和结构。
特征向量代表了矩阵的不变性,并且特征向量的个数等于矩阵A的秩,可以用来判断矩阵是否可逆或奇异。
特征向量还可以用来寻找矩阵的对角化和相似对角化等问题,从而简化矩阵的计算和处理。
其次,特征值与特征向量在物理学和力学中也有广泛的应用。
在固体力学中,特征值与特征向量可以用来描述材料的机械性质,如材料的刚度和强度等。
在电磁学中,特征值与特征向量可以用来描述电场和磁场的分布和振动模式,从而解决电磁学中的边值问题。
在量子力学中,特征值与特征向量可以用来描述量子系统的能量和波函数等物理性质。
此外,在计算机科学中,特征值与特征向量也有广泛的应用。
在图像处理和计算机视觉中,特征值与特征向量可以用来提取图像的纹理和形状等特征,从而实现图像的分类和识别。
在数据挖掘和机器学习中,特征值与特征向量可以用来降维和提取数据的重要特征,从而实现数据的压缩和分类。
总之,特征值与特征向量是矩阵理论中的重要概念,具有重要的性质和应用。
它们不仅可以描述矩阵的性质和结构,而且可以应用于各个领域,如物理学、计算机科学和经济学等。
特征值与特征向量的深入研究和应用,将对各个领域的理论和实践产生重要的影响。
因此,在矩阵理论的学习和应用中,特征值与特征向量是不可或缺的重要部分。
矩阵理论中的特征值与特征向量
矩阵理论是线性代数中的重要分支,广泛应用于各个领域。
其中,特征值与特征向量是矩阵理论中的重要概念。
本文将介绍特征值与特征向量的定义、性质以及应用,并探讨其在实际问题中的意义。
首先,我们来定义特征值与特征向量。
对于一个n阶方阵A,如果存在一个非零向量v使得Av与v共线,即Av=λv,其中λ为一个标量,则称λ为矩阵A 的特征值,v为矩阵A对应于特征值λ的特征向量。
特征值与特征向量的求解是解线性方程组(A-λI)v=0的问题,其中I为n阶单位矩阵。
可以通过求解特征方程|A-λI|=0得到特征值λ,然后再将λ带入方程组解出特征向量v。
特征值与特征向量总是成对出现的,一个特征值可能对应多个特征向量。
特征值与特征向量的研究具有重要的意义。
首先,它们可以帮助我们了解线性变换的性质。
矩阵A的特征值λ决定了A作用在向量空间中的变化情况,特征向量v则表示了这种变化方向。
通过分析特征值的大小与符号,我们可以判断矩阵的稳定性、奇异性和正定性等重要的性质。
其次,特征值与特征向量在矩阵对角化和相似矩阵的研究中具有重要作用。
对于一个可对角化的矩阵A,我们可以找到一组线性无关的特征向量构成的矩阵P,使得P-1AP为对角阵D,其主对角线上的元素即为A的特征值。
对角化矩阵的形式简单明了,方便后续的计算和分析。
此外,在实际问题中,特征值与特征向量也具有广泛的应用。
例如在机械工程中,求解材料的自然频率和振型问题就是特征值与特征向量的求解。
在物理学中,研究量子力学的本征问题也离不开特征值与特征向量的概念。
此外,在图像处理、信号处理以及数据压缩等领域,特征值与特征向量也被广泛应用。
特征值与特征向量的研究还涉及到矩阵的谱理论。
谱理论是矩阵论中的一个分支,主要研究矩阵特征值的分布和特征值问题在不同矩阵变换下的性质。
谱理论在正交多项式、微分方程的解法以及量子力学等领域有着重要的应用。
综上所述,矩阵理论中的特征值与特征向量是线性代数中非常重要的概念。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三部分 矩阵特征值的估计
引言:
矩阵特征值的计算与估计在理论上和实际应用中都是很重要的,但要精确计算特征值并非总是可能的,即使在某些特殊情况下有可能,可是付出的代价也是很大的。
幸好在许多应用中并不需要精确计算矩阵的特征值,而只需有一个粗略的估计就够了。
比如:在线性系统理论中,通过估计系统矩阵A 的特征值是否有负实部,便可判定系统的稳定性;当研究一个迭代法的收敛性时便要判断迭代矩阵的特征值是否都落在单位圆内;在差分方程的稳定性理论以及自动控制理论中都需要估计矩阵的特征值是否在复平面上的某一确定的区域中。
§1. 特征值的界的估计
引理1. n 阶复矩阵A ,酉相似于一个上(或下)三角矩阵,且三角矩阵的对角线元素是A 的特征值。
即存在一个酉矩阵U 和三角矩阵T ,使T AU U T =
引理2. 设n
n n n ij C
a A ⨯⨯∈=)(,则∑∑====n i n
j F ij H
A a AA tr 11
2
2
)(
Proof :设n n ij H b AA B ⨯==)(则
∑∑===++==n
j j n n n
j j j a a a a a a a a a b 1
2
11112121
11111111
∑∑====n
j j
n j j j a a a b 1
2
21
2222
∑∑====n
j ij n j ij ij ii a a a b 12
1
∑∑∑======n
i n
j ij n
i ii H
a b B tr AA tr 11
2
1
)()(
引理3. A 为正规矩阵⇔A 酉相似于对角矩阵。
(注:正规矩阵:A A A A H H ⋅=⋅)即存在酉矩阵U 使
),,,(21n H diag AU U λλλ =
Th 1.设A 为n 阶矩阵,n λλλ,,,21 为其特征值,则:
⇔=≤∑∑∑===n
i n i n
j F ij i A a 1
11
2
2
2
λA 为正规矩阵,等号成立。
Proof:由引理1.存在酉阵U ,使T AU U H =(三角阵)——①
对①两边取共轭转置:U A U AU U T H H H H H ==)(——② ①⨯②得 H H H H T T U A U AU U ⋅=⋅)()(
H H H T T U AA U ⋅=⇒(为酉阵)
)()()(H H H H T T tr AA tr U AA U tr ⋅==⇒
即∑∑∑∑∑∑=======≥=n i n
j n
i n
i i ii ij n i n
j ij t t a 11
1
1
2
2
2
11
2
λ
设n
n C
A ⨯∈,令2
,2H
H A A C A A B -=+=, 则A =B +C : 其中B 为Hermit 阵(即H B B =)实 C 为反Hermit 阵(即H C C -=)虚
注:引入B ,C 的目的是为了研究A 的特征值的实部和虚部的估计。
Th 2.设A ,B ,C 如上所设,i λ为A 的特征值,则有:
① ij n
j i i a n ≤≤⋅≤,1max λ
② ij n
j i i b n ≤≤⋅≤,1max )Re(λ
③ ij n
j i i m c n I ≤≤⋅≤,1max )(λ
Proof :由T AU U H =, *T U A U H H =
2
2
2
2H
H H
H H H H
H
T T
U A A U CU U T T
U A A U
BU U -=-=⇒+=+=⇒ ∑∑
∑∑∑∑
======≤≤+=+=n
i ij
j
i n
i n
i n
j ij
ii
ii n
i n
i i
i i
b n b t t 1
2
,21
11
2
2
1
1
2
2
max 2
2
)
Re(λλλ
ij i ij
i b n b n max )Re(max )Re(2
22
⋅≤⇒≤⇒λλ
同理可证:其它两个
注:该定理对A 特征值进行了界的估计,以及特征值的实部和虚部都有了界的估计,下面给出对A 特征值虚部估计更精确的一个定理。
Th 3.设n n R A ⨯∈
,则()m i I λ≤
其中ij c k max =,ij c 为上述C 的第i 行第j 列元素 Proof :(略)
eg 1.设⎪⎪⎪
⎭
⎫ ⎝⎛-=5.06.07.07.08.0112.01A
则 ⎪⎪⎪⎭⎫ ⎝
⎛--=+=5
.065.015.065
.08.06.015
.06.01)(21H
A A
B ⎪⎪⎪⎭
⎫ ⎝
⎛---=-=005.085.005
.004.085.04.00
)(21
H A A C 3max 3=⨯≤ij i a λ 3max 3)Re(=⨯≤ij i b λ
55.285.03max 3)(=⨯=⨯≤ij i m c I λ
由Th 3. 55.285.03max 2
2
3)(<⨯=⨯≤
ij i m c I λ 易见,Th 3.比Th 2.中③要精确。
据上述定理可得如下推论: 推论1:实对称矩阵的特征值均为实数。
推论2:Hermit 矩阵的特征值均为实数。
推论3:反Hermit 矩阵的特征值均为虚数或零。
Proof 1:A 为实对称,则A A A T
H
==,则02
=-=
H
A A C ,即0=ij c 由Th 2 0max )(=⋅≤ij i m c n I λ 即0)(=i m I λ
i λ∴为实数
Proof 2:A 为H —阵,则H
A A =,则02
=-=
H
A A C ,即0=ij c i λ∴为实数
Proof 3: A 为反H —阵,则A A H
-=,设i λ为特征值,02
=+=
H
A A
B 0=∴ij b
由Th 2. 0max )Re(=⋅≤ij i b n λ 0)R e (=i λ 即i λ为纯虚数或零。
Th 4.幂等阵)(2A A =的特征值为0或1
Proof:设λ为A 的特征值,X 为A 的对应于λ的非零特征向量。
即222(1)0AX X A X AX X X X X λλλλλλλ=⇒==⇒=⇒-=
0=∴λ或1.
Th 5.设A ,B 为n 阶实对称矩阵,矩阵B 半正定(B 的特征值非负),则),,2,1(n i i i =≥βα
其中i i βα,分别为A +B 和A 的特征值,且
n ααα≥≥≥ 21 n βββ≥≥≥ 21
即A +B 与A 的特征值按递减顺序排列。