线性代数-第6章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第6章
接下来的问题是如何求矩阵的特征值和特征向量?一个方案是从定义A*ai=λi*ai出发,
直接寻找满足这样要求的λi 和ai,但这一般是不容易做到的,故还有必要去建立一种更为
普遍的方法。
设A*ai=λi*ai<=>(A-λi*E)*ai=0<=>对λi来说,ai是齐次线性方程组(A-
λi*E)*X=0的一个非零解(因为ai构成的向量组线性无关)<=>方程组的系数行列式
det(A-λi*E)=0由此可见,每一个特征值λi都是多项式det(A-λ*E)在指定数域(一般
是实数域)上的根,我们称这个多项式为矩阵A的特征多项式,不难验证,它是一个λ的n
次多项式。
依据特征方程det(A-λ*E)=0,即可求出矩阵A的全部特征值。
对矩阵A的每个特征值λi,求齐次线性方程组(A-λi*E)*X=0的解,得到的全部非零
解(一般可用基础解系表示)就是A的属于特征值λi的全部特征向量。
由此可得到两点启示:对同一个特征值来说,特征向量不唯一;对同一特征值来说,特征向量的线性组合仍为特征向量。
相似的矩阵有相同的特征多项式和特征值,但有相同特征多项式的两个矩阵不一定相似。
相似的矩阵有相同的秩,故一个可对角化矩阵的非零特征值的数目即为其秩。
在求出矩阵的全部特征值和全部特征向量以后,剩下的问题就是判断这些所有的特征向量
中有没有n个是线性无关的?如果有,意味着矩阵可对角化,如果没有,则矩阵不可对角化。
对一个矩阵A来说,考虑到其n个特征值可能相同也可能不同,故最一般的情况应该是把
A的这n个特征值分为m组,分别为λ1, λ2, …, λm,每组的个数分别为j1,j2,…,jm (注意有j1+j2+…+jm=n),对每个λi(i=1,2,…,m),齐次线性方程组(A-λi*E)
*X=0的基础解系解向量的个数分别为r1,r2,…,rm,这些基础解系各自当然都是A的线性
无关的特征向量,自然会进一步联想,把这m组共r1+r2+…+rm个向量合在一起情况如何,是
否仍线性无关?
经过考察发现,矩阵A的属于不同的特征值的特征向量一定线性无关。
故上述
r1+r2+…+rm个来自不同特征值的特征向量构成的向量组确实是线性无关的。
于是不难有如下
结论,若r1+r2+…+rm=n,则A有n个线性无关的特征向量,从而A可对角化,若
r1+r2+…+rm<n,则A没有n个线性无关的特征向量,从而A不可对角化。
若矩阵A具有n个不同的特征值,则A可对角化。
由此可见,要判断一个矩阵是否可对角化,通常需要求出其全部特征值(相当于解代数方程的问题),再求出每个特征值所对应的特征向量(相当于解齐次线性方程组的问题)并考察其相互之间的线性无关性。
亦即我们应当建立起这样的认识:相似变换,尤其是相似对角变换,并不是对任何一个矩阵来说都可以进行的,这其中关键在于能否找到一个可逆矩阵P来为两者提供联系,换言之就是应当满足某些对应的条件。
当然,可以想象,也许对于具有某些特点的矩阵来说,它们本身就满足这种既定条件,从而必可以对角化。
实对称矩阵就是这样一种特殊的矩阵,它一定存在着n个线性无关的特征向量,即一定可对角化。
实对称矩阵属于不同特征值得特征向量是正交的,而之前已经提到过,对同一特征值来说,其特征向量的线性组合仍是其特征向量,故可利用施密特正交化方法(本质是线性组合)来构造出一组属于同一特征值的正交特征向量,这些正交化单位化后的特征向量就决定了实对称矩阵一定可以正交对角化。
要注意到正交矩阵当然是可逆的,正交的向量组当然是线性无关的,这是实对称矩阵对于一般矩阵来说在相似变换性质上更为优越的地方。
在实际生活中,我们常常会遇到许多与n个变量x1,x2,…,xn构成的二次齐次多项式
f(x1,x2,…,xn)相关的问题(如二次曲面问题、多元函数的极值问题等),我们将这种
多项式称为一个n元二次型。
可以看到,与线性方程组类似,对二次型的性质起决定作用的是自变量的系数及其相对位置,这提示我们可以把这些系数排成的一个n阶矩阵A,用矩阵的工具来研究二次型,具体做
法是:
令X=(x1,x2,…,xn)’,则二次型f(x1,x2,…,xn)可以写成:
f(x1,x2,…,xn)=X’AX其中A称为二次型f(x1,x2,…,xn)的矩阵,它的特点是:主对角线上的元素是完全平方项的系数,(i,j)位置上的元素是交叉项系数的一半,这
决定了二次型矩阵的对称性和唯一性。
我们知道,矩阵的一个应用是线性变换,即关系式X=CY表示的是从变量x1,x2, (x)
到变量y1,y2,…,yn的一个线性变换,一般来说,我们还要求这种变换是可逆的(即C可逆)。
从坐标变换的角度来看,向量R在X坐标系下的分量x1,x2,…,xn与Y坐标系下的
分量y1,y2,…,yn通过转换矩阵C相联系,这表明:同一个向量实体在不同坐标系下可以
有不同的表现形式,但本质上并无区别。
利用线性变换X=C*Y,变量X的一个二次型f(x1,x2,…,xn)=X’AX可以变成(CY)’A(CY)=Y’C’ACY= Y’(C’AC)Y设C’AC=B,则有Y’BY= f(y1,y2,…,yn),这是变量Y的一个二次型,不难验证,B正是二次型f(y1,y2,…,yn)的矩阵。
从坐标变换的角度来看,与向量类似,同一个二次型f在不同的坐标系下可以有不同的表现形式,两者通过关系式C’AC=B相联系,但本质上并无区别。
对矩阵A、B来说,如果存在着可逆矩阵C,使得C’AC=B,我们称A与B是合同的,不难
推断,合同的矩阵有相同的秩,且对应着同一个二次型。
特别地,如果矩阵A与对角矩阵∧合同,那这个对角矩阵∧对应的就是一个只含完全平方项的二次型,称为标准型。
将二次型化为标准型来进行研究,因为不含交叉项,问题变得简单许多。
注意到二次型的矩阵总是对称矩阵,故对于实数域上的二次型X’AX来说,其矩阵A必可正交对角化,故必定存在一个正交矩阵Q,使得Q逆*A*Q=∧,同时考虑到Q’=Q逆,因此
Q’AQ=∧,即A合同于对角矩阵。
也就是说,对实数域上的任意一个二次型,都能够通过合适的坐标变换化为标准型。
从坐标变换的角度来看,我们总可以找到一个合适的坐标系,在该坐标系中,二次型f以相对较为简单的,仅含完全平方项的形式表现出来,而这些完全平方项的系数(也就是矩阵A的特征值),就决定了该二次型具有的全部性质。
同一个实二次型X’AX,其标准型不唯一,但标准型中完全平方项的个数r是唯一的,同
时r也就是二次型矩阵A的秩。
这里应该着重体会的是,正是利用实对称矩阵在相似变换上强有力的性质(必可正交对角化),我们才得以将二次型化标准型的问题转化为矩阵求特征值特征向量的问题,而后者是之前就已经探讨清楚了的。
在得到实二次型的标准型后,还可对标准型中所有平方项的系数进行归一化,即得到规范型,一个二次型的规范性是唯一的。
规范型只含平方项,且平方项的系数只有1,0,-1,实
二次型的规范性由正惯性指数的个数p和负惯性指数的个数q决定,其中p+q=r为二次型矩阵
的秩。
规范型在形式上更为简单,一般常通过研究二次型的规范型来对其作出一些定性的判断。
正定二次型是无论自变量如何取值都能保证结果恒正的二次型,即对于任意非零的X,都
有X’AX>0。
判断一个二次型的正定性,一种选择是直接从定义出发,另一种方案可考虑利用
规范型(因为无论正定负定都是一个定性而非定量的结论),而实际上正定二次型的许多性质也确实能通过其规范型相联系,这是值得注意的。