矩阵可对角化的判定条件及推广

合集下载

矩阵可相似对角化的条件课件

矩阵可相似对角化的条件课件
通过归纳矩阵的阶数,逐步证明矩阵可相似对角化。
要点二
详细描述
归纳法是一种基于数学归纳法的证明方法,通过归纳矩阵 的阶数,逐步证明矩阵可相似对角化的性质。这种方法适 用于阶数较大的矩阵,但需要严谨的数学推导和证明。
05
矩阵可相似对角化的实例分析
二阶矩阵的实例分析存在 两个线性无关的特征向量。
三阶矩阵的实例分析
总结词
详细描述
实例
三阶矩阵可相似对角化的条件是存在 三个线性无关的特征向量。
对于三阶矩阵A,如果存在三个线性 无关的特征向量α、β和γ,使得 $Aalpha = lambda_1alpha$、 $Abeta = lambda_2beta$和 $Agamma = lambda_3gamma$, 其中$lambda_1$、$lambda_2$和 $lambda_3$是矩阵A的特征值,则 矩阵A可相似对角化。
反证法
总结词
通过假设矩阵不可相似对角化,然后推导出 矛盾,从而证明矩阵可相似对角化。
详细描述
反证法是一种常用的证明方法,通过假设矩 阵不可相似对角化,然后推导出一些矛盾的 情况,如行列式值为零或特征多项式无重根 等,从而证明矩阵可相似对角化。这种方法
逻辑严谨,但需要一定的数学基础。
归纳法
要点一
总结词
状态空间控制设计
在状态空间控制设计中,通过矩阵相 似对角化可以将复杂的系统分解为若 干个简单子系统,有助于简化控制器 的设计过程。
04
矩阵可相似对角化的证明方法
构造法
总结词
通过构造具体的矩阵,证明矩阵可相似对角 化。
详细描述
构造法是一种基于具体实例的证明方法,通 过构造一个具体的矩阵,并证明该矩阵可以 相似对角化,从而证明任意矩阵可相似对角 化的可能性。这种方法直观易懂,但需要一 定的技巧和经验。

对角化的充要条件

对角化的充要条件

对角化的充要条件
可对角化的充要条件是n阶方阵存在n个线性无关的特征向量。

矩阵可对角化的充分条件:
第一:矩阵A为n阶方阵。

第二:充要条件是有n个线性无关的特征向量。

第三充分条件n个特征值互不相等也就是由特征值求出n个特征向量,组成变换矩阵P,P=(a1,a2,。

an),那么:P逆AP=主对角线为特征值的对角阵。

矩阵对角化的条件
有个线性无关的特征向量,可对角化矩阵是线性代数和矩阵论中重要的一类矩阵。

如果一个方块矩阵A相似于对角矩阵,也就是说,如果存在一个可逆矩阵P使得P1AP是对角矩阵,则它就被称为可对角化的。

对角化的充分必要条件
有两条,其一是n阶方阵存在n个线性无关的特征向量,其二是如果阶n方阵存在重复的特征值,每个特征值的线性无关的特征向量的个数恰好等于该特征值的重复次数。

可对角化矩阵
对合在实数上(甚至特征不是2 的任何域)是可对角化的,带有
1 和-1 在对角线上。

有限阶自同态(包括对合)是在复数,或域的特征不整除自同态的阶的任何代数闭合域(因为单位一的根是不同的)是可对角化的,带有单位根在对角线上。

这是循环群的表示理论的一部分。

投影是可对角化的,带有0 和1 在对角线上。

相似矩阵矩阵可对角化的条件

相似矩阵矩阵可对角化的条件

1 0
0 0
1 x y,
1 0 1 0 0 0 0 0 0
x + y = 0.
P11/11
p11,L , p1n1 ,L , pm1,L , pmnm diag(141,2L 431 ,L , 14m ,2L 43m )
n1
A pi1,L , pini i pi1,L , i pini , i 1,L , m
nm
Apij i pij , i 1,L , m, j 1, 2,L , ni
“” Q R(i E A) n ni , 则 (i E A)x 0
的基础解系有ni个线性无关的向量 pi1,L , p1ni
A p11 ,L , p1n1 ,L , pm1 ,L , pmnm
p11,L , p1n1 ,L , pm1 ,L , pmnm diag(141,2L 431 ,L , 14m ,2L 43m )
将P按列分块: P = (p1, p2, …, pn),
因而有
1


A p1, p2 ,L , pn p1, p2 ,L , pn

2
O

n
1 p1 ,2 p2 , ,n pn .
于是有 Api = i pi, i = 1, 2, …, n.
§2 矩阵可对角化的条件
一、相似矩阵及其性质 二、矩阵可对角化的条件
1
§2 相似矩阵可对角化的条件
一、相似矩阵及其性质
定义3.3 设A, B均为n阶方阵, 若可逆矩阵P, 使得 P1AP = B, (3.8)
则称A与B相似, 记作AB. 性质3.1 基本性质 1) 反身性; 2) 对称性; 3) 传递性. 定理3.5 若AB, 则 1) |A| = |B|; 2) R(A) = R(B); 3) A1 B1, A, B均可逆.

第二十讲 矩阵的对角化

第二十讲 矩阵的对角化

20.1 矩阵可对角化的条件设矩阵有个线性无关的特征向量令则是一个对角矩阵其对角元素是的特征值:20.1 矩阵可对角化的条件事实上,于是因可逆,故20.1 矩阵可对角化的条件若存在可逆矩阵使为对角矩阵,则称矩阵是可对角化的(diagonalized).由上面的分析知,反之也成立. 故有定理:矩阵可对角化的充要条件是有个线性无关的特征向量.20.1 矩阵可对角化的条件例:的特征值为故只有个线性无关的特征向量,因此不能对角化.20.1 矩阵可对角化的条件定理:设是的互异特征值,是相应特征向量. 则线性无关.证明:设两边左乘得再左乘得不断左乘直到得故有20.1 矩阵可对角化的条件左边第二个矩阵的行列式行列式因此该矩阵可逆,故由于特征向量均为非零向量,故所以线性无关.20.1 矩阵可对角化的条件推论:具有个两两互异特征值的矩阵可以对角化.但若矩阵有相同特征值,其也可能对角化.例:有重特征值任何可逆矩阵都使是对角阵. 这反映了所有非零向量都是单位矩阵的特征向量.20.2 特征值的代数重数和几何重数定义:设其中称为特征值的代数重数(algebraicmultiplicity),记作称为特征值的几何重数(geometric multiplicity),记作例:20.2 特征值的代数重数和几何重数例:例:20.2 特征值的代数重数和几何重数一般地,命题:引理1:相似矩阵具有相同的特征多项式.事实上,设可逆,则我们有20.2 特征值的代数重数和几何重数引理2:任意复方阵相似于上三角阵,且其对角元为矩阵的特征值. 证明:对方阵的阶数用数学归纳法.时结论成立. 假设对阶复方阵结论成立.对任意阶复方阵设其有特征值及相应特征向量则可将其扩充得的一组基有记则有20.2 特征值的代数重数和几何重数对阶复方阵由归纳假设, 存在可逆阵使得为上三角阵.令为上三角阵.则结论第一部分得证.由引理1知上三角阵的对角元为的特征值.20.2 特征值的代数重数和几何重数命题的证明:由引理2,相似于上三角阵则和有相同特征值,且对任意特征值因此,不妨设是上三角阵,即于是故20.2 特征值的代数重数和几何重数定理:复方阵可对角化对任意特征值事实上,若则故有个线性无关的特征向量.从而可对角化.20.2 特征值的代数重数和几何重数例:判断是否可对角化,若可以求使为对角阵.解:于是又因此,可对角化.20.2 特征值的代数重数和几何重数对的基础解系为对的基础解系为20.2 特征值的代数重数和几何重数令则20.2 特征值的代数重数和几何重数注:可以看到,使对角化的矩阵不是唯一的. 一个特征向量乘以非零常数后仍是属于同一特征值的特征向量,所以若用任意非零常数乘以的各列,则得一个新的使对角化的矩阵. 而对于重特征值则有更大自由度. 上例中由的任意线性组合得到的两个线性无关的向量都可充当的前两列.20.2 特征值的代数重数和几何重数例:设其中为矩阵.的秩为的秩为故可对角化.20.3 矩阵可对角化的应用若矩阵可对角化,则可快速计算例:设求解:的特征值可对角化.20.3 矩阵可对角化的应用对的基础解系为对的基础解系为20.3 矩阵可对角化的应用令 则故20.3 矩阵可对角化的应用例(Markov过程):每年海淀区以外人口的迁入海淀区,而海淀区人口的迁出. 这给出一个差分方程:设最初外部人口为内部人口为则一年以后外部人口内部人口即20.3 矩阵可对角化的应用这个虚构的人口迁移过程有两个特点:(1)人口总数保持不变;(2)海淀区外部和内部的人口数不是负的. 我们称之为Markov(马尔科夫)过程.由性质(1),矩阵每一列元素之和为由性质(2),矩阵元素非负. 同样等也非负.20.3 矩阵可对角化的应用记取则20.3 矩阵可对角化的应用于是我们可求和年之后的人口分布:20.3 矩阵可对角化的应用可以看出,经过很多年之后,会变得非常小,从而这个解达到一个极限状态:此时,总人口仍为与初始状态相同. 但在此极限状态下,总人口的在外部,在内部, 并且这个数据无论初始分布怎样总成立.20.3 矩阵可对角化的应用注意到即这个稳定状态是Markov矩阵关于的特征向量.20.3 矩阵可对角化的应用例(Fibonacci数列):数列满足规律这是一个差分方程.怎样由出发,求出Fibonacci数列的通项公式呢?20.3 矩阵可对角化的应用令则即于是只需求20.3 矩阵可对角化的应用故20.3 矩阵可对角化的应用初始值给出于是Fibonacci数是这个乘积的第二个分量20.3 矩阵可对角化的应用我们希望研究由差分方程描述的离散动力系统的长期行为,即时解的性质.设可对角化,即存在可逆矩阵其中使为对角阵.则其中即可以看出,的增长由因子支配. 因此系统的稳定性依赖于的特征值.20.3 矩阵可对角化的应用对由一个差分方程定义的离散动力系统,当的所有特征值时,它是稳定的(stable),且;当所有时,它是中性稳定的(neutrally stable),且有界;而当至少有一个特征值时,它是不稳定的(unstable),且是无界的.Markov过程是中性稳定的,Fibonacci数列是不稳定的.20.3 矩阵可对角化的应用例:考虑差分方程其中的特征值为其对角元和故该系统是稳定的.由任何一个初始向量出发,的解必定最终趋向于如:20.3 矩阵可对角化的应用可以看到从开始,而的实际作用是,若把分解成的两个特征向量的和:则把属于的特征向量化为零,而把属于的特征向量乘以20.4 同时对角化问题:给定两个阶矩阵是否存在可逆矩阵使得同时为对角阵,也即同时对角化?命题:若有相同特征向量矩阵使得为对角阵,则事实上,20.4 同时对角化重要的是,“逆”命题也成立. 我们不加证明地给出:定理:若均可对角化,且则可同时对角化.注意到,若则故和是的属于同一特征值的特征向量. 看简单的情况.假设的特征值两两互异,则其所有特征子空间都是一维的. 于是必是的倍数,也即是的特征向量. 从而有公共特征向量矩阵,可同时对角化.20.4 同时对角化定理:对阶复矩阵若矩阵的特征值两两互异,则可同时对角化.20.4 同时对角化小结:1. 矩阵可对角化,指存在可逆矩阵使为对角阵.2. 矩阵可对角化有个线性无关的特征向量.3. 若复矩阵有个互异特征值,则可对角化.4. 复矩阵可对角化任意特征值的几何重数等于代数重数.5. 设可对角化, 即存在可逆阵使则6. 差分方程的解为其中。

矩阵可对角化的判定条件及推广

矩阵可对角化的判定条件及推广

矩阵可对角化的判定条件及推广
矩阵的对角化是矩阵理论的一个重要概念,它指的是有一种转换,使给定的方阵成为一个主对角线向量组成的对角矩阵。

矩阵可对角化是一个重要的判定条件,当满足所有下列条件时,矩阵可以对角化:
1、矩阵必须是n阶可逆矩阵,且n>1,即A必须为n阶可逆方阵;
2、所有特征值都是不同的,只有不同的特征值才能保证对角矩阵的特性;
3、矩阵的特征向量必须互相垂直,它们的内积必须为零,两个向量只有在这种状态下才能够形成一个正交矩阵;
4、矩阵的特征向量必须是单位向量,这种向量的模为1,只有确保矩阵的行列式的值不为0,才能让对角矩阵与原矩阵相同。

对角化矩阵的概念可以拓展到实数矩阵,在这种情况下,矩阵可先进行置换变换,让特征值互不相同,然后进行双对角化,将原矩阵分解为两个对角矩阵的乘积,然后将每个矩阵的特征向量分别作为其特征值的正交基,最后将所有对角矩阵的特征值按照其特定顺序汇总起来,从而形成一个新的对角矩阵。

补充到此,实数矩阵也同样满足上述矩阵可对角化的四条条件。

综上所述,矩阵可对角化的判定条件是:矩阵是可逆矩阵,并且特征值各不相同,特征向量互相垂直,且为单位向量,这四条条件同时满足时,矩阵可以对角化。

此外,对角化的概念也可以拓展到实数矩阵,用置换变换与双对角化使实数矩阵可对角化,实数矩阵也必须满足上述四条条件。

实对称矩阵可对角化的充要条件

实对称矩阵可对角化的充要条件

实对称矩阵可对角化的充要条件实对称矩阵可对角化的充要条件是它有n个线性无关的特征向量。

这个结论是非常重要的,因为实对称矩阵在很多领域都有广泛的应用,比如线性代数、数学物理、信号处理等等。

实对称矩阵的对角化可以化简矩阵运算,使得问题更加简单和易于处理。

具体来说,实对称矩阵是指一个矩阵和它的转置矩阵相等。

因此,它的所有特征值都是实数。

而且,它的特征向量是两两正交的。

这意味着,我们可以构造一个正交矩阵,使得它的每一列都是实对称矩阵的一个特征向量。

这个正交矩阵的逆矩阵就是实对称矩阵的对角化矩阵。

要证明这个结论,我们需要用到一些基本的线性代数知识。

首先,我们知道一个方阵的特征向量是指在矩阵乘以一个向量后,这个向量的方向没有改变,只是长度变成了原来的特征值倍。

其次,我们知道一个矩阵的特征向量是线性无关的,当且仅当它的特征值都不相同。

最后,我们知道一个矩阵可以对角化的充要条件是它有n个线性无关的特征向量。

因此,我们只需要证明实对称矩阵的特征向量是线性无关的。

假设实对称矩阵A有两个特征向量v和w,对应的特征值分别为λ和μ。

那么,根据特征向量的定义,我们有:Av = λvAw = μw将第一个等式左乘w的转置,右乘v,第二个等式左乘v的转置,右乘w,然后将两个等式相减,得到:(λ - μ)(v·w) = 0其中,v·w表示向量v和w的内积。

由于实对称矩阵的特征值都是实数,因此有λ - μ ≠ 0。

又因为v和w是非零向量,所以v·w ≠ 0。

因此,我们得到了矛盾,即v和w不能同时是实对称矩阵的特征向量。

因此,实对称矩阵的特征向量是线性无关的。

综上所述,实对称矩阵可对角化的充要条件是它有n个线性无关的特征向量。

这个结论不仅是理论上的重要结果,也是实际应用中的重要工具。

第2节 矩阵可对角化的条件、实对称矩阵的对角化

第2节 矩阵可对角化的条件、实对称矩阵的对角化

T
T
ቤተ መጻሕፍቲ ባይዱ
T
由于 是非零复向量,必有
x1 x1 x 2 x2

T
x n xn 0
.
R.
注 (1)对称矩阵的特征值未必是实数.
(2)特征值皆为实数的实矩阵未必是实对称矩阵. (3)反对称实数矩阵的特征值是零或纯虚数.
§2 矩阵可对角化的条件、实对称矩阵的对角化
第五章 矩阵的特征值与特征向量
§1 特征值与特征向量、相似矩阵
§2 矩阵可对角化的条件、实对称 矩阵的对角化
§2 矩阵可对角化的条件、实对称矩阵的对角化
§2 矩阵可对角化的条件、实对称矩阵的对角化 一、矩阵可对角化的条件
二、实对称矩阵的对角化
§2 矩阵可对角化的条件、实对称矩阵的对角化
一、矩阵可对角化的条件
即 故
(1 2 ) 0.
T 1 2
1T 2 [1 , 2 ] 0.
即1 与 2正交.
§2 矩阵可对角化的条件、实对称矩阵的对角化
定理3:对n 阶实对称矩阵A,总有正交矩阵T,使
T 1 AT diag(1 , 2 ,
其中 1 , 2 ,
, n )
2 2 E A 2 2 4 2 4 2
1
2 7
2
得A的特征值是2,2,-7 .
§2 矩阵可对角化的条件、实对称矩阵的对角化
对于特征值2,求出齐次线性方程组
1 2 2 x1 0 2 4 4 x 2 0 2 4 4 x 0 3
二、实对称矩阵的对角化
性质1 设A是实对称矩阵,则A的特征值都是实数.

矩阵可对角化的条件

矩阵可对角化的条件

矩阵可对角化的条件学生:翟亚丽 指导老师:王全虎一 引言矩阵可对角化的问题是高等代数和矩阵论最基本的问题之一,也是人们一直研究的问题之一。

从矩阵对角化的判别法则到矩阵对角化的方法,从矩阵对角化的方法再到矩阵可对角化的条件,再延伸到矩阵的广义对角化,本文从矩阵可对角化的各种例子和矩阵可对角化的各种定理归纳总结出矩阵可对角化的条件。

二 矩阵可对角化的概念定义【2】 设A 是数域F 上一个n 阶矩阵,如果存在F 上一个n 阶可逆矩阵T 使得T -1AT具有对角形式100n a a ⎛⎫ ⎪ ⎪ ⎪⎝⎭ 那么就称矩阵A 可对角化。

三 矩阵可对角化的相关定理定理1【1】 n 阶矩阵A 相似对角矩阵的充要条件是A 有n 个线性无关的特征向量。

定理2【3】 设i λ是线性变换A 的特征值,它的代数重数为i n ,几何重数为i m ,且1i im n ≤≤则A 可对角化的充分必要条件是:每个特征值的几何重数都等于代数重数。

定理 3【3】 A 可对角化⇔A 的最小多项式没有重根。

四 由矩阵可对角化的定理所引出的矩阵可对角化的条件及其相互之间的关系。

(一)设【12】()n M F A∈,K 重根按k 个计算,则A 可对角化⇒A 有n 个特征根,自然会问:A 有n 个特征根是否也是A 可对角化的充分条件?看例子11()01n M F ⎛⎫A =∈ ⎪⎝⎭则2()(1)A x x λ=-于是A 有2个特征值为1,但A 却不能对角化,故此例告诉我们A 有n 个特征根只是A 可对角化的必要条件,而非充要条件。

而且一般形如1,0k k F k ⎛⎫A =∈ ⎪⎝⎭的矩阵都不能对角化。

在给出A 可对角化的充要条件时需对特征根的特征向量要进一步讨论,若矩阵A 有n 个线性无关的特征向量则该矩阵可对角化,又有定理(二)设()n M F A∈,若在F 中,A 有n 个不同的特征根,则A 可对角化。

因为,不同特征根对应的特征向量必线性无关,则特征向量线性无关时可得出矩阵可对角化。

矩阵可对角化的条件

矩阵可对角化的条件

第二节矩阵可对于角化的条件之阳早格格创做定义1如果矩阵能取对于角矩阵相似,则称可对于角化.例1 设,则有:,即.进而可对于角化.定理1 阶矩阵可对于角化的充分需要条件是有个线性无闭的特性背量.说明:需要性如果可对于角化,则存留可顺矩阵,使得将按列分块得,进而有果此有,所以是的属于特性值的特性背量,又由可顺,知线性无闭,故有个线性无闭的特性背量.充分性设是的个线性无闭的特性背量,它们对于应的特性值依次为,则有.令,则是一个可顺矩阵且有:果此有,即,也便是矩阵可对于角化.注若,则,对于按列分块得,于是有,即,进而.可睹,对于角矩阵的元素便是矩阵的特性值,可顺矩阵便是由的线性无闭的特性背量所形成的,而且特性背量的程序依好于对于角矩阵.定理2矩阵的属于分歧特性值的特性背量是线性无闭的.说明:设是的个互没有相共的特性值,是的属于特性值的特性背量,现对于做数教归纳法说明线性无闭.当时,由于特性背量没有为整,果此定理创造.假设的个互没有相共的特性值对于应的个特性背量是线性无闭的.设是的个互没有相共的特性值,是的属于特性值的特性背量.又设(1)创造.则有,又将(1)式二边共乘得:进而有,由归纳假设得,再由二二互没有相共可得,将其代进(1)式得,果此有,进而线性无闭.推论1若阶矩阵有个互没有相共的特性值,则可对于角化,且.定理3设是阶矩阵的个互同特性值,对于应于的线性无闭的特性背量为,则由所有那些特性背量(共个)形成的背量组是线性无闭的.说明:设,记,,则有,且或者是的属于特性值的特性背量.若存留某个,,则由属于分歧特性值的特性背量线性无闭知,冲突.果此有,,又由已知得,,果此背量组线性无闭.定理4设是阶矩阵的一个沉特性值,对于应于的特性背量线性无闭的最大个数为,则,即齐次线性圆程组的前提解系所含背量个数没有超出特性值的沉数.说明:用反证法.由于是的属于特性值的特性背量当且仅当是齐次线性圆程组的非整解,果此对于应于的特性背量线性无闭的最大个数取齐次线性圆程组的前提解系所含背量个数相等.设是齐次线性圆程组的一个前提解系,且假设,则有.现将扩充为一个维线性无闭背量组,其中一定是的特性背量,但是有是一个维背量,进而可由背量组线性表示,即:果而有:(2)其中有个.令,并将(2)式左端矩阵分块表示,则有,由相似矩阵有相共的特性多项式,得的特性多项式为:其中是的次多项式.进而起码是的沉特性值,取是沉特性值冲突.所以.定理5 阶矩阵可对于角化的充分需要条件是:的每个特性值对于应的特性背量线性无闭的最大个数等于该特性值的沉数(即的每个特性值对于应的齐次线性圆程组的前提解系所含背量个数等于该特性值的沉数,也即的每个特性子空间的维数等于该特性值的沉数).说明:设,其中二二分歧,且有.充分性由于对于应于的特性背量有个线性无闭,又个特性值互同,果此有个线性无闭的特性背量,故可对于角化.需要性(反证法)设有一个特性值所对于应的线性无闭的特性背量的最大个数的沉数,则的线性无闭的特性背量个数小于,故没有克没有及取对于角矩阵相似.例2设,供的特性值战特性背量,并推断是可可对于角化?解:由得的特性值为(二沉特性值).当时,由,即:得前提解系为,进而的属于特性值的特性背量为(为任性非整常数).当时,由,即:得前提解系为,进而的属于特性值的特性背量为(为任性非整常数).由于的特性值对于应的齐次线性圆程组的前提解系所含背量个数小于特性值的沉数,故没有成对于角化.例3巳知,推断是可对于角化?若能对于角化,供可顺矩阵,使得为对于角阵.解:由得的特性值为(二沉特性值).当时,由,即:得前提解系为,进而的属于特性值的特性背量为(为任性非整常数).当时,由,即:得前提解系为及,进而的属于特性值的特性背量为(为任性没有齐为整的常数).由于的每个特性值对于应的齐次线性圆程组的前提解系所含背量个数等于特性值的沉数,故可对于角化.令,则.例4设是阶矩阵,,推断是可可对于角化.解:设的特性圆程的二个根为,则,故有二个分歧的特性值,进而可对于角化.例5设真对于称矩阵,问是可可对于角化?若可对于角化,供矩阵,使得为对于角阵,并供(为正整数).解:由得的特性值为(三沉特性值).当时,由,即:得前提解系为,进而的属于特性值的特性背量为(为任性非整常数).当时,由,即:得前提解系为,,,进而的属于特性值的特性背量为(为任性没有齐为整的常数).由于的每个特性值对于应的齐次线性圆程组的前提解系所含背量个数等于特性值的沉数,故可对于角化.令,则.进而,且例6设阶矩阵谦脚(称为幂等矩阵),说明:的特性值只可为或者,而且可对于角化.说明:设是的属于特性值的特性背量,则,由,得,所以幂等矩阵的特性值只可为或者.设秩,当秩时,,故可对于角化且;当秩时,可顺,由得,故可对于角化且;现设.当特性值时,其特性矩阵的秩为.那是果为由,所以;又,果而,进而有.再由可得对于应于的线性无闭的特性背量的最大个数为.设的属于特性值的个线性无闭的特性背量为.当特性值时,由可得对于应于的线性无闭的特性背量的最大个数为.设的属于特性值的个线性无闭的特性背量为.进而有个线性无闭的特性背量,故可对于角化.令,则,其中主对于角线上的个数为秩个,的个数为个.。

可对角化的其他判定准则及其应用

可对角化的其他判定准则及其应用

可对⾓化的其他判定准则及其应⽤矩阵或线性变换的可对⾓化判定是⾼等代数的重要知识点. 由于判定准则多, 技巧性强, 故可对⾓化判定⼀直是教学和考试中的难点. ⼀般来说,判定n维复线性空间V上的线性变换\varphi (或n阶复矩阵A) 可对⾓化, 通常有以下六种⽅法 (参考复旦⾼代教材的第六章和第七章):(D1) \varphi可对⾓化的充要条件是\varphi有n个线性⽆关的特征向量;(D2) 若\varphi有n个不同的特征值, 则\varphi可对⾓化;(D3) \varphi可对⾓化的充要条件是V是\varphi的特征⼦空间的直和;(D4) \varphi可对⾓化的充要条件是\varphi有完全的特征向量系, 即对\varphi的任⼀特征值, 其⼏何重数等于其代数重数;(D5) \varphi可对⾓化的充要条件是\varphi的极⼩多项式⽆重根;(D6) \varphi可对⾓化的充要条件是\varphi的 Jordan 块都是⼀阶的, 或等价地, \varphi的初等因⼦都是⼀次多项式.本⽂的主要⽬的是, 给出可对⾓化的⼀些其他的判定准则及其应⽤. 以下总是以线性变换作为对象来阐述和证明结论, 其对应的矩阵版本, 留给读者⾃⼰补充完整.⾸先, 我们来证明⼀个具有良好性质的线性变换的⼤型引理.引理 1 设V是数域\mathbb{K}上的n维线性空间, \varphi是V上的线性变换, 则以下九个结论等价:(1) V=\mathrm{Ker}\varphi\oplus\mathrm{Im}\varphi;(2) V=\mathrm{Ker}\varphi+\mathrm{Im}\varphi;(3) \mathrm{Ker}\varphi\cap\mathrm{Im}\varphi=0;(4) \mathrm{Ker}\varphi=\mathrm{Ker}\varphi^2, 或等价地, \dim\mathrm{Ker}\varphi=\dim\mathrm{Ker}\varphi^2;(5) \mathrm{Ker}\varphi=\mathrm{Ker}\varphi^2=\mathrm{Ker}\varphi^3=\cdots, 或等价地,\dim\mathrm{Ker}\varphi=\dim\mathrm{Ker}\varphi^2=\dim\mathrm{Ker}\varphi^3=\cdots;(6) \mathrm{Im}\varphi=\mathrm{Im}\varphi^2, 或等价地, r(\varphi)=r(\varphi^2);(7) \mathrm{Im}\varphi=\mathrm{Im}\varphi^2=\mathrm{Im}\varphi^3=\cdots, 或等价地, r(\varphi)=r(\varphi^2)=r(\varphi^3)=\cdots;(8) \mathrm{Ker}\varphi存在\varphi-不变补空间, 即存在\varphi-不变⼦空间U, 使得V=\mathrm{Ker}\varphi\oplus U;(9) \mathrm{Im}\varphi存在\varphi-不变补空间, 即存在\varphi-不变⼦空间W, 使得V=\mathrm{Im}\varphi\oplus W.证明由直和的定义可知 (1) \Leftrightarrow (2)+(3), 于是 (1) \Rightarrow (2) 和 (1) \Rightarrow (3) 都是显然的. 根据交和空间维数公式和线性映射维数公式可知\dim(\mathrm{Ker}\varphi+\mathrm{Im}\varphi)=\dim\mathrm{Ker}\varphi+\dim\mathrm{Im}\varphi-\dim(\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi)=\dim V-\dim(\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi),于是 (2) \Leftrightarrow (3) 成⽴,从⽽前三个结论两两等价.(3) \Rightarrow (4): 显然\mathrm{Ker}\varphi\subseteq\mathrm{Ker}\varphi^2成⽴. 任取\alpha\in\mathrm{Ker}\varphi^2, 则\varphi(\alpha)\in\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi=0, 于是\varphi(\alpha)=0, 即\alpha\in\mathrm{Ker}\varphi, 从⽽\mathrm{Ker}\varphi^2\subseteq\mathrm{Ker}\varphi也成⽴, 于是 (4) 成⽴.(4) \Rightarrow (3): 任取\alpha\in\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi, 则存在\beta\in V, 使得\alpha=\varphi(\beta), 于是0=\varphi(\alpha)=\varphi^2(\beta), 即\beta\in\mathrm{Ker}\varphi^2=\mathrm{Ker}\varphi, 从⽽\alpha=\varphi(\beta)=0, 即 (3) 成⽴.(5) \Rightarrow (4) 是显然的, 下证 (4) \Rightarrow (5): 设\mathrm{Ker}\varphi^k=\mathrm{Ker}\varphi^{k+1}已对正整数k成⽴, 先证\mathrm{Ker}\varphi^{k+1}=\mathrm{Ker}\varphi^{k+2}也成⽴, 然后⽤归纳法即得结论. \mathrm{Ker}\varphi^{k+1}\subseteq\mathrm{Ker}\varphi^{k+2}是显然的. 任取\alpha\in\mathrm{Ker}\varphi^{k+2}, 即0=\varphi^{k+2} (\alpha)=\varphi^{k+1}(\varphi(\alpha)), 于是\varphi(\alpha)\in\mathrm{Ker}\varphi^{k+1}=\mathrm{Ker}\varphi^k, 从⽽\varphi^{k+1}(\alpha)=\varphi^k(\varphi(\alpha))=0, 即\alpha\in\mathrm{Ker}\varphi^{k+1}, 于是\mathrm{Ker}\varphi^{k+2}\subseteq\mathrm{Ker}\varphi^{k+1}也成⽴.(3) \Leftrightarrow (6): 考虑\varphi在不变⼦空间\mathrm{Im}\varphi上的限制变换\varphi|_{\mathrm{Im}\varphi}:\mathrm{Im}\varphi\to\mathrm{Im}\varphi, 由限制的定义可知它的核等于\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi, 它的像等于\mathrm{Im}\varphi^2. 由于有限维线性空间上的线性变换是单射当且仅当它是满射,当且仅当它是同构, 故 (3) \Leftrightarrow (6) 成⽴.(7) \Rightarrow (6) 是显然的, 下证 (6) \Rightarrow (7): 设\mathrm{Im}\varphi^k=\mathrm{Im}\varphi^{k+1}已对正整数k成⽴, 先证\mathrm{Im}\varphi^{k+1}=\mathrm{Im}\varphi^{k+2}也成⽴, 然后⽤归纳法即得结论. \mathrm{Im}\varphi^{k+2}\subseteq\mathrm{Im}\varphi^{k+1}是显然的. 任取\alpha\in\mathrm{Im}\varphi^{k+1}, 即存在\beta\in V, 使得\alpha=\varphi^{k+1}(\beta). 由于\varphi^k(\beta)\in\mathrm{Im}\varphi^k=\mathrm{Im}\varphi^{k+1}, 故存在\gamma\in V, 使得\varphi^k(\beta)=\varphi^{k+1}(\gamma), 于是\alpha=\varphi^{k+1}(\beta)=\varphi(\varphi^k(\beta))=\varphi(\varphi^{k+1}(\gamma))=\varphi^{k+2}(\gamma)\in\mathrm{Im}\varphi^{k+2}, 从⽽\mathrm{Im}\varphi^{k+1}\subseteq\mathrm{Im}\varphi^{k+2}也成⽴. (1) \Rightarrow (8) 是显然的, 下证 (8) \Rightarrow (1). 我们先证\mathrm{Im}\varphi\subseteq U: 任取\varphi(v)\in\mathrm{Im}\varphi, 由直和分解可设v=v_1+u, 其中v_1\in\mathrm{Ker}\varphi, u\in U, 则由U的\varphi-不变性可得\varphi(v)=\varphi(v_1)+\varphi(u)=\varphi(u)\in U.考虑不等式\dim V=\dim(\mathrm{Ker}\varphi\oplus U)=\dim\mathrm{Ker}\varphi+\dim U\geq\dim\mathrm{Ker}\varphi+\dim\mathrm{Im}\varphi=\dim V,从⽽只能是U=\mathrm{Im}\varphi, 于是 (1) 成⽴.(1) \Rightarrow (9) 是显然的, 下证 (9) \Rightarrow (1). 我们先证W\subseteq\mathrm{Ker}\varphi: 任取w\in W, 则由W的\varphi-不变性可得\varphi(w)\in\mathrm{Im}\varphi\cap W=0, 即有w\in\mathrm{Ker}\varphi. 考虑不等式\dim V=\dim(\mathrm{Im}\varphi\oplusW)=\dim\mathrm{Im}\varphi+\dim W\leq\dim\mathrm{Im}\varphi+\dim\mathrm{Ker}\varphi=\dim V,从⽽只能是W=\mathrm{Ker}\varphi, 于是(1) 成⽴. \Box注 1 引理 1 是 15 级⾼等代数 I 每周⼀题第 10 题, 其证明思路在⾼代⽩⽪书的例 4.32, 例 4.33, 例 4.34 和例 7.13 中均有所涉及.有了引理 1 做铺垫, 我们可以证明⼀系列的可对⾓化判定准则.定理 1 设\varphi是n维复线性空间V上的线性变换, 则\varphi可对⾓化的充要条件是对\varphi的任⼀特征值\lambda_0, 下列条件之⼀成⽴:(E1) V=\mathrm{Ker}(\varphi-\lambda_0I_V)\oplus\mathrm{Im}(\varphi-\lambda_0I_V);(E2) V=\mathrm{Ker}(\varphi-\lambda_0I_V)+\mathrm{Im}(\varphi-\lambda_0I_V);(E3) \mathrm{Ker}(\varphi-\lambda_0I_V)\cap\mathrm{Im}(\varphi-\lambda_0I_V)=0;(E4) \mathrm{Ker}(\varphi-\lambda_0I_V)=\mathrm{Ker}(\varphi-\lambda_0I_V)^2, 或等价地, \dim\mathrm{Ker}(\varphi-\lambda_0I_V)=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^2;(E5) \mathrm{Ker}(\varphi-\lambda_0I_V)=\mathrm{Ker}(\varphi-\lambda_0I_V)^2=\mathrm{Ker}(\varphi-\lambda_0I_V)^3=\cdots, 或等价地, \dim\mathrm{Ker}(\varphi-\lambda_0I_V)=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^2=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^3=\cdots; (E6) \mathrm{Im}(\varphi-\lambda_0I_V)=\mathrm{Im}(\varphi-\lambda_0I_V)^2, 或等价地, r(\varphi-\lambda_0I_V)=r((\varphi-\lambda_0I_V)^2);(E7) \mathrm{Im}(\varphi-\lambda_0I_V)=\mathrm{Im}(\varphi-\lambda_0I_V)^2=\mathrm{Im}(\varphi-\lambda_0I_V)^3=\cdots, 或等价地,r(\varphi-\lambda_0I_V)=r((\varphi-\lambda_0I_V)^2)=r((\varphi-\lambda_0I_V)^3)=\cdots;(E8) \mathrm{Ker}(\varphi-\lambda_0I_V)存在\varphi-不变补空间, 即存在\varphi-不变⼦空间U, 使得V=\mathrm{Ker}(\varphi-\lambda_0I_V)\oplus U;(E9) \mathrm{Im}(\varphi-\lambda_0I_V)存在\varphi-不变补空间, 即存在\varphi-不变⼦空间W, 使得V=\mathrm{Im}(\varphi-\lambda_0I_V)\oplus W.证明由引理 1 可知, ⽆论是充分性还是必要性, 我们只要选取 (E1)--(E9) 中的⼀个等价条件来证明即可.必要性设\varphi可对⾓化, 即存在V的⼀组基\{e_1,e_2,\cdots,e_n\}, 使得\varphi在这组基下的表⽰矩阵为对⾓阵\mathrm{diag}\{\lambda_1,\lambda_2,\cdots,\lambda_n\}, 不妨设\lambda_1=\cdots=\lambda_r=\lambda_0, \lambda_j\neq\lambda_0\,(r<j\leq n). 由表⽰矩阵的定义可知\varphi(e_i)=\lambda_ie_i\,(1\leq i\leq n), 通过简单的验证可得\mathrm{Ker}(\varphi-\lambda_0I_V)=L(e_1,\cdots,e_r),\mathrm{Im}(\varphi-\lambda_0I_V)=L(e_{r+1},\cdots,e_n), 于是 (E1) 成⽴.充分性对应于不同的等价条件, 我们给出⼏种不同的证法.从 (E3) 出发: ⽤反证法, 设\varphi不可对⾓化, 则由 (D6) 可知, 存在V的⼀组基\{e_1,e_2,\cdots,e_n\}, 使得\varphi在这组基下的表⽰矩阵为 Jordan 标准型\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\}, 且⾄少有⼀个 Jordan 块的阶数⼤于 1.不妨设r_1>1, 则由表⽰矩阵的定义可知\varphi(e_1)=\lambda_1e_1,\,\,\,\,\varphi(e_2)=e_1+\lambda_1e_2.于是(\varphi-\lambda_1I_V) (e_1)=0, (\varphi-\lambda_1I_V)(e_2)=e_1, 从⽽0\neq e_1\in\mathrm{Ker}(\varphi-\lambda_1I_V)\cap\mathrm{Im}(\varphi-\lambda_1I_V),这与已知⽭盾.从 (E5) 出发: 由\mathrm{Ker}(\varphi-\lambda_0I_V)=\cdots=\mathrm{Ker}(\varphi-\lambda_0I_V)^n可知, \lambda_0的根⼦空间等于其特征⼦空间. 因为全空间V可以分解为根⼦空间的直和, 故全空间V也是特征⼦空间的直和, 从⽽由判定准则 (D3) 即得结论.从 (E5) 出发: 由\dim\mathrm{Ker}(\varphi-\lambda_0I_V)=\cdots=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^n可知, \lambda_0的⼏何重数\dim\mathrm{Ker}(\varphi-\lambda_0I_V)等于其代数重数\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^n, 从⽽由判定准则 (D4) 即得结论.从 (E5) 出发: 设\varphi的全体不同特征值为\lambda_1,\lambda_2,\cdots,\lambda_k, \varphi的特征多项式为f(\lambda)=(\lambda-\lambda_1)^{m_1}(\lambda-\lambda_2)^{m_2}\cdots(\lambda-\lambda_k)^{m_k},则对任意的\alpha\in V, 由 Cayley-Hamilton 定理可知(\varphi-\lambda_1I_V)^{m_1}(\varphi-\lambda_2I_V)^{m_2}\cdots(\varphi-\lambda_kI_V)^{m_k}(\alpha)=0,即(\varphi-\lambda_2I_V)^{m_2}\cdots(\varphi-\lambda_kI_V)^{m_k}(\alpha)\in\mathrm{Ker}(\varphi-\lambda_1I_V)^{m_1}=\mathrm{Ker}(\varphi-\lambda_1I_V), 从⽽(\varphi-\lambda_1I_V)(\varphi-\lambda_2I_V)^{m_2}\cdots(\varphi-\lambda_kI_V)^{m_k}(\alpha)=0.不断这样做下去,最终可得对任意的\alpha\in V, 总有(\varphi-\lambda_1I_V)(\varphi-\lambda_2I_V)\cdots(\varphi-\lambda_kI_V)(\alpha)=0,即\varphi适合多项式g(\lambda)=(\lambda-\lambda_1)(\lambda-\lambda_2)\cdots(\lambda-\lambda_k), 从⽽\varphi的极⼩多项式m(\lambda)\midg(\lambda). ⼜由极⼩多项式的性质可知g(\lambda)\mid m(\lambda), 于是m(\lambda)=g(\lambda)⽆重根, 从⽽由判定准则 (D5) 即得结论.从 (E6) 出发: ⽤反证法, 设\varphi不可对⾓化, 则由 (D6) 可知, \varphi的 Jordan 标准型J=\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\}中⾄少有⼀个 Jordan 块的阶数⼤于 1. 不妨设r_1>1, 则有r(J_{r_1}(\lambda_1)-\lambda_1I_{r_1})=r_1-1, ⽽r((J_{r_1}(\lambda_1)-\lambda_1I_{r_1})^2)=r_1-2. 由矩阵秩的基本不等式可知, r(J-\lambda_1I_n)>r((J-\lambda_1I_n)^2), 即有r(\varphi-\lambda_1I_V)>r((\varphi-\lambda_1I_V)^2), 这与已知⽭盾. \Box推论 1 设\varphi是n维复线性空间V上的线性变换, 则\varphi可对⾓化的充要条件是V的任⼀\varphi-不变⼦空间都存在\varphi-不变补空间, 即对任⼀\varphi-不变⼦空间U, 都存在\varphi-不变⼦空间W, 使得V=U\oplus W.证明充分性可由定理 1 的 (E8) 或 (E9) 得到. 再证必要性, 因为\varphi可对⾓化, 故由 (D1) 可知, 存在V的⼀组基\{e_1,e_2,\cdots,e_n\}, 它们都是\varphi的特征向量. 由⾼代教材的推论 7.6.3 可知, \varphi在不变⼦空间U上的限制\varphi|_U也可对⾓化, 故同理存在U的⼀组基\ {\alpha_1,\cdots,\alpha_r\}, 它们也都是\varphi的特征向量. 由基扩张定理的证明可知, 我们可从\{e_1,e_2,\cdots,e_n\}中取出n-r个向量, 不妨设为e_{r+1},\cdots,e_n, 使得\{\alpha_1,\cdots,\alpha_r,e_{r+1},\cdots,e_n\}成为V的⼀组新基. 令W=L(e_{r+1},\cdots,e_n), 则W是\varphi-不变⼦空间且满⾜V=U\oplus W. \Box推论 2 设\varphi是数域\mathbb{K}上n维线性空间V上的线性变换 (或A是数域\mathbb{K}上的n阶⽅阵), 并且\varphi (或A) 的所有特征值都在\mathbb{K}中, 则\varphi (或A) 可对⾓化的判定准则 (D1)--(D6) 以及 (E1)--(E9) 在数域\mathbb{K}上也成⽴.证明与复数域\mathbb{C}上的证明完全类似, 具体细节留给读者⾃⼰完成. \Box注 2 定理 1 在复旦⼤学⾼等代数习题课教学视频 [3] 的第 16 讲“可对⾓化的判定 (下)”中作为例 9 出现, 它是⾼代⽩⽪书的例 7.13 和例 7.14的⾃然推⼴. 推论 1 是⾼代⽩⽪书的例 7.15.接下去, 我们将不利⽤⾣相似标准型理论和正交相似标准型理论, ⽽利⽤定理 1 直接证明复正规阵可对⾓化以及实对称阵可实对⾓化这两个重要结论.引理 2 设A为m\times n阶复矩阵, 则r(\overline{A}'A)=r(A\overline{A}')=r(A).证明这是⾼代⽩⽪书的例 3.72 的复版本, 其证明完全类似. \Box引理 3 设A为n阶复正规阵, 即满⾜A\overline{A}'=\overline{A}'A, 则r(A)=r(A^2).证明若A是 Hermite 阵, 即满⾜\overline{A}'=A, 则由引理 2 可知r(A)=r(A^2). 若A是复正规阵, 注意到A\overline{A}'是 Hermite 阵, 则由引理 2 可得r(A^2)=r(A^2\overline{A^2}')=r(AA\overline{A}'\overline{A}')=r(A\overline{A}'A\overline{A}')=r((A\overline{A}')^2)=r(A\overline{A}')=r(A),结论得证. \Box引理 4 设A为n阶复正规阵, \lambda_0是A的特征值, 则A-\lambda_0I_n也是复正规阵.证明由复正规阵的定义验证即得. \Box推论 3 复正规阵可对⾓化. 特别地, 实对称阵, 实反对称阵, Hermite 阵, 斜 Hermite 阵, 正交阵, ⾣阵均可复对⾓化.证明由引理 4, 引理 3 以及定理 1 (E6) 即得结论. \Box引理 5 实对称阵的特征值全为实数.证明设A为n阶实对称阵, \lambda_0\in\mathbb{C}是A的任⼀特征值, \alpha=(a_1,a_2,\cdots,a_n)'\in\mathbb{C}^n是对应的特征向量, 即A\alpha=\lambda_0\alpha. 上式两边同时左乘\overline{\alpha}', 则有\overline{\alpha}'A\alpha=\lambda_0\overline{\alpha}'\alpha. 注意到\alpha是⾮零向量, 故\overline{\alpha}'\alpha=\sum\limits_{i=1}^n|a_i|^2>0. 注意到A为实对称阵, 故\overline{(\overline{\alpha}'A\alpha)}'=\overline{\alpha}'A\alpha, 即\overline{\alpha}'A\alpha是⼀个实数, 从⽽\lambda_0=\dfrac{\overline{\alpha}'A\alpha}{\overline{\alpha}'\alpha}也是实数. \Box推论 4 实对称阵在实数域上可对⾓化.证法 1 设A为实对称阵, 由⾼代⽩⽪书的例 3.72 可得r(A)=r(A^2). 再由引理 5 可知, A的特征值全为实数, 于是根据推论 2 可得A在实数域上可对⾓化.证法 2 由推论 3 可知实对称阵可复对⾓化, ⼜其特征值全为实数, 故实对称阵复相似于实对⾓阵. 再由⾼代教材的推论 7.3.4 (相似关系在基域扩张下的不变性) 可知, 实对称阵可实对⾓化. \Box注 3 推论 3 和推论 4 是教学博⽂ [4] 的主要结果, 其证明的关键点也是本⽂的引理 3 以及定理 1 的类似思想.我们将推论 3 和推论 4 合并起来, 补充如下的可对⾓化判定准则:(D7) 若复⽅阵相似于复正规阵, 则可对⾓化; 若实⽅阵实相似于实对称阵, 则可实对⾓化.我们先给出⼀个相似于复正规阵的例⼦.例 1 (⽩⽪书的例 6.33) 设n阶复⽅阵A可对⾓化, 证明: 矩阵\begin{pmatrix} A & A^2 \\ A^2 & A \\ \end{pmatrix}也可对⾓化.证明设P为⾮异阵, 使得P^{-1}AP=\Lambda为对⾓阵. 考虑相似变换\begin{pmatrix} P^{-1} & 0 \\ 0 & P^{-1} \\\end{pmatrix}\begin{pmatrix} A & A^2 \\ A^2 & A \\ \end{pmatrix}\begin{pmatrix} P & 0 \\ 0 & P \\ \end{pmatrix}=\begin{pmatrix} \Lambda &\Lambda^2 \\ \Lambda^2 & \Lambda \\ \end{pmatrix},通过简单的验证可知, \begin{pmatrix} \Lambda & \Lambda^2 \\ \Lambda^2 & \Lambda \\ \end{pmatrix}是复正规阵, 故由判定准则 (D7) 可知结论成⽴. \Box最后, 我们给出⼀个相似于实对称阵的例⼦, 更多的例题请参考⾼代⽩⽪书的例 9.63--例 9.65.例 2 (⽩⽪书的例 6.40) 设a,b,c为复数且bc\neq 0, 证明下列三对⾓矩阵可对⾓化: T(a,b,c)=\begin{pmatrix} a & b & & & & \\ c & a & b & & & \\ & c & a & b & & \\ & & \ddots & \ddots & \ddots & \\ & & & c & a & b \\ & & & & c & a \\ \end{pmatrix}.证明要证T(a,b,c)可对⾓化, 只要证T(a,b,c)-aI_n=T(0,b,c)可对⾓化即可, 故不妨设a=0. 由于bc\neq 0, 故对T(0,b,c)实施如下的相似初等变换: 依次将第i+1⾏乘以\sqrt{\bigg(\dfrac{b}{c}\bigg)^i}, 再将第i+1列乘以\sqrt{\bigg(\dfrac{c}{b}\bigg)^i}(1\leq i\leq n-1), 可得T(0,b,c)复相似于T(0,\sqrt{bc},\sqrt{bc})=\sqrt{bc}\cdot T(0,1,1). 因为T(0,1,1)是实对称阵, 故可对⾓化, 从⽽T(a,b,c)也可对⾓化. \Box参考⽂献[1] ⾼代教材: 姚慕⽣, 吴泉⽔, 谢启鸿编著, ⾼等代数学 (第三版), 复旦⼤学出版社, 2014.[2] ⾼代⽩⽪书: 姚慕⽣, 谢启鸿编著, 学习⽅法指导书: ⾼等代数 (第三版), 复旦⼤学出版社, 2015.Processing math: 0%。

可对角化的概念

可对角化的概念


③式减②式得
a1 (1 k )1 a2 (2 k ) 2 ak 1 (k 1 k ) k 1 0
1 , 2 , k 1 线性无关,所以 由归纳假设,
ai (i k ) 0, i 1,2,, k 1.
但 1 , 2 ,, k 互不相同,所以 a1 a2 ak 1 0.
4. (定理9) 设 为线性空间V的一个线性变换,
1 , 2 ,k 是 的不同特征值,而 i 1 , i 2 , iri 是属于
特征值 i 的线性无关的特征向量, i 1,2,, k , 则向量 11 , , 1r1 , , k 1 , , krk 线性无关.
0 0 A 0 0 1 0 0 0 0 1 0 0 0 0 1 0
于是
0 E A 0 0
1 0 1 0 0 0 0

0 0 n 1
∴ D的特征值为0(n重).
将之代入①,得 ak k 0.
k 0,
ak 0
故 1 , 2 , , k 线性无关.
3. (推论1) 设 为n 维线性空间V的一个线性变换,
如果 的特征多项式在数域 P 中有n个不同特征值, 则 可对角化. 特别地,(推论2) 在复数域C上的线性空间中, 如果线性变换 的特征多项式没有重根,则 可 对角化.
2° 对每一个特征值 i ,求出齐次线性方程组
i E A X 0,
i 1.2. k
的一个基础解系(此即 的属于 i 的全部线性无关 的特征向量在基 1 , 2 , , n下的坐标).
3°若全部基础解系所合向量个数之和等于n ,则

实对称阵可对角化的几种证明及其推广

实对称阵可对角化的几种证明及其推广

实对称阵可对⾓化的⼏种证明及其推⼴实对称阵是⼀类常见的矩阵, 它与实⼆次型和实内积空间上的⾃伴随算⼦有着密切的联系. 任⼀实对称阵 A 均正交相似于对⾓阵, 即存在正交阵 P , 使得P ′AP =diag{λ1,λ2,⋯,λn }.实对称阵的这条重要性质, 通常在内积空间的框架中加以证明 (参考复旦⾼代教材第 9.5 节). 事实上, 这⼀性质既可以在引⼊矩阵可对⾓化的定义和判定准则后直接加以证明, 也可以利⽤ Jordan 标准型理论加以证明. 下⾯我们将给出实对称阵可对⾓化的⼏种证明, 为此先来证明三个简单的引理.引理 1 实对称阵的特征值都是实数.证明 设 A 为 n 阶实对称阵, λ0∈C 是 A 的任⼀特征值, α=(a 1,a 2,⋯,a n )′∈C n 是对应的特征向量, 即 A α=λ0α. 上式两边同时左乘 ¯α′, 则有 ¯α′A α=λ0¯α′α. 注意到 α 是⾮零向量, 故 ¯α′α=n∑i =1|a i |2>0. 注意到 A 为实对称阵, 故 ¯(¯α′A α)′=¯α′A α, 即 ¯α′A α 是⼀个实数, 从⽽λ0=¯α′A α¯α′α也是实数. ◻引理 2 设 A 为 n 阶实对称阵, 则 r (A )=r (A 2)=r (A 3)=⋯.证明 由⾼代⽩⽪书的例 3.72 可知 r (A )=r (A ′A )=r (A 2), 从⽽ r (A )=r (A 2m) (m ≥1). 再由矩阵相乘秩相等或变⼩的性质以及夹逼法可知 r (A )=r (A k )(k ≥1). ◻引理 3 设 A 为 n 阶实对称阵, 则 Ker A ∩Im A =0 并且 Ker A =Ker A 2=Ker A 3=⋯.证明 由引理 2 以及线性映射的维数公式即得. ◻定理 1 实对称阵可实对⾓化.证法 1 (有完全的特征向量系) 由引理 1 可设 A 的全体实特征值为 λ1,λ2,⋯,λn , 我们对特征值 λ1 来证明其代数重数等于其⼏何重数. 不失⼀般性, 可设 λ1=⋯=λm , 但 λj ≠λ1(m <j ≤n ), 即 λ1 的代数重数为 m . 由复旦⾼代教材的定理 6.1.2 及其后的注可知, 存在⾮异实矩阵 P , 使得 P −1AP =B C 0D, 其中 B 是主对⾓元为 λ1 的 m 阶上三⾓阵, D 是主对⾓元分别为 λm +1,⋯,λn 的上三⾓阵, 于是P −1(A−λ1I n )P =B −λ1I mC 0D −λ1I n −m.注意到 B −λ1I m 是主对⾓元全为零的上三⾓阵, 这是⼀个幂零阵, 故 (B −λ1I m )m =0, 从⽽P −1(A−λ1I n )m P=B −λ1I mC 0D −λ1I n −mm=0∗0(D −λ1I n −m )m.注意到 (D −λ1I n −m )m 是⼀个主对⾓元全不为零的上三⾓阵, 从⽽是⾮异阵, 于是 r ((A −λ1I n )m )=n −m . 注意到 A −λ1I n 为实对称阵, 再由引理2 可知, λ1 的⼏何重数为n −r (A −λ1I n )=n −r ((A −λ1I n )m )=n −(n −m )=m ,即⼏何重数等于代数重数.证法 2 (全空间等于特征⼦空间的直和) 任取 A 的实特征值 λ0, 由引理 3 可知Ker(A −λ0I n )=Ker(A −λ0I n )2=⋯,再由⾼代⽩⽪书的例 7.13 的证法 1 完全相同的讨论即得结论. 另外, 由 Ker(A −λ0I n )=Ker(A −λ0I n )n 可知, λ0 的⼏何重数 dimKer(A −λ0I n )等于其代数重数 dimKer(A −λ0I n )n , 即 A 有完全的特征向量系, 这⼀⽅法⽐证法 1 更加简洁.证法 3 (极⼩多项式⽆重根) 任取 A 的实特征值 λ0, 由引理 3 可知Ker(A −λ0I n )=Ker(A −λ0I n )2=⋯,()()()()再由⾼代⽩⽪书的例 7.13 的证法 2 完全相同的讨论即得结论.证法 4 (Jordan 标准型之⼀) 任取A的实特征值λ0, 由引理 3 可知Ker(A−λ0I n)∩Im(A−λ0I n)=0,再由⾼代⽩⽪书的例 7.13 的证法 3 完全相同的讨论即得结论.证法 5 (Jordan 标准型之⼆) 任取A的实特征值λ0, 由引理 2 可知r(A−λ0I n)=r((A−λ0)2), 再由⾼代⽩⽪书的例 7.14 的证法 2 完全相同的讨论即得结论.证法 6 (Jordan 标准型之三) 设P为⾮异实矩阵, 使得P−1AP=J=diag{J r1(λ1),⋯,J rk(λk)}.⽤反证法, 若A不可对⾓化, 则不妨设r1>1. 设P′P=(b ij), 则b12=b21并且b11是P的第⼀列元素的平⽅和, 由P的⾮异性可知b11>0. 注意到P′AP=P′PJ为对称阵, 但P′PJ的第 (1,2) 元为b11+λ1b12, 第 (2,1) 元为λ1b21, 这两者不相等, ⽭盾.证法 7 (内积空间理论) 参考复旦⾼代教材的定理 9.5.2 和推论 9.5.2. ◻事实上, 我们也可以这样来看. 由上⾯的讨论可知, 对任⼀n阶实对称阵A, 全空间 R n等于A的所有特征⼦空间的直和. 容易证明: 在 R n的标准内积下, A的属于不同特征值的特征向量必正交, 属于同⼀特征值的特征向量可以利⽤ Gram-Schmidt 正交化⽅法化成两两正交的单位特征向量. 因此我们可以找到A的n个两两正交的单位特征向量, 将这些向量拼成矩阵P, 则P是⼀个n阶正交阵, 使得P′AP=diag{λ1,λ2,⋯,λn}.这就是A的正交相似标准型, 它对于深⼊探讨实对称阵的正定性和半正定性有着重要的作⽤.注 1 本题是 15 级⾼代 II 每周⼀题第 10 题第 1 ⼩问以及 16 级⾼代 II 每周⼀题第 6 题. 给出上述证法的复旦数学学院学⽣为: 章俊鑫 (证法 1),何陶然 (类似证法 1), 徐钰伦 (证法 2), 杨锦⽂ (证法 2), 杨钊杰 (证法 2), 蒋亦凡 (证法 3), 胡晓波 (证法 5), 杨彦婷 (证法 5), 沈伊南 (类似证法 6).下⾯将实对称阵可对⾓化的⼏种证法进⾏适当地推⼴, 从⽽不利⽤⾣相似标准型理论也可以直接证明: 实反对称阵, Hermite 阵, 斜 Hermite 阵,正交阵, ⾣阵, 以及更⼀般的复正规阵均可复对⾓化. 这是 15 级⾼代 II 每周⼀题第 10 题第 2 ⼩问以及 17 级⾼代 II 每周⼀题第 7 题第 2 ⼩问.我们先给出前三个引理的推⼴.引理 4 Hermite 阵的特征值都是实数. 特别地, 斜 Hermite 阵 (实反对称阵) 的特征值都是 0 或纯虚数.证明 Hermite 阵情形的证明完全类似于实对称阵情形的证明 (参考引理 1). 设A为斜 Hermite 阵, 则 i A为 Hermite 阵, 从⽽ i A的特征值都是实数, 于是A的特征值都是 0 或纯虚数. 实反对称阵是⼀种特殊的斜 Hermite 阵, 故结论也成⽴. ◻引理 5 设A为n阶复正规阵, 则r(A)=r(A2)=r(A3)=⋯.证明由⾼代⽩⽪书的例 3.72 对应的复版本可知: 对任意的m×n阶复矩阵A, 有r(A)=r(¯A ′A)=r(A¯A′).特别地, 若A是 Hermite 阵, 则r(A)=r(A2), 再仿照引理 2 的证明即得结论. 若A是复正规阵, 即A ¯A′=¯A′A, 注意到A¯A′是 Hermite 阵, 故有r(A2)=r(A2¯A2′)=r(AA¯A′¯A′)=r(A¯A′A¯A′)=r((A¯A′)2)=r(A¯A′)=r(A),再仿照引理 2 的证明即得结论. ◻引理 6 设A为n阶复正规阵, 则 Ker A∩Im A=0 并且 Ker A=Ker A2=Ker A3=⋯.证明由引理 5 以及线性映射的维数公式即得. ◻定理 2 复正规阵可对⾓化. 特别地, 实反对称阵, Hermite 阵, 斜 Hermite 阵, 正交阵, ⾣阵均可复对⾓化.证明定理 1 的证法 1--证法 5 可完全平⾏地改写⽤于证明定理 2; 定理 1 的证法 6 适当地修改之后可以证明: 实反对称阵, Hermite 阵,斜 Hermite 阵均可复对⾓化; 我们把具体的证明过程留给感兴趣的读者⾃⾏完成. 证法 7 可参考复旦⾼代教材的定理 9.6.2 和定理 9.6.3. ◻注 2 本⽂中的相关思想可推⼴为⼀般的可对⾓化判定准则, 具体的内容请参考教学博⽂ [3].参考⽂献[1] ⾼代教材: 姚慕⽣, 吴泉⽔, 谢启鸿编著, ⾼等代数学 (第三版), 复旦⼤学出版社, 2014.[2] ⾼代⽩⽪书: 姚慕⽣, 谢启鸿编著, 学习⽅法指导书: ⾼等代数 (第三版), 复旦⼤学出版社, 2015.Processing math: 100%。

矩阵a可对角化的充要条件

矩阵a可对角化的充要条件

矩阵a可对角化的充要条件矩阵a可对角化的充要条件引言矩阵的对角化是线性代数中一个重要的概念,能够简化矩阵的计算和分析过程。

在研究矩阵可对角化的条件时,我们需要探讨其充要条件。

充分条件矩阵a可对角化的充分条件是存在一个可逆矩阵P,使得矩阵P-1AP为对角矩阵。

即:P<sup>-1</sup>AP = D其中D为对角矩阵,其主对角线元素为矩阵a的特征值。

必要条件矩阵a可对角化的必要条件是矩阵a有n个线性无关的特征向量,其中n为矩阵a的维数。

充要条件的证明充分性证明对于矩阵a可对角化的充分条件,我们需要证明存在一个可逆矩阵P,使得矩阵P-1AP为对角矩阵。

假设矩阵a的特征值为λ1, λ2, …, λn,对应的特征向量为v1, v2, …, vn。

我们可以将特征向量按列放在一个矩阵中,记作P=[v1, v2, …, vn]由于特征向量v1, v2, …, vn是线性无关的,矩阵P是可逆的。

我们可以计算P-1AP:P<sup>-1</sup>AP = [P<sup>-1</sup>v<sub>1</sub>, P< sup>-1</sup>v<sub>2</sub>, ..., P<sup>-1</sup>v<sub>n</s ub>] [λ<sub>1</sub>v<sub>1</sub>, λ<sub>2</sub>v<sub>2</ sub>, ..., λ<sub>n</sub>v<sub>n</sub>] = [λ<sub>1</sub>P <sup>-1</sup>v<sub>1</sub>, λ<sub>2</sub>P<sup>-1</sup>v <sub>2</sub>, ..., λ<sub>n</sub>P<sup>-1</sup>v<sub>n</s ub>]由于P是可逆矩阵,P-1v1, P-1v2, …, P-1vn也是线性无关的特征向量,且它们对应的特征值分别为λ1, λ2, …, λn。

矩阵对角化公式

矩阵对角化公式

矩阵对角化公式矩阵对角化是线性代数中的重要概念,它提供了一种将一个矩阵表示为对角矩阵的方法,使得矩阵的运算更加简化。

在本文中,我们将介绍矩阵对角化的基本概念、判定条件以及计算方法。

1. 矩阵对角化的基本概念一个n×n矩阵A可对角化,意味着存在一个可逆矩阵P和一个对角矩阵D,使得A=PDP^{-1}。

其中,D是由A的特征值组成的对角矩阵。

2. 判定矩阵可对角化的条件一个n×n矩阵A可对角化的条件是:- 矩阵A有n个线性无关的特征向量;- 矩阵A的每个特征值都有对应的正交归一化特征向量。

3. 计算矩阵的特征值和特征向量要计算一个矩阵A的特征值和特征向量,可以遵循以下步骤:- 计算矩阵A的特征多项式det(A-λI),其中λ是一个未知数,I是单位矩阵;- 解特征多项式的根,即特征值λ;- 将特征值代入方程A-λI的解空间中,求解特征向量。

4. 矩阵对角化的计算过程对于可对角化的矩阵A,可以按以下步骤进行对角化:- 对矩阵A进行特征值分解,得到特征矩阵V和对角矩阵D;- 计算可逆矩阵P,使得A=V^{-1}DVP;- 可以通过相似变换将矩阵A对角化,P表示变换矩阵。

5. 对角化与矩阵的性质对角矩阵的特点是非常简单的,可以很容易地计算幂、指数和逆矩阵等运算。

因此,对角化使得矩阵的运算更加简化。

6. 矩阵对角化的应用矩阵对角化在许多领域都有广泛应用,包括物理、工程和数据分析等。

例如,在量子力学中,矩阵对角化可以把含有多个粒子态的哈密顿矩阵表示成一组分立的单粒子能级。

总结:矩阵对角化是线性代数中一个重要的概念,它提供了将一个矩阵表示为对角矩阵的方法。

这篇文章介绍了矩阵对角化的基本概念、判定条件及计算方法,还讨论了对角化的计算过程、矩阵的性质以及应用领域。

对角化简化了矩阵的运算,并且在许多领域有广泛的应用。

矩阵可对角化的充要条件

矩阵可对角化的充要条件

矩阵可对角化的充要条件引言矩阵对角化是矩阵理论中的一个重要概念,它能够让我们更好地理解矩阵的性质和运算。

在实际应用中,对角化可以简化计算和分析过程,因此对于一个矩阵是否可对角化的问题,是值得我们深入研究和探讨的。

本文将探讨矩阵可对角化的充要条件,通过理论推导和实例分析,将会全面、详细、完整地讲解矩阵可对角化的各种情况及其判定条件。

I. 列举与分析矩阵的特殊情况为了更好地理解什么样的情况下一个矩阵可对角化,我们先来列举一些特殊的矩阵情况,并分析它们是否可对角化。

1. 对角矩阵对角矩阵是指主对角线以外的元素都为零的矩阵。

例如:[ A =]对于任意的对角矩阵,由于它的非零元素只存在于主对角线上,所以它必然是一个可对角化的矩阵。

2. 对称矩阵对称矩阵是指矩阵的转置等于其本身的矩阵。

例如:[ B =]对于任意的对称矩阵,它必然是一个可对角化的矩阵。

这是因为对于对称矩阵,其特征值都是实数,且对应不同特征值的特征向量是相互正交的,因此可以通过特征向量的线性组合来表示整个矩阵。

3. 可逆矩阵可逆矩阵是指存在逆矩阵的矩阵。

例如:[ C =]对于任意的可逆矩阵,它必然是一个可对角化的矩阵。

这是因为可逆矩阵的特征值都是非零的,且可逆矩阵可以表示为一个对角矩阵和一个正交矩阵的乘积,而正交矩阵的转置等于其逆矩阵,因此可逆矩阵可以通过正交矩阵的逆变换为对角矩阵。

II. 可对角化的充分条件在上一节中,我们列举了一些特殊的矩阵情况,并发现它们对应的矩阵都是可对角化的。

接下来,我们将推导出可对角化的充分条件,并用定理的形式表述出来。

定理1对于一个n阶矩阵A,如果它有n个线性无关的特征向量,那么A是可对角化的。

证明:假设A有n个线性无关的特征向量,分别为v1, v2, …, vn,相应的特征值分别为λ1, λ2, …, λn。

根据特征值与特征向量的定义,我们可以得到以下等式:Av1 = λ1v1Av2 = λ2v2…Avn = λnv现在,我们将这n个特征向量构成一个矩阵V,即:V = [v1, v2, …, vn]同时,将这n个特征值构成一个对角矩阵Λ,即:Λ = []根据上述等式,我们可以得到:AV = [Av1, Av2, …, Avn] = [λ1v1, λ2v2, …, λnvn] = VΛ由于V是一个可逆矩阵(因为v1, v2, …, vn是线性无关的),所以可以将上述等式两边都左乘V的逆矩阵V^-1,得到:AVV^-1 = VΛV^-1即:A = VΛV^-1因此,我们证明了如果一个n阶矩阵A有n个线性无关的特征向量,那么A是可对角化的。

矩阵可对角化条件与方法

矩阵可对角化条件与方法

矩阵可对角化条件与方法矩阵的可对角化是一个重要的概念,在线性代数中占据着重要的地位。

一个矩阵是否可对角化决定着其特征值与特征向量的性质,对于解决线性方程组、求解线性变换以及简化计算都有着重要意义。

本文将介绍矩阵可对角化的条件与方法。

一、矩阵可对角化的条件对于一个n阶矩阵A,如果存在可逆矩阵P使得P-1AP为对角矩阵D,则称矩阵A可对角化。

下面是矩阵可对角化的充分条件:1. 矩阵A有n个线性无关的特征向量。

2. 矩阵A的n个特征向量构成了n维空间的一组基。

3. 矩阵A的特征值都是代数重数等于几何重数的。

这三个条件是矩阵可对角化的充分条件,也是我们在判断矩阵可对角化时常常使用的条件。

二、矩阵对角化的方法1. 求特征值和特征向量的方法对于一个矩阵A,我们首先需要求解其特征值和特征向量。

求解特征值的方法是通过解方程|A-λI|=0,其中λ为特征值,I为单位矩阵。

解得特征值后,再通过求解(A-λI)X=0,其中X为特征向量。

这个方法是最常用的求解特征值和特征向量的方法。

2. 判断矩阵可对角化的方法在求解完特征值和特征向量后,接下来需要判断矩阵是否可对角化。

常用的方法有以下几种:(1)检查特征值的代数重数与几何重数是否相等。

如果对于每个特征值的代数重数等于几何重数,则矩阵可对角化。

(2)检查特征向量的个数是否等于矩阵的秩。

如果矩阵的秩等于n 个特征向量的个数,则矩阵可对角化。

(3)判断矩阵的特征向量能否构成一组基。

根据线性代数的知识,如果矩阵A的n个特征向量能够构成一组基,则矩阵可对角化。

三、矩阵对角化的应用矩阵的可对角化在许多领域中都有着广泛的应用。

以下是一些常见的应用:1. 线性方程组的求解。

对于一个矩阵可对角化的线性方程组,可以通过对角化后的矩阵求解出方程组的解。

2. 线性变换的简化。

在线性代数中,矩阵可对角化可以将线性变换转化为更简单的形式,从而简化计算。

3. 特征值问题的求解。

矩阵的特征值问题可以通过矩阵的可对角化来求解,从而得到矩阵的特征值。

判断矩阵是否可对角化的方法

判断矩阵是否可对角化的方法

判断矩阵是否可对角化的方法1.引言1.1 概述在线性代数中,矩阵的对角化是一种重要的研究方法,可以帮助我们简化矩阵的计算和分析。

通过对角化,我们可以将一个复杂的矩阵转化为一个对角矩阵,使得矩阵的运算变得更加简单和直观。

然而,并非所有的矩阵都可以进行对角化。

有些矩阵由于其特殊的性质或结构,无法被对角化。

因此,判断一个矩阵是否可以对角化成为一个重要的问题,在矩阵理论和应用中具有广泛的意义。

本文将介绍一些判断矩阵是否可对角化的方法。

这些方法包括变换法、特征值法和可对角化标准形等。

通过运用这些方法,我们可以确定一个矩阵是否可以对角化,以及找出对角化所需的相应变换矩阵和对角矩阵。

文章的正文部分将详细介绍这些方法。

首先,我们将详细描述变换法,并给出相应的步骤和注意事项。

然后,我们将介绍特征值法,它是判断矩阵可对角化的常用方法之一。

我们将解释特征值的概念,并提供相应的判断条件和计算方法。

最后,我们将介绍可对角化标准形,它是判断矩阵是否可对角化的一个重要的准则。

我们将详细介绍可对角化标准形的定义、性质和应用。

在结论部分,我们将对整篇文章进行总结,并充分展望未来对于判断矩阵是否可对角化的更深入研究方向。

研究和应用矩阵的对角化具有重要的理论和实际意义,因此为了进一步提高矩阵的运算效率和准确性,我们需要不断深化对矩阵可对角化性质的研究与理解。

通过本文的阅读,读者将能够了解判断矩阵是否可对角化的一些基本方法,并能够应用这些方法解决实际问题。

同时,我们也将为矩阵的对角化研究提供一些思路和参考,促进相关领域的深入发展和应用。

文章结构部分的内容可以这样编写:1.2 文章结构本篇文章主要围绕判断矩阵是否可对角化的方法展开讨论。

文章分为引言、正文和结论三个部分。

引言部分主要包括对本文的概述、文章结构以及研究目的的介绍。

首先,我们会概述矩阵对角化的重要性和应用背景。

接着,我们会介绍文章的整体结构,明确每个部分的主要内容和研究重点。

线性变换“可对角化”的条件及“对角化”方法

线性变换“可对角化”的条件及“对角化”方法

对角化方法在控制系统设计 中的应用
在机器学习中的应用
对角化矩阵可以提高机器学 习算法的收敛速度

对角化矩阵可以简化机器学 习算法的实现过程
线性变换可对角化在机器学 习算法中的优化性能
对角化矩阵可以提高机器学 习算法的稳定性
研究现状及问题
线性变换对角化的研究历史与现状 当前研究存在的问题与挑战 未来研究方向与趋势 当前研究的热点问题与争议
当前研究的挑战与困难
确定对角化方法的 有效性
确定对角化方法的 普适性
确定对角化方法在 不同领域的应用价 值
探索新的对角化方 法
解决挑战的方法与策略
发展新的数学工具:引入新的数学理论和方法,以解决线性变换对角化中遇到的问题
借鉴其他领域的经验:参考其他领域类似的案例和经验,寻找解决方案 深入研究线性变换的性质:更深入地了解线性变换的性质和特点,为对角化提供更多思路和方法 开发高效的数值计算方法:发展更高效、更精确的数值计算方法,提高对角化的效率和准确性
对未来研究的展望与预期
探索更多可对角化的线性变换类型 深入研究线性变换对角化的条件和算法 拓展线性变换对角化在各个领域的应用 加强与其他领域的交叉研究,推动线性代数的发展
对未来应用的设想与期待
线性变换对角化在科学计 算领域的应用
对量子计算领域的影响
在机器学习领域的应用前 景
对未来科技发展的推动与 影响
特征值的应用:通过特征值可以对矩阵进行分解,应用于信号处理、图像处理等领域
相似变换的应用:通过相似变换可以将矩阵转化为对角矩阵,应用于相似分类、机器学习等领 域
对角化方法的优缺点:对角化方法具有简单易行、直观性等优点,但也存在局限性,如不适用 于非方阵等情形

7.6 可对角化矩阵

7.6  可对角化矩阵

的特征多项式是
−3
2
−3
−2
1
+2
−2 = 3 − 12 + 16 = ( − 2)2
−6
+1
特征根是 2,2,-4.
对于特征根-4,求出齐次线性方程组
−7 −2
2 −2
−3 −6
的一个基础系
1
2
, − ,1
3

1
−2
−3
1
0
2 = 0
3
0
对于特征根 2,求出齐次线性方程组

根据归纳法假设, 1 , 2 , ⋯ , −1 线性无关,所以
( − ) = , = , , ⋯ , − .
但 1 , 2 , ⋯ 两两不同,所以 1 = 2 = ⋯ = −1 = 0 ,再代入(3),
因为 ≠ 0, 所以 = 0. 这就证明了 , , ⋯ , 线性无关。
()
+ + ⋯ + = . ∈ ,
推论7.6.2 设σ是数域F上向量空间V的一个线性变换, 1 , 2 , ⋯ , 是σ的
互不相同的特征值。又设 1 , ⋯ , , = 1, ⋯ , , 是属于特征值 的线性
无关的特征向量, 那么向量 11 , ⋯ , 11 , ⋯ , 1 , ⋯ , 线性无关.
如果等式
()
+ + ⋯ + = . ∈ ,
成立,那么以 乘(3)的两端得
()
+ + ⋯ + = .
另一方面,对(3)式两端施行线性变换σ,
注意到等式(2),我们有
()
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

矩阵可对角化的判定条件及推广数学与计算机科学学院 数学与应用数学(S ) 学号:2011031103 姓名:方守强 指导教师:梁俊平摘要:矩阵是否可以对角化,是矩阵的一条很重要的性质。

对相似可对角化的充分必要条件的理解,一直是线性代数学习中的一个困难问题。

本文给出了矩阵可对角化的几个充分必要条件和相应的证明。

关键词:方阵;特征值;特征向量;对角化引言:矩阵是高等代数中的重要组成部分,是许多数学分支研究的重要工具。

而对角矩阵作为矩阵中比较特殊的一类,其形式简单,研究起来也非常方便。

研究矩阵的对角化及其理论意义也很明显,矩阵相似是一种等价关系,对角化相当于对一类矩阵在相似意义下给出了一种简单的等价形式,这对理论分析是方便的。

相似的矩阵拥有很多相同的性质,比如特征多项式、特征根、行列式……如果只关心这类性质,那么相似的矩阵可以看作是没有区别的,这时研究一个一般的可对角化矩阵,只要研究它的标准形式——一个对角形矩阵就可以了。

而对角矩阵是最简单的一类矩阵,研究起来非常方便。

在本课题中通过阅读参考文献、查阅相关资料,初步总结出了矩阵可对角化的若干充分必要条件,并给予了相应的证明过程。

一、矩阵可对角化的概念1 特征值、特征向量的概念定义1 设A 是数域P 上线性空间V 的一个线性变换, 如果对于数域P 中的一个数0λ存在一个非零向量ε使得ελε0=A ,那么0λ称为A 的一个特征值,而ε 称为A 的属于特征值0λ的一个特征向量。

求方阵A 的特征值与特征向量的步骤:(1)由特征方程A E -λ=0求得A 的n 个特征值,设t λλλ,,,21 是A 的互异特征值,其重数分别为t n n n ,,,21 则n n n n t =+++ 21。

(2)求解齐次线性方程组()0=-X A E i λ()t i ,,2,1 =,其基础解系s i i i p p p ,,,21 (t i n s i i ,,2,11 =≤≤,)就是A 所对应特征值i λ的线性无关的特征向量。

2 矩阵可对角化的概念定义2 设A 是矩阵F 上一个n 阶方阵,如果存在数域F 上的一个可逆矩阵P ,使得AP P 1-为对角形矩阵,那么就说矩阵A 可以对角化。

任意方阵A 的每一个特征值i λ都有一个与之相对应的特征向量i P 满足i i i P AP λ=()n ,1,2,i =,则这个方程可以写成()()n n P P P P P P A ,,,,,,2121 =⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛n λλλ21 , (1) 我们定义矩阵()n P P P P ,,,21 =,()n diag B λλλ,,,21 =则(1)式可写成PB AP =,若矩阵P 是可逆阵,则有()n diag B AP P λλλ,,,211 ==-引理1 设A 、B 都是n 阶矩阵,则有秩()AB ≥秩()A +秩()n B - 。

引理2 设s λλλ,,,21 (n s ≤)为n 阶方阵A 的所有互异特征值,则矩阵A 的线性无关的特征向量的最大个数为()()()I A r I A r I A r sn s λλλ------- 21。

证明 设s λλλ,,,21 (n s ≤)为n 阶方阵A 的所有互异特征值,因为特征值i λ()s ,1,2,i =相应的线性无关的特征向量的最大个数即为线性方程组()0=-XI A i λ的基础解析所含向量的个数,所以特征值()n s s ≤λλλ,,,21 相应的线性无关的特征向量的最大个数分别为()I A r n i λ--,()I A r n 2λ--,…,()I A r n s λ--,而矩阵A 的不同特征值的线性无关的特征向量并在一起仍然线性无关,从而,矩阵A 线性无关的特征向的最大个数为()()()I A r I A r I A r sn s λλλ------- 21。

引理3 设A 为n 阶方阵,s λλλ,,,21 是任意两两互异的数,则()()()()()()()n s I A r I A r I A r I A I A I A r s s 1][2121---++-+-=---λλλλλλ 。

二、矩阵可对角化的充分必要条件1 矩阵可对角化的充分必要条件及其证明定理1 数域P 上n 阶方阵A 可对角化的充分必要条件是A 有n 个线性无关的特征向量。

证明(1)充分性 假设n P P P ,,,21 是矩阵A 的n 个线性无关的特征向量,即有i i i P AP λ=()n ,1,2,i =,令矩阵()n P P P P ,,,21 =由特征向量n P P P ,,,21 组成,因为n P P P ,,,21 是线性无关的,因此矩阵P 是非奇异矩阵,其逆矩阵记为1-P ,根据逆矩阵的定义有P P 1-=()n P P P P P P 12111,,,--- ,另一方面,由i i i P AP λ=易知,()n AP AP AP AP ,,,21 = =()n n P P P λλλ,,,2211 ,给此式左乘矩阵1-P ,则有n I AP P =-1⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n λλλ21=⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛n λλλ21, 即充分性得证。

(2)必要性 令矩阵A 和对角形矩阵D 相似,即存在可逆矩阵P 使得D AP P =-1,则有PD AP =,于是记P =(n P P P ,,,21 ),()Tn d d d D ,,,21 =则PD AP =可以写成()n AP AP AP ,,,21 =(n n P d P d P d ,,,2211 )即有i i i P d AP =()n ,1,2,i =,这说明矩阵P 的列向量i P 是矩阵A 的特征向量,而已知P 是可逆阵,故P 的n 个列向量n P P P ,,,21 线性无关,必要性得证。

定理2 设 n n P A ⨯=,则A 可以对角化的充分必要条件是: (1)A 的特征根都在数域P 内, (2)对A 的每个特征根λ,有,()k =--A E n λ秩,其中k 是λ的重数。

条件(2) 也可改述为:特征根λ的重数等于齐次线性方程组()0=-X A E λ的基础解系所含向量的个数(简称为代数重数等于几何重数)。

条件(2)还可改述为:令有()[]n A n ri i =-∑=1-E λ秩,即属于A 的不同特征根的线性无关的特征向量总数是n 。

条件(1),(2)还可改述为:A 的属于不同特征值的特征子空间的维数之和等于n 。

证明 设r λλλ,,,21 是A 的所有不同的特征根,j jt j αα,,1 是齐次线性方程组()0=-X A E j λ()r j ,,2,1 =的一个基础解系,则A 的特征向量rrrt r t t ααααα,,,,,,,,111111一定线性无关。

如果n t t t r =+++ 21, 则A 有n 个线性无关的特征向量, 从而A 可以对角化。

若A 可以对角化, 则属于A 的不同特征根的线性无关的特征向量总数一定是n 。

若不然, 则由定理1可设A 的n 个线性无关的特征向量为n ηηη,,,21 ,设j η是属于特征根j λ的特征向量,则j η可由j t j j αα,,1 线性表出,从而可由向量组rrrt r t t ααααα,,,,,,,,111111线性表出,于是,rank{n ηηη,,,21 }≤rank{ttr t r αααα,,,,,,11111}=n t t t r <+++ 21与n ηηη,,,21 线性无关矛盾。

定理3 设A 是n 阶复矩阵, 则A 与对角形矩阵相似的充分必要条件是A 的最小多项式()λm 无重根。

证明 充分性 因())(λλn d m =无重根,由)(λi d |)(1λ+i d 知,A 的每个不变因子)(λi d 都不能有重根,从而特征矩阵A E -λ作为复数域上的λ矩阵,其初等因子全为一次式,故A 必与对角阵相似。

必要性 因A 与对角阵相似,特征矩阵A E -λ的初等因子必均为一次式,故最后一个不变因子()λn d 也只能是不同的一次因式之积,这就证明了最小多项式())(λλn d m =无重根。

此定理3所给出的判别矩阵与对角矩阵相似的条件,形式上还可削弱,我有: 定理4 设σ是n 维向量空间V 的一个线性变换,σ的矩阵可以对角化的充分必要条件是V 可以分解为n 个在σ之下不变的一维子空间n W W W ,,,21 的直和。

证明 :必要性 若σ可以对角化,则存在V 的一组基n ααα,,,21 使得σ在这组基下的矩阵为⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛n λλλ21, 令()()()n n L W L W L W ααα===,,,2211 ,则 n W W W V ⊕⊕⊕= 21, 事实上:(1)V ∈∀η,则n n k k k αααη+++= 2211,又i i i W k ∈α()n ,1,2,i =, n W W W +++∈ 21η, 即n W W W V +++= 21。

(2)()n i i i W W W W W W ++++++∈∀+- 1121ξ,()n ,1,2,i =,i W ∈ξ且n i i W W W W W ++++++∈+- 1121ξ,i ξξ=且n i i ξξξξξξ++++++=+- 1121,()n j W j j ,,2,1, =∈ξ , 又j j W ∈ξ()n ,1,2,j =,j j j W L =ξ,()n ,1,2,j =,i i n n i i i i L L L L L L ααααααξ=++++++=++-- 11112211,即i i n n i i i i i i L L L L L L L ααααααα=+++-+++++-- 11112211又n ααα,,,21 线性无关j L =0,()n ,1,2,j =, 即ξ=0。

充分性:若V 可分解为n 个在σ之下不变的一维子空间n W W W ,,,21 的直和,即n W W W V +++= 21,设n W W W ,,,21 的基分别为n ηηη,,,21 则n ηηη,,,21 可构成V 的一组基。

令()()()n n n ηλησηλησηλησ===,,,222111 ,σ在基n ηηη,,,21 下的矩阵为 ⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛n λλλ21, 即σ可以对角化。

定理5 设A 是数域F 上的一个n 阶矩阵,A 的特征根全在F 内,若n λλλ,,,21 是A 的全部不同的特征根,其重数分别为n r r r ,,,21 ,则A 可对角化的充要条件是秩()j ji i r A I =-∑≠λ()k ,1,2,j =。

证明 :设A 可对角化,则存在可逆矩阵T ,使{}n n I I I diag AT T λλλ,,,22111 =-这里右边是分块对角矩阵,i I 为i r 阶单位阵,于是有秩()⎪⎪⎭⎫⎝⎛-∏≠j i i A I λ =秩()⎪⎪⎭⎫⎝⎛⎪⎪⎭⎫ ⎝⎛-∏≠-T A I T ji i λ1=秩()⎪⎪⎭⎫ ⎝⎛-∏≠-j i i AT T I 1λ =秩{}⎪⎪⎭⎫⎝⎛-∏≠j i k k iI I I diag I λλλλ,,,,2211 =秩()()(){}⎪⎪⎭⎫⎝⎛---∏≠j i k k i i I I I diag λλλλλλ,,,22111 =秩()⎪⎪⎭⎫⎝⎛⎭⎬⎫⎩⎨⎧-∏≠j i j j i I diag 0,,0,,,0,0 λλ =jr 。

相关文档
最新文档