主理想环上矩阵可对角化的新判据

合集下载

矩阵可对角化的判定条件及推广

矩阵可对角化的判定条件及推广

矩阵可对角化的判定条件及推广
矩阵的对角化是矩阵理论的一个重要概念,它指的是有一种转换,使给定的方阵成为一个主对角线向量组成的对角矩阵。

矩阵可对角化是一个重要的判定条件,当满足所有下列条件时,矩阵可以对角化:
1、矩阵必须是n阶可逆矩阵,且n>1,即A必须为n阶可逆方阵;
2、所有特征值都是不同的,只有不同的特征值才能保证对角矩阵的特性;
3、矩阵的特征向量必须互相垂直,它们的内积必须为零,两个向量只有在这种状态下才能够形成一个正交矩阵;
4、矩阵的特征向量必须是单位向量,这种向量的模为1,只有确保矩阵的行列式的值不为0,才能让对角矩阵与原矩阵相同。

对角化矩阵的概念可以拓展到实数矩阵,在这种情况下,矩阵可先进行置换变换,让特征值互不相同,然后进行双对角化,将原矩阵分解为两个对角矩阵的乘积,然后将每个矩阵的特征向量分别作为其特征值的正交基,最后将所有对角矩阵的特征值按照其特定顺序汇总起来,从而形成一个新的对角矩阵。

补充到此,实数矩阵也同样满足上述矩阵可对角化的四条条件。

综上所述,矩阵可对角化的判定条件是:矩阵是可逆矩阵,并且特征值各不相同,特征向量互相垂直,且为单位向量,这四条条件同时满足时,矩阵可以对角化。

此外,对角化的概念也可以拓展到实数矩阵,用置换变换与双对角化使实数矩阵可对角化,实数矩阵也必须满足上述四条条件。

任意循环矩阵对角化证明

任意循环矩阵对角化证明

任意循环矩阵对角化证明任意循环矩阵对角化证明引言在线性代数中,矩阵是一种广泛使用的数学工具,用于描述线性变换。

对于某些矩阵而言,可以通过对角化来简化其计算和分析。

本文将探讨任意循环矩阵的对角化问题。

定义循环矩阵是指在每行或每列上将该行或该列向右移动一个单位得到的矩阵。

具体而言,若$A$为$n\times n$的循环矩阵,则其可以写成如下形式:$$A=\begin{pmatrix}a_1 & a_2 & \cdots & a_{n-1} & a_n \\a_n & a_1 & \cdots & a_{n-2} & a_{n-1} \\\vdots & \vdots & \ddots & \vdots & \vdots \\a_2 & a_3 & \cdots & a_n & a_{n-1} \\a_{n-1} & a_n & \cdots & a_2& a_1\end{pmatrix}$$其中$a_i$表示第$i$行和第$i+1$列的元素。

证明首先,我们需要证明任意循环矩阵都可以对角化。

具体而言,我们需要找到一个可逆矩阵$P$和一个对角矩阵$D$,使得$A=PDP^{-1}$。

由于循环矩阵的特殊性质,我们可以通过观察其特征向量来解决这个问题。

具体而言,我们可以通过以下步骤来证明:Step 1:求出$A$的特征值。

对于任意循环矩阵$A$,其有$n$个特征值,分别为:$$\lambda_1=\sum_{i=1}^na_i,\quad\lambda_2=a_1+a_n+\sum_{i=2}^{n-1}a_i,\quad \cdots,\quad \lambda_n=a_1+a_2+\cdots+a_{n-1}+a_n$$其中$\lambda_i$表示第$i$个特征值。

一、 可对角化的概念.

一、 可对角化的概念.

四、 对角化的一般方法
1.先求出矩阵A的全部特征根. 2.如果A的特征根都在F内,那么对于每一特征 根λ,求出齐次线性方程组
x1 0 x2 0 (I A) x 0 n
的一个基础解系. 3.如果对于每一特征根 λ 来说,相应的齐次线 性方程组的基础解系所含解向量的个数等于λ的
注意:推论7.6.3的条件只是一个n阶矩阵可以对角 化的充分条件,但不是必要条件。
下面将给出一个n 阶矩阵对角化的充分必要条件。
定义:设σ是数域F上向量空间V的一个线性变换, λ是σ的一个本征值,令 则有 因而是V的一个子空间. 这个子空间叫做σ的属于 本征值λ的特征子空间.
V { V | ( ) } V Ker ( )
现在设存在 F中的数 a11,, a1s1 ,, at1,, atst , 使得
a1111 a1s1 1s1 at1 t1 atst tst 0.


i ai1i1 aisi isi , i 1,, t.
1 t 0.
现在令V是数域F上一个n维向量空间,而σ是V的一 个线性变换,设λ是σ的一个本征值, 是 σ V 的属于 本征值λ的本征子空间,取 的一个基 V 1 ,, s 并且将它扩充为V的基,由7.4,σ关于这 个基的矩阵有形状
I s A O
A1 A2
这里 I s 是一个s阶的单位矩阵.因此,A的特征多项 式是
二、 本征向量的线性关系
定理7.6.1 令σ是数域F上向量空间V的一个线性变 换.如果 1 , 2 , , n分别是σ的属于互不相同的本征 值 1 , 2 , , n 的特征向量,那么 1 , 2 , , n 线性 无关. 证 我们对n用数学归纳法来证明这个定理 当n = 1时,定理成立.因为本征向量不等于零。 设n >1并且假设对于n-1来说定理成立.现在设 1 , 2 , , n 是σ的两两不同的本征值, i 是属于 本征值 i 的本征向量:

矩阵相似对角化

矩阵相似对角化

例如,对于矩阵$A = begin{bmatrix} 1 & 2 & 3 4 & 5 & 6 7 & 8 & 9 end{bmatrix}$,其特征值为 $lambda_1 = 1, lambda_2 = 2, lambda_3 = 3$,对 应的特征向量分别为$x_1 = begin{bmatrix} -2 -4 -6 end{bmatrix}, x_2 = begin{bmatrix} -1 -2 -3 end{bmatrix}, x_3 = begin{bmatrix} 1 2 3 end{bmatrix}$。选取可逆矩阵$P = begin{bmatrix} 2 & -1 & 1 -4 & -2 & 2 -6 & -3 & 3 end{bmatrix}$, 则有$P^{-1}AP = begin{bmatrix} 1 & 0 & 0 0 & 2 & 0 0 & 0 & 3 end{bmatrix}$。
性质
相似对角化后的矩阵 具有与原矩阵相同的 特征多项式和特征值。
相似对角化后的矩阵 具有与原矩阵相同的 特征子空间和特征向 量。
相似对角化后的矩阵 具有与原矩阵相同的 行列式值。
相似矩阵的判定
如果一个矩阵具有n个线性无关 的特征向量,则该矩阵可相似 对角化。
如果一个矩阵的所有特征值都 是单重的,则该矩阵可相似对
矩阵分解
矩阵相似对角化是矩阵分解的一 种形式,可以将一个复杂的矩阵 分解为易于处理的几个部分,如 三角矩阵、对角矩阵等。
线性变换
矩阵相似对角化可以用于研究线 性变换的性质。通过对矩阵进行 相似对角化,可以了解线性变换 在各个方向上的拉伸、压缩、旋 转等效应。

矩阵的对角化

矩阵的对角化

摘要矩阵的对角化指的是矩阵与对角矩阵相似,而形式最简单的对角矩阵在矩阵理论中占有重要地位,因此研究矩阵的对角化问题是很有实用价值的.矩阵是否可以对角化,是矩阵的一条很重要的性质。

对相似可对角化的充分必要条件的理解,一直是线性代数学习中的一个困难问题。

目前对于矩阵可对角化的条件,矩阵对角化的方法和矩阵对角化的运用都有了较为全面和深入的研究。

在归纳总结前人的基础之上,先给出了与对角化相关的概念,其次讨论了矩阵对角化的几个等价条件,最后总结了一些有关矩阵对角化的应用。

关键词:方阵;特征值;特征向量;对角化AbstractMatrix diagonalization refers similarity matrix and a diagonal matrix, The simplest form of a diagonal matrix plays an important role in matrix theory, Therefore Matrix diagonalization problem is very practical value.Whether matrix diagonalization matrix is a very important property. To be similar to the necessary and sufficient condition for understanding keratosis, has been one of linear algebra learning difficulties. At present more comprehensive and in-depth study of the matrix can be diagonalized conditions, matrix methods and the use of matrix diagonalization diagonalization of everything. In summarizing the basis of their predecessors, with the first given diagonalization related concepts, followed by discussion of the matrix diagonalization of several equivalent conditions and, finally, the application of some of the matrix diagonalization.Keywords: square; characteristic value; eigenvectors; diagonalization目录引言 (1)一矩阵可对角化的概念 (2)1.1 特征值、特征向量的概念 (2)1.2 矩阵可对角化的概念 (2)二矩阵可对角化的几个等价条件 (4)2.1 矩阵可对角化的充分必要条件及其证明 (4)2.2 可对角化矩阵的相似对角阵的求法及步骤 (8)三矩阵可对角化的应用 (9)3.1具体矩阵对角化的求解过程 (9)3.2矩阵对角化的应用 (13)3.2.1在反求矩阵方面的应用. (13)3.2.2 求方阵的高次幂 (14)3.2.3 求行列式的值 (15)3.2.4求一些具有线性递推关系组的数列的通项和极限 (16)3.2.5 在二次曲面上的一些应用 (17)结论 (19)致谢............................................... 错误!未定义书签。

线性变换可对角化的条件及对角化方法

线性变换可对角化的条件及对角化方法

邯郸学院本科毕业论文题目线性变换“可对角化”的条件及“对角化”方法学生苏成杰指导教师张素梅教授年级2006 级专业数学与应用数学二级学院数学系(系、部)邯郸学院数学系2010年5月郑重声明本人的毕业论文是在指导教师张素梅老师的指导下独立撰写完成的.如有剽窃、抄袭、造假等违反学术道德、学术规范和侵权的行为,本人愿意承担由此产生的各种后果,直至法律责任,并愿意通过网络接受公众的监督.特此郑重声明.毕业论文作者(签名):年月日摘要通过从特征值、特征向量、特征子空间、不变子空间、最小多项式、特征多项式以及线性变换矩阵本身的结构特点等七个不同的角度去分析线性变换可对角化的条件,总结出了七个充要条件和四个充分条件.第二部分给出了利用特征向量将线性变换对角化的一般方法并赋予了典型例题加以具体说明,同时又就以上某些条件的等价关系进行了说明.关键词线性变换对角化条件特征值特征向量Linear transformation’s “diagonalizable”conditions and“diagonalization” methods Su Chengjie Directed by Professor. ZhangSumeiAbstract According to the characteristic number, characteristic vector, subspace, invariant subspace, minimal polynomial, characteristic polynomial and the linear transformation matrix itself we get seven different sufficient conditions and four different necessary conditions. The second part of the text will show a common method to diagonalization the linear transformation with characteristic number and characteristic vector and also there will be an example to make it clear and then the construction of the above conditions are discussed on equivalence relation.Key words Linear transformation Diagonalization Condition Characteristic number Characteristic vector目录摘要 (Ⅰ)外文页 (Ⅱ)1 引言 (1)2 线性变换及其矩阵表示 (1)2.1 线性变换的定义 (1)2.2 线性变换矩阵的定义 (1)3 数域P上的n维线性空间V上的线性变换σ可对角化的充要条件 (2)4 数域P上的n维线性空间V上的线性变换σ可对角化的充分条件 (6)5 复数域P上的n维线性空间V上的线性变换σ可对角化的充要条件 (8)6 线性变换对角化方法介绍 (9)7 对各条件之间的联系进行分析和总结 (11)参考文献 (11)致谢 (12)线性变换“可对角化”的条件及“对角化”方法1 引言线性变换是线性空间中的重要研究内容之一,过去我们把对线性变换的研究转化为了对矩阵的研究,这样极大地丰富了线性变换的研究内容,线性变换的对角化问题就是其中一例.值得注意的是,并不是所有的线性变换都可以对角化,因此对线性变换可对角化的条件的研究是十分有价值的.本文从不同的角度分析了线性变换可对角化的条件并给出了相应的结论.2 线性变换及其矩阵表示2.1 线性变换的定义 定义2.1296]1[ 设V 是数域P 上的线性空间,若存在V 上的一个变换σ满足条件(1))()()(βαβασσσ+=+ V ∈∀βα, (2)αασσk k =)( V P k ∈∀∈∀α, 则称σ为V 的一个线性变换.2.2 线性变换矩阵的定义 定义2.2324]1[ 设n εεε,,,21Λ是数域P 上的n 维线性空间V 上的一组基,σ是V 中的线性变换,基向量的像可以被基线性表出:⎪⎪⎩⎪⎪⎨⎧+++=+++=+++=.,,22112222112212211111n nn n n n nn n n a a a a a a a a a εεεεεεεεεεεεΛΛΛΛΛΛΛσσσ 用矩阵来表示就是A εεεεεεεεε),,,(),,,(),,,(212121n n n ΛΛΛ==σσσσ其中⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n a a aa a aa a a ΛM M M ΛΛ212222111211A , 则称A 为线性变换σ在基n ε,,ε,εΛ21下的矩阵.3 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件命题3.1 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是V 中存在由σ的特征向量组成的一组基.证明 必要性 设线性变换σ在基n εεε,,,21Λ下具有对角矩阵⎪⎪⎪⎪⎪⎭⎫⎝⎛=n λλλO21A 即⎪⎪⎪⎪⎪⎭⎫⎝⎛=n n n λλλσOΛΛ212121),,,(),,,(εεεεεε 这就是说n i i i i ,,2,1,Λ==εελσ.因此n εεε,,,21Λ就是σ的n 个线性无关的特征向量.充分性 如果V 中存在由σ的特征向量组成的一组基,显然在这组基下σ的矩阵是对角矩阵,即线性变换σ可以对角化.命题 3.2 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是V 可以分解成σ的n 个一维不变子空间的直和.引理3.2.1260]2[ 如果ξ是数域P 上的线性空间V 上的线性变换σ的一个特征向量,则ξ生成的子空间)(ξL 是σ的一维不变子空间.引理3.2.2 设σ是数域P 上的n 维线性空间V 上的线性变换,如果W 是σ的一维不变子空间,则W 中任何一个非零向量都是σ的特征向量.证明 设W 是σ的一维不变子空间,任取)(0αα≠∈W ,则α是W 的一组基.因为W 是σ的一维不变子空间所以W ∈ασ,从而αα0k =σ对某个P k ∈0成立,这表明α是σ的特征向量.下面证明命题3.2必要性 设σ可对角化,由命题3.1可知V 中存在由σ的特征向量组成的一组基n ααα,,,21Λ,因此)()()(21n L L L V ααα⊕⊕⊕=Λ.根据引理3.2.1有),,2,1)((n i L i Λ=α是σ的一维不变子空间.由此得线性空间V 可以分解成σ的n 个一维不变子空间的直和.充分性 设V 可以分解成σ的n 个一维不变子空间n W W W ,,,21Λ的直和n W W W V ⊕⊕⊕=Λ21在),,2,1(n i W i Λ=中取一组基i ε,据引理3.2.2得i ε是σ的特征向量.由于和n W W W ⊕⊕⊕Λ21是直和,所以n εεε,,,21Λ是n W W W V ⊕⊕⊕=Λ21的一组基,即线性空间V 中存在由线性变换σ的特征向量组成的一组基,由命题3.1可知线性变换σ可以对角化.命题3.3 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是σ的所有特征子空间的维数之和等于n .引理3.3.1251]2[ n 维线性空间V 上的线性变换σ的属于不同特征值m λλλ,,,21Λ的特征向量是线性无关的;线性变换σ的属于不同特征值m λλλ,,,21Λ的线性无关的特征向量组合在一起仍然线性无关.下面证明命题3.3必要性 设线性变换σ的所有不同特征值分别是m λλλ,,,21Λ,),,2,1(m i V i Λ=λ是属于特征值),,2,1(m i i Λ=λ的特征子空间,因为线性变换σ可对角化,由命题3.1知σ有n 个线性无关的特征向量,从而有m V V V V λλλ⊕⊕⊕=Λ21.所以)dim ()dim ()dim ()dim ()dim (2121m m V V V V V V V λλλλλλ+++=⊕⊕⊕=ΛΛ.其中)dim(V 表示线性空间V 的维数,下同.从上面的等式可以看出,线性变换σ的所有特征子空间的维数之和等于线性空间V 的维数n . 充分性 设线性变换σ的所有特征子空间的维数之和等于线性空间V 的维数n ,即∑===mi n V V i1)dim()dim(λ在m V V V λλλ,,,21Λ中各取一组基,把它们合起来供共有n 个向量.据引理3.3.1它们仍然线性无关,从而它们构成线性空间V 的一组基.换句话说,线性空间V 中存在由线性变换σ的特征向量构成的一组基,由命题3.1知线性变换σ可以对角化.命题3.4 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是线性变换σ在某一组基下的矩阵A 的最小多项式是P 上互素的一次因式的乘积.引理3.4.1 设A 是一个准对角矩阵⎪⎪⎭⎫⎝⎛=21A A A 并设1A 的最小多项式为1g (x ),2A 的最小多项式为2g (x ),那么A 的最小多项式为1g (x )和2g (x )的最小公倍式)](),([21x g x g .证明 记)](),([)(21x g x g x g =,首先0A A A =⎪⎪⎭⎫⎝⎛=)()()(21g g g 因此g(x )能被A 的最小多项式整除,其次,如果0A =)(h ,那么0A A A =⎪⎪⎭⎫ ⎝⎛=)()()(21h h h 所以0A 0A ==)(,)(21h h ,因而)(|)(),(|)(21x h x g x h x g .并由此得)(|)(x h x g .这样就证明了g(x )是A 的最小多项式.引理3.4.286]3[ 设n 维线性空间V 上的线性变换σ在某组基下的矩阵A 的最小多项式为)(x g ,它可以分解成一次因式的乘积s r s r r x x x x x x x g )()()()(2121---=Λ则V 可以分解成不变子空间的直和s V V V V ⊕⊕⊕=Λ21,其中},)(|{V x V i ri i ∈=-=ξ0ξE A ξ,s i ,,2,1Λ=.下证命题3.4根据引理3.4.1,条件的必要性是显然的,现在证明充分性.根据矩阵和线性变换之间的对应关系,定义任意线性变换σ的最小多项式为其对应矩阵A 的最小多项式.设线性变换σ的最小多项式为)(x g ,由)(x g 是数域P 上互素的一次因式的乘积,我们有∏=-=li i a x x g 1)()(由引理3.4.2可得l V V V V ⊕⊕⊕=Λ21其中},)(|{V a V i i ∈=-=ξ0ξE A ξ,这里E 表示单位矩阵.因此把l V V V ,,,21Λ各自的基合起来就是线性空间V 的基,而每个基向量都属于某个),,2,1(n i V i Λ=,因而是线性变换σ的特征向量.换句话说就是线性空间V 中存在由线性变换σ的特征向量构成的一组基,由命题3.1可得线性变换σ可对角化.命题3.5 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是对于线性变换σ的每个特征值λ都有等式:k r n =--)(A E λ(其中k 是λ的重数,A 表示线性变换σ在某一组基下的矩阵,)(A E -λr 表示矩阵A E -λ的秩,下同).证明 必要性 设λ是线性变换σ的任一特征值,且其重数为k ,由于σ可以对角化,所以属于特征值λ的线性无关的特征向量有k 个,从而齐次线性方程组0X A E =-)(λ的基础解系中含向量的个数为k .由参考文献[1]第142页定理8可知齐次线性方程组0X A E =-)(λ的基础解系中含向量的个数为)(A E --λr n所以有k r n =--)(A E λ.充分性 由于对线性变换σ的每个特征根λ有k r n =--)(A E λ (k 是λ的重数),所以齐次线性方程组0X A E =-)(λ的基础解系中含向量的个数为k ,即属于k 重特征值λ的线性无关的特征向量的个数为k ,从而线性变换σ共有n 个线性无关的特征向量,由命题3.1可知线性变换σ可以对角化.由上面的证明过程可知,条件:对于线性变换σ的每个特征值λ都有k r n =--)(A E λ(k 是λ的重数)也可改为线性变换σ的每个特征值λ的重数等于齐次线性方程组0X A E =-)(λ的基础解系所含向量的个数.或改为如果令r λλλ,,,21Λ是σ的所有不同特征值,则有n r n r i i =--∑=)]([1A E λ.或改为线性变换σ的每个特征值λ的特征子空间的维数等于λ的重数.4 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充分条件命题4.1 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充分条件是σ有n 个不同的特征值.证明 由于属于不同特征值的特征向量是线性无关的,且线性变换σ有n 个不同的特征值,所以线性变换σ有n 个线性无关的特征向量,它们构成V 的一组基,由命题3.1可知线性变换σ可对角化.命题4.2 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充分条件是σ在某组基下的矩阵A 的特征多项式在数域P 内有n 个单根.证明 由于矩阵A 的特征多项式||)(A E -=λλf在数域P 上有n 个单根,从而线性变换σ有n 个不同的特征值,由命题4.1得线性变换σ可对角化.命题4.3 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充分条件是σ在某组基下的矩阵A 为幂等矩阵)(2A A =.引理4.3.1130]3[ 幂等矩阵的特征根只能是0或1.下面证明命题4.3设线性变换σ在某组基下矩阵A 为幂等矩阵,且r r =)(A ,由引理4.3.1知线性变换σ的特征值是0或1,所以矩阵A 相似于对角矩阵⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=00110O OA 由于相似矩阵具有相同的秩,所以 )()(0A A r r =)()(0A E A E -=-r r又n r r =+-)()(00A A E ,所以rn r n r r -=-=+-)()()(A E A A E . 于是齐次线性方程组0X A E =-)(的基础解系所含向量的个数为n )(A E --r =r r n n =--)(.又因为r r =)(A ,故齐次线性方程组0AX X A E =-=-)0(的基础解系所含向量的个数为r n r n -=-)(A .于是线性变换σ共有n r n r =-+)(个线性无关的特征向量,它们构成V 的一组基,由命题3.1可得线性变换σ可对角化.另外,如果线性变换σ在某一组基下的矩阵A 满足E A =2或)(2P k k ∈=A A ,由以上的证明过程可知线性变σ同样可以对角化.命题4.4 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充分条件是线性变换σ在某组基下矩阵A 为下三角矩阵,且),,2,1,,(n j i j i a a jj ii Λ=≠≠(其中ii a 为主对角线上元素).证明 因为A 是一个下三角矩阵,所以A 的特征多项式为|λA E -|=∏=-n i ii a1(λ),又由于),,2,1,,(n j i j i a a jj ii Λ=≠≠,从而A 的特征多项式有n 个不同的根),,2,1(n i a ii Λ=,即线性变换σ有n 个不同的特征值,由命题4.1可得线性变换σ可对角化.5 复数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件命题5.1 复数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是σ在某组基下的矩阵A 的最小多项式无重根.证明 由命题3.4可知σ可对角化的等价条件是σ在某组基下的矩阵A 的最小多项式是P 上互素的一次因式的乘积,而当P 是复数域时这个条件就等价于A 的最小多项式无重根,从而命题成立.另外不难证明如果A 的特征多项式无重根,则线性变换σ可对角化.命题5.2 复数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是对σ的每个特征值i λ均有m i r r i i ,,2,1,)()(2Λ=-=-A E A E λλ.证明 必要性 因线性变换σ可对角化,故A 的最小多项式)(λf 无重根,即A 的任一特征根i λ只能是)(λf 的单根.于是)(λf 与(i λλ-2)的最大公因式是i λλ-,由最大公因式的性质知,有多项式][)(),(λλλP v u ∈使 EA E A A A A i i ii v f u v f u λλλλλλλλλ-=-+-=-+22))(()()())(()()(.因 0A =)(f ,故 E A E A A i i v λλ-=-2))((.所以r (E A i λ-)≤2)(E A i r λ-但2)(E A i r λ-≤)(E A i r λ-,故有)(E A i r λ-=m i r i ,,2,1,)(2Λ=-E A λ.充分性 由命题5.1知,只需证明A 的最小多项式无重根,用反证法.假设线性变换σ的某个特征根i λ是最小多项式)(λf 的重根,可设)()()(2λλλλg f i -=,因多项式)()(λλλg i -的次数低于)(λf 的次数,故0A E A ≠-)()(g i λ,但0A A E A ==-)()()(2f g i λ所以)(A g 中必存在非零的列向量0X 使0X E A 0X E A =-≠-020)()(i i λλ.这就是说,齐次线性方程组0X E A =-)(i λ与0X E A =-2)(i λ有不同解,故2)()(E A E A i i r r λλ-≠-.这与2)()(E A E A i i r r λλ-=-矛盾.故)(λf 无重根,从而线性变换σ可对角化.6 线性变换对角化方法介绍命题6.162]4[ 设数域P 上的n 维线性空间V 中的线性变换σ有m 个不同的特征值,它们分别为)(,,,21n m m ≤λλλΛ,且其对应有n 个线性无关的特征向量为n ααα,,,21Λ,A 为线性变换σ的矩阵.如果令),,,(21n αααP Λ=则有⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=-n λλλO 211AP P . 上述命题就是将一个线性变换的矩阵变成一个其主对角线上全为其特征值的对角矩阵的具体方法.例298]6[ 数域P 上的n 维线性空间V 中的线性变换σ在某组基下的矩阵为⎪⎪⎪⎭⎫ ⎝⎛----=533242111A试将其对角化.解 矩阵A 的特征多项式)6()2(533242111||)(2--=-----=-=λλλλλλλA E f 令 0)6()2()(2=--=λλλf得6,2321===λλλ.所以线性变换σ的特征值为6,2321===λλλ.当2=λ时,由,)2(0X A E =-求得属于特征值2=λ的线性无关的特征向量为T T )1,0,1(,)0,1,1(21=-=αα.当6=λ时,由,)6(0X A E =-求得属于特征值6=λ的线性无关的特征向量为T )3,2,1(3-=α.再令⎪⎪⎪⎭⎫ ⎝⎛--==310201111),,(321αααP可求得⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛-----=-4141414143432121211P 则有⎪⎪⎪⎭⎫ ⎝⎛=-6221AP P .至此已将线性变换对角化,其对角化的矩阵为⎪⎪⎪⎭⎫ ⎝⎛=6220A .从上面的解题过程可以看出,线性变换对角化的过程实际上就是求解特征值与特征向量的过程.换句话说就是求得一组基,使线性变换在这组基下的矩阵为对角矩阵.显然这组基中的每一个向量都是线性变换的特征向量,而对角矩阵主对角线上元素都是其对应特征值.从而不难理解线性变换的矩阵对角化后并没有改变线性变换本身,它只是在另一组基下的矩阵.7 对各条件之间的联系进行分析和总结通过对以上各种条件进行分析和总结可以看出,线性变换可对角化的条件虽然有很多,但从本质上说它们其实是一致的.例如,线性变换σ可对角化的充要条件“σ有n 个线性无关的特征向量”与“线性空间V 上的线性变换σ的所有特征子空间的维数之和等于n ”其实就是同一问题的不同表述:有“线性变换σ有n 个线性无关的特征向量”就必然有“线性变换σ的所有特征子空间的维数之和等于n ”.反过来,如果“线性变换σ的所有特征子空间的维数之和等于n ”则必有“σ有n 个线性无关的特征向量”.所以,抓住问题的本质有助于真正理解和掌握线性变换可对角化的条件及对角化方法.参考文献:[1] 王萼芳 ,石生明.高等代数[M].北京:高等教育出版社,2005[2] 丘维声.高等代数[M].北京:高等教育出版社,2001[3] 钱芳华. 高等代数方法选讲[M].桂林:广西师范大学出版社,1991[4] 程云鹏 .矩阵论[M].西安:西北工业大学出版社,2001[5] 钱吉林.高等代数题解精粹[M].北京:中央民族大学出版社,2005[6] 唐忠明.高等代数[M].南京:南京大学出版社,2000[7] Y.Q.Guo,K.P.Shum and G.T.Xu.Linear Algebra[M].Beijing:Science Press ,2008致谢在此篇毕业论文划上句号之际,我郑重地向我的指导教师张素梅老师表示我最诚挚的感谢!衷心地感谢她的关心、指导和教诲.在张老师的精心引导下,几经修改和完善我终于完成了毕业论文,从她身上我获得了太多的文化和知识,更汲取了诸多纯朴而伟大的高尚品德.我在撰写毕业论文期间的工作自始至终都是在张老师的全面、具体指导下进行的.老师渊博的学识、民主而严谨的作风,使我受益匪浅.张老师谦逊的学术作风和高尚的人格品德将永远激励我前行!最后还要感谢我的同学和朋友四年来对我的关心和帮助.。

矩阵可对角化的充要条件

矩阵可对角化的充要条件

矩阵可对角化的充要条件引言矩阵对角化是矩阵理论中的一个重要概念,它能够让我们更好地理解矩阵的性质和运算。

在实际应用中,对角化可以简化计算和分析过程,因此对于一个矩阵是否可对角化的问题,是值得我们深入研究和探讨的。

本文将探讨矩阵可对角化的充要条件,通过理论推导和实例分析,将会全面、详细、完整地讲解矩阵可对角化的各种情况及其判定条件。

I. 列举与分析矩阵的特殊情况为了更好地理解什么样的情况下一个矩阵可对角化,我们先来列举一些特殊的矩阵情况,并分析它们是否可对角化。

1. 对角矩阵对角矩阵是指主对角线以外的元素都为零的矩阵。

例如:[ A =]对于任意的对角矩阵,由于它的非零元素只存在于主对角线上,所以它必然是一个可对角化的矩阵。

2. 对称矩阵对称矩阵是指矩阵的转置等于其本身的矩阵。

例如:[ B =]对于任意的对称矩阵,它必然是一个可对角化的矩阵。

这是因为对于对称矩阵,其特征值都是实数,且对应不同特征值的特征向量是相互正交的,因此可以通过特征向量的线性组合来表示整个矩阵。

3. 可逆矩阵可逆矩阵是指存在逆矩阵的矩阵。

例如:[ C =]对于任意的可逆矩阵,它必然是一个可对角化的矩阵。

这是因为可逆矩阵的特征值都是非零的,且可逆矩阵可以表示为一个对角矩阵和一个正交矩阵的乘积,而正交矩阵的转置等于其逆矩阵,因此可逆矩阵可以通过正交矩阵的逆变换为对角矩阵。

II. 可对角化的充分条件在上一节中,我们列举了一些特殊的矩阵情况,并发现它们对应的矩阵都是可对角化的。

接下来,我们将推导出可对角化的充分条件,并用定理的形式表述出来。

定理1对于一个n阶矩阵A,如果它有n个线性无关的特征向量,那么A是可对角化的。

证明:假设A有n个线性无关的特征向量,分别为v1, v2, …, vn,相应的特征值分别为λ1, λ2, …, λn。

根据特征值与特征向量的定义,我们可以得到以下等式:Av1 = λ1v1Av2 = λ2v2…Avn = λnv现在,我们将这n个特征向量构成一个矩阵V,即:V = [v1, v2, …, vn]同时,将这n个特征值构成一个对角矩阵Λ,即:Λ = []根据上述等式,我们可以得到:AV = [Av1, Av2, …, Avn] = [λ1v1, λ2v2, …, λnvn] = VΛ由于V是一个可逆矩阵(因为v1, v2, …, vn是线性无关的),所以可以将上述等式两边都左乘V的逆矩阵V^-1,得到:AVV^-1 = VΛV^-1即:A = VΛV^-1因此,我们证明了如果一个n阶矩阵A有n个线性无关的特征向量,那么A是可对角化的。

矩阵的对角化及其应用

矩阵的对角化及其应用

矩阵的对角化及其应用13届分类号:单位代码:10452临沂大学理学院毕业论文(设计)矩阵的对角化及其应用2013年3月20日临沂大学理学院2013届本科毕业论文(设计)摘要矩阵可对角化问题是矩阵理论中的一个重要问题,可对角化矩阵作为一类特殊的矩阵,在理论上和应用上有着十分重要的意义.本文对可对角化矩阵做出了较全面的概括和分析,并利用高等代数和线性代数的有关理论总结出了矩阵可对角化的若干条件,同时也讨论了化矩阵为对角形的方法,最后总结出可对角化矩阵在求方阵的高次幂)利用特征值求行列式的值)由特征值和特征向量反求矩阵)判断矩阵是否相似)向量空间)线性变换等方面的应用.关键词:对角化;特征值;特征向量;相似;线性变换临沂大学理学院2013届本科毕业论文(设计)ABSTRACTMatrix diagonolization problem is an important problem in matrix theory diagonolization matrix, as a kind of special matrix, in theory and application has the extremely vital significance. This paper has made diagonolization matrix analysis and generalization, and using higher algebra and linear algebra are given the relevant theory ofmatrix several conditions diagonolization, also discussed the matrix of the diagonal shape of method, and finally summarized; diagonolization matrix in high power, the policy of using eigenvalue beg determinant by characteristic value and value, feature vector reverse matrix, judgment matrix is similar, vector Spaces, the application of linear transformation, etc.Key words:The diagonalization; Eigenvalue; Feature vector; Similar; Linear transformation临沂大学理学院2013届本科毕业论文(设计)目录1 引言 (1)2矩阵对角化 (1)2.1可对角化的几个条件 (1)2.2可对角化的矩阵的性质 (3)2.3 矩阵的对角化 (5)2.3.1 用矩阵初等变换将矩阵对角化的方法 (5)2.3.2 利用内积构造齐次线性方程组的方法 (7)3 矩阵对角化的应用 (10)3.1 求具有线性递推关系( 组) 的数列的通项式与极限 (10)3.2 求解行列式的值 (14)3.3对角矩阵的其他方面的应用.................................... 15 4 结论 .......................................................... 19 参考文献 ..................................................... 19 致谢 (21)临沂大学理学院2013届本科毕业论文(设计)1 引言对角化矩阵在求解一类具有递推关系式的数列的通项与极限及一类三对角线行列式、求方阵的高次幂、利用特征值求行列式的值、由特征值和特征向量反求矩阵、判断矩阵是否相似、在向量空间、线性变换等方面的应用.对角矩阵贯穿于高等代数之中,有着十分重要的作用.定义1.1 对角矩阵是一个主对角线之外的元素皆为 0 的矩阵.对角线上的a元素可以为 0 或其他值.因此行列的矩阵= 若符合以下的性质: nnAa,,ij,ij,10,, ij,1,2,,…,nij,=0,,.形如. ,,,,01,,V定义1.2 矩阵可对角化:设是维线性空间的一个线性变换,如果存在n,V的一组基,使在这组基下的矩阵为对角矩阵,则称线性变换可对角化. ,, 定义1.3 矩阵是数域上的一个维方阵,如果存在数域上的级可逆APPnn,1TAT矩阵,使为对角矩阵,则称矩阵可对角化. AT2矩阵对角化通俗地说就是经过矩阵的一系列行、列变换(初等变换)后,能得到一个只有主对角线上元素不全为零,而其他位置全为零的另一个矩阵(这个矩阵称为对角阵),这个过程就叫做矩阵的对角化,并不是所有矩阵都能对角化. 2.1可对角化的几个条件矩阵可对角化在求矩阵的高次幂中有重要应用, 矩阵的对角化有多种判别方法.本节对矩阵对角化作一点讨论,nn,22,PABB, 引理2.1 设,,且=,,.则存在可逆矩阵,ABAABBA,P使,可同时对角化. ABnn,,Pdiag,,,,,…,引理2.2 如果=有个互不相同的对角元,对某Pn,,12nnn,,P个,则当切仅当本身是对角阵. BPBBP,BE0,,r2AA,由于任意一个幂等矩阵A必相似于对角矩阵.而且每个与对角,,,,00,,n矩阵都可以进行谱分解,即=,A,其中是的特征值,为幂等阵.那么AA,A,iiiii,1任意有限个幂等阵的线性组合是否对角化,有如下结论:1临沂大学理学院2013届本科毕业论文(设计)定理1.1 以=,为个数,Akkk,,,,,,…kkk,,…,n1122nn12nij,为个幂等阵,且两两可换,即=,,则可对,,,,,…,,,,,An,,12nijji 角化.证明为个幂等阵,且两两可换.由引理1可知,存在可逆阵,,,,,…,n12n ,1,1,使可同时对角化.即,…,,,,,,,…,,,,PPP,,,PP12n1nnnn1111 ,1,1,,,…,是对角阵PkP,PkP,.==++…Akkk,,,,,,…,,,,,,1n11221122nn,1,1PkP,PkkP,,,,,…+k++.由知,,,…,是对角阵,,,,nnnn11221n 也为对角阵,故可对角化. Akk,,,,,…+k1122nn如果矩阵只有两个不同的特征值,可有如下结论:nn,,P定理2.2 设,,为其两个不同的特征值,则可对角化存在AA,,,12 ,,,,幂等矩阵,使得=+,其中为幂等阵. ,AE,,,,211,E,,11-1证明必要性:若可对角化,存在可逆矩阵,使=相似APPAP,,11E,,,22,1PP,于对角阵,则= A,,0,,,1 = ,PEP,,,,,1,,,E,,,,21,,,,0,,,1,1,, =+, PPPEP,,,,,2111E2,,0,,,1,, =+, PP,E,,,,2111E2,,000,,,,,,,1,,112,PPPP且相似于== ,PP,,,,,,EEE222,,,,,,,,,,故为幂等阵,即存在幂等阵使得=+. ,,AE,,,211,,,,充分性:若存在使=+.因为为幂等阵,故存在可逆阵,使,AE,T,,,211 00,,,,,1,1,,,得=,则=+TT ,TTAE,,,,,,,211EE22,,,,2临沂大学理学院2013届本科毕业论文(设计),,0,,,1= ,TET,,,,,,,,E,,,,21,,,,,E,,11,1= TT,,E,22,,,E,,11,1,1TAT故= TT,,E,22,,即可对角化. AAB,如果满足条件的情况,有如下结论: ABBA=nn,nn,,P,P定理2.3 假设个互不相同的特征值,对某个个ABn有,则有AB,当且仅当同时对角化. ABBA=,1TPAP,证明必要性.由有个互不相同的特征值,则可对角化.设,AAndiag,,,,…,其中=.则T,,12,n,,11,,11,1,1,1,1PAPPBPPABPPBAPPBPPAPTPBPPBPT=====.即与T,,,,,1,1PBPPBP可交换,由引理2知是对角阵,从而是可对角化矩阵. B ,1AB,充分性.可同时对角化,故存在可逆阵,使得,PAPP,,1,1其中,为对角阵,,,1. BPP,,,,22,,11,1,1,,11=====. ABBAPPPP,,PP,,PP,,PPPP,,21121221对定理,我们可得到矩阵只有两个不同的特征值时可对角化的判别方法: A22,,=,,,,AE,,,/若,则可对角化,否则不可对角化.其中. AA,,,,122.2可对角化的矩阵的性质是数域上的一个可对角化的阶矩阵,是定理2.2.1 设APA,,,,,…,n12t 阶矩阵,使AA,,…,An的互不相同的特征根,则存在12t1+AAAA,,,,,,…; ,1122tt2+=E,EAAA,,…为单位矩阵; ,12t23AA,; ,ii,140,AAij,,,0为零矩阵,其中. ATBT,,ijii1证明由上一个阶可逆矩阵,使得 APTn,可对角化,则存在3临沂大学理学院2013届本科毕业论文(设计),0,,1,,,2,1,,TATB,, ,,…,,0,t,,其中的重数为,由于 s,ii10,,,,,,,,……,,,,,,,,10 B,,,,…+,,,,1t01,,,,,,,,……,,,,,,,,01,,,,记,所以 ,,,BBB,,…+1122tt,,11ATBTTBBBT,,,,,,,…+ ,,tt1122,,,111= TBTTBTTBT,,,,,…+t t1122,,11,,TBTTBT,…+= ,,,,tt11,1记,其中 ,,,AAA,,…+ATBT,1122tti故. AAAA,,,,,,…+1122tt 2由每个为对角形幂等阵,则, BBBE,,,…+B,12ti,1,1,,,111TET=ETBBBT,,…+===AAA,,…+TBTTBTTBT,,…+,,,t12t12t12故 AAA,,…+=E12t,,11,12,,113TBTTBT由,则== ATBT,ATBTTBT,,,,,iiiiiii,121,,1==,TBTTBBTTBTiiii=Ai2故. AA,ii,,11,1,,11TBTTBTTBBT4ij,TBTTBT当时,====0;0为零矩阵 AA,,,,,ijijijij故 AAij,,0,ij4临沂大学理学院2013届本科毕业论文(设计)15115,,,,1,2,3例2.2.1 设是数域上的矩阵.是矩阵的特征根,A,,20158PA,,,,876,,, 100231,,,,,,,,,1则存在可逆矩阵,使得=,其中T,342TAT,020B,,,,,,,,112003,,,,,,652,,,,,1, T,,431,,,,111,,,100,,,,,,,,,,,,由于,记 BBB,,23B,,,02130123,,,,,,,,,,,,001,,,,,,,,11ATBTTBBBT,,,,23所以,,123,,,111TBTTBTTBT,,23= ,,,,123,1=,其中AAA,,23ATBT,123ii,,,,,121041293111,,,,,,,,,,,,,且满足: AAA,,,,,,,18156,16124,222123,,,,,,则 ,,,,,,,,,,652431222,,,,,,123AAAA,,,; ,1232AAAE,,,; ,12323AA,i,1,2,3,; ,,,ii40,AAij,,,0为零矩阵. ,,,ij通过一个具体的可对角化矩阵,鲜明地反映了上述性质是成立的.2.3 矩阵的对角化2.3.1 用矩阵初等变换将矩阵对角化的方法VV数域P上维线性空间的一个线性变换判定其是否在中能找到一组基n使它在此基下的矩阵为对角形矩阵; 当这种基存在时, 如何去寻求它是线性代数学上一个十分重要的问题,利用矩阵的初等变换法解决此问题.,1TAT若矩阵在数域上可对角化,则有上可逆矩阵使=为对角阵.APPBT5临沂大学理学院2013届本科毕业论文(设计) 于是的主对角线上的元素即为的全体特征值,并且可表示为,BATQQQ,…12s,1,,,111i,1,2,…,s其中为初等矩阵,,于是,,又也BQQQAQQQ,……QQis1112sS,,1是初等矩阵,由初等矩阵与矩阵的初等变换的关系,即知相当于对施AQAQ11行了一次初等行变换和一次初等列变换,将此种变换称为对施行了一次相似变A注:为单位矩阵E换.又由,可进行如下初等变换,则可将化A TEQQQ,…,,12S 为对角矩阵,且可求得: BTAB,,,,对施行一系列相似变换A,对只施行其中的初等列变换. E,,,,,,,,,,,,ET,,,,当不可对角化时,也可经相似变换化简后,求得其特征值,判定它可否对角AA 化.-1,,,111T类似地,可有=,做如下的初等变换则可将化为对角形矩阵AQQQE…s11s,,且可求得或由求的特征值,判定可否对角化: BBAAT对施行一系列相似变换A,1AEBT,,,,,,,,,对对只施行其中的初等行变换. E,,,,并且在施行相似变换时,不必施行一次行变换后接着施行一次列变换这样进行,可施行若干次行(或列)变换后再施行若干次相应的列(或行)变换,只要保持变换后,最后所得矩阵与相似即可. Ajk为叙述简便,这里用表示第行,表示第列,表示用数乘第行iicrkr,riiji jk后加到第行上,表示用数乘第列后加到第列上. iickc,ij注意到初等矩阵的逆矩阵,,11,1,1PijPijPikPijkPijkPijk,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,1A故用左乘A,相当于对施行了变换,右乘A,相当于对A施rkr,Pijk,,,,,ji行了变换. ckc,ji例 2.3.1 求如下矩阵的特征值,并判定它们可否对角化,若可,则将其对角化: 1111,,511,,,,,1111,,,,,,21602,,,,,,,,,1111,,,,,311,,,,1111,,,,;511,411,,,,,,,,,rr,cc,31131CC解由=,知与相似.A,,,,602,,,,402A,,,,,, ,,,,,311002,,,,C2,2,2,2EC,C易知,的特征值为的秩为,所以不可对角化,从而知的特2A6临沂大学理学院2013届本科毕业论文(设计)2,2,2,征值为且不可对角化. A11111111,2111,,,,,,,,,,,,1111,,22000200,,,,,,,,,,,,1111,,20200020,,,,,,1111,,20020002rri,,,2,3,4cci,,,2,3,4,,,,,,i11i,,,,,,,,,,,2由,,,,,,,,100010001000,,,,,,01000100,1100,,,,,,,,,,,,00100010,1010,,,,,,,,,,,,00010001,1001,,,,,,,,2000,,111,,,2,,,,0200222,,,,,,00200200,,,,,,00020020,,1,,,2,3,4rri, ,,,1i,知可对角化,的BB111400021,,,,,,,,1,,cci,,,2,3,4ii4444,,,,,,,,,,1000,,311,,,,,1,,,,,11 00444,,,,131,1010,,,,,,,1,,,,444,1001,,,,113,,,,,1,,,,444 111,,1,,444,2,,,,,,311,,2,1,,,1,,,2,2,2,2。

矩阵对角化问题 数学毕业论文

矩阵对角化问题  数学毕业论文

矩阵对角化问题高等代数中,在讲到线性空间和线性变换时,一个主要内容是讨论矩阵对角化,即在什么条件下矩阵与对角矩阵相似.而矩阵对角化的原始问题是:设V 是有限维复线性空间,A 是V 上的线性变换,能否在V 中找到一个基,使得A 在这个基下的矩阵比较简单.作为纯粹的几何问题就是V 能否分解成一些不变子空间的直和.讨论这个几何问题的证明对于了解线性空间有很大好处.本文将对V 分解成所谓根子空间的直和给出一种较为初等的证明,并由根子空间分解定理推出线性变换(或n 阶方阵)可对角化的充要条件.把这些充要条件与其他线性变换(或n 阶方阵)可对角化的充要条件进行汇总比较,从而得到线性变换的矩阵对角化的方法的优劣,便于学习和研究根据具体情况选用.1.预备知识1.1有关定义定义 1.1.1[]1 线性空间V 一个变换A 称为线性变换,如果对于V 中任意的元素αβ和数域P 中任意数K 都有A (α+β)=A (α)+A (β)A (k α)=k A(α) 定义1.1.2[]1 设A 是数域P 上的线性空间V 的线性变换,W 是V 的子空间,如果W 中的向量在A 下像仍在W 中,换句话说,对于W 中任一向量ξ,有A ξ∈W ,我们就称W 是的A 不变子空间,简称A -空间.定义 1.1.3[]1设1V ,2V 线性空间V 的子空间,如果和1V +2V 中每个向α=1α+2α,1122,V V αα∈∈是唯一的,这个和就称为直和.定义1.1.4[]1如果数域P 上的n 阶矩阵A 相似于对角阵,则A 可对角化定义1.1.5[]1设A 是数域P 上的n 阶矩阵,如果数域P 上的多项式()f x 使得()f A = 0,则称()f A 以A 为根.在以A 为根的多项式中次数最低且首相系数为1的多项式称为A 的最小多项式.定义1.1.6 设A 是数域P 上的n 维线性空间V 的线性变换,如果存在非零向量V ξ∈,数λ∈P ,m ∈N,使得()0m A λεξ-=,那么称ξ为属于λ的根向量.线性变换A 的属于特征根λ的根向量的全体,再添上零向量所组成的V 的子集是V 的一个子空间,称V 的这个子空间为A 的属于特征值λ的根子空间.Sylvester 不等式 设,A B 均为n 阶矩阵,秩(A )+秩(B )≤n +秩(AB )1.2 线性空间根子空分解定理引理 设A 是n 维复线性空间V 的线性变换, 12,...s λλλ是A 的所有不同的特征值,且12...s V V V V λλλ=++其中12,,...,s V V V λλλ是V 的全部根子空间,则i A λε-在i V λ上为幂零线性变换,而在1211......i i s V V V V V λλλλλ-+++++++上为可逆线性变换.证明 不失一般性,只证明1A λε-在1V λ上为幂零线性变换,而在23...s V V V λλλ++上为可逆线性变换.在1V λ中取一个基 12,...t γγγ, 则有正整数12,...t p p p ,使1()0i p i A λεγ-= , i = 1,2,…, t ,取p = max {}12,...t p p p , 有()10pi A λεγ-=, i = 1 ,2…t ,于是对任意γ∈1V λ,令1ti i i k γγ==∑,则1()pA λεγ- =1()pA λε-(1ti ii k γ=∑ )=11()0tPii i k A λεγ=-=∑ ,即在1V λ上,1()p A λε- =ϑ (ϑ为零变换) ,所以1A λε-在1V λ上为幂零线性变换.令W =2...s V V λλ++,若1()A W λε-不可逆,则1()A W λε-一定有一个特征根是0 ,因而1A λε-在W 上有属于特征根0 的特征向量0ξ (0ξ∈W) ,即有10()A W λεξ-=1()A λε-0ξ=0, 亦即010()A ξλξ=(0ξ≠0). 又因0ξ∈W = 2...sV V λλ++ ,所以有0ξ=23...s ξξξ++,其中ii V λξ∈ ( i = 2 ,…,s ) 于是有正整数i m ,使()0im i i A λεξ-= , i = 2 ,…,s ,令()()22...s m m s A A τλελε=--,则τ(i ξ) = ()()22...s m ms A A λελε--i ξ= 0 , i = 2 ,…, s ,从而τ(0ξ) = τ(2ξ) + … + τ(ξs) = 0 , 另一方面, 因为()010A ξλξ=,又τ(0ξ)=21()...()s m m s A A λελε--0ξ=()()2121...0s m ms λλλλ--≠这就导致了矛盾.所以1A λε-在2...s V V λλ++ 上为可逆线性变换.定理1.2.1 (根子空间分解定理) 设A 是n 维复线性空间V 的线性变换, 12,...s λλλ是A 的所有不同的特征值,i V λ是属于i λ 的根子空间, i = 1 ,2 ,…, s ,则12...S V V V V λλλ=⊕⊕⊕.证明 设A 的特征多项式为1212()()()...()s s f x x x x γγγλλλ=--- 令()()()ii i f x g x x γλ=- i = 1 ,2 ,…, s , 则12(),(),...,()s g x g x g x 互素, 于是有多项式12(),(),...,()s u x u x u x , 使1()()1si i i g x u x ==∑, 将A 代入上式, 得 1()()si i i g A u A ε==∑,(ε为单位变换), 任给ξ ∈ V ,有ξ =ε(ξ) =()()1s i i i g A u A =⎛⎫⎪⎝⎭∑ξ=1(()())siii g A u A ξ=∑, 记()()i i i g A u A ξξ=, i = 1 ,2 ,…, s ,于是12...s ξξξξ=+++. 下面证明i i V ξ∈ , i = 1 ,2 ,…,s因为()()()i i i f x x g x γλ=-,由哈密尔顿- 凯莱定理()()()i i i A g A f A γλεϑ-== (ϑ为零变换),于是有()i i i A γλεξ-=()()()i i i i A g A u A γλεξϑ-=(ϑ为零变换)即i i V λξ∈, i = 1 ,2,… , s ,所以12...S V V V V λλλ⊂+++,又显然12...S V V V V λλλ⊃+++ ,故12...S V V V V λλλ=+++.再证明上面的和是直和,设12...0,i s i V λαααα++=∈, i = 1 ,2 ,…,s 由引理知i A λε-在i V λ上为幂零变换,所以存在正整数i n ,使得在i V λ上()i n i A λεϑ-=(ϑ为零变换),又由引理 ,i A λε-在111.......i i s V V V V λλλλ-++++++上为可逆变换,所以()i n i A λε- 在111.......i i s V V V V λλλλ-++++++上也是可逆变换,于是0 =()(0)i n i A λε-=()i n i A λε-(12...s ααα++)= ()i n i A λε-i α+()i n i A λε-(1211...i i s ααααα-++++++)=()i n i A λε-(1211...i i s ααααα-++++++)从而1211...i i s ααααα-++++++=0 ,于是()1211......0i i i s αααααα-+=-+++++= , i = 1 ,2 ,… s,由零向量的表法唯一知12...S V V V V λλλ=⊕⊕⊕ 根子空间分解定理全部证完.运用根子空间分解定理可以推出一些矩阵对角化的充要条件.对角矩阵可以认你为是矩阵中最简单的一种,一些复杂的矩阵可以通过适当的方法化为对角阵.通过相应对角阵的研究学习,可以推知这些复杂矩阵的性质,促进对复杂矩阵的了解,简化很多复杂工作,给学习和研究带来很大方便.下面就矩阵对角化的充要条件作一详细论述.2. 矩阵可对角化的一些充要条件及矩阵对角化方法2.1 特征向量法定理2.1.1 设A 是n 维线性空间V 的一个线性变换, A 的矩阵可以在某一组基下为对角阵充要条件是, A 有n 个线性无关的特征向量.证明 设A 在基12,...n εεε下具有对角阵1...n λλ⎛⎫⎪ ⎪ ⎪⎝⎭.即i i i A ελε= i=1,2…n 因此, 12,,...,n εεε就是A 的n 个线性无关的特征向量.反过来,如果A 有n 个线性无关的特征向量,那么就取12,,...,n εεε为基.显然, A 在这组基下的矩阵是对角阵. 证 毕.例1. 设线性变换A 在基12,,...,n εεε下的矩阵是(1)122212221A ⎛⎫ ⎪= ⎪ ⎪⎝⎭, (2)310410482A ⎛⎫⎪=-- ⎪ ⎪--⎝⎭,问A 是否可以对角化? 解 (1)因为特征多项式为122212221E A λλλλ----=------=()()215λλ+-所以A 的特征值是-1(二重)和5把特征值-1代入齐次方程组得()()()123123123122021202210x x x x x x x x x λλλ---=⎧⎪-+--=⎨⎪--+-=⎩ (1)解得基础解系是101⎡⎤⎢⎥⎢⎥⎢⎥-⎣⎦和011⎡⎤⎢⎥⎢⎥⎢⎥-⎣⎦因此属于-1的两个线性无关的特征向量是112223,ξεεξεε=-=-把特征值5代入(1)得基础解系111⎡⎤⎢⎥⎢⎥⎢⎥⎣⎦,所以属于5的全部特征向量为3123ξεεε=++ 则A 在基123,,ξξξ下的矩阵为B=100010005-⎛⎫ ⎪- ⎪ ⎪⎝⎭(2) E A λ-=310410482λλ--+-=()()212λλ-+,所特征值为1(二重)和-2. 对应特征值1的特征向量为11233620ξεεε=-+ 对应特征值-2的特征向量为23ξε=由此知A 有两个线性无关的特征向量,由定理1知A 不能对角化.运用此定理判定一个线性变换的矩阵是否可以对角化的方法简单易懂,但是过程比较繁琐.先计算一个行列式求出A 的特征值,再利用方程组和特征向量的有关理论及求法计算出A 是否有n 个线性无关的特征向量.计算过程容易出错.下面利用最小多项式给出一个线性变换的矩阵可角化的充要条件.此定理比定理2.1.1简洁实用2.2 最小多项式法引理 设A 是一个对角阵A=12A A ⎛⎫⎪⎝⎭,并设1A ,2A 的最小多项式为12(),()g x g x ,那么A 的最小多项式为12(),()g x g x 的最小公倍数[]12(),()g x g x .证明 ()g x =[]12(),()g x g x ,首先12()()()g A g A g A ⎛⎫= ⎪⎝⎭=0.因此()g x 能被A 的最小多项式整除.其次()0h A =.那么12()()()h A h A h A ⎛⎫= ⎪⎝⎭=0, 1()h A =0,2()h A =0,因而11()()g x h x ,22()()g x h x .并由此得()()g x h x .这样就证明了()g x 是A 的最小多项式. 这个结论可以推广到A 为若干矩阵组成的准对角阵的情形.即如果A=1 (00)S A A ⎛⎫ ⎪⎪ ⎪⎝⎭,i A 的最小多项式为()i g x ,i=1,2,…,s.那么A 的最小多项式为[]12(),(),...,()s g x g x g x .定理2.2.1 数域P 上n 级矩阵A 与对角阵相似的充要条件为A 的最小多项式是P 上互素的一次因式的乘积.证明 根据引理的推广形式,条件的必要性是显然的. 下面证明充分性.根据矩阵和线性变换之间的关系,我们可以定义任意线性变换A 的最小多项式,它等于其对应矩阵A 的最小多项式.所以只需证明,若数域P 上某线性空间V 的线性变换A 的最小多项式()g x 是P 上互素的一次因式的乘积1()()li i g x x a ==-∏,则A 有一组特征向量做成V的基.实际上,由于()0g A V =.由定理 1.2.1同样的步骤可证12...l V V V V =⊕⊕⊕,其中{}()0,i i V A a V ξεξξ=-=∈,把12,...l V V V 各自的基合起来就是V 的基,而每个基向量都属于某个i V ,因而是A 的特征向量. 证毕.推论 复数矩阵A 与对角阵相似的充要条件是A 的最小多项式无重根. 不利用定理2.2.1,该推论也可证明.下面给出令一种证明.证明 必要性设A 相似diag 12(,...)n λλλ,所以存在可逆矩阵T 使1T AT -=∧,(∧为对角阵),从而1i i T A T -=∧,不妨12,...k λλλ是A 的互不相同的特征根()k n ≤ 记()()()11211()......k k k k k g a a a λλλλλλλλλλ--=---=+++ 因而()11111(...)k k k k T g A T T A a A a A a E T----=+++=1111111...k k k k T A T a T A T a T AT a T ET ------+++=11...k k k a a E -∧+∧++=()g ∧ 而()11...k k k g a a E -∧=∧+∧++=1111211121(,...)(,...)...(,...)k k k k k k n n k k k diag diag a a a diag a a a λλλλλλ---++= 11111.........k k k k k n n k a a a a λλλλ-⎛⎫++ ⎪⎪ ⎪++⎝⎭=diag ()()()12(),...n g g g λλλ=0所以()g A =0.于是()()A m g λλ,但是()g λ没有重根,因而()A m λ没有重根.充分性 设12,...n λλλ为最小多项式()A m λ的互不相同的根,则由()A m λ无重根()A m λ=()()()12...k λλλλλλ---,于是()A m A =()()()12...k A E A E A E λλλ---=0 令rank ()i A E λ-=i γ,则dim I V λ=n -i γ,所以A 共有()()()12...k n n n s γγγ---=个线性无关的特征向量并且显然s n ≤.另一方面()12...1k k n γγγ+++≤-.因而又有()()()12...k s n n n n γγγ=---≥,故s n =.这就说明了A 有n 个线性无关的特征向量由定理2.1.1知A 可对角化. 证毕.例2. 判下列矩阵是否可以对角化.(1)001010110⎛⎫ ⎪ ⎪ ⎪⎝⎭(2)3131131331311313--⎛⎫⎪-- ⎪⎪-- ⎪--⎝⎭解(1)可求的A 的特征多项式为()()2010101110E A λλλλλλ--=-=-+-由于A 的最小多项式为()()211λλ-+的因式,计算得0A E -≠,0A E +≠.而()A E -()A E +=0.因此A 的最小多项式为()()11λλ-+.显然A 的最小多项式是实数域上互素的一次因式的乘积,从而由定理2.2.1知A 可对角化.(2)可求得A 的最小多项式为E A λ-=3131131331311313λλλλ-----+---+=4λ由于的最小多项式为4λ的因式,计算得A 0≠, 2A =0.因此A 的最小多项式为2λ.从而由定理2.2.1知A 不可对角化.例3 k A =E,则A 与对角阵相似.(k=1,2…)证明 由k A E =知A 为多项式()1k f x λ=-的零点,即()f A =0.因A 的最小多项式()()A m f λλ,而()f λ无重根,所以()A m λ无重根,故由推论知A 与对角阵相似.对于单纯的判断一个线性变换的矩阵能否对角化运用定理 2.2.1及其推论是很简洁方便的,它部避免了运用定理2.1.1的繁琐过程.但是对于既要判定某个数域上的线性变换的矩阵是否可对角化,对于可对角化的矩阵又要求出相似变换矩阵及矩阵特征值的题目来说运用定理2.2.1及推论是达不到要求的.而运用定理2.1.1虽然能达到要求但方法却很繁琐.下面给出的方法仅需利用矩阵的乘法运算便可判定一个矩阵是否相似与对角阵,并且在判定的过程中简洁的构造出相似变换矩阵完全不需解性方程组.2.3 矩阵的乘法运算法定理 2.3.1 设12,,...,s λλλ为n 阶矩阵A 的全部相异特征值,其重数分别为12,,...,s n n n ,1sii nn ==∑,则A 与对角阵相似的充要条件是1()si i E A λ=-∏=0.(i=1,2,…,s)证明 必要性若A 相似于阵对角阵∧,则存在可逆矩阵P 使得A =P 1...s E E λλ⎛⎫⎪ ⎪ ⎪⎝⎭1P -,其中i E 为in 阶单位矩阵(i=1,2,…,s )于是()i E A λ-=()1i P E P λ--∧=()()111...i i s s E P P E λλλλ--⎛⎫⎪ ⎪ ⎪-⎝⎭,于是1()s i i E A λ=-∏=()11s i i P E P λ-=-∧∏= P ()()1111...s i i si s s i E E λλλλ==⎛⎫- ⎪ ⎪⎪ ⎪ ⎪- ⎪⎝⎭∏∏1P - 由于()i j j iE λλ-∏=0(j=1,2,…,s ).所以1()si i E A λ=-∏=0.充分性 因为对于任何n 阶矩阵A 都存在可逆矩阵P ,使得A= P 12...S J J J ⎛⎫ ⎪⎪ ⎪ ⎪⎝⎭1P -,其中jJ 为jordan 块(j=1,2,...,s).因此要证A 可对角化,只要证j J =j j E λ(j=1,2,…,s ),由于()i E A λ-=()i P E J λ-1P -=P ()()()1122...i i i s s E J E J E j λλλ-⎛⎫ ⎪-⎪⎪ ⎪⎪-⎝⎭1P - ()()()()111221...i i i i i i s s i E J E J E A P P E J λλλλ-⎛⎫- ⎪ ⎪- ⎪-= ⎪ ⎪⎪-⎪⎝⎭∏∏∏∏所以若()0i iE A λ-=∏.则因P 可逆而有()0i j j iE J λ-=∏(j=1,2,…,s ).又当i j ≠时()0ijλλ-≠,()i jj EJ λ-可逆,所以()i j j E J λ-0≠,即j j j J E λ=(j=1,2,…,s)定理2.3.2 设12,,...,s λλλ时n 阶矩阵的全部相异特征根,其重数分别为12,...s n n n ,则A 于对角阵相似的充要条件是()j i i jW E A λ≠=-∏的秩为()j j R W n =(j=1,2,…,s ).证明 必要性()()()111...i i j j i i ji s S i E W E A P P E λλλλλ≠-≠⎛⎫- ⎪⎪=-=⎪ ⎪- ⎪⎝⎭∏∏∏=()110...0ijji js P P Eλλ-≠⎛⎫⎪ ⎪⎪- ⎪ ⎪ ⎪⎝⎭∏ 其中0,j j E 分别是j n 阶的零矩阵和单位矩阵(j=1,2,…,s ).由于P 满秩且i j λλ≠.所以()j R W =()i j j i j R E λλ≠⎛⎫- ⎪⎝⎭∏=()j j R E n =.充分性 用反证法假设()i j j i j R E λλ≠⎛⎫- ⎪⎝⎭∏不可对角化,则因几何重数≤代数重数[]5,必至少存在一整数k 使得()k R E A λ->()j R E []3,于是j k ≠时.由sylvester 不等式知j n =()k i j R E A λ≠⎛⎫- ⎪⎝⎭∏≥()()2i i jR E A s n λ≠---∑>()()2j i j n n s n ≠---∑=()()()12i j j i js n n s n n n n n ≠-=--=--=∑矛盾.所以A 可对角化.推论 1 设12,,...,s λλλ为n 阶矩阵A 的相异的特征根,其重数为12,,...,s n n n ,则矩阵j W =()k i jE A λ≠-∏的列向量中由对应于j λ的j n 个线性无关的特征向量.证明 因A 可对角化,由定理2.3.1得()i i jE A λ≠-∏=0,()jE A λ-()i i jE A λ≠-∏=()j jE A Wλ-=0.由此,j W 中每一列非零向量都是方程组()i E A λ-X=0解向量,即j λ的特征向量.又有定理2.3.2知()j j R W n =,所以j W 的列向量组中有恰好对应于j λ的j n 个线性无关的特征向量.上述的结论表明,要构造可对角化矩阵 A 的相似变换矩阵P ,完全可以不像传统的方法那样解方程组()k E A λ-X=0,而只需对每一特征值j λ(j=1,2,…,s )从矩阵乘积()ki jE A λ≠-∏中直接找出jn个与j λ对应的线性无关的特征向量,这样所得的j n n =∑个特征向量为列作一n 阶矩阵即可.推论2 若n 阶可对角化矩阵A 只有两个相异特征值1λ(k 重)和2λ(n k -重),则矩阵()1E A λ-(或()2E A λ-的n k - (或k )个线性无关列向量就是对应2λ(或1λ)的特征向量的极大无关组.这一结论进一步表明,在可对角化矩阵A 只有2个相异特征值的情况下,不仅不需要解方程组,而且不需要计算矩阵的乘积就可以把对应于不同特征值的特征向量立即求出.例4 求下列矩阵A 相似变换矩阵.(1)A =741471444-⎛⎫ ⎪ ⎪ ⎪-⎝⎭ (2)A =1220212022100001⎛⎫⎪⎪ ⎪ ⎪⎝⎭解 (1)A 的特征值1λ=12,2λ=3(二重)21541451448W E A λ-⎛⎫⎪=-=- ⎪ ⎪⎝⎭,124441W E A λ-⎛⎫⎪=-= ⎪ ⎪-⎝⎭-41-4-41由于()()120E A E A λλ--=,所以A 可对角化,有推论2知1λ的一个特征向量()11,1,1α=-(取1W 的第3列)2λ的2个线性无关的特征向量()()234,5,4,1,1,8αα=-故相似变换矩阵P =()123,,ααα=141151148-⎛⎫⎪⎪ ⎪-⎝⎭,1(12,3,3)PAP diag -=(2)A 的特征值1λ=-1(二重),2λ=5,3λ=1,而()()123W E A E A λλ=--=8448*4400-⎛⎫⎪-⎪ ⎪-- ⎪⎝⎭ ()()1300*08E A E A λλ⎛⎫ ⎪ ⎪--= ⎪ ⎪⎝⎭2W=,3W=88*80⎛⎫⎪ ⎪ ⎪⎪⎝⎭由推论2可得1λ的特征向量()()1284404αα''=--=-,,,,,8,-4,0. 23λλ,的特征向量分别为()()3400088880αα==,,,,,,,于是相似变换矩阵为P=()1234αααα,,,==84008440000-⎛⎫⎪⎪⎪--⎪⎝⎭8-488-8 P A 1P -=diag(-1,-1,5,-1).上文讨论了矩阵是否可对角化的判定及矩阵对角化方法问题,给出了简便易行的判定和求法.区别于传统的方法,定理2.3.1定理2.3.2及推论把矩阵对角化问题归结为矩阵的乘法运算,不需要解方程组就可以得到特征向量及相似变换矩阵,但是上述方法都没有达到特征值,特征向量,相似变换矩阵同步求解的效果.下面引入λ-矩阵,改进在一般情形下矩阵对角化的方法,使判定和求解一步到位并得到矩阵对角化十分简单的方法,主要依据下面两个定理.2.4 引入λ-矩阵推出数字矩阵可对角化的充要条件定理2.4.1 设A 是数域P 上的n 阶方阵,()()A E A λλ=-为其特征矩阵E 为n 阶单位阵.如果()A λ经过初等变换化为对角阵()D λ,则A 的特征值为()D λ的对角线上元素的乘积的多项式的根. (证明略)定理2.4.2 在定理2.4.1 的假设下,如果()()(),T A D λλ经初等变换化为()()(),D P λλ,且()D λ为对角阵,则(1) 对于A 的每个特征值i λ,()i P λ中与()i D λ的零行对应的行向量生成属于i λ的特征子空间.(2) 若A 的特征值都在P 内,设12,,...,s λλλ为A 的全部不同的特征值,其重数分别为12,,...,s γγγ,则A 可以对角化的充要条件是()i D λ中零行的数目=i λ的重数i γ(i=1,2,…,s )证明 (1)因为()D λ与()T A λ的秩为n ,则总有可逆的λ-矩阵()P λ,()Q λ,使()()()()()()()12(,,...,)T n P A Q diag d d d D λλλλλλλ==.即对()T A λ施行()P λ对应的一些行初等变换和()Q λ对应的一些列初等变换可使()T A λ化为对角阵()D λ,有()()()(),T P A Q E λλλ→()()(),D P λλ (1) 这里相当于初等列变换的()Q λ右乘作用在()T A λ而不作用于E.因为()()()T P A Q λλλ=()D λ,所以()()()()T T T Q A P D λλλλ==()D λ.于是对A 的每个特征值i λ有()()()T T i i i Q A P λλλ=diag(()()()12,,...,i i n i d d d λλλ)设()i D λ中有i m 个零行,相应的i m 个为的对角元记为()()()12...0i i i i i im i d d d λλλ====()1i m n ≤≤,取()T i P λ中对应的列向量1,2,...,i i i im P P P ,则()()T i i Q E A λλ- ()1,2,...,i i i im P P P =0.因为()T i Q λ可逆,所以()i E A λ- ()1,2,...,i i i im P P P =0 (2)由于()T i P λ可逆,故()12,,...,i T T T i i im P P P 列满秩,从而由(2)知12,,...,i T T Ti i im P P P 正是A 属于iλ的i m 个线性无关的特征向量,再从(1)式,注意到()i D λ中n -i m 个非零行是行满秩的.由[]7中定理1知A 属于i λ的线性无关的特征向量就是()i P λ中与()i D λ的零行对应的行向量,他们生成i λ对应的特征子空间.(2) A 可对角化⇔秩()i E A λ-=i n γ-=i n m -,即i m =i γ(i=1,2,…,s ) 证毕. 基于以上讨论我们不难得到矩阵对角化的简单方法,其步骤如下: (1)对(),TiE A E λ-作初等变换化为()()(),D P λλ,其中()()()()12(,...,)n D diag d d d λλλλ=,,则A 的特征值恰是()()()12...n d d d λλλ=0的根. (2) 如果A 的特征向量全在P 内,且对每个i λ有()i D λ中零行数目=i λ的重数,则A 可以对角化,否则不可对角化.(3) 对于每个i λ,在()i P λ中取出与()i D λ中零行对应的行向量12,,...,i i i im P P P 得A 属于i λ线性无关的特征向量.(4) 若A 可以对角化,作可逆矩阵()1121,,...,,...,,...,si i im s sm T P P P P P =,则11122(,,...,)s s T AT diag E E E λλλ-=,i E 为i γ阶矩阵.例5 判定下列矩阵可否对角化,若可以求可逆矩阵T ,使1T AT -为对角阵.(1) A =011111011⎛⎫ ⎪- ⎪ ⎪⎝⎭ (2) A =321222361-⎛⎫ ⎪-- ⎪ ⎪-⎝⎭解 ()()10100,111010011100T A E λλλλ-⎛⎫⎪=-- ⎪ ⎪--⎝⎭→2011002011111001λλλλλλλ⎛⎫-- ⎪--- ⎪ ⎪--⎝⎭ →21110010111102011λλλλλ--⎛⎫⎪-+ ⎪ ⎪---⎝⎭→210000101111020011λλλ-⎛⎫ ⎪-+ ⎪ ⎪--⎝⎭→()22100001010111001231λλλλλλλ⎛⎫-⎪-+ ⎪ ⎪⎪---++-++⎝⎭故P 的特征值是120,1λλ==(二重),因()1D 中的零行数目2λ≠的重数,故P 不可对角化.(2)()()2323100121001,22601002240121210010242103T A E λλλλλλλλλλλ⎛⎫----+⎛⎫⎪ ⎪=-+-→-- ⎪ ⎪ ⎪ ⎪-+-+-+⎝⎭⎝⎭()()2100001100001022*******012024241030242103λλλλλλλλλλλ⎛⎫⎛⎫ ⎪ ⎪→--→- ⎪ ⎪ ⎪ ⎪---+-+--+-+⎝⎭⎝⎭()()()1000010200120024121λλλλ⎛⎫⎪→- ⎪ ⎪--+--+⎝⎭故A 的特征值为12λ=(2重根), 24λ=-.又()2D 中零行数=2=1λ的重数;()4D -的零行数=1=2λ的重数,故P 可对角化,且由()()()2,2D P =100001000012000123⎛⎫ ⎪⎪ ⎪--⎝⎭可得出()()αβ''=0,1,2,=1,-2,-3是A 属于2的线性无关特征向量由()()()4D -,P-4=100001060012000123⎛⎫ ⎪- ⎪ ⎪-⎝⎭得()1,2,3γ'=-是A 属于-4的线性无关的特征向量.令T=011122233⎛⎫ ⎪-- ⎪ ⎪-⎝⎭,则1224T AT -⎛⎫⎪= ⎪ ⎪-⎝⎭参考文献[1] 北京大学数学系.高等代数.北京:高等教育出版社,第88版,1988.[2] 许以超.代数学引论[]M.上海:社会科学技术出版社,1966[3] 钱吉林.矩阵及其广义矩阵[]M.武汉:华中师范大学出版社.[4] 王心介.高等代数与解析几何[]M.北京:科学出版社,2002.[5] 张远达.线性代数原理.上海:上海教育出版社,1980.[6] 彭海明.对“矩阵特征值与特征向量同步求解方法探讨”的改进意见[]J.数学通报,1993(2):45-47.[7] 刘国洪.王宝智.利用矩阵的初等行变换对矩阵的特征值和特征向量同步求解,数学通报,1996,2.。

第三章矩阵对角化、若当标准型

第三章矩阵对角化、若当标准型

第三章 矩阵的对角化、若当标准型§ 矩阵对角化线性变换在基下的矩阵若为对角阵,则向量在基下的表示将非常简单,而线性变换在两个基下的矩阵相似,故线性变换在基下矩阵为对角阵问题即为矩阵对角化问题。

一、特征值、特征向量性质定义1 设n n A ⨯∈C ,称A 的全体特征值为A 的谱。

下面定理1是显然的。

定理1 相似矩阵有相同的特征多项式,从而有相同的谱。

由于矩阵A 的不同特征值对应的特征子空间的和是直和,故有下面定理2。

定理2 设n n A ⨯∈C ,则A 的不同特征值对应的特征向量线性无关。

定义2设n n A ⨯∈C ,i λ为A 的特征值,称A 的特征多项式中i λ的重根数i m 为iλ的代数重复度,称特征子空间i V λ的维数i α为i λ的几何重复度。

由定义2即知A 的特征值i λ的几何重复度i α为A 对应于特征值i λ的线性无关特征向量的个数。

定理3 设n n A ⨯∈C ,i λ为A 的特征值,i α为i λ的几何重复度,则rank()i i n n I A αλ=--证明 特征子空间{|,}i n i V x Ax x x λλ==∈C ,所以dim dim ()ii i n V N I A λαλ==-dim ()i n n R I A λ=-- rank()i n n I A λ=--例1 求123323001A ⎡⎤⎢⎥=⎢⎥⎢⎥-⎣⎦的谱,及相异特征值的代数重复度和几何重复度。

解 123det()32301I A λλλλ----=---+ 2(1)(4)λλ=+-所以A 的谱为11,1λ=--,24λ=,12,λλ的代数重复度分别为122,1m m ==。

1λ的几何重复度113rank()I A αλ=--2233rank 3331000---⎡⎤⎢⎥=----=⎢⎥⎢⎥⎣⎦2λ的几何重复度223rank()I A αλ=--3233rank 3231005--⎡⎤⎢⎥=---=⎢⎥⎢⎥⎣⎦定理4 设n n A ⨯∈C ,i λ为A 的特征值,i m 为i λ的代数重复度,i α为i λ的几何重复度,则i i m α≤。

线性变换“可对角化”的条件及“对角化”方法

线性变换“可对角化”的条件及“对角化”方法

对角化方法在控制系统设计 中的应用
在机器学习中的应用
对角化矩阵可以提高机器学 习算法的收敛速度

对角化矩阵可以简化机器学 习算法的实现过程
线性变换可对角化在机器学 习算法中的优化性能
对角化矩阵可以提高机器学 习算法的稳定性
研究现状及问题
线性变换对角化的研究历史与现状 当前研究存在的问题与挑战 未来研究方向与趋势 当前研究的热点问题与争议
当前研究的挑战与困难
确定对角化方法的 有效性
确定对角化方法的 普适性
确定对角化方法在 不同领域的应用价 值
探索新的对角化方 法
解决挑战的方法与策略
发展新的数学工具:引入新的数学理论和方法,以解决线性变换对角化中遇到的问题
借鉴其他领域的经验:参考其他领域类似的案例和经验,寻找解决方案 深入研究线性变换的性质:更深入地了解线性变换的性质和特点,为对角化提供更多思路和方法 开发高效的数值计算方法:发展更高效、更精确的数值计算方法,提高对角化的效率和准确性
对未来研究的展望与预期
探索更多可对角化的线性变换类型 深入研究线性变换对角化的条件和算法 拓展线性变换对角化在各个领域的应用 加强与其他领域的交叉研究,推动线性代数的发展
对未来应用的设想与期待
线性变换对角化在科学计 算领域的应用
对量子计算领域的影响
在机器学习领域的应用前 景
对未来科技发展的推动与 影响
特征值的应用:通过特征值可以对矩阵进行分解,应用于信号处理、图像处理等领域
相似变换的应用:通过相似变换可以将矩阵转化为对角矩阵,应用于相似分类、机器学习等领 域
对角化方法的优缺点:对角化方法具有简单易行、直观性等优点,但也存在局限性,如不适用 于非方阵等情形

7.6 可对角化矩阵

7.6  可对角化矩阵

的特征多项式是
−3
2
−3
−2
1
+2
−2 = 3 − 12 + 16 = ( − 2)2
−6
+1
特征根是 2,2,-4.
对于特征根-4,求出齐次线性方程组
−7 −2
2 −2
−3 −6
的一个基础系
1
2
, − ,1
3

1
−2
−3
1
0
2 = 0
3
0
对于特征根 2,求出齐次线性方程组

根据归纳法假设, 1 , 2 , ⋯ , −1 线性无关,所以
( − ) = , = , , ⋯ , − .
但 1 , 2 , ⋯ 两两不同,所以 1 = 2 = ⋯ = −1 = 0 ,再代入(3),
因为 ≠ 0, 所以 = 0. 这就证明了 , , ⋯ , 线性无关。
()
+ + ⋯ + = . ∈ ,
推论7.6.2 设σ是数域F上向量空间V的一个线性变换, 1 , 2 , ⋯ , 是σ的
互不相同的特征值。又设 1 , ⋯ , , = 1, ⋯ , , 是属于特征值 的线性
无关的特征向量, 那么向量 11 , ⋯ , 11 , ⋯ , 1 , ⋯ , 线性无关.
如果等式
()
+ + ⋯ + = . ∈ ,
成立,那么以 乘(3)的两端得
()
+ + ⋯ + = .
另一方面,对(3)式两端施行线性变换σ,
注意到等式(2),我们有
()

计算Ore代数上一类矩阵的分块对角型

计算Ore代数上一类矩阵的分块对角型

计算Ore代数上一类矩阵的分块对角型作者:刘兰兰石立叶来源:《赤峰学院学报·自然科学版》 2013年第14期刘兰兰1,石立叶2(1.贵州民族大学理学院,贵阳贵州 550025;2.邯郸学院数学系,河北邯郸 056005)摘要:在这篇文章中我们应用线性代数的方法来计算Laurent-Ore代数上的一类矩阵相似意义下的分块对角化.在某些特定的条件下(幂等)我们证明了R是等价于一个分块对角的矩阵.关键词:Ore代数;分块对角矩阵;幂等同态中图分类号:O151文献标识码:A文章编号:1673-260X(2013)07-0009-021 引言在一个一般的代数结构上的矩阵的标准型的存在性和计算是一个很复杂的问题.目前算子还上某些特殊的子环(如主理想整环)上的矩阵,在文献[2]中已经有算法可以计算它的等价Jacobson标准型或者是分块的对角型.但是,对于一般的Ore并非主理想整环也不是欧式环,所以Ore环上的元素不一定满足带余除法.线性代数中我们是用带余除法来约化矩阵中的元素,而在Ore环中我们只能再想其他办法.正是这个原因给我们的计算带来了困难,我们很难计算出它的Jacobson标准型和Simth标准型.在本文中我们用线性代数的方法来给矩阵对角化.我们找出使得URV为准对角形的U和V,我们用同调代数的办法来找U和V.2 符号和概念以下我们假设R是一个Ore代数,在本文中我们一直假设R,Q,P∈Fp×p满足RP=QR定义1 在Ore代数R中,我们称一个矩阵U∈Rp×p是可逆的,如果存在V∈Rp×p使得UV=VU=Ip.所以可逆矩阵的集合构成一个群我们称之为R上的一般线性群记为Glp(R).Glp(R)={U∈Rp×p|?埚V∈Rp×ps.t.UV=VU=Ip}3 引理和定理以上两个矩阵相等,得到R12=0,R21=0.4 结束语事实上这篇文章中所讨论的矩阵,只是Laurent-Ore代数上一类比较特殊的矩阵.因为Laurent-Ore代数并不是主理想整环,所以在一般情况下Laurent-Ore代数上的矩阵的对角化还是一个很复杂的问题,还有待于我们以后解决.参考文献:〔1〕王萼芳,石生明.高等代数[M].高等教育出版社,2003.〔2〕Levandovskyy, V., Schindelar, K., 2011. Computing diagonal form and Jacobson normal form of a matrix using Gr?bner bases.[J].SymbolicComput.46(5),595–608.〔3〕Thomas Cluzeau,Alban Quadrat, Factoring and decomposing a class of linear functional systems[J].Linear algebra and its application ,324-381,2007.〔4〕刘兰兰,周梦.差分-微分模上多个序的Grobner基及多变量的维数多项式[J].系统科学与数学,2012(8).。

矩阵交换性的应用(二):同时对角化

矩阵交换性的应用(二):同时对角化

矩阵交换性的应用(二):同时对角化矩阵交换性的应用(二)1.设和都是维线性空间的线性变换,如果的个特征值互异,则的充要条件是的特征向量也是的特征向量.证明:充分性:若的特征向量也是的特征向量.那么取一组基使得:在这组基下的矩阵为对角阵,由于前提,所以在这组基下的矩阵也是对角阵,因此,所以可交换.必要性:由于的特征值互异,因此可对角化,设其在某一组基下的矩阵式是角阵,记在这组基下的矩阵为,因此有:但是由于的个特征值互异,我们将具体写出来和相乘,简单验证就会发现必须是对角阵,因此结论得证.2.设,且,且都可对角化,证明存在可逆矩阵使得同时为对角阵.证明:由于可对角化,因此存在可逆矩阵使得:而由于可对角化,因此它的所有初等因子都是一阶的,因此存在可逆阵使得,令为:所以:这时取:可逆,且:故可同时对角化!推论:设均为阶实对称阵. 证明:有阶正交阵 , 使与同时为对角矩阵的充分必要条件是 .练习1:设与是实正定矩阵,证明: 是正定矩阵的充要条件时.练习2:若都是复数域上的阶方阵,且(k为某个正整数),则存在可逆矩阵使得,同时为对角阵.习题训练:目录●数分训练(一)解答及(二)预告●每日一题:数分训练(二):上下极限●数分训练(三):一道三角函数题目●数分训练(四):数列与级数训练●数分训练(五):定积分定义处理问题●数分训练(六):一道中值定理的渐进形态●高代训练(一):有限不覆盖定理●数分训练(八):一道积分不等式●数分训练(九):反正切函数的裂项●(十):高代训练:迹的基本应用●(十一):高代训练:正定矩阵习题●高代训练:矩阵交换性的应用(一)●Problem13:一道矩阵方程与特征多项式的关系。

矩阵可对角化的总结

矩阵可对角化的总结

矩阵可对角化的总结(总15页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--矩阵可对角化的总结莆田学院数学系02级1班连涵生[摘要]:主要讨论n级方阵可对角化问题:(1)通过特征值,特征向量和若尔当标准形讨论方阵可对角化的条件;(2)实n级对称矩阵的可对角化讨论;(3)几个常见n 级方阵的可对角化讨论。

[关键词]:n级方阵;可对角化;相似;特征值;特征向量;若尔当标准形;n级实对称矩阵说明:如果没有具体指出是在哪一个数域上的n 级方阵,都认为是复数域上的。

当然如果它的特征多项式在某一数域K上不能表成一次多项式的乘积的话,那么在此数域上它一定不能相似对角阵。

只要适当扩大原本数域使得满足以上条件就可以。

复数域上一定满足,因此这样假设,就不用再去讨论数域。

引言所谓矩阵可对角化指的是矩阵与对角阵相似,而说线性变换是可对角化的指的是这个线性变换在某一组基下是对角阵(或者说线性变换在一组基下的矩阵是可对角化的),同样可以把问题归到矩阵是否可对角化。

本文主要是讨论矩阵可对角化。

定义1:设A,B是两个n级方阵,如果存在可逆矩阵P,使P-1AP=B,则称B与A相似,记作A~B。

矩阵P称为由A到B的相似变换矩阵。

[]1[]2[]3[]423定义2:设A 是一个n 级方阵,如果有数λ和非零向量X ,使AX=λX 则称λ是矩阵A 的特征值,X 称为A 的对应于λ的特征向量,称{|}V A λααλα==为矩阵对应于特征值λ的特征子空间。

[]1[]2[]3[]4定义3:设A 是数域P 上一个n 级方阵,若多项式()[]f x P X ∈,使()0f A =则称()f x 为矩阵A 的零化多项式。

[]2定义4:数域P 上次数最低的首项为1的以A 为根的多项式称为A 的最小多项式。

[]1[]2[]3一、 首先从特征值,特征向量入手讨论n 级方阵可对角化的相关条件。

定理1:一个n 级方阵A 可对角化的充要条件它有n 个线性无关的特征向量。

可对角化的其他判定准则及其应用

可对角化的其他判定准则及其应用

可对⾓化的其他判定准则及其应⽤矩阵或线性变换的可对⾓化判定是⾼等代数的重要知识点. 由于判定准则多, 技巧性强, 故可对⾓化判定⼀直是教学和考试中的难点. ⼀般来说,判定n维复线性空间V上的线性变换\varphi (或n阶复矩阵A) 可对⾓化, 通常有以下六种⽅法 (参考复旦⾼代教材的第六章和第七章):(D1) \varphi可对⾓化的充要条件是\varphi有n个线性⽆关的特征向量;(D2) 若\varphi有n个不同的特征值, 则\varphi可对⾓化;(D3) \varphi可对⾓化的充要条件是V是\varphi的特征⼦空间的直和;(D4) \varphi可对⾓化的充要条件是\varphi有完全的特征向量系, 即对\varphi的任⼀特征值, 其⼏何重数等于其代数重数;(D5) \varphi可对⾓化的充要条件是\varphi的极⼩多项式⽆重根;(D6) \varphi可对⾓化的充要条件是\varphi的 Jordan 块都是⼀阶的, 或等价地, \varphi的初等因⼦都是⼀次多项式.本⽂的主要⽬的是, 给出可对⾓化的⼀些其他的判定准则及其应⽤. 以下总是以线性变换作为对象来阐述和证明结论, 其对应的矩阵版本, 留给读者⾃⼰补充完整.⾸先, 我们来证明⼀个具有良好性质的线性变换的⼤型引理.引理 1 设V是数域\mathbb{K}上的n维线性空间, \varphi是V上的线性变换, 则以下九个结论等价:(1) V=\mathrm{Ker}\varphi\oplus\mathrm{Im}\varphi;(2) V=\mathrm{Ker}\varphi+\mathrm{Im}\varphi;(3) \mathrm{Ker}\varphi\cap\mathrm{Im}\varphi=0;(4) \mathrm{Ker}\varphi=\mathrm{Ker}\varphi^2, 或等价地, \dim\mathrm{Ker}\varphi=\dim\mathrm{Ker}\varphi^2;(5) \mathrm{Ker}\varphi=\mathrm{Ker}\varphi^2=\mathrm{Ker}\varphi^3=\cdots, 或等价地,\dim\mathrm{Ker}\varphi=\dim\mathrm{Ker}\varphi^2=\dim\mathrm{Ker}\varphi^3=\cdots;(6) \mathrm{Im}\varphi=\mathrm{Im}\varphi^2, 或等价地, r(\varphi)=r(\varphi^2);(7) \mathrm{Im}\varphi=\mathrm{Im}\varphi^2=\mathrm{Im}\varphi^3=\cdots, 或等价地, r(\varphi)=r(\varphi^2)=r(\varphi^3)=\cdots;(8) \mathrm{Ker}\varphi存在\varphi-不变补空间, 即存在\varphi-不变⼦空间U, 使得V=\mathrm{Ker}\varphi\oplus U;(9) \mathrm{Im}\varphi存在\varphi-不变补空间, 即存在\varphi-不变⼦空间W, 使得V=\mathrm{Im}\varphi\oplus W.证明由直和的定义可知 (1) \Leftrightarrow (2)+(3), 于是 (1) \Rightarrow (2) 和 (1) \Rightarrow (3) 都是显然的. 根据交和空间维数公式和线性映射维数公式可知\dim(\mathrm{Ker}\varphi+\mathrm{Im}\varphi)=\dim\mathrm{Ker}\varphi+\dim\mathrm{Im}\varphi-\dim(\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi)=\dim V-\dim(\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi),于是 (2) \Leftrightarrow (3) 成⽴,从⽽前三个结论两两等价.(3) \Rightarrow (4): 显然\mathrm{Ker}\varphi\subseteq\mathrm{Ker}\varphi^2成⽴. 任取\alpha\in\mathrm{Ker}\varphi^2, 则\varphi(\alpha)\in\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi=0, 于是\varphi(\alpha)=0, 即\alpha\in\mathrm{Ker}\varphi, 从⽽\mathrm{Ker}\varphi^2\subseteq\mathrm{Ker}\varphi也成⽴, 于是 (4) 成⽴.(4) \Rightarrow (3): 任取\alpha\in\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi, 则存在\beta\in V, 使得\alpha=\varphi(\beta), 于是0=\varphi(\alpha)=\varphi^2(\beta), 即\beta\in\mathrm{Ker}\varphi^2=\mathrm{Ker}\varphi, 从⽽\alpha=\varphi(\beta)=0, 即 (3) 成⽴.(5) \Rightarrow (4) 是显然的, 下证 (4) \Rightarrow (5): 设\mathrm{Ker}\varphi^k=\mathrm{Ker}\varphi^{k+1}已对正整数k成⽴, 先证\mathrm{Ker}\varphi^{k+1}=\mathrm{Ker}\varphi^{k+2}也成⽴, 然后⽤归纳法即得结论. \mathrm{Ker}\varphi^{k+1}\subseteq\mathrm{Ker}\varphi^{k+2}是显然的. 任取\alpha\in\mathrm{Ker}\varphi^{k+2}, 即0=\varphi^{k+2} (\alpha)=\varphi^{k+1}(\varphi(\alpha)), 于是\varphi(\alpha)\in\mathrm{Ker}\varphi^{k+1}=\mathrm{Ker}\varphi^k, 从⽽\varphi^{k+1}(\alpha)=\varphi^k(\varphi(\alpha))=0, 即\alpha\in\mathrm{Ker}\varphi^{k+1}, 于是\mathrm{Ker}\varphi^{k+2}\subseteq\mathrm{Ker}\varphi^{k+1}也成⽴.(3) \Leftrightarrow (6): 考虑\varphi在不变⼦空间\mathrm{Im}\varphi上的限制变换\varphi|_{\mathrm{Im}\varphi}:\mathrm{Im}\varphi\to\mathrm{Im}\varphi, 由限制的定义可知它的核等于\mathrm{Ker}\varphi\cap\mathrm{Im}\varphi, 它的像等于\mathrm{Im}\varphi^2. 由于有限维线性空间上的线性变换是单射当且仅当它是满射,当且仅当它是同构, 故 (3) \Leftrightarrow (6) 成⽴.(7) \Rightarrow (6) 是显然的, 下证 (6) \Rightarrow (7): 设\mathrm{Im}\varphi^k=\mathrm{Im}\varphi^{k+1}已对正整数k成⽴, 先证\mathrm{Im}\varphi^{k+1}=\mathrm{Im}\varphi^{k+2}也成⽴, 然后⽤归纳法即得结论. \mathrm{Im}\varphi^{k+2}\subseteq\mathrm{Im}\varphi^{k+1}是显然的. 任取\alpha\in\mathrm{Im}\varphi^{k+1}, 即存在\beta\in V, 使得\alpha=\varphi^{k+1}(\beta). 由于\varphi^k(\beta)\in\mathrm{Im}\varphi^k=\mathrm{Im}\varphi^{k+1}, 故存在\gamma\in V, 使得\varphi^k(\beta)=\varphi^{k+1}(\gamma), 于是\alpha=\varphi^{k+1}(\beta)=\varphi(\varphi^k(\beta))=\varphi(\varphi^{k+1}(\gamma))=\varphi^{k+2}(\gamma)\in\mathrm{Im}\varphi^{k+2}, 从⽽\mathrm{Im}\varphi^{k+1}\subseteq\mathrm{Im}\varphi^{k+2}也成⽴. (1) \Rightarrow (8) 是显然的, 下证 (8) \Rightarrow (1). 我们先证\mathrm{Im}\varphi\subseteq U: 任取\varphi(v)\in\mathrm{Im}\varphi, 由直和分解可设v=v_1+u, 其中v_1\in\mathrm{Ker}\varphi, u\in U, 则由U的\varphi-不变性可得\varphi(v)=\varphi(v_1)+\varphi(u)=\varphi(u)\in U.考虑不等式\dim V=\dim(\mathrm{Ker}\varphi\oplus U)=\dim\mathrm{Ker}\varphi+\dim U\geq\dim\mathrm{Ker}\varphi+\dim\mathrm{Im}\varphi=\dim V,从⽽只能是U=\mathrm{Im}\varphi, 于是 (1) 成⽴.(1) \Rightarrow (9) 是显然的, 下证 (9) \Rightarrow (1). 我们先证W\subseteq\mathrm{Ker}\varphi: 任取w\in W, 则由W的\varphi-不变性可得\varphi(w)\in\mathrm{Im}\varphi\cap W=0, 即有w\in\mathrm{Ker}\varphi. 考虑不等式\dim V=\dim(\mathrm{Im}\varphi\oplusW)=\dim\mathrm{Im}\varphi+\dim W\leq\dim\mathrm{Im}\varphi+\dim\mathrm{Ker}\varphi=\dim V,从⽽只能是W=\mathrm{Ker}\varphi, 于是(1) 成⽴. \Box注 1 引理 1 是 15 级⾼等代数 I 每周⼀题第 10 题, 其证明思路在⾼代⽩⽪书的例 4.32, 例 4.33, 例 4.34 和例 7.13 中均有所涉及.有了引理 1 做铺垫, 我们可以证明⼀系列的可对⾓化判定准则.定理 1 设\varphi是n维复线性空间V上的线性变换, 则\varphi可对⾓化的充要条件是对\varphi的任⼀特征值\lambda_0, 下列条件之⼀成⽴:(E1) V=\mathrm{Ker}(\varphi-\lambda_0I_V)\oplus\mathrm{Im}(\varphi-\lambda_0I_V);(E2) V=\mathrm{Ker}(\varphi-\lambda_0I_V)+\mathrm{Im}(\varphi-\lambda_0I_V);(E3) \mathrm{Ker}(\varphi-\lambda_0I_V)\cap\mathrm{Im}(\varphi-\lambda_0I_V)=0;(E4) \mathrm{Ker}(\varphi-\lambda_0I_V)=\mathrm{Ker}(\varphi-\lambda_0I_V)^2, 或等价地, \dim\mathrm{Ker}(\varphi-\lambda_0I_V)=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^2;(E5) \mathrm{Ker}(\varphi-\lambda_0I_V)=\mathrm{Ker}(\varphi-\lambda_0I_V)^2=\mathrm{Ker}(\varphi-\lambda_0I_V)^3=\cdots, 或等价地, \dim\mathrm{Ker}(\varphi-\lambda_0I_V)=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^2=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^3=\cdots; (E6) \mathrm{Im}(\varphi-\lambda_0I_V)=\mathrm{Im}(\varphi-\lambda_0I_V)^2, 或等价地, r(\varphi-\lambda_0I_V)=r((\varphi-\lambda_0I_V)^2);(E7) \mathrm{Im}(\varphi-\lambda_0I_V)=\mathrm{Im}(\varphi-\lambda_0I_V)^2=\mathrm{Im}(\varphi-\lambda_0I_V)^3=\cdots, 或等价地,r(\varphi-\lambda_0I_V)=r((\varphi-\lambda_0I_V)^2)=r((\varphi-\lambda_0I_V)^3)=\cdots;(E8) \mathrm{Ker}(\varphi-\lambda_0I_V)存在\varphi-不变补空间, 即存在\varphi-不变⼦空间U, 使得V=\mathrm{Ker}(\varphi-\lambda_0I_V)\oplus U;(E9) \mathrm{Im}(\varphi-\lambda_0I_V)存在\varphi-不变补空间, 即存在\varphi-不变⼦空间W, 使得V=\mathrm{Im}(\varphi-\lambda_0I_V)\oplus W.证明由引理 1 可知, ⽆论是充分性还是必要性, 我们只要选取 (E1)--(E9) 中的⼀个等价条件来证明即可.必要性设\varphi可对⾓化, 即存在V的⼀组基\{e_1,e_2,\cdots,e_n\}, 使得\varphi在这组基下的表⽰矩阵为对⾓阵\mathrm{diag}\{\lambda_1,\lambda_2,\cdots,\lambda_n\}, 不妨设\lambda_1=\cdots=\lambda_r=\lambda_0, \lambda_j\neq\lambda_0\,(r<j\leq n). 由表⽰矩阵的定义可知\varphi(e_i)=\lambda_ie_i\,(1\leq i\leq n), 通过简单的验证可得\mathrm{Ker}(\varphi-\lambda_0I_V)=L(e_1,\cdots,e_r),\mathrm{Im}(\varphi-\lambda_0I_V)=L(e_{r+1},\cdots,e_n), 于是 (E1) 成⽴.充分性对应于不同的等价条件, 我们给出⼏种不同的证法.从 (E3) 出发: ⽤反证法, 设\varphi不可对⾓化, 则由 (D6) 可知, 存在V的⼀组基\{e_1,e_2,\cdots,e_n\}, 使得\varphi在这组基下的表⽰矩阵为 Jordan 标准型\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\}, 且⾄少有⼀个 Jordan 块的阶数⼤于 1.不妨设r_1>1, 则由表⽰矩阵的定义可知\varphi(e_1)=\lambda_1e_1,\,\,\,\,\varphi(e_2)=e_1+\lambda_1e_2.于是(\varphi-\lambda_1I_V) (e_1)=0, (\varphi-\lambda_1I_V)(e_2)=e_1, 从⽽0\neq e_1\in\mathrm{Ker}(\varphi-\lambda_1I_V)\cap\mathrm{Im}(\varphi-\lambda_1I_V),这与已知⽭盾.从 (E5) 出发: 由\mathrm{Ker}(\varphi-\lambda_0I_V)=\cdots=\mathrm{Ker}(\varphi-\lambda_0I_V)^n可知, \lambda_0的根⼦空间等于其特征⼦空间. 因为全空间V可以分解为根⼦空间的直和, 故全空间V也是特征⼦空间的直和, 从⽽由判定准则 (D3) 即得结论.从 (E5) 出发: 由\dim\mathrm{Ker}(\varphi-\lambda_0I_V)=\cdots=\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^n可知, \lambda_0的⼏何重数\dim\mathrm{Ker}(\varphi-\lambda_0I_V)等于其代数重数\dim\mathrm{Ker}(\varphi-\lambda_0I_V)^n, 从⽽由判定准则 (D4) 即得结论.从 (E5) 出发: 设\varphi的全体不同特征值为\lambda_1,\lambda_2,\cdots,\lambda_k, \varphi的特征多项式为f(\lambda)=(\lambda-\lambda_1)^{m_1}(\lambda-\lambda_2)^{m_2}\cdots(\lambda-\lambda_k)^{m_k},则对任意的\alpha\in V, 由 Cayley-Hamilton 定理可知(\varphi-\lambda_1I_V)^{m_1}(\varphi-\lambda_2I_V)^{m_2}\cdots(\varphi-\lambda_kI_V)^{m_k}(\alpha)=0,即(\varphi-\lambda_2I_V)^{m_2}\cdots(\varphi-\lambda_kI_V)^{m_k}(\alpha)\in\mathrm{Ker}(\varphi-\lambda_1I_V)^{m_1}=\mathrm{Ker}(\varphi-\lambda_1I_V), 从⽽(\varphi-\lambda_1I_V)(\varphi-\lambda_2I_V)^{m_2}\cdots(\varphi-\lambda_kI_V)^{m_k}(\alpha)=0.不断这样做下去,最终可得对任意的\alpha\in V, 总有(\varphi-\lambda_1I_V)(\varphi-\lambda_2I_V)\cdots(\varphi-\lambda_kI_V)(\alpha)=0,即\varphi适合多项式g(\lambda)=(\lambda-\lambda_1)(\lambda-\lambda_2)\cdots(\lambda-\lambda_k), 从⽽\varphi的极⼩多项式m(\lambda)\midg(\lambda). ⼜由极⼩多项式的性质可知g(\lambda)\mid m(\lambda), 于是m(\lambda)=g(\lambda)⽆重根, 从⽽由判定准则 (D5) 即得结论.从 (E6) 出发: ⽤反证法, 设\varphi不可对⾓化, 则由 (D6) 可知, \varphi的 Jordan 标准型J=\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\}中⾄少有⼀个 Jordan 块的阶数⼤于 1. 不妨设r_1>1, 则有r(J_{r_1}(\lambda_1)-\lambda_1I_{r_1})=r_1-1, ⽽r((J_{r_1}(\lambda_1)-\lambda_1I_{r_1})^2)=r_1-2. 由矩阵秩的基本不等式可知, r(J-\lambda_1I_n)>r((J-\lambda_1I_n)^2), 即有r(\varphi-\lambda_1I_V)>r((\varphi-\lambda_1I_V)^2), 这与已知⽭盾. \Box推论 1 设\varphi是n维复线性空间V上的线性变换, 则\varphi可对⾓化的充要条件是V的任⼀\varphi-不变⼦空间都存在\varphi-不变补空间, 即对任⼀\varphi-不变⼦空间U, 都存在\varphi-不变⼦空间W, 使得V=U\oplus W.证明充分性可由定理 1 的 (E8) 或 (E9) 得到. 再证必要性, 因为\varphi可对⾓化, 故由 (D1) 可知, 存在V的⼀组基\{e_1,e_2,\cdots,e_n\}, 它们都是\varphi的特征向量. 由⾼代教材的推论 7.6.3 可知, \varphi在不变⼦空间U上的限制\varphi|_U也可对⾓化, 故同理存在U的⼀组基\ {\alpha_1,\cdots,\alpha_r\}, 它们也都是\varphi的特征向量. 由基扩张定理的证明可知, 我们可从\{e_1,e_2,\cdots,e_n\}中取出n-r个向量, 不妨设为e_{r+1},\cdots,e_n, 使得\{\alpha_1,\cdots,\alpha_r,e_{r+1},\cdots,e_n\}成为V的⼀组新基. 令W=L(e_{r+1},\cdots,e_n), 则W是\varphi-不变⼦空间且满⾜V=U\oplus W. \Box推论 2 设\varphi是数域\mathbb{K}上n维线性空间V上的线性变换 (或A是数域\mathbb{K}上的n阶⽅阵), 并且\varphi (或A) 的所有特征值都在\mathbb{K}中, 则\varphi (或A) 可对⾓化的判定准则 (D1)--(D6) 以及 (E1)--(E9) 在数域\mathbb{K}上也成⽴.证明与复数域\mathbb{C}上的证明完全类似, 具体细节留给读者⾃⼰完成. \Box注 2 定理 1 在复旦⼤学⾼等代数习题课教学视频 [3] 的第 16 讲“可对⾓化的判定 (下)”中作为例 9 出现, 它是⾼代⽩⽪书的例 7.13 和例 7.14的⾃然推⼴. 推论 1 是⾼代⽩⽪书的例 7.15.接下去, 我们将不利⽤⾣相似标准型理论和正交相似标准型理论, ⽽利⽤定理 1 直接证明复正规阵可对⾓化以及实对称阵可实对⾓化这两个重要结论.引理 2 设A为m\times n阶复矩阵, 则r(\overline{A}'A)=r(A\overline{A}')=r(A).证明这是⾼代⽩⽪书的例 3.72 的复版本, 其证明完全类似. \Box引理 3 设A为n阶复正规阵, 即满⾜A\overline{A}'=\overline{A}'A, 则r(A)=r(A^2).证明若A是 Hermite 阵, 即满⾜\overline{A}'=A, 则由引理 2 可知r(A)=r(A^2). 若A是复正规阵, 注意到A\overline{A}'是 Hermite 阵, 则由引理 2 可得r(A^2)=r(A^2\overline{A^2}')=r(AA\overline{A}'\overline{A}')=r(A\overline{A}'A\overline{A}')=r((A\overline{A}')^2)=r(A\overline{A}')=r(A),结论得证. \Box引理 4 设A为n阶复正规阵, \lambda_0是A的特征值, 则A-\lambda_0I_n也是复正规阵.证明由复正规阵的定义验证即得. \Box推论 3 复正规阵可对⾓化. 特别地, 实对称阵, 实反对称阵, Hermite 阵, 斜 Hermite 阵, 正交阵, ⾣阵均可复对⾓化.证明由引理 4, 引理 3 以及定理 1 (E6) 即得结论. \Box引理 5 实对称阵的特征值全为实数.证明设A为n阶实对称阵, \lambda_0\in\mathbb{C}是A的任⼀特征值, \alpha=(a_1,a_2,\cdots,a_n)'\in\mathbb{C}^n是对应的特征向量, 即A\alpha=\lambda_0\alpha. 上式两边同时左乘\overline{\alpha}', 则有\overline{\alpha}'A\alpha=\lambda_0\overline{\alpha}'\alpha. 注意到\alpha是⾮零向量, 故\overline{\alpha}'\alpha=\sum\limits_{i=1}^n|a_i|^2>0. 注意到A为实对称阵, 故\overline{(\overline{\alpha}'A\alpha)}'=\overline{\alpha}'A\alpha, 即\overline{\alpha}'A\alpha是⼀个实数, 从⽽\lambda_0=\dfrac{\overline{\alpha}'A\alpha}{\overline{\alpha}'\alpha}也是实数. \Box推论 4 实对称阵在实数域上可对⾓化.证法 1 设A为实对称阵, 由⾼代⽩⽪书的例 3.72 可得r(A)=r(A^2). 再由引理 5 可知, A的特征值全为实数, 于是根据推论 2 可得A在实数域上可对⾓化.证法 2 由推论 3 可知实对称阵可复对⾓化, ⼜其特征值全为实数, 故实对称阵复相似于实对⾓阵. 再由⾼代教材的推论 7.3.4 (相似关系在基域扩张下的不变性) 可知, 实对称阵可实对⾓化. \Box注 3 推论 3 和推论 4 是教学博⽂ [4] 的主要结果, 其证明的关键点也是本⽂的引理 3 以及定理 1 的类似思想.我们将推论 3 和推论 4 合并起来, 补充如下的可对⾓化判定准则:(D7) 若复⽅阵相似于复正规阵, 则可对⾓化; 若实⽅阵实相似于实对称阵, 则可实对⾓化.我们先给出⼀个相似于复正规阵的例⼦.例 1 (⽩⽪书的例 6.33) 设n阶复⽅阵A可对⾓化, 证明: 矩阵\begin{pmatrix} A & A^2 \\ A^2 & A \\ \end{pmatrix}也可对⾓化.证明设P为⾮异阵, 使得P^{-1}AP=\Lambda为对⾓阵. 考虑相似变换\begin{pmatrix} P^{-1} & 0 \\ 0 & P^{-1} \\\end{pmatrix}\begin{pmatrix} A & A^2 \\ A^2 & A \\ \end{pmatrix}\begin{pmatrix} P & 0 \\ 0 & P \\ \end{pmatrix}=\begin{pmatrix} \Lambda &\Lambda^2 \\ \Lambda^2 & \Lambda \\ \end{pmatrix},通过简单的验证可知, \begin{pmatrix} \Lambda & \Lambda^2 \\ \Lambda^2 & \Lambda \\ \end{pmatrix}是复正规阵, 故由判定准则 (D7) 可知结论成⽴. \Box最后, 我们给出⼀个相似于实对称阵的例⼦, 更多的例题请参考⾼代⽩⽪书的例 9.63--例 9.65.例 2 (⽩⽪书的例 6.40) 设a,b,c为复数且bc\neq 0, 证明下列三对⾓矩阵可对⾓化: T(a,b,c)=\begin{pmatrix} a & b & & & & \\ c & a & b & & & \\ & c & a & b & & \\ & & \ddots & \ddots & \ddots & \\ & & & c & a & b \\ & & & & c & a \\ \end{pmatrix}.证明要证T(a,b,c)可对⾓化, 只要证T(a,b,c)-aI_n=T(0,b,c)可对⾓化即可, 故不妨设a=0. 由于bc\neq 0, 故对T(0,b,c)实施如下的相似初等变换: 依次将第i+1⾏乘以\sqrt{\bigg(\dfrac{b}{c}\bigg)^i}, 再将第i+1列乘以\sqrt{\bigg(\dfrac{c}{b}\bigg)^i}(1\leq i\leq n-1), 可得T(0,b,c)复相似于T(0,\sqrt{bc},\sqrt{bc})=\sqrt{bc}\cdot T(0,1,1). 因为T(0,1,1)是实对称阵, 故可对⾓化, 从⽽T(a,b,c)也可对⾓化. \Box参考⽂献[1] ⾼代教材: 姚慕⽣, 吴泉⽔, 谢启鸿编著, ⾼等代数学 (第三版), 复旦⼤学出版社, 2014.[2] ⾼代⽩⽪书: 姚慕⽣, 谢启鸿编著, 学习⽅法指导书: ⾼等代数 (第三版), 复旦⼤学出版社, 2015.Processing math: 0%。

线性变换的对角化

线性变换的对角化

线性变换的对角化
于是,σ可对角化时,σ在基α1,α2,…,αn下的矩阵表示的 主对角线上的元素δ1,δ2,…,δn,即为σ的全部特征值,αi为σ 属于特征值δi的特征向量.也就是说,V存在一个由σ的特征 向量组成的基.
反之,如果V存在一个由σ的特征向量组成的基,那么σ 在这组基下的矩阵表示为对角矩阵,从而σ是可对角化的.
谢谢聆听
线性变换的对角化
【例6-15】
设V是数域F上的一个3维线性空间,α1,α2,α3是V的一 组基,σ是V上一个线性变换,满足
判断σ是否为可对角化的;如果是可对角化的,求 相应的基及在此基下的矩阵表示.
线性变换的对角化
解σ在基α1,α2,α3的矩阵表示为 方阵A的特征多项式为 因此,σ的特征值为λ1=-1(二重),λ2=3.
线性变换的对角化
定理6-19
设λ1,λ2,…,λs是线性变换σ的s个互不相同的特征 值,βi1,βi2,…,βiri是σ属于特征值λi的线性无关的特征 向量,i=1,2,…,s.那么向量组 β11,β12,…,β1r1;β21,β22,…,β2r2;…;βs1,βs2,…,βsrs 是线性无关的. 事实上,上面的结论与矩阵中的结论对应,就是在给 定的一组基下,n维线性空间上的线性变换和n阶方阵 之间一一对应的体现.
定义6-6′设V是数域F上的一个线性空间,σ是V上 的一个线性变换.如果σ在V的某组基下的矩阵表示为一 个对角矩阵,则称σ是可对角化的.
线性变换的对角化
设线性变换σ是可对角化的,由定义6-6′,存在 V的一组基α1,α2,…,αn,使得σ在这组基下的矩阵表 示为
线性变换的对角化
根据矩阵表示的定义,得到
于是,对应于矩阵可对角化的定理,有下面的定理.

矩阵可相似对角化的条件课件

矩阵可相似对角化的条件课件

在数值分析中的应用
线性方程组的求解
通过矩阵相似对角化,可以将一个系 数矩阵转化为对角矩阵,从而简化线 性方程组的求解过程。
数值稳定性
在数值分析中,矩阵可相似对角化有 助于提高数值计算的稳定性,因为对 角矩阵的运算相对简单且误差较小。
在控制理论中的应用
系统稳定性分析
在控制理论中,系统的稳定性可以通 过分析系统的特征值来判定。如果系 统的矩阵可相似对角化,则可以通过 对角矩阵的特征值来快速判定系统的 稳定性。
最小多项式
最小多项式是矩阵相似对角化的另一 个重要条件。最小多项式是用于描述 矩阵的最小多项式和特征向量关系的 方程。如果一个矩阵的最小多项式存 在重根,则该矩阵无法通过相似变换 对角化。
VS
最小多项式的计算方法是通过求解特 征值对应的特征方程组,得到特征向 量,然后根据特征向量和特征值的关 系计算最小多项式。如果最小多项式 存在重根,则矩阵无法对角化。
实例
考虑一个4阶矩阵,其特征值为$lambda_1 = -3$、 $lambda_2 = -1$、$lambda_3 = 2$和$lambda_4 = 4$,对应的特征向量分别为α₁、α₂、α₃和α₄。如果这四 个特征向量线性无关,则矩阵可相似对角化。
THANKS
感谢观看
反证法
总结词
通过假设矩阵不可相似对角化,然后推导出 矛盾,从而证明矩阵可相似对角化。
详细描述
反证法是一种常用的证明方法,通过假设矩 阵不可相似对角化,然后推导出一些矛盾的 情况,如行列式值为零或特征多项式无重根 等,从而证明矩阵可相似对角化。这种方法
逻辑严谨,但需要一定的数学基础。
归纳 法
要点一
状态空间控制设计
在状态空间控制设计中,通过矩阵相 似对角化可以将复杂的系统分解为若 干个简单子系统,有助于简化控制器 的设计过程。

3矩阵相似对角化

3矩阵相似对角化
1 2 P, ( p1 , p2 , , pn ) n 所以 P 1 AP , 即A与对角矩阵Λ相似.
定理 n阶矩阵A能与对角矩阵Λ相似 A有n阶线性无关的特征向量. 推论 如果n阶矩阵A有n个不同的特征值,则矩阵A 可相似对角化. 推论 若n阶矩阵A可相似对角化A的任 t i 重特征值
一、定义 定义 设A、B都是n阶矩阵,若有可逆矩阵P, 1 使得 P AP B , 则称B是A的相似矩阵,或者说矩阵 A与B相似. 记作: A∽B. 对A进行运算P 1 AP , 称为对A进行相似变换,
可逆矩阵P称为把A变成B的相似变换矩阵. 二、性质 (1) 反身性: A∽A; (2) 对称性: A∽B,则B∽A; (3) 传递性: A∽B,B∽C,则A∽C;
1
于是有 Api i pi ( i 1,2, , n), 因为P可逆, 故 pi 0( i 1,2 , n), 于是 p1 , p2 , , pn 是A的n个线性无 关的特征向量。
反之, A有n个线性无关的特征向量 p1 , p2 , , pn 若
即 Api i pi ( i 1,2, , n), 设 P ( p1 , p2 , , pn ), 则P 可逆,且 AP ( Ap1 , Ap2 , , Apn ) (1 p1 , 2 p2 ,, n pn )
2k
这若能寻得相似变换矩阵P使
P AP 称之为把方阵A对角化.
定理的推论说明,如果n阶矩阵A与对角矩阵Λ相 似, 则Λ的主对角线上的元素就是A的全部特征值. 那么,使得 P 1 AP 的矩阵P又是怎样构成的呢? 设存在P可逆, 使得 P 1 AP AP P 若 P p1 , p2 , , pn , 1 2 有 A p1 , p2 , , pn p1 , p2 , , pn 1 p1 , 2 p2 , , n pn n
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
别地,若 R F 是域,则最小多项式无重根是域 F 上的矩阵 A 可对角化的充要条件[1].但是,对有单位的
若 用 相 似 变 换 可 将 A M n ( R ) 化 为 对 角 矩 阵 , 则 称 其 可 对 角 化 . 即 U GL(n, R) 使 得 UAU 1 diag ( 1 , 2 , , n ) M n ( R ) .因此,若 A M n ( R ) 可对角化,则其特征多项式 p ( ) 可写为
山东农业大学学报(自然科学版),2015,46(4):625-627 Journal of Shandong Agricultural University (Natural Science Edition )
VOL.46 NO.4 2015 doi:10.3969/j.issn.1000-2324.2015.04.030
题,其中 , R 且 .在此基础上,给出了 A, B M n ( R ) 存在公共特征向量的条件.
2
判别定理
设 A M n ( R ) 且 rankA k 是幂等矩阵 . 众所周知 , 幂等矩阵的最小多项式为 m ( ) ( e )
交换环( 尤其是主理想环 R )上的矩阵而言 ,最小多项式无重根只是其可对角化的必要条件 ,而非充分 条件[2].除此之外,类比域上的矩阵可对角化条件 ,文献[3]证明了 A Mn (R) 可对角化 p ( ) 有 n 个 互异特征值 1 , 2 , , n ;文献 [4] 证明了 A M n ( R ) 可对角化 A 有对应特征值 1 , 2 , , n ( 不 必互异)的 n 个不同的特征向量 u1 , u2 , , un M 1 n ( R ) ,且它们构成 R - 模 M 1 n ( R ) 的一组基底 .然而, 因基特征向量 u1 , u 2 , , u n 的计算十分繁琐且无一般算法,故实际操作相当困难. 本文进一步研究 M n ( R ) 上具有二次最小多项式 m( ) ( )( ) 的矩阵可对角化的判定问
New Diagonalization Condition for Matrices in a Domain of Principal Ideal
DENG Yong
Department of Mathematics/Kashgar Teacher’s College, Kashgar 844006, China Abstract: The diagonalization of matrices has an important position in the matrix theory. In order to expand the results for diagonalization of matrices over fields, we discussed the diagonalization of matrices over a domain of principal ideals, and obtained the necessary and sufficient conditions of diagonalization of matrices over a domain of principal ideals with minimal polynomial m(λ)=(λ−α)(λ−β),α≠β. Further, on the basis of the obtained results, the conditions under which the matrices A and B have common eigenvectors if and only if their commutator [A, B] is singular matrix, was proved. Keywords: Domain of principal ideals; diagonalization; minimal polynomial; eigenvector; commutator
p() det(In A) ( 1 )k1 ( 2 )k2 ( r )kr 的形式.其中 i R 互不相同, ki , (i 1, 2, , r ) 是非负整 数.显然,若 AMn (R) 可对角化,则其最小多项式 m ( ) 无重根,即 m( ) ( 1 )( 2 )( r ) .特
1Leabharlann 研究现状为方便讨论 ,本文用 R 表示有单位 e 0 的主理想环 ; I n 表示 n n 阶单位矩阵 ; M n ( R ) 表示 R 上
nn 阶矩阵环; M1n ( R) 表示 R -模; GL(n, R) 表示 R 上阶可逆 n n 矩阵关于加法和乘法所构成的一般线 性群; p() 和 m() 分别表示矩阵 A 的特征多项式和最小多项式; [ A, B] AB BA表示矩阵 A, B的交换子.
主理想环上矩阵可对角化的新判据
邓 勇
喀什师范学院数学系, 新疆 喀什市 844006 摘 要: 矩阵的对角化问题在矩阵理论中占有重要地位.为将域上矩阵可对角化的结果进行推广,研究了主理想环上矩 阵的可对角化问题,获得了主理想环上一类具有最小多项式 m(λ)=(λ−α)(λ−β),α≠β的矩阵可对角化的充分必要条件.在此 基础上,进一步证明了具有二次最小多项式的两个可对角化矩阵 A,B 有公共特征向量,当且仅当它们的交换子[A,B]是奇 异矩阵. 关键词: 主理想环; 对角化; 最小多项式; 特征向量; 交换子 中图法分类号: O151.21; O157.3 文献标识码: A 文章编号: 1000-2324(2015)04-0625-03
相关文档
最新文档