线性变换可对角化的条件及对角化方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
邯郸学院本科毕业论文
题目线性变换“可对角化”的条件
及“对角化”方法
学生苏成杰
指导教师张素梅教授
年级2006 级
专业数学与应用数学
二级学院数学系
(系、部)
邯郸学院数学系
2010年5月
郑重声明
本人的毕业论文是在指导教师张素梅老师的指导下独立撰写完成的.如有剽窃、抄袭、造假等违反学术道德、学术规范和侵权的行为,本人愿意承担由此产生的各种后果,直至法律责任,并愿意通过网络接受公众的监督.特此郑重声明.
毕业论文作者(签名):
年月日
摘要通过从特征值、特征向量、特征子空间、不变子空间、最小多项式、特征多项式以及线性变换矩阵本身的结构特点等七个不同的角度去分析线性变换可对角化的条件,总结出了七个充要条件和四个充分条件.第二部分给出了利用特征向量将线性变换对角化的一般方法并赋予了典型例题加以具体说明,同时又就以上某些条件的等价关系进行了说明.
关键词线性变换对角化条件特征值特征向量
Linear transformation’s “diagonalizable”
conditions and“diagonalization” methods Su Chengjie Directed by Professor. ZhangSumei
Abstract According to the characteristic number, characteristic vector, subspace, invariant subspace, minimal polynomial, characteristic polynomial and the linear transformation matrix itself we get seven different sufficient conditions and four different necessary conditions. The second part of the text will show a common method to diagonalization the linear transformation with characteristic number and characteristic vector and also there will be an example to make it clear and then the construction of the above conditions are discussed on equivalence relation.
Key words Linear transformation Diagonalization Condition Characteristic number Characteristic vector
目录
摘要 (Ⅰ)
外文页 (Ⅱ)
1 引言 (1)
2 线性变换及其矩阵表示 (1)
2.1 线性变换的定义 (1)
2.2 线性变换矩阵的定义 (1)
3 数域P上的n维线性空间V上的线性变换σ可对角化的充要条件 (2)
4 数域P上的n维线性空间V上的线性变换σ可对角化的充分条件 (6)
5 复数域P上的n维线性空间V上的线性变换σ可对角化的充要条件 (8)
6 线性变换对角化方法介绍 (9)
7 对各条件之间的联系进行分析和总结 (11)
参考文献 (11)
致谢 (12)
线性变换“可对角化”的条件及“对角化”方法
1 引言
线性变换是线性空间中的重要研究内容之一,过去我们把对线性变换的研究转化为了对矩阵的研究,这样极大地丰富了线性变换的研究内容,线性变换的对角化问题就是其中一例.值得注意的是,并不是所有的线性变换都可以对角化,因此对线性变换可对角化的条件的研究是十分有价值的.本文从不同的角度分析了线性变换可对角化的条件并给出了相应的结论.
2 线性变换及其矩阵表示
2.1 线性变换的定义 定义2.1
296
]1[ 设V 是数域P 上的线性空间,若存在V 上的一个变换σ满足条件
(1))()()(βαβασσσ+=+ V ∈∀βα, (2)αασσk k =)( V P k ∈∀∈∀α, 则称σ为V 的一个线性变换.
2.2 线性变换矩阵的定义 定义2.2
324
]1[ 设n εεε,,,21Λ是数域P 上的n 维线性空间V 上的一组基,σ是V 中的线性变
换,基向量的像可以被基线性表出:
⎪⎪⎩⎪⎪⎨
⎧+++=+++=+++=.
,,22112222112212211111n nn n n n n
n n n a a a a a a a a a εεεεεεεεεεεεΛΛΛΛΛΛΛσσσ 用矩阵来表示就是
A εεεεεεεεε),,,(),,,(),,,(212121n n n ΛΛΛ==σσσσ
其中
⎪⎪⎪⎪
⎪⎭
⎫
⎝⎛=nn n n n n a a a
a a a
a a a Λ
M M M ΛΛ
2122221
11211A , 则称A 为线性变换σ在基n ε,,ε,εΛ21下的矩阵.
3 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件
命题3.1 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是V 中存在由σ的特征向量组成的一组基.
证明 必要性 设线性变换σ在基n εεε,,,21Λ下具有对角矩阵
⎪⎪⎪⎪⎪⎭
⎫
⎝
⎛=n λλλO
2
1A 即
⎪⎪⎪⎪⎪⎭
⎫
⎝
⎛=n n n λλλσO
ΛΛ2
12121),,,(),,,(εεεεεε 这就是说
n i i i i ,,2,1,Λ==εελσ.
因此n εεε,,,21Λ就是σ的n 个线性无关的特征向量.
充分性 如果V 中存在由σ的特征向量组成的一组基,显然在这组基下σ的矩阵是对角矩阵,即线性变换σ可以对角化.
命题 3.2 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是V 可以分解成
σ的n 个一维不变子空间的直和.
引理3.2.1
260
]2[ 如果ξ是数域P 上的线性空间V 上的线性变换σ的一个特征向量,则ξ生成的
子空间)(ξL 是σ的一维不变子空间.
引理3.2.2 设σ是数域P 上的n 维线性空间V 上的线性变换,如果W 是σ的一维不变子空间,则W 中任何一个非零向量都是σ的特征向量.
证明 设W 是σ的一维不变子空间,任取)(0αα≠∈W ,则α是W 的一组基.因为W 是σ的一维不变子空间所以W ∈ασ,从而αα0k =σ对某个P k ∈0成立,这表明α是σ的特征向量.
下面证明命题3.2
必要性 设σ可对角化,由命题3.1可知V 中存在由σ的特征向量组成的一组基n ααα,,,21Λ,因此
)()()(21n L L L V ααα⊕⊕⊕=Λ.
根据引理3.2.1有),,2,1)((n i L i Λ=α是σ的一维不变子空间.由此得线性空间V 可以分解成σ的n 个一维不变子空间的直和.
充分性 设V 可以分解成σ的n 个一维不变子空间n W W W ,,,21Λ的直和
n W W W V ⊕⊕⊕=Λ21
在),,2,1(n i W i Λ=中取一组基i ε,据引理3.2.2得i ε是σ的特征向量.由于和
n W W W ⊕⊕⊕Λ21
是直和,所以n εεε,,,21Λ是n W W W V ⊕⊕⊕=Λ21的一组基,即线性空间V 中存在由线性变换σ的特征向量组成的一组基,由命题3.1可知线性变换σ可以对角化.
命题3.3 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是σ的所有特征子空间的维数之和等于n .
引理3.3.1
251
]2[ n 维线性空间V 上的线性变换σ的属于不同特征值m λλλ,,,21Λ的特征向量
是线性无关的;线性变换σ的属于不同特征值m λλλ,,,21Λ的线性无关的特征向量组合在一起仍然线性无关.
下面证明命题3.3
必要性 设线性变换σ的所有不同特征值分别是m λλλ,,,21Λ,
),,2,1(m i V i Λ=λ是属于特征值),,2,1(m i i Λ=λ的特征子空间,因为线性变换σ可对角化,由命题3.1知σ有n 个线性无关的特征
向量,从而有
m V V V V λλλ⊕⊕⊕=Λ21.
所以
)dim ()dim ()dim ()dim ()dim (2121m m V V V V V V V λλλλλλ+++=⊕⊕⊕=ΛΛ.
其中)dim(V 表示线性空间V 的维数,下同.
从上面的等式可以看出,线性变换σ的所有特征子空间的维数之和等于线性空间V 的维数n . 充分性 设线性变换σ的所有特征子空间的维数之和等于线性空间V 的维数n ,即
∑===m
i n V V i
1
)dim()dim(λ
在m V V V λλλ,,,21Λ中各取一组基,把它们合起来供共有n 个向量.据引理3.3.1它们仍然线性无关,
从而它们构成线性空间V 的一组基.换句话说,线性空间V 中存在由线性变换σ的特征向量构成的一组基,由命题3.1知线性变换σ可以对角化.
命题3.4 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是线性变换σ在某一组基下的矩阵A 的最小多项式是P 上互素的一次因式的乘积.
引理3.4.1 设A 是一个准对角矩阵
⎪⎪⎭
⎫
⎝⎛=21
A A A 并设1A 的最小多项式为1g (x ),2A 的最小多项式为2g (x ),那么A 的最小多项式为1g (x )和
2g (x )的最小公倍式)](),([21x g x g .
证明 记)](),([)(21x g x g x g =,首先
0A A A =⎪⎪⎭⎫
⎝
⎛=)()()(21g g g 因此g(x )能被A 的最小多项式整除,其次,如果0A =)(h ,那么
0A A A =⎪⎪⎭⎫ ⎝
⎛=)()()(21h h h 所以0A 0A ==)(,)(21h h ,因而
)(|)(),(|)(21x h x g x h x g .
并由此得
)(|)(x h x g .
这样就证明了g(x )是A 的最小多项式.
引理3.4.2
86
]3[ 设n 维线性空间V 上的线性变换σ在某组基下的矩阵A 的最小多项式为)(x g ,
它可以分解成一次因式的乘积
s r s r r x x x x x x x g )()()()(2121---=Λ
则V 可以分解成不变子空间的直和
s V V V V ⊕⊕⊕=Λ21,
其中},)(|{V x V i r
i i ∈=-=ξ0ξE A ξ,s i ,,2,1Λ=.
下证命题3.4
根据引理3.4.1,条件的必要性是显然的,现在证明充分性.
根据矩阵和线性变换之间的对应关系,定义任意线性变换σ的最小多项式为其对应矩阵A 的最小多项式.设线性变换σ的最小多项式为)(x g ,由)(x g 是数域P 上互素的一次因式的乘积,我们有
∏=-=l
i i a x x g 1
)()(
由引理3.4.2可得
l V V V V ⊕⊕⊕=Λ21
其中},)(|{V a V i i ∈=-=ξ0ξE A ξ,这里E 表示单位矩阵.因此把l V V V ,,,21Λ各自的基合起来就是线性空间V 的基,而每个基向量都属于某个),,2,1(n i V i Λ=,因而是线性变换σ的特征向量.换句话说就是线性空间V 中存在由线性变换σ的特征向量构成的一组基,由命题3.1可得线性变换σ可对角化.
命题3.5 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是对于线性变换σ的每个特征值λ都有等式:k r n =--)(A E λ(其中k 是λ的重数,A 表示线性变换σ在某一组基下的矩阵,)(A E -λr 表示矩阵A E -λ的秩,下同).
证明 必要性 设λ是线性变换σ的任一特征值,且其重数为k ,由于σ可以对角化,所以属于特征值λ的线性无关的特征向量有k 个,从而齐次线性方程组
0X A E =-)(λ
的基础解系中含向量的个数为k .由参考文献[1]第142页定理8可知齐次线性方程组
0X A E =-)(λ
的基础解系中含向量的个数为
)(A E --λr n
所以有
k r n =--)(A E λ.
充分性 由于对线性变换σ的每个特征根λ有
k r n =--)(A E λ (k 是λ的重数),
所以齐次线性方程组
0X A E =-)(λ
的基础解系中含向量的个数为k ,即属于k 重特征值λ的线性无关的特征向量的个数为k ,从而线性变换σ共有n 个线性无关的特征向量,由命题3.1可知线性变换σ可以对角化.
由上面的证明过程可知,条件:对于线性变换σ的每个特征值λ都有k r n =--)(A E λ(k 是λ的重数)也可改为线性变换σ的每个特征值λ的重数等于齐次线性方程组
0X A E =-)(λ
的基础解系所含向量的个数.或改为如果令r λλλ,,,21Λ是σ的所有不同特征值,则有
n r n r i i =--∑=)]([1A E λ
.
或改为线性变换σ的每个特征值λ的特征子空间的维数等于λ的重数.
4 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充分条件
命题4.1 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充分条件是σ有n 个不同的特征值.
证明 由于属于不同特征值的特征向量是线性无关的,且线性变换σ有n 个不同的特征值,所以线性变换σ有n 个线性无关的特征向量,它们构成V 的一组基,由命题3.1可知线性变换σ可对角化.
命题4.2 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充分条件是σ在某组基下的矩阵A 的特征多项式在数域P 内有n 个单根.
证明 由于矩阵A 的特征多项式
||)(A E -=λλf
在数域P 上有n 个单根,从而线性变换σ有n 个不同的特征值,由命题4.1得线性变换σ可对角化.
命题4.3 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充分条件是σ在某组基下的矩阵A 为幂等矩阵)(2A A =.
引理4.3.1130]3[ 幂等矩阵的特征根只能是0或1.
下面证明命题4.3
设线性变换σ在某组基下矩阵A 为幂等矩阵,且r r =)(A ,由引理4.3.1知线性变换σ的特征值是0或1,所以矩阵A 相似于对角矩阵
⎪⎪⎪⎪⎪⎪⎪⎪⎭
⎫
⎝
⎛=00110O O
A 由于相似矩阵具有相同的秩,所以 )()(0A A r r =
)()(0A E A E -=-r r
又
n r r =+-)()(00A A E ,
所以
r
n r n r r -=-=+-)()()(A E A A E . 于是齐次线性方程组
0X A E =-)(
的基础解系所含向量的个数为
n )(A E --r =r r n n =--)(.
又因为r r =)(A ,故齐次线性方程组
0AX X A E =-=-)0(
的基础解系所含向量的个数为
r n r n -=-)(A .
于是线性变换σ共有n r n r =-+)(个线性无关的特征向量,它们构成V 的一组基,由命题3.1可得线性变换σ可对角化.
另外,如果线性变换σ在某一组基下的矩阵A 满足E A =2或)(2
P k k ∈=A A ,由以上的证明过程可知线性变σ同样可以对角化.
命题4.4 数域P 上的n 维线性空间V 上的线性变换σ可对角化的充分条件是线性变换σ在某组基下矩阵A 为下三角矩阵,且),,2,1,,(n j i j i a a jj ii Λ=≠≠(其中ii a 为主对角线上元素).
证明 因为A 是一个下三角矩阵,所以A 的特征多项式为
|λA E -|=∏=-n i ii a
1(λ),
又由于),,2,1,,(n j i j i a a jj ii Λ=≠≠,从而A 的特征多项式有n 个不同的根),,2,1(n i a ii Λ=,即线性变换σ有n 个不同的特征值,由命题4.1可得线性变换σ可对角化.
5 复数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件
命题5.1 复数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是σ在某组基下的矩阵A 的最小多项式无重根.
证明 由命题3.4可知σ可对角化的等价条件是σ在某组基下的矩阵A 的最小多项式是P 上互素的一次因式的乘积,而当P 是复数域时这个条件就等价于A 的最小多项式无重根,从而命题成立.
另外不难证明如果A 的特征多项式无重根,则线性变换σ可对角化.
命题5.2 复数域P 上的n 维线性空间V 上的线性变换σ可对角化的充要条件是对σ的每个特征值i λ均有
m i r r i i ,,2,1,)()(2Λ=-=-A E A E λλ.
证明 必要性 因线性变换σ可对角化,故A 的最小多项式)(λf 无重根,即A 的任一特征根i λ只能是)(λf 的单根.于是)(λf 与(i λλ-2
)的最大公因式是i λλ-,由最大公因式的性质知,有多项式][)(),(λλλP v u ∈使 E
A E A A A A i i i
i v f u v f u λλλλλλλλλ-=-+-=-+22))(()()())(()()(.
因 0A =)(f ,故 E A E A A i i v λλ-=-2))((.
所以
r (E A i λ-)≤2)(E A i r λ-
但
2)(E A i r λ-≤)(E A i r λ-,
故有
)(E A i r λ-=m i r i ,,2,1,)(2Λ=-E A λ.
充分性 由命题5.1知,只需证明A 的最小多项式无重根,用反证法.
假设线性变换σ的某个特征根i λ是最小多项式)(λf 的重根,可设
)()()(2λλλλg f i -=,
因多项式)()(λλλg i -的次数低于)(λf 的次数,故
0A E A ≠-)()(g i λ,
但
0A A E A ==-)()()(2f g i λ
所以)(A g 中必存在非零的列向量0X 使
0X E A 0
X E A =-≠-020)()(i i λλ.
这就是说,齐次线性方程组0X E A =-)(i λ与0X E A =-2)(i λ有不同解,故
2)()(E A E A i i r r λλ-≠-.
这与
2)()(E A E A i i r r λλ-=-
矛盾.故)(λf 无重根,从而线性变换σ可对角化.
6 线性变换对角化方法介绍
命题6.162]4[ 设数域P 上的n 维线性空间V 中的线性变换σ有m 个不同的特征值,它们分别为)(,,,21n m m ≤λλλΛ,且其对应有n 个线性无关的特征向量为n ααα,,,21Λ,A 为线性变换σ的矩阵.如果令
),,,(21n αααP Λ=
则有
⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛=-n λλλO 211AP P . 上述命题就是将一个线性变换的矩阵变成一个其主对角线上全为其特征值的对角矩阵的具体方法.
例298]6[ 数域P 上的n 维线性空间V 中的线性变换σ在某组基下的矩阵为
⎪⎪⎪⎭
⎫ ⎝⎛----=533242111A
试将其对角化.
解 矩阵A 的特征多项式
)6()2(5
33
242
111
||)(2--=-----=-=λλλλλλλA E f 令 0)6()2()(2=--=λλλf
得
6,2321===λλλ.
所以线性变换σ的特征值为6,2321===λλλ.
当2=λ时,由,)2(0X A E =-求得属于特征值2=λ的线性无关的特征向量为
T T )1,0,1(,)0,1,1(21=-=αα.
当6=λ时,由,)6(0X A E =-求得属于特征值6=λ的线性无关的特征向量为
T )3,2,1(3-=α.
再令
⎪⎪⎪⎭
⎫ ⎝⎛--==310201111),,(321αααP
可求得
⎪⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛-----=-4141414143432121211P 则有
⎪⎪⎪⎭
⎫ ⎝⎛=-6221AP P .
至此已将线性变换对角化,其对角化的矩阵为
⎪⎪⎪⎭
⎫ ⎝⎛=6220A .
从上面的解题过程可以看出,线性变换对角化的过程实际上就是求解特征值与特征向量的过程.换句话说就是求得一组基,使线性变换在这组基下的矩阵为对角矩阵.显然这组基中的每一个向量都是线性变换的特征向量,而对角矩阵主对角线上元素都是其对应特征值.从而不难理解线性变换的矩阵对角化后并没有改变线性变换本身,它只是在另一组基下的矩阵.
7 对各条件之间的联系进行分析和总结
通过对以上各种条件进行分析和总结可以看出,线性变换可对角化的条件虽然有很多,但从本质上说它们其实是一致的.例如,线性变换σ可对角化的充要条件“σ有n 个线性无关的特征向量”与“线性空间V 上的线性变换σ的所有特征子空间的维数之和等于n ”其实就是同一问题的不同表述:有“线性变换σ有n 个线性无关的特征向量”就必然有“线性变换σ的所有特征子空间的维数之和等于n ”.反过来,如果“线性变换σ的所有特征子空间的维数之和等于n ”则必有“σ有n 个线性无关的特征向量”.所以,抓住问题的本质有助于真正理解和掌握线性变换可对角化的条件及对角化方法.
参考文献:
[1] 王萼芳 ,石生明.高等代数[M].北京:高等教育出版社,2005
[2] 丘维声.高等代数[M].北京:高等教育出版社,2001
[3] 钱芳华. 高等代数方法选讲[M].桂林:广西师范大学出版社,1991
[4] 程云鹏 .矩阵论[M].西安:西北工业大学出版社,2001
[5] 钱吉林.高等代数题解精粹[M].北京:中央民族大学出版社,2005
[6] 唐忠明.高等代数[M].南京:南京大学出版社,2000
[7] Y.Q.Guo,K.P.Shum and G.T.Xu.Linear Algebra[M].Beijing:Science Press ,2008
致谢
在此篇毕业论文划上句号之际,我郑重地向我的指导教师张素梅老师表示我最诚挚的感谢!衷心地感谢她的关心、指导和教诲.在张老师的精心引导下,几经修改和完善我终于完成了毕业论文,从她身上我获得了太多的文化和知识,更汲取了诸多纯朴而伟大的高尚品德.
我在撰写毕业论文期间的工作自始至终都是在张老师的全面、具体指导下进行的.老师渊博的学识、民主而严谨的作风,使我受益匪浅.张老师谦逊的学术作风和高尚的人格品德将永远激励我前行!
最后还要感谢我的同学和朋友四年来对我的关心和帮助.。