二_三阶可逆矩阵可以相似对角化的几何条件_谢伟献
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
引理 4 过仿射变换 f 的不动点 , 且方向为其特征向量的直线为 f 的不变直线 .
证 设点 O 为仿射变换 f 的不动点 , 直线 l 过 O , 且方向为 f 的特征向量 u .任取 P ∈ l , P ≠O , 则 f (P)∈ f (l), 且OP ∥u .此时 O f (P)=f (OP)∥f (u)=λu ∥u ∥OP , 因 此 O , P , f (P )三 点共 线 ,
或 x′=a11 x +a12 y +a13 z +a1 , y′=a21 x +a22 y +a23 z +a2 , z′=a31 x +a32 y +a33 z +a3 ,
其中矩阵 A =(aij )为可逆矩阵 , 则称 f 为平面或空间的一个仿射变换 .在[ 1] 中称 A 为 f 在该仿射坐标 系中的变换矩阵 .
引理 7[ 3] 一个矩阵的任一特征值的几何重数不超过其代数重数 .
定理 2 仿射变换 f 恰有三条相交于一点O 的不共面的不变直线当且仅当 f 有三个均不为 1 的不
同特征值 .
证 必要性 .设 f 恰有三条相交于一点 O 的不共面的不变直线 l1 , l2 , l3 , 则由引理 1 可知 f 有三个
[ 关键词] 仿射变换 ;不变直线 ;矩阵的相似对角化 [ 中图分类号] O 151 .2 , O 182.2 [ 文献标识码] C [ 文章编号] 1672-1454(2009)03-0177-04
定义 1[ 2] 平面或空间的一个点变换 , 如果在一个平面或空间仿射坐标系中的公式为 x′=a11 x +a12 y +a1 , y′=a21 x +a22 y +a2 ,
不共面的特征向量 u1 , u2 , u3 , 它们分别平行于 l1 , l2 , l3 , .设其对应的特征值分别为 λ1 , λ2 , λ3 .下证 λ1 ,
Βιβλιοθήκη Baidu
λ2 , λ3 互不相同 , 且均不为 1 .由引理 3 , O 是 f 的不动点 .若 λi =λj =λ(i , j =1 , 2 , 3 , 且 i ≠j), 则
f 有两个不共线的特征向量 , 且对应两个特征值 .若它们对应的特征值相同 , 由引理 5 可知平面上任一 非零向量都是 f 的特征向量 , 此时再根据引理 4 , 平面上过不动点的每一条直线都是 f 的不变直线 , 这
与题设矛盾 .因而 , f 的两个不共线特征向量对应不同的特征值 .又 f 恰有两条不变直线 , 因此 f 的不动
不同的特征值 , 所以 u 对应于特征值 λ1 , λ2 中其中一个 , 不妨设它对应于特征值 λ1 , 则平面上两不共线
向量 u , u1 对应相同的特征值 λ1 , 由引理 5 可知 , 平面上任一非零向量都是 f 的特征向量 .于是根据引理
6 , f 是位似变换 , 但位似变换在任何仿射坐标系的变换矩阵都是数量矩阵(见[ 1] 中习题 4 .3 第 1 题),
若某个 λi =1 (i =1 , 2 , 3), 则 f 必有无穷多个不动点构成不动直线 l 或不动平面 π, 此时过 l 或 π上
不同于 O 的点 P , 方向为 u1 , u2 , u3 中任一向量的直线仍为 f 的不变直线 , 且不同于 l1 , l2 , l3 , 矛盾 .
充分性 .设 f 有三个均不为 1 的不同特征值 , 根据引理 2 , f 有唯一的不动点 O .由代数知识可知 f
第 25 卷第 3 期 2009 年 6 月
大 学 数 学
COL L EGE M A T H EM A T ICS
V ol .25 , №.3 Jun .2009
二 、三阶可逆矩阵可以相似对角化的几何条件
谢伟献
(北京服装学院 基础课部 , 北京 100029)
[ 摘 要] 从几何的角度给出了特征值不含 1 的二 、三阶可逆矩阵可以相似对角化的一个充分条件和二 、 三阶可逆矩阵可以相似对角化的一个充分必要条件 .
即 f (P)在直线 OP =l 上 .这就说明 l 是仿射变换 f 的不变直线 .
引理 5 如果平面仿射变换 f 的两个不共线的特征向量对应两个相同的特征值 , 则平面上任一非 零向量都是 f 的特征向量 .
证 设平面上两个不共线的向量 u1 , u2 都是 f 的对应于特征值 λ的特 征向量 , u 是平面上任一 非零向量 .任取平 面上 一 点 O , 建立 仿射 坐 标系 I :[ O ;u1 , u2] , 设 u 在 I 中 的坐 标为 (x , y ), 则有 u =xu1 +yu2 .根据仿射变换决定的向量变换的线性性质 , 有
f (u)=f (xu1 +yu2 )=x f (u1 )+y f (u2)=xλu1 +y λu2 =λ(xu1 +yu2)=λu . 从而 u 是 f 的特征向量 .
定义 4[ 1] 取定平面上一点 O 和一个不为零的实数 k , 规定变换 f 为 :对于平面的任一点 P , 令
f (P)是由等式O f (P)=k OP 决定的点 , 称 f 是一个位似变换 , O 称为它的位似中心 , k 为位似系数 .
而且向量PQ是 f 的特征向量 , 从而 f (P)f (Q)∥P Q , 因此O f (Q)=k OQ .所以 f 是位似变换 . 定理 1 平面仿射变换 f 恰有两条相交的不变直线当且仅当 f 有两个均不为 1 的不同特征值 .
证 必要性 .设 f 恰有两条相交的不变直线 , 则由引理 3 , 两直线的交点为 f 的不动点 , 根据引理 1 ,
对应的特征值不为 1 , 根据引理 1 , l 上有 f 的不动点 , 它不同于 O , 与 f 有唯一不动点矛盾 .若 l 与 l 1 , l2 ,
点唯一 .这样由引理 2 , f 的特征值不能为 1 .即 f 有两个不为 1 的不同特征值 . 充分性 .设 f 有两个均不为 1 的不同特征值 λ1 , λ2 .则 f 有两个线性无关的特征向量 u1 , u2 , 它们分
别对应特征值 λ1 , λ2 .又根据引理 2 , f 有唯一的不动点 O , 于是由引理 4 可知 , 过点 O 分别平行于 u1 , u2 的直线 l1 , l2 为 f 的相交于点 O 的不变直线 .
有三个线性无关的特征向量 u1 , u2 , u3 , 它们分别对应特征值 λ1 , λ2 , λ3 , 根据引理 4 , 过点 O 分别平行于
u1 , u2 , u3 的直线 l1 , l2 , l3 为 f 的相交于点 O 的不变直线 .
假设 f 还有不同于 l 1 , l2 , l3 的不变直线 l .若 l 与 l 1 , l2 , l3 都不相交 , 因为平行于 l 的 f 的特征向量
[ 收稿日期] 2006-11-14 ; [ 修改日期] 2007-01-31 [ 基金项目] 北京服装学院科研专项经费(2006A-32)
17 8
大 学 数 学 第 25 卷
x′
x
a1
y′ =A y + a2 ,
z′
z
a3
其中 A 为三阶可逆矩阵 , 则(x0 , y0 , z0 )T 是 f 的唯一不动点当且仅当关于 x , y , z 的方程组
x
x
a1
y =A y + a2
有唯一解(x0 , y0 , z0)T , 即方程组
z
z
a3
x
a1
(E -A) y = a2
z
a3
有唯一解(x 0 , y 0 , z0 )T , 其中 E 为三阶 单位矩阵 , 这等 价于系数 行列式 E -A ≠0 , 即 1 不是 A 的
特征值 .
引理 3 仿射变换 f 的两条相交不变直线的交点必为 f 的不动点 .
引理 6 如果一个仿射变换 f 有唯一不动点 , 且每个非零向量都是它的特征向量 , 则 f 必是位似 变换 .
证 设 f 有唯一不动点 O , 且每个非零向量都是它的特征向量 .根据引理 4 , 过 O 的每一条直线是
f 的不变直线 .在平面上任意取定一点 P ≠O , 则直线 OP 为 f 的不变直线 , 于是 f (P)仍在直线 OP 上 . 设O f (P)=k OP , 下证对于平面上任一点 Q ≠P , O f (Q)=k OQ .事实上 , 显然有 O , Q , f (Q)三点共线 ,
定义 2[ 1] 设 f 是一个仿射变换 .如果点 P 使得 f (P)=P , 称 P 是 f 的一个不动点 .如果非零向量 u 与 f (u)平行 , 则称 u 为 f 的一个特征向量 ;此时有唯一实数 λ, 使得 f (u)=λu , 称 λ为 u 的特征值 .
定义 3[ 1] 对于一个仿射变换 f , 如果直线 l 满足 f (l)=l , 称 l 为 f 的不变直线 . 引理 1[ 1] 若 l 是仿射变换 f 的一条不变直线 , 则平行于 l 的向量都是 f 的特征向量 , 且对应的特 征值 λ相同 ;进一步地 , 若 λ≠1 , 则 l 上有 f 的不动点 . 证 设 u ∥l .由仿射变换的性质可知 , f (u)∥f (l)=l ∥u .因此 u 是 f 的特征向量 . 设两个不同的非零向量 u1 ∥l , u2 ∥l , 且它们分别对应于特征值 λ1 , λ2 .不妨设 u2 =ku1 , 则 k ≠0 .因 为 f (u2 )=λ2 u2 =λ2 ku1 , f (ku1 )=k f (u1 )=kλu1 , 于是 λ1 ku1 =kλ2 u1 , 即 k(λ2 -λ1 )u1 =0 , 从而由 k ≠0 , u1 ≠0 可知 , λ1 =λ2 . 进一步地 , 设平行于 l 的向量对应的特征值 λ≠1 .任取 l 上一点 P , 不妨设 P 不是 f 的不动点 , 则 f (P)≠P 也在 l 上 .令 Q 是使得PQ =1 1-λP f (P)的点 , 则 Q 在 l 上 , 下证 Q 就是 l 上 f 的不动点 .事实 上 , 显 然 有 PQ ∥l , 从 而 是 f 的 对 应 特 征 值 λ的 特 征 向 量 , 于 是 P f (Q)=P f (P)+ f (P)f (Q) =P f (P)+λP Q =P f (P)+1 -λλP f (P)=1 1-λP f (P)=P Q .因此 f (Q)=Q , 即 Q 是 f 的不动点 . 引理 2 1 不是仿射变换 f 的特征值当且仅当 f 有唯一不动点 . 证 只证空间仿射变换的情形 , 对于平面仿射变换可类似证明 .设空间仿射变换 f 在某仿射坐标 系的公式为
从而有两个相同的特征值 , 这与题设矛盾 .因此 f 只有两条相交于点 O 的不变直线 l 1 , l2 . 定义 5[ 3] 设 λ0 是 n 阶方阵 A 的 r 重特征值 , 数 r 称为特征值 λ0 的代数重数 , 对应于特征值 λ0 的
线性无关的特征向量的个数称为特征值 λ0 的几何重数 .
f (ui -uj)=f (ui )-f (uj )=λiui -λju j =λ(ui -uj ),
从而 ui -uj 也是 f 的特征向量 .此时过不动点 O , 且方向为 ui -uj 的直线为 f 的不变直线 , 且与 l1 , l2 ,
l3 均不相同 , 与题设矛盾 .因此 λ1 , λ2 , λ3 互不相同 .
证 设 l1 , l2 为仿射变换 f 的两条不变直线 , 交点为 P , 则 f (l1)=l1 , f (l2 )=l2 .f (P)既在 f (l1 )上 又在 f (l2 )上 , 从而既在 l1 上 , 又在 l2 上 .即 f (P)恰为 l1 与 l2 的交点 P , 故 P 为 f 的不动点 .
若 f 还有不同于 l 1 , l2 的不变直线 l , 则 l 必与 l 1 , l2 中其中一条相交 , 其交点应为 f 的唯一不动点
第 3 期 谢伟献 :二 、三阶可逆矩阵可以相似对角化的几何条件
179
O .现设非零向量 u ∥l , 由引理 1 可知 , u 是 f 的特征向量 .因为平面仿射变换的特征向量至多对应两个
证 设点 O 为仿射变换 f 的不动点 , 直线 l 过 O , 且方向为 f 的特征向量 u .任取 P ∈ l , P ≠O , 则 f (P)∈ f (l), 且OP ∥u .此时 O f (P)=f (OP)∥f (u)=λu ∥u ∥OP , 因 此 O , P , f (P )三 点共 线 ,
或 x′=a11 x +a12 y +a13 z +a1 , y′=a21 x +a22 y +a23 z +a2 , z′=a31 x +a32 y +a33 z +a3 ,
其中矩阵 A =(aij )为可逆矩阵 , 则称 f 为平面或空间的一个仿射变换 .在[ 1] 中称 A 为 f 在该仿射坐标 系中的变换矩阵 .
引理 7[ 3] 一个矩阵的任一特征值的几何重数不超过其代数重数 .
定理 2 仿射变换 f 恰有三条相交于一点O 的不共面的不变直线当且仅当 f 有三个均不为 1 的不
同特征值 .
证 必要性 .设 f 恰有三条相交于一点 O 的不共面的不变直线 l1 , l2 , l3 , 则由引理 1 可知 f 有三个
[ 关键词] 仿射变换 ;不变直线 ;矩阵的相似对角化 [ 中图分类号] O 151 .2 , O 182.2 [ 文献标识码] C [ 文章编号] 1672-1454(2009)03-0177-04
定义 1[ 2] 平面或空间的一个点变换 , 如果在一个平面或空间仿射坐标系中的公式为 x′=a11 x +a12 y +a1 , y′=a21 x +a22 y +a2 ,
不共面的特征向量 u1 , u2 , u3 , 它们分别平行于 l1 , l2 , l3 , .设其对应的特征值分别为 λ1 , λ2 , λ3 .下证 λ1 ,
Βιβλιοθήκη Baidu
λ2 , λ3 互不相同 , 且均不为 1 .由引理 3 , O 是 f 的不动点 .若 λi =λj =λ(i , j =1 , 2 , 3 , 且 i ≠j), 则
f 有两个不共线的特征向量 , 且对应两个特征值 .若它们对应的特征值相同 , 由引理 5 可知平面上任一 非零向量都是 f 的特征向量 , 此时再根据引理 4 , 平面上过不动点的每一条直线都是 f 的不变直线 , 这
与题设矛盾 .因而 , f 的两个不共线特征向量对应不同的特征值 .又 f 恰有两条不变直线 , 因此 f 的不动
不同的特征值 , 所以 u 对应于特征值 λ1 , λ2 中其中一个 , 不妨设它对应于特征值 λ1 , 则平面上两不共线
向量 u , u1 对应相同的特征值 λ1 , 由引理 5 可知 , 平面上任一非零向量都是 f 的特征向量 .于是根据引理
6 , f 是位似变换 , 但位似变换在任何仿射坐标系的变换矩阵都是数量矩阵(见[ 1] 中习题 4 .3 第 1 题),
若某个 λi =1 (i =1 , 2 , 3), 则 f 必有无穷多个不动点构成不动直线 l 或不动平面 π, 此时过 l 或 π上
不同于 O 的点 P , 方向为 u1 , u2 , u3 中任一向量的直线仍为 f 的不变直线 , 且不同于 l1 , l2 , l3 , 矛盾 .
充分性 .设 f 有三个均不为 1 的不同特征值 , 根据引理 2 , f 有唯一的不动点 O .由代数知识可知 f
第 25 卷第 3 期 2009 年 6 月
大 学 数 学
COL L EGE M A T H EM A T ICS
V ol .25 , №.3 Jun .2009
二 、三阶可逆矩阵可以相似对角化的几何条件
谢伟献
(北京服装学院 基础课部 , 北京 100029)
[ 摘 要] 从几何的角度给出了特征值不含 1 的二 、三阶可逆矩阵可以相似对角化的一个充分条件和二 、 三阶可逆矩阵可以相似对角化的一个充分必要条件 .
即 f (P)在直线 OP =l 上 .这就说明 l 是仿射变换 f 的不变直线 .
引理 5 如果平面仿射变换 f 的两个不共线的特征向量对应两个相同的特征值 , 则平面上任一非 零向量都是 f 的特征向量 .
证 设平面上两个不共线的向量 u1 , u2 都是 f 的对应于特征值 λ的特 征向量 , u 是平面上任一 非零向量 .任取平 面上 一 点 O , 建立 仿射 坐 标系 I :[ O ;u1 , u2] , 设 u 在 I 中 的坐 标为 (x , y ), 则有 u =xu1 +yu2 .根据仿射变换决定的向量变换的线性性质 , 有
f (u)=f (xu1 +yu2 )=x f (u1 )+y f (u2)=xλu1 +y λu2 =λ(xu1 +yu2)=λu . 从而 u 是 f 的特征向量 .
定义 4[ 1] 取定平面上一点 O 和一个不为零的实数 k , 规定变换 f 为 :对于平面的任一点 P , 令
f (P)是由等式O f (P)=k OP 决定的点 , 称 f 是一个位似变换 , O 称为它的位似中心 , k 为位似系数 .
而且向量PQ是 f 的特征向量 , 从而 f (P)f (Q)∥P Q , 因此O f (Q)=k OQ .所以 f 是位似变换 . 定理 1 平面仿射变换 f 恰有两条相交的不变直线当且仅当 f 有两个均不为 1 的不同特征值 .
证 必要性 .设 f 恰有两条相交的不变直线 , 则由引理 3 , 两直线的交点为 f 的不动点 , 根据引理 1 ,
对应的特征值不为 1 , 根据引理 1 , l 上有 f 的不动点 , 它不同于 O , 与 f 有唯一不动点矛盾 .若 l 与 l 1 , l2 ,
点唯一 .这样由引理 2 , f 的特征值不能为 1 .即 f 有两个不为 1 的不同特征值 . 充分性 .设 f 有两个均不为 1 的不同特征值 λ1 , λ2 .则 f 有两个线性无关的特征向量 u1 , u2 , 它们分
别对应特征值 λ1 , λ2 .又根据引理 2 , f 有唯一的不动点 O , 于是由引理 4 可知 , 过点 O 分别平行于 u1 , u2 的直线 l1 , l2 为 f 的相交于点 O 的不变直线 .
有三个线性无关的特征向量 u1 , u2 , u3 , 它们分别对应特征值 λ1 , λ2 , λ3 , 根据引理 4 , 过点 O 分别平行于
u1 , u2 , u3 的直线 l1 , l2 , l3 为 f 的相交于点 O 的不变直线 .
假设 f 还有不同于 l 1 , l2 , l3 的不变直线 l .若 l 与 l 1 , l2 , l3 都不相交 , 因为平行于 l 的 f 的特征向量
[ 收稿日期] 2006-11-14 ; [ 修改日期] 2007-01-31 [ 基金项目] 北京服装学院科研专项经费(2006A-32)
17 8
大 学 数 学 第 25 卷
x′
x
a1
y′ =A y + a2 ,
z′
z
a3
其中 A 为三阶可逆矩阵 , 则(x0 , y0 , z0 )T 是 f 的唯一不动点当且仅当关于 x , y , z 的方程组
x
x
a1
y =A y + a2
有唯一解(x0 , y0 , z0)T , 即方程组
z
z
a3
x
a1
(E -A) y = a2
z
a3
有唯一解(x 0 , y 0 , z0 )T , 其中 E 为三阶 单位矩阵 , 这等 价于系数 行列式 E -A ≠0 , 即 1 不是 A 的
特征值 .
引理 3 仿射变换 f 的两条相交不变直线的交点必为 f 的不动点 .
引理 6 如果一个仿射变换 f 有唯一不动点 , 且每个非零向量都是它的特征向量 , 则 f 必是位似 变换 .
证 设 f 有唯一不动点 O , 且每个非零向量都是它的特征向量 .根据引理 4 , 过 O 的每一条直线是
f 的不变直线 .在平面上任意取定一点 P ≠O , 则直线 OP 为 f 的不变直线 , 于是 f (P)仍在直线 OP 上 . 设O f (P)=k OP , 下证对于平面上任一点 Q ≠P , O f (Q)=k OQ .事实上 , 显然有 O , Q , f (Q)三点共线 ,
定义 2[ 1] 设 f 是一个仿射变换 .如果点 P 使得 f (P)=P , 称 P 是 f 的一个不动点 .如果非零向量 u 与 f (u)平行 , 则称 u 为 f 的一个特征向量 ;此时有唯一实数 λ, 使得 f (u)=λu , 称 λ为 u 的特征值 .
定义 3[ 1] 对于一个仿射变换 f , 如果直线 l 满足 f (l)=l , 称 l 为 f 的不变直线 . 引理 1[ 1] 若 l 是仿射变换 f 的一条不变直线 , 则平行于 l 的向量都是 f 的特征向量 , 且对应的特 征值 λ相同 ;进一步地 , 若 λ≠1 , 则 l 上有 f 的不动点 . 证 设 u ∥l .由仿射变换的性质可知 , f (u)∥f (l)=l ∥u .因此 u 是 f 的特征向量 . 设两个不同的非零向量 u1 ∥l , u2 ∥l , 且它们分别对应于特征值 λ1 , λ2 .不妨设 u2 =ku1 , 则 k ≠0 .因 为 f (u2 )=λ2 u2 =λ2 ku1 , f (ku1 )=k f (u1 )=kλu1 , 于是 λ1 ku1 =kλ2 u1 , 即 k(λ2 -λ1 )u1 =0 , 从而由 k ≠0 , u1 ≠0 可知 , λ1 =λ2 . 进一步地 , 设平行于 l 的向量对应的特征值 λ≠1 .任取 l 上一点 P , 不妨设 P 不是 f 的不动点 , 则 f (P)≠P 也在 l 上 .令 Q 是使得PQ =1 1-λP f (P)的点 , 则 Q 在 l 上 , 下证 Q 就是 l 上 f 的不动点 .事实 上 , 显 然 有 PQ ∥l , 从 而 是 f 的 对 应 特 征 值 λ的 特 征 向 量 , 于 是 P f (Q)=P f (P)+ f (P)f (Q) =P f (P)+λP Q =P f (P)+1 -λλP f (P)=1 1-λP f (P)=P Q .因此 f (Q)=Q , 即 Q 是 f 的不动点 . 引理 2 1 不是仿射变换 f 的特征值当且仅当 f 有唯一不动点 . 证 只证空间仿射变换的情形 , 对于平面仿射变换可类似证明 .设空间仿射变换 f 在某仿射坐标 系的公式为
从而有两个相同的特征值 , 这与题设矛盾 .因此 f 只有两条相交于点 O 的不变直线 l 1 , l2 . 定义 5[ 3] 设 λ0 是 n 阶方阵 A 的 r 重特征值 , 数 r 称为特征值 λ0 的代数重数 , 对应于特征值 λ0 的
线性无关的特征向量的个数称为特征值 λ0 的几何重数 .
f (ui -uj)=f (ui )-f (uj )=λiui -λju j =λ(ui -uj ),
从而 ui -uj 也是 f 的特征向量 .此时过不动点 O , 且方向为 ui -uj 的直线为 f 的不变直线 , 且与 l1 , l2 ,
l3 均不相同 , 与题设矛盾 .因此 λ1 , λ2 , λ3 互不相同 .
证 设 l1 , l2 为仿射变换 f 的两条不变直线 , 交点为 P , 则 f (l1)=l1 , f (l2 )=l2 .f (P)既在 f (l1 )上 又在 f (l2 )上 , 从而既在 l1 上 , 又在 l2 上 .即 f (P)恰为 l1 与 l2 的交点 P , 故 P 为 f 的不动点 .
若 f 还有不同于 l 1 , l2 的不变直线 l , 则 l 必与 l 1 , l2 中其中一条相交 , 其交点应为 f 的唯一不动点
第 3 期 谢伟献 :二 、三阶可逆矩阵可以相似对角化的几何条件
179
O .现设非零向量 u ∥l , 由引理 1 可知 , u 是 f 的特征向量 .因为平面仿射变换的特征向量至多对应两个