线性代数之线性变换的解释

合集下载

第6章线性变换和特征值

第6章线性变换和特征值

第6章线性变换和特征值线性变换是线性代数中的重要概念,它是指一个向量空间V到另一个向量空间W之间的映射,满足线性性质。

线性变换在实际应用中有着广泛的应用,特别是在计算机图形学、信号处理、物理学等领域中。

在进行线性变换时,我们通常会对向量进行一系列的操作,如旋转、缩放、投影等。

这些操作可以通过矩阵来表示,因为矩阵可以将一些向量操作统一起来,从而方便计算。

线性变换可以用一个矩阵A表示,对于输入向量x,其变换结果y=Ax。

线性变换的一个重要性质是保持向量的线性组合。

即对于任意的向量x1, x2和标量a,b,有T(ax1 + bx2) = aT(x1) + bT(x2)。

这一性质在实际应用中非常有用,它保证了线性变换的结果仍然是向量空间中的向量。

在线性代数中,我们研究的是向量空间的特征,即向量空间中的一些特殊向量。

对于一个线性变换T,其特征向量是满足T(v)=λv的非零向量v,其中λ是一个标量,称为特征值。

特征向量和特征值可以用来描述线性变换对向量的“拉伸”和“旋转”效果。

特征值和特征向量的计算是线性代数中的关键问题。

一般来说,我们可以通过求解线性变换对应矩阵的特征方程来求解特征值和特征向量。

特征方程是一个关于特征值λ的方程,其形式为det(A - λI) = 0,其中A是线性变换对应的矩阵,I是单位矩阵。

特征值和特征向量在实际应用中有着广泛的应用。

例如,在计算机图形学中,特征值和特征向量可以用来描述3D模型的形状变化。

在信号处理中,特征值和特征向量可以用来解决滤波和降噪问题。

除了特征值和特征向量,线性变换还有一些重要的性质。

例如,对于矩阵为A的线性变换T和标量c,有T(cA)=cT(A),称为线性变换的齐次性质。

此外,线性变换的核是指所有使得T(v)=0的向量v的集合,而像是指线性变换T的所有可能输出向量的集合。

总结起来,线性变换是线性代数中的重要概念,它可以用矩阵来表示,并且具有许多重要的性质。

特征值和特征向量是线性变换的重要度量指标,可以用来描述线性变换的效果。

第七章线性变换总结篇(高等代数)

第七章线性变换总结篇(高等代数)

第 7章 线性变换7.1知识点归纳与要点解析一.线性变换的概念与判别 1.线性变换的定义数域P 上的线性空间V 的一个变换σ称为线性变换,如果对V 中任意的元素,αβ和数域P 中的任意数k ,都有:()()()σαβσασβ+=+,()()k k σασα=。

注:V 的线性变换就是其保持向量的加法与数量乘法的变换。

2.线性变换的判别设σ为数域P 上线性空间V 的一个变换,那么:σ为V 的线性变换⇔()()()k l k l ,,V ,k,l P σαβσασβαβ+=+∀∈∀∈ 3.线性变换的性质设V 是数域P 上的线性空间,σ为V 的线性变换,12s ,,,,V αααα∀∈。

性质1. ()()00,σσαα==-; 性质2. 若12s ,,,ααα线性相关,那么()()()12s ,,,σασασα也线性相关。

性质3. 设线性变换σ为单射,如果12s ,,,ααα线性无关,那么()()()12s ,,,σασασα也线性无关。

注:设V 是数域P 上的线性空间,12,,,m βββ,12,,,s γγγ是V 中的两个向量组,如果:11111221221122221122s ss s m m m ms sc c c c c c c c c βγγγβγγγβγγγ=+++=+++=+++记:()()1121112222121212,,,,,,m m m s s s ms c c c c c c c c c βββγγγ⎛⎫ ⎪ ⎪= ⎪⎪⎝⎭于是,若()dim V n =,12,,,n ααα是V 的一组基,σ是V 的线性变换, 12,,,m βββ是V 中任意一组向量,如果:()()()11111221221122221122n n n n m m m mn nb b b b b b b b b σβααασβααασβααα=+++=+++=+++记:()()()()()1212,,,,m m σβββσβσβσβ=那么:()()1121112222121212,,,,,,m m m n n n mn b b c b b c b b c σβββααα⎛⎫⎪ ⎪= ⎪⎪⎝⎭设112111222212m m n n mn b b c b b c B b b c ⎛⎫⎪⎪= ⎪⎪⎝⎭,12,,,m ηηη是矩阵B 的列向量组,如果12,,,r i i i ηηη是12,,,m ηηη的一个极大线性无关组,那么()()()12,ri i iσβσβσβ就是()()()12,m σβσβσβ的一个极大线性无关组,因此向量组()()()12,m σβσβσβ的秩等于秩()B 。

线性代数 线性变换

线性代数 线性变换

5) 零变换 O: V V , O(v) = 0
2. 线性变换的性质
设 L: VW 是一个线性变换,则有 (i) L(0) = 0
(ii) L(−v) = −L(v) , vRn.
(iii) 设 v1, ... , vk ∈ V , α1,...,αk ∈ , 有 L(α1v1 +···+αkvk) = α1 L(v1) + ···+ αk L(vk)
称 ker (L)为L 的核, L(S5 设线性算子L(x) = (x1, 0)T: 2 2 . 则ker(L)= Span(e2) ; L( 2) = Span(e1) .
定理1
设 L : V W 是一个线性变换, S是V 的一个子空间. 则 i) ker(L) 是V 的子空间. ii) L(S) 是W 的子空间.
例 2 设 f : ,对应关系为 f (x) = ax+b ,它是线性映射吗? 答:f 是 上的一个线性映射当且仅当 b = 0.
例 3 证明:A Rmn , 映射 L(x) = Ax是从 n m的线性变换.
x=(x1, x2)T
y
1) L(x)=(x1, x2)T 2 2
x
x
L(x)
2) L(x)=3x 2 2
第四章 线性变换
4.1 线性变换的概念
线性变换的判别; 线性变换的核与值域; 线性变换的性质.
1. 线性变换的定义
定义 设 L: VW 是从线性空间V 到线性空间W的映射. 若映射L满足: 对任意的v1, v2 V 及实数 α , β, 有
L(αv1 + βv2) = αL(v1) + βL(v2) 则称映射L是从V 到W的一个线性映射.

线性代数线性变换分析

线性代数线性变换分析

线性代数线性变换分析线性代数线性变换分析线性代数是数学中的一个重要分支,研究向量空间、线性映射、线性方程组等概念和性质。

其中,线性变换是线性代数中的一个重要概念,也是线性代数的核心内容之一。

本文将对线性变换进行深入分析。

一、线性变换的定义线性变换是指将一个向量空间的元素映射到另一个向量空间的元素,同时满足两个条件:保持加法运算和标量乘法运算的线性性。

换句话说,对于任意向量a和b,以及任意标量c,线性变换T满足以下等式:1. T(a+b) = T(a) + T(b)2. T(c * a) = c * T(a)二、线性变换的矩阵表示线性变换可以使用矩阵来表示,具体方法如下:设有一个线性变换T,原向量空间为V,目标向量空间为W。

若V中的一个向量a经过线性变换T后得到目标向量空间W中的向量b,可以表示为T(a) = b。

若选定了V和W的一组基,可以得到V和W的坐标系,进而可以得到向量a和b在各自坐标系中的坐标。

设V的基为{v_1, v_2, ..., v_n},W的基为{w_1, w_2, ..., w_m},则线性变换T可以表示为一个m x n的矩阵A,使得:[T(a)]_W = A * [a]_V其中,[a]_V表示向量a在坐标系V中的坐标,[a]_W表示向量b在坐标系W中的坐标。

三、线性变换的性质线性变换具有以下几个重要的性质:1. 线性变换保持直线的性质:线性变换对原空间中的直线进行映射后,得到的是目标空间中的直线。

这是因为直线上的任意两点经过线性变换后仍然是目标空间中的两点,同时线性变换保持加法运算,所以线性变换对直线的保持是自然的。

2. 线性变换对原点的保持:线性变换将原点映射到目标空间的原点。

这是因为线性变换对加法运算的保持,所以线性变换将原点映射到目标空间中的零点是必然的。

3. 线性变换对向量的放缩:线性变换对向量的放缩具有可加性,即T(c * a) = c * T(a)。

这是因为线性变换对标量乘法运算的保持,所以线性变换对向量的放缩也是保持的。

高等代数讲义ppt第七章 线性变换

高等代数讲义ppt第七章 线性变换

(4) 若A 是可逆的,则矩阵 A 也可逆,且A-1的矩阵是A-1。
例5 设 V是数域P上的n维线性空间,则L(V)与P n×n同构。
例6 设 A1,A2是 n 维线性空间 V 的两个线性变换,证明: A2V⊂A1V 的充要条件是存在线性变换 A 使得 A2=A1A 。
线性变换
§3 线性变换的矩阵
例4 设 A 是n维线性空间V的一个线性变换, A3=2E, B =A2-2A+2E, 证明:A,B都是可逆变换。
线性变换
§3 线性变换的矩阵
§3 线性变换的矩阵
定理1 设1, 2 , , n是线性空间V的一组基, 对V中任意n个向量 1,2 , ,n 存在唯一的线性变换 A∈L(V) 使任的何像得元,素只都要可选以取是适基当
线性变换
§1 线性变换的定义
二、线性变换的性质
性质1 设 A 是V的线性变换,则 A(0) 0, A( ) A()
性质2 线性变换保持线性组合与线性关系式不变。
性质3 线性变换把线性相关的向量组变成线性相关的向量组。
注意: 线性变换可能把线性无关的向量组变成线性相关的 向量组。
例3 设 1,2, ,r 是线性空间V的一组向量,A 是V的一个线
线性变换的加法满足以下运算规律:
(1) A + ( B + C ) = ( A + B ) + C
(2) A + B = B + A
线性变换
§2 线性变换的运算
定义2 设 A∈L(V),k∈P,对k与 A 的数量乘积 kA 定义为:
(kA) k A, V
结论2 对∀A ∈L(V),k∈P 有 kA∈L(V)。
Amn AmAn , (Am )n Amn, m, n N

线性代数之线性变换的解释

线性代数之线性变换的解释

最近想知道特征值、特征值到底有什么物理意义,搜到了这篇文章,共享一下。

来源:孙哲的日志[1. 特征的数学意义]我们先考察一种线性变化,例如x,y坐标系的椭圆方程可以写为x^2/a^2+y^2/b^2=1,那么坐标系关于原点做旋转以后,椭圆方程就要发生变换。

我们可以把原坐标系的(x,y)乘以一个矩阵,得到一个新的(x',y')的表示形式,写为算子的形式就是(x,y)*M=(x',y')。

这里的矩阵M代表一种线性变换:拉伸,平移,旋转。

那么,有没有什么样的线性变换b(b是一个向量),使得变换后的结果,看起来和让(x,y)*b像是一个数b乘以了一个数字m*b? 换句话说,有没有这样的矢量b,使得矩阵A*b这样的线性变换相当于A在矢量b上面的投影m*b? 如果有,那么b就是A的一个特征向量,m就是对应的一个特征值。

一个矩阵的特征向量可以有很多个。

特征值可以用特征方程求出,特征向量可以有特征值对应的方程组通解求出,反过来也一样。

例如,设A为3阶实对称矩阵,a1=(a,-a,1)T是Ax=0的解,a2=(a,1,-a)T是(A+E)x=0的解,a≠2,则常数a=? 因为a1=(a,-a,1)T 是Ax=0的解,说明a1=(a,-a,1)T是A的属于0的特征向量,a2=(a,1,-a)T是(A+E)x=0的解,说明a2=(a,1,-a)T是A的属于-1的特征向量。

实对称矩阵属于不同特征值的特征向量式正交的,所以a^2-a-a=0,a≠2,所以a=0。

还是太抽象了,具体的说,求特征向量的关系,就是把矩阵A所代表的空间,进行正交分解,使得A的向量集合可以表示为每个向量a在各个特征向量上面的投影长度。

例如A是m*n的矩阵,n>m,那么特征向量就是m个(因为秩最大是m),n个行向量在每个特征向量E 上面有投影,其特征值v就是权重。

那么每个行向量现在就可以写为Vn=(E1*v1n,E2*v2n...Em*vmn),矩阵变成了方阵。

线性变换知识点总结

线性变换知识点总结

线性变换知识点总结一、引言线性变换是线性代数中的重要概念,它是在向量空间中的一种特殊映射。

线性变换具有许多重要的性质和应用,因此研究线性变换对于理解线性代数和应用数学有着重要的意义。

本文将从线性变换的基本概念、性质和应用进行总结,希望能够帮助读者对线性变换有更深入的理解。

二、线性变换的定义线性变换是向量空间之间的一种映射,具体来说,设V和W是两个向量空间,f:V→W是从V到W的映射。

如果对于V中的任意向量u、v和任意标量a,b,都有f(au+bv)=af(u)+bf(v)那么f称为一个线性变换。

三、线性变换的矩阵表示线性变换可以用矩阵来表示,假设V和W是n维向量空间,我们选择V和W的基,那么可以得到V和W中的向量可以用n维列向量表示。

设f:V→W是一个线性变换,选择V和W的基分别为{v1,v2,...,vn}和{w1,w2,...,wn},那么f的矩阵表示为[f]=(f(v1) f(v2) ... f(vn))其中f(vi)表示w中的基向量wi在f映射下的像,也就是f(vi)对应的列向量。

根据线性变换的定义,我们可以得到映射f的矩阵表示满足下列关系f(av1+bv2)=af(v1)+bf(v2)等价于[f](av1+bv2)=a[f]v1+b[f]v2其中[f]v1和[f]v2为f(v1)和f(v2)的列向量表示。

四、线性变换的性质1. 线性变换的保直性线性变换f:V→W将V中的任意向量线性映射到W中,这种映射保持向量之间的直线性质,即通过f映射后的图像仍然是一条直线。

这是线性变换的一个重要性质,它保证了线性变换后的图像具有一些有用的性质,比如直线上的点在f映射后仍然在同一条直线上。

2. 线性变换的局部性线性变换f:V→W保持向量之间的“相对位置”不变,即如果向量v1和v2之间的相对位置关系在V中是一定的,那么在映射f下,向量f(v1)和f(v2)之间的相对位置关系也是一定的。

这一性质对于理解线性变换的几何意义有着重要的作用,它意味着线性变换可以保持向量之间的某些几何性质。

理解线性变换本质

理解线性变换本质

理解线性变换本质线性变换是线性代数中一个重要的概念,它在数学和应用领域都有广泛的应用。

理解线性变换的本质对于深入掌握线性代数理论以及解决实际问题具有重要意义。

一、线性变换的定义和性质线性变换可以理解为一种向量空间之间的变换,它保持向量的线性关系。

设V和W是两个向量空间,f是从V到W的映射,如果对于任意的向量x和y,以及标量a和b,满足以下两个条件:1. f(ax + by) = af(x) + bf(y),称为线性性质;2. f(0) = 0,称为零性质。

则称f为从V到W的线性变换。

线性变换具有以下重要性质:1. 线性变换保持向量的线性组合:即对于任意的向量x1, x2, ..., xn和标量c1, c2, ..., cn,有f(c1x1 + c2x2 + ... + cnxn) = c1f(x1) + c2f(x2)+ ... + cnf(xn)。

2. 线性变换保持向量的加法和乘法运算:即对于任意的向量x和y,有f(x + y) = f(x) + f(y),以及对于任意的标量a,有f(ax) = af(x)。

3. 线性变换的零空间:线性变换的零空间是指使得f(x) = 0成立的向量x的集合,记为ker(f),它是V的子空间。

4. 线性变换的像空间:线性变换的像空间是指所有可能的f(x)的向量的集合,记为im(f),它是W的子空间。

二、线性变换的本质理解线性变换的本质需要从几何和代数两个角度进行考虑。

从几何角度看,线性变换可以将向量空间中的向量变换为另一个向量空间中的向量,而保持向量之间的关系。

例如,平移、旋转和缩放等几何变换,都可以使用线性变换来表示。

线性变换可以改变向量的方向、长度和位置,但不会改变向量的线性关系。

从代数角度看,线性变换可以用矩阵来表示,矩阵中的每个元素表示了向量在变换后的位置。

线性变换可以通过矩阵乘法来实现,变换后的向量可以用原始向量和变换矩阵的线性组合来表示。

线性变换的本质在于它可以将向量的运算转化为矩阵的乘法运算,从而简化了向量的计算和操作。

第七章 线性变换

第七章 线性变换

第七章 线性变换一. 内容概述1. 线性变换的概念设n V 是n 维线性空间,T 是n 维线性空间n V 中的变换,且满足1) 对任意向量n V ∈βα,,有 )()()(βαβαT T T +=+ 2) 对任意向量F k V n ∈∈,α,有)()(ααkT k T =则称为中的线性变换。

2. 线性变换的性质及运算1)0)0(=T )()(ααT T -=-2) )()()()(22112211n n n n T k T k T k k k k T αααααα+++=+++ΛΛ3)设向量组n ααα,,,21Λ线性相关,则向量组)(),(),(21n T T T αααΛ也线性相关。

线性变换的和:)()())((2121αααT T T T +=+ 线性变换的积:))(())((2121ααT T T T = 数乘变换:)())((αλαλT T = 线性变换T 可逆时,逆变换1-T都是线性变换。

线性变换的多项式:0111)(a a a a f m m m m ++++=--σσσσΛ 3. 线性变换的矩阵设σ是V 的一个线性变换,n εεε,,,21Λ是V 的一个基,且n n a a a εεεεσ12211111)(+++=Λn n a a a εεεεα22221122)(+++=ΛΛΛΛΛn nn n n n a a a εεεεσΛ++=2211)(记))(),(),((),,,(2121n n εσεσεσεεεσΛΛ=A n n n ),,,())(,),(),((),,,(212121εεεεσεσεσεεεσΛΛΛ== 则称A 为线性变换σ在基n εεε,,,21Λ下的矩阵。

4. 设n εεε,,,21Λ是数域P 上n 维线性空间V 的一组基,在这组基下,每个线性变换按公式)(*对应一个n n ⨯矩阵,这个对应具有以下性质:1) 线性变换的和对应与矩阵的和; 2) 线性变换的积对应与矩阵的积;3) 线性变换的数量乘积对应与矩阵的数量乘积;4) 可逆的线性变换与可逆矩阵对应,且逆变换对于与逆矩阵。

线性代数课件PPT第五章 线性变换 S1 线性变换的定义

线性代数课件PPT第五章 线性变换 S1 线性变换的定义

由于T1(p+q)=1, 但T1(p)+T1(q)=1+1=2,
所以
T1(p+q)T1(p)+T1(q).
18
5
T(kp1)=A(kp1)=kAp1=kT(p1).
所以, 变换T是线性变换.
y P'

x y
r cos r sin
, 于是
T
x y
x cos x sin
y sin y cos
p
o
x
r r
cos cos
cos sin
r sin sin r sin cos
r r
cos( sin(
)),
例5 设V是数域F上的线性空间,k是F中的某个数 , 定义V的变换如下:
k
这是一个线性变换,称为由数k决定的数乘变换.
当k=1时,便得恒等变换,当k=0时,便得零变换 .
8
例6: 在R3中定义变换: T(x1, x2, x3)= (x12, x2+x3, 0),
则T不是R3的一个线性变换.
证明: 对任意的=(a1, a2, a3), =(b1, b2, b3)R3, T( + )=T(a1+b1, a2+b2, a3+b3)
上式表明: 变换T把任一向量按逆时针方向旋转角.
一般地, 在线性空间Rn中, 设A为n阶方阵, xRn, 变换 T(x)=Ax是本节所定义的线性变换.
事实上, 对任意的x, xRn,
T(x+x) =A(x+x) =Ax+Ax =T(x)+T(x),
T(kx) =A(kx)=kAx =kT(x).
6

线性代数之——线性变换及对应矩阵

线性代数之——线性变换及对应矩阵

线性代数之——线性变换及对应矩阵1. 线性变换的概念当⼀个矩阵A乘以⼀个向量v时,它将v变换到另⼀个向量A v。

进来的是v,出去的是T(v)=A v。

⼀个变换T就像⼀个函数⼀样,进来⼀个数字x,得到f(x)。

但更⾼的⽬标是⼀次考虑所有的v,我们是将整个空间V进⾏变换当我们⽤A乘以每⼀个向量v时。

⼀个变换T,为空间V中的每⼀个向量v分配⼀个输出T(v)。

这个变换是线性的,如果它满⾜:(a)T(v+w)=T(v)+T(w)(b)T(c v)=cT(v) 对任意c成⽴我们可以将这两个条件结合成⼀个,T(c v+d w)=cT(v)+dT(w)矩阵相乘满⾜线性变化,因为A(c v+d w)=cA v+dA w始终成⽴。

线性变换满⾜线到线,三⾓形到三⾓形,看下图。

在⼀条线上的三个点经过变换后仍然在⼀条线上,变换前等距离的点变换后仍然是等距离的点,输⼊是⼀个三⾓形变换后输出还是⼀个三⾓形。

这种线性可以扩展到三个向量或者 N 个向量的组合。

变换有⾃⼰的语⾔,如果没有矩阵的话,我们没办法讨论列空间。

但是这些思想可以被保留,⽐如列空间包含所有的线性组合Av,零空间包含所有使得Av=0 的输⼊。

将它们转化为值域(range)和核(kernel):T的值域 = 所有输出T(v) 的集合,对应于列空间。

T的核 = 所有使得T(v)=0 的输⼊的集合,对应于零空间。

投影任意⼀个三维向量到xy平⾯,那么我们有T(x,y,z)=(x,y,0)。

值域就是这个平⾯,包含了所有的T(v);核是z轴,它们被投影到了零点。

这是⼀个线性的变换。

投影任意⼀个三维向量到z=1 平⾯,那么我们有T(x,y,z)=(x,y,1)。

这不是⼀个线性的变换,为什么呢?它根本不能将零向量投影到零点,⽽这是线性变换必须满⾜的条件。

假设A是⼀个可逆的矩阵,那么核是零向量,值域W和输⼊空间V相同。

有另⼀个线性变化是乘以矩阵A−1,它将每⼀个T(v)都带回到v ,有,T−1(T(v))=v⟺A−1Av=v我们遇到了⼀个不可避免的问题,所有的线性变换都可以由⼀个矩阵产⽣吗?答案是肯定的,所有的变换⽐如旋转、投影……背后都藏着对应的⼀个矩阵。

高等代数.第七章.线性变换.课堂笔记

高等代数.第七章.线性变换.课堂笔记

第七章 线性变换§7.1 线性变换的定义与判别一、线性变换的定义:定义1 设V 为数域P 上线性空间,A 为V 的一个变换(即V ⟶V 的映射),若A 保持加法和数乘运算,即A (α+β)=A (α)+ A (β),∀α,β∈V ,A (kα)=k A (α),∀k ∈P ,则称A 为V 的一个线性变换.注记: 以后我们用花体拉丁字母A,B,C,...表示V 的线性变换,除了特别说明外,本章节中V 均指数域P 上有限维线性空间.例1.说明下列变换均为线性变换: (1)把V 中任一向量都映射为0(称为零变换,记作0); (2)把V 中任一向量α映射为本身(恒等变换,记作E ); (3)取定k ∈P ,把V 中的每一个向量α映射为kα(数乘变换,记作k ).例2.判定下列规则σ是否为指定线性空间的线性变换: (1)ℝ,x -:σ(f (x ))=f′(x );(2)C ,a,b -: σ(f (x ))=∫f (t )dt x0;(3)P n×n : σ(A )=A +A ′,σ2(A )=SAT ,S,T 为固定二个n ×n 矩阵. (4)ℝ,x -n : σ1(f (x ))=xf (x ),σ2(f (x ))=f (x )+1. 解:可验证(1)-(3)均为线性变换,下面证明(1): ∀ f (x )∈ℝ,x -,其导函数唯一确定,且f (x )∈ℝ,x -,因而σ为V ⟶V 的变换,即V 的一个变换,σ(f (x )+g (x ))=(f (x )+g (x ))′=f ′(x )+g ′(x )= σ(f (x ))+ σ(g (x )), ∀k ∈ℝ,σ(kf (x ))=(kf (x ))′=kf ′(x )=kσ(f (x )).(4): σ1与σ2均不是线性变换,取f (x )=x n−1+1=ℝ,x -n ,但σ1(f (x ))=xf (x )=x n +x ∉ℝ,x -n , 因而σ1不是ℝ,x -n 的一个变换, σ2是ℝ,x -n 的一个变换,但运算不保持,因而不是线性变换.习题:P320、1例3.设α为通常几何空间ℝ3中固定的向量,把空间中每个向量η映射为η在α上的内映射(正投影),即Πα: η⟶(α∙η)(α∙α)α是ℝ3的线性变换,这里(α∙η),(α∙α)表示通常向量的内积.证:如图,Πα(η)=OD ⃗⃗⃗⃗⃗ =ηcos (η∙α)α|α|=(α∙η)(α∙α)α,唯一确定, 从而Πα为ℝ3的一个变换,如图,AC ⊥W(垂足为C),OCD LA Wα1α2η因此L 与W 为ℝ3的子空间且ℝ3=W ⊕L ,令 η=α1+α2,α1=OD⃗⃗⃗⃗⃗ =Πα(η),α2∈W , δ=β1+β2,β1=Πα(δ)∈L,β2∈W ,则η+δ=(α1+β1)+(α2+β2),α1+β1∈L,α2+β2∈W , 从而Πα(η+δ)=α1+β1=Πα(η)+Πα(δ), 同理,Πα(kη)=kΠα(η).二、线性变换的性质: 设A 为V 的线性变换,则: (1) A (0)=0, A (−α)=−A (α),∀α∈V ; (2) A (k 1α1+k 2α2+⋯+k t αt )=k 1A (α1)+k 2A (α2)+⋯+k t A (αt ); (3) A 把线性相关的向量组映射为线性相关的向量组(反之不真).2011-04-02A : V ⟶V 线性变换性质: (3) A 为V 中线性相关的向量组,映为V 中线性相关的向量组,即α1,α2,…,αs 相关⟹A (α1), A (α2),…, A (αs )相关;但A (α1), A (α2),…, A (αs )线性相关⇒α1,α2,…,αs 相关. 如A =0,∀ α∈V,α≠0, A (α)=0.(4)设α1,α2,…,αn 为V 的一个基,∀ α∈V,α=x 1α1+x 2α2+⋯+x n αn ⟹A (α)=A (x 1α1+x 2α2+⋯+x n αn ) 线性变换A 由V 中一个基中的像唯一确定;(5)设α1,α2,…,αn 为V 的一个基,则对V 中任一向量组β1,β2,…,βn 必存在一个线性变换 A : V ⟶V ,使得:A (αi )=βi ,1≤i ≤n ;证:作V ⟶V 映射:A (α)= x 1β1+x 2β2+⋯+x n βn ,其中:α=x 1β1+x 2β2+⋯+x n βn ,则A (αi )=βi ,1≤i ≤n ; 下证:A 为V 的线性变换:∀ α=x 1α1+x 2α2+⋯+x n αn ∈V,β=y 1α1+y 2α2+⋯+y n αn ∈V,A (α+β)= A .(x 1+y 1)α1+(x 2+y 2)α2+⋯+(x n +y n )αn /=(x 1+y 1)β1+(x 2+y 2)β2+⋯+(x n +y n )βn=(x 1β1+x 2β2+⋯+x n βn )+(y 1β1+y 2β2+⋯+y n βn ) = A (x 1α1+x 2α2+⋯+x n αn )+ A (y 1α1+y 2α2+⋯+y n αn )= A (α)+A (β)同理,∀k ∈P ,A (kα)=k A (α).§7.2 线性变换的运算为方便,引入记号:Hom (V,V ),它表示数域P 上线性空间V 的所有线性变换的集合。

7线性变换

7线性变换

187第七章 线性变换§1 线性变换我们已经看到,数域F 上任意一个n 维向量空间都与n F 同构,因之,有限维向量空间的结构可以认为是完全清楚了,向量空间是某一类事物的一个抽象。

认识客观事物,固然要弄清楚它们单个的和总体的性质,但是更重要的是研究它们之间的各种各样的联系,在向量空间之间的联系就反映为向量空间的映射,向量空间V 到自身的映射通常称为V 的变换,下面要讨论的线性变换就是最简单最基本的,同时也是线性代数的一个主要研究对象.定义 1 向量空间V 到自身的线性映射叫做线性变换,即V 的线性变换σ是V 到V 的映射,且满足1) ,,()()()V αβσαβσασβ∀∈+=+; 2) ,,()()V k F k k ασασα∀∈∀∈=.下面所考虑的向量空间V 都是某一固定的数域F 上的向量空间. 我们用希腊字母表示,,,στρ表示V 的变换,用()σα表示向量α在变换σ下的像.先看几个简单的例子,它表明线性变换这个概念是有丰富的内容的. 例1平面上的向量构成实数域上的二维向量空间,把平面围绕坐标原点按逆时针方向旋转θ角,就是一个线性变换,如果平面上一个向量在直角坐标系下的坐标是(,)x y ,那么旋转θ角后的像的坐标是按照公式'cos sin 'sin cos x x y y θθθθ-⎛⎫⎛⎫⎛⎫= ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭来计算的,这是一个2R 的线性变换.一般,用数域F 上的矩阵A 左乘n F 的任意向量X ,得到的就是一个线性变换.例2 设k F ∈,:V V σ→,k αα是一个线挫变换,称为数乘变换,当0k =时,是零变换,当1k =时,是恒188 等变换或单位变换.例3 在向量空伺[]F x 中,求微商是一个线性变换,这个变换通常用D 代表,即:()'()(())D f x f x D f x →=例4 定义在闭区间[,]a b 上的全体连续函数[,]C a b 组成实数域上一向量空间,在这个空同中,变换:[,][,]C a b C a b σ→()()(()xaf x f t d t f x σ=⎰是一个线性变换. 例5 设12,,,n ααα是V 的一个基,12,,,n βββ是V 的n 个向量,则存在唯一的线性变换σ,使得(),1,2,,i i i n σαβ==.证明 1122n n x x x V ξααα∀=+++∈,规定1122()n n x x x σξβββ=+++,则σ是V 的一个变换,设1122n n y y y V ηααα=+++∈111222()(()()())n n n x y x y x y σξησααα+=++++++111222()()()n n nx y x y x y βββ=++++++11221122()()n n n n x x x y y y ββββββσξση=+++++++=+11221122()()n n n n k kx kx kx kx kx kx σξσαααβββ=+++=+++1122()()n n k x x x k βββσξ=+++=所以若还有V 的线性变换τ满足(),1,2,,i i i n ταβ==,则1122n n x x x Vξααα∀=+++∈,1122()()n n x x x ββξτσξβ+++==,τσ= .不难直接从定义推出线性变换具有以下性质:1) 设σ是V 的线性变换,则(0)0σ=,()()σασα-=-, 这是因为()()k k σασα=,取0k =和1k =-即得.2) 线性变换保持线性组合与线性关系式不变. 即,如果18912112212(,,,)n n n n k kk k k k βαααααα⎛⎫ ⎪ ⎪=+++= ⎪ ⎪⎝⎭,12112212()()()()((),(),,())n n n n k kk k k k σβσασασασασασα⎛⎫ ⎪ ⎪=+++= ⎪ ⎪⎝⎭.经过线性变换后保持同样形式的线性组合; 不难看出,线性变换把线性相关的向量组变成线性相关的向量组; 但是,线性变换可能把线性无关的向量组也变成线性相关的向量组,例如零变换就是这样. §2 线性变换的运算设V 是数域F 上向量空向,我们用()L V 表示V 的一切线性变换作成的集合,即(){|}L V V σσ=是的线性变换就像判断两个映射相等一样,判断两个V 的线性变换σ与τ相等,只要V α∀∈,有()()σατα=.下面我们定义()L V 的运算,,,()L V στρ∀∈,,,,V k a F αβ∀∈∀∈: 加法::()()()()στασαταστα++=+,这是一个V 的变换,且()()()()()()()()σταβσαβταβσασβτατβ++=+++=+++()()()()()()()()σατασβτβσταστβ=+++=+++()()()()()()(()())()()k k k k k k k στασατασατασαταστα+=+=+=+=+,所以 ()L V στ+∈不难证明,线性变换的加法适合交換律与结合律,即 1) σττσ+=+;2) ()()στρστρ++=++; 令 :,0V V θα→ 为V 的零变换,满足()L V σ∀∈,3) θσσ+=;190 :()σασα--,满足4) ()σσθ+-=;容易证明,()L V θσ-∈. 我们可以定义σ与τ 的差 ()στστ-=+- ; 数量乘法: :()()()k k k σασασα=,这亦是一个V 的变换,且()()(())(()())()k k k k σαβσαβσασβσαβ+=+=+=+ ()()(())(())(())k a k a k a a k σασασασα===,所以,()k L V σ∈容易证明,下列算式成立 5) ()()()kl k l σσ=; 6) ()k k k στστ+=+; 7) ()k l k l σσσ+=+; 8) 1σσ=. 这样我们得到定理1 ()L V 对于线性变换的加法和数量乘法作成一个数域F 上的向量空间.()L V 中还可以定义乘法.乘积: :(())()()στασταστα=,这也是一个V 的变换,且()(())(()())()()σταβσταβστατβσταστβ+=+=+=+()(())(())((())()k k k k k στασταστασταστα====,所以,()L V στ∈ 线性变换的乘法对加法还适合左右分配律,即 9) (),()στρστσρστρσρτρ+=++=+,我们验证第一个等式:V α∀∈,()()(()())(()())στραστρασταρα+=+=+(())(())στασρα=+()()()()στασραστσρα=+=+.因为一般映射的乘法适合结合律,所以线性变換的乘法当然也适合结合律,即10) ()()στρστρ=;利用线性变換的乘法适合结合律,可以定义线性变換σ的幂,nnσσσσ= ,0σι=,ι是V 的单位变换.191设 1110()n n n n f x a x a x a x a --=++++,()L V σ∈,用σ代替x 得到 1110()n n n n f a a a a σσσσι--=++++,叫做线性变换σ的多项式.一般若有多项式的恒等式,则有相应的线性变换的多项式的等式,如对于(),(),()[]f x g x h x F x ∈,且()()(u x f x g x h x =+,则有 ()()()()u f g h σσσσ=+.线性变换的乘法一般是不可交换的,但是,关于同一个线性变换σ的两个多项式相乘是可以交换的.V 的变换σ称为可逆的, 如果有V 的变換τ使 σττσι== τ叫做σ的逆变换,记作1σ-, 1σ-是线性变换,事实上1111111()(()())((()()))σαβσσσασσβσσσασβ-------+=+=+11111()(()())()()σσσασβσασβ-----=+=+;11111111()(())((()))()(())()k k k k k σασσσασσσασσσασα--------====所以,1()L V σ-∈当线性变换σ可逆时,定义σ的负整数幂为1()n n σσ--= 不难证明,线性变换σ可逆⇔线性变换σ是双射. §3 线性变换的矩阵设V 是数域F 上n 维向量空间,12,,,n ααα是V 的一组基,现在我们来建立线性变换与矩阵的关系前面我们已看到,n 维向量空间的线性变换σ被基的像唯一决定. 由()i V σα∈,可由12,,,n ααα线性表出1111111((),,())(,,)n n n n nn n a a a a σασααααα=++++1112121222121212(,,,)(,,,)n n n n n n nn a a a a a a A a a a αααααα⎛⎫ ⎪ ⎪== ⎪ ⎪⎝⎭A 叫做线性变换σ在基12,,,n ααα下的矩阵,A 的第j 列就是()j σα在基12,,,n ααα下的坐标. 我们也用12(,,,)n σααα表示12((),(),,())n σασασα.192 设12112212(,,,)n n n n x xx x x x βαααααα⎛⎫ ⎪ ⎪=+++= ⎪ ⎪⎝⎭,则12112212()()()()((),(),,())n n n n x xx x x x σβσασασασασασα⎛⎫ ⎪ ⎪=+++= ⎪ ⎪⎝⎭1212(,,,)n n x x A x ααα⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭, 即()σβ关于基12,,,n ααα的坐标是 12n x xA x ⎛⎫ ⎪ ⎪ ⎪ ⎪⎝⎭.定理1设12,,,n ααα是数域F 上n 维向量空间V 的一组基,规定:()L V σ∀∈,:()()n L V M F ϕ→()A σϕσ=,如果 112((),,())(,,,)n n A σασαααα=则 ϕ 是()L V 到()n M F 的一个双射,且满足 1) ()()()ϕστϕσϕτ+=+; 2) ()()k k ϕσϕσ=; 3) ()()()ϕστϕσϕτ=; 4) 当σ可逆时,111()()A ϕσϕσ---==;证明 1) 设 1212((),(),,())(,,,)n n A σασασαααα=,1212((),(),,())(,,,)n n B ταταταααα=12(()(),()(),,()())n στασταστα+++1122(()(),()(),,()())n n σατασατασατα=+++1212((),(),,())((),(),,())n n σασασατατατα=+1931212((),(),,())((),(),,())n n σασασατατατα=+1212(,,,)(,,,)n n A B αααααα=+12(,,,)()n A B ααα=+,即 ()()()ϕστϕσϕτ+=+;2) 1212((),(),,())((),(),,())n n k k k k σασασασασασα=12(,,,)n k A ααα=12(,,,)n kA ααα=, 即 ()()k k ϕσϕσ=3) 注意到 1()nj kj k k b ταα==∑, 所以1()()nj kj k k b στασα==∑12((),(),,())n στασταστα12((),(),,())n B σασασα=12(,,,)n AB ααα=,即 ()()()ϕστϕσϕτ=;4) 当σ可逆时,σττσι==,121212((),(),,())(,,,)((),(),,())n n n σταστασταααατσατσατσα==121212(,,,)(,,,)(,,,)n n n AB E BA ααααααααα==,可得AB BA E ==,1B A -= ,即 111()()()B A ϕσϕτϕσ---====.1),2)说明,作为向量空间来说 ()()n L V M F ϕ≅ ;3) 说明()L V 与()n M F 在ϕ 之下保持乘法,4) 说明 σ可逆()A ϕσ⇔= 可逆.定理1说明,n 维向量空间的线性变换的问题可以转化为矩阵的问题, 矩阵的问题也可以转化为 n 维向量空间的线性变换的问题.因此,类似于第三章的线性变换可得到一般的n 维向量空间的线性变换的结论. 线性变换的矩阵是与向量空间中一组基联系在一起的, 随着基的改变,同一个线性变换就有不同的矩阵,为了利用矩阵来研究线性变换,有必要弄淸楚线性变换的矩阵是如何随着基的改变而改变的.定理 2 设12,,,n ααα与12,,,n βββ是向量空间V 的两组基,()L V σ∈,1212((),(),,())(,,,)n n A σασασαααα=, 1212((),(),,())(,,,)n n B σβσβσββββ=, 1212(,,,)(,,,)n n T βββααα=,则 1B T AT -=.证明 由1212(,,,)(,,,)n n T βββααα=,得1212((),(),,())((),(),,())n n Tσβσβσβσασασα=1212(,,,)((),(),,())n n B βββσβσβσβ=12((),(),,())n T σασασα=12(,,,)n AT ααα=111212((,,,))(,,,)n n T AT T AT ββββββ--==,由于194 12,,,n βββ线性无关,于是有1B T AT -=.因此在一般n 维向量空间中也有:同一个线性变换在不同基下的矩阵是相似的.定理2的结论反过来也是成立的,即若1B T AT -=,则A 与B 可以看作同一个线性变换在不同基下的矩阵.事实上,设1B T AT -=,12,,,n ααα是向量空间V 的一组基, 1212((),(),,())(,,,)n n A σασασαααα=,令1212(,,,)(,,,)n n T βββααα=,则12,,,n βββ也是基,且1212((),(),,())((),(),,())n n T σβσβσβσασασα=1121212(,,,)(,,,)(,,,)n n n AT T AT B αααββββββ-===.例1 注意到,111()T A C T T AT T CT ---+=+和 若 1B T AT -=,则1r r B T A T -=;,就有,若 ()[]f x F x ∈,则 1()()f B T f A T -=.例2 21,,x x 是3[]F x 的一组基,D 是求导数的线性变换,求D 在3[]F x 的另一组基21,1,(1)x x --下的矩阵.解 22111(1,1,(1))(1,,)012001x x x x -⎛⎫⎪--=- ⎪ ⎪⎝⎭22010((1),(),())(1,,)002000D D x D x x x ⎛⎫ ⎪= ⎪ ⎪⎝⎭22111((1),(1),((1)))((1),(),())012001D D x D x D D x D x -⎛⎫⎪--=- ⎪⎪⎝⎭2010111(1,,)002012000001x x -⎛⎫⎛⎫⎪⎪=- ⎪⎪⎪⎪⎝⎭⎝⎭19512111010111(1,1,(1))012002012001000001x x ---⎛⎫⎛⎫⎛⎫ ⎪ ⎪⎪=---- ⎪ ⎪⎪ ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭例3 设V 是数域F 上n 维向量空间,()L V σ∈,则σ是数乘变换⇔σ关于V 的任意基的矩阵相同.证明 若σ关于V 的任意基的矩阵相同,设为A ,T 是一个n 阶可逆矩阵,可以看作V 的一个基到另一个基的过渡矩阵,故1T AT A -=,即AT TA =,设P 是任一个n 阶矩阵,因使 ||0E P λ+= 的λ的值最多n 个,故可找到λ使得E P λ+可逆,故()()A E P E P A λλ+=+,从而AP PA =,取ij P E =,,1,2,,i j n = ,得A kE =.§4 特征值与特征向量我们知道, 在有限维向量空间中,取了一組基之后,一个线性变换就对应一个矩阵,矩阵的特征值和特征向量我们已经了解,我们要弄清楚线性变换的特征值与矩阵的特征值之间的关系,为了利用矩阵来研究线性变换,对于每个给定的线性变换,我们希望能找到一组基使得它的矩阵具有最简单的形式. 先介绍一般向量空间特征值和特征向量的概念,它们对于线性变换的研究具有基本的重要性.定义1 设()n V V F =,()L V σ∈,F λ∈,若 0V ξ∃≠∈,使得()σξλξ=,则说λ是σ的一个特征值,ξ是属于特征值λ的特征向量.从几何上来看,特征向量的方向经过线性变换后,保持在同一条直线上,0λ> 时方向不变,0λ<方向相反,至于0λ=时,特征向量就被线性变换变成了0.由定义可以看出,特征向量是非零向量,特征向量的非零倍数仍然是是特征向量,这说明待征向量不是被特征值所唯一决定的,但是特征值却是被特征向量所唯一决定的,因为,一个特征向量只能属于一个特征值.定理1 属于不同特征值的特征向量是线性无关的.196 证明 设 ()L V σ∈,()i i i σξλξ=,0i ξ≠,12,,,s λλλ两两不同,1s =,结论成立.假设不同特征值的个数为1s -结论成立;对于s 个时,有关系式11220s s k k k ξξξ+++=,把此式分别用s λ乘等式两边与用σ作用,得11220s s s s s k k k λξλξλξ+++= 1112220s s s k k k λξλξλξ+++=把上面两式相减,得111222111()()()0s s s s s s k k k λλξλλξλλξ----+-++-=,由归纳假定,121,,,s ξξξ-线性无关,故112211()()()0s s s s s k k k λλλλλλ---=-==-=,因此 1210s k k k -====,带回第一式,得 0s s k ξ=,00s s k ξ≠⇒=,12,,,s ξξξ线性无关,由数学归纳法原理,结论成立.现在来给出求线性变换的特征值和特征向量的方法,()n V V F =,()L V σ∈,σ在V 的基12,,,n ααα下的矩阵是A ,λ是σ的一个特征值,ξ是属于特征值λ的特征向量,ξ在V 的基12,,,n ααα下的坐标是12'(,,,)n X x x x =,那么λ是σ的一个特征值,ξ是属于λ的特征向量⇔ (),0σξλξξ=≠⇔ 121212((),(),,())(,,,)(,,,),0n n n X AX X X σασασαααααααλ==≠⇔,0AX X X λ=≠⇔()0E A X λ-=有非零解⇔ ||0E A λ-=⇔ λ是A 的特征多项式()A f λ在F 中的根.同一个线性变换σ在不同基下的矩阵是相似的,而相似的矩阵有相同的特征多项式,可见线性变换的矩阵的特征多项式与基的选择无关, 它是直接被线性变换决定的,因此,以后就可以说线性变换σ的特征多项式了,可以记作()f σλ.因此,确定n 维向量空间的线性变换σ的特征值与特征向量可以按以下几步完成:1) 在n 维向量空间V 中取一组基12,,,n ααα,写出σ在这组基下的矩阵A ;1972) 求出A 的特征多项式||E A λ-在数域F 中全部的根,它们就是线性变换σ的全部特征值;3) 把所求得的特征值i λ逐个地代人方程组()0E A X λ-=,对于每一个特征值i λ,解方程组()0i E A X λ-=,求出一组基础解系,它们就是属于这个特征值i λ的几个线性无关的特征向量在基12,,,n ααα的坐标, 所有属于每个特征值的特征向量放到一起就是全部线性无关的特征向量.例1 设R 上三维向量空间V 的线性变换σ在一个基123,,ααα下的矩阵是332112310A ⎛⎫ ⎪=- ⎪ ⎪--⎝⎭,求σ的特征值和相应的特征向量. 解 A 的特征多项式322332()||1124416(4)(4)31A f E A λλλλλλλλλλ---=-=--=-+-=-+只有一个实根4,将4代人方程组()0E A X λ-=中λ处,得 1230(4)00x E A x x ⎛⎫⎛⎫⎪ ⎪-= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭,即123123123320320340x x x x x x x x x --=-++=++= 这个方程组的解是(,,),a a a a R -∈,因此属于特征值4的特征向量是123,0a a a a R ααα+-≠∈.例2平面上全体向量构成实数域上一个二维向量空间2R , 2R 中旋转θσ是线性变换,在直角坐标系下的矩阵为cos sin sin cos θθθθ-⎛⎫⎪⎝⎭198 它的特征多项式2cos sin 2cos 1sin cos λθθλλθθλθ-=-+--当k θπ≠时没有实根,因此,θσ没有特征值,从几何上看,它是旋转,不在原来方向所在线上.容易看出,对于线性变换σ的任一个特征值λ , 全部属于λ的特征向量加上零向量作成的集合 {|(),}V V λασαλαα==∈是V 的一个子空间,叫做σ的一个特征子空间. 显然,V λ的维数就是属于λ的线性无关的特征向量的最大个数.下面先来看一下矩阵的特征多项式的系数. 在()||f E A λλ=-111212122212n nn n nna a a a a a a a a λλλ------=---的展幵式中,有一项是主对角线上元索的连乘积1122()()()nn a a a λλλ---行列式展开式中的其余各项,至多包含义2n -个主对角线上的元素,它关于λ的次数最多是2n -,因此特征多项式中含λ的n 次与1n -次的项只能在主对角线上元案的连乘积中出现, 它们是11122()n n nn a a a λλ--+++,在特征多项式中令0λ= ,得常数项(0)||(1)||n f A A =-=-,由此, 11122()()(1)||n n n nn f a a a A λλλ-=-+++++-.1122nn a a a +++叫做A 的迹,记作()Tr A .如果12()()()()n f λλλλλλλ=---,由根与系数的关系,得12()n Tr A λλλ=+++,12||n A λλλ=.引理 1 复数域上任一n 阶矩阵A 都与一上三角形矩阵相似,且主对角线上元素是A 在的全部特征值.证明 若1n =,结论显然成立. 假定结论对1n -成立, 取n 维向量空间V 的一组基12,,,n ααα,定义线性变换1991212(,,,)(,,,)n n A σαααααα=,设1λ是A 的一个特征值,1ξ是属于1λ的一个特征向量,将1ξ扩充为V 的一组基12,,,n ξξξ,则σ在基12,,,n ξξξ下的矩阵可写为1121222200n n n nn b b b b B b b λ⎛⎫⎪ ⎪= ⎪⎪⎝⎭1212(,,,)(,,,)n n T ξξξααα=,则 1T AT B -=,令22212n n nn b b B b b ⎛⎫ ⎪=⎪ ⎪⎝⎭由归纳假定 有1P ,使得231111**0*0n P B P λλλ-⎛⎫⎪ ⎪= ⎪ ⎪⎝⎭,再令 11P P ⎛⎫= ⎪⎝⎭,则 1211**0*()00n TP ATP P BP λλλ--⎛⎫⎪ ⎪== ⎪⎪⎝⎭由数学归纳法原理,结论成立.最后,我们给出特征多项式的一个称之为哈密顿-凯莱定理的重要结果:.定理2 (Hamilton-Caylay) 设()n A M F ∈,()||f E A λλ=- 是A 的特征多项式,则11122()()(1)||0n n n nn f A A a a a A A E -=-+++++-=.证明 设 1T BT A -=,则 1()()T f B T f A -=,如果()0f B =,则()0f A =. 由引理1,可设200 12**0*00n B λλλ⎛⎫⎪⎪= ⎪⎪⎝⎭根据特征多项式的定义,注意上三角阵的行列式就是对角元的乘积,12()||()()()B n f E B λλλλλλλλ=-=---,12()()()()B n f B B E B E B E λλλ=---,注意到()i B E λ-是上三角形矩阵,且i 行i 列元素为0,12()()B E B E λλ--1221120****0*00*00000n n λλλλλλλλ-⎛⎫⎛⎫⎪⎪- ⎪⎪= ⎪⎪⎪⎪--⎝⎭⎝⎭00*00*00*⎛⎫⎪ ⎪= ⎪⎪⎝⎭假设12()()()k B E B E B E λλλ---的前k 列元素全为0,11()()()k k B E B E B E λλλ+---100**00**()0*k B E λ+⎛⎫ ⎪ ⎪=- ⎪ ⎪⎝⎭的前1k +列元素全为0, 由数学归纳法原理,12()()()()0B n f B B E B E B E λλλ=---=,从而()0f A =.这个定理还可以利用E A λ-的伴随矩阵()B λ的1n -展式和等式 ()()||()B E A E A E f E λλλλ-=-=展开对比来证明.有人的证明方法是:()|||||0|0f A AE A A A =-=-==,这种方法错在哪?推论1 设σ是有限维向量空间V 的线性变换,()f λ是σ的特征多项式,那么()0f σ=.201§5 对角矩阵对角矩阵可以认为是矩阵中最简单的一种,现在我们来考察,究竟哪一些线性变换的矩阵在一组适当的基下可以是对角矩阵.设(),()n V V F L V σ=∈,如果σ在V 的某基下矩阵是对角形,则说σ可以对角化. ()n A M F ∈,如果A 与对角形矩阵相似,则说A 可对角化. 下面内容中(),()n V V F L V σ=∈.下面给出一个基本的好记好用又容易证明的线性变换可以对角化的充要条件.定理1 σ可对角化⇔σ有n 个线性无关的特征向量.证明 “⇒”设σ可对角化,即存在V 的基12,,,n ααα, σ在此基下是对角矩阵12n λλλ⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭, 即 ()i i i σαλα=,1,2,,i n = 因此12,,,n ααα就是V 的n 个线性无关的特征向量.“⇐”设σ有n 个线性无关的特征向量12,,,n ααα,那么就取12,,,n ααα为基,在这组基下σ的矩阵是对角矩阵.由§4定理1和本节定理1,可得推论1 若σ有n 个不同特征值,则σ可对角化. 因为在复数域中任一个n 次多项式都有n 个根,所以由推论1和§4定理1可得推论2 若σ的特征多项式无重根,则则σ可对角化. 当σ的特征多项式有重根时,可以用不同特征子空间的维数和来判别这个线性变换的矩阵能不能成为对角形.推论3 设σ的不同特征值为12,,,r λλλ,{|()}i i V V λξσξλξ=∈=,202 则σ可对角化⇔1dim iri V n λ==∑.证明 “⇐”若1dim iri V n λ==∑,从每一i V λ中取一组基,合起来就是V 的基,σ在这组基下的矩阵就是对角型;“⇒” 若σ可对角化,则σ有n 个线性无关的特征向量作成V 的基,将这些基向量按属于i λ分类,就分别是i V λ的基,因此就有1dim i ri V n λ==∑.这个结果换一种说法就是:设A 的特征多项式()f λ不同特征根为12,,,r λλλ,{|()}i i V V λξσξλξ=∈=,则A 可对角化⇔ dim i V λ等于i λ的重数,1,2,,i r =.根据这个结果,对于一个线性变换, 求出属于每个特征值的线性无关的特征向量,把它们合在一起还是线性无关的,如果它们的个数等于空间的维数,那么这个线性变换在一组合适的基下的矩阵是对角矩阵,如果它们的个数少于空间的维数,那么这个线性变换在任何一组基下的矩阵都不能是对角形的.当σ在某基下矩阵B 为对角形时,12n B λλλ⎛⎫ ⎪⎪= ⎪ ⎪⎝⎭σ的特征多项式就是12()()()()B n f λλλλλλλ=---,这说明B 的主对角线上元素正好就是σ的特征多项式的全部根.一个线性变换的矩阵能不能在某一组基下是对角形的问题就相当于一个矩阵是不是相似于一个对角矩阵的问题,因此,我们已经解决了这样一个问题.例1 设线性变换σ在基123,,εεε下的矩阵203122212221A ⎛⎫ ⎪= ⎪ ⎪⎝⎭问σ是否可以对角化?若可以,则将其对角化. 解 在第三章§9例1中,已经箅出A 的特征根是5与1-,1-是二重,A 可以对角化,而对应的特征向量坐标是(1,1,1)与(1,0,1),(0,1,1)--,令1123αεεε=++ ,213αεε=-,323αεε=-,即123123123110(,,)(,,)101(,,)111T αααεεεεεε⎛⎫⎪== ⎪ ⎪--⎝⎭则1231235((),(),())(,,)11σασασαααα⎛⎫⎪=- ⎪ ⎪-⎝⎭即σ在基123,,ααα下的矩阵为对角矩阵,因此1511T AT -⎛⎫⎪=- ⎪ ⎪-⎝⎭§6 线性变换的象与核设(),()n V V F L V σ=∈,V 的子集 {()|}V σξξ∈叫做V 在σ之下的象,或者值域,记作()V σ或Im()σ.σ的象是V 的子空间,事实上,0(0)()V σσ=∈,()V σ非空,,(),,V V αβσξζ∀∈∃∈,使得 (),()ασξβσζ==,,a b F ∀∈,()()()()a b a b a b V αβσξσζσξζσ+=+=+∈.()V σ的维数叫做σ的秩.在σ之下零向量的原象 {|()0}V ξσξ∈=叫做σ的核,记作er()K σ. ,(),,V V αβσξζ∀∈∃∈.σ的核是V 的子空间,事实上,(0)0σ=,0er()K σ∈非空,204 ,()Ker ξζσ∀∈,,a b F ∀∈,()()()000a b a b a b σξζσξσζ+=+=+=.σ的核的维数也称为σ的零度.例 1 2V F =,:(,)(,)a b a a σ,则 (){(,)|}V a a a F σ=∈,(){(0,)|}Ker b b F σ=∈.例2 []n V F x =,:()'()D f x f x ,则 1()[]n D V F x -=,()Ker D F =.例3 n V F =,112:(,,,)(,,,0)n n n x x x x x σ-,则121(){(,,,,0)|}n i V x x x x F σ-=∈,11(){(,0,,0)|}Ker x x F σ=∈.定理1 设12,,,n ααα是V 的一组基, ()L V σ∈,则12()((),(),,())n V L σσασασα=.证明 (),V V ασξ∀∈∃∈,使得 ()ασξ=,1122n n x x x ξααα=+++,112212()()()()((),(),,())n n n x x x L ασξσασασασασασα==+++∈;反过来,112212()()()((),(),,())n n n x x x L σασασασασασα∀+++∈, 11221122()()()()()n n n n x x x x x x V σασασασααασ+++=+++∈设1212((),(),,())(,,,)n n A σασασαααα=则 σ的秩= 12(),(),,()n σασασα的秩=()R A .定理2 设(),()n V V F L V σ=∈,则 dim(())dim(())V Ker n σσ+=. 证明 设12,,,r ααα是()Ker σ的一个基,将它扩充为V 的基,11,,,,,r r n αααα+,则 12()((),(),,())r r n V L σσασασα++= 我们说,20512(),(),,()r r n σασασα++是线性无关的.若 1122()()()0r r r r n n k k k σασασα+++++++=,即1122()0r r r r n n k k k σααα+++++++= 1122()r r r r n n k k k Ker ααασ+++++++∈, 1122r r r r n n k k k ααα+++++++=1122r r k k k ααα+++, 112211220r r r r r r n n k k k k k k αααααα++++----++++=,由11,,,,,r r n αααα+是基,120r r n k k k ++====所以 dim(())dim(())()V Ker n r r n σσ+=-+=.注意,这个结果并不表示()()V Ker V σσ+=, 例3就是一个()()V Ker V σσ+≠的例子.推论1 设(),()n V V F L V σ=∈,则 σ是单射⇔ σ是满射. 证明 “⇐” 若σ是满射,()V V σ= ,dim(())dim(())0Ker n V n n σσ=-=-=,⇒ (){0}K e r σ=,由 ()()()0(){0}Ker σξσζσξζξζσξζ=⇒-=⇒-∈=⇒= ,σ是单射“⇒”若σ是单射,⇒ (){0}Ker σ=dim(())0Ker σ⇒=⇒ dim(())V n σ=⇒ ()V V σ=⇒σ是满射.例4 设()n A M F ∈,2A A =,则 A 与11100B ⎛⎫ ⎪ ⎪ ⎪ ⎪=⎪ ⎪ ⎪ ⎪ ⎪⎝⎭相似,这里()()R B R A =. 证明 取V 的一组基 12,,,n ααα,规定1212((),(),,())(,,,)n n A σασασαααα=, 因此2σσ=,206 V ξ∀∈,()()ξξσξσξ=-+,而 2(())()()0σξσξσξσξ-=-=,所以 ()()V V K e r σσ=+ ()(),V Ker V ασσβ∀∈⋂∃∈,使得()ασβ=,2()()()0ασβσβσα==== ,故()(){0}V Ker σσ⋂=,()()V V Ker σσ=⊕,从()V σ中取一组基 12,,,r βββ,从()Ker σ中取一组基 12,,,r r n βββ++,合起来就是V 的一组基,σ在这组基下的矩阵就是B ,因此A 与B 是同一线性变换在不同基下的矩阵,就有A 与B 相似. §7 不变子空间这一节我们再来介绍一个与线性变换有关的称之为不变子空间的概念,并利用不变子空间来说明线性变换的矩阵的化简与线性变换的内在联系.定义 1 设σ是向量空间V 的线性变换,W 是V 的一个子空间,如果()W W σ⊆,也就是W ξ∀∈,有()W σξ∈,则说W 是一个σ的不变子空间.满足()W W σ⊆时,我们说W 在σ之下不变.例1 V ,{0} ,()V σ,()Ker σ都是σ的不变子空间. V ,{0}叫做σ的平凡不变子空间.例2 设σ是向量空间V 的数乘线性变换,W 是V 的任意一个子空间,则W 是σ的不变子空间.例3 设()L V σ∈,12(,,,)r W L ααα=, 若(),1,2,,i W i r σα∈= ,则W 是σ的不变子空间.例4 设,()L V στ∈,σττσ=,则(),()V K e r ττ 都是σ的不变子空间. 证明 我们知道(),()V Ker ττ都是V 的子空间,(),V V ατξ∀∈∃∈,使()ατξ=,()(())()()(())()V σαστξστξτσξτσξτ====∈,()V τ在σ之下不变.()Ker ατ∀∈,那么()0τα=,(())()()(())(0)0τσατσασταστασ=====, 所以()()Ker σατ∈,207()Ker τ在σ之下不变.作为例4的特例,因为对于(),()[],(),()()()()f x g x F x L V f g g f σσσσσ∈∈=,因此 Im(()),(())f Ker f σσ 都是()g σ的不变子空间.例5 σ的属于特征值λ 的子空间{|(),}V V λξσξλξξ==∈是σ的不变子空间.例6 两个σ的不变子空间的交与和还是σ的不变子空间.设σ是向量空间V 的线性变换,W 是σ的不变子空间,由于W 中向量在σ下的象仍在W 中,这就使得有可能不必在整个空间V 中来考虑,而只须在不变子空间W 中考虑就可以了,即把σ看成是W 的一个线性变换,称为σ在不变子空间W 上的限制,记作|W σ,必须在概念上弄清楚σ和|W σ的异同,σ是V 的线性变换,而|W σ是W 的线性变换,,|()()W W ξσξσξ∀∈=,而对于W ξ∉,|()W σξ没有意义.下面讨论不变子空间与线性变换矩阵化简之间的关系.设(),()n V V F L V σ=∈,W 是σ的一个非平凡不变子空间,在W 中取一组基12,,,r ααα,将它扩充为V 的基11,,,,,r r n αααα+,因为12(),(),,()r σασασα可用12,,,r ααα线性表出,因此V 在这组基下的矩阵就具有下列形状1111111111111210000r r n r rr rr rn r r r n nr nn a a a a a a a a A B a a OA a a ++++++⎛⎫⎪ ⎪⎪⎛⎫= ⎪ ⎪⎝⎭⎪ ⎪ ⎪ ⎪⎝⎭, 并且左上角的r 级矩阵、就是σ 在W 的基12,,,r ααα下的矩阵.如果V 可以写成σ的两个非平凡不变子空间1W 与2W 的直和,12V W W =⊕,在1W 中取一组基12,,,r ααα,在2W 中取一组基12,,,r r n ααα++,合起来就是V 的基,设12121((),(),,())(,,,)r r A σασασαααα=,208 12122((),(),,())(,,,)r r n r r n A σασασαααα++++=则σ 在基12,,,n ααα下的矩阵就是 12AO OA ⎛⎫ ⎪⎝⎭; 反过来,若σ 在基11,,,,,r r n αααα+下的矩阵是 12AO OA ⎛⎫⎪⎝⎭,这里1A 是r 阶的,2A 是n r -阶的, 令1121(,,),(,,)r r n W L W L αααα+==,则12V W W =⊕.一般,如果V 可以写成σ的s 个非平凡不变子空间12,,,s W W W 的直和,12s V W W W =⊕⊕⊕,在每个i W 中取一组基合起来就是V 的基,则σ在这组基下的矩阵就是准对角矩阵12s A A A A ⎛⎫ ⎪⎪= ⎪ ⎪⎝⎭; 其中i A 是σ在i W 的基下的矩阵;反之,如果σ在某基下的矩阵是A ,那么类似于前面2s =的情况,不难证明,V 可以写成σ的s 个不变子空间的直和.由此可知,矩阵分解为准对角形与空间分解为不变子空间的直和是相当的.下面我们应用哈密尔顿-凯莱定理将向量空间V 按特征值分解为不变子空间的直和.定理1 设线性变换σ的特征多项式为()f x ,它可分解成一次因式的乘积1212()()()()s r r r s f λλλλλλλ=---、则V 可分解成不变子空间i W 的直和,12s V W W W =⊕⊕⊕ 其中 {|()0,}i r i i W V ξσλξ=-=∈.证明 {|()0,}(()i ir r i i i W V Ker ξσλξσλ=-=∈=-,所以i W 是σ的不209变子空间,令 ()()()()j iri j r j ii f f λλλλλλ≠==--∏, 因为12,,,s λλλ两两不同,故 12(),(),,()s f f f λλλ互素,存在 12(),(),,()s u u u λλλ使得1122()()()()()()1s s u f u f u f λλλλλλ+++=,故1122()()()()()()s s u f u f u f σσσσσσι+++= (恒等变换)则Vα∀∈,1122()()()()()()()()()s s u f u f u f ασσασσασσα=+++,因为()()()()()()()0ir i i i i u f u f σλισσασσα-==,所以()()()i i i u f W σσα∈,因而12s V W W W =+++,下面来证明0向量的表示法唯一, 设 120s βββ=+++,i i W β∈,因此 ()()0ir i i σλιβ-=,1,2,,i s =而i j ≠时, ()|()i r i j f λλλ-,所以 ()()0j i f σβ=,将120s βββ=+++两边用()j f σ作用,得 0()()j j f σβ=,1122(()()()()()())()0j s s j u f u f u f βσσσσσσβ=+++=于是 12s V W W W =⊕⊕⊕.根据哈密尔顿-凯莱定理,任给数域F 上的一个n 阶矩阵A ,总可找到数域F 上一个多项式()f x ,使得()0f A =,这时我们说,()f x 以A 为根. 定义2 数域F 上以A 为根的次数最低的首1多项式称为A 的最小多项式.首先来看最小多项式的一些基本性质. 引理1 A 的最小多项式是唯一的.证明 设12(),()g x g x 都是A 的最小多项式,根据带余除法,12()()()(),()0g x q x g x r x r x =+=或2(())(())r x g x ∂<∂,210 12()()()()0()0g A q A g A r A r A =+=⇒=,由最小多项式的定义知,()0r x =,因此,21()|()g x g x ,同样可证12()|()g x g x ,又因12(),()g x g x 的首项系数都等于1,所以12()()g x g x =.应用同样的方法,可证下述引理2.引理2 设()g x 是A 的最小多项式,()[]f x F x ∈,()0f A =,则 ()|()g x f x .因此A 的最小多项式是A 的特征多项式的一个因式.例7 数乘矩阵kE 的最小多项式为k λ-,特别地,单位矩阵E 的最小多项式为1λ- ,零矩阵的最小多项式为λ反过来, 如果A 的最小多项式是k λ-,那么A 一定是数量矩阵kE . 例8 设1111A ⎛⎫ ⎪= ⎪ ⎪⎝⎭求4的最小多项式,解 因为A 的特征多项式为 3()||(1)f E A λλλ=-=-,所以A 的最小多项式为3(1)λ-的因式,但,20,()0A E A E -≠-=,因此A 的最小多项式为2(1)λ-.如果矩阵A 与B 相似,即1B T AT -=,()g x 是A 的最小多项式,因此()0g A =可得1()()0g B T g A T -==,由此可知,相似的矩阵有相同的最小多项式.要注意的是这个条件并不是充分的,即最小多項式相同的矩阵不一定是相似的,例如111111,1222A B ⎛⎫⎛⎫ ⎪ ⎪⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭211的最小多项式都等于2(1)(2)λλ--,但是它们的特征多项式不同,因此A 与B 不是相似的.引理3 设12AA A ⎛⎫= ⎪⎝⎭()i g λ是i A 的最小多项式,1,2i = ,则A 的最小多项式为12[(),()]g g λλ.证明 记 ,由11()0g A =和22()0g A =,得 ()0g A =若有()h λ,满足 12()()0()h A h A h A ⎛⎫== ⎪⎝⎭ ,则1()0h A =, 2()0h A = 1212()|(),()|()[(),()]|()g h g h g g h λλλλλλλ⇒,即12[(),()]g g λλ是A的最小多项式.这个结论可以推广到A 为若干个矩阵组成的准对角形矩阵的情形,即:如果12s A A A A ⎛⎫ ⎪⎪= ⎪ ⎪⎝⎭()i g λ是i A 的最小多项式,1,2,,i s = ,则A 的最小多项式为12[(),(),,()]s g g g λλλ.定理 2 数域F 上n 阶矩阵A 可对角化⇔A 的最小多项式是F 上互素的一次多项式的乘积.证明 “⇒” 若A 可对角化,由引理3的推广的情况,显然结论成立; “⇐”若A 的最小多项式是F 上互素的一次多项式的乘积,12()()()()s g λλλλλλλ=---,这里12,,,s λλλ互不相同,令 ()()()i j j ii g g λλλλλλ≠==--∏,则12(),(),,()s g g g λλλ互素 存在212 12(),(),,()s u u u λλλ,使得1122()()()()()()1s s u g u g u g λλλλλλ+++=,故1122()()()()()()s s u g u g u g σσσσσσι+++= (恒等变换)则Vα∀∈,1122()()()()()()()()()s s u g u g u g ασσασσασσα=+++,因为()()()()()()()0i i i i u g u g σλισσασσα-==,所以()()(){|()()0,}i i i i u g V V λσσαξσλιξξ∈=-=∈,因而 12s V V V V λλλ=+++,下面来证明0向量的表示法唯一, 设 120s βββ=+++,i i V λβ∈,因此 ()()0i i σλιβ-=,1,2,,i s =而i j ≠时, ()|()i j g λλλ-,所以 ()()0j i g σβ=,将120s βββ=+++两边用()j g σ作用,得 0()()j j g σβ=,1122(()()()()()())()0j s s j u g u g u g βσσσσσσβ=+++=于是 12s V V V V λλλ=⊕⊕⊕,所以σ可以对角化.把这个结论应用到复数域上矩阵,就有:A 与对角矩阵相似的充分必要条件是A 的最小多项式没有重根. §8 若当标准形从上面的讨论可以知道,并不是对于每一个线性变换σ都有一组基,使它在这组基下的矩阵成为对角型. 但是从上节定理1我们知道,存在V 的一个基,使得线性变换σ在这组基下的矩阵是准对角形的,下面我们要搞清楚这个准对角形矩阵的每一块可具体化为更简单的形式. 进一步得出在适当选择的基下, 一般的一个线性变换的矩阵能化简成若当形矩阵.213定义1 1(,)11J i λλλλλ⎛⎫⎪ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭叫做一个若当块,其中C λ∈,i 是这个矩阵的阶数. 若干个若当块组成的准对角矩阵叫做若当形矩阵.例如21212⎛⎫ ⎪ ⎪ ⎪⎝⎭, 2123⎛⎫⎪ ⎪ ⎪⎝⎭第一个是若当块,第二个是由一个2阶若当快和一个1阶若当块构成的若当形矩阵.容易看出若当块1(,)11J i λλλλλ⎛⎫⎪ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭的最小多项式就是()()i i g x x λ=- . 在这一节,我们的讨论限制在复数域中.引理1 ()L V τ∈,若 存在V ξ∈,使得 ()0k τξ=,但是 1()0k τξ-≠,则1,(),,()k ξτξτξ-线性无关.证明 设 1011()()0k k x x x ξτξτξ--+++=用1k τ- 作用上式,得100()00k x x τξ-=⇒=,上式变成了21121()()()0k k x x x τξτξτξ--+++=214 用2k τ- 作用上式,得111()00k x x τξ-=⇒=,上式变成了231231()()()0k k x x x τξτξτξ--+++=继续下去,最后得11()0k k x τξ--=0k x ⇒=引理2 设W 是r 维向量空间,()L W τ∈,,()0r W ξτξ∀∈=,则存在W 的一组基,τ在这组基下矩阵为若当形矩阵. 其主对角线上元素全为0.证明 取W 的一组基12,,,r ξξξ,τ在这组基下的矩阵为下三角矩阵,设111()0,()0k k τξτξ-=≠,由引理1,1111,(),,()k ξτξτξ-线性无关,由替换定理,不妨设11111,(),,(),,,k k r ξτξτξξξ-+与12,,,r ξξξ等价,τ在基11111,(),,(),,,k k rξτξτξξξ-+下的矩阵为A ,即1111111111(,(),,(),,,)(,(),,(),,,)k k k r k r A τξτξτξξξξτξτξξξ--++=212111110101k n kk kn k k k n nk rr a a A a a a a a a ++++++⎛⎫ ⎪ ⎪⎪ ⎪=⎪ ⎪⎪ ⎪ ⎪⎝⎭121111()()(),1,2,,k i i ki k i k ri r a a a a i k k rτξτξτξξξ-++=+++++=++,令2213111()()k i i i i k i a a a ηξξτξτξ--=----,则11111,(),,()k k r ξτξτξηη-+还是基,11(),1,2,,i k i k ri r a a i k k r τηξξ++=++=++,即2151111111111(,(),,(),,,)(,(),,(),,,)k k k r k r B τξτξτξηηξτξτξηη--++=1111000100100k k k n nk rr B b b b b ++++⎛⎫ ⎪ ⎪ ⎪ ⎪=⎪ ⎪⎪ ⎪ ⎪⎝⎭11111(,(),,())(,,)k k r W L L ξτξτξηη-+=⊕,对11(,,)k r W L ηη+=,继续上面的过程,一直下去,最后可找到W 的一组基,τ在这组基下矩阵为若当形矩阵. 其主对角线上元素全为0. 每个若当块的大小由满足1()0,()0k k i i τξτξ-=≠的k 决定. 这个若当矩阵的秩等于最大的1k -,如果我们每次取的1()0,()0k k i i τξτξ-=≠都是最大的,可以同样的方法考虑去掉这个若当块而作成的若当形矩阵,这样这个若当形矩阵的若当块的大小和次序就决定了.在上节定理1中,{|()0,}(())i ir r i i i W V Ker ξσλξσλ=-=∈=-,且dim()i i W r =,我们来看如何选取i W 的基.令i τσλ=-,因为dim()i i W r =,且,()0i r i W ξτξ∀∈=,由引理2,则存在i W 的一组基,τ在这组基下矩阵为若当形矩阵. 其主对角线上元素为0.i στλ=+,则σ在这组基下矩阵为上面若当形矩阵加上i E λ,即除主对角线上元素为i λ外,其余与τ在这组基下矩阵相同. .对于每一个{|()0,}i r i i W V ξσλξ=-=∈,存在i W 的一组基,使得线性变换|i W σ在这组基下的矩阵是一个若当形矩阵,这个若当块主对角线上的元素是i λ,它由i W 和|i W σ决定. 把所有i W 的这种基合起来就是V 的一组基, σ在这组基下的矩阵就是一个若当形矩阵. 因为相似的矩阵有相同的特征多项式,所以两个含有不同特征根(包括重根个数)的若当形矩阵不可能相似,对于同一个特征根而言,考虑i W ,由引理2,τ在i W 的一组基下矩阵为若当形矩阵. 其主对角线上元素全为0.若当块的大小由满足216 1()0,()0k k i i τξτξ-=≠的k 决定. 这个若当形矩阵的秩等于最大的1k -,因为相似的矩阵有相同的秩,所以相似的矩阵有相同的最大若当块,我们可以同样的方法考虑去掉这个若当块而作成的若当形矩阵因此有定理1 设σ是复数域上向量空间V 的一个线性变换,则在V 中必定存在一组基,使V 在这组基下的矩阵是若当形矩阵. 且除了若当块排列次序外是唯一的. 叫做σ的若当标准形. §9 λ-矩阵的概念上面若当形矩阵相似结论是借助于线性变换的不变子空间的直和分解及取适当基向量来达到证明的,这是用线阵变换的工具来解决矩阵问题的范例,但这种方法用于实际计箅判断两个矩阵何时是否相似的问题,却不见得是最方便的,λ-矩阵理论采用纯矩阵方法的方法能够直接通过计算来判断,并且能得到若当标准形的唯一性清楚证明和解决有理标准形的问题.设F 是一个数域,以F [λ]中的多项式为元素的m ⨯n 矩阵称为λ-矩阵,记为111212122212()()()()()()()()()()n n m m mn f f f f f f A f f f λλλλλλλλλλ⎛⎫⎪ ⎪= ⎪⎪⎝⎭,简记为A (λ)=( f ij (λ))mn . m ⨯n 的λ-矩阵的全体记作F [λ]m ⨯n .显然,F m ⨯n ⊂F [λ]m ⨯n .因此,λ-矩阵是数域F 上矩阵的推广.矩阵A 的特征矩阵E A λ-就是一个n 阶λ-矩阵.一个λ-矩阵中所含多项式的最高次数叫做这个λ-矩阵的次数,记作deg A (λ).若deg A (λ)=t ,则A (λ)可表示为 1011()t t t t A A A A A λλλλ--=++++,其中A i ∈F m ⨯n ,i =0,1,…,t .例如23222312214()323243A λλλλλλλλλλλλ⎛⎫+++ ⎪++- ⎪= ⎪ ⎪ ⎪+⎝⎭。

高等代数线性变换解析

高等代数线性变换解析

(3)
A ( BC ) = ( A B )C
(4) k( AB ) = ( kA )B = A ( kB ) 例1 在R 2中,设A(x, y)=(y, x),B(x, y)=(0, x),则A, B是R2中的 线性变换,求A + B,AB,BA,3A-2B。
线性变换
§2 线性变换的运算
三、可逆的线性变换
A m n A m A n ,
(A m )n A mn ,
m, n N
若A是可逆的,则以上法则对任意整数m,n都成立。
注意: 由于线性变换的乘法不满足交换律,故( AB ) ≠ A B 。
n
n n
线性变换 定义5 设
§2 线性变换的运算
f ( x) an xn an1xn1 a1x a0 P[ x]
线性变换
§3 线性变换的矩阵
定理2 设 1 , 2 ,, n 是数域 P 上 n 维线性空间 V 的一组基,
A, B∈L(V), 且 A, B 在这组基下的矩阵分别为A和B,则在该 组基下: (1) A + B 的矩阵是 A+B;
(2) AB 的矩阵是 AB; (3) kA 的矩阵是 kA; (4) 若A 是可逆的,则矩阵 A 也可逆,且A-1的矩阵是A-1。
矩阵的相似性是由 线性变换所决定的
则 B 为线性变换 A 在基 1 ,2 ,,n 下的矩阵。 A A
1 , 2 ,, n
A可逆的充要条件是它在 一组基下的矩阵A可逆
例5 设 V是数域P上的n维线性空间,则L(V)与P n×n同构。
例6 设 A1,A2是 n 维线性空间 V 的两个线性变换,证明: A2V⊂A1V 的充要条件是存在线性变换 A 使得 A2=A1A 。

高等代数(第7章)

高等代数(第7章)

例如,零变换将线性无关的向量组变成线性相关 的向量组.
§7.2 线性变换的运算
设V是数域P上的线性空间, 、是V的两个线 性变换. 1.线性运算 (1)加法: 与的和定义为 ( +)()=()+() ( V) (2)数量乘法:数域P中的数k与的数量乘法定义为 (k)( ) =k(()) ( V) (3) 负变换:的负变换 -定义为 (-)()= - () ( V) 结论:线性空间V上的线性变换的全体,对于如上定 义的加法与数乘运算构成数域P上的线性空间.即
例2 设是几何空间中一个固定的非零向量, 将每个 向量变到它在上的内射影的变换
( , ) ( ) ( , ) .
( )


是一个线性变换.
2.线性变换的简单性质 设 是数域P上线性空间V的一个变换. (i)(0)=0, (-)= - (), V. (ii)(k11+…+ kmm)= k1(1) +…+ km(m) i V, ki P (i=1,2,…,m) (iii) 设i V, (i=1,2,…,m) .若 1,2,…,m线性相关,则 (1),(2),…,(m)线性相关;反之不然.
线性变换被基向量的像唯一确定!
定理1: 设1, 2,…,n是数域P上n维线性空间V 的一组 基, 1,2,…,n是V中任意n个向量,则存在唯一的线性 变换使 (j)= j , j=1,2,…,n.
证明:(i)存在性
x i i V , 定义V的变换: x i i .
仍是线性变换
()()=(()) ( V)
运算律: (i)()= () (ii) (+) = + , (+)+= +(+) (iii)k()=(k)= (k) 注意:线性变换的乘积一般是不可交换的,即 . 例1 在P22中,定义线性变换、 、为

高等代数第7章线性变换PPT课件

高等代数第7章线性变换PPT课件

特征向量定义
对应于特征值m的非零向量x称为A的对应于特征值 m的特征向量。
设A是n阶方阵,如果存在数m和非零n维列向 量x,使得Ax=mx成立,则称m是A的一个特 征值。
求解方法
通过求解特征多项式f(λ)=|A-λE|的根得到特 征值,再代入原方程求解对应的特征向量。
特征多项式及其性质分析
特征多项式定义
量子力学
在量子力学中,特征值和特征向量用 于描述微观粒子的状态和能量级别。
图像处理
在图像处理中,特征值和特征向量可 以用于图像压缩和图像识别等任务。
经济学
在经济学中,特征值和特征向量可以 用于分析和预测经济系统的稳定性和 发展趋势。
04
线性变换对角化条
件及步骤
可对角化条件判断方法
判断矩阵是否可对角化
线性变换的性质与 矩阵性质对应
线性变换的性质如保持加法、 数乘等运算可以通过其对应的 矩阵性质来体现。例如,两个 线性变换的和对应两个矩阵的 和;线性变换的复合对应两个 矩阵的乘积等。
02
线性变换矩阵表示

标准基下矩阵表示法
定义
设V是n维线性空间,e1,e2,...,en 是V的一个基,T是V上的一个线 性变换,则T在基e1,e2,...,en下的 矩阵A称为T在基e1,e2,...,en下的 标准矩阵表示。
计算矩阵的高次幂
对于可对角化的矩阵A,可以利用对角化公式A=PDP^(-1)将A的高次幂转化为对角矩阵D的高次幂, 从而简化计算过程。
求解线性方程组
对于系数矩阵为可对角化矩阵的线性方程组,可以通过对角化将系数矩阵转化为对角矩阵,进而 简化方程组的求解过程。
计算行列式和逆矩阵
对于可对角化的矩阵A,其行列式值等于对角矩阵D的行列式值,逆矩阵可以通过对角化公式求得, 从而简化相关计算。

高等代数第7章线性变换[1]

高等代数第7章线性变换[1]
于是Aa = Ba. 由a的任意性,知 A = B.
推论 设e1, e2, …, en是线性空间V的一
组基, 如果V的两个线性变换A与B在这
组基上的作用相同,即
Aei = Bei ,
则必有 A = B.
推论 设x1, x2, …, xs是n维线性空间V的一
组线性无关向量, a1,a2,…,as是V中任意取
二、线性变换在一组基下的矩阵
定义 设e1, e2, …, en是数域P上n维
线性空间V的一组基,A是V的线性变
换,则基向量的象可唯一地被基线
性表示为
Ae1 a11e1 a21e 2 an1e n
Ae 2 a12e1 a22e 2 an2e n
Ae n a1ne1 a2ne 2 anne n
D是一个线性变换,称为微分变换.
例7 闭区间[a, b]上所有连续函数全体 组成实数域R上的线性空间C0(a, b). 定义变换
x
则J是一个J(线f (性x))变=换.a f (t)dt
二、线性变换的简单性质
1、设A是线性空间V的一个线性变换,则
A(0) = 0, A(-a) = - A(a)
2、线性变换保持向量的线性组合与线性 关系式不变.即若

定义 设V是数域P上的n维线性空间,
A :VV为V的一个变换, 若对任意a,bV
和数kP, 都有
A(a + b ) = A(a) + A(b)
A(ka) = kA(a)
则称A是线性空间V的一个线性变换. (linear transformation).
称A(a)或Aa为向量a在线性变换A下的
象(image).
2、(1)交换律 A +B =B +A (2)结合律 (A+B)+C =A+(B+C) (3)零变换 A+O =A (4)负变换 A+(-A) = O

线性变换与线性方程组

线性变换与线性方程组

线性变换与线性方程组在数学中,线性变换与线性方程组是线性代数的重要概念。

线性变换是一种将一个向量空间映射到另一个向量空间的变换,而线性方程组是一组线性方程的集合,其中每个方程都表示了一条直线的方程。

在本文中,我们将探讨线性变换和线性方程组的定义、性质以及它们之间的关系。

首先,我们介绍线性变换的概念。

线性变换是指保持向量空间中向量加法和数乘运算的变换。

设V和W是两个向量空间,那么一个从V 到W的映射T被称为线性变换,如果满足以下两个条件:1. 对于任意向量u和v以及标量c,T(u+v)=T(u)+T(v)和T(cu)=cT(u)。

2. T(0)=0,其中0表示向量空间的零向量。

通过定义我们可以看出,线性变换保持向量的线性组合关系。

线性变换有许多重要的性质,例如,它们保持原点、线性运算和零向量。

接下来我们讨论线性方程组。

线性方程组是由一组包含未知数的线性方程组成的方程组。

通常情况下,线性方程组的未知数被表示为向量x=(x1,x2,...,xn),其中每个xi代表一个未知数。

一个线性方程组可以用矩阵形式表示为Ax=b,其中A是系数矩阵,b是常数向量。

一个线性方程组可以有三种解的情况:无解、唯一解或无穷解。

一个线性方程组无解意味着方程组中存在矛盾的方程,而一个线性方程组有唯一解意味着方程组中的每个方程均有唯一解,没有矛盾或重复的方程。

一个线性方程组有无穷解意味着方程组中的方程存在一些自由变量,可以通过线性组合产生无穷多的解。

线性变换与线性方程组之间存在紧密的联系。

我们可以将线性方程组视为一个矩阵方程Ax=b,其中A是线性变换的矩阵表示。

解线性方程组就是找到一个向量x,使得Ax=b成立。

而解线性方程组实质上是求解线性变换的核空间,即线性变换将所有映射到零向量的向量集合。

线性变换和线性方程组在实际应用中具有广泛的应用。

例如,在机器学习中,线性变换和线性方程组被用于数据的降维和特征提取。

在工程学中,线性变换和线性方程组被用于模拟和分析电路。

高等代数选讲第五讲 线性变换

高等代数选讲第五讲 线性变换

( 3 ) (0,0,1) (0,0,0)
1 0 0 ( 1 , 2 , 3 ) ( 1 , 2 , 3 ) 0 1 0 1 1 0
15
2、线性变换运算与矩阵运算
定理2 设 1 , 2 ,, n 为数域P上线性空间V的一组
2、线性变换保持线性组合及关系式不变,即 若 k11 k2 2 kr r , 则 ( ) k1 (1 ) k2 ( 2 ) kr ( r ).
3、线性变换把线性相关的向量组变成线性相关的
向量组.
4
注意
3的逆不成立,即 1 , 2 , , r 线性相关, 1 , 2 ,, r未必线性相关.
(2) E E ,E为单位变换
(3)交换律一般不成立,即一般地,
6
例1
线性空间 R[ x]中,线性变换
D f x f x
J f x f t dt
x 0
x
DJ f xP 设线性空间 的线性变换 为
( x1 , x2 , x3 ) ( x1 , x2 , x1 x2 )
求 在标准基 1 , 2 , 3 下的矩阵. 解: ( 1 ) (1,0,0) (1,0,1)
( 2 ) (0,1,0) (0,1,1)
基,在这组基下,V的每一个线性变换都与 P
n n

的唯一一个矩阵对应,且具有以下性质:
(1) 线性变换的和对应于矩阵的和; (2) 线性变换的乘积对应于矩阵的乘积; (3) 线性变换的数量乘积对应于矩阵的数量乘积;
16
(4) 可逆线性变换与可逆矩阵对应,且逆变换对应 于逆矩阵.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

最近想知道特征值、特征值到底有什么物理意义,搜到了这篇文章,共享一下。

来源:孙哲的日志[1. 特征的数学意义]我们先考察一种线性变化,例如x,y坐标系的椭圆方程可以写为x^2/a^2+y^2/b^2=1,那么坐标系关于原点做旋转以后,椭圆方程就要发生变换。

我们可以把原坐标系的(x,y)乘以一个矩阵,得到一个新的(x',y')的表示形式,写为算子的形式就是(x,y)*M=(x',y')。

这里的矩阵M代表一种线性变换:拉伸,平移,旋转。

那么,有没有什么样的线性变换b(b是一个向量),使得变换后的结果,看起来和让(x,y)*b像是一个数b乘以了一个数字m*b? 换句话说,有没有这样的矢量b,使得矩阵A*b这样的线性变换相当于A在矢量b上面的投影m*b? 如果有,那么b就是A的一个特征向量,m就是对应的一个特征值。

一个矩阵的特征向量可以有很多个。

特征值可以用特征方程求出,特征向量可以有特征值对应的方程组通解求出,反过来也一样。

例如,设A为3阶实对称矩阵,a1=(a,-a,1)T是Ax=0的解,a2=(a,1,-a)T是(A+E)x=0的解,a≠2,则常数a=? 因为a1=(a,-a,1)T 是Ax=0的解,说明a1=(a,-a,1)T是A的属于0的特征向量,a2=(a,1,-a)T是(A+E)x=0的解,说明a2=(a,1,-a)T是A的属于-1的特征向量。

实对称矩阵属于不同特征值的特征向量式正交的,所以a^2-a-a=0,a≠2,所以a=0。

还是太抽象了,具体的说,求特征向量的关系,就是把矩阵A所代表的空间,进行正交分解,使得A的向量集合可以表示为每个向量a在各个特征向量上面的投影长度。

例如A是m*n的矩阵,n>m,那么特征向量就是m个(因为秩最大是m),n个行向量在每个特征向量E 上面有投影,其特征值v就是权重。

那么每个行向量现在就可以写为Vn=(E1*v1n,E2*v2n...Em*vmn),矩阵变成了方阵。

如果矩阵的秩更小,矩阵的存储还可以压缩。

再: 由于这些投影的大小代表了A在特征空间各个分量的投影,那么我们可以使用最小2乘法,求出投影能量最大的那些分量,而把剩下的分量去掉,这样最大限度地保存了矩阵代表的信息,同时可以大大降低矩阵需要存储的维度,简称PCA 方法。

举个例子,对于x,y平面上的一个点(x,y),我对它作线性变换,(x,y)*[1,0;0,-1],分号代表矩阵的换行,那么得到的结果就是(x,-y),这个线性变换相当于关于横轴x做镜像。

我们可以求出矩阵[1,0;0,-1]的特征向量有两个,[1,0]和[0,1],也就是x轴和y轴。

什么意思呢? 在x轴上的投影,经过这个线性变换,没有改变。

在y轴上的投影,乘以了幅度系数-1,并没有发生旋转。

两个特征向量说明了这个线性变换矩阵对于x轴和y轴这两个正交基是线性不变的。

对于其他的线性变换矩阵,我们也可以找到类似的,N个对称轴,变换后的结果,关于这N个对称轴线性不变。

这N个对称轴就是线性变换A的N个特征向量。

这就是特征向量的物理含义所在。

所以,矩阵A等价于线性变换A。

对于实际应用的矩阵算法中,经常需要求矩阵的逆:当矩阵不是方阵的时候,无解,这是需要用到奇异值分解的办法,也就是A=PSQ,P 和Q是互逆的矩阵,而S是一个方阵,然后就可以求出伪逆的值。

同时,A=PSQ可以用来降低A的存储维度,只要P是一个是瘦长形矩阵,Q是宽扁型矩阵。

对于A非常大的情况可以降低存储量好几个数量级。

[2. 物理意义]特征向量有什么具体的物理意义? 例如一个驻波通过一条绳子,绳子上面的每个点组成一个无穷维的向量,这个向量的特征向量就是特征函数sin(t),因为是时变的,就成了特征函数。

每个点特征值就是每个点在特定时刻的sin(x+t)取值。

再如,从太空中某个角度看地球自转,虽然每个景物的坐标在不断的变换,但是这种变换关于地球的自传轴有对称性,也就是关于此轴的平移和拉伸的坐标变换不敏感。

所以地球自转轴,是地球自转这种空间变换的一个特征向量。

Google 的PageRank,就是对www链接关系的修正邻接矩阵的,主要特征向量的投影分量,给出了页面平分。

有什么特性呢? AB和BA有相同的特征向量----设AB的特征向量为x,对应的特征值为b,则有(AB)x = bx,将上式两边左乘矩阵B,得B(AB)x = (BA)(Bx) = b(Bx),故b 为BA的特征值,对应的特征向量为Bx。

反之亦然。

什么是特征矩阵和特征值?我们用整体论来考虑,假设P(A)=(1,2,3)是A的3个特征向量。

那么P(A^2)就是(1^2,2^2,3^2),P可以看作是一种算子。

当然,算子的特性是需要用部分/细节详细证明的。

一旦证明,就可以作为整体的特征。

特征值有什么特性?说明矩阵可以分解成N维特征向量的投影上面,这N个特征值就是各个投影方向上的长度。

由于n*n矩阵A可以投影在一个正交向量空间里面,那么任何N维特征向量组成的矩阵都可以是线性投影变换矩阵,那么I就是一个同用的线性变换投影矩阵。

所以对于特征值m,一定有是够成了一个没有线性无关向量的矩阵Aa=ma两边同乘以I得到Aa=maI,所以(A-mI)a=0有非0解,那么|A-mI|=0(可以用反正法,如果这个行列式不是0,那么N个向量线性无关,在N维空间中只能相交于原点,不可能有非0解)。

所以可以推出一些很有用的性质,例如A=[1/2,1,1;0,1/3,1;0,0,1/5],那么只要满足|A- mI|=0的值就是特征值,显然特征值数组立即可以得到(1/2,1/3,1/5)。

一个n*n的矩阵A,秩=1,那么最大线性无关组=1组,特征向量=1个,任意n 维非零向量都是A的特征向量。

特征向量本身不是定死的,这就好比坐标系可以旋转一样。

一旦特征向量的各个方向确定了,那么特征值向量也就确定了。

求特征值的过程就是用特征方程:|A-mE|=0,P(1/A)=1/P(A),可以证明。

有什么物理含义呢?一个N 维线性无关的向量,去掉其中的一维,那么就有至少两个向量是线性相关的了,所以行列式=0。

特征矩阵有什么作用?把矩阵变化为正定矩阵,也就是A=P^-1BP,这样的变换,A是对角阵。

线性代数的研究,是把向量和矩阵作为一个整体,从部分的性质出发,推到出整体的性质,再由整体的性质得到各种应用和物理上的概念。

当矩阵A是一个符号的时候,它的性质会和实数a有很多相似的地方。

科学的定理看起来总是递归着的。

再举一个例子,高数的基本概念有微分,积分,倒数,那么我立刻可以想到中值定理就应该有3个,形式上分别是微分,积分和倒数。

[3. 应用的场景]线性变换的缺点:线性变换PCA可以用来处理图像(可以搜一下百度有详细的介绍)。

如2维的人像识别:1. 我们把图像A看成矩阵,进一步看成线性变换矩阵,把这个训练图像的特征矩阵求出来(假设取了n个能量最大的特征向量)。

用A乘以这个n个特征向量,得到一个n维矢量a,也就是A在特征空间的投影。

2. 今后在识别的时候同一类的图像(例如,来自同一个人的面部照片),认为是A的线性相关图像,它乘以这个特征向量,得到n个数字组成的一个矢量b,也就是B在特征空间的投影。

那么a和b之间的距离就是我们判断B是不是A的准则。

不过,PCA有天生的缺点,就是线性矢量的相关性考察有"平移无关性"优点的同时,也完全忽略了,2维图形中,矢量分量之间的顺序是有意义的,顺序不同可以代表完全不同的信息。

还有,就是图像B 必须是A的某种伸缩(由特征向量空间决定的),才能被很好的投影到A的特征向量空间里面,如果B包含了A中的某种旋转因素,那么PCA可以彻底失效。

所以实际应用中PCA的方法做图像识别,识别率并不高,它要求图像有某种严格的方向对齐和归一化。

所以PCA一般不用来做直接的特征提取而是用来做特征矩阵的降维。

当然,降维的结果用于分类并不理想,我们可以进一步做最小二承法拉开类间距离的Fisher变换。

但是Fisher变换会引入新的弱点,那就是对于训练类别的数据变得更敏感了,分类效果上升的代价是通用性下降,当类型数量急剧膨胀的时候,分类效果的函数仍然是直线下降的----但是还是比直接PCA的分类效果好得多。

PCA"主观"的认为,一个类型的第N+1个矩阵可以由之前已知的[1,N]个矩阵通过拉成向量来线性表出。

显然这只是一个美好的主观愿望,因为即使新的输入矩阵是原有矩阵作了一些行列的初等变换如交换等,这种拉直以后的线性表出也可能根本就不存在(2维的PCA同样无法克服这个客观不存在的设定),于是,当应用到实际的时候,只能试图做优化没,用最小二乘距离来判定,"认为"那个矩阵就是属于某个分类。

由于PCA训练的特征矩阵是一个类别一个矩阵,这些矩阵构成的子空间之间又无法保证正交,于是投影的结果也不具有根本意义上的分类特性。

这个算法是个实用的算法,但是理论上根本就是无解。

K-L变换是PCA的一个应用形式。

假设图像类型C有N个图像,那么把每个图像拉直成一个向量,N个图像的向量组成一个矩阵,求矩阵的特征向量(列向量)。

那么用原来的N个图像乘以这些列向量求出平均值,就是我们的特征图像。

可以看到特征图像和原图像有相似的地方,但是去掉了和拉伸,平移相关的一些形变信息。

在得到了鲁棒性的同时,牺牲了很多精确性。

所以它比较适合特定范围图像的Verification工作,也就是判断图像P是不是属于类型C。

对比一下神经网络:说白了把函数y=f(x)的映射,变成了[y]=[f(x)]的向量映射。

输入输出的点(entry)是固定的。

而真实的神经系统,并没有明显的内部处理和外部接口的区分。

所以所有的神经网络理论,名字上是神经网络,实质上,差得很远。

[4. 关于谱]什么是"谱"(Spectrum)? 我们知道音乐是一个动态的过程,但是乐谱却是在纸上的,静态的存在。

对于数学分析工具,研究时变函数的工具,可以研究傅立叶变换对应的频率谱;对于概率问题,虽然每次投色子的结果不一样,但是可以求出概率分布的功率谱密度。

数学作为一种形而上学工具,研究的重点,就是这个变化世界当中那些不变的规律。

[5. 能用于分类吗]所谓的特征矩阵,就是原矩阵如何与一个x维的数量矩阵相似。

Lamda(i)说明了相似投影与一个x维线性空间的第i维坐标轴,Lamda(i)是放缩比例。

Lamda(i)之间的顺序是不重要的,因为坐标轴之间的交换是初等线性变换,不影响代数拓扑的性质。

特征向量xi 表明A如何把线性组合投影到一个坐标轴上。

所谓的特征向量,就是一组正交基集合。

在图像处理的问题域中,把图像看成矩阵本身,那么图像的分类问题就是同类矩阵被认为有相同或者代数近似的"不变量"。

相关文档
最新文档