线性代数应该这样学4:线性映射,单射与满射,零空间与像空间,线性映射基本定理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

线性代数应该这样学4:线性映射,单射与满射,零空间与像空间,线性映射基本定理
在本系列中,我的个⼈见解将使⽤斜体标注。

每篇⽂章的最后,我将选择摘录⼀些例题。

由于⽂章是我独⾃整理的,缺乏审阅,难免出现错误,如有发现欢迎在评论区中指正。

⽬录
Part 1:线性映射
线性映射让线性代数不再是静态的⼀门学科,有了线性映射,线性空间中的向量就可以动起来。

这⼀章同时也在告诉读者,向量不只是狭义的数组。

线性映射(linear map) 从V到W的线性映射是具有下列性质的函数T:V→W:
加性(additivity):∀u,v∈V,有T(u+v)=Tu+Tv。

齐性(homogeneity):∀λ∈F和v∈V,有T(λv)=λ(Tv)。

注意线性映射的加性和齐性是缺⼀不可的,它们并没有相互包含的关系。

线性映射的集合(V,W)代表从V到W的所有线性映射。

在(V,W)中,每⼀个线性映射T是⼀个集合内的元素,要搞清楚集合的基本元素是什么。

由于V,W都是线性空间,所以不可避免地要讨论线性空间的维数和基。

可以直观地想象⼀下,如果⼀个线性映射T确定了集合中每⼀个基向量v1,⋯,v n的取值,那么V中的任何向量v在W中的像Tv也随之确定,因为v只能由v1,⋯,v n唯⼀表⽰。

这个性质直接引出了下⾯的定理。

线性映射与基设v1,⋯,v n是V的基,w1,⋯,w n∈W,则存在唯⼀⼀个线性映射T:V→W使得对任意j=1,⋯,n,都有
Tv j=w j.
这⾥需要先说明两个线性映射相等指的是什么,如果两个线性映射把任意V中的v都映射到同⼀个像上,就称它们是同⼀个线性映射。

从我们刚才的分析来看,只要两个线性映射对所有基的成像都相同,它们就是同⼀个线性映射。

⾸先证明这样的线性映射存在。

定义T为
T(c1v1+⋯+c n v n)=c1w1+⋯+c n w n,
显然只要取c i=1,当j≠i时c j=0,就有Tv j=w j。

下验证T∈(V,W),即满⾜加性和齐性。

⾸先∀λ∈F,v=c1v1+⋯+c n v n,有
T(λv)=T(λc1v1+⋯+λc n v n)=λT(c1v1+⋯+c n v n)=λTv,
另外对于u=a1v1+⋯+a n v n,有
T(u+v)=(a1+c1)Tv1+⋯+(a n+c n)Tv n=Tu+Tv.
这⾥写得很简略,展开以后可以⽴即得出,就不详叙了。

接下来要证明这样的线性映射是唯⼀的,即任何S∈(V,W),如果它满⾜Sv j=w j,则
∀v=c1v1+⋯+c n v n,有
Sv=c1Sv1+⋯+c n Sv n=c1w1+⋯+c n w n=Tv,
故S=T。

刚才我们所构建的(V,W)只是⼀个集合,⼀个集合如果不具有运算,那么集合内部就没有结构,只是⼀个元素的集合体。

现在,我们可以给(V,W)内定义运算,从⽽使它具有更多的性质。

(V,W)上的加法和标量乘法:
定义S+T为V到W的线性映射,满⾜对⼀切v都有
(S+T)v=Sv+Tv.
定义λT是V到W的线性映射,满⾜对⼀切v都有
(λT)v=λ(Tv).
这⾥需要思考,这样定义出来的S+T与λT是否是线性映射(实际上肯定是,但是需要验证)。

同时,要将(V,W)上的加法、标量乘法与线性映射的加性、齐性区分开,这两个是完全不同的东西。

加上了定义之后,我们可以验证(V,W)是⼀个线性空间。

回顾线性空间的定义条件,加法、乘法、交换性、结合性、分配性质都是容易验证的,乘法单位元也是显然的,⽽加法单位元应该是0映射:∀v,0v=0。

要注意,这⾥第⼀个0既不是0向量,也不是标量0,⽽是⼀个线性映射:0∈(V,W),它将v上的所有向量映射到W空间的加法单位元0。

线性映射的乘积(product of linear maps) 若L∈(U,V),S∈(V,W),则定义线性映射的乘积ST为:
∀u∈U,ST(u)=S(Tu)∈W.
注意到,如果我们把每⼀个线性映射看成线性空间⾥的⼀个向量,⼀般的向量乘积是没有定义的,但线性映射却可以定义乘积,这是它与⼀般向量的不同之处。

实际上,线性映射也属于特殊的⼀种函数,所以线性映射的乘积等价于函数的复合。

ST是线性映射:线性映射的乘积仍然是⼀个线性映射。

∀u1,u2∈U,λ∈F,
ST(u1+u2)=S[T(u1+u2)]=S(Tu1+Tu2)=STu1+STu2,ST(λu)=S[T(λu)]=S[λ(Tu)]=λS(Tu)=λSTu.
故ST作为映射满⾜加性和齐性,是线性映射。

我们把线性映射看成⼀个向量,但是相乘的两个向量并不属于同⼀个向量空间,乘出的结果也并不属于原来两个向量空间之⼀(⼴义来说,即不考虑(V,V)的特例),所以它与线性空间中定义的加法⼜不属于同⼀种运算类型。

线性映射乘积的代数性质以下性质有助于对线性映射进⾏复合。

结合性(associativity):如果以下乘积都是有意义的,则
(T1T2)T3=T1(T2T3).
这⾥T1,T2和T3都是线性映射。

单位元(identity):存在恒等映射I V,I W,使得∀T∈(V,W),
I W T=TI V=T.
在学习的初级阶段,写出映射乘积的存在条件还是很有必要的。

分配性质(distributive properties):对T,T1,T2∈(U,V),S,S1,S2∈(V,W),成⽴
Processing math: 58%
(S1+S2)T=S1T+S2T,S(T1+T2)=ST1+ST2.
⼀般要注意,线性映射的乘法不可交换,即对于⼀般函数也有f[g(x)]≠g[f(x)]⼀样。

对于那些特别可交换的线性映射对,称它们为可交换的。

结合性:∀v,这⾥v落在L3的定义域内,则
(T1T2)T3v=(T1T2T3)v=T1(T2T3)v,
故结合性成⽴。

这⾥的每个等号都是基于线性映射乘法的定义的,不妨回顾⼀下。

单位元:∀v∈V,
I W Tv=I W(Tv)=Tv,TI V v=T(I V v)=Tv,
故I W T=TI V=T。

分配性质:∀v∈V,
(S1+S2)Tv=(S1+S2)(Tv)=S1Tv+S2Tv=(S1T+S2T)v,S(T1+T2)v=S(T1v+T2v)=ST1v+ST2v=(ST1+ST2)v.
对于第⼀⾏,第⼀个等号是线性映射乘法定义,第⼆个等号是线性映射加法定义,第三个等号是映射的线性性。

对于第⼆⾏,第⼀个等号是线性映射加法定义,第⼆个等号是映射的线性性,第三个等号也是线性映射加法定义。

最后书上给出⼀个实⽤的定理,这个定理常常可以直接证明映射不是线性的。

线性映射对加法单位元若T∈(V,W),则T(0)=0。

T(0)=T(0+0)=T(0)+T(0),
故T(0)=0。

Part 2:零空间与值域
可以说,本节中提到的零空间、值域、单射满射都是彼此相连的⼀个整体,它们之间具有许多联系,共同构成线性映射的结构基础。

零空间(null space) 对于T∈(V,W),T的零空间指的是V中那些被T映射为0的向量构成的集合:
null T={v∈V:Tv=0}.
零空间也被称为核空间(kernel)。

零空间之所以能被称为空间,是因为零空间也是⼀个向量空间,满⾜加法与标量的封闭性。

显然,如果零空间不是线性空间,也没有研究它的价值。

零空间是⼦空间设T∈(V,W),则null T是V的⼦空间。

设u,v∈null T,则
T(u+v)=Tu+Tv=0,u+v∈null T.
对于λ∈F,有
T(λv)=λTv=0,λv∈null T.
最后,由于T(0)=0,所以0∈null T。

向量空间的三⼤条件得以验证。

单射(injective) 如果Tu=Tv⇔u=v,则称T∈(V,W)是单射。

单射的概念很重要,联想能够⼀⼀确定⾃变量和因变量的函数——可逆函数,它与单射就很类似。

单射的等价条件设T∈(V,W),则T是单射等价于null T={0}。

这是⼀个⼗分重要的定理。

已有{0}⊂null T。

当T是单射时,∀v∈null T,有
Tv=0=T0,
结合单射性就得到v=0,即null T={0}。

反之,若null T=0,则∀u,v∈V,如果Tu=Tv,则
Tu−Tv=T(u−v)=0,
故u−v=0,得到u=v,从⽽证明T是单射。

值域(range) 对于T∈(V,W),称V的值域为所有形如Tv(v∈V)的向量构成的集合,即
range T={Tv:v∈V}.
⾃然地,值域也应该是⼀个⼦空间,但注意对象不同。

显然每⼀个Tv∈W,所以值域是W的⼦空间⽽不是V的,这点与零空间不同。

值域是⼦空间设T∈(V,W),则range T是W的⼦空间。

这个证明虽然简单,但⼜和零空间的有⼀些不同。

若w1,w2∈range T,则∃v1,v2∈V,Tv1=w1,Tv2=w2,则
w1+w2=Tv1+Tv2=T(v1+v2),
由于v1+v2∈V,所以w1+w2∈range T。

同理
λw1=λTv1=T(λv1)∈range T,
⼜因为T(0)=0,所以0∈range T。

向量空间的三个条件得以验证。

满射(surjective) 设T∈(V,W),如果\mathrm{range}T=W,则称T是满射。

单射可以类⽐⼀⼀映射,满射则相当于将映射的值域扩充满了,⼆者⼀结合,就能得到全空间上的⼀⼀映射。

需要注意的是,如果W'是W的⾮平凡⼦空间,T\in\mathcal L(V,W')是满的很可能不意味着T\in\mathcal L(V,W)上也是满的,即使对T作解析延拓也不⼀定,这是因为\mathrm{range}T受到V的维数限制,我们可以很容易地证明这⼀点。

事实上,我们前⾯得出了单射与零空间的关系,这⾥得出了满射与像空间(值域)的关系,这两组关系在形式上对偶,不妨将Tu=Tv\Leftrightarrow u=v看作单射的衍⽣性质,⽽从零空间的⾓度定义它,这样显得更统⼀,不过这让“单射”的名字没有那么写实了。

线性映射基本定理设V是有限维的,T\in\mathcal L(V,W),则\mathrm{range}T是有限维的,且
\dim V=\dim\mathrm{null}T+\dim\mathrm{range}T.
这个定理揭⽰了线性映射结构的本质关系——它只会造成信息的丢失,⽽不会造成信息的增加,因为T(0)=0,⽽零空间的维数就是信息丢失多少的量度。

设u_1,\cdots,u_m是\mathrm{null}T的基,则\dim \mathrm{null}T=m。

这组基可以扩充成V的基:
u_1,\cdots,u_m,v_1,\cdots,v_n,\quad \dim{V}=m+n.
如果等式成⽴,则\dim\mathrm{range}T=n,⾃然会猜想Tv_1,\cdots,Tv_n是\mathrm{range}T的基,这包括张成性与线性⽆关性两⽅⾯。

先证张成性,\forall v\in V,有
v=a_1u_1+\cdots+a_m u_m+b_1v_1+\cdots+b_nv_n,

Tv=T\left(\sum_{j=1}^m a_ju_j+\sum_{j=1}^n b_jv_j \right)=\sum_{j=1}^nb_j Tv_j,
因此Tv_1,\cdots,Tv_n张成\mathrm{range}T。

再证线性⽆关,令
a_1Tv_1+\cdots +a_nTv_n=0,

T\left(\sum_{j=1}^n a_jv_j\right)=0,\quad \sum_{j=1}^n a_j v_j\in\mathrm{null}T,
所以
\sum_{j=1}^n a_jv_j=\sum_{j=1}^m b_ju_m,
移项后得到a_1=\cdots=a_n=b_1=\cdots=b_m=0,线性⽆关性得证。

对⽐线性映射基本定理与和空间维数公式的证明过程,读者应该能捕捉到⼆者之间的共同点。

由线性映射基本定理,直接得到两个推论:
到更⼩维数向量空间的线性映射不是单射。

到更⼤维数向量空间的线性映射不是满射。

由此结论建⽴线性⽅程组求解的关系,是⼀个直接的推论。

事实上,线性⽅程组的本质就是我们在例题1中提到的T\in\mathcal
L(\mathbb{F}^n,\mathbb{F}^m),n是变量个数,m是约束条件个数,在这⾥就不展开了。

例题
3.A部分的例题⽐较简单,毕竟还是围绕着有限维向量空间的线性映射,只要别忘了有限维向量空间的基就好。

3.B部分的例题则主要围绕着线性映射基本定理,还有⼀些维数的基本关系,只要会利⽤V和W的基构造满⾜条件的线性映射(构造的存在性由“线性映射与基”结论保证),问题基本可以迎刃⽽解。

第⼀题(3.A 3)设T\in\mathcal L(\mathbb{F}^n,\mathbb{F}^m),证明存在标量A_{j,k}\in\mathbb{F},其中j=1,\cdots,m,k=1,\cdots,n,使得对任
意(x_1,\cdots,x_n)\in\mathbb{F}^n都有
T(x_1,\cdots,x_n)=(A_{1,1}x_1+\cdots+A_{1,n}x_n,\cdots,A_{m,1}x_1+\cdots+A_{m,n}x_n).
这题看起来⽆从⼊⼿,但是线性代数嘛,既然是有限维向量空间,那就有穷举的机会,莽就完事了。

取V的⼀组⾃然基e_1,\cdots,e_n,它在T下必然拥有⼀个像,故设
T(e_i)=(A_{1,i},A_{2,i},\cdots,A_{m,i}),
由于V中的每⼀个向量都可以被这组基线性表⽰,不妨设
v=x_1e_1+\cdots+x_ne_n,
则由T的线性性,
\begin{aligned} T(v)&=T(x_1e_1+\cdots+x_ne_n)\\ &=T(x_1,\cdots,x_n)\\ &=x_1T(e_1)+\cdots+x_nT(e_n)\\ &=
(A_{1,1}x_1+\cdots+A_{1,n}x_n,\cdots,A_{m,1}x_1+\cdots+A_{m,n}x_n). \end{aligned}
由v的任意性,结论得证。

第⼆题(3.A 14)设V是有限维的且\dim{V}\ge2,证明存在S,T\in\mathcal L(V,V),使得ST\ne TS。

这题的关键信息在于\dim{V}\ge 2,因⽽可以找到两个线性⽆关向量,围绕他们进⾏⼀波构造就可以推出找到这样的S,T。

设v_1,v_2是V中两个线性⽆关的向量,因为\dim V\ge 2,所以这样的两个向量是可以找到的。


Tv_1=v_2,\quad Sv_1=v_1+v_2,\\ Tv_2=0,\quad Sv_2=v_1.

STv_1=Sv_2=v_1,\\ TSv_1=T(v_1+v_2)=v_2,
由v_1,v_2的线性⽆关性,得到STv_1\ne TSv_1,即ST\ne TS。

第三题(3.B 22)设U,V都是有限维向量空间,并设S\in \mathcal L(V,W),T\in\mathcal L(U,V),证明:
\dim\mathrm{null}(ST)\le \dim\mathrm{null}S+\dim\mathrm{null}T.
万变不离其宗,基扩充在证明维数不等式上依然是永远的神。

⾸先要注意到\mathrm{null}T\subset\mathrm{null}(ST)。

设u_1,\cdots,u_m是\mathrm{null}T的基,如果\mathrm{null}T=\mathrm{null}(ST),则不等式已经成⽴。

假设⼆者不等,则可以扩充为\mathrm{null}(ST)的基:
u_1,\cdots,u_m,u_{m+1},\cdots,u_{n}.
满⾜
Tu_{m+1}\ne 0,\cdots,Tu_n\ne 0.
现证明Tu_{m+1},\cdots,Tu_n是线性⽆关的,即
a_{m+1}Tu_{m+1}+\cdots+a_nTu_n=T\left(\sum_{j={m+1}}^{n} a_ju_{j} \right),
所以\sum_{j=m+1}^{n}a_ju_j\in\mathrm{null}T,即
\sum_{j=m+1}^n a_ju_j=\sum_{k=1}^m b_ku_k,
移项得到a_{m+1}=\cdots=a_n=0(由于u_1,\cdots,u_n是\mathrm{null}(ST)的基),所以线性⽆关性得证。

⼜因为\mathrm{null}S中线性⽆关组的长度中⼩于张成组的长度,所以
\dim S\ge n-m,\\ \dim\mathrm{null}(ST)=n=n-m+m\le \dim\mathrm{null}S+\dim\mathrm{null}T.
第四题(3.B 26、27)
1、设D\in\mathcal L(\mathcal P(\mathbb{R}),\mathcal P(\mathbb{R}))使得对每个⾮常数多项式p\in\mathcal P(\mathbb{R})均有\mathrm{deg}(Dp)=
(\mathrm{deg}p)-1,这⾥\mathrm{deg}指的是多项式的次数,证明D是满射。

2、设p\in\mathcal P(\mathbb{R}),证明存在多项式q\in\mathcal P(\mathbb{R})使得
5q''+3q'=p.
这题本质上和线性⽅程组是⼀样的,但由于笔记中对线性⽅程组的介绍很少,因此将这个例题摘录于此。

第⼆问中的微分算⼦其实就是第⼀问中D的⼀种显式,可以看作1中结论的直接应⽤。

另外,看到多项式时,应当考虑多项式空间的⾃然基,本题的主要问题是⽆限维向量空间的处理。

1、由题意,\forall n,
\mathrm{deg}Dx^{n+1}=n,
显然由于Dx,Dx^2,\cdots的次数不同,它们是线性⽆关的,对任何⼀个给定的j,
\mathrm{span}(Dx,Dx^2,\cdots,Dx^{j+1})=\mathrm{span}(1,x,\cdots,x^j),
因此令j\to \infty,有
\mathrm{span}(Dx,Dx^2,Dx^3,\cdots)=\mathrm{span}(1,x,x^2,\cdots)=\mathcal P(\mathbb{R}),\\ \mathcal P(\mathbb{R})\subset \mathrm{range}D.
⼜因为对任何多项式p,Dp仍是⼀个多项式,所以
\mathrm{range}D\subset \mathcal P(\mathbb{R}),
即\mathrm{range}D=\mathcal P(\mathbb{R}),也就是D是满射。

2、定义降次算⼦为Dp=3p'+5p'',则由1,D是满的,所以\forall q\in\mathcal P(\mathbb{R}),必定存在⼀个p,使得
Dp=5p''+3p'=q.。

相关文档
最新文档