矩阵的分类

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

合同矩阵(等价矩阵、相似矩阵、置换矩阵、若尔当标准型)
(2012-04-05 13:58:14)
分类:工作篇
标签:
校园
合同矩阵
在线性代数,特别是二次型理论中,常常用到矩阵间的合同关系。

两个矩阵和是合同的,当且仅当存在一个可逆矩阵,使得。

对于二次型的矩阵表示来说,做一次非退化的线性替换相当于将二次型的矩阵变为一个与其合同的矩阵。

性质
合同关系是一个等价关系,也就是说满足:
反身性:
对称性:合同于,则可以推出合同于。

传递性:合同于,合同于,则可以推出合同于。

由于每个二次型都可以经过线性替换变成若干个平方和的形式,对于矩阵来说,就是每个对称矩阵都合同于一个对角矩阵,后者称为一个标准形。

根据谱定理,替换的过渡矩阵可以是一个正交矩阵。

如果不考虑替换矩阵的正交性,那么在复数域中,每个对称矩阵都合同于一个对角线上元素只由0和1构成的对角矩阵。

对角线上的1的个数等于原来的矩阵的秩。

因此每个可逆的对称矩阵都合同于单位矩阵。

在实数域中,根据惯性定理,每个对称矩阵都合同于一个对角线上元素只由0和正负1构成的对角矩阵。

如果设1的个数是p,-1的个数是q,那么给定(p,q)后,就确定了一个关于合同关系的等价类。

数对(p,q)称为一个对称矩阵(或相应二次型)的惯性指数其中1的个数p 称为正惯性指数,-1的个数q称为负惯性指数,p-q叫做符号差。

据此可以得出:合同关系将所有的对称矩阵分为个等价类。

正定二次型
主条目:正定二次型
一个二次型被称为半正定的,如果它对应的对称矩阵在实数域内合同到一个一个对角线上元素只由0和1构成的对角矩阵。

如果一个二次型的矩阵在实数域内合同于单位矩阵,那么称其为正定二次型。

一个二次型是半正定二次型当且仅当它的正惯性指数等于它对应的矩阵的秩;是正定二次型当且仅当它的正惯性指数是n。

正定二次型必然是可逆矩阵,而且它的行列式大于0。

同样的可以定义半负定、负定和不定的二次型。

参看
相似矩阵
参考资料
北京大学数学系几何与代数教研室前代数小组,《高等代数》,高等教育出版社,2003年。

来自“/w/index.php?title=合同矩阵&oldid=17636850”
合同矩阵
定义
在线性代数,特别是二次型理论中,常常用到矩阵间的合同关系。

两个矩阵A和B是合同的,当且仅当存在一个可逆矩阵P,使得
对于二次型的矩阵表示来说,做一次非退化的线性替换相当于将二次型的矩阵变为一个与其合同的矩阵。

性质
合同关系是一个等价关系,也就是说满足:
1、反身性:任意矩阵都与其自身合同;
2、对称性:A合同于B,则可以推出B合同于A;
3、传递性:A合同于B,B合同于C,则可以推出A合同于C;
4、合同矩阵的秩相同。

正定二次型
主条目:正定二次型
一个二次型被称为半正定的,如果它对应的对称矩阵在实数域内合同到一个一个对角线上元素只由0和1构成的对角矩阵。

如果一个二次型的矩阵在实数域内合同于单位矩阵,那么称其为正定二次型。

一个二次型是半正定二次型当且仅当它的正惯性指数等于它对应的矩阵的秩;是正定二次型当且仅当它的正惯性指数是n。

正定二次型必然是可逆矩阵,而且它的行列式大于0。

同样的可以定义半负定、负定和不定的二次型。

合同矩阵发展史
1855 年,埃米特(C.Hermite,1822-1901) 证明了其他数学家发现的一些矩阵类的特征根的特殊性质,如现在称为埃米特矩阵的特征根性质等。

后来,克莱伯施(A.Clebsch,1831-1872) 、布克海姆(A.Buchheim) 等证明了对称矩阵的特征根性质。

泰伯(H.Taber) 引入矩阵的迹的概念并得出了一些有关的结论。

在矩阵论的发展史上,弗罗伯纽斯(G.Frobenius,1849-1917) 的贡献是不可磨灭的。

他讨论了最小多项式问题,引进了矩阵的秩、不变因子和初等因子、正交矩阵、矩阵的相似变换、合同矩阵等概念,以合乎逻辑的形式整理了不变因子和初等因子的理论,并讨论了正交矩阵与合同矩阵的一些重要性质。

1854 年,约当研究了矩阵化为标准型的问题。

1892 年,梅茨勒(H.Metzler) 引进了矩阵的超越函数概念并将其写成矩阵的幂级数的形式。

扩展阅读:
/wiki/合同矩阵
/����_m/blog/item/e3306e10e1871a0b203f2e07.html
等价矩阵
在线性代数和矩阵论中,两个矩阵之间的等价是一种矩阵之间的等价关系。

假设有两个
的矩阵,记作A和B。

它们之间等价当且仅当存在两个可逆的方块矩阵:的矩阵P以
及的矩阵Q,使得
这时称两个矩阵A和B是等价矩阵。

矩阵之间的等价和矩阵的相似关系有所不同。

如果两个矩阵A和B相似,那么它们一定是等价矩阵,因为按照矩阵相似的定义,可以找到一个可逆矩阵P,使得
由于其中的P-1也是可逆的矩阵,所以A和B相似必然推出它们等价。

但是,等价的矩阵不一定是相似的。

首先相似的两个矩阵必须是大小相同的两个方块矩阵,而等价矩阵则没有这
个要求。

其次,即使两个等价矩阵都是同样大小的方阵,中用到的Q也不
一定是P的逆矩阵。

性质
等价矩阵是矩阵集合中的一种等价关系。

两个矩阵等价当且仅当:
其中一者能够经过若干次初等行或列变换变成另一者。

它们有相同的秩。

参见
相似矩阵
合同矩阵
这是与数学相关的小作品。

你可以通过编辑或修订扩充其内容。

相似矩阵
在线性代数中,相似矩阵是指存在相似关系的矩阵。

相似关系是两个矩阵之间的一种等价关系。

两个n×n矩阵A与B为相似矩阵当且仅当存在一个n×n的可逆矩阵P,使得:

P被称为矩阵A与B之间的相似变换矩阵。

相似矩阵保留了矩阵的许多性质,因此许多对矩阵性质的研究可以通过研究更简单的相似矩阵而得到解决。

严格定义
两个系数域为K的n×n的矩阵A与B为域L上的相似矩阵当且仅当存在一个系数域为L的n×n的可逆矩阵P,使得:
这时,称矩阵A与B“相似”。

B称作A通过相似变换矩阵:P得到的矩阵。

术语相似变换的其中一个含义就是将矩阵A变成与其相似的矩阵B。

性质
相似变换是矩阵之间的一种等价关系,也就是说满足:
反身性:任意矩阵都与其自身相似。

对称性:如果A和B相似,那么B也和A相似。

传递性:如果A和B相似,B和C相似,那么A也和C相似。

矩阵间的相似关系与所在的域无关:设K是L的一个子域,A和B是两个系数在K中的矩阵,则A和B在K上相似当且仅当它们在L上相似。

这个性质十分有用:在判定两个矩阵是否相似时,可以随意地扩张系数域至一个代数闭域,然后在其上计算若尔当标准形。

如果两个相似矩阵A和B之间的转换矩阵P是一个置换矩阵,那么就称A和B“置换相似”。

如果两个相似矩阵A和B之间的转换矩阵P是一个酉矩阵,那么就称A和B“酉相似”。

谱定理证明了每个正交矩阵都酉相似于某个对角矩阵。

相似变换下的不变性质
两个相似的矩阵有许多相同的性质:
两者的秩相等。

两者的行列式相等。

两者的迹数相等。

两者拥有同样的特征值,尽管相应的特征向量一般不同。

两者拥有同样的特征多项式。

两者拥有同样的初等因子。

这种现象的原因有两个:
两个相似的矩阵可以看做是同一个线性变换的“两面”,即在两个不同的基下的表现。

映射X P−1XP是从n阶方阵射到n阶方阵的一个双射同构,因为P是可逆的。

因此,在给定了矩阵A后,只要能找到一个与之相似而又足够“简单”的“规范形式”B,那么对A的研究就可以转化为对更简单的矩阵B的研究。

比如说A被称为可对角化的,如果它与一个对角矩阵相似。

不是所有的矩阵都可以对角化,但至少在复数域(或任意的代数闭域)内,所有的矩阵都相似于一些被称为若尔当标准形的简单的矩阵。

另一种标准形:弗罗贝尼乌斯标准形则在任意的域上都适用。

只要查看A和B所对应的标准形是否一致,就能知道两者是否相似。

参见
合同矩阵
正则形式
等价矩阵
参考来源
相似矩阵
相似矩阵及其性质
相似矩阵的特征值
矩阵的对角化
置换矩阵
在数学中的矩阵论里,置换矩阵是一种系数只由0和1组成的方块矩阵。

置换矩阵的每一行和每一列都恰好有一个1,其余的系数都是0。

在线性代数中,每个n阶的置换矩阵都代表了一个对n个元素(n维空间的基)的置换。

当一个矩阵乘上一个置换矩阵时,所得到的是原来矩阵的横行(置换矩阵在左)或纵列(置换矩阵在右)经过置换后得到的矩阵。

严格定义
每个n元置换都对应着唯一的一个置换矩阵。

设π为一个n元置换:
给出其映射图:
它对应的n ×n的置换矩阵Pπ是:在第i横行只有π(i)位置上系数为1,其余为0。

即可以写做:
其中每个表示正则基中的第j个,也就是一个左起第j个元素为1,其余都是0的n元横排数组。

由于单位矩阵是
置换矩阵也可以定义为单位矩阵的某些行和列交换后得到的矩阵。

性质
对两个n元置换π和σ的置换矩阵Pπ和Pσ,有
一个置换矩阵Pπ必然是正交矩阵(即满足),并且它的逆也是置换矩阵:
用置换矩阵左乘一个列向量g所得到的是g 的系数经过置换后的向量:
用置换矩阵右乘一个行向量h 所得到的是h 的系数经过置换后的向量:
置换矩阵与置换
设Sn是n次对称群,由于n置换一共有n! 个,n阶的置换矩阵也有n! 个。

这n! 个置换矩阵构成一个关于矩阵乘法的群。

这个群的单位元就是单位矩阵。

设A是所有n阶的置换矩阵的集合。

映射Sn →A ⊂ GL(n, Z2)是一个群的忠实表示。

对一个置换σ,其对应的置换矩阵Pσ是将单位矩阵的横行进行σ置换,或者将单位矩阵的横行进行σ−1 置换得到的矩阵。

置换矩阵是双随机矩阵的一种。

伯克霍夫-冯·诺伊曼定理说明每个双随机矩阵都是同阶的置换矩阵的凸组合,并且所有的置换矩阵构成了双随机矩阵集合的所有端点。

置换矩阵Pσ的迹数等于相应置换σ的不动点的个数。

设a1、a2、……、ak 为其不动点的序号,则ea1、ea2、……、eak 是Pσ的特征向量。

由群论可以知道,每个置换都可以写成若干个对换的复合。

由此可知,置换矩阵Pσ都可以写成若干个表示两行交换的初等矩阵的乘积。

Pσ的行列式就等于σ的符号差。

例子
对应于置换π= (1 4 2 5 3)的置换矩阵Pπ是
给定一个向量g,
推广
置换矩阵概念的一个推广是将方阵的情况推广到一般矩阵的情况:
一个m×n的0-1矩阵P 是置换矩阵当且仅当
这时一个0-1矩阵是置换矩阵当且仅当它的每一行恰有一个1,每一列至多有一个1。

置换矩阵概念的另一个推广是将每行的1变为一个非零的实数:
一个n阶的方块矩阵P 是置换矩阵当且仅当其每一行与每一列都恰好只有一个系数不为零。

这时的置换矩阵P可以看做由0和1组成的置换矩阵Q与一个对角矩阵相乘的结果。

参见
变号矩阵
广义置换矩阵
参考来源
左光纪,置换矩阵的组合合成及其图表示
0-1矩阵与置换矩阵
置换矩阵(英文)
置换矩阵介绍(英文)
张贤达,矩阵分析与应用,清华大学出版社,2004。

若尔当标准型
在线性代数中,若尔当标准型(或称若尔当正规型)是矩阵的一类。

若尔当矩阵理论说明了任何一个系数域为的方块矩阵如果特征值都在中,那么必然和某个若尔当标准型相似。

或者说,如果一个线性空间上的自同态特征值都在系数域中,那么它可以在某个基底下表示成若尔当标准型。

若尔当标准型几乎是对角矩阵:除了主对角线和主对角线上方的对角线外系数都是零。

谱定理和正规矩阵都是若尔当标准型的特殊情况。

若尔当标准型得名于十九世纪后期的法国数学家卡米尔·若尔当。

简介
一个n ×n 的矩阵是可对角化的当且仅当的所有特征空间的维数之和等于n,或者当且仅当有n 个线性独立的特征向量(拥有一个由特征向量组成的基底)。

矩阵的对角化使得研究其性质变为研究相应的对角矩阵的性质,而后者显然简单得多。

然而,不是所有的矩阵都能对角化。

例如以下的:
计入重数的话,的特征值为1, 2, 4, 4。

的核的维数是1,因此不能对角化。

但经过基底变换,相似于下面的矩阵:
矩阵近乎对角矩阵,除了第三行第四列系数是1。

如果将后两行和后两列的部分作为一块的话,矩阵就是一个分块对角矩阵。

若尔当标准型的目标就是将更多的矩阵化简到一类只比对角矩阵稍微复杂的矩阵:若尔当标准型。

实际上这是一种简单的分块对角矩阵。

这里的“简单”是指每小块矩阵都具备一种很简单的形状:
其中主对角线上都是同一个系数,而对角线上方一排全是1。

形同以上的矩阵称为若尔
当矩阵。

而矩阵中每一个这样的小块被称为若尔当块。

线性代数中有如下的结果:
对任意系数域为的矩阵,只要其特征值都在中,就存在一个与之相似的若尔当标准型:,其中是一个可逆矩阵。

并且满足:
矩阵的特征值(计入重数)就是主对角线上的系数。

对于的一个特征值,它的几何重数(特征空间的维数)就是属于特征值的若尔当块的个数。

所有属于特征值的若尔当块的维数之和是特征值的代数重数。

矩阵可对角化当且仅当它的每个特征值的几何重数都等于代数重数(一般来说几何重数小于等于代数重数)。

证明
广义特征向量
考虑前面例子中的矩阵M。

M 的若尔当标准型可以写成P−1MP = J,即
其中变换矩阵P 的四个列向量为:pi, i = 1, ..., 4,于是
也就是:
对于i = 1、2、3,都是某个特征值所对应的特征向量:。

然而,当i=4 时,并不是特征值4所对应的特征向量。

尽管如此:
于是。

像这样的向量被称为M 的广义特征向量。

给定一个特征值,它对应的若尔当块:
对应着一个由广义特征向量所张成的子空间,因为对应的基底满足:
也就是说
因此,“所有特征值在中的矩阵都相似于某个若尔当标准型”这个命题等价于存在一个由这个矩阵的特征向量和广义特征向量构成的全空间的基底。

幂零矩阵的情况
当矩阵A 为幂零矩阵(即存在m 使得)时,可以证明整个空间总是可以分解为若干个A-循环子空间的直和[1]。

所谓的A-循环子空间就是由某个向量v 以及基底:
线性张成的子空间。

显然,这样的子空间是A-不变子空间。

同时,注意到是由 A 的特征向量和广义特征向量构成的()。

因此在这个循环子空间里,A 在基底下表示为若尔当块:
因此A 在所有这样的基底下可以表示为由若尔当块组成的分块对角矩阵,即若尔当标准型:
一般情况
下面用数学归纳法证明:所有特征值在中的n ×n 的矩阵都相似于某个若尔当标准型。

n= 1 的情况显然。

对于考虑n ×n 矩阵A。

对于A 的一个特征值λ,设s 为λ的
几何重数。

设线性变换的像空间为,这是关于A 的一个不变子空间。

因为λ是特征值,的空间维数r 严格小于n。

记为A 在子空间限制上的部分。

根据归纳假设存在一个基底:{p1, ..., pr} 使得在这个基底上为若尔当标准型。

接下来考虑子空间,只要能够证明整个空间可以分为:
由于是一个A-不变子空间,在上面是幂零矩阵,因此可以写成若尔当标准型:
而加上后还是若尔当标准型。

因此,A 在和上都
能写成若尔当标准型,从而A 相似于某个若尔当标准型。

有归纳法可知所有的n ×n 的矩阵都相似于某个若尔当标准型。

下面证明:
设 A 的最小多项式为,并将其写成。

于是和
互素。

于是根据裴蜀定理,存在多项式:a 和b使得。

每个向量u都可以写成:
并且,同样地,因此
,也就是说:另一方面,任意,。

也就是说:。

综上所述,
然而,,从而。

而根据秩-零化度定理,和维数相等,所以两者完全相等。

于是
从而命题得证。

推论
如果矩阵的系数域是一个代数闭域,那么由于其特征值是特征多项式的根,所以也在系数域中。

于是只要系数域是一个代数闭域,所有的矩阵都相似于若尔当标准型。

特别的,所有复系数矩阵都可以简化为若尔当标准型,因为复数域是代数封闭的。

所有的若尔当标准型都可以分解成一个对角矩阵D 和一个只有对角线上一排为1的矩阵N 的和。

这两个矩阵是可交换的,因为其中一个是对角矩阵。

不仅如此,矩阵N 是一个幂零矩阵。

因此,每个相似于若尔当标准型的矩阵都可以写成可交换的一个对角矩阵和一个幂零矩阵的和。

因为与对角矩阵和幂零矩阵相似的矩阵仍然是对角矩阵和幂零矩阵。

换句话说,只要一个矩阵的特征值都在它的系数域里(或者说它的最小多项式或特征多项式可以分解成一次项的乘积),就可以将这个矩阵分解成一个对角矩阵和一个幂零矩阵的和,而这两个矩阵可以交换。

这个结果被称为丹佛分解(Dunford 分解),在计算矩阵的指数时很有用。

谱映射定理
用若尔当标准型以及直接的计算可以得出:如果n ×n 矩阵A 的特征值为:λ1, ..., λn,那么对于多项式:p,矩阵p(A) 的特征值是:p(λ1), ..., p(λn)。

凯莱-哈密尔顿定理
凯莱-哈密尔顿定理断言任意矩阵A 都是特征方程的根:如果p是A的特征多项式,那么p(A) = 0。

这个定理一样可以用若尔当标准型直接计算得出。

最小多项式
方块矩阵A 的最小多项式是使得m(A) = 0 的非常数首一多项式中次数最小者。

另一种定义是:所有使得m(A) = 0 的多项式构成主理想环C[x] 的一个理想I,而m则是这个理想的产生子。

对于有若尔当标准型的矩阵A,其最小多项式以其特征值为根,并且由若而当标准型的形状可以看出,每个特征值的重数是若尔当标准型中属于这个特征值的最大的若尔当块的维数。

反之已知矩阵A的最小多项式并不能知道其若尔当标准型。

要确定矩阵A的标准型需要用到所谓的初等因子。

矩阵A的一个初等因子是它的某一个若尔当块的特征多项式(或最小多项式,对于若尔当块两者一样)。

如果所有的初等因子都是一次多项式,那么A可对角化。

不变子空间分解
一个n ×n 的矩阵A 的若而当标准型是分块对角矩阵,因此给出了一个将n 维欧几里得空间分解为矩阵A 的不变子空间的具体方法。

每个若尔当块Ji 都对应着一个不变子空间:Xi。

可以简记为:
其中的每个Xi 都是由若尔当块Ji 对应的广义特征向量张成的子空间。

注意到这里的k 并不是不同的特征值的个数,因为属于同一个特征值的若尔当块可以不止一个。

如果要将分解为l 个不变子空间,其中l 是不同特征值的个数的话,可以将属于同一个特征值,比如说的若尔当块合并:只需使用 A 的最小多项式中关于的重根数(几何重数),考虑空间:
这就是所有的属于同一个特征值的若尔当块所对应的Xi,p 所合并后的空间,因为它包含了所有使得经过次操作后会清零的向量集合。

如果某个Xi 中向量没有被清零,那么由于这个向量也不会被其他的特征值清零,它将不会被清零,这与
矛盾。

于是n 维欧几里得空间也可以被分解为
其中l 是矩阵A 的不同的特征值的个数。

值得注意的是,这里的指标ν(λ) 是使得特征零空间“稳定”下来的最小次数:
这也可以作为几何重数的另一个定义。

参见。

相关文档
最新文档