第4章 矩阵分解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
矩阵. 矩阵.
的满秩分解时, 利用定理 4.1.2 求 A 的满秩分解时,需要首先求出 A 的行最简 因此不需求之. 形矩阵 B ,但并未用到变换矩阵 P ,因此不需求之.
0 0 1 的满秩分解, 例 4.1.2 求矩阵 A = 2 1 1 的满秩分解,其中 i = − 1 . 2i i 0 1 0 1 0 0 1 2 行 A = 2 1 1 → 0 0 1 = B , 解 2i i 0 0 0 0 的前两列,所以, 因为 B 的第 1 列和第 3 列构成 E 3 的前两列,所以, F 为 A 的第 1 列和第 3 列构成的
(
)
从而
rank ( A1 + A2 ) ≤ rank ( F1 , F2 ) ≤ rank ( F1 ) + rank ( F2 ) = rank ( A1 ) + rank ( A2 ) .
4.2 舒尔定理及矩阵的 舒尔定理及矩阵的QR分解 分解
舒尔(Schur)定理在理论上很重要,它是很多重要定理 定理在理论上很重要, 舒尔 定理在理论上很重要 证明的出发点. 而矩阵的QR分解在数值代数中起着重要作 证明的出发点. 而矩阵的 分解在数值代数中起着重要作 用,是计算矩阵特征值及求解线性方程组的一个重要工具.下 是计算矩阵特征值及求解线性方程组的一个重要工具 下 面的讨论是在酉空间C 内进行的. 面的讨论是在酉空间Cn内进行的.
0 1 0 0 0 1 就是一个 4 阶置换 0 0 0 1 0 0
有如下一些性质: 置换矩阵 P = (e j1 , e j2 , ⋯, e jn ) 有如下一些性质: (1) P 是正交矩阵; ) 是正交矩阵; (2)对任意 A ∈ C )
m×n
, AP 是将 A 的列按 j1 , j 2 , ⋯ , j n 的次序
n
ε 1 ,η 2 , ⋯ ,η n .
对它进行正交化、单位化,可以得到一组标准正交基 对它进行正交化、单位化, ′ ′ ε 1 ,η 2 ,⋯ ,η n . (4.2.1) ) 以这组基作列向量构成的矩阵
′ ′ U 1 = (ε 1 ,η 2 ,⋯ ,η n )
为酉矩阵. 为酉矩阵.由于
′ ′ ′ ′ AU 1 = ( Aε 1 , Aη 2 , ⋯ , Aη n ) = (λ1ε 1 , Aη 2 , ⋯ , Aη n ) ,
证明 由 A → B 知,存在 m 阶可逆矩阵 P ,使得 PA = B 或
行
− 根据定理(4.1.1),将 P 者 A = P B ,根据定理 , −1 −1
分块为
P −1 = ( F , S ) , F ∈ C m× r , rank ( F ) = r ; S ∈ C m ×( m − r ) , rankS = m − r . 矩阵. 可得满秩分解 A = FG ,其中 G 为 B 的前 r 行构成的 r × n 矩阵.
2 1 0 0 −1 0 1 ( A, E ) = 1 2 − 1 1 ⋮0 1 0 2 2 − 2 − 1 0 0 1 − 1 0 1 2 1 0 , 所以 B = 0 2 0 3 P = 1 1 0 0 0 0 1 − 1
− 1 0 1 2 1 0 0 行 → 0 2 0 3⋮1 1 0 0 0 0 0 1 − 1 1 0 1 0 0 . ,可求得 −1 P = − 1 1 0 0 − 2 1 1 1
于是有
1 0 − 1 0 1 2 A = − 1 1 0 2 0 3 . − 2 1
行
F ∈ C m× r 且 rankF = r , S ∈ C m×( m − r ) 且 rankS = m − r ,
则有
G A = P B = ( F , S ) = FG , 0 列满秩矩阵, 行满秩矩阵. 其中 F 是列满秩矩阵, G 是行满秩矩阵.
−1
的满秩分解(4.1.1)不是唯一的, 不是唯一的, 注 4.1.1 矩阵 A 的满秩分解 不是唯一的 这是因为若取 D 阶非奇异矩阵,则式( 是任一个 r 阶非奇异矩阵,则式(4.1.1)可改写为 )
4.1 矩阵的满秩分解
本节介绍将非零矩阵分解为列满秩矩阵与行满秩矩阵的 乘积问题. 乘积问题.
定义 4.1.1 设 A ∈ C 矩阵 F ∈ C
m× r
m× n
且rankA = r (r > 0) ,如果存在列满秩
r ×n
和行满秩矩阵 G ∈ C
,使得 (4.1.1) )
A = FG
则称式(4.1.1)为矩阵 A 的满秩分解. 则称式( ) 满秩分解.
P = (e j1 , e j2 ,⋯ , e jn )
称为置换矩阵, 的一个全排列. 称为置换矩阵,这里 j1 j2 ⋯ jn 是1,2, ⋯ , n 的一个全排列. 置换矩阵
0 0 例如, 例如,矩阵 P = (e3 , e 4 , e1 , e2 ) = 1 0
矩阵. 矩阵
下面确定列满秩矩阵 F ,参照 A 的行最简形矩阵 B 作 n 阶置换 矩阵
P1 = (e j1 , ⋯, e jr , e jr +1 , ⋯, e jn ) ,
划分 A = (α 1 , α 2 , ⋯, α n ) , B = ( β 1 , β 2 , ⋯ , β n ) ,则有
AP1 = (α j1 ,⋯, α jr , α jr +1 , ⋯, α jn ) , E r B12 , BP1 = ( β j1 ,⋯ , β jr , β jr +1 ,⋯ , β jn ) = 0 0 r ×( n − r ) −1 其中 B12 ∈ C ,再由 A = P B ,可得 E r B12 −1 = ( F , FB12 ) , AP1 = P ( BP1 ) = ( F , S ) 0 0 列构成的矩阵, 即 F 为 AP 的前 r 列构成的矩阵,也就是 A 的 j1 , j 2 , ⋯, j r 列构成的 1
上例中, 上例中,求列满秩矩阵 F 时,需要求出矩阵 P 及其逆矩阵 P 计算量较大. 为了避免这些运算,引入下面的定义. 计算量较大. 为了避免这些运算,引入下面的定义
−1
,
定义 4.1.2 以 n 阶单位矩阵 E n 的 n 个列向量 e1 , e2 , ⋯ , en 为列构成 的 n 阶矩阵
(4.1.1) ) . 证明 rankA = r 时,根据矩阵的初等变换理论,对 A 进行初等 根据矩阵的初等变换理论, 行变换, 行变换,可将 A 化为阶梯形矩阵 B ,即
G A → B = , G ∈ C r×n , rankG = r . 0 −1 −1 于是存在 m 阶可逆矩阵 P ,使得 PA = B 或者 A = P B . 将 P −1 分块为 P = ( F , S ) ,其中
m×n
重新排列所得到的矩阵. 重新排列所得到的矩阵. 我们已知,任意非零矩阵 A ∈ C 我们已知,
设 A∈C
m×n
且rankA = r ,可通过初等
行线性无关. 行变换化为行最简形矩阵 B ,且 B 的前 r 行线性无关
定理 4.1.2
, rankA = r (r > 0) 的行最简形矩阵为
B ,那么,在 A 的满秩分解(4.1.1)中,可取 F 为 A 的 j1 , j 2 , ⋯, j r 那么, 的满秩分解( ) 矩阵, 矩阵. 列构成的 m × r 矩阵, G 为 B 的前 r 行构成的 r × n 矩阵.
第4章
矩阵分解
把矩阵分解为形式比较简单或具有某种特性的一些矩 阵的乘积,在矩阵理论的研究与应用中, 阵的乘积,在矩阵理论的研究与应用中,都是十分重要 的.因为这些分解式的特殊形式一方面能明显地反映出原 矩阵的某些数值特征,如矩阵的秩、行列式、特征值及奇 矩阵的某些数值特征,如矩阵的秩、行列式、 异值等, 异值等,另一方面分解的方法与过程往往提供了某些有效 的数值计算方法和理论分析根据. 的数值计算方法和理论分析根据.本章将介绍在广义逆矩 阵等理论中常用的矩阵满秩分解和奇异值分解, 阵等理论中常用的矩阵满秩分解和奇异值分解,最后介绍 矩阵的QR分解以及 分解以及Schur定理. 定理. 矩阵的 分解以及 定理
定理) 定理 4.2.1(Schur 定理)若 A ∈ C (
n× n
,则存在酉矩阵 U ,使得
U H AU = T
为上三角矩阵, 这里 T 为上三角矩阵, T 的(主)对角线上的元素都是 A 的特征值. 主 对角线上的元素都是 的特征值.
证明 设 A 的特征值为 λ1 , λ 2 , ⋯ , λ n . 若 ε 1 为 A 的属于 λ1 的单 位特征向量. 位特征向量. 把 ε 1 扩充成 C 的一组基
注意到 ε 1
T
及向量组( λ1ε 1 = λ1 | ε 1 |= λ1 及向量组(4.2.1)的正交性,则有 )的正交性,
ε 1T T η 2′ λ1 ∗ H ′ ′ U 1 AU 1 = (λ1ε 1 Aη 2 ⋯ Aη n ) = 0 A ⋮ 1 η ′T n n −1 易知 n − 1 阶方阵 A1 的特征值为 λ 2 , ⋯, λ n . 设 ε 2 ∈ C 为 A1 的属于 λ 2 的单位特征向量,又重复上述步骤, 的单位特征向量,又重复上述步骤,则又有 n − 1 阶酉矩阵 U 2 ,使得
是满秩(列满秩或行满秩)矩阵时, 当 A 是满秩(列满秩或行满秩)矩阵时, A 可分解为一个因子 是单位矩阵, 本身,称此满秩分解为平凡分解 平凡分解. 是单位矩阵,另一个因子是 A 本身,称此满秩分解为平凡分解.
定理 4.1.1 设 A ∈ C
m× n
, rankA = r (r > 0) , 则 A 有满秩分解
3×2 矩阵,从而有 × 矩阵,
0 1 1 A = 2 1 2i 0 0
又如在例 4.1.1 中
1 0 . 2 0 1
所以
1 0 −1 − 2 2 −1 0 1 行 3 A = 1 2 −1 1 → 0 1 0 = B, 2 2 2 − 2 − 1 0 0 0 0 − 1 0 1 0 − 1 − 2 3 . A = 1 2 0 1 0 2 2 2
A = ( FD)( D G ) = F G ,
的另一个满秩分解. 这是 A 的另一个满秩分解 的证明过程表明, 注 4.1.2 定理 4.1.1 的证明过程表明,可以使用矩阵的初等行变 换方法求矩阵的满秩分解. 换方Hale Waihona Puke Baidu求矩阵的满秩分解.
−1
~ ~
2 −1 0 1 的满秩分解. 例 4.1.1 求矩阵 A = 1 2 − 1 1 的满秩分解. 2 2 − 2 − 1 为此, 解 需要求出阶梯形矩阵 B 及诸初等矩阵的乘积 P . 为此,对 进行初等行变换, 距阵 ( A, E ) 进行初等行变换, A 所在的位置成为阶梯形矩阵 B 时, 当 E 所在的位置就是进行初等行变换对应的初等矩阵的乘积 P .
利用矩阵的满秩分解处理一些矩阵问题时,有时会十分方便. 利用矩阵的满秩分解处理一些矩阵问题时,有时会十分方便. 矩阵, 例 4.1.3 设 A1 与 A2 都是 m × n 矩阵,证明
rank ( A1 + A2 ) ≤ rank ( A1 ) + rank ( A2 ) . 则结论显然成立. 证明 如果 A1 = 0 , 或者 A2 = 0 , 则结论显然成立 . 如果 A1 ≠ 0 且 A2 ≠ 0 ,设 A1 与 A2 的满秩分解分别为 A1 = F1G1 , A2 = F2 G2 ,则有 G1 A1 + A2 = F1G1 + F2G2 = F1 , F2 , G 2
的满秩分解时, 利用定理 4.1.2 求 A 的满秩分解时,需要首先求出 A 的行最简 因此不需求之. 形矩阵 B ,但并未用到变换矩阵 P ,因此不需求之.
0 0 1 的满秩分解, 例 4.1.2 求矩阵 A = 2 1 1 的满秩分解,其中 i = − 1 . 2i i 0 1 0 1 0 0 1 2 行 A = 2 1 1 → 0 0 1 = B , 解 2i i 0 0 0 0 的前两列,所以, 因为 B 的第 1 列和第 3 列构成 E 3 的前两列,所以, F 为 A 的第 1 列和第 3 列构成的
(
)
从而
rank ( A1 + A2 ) ≤ rank ( F1 , F2 ) ≤ rank ( F1 ) + rank ( F2 ) = rank ( A1 ) + rank ( A2 ) .
4.2 舒尔定理及矩阵的 舒尔定理及矩阵的QR分解 分解
舒尔(Schur)定理在理论上很重要,它是很多重要定理 定理在理论上很重要, 舒尔 定理在理论上很重要 证明的出发点. 而矩阵的QR分解在数值代数中起着重要作 证明的出发点. 而矩阵的 分解在数值代数中起着重要作 用,是计算矩阵特征值及求解线性方程组的一个重要工具.下 是计算矩阵特征值及求解线性方程组的一个重要工具 下 面的讨论是在酉空间C 内进行的. 面的讨论是在酉空间Cn内进行的.
0 1 0 0 0 1 就是一个 4 阶置换 0 0 0 1 0 0
有如下一些性质: 置换矩阵 P = (e j1 , e j2 , ⋯, e jn ) 有如下一些性质: (1) P 是正交矩阵; ) 是正交矩阵; (2)对任意 A ∈ C )
m×n
, AP 是将 A 的列按 j1 , j 2 , ⋯ , j n 的次序
n
ε 1 ,η 2 , ⋯ ,η n .
对它进行正交化、单位化,可以得到一组标准正交基 对它进行正交化、单位化, ′ ′ ε 1 ,η 2 ,⋯ ,η n . (4.2.1) ) 以这组基作列向量构成的矩阵
′ ′ U 1 = (ε 1 ,η 2 ,⋯ ,η n )
为酉矩阵. 为酉矩阵.由于
′ ′ ′ ′ AU 1 = ( Aε 1 , Aη 2 , ⋯ , Aη n ) = (λ1ε 1 , Aη 2 , ⋯ , Aη n ) ,
证明 由 A → B 知,存在 m 阶可逆矩阵 P ,使得 PA = B 或
行
− 根据定理(4.1.1),将 P 者 A = P B ,根据定理 , −1 −1
分块为
P −1 = ( F , S ) , F ∈ C m× r , rank ( F ) = r ; S ∈ C m ×( m − r ) , rankS = m − r . 矩阵. 可得满秩分解 A = FG ,其中 G 为 B 的前 r 行构成的 r × n 矩阵.
2 1 0 0 −1 0 1 ( A, E ) = 1 2 − 1 1 ⋮0 1 0 2 2 − 2 − 1 0 0 1 − 1 0 1 2 1 0 , 所以 B = 0 2 0 3 P = 1 1 0 0 0 0 1 − 1
− 1 0 1 2 1 0 0 行 → 0 2 0 3⋮1 1 0 0 0 0 0 1 − 1 1 0 1 0 0 . ,可求得 −1 P = − 1 1 0 0 − 2 1 1 1
于是有
1 0 − 1 0 1 2 A = − 1 1 0 2 0 3 . − 2 1
行
F ∈ C m× r 且 rankF = r , S ∈ C m×( m − r ) 且 rankS = m − r ,
则有
G A = P B = ( F , S ) = FG , 0 列满秩矩阵, 行满秩矩阵. 其中 F 是列满秩矩阵, G 是行满秩矩阵.
−1
的满秩分解(4.1.1)不是唯一的, 不是唯一的, 注 4.1.1 矩阵 A 的满秩分解 不是唯一的 这是因为若取 D 阶非奇异矩阵,则式( 是任一个 r 阶非奇异矩阵,则式(4.1.1)可改写为 )
4.1 矩阵的满秩分解
本节介绍将非零矩阵分解为列满秩矩阵与行满秩矩阵的 乘积问题. 乘积问题.
定义 4.1.1 设 A ∈ C 矩阵 F ∈ C
m× r
m× n
且rankA = r (r > 0) ,如果存在列满秩
r ×n
和行满秩矩阵 G ∈ C
,使得 (4.1.1) )
A = FG
则称式(4.1.1)为矩阵 A 的满秩分解. 则称式( ) 满秩分解.
P = (e j1 , e j2 ,⋯ , e jn )
称为置换矩阵, 的一个全排列. 称为置换矩阵,这里 j1 j2 ⋯ jn 是1,2, ⋯ , n 的一个全排列. 置换矩阵
0 0 例如, 例如,矩阵 P = (e3 , e 4 , e1 , e2 ) = 1 0
矩阵. 矩阵
下面确定列满秩矩阵 F ,参照 A 的行最简形矩阵 B 作 n 阶置换 矩阵
P1 = (e j1 , ⋯, e jr , e jr +1 , ⋯, e jn ) ,
划分 A = (α 1 , α 2 , ⋯, α n ) , B = ( β 1 , β 2 , ⋯ , β n ) ,则有
AP1 = (α j1 ,⋯, α jr , α jr +1 , ⋯, α jn ) , E r B12 , BP1 = ( β j1 ,⋯ , β jr , β jr +1 ,⋯ , β jn ) = 0 0 r ×( n − r ) −1 其中 B12 ∈ C ,再由 A = P B ,可得 E r B12 −1 = ( F , FB12 ) , AP1 = P ( BP1 ) = ( F , S ) 0 0 列构成的矩阵, 即 F 为 AP 的前 r 列构成的矩阵,也就是 A 的 j1 , j 2 , ⋯, j r 列构成的 1
上例中, 上例中,求列满秩矩阵 F 时,需要求出矩阵 P 及其逆矩阵 P 计算量较大. 为了避免这些运算,引入下面的定义. 计算量较大. 为了避免这些运算,引入下面的定义
−1
,
定义 4.1.2 以 n 阶单位矩阵 E n 的 n 个列向量 e1 , e2 , ⋯ , en 为列构成 的 n 阶矩阵
(4.1.1) ) . 证明 rankA = r 时,根据矩阵的初等变换理论,对 A 进行初等 根据矩阵的初等变换理论, 行变换, 行变换,可将 A 化为阶梯形矩阵 B ,即
G A → B = , G ∈ C r×n , rankG = r . 0 −1 −1 于是存在 m 阶可逆矩阵 P ,使得 PA = B 或者 A = P B . 将 P −1 分块为 P = ( F , S ) ,其中
m×n
重新排列所得到的矩阵. 重新排列所得到的矩阵. 我们已知,任意非零矩阵 A ∈ C 我们已知,
设 A∈C
m×n
且rankA = r ,可通过初等
行线性无关. 行变换化为行最简形矩阵 B ,且 B 的前 r 行线性无关
定理 4.1.2
, rankA = r (r > 0) 的行最简形矩阵为
B ,那么,在 A 的满秩分解(4.1.1)中,可取 F 为 A 的 j1 , j 2 , ⋯, j r 那么, 的满秩分解( ) 矩阵, 矩阵. 列构成的 m × r 矩阵, G 为 B 的前 r 行构成的 r × n 矩阵.
第4章
矩阵分解
把矩阵分解为形式比较简单或具有某种特性的一些矩 阵的乘积,在矩阵理论的研究与应用中, 阵的乘积,在矩阵理论的研究与应用中,都是十分重要 的.因为这些分解式的特殊形式一方面能明显地反映出原 矩阵的某些数值特征,如矩阵的秩、行列式、特征值及奇 矩阵的某些数值特征,如矩阵的秩、行列式、 异值等, 异值等,另一方面分解的方法与过程往往提供了某些有效 的数值计算方法和理论分析根据. 的数值计算方法和理论分析根据.本章将介绍在广义逆矩 阵等理论中常用的矩阵满秩分解和奇异值分解, 阵等理论中常用的矩阵满秩分解和奇异值分解,最后介绍 矩阵的QR分解以及 分解以及Schur定理. 定理. 矩阵的 分解以及 定理
定理) 定理 4.2.1(Schur 定理)若 A ∈ C (
n× n
,则存在酉矩阵 U ,使得
U H AU = T
为上三角矩阵, 这里 T 为上三角矩阵, T 的(主)对角线上的元素都是 A 的特征值. 主 对角线上的元素都是 的特征值.
证明 设 A 的特征值为 λ1 , λ 2 , ⋯ , λ n . 若 ε 1 为 A 的属于 λ1 的单 位特征向量. 位特征向量. 把 ε 1 扩充成 C 的一组基
注意到 ε 1
T
及向量组( λ1ε 1 = λ1 | ε 1 |= λ1 及向量组(4.2.1)的正交性,则有 )的正交性,
ε 1T T η 2′ λ1 ∗ H ′ ′ U 1 AU 1 = (λ1ε 1 Aη 2 ⋯ Aη n ) = 0 A ⋮ 1 η ′T n n −1 易知 n − 1 阶方阵 A1 的特征值为 λ 2 , ⋯, λ n . 设 ε 2 ∈ C 为 A1 的属于 λ 2 的单位特征向量,又重复上述步骤, 的单位特征向量,又重复上述步骤,则又有 n − 1 阶酉矩阵 U 2 ,使得
是满秩(列满秩或行满秩)矩阵时, 当 A 是满秩(列满秩或行满秩)矩阵时, A 可分解为一个因子 是单位矩阵, 本身,称此满秩分解为平凡分解 平凡分解. 是单位矩阵,另一个因子是 A 本身,称此满秩分解为平凡分解.
定理 4.1.1 设 A ∈ C
m× n
, rankA = r (r > 0) , 则 A 有满秩分解
3×2 矩阵,从而有 × 矩阵,
0 1 1 A = 2 1 2i 0 0
又如在例 4.1.1 中
1 0 . 2 0 1
所以
1 0 −1 − 2 2 −1 0 1 行 3 A = 1 2 −1 1 → 0 1 0 = B, 2 2 2 − 2 − 1 0 0 0 0 − 1 0 1 0 − 1 − 2 3 . A = 1 2 0 1 0 2 2 2
A = ( FD)( D G ) = F G ,
的另一个满秩分解. 这是 A 的另一个满秩分解 的证明过程表明, 注 4.1.2 定理 4.1.1 的证明过程表明,可以使用矩阵的初等行变 换方法求矩阵的满秩分解. 换方Hale Waihona Puke Baidu求矩阵的满秩分解.
−1
~ ~
2 −1 0 1 的满秩分解. 例 4.1.1 求矩阵 A = 1 2 − 1 1 的满秩分解. 2 2 − 2 − 1 为此, 解 需要求出阶梯形矩阵 B 及诸初等矩阵的乘积 P . 为此,对 进行初等行变换, 距阵 ( A, E ) 进行初等行变换, A 所在的位置成为阶梯形矩阵 B 时, 当 E 所在的位置就是进行初等行变换对应的初等矩阵的乘积 P .
利用矩阵的满秩分解处理一些矩阵问题时,有时会十分方便. 利用矩阵的满秩分解处理一些矩阵问题时,有时会十分方便. 矩阵, 例 4.1.3 设 A1 与 A2 都是 m × n 矩阵,证明
rank ( A1 + A2 ) ≤ rank ( A1 ) + rank ( A2 ) . 则结论显然成立. 证明 如果 A1 = 0 , 或者 A2 = 0 , 则结论显然成立 . 如果 A1 ≠ 0 且 A2 ≠ 0 ,设 A1 与 A2 的满秩分解分别为 A1 = F1G1 , A2 = F2 G2 ,则有 G1 A1 + A2 = F1G1 + F2G2 = F1 , F2 , G 2