矩阵分解及其应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《线性代数与矩阵分析》课程小论文
矩阵分解及其应用
学生姓名:******
专业:*******
学号:*******
指导教师:********
2015年12月
Little Paper about the Course of "Linear Algebra and Matrix
Analysis"
Matrix Decomposition and its Application
Candidate:******
Major:*********
StudentID:******
Supervisor:******
12,2015
中文摘要
将特定类型的矩阵拆解为几个矩阵的乘机称为矩阵的分解。
本文主要介绍几种矩阵的分解方法,它们分别是矩阵的等价分解、三角分解、谱分解、奇异值分解和 Fitting 分解等。
矩阵的分解理论和方法是矩阵分析中重要的部分,在求解矩阵的特征值、解线性方程组以及实际工程中有着广泛的运用。
因此,本文将介绍矩阵等价分解、三角分解、奇异值分解的理论运用以及三角分解的工程运用。
关键词:等价分解,三角分解,奇异值分解,运用
Abstract
Many particular types of matrix are split into the product of a matrix of several matrices, which is called decomposition of matrix. In this paper, we introduce some methods of matrix decomposition, which are equivalent decomposition, triangular decomposition, spectral decomposition, singular value decomposition, Fitting decomposition and so on. The decomposition theory and method of matrix is an important part of matrix analysis, which is widely used in solving the characteristic value, solving linear equations and the practical engineering. In this paper, we will introduce the theory of matrix equivalence decomposition, triangular decomposition, singular value decomposition and the engineering application of triangular decomposition.
Key words:Equivalent Decomposition, Triangular Decomposition, Singular Value Decomposition, Application
目录
中文摘要 (1)
ABSTRACT (1)
1 绪论 (1)
2 矩阵分解的常用方法 (1)
2.1矩阵的等价分解 (1)
2.2矩阵的三角分解 (2)
2.2.1 矩阵的三角分解 (2)
2.2.2 矩阵的正三角分解 (2)
2.3矩阵的谱分解 (5)
2.3.1 单纯形矩阵的谱分解 (5)
2.3.2 正规矩阵与酉对角化 (6)
2.3.3 正规矩阵的谱分解 (6)
2.4矩阵的奇异值分解 (7)
2.4.1 矩阵的奇异值分解(SVD分解) (7)
2.5矩阵的FITTING分解 (7)
3矩阵分解的理论应用 (8)
3.1矩阵等价分解的理论应用 (8)
3.2矩阵三角分解的理论应用 (8)
3.3矩阵奇异值分解的理论应用 (9)
4 矩阵分解在递推系统辨识中的应用 (10)
4.1递推系统辨识中的困难 (10)
4.1.1 病态问题 (10)
4.1.2 效率和计算量问题 (10)
4.2QR分解的实现方法 (11)
4.2.1 GIVENS变换 (13)
4.3递推算法 (13)
5 结论 (18)
6 参考文献 (18)
1 绪论
矩阵的分解是将一个矩阵分解为较为简单的或具有某种特性的若干矩阵的乘积,这是矩阵理论及其应用中比较常见的方法。
由于矩阵的这些特殊的分解形式,一方面反映了原矩阵的某些数值特性,如矩阵的秩、特征值、奇异值等;另一方面矩阵分解方法与过程往往为某些有效的数值计算方法和理论分析提供了重要的依据,因而使其对分解矩阵的讨论和计算带来极大的方便,这在矩阵理论研究及其应用中都有非常重要的理论意义和应用价值。
在实际应用中,利用矩阵的某些分解来解决一些实际的工程数学问题有明显的效果。
如计算某些特大、特殊矩阵时,矩阵的三角分解非常有作用,可以大大简化很多计算过程。
矩阵的QR (正交三角)分解在状态估计具有很好的计算效率。
谱分解作为一种强有力的工具,在处理矩阵等式和矩阵不等式的过程中有着非常重要的作用。
奇异值分解是研究数学的一种重要方法,并在最优化问题、特征值问题、广义逆矩阵计算、谱估计、控制理论等领域,有极其重要的作用。
矩阵的 Fitting 分解可看作是复矩阵的Jordan 分解在一般域上的推广,它在运筹与控制论方面有至关重要的作用。
2 矩阵分解的常用方法
矩阵分解大致可以分为等价分解、三角分解、谱分解、奇异值分解和Fitting 分解等五大类。
2.1矩阵的等价分解
定理 1.1:(等价分解)若m n
A R
⨯∈,则存在m 阶的可逆阵P 及n 阶可逆阵Q 使得
r Pdiag(E 0)Q ,,其中r=rank(A) 。
证明:设x r+1,…,x n 是N(A)的基,将其扩充成R m 的基1,,,,r n x x x ,因为Ax 1,
…,Ax r 是线性无关的,所以将其扩充成R m 的基11,
,,,
r r m Ax Ax y y +。
令[
]1
1
r r m P Ax Ax y y +=,并且[]11
0r
AQ Ax Ax -=。
于是(,0)r A Pdiag E Q =。
定理 1.2:(满秩分解)若m n
A R
⨯∈,则存在列满秩阵BϵR mxr 和行满秩阵CϵR rxn 使得
A BC =,其中r =rank (A )。
2.2矩阵的三角分解
2.2.1 矩阵的三角分解
(1)LU 分解
三角分解法是将方阵分解成为一个上三角阵和一个下三角阵,这样的分解法称为LU 分解法。
定理2.1:(LU 分解)对一任意方阵n n
A C ⨯∈,均可分解为两个三角阵的乘积,即:PA-LU,
其中P 为置换阵,下三角形矩阵n n
L C
⨯∈,上三角形矩阵n n
U C
⨯∈。
定理2.2:方阵n n
A C
⨯∈,rankA n =,则A 可以作LU 分解的充要条件是A 的K 阶(K=1,
2,…,n-1)的顺序主子式不为零。
定理2.3:方阵n n
A C
⨯∈,rankA r n =≤,A 的K 阶(K=1,2,…,r )的顺序主子式
不为零,则可以作LU 分解(Doolittle 分解)。
证明:当矩阵的阶数为n 时,用数字归纳法来证。
当1n =时,结论显然成立。
假设对n-1阶矩阵结论成立,下面证明对于n 阶矩阵结论也成立。
将A 分块可以得A =[A n−1E
C
a nn ],令L 1=[E n−10
CA n−1
−11
] 易见A =L 1[
A n−1B
a nn −CA n−1
−1B ]
令a nn −CA n−1−1B =b ,由归纳假设有A n−1=L 2U 2,其中2L 为单位下三角阵,U 2为上三角阵。
于是A =L 1[L 2U
2
B 0
b ]=L 1[L 200
1][U 2
L 2−1B 0
b
],令L =L 1
[L 2
01],U =[U 2L 2−1B 0
b
],
则L 为单位下三角阵,U 为上三角阵,故A LU =。
(2)对称阵的Cholesky 分解
定理2.4:设A 为对称阵,则存在唯一分解:T
A LL =,其中L 为单位下三角阵。
证明:由Doolittle 分解,A 有唯一分解:A LU =;
则 A =LU =A T =U T L T ,即LU =U T L T ,有T
L U =;所以 A =LL T 。
定理2.5:设A 为对称正定阵,则存在唯一分解:T
A LDL =,其中L 为单位下三角阵,D 为对角线元素大于零的对角阵。
2.2.2 矩阵的正三角分解
(1)QR 分解
若n 阶实非奇异矩阵A 可以分解为正交矩阵Q 与实非奇异上三角矩阵R 的乘积,即
A QR =,则称该分解式为矩阵A 的QR 分解;进而A 是m n ⨯列满秩矩阵,若A=QR ,其
中Q 是m ×n 矩阵,T
Q Q E =(称Q 为列正交矩阵),R 为非奇异上三角矩阵,也称为矩阵A 的QR 分解。
(ⅰ)利用Schmidt 正交化求矩阵的QR 分解
Schmidt 正交化方法是矩阵的QR 。
分解最常用的方法,主要依据下面的两个结论: 结论2.6:设A 是n 阶实非奇异矩阵,则存在正交矩阵Q 和实非奇异上三角矩阵R 使A 有QR 分解;且除去相差一个对角元素的绝对值(模)全等于1的对角矩阵因子外,分解是唯一的。
结论2.7:设A 是m n ⨯m ×n 实矩阵,且其n 个列线性无关,则A 有分解A=QR,其中Q 是m ×n 实矩阵,且满足T
Q Q E =,R 是n 阶实非奇异上三角矩阵该分解除去相差一个对角元素的绝对值(模)全等于1的对角矩阵因子外是唯一的。
(ⅱ)利用初等变换求矩阵的QR 分解
矩阵的初等变换共有三种,其中把数域P 上矩阵的某一行(列)的k 倍加到另一行(列),这种初等变换称为第3种行(列)初等变换(其中k 是P 中任意一个数)。
结论2.8:设A 是一个m ×n 实矩阵,若A 是列满秩矩阵,则T A A 对称正定,因而T
A A
有唯一的三角分解,式T T
A A LDL =,其中L 是单位下三角矩阵;D 是对角元全为正数的
对角矩阵。
结论2.9:若m n
A R
⨯∈是一个列满秩矩阵,则A 总可经过一对第3种行和列的初等变换
分解为A QR =的形式。
其中Q 是一个列正交矩阵,R 是一个非奇异上三角矩阵。
(ⅲ)利用Givens(吉文斯)变换求矩阵的QR 分解 一般地,在n 维Euclid 空间n R 中,令12e ,e ,
,e n 是它的一个标准正交基,于是在平面
i j e e ⎡⎤⎣⎦中的Givens 变换定义如下:
定义2.10:设实数c 与s 满足221c s +=,称
11
1
1
11ij c
s
T s
c ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥
=⎢
⎥⎢⎥⎢⎥-⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣
⎦
(i<j )
为Givens 矩阵,也记作(,)ij ij T T c s =。
由于Givens 矩阵确定的线性变换成为Givens 变换。
容易验证,当221c s +=时,存在角度θ,使得cos ,sin c s θθ==。
Givens 矩阵具有如下的性质:
(ⅰ)Givens 矩阵是正交矩阵,且有
1
(,)(,)(,),det (,)1T
ij ij ij ij T c s T c s T c s T c s -⎡⎤⎡⎤⎡⎤===⎣⎦⎣⎦⎣⎦
(ⅱ)设1212(,,
,),(,,,)T T n ij n x y T x ξξξηηη===,则有
(,)
i i j
j i j k
k c s s c k i j ηξξηξξηξ=+⎧⎪
=-+⎨⎪=≠⎩ 上式表明,当220i j ξξ+≠
时,选取c s ξ=
=
就使0,0i j ηη=>=
结论2.11:任何n 阶实非奇异矩阵()ij A a =可通过左连乘Givens 矩阵化为上三角矩阵。
(2)Schur 分解
定理2.10:若n n A C ⨯∈,则存在酉矩阵U 使得H A UTU =, 其中T 为对角线上的元素都是A 的特征值的上三角阵。
证明:用数学归纳法
(ⅰ)当A 的阶数为1时,定理2.8显然成立; (ⅱ)现在假设A 的阶数为n-1时,定理2.8也成立;
(ⅲ)现在考虑A 的阶数为n 时的情况:
取n 阶矩阵A 的一个特征值1λ,对应的单位特征向量为1a ,把1a 扩充到k C 的一组基:
12,,,n αββ,再对它进行正交化、单位化,可以得到一组标准正交基12,,,n ααα,令
[]112,,
,n U ααα=,故1U 为k 阶酉矩阵。
由于[][]11212,,,,,
,n n AU A A A αααλαλαλα==,又因为12,,
,n ααα构成k C 的
一个标准正交基,故n
1ij
j 1
=
j
A ααα=∑(i=1,2,
n ),因此有
[]121
11121
0,,
,0
n n AU A λααααα⎡⎤
⎢⎥⎢
⎥=⎢⎥⎢⎥⎣⎦
其中1A 是k-1阶矩阵,根据归纳假设,存在k-1阶酉矩阵W 满足11
H
A WRW =,其中1R 为上三角阵。
令n 21n U U W ⨯⎡⎤=∈⎢⎥⎣⎦
,则有121
121121
n H H
b b U U AU U T R λ⎡⎤⎢⎥
⎢⎥==⎢⎥⎢⎥⎣⎦
令12U U U =,则有H A UTU =,其中T 为对角线上的元素都是A 的特征值的上三角阵。
2.3矩阵的谱分解
2.3.1 单纯形矩阵的谱分解
给定n 阶矩阵A ,λ是A 的特征值。
由于T A 与A 有相同的特征值,设Y 的T A 的属于
λ的特征向量,则
T A Y Y λ=
两端取转置得:T T
Y A Y λ=
称T
Y 是A 的属于λ的左特征向量,也称A 的属于λ的特征向量为右特征向量。
性质2.11:单纯矩阵不同特征值的左右特征向量是正交的。
单纯矩阵A 的谱分解定理:设单纯矩阵n n
A C
⨯∈的谱为
12,,,s λλλ,其代数重数分为
12,,
,s m m m ,则存在唯一的n ,1,2,
,n i E C i s ⨯∈=使
(1)1
s
i
i
i A E λ==
∑
(2),=0,i i j E i j E E i j ⎧=⎨≠⎩
(3)
1
s
i
i E
I ==∑
2.3.2 正规矩阵与酉对角化
(ⅰ)正规矩阵定义:设n n A C ⨯∈,满足H H
A A AA =。
(ⅱ)酉相似:设n ,n
A B C ⨯∈,若存在可逆矩阵P ,使得1P AP B -=,则称A 与B 是相
似的。
若P 是正交矩阵(实矩阵),即1
T P P -=,则称A 与B 是正交相似的。
若P 是酉矩阵(复矩阵),即1
H P
P -=,则称A 与B 是酉相似的。
(ⅲ)定理2.12:设m n A C ⨯∈,则A 酉相似于一个对角矩阵的充分必要条件是A 为正规矩阵,即
12(,,,),H H H H n A A AA U AU diag U U I λλλ=←−→==
(ⅳ)正规矩阵的性质:a :正规矩阵有n 个线性无关的特征向量;
b :正规矩阵属于不同特征值的特征向量是正交的;
c :与正规矩阵酉相似的矩阵都是正规矩阵。
2.3.3 正规矩阵的谱分解
设n n A C ⨯∈的谱为12,,
,s λλλ,其代数重数分为12,,
,s m m m ,则A 为正规矩阵的充
要条件是存在唯一的一组正交投影矩阵n ,1,2,,n
i P C
i s ⨯∈=使
(ⅰ)1
s
i
i
i A E λ==
∑
(ⅱ),=0,i i j P i j PP i j ⎧=⎨≠⎩
(ⅲ)
1
s
i i P I ==∑
2.4矩阵的奇异值分解
奇异值分解是另一种正交矩阵分解法,也是最可靠的矩阵分解方法。
2.4.1 矩阵的奇异值分解(SVD 分解)
定义2.13:若m n A C ⨯∈,A 的秩为r ,则H A A 为厄米特矩阵且特征值均为非负实数,设其特征值为12r 10r n λλλλλ+≥≥≥≥===
,则称1,2,
)
i i n σ=为矩阵A
的奇异值。
定义2.14:,m n
A B C ⨯∈,若存在m 阶酉矩阵U ,n 阶酉矩阵V ,使得A=UBV ,则称A
与B 酉等价。
定理2.15:,m n A B C
⨯∈,若A 与B 酉等价,则它们有相同的正奇异值。
定理2.16(奇异值分解定理):m n A C ⨯∈,A 的秩为r ,则存在m 阶酉矩阵U 与n 阶酉矩阵V ,使得
000H
A U V ∑⎡⎤=⎢⎥⎣⎦
其中
12r i =diag(,,,)(=1,2,)
i r σσσσ∑,,是矩阵A 的正奇异值。
定理2.17:若A 为n 阶可逆矩阵,则存在n 阶酉矩阵U 与V ,使得
H A U V =∑
其中12n i =diag(,,
,)(=1,2,)i n σσσσ∑,,是矩阵A 的奇异值。
2.5矩阵的Fitting 分解
矩阵呢的Fitting 分解将矩阵分解为可逆部分和幂零部分的直和。
定义5.1:对与n 阶矩阵A ,若存在正整数1k ≥且满足:A k =0,则称A 为幂零阵。
引理5.2:n m
A F
⨯∈,BϵF nxm ,M =[A B
00
],则A 幂零的充要条件是M 幂零。
定理5.3(Fitting 分解):设n m
A F ⨯∈,则存在可逆矩阵T ,使得A =Tdiag (D ,N )T −1,
其中D 为可逆阵,N 为幂零阵。
证明:对于n 阶矩阵用数学归纳法: (ⅰ)假设A 的阶数为n-1时,结论成立;
(ⅱ)下面证明当A 的阶数是n 时结论仍然成立。
若A=0或A 可逆,结论显然成立;
若1()rank A r n ≤=<,设A 的等价分解为A =Pdiag(E r ,0)Q ,其中P ,Q 可逆。
令QP =[Q
1
Q 2
Q 3
Q 4
],Q 1ϵR rxr ,则 A =Pdiag(E r ,0)QPP −1=P [Q
1
Q 20
]P −1。
有归纳假设,存在可逆矩阵1P ,使得1
11
1(,)Q Pdiag D N P -=,其中D 为可逆矩阵,1N 为幂零阵,于是
1112
diag diag diag 0P Q A P P P P --⎡⎤⎡⎤⎢⎥==⎢⎥⎢⎥⎣⎦⎢⎥⎣⎦
21-1
-11111221D 0Q (D,N )P (P ,E )0N Q (P ,E )0000
其中211
1222Q P Q Q -⎡⎤=⎢⎥⎣⎦,令1211221E 0diag(P ,E)0E 0,0000E D Q N Q T P N -⎡⎤
-⎡⎤⎢⎥==⎢⎥⎢⎥⎣⎦⎢⎥⎣⎦
则1
(,)A Tdiag D N T
-=,由1N 幂零及引理5.2知N 幂零。
3矩阵分解的理论应用
3.1矩阵等价分解的理论应用
矩阵的等价分解在矩阵秩、矩阵方程等许多问题的研究中有广泛的应用。
下面举例说明: 例1:设n m
A R
⨯∈,求解AXA =A 。
解:由矩阵等价分解知,存在m 阶的可逆阵P 及n 阶可逆阵Q 满足A =P[E r
00
]Q ,其中r =rank (A );
设X =Q −1[X 1
X 2X 3
X 4
]P −1
,其中X 1为r 阶方阵; 由矩阵方程AXA =A 有[E
r
000][X 1X 2X 3
X 4][E r 000]=[E r 0
],故X 1=E r ; 因此矩阵方程的全部解为X =Q −1[
X 1X 2X 3
X 4
]P −1
,其中X 2,X 3,X 4为任意的适当矩阵。
3.2 矩阵三角分解的理论应用
在线性代数中,利用矩阵行初等变换可以把方程组化为同解的三角形方程组,从而求出
原方程组的解。
例2:求下例方程组:
{x 1+2x 2+x 3=02x 1+2x 2+3x 3=3−x 1−3x 3=2
其求解过程是,写出增广矩阵并实施行初等变换:
[1222−1−3103302]r 2−2r 1r 3+r 1→ [120−20−1101312]r 3−12
r 2→ [120−2
0010131/21/2
] 得到与原方程组同解的三角形方程组
{x 1+2x 2+x 3=0
−2x 2+x 3=31/2x 3=1/2
利用上式回代即可求出方程组的解
在求解方程组的过程中,实际上先用1L 左乘原方程组的增广矩阵,再用L 2左乘该增广矩阵,进而得到对应的增广矩阵。
L 1=[100
−210101
]L 2=[1000
100−1/21] 若将原方程组的系数矩阵记为A ,三角形方程组的系数矩阵为U ,则有21L L A U =或者
A =L 1−1L 2−1
U ;
容易验证L 1
−1=[100
−210101
]L 2−1=[1000
100−1/21] 令L =L 1−1L 2−1
,则
L =
L 1−1L 2
−1
=[100−210101][1
000
100−1/21
]=[100210−1−1/21]且A =LU 。
这表明矩阵A 能够分解为一个单位下三角矩阵与一个上三角矩阵的乘积,即是矩阵的
三角分解。
3.3矩阵奇异值分解的理论应用
例1:用奇异值分解来讨论最小二乘问题。
定理3.1:设m b n A C ⨯∈∈m ,C ,则A b +是线性方程组Ax=b 的最小二乘问题的最小长度解。
证明:设-1
H
(,0),diag(,0)U H
A Udiag V A V +
=∑=∑,并设
11r 122b b x b U x b x ⎡⎤⎡⎤=∈∈⎢⎥⎢⎥
⎣⎦⎣⎦
H r
1(R ) x=V (R ) 于是
22
2
2(,0)H AA b b Udiag E U b b b +-=-=
2
2
22
211112(,0)x b Udiag E Vx b x b b b ⎡⎤
--==
-+⎢⎥-⎣⎦
∑∑
因而2min x
Ax b b -=。
于是推出A b +是Ax b =的最小二乘解。
从而线性方程组
Ax b =的所有最小二乘解可以表示为
112H
b x V x -⎡⎤∑=⎢⎥⎣⎦
2x ∀
由于2
2
2
11
1(,0)H H
A b V diag U b b +
--=∑=∑及2
2
2
1
12x b x -=∑+,知b A +是满足
0min x
Ax b Ax b -=-的解中的最小长度解。
4 矩阵分解在递推系统辨识中的应用
4.1递推系统辨识中的困难
在递推系统辨识中,通过最小二乘法求出的参数估计值是不合理的。
主要是由于下面两个方面的原因:
4.1.1 病态问题
最小二乘法在实际应用中经常会遇到这样的问题,即方程(3-1)
T T F W W Y W θ∧
••=
或公式(3-2)
1()T T F Y W W W θ∧
-=•••
呈现病态,得到的辨识参数的估计值θ∧
很不稳定,结果的精度很低以致无法采用。
4.1.2 效率和计算量问题
一次完成算法(3-1)或(3-2)中T W W •需要进行多次乘法和加法运算,整体参数求解需要 进行两次矩阵相乘和一次矩阵求逆运算,解的结构过于复杂,求得的估计值在实现上效率比较低,所得结果的精度也比较低。
尽管可以通过无矩阵求逆来实现最小二乘法,但是矩阵与向量的相乘计算量也随之增加。
为了解决上述问题,通常采用效率和精度较高的QR 分解来实现。
首先考虑式(3-2),可以得到下面的结论:
(ⅰ)对F Y 和W 施行相同的正交列变换,参数辨识的最终结果保持不变。
(ⅱ)在牙的右边插入全零列,并在F Y 的相同位置插入任意数值的列,最终求得辨识参数的结果保持不变。
同样,如果牙中发现有全零列,那么把这些全零列从附中移去,然后在养中移去相应位置的列,参数辨识的结果保持不变。
根据上面两个结论,可以考虑对砰进行正交变换,将其化为下三角形式,同时对耳进行同样的变换,这样的变换不会使参数辨识的估计值发生改变,并且结果的形式会更加简洁。
为了便于进行递推辨识,首先对一次完成算法的结果进行适当修正。
由前的结果可知,分块Hankel 矩阵W 必须为行满秩的,在这种情况下系统参数的估计值才能唯一确定。
定理4.1:对于矩阵m n A R ⨯∈,若rank(A)=m (n>m ),即A 是行满秩的,则存在m 阶下三角矩阵L ,使得矩阵A 可以分解为1T
A L Q =•,其中m n ⨯矩阵[]10L L
=。
由上面的定理可知,满秩矩阵平可以通过列变换化为下三角矩阵和正交矩阵的乘积,即
[]0W Q L •=(5-3a )
或则[]0T W L
Q =•(5-3b )
其中单位正交矩阵()()
N n N n Q R
-⨯-∈为变换矩阵,22n n L R ⨯∈为下三角可逆矩阵,
2(3)0n N n R ⨯-∈为零矩阵。
将式(5-2)其代入式(5-3b )中,可以得到
1
1()()0T T
T T F F L Y W W W Y Q L L θ∧
--⎡⎤
=•••=••••⎢⎥⎣⎦
11
()0T T F FQ L L L Y Q Y L --⎡⎤••=••=•⎢⎥⎣⎦
其中向量FQ Y 是向量F Y 和矩阵Q 的前2n 列相乘得到的。
这就是最小二乘一次完成算法的结果。
可以看出,此时得到的结果形式比较简单。
由于矩阵L 是下三角矩阵,矩阵求逆运算是通过对矩阵中的元素求逆来实现的。
4.2 QR 分解的实现方法
假设矩阵m n A R ⨯∈若rank(A)=m (n>m ),即A 是行满秩的,对这样一个满秩矩阵进行QR 分解,可以通过Schmidt 正交化方法来实现。
假设矩阵A 的各个行向量分别为12,,
,m ααα,
它们之间是线性无关的,而n>m ,可以在这m 个向量的基础上扩充为
121,,
,,,,m m n ααααα+,得到n 个线性无关的向量,这恰好是m n R ⨯的一组基。
按照Schmidt
标准正交化方法先将这n 个线性无关的向量正交化得12,,,n βββ再单位化得12,,,n ϕϕϕ,
则有
1111c αϕ= 2211222c c αϕϕ=+
1122m m m mm m c c c αϕϕϕ=+++
11,111,221,11m m m m m m c c c αϕϕϕ++++++=++
+
1122n n n nn n c c c αϕϕϕ=++
+
则新的构造矩阵为
111111122111,111,221,111122m m m m mm m m m m m m m n n n n nn n c A c c c A c c c c c c αϕααϕϕϕαϕϕϕααϕϕϕ+++++++⎡⎤⎡⎤
⎢⎥⎢⎥
⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥+++⎢⎥===⎢⎥⎢⎥⎢⎥+++⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦
⎢⎥⎢⎥+++⎢⎥⎢⎥⎣⎦⎣⎦
1112122212
n n nn n c c c c c c ϕϕϕ⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥=•⎢⎥⎢⎥⎢
⎥⎢⎥⎣⎦⎣⎦
取其中的前m 行,可以得到
[]111212221
12
00000.0
0T T n n nn
n c c c A L Q L Q c c c ϕϕϕ⎡⎤⎡⎤
⎢⎥⎢⎥⎢⎥⎢⎥=•==•⎢⎥⎢⎥⎢
⎥⎢⎥⎣⎦⎣⎦
其中L 为m m ⨯的下三角满秩矩阵,Q 为n n ⨯的单位正交矩阵。
事实上,对非满秩的矩阵也可以进行上述分解,但是得到下三角矩阵的主对角元中会出现零元素,也就是说下三角矩阵L 是奇异的。
上述方法在理论上具有重要的研究价值,但是在实现上却有很大的局限性,尤其不适合进行递推实现,因为递推时每行只需将新添加的一个元素化为零,采用Schmidt 正交化方法计算过于繁琐。
在工程实践上可以通过GIVENS 变换来实现矩阵的QR 分解,将其化为上
三角矩阵和正交矩阵的乘积。
下面着重介绍系统辨识中常用的QR 分解方法。
4.2.1 GIVENS 变换
具有如下形式的22⨯的正交矩阵
cos sin =sin cos G θθθ
θ⎡⎤
⎢⎥⎣⎦
称为GIVENS 矩阵,它可以实现如下的变换
0x r G y ⎡⎤⎡⎤
•=⎢⎥⎢⎥⎣⎦⎣⎦
即将一个二维向量的第二个分量化为零。
这样可以看作二维平面中某一点的坐标通过旋转θ角度反射到x 轴上。
广义的GIVENS 矩阵具有如下的形式:
1
1
cos sin sin cos i k i i n I G I I θθθθ
----⎡⎤
⎢⎥⎢⎥⎢
⎥=⎢
⎥-⎢⎥⎢⎥⎣
⎦
若[]1
21
T
n n n x x x x x R -=∈,
则广义的GIVENS 矩阵可以利用其第i 个分量, 将第k 个分量化为零,即:
[]1
20
T
n i n x x x r x R =∈
i k
利用GIVENS 变换,可以将矩阵m n
A R
⨯∈化为下三角形式,而进行的变换为正交变换,
这样就可以实现A 的QR 分解。
由于变换形式简单容易实现,有利于算法的优化。
4.3 递推算法
由前面得到的公式(5-2)可知,利用新数据得到更新的矩阵L 和向量FQ Y ,然后将更新值代入到公式中即可求得辨识参数的递推值。
因此进行递推辨识,主要是利用新数据对矩阵L 和向量FQ Y 进行更新。
当前已知量为矩阵L 和向量FQ Y 。
同时定义输入向量u 和输出向量y ——它们是递推辨识时用来更新L 矩阵的输入输出数据,包含离当前时刻最近的n 组输入输出数据,当前它们
的值为
(1)(1)(2)(2),()()u N n y N n u N n y N n u y u N y N -+-+⎡⎤⎡⎤⎢⎥⎢⎥
-+-+⎢
⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥
⎣⎦⎣⎦
首先利用上面的输入输出向量对参与变换的相关参数(即矩阵L 和向量FQ Y )进行更新。
在矩阵L 和向量FQ Y 的最后增加一列,按照前面分块Hankel 矩阵沙的规律将相应数据添加到这一列中,得到更新值为
u L L y ⎡⎤
⎢⎥→⎢⎥⎢⎥⎣⎦
1FQ
FQ Y y Y ⎡⎤→⎣⎦
此时的L 矩阵具有下面的形式
(1,1)
(1)(,1)(,)
()(1,1)(1,)(1,1)(1)(2,1)
(2,)
(2,1)
(2,2)()L u N n L n L n n u n L n L n n L n n y N n L n L n n L n n L n n y n -+⎡⎤
⎢⎥⎢
⎥⎢⎥⎢
⎥
++++-+⎢⎥
⎢⎥⎢
⎥
+⎣⎦
考虑算法中的实时更新和覆盖,上面的L 矩阵可以写为
(1,1)
(1,21)(2,1)(2,2)(2,21)L L n L L n L n n L n n +⎡⎤
⎢⎥=⎢
⎥
⎢⎥+⎣⎦
对上述矩阵L 进行正交列变换,把新增列的元素都化为零,将它化为下三角形式。
此时L 矩阵中只有最后一列元素需要化为零,其他位置的元素都己经符合下三角矩阵的形式,即每一行只需将最后一个元素化为零即可。
首先考虑对第1行进行变换。
将主对角元和最后一个元素组成二维向量
[][](1)(2)(1,1)(121)T T T L L n ==+,
利用主对角元将它后面的元素化为零。
通过求得适当的GIVENS 矩阵G 。
实现下述变换结果
[]r 0T T G •=
其中
c s G s c ⎡⎤=⎢⎥
-⎣⎦
(11)s=
(11)L L ,,
经过验证确实满足将第二个分量化为零的变换要求,而且可以得到
(11)r=
(11)L L ,
,
当L(1,1)=0时,直接通过列交换来实现,此时的GLVENS 矩阵为
0110G ⎡⎤
=⎢⎥
-⎣⎦
这样L 矩阵第l 行就变成了下面的形式
[]
(1,1)
0L
其中L(1,1)的数值己经更新为r 。
对得到的GLVENS 矩阵G 进行扩展,利用2n+1维的单位矩阵P 存储变换信息——包括变换得到的GIVENS 矩阵和矩阵L 中参与变换元素所在的位置。
[][](1,21,1,21)T
P n n G ++=
这实际上是进行了下面的存储
21n c
s P I s c --⎡⎤⎢⎥=⎢⎥
⎢⎥⎣⎦
上述变换对L 中第一列和最后1列的元素会产生影响,所以要用P 矩阵来更新L 矩阵,即将L •P 作为L 的当前值。
为了保证最后辨识结果不变,需要对向量FQ Y 进行同样的变换,即将FQ Y 作为FQ Y 的更新值。
这样对第1行的变换就完成了,p 矩阵中的信息转移到矩阵L 和向量FQ Y 中,从而不需对P 再进行存储,这里的P 矩阵相当于一个中间转换矩阵。
以后对矩阵P 都按照这种方法来进行处理。
考虑对第i 行进行变换。
当前L 矩阵的形式为
(1,1)0
(1,1)(1,1)0
(,1)(,1)(,)(,21)(2,1)
(2,1)
(2,)
(2,2)(21,21)L L i L i i L i L i i L i i L i n L n L n i L n i L n n L n n ⎡⎤⎢⎥⎢
⎥⎢⎥---⎢
⎥
-+⎢⎥
⎢⎥⎢
⎥
-++⎣⎦
其中的元素都是经过每次列正交变换得到的GIVENS 矩阵修正后的数值。
将第i 行的主对角元和最后一列元素组成如下的二维向量。
[][]
(1)(2)(,)(21)T T T L i i L i n ==+,
对此二维向量进行GIVENS 变换,将第二个分量化为零。
得到如下形式的GIVENS 矩阵。
c s G s c ⎡⎤=⎢⎥-⎣⎦
(,)s=
(,)L i i L i i
可以验证上述GIVENS 矩阵能够实现下面的变换目标
[]r 0T T G •=
其中
(,)
r=
(,)
L i i L i i •
对得到的GIVENS 矩阵G 进行扩展,将变换信息存储在2n+1维的单位矩阵P 中,以保存得到的变换矩阵和L 中参与变换元素所在的位置,即
[][](,21,,21)T
P i n i n G ++=
这实际上是进行了下面的存储
121
i n I c s P I s c --⎡⎤
⎢⎥-⎢
⎥=⎢⎥⎢
⎥⎣
⎦
用P 来更新L 矩阵,即将L •P 作为L 的更新值。
此时得到的L 矩阵具有下面的形式
(1,1)0
(,1)(,)
(1,1)(1,)(1,1)(1,21)(2,1)
(2,)
(2,1)
(2,2)(2,21)L L i L i i L i L i i L i i L i n L n L n i L n i L n n L n n ⎡⎤⎢⎥⎢
⎥⎢⎥⎢
⎥
++++++⎢⎥
⎢⎥⎢
⎥
++⎣⎦
利用矩阵P 对向量FQ Y 进行同样的变换,以保证最后的结果不变,即
FQ FQ Y P Y •→
将FQ Y P •作为FQ Y 的更新值。
按照上面的方法对每一行都进行类似的变换,最终可以将L 矩阵化为如下的下三角形式。
(1,1)
0(2,1)(2,2)0L L L n L n n ⎡⎤
⎢⎥=⎢
⎥
⎢⎥⎣⎦
由于每次变换后都用矩阵P 来修正向量FQ Y ,这相当于对矩阵L 和向量FQ Y 进行了同样的正交列变换,最后结果不会发生变化。
变换结束后,矩阵L 最后有1个全零列。
根据前面得到的结论,去掉矩阵L 中的全零列,同时去掉向量FQ Y 中对应的列(在这里是指最后一列),最终的辨识结果不会发生变化。
当得到的矩阵L 可逆时,可以根据前面的公式求得辨识参数的一步递推值。
最后还要对当前的相关参数进行数据更新。
对输入向量u 和输出向量y 进行平移,即
(2)(2),()()(1)(1)u N n y N n u y u N y N u N y N -+-+⎡⎤⎡⎤
⎢⎥⎢⎥
⎢
⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥++⎣⎦⎣⎦
当再次获得新的采用数据时,将其输出值赋给1y ,即1(2)y y N =+,它们与得到的矩阵L 和向量FQ Y 一起作为下次递推的初始值。
在线重复上述过程,即可得到系统辨识参数的
递推估计值。
5 结论
本文归纳和总结了矩阵分解的类型及其相关的理论应用,把矩阵分解大致分为等价分解、三角分解、谱分解、奇异值分解和Fitting分解等五类,在证明过程中注重理论的前后衔接。
在很多实际工程问题中,矩阵分解都具有很大的优势,但因作者水平有限,本文仅仅只是略提了一下有关矩阵分解理论中的运用和实际工程方面的应用,以后可以做更深一步的研究。
6 参考文献
[1] 孙延鹏.QR分解技术在递推系统辨识中的应用[D].北京交通大学,2008.
[2] 宋彦国,孙涛.旋翼飞行器飞行动力学系统辨识建模算法[J].南京航空航天大学学
报,2011,43(3):387-392.
[3] 于开平,董好志.基于前向神经网络的时变非线性结构系统辨识快速递推最小二乘法[J].振
动工程学报,2007,20(5):468-472.
[4] 庞世伟,于开平,邹经湘等.用于时变系统辨识的自由响应递推子空间方法[J].振动工程学
报,2005,18(2):233-237.
[5] 李建东.矩阵QR分解的三种方法[J].吕梁高等专科学校学报,2009,25(1):16-19.
[6] 袁晖坪.广义行(列)对称矩阵的QR分解及其算法[J].计算机应用,2012,32(4):990-993,998.
[7] 仲光苹,刘金明.矩阵分解理论及应用[J].黑龙江科技信息,2012,(29):199-200,98.
[8]方保镕,周继东,李医民.矩阵论[M].北京:清华大学出版社,2004.
[9]戴华.矩阵论[M].北京:科学出版社,2001 .
[10]苏育才,姜翠波,张跃辉.矩阵理论[M].北京:科学出版社, 2006.。