数值分析-第7章 矩阵特征值问题的数值解法n
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i 1 i 1 i 1
n ( Ax, x) ( i i xi , i xi ) i 1 i2
i 1 2 i
n
n
n
n
n
i 1
i 1
i 1
2 i
i 1
由式(1)的证明,易见式(2)和式(3)成立。定理得证。
4
定理7.1.5 (Gerschgorin圆盘定理) 设ARnn,则 (1)A的每一个特征值必属于下述某个圆盘之中,
(1, 0.8, -0.7)
(10, 8, -7)
(7.2, 5.4, -10.4)
2
3 5
-10.4
8.230769 6.430115
(-0.692308 -0.519231, 1.0)
(-0.546729, -0.399533, 1.0) (-0.467815, -0.335976, 1.0)
(-4.5, -3.288462, 8.230769)
~ v1 ( y ( k +1) - y ( k ) ) 2 (k ) ~ ) y - y ( k + 2) - 2 y ( k +1) + y ( k ) max(v1
第7章 矩阵特征值问题的数值解法
很多工程计算中,会遇到特征值和特征向量的计算, 如:机械、结构或电磁振动中的固有值问题;物理学中 的各种临界值等。这些特征值的计算往往意义重大。
求解线性方程组的迭代法,重要一点是判断迭 代法的收敛性;判断方法之一就是看迭代矩阵的特 征值的模是否都小于1。 n阶方阵A的特征值是特征方程 det(A-I)=0 的根. A的特征向量是齐次线性方程组 (A-I)x=0 的非零解.
特征值的范围. 解 我们先分别求出各个圆盘区域。 D1 = {z:|z – 1|£0.6};D2 = {z:|z – 3|£0.8} D3 = {z:|z + 1|£1.8};D4 = {z:|z + 4|£0.6}. 易见D2和D4为 弧立圆盘分别 包含A的两个实 特征值.
D4
D3
D1
D2
6
7.2
Di {z C : z - aii
j 1, j i
n
aij } , i 1, 2,, n
表示以aii为中心,以
j 1, j i
a
n
ij
半径为的复平面上的n个圆盘。
(2)如果矩阵A的m个圆盘组成的并集S(连通的)与其余 n – m个圆盘不连接,则S内恰包含m个A的特征值。 证 我们只证明(1)。 是矩阵A的任一特征值,即Axx (x 0) 设
2 mk + 2 mk - mk +1 (mk +1 - mk ) 2 1 mk mk + 2 - 2mk +1 + mk mk + 2 - 2mk +1 + mk
(mk +1 - mk ) 2 ~ mk mk mk + 2 - 2mk +1 + mk 会达到加速收敛的目的.
构造Aitken序列
7.2.1
幂法和反幂法
幂法
设矩阵A R n*n的n个特征值满足 1 2 ....... n , 对应的特征向量为 v1,v2,…vn 线性无关.
1 和 v1 分别称为主特征值和主特征向量.
幂法的基本思想是取初始向量x(0)Rn,作迭代 x(k+1) =Ax(k) =Ak+1x(0) , k=0,1,2,…
设 xi max x k x 1 k n
( - aii ) xi
考虑第i个方程
- aii
j 1, j i
a
j 1
n
ij
x j x i
n
j 1, j i
a
n
ij
xj
n
a ij x j xi
j 1, j i
a ij
xj xi
j 1, j i
a
n
ij
结论成立。
5
利用定理,我们可以由A的元素估计特征值的范围.A的n个 特征值均落在n个原盘上,但不一定每个圆盘都有一个特征值. 例7.1.1 估计矩阵
0.1 0.2 1 0.5 3 0.1 A 1 0.3 -1 0.2 - 0.3 - 0.1 0.3 0.2 0.5 - 4
1 [a1v1 + a i (
k
max(x ( k ) ) max(Ay ( k -1) ) max(A
v1 max(Av1 ) ) max(v1 ) max(v1 )
max(1v1 ) 1 (k ) max(v1 )
9
由定理的证明可见幂法的收敛速度由 2 / 1 的大小确定。 , 如果1 2 ... r,且r r +1 ,可以作类似的分析有 ,
x ( k +1) Ay ( k )
(4) 若 |mk-u|< , 则输出mk , y(k) , 停算; (5)若k=N,则停算,输出计算失败信息;否则,置k=k+1, u=mk, 转步2;
10
- 4 14 0 例7.2.1 设 A - 5 13 0 - 9 0 2
实际计算时,常把每一 步计算的迭代向量 (k ) 规范化。 x
为此, 记 max(x) xi , 其中xi x .这样, 我们有
如下实用的幂法计算公式:
(k ) x (k ) y max(x ( k ) ) (k 0,1,2.) x ( k +1) Ay ( k )
max(v1 )
k
n
证明:由(7.2ቤተ መጻሕፍቲ ባይዱ4)
y (k )
y (k )
n i k ) vi ] [a1v1 + ai ( i ) k v i ] a1v1 v1 1 1 i 2 i 2 ( k ) n max(a1v1 ) max(v1 ) n k max1 [a1v1 + a i ( i ) k v i ] max[a1v1 + ai ( i ) k v i ] 1 1 i 2 i 2
det(A) 12 n
定义7.1.2 设矩阵ARnn为对称矩阵,对于任一非零向量x,称
( Ax, x ) R( x ) ( x, x )
为对应于向量x的Rayleigh商.
3
定理7.1.4 设ARnn为对称矩阵,其特征值1≥2≥…≥n,对应特征 向量x1,x2,...,xn组成规范正交向量组,则有 (1)对任意xRn,x≠0,有
(2) n min R( x)
x 0
n R( x) 1
x 0
(3) 1 max R( x)
证 由x1, x2, …, xn组成规范正交向量组,则对非零向量x,有
x i x i
i 1 n
n n n
( x, x) ( i xi , i xi ) i2 0
(-3.406542,-2.460280, 6.920561) (-2.832406, -2.028615, 6.210333)
7
9 11 12
6.104716
6.026349 6.006637 6.003327
(-0.450275, -0.322058, 1.0)
(-0.445914, -0.318617, 1.0) (-0.444814, -0.31775, 1.0) (-0.444630, -0.317606, 1.0)
(-2.707710, -1.935377, 6.052479)
(-2.676980, -1.912449, 6.013229) (-2.669257, -1.906692, 6.003327)
可取 1 6.003327, y(12)(-0.444630, -0.317606, 1.0)T.
12
7
k n 2 x ( k ) 1 [a1v1 + a 2 ( 1 ) k v 2 + + a n ( 1 ) k v n ]
k 若a10, 则对充分大的k有 x ( k ) 1 a1v1 从而知x(k)是属于λ1的特征向量.
因而有
k x ( k +1) 1 +1a1v1 1 x ( k )
其中i为A的特征值,P的各列为相应于i的特征向量。
P -1 AP D
2
n
2
定理7.1.3 ARnn,1, …, n为A的特征值,则
(1)A的迹数等于特征值之和,即 tr ( A) aii i
i 1 i 1
n
n
(2)A的行列式值等于全体特征值之积,即
(7.2.4)
8
定理7.2.1 设AÎ n×n的特征值i (i = 0,1,2,…)满足式(7.2.1),且 R 对应n个线性无关的特征向量v1, v2, …,vn,任给初始向量
x
(0)
ai v i
( a1 0),则由式(7.2.4)生成的向量序列 i 1 有) v1 (k lim y lim max( x ( k ) ) 1 k
产生迭代序列x(k).
由于v1,v2,…vn 线性无关, 从而有 x(0) =a1v1+a2v2+…+anvn 故有 x(k) = Akx(0) =a11kv1+a22kv2+…+annkvn
k n 2 x ( k ) 1 [a1v1 + a 2 ( 1 ) k v 2 + + a n ( 1 ) k v n ]
(7.2.4)
max(x ( 0) ) 1
y (0) x (0) max(x (0) ) (1, 1, 1) T
x (1) Ay (0) (10, 8, - 7) T
11
k
max(x(k))
y(k) = x(k)/max(x(k))
x(k+1) = Ay (k)
0
1
1
10
(1, 1, 1)
x ( k -1) A max(x ( k -1) ) x (k ) Ay ( k -1) max(x ( k ) ) max(Ay ( k -1) ) x ( k -1) max A max(x ( k -1) )
n
A k x ( 0) max(A k x ( 0) )
7.2.2 幂法的加速技术
由于
mk max(x
(k )
) 1 + o(
2 k 1
)
所以,幂法收敛速度取决于比值|2/1|,当|2/1|1时,收敛是很慢的. 1. Aitken 加速方法 由上式可知 解之得
mk + 2 - 1 mk +1 - 1 mk +1 - 1 mk - 1
lim y
k (k ) r
i 1
ci v i
r i 1
max( ci v i )
, lim max(x ( k ) ) 1。
k
可见, y ( k ) 仍收敛于一个主特征向 量。
算法7.1 幂法 (1)输入矩阵A,非零初始向量x(0),最大迭代次数N,精度 , 置k=0,u=0; (2) 计算 mk = max (x(k)); (3)计算 y ( k ) x ( k ) / mk
1 xi(k +1) / xi(k )
i 1,2,, n
可见,当k充分大时, ( k ) 近似于主特征值, ( k +1) 与x ( k )的对应非零分量的比值 x x 近似于主特征值。
在实际计算中需要对计算结果进行规 , 范化。因为当 1 1时,x (k ) 趋于零, 当1 1时, x ( k )的非零分量趋于无穷。 从而计算时会出现下溢 或上溢。
1
7.1
特征值问题的性质与估计
B P -1 AP
定义7.1.1 设矩阵A, BRnn,若有可逆阵P,使 则称A与B相似。 定理7.1.1 若矩阵A, BRnn且相似,则 (1)A与B的特征值完全相同; (2)若x是B的特征向量,则Px便为A的特征向量。 定理7.1.2 设ARnn具有完全的特征向量系,即存在n个线性无关 的特征向量构成Rn的一组基底,则经相似变换可化A为对角阵, 即有可逆阵P,使 1
用规范化幂法求A的主特征值和相应特征向量. 解 A的特征值1 = 6,2 = 3,3 = 2。取初始值x(0) = (1, 1, 1)T, 用规范化幂法公式(7.2.4)计算
(k ) x (k ) y max(x ( k ) ) (k 0,1,2.) x ( k +1) Ay ( k )
n ( Ax, x) ( i i xi , i xi ) i 1 i2
i 1 2 i
n
n
n
n
n
i 1
i 1
i 1
2 i
i 1
由式(1)的证明,易见式(2)和式(3)成立。定理得证。
4
定理7.1.5 (Gerschgorin圆盘定理) 设ARnn,则 (1)A的每一个特征值必属于下述某个圆盘之中,
(1, 0.8, -0.7)
(10, 8, -7)
(7.2, 5.4, -10.4)
2
3 5
-10.4
8.230769 6.430115
(-0.692308 -0.519231, 1.0)
(-0.546729, -0.399533, 1.0) (-0.467815, -0.335976, 1.0)
(-4.5, -3.288462, 8.230769)
~ v1 ( y ( k +1) - y ( k ) ) 2 (k ) ~ ) y - y ( k + 2) - 2 y ( k +1) + y ( k ) max(v1
第7章 矩阵特征值问题的数值解法
很多工程计算中,会遇到特征值和特征向量的计算, 如:机械、结构或电磁振动中的固有值问题;物理学中 的各种临界值等。这些特征值的计算往往意义重大。
求解线性方程组的迭代法,重要一点是判断迭 代法的收敛性;判断方法之一就是看迭代矩阵的特 征值的模是否都小于1。 n阶方阵A的特征值是特征方程 det(A-I)=0 的根. A的特征向量是齐次线性方程组 (A-I)x=0 的非零解.
特征值的范围. 解 我们先分别求出各个圆盘区域。 D1 = {z:|z – 1|£0.6};D2 = {z:|z – 3|£0.8} D3 = {z:|z + 1|£1.8};D4 = {z:|z + 4|£0.6}. 易见D2和D4为 弧立圆盘分别 包含A的两个实 特征值.
D4
D3
D1
D2
6
7.2
Di {z C : z - aii
j 1, j i
n
aij } , i 1, 2,, n
表示以aii为中心,以
j 1, j i
a
n
ij
半径为的复平面上的n个圆盘。
(2)如果矩阵A的m个圆盘组成的并集S(连通的)与其余 n – m个圆盘不连接,则S内恰包含m个A的特征值。 证 我们只证明(1)。 是矩阵A的任一特征值,即Axx (x 0) 设
2 mk + 2 mk - mk +1 (mk +1 - mk ) 2 1 mk mk + 2 - 2mk +1 + mk mk + 2 - 2mk +1 + mk
(mk +1 - mk ) 2 ~ mk mk mk + 2 - 2mk +1 + mk 会达到加速收敛的目的.
构造Aitken序列
7.2.1
幂法和反幂法
幂法
设矩阵A R n*n的n个特征值满足 1 2 ....... n , 对应的特征向量为 v1,v2,…vn 线性无关.
1 和 v1 分别称为主特征值和主特征向量.
幂法的基本思想是取初始向量x(0)Rn,作迭代 x(k+1) =Ax(k) =Ak+1x(0) , k=0,1,2,…
设 xi max x k x 1 k n
( - aii ) xi
考虑第i个方程
- aii
j 1, j i
a
j 1
n
ij
x j x i
n
j 1, j i
a
n
ij
xj
n
a ij x j xi
j 1, j i
a ij
xj xi
j 1, j i
a
n
ij
结论成立。
5
利用定理,我们可以由A的元素估计特征值的范围.A的n个 特征值均落在n个原盘上,但不一定每个圆盘都有一个特征值. 例7.1.1 估计矩阵
0.1 0.2 1 0.5 3 0.1 A 1 0.3 -1 0.2 - 0.3 - 0.1 0.3 0.2 0.5 - 4
1 [a1v1 + a i (
k
max(x ( k ) ) max(Ay ( k -1) ) max(A
v1 max(Av1 ) ) max(v1 ) max(v1 )
max(1v1 ) 1 (k ) max(v1 )
9
由定理的证明可见幂法的收敛速度由 2 / 1 的大小确定。 , 如果1 2 ... r,且r r +1 ,可以作类似的分析有 ,
x ( k +1) Ay ( k )
(4) 若 |mk-u|< , 则输出mk , y(k) , 停算; (5)若k=N,则停算,输出计算失败信息;否则,置k=k+1, u=mk, 转步2;
10
- 4 14 0 例7.2.1 设 A - 5 13 0 - 9 0 2
实际计算时,常把每一 步计算的迭代向量 (k ) 规范化。 x
为此, 记 max(x) xi , 其中xi x .这样, 我们有
如下实用的幂法计算公式:
(k ) x (k ) y max(x ( k ) ) (k 0,1,2.) x ( k +1) Ay ( k )
max(v1 )
k
n
证明:由(7.2ቤተ መጻሕፍቲ ባይዱ4)
y (k )
y (k )
n i k ) vi ] [a1v1 + ai ( i ) k v i ] a1v1 v1 1 1 i 2 i 2 ( k ) n max(a1v1 ) max(v1 ) n k max1 [a1v1 + a i ( i ) k v i ] max[a1v1 + ai ( i ) k v i ] 1 1 i 2 i 2
det(A) 12 n
定义7.1.2 设矩阵ARnn为对称矩阵,对于任一非零向量x,称
( Ax, x ) R( x ) ( x, x )
为对应于向量x的Rayleigh商.
3
定理7.1.4 设ARnn为对称矩阵,其特征值1≥2≥…≥n,对应特征 向量x1,x2,...,xn组成规范正交向量组,则有 (1)对任意xRn,x≠0,有
(2) n min R( x)
x 0
n R( x) 1
x 0
(3) 1 max R( x)
证 由x1, x2, …, xn组成规范正交向量组,则对非零向量x,有
x i x i
i 1 n
n n n
( x, x) ( i xi , i xi ) i2 0
(-3.406542,-2.460280, 6.920561) (-2.832406, -2.028615, 6.210333)
7
9 11 12
6.104716
6.026349 6.006637 6.003327
(-0.450275, -0.322058, 1.0)
(-0.445914, -0.318617, 1.0) (-0.444814, -0.31775, 1.0) (-0.444630, -0.317606, 1.0)
(-2.707710, -1.935377, 6.052479)
(-2.676980, -1.912449, 6.013229) (-2.669257, -1.906692, 6.003327)
可取 1 6.003327, y(12)(-0.444630, -0.317606, 1.0)T.
12
7
k n 2 x ( k ) 1 [a1v1 + a 2 ( 1 ) k v 2 + + a n ( 1 ) k v n ]
k 若a10, 则对充分大的k有 x ( k ) 1 a1v1 从而知x(k)是属于λ1的特征向量.
因而有
k x ( k +1) 1 +1a1v1 1 x ( k )
其中i为A的特征值,P的各列为相应于i的特征向量。
P -1 AP D
2
n
2
定理7.1.3 ARnn,1, …, n为A的特征值,则
(1)A的迹数等于特征值之和,即 tr ( A) aii i
i 1 i 1
n
n
(2)A的行列式值等于全体特征值之积,即
(7.2.4)
8
定理7.2.1 设AÎ n×n的特征值i (i = 0,1,2,…)满足式(7.2.1),且 R 对应n个线性无关的特征向量v1, v2, …,vn,任给初始向量
x
(0)
ai v i
( a1 0),则由式(7.2.4)生成的向量序列 i 1 有) v1 (k lim y lim max( x ( k ) ) 1 k
产生迭代序列x(k).
由于v1,v2,…vn 线性无关, 从而有 x(0) =a1v1+a2v2+…+anvn 故有 x(k) = Akx(0) =a11kv1+a22kv2+…+annkvn
k n 2 x ( k ) 1 [a1v1 + a 2 ( 1 ) k v 2 + + a n ( 1 ) k v n ]
(7.2.4)
max(x ( 0) ) 1
y (0) x (0) max(x (0) ) (1, 1, 1) T
x (1) Ay (0) (10, 8, - 7) T
11
k
max(x(k))
y(k) = x(k)/max(x(k))
x(k+1) = Ay (k)
0
1
1
10
(1, 1, 1)
x ( k -1) A max(x ( k -1) ) x (k ) Ay ( k -1) max(x ( k ) ) max(Ay ( k -1) ) x ( k -1) max A max(x ( k -1) )
n
A k x ( 0) max(A k x ( 0) )
7.2.2 幂法的加速技术
由于
mk max(x
(k )
) 1 + o(
2 k 1
)
所以,幂法收敛速度取决于比值|2/1|,当|2/1|1时,收敛是很慢的. 1. Aitken 加速方法 由上式可知 解之得
mk + 2 - 1 mk +1 - 1 mk +1 - 1 mk - 1
lim y
k (k ) r
i 1
ci v i
r i 1
max( ci v i )
, lim max(x ( k ) ) 1。
k
可见, y ( k ) 仍收敛于一个主特征向 量。
算法7.1 幂法 (1)输入矩阵A,非零初始向量x(0),最大迭代次数N,精度 , 置k=0,u=0; (2) 计算 mk = max (x(k)); (3)计算 y ( k ) x ( k ) / mk
1 xi(k +1) / xi(k )
i 1,2,, n
可见,当k充分大时, ( k ) 近似于主特征值, ( k +1) 与x ( k )的对应非零分量的比值 x x 近似于主特征值。
在实际计算中需要对计算结果进行规 , 范化。因为当 1 1时,x (k ) 趋于零, 当1 1时, x ( k )的非零分量趋于无穷。 从而计算时会出现下溢 或上溢。
1
7.1
特征值问题的性质与估计
B P -1 AP
定义7.1.1 设矩阵A, BRnn,若有可逆阵P,使 则称A与B相似。 定理7.1.1 若矩阵A, BRnn且相似,则 (1)A与B的特征值完全相同; (2)若x是B的特征向量,则Px便为A的特征向量。 定理7.1.2 设ARnn具有完全的特征向量系,即存在n个线性无关 的特征向量构成Rn的一组基底,则经相似变换可化A为对角阵, 即有可逆阵P,使 1
用规范化幂法求A的主特征值和相应特征向量. 解 A的特征值1 = 6,2 = 3,3 = 2。取初始值x(0) = (1, 1, 1)T, 用规范化幂法公式(7.2.4)计算
(k ) x (k ) y max(x ( k ) ) (k 0,1,2.) x ( k +1) Ay ( k )