第8章 特征值和特征向量
特征值与特征向量
特征值与特征向量首先,让我们来了解一下什么是矩阵。
矩阵是一个由m行n列元素组成的矩形数表,可以表示为[A]或者A = [a_ij],其中i表示行数,j表示列数,a_ij表示第i行第j列的元素。
现在,我们来定义特征值和特征向量。
特征值:一个数λ称为矩阵A的特征值,如果存在一个非零向量X 使得AX=λX成立。
其中,X被称为特征值λ对应的特征向量。
特征向量:一个非零向量X称为矩阵A的特征向量,如果存在一个数λ使得AX=λX成立。
特征向量可以是多维的,可以是列向量或行向量。
特征值和特征向量的计算方法:给定一个n阶方阵A,要找到它的特征值和特征向量,我们需要解决下面的特征方程Ax=λx,其中A是矩阵,x是特征向量,λ是特征值。
为了求解特征方程,我们需要将特征方程等式转换为一个齐次线性方程组,即(A-λI)x=0,其中I是n阶单位矩阵。
然后,我们需要找到零空间(Null Space)或核(Kernel)来求解方程组(A-λI)x=0。
零空间是指在方程组的解向量中满足Ax=λx的向量空间。
在找到解向量后,我们可以得到特征值λ和特征向量x。
特征向量是零空间中的一个非零向量。
特征值和特征向量在很多领域中都有广泛的应用。
1.物理学中,特征值和特征向量在量子力学中用于解决薛定谔方程,求解能量本征值和波函数。
2.机器学习和数据分析中,特征值和特征向量用于主成分分析(PCA),可以降低数据的维度,提取主要特征。
3.图像处理和计算机视觉中,特征值和特征向量用于特征提取、图像压缩等。
4.工程中,特征值和特征向量可用于结构分析、振动模态分析等。
5.金融学和经济学中,特征值和特征向量可用于风险分析、资产组合优化等。
总之,特征值和特征向量是矩阵和线性代数中的重要概念,广泛应用于各个领域。
了解特征值和特征向量的计算方法和应用可以帮助我们更好地理解和应用相关的数学理论和方法。
矩阵特征值与特征向量的计算_OK
n阶方阵A的特征值是特征方程 PA()=det(A-E)=0
的根.
A的特征向量是齐次线性方程组 (A-E)x=0
的非零解.
PA()是的高次的多项式,它的求根是很困难的。设法通
过数值方法是求它的根。
通常对某个特征值,可以用些针对性的方法来求其近似值。
若要求所有的特征值,则可以对A做一系列的相似变换,
“收敛”到对角阵或上(下)三角阵,
可得
n
xk
Ak x0 max(Ak x0 )
11 m ax (11
i
(
i 1
)
k
i
i2
n
i
(
i 1
)
k
i
)
7
i2
所以
8.1.1 幂法
n
xk
Ak x0 max(Ak x0 )
11
i
(
i 1
)
k
i
i2
n
max(11
i
(
i 1
)
k
i
)
lim
k
xk
11 max (11 )
i2 1
max (1 )
y=x/max(x)为向量x例的如规,范设化向向量量x=. (2,1,-5,-1)T,则max(x)=-5,y=(-0.4,-
0.2,1,0.2)T.可见规范化向量y总满足‖y‖=1.
幂法的规范化计算公式为: 任取初始向量x0=y0 0,计算
yk
Axk1
mk max(yk ) xk yk / mk , k 1,2,3,
1 1 1 1
n
n1
n2
1
对应的特征向量为ξn, ξn-1,…, ξ1.
第8章矩阵特征值计算
(2) 如果 A∈Rn×n 有 m 个(m≤n)不同的特征值 λ1 ,λ2 ,…,λm , 则对应的特征向 量 x1 ,x2 ,…xm 线性无关.
5
数值分析
第8章 矩阵特征值计算
定理 7(对称矩阵的正交约化) 设 A∈Rn×n 为对称矩阵,则 (1) A 的特征值均为实数; (2) A 有 n 个线性无关的特征向量; (3) 存在一个正交矩阵 P 使得
定理 8 (Gerschgorin 圆盘定理) (1) 设 A=(aij)n×n ,则的每一个特征值必属于下属某个圆盘之中
n
| aii | ri
| aij |
j 1, j i
或者说, A 的特征值都在复平面上 n 个圆盘的并集中. (2) 如果 A 有 m 个圆盘组成一个连通的并集 S, 且 S 与余下 n-m 个圆盘 是分
uk
vk
k
vk1 Auk
if
vk1 vk
输出vk 1和k
26
数例值分1析:利用幂法求下列矩阵A 的模 第82章 矩1阵特0征值计算
最大的特征值及相应的特征向量. A 1 3 1
(取初始向量为 v0 (1 1 1)T )
0 1 4
解:Step0
0 u0
v1
vv00
1
(1
0
Au0 (3
1
10
数值分析
D2 :
第8章 矩阵特征值计算
n
| | r2 | a2 j | 2 j 1 j2
D3 :
n
| 4 | r3 | a3 j | 2 j 1 j3
由上述定理结论可知A的三个特征值位于 三个圆盘的并集中,
11
数值分析
第8章 矩阵特征值计算
第8章 矩阵特征值计算
第八章 矩阵特征值计算1 特征值性质和估计工程实践中有许多种振动问题,如桥梁或建筑物的振动,机械机件的振动,飞机机翼的颤动等,这些问题的求解常常归纳为求矩阵的特征值问题。
另外,一些稳定分析问题及相关问题也可以转化为求矩阵特征值与特征向量的问题。
1.1 特征值问题及性质设矩阵n n ⨯∈A R (或n n ⨯C ),特征值问题是:求C λ∈和非零向量n R ∈x ,使λ=Ax x (1.1)其中x 是矩阵A 属于特征值λ的特征向量。
A 的全体特征值组成的集合记为sp()A 。
求A 的特征值问题(1.1)等价于求A 的特征方程()det()0p I λλ=-=A (1.2)的根。
因为一般不能通过有限次运算准确求解()0p λ=的根,所以特征值问题的数值方法只能是迭代法。
反之,有时为了求多项式111()n n n n q a a a λλλλ--=++++的零点,可以把()q λ看成矩阵123101010n a a a a ----⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦的特征多项式(除(1)n -因子不计)。
这是一个Hessenberg 矩阵,可用QR 方法求特征值,从而求出代数方程()0q λ=的根。
矩阵特征值和特征向量的计算问题可分为两类:一类是求矩阵A 的全部特征值及其对应的向量;另一类是求部分特征值(一个或几个、按模最大或最小)及其对应的特征向量。
本章介绍部分特征值和特征向量的幂法、内积法;求实对称矩阵全部特征值的雅可比法、Given 方法和Householder 方法;求任意矩阵全部特征值的QR 算法。
在第5章已给出特征值的一些重要性质,下面再补充一些基本性质。
定理1 设n n R ⨯∈A ,则(1) 设λ为A 的特征值,则λμ-为μ-A I 的特征值;(2) 设12,,,n λλλ是A 的特征值,()p x 是一多项式,则矩阵()p A 的特征值是12(),(),,()n p p p λλλ。
计算方法之计算矩阵的特征值和特征量
计算方法之计算矩阵的特征值和特征量计算矩阵的特征值和特征向量是线性代数中的一个重要问题,它在科学研究和工程应用中有着广泛的应用。
本文将介绍计算矩阵特征值和特征向量的方法,包括特征方程法、幂法、反幂法和QR方法。
一、特征值和特征向量的定义给定一个n阶方阵A,如果存在一个非零向量x和一个标量λ,满足以下方程:Ax=λx其中,x被称为A的特征向量,λ被称为A的特征值。
二、特征方程法特征方程法是计算矩阵特征值和特征向量的一种常用方法,其基本思想是通过求解矩阵的特征方程来求得特征值。
对于一个n阶方阵A,其特征方程为:A-λI,=0其中,I是n阶单位矩阵,A-λI,表示A-λI的行列式。
解特征方程可以得到n个特征值λ₁,λ₂,...,λₙ。
然后,将这些特征值带入原方程组(A-λI)x=0,求解线性方程组得到n个特征向量x₁,x₂,...,xₙ。
三、幂法幂法是一种通过迭代来计算矩阵最大特征值和对应的特征向量的方法。
首先,随机选择一个非零向量b₀,并进行归一化,得到单位向量x₀=b₀/,b₀。
然后,通过迭代的方式,计算xₙ₊₁=Axₙ,其中xₙ为第k次迭代得到的向量。
在迭代过程中,向量xₙ的模长会逐渐趋近于最大特征值对应的特征向量。
当迭代收敛后,xₙ就是矩阵A的最大特征值对应的特征向量。
四、反幂法反幂法是一种通过迭代来计算矩阵最小特征值和对应的特征向量的方法。
首先,随机选择一个非零向量b₀,并进行归一化,得到单位向量x₀=b₀/,b₀。
然后,通过迭代的方式,计算xₙ₊₁=(A-σI)⁻¹xₙ,其中σ为待求的特征值。
在迭代过程中,向量xₙ的模长会逐渐趋近于特征值σ对应的特征向量。
当迭代收敛后,xₙ就是矩阵A的特征值为σ的特征向量。
五、QR方法QR方法是一种通过迭代来计算矩阵特征值和特征向量的方法。
首先,将矩阵A进行QR分解,得到矩阵A=QR,其中Q是正交矩阵,R是上三角矩阵。
然后,计算矩阵B=RQ,重复以上步骤,直到矩阵B收敛。
特征值和特征向量
特征值和特征向量首先,我们先来了解一下矩阵。
矩阵是由一个矩形的数组组成的,其中的每个元素都可以是实数或复数。
例如,3x3的矩阵可以写为:A=[abc][def][ghi]Av=λv那么v就是矩阵A的特征向量,λ就是矩阵A的特征值。
换句话说,特征向量在矩阵的变换下只发生拉伸或缩放,而不发生旋转或扭曲。
特征值表示特征向量被拉伸或缩放的比例。
det(A - λI) = 0其中,det表示矩阵的行列式,I是单位矩阵。
通过解特征方程,我们可以求得特征值λ。
然后,我们可以将每个特征值代入原方程Av =λv中,从而求得对应的特征向量v。
1.矩阵的对角化:特征值和特征向量可以帮助我们将一个复杂的矩阵对角化,即将矩阵表示为对角矩阵的形式。
对角化后的矩阵更容易进行计算和分析,也更便于推导矩阵的性质。
2.矩阵的相似性:如果一个方阵A和B有相同的特征值和特征向量,那么A和B是相似的。
相似的矩阵在一些数学和物理问题中具有相同的性质和行为,因此,通过特征值和特征向量可以判断矩阵的相似性。
3.矩阵的主成分分析(PCA):主成分分析是一种常用的数据降维方法,它可以通过计算矩阵的特征值和特征向量,将高维数据降低到低维空间中。
通过PCA,我们可以找到数据中最重要的特征和主要方向,从而减少冗余信息。
4.矩阵的奇异值分解(SVD):奇异值分解是矩阵分解的一种重要方法,它可以将一个任意形状的矩阵表示为三个矩阵的乘积。
在奇异值分解中,矩阵的特征值和特征向量扮演了重要的角色。
5.线性变换和矩阵的谱:特征值和特征向量可以帮助我们理解和描述线性变换和矩阵的谱。
谱是矩阵A的特征值的集合,它可以提供关于矩阵的一些性质信息,比如矩阵的正定性、对称性、收敛性等。
总结起来,特征值和特征向量是矩阵理论中非常重要的概念。
它们可以帮助我们理解和描述矩阵的性质和变换,以及在许多实际问题中的应用。
特征值和特征向量的计算和应用对于数学、物理、工程和计算机科学等领域都有重要意义。
2021考研数学线性代数公式详解-特征值与特征向量
一、矩阵 的特征值和特征向盘1.矩阵的特征值与特征向量的概念对于n阶方阵A,若有数λ和向盘X:;t O,满足Ax =λX, 林λ为A的特征值,称x为A的属于特征值λ的特征向盘.2.矩阵的特征多项式与特征方程的概念行列式/(A)=A -λEl 或/(λ)=|λE-AI称为矩阵A的特征多项式:A -λEl=O或|λE -A l =O称为矩阵A的特征方程.3.矩阵的特征值与特征向量的求法设λ是A的一个特征值,x是A的属于λ的特征向量的充要条件是zλ为特征方程λE-A l=O的根,x是齐改方程组(λE-A)x =O的非零解.具体计算步骤如下z (1)计算机E-A :(2)求|λE-Al=O的全部棍,ll P 为A的全部特征值:(3)对于每一个特征值句,求出(λ。
E-A)x=O的一个基础解系吨,酌,…,飞-,.其中r为矩阵也E-A的秩,则A 的属于λ。
的全部特征向量为k,111+k 2、+…+k n -,11n叶’其中k l 'k 2,…,k n -,是不全为霉的任意常数.4.特征值和特征向盘的性质(I)特征值的性质。
设λ是方阵A的特征值,X是A对应λ的特征向最,则矩阵kA,A m,A-1,A·分别有特征值为z U,.-t "',_!_)剑,贝Ux也是kA.A m.A-1.A•对应特征值以,r ,土,凶”λ’λ””’λ’λ的特征向盘.2 )设λ是方阵A 的一个特征值,x为对应的特征向盘,若伊(A )=a 0E +a 1A+…+a n A n,则ψλ)=a 0 +a 1λ+…+a n A "是ψ(A )的一个特征值,x为对应特征向盘.3)若n阶方阵A=(a ij )的全部特征值为λ,,也,…,.-!"< k 重特征值算作k个特征值)则z①码+A..z+…+礼=a ,,+a 22+…+a nn : 2021考研高等数学必备公式特征值与特征向量②AiA:i ...λ..=IAI.)阳”的秩R(A)=l,则A的n个特征值为Ai=a u +a22 +…+a,,,,• 4)设A=(a11A:i=也=…=礼=0(2)特征向盘的性质1)设码,A:i,...,λm是方阵A的互不相同的特征值,X;是对应于..,1;(i = 1,2,··,m)的特征向量,则向量组鸟,鸟,…,x m线性无关,即对应于互不相同特征值的特征向盘线性无关:但相同特征值对应的特征向量可能线性相关,也可能线性无关.2)设坞,X2为A的属于λ的两个不同的特征向盘,若k1X1+kx2 :#0,贝tlk1x1+k2鸟也2是A的属于λ的特征向盘.3)设X1,X2为A的不同特征值λ1,名对应的特征向盘,则X1+X2不是A的特征向ffl:.4)k重特征值最多对应k个线性无关的特征向盘.二、相似矩阵、矩阵的对角化1. 相似短阵的概念与性质(1)相似矩阵的概念设A,8为两个n阶方阵,如果存在一个可逆矩阵P,使得B=P-1AP成立,则称矩阵A与B相似,记为A~8.(2)相似矩阵的性质如果A~B,则有:1) A r~e r.2) A-I~e-1 <若A,8均可逆〉.3) A+kE~B+kE.的A11.~e.t<k为正整数〉.的|λE-Al=IλE-BI,从而A,8有相同的特征值-S) I A l=I B,从而A,8同时可逆或同时不可逆.7) 4au = 4轧CA、B有相同的迹〉8) R(A)=R(B).2.矩阵可相似对角化(1)相似对角化的概念若n阶矩阵A与对角矩阵A相似,则称A可以相似对角化,记为A~A,并称A是A 的相似标准形.(2) A与对角矩阵相似的充要条件A与对角矩阵相似的充要条件为n阶矩阵A有n个线性无关的特征向盘.1) A与对角矩阵相似的充分条件z若A有n个互不相等的特征值4,也,…,礼,则A必与对角矩阵相似.2) A与对角矩阵相似的充要条件:对A的特征值的重根数等于其对应的线性无关的特征向盘个数,即R (λE-A)=n-k .(4)相似对角化A为对角短阵A的解题步骤。
第八章矩阵特征值
第八章矩阵特征值8.1特征值的定义在线性代数中,一个n阶方阵A的特征值(Eigenvalue)是指一个标量λ,使得下面的等式成立:Ax=λx其中x是一个非零的n维向量,被称为对应于特征值λ的特征向量(Eigenvector)。
特别地,一些情况下,我们有:AX=λX。
这是一个常见的特殊情况,被称为多重特征值(Multiple Eigenvalues)。
8.2特征值与特征向量的求解我们可以通过以下方式求解矩阵的特征值与特征向量。
1.设A是一个n阶方阵,特征值为λ,特征向量为X,我们有AX=λX。
2.将等式重写为AX–λX=0,再移项得到(A–λI)x=0。
3.构造(A–λI)矩阵,其中I是单位矩阵。
4.解方程组(A–λI)X=0,求解零空间的基础解系(基础特征向量)。
5.基础特征向量的线性组合即为所有特征向量。
8.3特征值的性质矩阵的特征值具有一些性质,包括:1.特征值的个数等于矩阵的阶数。
一个n阶矩阵A最多有n个不同的特征值。
2.特征值的乘积等于矩阵的行列式。
即特征值λ1,λ2,…,λn与矩阵A的特征多项式p(λ)=,A-λI,的系数关系为λ^n+a_{n-1}λ^(n-1)+…+a_1λ+a_0。
3.特征值的和等于矩阵的迹。
即矩阵A的特征值λ1,λ2,…,λn 满足λ1+λ2+…+λn=Tr(A),其中Tr(A)为矩阵A的迹(对角线上元素之和)。
4.特征值与行列式的关系。
矩阵A的特征值λ1,λ2,…,λn都满足,A-λI,=0,即他们是矩阵A的特征方程的根。
8.4矩阵的对角化对角化是指将一个矩阵通过相似变换,将其转化为对角矩阵的过程。
对角化的主要目的是将矩阵的运算简化为对角矩阵的运算,从而更易于求解。
一个n阶方阵可以对角化的条件是它有n个线性无关的特征向量,即A的特征向量数量等于A的阶数。
通过对角化,可以将矩阵A表示为:A=P^(-1)DP其中D是对角矩阵,P是可逆矩阵,P的列向量是A的特征向量。
特征值和特征向量的性质与求法
特征值和特征向量的性质与求法方磊(陕理工理工学院(数学系)数学与应用数学专业071班级,陕西汉中723000)”指导老师:周亚兰[摘要] :本文主要给出了矩阵特征值与特征向量的几个性质及特征值、特征向量的几种简单求法。
[关键词]:矩阵线性变换特征值特征向量1 特征值与特征向量的定义及性质定义1:(ⅰ)设A 是数域p 上的n 阶矩阵,则多项式|λE -A|称A 的特征多项式,则它在 c 上的根称为A 的特征值。
(ⅱ)若λ是A 的特征值,则齐次线性方程组(λE-A) X =0的非零解,称为A 的属于特征值λ的特征向量。
定义2:设α是数域P 上线性空间v 的一个线性变换,如果对于数域P 中的一数0λ存在一个非零向量ξ,使得a ξ=0λξ,那么0λ 成为α的一个特征值而ξ称为α的属于特征值0λ的一个特征向量。
性质1: 若λ为A 的特征值,且A 可逆,则0≠λ、则1-λ 为1-A 的特征知值。
证明: 设n λλλ 21为A 的特征值,则A =n λλλ 21ο≠ ∴λi≠0(i=1、2…n)设A 的属于λ的特征向量为ξ 则ξλξi =⋅A 则λ1-A ξ=ξ即有 1-A ξ=1-λξ∴1-λ为1-A的特征值,由于A 最多只有n 个特征值 ∴1-λ为1-Aξ的特征值性质2:若λ为A 的特征值,则()f λ为()f A 的特征值 ()χf =nn a χ+101111x a x a xa n n +++--证明:设ξ为A 的属于λ的特征向量,则A ξ=λξ ∴ ()A f ξ=(nn A a +E a A a Aa n n 0111+++-- )ξ= n n A a ξ+ 11--n n A a ξ+… +E a 0 ξ=nn a λξ+11--n n a λ+…+E 0a ξ=()λf ξ 又ξ≠0∴ ()λf 是()A f 的特征值性质3:n 阶矩阵A 的每一行元素之和为a ,则a 一定是A 的特征值证明:设 A= ⎪⎪⎪⎪⎪⎭⎫⎝⎛nn n n n n a a aa a a a a a 212222111211则由题设条件知:⎪⎪⎪⎪⎪⎭⎫⎝⎛nn n n n n a a aa a a a a a 212222111211 ⎪⎪⎪⎪⎪⎭⎫ ⎝⎛111 =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛a a a =a ⎪⎪⎪⎪⎪⎭⎫⎝⎛111∴a 是A 的特征值推论:若λ为A 的特征值,且A 可逆,则λA为*A 的特征值(*A 为A 的伴随矩阵)。
特征值与特征向量的应用PPT
定义 方阵A的主对角线上的元素之和称为方阵A的迹. 记为 tr A aii i . 二、特征值和特征向量的性质 推论1 n阶方阵A可逆A的n个特征值全不为零. 若数λ为可逆阵的A的特征值, 则 1 为 A1 的特征值. 推论2 推论3 则 k 为 kA 的特征值. 1 推论4 则 A 为 A 的特征值.
注:内积是向量的一种运算,用矩阵形式表示,有 b1 b 2 T . , a1 a2 an bn
施密特(Schmidt)正交化法 设 1 , 2 ,, r 是向量空间V的一个基,要求向量空 间V的一个标准正交基,就是要找到一组两两正交的单 位向量 1 , 2 ,, r ,使 1 , 2 ,, r 与 1 , 2 ,, r 等价, 此问题称为把 1 , 2 ,, r 这组基标准正交化. 1)正交化 令 1 1
则 1 , 2 ,, r 两两正交,且与 1 , 2 ,, r 等价. 2)标准化 令 1
1
1
1 , 2
1
2
2 , , r
1
r
r ,
就得到V的一个标准正交向量组. 如果 1 , 2 ,, r 是V的一组基,则 1 , 2 ,, r 就是
1 2 P, ( p1 , p2 , , pn ) n 所以 P 1 AP , 即A与对角矩阵Λ相似.
定理 n阶矩阵A能与对角矩阵Λ相似 A有n阶线性无关的特征向量. 推论 如果n阶矩阵A有n个不同的特征值,则矩阵A 可相似对角化.
1 , 2 2 2 1 1 , 1 1 , r 2 , r r 1 , r r r 1 2 r 1 1 , 1 2 , 2 r 1 , r 1
特征值与特征向量及其应用
特征值与特征向量及其应⽤⼤学学习线性代数的时候,特征值(eigenvalue)和特征向量(eigenvector)⼀直不甚理解,尽管课本上说特征值和特征向量在⼯程技术领域有着⼴泛的应⽤,但是除了知道怎么求解特征值和特征向量之外,对其包含的现实意义知之甚少。
研究⽣之后学习统计学,在进⾏主成分分析过程中,需要求解变量的协⽅差矩阵的特征值和特征向量,并根据特征值的⼤⼩确定主成分,似乎知道了特征值和特征向量的⼀点点现实意义,但是本着考试为主的态度,没有深⼊进去理解特征值和特征向量。
最近看机器学习的⼀些⽅法,如特征降维⽅法如SVD和PCA,线性判别法(Linear Discriminant Analysis,LDA)等⽅法的时候都涉及到特征值和特征向量,发现如果不深⼊理解特征值和特征向量,对这些⽅法的学习只能浮于表⾯,难以透彻理解。
痛定思痛,决定由表及⾥好好的学习⼀下特征值和特征向量,本⽂的关于特征值和特征向量的理解和表述⼤量参考了⽹上的资料,仅作为本⼈学习笔记,谢绝转载。
⼀、特征值和特征向量的概念和计算先看⼀下教科书上的定义:设A是n阶⽅阵,如果存在常数及⾮零n向量x,使得,则称是矩阵A的特征值,x是A属于特征值的特征向量。
给定n阶矩阵A,⾏列式的结果是关于的⼀个多项式,成为矩阵A的特征多项式,该特征多项式构成的⽅程称为矩阵A的特征⽅程。
定理:n阶矩阵A的n个特征值就是其特征⽅程的n个跟;⽽A的属于特征值的特征向量就是其次线性⽅程的⾮零解。
例:求的特征根和特征向量 解:,解⼀元⼆次⽅程可得,; 对应的特征向量为x满⾜,求得 对应的特征向量为x满⾜,求得⼆、特征值和特征向量的⼏何意义1、矩阵、向量、向量的矩阵变换 在进⾏特征和特征向量的⼏何意义解释之前,我们先回顾⼀下向量、矩阵、向量矩阵变换的等相关知识。
向量有⾏向量和列向量,向量在⼏何上被解释成⼀系列与轴平⾏的位移,⼀般说来,任意向量v都能写成"扩展"形式: 以3维向量为例,定义p、q、r为指向+x,+y和+z⽅向的单位向量,则有v=xp+yq+zr。
特征值与特征向量
则 Ax1 p1 x2 p2 xm pm 0, 即
1 x1 p1 2 x2 p2 m xm pm 0,
类推之,有
k x p 1 11
k x p 222
k x m
m
pm
0.
k 1,2,,m 1
把上列各式合写成矩阵形式,得
1 AE 0
1 3
1 1
0
~
0
0 1
1 0 ,
4 1 4
0 0
0
得基础解系
1 p1 0, 1
故对应于1 1的全体特征向量为
k p1
(k 0).
当2 3 2时,解方程A 2E x 0.由
4 A 2E 0
1 0
1 0
~
4 0
1 0
1 0,
4 1 1 0 0 0
所以向量组 p , p ,, p 线性无关.
注意
1. 属于不同特征值的特征向量是线性无关 的.
2. 属于同一特征值的特征向量的非零线性 组合仍是属于这个特征值的特征向量.
3. 矩阵的特征向量总是相对于矩阵的特征 值而言的,一个特征值具有的特征向量不唯一; 一个特征向量不能属于不同的特征值.
因为, 如果设x同时是A的属于特征值1 ,2
0的都是矩阵A的特征值.
3. A E 0
a11
a12
a21
a22
a1n
a2n
0
an1
an2 ann
称以为未知数的一元 n次方程 A E 0
为A的特征方程.
记 f A E ,它是的n次多项式, 称
为方阵A的 特征多项式 其
特征值与特征向量
2 ( 4)( 2)2 0 ,
故 A 的全部特征值为 1 4 , 2 2 (二重).
1.1 特征值与特征向量的概念
当 1 4 时,解齐次线性方程组 (4E A)x 0 :
7 2 1 1 0 1/3
1
由
4E
A
2
2
2
0
1
2/3
得基础解系
p1
2
,故对应于
1
4
的全部特征向量为:
1.2 特征值与特征向量的性质
性质 3 设 是方阵 A 的特征值,则 (1) c 是 cA 的特征值 (c R) ; (2) 2 是 A2 的特征值,进一步推出 k 是 Ak 的特征值; (3)() 是 (A) 的特征值,其中(A) a0 E a1A an1An1 an An 是矩阵 A 的多项式; (4)当 A 可逆时, 1 和 A 分别是 A1 和 A* 的特征值.
5
0
1
0
得
基
础解
系
是
1 1
,
故
k1
1 1
(k1
0)
是矩阵
A
对应于
1
4 的全部特征向量.
当
2
2
时,解齐次线性方程组
(2E
A) x
0
,由
2E
A
5
5
1 5
1
0
1 0
得基
础解系是ຫໍສະໝຸດ 1 5 ,故
k2
1
5
(k2
0)
是矩阵
A
对应于 2
2
的全部特征向量.
1.1 特征值与特征向量的概念
3 2 1
1.2 特征值与特征向量的性质
矩阵论—特征值和特征向量
矩阵论—特征值和特征向量特征值和特征向量是矩阵论中的重要概念。
在线性代数中,矩阵可以视为线性变换的一种表示,而特征值和特征向量则是描述这种线性变换的特性的数学工具。
首先,我们来定义特征值和特征向量。
设A是一个n×n矩阵,如果存在一个非零向量x,使得Ax=λx,其中λ是一个标量,那么称λ为矩阵A的特征值,x称为矩阵A对应于特征值λ的特征向量。
特征值和特征向量的求解可以通过求解特征方程来实现。
特征方程是指矩阵A减去λI后的行列式等于零,其中I是单位矩阵。
即,det(A-λI)=0。
求解特征方程可以得到矩阵A的所有特征值λ。
而对于每个特征值λ,通过求解(A-λI)x=0,可以得到对应的特征向量x。
特征值和特征向量的应用非常广泛。
一方面,它们可以用来判断一个矩阵的性质。
例如,对于对称矩阵,它的特征值都是实数;对于正定矩阵,所有特征值都是正数。
另一方面,特征向量可以用来描述矩阵的变换效果。
当一个向量x是矩阵A的特征向量时,它进行矩阵A的线性变换后,只发生了伸缩而没有发生旋转。
特征向量的长度(模)因子为特征值的绝对值。
特征值和特征向量还与矩阵的对角化有关。
如果一个n×n矩阵A有n个线性无关的特征向量,那么A可以被相似对角化,即存在一个可逆矩阵P和对角矩阵D,使得A=PDP^(-1),其中D的对角线上的元素就是矩阵A的特征值。
对角化简化了矩阵的计算,并且提供了矩阵变换的直观理解。
特征值和特征向量还可以应用于解决线性方程组和矩阵的幂运算问题。
对于一个方阵A,求解Ax=b的解可以通过特征值和特征向量来实现。
当一个矩阵A对角化后,方程Ax=b可以转化为Dy=P^(-1)b,其中y是一个新的未知向量。
然后再求解Dy=P^(-1)b,最后通过y=P^(-1)b求得原方程的解x。
此外,矩阵的幂运算A^k可以通过特征值和特征向量来简化。
由于A=PDP^(-1),所以A^k=(PDP^(-1))^k=PD^kP^(-1),其中D^k是D中的每个元素都进行幂运算后的对角矩阵。
特征值与特征向量
思考题 :1 .
是否任一数 0 都是某个矩阵 A 的 特征值 ?
是 . 比如 , 0 A 0 . 0
当2 3 2时, 解方程组(A 2 I ) x 0 得基础解系 p2 (1, 4, 0) ,p3 (1, 0, 4)
T T
所以k2 p2 k3 p3 (k2 , k3不全为零)是对应于
2 3 2的全部特征向量.
定理
设n阶方阵A (aij )nn的n个特征值为1 , 2 ,, n (重特征值按重数算), 则有 (1) 12 n A (2) 1 2 n a11 a22 ann trA, (注 : trA称为矩阵A的迹)
特征值与特征向量
定义 设A为n阶方阵,若存在数λ和非零的 n维列向量x, 使得 Ax=λx (1)
则称数λ为矩阵 A的特征值,称 x为矩阵A对应于特征 值λ的特征向量. 设x是对应于特征值λ的特征向量,由于 A(kx)=k(Ax)=k(λx)= λ(kx) k≠0 ,
所以, kx也是A的对应于特征值λ的特征向量.这说明特 征向量不是被特征值唯一决定的.但是,特征值是被特征 向量唯一决定的.因此一个特征向量只属于一个特征值.
1 , 2 , , t
则对于不全为零的任意常数k1 , k2 , , kt , x k11 k2 2 ktt 为A的对应于特征值0的全部特征向量.
例1
当1 1时, 解方程组(A I ) x 0 得基础解系 p1 (1, 0,1)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第8章特征值和特征向量M A T L A B中的命令计算特征值和特征向量很方便,可以得到不同的子结果和分解,这在线性代数教学时很有用。
注意,本章中的命令只能对二维矩阵操作。
8.1 特征值和特征向量的计算假设A是一个m×n的矩阵,A的特征值问题就是找到方程组的解:其中λ是一个标量,x是一个长度为n的列向量。
标量λ是A的特征值,x是相对应的特征向量。
对于实数矩阵A来说,特征值和特征向量可能是复数。
一个n×n的矩阵有n个特征值,表,λ2,. ..,λn。
示为λ1M A T L A B中用命令e i g来确定矩阵A的特征值和特征向量。
特征向量的规格化,就是每个特征向量的欧几里得范数为1;参见7 .6节。
命令e i g自动完成对矩阵A的平衡化。
这就要求M A T L A B找出一个相似变换矩阵Q,满足条件。
求的特征值比求A的特征值条件更好些。
万一A有一个和机器错误大小一样的元素,平衡化对于计算过程是没有好处的。
带有参数n o b a l a n c e的命令e i g可用来计算没有这个变换矩阵的特征值和特征向量。
命令集7 9特征值和特征向量e i g(A)求包含矩阵A的特征值的向量。
[ X,D]=e i g(A)产生一个矩阵A的特征值在对角线上的对角矩阵D和矩阵X,它们的列是相应的特征向量,满足A X=X D。
为了得到有更好条件特征值的矩阵要进行相似变换。
[ X,D]=不经过平衡处理求得矩阵A的特征值和特征向量,也就是e i g(A,’n o b a l a n c e’)不进行平衡相似变换。
b a l a nc e(A)求平衡矩阵。
[ T,B]=b a l a n c e(A)找到一个相似变换矩阵T和矩阵B,使得它们满足B=T-1AT。
B是用命令b a l a n c e求得的平衡矩阵。
e i g s(A)返回一个由矩阵A的部分特征值组成的向量,和命令e i g一样,但是不返回全部的特征值。
如果不带有参量,则计算出最大的特征值。
当计算所有特征值时,如果矩阵A的秩不小于6,则计算出6个特征值来。
e i g s(f,n)求出矩阵A的部分特征值。
在使用一个矩阵列的线性运算符时,字符串f中包含的是M文件的文件名,n指定问题的阶次。
用这种方法来求特征值比开始就用运算符来求要快。
e i g s (A ,B ,k ,s i g m a )求矩阵A 的部分特征值,矩阵B 的大小和A 相同;如果没有给出B = e y e (s i z e (A )),那么k 就是要计算的特征值的个数;如果k 没有给出,就用小于6的数或者A 的秩;变量s i g m a 是一个实数或者复数的移位参数,或者下列文本字符串中的一个,文本字符串指明需要的是哪种特征值:‘l m ’最大的特征值(缺省)‘s m ’最小的特征值‘l r ’最大的实数部分‘s r ’最小的实数部分‘b e ’同时求得最大和最小的实数部分c o nde i g (A )返回一个由矩阵A 的特征值条件数组成的向量。
[ V ,D ,s ]=c o n d e i g (A )返回[ V ,D ]=e i g (A )和s =c o n d e i g (A )。
如果A 是实数矩阵,M A T L A B 在计算中用Q R 因式分解;否则用Q Z 因式分解。
左特征向量是满足下面条件的非零行向量y :y A =λy如果用命令e ig 对A ′作用,也可以计算出左特征向量,因为:这里的撇号'代表矩阵的转置和共轭复数(见3 .4节),上的短杠表示共轭复数。
矩阵特征值的集合称为矩阵的谱,谱半径( A )定义为m a x (a b s (e i g (A )))。
矩阵A 的特征值的乘积等于d e t (A ),和等于t r a c e (A ),这是矩阵A 主对角线上元素的和。
如果X 一个列向量为A 的特征向量的矩阵,并且它的秩为n ,那么特征向量线性无关。
如果不是这样,则称矩阵为缺陷阵。
如果X 'X =I ,则特征向量正交,这对于对称矩阵是成立的。
■例8 .1矩阵A 定义为:(a) 运行命令[ E v e c t ,E v a l u e ]=e i g (A ),得到结果为:可知特征值都是非零数,矩阵是满秩的,可以用t h e r a n k =r a n k (E v e c t )来确认:t h e r a n k =3令M =E vec t'* E vec t 得:可知特征向量没有相互正交。
给出结果为:可知行列式等于特征值的积。
结果为:可知矩阵的迹等于特征值的和。
如果矩阵A 是实数矩阵,但是有复数特征值,那么这些特征值是以共轭复数的形式出现的。
如果[ X ,D ]=e i g (A ),可以用命令c d f 2r d f 将矩阵D 转换为一个实数块对角矩阵。
在对角线上用一个2×2实数块代替共轭复数对。
命令集8 0复对角矩阵变成实对角矩阵[ Y ,E ]=c d f 2r d f (X ,D )将复对角矩阵D 变成实对角矩阵E ,Y 的列不是A 的特征向量。
■例8 .2假设矩阵A 为:则运行[ X ,D ]=e i g (A )可得:■X和D 都是复数矩阵,运行命令:[ Y ,E ]=c d f 2r d f (X ,D ),结果为:所得的矩阵E 正好是A 矩阵。
注意特征向量是特征多项式d e t (λI -A ) =0的根,其中I 是单位矩阵。
用命令p o l y 来求特征多项式,参见11 .1节。
命令r o o t s 也可求得特征值,但是用命令e i g 求得的特征值更准确,精度更高。
广义特征值问题就是找到方程组A x =λB x 的重要解,其中B 也是一个n ×n 的矩阵。
λ值和向量x 分别称为广义特征值和广义特征向量。
如果B 是一个奇异矩阵,则用Q Z 算法来求解。
标准和广义特征值问题都属于矩阵多项式特征问题,都可以用命令p o l y e i g 来求它们的解。
命令集8 1广义特征值和广义特征向量e i g (A ,B )返回一个含有广义特征值的向量,A 和B 都是方阵。
[ X ,D ]=e i g (A ,B )返回一个对角线上为广义特征值的对角矩阵D 和矩阵X ,X 的列是相对应的特征向量,因此有A X =B X D 。
[ X ,v ]=给出度为k 的特征问题(A 0+λA 1+λA 2+ ...+λk A k )x =0的特征值和p o l y e i g (A 0,A 1,...,特征向量。
向量v 的长度为n k ,包含有特征值;n ×n k 的矩阵A K )X 的列是特征向量。
如果有A 0=A 和A 1=-I ,那么这就是标准特征值问题。
为了检查特征值的条件或者它的敏感性,可以计算出条件数 c o n d (X ) =||X || ||X -1| |,矩阵X 的列是A 的特征向量。
条件数大表示坏条件,也就是对扰动很敏感。
为了检查特征向量的条件或者它的敏感性可以查看特征值,多个重复的特征值或者特征值彼此相差很小就表示是坏条件问题。
■例8 .3假设:运行命令[XX, DD]=eig(A),结果为:■显然两个特征向量,列2和列3是复数。
从上可以看出特征值为2,2 .01,3,3和4,可以知道这个特征值问题是一个坏条件问题。
输入b a d M a t r i x =c o n d (X X )可求得条件数:将这个数和例8 .2中矩阵的特征值条件数n i c e M a t r i x =c o n d (X )比较:它们是不同的。
8.2 上海森伯形式、Q R 和Q Z 因式分解如果只求特征值和特征向量,推荐用上一节中提到的方法。
然而,有时要求更详细了解计算过程,可用在这一节和下一节中定义的命令来满足这样的要求。
如果矩阵H 的第一子对角线下元素都是零,则它是一个上海森伯(H e s s e n b e r g )矩阵。
如果矩阵是对称矩阵,则它的海森伯形式是对角三角阵。
M AT L AB 可以通过相似变换将矩阵变换成这种形式。
命令集8 2上海森伯形式h e s s (A )返回矩阵A 的上海森伯形式。
[ P ,H ]=h e s s (A )返回一个酉矩阵P 和上海森伯矩阵H ,使A =P H P ´和P P ´ =I 。
在M A T L A B 中,Q R 算法是计算矩阵所有特征值的一种有效的数学方法,也可以用命令e i g 来求。
在用这种方法时,建议将矩阵转换成相似的上海森伯形式,参见例8 .4。
Q R 算法是基于Q R 因式分解的一种算法,每个m ×n 的矩阵A 可以表示成:A =Q R其中Q 是一个m ×m 的酉矩阵,R 是一个m ×n 的上三角矩阵。
如果A 是一个方阵,R 也还是这样的一个矩阵。
当用命令q r 时,会返回矩阵Q 和R ,也可参见例7 .7。
命令集8 3Q R 因式分解[ Q ,R ]=q r (A )产生一个m ×m 的酉矩阵Q 和一个m ×n 的上三角矩阵■R ,使得A =Q R 。
[ Q ,R ,P ]=q r (A )产生一个大小为m ×m 、列正交的酉矩阵Q ,一个对角线元素递减的m ×n 的上三角矩阵R 和一个置换矩阵P ,使得A P =Q R 。
[ Q ,R ]=q r i n s e r t由于在矩阵A 的j 列后插入一个额外的列b 而得到新的( Q ,R ,j ,b )Q R 因式分解,Q 和R 是对矩阵A 进行Q R 因式分解得到的矩阵。
如果j =n + 1,那么b 就插入在矩阵A 的最后一列。
[ Q ,R ]=由于去掉矩阵A 的第j 列而得到新的Q R 分解,Q 和R 是q r d e l e t e (Q ,R ,j )对矩阵A 进行Q R 分解得到的矩阵。
[ Q 1,R 1]=给出A +x y ´的Q R 分解,也就是用秩为1的矩阵改变A 的q r u p d a t e (Q ,R ,x ,y )Q R 分解。
如果A 是上海森伯矩阵,则Q 也是一样。
对于Q R 算法,下面给出一些简短的描述:Q R 算法:1) 令A 0=A ,k = 0;2) 找到A k 的分解:A k =Q k R k ;3) 迭代计算下一个矩阵:A k +1=Q k R k ,令k =k + 1;4) 返回到2。
这种方法也称为不移位的Q R 方法,就是在某种约定下逼近于上三角矩阵。
因为所有的矩阵A k 和A 0=A 相似,所以有和原始矩阵相同的特征值,即最后的上三角矩阵的对角线元素就是A 的特征值。
如果矩阵一开始就转换成有接近一半元素是零的上海森伯形式,就可以减少可观的计算步骤。