应用多元分析课件 (6)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
矩阵代数
§1.1 v §1.2 v §1.3 v §1.4 v §1.5 v §1.6 v §1.7 v §1.8
v
定义 矩阵的运算 行列式 矩阵的逆 矩阵的秩 特征值、特征向量和矩阵的迹 正定矩阵和非负定矩阵 特征值的极值问题
§1.1 定义
p×q矩阵:
a11 a12 a1 q a a a 21 22 2q A a a a p2 pq p1
故有
1, 若i j aia j 0, 若1 i j p 即a1,a2,⋯ ,ap为一组正交单位向量。同理,由AA′=I 可证a(1),a(2),⋯ ,a(p)也是一组正交单位向量。
§1.3 行列式
v
p阶方阵A=(aij)的行列式定义为
A
j1 j2 j p
1
由A′A=I,得
于是
a1 a1 a2 a1 a p 1 0 a1 a a a a a a 1 2 1 2 p 2 1 a a a a a a 1 p 1 p p 0 p 1
a1 a 2 q维行向量: a′=(a1,a2,⋯ ,aq) p维列向量: a ap 2 2 2 向量a的长度:a aa a1 a2 a p 单位向量: a 1
若A的所有元素全为零,则称A为零矩阵,记作 A=0pq或A=0。 v 若p=q,则称A为p阶方阵,a11,a22,⋯ ,app称为它的对 角线元素,其他元素aij(i≠j)称为非对角线元素。 v 若方阵A的对角线下方的元素全为零,则称A为上三 角矩阵。显然,aij=0,i>j。 v 若方阵A的对角线上方的元素全为零,则称A为下三 角矩阵。显然,aij=0,i<j。 v 若方阵A的所有非对角线元素均为零,则称A为对角 矩阵,简记为A=diag(a11,a22,⋯ ,app)。 v 若p阶对角矩阵A的所有p个对角线元素均为1,则称 A为p阶单位矩阵,记作A=Ip或A=I。
若A=(aij):p×q,B=(bij):p×q,则A与B的和定义为 A+B=(aij+bij):p×q v 若c为一常数,则它与A的积定义为 cA=(caij):p×q v 若A=(aij):p×q,B=(bij):q×r,则A与B的积定义为
v
q AB aik bkj :p r k 1
j1 j2 j p
a1j1 a2j2 a pj p
这里
是排列j1,j2,⋯ ,jp中逆序的总数,称它为这个排列的 逆序数,一个逆序是指在一个排列中一对数的前后 位置与大小顺序相反,即前面的数大于后面的数。 例如,τ(3142)=1+τ(1342)=3+τ(1234)=3。
j1 j2 j p
a
j 1
p
kj
Aij 0 k i , aik Aij 0 k j
i 1
p
§1.4 矩阵的逆
若方阵A满足|A|≠0,则称A为非退化方阵;若 |A|=0 ,则称A为退化方阵。 v 设A=(aij)是一非退化方阵,若方阵C满足AC=I,则 称C为A的逆矩阵,记为C=A−1,A−1必是一个非退化 矩阵。令 B′=(Aij)/|A| 其中Aij是aij的代数余子式,则容易验证AB=BA=I。 由于C=BAC=B,因此A−1是惟一的,且(A−1)−1=A。i 1p源自vv代数余子式
v
设A为p阶方阵,将其元素aij所在的第i行与第j列划 去之后所得(p−1)阶矩阵的行列式,称为元素aij的余 子式,记为Mij。Aij=(−1)i+jMij称为元素aij的代数余子 式。有以下公式成立
A aij Aij aij Aij
j 1 i 1 p p
矩阵的分块
v
其中A11:k×l,A12:k×(q−l),A21:(p−k)×l, A22:(p−k)×(q−l)。 v 若A和B有相同的分块,则 A11 B11 A12 B12 A B A B A B 21 22 22 21
设A=(aij):p×q,将它分成四块,表示成 A11 A12 A A A 22 21
p
(j≠k),即A的p个列向量也是一组正交单位向量。
v v
若方阵A满足A2=A,则称A为幂等矩阵。 对称的幂等矩阵称为投影矩阵。
正交矩阵A的几何意义
v
Ø
v
将p维向量x看作是在Rp中的一个点,则x的各分量是该点在 相应各坐标轴上的坐标。正交阵A的行列式非1即−1。若 |A|=1,则正交变换y=Ax意味着对原p维坐标系作一刚性旋转( 或称正交旋转),y的各分量正是该点在新坐标系下的坐标; 若|A|=−1,则包含了一个反射的坐标轴。 当p=2时,按逆时针方向将直角坐标系x1Ox2旋转一个角度θ ,所得新坐标系y1Oy2与原坐标系之间的变换为 y1 cos sin x1 y Ax y2 sin cos x2 当p=3时同样有着直观的几何展示。 由于 y′y=(Ax)′(Ax)=x′A′Ax=x′x 故在新、旧坐标系下,该点到原点的距离保持不变。
2 a 若方阵A满足AA′=I,则称A为正交矩阵。显然, ij 1, p j 1
v
aij akj 0, i k , i=1,2,⋯ ,p,即A的p个行向量为单位向量;
2 a 即A的p个行向量相互正交。又从A′A=I得: ij 1, aij akj 0 i 1 i 1 j 1 p p
v Ø
例1.2.2 用矩阵分块方法证明正交矩阵A:p×p的p 个列向量和p个行向量都是一组正交单位向量。 证明 将矩阵A分别按列向量和行向量分块,并记
a1 a2 A a1 , a 2 , , a p a p a1 a 2 a , a ,, a I p 1 2 ap
v
矩阵秩的基本性质
v v
v v v v
v v
(1)rank(A)=0,当且仅当A=0。 (2)若A为p×q矩阵, 且A≠0,则1≤rank(A)≤min{p,q}(若rank(A) =p,则称A为行满秩的;若rank(A)=q,则称A为列满秩的)。 (3)rank(A)=rank(A′)。 A 0 0 A (4) rank 0 B rank B 0 =rank A rank B 。 (5)rank(AB)≤min{rank(A),rank(B)}。 (6)若A和C为非退化方阵,则 rank(ABC)=rank(B) (7)p阶方阵A是非退化的,当且仅当rank(A)=p(称作A满秩)。 (8)rank(AA′)=rank(A′A)=rank(A)。
表示对1,2,⋯ ,p的所有排列求和,τ(j1j2⋯ jp)
行列式的一些基本性质
v v v v v v v v
(1)若A的某行(或列)为零,则|A|=0。 (2)|A′|=|A|。 (3)若将A的某一行(或列)乘以常数c,则所得矩阵的行列式为 c|A|。 (4)若A是一个p阶方阵,c为一常数,则|cA|=cp|A|。 (5)若互换A的任意两行(或列),则行列式符号改变。 (6)若A的某两行(或列)相同,则行列式为零。 (7)若将A的某一行(或列)的倍数加到另一行(或列),则所得行 列式不变。 (8)若A的某一行(或列)是其他一些行(或列)的线性组合,则行 列式为零。
v v v v
(9)若A为上三角矩阵或下三角矩阵或对角矩阵,则 A aii (10)若A和B均为p阶方阵,则|AB|=|A||B|。 (11)|AA′|≥0。 (12)若A与B都是方阵,则 A C A 0 A B 0 B C B (13)若A:p×q,B:q×p,则 |Ip+AB|=|Iq+BA| 例1.3.3 设x,y为两个p维向量,则 |Ip+xy′|=1+y′x
v
逆矩阵的基本性质
v v v
v v v
(1)AA−1=A−1A=I。 (2)(A′)−1=(A−1)′。 (3)若A和C均为p阶非退化方阵,则 (AC)−1=C−1A−1 (4)|A−1|=|A|−1。 (5)若A是正交矩阵,则A−1=A′。 (6)若A=diag(a11,a22,⋯ ,app)非退化(即aii≠0,i=1,2,⋯ ,p),则
v
v
若将矩阵A的行与列互换,则得到的矩阵称为A的转 置,记作A′,即
a11 a 12 A a1q a21 a p1 a22 a p2 a2q a pq
v
若方阵A满足A′=A,则称A为对称矩阵。显然, aij=aji。
§1.2 矩阵的运算
§1.6 特征值、特征向量和矩阵的迹
一、特征值和特征向量 v 二、矩阵的迹
v
一、特征值和特征向量
v
v
v
设A是p阶方阵,若对于一个数λ,存在一个p维非零向量x, 使得Ax=λx,则称λ为A的一个特征值或特征根,而称x为A的 属于特征值λ的一个特征向量。 依该定义有,(A−λI)x=0,而x≠0,故必有 |A−λI|=0 |A−λI|是λ的p次多项式,称为特征多项式。上式有p个根 (可能有重根),记作λ1,λ2,⋯ ,λp,它们可能为实数,也可能为 复数(虽然A是实数矩阵)。反过来,若λi是上式的一个根,则 A−λiI为退化矩阵,故存在一个p维非零向量xi,使得 (A−λiI)xi=0 即λi是A的一个特征值,而xi是相应的特征向量。 今后,一般取xi为单位向量,即满足xi′xi=1。
特征值和特征向量的基本性质
v v v
v
(1)A和A′有相同的特征值。 (2)若A和B分别是p×q和q×p矩阵,则AB和BA有相同的非零 特征值。 (3)若A为实对称矩阵,则A的特征值全为实数,p个特征值按 大小依次表示为λ1≥λ2≥⋯ ≥λp。若λi≠λj,则相应的特征向量xi 和xj必正交,即xi′xj=0。 (4)若A=diag(a11,a22,⋯ ,app),则a11,a22,⋯ ,app为A的p个特征值 ,相应的特征向量分别为e1=(1,0,⋯ ,0)′,e2=(0,1,0,⋯ ,0)′,⋯ ,ep=(0,⋯ ,0,1)′。 (5) A i ,即A的行列式等于其特征值的乘积。可见,A 为非退化矩阵,当且仅当A的特征值均不为零;A为退化矩 阵,当且仅当A至少有一个特征值为零。
v
若C为q×r矩阵,分成 C11 C12 C C C 22 21 其中C11:l×m,C12:l×(r−m),C21:(q−l)×m, C22:(q−l)×(r−m),则有
A11 A12 C11 C12 AC C A A C 22 21 22 21 A11C11 A12C 21 A11C12 A12C 22 A21C11 A22C 21 A21C12 A22C 22
1 1 1 A1 diag a11 , a22 , , a pp (7)若A和B为非退化方阵,则 1 A 0 A 1 0 0 B 1 0 B
v
§1.5 矩阵的秩
一组同维向量a1,a2,⋯ ,an,若存在不全为零的常数 c1,c2,⋯ ,cn,使得 c1a1+c2a2+⋯ +cnan=0 则称该组向量线性相关。若向量a1,a2,⋯ ,an不线性相 关,就称为线性无关。 v 矩阵A的线性无关行向量的最大数目称为行秩,其 线性无关列向量的最大数目称为列秩。矩阵的行秩 和列秩必相等,故统一将其称为A的秩,记作 rank(A)。
运算规律
(1)(A+B)′=A′+B′。 v (2)(AB)′=B′A′。 v (3)A(B1+B2)=AB1+AB2。
v
k k v (4) A Bi ABi 。 i 1 i 1 v (5)c(A+B)=cA+cB。
v
若两个p维向量a和b满足 a′b=a1b1+a2b2+⋯ +apbp=0 则称a和b正交。几何上,正交向量之间相互垂直。
§1.1 v §1.2 v §1.3 v §1.4 v §1.5 v §1.6 v §1.7 v §1.8
v
定义 矩阵的运算 行列式 矩阵的逆 矩阵的秩 特征值、特征向量和矩阵的迹 正定矩阵和非负定矩阵 特征值的极值问题
§1.1 定义
p×q矩阵:
a11 a12 a1 q a a a 21 22 2q A a a a p2 pq p1
故有
1, 若i j aia j 0, 若1 i j p 即a1,a2,⋯ ,ap为一组正交单位向量。同理,由AA′=I 可证a(1),a(2),⋯ ,a(p)也是一组正交单位向量。
§1.3 行列式
v
p阶方阵A=(aij)的行列式定义为
A
j1 j2 j p
1
由A′A=I,得
于是
a1 a1 a2 a1 a p 1 0 a1 a a a a a a 1 2 1 2 p 2 1 a a a a a a 1 p 1 p p 0 p 1
a1 a 2 q维行向量: a′=(a1,a2,⋯ ,aq) p维列向量: a ap 2 2 2 向量a的长度:a aa a1 a2 a p 单位向量: a 1
若A的所有元素全为零,则称A为零矩阵,记作 A=0pq或A=0。 v 若p=q,则称A为p阶方阵,a11,a22,⋯ ,app称为它的对 角线元素,其他元素aij(i≠j)称为非对角线元素。 v 若方阵A的对角线下方的元素全为零,则称A为上三 角矩阵。显然,aij=0,i>j。 v 若方阵A的对角线上方的元素全为零,则称A为下三 角矩阵。显然,aij=0,i<j。 v 若方阵A的所有非对角线元素均为零,则称A为对角 矩阵,简记为A=diag(a11,a22,⋯ ,app)。 v 若p阶对角矩阵A的所有p个对角线元素均为1,则称 A为p阶单位矩阵,记作A=Ip或A=I。
若A=(aij):p×q,B=(bij):p×q,则A与B的和定义为 A+B=(aij+bij):p×q v 若c为一常数,则它与A的积定义为 cA=(caij):p×q v 若A=(aij):p×q,B=(bij):q×r,则A与B的积定义为
v
q AB aik bkj :p r k 1
j1 j2 j p
a1j1 a2j2 a pj p
这里
是排列j1,j2,⋯ ,jp中逆序的总数,称它为这个排列的 逆序数,一个逆序是指在一个排列中一对数的前后 位置与大小顺序相反,即前面的数大于后面的数。 例如,τ(3142)=1+τ(1342)=3+τ(1234)=3。
j1 j2 j p
a
j 1
p
kj
Aij 0 k i , aik Aij 0 k j
i 1
p
§1.4 矩阵的逆
若方阵A满足|A|≠0,则称A为非退化方阵;若 |A|=0 ,则称A为退化方阵。 v 设A=(aij)是一非退化方阵,若方阵C满足AC=I,则 称C为A的逆矩阵,记为C=A−1,A−1必是一个非退化 矩阵。令 B′=(Aij)/|A| 其中Aij是aij的代数余子式,则容易验证AB=BA=I。 由于C=BAC=B,因此A−1是惟一的,且(A−1)−1=A。i 1p源自vv代数余子式
v
设A为p阶方阵,将其元素aij所在的第i行与第j列划 去之后所得(p−1)阶矩阵的行列式,称为元素aij的余 子式,记为Mij。Aij=(−1)i+jMij称为元素aij的代数余子 式。有以下公式成立
A aij Aij aij Aij
j 1 i 1 p p
矩阵的分块
v
其中A11:k×l,A12:k×(q−l),A21:(p−k)×l, A22:(p−k)×(q−l)。 v 若A和B有相同的分块,则 A11 B11 A12 B12 A B A B A B 21 22 22 21
设A=(aij):p×q,将它分成四块,表示成 A11 A12 A A A 22 21
p
(j≠k),即A的p个列向量也是一组正交单位向量。
v v
若方阵A满足A2=A,则称A为幂等矩阵。 对称的幂等矩阵称为投影矩阵。
正交矩阵A的几何意义
v
Ø
v
将p维向量x看作是在Rp中的一个点,则x的各分量是该点在 相应各坐标轴上的坐标。正交阵A的行列式非1即−1。若 |A|=1,则正交变换y=Ax意味着对原p维坐标系作一刚性旋转( 或称正交旋转),y的各分量正是该点在新坐标系下的坐标; 若|A|=−1,则包含了一个反射的坐标轴。 当p=2时,按逆时针方向将直角坐标系x1Ox2旋转一个角度θ ,所得新坐标系y1Oy2与原坐标系之间的变换为 y1 cos sin x1 y Ax y2 sin cos x2 当p=3时同样有着直观的几何展示。 由于 y′y=(Ax)′(Ax)=x′A′Ax=x′x 故在新、旧坐标系下,该点到原点的距离保持不变。
2 a 若方阵A满足AA′=I,则称A为正交矩阵。显然, ij 1, p j 1
v
aij akj 0, i k , i=1,2,⋯ ,p,即A的p个行向量为单位向量;
2 a 即A的p个行向量相互正交。又从A′A=I得: ij 1, aij akj 0 i 1 i 1 j 1 p p
v Ø
例1.2.2 用矩阵分块方法证明正交矩阵A:p×p的p 个列向量和p个行向量都是一组正交单位向量。 证明 将矩阵A分别按列向量和行向量分块,并记
a1 a2 A a1 , a 2 , , a p a p a1 a 2 a , a ,, a I p 1 2 ap
v
矩阵秩的基本性质
v v
v v v v
v v
(1)rank(A)=0,当且仅当A=0。 (2)若A为p×q矩阵, 且A≠0,则1≤rank(A)≤min{p,q}(若rank(A) =p,则称A为行满秩的;若rank(A)=q,则称A为列满秩的)。 (3)rank(A)=rank(A′)。 A 0 0 A (4) rank 0 B rank B 0 =rank A rank B 。 (5)rank(AB)≤min{rank(A),rank(B)}。 (6)若A和C为非退化方阵,则 rank(ABC)=rank(B) (7)p阶方阵A是非退化的,当且仅当rank(A)=p(称作A满秩)。 (8)rank(AA′)=rank(A′A)=rank(A)。
表示对1,2,⋯ ,p的所有排列求和,τ(j1j2⋯ jp)
行列式的一些基本性质
v v v v v v v v
(1)若A的某行(或列)为零,则|A|=0。 (2)|A′|=|A|。 (3)若将A的某一行(或列)乘以常数c,则所得矩阵的行列式为 c|A|。 (4)若A是一个p阶方阵,c为一常数,则|cA|=cp|A|。 (5)若互换A的任意两行(或列),则行列式符号改变。 (6)若A的某两行(或列)相同,则行列式为零。 (7)若将A的某一行(或列)的倍数加到另一行(或列),则所得行 列式不变。 (8)若A的某一行(或列)是其他一些行(或列)的线性组合,则行 列式为零。
v v v v
(9)若A为上三角矩阵或下三角矩阵或对角矩阵,则 A aii (10)若A和B均为p阶方阵,则|AB|=|A||B|。 (11)|AA′|≥0。 (12)若A与B都是方阵,则 A C A 0 A B 0 B C B (13)若A:p×q,B:q×p,则 |Ip+AB|=|Iq+BA| 例1.3.3 设x,y为两个p维向量,则 |Ip+xy′|=1+y′x
v
逆矩阵的基本性质
v v v
v v v
(1)AA−1=A−1A=I。 (2)(A′)−1=(A−1)′。 (3)若A和C均为p阶非退化方阵,则 (AC)−1=C−1A−1 (4)|A−1|=|A|−1。 (5)若A是正交矩阵,则A−1=A′。 (6)若A=diag(a11,a22,⋯ ,app)非退化(即aii≠0,i=1,2,⋯ ,p),则
v
v
若将矩阵A的行与列互换,则得到的矩阵称为A的转 置,记作A′,即
a11 a 12 A a1q a21 a p1 a22 a p2 a2q a pq
v
若方阵A满足A′=A,则称A为对称矩阵。显然, aij=aji。
§1.2 矩阵的运算
§1.6 特征值、特征向量和矩阵的迹
一、特征值和特征向量 v 二、矩阵的迹
v
一、特征值和特征向量
v
v
v
设A是p阶方阵,若对于一个数λ,存在一个p维非零向量x, 使得Ax=λx,则称λ为A的一个特征值或特征根,而称x为A的 属于特征值λ的一个特征向量。 依该定义有,(A−λI)x=0,而x≠0,故必有 |A−λI|=0 |A−λI|是λ的p次多项式,称为特征多项式。上式有p个根 (可能有重根),记作λ1,λ2,⋯ ,λp,它们可能为实数,也可能为 复数(虽然A是实数矩阵)。反过来,若λi是上式的一个根,则 A−λiI为退化矩阵,故存在一个p维非零向量xi,使得 (A−λiI)xi=0 即λi是A的一个特征值,而xi是相应的特征向量。 今后,一般取xi为单位向量,即满足xi′xi=1。
特征值和特征向量的基本性质
v v v
v
(1)A和A′有相同的特征值。 (2)若A和B分别是p×q和q×p矩阵,则AB和BA有相同的非零 特征值。 (3)若A为实对称矩阵,则A的特征值全为实数,p个特征值按 大小依次表示为λ1≥λ2≥⋯ ≥λp。若λi≠λj,则相应的特征向量xi 和xj必正交,即xi′xj=0。 (4)若A=diag(a11,a22,⋯ ,app),则a11,a22,⋯ ,app为A的p个特征值 ,相应的特征向量分别为e1=(1,0,⋯ ,0)′,e2=(0,1,0,⋯ ,0)′,⋯ ,ep=(0,⋯ ,0,1)′。 (5) A i ,即A的行列式等于其特征值的乘积。可见,A 为非退化矩阵,当且仅当A的特征值均不为零;A为退化矩 阵,当且仅当A至少有一个特征值为零。
v
若C为q×r矩阵,分成 C11 C12 C C C 22 21 其中C11:l×m,C12:l×(r−m),C21:(q−l)×m, C22:(q−l)×(r−m),则有
A11 A12 C11 C12 AC C A A C 22 21 22 21 A11C11 A12C 21 A11C12 A12C 22 A21C11 A22C 21 A21C12 A22C 22
1 1 1 A1 diag a11 , a22 , , a pp (7)若A和B为非退化方阵,则 1 A 0 A 1 0 0 B 1 0 B
v
§1.5 矩阵的秩
一组同维向量a1,a2,⋯ ,an,若存在不全为零的常数 c1,c2,⋯ ,cn,使得 c1a1+c2a2+⋯ +cnan=0 则称该组向量线性相关。若向量a1,a2,⋯ ,an不线性相 关,就称为线性无关。 v 矩阵A的线性无关行向量的最大数目称为行秩,其 线性无关列向量的最大数目称为列秩。矩阵的行秩 和列秩必相等,故统一将其称为A的秩,记作 rank(A)。
运算规律
(1)(A+B)′=A′+B′。 v (2)(AB)′=B′A′。 v (3)A(B1+B2)=AB1+AB2。
v
k k v (4) A Bi ABi 。 i 1 i 1 v (5)c(A+B)=cA+cB。
v
若两个p维向量a和b满足 a′b=a1b1+a2b2+⋯ +apbp=0 则称a和b正交。几何上,正交向量之间相互垂直。