超定方程组最小二乘解说课讲解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

超定方程组最小二乘

超定方程组最小二乘解

最小二乘法广泛地应用于工程计算中,用最小二乘法消除(平滑)误差,用最小二乘法从有噪声的数据中提取信号,从海量数据中找出数据变化的趋

势,……。甚至利用简单函数计算复杂函数的近似值,我们并不期望它的近似值多么精确(事实上很多时候也不用很精确),尽管如此还是希望计算出的近似数据与原始数据之间有相似之处。如果从线性代数角度来理解最小二乘法,实际上是将一个高维空间的向量投影到低维子空间所涉及的工作。

一、 超定方程组的最小二乘解

当方程组GX=b 的方程数多于未知数个数时,对应的系数矩阵G 的行数大于列数,此时方程组被称为是超定方程组。设G=(g iu )m ×n ,当m>n 时即所谓的高矩阵,绝大多数情况下,超定方程组没有古典意义下的解。超定方程组的最小二乘解是一种广义解,是指使残差r = b – GX 的2-范数达取极小值的解,即

22*||||min ||||GX b GX b m R

X -=-∈ 该问题是一个优化问题。

命题1:如果X *是正规方程组G T GX=G T b 的解,则X *是超定方程组GX=b 的最小二乘解

证 由题设可得,G T (b – GX *)=0。对任意n 维向量Y ,显然有

(X * – Y )T G T (b – GX *)=0

考虑残差2-范数平方,由

22**2

2||)()(||||||Y X G GX b GY b -+-=-

上式右端利用内积,得

22*22*22*2

2||||||)(||||||||||GX b Y X G GX b GY b -≥-+-=-

从而有

|| b – GY ||2 ≥ || b – GX *||2

等式仅当Y =X *时成立。所以X *是超定方程组GX=b 的最小二乘解。

命题2:如果X *是超定方程组GX=b 的最小二乘解,则X *满足正规方程组G T GX=G T b

证 由题设,22*||||min ||||GX b GX b m R

X -=-∈,利用2-范数与内积关系,知X *是下面二次函数的极小值点

ϕ(X ) = (GX ,GX ) – 2(GX ,b ) + (b ,b )

取任意n 维向量v ,对任意实数t ,构造一元函数

g (t ) = ϕ(X * + t v )

显然, g (t ) 是关于变量t 的二次函数

g (t ) = (G (X * + t v ),G (X * + t v )) – 2(G (X * + t v ),b ) + (b ,b )

= g (0) + 2t [(GX *,Gv ) – (Gv ,b )]+ t 2 (Gv ,Gv )

由题设t =0是g (t )的极小值点。由极值必要条件,得0)0(='g 。即

(GX *,Gv ) – (Gv ,b )=0

将左端整理化简,便得

(Gv ,GX * – b ) =0

利用内积性质,得

( v ,G T (GX * – b ) )=0

由v 的任意性,得G T (GX * – b ) =0

二、 最小二乘解的几何意义

首先考虑一个简单的超定方程组

⎥⎥⎥⎦

⎤⎢⎢⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-6311215342y x 该方程组的右端向量是三维向量,系数矩阵的每一列也是三维向量,但待求的未知向量却是二维向量。将系数矩阵按列分块,G =[α1,α2],记右端向量为β。则方程组求解问题可表示为求组合系数x 和y 使

x α1 + y α2 = β

的向量的线性组合问题。由于两个向量α1,α2不构成三维空间的一组基,所以一般情况下这一问题无解。而由向量α1,α2张成的子空间span{α1,α2}是一张平面,记为π。则超定方程组的最

小二乘解实际上是求X *,使GX *

恰好等于β 在平面π上的投影。而

最小二乘解所对应的残差向量则垂

直于向量GX *。事实上,由正规方程组

G T GX=G T b

G T (b –GX * ) = 0

上式的几何意义可解释为:最小二乘解的残差向量与超定方程组的系数矩阵G 的所有列向量正交。从而

(X *)T G T (b –GX * ) = 0

所以

(GX *,b –GX * ) = 0

相关文档
最新文档