最小二乘法及其应用..

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

最小二乘法及其应用

1．引言

最小二乘法在19世纪初发明后,很快得到欧洲一些国家的天文学家和测地学家的广泛关注。据不完全统计,自1805年至1864年的60年间,有关最小二乘法的研究论文达256篇,一些百科全书包括1837年出版的大不列颠百科全书第7版,亦收入有关方法的介绍。同时,误差的分布是“正态”的,也立刻得到天文学家的关注及大量经验的支持。如贝塞尔( F. W. Bessel, 1784—1846)对几百颗星球作了三组观测,并比较了按照正态规律在给定范围内的理论误差值和实际值,对比表明它们非常接近一致。拉普拉斯在1810年也给出了正态规律的一个新的理论推导并写入其《分析概论》中。正态分布作为一种统计模型,在19世纪极为流行,一些学者甚至把19世纪的数理统计学称为正态分布的统治时代。在其影响下,最小二乘法也脱出测量数据意义之外而发展成为一个包罗极大,应用及其广泛的统计模型。到20世纪正态小样本理论充分发展后,高斯研究成果的影响更加显著。最小二乘法不仅是19世纪最重要的统计方法,而且还可以称为数理统计学之灵魂。相关回归分析、方差分析和线性模型理论等数理统计学的几大分支都以最小二乘法为理论基础。正如美国统计学家斯蒂格勒( S. M. Stigler)所说,“最小二乘法之于数理统计学犹如微积分之于数学”。最小二乘法是参数回归的最基本得方法所以研究最小二乘法原理及其应用对于统计的学习有很重要的意义。

2. 最小二乘法

所谓最小二乘法就是：选择参数10,b b ,使得全部观测的残差平方和最小. 用数学公式表示为：为了说明这个方法，先解释一下最小二乘原理，以一元线性回归方程为例.

i i i x B B Y μ++=10 （一元线性回归方程）

由于总体回归方程不能进行参数估计，我们只能对样本回归函数来估计即：

从上面的公式可以看出：残差i e 是i Y 的真实值与估计值之差，估计总体回归函数最优方法是，选择10,B B 的估计量10,b b ，使得残差i e 尽可能的小.

总之，最小二乘原理就是选择样本回归函数使得所有Y 的估计值与真实值差的平方和为最小，这种确定10,b b 的方法叫做最小二乘法。

最小二乘法是回归分析中的最基本的方法。回归方程一般分为2类，线性回归方程和非线性回归方程。

2.1 线性回归最小二乘法

最小二乘法是由实验或调查的数据，建立线性型公式的一种常用方法. 在建立线性型公式中，虽然有很多种不同的方法来求样本回归函数（即真实总体回归函数的估计值），但是在回归分析中最广泛应用的方法是最小二乘法.

如果变量y x 和有精确的线性关系比如说b ax y +=,那么∧

=i i y y 即观测值与回归值是相等的.事实上现实世界中的诸多变量的关系未必都是如此，由于受诸多随机因数的干扰使得物与物之间没有那种很明确的对应关系.比如说人的身高和体重就是一个对应，我们都知道长的高的人不一定就重，同理长的矮的人也不一定就轻.但身高和体重的确存在着一定的关系,而这种关系并非是

b ax y +=所能确定的.那么我们要寻求身高和体重之间的关系就需要通过数学的方法.首先调查统

计得出数据;其次把数据描绘出来；然后拟合一条跟已有的图象最接近的曲线,这样就可以相对地将身高和体重之间的关系表示出来.在处理类似的事情中常常用到最小二乘法.

2.2 非线性回归最小二乘法

非线性回归的种类很多，常用的有抛物线方程（2Y a bX cX =++）、指数方程（x Y ab =）等。设已知列表函数()(0,1,...,)i i y f x i m ==，并且我们想用一个通常的()n m <次多项式

()01...n n n p x a a x a x =+++ （1）

去近似它。问题是应该如何选择01...n a a a ，，，使()n p x 能较好地近似列表函数()f x 。按最小二乘法，应该选择01...n a a a ，，

，使得 ()()()()

010

...m

n i

i S a a a f x p x ==-∑，，，

（2）

取最小。注意到S 是非负的，且是01...n a a a ，，

，的2次多项式，它必有最小值。求S 对01...n a a a ，，，的偏导数，并令其等于零，得到进一步，可以将它们写成

引进记号则上述方程组为

0011

0102111

0112

,,n n n n n n n n n s a s a s a u s a s a s a u s a s a s a u +++++=⎧⎪+++=⎪⎨⎪⎪+++=⎩ (3)

它的系数行列式是由(0,1,

,2)i i n s = 的定义及行列式性质，可以断言

()()2

1011

,,,.

(1)!

n n X W n ξξξ+=

+∑ (4) 此处符号W 表Vandermonde 行列式，而∑是对所有可能的(0,1,

,)i i n ξ= 求和（每个i ξ 可以取值

01,,

,,m x x x 并且当i j ≠时i j ξξ≠。由（4）式及Vandermonde 行列式的性质可知，当01,,

,m x x x 互

异时，

从而，()100n X +≠>方程组(3)有唯一解01,,,n a a a ,且它们使(2)取极小值如此，我们应用最

小二乘法找到了()f x 的近似多项式()n x p .

在利用最小二乘法组成和式(2)时，所有点i x 都起到了同样的作用，但是有时依据某种理由认为∑中的某些项的作用大些，而另外一些作用小些（例如，一些i y 是由精度较高的仪器或操作上比较熟练的人员获得的，自然应该予以较大的信任），这在数学上表现为用和

()()()2

i i n i i f x p x ρ=-∑ （5）

替代和(2)取最小值.0i ρ>，且1

i i ρ==∑,i ρ通常称之为权；而(5)为加权和.

用多项式()01n n n x a a x a x p =++

+去近似一个给定的列表函数（即给出的一组观测值

()i i y f x =时。

需要确定的参数是01,,,n a a a ;而()n x p 可以看成是01,,

,n a a a 的线性函数.但是有时