最小二乘法的基本原理和多项式拟合

合集下载

相关主题

最小二乘配置法

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

最小二乘法的基本原理和多项式拟合

一最小二乘法的基本原理

从整体上考虑近似函数)(x p 同所给数据点),(i i y x (i=0,1,…,m)误差

i i i y x p r -=)((i=0,1,…,m)的大小，常用的方法有以下三种：一是误差

i i i y x p r -=)((i=0,1,…,m)绝对值的最大值i

m i r ≤≤0max ，即误差向量

T m r r r r ),,(10 =的∞—范数；二是误差绝对值的和∑=m

i i

r 0

，即误差向量r 的1—

范数；三是误差平方和∑=m

i i

r

02

的算术平方根，即误差向量r 的2—范数；前两种方法简单、自然，但不便于微分运算，后一种方法相当于考虑 2—范数的平方，因此在曲线拟合中常采用误差平方和∑=m

i i

r

02

来度量误差i r (i=0，1，…，m)的整

体大小。

数据拟合的具体作法是：对给定数据 ),(i i y x (i=0,1,…，m)，在取定的函数类Φ中,求Φ∈)(x p ,使误差i i i y x p r -=)((i=0,1,…,m)的平方和最小，即

∑=m

i i

r

2

=

从几何意义上讲，就是寻求与给定点),(i i y x (i=0,1,…,m)的距离平方和为最

小的曲线)(x p y =（图6-1）。函数)(x p 称为拟合函数或最小二乘解，求拟合函数)(x p 的方法称为曲线拟合的最小二乘法。

在曲线拟合中，函数类Φ可有不同的选取方法.

6—1

二多项式拟合

假设给定数据点),(i i y x (i=0,1,…,m)，Φ为所有次数不超过)(m n n ≤的多项式构成的函数类，现求一

Φ

∈=∑=n

k k k n x a x p 0

)(,使得

[]

min )(0

02

=⎪⎭⎫

⎝⎛-=-=∑∑∑===m

i m

i n k i k i k i i n y x a y x p I (1)

[ ] ∑ = = - m

i i

i y x p 0

2 min ) (

当拟合函数为多项式时，称为多项式拟合，满足式（1）的)(x p n 称为最小二乘拟合多项式。特别地，当n=1时，称为线性拟合或直线拟合。显然

∑∑==-=m i n

k i k i k y x a I 0

2

)(

为n a a a ,,10的多元函数，因此上述问题即为求),,(10n a a a I I =的极值问题。由多元函数求极值的必要条件，得

n j x y x a a I

m i j i n

k i k i k j ,,1,0,0)(200 ==-=∂∂∑∑== (2)

即

n

j y x a x

n k m

i i j i k m

i k j i

,,1,0,

)(0

==∑∑∑===+ (3)

（3）是关于n a a a ,,10的线性方程组，用矩阵表示为

⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡⎥⎥

⎥⎥⎥⎥⎥⎥⎦

⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡+∑∑∑∑∑∑∑∑∑∑∑=====+==+====m i i n i m i i i m i i n m

i n i m i n i m i n i m

i n i m i i m i i

m

i n i m i i y x y x y a a a x x x x x x x x m 00010020100

1020001 (4) 式（3）或式（4）称为正规方程组或法方程组。

可以证明，方程组（4）的系数矩阵是一个对称正定矩阵，故存在唯一解。从式（4）中解出k a (k=0,1,…，n)，从而可得多项式

∑==n

k k

k n x a x p 0

)( (5)

可以证明，式（5）中的)(x p n 满足式（1），即)(x p n 为所求的拟合多项式。我

们把[]

∑=-m

i i i n

y x p

2

)(称为最小二乘拟合多项式)(x p n 的平方误差，记作

[]

∑=-=m

i i i n y x p r

2

22

)(

由式(2)可得

∑∑∑===-=m i n k m

i i k i k i y x a y r

222

)

( (6)

多项式拟合的一般方法可归纳为以下几步：

(1) 由已知数据画出函数粗略的图形——散点图，确定拟合多项式的次数n ；

(2) 列表计算∑==m

i j i

n j x

)

2,,1,0( 和∑==m

i i

j i

n j y x

)

2,,1,0( ；

(3) 写出正规方程组，求出n a a a ,,10；

(4) 写出拟合多项式∑==n

k k

k n x a x p 0)(。

在实际应用中，m n <或m n ≤；当m n =时所得的拟合多项式就是拉格朗日或牛顿插值多项式。

例 1 测得铜导线在温度i T (℃)时的电阻)(Ωi R 如表6-1，求电阻R 与温度 T

的近似函数关系。

i 0 1

2

3 4 5 6 i T (℃)

19.1 25.0 30.1 36.0 40.0 45.1 50.0 )(Ωi R

76.30 77.80

79.25

80.80

82.35

83.90

85.10

解画出散点图（图6-2），可见测得的数据接近一条直线，故取n=1，拟合函数为

T a a R 10+=

列表如下

i

i T i R 2i T

i i R T 0

19.1 76.30 364.81 1457.330 1 25.0 77.80 625.00 1945.000 2 30.1 79.25 906.01 2385.425 3 36.0 80.80 1296.00 2908.800 4 40.0 82.35 1600.00 3294.000 5 45.1 83.90 2034.01 3783.890 6 50.0 85.10 2500.00 4255.000 ∑

245.3

565.5

9325.83

20029.445

正规方程组为

⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡445.200295.56583.93253.2453.2457

10a a

解方程组得

921.0,

572.7010==a a

故得R 与T 的拟合直线为

T R 921.0572.70+=

利用上述关系式，可以预测不同温度时铜导线的电阻值。例如，由R=0得T=-242.5，即预测温度T=-242.5℃时，铜导线无电阻。