最小二乘法的基本原理和多项式拟合
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最小二乘法的基本原理和多项式拟合
一 最小二乘法的基本原理
从整体上考虑近似函数)(x p 同所给数据点),(i i y x (i=0,1,…,m)误差
i i i y x p r -=)((i=0,1,…,m)的大小,常用的方法有以下三种:一是误差
i i i y x p r -=)((i=0,1,…,m)绝对值的最大值i
m i r ≤≤0max ,即误差 向量
T m r r r r ),,(10 =的∞—范数;二是误差绝对值的和∑=m
i i
r 0
,即误差向量r 的1—
范数;三是误差平方和∑=m
i i
r
02
的算术平方根,即误差向量r 的2—范数;前两种方法简单、自然,但不便于微分运算 ,后一种方法相当于考虑 2—范数的平方,因此在曲线拟合中常采用误差平方和∑=m
i i
r
02
来 度量误差i r (i=0,1,…,m)的整
体大小。
数据拟合的具体作法是:对给定数据 ),(i i y x (i=0,1,…,m),在取定的函数类Φ中,求Φ∈)(x p ,使误差i i i y x p r -=)((i=0,1,…,m)的平方和最小,即
∑=m
i i
r
2
=
从几何意义上讲,就是寻求与给定点),(i i y x (i=0,1,…,m)的距离平方和为最
小的曲线)(x p y =(图6-1)。函数)(x p 称为拟合函数或最小二乘解,求拟合函数)(x p 的方法称为曲线拟合的最小二乘法。
在曲线拟合中,函数类Φ可有不同的选取方法.
6—1
二 多项式拟合
假设给定数据点),(i i y x (i=0,1,…,m),Φ为所有次数不超过)(m n n ≤的多项式构成的函数类,现求一
Φ
∈=∑=n
k k k n x a x p 0
)(,使得
[]
min )(0
02
02
=⎪⎭⎫
⎝⎛-=-=∑∑∑===m
i m
i n k i k i k i i n y x a y x p I (1)
[ ] ∑ = = - m
i i
i y x p 0
2 min ) (
当拟合函数为多项式时,称为多项式拟合,满足式(1)的)(x p n 称为最小二乘拟合多项式。特别地,当n=1时,称为线性拟合或直线拟合。 显然
∑∑==-=m i n
k i k i k y x a I 0
2
)(
为n a a a ,,10的多元函数,因此上述问题即为求),,(10n a a a I I =的极值 问题。由多元函数求极值的必要条件,得
n j x y x a a I
m i j i n
k i k i k j ,,1,0,0)(200 ==-=∂∂∑∑== (2)
即
n
j y x a x
n k m
i i j i k m
i k j i
,,1,0,
)(0
==∑∑∑===+ (3)
(3)是关于n a a a ,,10的线性方程组,用矩阵表示为
⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡⎥⎥
⎥⎥⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡+∑∑∑∑∑∑∑∑∑∑∑=====+==+====m i i n i m i i i m i i n m
i n i m i n i m i n i m
i n i m i i m i i
m
i n i m i i y x y x y a a a x x x x x x x x m 00010020100
1020001 (4) 式(3)或式(4)称为正规方程组或法方程组。
可以证明,方程组(4)的系数矩阵是一个对称正定矩阵,故存在唯一解。从式(4)中解出k a (k=0,1,…,n),从而可得多项式
∑==n
k k
k n x a x p 0
)( (5)
可以证明,式(5)中的)(x p n 满足式(1),即)(x p n 为所求的拟合多项式。我
们把[]
∑=-m
i i i n
y x p
2
)(称为最小二乘拟合多项式)(x p n 的平方误差,记作
[]
∑=-=m
i i i n y x p r
2
22
)(
由式(2)可得
∑∑∑===-=m i n k m
i i k i k i y x a y r
222
)
( (6)
多项式拟合的一般方法可归纳为以下几步:
(1) 由已知数据画出函数粗略的图形——散点图,确定拟合多项式的次数n ;
(2) 列表计算∑==m
i j i
n j x
)
2,,1,0( 和∑==m
i i
j i
n j y x
)
2,,1,0( ;
(3) 写出正规方程组,求出n a a a ,,10;
(4) 写出拟合多项式∑==n
k k
k n x a x p 0)(。
在实际应用中,m n <或m n ≤;当m n =时所得的拟合多项式就是拉格朗日或牛顿插值多项式。
例 1 测得铜导线在温度i T (℃)时的电阻)(Ωi R 如表6-1,求电阻R 与温度 T
的近似函数关系。
i 0 1
2
3 4 5 6 i T (℃)
19.1 25.0 30.1 36.0 40.0 45.1 50.0 )(Ωi R
76.30 77.80
79.25
80.80
82.35
83.90
85.10
解 画出散点图(图6-2),可见测得的数据接近一条直线,故取n=1,拟合函数为
T a a R 10+=
列表如下
i
i T i R 2i T
i i R T 0
19.1 76.30 364.81 1457.330 1 25.0 77.80 625.00 1945.000 2 30.1 79.25 906.01 2385.425 3 36.0 80.80 1296.00 2908.800 4 40.0 82.35 1600.00 3294.000 5 45.1 83.90 2034.01 3783.890 6 50.0 85.10 2500.00 4255.000 ∑
245.3
565.5
9325.83
20029.445
正规方程组为
⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡445.200295.56583.93253.2453.2457
10a a
解方程组得
921.0,
572.7010==a a
故得R 与T 的拟合直线为
T R 921.0572.70+=
利用上述关系式,可以预测不同温度时铜导线的电阻值。例如,由R=0得T=-242.5,即预测温度T=-242.5℃时,铜导线无电阻。