最小二乘法的基本原理和多项式拟合
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i=0
∑ ∑ =
m
[ ]m
Qn (xi ) − pn (xi ) 2 +2
[Qn (xi ) − pn (xi )]⋅ [pn (xi ) − yi ]
i=0
i=0
∑∑[ ] ∑ ∑ ( )∑ ∑ m
≥0+2
i=0
n j=0
(b j
− a j )xij
⋅
⎡ ⎢⎣
k
n =0
ak
xik
−
yi
⎤ ⎥⎦
=
2
m
m
∑ ∑[ ] = ri2
i=0
i=0
p(xi ) − yi
2 = min
从几何意义上讲,就是寻求与给定点 (xi , yi ) (i=0,1,…,m)的距离平方和为最小的曲线
y = p(x) (图6-1)。函数 p(x) 称为拟合 函数或最小二乘解,求拟合函数 p(x) 的方法称为曲 线拟合的最小二乘法。
125
625
10
50
4
6
1
36
216
1296
6
36
5
7
1
49
343
2401
7
49
6
8
2
64
512
4096
16
128
7
9
3
81
729
6561
27
243
8
10
4
100
1000 10000
40
400
∑
53
32
381
3017 25317
147
1025
得正规方程组
http://www.tyut.edu.cn/kecheng/jisff/dzja/ch6/ch6-1.htm
i=0
Μ
m
∑ ∑ ⎢
⎢⎣ i=0
xin
x n+1 i
Λ
i=0
m
∑ ∑ xin
i=0 m
∑ x n+1 ∑ i
i=0
Μ
m
∑ ∑ xi2n
i=0
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥⎦
⎡a0 ⎤
⎢ ⎢
a1
⎥ ⎥
⎢ Μ⎥
⎢⎣an
⎥ ⎦
=
⎡m ⎢ yi
⎢ ⎢ ⎢ ⎢ ⎢
i=0 m
xi yi
i=0
Μ
m
⎢ ⎢⎣ i=0
解 画出散点图(图6-2),可见测得的数据接近一条直线,故取n=1,拟合函数为
列表如下 i
0 1 2 3 4 5 6
∑
Ti
19.1 25.0 30.1 36.0 40.0 45.1 50.0 245.3
R = a0 + a1T
Ri 76.30 77.80 79.25 80.80 82.35 83.90 85.10 565.5
a1
⎥ ⎥
⎢ Μ⎥
⎢⎣a
n
⎥ ⎦
=
⎡m ⎢ yi
⎢ ⎢ ⎢ ⎢ ⎢
i=0 m
xi yi
i=0
Μ
m
⎢ ⎢⎣ i=0
xin
yi
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥⎦
(7)
nm
∑ ∑( xij+k )ak = 0,
k=0 i=0
j = 0,1,Λ , n
(8)
将式(8)中第j个方程乘以 a j (j=0,1,…,n),然后将新得到的n+1个方程左右两端分别 相
m
∑i=0 [pn (xi ) − yi ]2 称为最小二乘拟合多项式 pn (x) 的平方误差,记作
由式(2)可得
∑[ ] m
r2= 2
pn (xi ) − yi 2
i=0
http://www.tyut.edu.cn/kecheng/jisff/dzja/ch6/ch6-1.htm
2007-6-26
第一节 最小二乘法的基本原理和多项式拟合
页码,3/8
m
n
m
∑ ∑ ∑ r 2 = 2
y
2 i
−
ak (
xik yi )
i=0
k =0
i=0
(6)
多项式拟合的一般方法可归纳为以下几步: (1) 由已知数据画出函数粗略的图形——散点图,确定拟合多项式的次数n;
m
∑ (2) 列表计算 i=0 xij
2007-6-26
第一节 最小二乘法的基本原理和多项式拟合
页码,5/8
解得
⎡ 9 52 381 ⎤⎡a0 ⎤ ⎡ 32 ⎤
⎢ ⎢
52
381
3017
⎥ ⎥
⎢ ⎢
a1
⎥ ⎥
=
⎢ ⎢
147
⎥ ⎥
⎢⎣381 3017 25317⎥⎦⎢⎣a2 ⎥⎦ ⎢⎣1025⎥⎦
故拟合多项式为
a0 = 13.4597, a1 = −3.6053 a2 = 0.2676
⎡7 ⎢⎣245.3
245.3 ⎤⎡a0
9325.83⎥⎦
⎢ ⎣
a1
⎤ ⎥ ⎦
=
⎡ 565.5 ⎤ ⎢⎣20029.445⎥⎦
http://www.tyut.edu.cn/kecheng/jisff/dzja/ch6/ch6-1.htm
2007-6-26
第一节 最小二乘法的基本原理和多项式拟合
页码,4/8
mn
∑ ∑ I = ( ak xik − yi )2 i=0 k=0
为 a0 , a1,Λ an 的多元函数,因此上述问题即为求 I = I (a0 , a1,Λ an ) 的极值 问题。由多元函数 求极值的必要条件,得
∑ ∑ ∂I
∂a j
mn
= 2 ( ak xik
i=0 k=0
− yi )xij
第一节 最小二乘法的基本原理和多项式拟合
页码,1/8
第一节 最小二乘法的基本原理和多项式拟合 一 最小二乘法的基本原理
从整体上考虑近似函数 p(x) 同所给数据点 (xi , yi ) (i=0,1,…,m)误差 ri = p(xi ) − yi (i=0,1,
…,m) 的大小,常用的方法有以下三种:一是误差 ri = p(xi ) − yi (i=0,1,…,m)绝对值的最大
n
∑ 证
只需证明,对任意一组数
b0, b1 ,Λ
, bn
组成的多项式
Qn
(x)
=
bk
k =0
xk
,恒有
即可。
m
m
∑ ∑ [Qn (xi ) − ]yi 2 ≥ [pn (xi ) − yi ]2
i=0
i=0
m
m
∑ ∑ [Qn (xi ) − yi ]2 − [pn (xi ) − yi ]2
i=0
在曲线拟合中,函数类 Φ 可有不同的选取方法.
二 多项式拟合
6—1
假设给定数据点 (xi , yi ) (i=0,1,…,m), Φ 为所有次数不超过 n(n ≤ m) 的多项式构成的函数
n
∑ 类,现求一 pn (x) = k=0 ak x k ∈ Φ ,使得
http://www.tyut.edu.cn/kecheng/jisff/dzja/ch6/ch6-1.htm
m
∑ 中常采用误差平方和 i=0 ri2 来 度量误差 ri (i=0,1,…,m)的整体大小。
数据拟合的具体作法是:对给定数据 (xi , yi ) (i=0,1,…,m),在取定的函数类 Φ 中,求
p(x) ∈ Φ ,使误差 ri = p(xi ) − yi (i=0,1,…,m)的平方和最小,即
2007-6-26
第一节 最小二乘法的基本原理和多项式拟合
页码,6/8
a0 = a1 = Λ an = 0 ,与齐次方程组有非零解的假设矛盾。因此正规方程组(4)必有唯一解
n
∑ 。定理2
设 a0,a1 ,Λ
, an
是正规方程组(4)的解,则
pn (x)
=
ak xk
k =0
是满足式(1)的最小二
乘拟合多项式。
2007-6-26
第一节 最小二乘法的基本原理和多项式拟合
页码,2/8
∑[ ] ∑ ∑ m
I=
i=0
pn (xi ) − yi
2
=
m i=0
⎜⎛ ⎝
n k =0
ak
xik
−
yi
⎟⎞ 2 ⎠
=
min
(1)
当拟合函数为多项式时,称为多项式拟合,满足式(1)的 pn (x) 称为最小二乘拟合多项式。 特别地,当n=1时,称为线性拟合或直线拟合。 显然
y = 13.4597 − 3.6053 + 0.2676x2
*三 最小二乘拟合多项式的存在唯一性
定理1 设节点 x0 , x1,Λ , xn 互异,则法方程组(4)的解存在唯一。
证 由克莱姆法则,只需证明方程组(4)的系数矩阵非奇异即可。 用反证法,设方程组(4)的系数矩阵奇异,则其所对应的齐次方程组
n
⎪⎧ ⎨
j=0 ⎪⎩
bj
−
aj
m i=0
⎢⎡⎜⎛ ⎣⎝
n k =0
ak
xik
−
yi
⎟⎞ ⎠
xij
⎤⎪⎫ ⎥⎦⎪⎭⎬
因为 ak (k=0,1,…,n)是正规方程组(4)的解,所以满足式(2),因此有
m
m
∑ ∑ [Qn (xi ) − yi ]2 − [pn (xi ) − ]yi 2 ≥ 0
i=0
∑ ∑ ∑ 加,得
n
aj
j=0
⎡n m ⎢⎣k=0 (i=0
x j+k i
)ak
0⎥⎦⎤
=0
因为
∑ ∑ ∑ ∑∑∑ ∑ ∑ ∑ ∑[ ] n
j=0
a
j
⎡n ⎢⎣k =0
m
(
i=0
x j+k i
)ak
⎤ ⎥⎦
m
=
i=0
nn
ak a j xij+k
j=0 k=0
mn
n
= ( a j xij )( ak xik ) =
式。
例1 测得铜导线在温度 Ti (℃)时的电阻 Ri (Ω) 如表6-1,求电阻R与温度 T的近似函数关 系。
i Ti (℃)
0 19.1
1 25.0
2 30.1
3 36.0
4 40.0
5 45.1
6 50.0
Ri (Ω)
76.30 77.80 79.25 80.80 82.35 83.90 85.10
∑ ⎡
⎢
m
+
1
m
xi Λ
∑ ⎢
⎢ ⎢ ⎢ ⎢
m
xi
i=0
Μ
m
i=0 m
∑ xi2 Λ
i=0
Μ
m
∑ ∑ ⎢
⎢⎣ i=0
xin
x n+1 i
Λ
i=0
有非零解。式(7)可写为
m
∑ ∑ xin
i=0 m
∑ x n+1 ∑ i
i=0
Μ
m
∑ ∑ xi2n
i=0
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥⎦
⎡a0 ⎤
⎢ ⎢
m
∑ ( j = 0,1,Λ ,2n) 和 i=0 xij yi
( j = 0,1,Λ ,2n) ;
(3) 写出正规方程组,求出 a0 , a1,Λ an ;
n
∑ (4)
写出拟合多项式
pn (x) =
ak xk
k =0
。
在实际应用中, n < m 或 n ≤ m ;当 n = m 时所得的拟合多项式就是拉格朗日或牛顿插值多项
4
5
6
7
8
9
10
xi
yi
10
5
4
2
1
1
2
3
4
试用最小二乘法求它的二次拟合多项式。 解 设拟合曲线方程为
y = a0 + a1x + a2 x 2
列表如下
I
xi
yi
x i2
x i3
x i4
xi yi
xi2 yi
0
1
10
1
1
1
10
10
1
3
5
9
27
81
15
45
2
4
4
16
64
256
16
64
3
5
2
25
m
∑ 值
max
0≤i≤m
ri
,即误差
向量 r = (r0 , r1,Λ
rm )T 的∞—范数;二是误差绝对值的和 i=0
ri
,即误差向
m
∑ 量r的1—范数;三是误差平方和 i=0 ri2 的算术平方根,即误差向量r的2—范数;前两种方法
简单、自然,但不便于微分运算 ,后一种方法相当于考虑 2—范数的平方,因此在曲线拟合
Ti 2
364.81 625.00 906.01 1296.00 1600.00 2034.01 2500.00 9325.83
Ti Ri
1457.330 1945.000 2385.425 2908.800 3294.000 3783.890 4255.000 20029.445
正规方程组为 解方程组得
故得R与T的拟合直线为
a0 = 70.572,
a1 = 0.921
R = 70.572 + 0.921T
利用上述关系式,可以预测不同温度时铜导线的电阻值。例如,由R=0得T=-242.5,即预测温 度 T=-242.5℃时,铜导线无电阻。
6-2 例2 已知实验数据如下表
i
0
1
2
来自百度文库
3
4
5
6
7
8
1
3
i=0 j=0
k =0
m i=0
pn (xi ) 2
其中
所以
n
∑ pn (x)
=
ak xk
k =0
pn (xi ) = 0 (i=0,1,…,m)
pn (x) 是次数不超过n的多项式,它有m+1>n个相异零点,由代数基本定理,必须有
http://www.tyut.edu.cn/kecheng/jisff/dzja/ch6/ch6-1.htm
i=0
故 pn (x) 为最小二乘拟合多项式。
*四 多项式拟合中克服正规方程组的病态 在多项式拟合中,当拟合多项式的次数较高时,其正规方程组往往是病态的。而且 ①正规方程组系数矩阵的阶数越高,病态越严重;
②拟合节点分布的区间 [x0 , xm ]偏离原点越远,病态越严重;
③ xi (i=0,1,…,m)的数量级相差越大,病态越严重。
xin
yi
⎤ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥⎦
(4)
式(3)或式(4)称为正规方程组或法方程组。 可以证明,方程组(4)的系数矩阵是一个对称正定矩阵,故存在唯一解。从式(4)中
解出 ak (k=0,1,…,n),从而可得多项式
n
∑ pn (x)
=
ak xk
k =0
(5)
可以证明,式(5)中的 pn (x) 满足式(1),即 pn (x) 为所求的拟合多项式。我们把
= 0,
j = 0,1,Λ , n (2)
即
nm
m
∑ ∑ ∑
k =0
(
i=0
xij+k )ak
=
xij yi ,
i=0
j = 0,1,Λ , n
(3)
(3)是关于 a0 , a1,Λ an 的线性方程组,用矩阵表示为
∑ ⎡
⎢
m
+
1
m
xi Λ
∑ ⎢
⎢ ⎢ ⎢ ⎢
m
xi
i=0
Μ
m
i=0 m
∑ xi2 Λ