在Matlab中数据拟合的研究应用

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

在Matlab 中数据拟合的研究应用

而解决数据拟合问题最重要的方法变是最小二乘法，矛盾方程组和回归分析。而本论文主要研究的就是最小二乘法。

在科学实验，统计研究以及一切日常应用中，人们常常需要从一组测定的数据（例如N 个点（

(,)(0,1,

,)

i i x y i m =）去求得自变量x 和因变量y 的一个近似解表达式()y x ϕ=，这就

是由给定的N 个点

(,)(0,1,

,)

i i x y i m =求数据拟合的问题。

插值法虽然是函数逼近的一种重要方法，但他还存在以下的缺陷：一是由于测量数据的往往不可避免地带有测试误差，而插值多项式又通过所有的点

(,)

i i x y ，这样就使插值多

项式保留了这些误差，从而影响了逼近精度。此时显然插值效果是不理想的。二是如果由实验提供的数据较多，则必然得到次数较高的插值多项式，这样近似程度往往既不稳定又明显缺乏实用价值。因此，怎样从给定的一组实验数据出发，寻求已知函数的一个逼近函数

()y x ϕ=，使得逼近函数从总体上来说与已知函数的偏差按某种方法度量能达到最小而又

不一定过全部的点

(,)

i i x y ，这就需要介绍本论文主要研究的最小二乘法曲线拟合法。

一．数据拟合的原理及依据

1．最小二乘法的基本原理

从整体上考虑近似函数()p x 同所给数据点(,)i i x y (,)(0,1,

,)i i x y i m =误差

()(0,1,

,)i i i r p x y i m =-=的大小，常用的方法有以下三种：一是误差

()(0,1,,i i i r p x y i m =-=绝对值的最大值0max i i m

r ≤≤，即误差向量01(,,

,)t m r r r r =的

∞-的范数；二是误差绝对值的和0

m

i i r =∑，即误差向量r 的1-范数；前两种方法简单，自然，

但不便于微分运算，后一种方法相当于考虑2-的范数的平方，因此在曲线拟合中常采用误差平方和

2

m

i

i r

=∑来度量误差01(,,,)m r r r r =的整体大小。

数据拟合的具体作法是：对给定的数据(,)(0,1,

,)i i x y i m =，在取定的函数类φ中，

求()p x φ∈，使误差()(0,1,

,)i i i r p x y i m =-=的平方和最小，即

[]

2

20

()min m m

i

i i r p x y ===-=∑∑

从几何意义上讲，就是寻求与给定点(,)(0,1,

,)i i x y i m =的距离平方和为最小的曲线

()y p x =。函数()p x 称为拟合函数或最小二乘解，求拟合函数()p x 的方法成为曲线拟合

的最小二乘法。

在曲线拟合中，函数类φ可有不同的选取方法。

2．多项式拟合

假设给定数据点(,)(0,1,,)i i x y i m =，φ为所有次数不超过()n n m ≤的多项式构成

的函数类，现求一0

()n

k

n k k p x a x

φ==

∈∑，使得

[]

2

00()min m

m

n k n i i k i i i i k I p x y a x y ===⎛⎫

=-=-= ⎪⎝⎭

∑∑∑ （1）称为多项式拟合，满足上式的()n p x 称为最小二乘拟合多项式。特别地，当1n =时，称为线性拟合或直线拟合。

显然

2

00m

n k k i i i k I a x y ==⎛⎫=- ⎪⎝⎭

∑∑

为01,,

,n a a a 的多元函数，因此上述问题即为求01(,,,)n I I a a a =的极值问题，由多元

函数求极值的必要条件，得

0020m

n k j k i i i i k j I a x y x a ==∂⎛⎫

=-= ⎪∂⎝⎭

∑∑， 0,1,,j n = （2）即 000n

m m

j k j i k i i k i i x a x y +===⎛⎫

= ⎪⎝⎭

∑∑∑， 0,1,,j n = （3）

（3）式是关于01,,,n a a a 的线性方程组，用矩阵表示为

00

002

11000

0120

001m

m

m n i

i

i i i i m m

m m

n i i

i i i i i i i n m

m

m n

n n n i

i i i i

i i i i m x

x y a x x

x a x y a x x x x y ===+====+====⎡

⎤⎡⎤

+⎢⎥⎢⎥⎢⎥⎢⎥⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦

∑∑∑∑∑∑∑∑∑∑∑ （4）

（3）式或（4）式称为正规方程组或法方程组。

可以证明，方程组（4）的系数矩阵是一个对称正定矩阵，故存在唯一解。从（4）式中解出,0,1,

,k a k n =，从而可得多项式

()n

k n k k p x a x ==∑ （5）

可以证明，（5）式中的()n p x 满足（1）式，即()n p x 为所求的拟合多项试。我们把

[]

2

()m

n

i

i p x y =-∑称为最小二乘拟合多项式()n p x 的平方误差，记作

[]2

2

20

()m

n i i i r p x y ==-∑

由（2）式可得

2

2000m n

m k i

k i i i k i r y a x y ===⎛⎫

=- ⎪⎝⎭

∑∑∑ （6）

多项式拟合的一般方法可归纳为以下几步：

（1）由已知数据画出函数粗略的图形——散点图，确定拟合多项式的次数n ：

（2）列表计算

()0

0,1,

,2m

j i i x j n ==∑和()0

0,1,

,2m

j i i i x y j n ==∑：

（3）写出正规方程组，求出01,,,n a a a ：

（4）写出拟合多项式0

()n

k

n k k p x a x

==

∑

在实际应用中，n m <或n 《m ：当n m =时所得的拟合多项式就是拉格朗日或牛顿插值多项式。

3．曲线拟合的最小二乘法

在科学实验数据处理中，往往要根据一组给定的实验数据，求出

自变量x 与因变量y 的函数关系

，这是为待定参数，由于观测数