实验五曲线拟合
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由此构造一个简单易算的近似函数 p(x) f(x),满足条件 p(xi) = f(xi) (i = 0, … n),(插值条件)
这里的 p(x) 称为f(x) 的插值函数;
构造插值函数的方法为插值法。
曲线拟合
定义: 当精确函数 y = f(x) 非常复杂或未知时,在一系列节点x0 … xn 处,测得函数值 y0 , … ,yn ,由此构造一个简单易 算的近似函 数 p(x) f(x),
2求曲线拟合函数的标准?1用各点误差绝对值的和表示?2用各点误差按绝对值的最大值表示?3用各点误差的平方和表示11miiirpxy????1maxiiimrpxy?????221miiirpxy????而只要pxi??yi总体上尽可能小最小二乘拟合?式中r2称为均方误差
实验五 曲线拟合
实验内容
1、理解曲线拟合的最小二乘法原理; 2、用MATLAB实现最小二乘法。
偏差平方的均值的算术平方根,越接近0 越好
曲线拟合好坏如何评价
首要指标是目标函数误差最小(拟合度 最大);
其次是应考虑关键点的吻合,这些关键 点包括:初始点(有时是原点)、拐点、 峰值点、极值点、中间点、渐近点、终 值点等,在这些关键点上,数据观察值 点与函数值点应尽可能一致;
再次是拟合的模型应尽可能简单(模型 的形式简单,参数数少)。
“Fitting”按钮
曲线拟合
点击“Fitting”按钮, 弹出“Fitting”窗口;
点击“New fit”按 钮,可修改拟合项目 名称“Fit name”, 通过“Data set”下 拉菜单选择数据集, 然后通过下拉菜单 “Type of fit”选择 拟合曲线的类型。
SSE
The sum of squares due to error. This statistic measures the deviation of the responses from the fitted values of the responses. A value closer to 0 indicates a better fit.
x x1 x2 … xm y y1 y2 … ym
构造一个简单易于计算的近似函数 p(x) f (x) (精确函数)。 2、构造近似函数, p(x) 的方法有两种:
(1)插值法; (2)曲线拟合法.
插值法
定义:当精确函数 y = f(x) 非常复杂或未知时,在一系列节点 x0 … xn 处测得函数值 y0 = f(x0), … ,yn = f(xn),
实践中如何选择模型?
在数据拟合实践中,理性模型毕竟是少 数,大多数的情形是根据数据的趋势寻 找合适的模型,有时好几个模型对数据 都有较好的拟合,但通过对关键点的比 较总会找到一种最合适的模型。
在选择不同的模型时,合理性和可解释 性是首要考虑的因素。
美国人口问题
据美国人口普查局数据: 从1790每隔10年至2000年的总人口(单 位:百万)如下示
x0=[0 0.9 1.9 3 3.9 5]; y0=[0 10 30 50 80 110]; a=polyfit(x0,y0,1) x=0:0.1:5; y=polyval(a,x); %计算拟合多项式在x的值 plot(x0,y0,'*',x,y)
运行结果: a=
22.2538 -7.8550
练习1:求下面数据表的二次最小二乘拟合多项式。
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
流 3.19 3.22 3.26 3.25 3.23 3.19 3.20 3.13 3.06 2.98 速
美国人口问题
据美国人口普查局数据: 从1790每隔10年至2000年的总人口(单位:百万)如下示
t = 1790:10:2000; p = [3.9, 5.3 , 7.2 , 9.6 , 12.9 , 17.1 , 23.1 , 31.4 , 38.6 , 50.2 , 62.9 ,
函数。 (2)拟合函数 p(x) 为多项式,即用多项式来拟合离 散数据:
x x1 x2 … xm y y1 y2 … ym
最小二乘拟合中,用的较多的是多项式拟合。
4、多项式拟合的MATLAB实现
MATLAB中求最小二乘意义下拟合多项式 p(x) 的 命令:
a=polyfit(x0,y0,m)
其中输入参数:
怎样预测其它点的函数值?
飞机机翼制造
下表给出的x、y数据位于机翼端面的轮廓线上,Y1和Y2分别 对应轮廓的上下线。假设需要得到x坐标每改变0.1时的y 坐标,试完成加工所需数据,画出曲线.
x
0 3 5 7 9 11
Y1 0 1.8 2.2 2.7 3.0 3.1
Y2 0 1.2 1.7 2.0 2.0 2.0
复相关系数平方(决定系数),越接近1越好
Adjusted R-square
The degree of freedom adjusted Rsquare. A value closer to 1 indicates a better fit. It is generally the best indicator of the fit quality when you add additional coefficients to your model.
试做出该山区的地貌图.
水深和流速的问题
在水文数据测量中,不同水深的流速是不同的. 水文数据的测量 时天天进行的,为了减少测量的工作,希望得到确定的水深和水 流之间的关系. 为此测量了一系列不同水深和流速值. 下表给出了 对某河流的测量数据,其中水深和流速根据适当的单位进行了规 范化,共10个值.
水0 深
插值与拟合的不同点
插值: 过节点 ; 拟合: 不过节点, 整体近似;
插值法
拉格朗日插值 牛顿插值 三次埃尔米特插值法 分段线性插值 分段三次埃尔米特插值法 三次样条插值
三、曲线拟合
1、定义:在实验中经常给出一组离散点, x y
x1 x2 … xm y1 y2 … ym
偏差平方和,越接近0越好
SSE
n
(
p( xi
)
yi
)2
i1
R-square
The coefficient of multiple determination. This statistic measures how successful the fit is in explaining the variation of the data. A value closer to 1 indicates a better fit.
x0, y0为要拟合的数据,
m 为拟合多项式的 次数,
输出参数d:d为拟合多项式
p(x) =amxm+…+a1x+a0 的系数a=[am, …, a1, a0 ]。
观测物体的直线运动,数据如下:
时间t 0
0.9
1.9
3.0 3.9 5.0
距离s 0
10
30
50
80
110
求运动方程。 MATLAB程序:
xi f (xi )
0 1.0000
0.25 1.2840
0.50 1.6487
0.75 2.1170
1.00 2.7183
答案:二次最小二乘拟合多项式为 p2( x) 1.0052 0.8641x 0.8437x2
练习2 :给定函数值表,求 f (x) 的最小二乘拟合函数
xi 0.24 0.65 1.24 2.23 2.52 2.77 2.99 yi 0.23 -0.26 - -0.29 0.24 0.56 1.00
试作出该山区的地貌图和等高线图,并对几种插值方法进行比较。
X 1200 1600 2000 2400 2800 3200 3600 4000 Y 1200 1130 1250 1280 1230 1040 900 500 700 1600 1320 1450 1420 1400 1300 700 900 850 2000 1390 1500 1500 1400 900 1100 1060 950 2400 1500 1200 1100 1350 1450 1200 1150 1010 2800 1500 1200 1100 1550 1600 1550 1380 1070 3200 1500 1550 1600 1550 1600 1600 1600 1550 3600 1480 1500 1550 1510 1430 1300 1200 980
实验目的
1、通过实验理解最小二乘法的意义; 2、会用MATLAB解决现实中的最小二乘问 题。
一、问题的提出
在生产和实验中,关于函数f(x),经常存在两种情况: (1)其表达式不便于计算; (2)无表达式. 而只有函数在给定点的函数值,
x x0 y y0
x1 x2 … xn y1 y2 … yn
0.45
先画出拟合数据点的图形,观察规律,选择合适的拟合函数。
5、MATLAB---曲线拟合工具箱
Matlab有一个功能强大的曲线拟合工具 箱 (Curve Fitting Toolbox ) cftool, 使用方便,能实现多种类型的线性、非 线性曲线拟合。
调用:cftool 界面如下所示
2
i
i
平方和表示
i 1
最小二乘拟合
m
R ( p(x ) y )2
2
i
i
i1
式中 R2 称为均方误差。由于计算均方误差 的最小值的原则容易实现而被广泛采用。
按均方误差达到最小构造拟合函数的方法 称为最小二乘法。
3.拟合函数 p(x) 的选择
(1)拟合函数 p(x) 的选择: 多项式、指数函数、对数函数、有理函数等, 选择标准:根据离散数据自身的特征来选择拟合
需要求一个简单易算的近似函数 ; (2) yi 本身是测量值,不准确,即 yi f (xi) 。
这时没必要使 p(xi) = yi (即没有必要使用插值法) ,而只要 p(xi) yi 总体上 尽可能小。这种构造近似函数 的方法称为曲线拟合, p(x) 称为拟合函数。
“Data”按钮
数据的选取 点击“Data”按钮,弹出“Data”窗口; 利用X data和Y data的下拉菜单读入数据
x,y,可修改数据集名“Data set name”, 然后点击“Create data set”按钮,退出 “Data”窗口,返回工具箱界面,这时 会自动画出数据集的曲线图;
76 , 92 , 105.7 , 122.8 , 131.7 , 150.7 , 179 , 205 , 226.5 , 251.4 , 281.422]; 预测2001,2002年的美国人口数?并与调查数据285.318, 288.369比较,选择拟合较好的模型。
二、问题的解决
1、问题的抽象 在实验中经常给出一组离散点,
12 13 14 15 2.9 2.5 2.0 1.6 1.8 1.2 1.0 1.6
山体地貌
要在某山区例方圆山区大地约貌2:7平方公里范围内修建一条公路,从山脚出发经 过一个居民区,在某再山到区测达得一一些个地矿点的区高。程如横下向表。纵平向面分区域别为每隔400米测量一次, 得到一些地点的高程12:00<=x<=4000,1200<=y<=3600)
但是不要求使 p(xi) = yi ,而只要 p(xi) yi 总体上尽可能小。这种构
造近似函数p(x) 的方法称为曲线拟合法, p(x) 称为拟合函数。
插值与拟合的相同点
都需要根据已知离散数据构造函数。 x x1 x2 … xm y y1 y2 … ym
求一个简单易算的近似函数 p(x) f (x) 。
而只要 p(xi) yi 总体上 尽可能小
2、求曲线拟合函数的标准
(1)用各点误差绝
m
对值的和表示
R p(x ) y
1
i
i
i1
max (2)用各点误差按 绝对值的最大值表示
R
p(x ) y
i
i
1im
m
(3)用各点误差的 R ( p(x ) y )2
修正的复相关系数平方,越接近1越好
Adjusted R-square
下列公式中的m为拟合函数中待估参数 个数,如:对一元一次多项式拟合,f(x) = a + bx,此时m=2,n为数据点个数。 该修正类似修正的样本方差使其为总体 方差的无偏估计。
RMSE
The root mean squared error. A value closer to 0 indicates a better fit.
这里的 p(x) 称为f(x) 的插值函数;
构造插值函数的方法为插值法。
曲线拟合
定义: 当精确函数 y = f(x) 非常复杂或未知时,在一系列节点x0 … xn 处,测得函数值 y0 , … ,yn ,由此构造一个简单易 算的近似函 数 p(x) f(x),
2求曲线拟合函数的标准?1用各点误差绝对值的和表示?2用各点误差按绝对值的最大值表示?3用各点误差的平方和表示11miiirpxy????1maxiiimrpxy?????221miiirpxy????而只要pxi??yi总体上尽可能小最小二乘拟合?式中r2称为均方误差
实验五 曲线拟合
实验内容
1、理解曲线拟合的最小二乘法原理; 2、用MATLAB实现最小二乘法。
偏差平方的均值的算术平方根,越接近0 越好
曲线拟合好坏如何评价
首要指标是目标函数误差最小(拟合度 最大);
其次是应考虑关键点的吻合,这些关键 点包括:初始点(有时是原点)、拐点、 峰值点、极值点、中间点、渐近点、终 值点等,在这些关键点上,数据观察值 点与函数值点应尽可能一致;
再次是拟合的模型应尽可能简单(模型 的形式简单,参数数少)。
“Fitting”按钮
曲线拟合
点击“Fitting”按钮, 弹出“Fitting”窗口;
点击“New fit”按 钮,可修改拟合项目 名称“Fit name”, 通过“Data set”下 拉菜单选择数据集, 然后通过下拉菜单 “Type of fit”选择 拟合曲线的类型。
SSE
The sum of squares due to error. This statistic measures the deviation of the responses from the fitted values of the responses. A value closer to 0 indicates a better fit.
x x1 x2 … xm y y1 y2 … ym
构造一个简单易于计算的近似函数 p(x) f (x) (精确函数)。 2、构造近似函数, p(x) 的方法有两种:
(1)插值法; (2)曲线拟合法.
插值法
定义:当精确函数 y = f(x) 非常复杂或未知时,在一系列节点 x0 … xn 处测得函数值 y0 = f(x0), … ,yn = f(xn),
实践中如何选择模型?
在数据拟合实践中,理性模型毕竟是少 数,大多数的情形是根据数据的趋势寻 找合适的模型,有时好几个模型对数据 都有较好的拟合,但通过对关键点的比 较总会找到一种最合适的模型。
在选择不同的模型时,合理性和可解释 性是首要考虑的因素。
美国人口问题
据美国人口普查局数据: 从1790每隔10年至2000年的总人口(单 位:百万)如下示
x0=[0 0.9 1.9 3 3.9 5]; y0=[0 10 30 50 80 110]; a=polyfit(x0,y0,1) x=0:0.1:5; y=polyval(a,x); %计算拟合多项式在x的值 plot(x0,y0,'*',x,y)
运行结果: a=
22.2538 -7.8550
练习1:求下面数据表的二次最小二乘拟合多项式。
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
流 3.19 3.22 3.26 3.25 3.23 3.19 3.20 3.13 3.06 2.98 速
美国人口问题
据美国人口普查局数据: 从1790每隔10年至2000年的总人口(单位:百万)如下示
t = 1790:10:2000; p = [3.9, 5.3 , 7.2 , 9.6 , 12.9 , 17.1 , 23.1 , 31.4 , 38.6 , 50.2 , 62.9 ,
函数。 (2)拟合函数 p(x) 为多项式,即用多项式来拟合离 散数据:
x x1 x2 … xm y y1 y2 … ym
最小二乘拟合中,用的较多的是多项式拟合。
4、多项式拟合的MATLAB实现
MATLAB中求最小二乘意义下拟合多项式 p(x) 的 命令:
a=polyfit(x0,y0,m)
其中输入参数:
怎样预测其它点的函数值?
飞机机翼制造
下表给出的x、y数据位于机翼端面的轮廓线上,Y1和Y2分别 对应轮廓的上下线。假设需要得到x坐标每改变0.1时的y 坐标,试完成加工所需数据,画出曲线.
x
0 3 5 7 9 11
Y1 0 1.8 2.2 2.7 3.0 3.1
Y2 0 1.2 1.7 2.0 2.0 2.0
复相关系数平方(决定系数),越接近1越好
Adjusted R-square
The degree of freedom adjusted Rsquare. A value closer to 1 indicates a better fit. It is generally the best indicator of the fit quality when you add additional coefficients to your model.
试做出该山区的地貌图.
水深和流速的问题
在水文数据测量中,不同水深的流速是不同的. 水文数据的测量 时天天进行的,为了减少测量的工作,希望得到确定的水深和水 流之间的关系. 为此测量了一系列不同水深和流速值. 下表给出了 对某河流的测量数据,其中水深和流速根据适当的单位进行了规 范化,共10个值.
水0 深
插值与拟合的不同点
插值: 过节点 ; 拟合: 不过节点, 整体近似;
插值法
拉格朗日插值 牛顿插值 三次埃尔米特插值法 分段线性插值 分段三次埃尔米特插值法 三次样条插值
三、曲线拟合
1、定义:在实验中经常给出一组离散点, x y
x1 x2 … xm y1 y2 … ym
偏差平方和,越接近0越好
SSE
n
(
p( xi
)
yi
)2
i1
R-square
The coefficient of multiple determination. This statistic measures how successful the fit is in explaining the variation of the data. A value closer to 1 indicates a better fit.
x0, y0为要拟合的数据,
m 为拟合多项式的 次数,
输出参数d:d为拟合多项式
p(x) =amxm+…+a1x+a0 的系数a=[am, …, a1, a0 ]。
观测物体的直线运动,数据如下:
时间t 0
0.9
1.9
3.0 3.9 5.0
距离s 0
10
30
50
80
110
求运动方程。 MATLAB程序:
xi f (xi )
0 1.0000
0.25 1.2840
0.50 1.6487
0.75 2.1170
1.00 2.7183
答案:二次最小二乘拟合多项式为 p2( x) 1.0052 0.8641x 0.8437x2
练习2 :给定函数值表,求 f (x) 的最小二乘拟合函数
xi 0.24 0.65 1.24 2.23 2.52 2.77 2.99 yi 0.23 -0.26 - -0.29 0.24 0.56 1.00
试作出该山区的地貌图和等高线图,并对几种插值方法进行比较。
X 1200 1600 2000 2400 2800 3200 3600 4000 Y 1200 1130 1250 1280 1230 1040 900 500 700 1600 1320 1450 1420 1400 1300 700 900 850 2000 1390 1500 1500 1400 900 1100 1060 950 2400 1500 1200 1100 1350 1450 1200 1150 1010 2800 1500 1200 1100 1550 1600 1550 1380 1070 3200 1500 1550 1600 1550 1600 1600 1600 1550 3600 1480 1500 1550 1510 1430 1300 1200 980
实验目的
1、通过实验理解最小二乘法的意义; 2、会用MATLAB解决现实中的最小二乘问 题。
一、问题的提出
在生产和实验中,关于函数f(x),经常存在两种情况: (1)其表达式不便于计算; (2)无表达式. 而只有函数在给定点的函数值,
x x0 y y0
x1 x2 … xn y1 y2 … yn
0.45
先画出拟合数据点的图形,观察规律,选择合适的拟合函数。
5、MATLAB---曲线拟合工具箱
Matlab有一个功能强大的曲线拟合工具 箱 (Curve Fitting Toolbox ) cftool, 使用方便,能实现多种类型的线性、非 线性曲线拟合。
调用:cftool 界面如下所示
2
i
i
平方和表示
i 1
最小二乘拟合
m
R ( p(x ) y )2
2
i
i
i1
式中 R2 称为均方误差。由于计算均方误差 的最小值的原则容易实现而被广泛采用。
按均方误差达到最小构造拟合函数的方法 称为最小二乘法。
3.拟合函数 p(x) 的选择
(1)拟合函数 p(x) 的选择: 多项式、指数函数、对数函数、有理函数等, 选择标准:根据离散数据自身的特征来选择拟合
需要求一个简单易算的近似函数 ; (2) yi 本身是测量值,不准确,即 yi f (xi) 。
这时没必要使 p(xi) = yi (即没有必要使用插值法) ,而只要 p(xi) yi 总体上 尽可能小。这种构造近似函数 的方法称为曲线拟合, p(x) 称为拟合函数。
“Data”按钮
数据的选取 点击“Data”按钮,弹出“Data”窗口; 利用X data和Y data的下拉菜单读入数据
x,y,可修改数据集名“Data set name”, 然后点击“Create data set”按钮,退出 “Data”窗口,返回工具箱界面,这时 会自动画出数据集的曲线图;
76 , 92 , 105.7 , 122.8 , 131.7 , 150.7 , 179 , 205 , 226.5 , 251.4 , 281.422]; 预测2001,2002年的美国人口数?并与调查数据285.318, 288.369比较,选择拟合较好的模型。
二、问题的解决
1、问题的抽象 在实验中经常给出一组离散点,
12 13 14 15 2.9 2.5 2.0 1.6 1.8 1.2 1.0 1.6
山体地貌
要在某山区例方圆山区大地约貌2:7平方公里范围内修建一条公路,从山脚出发经 过一个居民区,在某再山到区测达得一一些个地矿点的区高。程如横下向表。纵平向面分区域别为每隔400米测量一次, 得到一些地点的高程12:00<=x<=4000,1200<=y<=3600)
但是不要求使 p(xi) = yi ,而只要 p(xi) yi 总体上尽可能小。这种构
造近似函数p(x) 的方法称为曲线拟合法, p(x) 称为拟合函数。
插值与拟合的相同点
都需要根据已知离散数据构造函数。 x x1 x2 … xm y y1 y2 … ym
求一个简单易算的近似函数 p(x) f (x) 。
而只要 p(xi) yi 总体上 尽可能小
2、求曲线拟合函数的标准
(1)用各点误差绝
m
对值的和表示
R p(x ) y
1
i
i
i1
max (2)用各点误差按 绝对值的最大值表示
R
p(x ) y
i
i
1im
m
(3)用各点误差的 R ( p(x ) y )2
修正的复相关系数平方,越接近1越好
Adjusted R-square
下列公式中的m为拟合函数中待估参数 个数,如:对一元一次多项式拟合,f(x) = a + bx,此时m=2,n为数据点个数。 该修正类似修正的样本方差使其为总体 方差的无偏估计。
RMSE
The root mean squared error. A value closer to 0 indicates a better fit.