2013年数学建模数据拟合方法
数学建模中的数据处理方法(非常全)
二维插值
在一个长为5个单位,宽为3个单位的金属薄 片上测得15个点的温度值,试求出此薄片的 温度分布,并绘出等温线图。(数据如下表)
yi xi
1
2
3
4
5
1
82
81
80
82
84
2
79
63
61
65
87
3
84
84
82
85
86
二维插值(px_lc21.m)
temps=[82,81,80,82,84;79,63,61,65,87;84,84,82,85,8 6];
微分方程数值解(单摆问题)
再编函数文件(danbai.m) function xdot=danbai(t,x) xdot=zeros(2,1); xdot(1)=x(2);xdot(2)=-9.8/25*sin(x(1));
微分方程数值解(单摆问题)
在命令窗口键入() [t,x]=ode45(‘danbai’,[0:0.1:20],[0.174
想得到更理想的结果,我们可以自己设计 解决问题的方法。(可以编写辛普森数值 计算公式的程序,或用拟合的方法求出被 积函数,再利用MATLAB的命令 quad,quad8)
数值微分
已知20世纪美国人口统计数据如下,根据 数据计算人口增长率。(其实还可以对于 后十年人口进行预测)
年份
人口× 106
微分方程数值解单摆问题二次规划线性规划有约束极小问题fvallinprogfaba1b1lbub线性规划有约束极小问题线性规划有约束极小问题线性规划有约束极小问题把问题极小化并将约束标准化线性规划有约束极小问题z145714最大
【数学建模中的数据处理方法】
数学建模线性拟合与非线性拟合
数学实验与数学建模实验报告学院:南通大学理学院班级:信计111学号:姓名:实验名称:线性拟合与非线性拟合指导教师:填写日期:2013年11月5日实验五线性拟合与非线性拟合一、实验指导解读本实验的主要目的是了解迭代法,研究迭代数列的收敛性,学习线性方程组的求解以学习非线性方程组的求解。
本次实验是通过两个变量的多组记录数据利用最小二乘法寻求两个变量之间的函数关系。
两个变量之间的函数关系主要有两种:一是线性关系(一次函数);二是非线性关系(非一次的其它一元函数)。
因此本实验做两件事:一是线性拟合(习题1);二是非线性拟合(习题2)。
习题2是用多项式函数、指数函数、双曲函数等初等函数以及分段函数拟合。
二、实验基本方法与理论:(习题1)线性拟合修改、补充程序要说明拟合效果,主要从形(大多数散点是否在拟合曲线上或附近)与量(残差是否小)!计算残差的程序:假设对两个变量的多组记录数据已有程序biao={{x1,y1},{x2,y2},…,{xn,yn}}并且通过Fit得到线性拟合函数y=ax+b我们可以先定义函数(程序)f[x_]:=a*x+b再给出计算残差的程序dareta=Sum[(biao[[i ,2]]-f[biao[[i ,1]]])^2,{i ,1, n}]程序说明:biao[[i]]是提取表biao的第i行,即{xi,yi}biao[[i ,1]] 是提取表biao的第i行的第一个数, 即xibiao[[i ,2]] 是提取表biao的第i行的第一个数, 即yibiao[[i ,2]]-f[biao[[i ,1]]] 即yi-(a*xi+b)(习题2)非线性拟合修改、补充程序要说明拟合效果,主要从形(大多数散点是否在拟合曲线上或附近)与量(残差是否小)!计算残差的程序:假设对两个变量的多组记录数据已有程序biao={{x1,y1},{x2,y2},…,{xn,yn}}并且通过Fit得到非线性拟合函数y=f(x)我们可以先定义函数(程序)f[x_]:=再给出计算残差的程序dareta=Sum[(biao[[i ,2]]-f[biao[[i ,1]]])^2,{i ,1, n}]程序说明:biao[[i]]是提取表biao的第i行,即{xi,yi}biao[[i ,1]] 是提取表biao的第i行的第一个数, 即xibiao[[i ,2]] 是提取表biao的第i行的第一个数, 即yibiao[[i ,2]]-f[biao[[i ,1]]] 即yi-f(xi)三、实验的整体思路(1)对数据线性拟合1、先对习题1的十组数据线性拟合,并从形与量看拟合效果;2、对习题1的十组数据中的9组数据线性拟合,并从形与量看拟合效果;3、对习题1的十组数据中的6组数据线性拟合,并从形与量看拟合效果。
数学建模之数据拟合
迭代初值
注意其中fun的定义和前两个函数不同!
25
例2 已知数据表
x y 0.02 76 0.02 47 0.06 97 0.06 107 0.11 123 0.11 139 0.22 159 0.22 152 0.56 191 0.56 201 1.1 207 1.1 200
初值
已知数据点
22
2. nlinfit(了解)
nlinfit()实际上是非线性回归函数,因此可以方便的求解最 小二乘问题,其应用格式为 x = nlinfit (xdata, ydata,‘fun’,x0); 和函数lsqcurvefit()相类似,只是参数的调用顺序不同。
23
3. lsqnonlin(了解)
已知数据点:xdata=(xdata1, xdata2, …, xdatan) ydata=(ydata1, ydata2, …, ydatan) lsqnonlin用以求含参量x(向量)的向量值函数 f(x)=(f1(x), f2(x), …, fn(x))T 中的参量x,使得
T 2 2 2 f ( x ) f ( x ) f ( x ) f ( x ) f ( x ) 1 2 n
1)输入以下命令: x=0:0.1:1;
y=[-0.447 1.978 3.28 6.16 7.08 7.34 7.66 9.56 9.48 9.30 11.2];
R=[(x.^2) ' x' ones(11,1)]; a=R\y' 2)计算结果: a = -9.8108
MATLAB(zxec1)
20.1293 -0.0317
下面我们看一下插值和拟合的异同: MATLAB(cn)
7
数学建模十大经典算法( 数学建模必备资料)
建模十大经典算法1、蒙特卡罗算法。
该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时通过模拟可以来检验自己模型的正确性。
2、数据拟合、参数估计、插值等数据处理算法。
比赛中通常会遇到大量的数据需要处理,而处理数据的关键就在于这些算法,通常使用Matlab作为工具。
3、线性规划、整数规划、多元规划、二次规划等规划类问题。
建模竞赛大多数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通常使用Lindo、Lingo、MATLAB软件实现。
4、图论算法。
这类算法可以分为很多种,包括最短路、网络流、二分图等算法,涉及到图论的问题可以用这些方法解决,需要认真准备。
5、动态规划、回溯搜索、分治算法、分支定界等计算机算法。
这些算法是算法设计中比较常用的方法,很多场合可以用到竞赛中。
6、最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法。
这些问题是用来解决一些较困难的最优化问题的算法,对于有些问题非常有帮助,但是算法的实现比较困难,需慎重使用。
7、网格算法和穷举法。
网格算法和穷举法都是暴力搜索最优点的算法,在很多竞赛题中有应用,当重点讨论模型本身而轻视算法的时候,可以使用这种暴力方案,最好使用一些高级语言作为编程工具。
8、一些连续离散化方法。
很多问题都是实际来的,数据可以是连续的,而计算机只认的是离散的数据,因此将其离散化后进行差分代替微分、求和代替积分等思想是非常重要的。
9、数值分析算法。
如果在比赛中采用高级语言进行编程的话,那一些数值分析中常用的算法比如方程组求解、矩阵运算、函数积分等算法就需要额外编写库函数进行调用。
10、图象处理算法。
赛题中有一类问题与图形有关,即使与图形无关,论文中也应该要不乏图片的,这些图形如何展示以及如何处理就是需要解决的问题,通常使用Matlab进行处理。
历年全国数学建模试题及解法赛题解法93A非线性交调的频率设计拟合、规划93B足球队排名图论、层次分析、整数规划94A逢山开路图论、插值、动态规划94B锁具装箱问题图论、组合数学95A飞行管理问题非线性规划、线性规划95B天车与冶炼炉的作业调度动态规划、排队论、图论96A最优捕鱼策略微分方程、优化96B节水洗衣机非线性规划97A零件的参数设计非线性规划97B截断切割的最优排列随机模拟、图论98A一类投资组合问题多目标优化、非线性规划98B灾情巡视的最佳路线图论、组合优化99A自动化车床管理随机优化、计算机模拟99B钻井布局0-1规划、图论00A DNA序列分类模式识别、Fisher判别、人工神经网络00B钢管订购和运输组合优化、运输问题01A血管三维重建曲线拟合、曲面重建01B 公交车调度问题多目标规划02A车灯线光源的优化非线性规划02B彩票问题单目标决策03A SARS的传播微分方程、差分方程03B 露天矿生产的车辆安排整数规划、运输问题04A奥运会临时超市网点设计统计分析、数据处理、优化04B电力市场的输电阻塞管理数据拟合、优化05A长江水质的评价和预测预测评价、数据处理05B DVD在线租赁随机规划、整数规划06A 出版资源配置06B 艾滋病疗法的评价及疗效的预测 07A 中国人口增长预测 07B 乘公交,看奥运 多目标规划 数据处理 图论 08A 数码相机定位 08B 高等教育学费标准探讨09A 制动器试验台的控制方法分析 09B 眼科病床的合理安排 动态规划 10A 10B赛题发展的特点:1.对选手的计算机能力提出了更高的要求:赛题的解决依赖计算机,题目的数据较多,手工计算不能完成,如03B ,某些问题需要使用计算机软件,01A 。
§4.常见的数学建模方法(1)---数据拟合(曲线拟合)法
实例. 找出基于下列数据的美国马萨诸塞州生产量、劳动力和投资之间变化的经
济增长模型(道格拉斯 Douglas 生产函数模型 )
实例 3. 某研究所为了研究三种肥料氮, 磷, 钾对于土豆和生菜的作
用, 分别对每种作物进行了三组试验. 实验数据如下列表格所示, 其 中 ha 表示公顷 , t 表示吨 , kg 表示千克. 试建立反映施肥量与产量 关系的数学模型. 氮施肥量(公斤/公顷)与土豆产量(吨/公顷)关系的实验数据
4
组数据应服 从的数学模型,如记 l - 1000 = l’ , l0 – 1000 = b, al0 = k , 则有 l’ = b + kt . 可以算得:
t 42.5,
2 ' t 8100 , l i i 1
4
(l 1000)
i 1
4
0.705,
' t l i i 34.6 i 1
§4. 常见的数学建模方法(1) --- 数据拟合(曲线拟合)法
在建立数学模型时,实际问题有时仅给出一组数据. 处理这类问题的 较简单易行的方法是通过数据拟合法求得 “最佳” 的近似函数式 --经验公式. 从几何上看就是找一条 “最佳” 的曲线, 使之和给定的 数 ( 1)决定经验公式的形式 . 根据所描绘的系统固有的特点 ,参照 据点靠得最近 , 即进行曲线拟合 . 根据一组数据来确定其经验公式 , 已知数据的图形和特点或者它应服从的规律来决定经验公式的形式 . 一般可 分为三步进行: 这一步是关键的一步. (2)决定经验公式中的待定参数 . 一般可用线性情况下的最小二 乘法 .它误差较小,适用于测定数据比较精确的情况.在使用最小二 乘法 时,如遇到数学模型是非线性经验公式时其中参数的待定,通
2013数学建模D题
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): D我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名):1.2.3.指导教师或指导教师组负责人(打印并签名):平日期:2013年9月16日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):公共自行车服务系统的统计分析摘要本文研究的是有关公共自行车服务系统的统计分析,包括站点设置和锁桩数量的配置问题。
对于该题中的问题我们转化为数学中的数据统计与图像,利用Excel、matlab软件对数据进行处理。
分别得到本题中的五个问题。
对与问题一:首先要进行总体样本数据统计,利用Excel软件进行数据统计,找出所需要的重要数据,将其按照问题所需进行运算分析。
第一、用Excel统计各站点20天中每天以及累计的借车频次和还车频次。
第二、对所有站点按照累计的借车频次和还车频次分别给它们排序。
第三、在Excel中汇总出每次用车时长的数据,随即将数据导入matlab中,通过matlab 处理去除奇异数据,并做出图像。
第四、通过该图得出用车时长最长的时段数据,拟合出函数分布,并判断实际观察的属性类别分配是否符合已知属性类别分配理论。
第五、检测观察数与理论数之间的一致性,通过检测真实数据与理论数据间的一致性来判定事物之间的独立性。
数学建模中的参数拟合方法
数学建模中的参数拟合方法数学建模是研究实际问题时运用数学方法建立模型,分析和预测问题的一种方法。
在建立模型的过程中,参数拟合是非常重要的一环。
所谓参数拟合,就是通过已知数据来推算模型中的未知参数,使模型更加精准地描述现实情况。
本文将介绍数学建模中常用的参数拟合方法。
一、最小二乘法最小二乘法是一种常用的线性和非线性回归方法。
该方法通过最小化误差的平方和来估计模型参数。
同时该方法的优点在于可以使用简单的数学公式解决问题。
最小二乘法的基本思想可以简单地表示如下:对于给定的数据集合,设其对应的观测值集合为y,$y_1,y_2,...,y_n$,对应的自变量集合为x,$x_1,x_2,...,x_n$,则目标是找到一组系数使得拟合曲线最接近实际数据点。
通常拟合曲线可以用如下所示的线性方程表示:$$f(x)=a_0+a_1x+a_2x^2+...+a_kx^k$$其中,k为拟合曲线的阶数,$a_i$表示第i个系数。
最小二乘法的目标即为找到一组系数${a_0,a_1,...,a_k}$,使得曲线拟合残差平方和最小:$$S=\sum_{i=1}^{n}(y_i-f(x_i))^2$$则称此时求得的拟合数学模型为最小二乘拟合模型。
最小二乘法在实际问题中应用广泛,如线性回归分析、非线性回归分析、多项式拟合、模拟建模等领域。
对于非线性模型,最小二乘法的数学公式比较复杂,需要使用计算机编程实现。
二、梯度下降法梯度下降法是一种优化算法,通过求解函数的导数,从而找到函数的最小值点。
在数学建模中,梯度下降法可以用于非线性回归分析,最小化误差函数。
梯度下降法的基本思想为:在小区间范围内,将函数$f(x)$视为线性的,取其一阶泰勒展开式,在此基础上进行优化。
由于$f(x)$的导数表示$f(x)$函数值增大最快的方向,因此梯度下降法可以通过调整参数的值,逐渐朝向函数的最小值点移动。
具体地,对于给定的数据集合,设其对应的观测值集合为y,$y_1,y_2,...,y_n$,对应的自变量集合为x,$x_1,x_2,...,x_n$,则目标是找到一组系数使得拟合曲线最接近实际数据点。
数学建模中常见的十大模型
数学建模中常见的十大模型集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#数学建模常用的十大算法==转(2011-07-24 16:13:14)1. 蒙特卡罗算法。
该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟来检验自己模型的正确性,几乎是比赛时必用的方法。
2. 数据拟合、参数估计、插值等数据处理算法。
比赛中通常会遇到大量的数据需要处理,而处理数据的关键就在于这些算法,通常使用MATLAB 作为工具。
3. 线性规划、整数规划、多元规划、二次规划等规划类算法。
建模竞赛大多数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通常使用Lindo、Lingo 软件求解。
4. 图论算法。
这类算法可以分为很多种,包括最短路、网络流、二分图等算法,涉及到图论的问题可以用这些方法解决,需要认真准备。
5. 动态规划、回溯搜索、分治算法、分支定界等计算机算法。
这些算法是算法设计中比较常用的方法,竞赛中很多场合会用到。
6. 最优化理论的三大非经典算法:模拟退火算法、神经网络算法、遗传算法。
这些问题是用来解决一些较困难的最优化问题的,对于有些问题非常有帮助,但是算法的实现比较困难,需慎重使用。
7. 网格算法和穷举法。
两者都是暴力搜索最优点的算法,在很多竞赛题中有应用,当重点讨论模型本身而轻视算法的时候,可以使用这种暴力方案,最好使用一些高级语言作为编程工具。
8. 一些连续数据离散化方法。
很多问题都是实际来的,数据可以是连续的,而计算机只能处理离散的数据,因此将其离散化后进行差分代替微分、求和代替积分等思想是非常重要的。
9. 数值分析算法。
如果在比赛中采用高级语言进行编程的话,那些数值分析中常用的算法比如方程组求解、矩阵运算、函数积分等算法就需要额外编写库函数进行调用。
10. 图象处理算法。
赛题中有一类问题与图形有关,即使问题与图形无关,论文中也会需要图片来说明问题,这些图形如何展示以及如何处理就是需要解决的问题,通常使用MATLAB 进行处理。
数学建模大赛C题
承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。
如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): C我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):石家庄职业技术学院参赛队员(打印并签名) :1.魏鹏飞2.邢磊3.刘力恒指导教师或指导教师组负责人(打印并签名):陈佩宁(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。
以上内容请仔细核对,提交后将不再允许做任何修改。
如填写错误,论文可能被取消评奖资格。
)日期:2013年9月16日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国评阅编号(由全国组委会评阅前进行编号):C题:古塔的变形摘要古塔由于长时间承受自重、气温、风力等各种作用,偶然还要受地震、飓风的影响,古塔会产生各种变形,诸如倾斜、弯曲、扭曲等。
为保护古塔,文物部门需适时对古塔进行观测,了解各种变形量,以制定必要的保护措施。
对于第一个问题,求中心点坐标,采用的是均值法,由于前两次测量中第13层第5个点没有数据,要是采用均值法求中心坐标,会产生较大的误差,所以在求第13层中心坐标,采用的是拟合法。
数学建模曲线的拟合
0 3.19
0.1 3.22
0.2 3.26
0.3 3.25
0.4 3.23
0.5 3.19
0.6 3.20
0.7 3.13
0.8 3.06
0.9 2.98
程序设计: 程序设计: x0=[0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9]; y0=[3.19 3.22 3.26 3.25 3.23 3.19 3.20 3.13 3.06 2.98]; a=polyfit(x0,y0,2) %二次多项式为拟合函数 二次多项式为拟合函数 x=0:0.1:0.9; y=polyval(a,x); %计算拟合多项式在 的值 计算拟合多项式在x的值 计算拟合多项式在 plot(x0,y0,'*',x,y)
有时候,问题本身不要求构造的函数过所有的节点。 有时候,问题本身不要求构造的函数过所有的节点。 个风景点, 使得S为直线 如:5个风景点,要修一条公路 使得 为直线,且到所有风景点的 个风景点 要修一条公路S使得 为直线, 距离和最小。 距离和最小。
二、常见的解决做法
总体上尽可能小 尽可能小” “p(xi) − yi 总体上尽可能小”,有不同的准则
显然, 要设计给药方案, 显然, 要设计给药方案, 必须知道给药后血药浓度随时间变化的 规律. 为此, 实验和理论两方面着手 在实验方面, 两方面着手. 规律. 为此, 从实验和理论两方面着手. 在实验方面, 对某人用 快速静脉注射方式一次注入该药物300mg 300mg后 (小 快速静脉注射方式一次注入该药物300mg后, 在一定时刻 t (小 采集血样, 测得血药浓度c. 如表: 血药浓度c(t) 时)采集血样, 测得血药浓度c. 如表: 血药浓度c(t) 的测试数 据
数学建模-拟合模型
y 2.33e
2
Q 0.7437
结论
1. Q1 = 0.2915 < 0.7437 = Q2. 线性模型更适合中国人口的增长。 2. 预报:1999年12.55亿,13.43亿 3. 人口白皮书: 2005年13.3亿, 2010年14亿 模型 I 2005年13.43亿,2010年14.16亿 模型II 14.94亿, 16.33亿
2 1i
l11b1 l12b2 l1y l21b1 l22b2 i x2i )b 2i ˆ2 x2i yi 1
模型:y = a+b1x1+b2x2, 数据:yi a b1x1i b2 x2i i y Ab , A (1, X ) T T 精度:Q ( y Ab ) ( y Ab )
1 n 1 n x xi , y yi n i 1 n i 1
l xy ( xi x )( yi y ) l xx ( xi x ) 2
i 1
n
参数估计
可以算出:a = – 1.93, b = 0.146 模型:y = – 1.93 + 0.146 x
2. 线性最小二乘法
模型:y = a, 数据: yi a i , i 1,, n 精度:Q
2 i
( yi a)2
2 2 ( y 2 y a a i i )
yi2 2( yi )a na2
1 估计: a ˆ yi y n
2 2
U b l xx U Q r 1 l yy l yy l xxl yy Q U l yy
数学建模插值及拟合详解
插值和拟合实验目的:了解数值分析建模的方法,掌握用Matlab进行曲线拟合的方法,理解用插值法建模的思想,运用Matlab一些命令及编程实现插值建模。
实验要求:理解曲线拟合和插值方法的思想,熟悉Matlab相关的命令,完成相应的练习,并将操作过程、程序及结果记录下来。
实验内容:一、插值1.插值的基本思想·已知有n +1个节点(xj,yj),j = 0,1,…, n,其中xj互不相同,节点(xj, yj)可看成由某个函数y= f (x)产生;·构造一个相对简单的函数y=P(x);·使P通过全部节点,即P (xk) = yk,k=0,1,…, n ;·用P (x)作为函数f ( x )的近似。
2.用MA TLAB作一维插值计算yi=interp1(x,y,xi,'method')注:yi—xi处的插值结果;x,y—插值节点;xi—被插值点;method—插值方法(‘nearest’:最邻近插值;‘linear’:线性插值;‘spline’:三次样条插值;‘cubic’:立方插值;缺省时:线性插值)。
注意:所有的插值方法都要求x是单调的,并且xi不能够超过x的范围。
练习1:机床加工问题每一刀只能沿x方向和y方向走非常小的一步。
表3-1给出了下轮廓线上的部分数据但工艺要求铣床沿x方向每次只能移动0.1单位.这时需求出当x坐标每改变0.1单位时的y坐标。
试完成加工所需的数据,画出曲线.步骤1:用x0,y0两向量表示插值节点;步骤2:被插值点x=0:0.1:15; y=y=interp1(x0,y0,x,'spline');步骤3:plot(x0,y0,'k+',x,y,'r')grid on答:x0=[0 3 5 7 9 11 12 13 14 15 ];y0=[0 1.2 1.7 2.0 2.1 2.0 1.8 1.2 1.0 1.6 ];x=0:0.1:15;y=interp1(x0,y0,x,'spline');plot(x0,y0,'k+',x,y,'r')grid on3.用MA TLAB作网格节点数据的插值(二维) z=inte rp2(x0,y0,z0,x,y,’method’)注:z—被插点值的函数值;x0,y0,z0—插值节点;x,y—被插值点;method—插值方法(‘nearest’:最邻近插值;‘linear’:双线性插值;‘cubic’:双三次插值;缺省时:双线性插值)。
2013年全国数学建模B题一等奖论文
(由由由由由由)第十届华为杯全国研究生数学建模竞参学校南京师范大学参参队号103190031.佟德宇队员姓名2.顾燕3.贾泽慧(由由由由由由)第十届华为杯全国研究生数学建模竞参题 目 功率放大器非线性特性及预失真建模摘 要针对问题一中求解输入输出信号之间的非线性功放特性函数问题, 采用了不同的多项式函数, 运用最小二乘法或正则化后的最小二乘法进行拟合求解. 并用参数NMSE 来评价所建模型的准确度. 结果发现在逼近函数选为函数基的情况下, 采用正则化后的最小二乘法得出的模型准确度最好, 其对应的参数NMSE=-68.6294.同时考虑计算量和模型准确度, 在由多项式变形函数逼近功放的模型基础上, 来进行预失真模型的建立. 根据题中给出的原则和约束, 可知预失真模型的表达式与功放模型的表达式是类似的, 从而可建立相应的预失真模型.:-11()()()K k k k z t h x t x t ==∑K=4时, 整体模型的放大倍数g=1.8693, 参数NMSE=-32.5819, EVM=2.3491; K=5时, g=1.8473, 参数NMSE=-37.1398, EVM=1.3900; K=7时, g=1.8326, 参数NMSE=-46.0624, EVM=0.4976.针对问题二, 直接将功放的输入输出与题目中所提的“和记忆多项式”模型进行拟合, 运用正则化后的最小二乘法进行求解, 这很好的保证了模型的可解性. 本题只考虑功放模型次数为5的情形. 当记忆深度为7时, 得NMSE=-45.8394; 当记忆深度为3时, 得NMSE=-44.5315. 预失真模型的建立与问题一类似, 文中以框图的方式建立了预失真处理的模型实现示意图, 并对次数为5、记忆深度为3的情形, 求解出整体模型的放大倍数g=9.4908, 参数NMSE=-37.8368, EVM=0.0128.针对问题三, 将所给的离散的、有限的输入输出数据作为随机过程的样本函数,通过其傅立叶变换得到功率谱参度函数. 文中分别给出了输入信号、无预失真补偿的功率放大器输出信号、采用预失真补偿的功率放大器输出信号的功率谱参度图形. 可解出它们的ACPR 分别为-155.6610、-74.3340、-104.4904, 最后对结果进行分析评价, 得出采用预失真补偿的功率放大器的输出信号效果比无预失真补偿的效果好. 关键字:最小二乘法、Tikhonov正则化、Fourier变换一、问题重述信号的功率放大是电子通信系统的关键功能之一, 其实现模块称为功率放大器( PA, Power Amplifier), 简称功放. 功放的输出信号相对于输入信号可能产生非线性变形, 这将带来无益的干扰信号, 影响信信息的正确传递和接收, 此现象称为非线性失真.功放非线性属于有源电子器件的固有特性, 研究其机理并采取措施改善, 具有重要意义. 目前已经提出了各种技术来克服功放的非线性失真, 其中预失真技术是被研究的较多的一项技术, 其最新的研究成果已经被运用于实际的产品中, 但在新算法、实现复杂度、计算速度、效果精度等方面仍有相当的研究价值.预失真的基本原理是:在功放前设置一个预失真处理模块, 这两个模块的合成总效果使整体输入-输出特性线性化, 输出功率得到充分利用.文中给出了NMSE 、EVM 等参数评价所建模型其准确度, 以及ACPR 表示信道的带外失真的参数.根据数据文件中给出的某功放无记忆效应、有记忆效应的复输入输出测试数据:(1)我们建立此功放的非线性数学模型()G ⋅, 并用NMSE 来评价所建模型的准确度.(2)根据线性化原则以及“输出幅度限制”和“功率最大化”约束, 计算线性化后最大可能的幅度放大倍数, 建立预失真模型. 并运用评价指标参数NMSE/EVM 评价预失真补偿的计算结果.(3)应用问题二中所给的数据, 计算功放预失真补偿前后的功率谱参度(输入信号、无预失真补偿的功率放大器输出信号、采用预失真补偿的功率放大器输出信号), 并用图形的方式表示了这三类信号的功率谱参度. 最后用相邻信道功率比ACPR 对结果进行分析.二、模型假设1、假设题中所给的功放输入输出数据采样误差为0.2、假设题中所给的功放输入输出数据具有代表性、一般性.3、假设存在这样的预失真处理器, 能够做到将输入数据变为模型求解所得的预失真 处理输出结果.三、基本知识§3.1 最小二乘方法最小二乘方法[][]12产生于数据拟合问题, 它是一种基于观测数据与模型数据之间的差的平方和最小来估计数学模型中参数的方法. 输入数据t 与输出数据y 之间大致服从如下函数关系(,)y x t φ=,式中n x R ∈为待定参数. 为估计参数x 的值, 要先经过多次试验取得观测数据1122(,),(,),,(,)m m t y t y t y , 然后基于模型输出值和实际观测值的误差平方和21((,))m i ii y x t φ=−∑最小来求参数x 的值, 这就是最小二乘问题. 一般地, m n .引入函数()(,), 1,2,,i i i r x y x t i m φ=−= ,并记12()((), (), , ())m r x r x r x r x = ,则最小二乘问题即为n min ()()T x Rr x r x ∈. 如果最小二乘问题中的模型函数估计准确, 那么最小二乘问题的最优值是很靠近零的. 因此()r x 常称作残量函数.对于线性最小二乘问题, 残量函数可以表示为()r x b Ax =−,从而线性最小二乘问题可以表示为2min n x R b Ax ∈−. (3.1.1) 若A 是列满秩的, 且考虑到二次凸函数的稳定点即为最小值点, 可以直接得到x 的求解公式, 即()1T T x A A A b −=. (3.1.2) 而对于复数域上的线性最小二乘问题n 2min x C b Ax ∈−, 也可以直接得到x 的求解公式, 即为()-1T x A A A b =, (3.1.3) 其中, T A 表示A 的共轭转置.§3.2 Tikhonov 正则化在使用最小二乘方法进行参数估计的时候, 由于A 不一定是列满秩的, 故T A A 不一定是可逆的, 此时就不能够用上面所推得的公式进行直接的求解了. 为了克服这个困难,考虑Tikhonov 正则化[]3方法, 即给目标函数加上一个正则项(即一个邻近项)2k k x x λ−.此时, 最小二乘问题转化为n 221min +k k k x C x b Ax x x λ+∈=−−.其中k x 是第k 步迭代得到的解, k λ可以选为一个常数或一个单调下降趋于0的数列. 迭代的终止准则为1k k x x ε+−≤,其中ε是一个给定的误差上界.考虑到二次凸函数的稳定点即为最小值点, 这时问题22min n k k x C b Ax x x λ∈−+− 是可以直接求解的, 给出x 的求解公式为()()1T k k k x A A I A b x λλ−=++.显然, 此时即使A 非列满秩, 问题也是可以求解的.四、问题分析问题一题中已给出了某功放无记忆效应的复输入输出测试数据, 现需要建立此功放的非线性特性数学模型, 拟合出功放的特性函数()G⋅. 根据函数逼近理论, 功放的特性函数可以用多项式来表示, 也可以用空间中的一由正交函数基来表示. 然后采用最小二乘法或正则化后的最小二乘法, 将这些情况都进行求解, 得出功放的特性函数()G⋅. 并在最后用参数NMSE(归一化均方误差)来评价所建模型的准确度.接着, 在前面所建模型的基础上, 选择一个计算量适当, 且准确度较好的()G⋅的一个拟合模型. 然后根据线性化原则以及“输出幅度限制”和“功率最大化”约束, 建立预失真模型, 使得整体模型线性化后放大倍数尽可能的大. 通过对优化模型的分析可知, 对预失真特性函数()F⋅的求解可以转化为对1Gg−⎛⎞⎜⎟⎝⎠的求解, 且预失真模型的表达式与功放模型的表达式是类似的. 在求解1Gg−⎛⎞⎜⎟⎝⎠时, 可以对求解所用模型的次数进行不同的选取,分别得出整体模型的g和NMSE、EVM的值, 用来评价预失真补偿的结果.问题二题中已给出了某功放有记忆效应的复输入输出测试数据, 现需要建立此功放的非线性特性数学模型, 拟合出功放的特性函数()G⋅. 根据函数逼近理论, 本文直接将功放的输入输出与题目中所提的“和记忆多项式”模型来进行拟合, 在使用最小二乘方法求解时, 我们对目标函数加了一个正则项, 以保证求解的可实现性.预失真处理器模型的建立与问题一类似, 且给出了以框图的方式建立的预失真处理的模型实现示意图.问题三问题二中所给的输入输出数据是离散的、有限的, 在这种情况下计算功率谱参度的函数可以用自相关函数法或对随机过程{}()x t的样本函数作傅立叶变换得到, 文中采取第二种方法来求解.五、模型建立与求解§5.1 问题一的模型与求解§5.1.1 无记忆功放的特性函数()G⋅模型建立文章中已给出某功放无记忆效应的复输入输出测试数据, 这些数据是对功放输入)(tx/输出)(t z进行离散采样后得到的, 它们的值为分别为()x n/()z n(采样过程符合Nyquist采样定理要求).对于问题一, 根据文章中所给的某功放无记忆效应的复输入输出测试数据, 首先需要建立此功放的非线性特性数学模型, 拟合出功放的特性函数()G⋅. 根据函数逼近理论,可以采用1、多项式的形式2、多项式的变形的形式3、空间中的一由正交函数基的线性由合来表示4、正则化下, 空间中的一由正交函数基的线性由合来表示下面将这些情况都进行建模, 来拟合功放的特性函数()G ⋅, 并在最后进行比较选择优者.所求得的模型的数值计算结果业界常用NMSE 、EVM 等参数评价其准确度, NMSE 的具体定义如下. 采用归一化均方误差 (Normalized Mean Square Error, NMSE) 来表征计算精度, 其表达式为211021ˆ|()()|NMSE 10log |()|N n N n z n z n z n ==−=∑∑ . (5.1.1) 如果用z 表示实际信号值, ˆz表示通过模型计算的信号值, NMSE 就反映了模型与实际模块的接近程度. 显然NMSE 的值越小, 模型的数值计算结果就越准确.误差矢量幅度 (Error Vector Magnitude, EVM)定义为误差矢量信号平均功率的均方根和参照信号平均功率的均方根的比值, 以百分数形式表示. 如果用X 表示理想的信号输出值, e 表示理想输出与整体模型输出信号的误差, 可用EVM 衡量整体模型对信号的幅度失真程度:EVM 100%= . (5.1.2)模型一 多项式的形式首先根据函数逼近的Weierstrass 定理, 对解析函数采用简单的多项式来表示, 可表示为∑==Kk k k t x h t z 1)()(. (5.1.3)因为此时是要将观测数据与形式已经固定的函数(5.1.3)进行拟合, 而目的是求解该函数的各项系数, 所以该问题其实就是最简单的线性最小二乘问题.模型建立()n 211min ()N K k k h C n k z n h x n ∈==−∑∑, (5.1.4) 其中, ()x n 和()z n 为文章中所给的输入和输出测试数据, 这些数据是对功放输入()x t 、输出()z t 进行离散采样后得到的(采样过程符合Nyquist 采样定理要求),N 为功放输入输出数据的总个数.将问题(5.1.4)与( 3.1.1)进行对应, 由( 3.1.3)可以直接得到系数的表达式为()-1T h A A A z = 其中232323 (1) (1) (1) (1) (2) (2) (2) (2) () () () ()K K K x x x x x x x x A x N x N x N x N ⎡⎤…⎢⎥…⎢⎥=⎢⎥⎢⎥⎢…⎥⎣⎦, ()12,,,TK h h h h =…, ()()()()1,2,,Tz z z z N =….结果当3K =时, (见附录2.1.1)该表达式中的系数为123 2.908532278399690.060653883258900.213775998314930.43417026083854 0.198185637666730.27826757408010h ih i h i=−=−=+.根据模型一以及(5.1.1)式, 可以求出NMSE 的值如下:()NMSE 13.4414169873254 3k =−=.当5k =时, (见附录2.1.2 )表达式中的系数为12345 2.908037719327826 - 0.063527494375989i0.343519806629302 - 0.388942747664566i0.541211413428411 - 0.144422960285135i -0.399744749427209 - 0.558463329513045i-0.271952185146638 + 0.1205591h h h h h =====40060622i根据模型一以及(5.1.1)式, 可以求出NMSE 的值如下:()NMSE -21.544782705381238 5k ==.模型二 多项式的变形同时我们也考虑了多项式变形[]4的情形来对其进行表示, 其表示式为-11()()()K k k k z t h x t x t ==∑. (5.1.5)因为此时是要将观测数据与形式已经固定的函数(5.1.5)进行拟合, 而目的是求解该函数的各项系数, 所以该问题其实就是最简单的线性最小二乘问题.模型建立()n 2-111min ()()N K k k h C n k z n h x n x n ∈==−∑∑ (5.1.6)其中N 为所给功放输入输出数据的总个数, K 为表达式的次数. 将问题(5.1.6)与(3.1.1)进行对应, 由(3.1.3)可以直接得到系数的表达式为()-1T h A A A z = 其中212121(1) (1)(1) (1)(1) (1)(1)(2) (2)(2) (2)(2) (2)(2) () ()() ()() ()()K K K x x x x x x x x x x x x x x A x N x N x N x N x N x N x N −−−⎡⎤…⎢⎥⎢⎥…=⎢⎥⎢⎥⎢⎥…⎢⎥⎣⎦,()123,,,,TK h h h h h =…, ()()()()()1,2,3,,Tz z z z z N =…. 分别考虑当3k =, 5k =时, 该表达式的具体形式(即确定表达式的系数).结果当3k =时, (见附录2.1.3 )表达式中的系数为123 3.051183005392040.00000000000001 0.006071903393980.00000000000005 1.170159412626470.00000000000004h ih i h i=−=+=−−.根据上面所建立的模型以及(5.1.1)式, 可以求出NMSE 的值如下:()NMSE 29.7446547565428 3k =−=.当5k =时, (见附录2.1.4 )表达式中的系数为12345 2.967983597251020.00000000000080 0.309931644197600.00000000000873 0.153664636905190.00000000002804 3.424500445954250.00000000003458 2.208212395486470.00000000001446h ih ih i h ih i=−=+=−−=−+=−.根据上面所建立的模型以及(5.1.1)式, 可以求出NMSE 的值如下:()NMSE 45.379717608769994 5k =−=模型三 空间中的一由正交函数基的线性由合最后根据函数逼近理论, 可采用空间中的一由正交函数基[]4的线性由合来表示该特性函数(参考文献3中的方法), 其表达式为()z t h =Ψ, (5.1.7)其中正交矩阵12[() () ()]k x x x ψψψΨ= ,11()!()(1)(1)!(1)!()!kl l k k l k l x x x l l k l ψ−+=+=−−+−∑. 因为此时是要将观测数据与形式已经固定的函数(5.1.7)进行拟合, 而目的是求解该函数的各项系数, 所以该问题其实就是最简单的线性最小二乘问题.模型建立 n 2min h C z h ∈−Ψ (5.1.8) 其中()123,,,,TK h h h h h =…, ()()()()()1,2,3,,T z z z z z N =…, ()()()12[() ()()]k x n x n x n ψψψΨ= ,()()()11()!()(1)(1)!(1)!()!k l l kk l k l x n x n x n l l k l ψ−+=+=−−+−∑, N 为功放的输入输出数据的总个数. 将问题(5.1.8)与(3.1.1)进行对应, 由(3.1.3)可以直接得到系数的表达式为 ()-1T T h z =ΨΨΨ. 由于计算量较大, 我们选取7=k 来进行拟合, 得出表达式中的系数.结果(见附录2.1.5)当7=k 时, 表达式中的系数为12345 3.287412936081622-7.322701472967097-015-0.091488124421954-2.16460963736731-015-0.066219774105875 5.035305939565804-0160.038056322596937 2.726632938529483-0160.01014165858755-1.2h e ih e ih e ih e i h ===+=+=6758894247527231-016-0.005283612035716-2.653720342429833-016-0.001265433154276-1.923256069376669-016e ih e ih e i==.根据上面所建立的模型以及(5.1.1)式, 可以求出NMSE 的值如下:()NMSE -60.5675309366592 7k ==模型四 模型三正则化模型建立对于模型三, 由于所给的数据较多, 很难避免本文3.2节中所提到的T ΨΨ奇异的情况, 故对(5.1.8)再进行一个Tikhonov 正则化. 即对(5.1.8)加一个正则项2k k h h λ−.问题转变为()1221min K M k k k h C h z h h h λ⋅×+∈=−Ψ+−. (5.1.9) 其中k h 是第k 步迭代得到的解(计算机运行求解时是要给其赋一个初始值的), 而k λ可以选为一个常数或一个单调下降趋于0的数列. 而迭代的终止准则为1k k h h ε+−≤,其中ε是一个给定的误差上界.考虑到二次凸函数的稳定点即为最小值点, 问题(5.1.9)是可以直接求解的, 得到h 的求解公式为()()()1T Tk k k h I z n h λλ−=ΨΨ+Ψ+. (5.1.10)此处, 我们仍选取7=k 来进行拟合, 其中一些参数选取为800111, 1, 0.8, 10k k h i λλλε−+=+===.则可得出表达式(5.1.7)中的系数.结果(见附录2.1.6)123456 3.2873994140515280.000008426827987-0.0914922453118830.000002568107767-0.066218825186175-0.000000591359660.038056824724197-0.0000003129219510.010141412616440.000000153287355-0h ih ih ih i h ih =+=+===+=7.0052839775157310.000000227764411-0.0012655686759970.000000084456122ih i+=+根据上面所建立的模型以及(5.1.1)式, 可以求出NMSE 的值如下:()NMSE -68.6293523598994 7k ==模型一~模型四的总评价对四种模型下参数NMSE 的大小进行比较发现, 当选用一由正交函数基, 并运用正则化后的最小二乘方法来对功放特性函数进行拟合时(即模型四), NMSE 的值是最小的. 也就是说2121ˆ|()()||()|Nn Nn z n zn z n ==−∑∑在模型四下是最靠近0的, 故模型四是逼近效果最好的.但模型四的计算复杂度是很大, 由所得的NMSE 参数可发现模型二的计算精度也是不错的, 但其计算的复杂度比模型四要小很多, 故选择模型二来求解功放特性函数. 且在下面的无记忆功放模型的预失真处理建模中, 功放特性函数是由模型二得出的.§5.1.2四种模型的输入输出幅度比较图与评价下面将实际的与拟合的复输入输出幅度值进行作图, 以便更直观的看出模型的逼近效果.图5.1 模型一k=3实际与拟合功放输入/输出幅度散点图 图5.1模型一k=5实际与拟合功放输入/输出幅度散点图图5.3模型二k=3实际与拟合功放输入/输出幅度散点图 图5.4 模型二k=5实际与拟合功放输入/输出幅度散点图图5.5 模型三实际与拟合的功放输入/输出幅度散点图图5.6模型四实际与拟合的功放输入/输出幅度散点图根据观察比较发现, 当用正交的函数基或对其实行一个正则化(即模型三和模型四), 来对功放特性函数进行拟合的时候, 拟合情形的输入输出幅度散点图与实际的输入输出幅度散点图的逼近效果是最佳的.k=时, 其散点图的逼近效果也是很好的.同时可观察到但模型二中的次数5§5.1.3 预失真处理模型建立选定-11():()()()Kk k k G z n b x n x n =⋅=∑的阶数5K =, 通过上面的算法可以得到当F 取不同阶数的情况下, g, NMSE, EVM 的结果及图像表5.1 F 取不同阶数情况下g, NMSE, EVM 的结果F 的阶数Kg NMSE EVM 4 1.86932497973065-32.5819077399852 2.34911681195961% 5 1.84730161996524-37.1398119663279 1.38998272147897% 7 1.83264461869445-46.06241433950440.497598752653887%由表5.1的结果可以看出当F 的阶数越高时, 得到的g 的值越小(说明线性化后的幅度放大倍数越小), NMSE 、EVM 的值越小(说明模型的计算精度越高, 整体模型对信号的幅度失真程度越小).图5.7理想信号与所建模型得到的输出信号对比(K=4) 图5.8理想信号与所建模型得到的输出信号对比(K=5)图5.9理想信号与所建模型得到的输出信号对比(K=7)根据观察发现, 当K 的取值越大时, 所建模型的输入输出幅度散点图与理想的输入输出幅度散点图的逼近效果越好.§5.2 问题二的模型与求解§5.2.1 有记忆功放的特性函数()G ⋅模型建立对于问题二, 根据文章中所给的某功放有记忆效应的复输入输出测试数据, 首先需要建立此功放的非线性特性数学模型, 拟合出功放的特性函数()G ⋅. 此时功放不仅与此时刻输入有关, 而且与此前某一时间段的输入有关, 其可以由为101111022220212()()()(1)()()(1)()K Mk km M k m M z n h x n m h x n h x n h x n M h x n h x n h x n M ===−=+−++−++−++−+∑∑ 01 ()(1)()K K K K K KM h x n h x n h x n M ++−++− , 0,1,2,,n N = .式中M 表示记忆深度, km h 为系数. 具有记忆效应的功放模型也可以用更一般的V olterra级数[][]56表示, 由于V olterra 级数太复杂, 简化模型有Wiener 、Hammersteint 等[][]47. 由于常用复值输入-输出信号, 上式也可表示为便于计算的“和记忆多项式”模型-110()(-)|(-)|K Mk km k m z n h x n m x n m ===∑∑ 0,1,2,,n N = (5.2.1)模型建立本文采用“和记忆多项式”模型(5.2.1)式来进行拟合. 我们用最小二乘法来求解, 由于本问中所给的输入输出的数据个数非常大, 故现在选取其中的一部分来进行拟合, 求得功放过程的模型. 我们选取输入输出数据的次数n 为1M +的倍数的数据来进行拟合, 最小二乘公式即为()()12-1(1)|10min (-)|(-)|K M K Mk km h CM nk m n Nz n h x n m x n m ××∈+==≤−∑∑∑ (5.2.2) 其中N 是指所有的功放的输入数据总个数, K 表示所选模型的最高次数, M 表示记忆深度(本文在求解模型时是事先给定的), ()x n 是第n 个复输入值, ()z n 是第n 个复输出值, km h 为系数, ()102001222212,,,,,,,, ,,,,TK K M M KM h h h h h h h h h h =…………….由于所给的数据较多, 即便是选取了部分数据进行拟合,但仍很难避免3.2节中所提到的A A 奇异的情况, 故对(5.2.2)再进行一个Tikhonov 正则化. 即对(5.2.2)加一个正则项2k k h h λ−,则问题转变为()()122-11(1)|10min (-)|(-)|K M K Mk k km k k h CM nk m n Nh z n h x n m x n m h h λ××+∈+==≤=−+−∑∑∑ (5.2.3) 其中k h 是第k 步迭代得到的解, 而k λ可以选为一个常数或一个单调下降趋于0的数列. 而迭代的终止准则为1k k h h ε+−≤,其中ε是一个给定的误差上界.当给定一个记忆深度M 后, 我们可以将问题(5.2.3)化成如下形式的问题, 即()22min nk k h Cz n Ah h h λ∈−+− (5.2.4) 其中A 是一个()()()()/11N M K M +×⋅+的复矩阵, 即1111(1) (1)(1) (1)(1) (1) (1)(1) (22) (22)(22) (22)(22) (2) (1)(1) K K K K x M x M x M x M x M x x x x M x M x M x M x M x M x x A −−−−+++++++++++=……………… ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦而()102001121112,,,,,,,, ,,,,TK K M M KM h h h h h h h h h h =…………….考虑到二次凸函数的稳定点即为最小值点, 问题(5.2.4)是可以直接求解的, h 的求解公式为()()()1Tk kk h A A I A z n h λλ−=++. (5.2.5)本题中已给出有记忆功放输入输出数据的总个数为73920N =, 并分别取 87, 5, 10M K ε−===和 83, 5, 10M K ε−===这两种情况. 这样就可以根据(5.2.5)求得h .结果(见附录2.2.1、2.2.2)当7,5M K ==时, 由于系数共有40个, 即h 是一个401×的大向量, 故将该结果放到附录中. 再根据上面所建立的模型及(5.1.1)式, 求出该模型的NMSE 值如下:NMSE -45.839408840847 7,5M K ===.当3,5M K ==时, 由于系数共有20个, 即h 是一个201×的大向量, 故将该结果放到附录中. 再根据上面所建立的模型及(5.1.1)式, 求出该模型的NMSE 值如下:NMSE 44.5315001961471 3,5M K =−==.§5.2.2有记忆功放模型的输入输出幅度图下面将实际与拟合的复输入输出幅度进行作图, 以便更直观的看出模型的逼近效果.图5.10 M=7实际与拟合功放输入/输出幅度散点图 图5.11 M=3实际与拟合功放输入/输出幅度散点图总评价根据观察比较发现, 尽管在用“和记忆多项式”模型进行拟合时, 我们只选取了一部分输入输出测量数据进行模型的建构. 但通过对上面两图的观察, 当对所有的输入测量数据进行作图时, 可发现拟合得到的输入输出幅度散点图与实际的输入输出幅度散点图的逼近效果还是很好的.§5.2.3 预失真处理模型建立上面已求得功放特性函数()G ⋅的模型, 采用“和记忆多项式”模型-110()(-)|(-)|K Mk kmk m z n hx n m x n m ===∑∑建立的功放模型. 下面建模的总体原则是使预失真和功放的联合模型呈线性后误差最小. 在此模型中, 有两个约束需要考虑:(1)输出幅度限制:即模型中的预失真处理的输出幅度不大于给出的功放输入幅度最大值.(2)功率最大化:即模型的建立必需考虑尽可能使功放的信号平均输出功率最大, 因此预失真处理后的输出幅度需尽可能提高.0≤下面我们将给出解决该优化问题的算法: 给定判断容限step1选定-110(): ()(-)|(-)|KMk km k m G z n h x n m x n m ==⋅=∑∑的阶数为5K =. 因数据量很大且算法较复杂, 本文对F 进行多次计算, 发现当阶数为5K =的时候与更高阶相比, 效果就已经很好了, 故下面只给出阶数为5K =时g, NMSE, EVM 的结果.本文取定记忆深度为 3M =, 现根据算法5.2可求得9.490829228013789g =,由于系数一共有20个, 即h 是一个201×的向量, 故将此结果放到附录中.根据上面所建模型以及(5.1.1)、(5.1.2)式, 可求出该模型的NMSE 、EVM 值如下:.NMSE -37.836849855461956EVM 0.012827957346961== 3,5M K ==由所得数据, 可以发现在该算法下, 得到的g 的值比较大(说明线性化后的幅度放大倍数大), NMSE 、EVM 的值较小(说明模型的计算精度越高, 整体模型对信号的幅度失真程度越小).图5.13 M=3, K=5实际与拟合功放输入/输出幅度散点图观察图5.13发现, 该情况下所建模型的输入输出幅度散点图与理想的输入输出幅度散点图逼近效果还是较好的. 故该模型是可行的.§5.3 问题三的模型与求解 §5.3.1背景知识功率谱的概念是针对功率有限信号的, 所表现的是单位频带内信号功率随频率的变化情况. 保留了频谱的幅度信息, 但是丢掉了相位信息, 所以频谱不同的信号其功率谱是可能相同的. 功率谱是随机过程的统计平均概念, 平稳随机过程的功率谱是一个确定函数;而频谱是随机过程样本的Fourier 变换, 对于一个随机过程而言, 频谱也是一个“随机过程”(随机的频域序列).功率谱参度(PSD), 它定义了信号或者时间序列的功率如何随频率分布. 这里功率可能是实际物理上的功率, 或者更经常便于表示抽象的信号, 被定义为信号数值的平方, 也就是当信号的负载为1欧姆(ohm)时的实际功率.由于平均值不为零的信号不是平方可积的, 所以在这种情况下就没有傅立叶变换. 维纳-辛钦定理(Wiener-Khinchin theorem)提供了一个简单的替换方法. 如果信号可以看作是平稳随机过程, 那么功率谱参度就是信号自相关函数的傅立叶变换. 信号的功率谱参度当且仅当信号是广义的平稳过程的时候才存在; 如果信号不是平稳过程, 那么自相关函数一定是两个变量的函数, 这样就不存在功率谱参度, 但是可以使用类似的技术估计时变谱参度. 随机信号是时域无限信号, 不具备可积分条件, 因此不能直接进行傅氏变换. 一般用具有统计特性的功率谱来作为谱分析的依据. 功率谱与自相关函数是一个傅氏变换对.一般的功率谱参度都是针对平稳随机过程的, 由于平稳随机过程的样本函数一般不是绝对可积的, 因此不能直接对它进行傅立叶分析. 可以有三种办法来重新定义谱参度,来克服上述困难.1. 用相关函数的傅立叶变换来定义谱参度;2. 用随机过程的有限时间傅立叶变换来定义谱参度;3. 用平稳随机过程的谱分解来定义谱参度.§5.3.2 模型建立计算功率谱参度函数通常有两种方法[]8. 一种叫做标准的自相关函数法, 其表达式为:(1)0()4()cos 2d x x G f R f τπττ∞=∫ (5.3.1)其中()x R τ表示某个各态历经的随机过程{}()x t 的自相关函数;另一种叫做直接法, 即是直接对随机过程{}()x t 的样本函数作傅立叶变换得到功率谱参度函数, 其表达式为:2(2)202()lim ()d T j ftx T G f x t e t Tπ−→∞=∫ (5.3.2)在计算机上计算功率谱参度函数时, 要求输入的数据必须是离散数值, 所以要对连续观测的数据记录必须做离散化处理. 这叫做数据采样. 离散化的数据值叫做采样数据. 实际计算时, 要求参加运算的采样数据的个数是有限的(即是说, 在有限的时间区段0-T 上进行计算). 在记录是离散的、有限的情况下, 计算功率谱参度函数的公式可以分别近似地表示为:1(1)01()22cos 2cos 2M x r M r G f t R R fr t R fM t ππ−=⎡⎤=Δ+Δ+Δ⎢⎥⎣⎦∑ (5.3.3)和21(2)202()N j fi t x i i G f t x e N t π−−Δ==ΔΔ∑ (5.3.4)这里, 将(5.3.4)式整理为()()21P f X f N=(5.3.5) 其中()X f 是()x n 的傅里叶变换, 在计算过程中可以直接调用FFT 函数.另外由题意可设出, per F 表示每个点上的频率, 其表达式为sper F F N=. M 表示每个信道所含的点的个数, 其表达式为0perF M F =.其中0F 表示每个传输信道上的频率. 故传输信道就只包含M 个点, 相邻信道也只包含M 个点.由于非线性效应产生的新频率分量由对邻道信号有一定的影响, 现用相邻信道功率比(Adjacent Channel Power Ratio, ACPR)表示信道的带外失真的参数, 衡量由于非线性效应所产生的新频率分量对邻道信号的影响程度. 其定义为。
(完整版)数学建模 插值和拟合
x
xn
x
4.2 MATLAB实现插值
Matlab 实现:实现插值不需要编制函 数程序,它自身提供了内部的功能函数 interp1(一维分段插值) interp2(二维) interp3(三维) intern(n维)
4.3.1一维插值
用MATLAB作插值计算
一维插值函数: yi=interp1(x,y,xi,'method')
h=1:0.1:12;
t=interp1(hours,temps,h,'spline');
plot(hours,temps,'+',h,t,'r:')
xlabel('Hour'),ylabel('Degrees Celsius’)
例1:从1点12点的11小时内,每隔1小时测量一次温度, 测得的温度的数值依次为:5,8,9,15,25,29, 31,30,22,25,27,24.试估计(1)每隔1/10小时 的温度值;(2)估计1点30分和13的温度值。
例1:从1点到12点的11小时内,每隔1小时测量一次温 度,测得的温度的数值依次为:5,8,9,15,25, 29,31,30,22,25,27,24.试估计(1)每隔 1/10小时的温度值;(2)估计1点30分和13的温度值。
hours=1:12;
temps=[5 8 9 15 25 29 31 30 22 25 27 24];
x x0 y y0
x1 … xn y1 … yn
其中x0,x1, …xn是n+1个互不相同的点,求一个 近似函数 (x) ,使得
( xi ) f ( xi ) i 0,1 …n
数学建模 插值和拟合
一维插值函数: yi=interp1(x,y,xi,'method')
xi处的 插值结果 插值节点 被插值点 插值方法
注意(1)所有的插值方法 ‘nearest’ 最近邻点插值; 都要求x是单调的,并且xi不 ‘linear’分段线性插值; ‘spline’ 三次样条插值; 能够超过x的范围; ‘cubic’ 三次多项式插值; (2)interp1()并没有提供 缺省时 分段线性插值. 插值函数的表达式。
X Y 1200 1600 2000 2400 2800 3200 3600 1200 1130 1320 1390 1500 1500 1500 1480 1600 1250 1450 1500 1200 1200 1550 1500 2000 1280 1420 1500 1100 1100 1600 1550 2400 1230 1400 1400 1350 1550 1550 1510 2800 1040 1300 900 1450 1600 1600 1430 3200 900 700 1100 1200 1550 1600 1300 3600 500 900 1060 1150 1380 1600 1200 4000 700 850 950 1010 1070 1550 980
用MATLAB作散点数据的插值计算
插值函数griddata格式为:
cz =griddata(x,y,z,cx,cy,‘method’)
被插值点 的函数值 插值 节点 被插值点
插值方法
要求cx取行向量, cy取为列向量.
‘nearest’最邻近插值 ‘linear’ 双线性插值 ‘cubic’ 双三次插值 'v4'- MATLAB提供的插值方法 缺省时, 双线性插值
历年全国数学建模试题及解法
一、历年全国数学建模试题及解法赛题解法93A 非线性交调的频率设计拟合、规划93B 足球队排名图论、层次分析、整数规划94A 逢山开路图论、插值、动态规划94B 锁具装箱问题图论、组合数学95A 飞行管理问题非线性规划、线性规划95B 天车与冶炼炉的作业调度动态规划、排队论、图论96A 最优捕鱼策略微分方程、优化96B 节水洗衣机非线性规划97A 零件的参数设计非线性规划97B 截断切割的最优排列随机模拟、图论98A 一类投资组合问题多目标优化、非线性规划98B 灾情巡视的最灾情巡视的最佳佳路线图论、组合优化99A 自动化车动化车床床管理随机优化、计随机优化、计算算机模拟99B 钻井布局0-1规划、图论00A DNA 序列分类模式识别式识别、、Fisher 判别判别、、人工神经网络00B 钢管订购和运输组合优化、组合优化、运输运输运输问题问题01A 血管三维重建曲线拟合、线拟合、曲面重建曲面重建01B 工交车调度问题多目标规划02A 车灯线光源光源的优化的优化非线性规划02B 彩票彩票问题问题问题 单目标目标决决策 03A SARS 的传播传播 微分方程、微分方程、差差分方程分方程03B 露天矿生产矿生产的车的车的车辆安辆安辆安排排 整数规划、整数规划、运输运输运输问题问题问题 04A 奥运会临时超市网点奥运会临时超市网点设计设计设计 统计分析、数计分析、数据处据处据处理、优化理、优化理、优化 04B 电力市场电力市场的的输电阻塞输电阻塞管理管理管理 数据拟合、优化拟合、优化 05A 长江长江水水质的评价和预测评价和预测 预测评价预测评价、数、数、数据处据处据处理理 05B DVD 在线租赁租赁 随机规划、整数规划随机规划、整数规划二、赛题发展的特点1.对选手对选手的计的计的计算算机能力提出了更高能力提出了更高的的要求:要求:赛题的解赛题的解赛题的解决依赖决依赖决依赖计计算机,题目的数题目的数据较据较据较多多,手工,手工计计算不能完成,如03B ,某些,某些问题问题问题需要需要需要使用使用使用计计算机软件,01A 。
数学建模课件--最小二乘法拟合
---------------------------------------------------------------最新资料推荐------------------------------------------------------1 / 11数学建模课件--最小二乘法拟合4. 最小二乘法线性拟合 我们知道, 用作图法求出直线的斜率a 和截据b , 可以确定这条直线所对应的经验公式, 但用作图法拟合直线时, 由于作图连线有较大的随意性, 尤其在测量数据比较分散时, 对同一组测量数据, 不同的人去处理, 所得结果有差异, 因此是一种粗略的数据处理方法, 求出的 a 和 b 误差较大。
用最小二乘法拟合直线处理数据时, 任何人去处理同一组数据,只要处理过程没有错误, 得到的斜率 a 和截据 b 是唯一的。
最小二乘法就是将一组符合 Y=a+bX 关系的测量数据, 用计算的方法求出最佳的 a 和 b 。
显然, 关键是如何求出最佳的 a 和b 。
(1) 求回归直线 设直线方程的表达式为:(2-6-1) 要根据测量数据求出最佳的 a 和 b 。
对满足线性关系的一组等精度测量数据(xi , yi ),假定自变量xi 的误差可以忽略, 则在同一 xi 下, 测量点 yi 和直线上的点a+bxi 的偏差 di 如下:显然最好测量点都在直线上(即 d1=d2==dn=0), 求出的 a 和 b 是最理想的, 但测量点不可能都在直线上, 这样只有考虑 d1、 d2、 、dn 为最小, 也就是考虑 d1+d2++dn 为最小, 但因 d1、 d2、 、 dn有正有负,加起来可能相互抵消,因此不可取;而| d1| + | d2| ++ | dn| 又不好解方程,因而不可行。
现在采取一种等效方法:当 d1对 a 和 b 为最小时, d1、 d2、、 dn也为最小。
取(d12+d22++dn22+d22++dn2)为最小值,求 a和 b 的方法叫最小二乘法。
数学建模曲线拟合模型
数学建模曲线拟合模型在数据分析与预测中,曲线拟合是一个重要的步骤。
它可以帮助我们找到数据之间的潜在关系,并为未来的趋势和行为提供有价值的洞察。
本篇文章将深入探讨数学建模曲线拟合模型的各个方面,包括数据预处理、特征选择、模型选择、参数估计、模型评估、模型优化、模型部署、错误分析和调整等。
一、数据预处理数据预处理是任何数据分析过程的第一步,对于曲线拟合尤为重要。
这一阶段的目标是清理和准备数据,以便更好地进行后续分析。
数据预处理包括检查缺失值、异常值和重复值,以及可能的规范化或归一化步骤,以确保数据在相同的尺度上。
二、特征选择特征选择是选择与预测变量最相关和最有信息量的特征的过程。
在曲线拟合中,特征选择至关重要,因为它可以帮助我们确定哪些变量对预测结果有显著影响,并简化模型。
有多种特征选择方法,如基于统计的方法、基于模型的方法和集成方法。
三、模型选择在完成数据预处理和特征选择后,我们需要选择最适合数据的模型。
有许多不同的曲线拟合模型可供选择,包括多项式回归、指数模型、对数模型等。
在选择模型时,我们应考虑模型的预测能力、解释性以及复杂性。
为了选择最佳模型,可以使用诸如交叉验证和网格搜索等技术。
四、参数估计在选择了一个合适的模型后,我们需要估计其参数。
参数估计的目标是最小化模型的预测误差。
有多种参数估计方法,包括最大似然估计和最小二乘法。
在实践中,最小二乘法是最常用的方法之一,因为它可以提供最佳线性无偏估计。
五、模型评估在参数估计完成后,我们需要评估模型的性能。
这可以通过使用诸如均方误差(MSE)、均方根误差(RMSE)和决定系数(R²)等指标来完成。
我们还可以使用诸如交叉验证等技术来评估模型的泛化能力。
此外,可视化工具(如残差图)也可以帮助我们更好地理解模型的性能。
六、模型优化如果模型的性能不理想,我们需要对其进行优化。
这可以通过多种方法实现,包括增加或减少特征、更改模型类型或调整模型参数等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据拟合
问题的提出及最小二乘原理
取
x 的n 个不全相同的值n x x x ,,,21 作独立试验,得到样本
()11,y x ,()22,y x ,…,()n n y x ,,则
i i i bx a y ε++=,
设()2
,0~σεN i
,各 i ε 相互独立 于是
()
2
,~σi i bx a N y +,
n
i ,,2,1 =。
且由
n y y y ,,,21 的独立性,知n y y y ,,,21 的联合概率密度为
()⎥⎦
⎤
⎢⎣
⎡---⎪⎭⎫
⎝⎛=∑=n
i i i n
bx a y L 12
2
21exp 21σπσ (1)
现用最大似然估计法来估计未知参数
b a ,。
对于任意一组观察值
n y y y ,,,21 ,(1)式就是样本的似然函数。
显然,要L 取最大值,
只需函数
()()
∑=--=n
i i i bx a y b a Q 12
,
取最小值。
如果
y 不是正态变量,则直接用(1)式估计b a ,使
y 的观察值 i y
与
i bx a + 偏差的平方和 ()b a Q , 为最小。
这种方法叫最小二乘法。
如果y 是正态变量,则最小二乘法与最大似然估计法给出相同的结果。
取
()b a Q ,分别关于b a ,的偏导数,并令它们等于0,得到b
a ,
应满足方程
()()⎪⎪⎩⎪⎪⎨⎧=---=∂∂=---=∂∂∑∑==020211n i i i i n
i i i x x b a y b
Q x b a y a Q
(2) (2)式称为正规方程组。
解此方程组即可确定
b a ,,从而得到直线方程
bx a y +=*。
对一组测定数据用最小二乘原理找出其合适的数学公式,可以分以下几步: 1. 由观测数据作出散点图
2. 根据散点图确定近似公式的函数类
3. 用最小二乘原理确定函数中的未知参数 这一方法称为数据拟合法。
常用的曲线(函数类)有直线、多项式、双曲线、指数曲线等,实际操作中可以在直观判断的基础上,选几种曲线分别做拟合,然后比较看哪条曲线的最小二乘指标最小。
一. 多变量的数据拟合
若影响变量
y
的因素不只是一个,而是几个,譬如有
k
个因素
k x x x ,,,21 ,这时通过n 次实验可以得到数据表:
实验 1x
2x … k x y
1 11x 21x
… 1k x 1y 2 12x
22x
… 2k x
2y
…
…
…
… …
…
n
n x 1 n x 2 …
kn x n y
一般说来
k n >,如果选择近似方程为
k k x a x a x a a y ++++= 22110*
和前面一样,用最小二乘原理可确定此方程中的全部系数。
二. 非线性曲线的数据拟合
()()()()x c x c x c x c y k k φφφφ++++= 221100*
多项式数据拟合有它特殊的重要性,因为任何连续函数,至少在一个比较小的领域内可以用多项式任意逼近。
因此,在许多实际问题中,可以不问
y 与
诸因素的确切关系如何,而用多项式进行拟合。
数据拟合总是在一组选定的基函数上,构造基函数的线性组合,并从这个组合函数类中对给定数据找出最好的拟合曲线。
例如,线性拟合是在基函数
{}x ,1上构造一次函数类,找出对给定数据最好的直线方程;多项式拟合
是在基函数{}m
x x ,,,1 上构造m 次多项式,在全部m 次多项
式中选取对给定数据拟合的最好的一个m
次多项式。
因此,怎样选择基函数来构造函数类是非常重要的,也比较困难,它主要靠对问题的仔细分析和搞清物理背景的办法来解决,但在数学上也有行之有效的方法——正交筛选法。
三. 数据拟合的MATLAB 实现
命令: polyfit 、polyval 、
curvefit 、leastsq。