应用MATLAB进行非线性回归分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用MATLAB进行非线性回归分析
摘要
早在十九世纪,英国生物学家兼统计学家高尔顿在研究父与子身高的遗传问题时,发现子代的平均高度又向中心回归大的意思,使得一段时间内人的身高相对稳定。
之后回归分析的思想渗透到了数理统计的其他分支中。
随着计算机的发展,各种统计软件包的出现,回归分析的应用就越来越广泛。
回归分析处理的是变量与变量间的关系。
有时,回归函数不是自变量的线性函数,但通过变换可以将之化为线性函数,从而利用一元线性回归对其进行分析,这样的问题是非线性回归问题。
下面的第一题:炼钢厂出钢水时用的钢包,在使用过程中由于钢水及炉渣对耐火材料的侵蚀,使其容积不断增大。
要找出钢包的容积用盛满钢水时的质量与相应的实验次数的定量关系表达式,就要用到一元非线性回归分析方法。
首先我们要对数据进行分析,描出数据的散点图,判断两个变量之间可能的函数关系,对题中的非线性函数,参数估计是最常用的“线性化方法”,即通过某种变换,将方程化为一元线性方程的形式,接着我们就要对得到的一些曲线回归方程进行选择,找出到底哪一个才是更好一点的。
此时我们通常可采用两个指标进行选择,第一个是决定系数,第二个是剩余标准差。
进而就得到了我们想要的定量关系表达式。
第二题:给出了某地区1971—2000年的人口数据,对该地区的人口变化进行曲线拟合。
也用到了一元非线性回归的方法。
首先我们也要对数据进行分析,描出数据的散点图,然后用MATLAB编程进行回归分析拟合计算输出利用Logistic模型拟合曲线。
关键词:参数估计,Logistic模型,MATLAB
正文
一、一元非线性回归分析的求解思路:
•求解函数类型并检验。
•求解未知参数。
可化曲线回归为直线回归,用最小二乘法求解;可化曲线回归为多项式回归。
二、回归曲线函数类型的选取和检验
1、直接判断法
2、作图观察法,与典型曲线比较,确定其属于何种类型,然后检验。
3、直接检验法(适应于待求参数不多的情况)
4、表差法(适应于多想式回归,含有常数项多于两个的情况)
三、化曲线回归为直线回归问题
用直线检验法或表差法检验的曲线回归方程都可以通过变量代换转化为直线回归方程,利用线性回归分析方法可求得相应的参数估计值。
题目:
例 8.5.1
炼钢厂出钢水时用的钢包,在使用过程中由于钢水及炉渣对耐火材料的浸蚀,其容积不断增大。
现在钢包的容积用盛满钢水时的重量y (kg)表示,相应的试验次数用x表示。
数据见表8.5.1,要找出y与x的定量关系表达式。
表8.5.1 钢包的重量y与试验次数x数据
7
10110.49
•y=a+b ln x
format long
x=[2 3 4 5 7 8 10 11 14 15 16 18 19];
y=[106.42 108.20 109.58 109.5 110 109.93 110.49 110.59 110.60 110.9 110.76 111 111.20];
plot(x,y,‘k+’);%数据的散点图
x1=1./x;
y1=1./y;
plot(x1,y1,‘k+’); %变换后数据的散点图
x2=[ones(13,1) x1'];
[b,bint,rint,stats]=regress(y1',x2);
z=b(1)+b(2)*x1;
yc=1./z;
plot(x1,y1,‘k+’,x1,z,‘r’)%变换后数据的散点图和回归直线图
变换后数据的散点图及回归直线图
R2=1-sum((y-yc).^2)/lyy;%模型的拟合优度系数plot(x,y,‘k+’,x,yc,‘r’)%数据的散点图和回归曲线图legend('散点图','回归函数')
b = 0.00896662968057
0.00082917436336
R2 =0.97292374957556
第一种方法的程序:
format long
x=[2 3 4 5 7 8 10 11 14 15 16 18 19];
y=[106.42 108.20 109.58 109.5 110 109.93 110.49 110.59 110.60 110.9 110.76 111 111.20];
plot(x,y,‘k+’);%数据的散点图
x1=1./x;
y1=1./y;
plot(x1,y1,‘k+’); %变换后数据的散点图
x2=[ones(13,1) x1'];
[b,bint,rint,stats]=regress(y1',x2);
z=b(1)+b(2)*x1;
yc=1./z;
plot(x1,y1,‘k+’,x1,z,‘r’)%变换后数据的散点图和回归直线图
n=length(x);
lyy=sum(y.^2)-n*(mean(y))^2;
R2=1-sum((y-yc).^2)/lyy;%模型的拟合优度系数
b = 0.00896662968057
0.00082917436336
R2 =0.97292374957556
用类似的方法可以得出其它三个曲线回归方程,它们分别是:
第二种方法的程序:
format long
x=[2 3 4 5 7 8 10 11 14 15 16 18 19];
y=[106.42 108.20 109.58 109.5 110 109.93 110.49 110.59 110.60 110.9 110.76 111 111.20];
x1=log(x);
y1=y;
x2=[ones(13,1) x1'];
[b,bint,rint,stats]=regress(y1',x2);
b
z=b(1)+b(2)*x1;
yc=z;
n=length(x);
lyy=sum(y.^2)-n*(mean(y))^2;
R2=1-sum((y-yc).^2)/lyy;
plot(x,y,'k+',x,yc,‘c');
legend('散点图','回归函数')
b = 1.0e+002 *
1.06314674075167
0.01713977247928
R2 =0.87731500489620
第三种方法的程序:
format long
x=[2 3 4 5 7 8 10 11 14 15 16 18 19];
y=[106.42 108.20 109.58 109.5 110 109.93 110.49 110.59 110.60 110.9 110.76 111 111.20];
x1=sqrt(x);
y1=y;
x2=[ones(13,1) x1'];
[b,bint,rint,stats]=regress(y1',x2);
b
z=b(1)+b(2)*x1;
yc=z;
n=length(x);
lyy=sum(y.^2)-n*(mean(y))^2;
R2=1-sum((y-yc).^2)/lyy;
plot(x,y,'k+',x,yc,'k');
legend('散点图','回归函数')
b = 1.0e+002 *
1.06301275014382
0.01194728720517
R2 = 0.78514164407253
三种方法的拟合效果比较:
R2 =0.97292374957556
R2 =0.87731500489620
R2 = 0.78514164407253
1.原始数据
下表给出了某地区1971—2000年的人口数据(表1)。
试分别用Matlab和SPSS软件,对该地区的人口变化进行曲线拟合。
表1 某地区人口变化数据
年份时间变量t=年份-1970人口y/人
1971133 815
1972233 981
1973334 004
1974434 165
1975534 212
1976634 327
1977734 344
1978834 458
1979934 498
19801034 476
19811134 483
19821234 488
19831334 513
19841434 497
19851534 511
19861634 520
19871734 507
19881834 509
19891934 521
19902034 513
19912134 515
19922234 517
19932334 519
19942434 519
19952534 521
19962634 521
19972734 523
19982834 525
19992934 525
20003034 527
根据上表中的数据,做出散点图,见图1。
图1 某地区人口随时间变化的散点图
从图1可以看出,人口随时间的变化呈非线性过程,而且存在一个与横坐标轴平行的渐近线,故可以用Logistic曲线模型进行拟合。
因为Logistic曲线模型的基本形式为:
所以,只要令:,就可以将其转化为直线模型:
下面,我们分别用Matlab和SPSS软件进行回归分析拟合计算。
2.用Matlab编程进行回归分析拟合计算
源程序(Nonlinear-Regression-Model.m),如下:
clear
clc
% 读入人口数据(1971-2000年)
y = [33815 33981 34004 34165 34212 34327 34344 34458 34498 34476 34483 34488 34513 34497 34511 34520 34507 34509 34521 34513 34515 34517 34519 34519 34521 34521 34523 34525 34525 34527];
% 读入时间变量数据(t=年份-1970)
t=[1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30]; % 线性化处理
for t = 1:30,
x(t)=exp(-t);
y(t)=1/y(t,1);
end
% 计算,并输出回归系数B
c=zeros(30,1)+1;
X=[c,x'];
B=inv(X'*X)*X'*y
for i=1:30,
% 计算回归拟合值
z(i)=B(1,1)+B(2,1)*x(i);
% 计算离差
s(i)=y(i)-sum(y)/30;
% 计算误差
w(i)=z(i)-y(i);
end
% 计算离差平方和S
S=s*s';
% 回归误差平方和Q
Q=w*w';
% 计算回归平方和U
U=S-Q;
% 计算,并输出F检验值
F=28*U/Q
% 计算非线性回归模型的拟合值
for j=1:30,
Y(j)=1/(B(1,1)+B(2,1)*exp(-j));
end
% 输出非线性回归模型的拟合曲线(Logisic曲线)
plot(T,Y)
上述程序运行后,输出
(1)输出回归系数B及F检验值如下:
B =
1.0e-004 *
0.2902
0.0182
F =
47.8774
(2)输出Logistic模型拟合曲线
总结
文中给出了两道题对这次的论文《应用MATLAB进行非线性回归分析》进行说明,给出了进行非线性回归需要的步骤,画出了描述数据的散点图,参数估计等,通过比较我们得到了需要的定量关系表达式,画出了拟合曲线。
参考文献
[1]金兰,回归分析与方差分析教学的几点思考[J].统计教育,2006年
[2]王兵团,数学建模基础[M],北京:清华大学出版社,2004年
(本资料素材和资料部分来自网络,仅供参考。
请预览后才下载,期待您的好评与关注!)。