多项式回归、非线性回归模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表 2 钢包使用次数与增大容积
使用次数 (x)
增大容积 (y)
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 6.42 8.2 9.58 9.5 9.7 10 9.93 9.99 10.49 10.59 10.6 10.8 10.6 10.9 10.76
解:(1)建立非线性回归模型: 程序 2 x=[2:16]; y= [6.42 8.2 9.58 9.5 9.7 10 9.93 9.99 10.49 10.59 10.6 10.8 10.6 10.9 10.76]; %建立非线性双曲线回归模型 b0=[0.084,0.1436];%回归系数初值 fun=inline('x./(b(1)*x+b(2))','b','x');%建立函数 [beta,r,J]=nlinfit(x,y,fun,b0);%非线性拟合命令;其中,beta 表示最佳回归系数的估计值, r 是残差,J 是雅可比矩阵 beta%输出最佳参数 y1=x./(0.0845*x+0.1152);%拟合曲线 plot(x,y,'*',x,y1,'-or') legend('原始数据','拟合曲线')%legend 为图例命令 初始值要先计算后才能得到上面程序中的 b0,选择已知程序中的点(2,6.42)和点(16, 10.76),可选择手工方法解方程,也可利用以下 MATLAB 程序求解。 程序 3 [a,b]=solve('1/6.42=a+b/2','1/10.76=a+b/16')%解方程 注:当所求解的方程过于复杂时,MATLAB 运行会出现错误,此时需将方程尽量化简后 再进行求解,如以下形式: [a,b]=solve('6.42*(2*a+b)=2','10.76*(16*a+b)=16')
5
图 3 钢包使用次数与增大容积的拟合交互图 图中的星号代表实验的原始数据点,绿色实线是回归模型曲线,两条红色虚线为 95% 上下置信区间的曲线,纵向的虚线表示自变量为 9 时,横向虚线对应的预测值为 10.4118。
6
y1 1.9897t2 51.1394t 347.8967
2
y(残留细菌数)
400 350 300 250 200 150 100
50 0 0
原始数据 二次函数
5
10
15
t(照射次数)
图 1 原始数据与拟合效果的散点图
原始数据与拟合结果的散点图如图所示,从图形可知拟合效果较好。照射 16 次后,用
运行程序 3 可得到最佳参数为 a 0.0845 、 b 0.1152 ,求解得到钢包使用次数与增
大容积的非线性拟合图,如图 2 所示。
4
11
原始数据
10.5
拟合曲线
10
9.5
9
8.5
8
7.5
7
6.5
6
2
4
6
8
10
12
14
16
图 2 钢包使用次数与增大容积的非线性拟合图 (2)预测钢包使用 17 次后增大的容积: 程序 4 ypred=nlpredci(fun,17,beta,r,J)%预测钢包使用 17 次后增大的容积 (3)置信区间: 程序 5 ci=nlparci(beta,r,J)%置信区间 运行后得到 ci =
SSA
n
( yi yˆi )2 /(n 2)
SSE /(n 2)
i 1
例 6(F 检验)
在合金钢强度的例 1 中,我们已求出了回归方程,这里考虑关于回归方程的显著性检验,
经计算有:
表 5 X 射线照射次数与残留细菌数的方差分析表
来源
平方和
自由度
均方
F比 p值
回归
SR 327.34
fR 1
MSR 327.34
n
n
( yi yˆi )2
( yˆi yi )2
R2
1
i 1 n
i1
n
( yi yi )2
( yi yi )2
i 1
i 1
2. 例题 1
存在四点(-2,-3)、(-1,-1)、(1,2)、(4,3)求拟合直线与决定系数。
2. 回归方程的显著性检验
n
F
( yˆi yi )2
i 1
(6)
S
型曲线
y
a
1 bex
,其中
ab
0
(如图所示)
非线性回归建模通常有两种方法:一是通过适当的变换转化为线性回归模型,例如双曲
线模型 1 a b (如图 1 所示),如果作变换 y 1 , x 1 则有 y a bx ,此时就
y
x
y
x
是线性回归模型。如果无法实现线性化,可以利用最小二乘法直接建立非线性回归模型,求
0.0814 0.0876 0.0934 0.1370 即回归模型中参数的置信度为的置信区间分别为[0.0814,0.0876]与[0.0934,0.1370]。我们
求出的最佳参数分别为 a 0.0845 和 b 0.1152 ,均属于上述置信区间。
调用多项式回归的 GUI 界面,可显示出钢包使用次数与增大容积的拟合交互图,见图 3。 程序 6 polytool(x,y,2)
解最佳参数。
例 2(非线性回归模型、置信区间)
炼钢厂出钢时所用盛钢水的钢包,由于钢水对耐火材料的侵蚀,容积不断增大,我们希
望找出使用次数与增大容积之间的函数关系。实验数据见表 2。
3
(1)建立非线性回归模型 1 a b ;
y
x
(2)预测钢包使用 x0 17 次后增大的容积 y0 ;
(3)计算回归模型参数的置信度为 95%的置信区间。
二次函数计算出细菌残留数为 39.0396,显然与实际不符。由实际问题的意义可知,尽管二
次多项式拟合效果较好,但是用于预测并不理想。因此如何根据原始数据散点图的规律,选
择适当的回归曲线是非常重要的,这样就有必要给出非线性回归模型。
三、一元非线性回归模型
为了便于正确选择合适的函数进行回归分析建模,我们给出通常选择的 6 类曲线:
例 1(多项式回归模型)
为了分析 X 射线的杀菌作用,用 200 千伏的 X 射线来照射细菌,每次照射 6 分钟,用
平板计数法估计尚存活的细菌数。照射次数记为 t ,照射后的细菌数为 y 见表 1。试求: (1)给出 y 与 t 的二次回归模型。
(2)在同一坐标系内作出原始数据与拟合结果的散点图。
(3)预测 t 16 时残留的细菌数。
多项式回归、非线性回归模型
关键词:回归方程的统计检验、拟合优度检验、回归方程的显著性检验、F 检验、回归
系数的显著性检验、残差分析、一元多项式回归模型、一元非线性回归模型
一、回归方程的统计检验
1. 拟合优度检验
1. 概念介绍
SST 总离差平方和 total
SSR 回归平方和 regression
SSE 剩余平方和 error
(1)双曲线 1 a b (如图所示)
y
x
(2)幂函数曲线 y axb ,其中 x 0 , a 0 (如图所示)
(3)指数曲线 y aebx ,其中参数 a 0 (如图所示)
(4)倒指数曲线 y aeb / x ,其中 a 0 (如图所示)
(5)对数曲线 y a b ln x (如图所示)
(4)根据问题的实际意义,你认为选择多项式函数是否合适?
表 1 X 射线照射次数与残留细菌数
t
1
Biblioteka Baidu
2 3 4 5 6 7 8 9 10 11 12 13 14 15
y
352 211 197 160 142 106 104 60 56 38 36 32 21 19 15
程序 1 t=1:15; y=[352 211 197 160 142 106 104 60 56 38 36 32 21 19 15]; p=polyfit(t,y,2)%作二次多项式回归 y1=polyval(p,t);%模型估计与作图 plot(t,y,'-*',t,y1,'-o');%在同一坐标系中做出两个图形 legend('原始数据','二次函数') xlabel('t(照射次数)')%横坐标名 ylabel('y(残留细菌数)')%纵坐标名 t0=16; yc1=polyconf(p,t0)%预测 t0=16 时残留的细菌数,方法 1 yc2=polyval(p,t0)%预测 t0=16 时残留的细菌数,方法 2 即二次回归模型为:
184.94 0.0000
残差
Se 17.72
fe 10
MSe 1.77
总计
ST 345.06
fT 11
这里值很小,因此,在显著性水平 0.01 下回归方程是显著的。 3. 回归系数的显著性检验 4. 残差分析 二、一元多项式回归模型
1
模型如以下形式的称为一元多项式回归模型:
y an xn an1xn1 a1x a0