MATLAB拟合模型回归模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
年份 xi 49 54 59 64 69 74 79 84 89 94 人数 yi 5.4 6.0 6.7 7.0 8.1 9.1 9.8 10.3 11.3 11.8 模型 误差 5.24 5.97 6.7 7.43 8.16 8.90 9.62 10.36 11.09 11.82 .16 .03 0 -.43 -.06 .20 .18 -.06 .01 -.02
模型: t = a + b x 参数: a= - 9.99, b = 0.145 t = - 9.99 + 0.145 x Q1 = 82.04 检验: 当 x < 68.89 m 时, t < 0. 当 x = 100 m 时, t = 4.51 s 与实际情形差距较大 ! 中间数值偏低
讨论
xi 49 54 59 64 69 74 79 84 89 94 yi 5.4 6.0 6.7 7.0 8.1 9.1 9.8 10.3 11.0 11.8 yi 5.24 5.97 6.70 7.43 8.16 8.90 9.62 10.36 11.09 11.82 0.16 0.03 0.00 -0.43 -0.06 0.20 0.18 -0.06 0.01 -0.02 yi 5.55 6.06 6.62 7.23 7.90 8.64 9.44 10.31 11.26 12.31 -0.15 –.06 0.08 –0.23 0.20 0.46 0.36 –.01 –0.13 –0.51
30. 经验模型和插值模型 经验模型:主要是探讨变量间的内在规律, 容许出现一定的误差。 在简单的数学表达式中选择拟合效果好的 插值模型:以数据拟合的效果为主。 要求精确地拟合观测数据, 即在观测点之间插入适当的数值。
4. 其他利用数据组建的模型
假设:人口随时间线性地增加 模型:y = a + b x 参数估计 观测值的模型: yi = a + b xi + εi ,i = 1,…,n 拟合的精度: Q = i 2 = (yi - a – b xi)2, 误差平方和
最小二乘法: 求参数 a 和 b,使得误差平方和最小
yi bxi xii
xi2bi xi2 xi2 b 2 i xi
ˆ b
xi yi x
2 i
数据:yi a bxi i , i 1,, n 模型:y = a + bx,
Q i2 ( yi a bxi )2 精度:
l xy ( xi x )( yi y ) l xx ( xi x ) 2
i 1
n
参数估计
可以算出:a = – 1.93, b = 0.146 模型:y = – 1.93 + 0.146 x
拟合效果
ˆ ˆ ˆ yi a bxi i yi yi
§3.2
数据资料 与 拟合模型
一. 数据资料与数学模型
1. 数据资料 数据资料 是在实际问题中收集到的观测数值。
数据携带有实际问题大量的信息, 是组建数学模型的重要依据。
数据获取 年鉴报表、学术刊物、网络资源、实验观测等等 数据误差 观测数据中一般都包含有误差。
正确对待和处理这 些误差是数学建模中不可回避的问题. 系统误差:偏差,来自于系统,有规律,可避免。 随机误差:无偏,来自随机因素,无规律,不可免
模型:y = a+b1x1+b2x2, 数据: yi a b1x1i b2 x2i i 精度: Q ( yi a b1x1i b2 x2i )2
估计: l11b1 l12b2 l1y l ( x x )2 11 1i 1
l21b1 l22b2 l2 y l22 ( x2i x2 )
40. y = 1/(a+bx) 令 z = 1/y, 则有 z = 1/y = a + bx . 50. y = x/(b+ax) 令 z = 1/y, u=1/x, 则有 z = 1/y = a + b/x = a + b u 60. y = (1+ax)/(1+bx) ?
Q i2 ( yi bxi )2 yi2 2b xi yi b2 xi2 精度:
i i i i i
ˆ 估计:b xi yi
xi2 lxy lxx
ˆ 1 yi 1 b 讨论:b1 i n i xi n
模型:
yi bi b i xi
ˆ ˆ a y bx
模型:y = b1x1+b2x2,
数据: yi b1x1i b2 x2i i
精度: Q ( yi b1x1i b2 x2i )2
2 [( yi b1x1i )2 2x2i ( yi b1x1i )b2 x2ib2 ]
Q=∑ε2 = 0.2915
模型二:y = a + b x + cx2
y = - 0.8427+0.1133x+0.0002x2
12
11
10
9
8
7
6
5 40
50
60
70
80
90
100
模型三 人口自然增长模型
y ae
设数据满足
最小二乘法
bx
ln y ln a bx
ln yi ln a bxi i
例 4.2 表列数据为1977年以前六个不同距离 的中短距离赛跑成绩的世界纪录. 试用这些数据建模分析赛跑的成绩与赛跑距 离的关系。 距离 x(m) 100 200 400 800 1000 1500 时间 t (s) 9.95 19.72 43.86 102.4 133.9 212.1
i i
[( yi y ) a b( xi x ) y bx ]2
i
[( yi y ) b( xi x )]2 ( y a bx ) 2
i i
ˆ 估计:b ( xi x )( yi y)
( xi x )2 lxy lxx
Q ( yi a bxi )
i 1 2 i i 1 n n 2
na ( xi )b yi ( xi )a ( x )b xi yi
2 i
a y bx b lxy lxx
1 n 1 n x xi , y yi n i 1 n i 1
2. 线性最小二乘法
模型:y = b, 数据: yi b i ,
i 1,, n
Q i2 ( yi b)2 ( yi2 2 yib b2 ) 精度: yi2 2( yi )b nb2
估计: ˆ 1 b yi
n
y
y 数据: i bxi i , i 1,, n 模型:y = bx,
1 x1 y1 1 x 2 a y2 b 1 x y n n
讨论
3. 关于最小二乘技术 可以使用计算器计算 使用excel计算: \数据分析\回归分析 使用MATLAB计算 >>x=49:5:94; y=[5.4 6 6.7 7 8.1 … ]; >>A=[ones(10,1), x’]; b=A\y’; >>z=b(1)+b(2)*x; >>plot( x, z, ’b’, x, y,’r*’)
2. 资料与模型
10. 数据资料可以直接应用于数学模型的组建。 数据可以为模型的设计提供信息 数据也可以为模型参数的估计给出数值基础 数据也是检验模型合理性的重要依据
3. 拟合模型
10.对于情况较复杂的实际问题 (因素多且不易化简,作用机理不详) 可直接寻找数据表达的因果变量之间简单 的数量关系组建模型, 从而对未知的情形作预报。 这样组建的模型称为拟合模型。 20. 拟合模型的组建主要是处理好数据的误差 使用数学近似表达因果变量之间的关系。 其实质是数据拟合的精度和数学表达式简 化程度间的一个折中。 折中方案的选择将取决于实际问题的需要
模型: t = a xb, 令 z = ln t, u = ln x , 则有 z = ln t = ln a+b ln x = a* + b u 参数: a* = - 3.0341, a = e a* = 0.048, b = 1.145
t = 0.048 x1.145. Q2 = 23.55 200 400 800 1000 19.72 43.86 102.4 133.9 19.10 48.20 106.4 135.5 20.78 45.96 101.68 131.29
[( yi b2 x2i )2 2x1i ( yi b2 x2i )b1 x12ib1 ]
ˆ ˆ ( x12i )b1 ( x1i x2i )b2 x1i yi
2 ˆ ˆ ( x1i x2i )b1 ( x2i )b2 x2i yi
l11b1 l12b2 l1y l21b1 l22b2 l2 y
2
a y b1 x1 b2 x2 l12 l21 ( x1i x1 )(x2i x2 )
lky ( xki xk )( yi y)
3. 可化简的非线性最小二乘法
10. y=a+b1f1(x)+b2 f2(x)+…+bn fn(x) 令 ui= fi(x), 则有 y=a+b1u1+…+bnun. 20. y=a ebx . 令 z=ln y, 则有 z = ln a + b x = a* + b x . 30. y = a xb . 令 z = ln y, u = ln x, 则有 z = ln y = lna+b ln x = a*+ b u
判别模型, 主成分模型, 分类模型, 因子模型 趋势面模型, 时间序列模型等。
二. 经验模型与最小二乘法
1. 经验模型及其组建 在简单模型中选择拟合效果好者。 例 人口预测 1949年—1994年我国人口数据资料如下: 年份 xi 49 54 59 64 69 74 79 84 89 94 人数 yi 5.4 6.0 6.7 7.0 8.1 9.1 9.8 10.3 11.1 11.8 建模分析我国人口增长的规律, 预报99年我国人口数 1. 在坐标系上作观测数据的散点图。 2. 根据散点分布的几何特征提出模型 3. 利用数据估计模型的参数 4. 计算拟合效果
Q (ln yi ln a bxi )
i 1 2 i i 1 n n 2
算得 模型 拟合精度
ˆ a 2.33
ˆ b 0.0177
0.0177 x
y 2.33e
2
Q 0.7437
结论
1. Q1 = 0.2915 < 0.7437 = Q2. 线性模型更适合中国人口的增长。 2. 预报:1999年12.55亿,13.43亿 3. 人口白皮书: 2005年13.3亿, 2010年14亿 模型 I 2005年13.43亿,2010年14.16亿 模型II 14.94亿, 16.33亿
x t I II
100 9.95 4.56 9.39
1500 212.1 208.2 208.9
250
200
150
100
50
0
0பைடு நூலகம்
500
1000
1500
讨论
1. 经验模型是众多因素作用综合在因果关系上 的结论。会因时因地发生变化且不宜在另外的 环境下套用和从机理作过多的分析。 2. 前面的最小二乘法实质上是近似求解线性方 程组 a + xk b = yk,k = 1,…,n 或