化工计算方法-4-曲线拟合
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 拟合直线方程 中的b可写为
1 Lxy xi yi m ( xi )( yi ) b 1 2 Lxx xi ( xi )2 m
•与插值法比较的特点
① 由于离散数据点含有随机误差, 故拟合曲线不必通过所有数据点, (插值多项式必须通过插值节点) y
② 曲线拟合处理的是随机变量问题, 允许一个自变量对应多个不同的函 数值,所用数学方法属数理统计回 归分析;
C 0 y i x 0 C1 yi x1i C 2 y x i 2 i
系数矩阵 1
x x x x x x x x
1i 1i 2i
1i 2 i 2 2i
1i 2 i 2 2i
4 曲线拟合
• 插值法适用于处理确定性变量问题,即变量与自变量有确 定的函数关系。如果数据表本身误差大,插值法则不适合, 此时应该用曲线拟合。 曲线拟合应用
1. 经验建模——通过观测数据寻找相关变量之间的数学表 达式 (能否举出所学化工课程中的这种表达式或经验模 型?) 2. 参数估值——数学关系或模型可从理论导出,模型关系 式中的参数由实验数据求取(如化工热力学中的安托因 方程、化学反应工程中的阿累尼乌斯方程等)。
• 残差平方和是C0,C1,C2的函数
Q Q (C 0 , C 1 , C 2 )
• 残差平方和是C0,C1,C2的函数 Q Q(C 0 , C1 , C 2 ) • 根据多元函数极值存在的必要条件,要使Q达到最小,分 别令Q对每一系数的偏导数为零,得到三个方程
Q 2 ( y i C 0 C1 x1i C 2 x 2 i ) 0 C 0 Q 2 ( yi C 0 C1 x1i C 2 x 2 i ) x1i 0 C 1 Q 2 ( yi C 0 C1 x1i C 2 x 2 i ) x 2 i 0 C 1
• 正规方程组是含有未知数C0,C1,C2的3元线性方程组 可写成矩阵形式 #
•正规方程组的矩阵形式
x1i • 将第一行 和第一列乘 x2 i
变量
1i 2i 2
常数项
C 0 y i C1 yi x1i C 2 y x i 2 i
*
*
* *
*
*
*
* * *
*
• 插值法只适用于处理确定性变量 问题,自变量与函数值有确定的一 一对应关系。
x • 是否可拟合成直线? • 得到的直线方程是否 可用? #
• 4.1.2 线性相关系数与显著性检验 拟合的方程能否使用(反映原函数关系),必须通过检验 •以实验观测值的平均值为基准 ˆ ˆ • 一个实验值yi的离差为 yi y ( yi yi ) ( yi y ) • 全部实验点的离差平方和称为总平方和记为S总
b=0.2397468 Rmf=0.765 R=0.920295 ** Rmf=0.632 R=0.920295 *
拟合方程 : y= 5.4366346+ 0.2397468 x
4.2 多元线性拟合 • 对多个自变量的离散函数,常常拟合为线性的多元函数 • 讨论两个自变量的问题——已知离散函数数据 yi y1 y2 y3 … … … ym x1i x11 x12 x13 … … … x1m x2i x21 x22 x23 … … … x2m • 根据数据 ,确定二元线性方程
2 i 1 i 1
m
m
• 回归直线方程中的a和b的取值应该使Q达 到最小,Q取最小值的必要条件为
Q 正规方 2 ( y i a bxi ) 0 a 程组 i 1 m Q 2 ( y i a bxi ) x i 0 b i 1
m
Q Q 0 a b
i
b
(x
i 1 m
m
x )( y i y )
( xi x ) 2
i 1
1 全部实验点 x 1 xi y m yi m i 1 的平均值 yi
2
m
m
a y bx
• x的离差 xi x
2
1 L xx ( xi x ) xi ( xi )2 • x的离差平方和 m • x和y的离 L ( x x )( y y ) x y 1 ( x )( y ) i i m i i i 差乘积之和 xy i
• 回归平方和 S回——y的回 归值与平均值之差
• S回产生原因:因自变量xi 取值不同引起
• 反映了因 y 与 x 间存在回 归关系而引起的 y 的波动
• 总平方和 S总由 S残 与 S回构成
S总=S残+S回
• 回归平方和与残差(剩余)平方和的相对大小,可判断 回归效果的好坏(反映原实测数据函数关系的程度) • 回归平方和越大,残差平方和就越小,则回归效果就越 好 m ( yi y )2 ˆ L2xy S回 i 1 定义比值判 m R 2 比值越大,回 断回归效果 S总 Lxx L yy 归效果越好 ( yi y )2
ˆ y C 0 C1 x1 C 2 x2
ˆ • 对以上二元线性模型,实测数据 yi与模型计算值 y 之间的 残差平方和为
ˆ Q ( yi yi ) [ yi (C 0 C1 x1i C 2 x2 i )]2
2 i 1 i 1 m m
也就是要确定方程中的 C0,C1,C2
• 如果回归方程不显著,是否说明 x 和 y 间没有函数关系 ?
• 如果回归方程不显著,只表明 x 和 y 间建立线性关系不 合适,并不说明二者间没有函数关系 。 #
y
* * * *
*
*
*
x
例题4-1 已知实验数据x和y间存在线性关系,试拟合方程并 进行相关系数检验 X 1.36 1.49 1.73 1.81 1.95 2.16 Y 14.10 15.10 16.80 17.40 18.40 19.40 解 用最小二乘法求直线中的a和b并进行显著性检验。 (1)为方便,直接调用最小二乘多项式拟合函数 polyfit(x,y,1) (2)进行相关系数检验时,用到的相关系数临界值数据(表4-2), 已 存 为 Excel 下 的 .xls 文 档 , 程 序 可 直 接 读 入 。 本 例 中 “alpha0.01.xls”和“alpha0.05.xls”分别为=0.01和=0.05的相 关 系 数 临 界 值 数 据 的 文 件 名 , “ C:\Documents and Settings\Administrator\‘”是其存放路径; (3)结果显示中的星号*标志线性相关性的显著程度,“*” 和 “**”分别代表显著和高度显著。 参考程序及计算结果见教材p.43.
ˆ • 选择的线 yi a bxi , 观测数据 yi
ˆ 两者偏差 i yi yi yi f ( x )
残差,反映了实验观测值yi与 拟合直线计算值的偏离程度 y
(xi,yi) *
*
i
*
* * *
*
ˆ ( xi , yi )
x • 通常采用残差平方和最小的原则来确定回归直线,也就 是说,回归直线应是所有直线中残差平方和Q最小的一条
0 2i
x0,令x0=1, 2 x0 矩阵各项值 未变,但形 x0 x1i 式变得很有 x0 x2 i 规律
x x x x x
0 2 1i 1i
1i
2i
x x x x x
• 可用高斯消去法求正规方程组,得到模型系数C0,C1,C2 • 同样方法可推广到二元以上的多元线性拟合,如对有4个自 变量的四元线性拟合方程,需要确定C0,C1,…,C5 五个模 型系数 • 也可用其它方法求解多元线性模型正规方程组
• 多元线性拟合可用两种方式进行检验 1、用复相关系数检验拟合效果好坏的指标,计算式与一元 线性拟合类似 m m
R S回 / S总
( yi y )2 / ( yi y )2 ˆ
i 1 i 1
2、用 F 检验,计算一个 F 比值,与F分布临界值比较
i 1
•相关系数 R
S回 S总
Lxy Lxx Lyy
由于S总>=S回,有R2<=1
• 相关系数 R 用于评价两个变量间的线性相关程度
•R的取值情况: ① R = 0 ,表明原离散函数 x 与 y 之间不存在线性关系,称 为线性无关; ② 0 < |R| < 1 ,x 与 y 存在线性关系 |R|越接近于1,线性相关性越大; ˆ R<<1,说明yi与yi 偏离大,回归直线不能代表原离散函数; ③ |R| = 1 ,所有数据点都在回归直线上,称完全线性相关, 表明 x 和 y 有确定的函数关系 • 显著性检验——只有当相关系数 R 的绝对值达到一定值时 才可用回归直线表示 x 与 y 的关系 • 相关函数R与显著性水平的关系表(表4-2) • R的临界值——与观测次数m及显著性水平有关 • m-2: 自由度 :信度,0.05和0.01,代表显著性水平 • 若 R小于 =0.05 时的值,不显著,反之则显著(以*表示) • 若R大于= 0.01时的值,高度显著(以**表示);#
例题4-2 某矾土矿物成分用x表示,SiO2用y表示,实验数 据如下,已知x和y间存在线性关系,试计算a和b并进行相 关系数检验
X Y 67 24 54 15 72 23 64 19 39 16 22 11 58 20 43 16 46 17 34 13
解 本例除观测数据不同外,程序与例4-1完全相同,只需将 例4-1程序中x和y数据按本题数据改写即可。 请同学们自己上机练习 运行后输出 a=5.4366346 alpha =0.01 alpha =0.05
正规方 程组
整理 可得
mC 0 C1 x1i C 2 x 2 i yi 2 C 0 x1i C1 x1i C 2 x1i x2 i x1i yi 2 C 0 x 2 i C1 x1i x2 i C 2 x2 i x 2 i yi
2 ˆ ˆ S总=Lyy= ( yii y )2 ( yi yi )2 ( yi y )2 1 ii1 i 1 i 1 m m m m
• 残差平方和S残——实验观测 值与拟合方程计算值的偏差 • S残产生原因:因实验误差或 其它原因造成的 • 反映了除回归关系以外的其 它“剩余因素”的影响,又称 剩余平方和 #
• 最佳选择应该是所有点的残差|△i| 之和最小
ˆ Q ( yi yi ) 2 ( yi a bxi )2 min
i 1 i 1
m
m
• 最小二乘原理——使所求近似函数或回归直线的残差平 方和最小。#
ˆ Q ( yi yi ) ( yi a bxi )2 min • 残差平方和
w/g· l-1
w1
w2
w3
w4பைடு நூலகம்
w5
w6
w7
w7
解: 作图知 t 和w 大致呈直线关系,但无论怎样划线,也不能 使直线通过所有的点,总会存在误差. * • 问题:选那一条线最好?(怎样 * 取直线的截距a和斜率b?) * w/g· l-1 * • 所选直线的 * ˆ a bt w 方程写为 * • 目标: 希望选择的线与观测数据 * 之间的误差最小. # t/oC
•
本节讨论:最小二乘法、一元线性拟合、显著性检验、 多元线性拟合 #
4.1 一元线性拟合 4.1.1 最小二乘原理 • 例:实验测得不同温度下的8组数据如下表,现希望根据实 验数据建立溶解度w与溶液温度t的数学表达式 j 1 2 3 4 5 6 7 8
t/oC t1 t2 t3 t4 t5 t6 t7 t8