实验数据数学建模方法研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在保证其他几何参数不变的情况下, 研究长度 与挠度之间的变化规律。板的数据如表 2 所示。
应用表 1 数学模型进行曲线估计, 得出的统计 量列于表 3。
应用表 1 各数学模型所获得的板长与挠度关系 曲线如图所示。
邓燕萍, 等: 实验数据数学建模方法研究
# 21 #
板长 ( m) 12 10
8
6
表 2 钢板尺寸与挠度关系
之间的关系。最终结果如表 4。
表 4 模型形式
几何参数 模型名称 方程
线性回归模型
板长 板宽 曲率半径 厚度
乘幂 乘幂 乘幂 线性
y = b0 tb1 y = b0 tb1 y = b0 tb1 y = b0 + b1 t
lny = lnb0 + b1 lnt lny = lnb0 + b1 lnt lny = lnb0 + b1 lnt
有较大的影响力。
3. 3 多元线性回归分析的检验
建立了多元回归模型后, 需要进行显著性检验, 以确认建立的数学模型是否很 好地拟合了原 始数
造 船 技 术 2006 年第 3 期( 总第 271 期)
据, 即该回归方程是否有效。利用残差分析, 确定回 归方程是否违反了假设理论。对方程式中各自变量 的系数进行检验。其假设是, 总体的回归方程自变 量系数或常数项为 0, 以便在回归方程中保留那些 对该因变量 y 值预测更为有效的自变量。 3. 3. 1 方差分析
主题词 数据分析 数学模型 曲线 求律法 多元分析 曲面 船壳板 成形
1 引言
实验是各研究领域的研究者通常为发现关于一 个特定过程或系统的某些规律所进行的科学实践工 作。它是对一个过程或系统的输入变量作一些有目 的的改变, 以使能够观察到和识别出引起输入相应 变化的缘由。实验中一项必不可少的工作就是实验 数据分析。为了更好地描述实验中各实验参数与实 验结果之间的关系, 我们通常建立实验数据的数学 模型。如何迅速准确地找出各实验参数与实验结果 的关系, 如何建立一个更准确的数学模型, 这是本文 所研究的工作。
从以上各模型都可以看出, 方差分析的结果: 显 著水平小于或等于 0. 01 的模型有乘幂、复合、增长、 指数以及三次各模型, 这些模型均具有统计意义。
从图形比较分析: 各图形符合都很好, 但乘幂的 较好。
从统计量对比分析: 比较模型的修正 R2 值。大 多数模型都大于 0. 9, 最好的达到 0. 9999 以上的只 有乘幂模型。比较 F 值,
2 曲线估计的基本思想
2. 1 一般概念 线性回归可以满足很多数据分析, 然而线性回
归不会对所有问题都适用, 因为有时因变量和自变 量是通过一个已知或未知的非线性函数关系相联系 的。尽管有可能通过一些函数的转换, 在一定范围 内将它们转变为线性, 但这种转换有可能导致更为 复杂的计算和失真。
在很多情况下有两个相关的变量, 我们希望利 用其中的一个变量对另一个变量进行预测。预测可 采用的方法很多, 从简单的直线到复杂的时间序列 模型。如果不能马上根据专业知识或是观测量数据 本身的特点确定一种最佳模型, 那么, 可以利用曲线
邓燕萍, 等: 实验数据数学建模方法研究
# 19 #
实验数据数学建模方法研究
邓燕萍, 周波, 刘玉君, 汪骥, 郭培军
( 大连理工大学 船舶工程 学院, 辽宁 大连 116024)
提 要 阐述了曲线估计 的基本思 想和多元线 性 回归的概念, 介绍一 种利 用二者 相结 合的 实验 数据 建 模方法, 以实船板实验数据为例, 建立船体 外板自重 成 形的数学模型, 实测分析表明, 预报结果与 实验结果 符 合较好。
进行多元线性回归, 可以得出模型中各待定系
数, 建立以板厚为基准的系列模型。
4. 4 模型计算结果
下面是以板厚为 0. 018m、曲率半径为 11m 的
在这里, 零阶相关系数( ZeroOOrder ) 表 示各自
变量与因变量之间的简单相关的系数。
部分相关 系数( Part Co rrect ion) 表示, 在排 除
了其他变量的影响后, 自变量 x i 与因变量 y 之间的
相关程度。部分相关系数小于偏相关系数。偏相关
系数也可以用来作为筛选自变量的指标, 即通过比 较偏相关系数的大小, 判别哪些自变量对因变量具
F乘幂 = 374 49, F三次 = 5 026. 33 , F指数 = 164. 76, F复合 = 164. 76 , F增长 = 164. 76。 由此可见, 相对更好的是乘幂模型。 综合考虑, 为了以后结合其他参数建立模型, 所 以在保证准确的基础上, 尽量保证形式一致。最后 选择了乘幂模型。 4. 2 各参数与挠度之间的关系 同理, 应用曲线估计, 可以得出其他参数与挠度
表 3 板长数学模 型统计量
判定系数 R2
修正 R2
0. 921 05
0. 881 58
0. 999 16
0. 997 48
0. 988 01
0. 982 01
0. 988 01
0. 982 01
0. 858 46
0. 787 69
0. 999 90
0. 999 70
0. 997 92
0. 997 40
3. 2 多元线性回归中的统计指标 3. 2. 1 复相关系数 R
复相关系数是表示自变量 x i 与因变量 y 之间 线性关系密切程度的指标。复相关系数使用字母 R 表示, 取值范围在 0~ 1 之间。其值越接近 1, 表示 线性关系越强; 越接近 0, 表示线性关系越差。 3. 2. 2 判定系数 R2 与修正判定系数
与一元回归方程的检验相同, 多元回归方程也 采用方差分析方法对回归方程进行检验。检验的假 设是, 总体的回归系数均为 0 或都不为 0。它使用 统计量 F 对这个回归方程的显著性进行检验, 其原 理与一元回归方程分析相同。 3. 3. 2 偏回归系数与常数项的检验
检验的假设是, 总体中回归方程各自变量偏回 归系数为 0, 常数项为 0。检验使用统计量 t 。偏回 归系数和常数项的 t 检验公式分别是:
检验的方法多种多样, 其中最直观、最简单的方 法是残差的直方图和累计概率图。需要指出的是, 希望残差完全服从于正态分布也是不现实的, 即使 存在很理想的总体数据, 其样本的残差分布也只能 是近似于正态分布。
4 计算实例
本文以鞍形实船板的自重成形数据为例, 进行 建模分析。钢板自重成形计算所考虑的主要几何工 艺参数, 如板长、板宽、板厚、曲率半径, 对成形效果 影响很大。 4. 1 板长与挠度之间的关系
# 20 #
3. 1 多元线性回归的概念 根据多个自变量的最优组合建立回归方程来预
测因变量的回归分析, 称为多元回归分析。多元回 归分析的模型为
y^ = b0 + b1 x 1 + b2 x 2 + ,+ bn x n , 其中 y^ 为根据所有自变量 x 计算出的估计量, b0 为
常数项, b1 , b2 , ,bn 称为 y 对应于 x 1 , x 2 , ,, x n 的 偏回归系数。偏回归系数表示, 假设在其他所有自 变量不变的情况下, 某一个自变量变化引起因变量 变化的比率。
板宽 ( m)
厚度 ( m)
曲率半径 ( m)
挠度 ( m)
2
0. 014
7
0. 180 380
2
0. 014
7
0. 083 737
2
0. 014
7
0. 032 383
2
0. 014
7
0. 009 278
各模型所获得的曲线
模型名称 线性 二次 复合 增长 对数 三次 指数 倒数 乘幂
复相关系数 R 0. 959 71 0. 999 58 0. 993 99 0. 993 99 0. 926 53 0. 999 95 0. 998 96 0. 885 28 0. 999 97
lny 0 = lnA0 + A1 ln L 0 + A2 ln D 0 + A3 ln R0 ,
令 lny 0 = Y ,
ln L 0 = X 1 ,
ln D0 = X 2 ,
ln R0 = X 3,
ln A0 = B0 ,
A1 = B1 ,
A2 = B2 ,
A3 = B3 ,
则式( 2) 变为
Y = B 0 + B1 X 1 + B2 X 2 + B3 X 3 。 ( 3)
4. 3 建立回归模型
选择以板厚为基准建立系列模型, 模型形式为
y = A0 L A1 D A2 R A3 ,
( 1)
式中 y ) ) ) 中面最大挠度, mm;
L ) ) ) 板长, m;
D ) ) ) 板宽, m;
R ) ) ) 板的曲率半径, m; A0 , A1 , A2 , A3 ) ) ) 关系系数, A0 包 含扰 动误
作者简介: 邓燕萍( 1950- ) , 女, 高级工程师。
估计在众多的回归模型中建立一个简单而又比较合 适的模型。 2. 2 数学模型
在充分了解计算数据的情况下, 可以直接根据 数据的特点选择相应的函数作为拟合模型。但是, 在大多数情况下, 对变量之间关系的认识往往模糊 不清, 需要先绘制散点图, 然后再根据 数据分布特 点, 确定应采用的模型。由于有些函数的图形十分 接近, 可能在模型选择上产生疑虑, 为此可以指定几 个模型进行拟合。根据输出的统计量( 例如 R2 值) 结合图形综合考虑, 确定最佳模型。表 1 所列为部 分选用的数学模型。
模型 名称
表 1 数学模型
回归方程
线性回归模型
线性
y = b0 + b1 t
二次
y = b0 + b1 t + b2 t2
复合
y = b0 bt1
增长 y = exp( b0 + b1 t)
对数
y = b0 + b1 lnt
三次 y = b0 + b1 t + b2 t2 + b3 t3
指数பைடு நூலகம்
y = b0 ex p( b1 t)
E 修正 R 2 = 1 -
( y - y^ ) 2 / ( n - k - 1) ,
E ( y - y½) / ( n - 1)
其中 k 为自变量的个数, n 为观测量数目。可以看
出, 自变量大于 1 时, 其值小于判定系数。自变量数
越多, 与判定系数的差值越大。
3. 2. 3 零阶相关系数部分相关系数与偏相关系数
与一元回归方程相同, 多元回归也使用判定系 数 R2 来解释回归模型自变量的变异所占的比率。
但是, 判定系数的值随着进入回归方程的自变
量的个数 n ( 或样本容量的大小) 的增加而增大。因 此, 为了消除自变量的个数以及样本量的大小对判 定系数的影响, 引进了经修正的判定系数/ 修正 R 20 值( Adjust ed R Square) 的概念。修正 R2 值的公式 是:
偏回归系数 t = 偏回归系数的标准差;
t = 常数常项数的项标准差。 3. 3. 3 方差齐性分析
方差齐性是指残差的分布是常数, 与自变量或 因变量无关。即残差应随机地分布在一条穿过零点 的水平直线的两侧。在实际应用中, 一般是绘制因 变量预测值与生化残差的散点图。 3. 3. 4 残差的正态性检验
倒数
y = b0 + ( b1/ t)
乘幂
y = b0 tb1
lny = lnb0 + ( lnb1) t lny = b0 + b1 t
lny = lnb0 + b1 t lny = lnb0 + b1 lnt
3 多元线性回归简介
应用曲线估计可以在众多的回归模型中选择一 个简单而又比较合适的模 型。当回归 模型确定之 后, 下一步就是求回归模型中未知的参数。对于许 多非线性回归模型, 可通过变量的变换, 把非线性模 型化为线性模型, 然后用最小二乘法求出参数之值。 下面简单介绍 一下多元线性回归分析 的理论和求 解。
0. 783 71
0. 675 57
0. 999 95
0. 999 92
F 23. 33 595. 60 164. 76 164. 76 12. 13 5 026. 33 164. 76 7. 25 37 449. 00
显 著水平 0. 0403 0. 0290 0. 0060 0. 0060 0. 0735 0. 0100 0. 0060 0. 1147 0. 0000
差项。
下面利用板厚 t 对各参数以及成形挠度进行无
因次化, 方程变成如下形式:
# 22 #
造 船 技 术 2006 年第 3 期( 总第 271 期)
y 0 = A0 L 0A1 D A02 RA03 ,
( 2)
式中 y0 = y / t,
L 0 = L / t,
D0 = D/ t, R0 = R/ t。
应用表 1 数学模型进行曲线估计, 得出的统计 量列于表 3。
应用表 1 各数学模型所获得的板长与挠度关系 曲线如图所示。
邓燕萍, 等: 实验数据数学建模方法研究
# 21 #
板长 ( m) 12 10
8
6
表 2 钢板尺寸与挠度关系
之间的关系。最终结果如表 4。
表 4 模型形式
几何参数 模型名称 方程
线性回归模型
板长 板宽 曲率半径 厚度
乘幂 乘幂 乘幂 线性
y = b0 tb1 y = b0 tb1 y = b0 tb1 y = b0 + b1 t
lny = lnb0 + b1 lnt lny = lnb0 + b1 lnt lny = lnb0 + b1 lnt
有较大的影响力。
3. 3 多元线性回归分析的检验
建立了多元回归模型后, 需要进行显著性检验, 以确认建立的数学模型是否很 好地拟合了原 始数
造 船 技 术 2006 年第 3 期( 总第 271 期)
据, 即该回归方程是否有效。利用残差分析, 确定回 归方程是否违反了假设理论。对方程式中各自变量 的系数进行检验。其假设是, 总体的回归方程自变 量系数或常数项为 0, 以便在回归方程中保留那些 对该因变量 y 值预测更为有效的自变量。 3. 3. 1 方差分析
主题词 数据分析 数学模型 曲线 求律法 多元分析 曲面 船壳板 成形
1 引言
实验是各研究领域的研究者通常为发现关于一 个特定过程或系统的某些规律所进行的科学实践工 作。它是对一个过程或系统的输入变量作一些有目 的的改变, 以使能够观察到和识别出引起输入相应 变化的缘由。实验中一项必不可少的工作就是实验 数据分析。为了更好地描述实验中各实验参数与实 验结果之间的关系, 我们通常建立实验数据的数学 模型。如何迅速准确地找出各实验参数与实验结果 的关系, 如何建立一个更准确的数学模型, 这是本文 所研究的工作。
从以上各模型都可以看出, 方差分析的结果: 显 著水平小于或等于 0. 01 的模型有乘幂、复合、增长、 指数以及三次各模型, 这些模型均具有统计意义。
从图形比较分析: 各图形符合都很好, 但乘幂的 较好。
从统计量对比分析: 比较模型的修正 R2 值。大 多数模型都大于 0. 9, 最好的达到 0. 9999 以上的只 有乘幂模型。比较 F 值,
2 曲线估计的基本思想
2. 1 一般概念 线性回归可以满足很多数据分析, 然而线性回
归不会对所有问题都适用, 因为有时因变量和自变 量是通过一个已知或未知的非线性函数关系相联系 的。尽管有可能通过一些函数的转换, 在一定范围 内将它们转变为线性, 但这种转换有可能导致更为 复杂的计算和失真。
在很多情况下有两个相关的变量, 我们希望利 用其中的一个变量对另一个变量进行预测。预测可 采用的方法很多, 从简单的直线到复杂的时间序列 模型。如果不能马上根据专业知识或是观测量数据 本身的特点确定一种最佳模型, 那么, 可以利用曲线
邓燕萍, 等: 实验数据数学建模方法研究
# 19 #
实验数据数学建模方法研究
邓燕萍, 周波, 刘玉君, 汪骥, 郭培军
( 大连理工大学 船舶工程 学院, 辽宁 大连 116024)
提 要 阐述了曲线估计 的基本思 想和多元线 性 回归的概念, 介绍一 种利 用二者 相结 合的 实验 数据 建 模方法, 以实船板实验数据为例, 建立船体 外板自重 成 形的数学模型, 实测分析表明, 预报结果与 实验结果 符 合较好。
进行多元线性回归, 可以得出模型中各待定系
数, 建立以板厚为基准的系列模型。
4. 4 模型计算结果
下面是以板厚为 0. 018m、曲率半径为 11m 的
在这里, 零阶相关系数( ZeroOOrder ) 表 示各自
变量与因变量之间的简单相关的系数。
部分相关 系数( Part Co rrect ion) 表示, 在排 除
了其他变量的影响后, 自变量 x i 与因变量 y 之间的
相关程度。部分相关系数小于偏相关系数。偏相关
系数也可以用来作为筛选自变量的指标, 即通过比 较偏相关系数的大小, 判别哪些自变量对因变量具
F乘幂 = 374 49, F三次 = 5 026. 33 , F指数 = 164. 76, F复合 = 164. 76 , F增长 = 164. 76。 由此可见, 相对更好的是乘幂模型。 综合考虑, 为了以后结合其他参数建立模型, 所 以在保证准确的基础上, 尽量保证形式一致。最后 选择了乘幂模型。 4. 2 各参数与挠度之间的关系 同理, 应用曲线估计, 可以得出其他参数与挠度
表 3 板长数学模 型统计量
判定系数 R2
修正 R2
0. 921 05
0. 881 58
0. 999 16
0. 997 48
0. 988 01
0. 982 01
0. 988 01
0. 982 01
0. 858 46
0. 787 69
0. 999 90
0. 999 70
0. 997 92
0. 997 40
3. 2 多元线性回归中的统计指标 3. 2. 1 复相关系数 R
复相关系数是表示自变量 x i 与因变量 y 之间 线性关系密切程度的指标。复相关系数使用字母 R 表示, 取值范围在 0~ 1 之间。其值越接近 1, 表示 线性关系越强; 越接近 0, 表示线性关系越差。 3. 2. 2 判定系数 R2 与修正判定系数
与一元回归方程的检验相同, 多元回归方程也 采用方差分析方法对回归方程进行检验。检验的假 设是, 总体的回归系数均为 0 或都不为 0。它使用 统计量 F 对这个回归方程的显著性进行检验, 其原 理与一元回归方程分析相同。 3. 3. 2 偏回归系数与常数项的检验
检验的假设是, 总体中回归方程各自变量偏回 归系数为 0, 常数项为 0。检验使用统计量 t 。偏回 归系数和常数项的 t 检验公式分别是:
检验的方法多种多样, 其中最直观、最简单的方 法是残差的直方图和累计概率图。需要指出的是, 希望残差完全服从于正态分布也是不现实的, 即使 存在很理想的总体数据, 其样本的残差分布也只能 是近似于正态分布。
4 计算实例
本文以鞍形实船板的自重成形数据为例, 进行 建模分析。钢板自重成形计算所考虑的主要几何工 艺参数, 如板长、板宽、板厚、曲率半径, 对成形效果 影响很大。 4. 1 板长与挠度之间的关系
# 20 #
3. 1 多元线性回归的概念 根据多个自变量的最优组合建立回归方程来预
测因变量的回归分析, 称为多元回归分析。多元回 归分析的模型为
y^ = b0 + b1 x 1 + b2 x 2 + ,+ bn x n , 其中 y^ 为根据所有自变量 x 计算出的估计量, b0 为
常数项, b1 , b2 , ,bn 称为 y 对应于 x 1 , x 2 , ,, x n 的 偏回归系数。偏回归系数表示, 假设在其他所有自 变量不变的情况下, 某一个自变量变化引起因变量 变化的比率。
板宽 ( m)
厚度 ( m)
曲率半径 ( m)
挠度 ( m)
2
0. 014
7
0. 180 380
2
0. 014
7
0. 083 737
2
0. 014
7
0. 032 383
2
0. 014
7
0. 009 278
各模型所获得的曲线
模型名称 线性 二次 复合 增长 对数 三次 指数 倒数 乘幂
复相关系数 R 0. 959 71 0. 999 58 0. 993 99 0. 993 99 0. 926 53 0. 999 95 0. 998 96 0. 885 28 0. 999 97
lny 0 = lnA0 + A1 ln L 0 + A2 ln D 0 + A3 ln R0 ,
令 lny 0 = Y ,
ln L 0 = X 1 ,
ln D0 = X 2 ,
ln R0 = X 3,
ln A0 = B0 ,
A1 = B1 ,
A2 = B2 ,
A3 = B3 ,
则式( 2) 变为
Y = B 0 + B1 X 1 + B2 X 2 + B3 X 3 。 ( 3)
4. 3 建立回归模型
选择以板厚为基准建立系列模型, 模型形式为
y = A0 L A1 D A2 R A3 ,
( 1)
式中 y ) ) ) 中面最大挠度, mm;
L ) ) ) 板长, m;
D ) ) ) 板宽, m;
R ) ) ) 板的曲率半径, m; A0 , A1 , A2 , A3 ) ) ) 关系系数, A0 包 含扰 动误
作者简介: 邓燕萍( 1950- ) , 女, 高级工程师。
估计在众多的回归模型中建立一个简单而又比较合 适的模型。 2. 2 数学模型
在充分了解计算数据的情况下, 可以直接根据 数据的特点选择相应的函数作为拟合模型。但是, 在大多数情况下, 对变量之间关系的认识往往模糊 不清, 需要先绘制散点图, 然后再根据 数据分布特 点, 确定应采用的模型。由于有些函数的图形十分 接近, 可能在模型选择上产生疑虑, 为此可以指定几 个模型进行拟合。根据输出的统计量( 例如 R2 值) 结合图形综合考虑, 确定最佳模型。表 1 所列为部 分选用的数学模型。
模型 名称
表 1 数学模型
回归方程
线性回归模型
线性
y = b0 + b1 t
二次
y = b0 + b1 t + b2 t2
复合
y = b0 bt1
增长 y = exp( b0 + b1 t)
对数
y = b0 + b1 lnt
三次 y = b0 + b1 t + b2 t2 + b3 t3
指数பைடு நூலகம்
y = b0 ex p( b1 t)
E 修正 R 2 = 1 -
( y - y^ ) 2 / ( n - k - 1) ,
E ( y - y½) / ( n - 1)
其中 k 为自变量的个数, n 为观测量数目。可以看
出, 自变量大于 1 时, 其值小于判定系数。自变量数
越多, 与判定系数的差值越大。
3. 2. 3 零阶相关系数部分相关系数与偏相关系数
与一元回归方程相同, 多元回归也使用判定系 数 R2 来解释回归模型自变量的变异所占的比率。
但是, 判定系数的值随着进入回归方程的自变
量的个数 n ( 或样本容量的大小) 的增加而增大。因 此, 为了消除自变量的个数以及样本量的大小对判 定系数的影响, 引进了经修正的判定系数/ 修正 R 20 值( Adjust ed R Square) 的概念。修正 R2 值的公式 是:
偏回归系数 t = 偏回归系数的标准差;
t = 常数常项数的项标准差。 3. 3. 3 方差齐性分析
方差齐性是指残差的分布是常数, 与自变量或 因变量无关。即残差应随机地分布在一条穿过零点 的水平直线的两侧。在实际应用中, 一般是绘制因 变量预测值与生化残差的散点图。 3. 3. 4 残差的正态性检验
倒数
y = b0 + ( b1/ t)
乘幂
y = b0 tb1
lny = lnb0 + ( lnb1) t lny = b0 + b1 t
lny = lnb0 + b1 t lny = lnb0 + b1 lnt
3 多元线性回归简介
应用曲线估计可以在众多的回归模型中选择一 个简单而又比较合适的模 型。当回归 模型确定之 后, 下一步就是求回归模型中未知的参数。对于许 多非线性回归模型, 可通过变量的变换, 把非线性模 型化为线性模型, 然后用最小二乘法求出参数之值。 下面简单介绍 一下多元线性回归分析 的理论和求 解。
0. 783 71
0. 675 57
0. 999 95
0. 999 92
F 23. 33 595. 60 164. 76 164. 76 12. 13 5 026. 33 164. 76 7. 25 37 449. 00
显 著水平 0. 0403 0. 0290 0. 0060 0. 0060 0. 0735 0. 0100 0. 0060 0. 1147 0. 0000
差项。
下面利用板厚 t 对各参数以及成形挠度进行无
因次化, 方程变成如下形式:
# 22 #
造 船 技 术 2006 年第 3 期( 总第 271 期)
y 0 = A0 L 0A1 D A02 RA03 ,
( 2)
式中 y0 = y / t,
L 0 = L / t,
D0 = D/ t, R0 = R/ t。