试验设计与数据处理(第二版)-李云雁(全书ppt)
合集下载
试验误差的分析及数据处理
x n x1 x2 xn
例 1:某工厂测定含铬废水浓度的结果如下表,试计算其
平均浓度。
铬(mg/L) 0.3 0.4 0.5 0.6 0.7
出现次数 3 5
7
7
5
x 0.33 0.45 0.57 0.67 0.75 35775
=0.52(mg/L)
例 2:某印染厂、各类污水的 BOD5 测定结果如下表,试 计算该厂污水平均浓度。
污水类型
BOD5 ( mg/L)
污水流量 ( m3 /d)
退浆污水
4000
15
煮布锅污水
10000
8
印染污水
400
1500
漂白污水
70
900
解:
x
4000 15
10000 8 400 1500 15 8 1500 900
70
900
=331.4(mg/L)
2.直接测量值与间接测量值
直接测量值就是通过仪器直接测试读数得到的数据。
精密度(precision)是平行测量的各测量值(实验值)之间 互相接近的程度。 用偏差表示,偏差为测定值与平均值之 差,偏差可分为:绝对偏差(d)与相对偏差(dr)平均偏差、 相对平均偏差、标准偏差、相对标准偏差等:
(1)绝对偏差(d): d X i X
(2)相对偏差(dr)为绝对偏差与平均值之比,常用百分率
正确度反映系统误差的大小的程度。如观测的系统误 差小,则称观测的正确度高。可以使用更精确的仪器 来提高观测的精密度。 精确度反映偶然误差与系统误差合成的综合误差大小 的程度。 对于测量来说,精密度高,正确度不一定高;同 样,正确度高,精密度也不一定高;精确度高,则精 密度和正确度都高。
例如:甲、乙、丙、丁四个人同时用碘量法测定某铜矿中CuO含 量(真实含量为37.40)测定4次,其结果如下图所示:分析此 结果精密度与正确度的关系。
例 1:某工厂测定含铬废水浓度的结果如下表,试计算其
平均浓度。
铬(mg/L) 0.3 0.4 0.5 0.6 0.7
出现次数 3 5
7
7
5
x 0.33 0.45 0.57 0.67 0.75 35775
=0.52(mg/L)
例 2:某印染厂、各类污水的 BOD5 测定结果如下表,试 计算该厂污水平均浓度。
污水类型
BOD5 ( mg/L)
污水流量 ( m3 /d)
退浆污水
4000
15
煮布锅污水
10000
8
印染污水
400
1500
漂白污水
70
900
解:
x
4000 15
10000 8 400 1500 15 8 1500 900
70
900
=331.4(mg/L)
2.直接测量值与间接测量值
直接测量值就是通过仪器直接测试读数得到的数据。
精密度(precision)是平行测量的各测量值(实验值)之间 互相接近的程度。 用偏差表示,偏差为测定值与平均值之 差,偏差可分为:绝对偏差(d)与相对偏差(dr)平均偏差、 相对平均偏差、标准偏差、相对标准偏差等:
(1)绝对偏差(d): d X i X
(2)相对偏差(dr)为绝对偏差与平均值之比,常用百分率
正确度反映系统误差的大小的程度。如观测的系统误 差小,则称观测的正确度高。可以使用更精确的仪器 来提高观测的精密度。 精确度反映偶然误差与系统误差合成的综合误差大小 的程度。 对于测量来说,精密度高,正确度不一定高;同 样,正确度高,精密度也不一定高;精确度高,则精 密度和正确度都高。
例如:甲、乙、丙、丁四个人同时用碘量法测定某铜矿中CuO含 量(真实含量为37.40)测定4次,其结果如下图所示:分析此 结果精密度与正确度的关系。
实验设计与数据处理ppt
一.实验误差分析
二.实验数据整理
三.实验数据分析(直观分析法、方差分析、 回归分析)
一.郑少华、姜奉华《试验设计与数据处理》,中国建材工业出版社,2004年3月第 1版,51.727/Z429
(适合材料科学与工程、化工、机械、农业、医药等专业) 一.方萍、何延《试验设计与统计》,浙江大学出版社,2003年6月第1版 (适合环境与资源相关专业、生命科学、农业科学、医学) 一.[美]Douglas C.Montgomery著《实验设计与分析》 中国统计出版社,1998年6月第1版(电工等专业 ) 一.杨德《试验设计与分析》,中国农业出版社 二.王万中《试验的设计与分析》,高等教育出版社
(一)实验的分类
验证性实验:对已知的理论进行验 证,以加深对理论的认识
探索性实验:为了揭示尚未完全认 识的事物,发现其发生与发展的规 律,以完成工程与科研任务,具有 很强的探索性 (工程中经常碰到)
• 实验准备→实验→实验数据分析处理
• 1.实验准备 ①提出问题,弄清实验目标 ②设计实验方案(实验设计) ③拟订实验大纲 ④实验设备、测试仪器的准备
因素也称为因子, 它是在进行实验 时重点考察的内 容。
因素一般用大写 字母ABC……来标 记,如因素A、因 素B、因素C等。
因素分类:
1. 可控因素(温 度、时间、种 类、浓度……)
2. 不可控因素 (风速、气 温、……)
② 选择因素的原则
01
抓住主要因素(将影响较大的因素选入试验)同时要考虑
最大限度地提高实验效率
最大限度地提高实验精度
对实验过程优化的方法
B
3.实验设计基本要素
指标——因素——02源自用来衡量试验效果好坏的特征值。
试验设计与数据处理-李云雁-全套 第1章 误差分析
(2)三者关系
有系统误差的试验
精密度 :A' > B' > C'
准确度: A '> B '> C ' ,A ' >B,C
1.5 试验数据误差的统计假设检验
1.5.1 随机误差的检验 2 检验( 2 -test) 1.5.1.1
(1)目的: 在试验数据的总体方差 2 已知的情况下, 对试验数据的随机误差或精密度进行检验。 (2)检验步骤:
2 (n1 1) s12 ( n2 1) s2 s n1 n2 2
两组数据的精密度或方差有显著差异时
t
x1 x2
2 s12 s2 n1 n2
服从t分布,其自由度为:
2 ( s12 n1 s2 n2 )2 df 2 2 2 2 2 ( s1 n1 ) ( s2 n2 ) (n1 1) (n2 1)
说明:
若数据的分布具有对数特性,则宜使用对数平均值 对数平均值≤算术平均值 如果1/2≤x1/x2≤2 时,可用算术平均值代替
(4)几何平均值(geometric mean) 设有n个正试验值:x1,x2,…,xn,则
xG
n
x1 x2 ...xn ( x1 x2 ...xn )
(2)说明:
可以通过增加试验次数而达到提高数据精密度的目的 试验数据的精密度是建立在数据用途基础之上的 试验过程足够精密,则只需少量几次试验就能满足要求
(3)精密度判断
①极差(range)
R xmax xmin
②标准差(standard error)
n n
R↓,精密度↑
( xi x)
1 n
当一组试验值取对数后所得数据的分布曲线更加对称 时,宜采用几何平均值。 几何平均值≤算术平均值
实验设计与数据处理.ppt
能对试验结果进行预测和优化; • 试验因素对试验结果的影响规律,为控制试验提供思路; • 确定最优试验方案或配方。
参考文献
1. 水处理实验技术.李燕城.中国建筑工业 出版社.
2. 试验设计与数据处理.李云雁等.化学工 业出版社:2005.2 O212.6-43/2
3. 实验设计与数据处理.刘振学等.化学工 业出版社:2005.3 O212.6-43/1
实验设计与数据处理
引言
• 新产品、新工艺、新材料、新品种及其他 科研成果产生流程
多次反复试验
提高产量
试验数据分析
提高产品性能
规律研究
降低成本能耗
• 科研工作的必要手段——试验
实验和试验
实验
已知某个结论去 验证 已知方法的操作 验证性
试验
未知某个结论去 探索 未知方法的探索 探索性
试验设计方法起源 1980s
• 3.水平:因素在试验中所处的不同状态,可 能引起指标的变化。
• 选择原则:
• 宜选择三水平; • 水平是等间隔的; • 水平是具体的;
• 在技术上现实可行。
试验设计的方法
• 针对不同的具体情况,有不同的试验设计方法。 • 单因素试验设计 • 多因素试验设计 • 正交试验设计
• 各种试验方法的目的、出发点各不相同。
• 2.因素:对试验指标有影响的原因或要素,又称 因子,在试验时重点考察的内容,一般用大写字 母A、B、C标记。
• (1)分类:
• A.可控因素:温度、时间、浓度等
• B.不可控因素:风速、气压、气温等
• (2)选择原则:
• A.抓住主要因素,并且考虑各因素之间的交互作 用。
• B.找出非主要因素,使其在试验中保持不变,以 消除其干扰作用。
参考文献
1. 水处理实验技术.李燕城.中国建筑工业 出版社.
2. 试验设计与数据处理.李云雁等.化学工 业出版社:2005.2 O212.6-43/2
3. 实验设计与数据处理.刘振学等.化学工 业出版社:2005.3 O212.6-43/1
实验设计与数据处理
引言
• 新产品、新工艺、新材料、新品种及其他 科研成果产生流程
多次反复试验
提高产量
试验数据分析
提高产品性能
规律研究
降低成本能耗
• 科研工作的必要手段——试验
实验和试验
实验
已知某个结论去 验证 已知方法的操作 验证性
试验
未知某个结论去 探索 未知方法的探索 探索性
试验设计方法起源 1980s
• 3.水平:因素在试验中所处的不同状态,可 能引起指标的变化。
• 选择原则:
• 宜选择三水平; • 水平是等间隔的; • 水平是具体的;
• 在技术上现实可行。
试验设计的方法
• 针对不同的具体情况,有不同的试验设计方法。 • 单因素试验设计 • 多因素试验设计 • 正交试验设计
• 各种试验方法的目的、出发点各不相同。
• 2.因素:对试验指标有影响的原因或要素,又称 因子,在试验时重点考察的内容,一般用大写字 母A、B、C标记。
• (1)分类:
• A.可控因素:温度、时间、浓度等
• B.不可控因素:风速、气压、气温等
• (2)选择原则:
• A.抓住主要因素,并且考虑各因素之间的交互作 用。
• B.找出非主要因素,使其在试验中保持不变,以 消除其干扰作用。
试验设计与数据处理教案第二版李云雁试验数据的表图表示公开课一等奖优质课大赛微课获奖课件
第2章 试验数据表图表示法
第1页
2.1 列表法
将试验数据列成表格,将各变量数值依照一定形式和顺序 一一相应起来
(1)试验数据表 ①统计表 试验统计和试验数据初步整理表格 表中数据可分为三类: ➢ 原始数据 ➢ 中间数据 ➢ 最后计算结果数据
第2页
②结果表示表 表示试验结论 应简明扼要
第3页
②依据数据改变情况
两个变量改变幅度都不大,选取普通直角坐标系; 有一个变量最小值与最大值之间数量级相差太大时,能够选取半对数
坐标; 两个变量在数值上均改变了几种数量级,可选取双对数坐标; 在自变量由零开始逐步增大初始阶段,当自变量少许改变引起因变量
极大改变时,此时采用半对数坐标系或双对数坐标系,可使图形轮廓 清楚
超பைடு நூலகம்波法
醇提法 碱提法
植物2 植物1
湿浸法
0 2 4 6 8 10 12 14 16 18 20 提取率(%)
图5 不同提取方法对两种原料有效成份提取率效果比较
第11页
(4)圆形图和环形图
①圆形图(circle chart) 也称为饼图(pie graph) 表示总体中各构成部分所占百
分比 只适合于包括一个数据系列情
②推荐坐标轴百分比常数M=(1、2、5)×10± n (n为正 整数),而3、6、7、8等百分比常数绝不可用; ③纵横坐标之间百分比不一定取得一致,应依据详细情况选择, 使曲线坡度介于30°~60°之间
第23页
例2: 研究pH值对某溶液吸光度A影响,已知pH值测量误 差ΔpH=0.1,吸光度A测量误差ΔA=0.01。在一定波长下, 测得pH值与吸光度A关系数据如表所表示。试在普通直角坐 标系中画出两者间关系曲线。
(2)阐明: 三部分:表名、表头、数据资料 必要时,在表格下方加上表外附加 表名应放在表上方,主要用于阐明表主要内容,为了引用
第1页
2.1 列表法
将试验数据列成表格,将各变量数值依照一定形式和顺序 一一相应起来
(1)试验数据表 ①统计表 试验统计和试验数据初步整理表格 表中数据可分为三类: ➢ 原始数据 ➢ 中间数据 ➢ 最后计算结果数据
第2页
②结果表示表 表示试验结论 应简明扼要
第3页
②依据数据改变情况
两个变量改变幅度都不大,选取普通直角坐标系; 有一个变量最小值与最大值之间数量级相差太大时,能够选取半对数
坐标; 两个变量在数值上均改变了几种数量级,可选取双对数坐标; 在自变量由零开始逐步增大初始阶段,当自变量少许改变引起因变量
极大改变时,此时采用半对数坐标系或双对数坐标系,可使图形轮廓 清楚
超பைடு நூலகம்波法
醇提法 碱提法
植物2 植物1
湿浸法
0 2 4 6 8 10 12 14 16 18 20 提取率(%)
图5 不同提取方法对两种原料有效成份提取率效果比较
第11页
(4)圆形图和环形图
①圆形图(circle chart) 也称为饼图(pie graph) 表示总体中各构成部分所占百
分比 只适合于包括一个数据系列情
②推荐坐标轴百分比常数M=(1、2、5)×10± n (n为正 整数),而3、6、7、8等百分比常数绝不可用; ③纵横坐标之间百分比不一定取得一致,应依据详细情况选择, 使曲线坡度介于30°~60°之间
第23页
例2: 研究pH值对某溶液吸光度A影响,已知pH值测量误 差ΔpH=0.1,吸光度A测量误差ΔA=0.01。在一定波长下, 测得pH值与吸光度A关系数据如表所表示。试在普通直角坐 标系中画出两者间关系曲线。
(2)阐明: 三部分:表名、表头、数据资料 必要时,在表格下方加上表外附加 表名应放在表上方,主要用于阐明表主要内容,为了引用
实验设计与数据处理第二部分
i 1 j 1 i 1 j 1 i 1 j 1
m
k
m
k
I
II
III
式中I项是在同一条件(水平)下,k次实验的数据与其平 均值的偏差平方和,称为组内偏差平方和,因为它反映了 实验过程引起的误差,所以也称误差平方和,用Se表示。
Se ( xij xi )2
i 1 j 1
x1 x2
Am 总和
…
Ai
…
…
xi1
…
…
…
…
Ti
xi
…
xm1 xm2 … xmj … xmk
…
…
…
…
Tm T
…
…
xm x
Ti表示Ai水平下k次实验数据的合计,xi 表示Ai水平下k次实验 数据的算术平均值。
Ti xij
j 1
k
1 k Ti xi xij k j 1 k
共进行了mk次实验,令n=mk,用T表示n个实验值的总和,即
实验室 A B C D (1) 偏差平方和 0.37 0.86 0.63 1.44 0.85 0.98 0.47 1.24 简化数据 0.50 1.04 0.82 1.67 0.92 0.53 0.39 1.04 0.22 0.71 0.77 1.15
Se ( xij xi ) 2
i 1 j 1 m k
ST = Se+ SA =0.9278+1.7044=2.6322
(2) 方差
Se 0.9278 Ve 0.05799 fe 16 SA 1.7044 VA 0.5681 fA 3
m
k
式中II项
2 ( xij xi )( xi x ) 2 ( xi x ) ( xij xi )
m
k
m
k
I
II
III
式中I项是在同一条件(水平)下,k次实验的数据与其平 均值的偏差平方和,称为组内偏差平方和,因为它反映了 实验过程引起的误差,所以也称误差平方和,用Se表示。
Se ( xij xi )2
i 1 j 1
x1 x2
Am 总和
…
Ai
…
…
xi1
…
…
…
…
Ti
xi
…
xm1 xm2 … xmj … xmk
…
…
…
…
Tm T
…
…
xm x
Ti表示Ai水平下k次实验数据的合计,xi 表示Ai水平下k次实验 数据的算术平均值。
Ti xij
j 1
k
1 k Ti xi xij k j 1 k
共进行了mk次实验,令n=mk,用T表示n个实验值的总和,即
实验室 A B C D (1) 偏差平方和 0.37 0.86 0.63 1.44 0.85 0.98 0.47 1.24 简化数据 0.50 1.04 0.82 1.67 0.92 0.53 0.39 1.04 0.22 0.71 0.77 1.15
Se ( xij xi ) 2
i 1 j 1 m k
ST = Se+ SA =0.9278+1.7044=2.6322
(2) 方差
Se 0.9278 Ve 0.05799 fe 16 SA 1.7044 VA 0.5681 fA 3
m
k
式中II项
2 ( xij xi )( xi x ) 2 ( xi x ) ( xij xi )
试验设计和数据处理
此例题说明了对环境问题的分析程序是:提出假设—— 采样——获取数据——分析数据——从样本推断总体。
涉及到的一些基本术语: 总体:欲研究对象的全体,又称母体 个体:组成总体的每个单元为个体(总体单位) 样本:总体的查和观察的结果。
(1)物化性质研究: 一般不常用统计方法;
(2)产品、原料等的常规分析: 系统误差大于随机误差,对误差需进行一定的设计,
若想获得可靠的估计值,最好的方法就是采用统计方法;
(3)材料特性试验: 随机误差较大, 为了获得可靠的估计值,必须从相当
数量的观测值中取均值,凡是涉及此类实验的研究工作, 均需采用统计法的合理设计;
本课程研究内容:
研究如何合理地安排实验,有效地获得实验 数据,然后对实验数据进行综合的科学分析,以 求尽快达到优化实验的目的。
本课程开设的目的:
将数学的纯理论转向实际应用,利用数学工 具解决实际的化学、化工及环境专业问题,无论 是对于目前大家即将面临的专业课学习、毕业论 文实验,还是将来的生产实践,都是很有必要的。
相当多的量是无法用仪表直接测出的,如粉磨效
率、选粉机的效率等。此时只能用间接测量法进 行测量。
(二)间接测量法
把直接测量代入某一特定的函数关系式中,通过计算求出未知 物理量的大小,这种方法——间接测量法。
例如,用毕托管测量气流速度 ,直接测量压差值 h。 计算的特定函数关系式为
式中:
h
——
(4)过程研究:主要涉及的是各种实验条件的优化实验, 需要对各种条件变化对过程的影响进行系统性研究,需要 用到统计法的实验设计与数据处理知识。
本课程的讲授内容安排
(1)数据处理基础:误差理论、数据的表 示方法;
(2)数据处理部分:有限数据的统计处理、 方差分析、回归分析;
涉及到的一些基本术语: 总体:欲研究对象的全体,又称母体 个体:组成总体的每个单元为个体(总体单位) 样本:总体的查和观察的结果。
(1)物化性质研究: 一般不常用统计方法;
(2)产品、原料等的常规分析: 系统误差大于随机误差,对误差需进行一定的设计,
若想获得可靠的估计值,最好的方法就是采用统计方法;
(3)材料特性试验: 随机误差较大, 为了获得可靠的估计值,必须从相当
数量的观测值中取均值,凡是涉及此类实验的研究工作, 均需采用统计法的合理设计;
本课程研究内容:
研究如何合理地安排实验,有效地获得实验 数据,然后对实验数据进行综合的科学分析,以 求尽快达到优化实验的目的。
本课程开设的目的:
将数学的纯理论转向实际应用,利用数学工 具解决实际的化学、化工及环境专业问题,无论 是对于目前大家即将面临的专业课学习、毕业论 文实验,还是将来的生产实践,都是很有必要的。
相当多的量是无法用仪表直接测出的,如粉磨效
率、选粉机的效率等。此时只能用间接测量法进 行测量。
(二)间接测量法
把直接测量代入某一特定的函数关系式中,通过计算求出未知 物理量的大小,这种方法——间接测量法。
例如,用毕托管测量气流速度 ,直接测量压差值 h。 计算的特定函数关系式为
式中:
h
——
(4)过程研究:主要涉及的是各种实验条件的优化实验, 需要对各种条件变化对过程的影响进行系统性研究,需要 用到统计法的实验设计与数据处理知识。
本课程的讲授内容安排
(1)数据处理基础:误差理论、数据的表 示方法;
(2)数据处理部分:有限数据的统计处理、 方差分析、回归分析;
试验设计与数据处理(第二版)李云雁(全书ppt)-图文
验效率; 确定试验因素与试验结果之间存在的近似函数关系,并
能对试验结果进行预测和优化; 试验因素对试验结果的影响规律,为控制试验提供思路
; 确定最优试验方案或配方。
第1章 试验数据的误差分析
误差分析(error analysis) :对原始数据的可靠性进 行客观的评定
误差(error) :试验中获得的试验值与它的客观真实 值在数值上的不一致
或
(2)说明 真值未知,绝对误差也未知 可以估计出绝对误差的范围:
或
绝对误差限或绝对误差上界
绝对误差估算方法: ➢ 最小刻度的一半为绝对误差; ➢ 最小刻度为最大绝对误差; ➢ 根据仪表精度等级计算:
绝对误差=量程×精度等级%
1.2.2 相对误差(relative error)
(1)定义:
1.5.1.2 F检验(F-test)
(1)目的: 对两组具有正态分布的试验数据之间的精密度进行比较
(2)检验步骤 ①计算统计量
设有两组试验数据:
和
都服从正态分布,样本方差分别为 和 ,则
服从F分布,第一自由度为 第二自由度为
②查临界值 给定的显著水平α
查F分布表 临界值
③检验 双侧(尾)检验(two-sided/tailed test) :
1.1.2 平均值(mean)
(1)算术平均值(arithmetic mean)
适合: 等精度试验值 试验值服从正态分布
(2)加权平均值(weighted mean)
加权和
wi——权重 适合不同试验值的精度或可靠性不一致时
(3)对数平均值(logarithmic mean) 设两个数:x1>0,x2 >0 ,则
1.2.4 标准误差 (standard error)
能对试验结果进行预测和优化; 试验因素对试验结果的影响规律,为控制试验提供思路
; 确定最优试验方案或配方。
第1章 试验数据的误差分析
误差分析(error analysis) :对原始数据的可靠性进 行客观的评定
误差(error) :试验中获得的试验值与它的客观真实 值在数值上的不一致
或
(2)说明 真值未知,绝对误差也未知 可以估计出绝对误差的范围:
或
绝对误差限或绝对误差上界
绝对误差估算方法: ➢ 最小刻度的一半为绝对误差; ➢ 最小刻度为最大绝对误差; ➢ 根据仪表精度等级计算:
绝对误差=量程×精度等级%
1.2.2 相对误差(relative error)
(1)定义:
1.5.1.2 F检验(F-test)
(1)目的: 对两组具有正态分布的试验数据之间的精密度进行比较
(2)检验步骤 ①计算统计量
设有两组试验数据:
和
都服从正态分布,样本方差分别为 和 ,则
服从F分布,第一自由度为 第二自由度为
②查临界值 给定的显著水平α
查F分布表 临界值
③检验 双侧(尾)检验(two-sided/tailed test) :
1.1.2 平均值(mean)
(1)算术平均值(arithmetic mean)
适合: 等精度试验值 试验值服从正态分布
(2)加权平均值(weighted mean)
加权和
wi——权重 适合不同试验值的精度或可靠性不一致时
(3)对数平均值(logarithmic mean) 设两个数:x1>0,x2 >0 ,则
1.2.4 标准误差 (standard error)
试验设计与数据处理教案-(李云雁)第8章--回归正交试验设计
第四页,共44页。
(2)因素(yīn sù)水平的编码
编码(coding):将因素(yīn sù)xj的各水平进行线性变换:
zj
xj xj0 j
➢ zj:因素(yīn sù)xj的编码 ,称为规范变量 ➢ xj:自然变量 ➢ 上水平xj2的编码 :zj2=1 ➢ 下水平xj1的编码:zj1=-1 ➢ 零水平xj0的编码:zj0=0
第十页,共44页。
1 n
a n i1 yi y
n
z ji y i
bj
i1
mc
j=1,2,…,m
n
(zk z j )i yi
bkj i1 m c
j>k, k=1,2,…,m-1
说明:
求得的回归系数直接反映了该因素作用的大小(dàxiǎo)
回归系数的符号反映了因素对试验指标影响的正负
4 1.210 1.414
1.525
1.607
5 1.267 1.471
1.575
1.664
6 1.320 1.525
1.623
1.719
7 1.369 1.575
1.668
1.771
8 1.414 1.623
1.711
1.820
9 1.457 1.668
1.752
1.868
10 1.498 1.711
0
1
0
0
8
0
-1
0
0
9
0
0
0
0
z22
z1’
z2’
1
1/3
1/3
1
1/3
1/3
1
1/3
1/3
1
1/3
(2)因素(yīn sù)水平的编码
编码(coding):将因素(yīn sù)xj的各水平进行线性变换:
zj
xj xj0 j
➢ zj:因素(yīn sù)xj的编码 ,称为规范变量 ➢ xj:自然变量 ➢ 上水平xj2的编码 :zj2=1 ➢ 下水平xj1的编码:zj1=-1 ➢ 零水平xj0的编码:zj0=0
第十页,共44页。
1 n
a n i1 yi y
n
z ji y i
bj
i1
mc
j=1,2,…,m
n
(zk z j )i yi
bkj i1 m c
j>k, k=1,2,…,m-1
说明:
求得的回归系数直接反映了该因素作用的大小(dàxiǎo)
回归系数的符号反映了因素对试验指标影响的正负
4 1.210 1.414
1.525
1.607
5 1.267 1.471
1.575
1.664
6 1.320 1.525
1.623
1.719
7 1.369 1.575
1.668
1.771
8 1.414 1.623
1.711
1.820
9 1.457 1.668
1.752
1.868
10 1.498 1.711
0
1
0
0
8
0
-1
0
0
9
0
0
0
0
z22
z1’
z2’
1
1/3
1/3
1
1/3
1/3
1
1/3
1/3
1
1/3
试验设计与数据处理 第二版 第6章 正交试验设计
按照规定的方案完成每一号试验 试验次序可随机决定 试验条件要严格控制
(5)计算极差,确定因素的主次顺序
三个符号: Ki:表示任一列上水平号为 i 时,所对应的试验结果之和。 ki :ki= Ki/s,其中s为任一列上各水平出现的次数 R(极差):在任一列上
R=max{K1 ,K2 ,K3}-min{K1 ,K2 ,K3},
上一张 下一张 主 页 退 出
图6-3
上一张 下一张 主 页
退 出
正交设计就是从选优区全面试验点(水 平组合)中挑选出有代表性的部分试验点(水
平组合)来进行试验。图6-3中标有试验号的九
个“(·)”,就是利用正交表 L9(34) 从 27 个试
验点中挑选出来的9个试验点。即:
(1)A1B1C1 (2)A2B1C2 (3)A3B1C3
图6-3
3 因 素 3 水 平 的 全 面试验水平组合数为 33=27,4 因素3水平的全面试验水平组合数为34=81 , 5因素3水平的全面试验水平组合数为35=243,这在科 学试验中是有可能做不到的。
上一张 下一张 主 页 退 出
表10-1
上一张 下一张 主 页
退 出
图6-1 全面实验 实验点分布
试验目的与要求
试验方案设计:
试验指标
选因素、定水平 因素、水平确定 选择合适正交表 表头设计 列试验方案 试验结果分析
验证试验
试验结果分析:
进行试验,记录试验结果
试验结果极差分析
试验结果方差分析
绘 制 因 素 指 标 趋 势 图
计 算 K 值
计 算 k 值
计 算 极 差 R
计算各列偏差平方和、 自由度 列方差分析表, 进行F 检验 分析检验结果, 写出结论
《实验设计与数据处理》课程小结PPT
42
Origin 简介
OriginLab公司的产品 最新版本为 V7.5 Pro 通用的科技绘图和数据分析软件 定位于基础级和专业级之间 国际科技出版界公认的标准作图软件 科学和工程研究人员的必备软件之一 主页:/
44
Origin绘制的图形 (2D部分)
24
(2)指标叠加法
所谓指标叠加法,就是将多指标按照某种 计算公式进行叠加,将多指标化为单指标, 而后进行正交实验直观分析。
25
26
27
三、回归分析
一元线性回归方程的建立
(1)、数学模型
y
8
7
yi = a + bxi +εi
6
y对x的回归方程
5
y = a + bx
4
3
y 称为变量y的理论 2
39
Matlab简介
Matlab作为线性系统的一种分析合仿真 工具,1984年被MathWork公司开发并 作为产品推向市场。
Matlab建立在向量、数组和矩阵的基础 上,人机界面直观,输出结果可视化, 可解决工程、科学计算和数学学科的许 多问题,深受用户欢迎。
40
Mathematica简介
n
Q i2 [yi(abix)]2 min i1 29
回归系数a、b计算式
b
xi yi n x y
xi 2
2
nx
a y b x
30
一元线性回归方程
含铁量/μg
铁标准曲线
300
250
0.88, 250
200
0.631, 200
150
0.48, 150
100
0.279, 100 y = 280.78x + 13.625
Origin 简介
OriginLab公司的产品 最新版本为 V7.5 Pro 通用的科技绘图和数据分析软件 定位于基础级和专业级之间 国际科技出版界公认的标准作图软件 科学和工程研究人员的必备软件之一 主页:/
44
Origin绘制的图形 (2D部分)
24
(2)指标叠加法
所谓指标叠加法,就是将多指标按照某种 计算公式进行叠加,将多指标化为单指标, 而后进行正交实验直观分析。
25
26
27
三、回归分析
一元线性回归方程的建立
(1)、数学模型
y
8
7
yi = a + bxi +εi
6
y对x的回归方程
5
y = a + bx
4
3
y 称为变量y的理论 2
39
Matlab简介
Matlab作为线性系统的一种分析合仿真 工具,1984年被MathWork公司开发并 作为产品推向市场。
Matlab建立在向量、数组和矩阵的基础 上,人机界面直观,输出结果可视化, 可解决工程、科学计算和数学学科的许 多问题,深受用户欢迎。
40
Mathematica简介
n
Q i2 [yi(abix)]2 min i1 29
回归系数a、b计算式
b
xi yi n x y
xi 2
2
nx
a y b x
30
一元线性回归方程
含铁量/μg
铁标准曲线
300
250
0.88, 250
200
0.631, 200
150
0.48, 150
100
0.279, 100 y = 280.78x + 13.625
实验设计与数据处理 ppt课件
这给予爱因斯坦广义相对论有力的支持。
10
3.科学与测量的关系
例3 牛顿引力论文推迟20年发表 由于在计算中使用了较大误差的地球
半径值,使得他测得的月球加速度的值和 理论计算值相差约10%,因而不得不推 迟20年才发表他的引力论文。
11
例1:学术期刊论文的撰写 例2:科研项目成果鉴定、验收、评审 例3:国际、国内仪器、器材的购买合同等
具体实验数据(瑞利测定的氮气的密度数据): 1、化学方法制得的氮,其平均密度和实验标准偏差分别 为 2.29971和0.00041; 2、从大气中分离的氮,其平均密度和实验标准偏差分别 为 2.31022和0.00019 ;
所幸的是:瑞利是懂误差理论与实验数据处理的。
9
3.科学实验测量结果的可置信度
搞理工的不懂误差理论不行。 与其糊涂一辈子,不如早做明理人。
12
教学安排及要求
第12~19周讲课,每周4学时 考试:开卷考试 作业: 会留一些课后习题供大家思考 要求:随机点名6次,计入平时成绩
13
如何学习这门课:
对教师:指导思想——争取课内解决; 对同学:理解学完这门课后,在今后我们
理工科科研工作中的益处。保证来上课, 提高课堂听课效率。
---- “Guide to the Expression of Uncertainty in Measurement”(GUM)中B.2.5条
5
俄国科学家门捷列夫说过: “没有测量,就没有科学。”( “科学始于测 量。”)
得到了测量值,是不是就等于已有了测量结果?
6
为什么得到测量值,并不等于就已有了测量结果? 一、因为误差始终存在于一切观测实验之中,任何测量都
实验设计与数据处理
1
10
3.科学与测量的关系
例3 牛顿引力论文推迟20年发表 由于在计算中使用了较大误差的地球
半径值,使得他测得的月球加速度的值和 理论计算值相差约10%,因而不得不推 迟20年才发表他的引力论文。
11
例1:学术期刊论文的撰写 例2:科研项目成果鉴定、验收、评审 例3:国际、国内仪器、器材的购买合同等
具体实验数据(瑞利测定的氮气的密度数据): 1、化学方法制得的氮,其平均密度和实验标准偏差分别 为 2.29971和0.00041; 2、从大气中分离的氮,其平均密度和实验标准偏差分别 为 2.31022和0.00019 ;
所幸的是:瑞利是懂误差理论与实验数据处理的。
9
3.科学实验测量结果的可置信度
搞理工的不懂误差理论不行。 与其糊涂一辈子,不如早做明理人。
12
教学安排及要求
第12~19周讲课,每周4学时 考试:开卷考试 作业: 会留一些课后习题供大家思考 要求:随机点名6次,计入平时成绩
13
如何学习这门课:
对教师:指导思想——争取课内解决; 对同学:理解学完这门课后,在今后我们
理工科科研工作中的益处。保证来上课, 提高课堂听课效率。
---- “Guide to the Expression of Uncertainty in Measurement”(GUM)中B.2.5条
5
俄国科学家门捷列夫说过: “没有测量,就没有科学。”( “科学始于测 量。”)
得到了测量值,是不是就等于已有了测量结果?
6
为什么得到测量值,并不等于就已有了测量结果? 一、因为误差始终存在于一切观测实验之中,任何测量都
实验设计与数据处理
1
试验设计和数据处理
二、关于实验设计与数据处理
本课程中主要应用的是数理统计中的统计方法理论,主要考
虑的是与实验设计有关的分析并解释实验结果的统计方法。 如误差检验、方差分析、回归分析等。。
凡是涉及到数据的问题,只要数据中包含有相当大的实验误
差,则获得满意结果的唯一稳妥的处理方法就是统计方法, 除此之外别无他择。
(二)间接测量法
把直接测量代入某一特定的函数关系式中,通过计算求出未知 物理量的大小,这种方法——间接测量法。 例如,用毕托管测量气流速度 ,直接测量压差值 h。 计算的特定函数关系式为
式中: h —— U 型差压计的读数;
h 2 1 2g (1—2) 1000 1
为了回答这个问题,调查组沿着该河干流和支流进行了实地 考察,在不同的地段采集鱼样共144条(由假设拟定抽样调 查的方案);对采集来的鱼样进行分类、称重、测量长度, 然后用有机溶剂提取鱼肉中的DDT,测定鱼肉中的DDT含 量(从调查和试验中获取数据)。很明显,这项调查并不是 去捕捞河里所有的鱼,144个DDT测定值代表着从河中之鱼 DDT含量这个总体中收集的一个样本,利用收集到的数据 可以比较不同地段和不同鱼种之间鱼肉中DDT的含量,并 确定鱼的长度和重量与DDT含量之间是否有定量关系等等 (分析数据——从样本推断总体)。
• 1. 2 数据测量的分类
一、按计量的性质分为:检定、检验和校准
• 检定:由法定计量部门,为确定和证实计量器具是否完全满足检定规程的要求而进行的 全部工作。检定是由国家法定计量部门所进行的测量,在我国主要是由各级计量院所 以及授权的实验室来完成,是我国开展量值传递最常用的方法。检定必须严格按照检 定规程运作,对所检仪器给出符合性判断,既给出合格还是不合格的结论,而该结论 具有法律效应。检定方法一般分为整体检定法和分项检定法两种。 检测:对给定的产品、材料、设备、生物体、物理现象、工艺过程或服务,按照一定 的程序确定一种或多种特性或性能的技术操作。检测通常是依据相关标准对产品的质 量进行检验,检验结果一般记录在称为检测报告或检测证书的文件中。 校准:在规定条件下,为确定测量仪器或测量系统所指示的量值,或实物量具或参考物 质所代表的量值,与对应的由标准所呈现的量值之间关系的一组操作。 二、按测量目的的分类分为:定值测量和参数检验 定值测量:按一种不确定度确定参数实际值的测量。其目的是确定被测量的量值是多少 , 通常预先限定允许的测量误差。 参数检验:以技术标准、规范或检定规程为依据,判断参数是否合格的测量。其目的 是判断被检参数是否合格,通常预先限定参数允许变化的范围(如公差等)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 n
当一组试验值取对数后所得数据的分布曲线更加对称 时,宜采用几何平均值。 几何平均值≤算术平均值
(5)调和平均值(harmonic mean) 设有n个正试验值:x1,x2,…,xn,则:
1 1 1 ... x1 x2 xn 1 H n
1 i 1 xi n
n
常用在涉及到与一些量的倒数有关的场合 调和平均值≤几何平均值≤算术平均值
第1章
试验数据的误差分析
误差分析(error analysis) :对原始数据的可靠性进 行客观的评定 误差(error) :试验中获得的试验值与它的客观真实 值在数值上的不一致 试验结果都具有误差,误差自始至终存在于一切科学 实验过程中 客观真实值——真值
1.1 真值与平均值
试验设计与数据处理
(第二版)
Experiment Design and Data Processing
引
言
0.1 试验设计与数据处理的发展概况
20世纪20年代,英国生物统计学家及数学家费歇 (R.A.Fisher)提出了方差分析
20世纪50年代,日本统计学家田口玄一将试验设计中应用 最广的正交设计表格化 数学家华罗庚教授也在国内积极倡导和普及的“优选法” 我国数学家王元和方开泰于1978年首先提出了均匀设计
(1)算术平均值(arithmetic mean)
n
x1 x2 ... xn x n
适合:
x
i 1
i
n
等精度试验值 试验值服从正态分布
(2)加权平均值(weighted mean)
加权和
w1 x1 w2 x2 ... wn xn xW w1 w2 ... wn
1.2 误差的基本概念
1.2.1 绝对误差(absolute error)
(1)定义
绝对误差=试验值-真值 或
x x xt
(2)说明 真值未知,绝对误差也未知
可以估计出绝对误差的范围:
或
x x xt x max
xt x x max
绝对误差限或绝对误差上界
i 1
n
i
x
d
i 1
n
i
n
n
d i —— 试验值 xi 与算术平均值 x 之间的偏差
可以反映一组试验数据的误差大小
1.2.4 标准误差 (standard error)
当试验次数n无穷大时,总体标准差:
( x x)
i 1 i
n
2
n
x
i 1
n
2 i
( xi ) 2 / n
i 1
n
n
试验次数为有限次时,样本标准差:
s
d
i 1
n
2 i
n 1
( xi x)
i 1
n
2
n 1
2 x ( x ) i /n i 1 2 i i 1
n
n
n 1
表示试验值的精密度,标准差↓,试验数据精密度↑
1.3 试验数据误差的来源及分类
1.3.1 随机误差 (random error )
(1)定义: 一定试验条件下,由某个或某些因素按照某一 确定的规律起作用而形成的误差 (2)产生的原因:多方面 (3)特点:
系统误差大小及其符号在同一试验中是恒定的
它不能通过多次试验被发现,也不能通过取多次试验值的 平均值而减小
wi——权重
w x
i 1 n
n
i i
w
i 1
i
适合不同试验值的精度或可靠性不一致时
(3)对数平均值(logarithmic mean) 设两个数:x1>0,x2 >0 ,则
x1 x2 x1 x2 x2 x1 xL x1 x2 ln x1 ln x2 ln ln x2 x1
(1)定义:以不可预知的规律变化着的误差,绝对误差时 正时负,时大时小 (2)产生的原因: 偶然因素 (3)特点:具有统计规律
小误差比大误差出现机会多
正、负误差出现的次数近似相等
当试验次数足够多时,误差的平均值趋向于零 可以通过增加试验次数减小随机误差
随机误差不可完全避免的
1.3.2 系统误差(systematic error)
x ER x
或
x ER x
可以估计出相对误差的大小范围:
ER
x x xt xt
相对误差限或相对误差上界
max
∴
xt x(1 ER )
相对误差常常表示为百分数(%)或千分数(‰)
1.2.3 算术平均误差 (average discrepancy)
定义式:
x
0.2 试验设计与数据处理的意义
0.2.1 试验设计的目的:
合理地安排试验,力求用较少的试验次数获得较好结果
例:某试验研究了3个影响因素: A:A1,A2,A3
B:B1,B2,B3
C:C1,C2,C3 全面试验:27次 正交试验:9次
0.2.2 数据处理的目的
通过误差分析,评判试验数据的可靠性; 确定影响试验结果的因素主次,抓住主要矛盾,提高试 验效率; 确定试验因素与试验结果之间存在的近似函数关系,并 能对试验结果进行预测和优化; 试验因素对试验结果的影响规律,为控制试验提供思路; 确定最优试验方案或配方。
绝对误差估算方法:
最小刻度的一半为绝对误差; 最小刻度为最大绝对误差; 根据仪表精度等级计算: 绝对误差=量程×精度等级%
1.2.2 相对误差(relative error)
(1)定义:
绝对误差 相对误差 真值
或
(2)说明:
x xt x ER xt xt
或
真值未知,常将Δx与试验值或平均值之比作为相对误差:
1.1.1 真值(true value)
真值:在某一时刻和某一状态下,某量的客观值或实际值
真值一般是未知的 相对的意义上来说,真值又是已知的 平面三角形三内角之和恒为180° 国家标准样品的标称值
国际上公认的计量值
高精度仪器所测之值 多次试验值的平均值
1.1.2 平均值(mean)
说明:
若数算术平均值 如果1/2≤x1/x2≤2 时,可用算术平均值代替
(4)几何平均值(geometric mean) 设有n个正试验值:x1,x2,…,xn,则
xG
n
x1 x2 ...xn ( x1 x2 ...xn )