试验设计与数据处理(第三版)李云雁 第1章 误差分析
《实验设计与数据处理》课程小结

T
90
80
70
60
50
40
30
460
480
500
520
540
560 λ
2、 0.618法安排实验
• 确定第一、二两个实验点 x1 = a + 0.618 ( b - a ) =80+0.618×40=105 x2 = a + 0.382 ( b – a ) = 80+0.382×40 =95
80
x2 =95 x1 =105
• 叶卫平 等编
精通Origin 7.0 (O245/17)
周建平 编
仿Байду номын сангаас科技论坛
/forum/index.php
本
课
谢
程 学 习 完 毕
谢祝 学 习 愉 快
参考文献
1. 水处理实验技术.李燕城.中国建筑工业 出版社.
2. 试验设计与数据处理.李云雁等.化学工 业出版社:2005.2 O212.6-43/2
3. 实验设计与数据处理.刘振学等.化学工 业出版社:2005.3 O212.6-43/1
4. 实验设计与数据处理.田胜元.中国建筑 工业出版社. TU83-43
综合起来以A3B2C2最好。
追加试验
• 追加试验方法:在A3B2C2下作几次试验,看看 平均转化率是否高于已作试验的9次试验.
• 实验结果表明:追加试验A3B2C2的平均转化率 为74%,显著高于前面9次试验最好的结果64% .
• 注意:由于温度的增加,显著地使转化率增加, 追加试验应考虑温度大于90℃的情形.
0.48, 150
100
0.279, 100 y = 280.78x + 13.625
试验设计与数据处理1

1.1.2 用正交表安排实验
一、指标、因素、水平 实验中的基本要素
①指标—— 用来衡量试验效果好坏的特征值。 ②因素—— 对实验指标有影响的原因或要素。 ③水平—— 因素在实验中所处的不同状态,可 能引起指标的变化。
1)指标——用来衡量试验效果好坏的特征值 ①指标分类: a)定量指标(数量指标,如强度、重量、产量、 合格率、成活率、废品率、转化率等。) b)定性指标 (非数量指标,如颜色、味道、 光泽等) ②指标的选择要求: 选择客观性强的指标;选择易于量化即经过 仪器测量而获得的指标;选择灵敏度高的 指标;选择精确性强的参数作为指标。
20世纪初:英国生物统计学家费歇尔(1890-1962) 首次提出了“试验设计”术语。
实验设计方法最早应用于农业、生物学、遗传学方面。在 农业方面主要是进行品种对比、施肥对比等。 20世纪40年代,英美两国开始在工业生产中应用,如改变 原料配比或工艺生产条件,寻找最佳工况。
50、60年代:日本田口玄一博士创造了正交试验 设计法。
(3)为具有(1)和(2)的优点,能否减少试验 次数,而又不影响试验效果呢?怎样安排实验、 采取什么样的试验方法呢? 对应于A有A1、A2、A3三个平面,对应于B、C也各 有三个平面,共九个平面。则这九个平面上的试 验点都应当一样多,即对每个因子的每个水平都 要同等看待。具体来说,每个平面上都有三行、 三列,要求在每行、每列上的点一样多。这样, 作出如图1.2所示的设计,试验点用⊙表示。我们 看到,在9个平面中每个平面上都恰好有三个点而 每个平面的每行每列都有一个点,而且只有一个 点,总共九个点。这样的试验方案,试验点的分 布很均匀,试验次数也不多。
三、正交表的正交性
正交表具有两条性质: (1) 均匀性:每一列中各数字出现的次数都一样多。如各列 中的1、2、3都各自出现3次。均匀分散;
试验误差的分析及数据处理

例 1:某工厂测定含铬废水浓度的结果如下表,试计算其
平均浓度。
铬(mg/L) 0.3 0.4 0.5 0.6 0.7
出现次数 3 5
7
7
5
x 0.33 0.45 0.57 0.67 0.75 35775
=0.52(mg/L)
例 2:某印染厂、各类污水的 BOD5 测定结果如下表,试 计算该厂污水平均浓度。
污水类型
BOD5 ( mg/L)
污水流量 ( m3 /d)
退浆污水
4000
15
煮布锅污水
10000
8
印染污水
400
1500
漂白污水
70
900
解:
x
4000 15
10000 8 400 1500 15 8 1500 900
70
900
=331.4(mg/L)
2.直接测量值与间接测量值
直接测量值就是通过仪器直接测试读数得到的数据。
精密度(precision)是平行测量的各测量值(实验值)之间 互相接近的程度。 用偏差表示,偏差为测定值与平均值之 差,偏差可分为:绝对偏差(d)与相对偏差(dr)平均偏差、 相对平均偏差、标准偏差、相对标准偏差等:
(1)绝对偏差(d): d X i X
(2)相对偏差(dr)为绝对偏差与平均值之比,常用百分率
正确度反映系统误差的大小的程度。如观测的系统误 差小,则称观测的正确度高。可以使用更精确的仪器 来提高观测的精密度。 精确度反映偶然误差与系统误差合成的综合误差大小 的程度。 对于测量来说,精密度高,正确度不一定高;同 样,正确度高,精密度也不一定高;精确度高,则精 密度和正确度都高。
例如:甲、乙、丙、丁四个人同时用碘量法测定某铜矿中CuO含 量(真实含量为37.40)测定4次,其结果如下图所示:分析此 结果精密度与正确度的关系。
《试验设计》讲稿第一部分

试验设计DOE design Of experiment教材王万中 试验的设计与分析 高等教育出版社参考文献1.李云雁 胡传荣 试验设计与数据处理 化学工业出版社2.茆诗松 周纪芗 陈颖 试验设计 中国统计出版社3.方开泰 试验设计 高等教育出版社一、引 言试验设计(design Of experiment,DOE),也称为实验设计。
试验设计是以概率论和数理统计为理论基础,经济地,科学地安排试验的一项技术。
试验设计自20世纪20年代问世至今,其发展大致经历了三个阶段:即早期的单因素和多因素方差分析,传统的正交试验法和近代的调优设计法。
试验设计的概念从20世纪30(20)年代费希尔(R.A.Fisher)在农业生产中使用试验设计方法以来,试验设计方法已经得到广泛的发展,统计学家们发现了很多非常有效的试验设计技术。
20世纪60(50)年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,在方法解说方面深入浅出为试验设计的更广泛使用作出了巨大的贡献。
试验设计的内容产品质量的高低主要是由设计决定的,一个好的试验设计包含几个方面的内容。
第一是明确衡量产品质量的指标,6σ管理强调用数据说话,所以这个质量指标必须是能够量化的指标,在试验设计中称为试验指标,也称为响应变量(responsevariable)或输出变量。
第二是寻找影响试验指标的可能因素(factor) ,也称为影响因子和输入变量。
因素变化的各种状态称为水平,要求根据专业知识初步确定因家水平的范围。
第三是根据实际问题,选择适用的试验设计方法。
试验设计的方法有很多,每种方法都有不同的适用条件,选择了适用的方法就可以事半而功倍,选择的方法不正确或者根本没有进行有效的试验设计就会事倍而功半。
第四是科学地分析试验结果,包括对数据的直观分析、方差分析、回归分析等多种统计分析方法,这些工作可以借助各类(SAS SPSS MATLAB EXCEL等等)软件完成。
试验设计与数据处理(第三版)李云雁-第1章-误差分析PPT优秀课件

设有n个正试验值:x1,x2,…,xn,则:
1 1 ... 1 n 1
1 x1 x2
xn i1 xi
H
n
n
常用在涉及到与一些量的倒数有关的场合 调和平均值≤几何平均值≤算术平均值
Excel在计算平均值中的应用
13
1.2 误差的基本概念
1.2.1 绝对误差(absolute error)
10
(3)对数平均值(logarithmic mean)
设两个数:x1>0,x2 >0 ,则
说明:
xL
x1 x2 ln x1 ln x2
x1 x2 ln x1
x2 x1 ln 宜使用对数平均值
对数平均值≤算术平均值
如果1/2≤x1/x2≤2 时,可用算术平均值代替
(1)定义: 一定试验条件下,由某个或某些因素按照某一 确定的规律起作用而形成的误差
(2)产生的原因:多方面 (3)特点: 系统误差大小及其符号在同一试验中是恒定的 它不能通过多次试验被发现,也不能通过取多次试验值的
平均值而减小 只要对系统误差产生的原因有了充分的认识,才能对它进
行校正,或设法消除。
数学家华罗庚教授也在国内积极倡导和普及的“优选法” 我国数学家王元和方开泰于1978年首先提出了均匀设计
3
0.2 试验设计与数据处理的意义
0.2.1 试验设计的目的:
合理地安排试验,力求用较少的试验次数获得较好结果 例:某试验研究了3个影响因素: A:A1,A2,A3 B:B1,B2,B3 C:C1,C2,C3 全面试验:27次 正交试验:9次
6
误差分析(error analysis) :对原始数据的可靠性进 行客观的评定
误差(error) :试验中获得的试验值与它的客观真实 值在数值上的不一致
试验设计与数据处理(第三版)李云雁 第1章 误差分析.ppt

1.2.2 相对误差(relative error)
(1)定义:
相对误差
绝对误差 真值
或
ER
x xt
x
xt xt
(2)说明:
真值未知,常将Δx与试验值或平均值之比作为相对误差:
ER
x x
或
ER
x x
可以估计出相对误差的大小范围:
ER
x xt
x xt max
相对误差限或相对误差上界
∴ xt x(1 ER )
设有n个正试验值:x1,x2,…,xn,则:
1 1 ... 1 n 1
1 x1 x2
xn i1 xi
H
n
n
常用在涉及到与一些量的倒数有关的场合 调和平均值≤几何平均值≤算术平均值
Excel在计算平均值中的应用
1.2 误差的基本概念
1.2.1 绝对误差(absolute error)
真值:在某一时刻和某一状态下,某量的客观值或实际值 真值一般是未知的 相对的意义上来说,真值又是已知的 ➢ 平面三角形三内角之和恒为180° ➢ 国家标准样品的标称值 ➢ 国际上公认的计量值 ➢ 高精度仪器所测之值 ➢ 多次试验值的平均值
1.1.2 平均值(mean)
(1)算术平均值(arithmetic mean)
(3)对数平均值(logarithmic mean)
设两个数:x1>0,x2 >0 ,则
说明:
xL
x1 x2 ln x1 ln x2
x1 x2 ln x1
x2 x1 ln x2
x2
x1
若数据的分布具有对数特性,则宜使用对数平均值
对数平均值≤算术平均值
如果1/2≤x1/x2≤2 时,可用算术平均值代替
试验设计与数据处理(第三版)李云雁-第1章-误差分析

若
2
2 (1
)
(df
)
则判断该方差与原总体方差无显著减小,否则有显著减小
➢ 右侧(尾)检验
若 2 2 (df ) (当 s2 2 时)
则判断该方差与原总体方差无显著增大,否则有显著增大
(3)Excel在 2 检验中的应用
1.5.1.2 F检验(F-test)
设有n个正试验值:x1,x2,…,xn,则:
1 1 ... 1 n 1
1 x1 x2
xn i1 xi
H
n
n
常用在涉及到与一些量的倒数有关的场合 调和平均值≤几何平均值≤算术平均值
Excel在计算平均值中的应用
1.2 误差的基本概念
1.2.1 绝对误差(absolute error)
(3)对数平均值(logarithmic mean)
设两个数:x1>0,x2 >0 ,则
说明:
xL
x1 x2 ln x1 ln x2
x1 x2 ln x1
x2 x1 ln x2
x2
x1
若数据的分布具有对数特性,则宜使用对数平均值
对数平均值≤算术平均值
如果1/2≤x1/x2≤2 时,可用算术平均值代替
s——合并标准差:
s (n1 1)s12 (n2 1)s22 n1 n2 2
两组数据的精密度或方差有显著差异时 t x1 x2 s12 s22 n1 n2
服从t分布,其自由度为:
df
(s12 n1 s22 n2 )2 (s12 n1)2 (s22 n2 )2
2
(n1 1) (n2 1)
定义式:
SE
n
(xi x)2
i 1
n(n 1)
试验设计与数据处理(第三版)李云雁 第3章 试验的方差分析知识讲解

方差分析(analysis of variance,简称ANOVA) 检验试验中有关因素对试验结果影响的显著性
试验指标(experimental index) 衡量或考核试验效果的参数
因素(experimental factor) 影响试验指标的条件 可控因素(controllable factor)
④计算均方
MS A
SS A df A
SS A r 1
MSB
SSB df B
SSB s 1
MSe
SSe dfe
(r
SSe 1)(s 1)
⑤F检验
FA
MS A MSe
FB
MSB MSe
FA服从自由度为(dfA,dfe)的F分布;
FB服从自由度为(dfB,dfe)的F分布;
对于给定的显著性水平 ,查F分布表:
下的试验结果服从正态分布 在各水平下分别做了ni(i=1,2,…,r)次试验 判断因素A对试验结果是否有显著影响
(3) 单因素试验数据表
试验次数 A1
A2
…
1
x11
x21
…
2
x12
x22
…
…
…
…
…jBiblioteka x1jx2j…
…
…
…
…
ni
x1n1
x2n2
…
Ai
…
Ar
xi1
…
xr1
xi2
…
xr2
… ……
xij
1 r s
x rs
i 1
xij
j 1
Ai水平时 :
xi•
1 s
s
xij
j 1
试验设计与数据处理(第三版)李云雁 第2章 试验数据的表图表示法

2.1 列表法
将试验数据列成表格,将各变量的数值依照一定的形式和 顺序一一对应起来
(1)试验数据表 ①记录表
试验记录和试验数据初步整理的表格 表中数据可分为三类: 原始数据 中间数据 最终计算结果数据
②结果表示表
表达试验结论
应简明扼要
(2)说明:
图2-13 普通直角坐标系
1000
100
y
10 1 10 100 1000 10000
x
图2-14 双对数坐标系
2.3 计算机绘图软件在图表绘制中的应用
2.3.1 Excel在图表绘制中的应用 *2.3.2 Excel在图表绘制中的应用
(3)定量绘制的坐标图,其坐标轴上必须标明该坐标所代表 的变量名称、符号及所用的单位,一般用纵轴代表因变量; (4)试验数据较大或较小时,要用科学记数法来表示 (5)坐标轴的分度应与试验数据的有效数字位数相匹配; (6)为了便于引用,图必须有图号和图题(图名),图名应 该位于图的下方,必要时还应有图注。
表外附加通常放在表格的下方,主要是一些不便列在表内 的内容,如指标注释、资料来源、不变的试验数据等
(3)注意 :
表格设计应简明合理、层次清晰,以便阅读和使用;
数据表的表头要列出变量的名称、符号和单位;
要注意有效数字位数; 试验数据较大或较小时,要用科学记数法来表示,并记入 表头,注意表头中的与表中的数据应服从下式:数据的实 际值×10±n = 表中数据; 数据表格记录要正规,原始数据要书写得清楚整齐,要记 录各种试验条件,并妥为保管。
2.5 2.0 1.5 1.0 0.5 0 2 4 x 6 8 10
《试验设计与数据处理》讲稿第1章

PPT文档演模板
《试验设计与数据处理》讲稿第1章
权数或权值的确定: •一般有三种方法
• ①当试验次数很多时,以试验值xi在测量中出现的频 率ni / n作为权数。
• ②如果试验值是在同样的试验条件下但来源于不同的 组,则以各组试验值的出现的次数作为权数。 • 加权平均值即为总算术平均值。(见例1-1)
•(5)调和平均值
• 设有n个正试验值:x1,x2,…,xn,它们的调和平均 值为:
• 适用场合:试验值的倒数服从正态分布 。
PPT文档演模板
《试验设计与数据处理》讲稿第1章
1.2 误差的基本概念
• 1. 绝对误差 绝对误差 = 试验值-真值 △x = x – xt
• 真值一般是未知的,通常用最大的绝对误差来估计其 大小范围:
• 在一次测定中,是不可预知的,但在多次测定中,其误差 的算术平均值趋于零。源自※ 随机误差的来源:偶然因素
※ 随机误差具有一定的统计规律:
(1) 有界性;
(2) 正误差和负误差出现的频数大致相等;
(3) 绝对值小的误差比大的误差出现的次数多(收敛性)。
(4) 当测量次数n→∞,误差的算术平均值趋于零(抵偿性)。
• ※ 系统误差的来源:
• 仪器(如砝码不准或刻度不均匀等);
• 操作不当;
• 个人的主观因素(如观察滴定终点或读取刻度的习惯);
• 试验方法本身的不完善。
PPT文档演模板
《试验设计与数据处理》讲稿第1章
※ 3. 过失误差
• 粗差、人为误差: 是一种显然与事实不符的误差。
※ 特点: 没有一定的规律。
• ③根据权与绝对误差的平方成反比来确定权数。
• 例1-2 权数的计算:
实验设计与数据处理第一章例题及课后习题(附答案)

1、 根据三组数据的绝对误差计算权重:12322211110000,25,400000.010.20.005w w w ====== 因为123::400:1:1600w w w = 所以1.54400 1.71 1.53716001.53840011600pH ⨯+⨯+⨯==++2、 因为量程较大的分度值也较大,用量程大的测量数值较小的物理量会造成很大的系统误差。
3.、含量的相对误差为0.2g ,所以相对误差为:0.20.99790525.3Rx E x ∆===。
4、 相对误差18.20.1%0.0182x mg mg ∆=⨯= 故100g 中维生素C 的质量范围为:18.2±0.0182。
5、1)、压力表的精度为1.5级,量程为0.2,则max 0.2 1.5%0.003330.3758R x MPa KPa x E x ∆=⨯==∆===2)、1的汞柱代表的大气压为0.133,所以max 20.1330.133 1.6625108R x KPax E x -∆=∆===⨯ 3)、1水柱代表的大气压为gh ρ,其中29.8/g m s =则:3max 339.8109.810 1.225108R x KPax E x ---∆=⨯∆⨯===⨯6、样本测定值算术平均值 3.421666667 3.48 几何平均值 3.421406894 3.37 调和平均值 3.421147559 3.47 标准差s 0.046224092 3.38 标准差 0.04219663 3.4 样本方差 0.002136667 3.43 总体方差0.001780556 算住平均误差 0.038333333极差 0.117、依题意,检测两个分析人员测定铁的精密度是否有显著性差异,用F双侧检验。
根据试验值计算出两个人的方差及F值:221221223.733, 2.3033.7331.621232.303s s s F s ===== 而0.9750.025(9,9)0.248386,(9,9) 4.025994F F ==, 所以0.9750.025(9,9)(9,9)F F F <<两个人的测量值没有显著性差异,即两个人的测量方法的精密度没有显著性差异。
试验设计与数据处理-李云雁-全套323页

1.1.2 平均值(mean)
(1)算术平均值(arithmetic mean)
s——合并标准差:
s (n1 1)s12 (n2 1)s22 n1 n2 2
两组数据的精密度或方差有显著差异时 t x1 x2 s12 s22 n1 n2
服从t分布,其自由度为:
df
(s12 n1 s22 n2 )2 (s12 n1)2 (s22 n2 )2
2
(n1 1) (n2 1)
② t检验
双侧检验 :
若 t t
2
则可判断两平均值无显著差异,否则就有显著差异
1.4.2 正确度(correctness)
(1)含义:反映系统误差的大小 (2)正确度与精密度的关系:
(a)
(b)
(c)
精密度高并不意味着正确度也高
精密度不好,但当试验次数相当多时,有时也会得到 好的正确度
1.4.3 准确度(accuracy)
(1)含义: 反映了系统误差和随机误差的综合 表示了试验结果与真值的一致程度 (2)三者关系 无系统误差的试验
(2)产生的原因: 偶然因素 (3)特点:具有统计规律 小误差比大误差出现机会多 正、负误差出现的次数近似相等 当试验次数足够多时,误差的平均值趋向于零 可以通过增加试验次数减小随机误差 随机误差不可完全避免的
1.3.2 系统误差(systematic error)
(1)定义: 一定试验条件下,由某个或某些因素按照某一 确定的规律起作用而形成的误差
试验设计与数据处理(第三版)李云雁 第3章 试验的方差分析

3.1 单因素试验的方差分析 (one-way analysis of variance)
3.1.1 单因素试验方差分析基本问题
(1)目的:检验一个因素对试验结果的影响是否显著性 (2)基本命题: 设某单因素A有r种水平:A1,A2,…,Ar,在每种水平
第3章 试验的方差分析
方差分析(analysis of variance,简称ANOVA) 检验试验中有关因素对试验结果影响的显著性
试验指标(experimental index) 衡量或考核试验效果的参数
因素(experimental factor) 影响试验指标的条件 可控因素(controllable factor)
④计算均方
MS A
SS A r 1
MSB
SSB s 1
MS AB
(r
SS AB 1)(s 1)
MSe
SSe rs(c 1)
⑤F检验
FA
MS A MSe
FB
MSB MSe
FAB
MS AB MSe
若FA>F (dfA,dfe),则认为因素A对试验结果有显著影响, 否则无显著影响;
MSe SSe / dfe
MSA——组间均方 MSe——组内均方/误差的均方
(5)F检验
FA
组间均方 组内均方
MS A MSe
服从自由度为(dfA,dfe)的F分布(F distribution) 对于给定的显著性水平,从F分布表查得临界值F(dfA,dfe) 如果FA > F(dfA,dfe) ,则认为因素A对试验结果有显著影
试验设计与数据处理(第三版)李云雁 第3章 试验的方差分析

x 1
rs
r i 1
s
xij
j 1
Ai水平时 :
xi•
1 s
s
xij
j 1
Bj水平时:
x• j
1 r
r i 1
xij
②计算离差平方和
总离差平方和:
rs
2
SST
xij x SSA SSB SSe
i1 j1
因素A引起离差的平方和:
B1
B2
…
x111, x112 ,..., x11c x121, x122 ,..., x12c …
Bs
x1s1, x1s2 ,..., x1sc
x211, x212 ,..., x21c x221, x222 ,..., x22c …
…
…
…
xr11, xr12 ,..., xr1c xr 21, xr 22 ,..., xr 2c …
因素A引起离差的平方和: SSA sc (xi•• x)2 i 1 s
因素B引起离差的平方和:SSB rc (x• j• x)2 j 1
交互作用A×B引起离差的平方和:
rs
SSAB c
(xij• xi•• x• j• x)2
i1 j1
3.2 双因素试验的方差分析
讨论两个因素对试验结果影响的显著性,又称“二元方差 分析”
3.2.1 双因素无重复试验的方差分析
(1)双因素无重复试验
B1
B2
…
Bs
A1
x11
x12
…
x1s
A2
x21
x22
…
x2s
实验误差分析与数据处理(2010.3)

随机误差的规律性: 随机误差的规律性:
(1) 绝对值相等的正的误差和负的误 ) 差出现的机会相同。 差出现的机会相同。 (2) 绝对值小的误差比绝对值大的误 ) 差出现的机会多。 差出现的机会多。 (3) 超出一定范围的误差基本不出现。 ) 超出一定范围的误差基本不出现。
随机误差的消除
在一定测量条件下,增加测量次数, 在一定测量条件下,增加测量次数,可 以减小测量结果的偶然误差, 以减小测量结果的偶然误差,使算术平 均值趋于真值。因此,可以取算术平均 均值趋于真值。因此,可以取算术平均 值为直接测量的最近真值(最佳值)。 值为直接测量的最近真值(最佳值)。
产生系统误差的原因: 产生系统误差的原因:
(1) 仪器误差:由测量仪器、装置不 ) 仪器误差:由测量仪器、 完善而产生的误差。 完善而产生的误差。 ):由实验 (2) 方法误差(理论误差):由实验 ) 方法误差(理论误差): 方法本身或理论不完善而导致的误差。 方法本身或理论不完善而导致的误差。 (3) 环境误差:由外界环境(如光照、 ) 环境误差:由外界环境(如光照、 温度、湿度、电磁场等) 温度、湿度、电磁场等)影响而产生的 误差。 误差。 (4) 读数误差:由观察者在测量过程 ) 读数误差: 中的不良习惯而产生的误差。 中的不良习惯而产生的误差。
实验值
用测量仪器测定待测物理量所得的数值。 用测量仪器测定待测物理量所得的数值。
理论值
用理论公式计算得到某个物理量的数值。 用理论公式计算得到某个物理量的数值。
误差分析
误差:测量值和真值之间总会存在或多或少的 误差:测量值和真值之间总会存在或多或少的 偏差,这种偏差就称为测量值的误差。 偏差,这种偏差就称为测量值的误差。 设被测量的真值为 a,测量值为 则测量误差为 测量值为x,则测量误差为 测量值为 x-a 我们所测得的一切数据都毫无例外地包含一定 的误差,因而误差存在于一切测量之中。 的误差,因而误差存在于一切测量之中。
试验设计和数据处理

二、关于实验设计与数据处理
本课程中主要应用的是数理统计中的统计方法理论,主要考
虑的是与实验设计有关的分析并解释实验结果的统计方法。 如误差检验、方差分析、回归分析等。。
凡是涉及到数据的问题,只要数据中包含有相当大的实验误
差,则获得满意结果的唯一稳妥的处理方法就是统计方法, 除此之外别无他择。
(二)间接测量法
把直接测量代入某一特定的函数关系式中,通过计算求出未知 物理量的大小,这种方法——间接测量法。 例如,用毕托管测量气流速度 ,直接测量压差值 h。 计算的特定函数关系式为
式中: h —— U 型差压计的读数;
h 2 1 2g (1—2) 1000 1
为了回答这个问题,调查组沿着该河干流和支流进行了实地 考察,在不同的地段采集鱼样共144条(由假设拟定抽样调 查的方案);对采集来的鱼样进行分类、称重、测量长度, 然后用有机溶剂提取鱼肉中的DDT,测定鱼肉中的DDT含 量(从调查和试验中获取数据)。很明显,这项调查并不是 去捕捞河里所有的鱼,144个DDT测定值代表着从河中之鱼 DDT含量这个总体中收集的一个样本,利用收集到的数据 可以比较不同地段和不同鱼种之间鱼肉中DDT的含量,并 确定鱼的长度和重量与DDT含量之间是否有定量关系等等 (分析数据——从样本推断总体)。
• 1. 2 数据测量的分类
一、按计量的性质分为:检定、检验和校准
• 检定:由法定计量部门,为确定和证实计量器具是否完全满足检定规程的要求而进行的 全部工作。检定是由国家法定计量部门所进行的测量,在我国主要是由各级计量院所 以及授权的实验室来完成,是我国开展量值传递最常用的方法。检定必须严格按照检 定规程运作,对所检仪器给出符合性判断,既给出合格还是不合格的结论,而该结论 具有法律效应。检定方法一般分为整体检定法和分项检定法两种。 检测:对给定的产品、材料、设备、生物体、物理现象、工艺过程或服务,按照一定 的程序确定一种或多种特性或性能的技术操作。检测通常是依据相关标准对产品的质 量进行检验,检验结果一般记录在称为检测报告或检测证书的文件中。 校准:在规定条件下,为确定测量仪器或测量系统所指示的量值,或实物量具或参考物 质所代表的量值,与对应的由标准所呈现的量值之间关系的一组操作。 二、按测量目的的分类分为:定值测量和参数检验 定值测量:按一种不确定度确定参数实际值的测量。其目的是确定被测量的量值是多少 , 通常预先限定允许的测量误差。 参数检验:以技术标准、规范或检定规程为依据,判断参数是否合格的测量。其目的 是判断被检参数是否合格,通常预先限定参数允许变化的范围(如公差等)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0.2 试验设计与数据处理的意义
0.2.1 试验设计的目的:
合理地安排试验,力求用较少的试验次数获得较好结果 例:某试验研究了3个影响因素: A:A1,A2,A3 B:B1,B2,B3 C:C1,C2,C3 全面试验:27次 正交试验:9次
定义式:
SE
n
(xi x)2
i 1
n(n 1)
表示当前样本对总体数据的估计; 表示样本均数与总体均数的相对误差;
样本个数n越大,标准误越小,表明所抽取的样本能够较 好地代表总体样本
1.3 试验数据误差的来源及分类
1.3.1 随机误差 (random error )
(1)定义:以不可预知的规律变化着的误差,绝对误差时 正时负,时大时小
n
x
x1 x2 ... xn
xi
i 1
n
n
适合:
等精度试验值 试验值服从正态分布
(2)加权平均值(weighted mean)
n
xW
w1x1 w2 x2 ... wn xn w1 w2 ... wn
wi xwi——权重
加权和
适合不同试验值的精度或可靠性不一致时
(4)几何平均值(geometric mean)
设有n个正试验值:x1,x2,…,xn,则
1
x G n x1x2...xn (x1x2...xn ) n
当一组试验值取对数后所得数据的分布曲线更加对称 时,宜采用几何平均值。
几何平均值≤算术平均值
(5)调和平均值(harmonic mean)
试验设计与数据处理
(第三版)
Experiment Design and Data Processing
引言
0.1 试验设计与数据处理的发展概况
20世纪20年代,英国生物统计学家及数学家费歇 (R.A.Fisher)提出了方差分析
20世纪50年代,日本统计学家田口玄一将试验设计中应用 最广的正交设计表格化
0.2.2 数据处理的目的
通过误差分析,评判试验数据的可靠性; 确定影响试验结果的因素主次,抓住主要矛盾,提高试
验效率; 确定试验因素与试验结果之间存在的近似函数关系,并
能对试验结果进行预测和优化; 试验因素对试验结果的影响规律,为控制试验提供思路; 确定最优试验方案或配方。
第1章 试验数据的误差分析
真值:在某一时刻和某一状态下,某量的客观值或实际值 真值一般是未知的 相对的意义上来说,真值又是已知的 ➢ 平面三角形三内角之和恒为180° ➢ 国家标准样品的标称值 ➢ 国际上公认的计量值 ➢ 高精度仪器所测之值 ➢ 多次试验值的平均值
1.1.2 平均值(mean)
(1)算术平均值(arithmetic mean)
(1)定义 绝对误差=试验值-真值
或
x x xt
(2)说明 真值未知,绝对误差也未知
可以估计出绝对误差的范围:
或
x
x xt
x max
绝对误差限或绝对误差上界
xt
x
x max
绝对误差估算方法: ➢ 最小刻度的一半为绝对误差; ➢ 最小刻度为最大绝对误差; ➢ 根据仪表精度等级计算:
绝对误差=量程×精度等级%
(2)产生的原因: 偶然因素 (3)特点:具有统计规律 小误差比大误差出现机会多 正、负误差出现的次数近似相等 当试验次数足够多时,误差的平均值趋向于零 可以通过增加试验次数减小随机误差 随机误差不可完全避免的
1.3.2 系统误差(systematic error)
(1)定义: 一定试验条件下,由某个或某些因素按照某一 确定的规律起作用而形成的误差
相对误差常常表示为百分数(%)或千分数(‰)
1.2.3 算术平均误差 (average discrepancy)
定义式:
n
n
xi x di
i1
i1
n
n
di —— 试验值 xi 与算术平均值 x 之间的偏差
可以反映一组试验数据的误差大小
1.2.4 标准误差 (standard error)
(2)产生的原因:多方面 (3)特点: 系统误差大小及其符号在同一试验中是恒定的 它不能通过多次试验被发现,也不能通过取多次试验值的
平均值而减小 只要对系统误差产生的原因有了充分的认识,才能对它进
行校正,或设法消除。
1.3.3 过失误差 (mistake )
(1)定义: 一种显然与事实不符的误差
误差分析(error analysis) :对原始数据的可靠性进 行客观的评定
误差(error) :试验中获得的试验值与它的客观真实 值在数值上的不一致
➢ 客观真实值——真值 ➢ 试验结果都具有误差,误差自始至终存在于一切科学实
验过程中
1.1 真值与平均值
1.1.1 真值(true value)
设有n个正试验值:x1,x2,…,xn,则:
1 1 ... 1 n 1
1 x1 x2
xn i1 xi
H
n
n
常用在涉及到与一些量的倒数有关的场合 调和平均值≤几何平均值≤算术平均值
Excel在计算平均值中的应用
1.2 误差的基本概念
1.2.1 绝对误差(absolute error)
(3)对数平均值(logarithmic mean)
设两个数:x1>0,x2 >0 ,则
说明:
xL
x1 x2 ln x1 ln x2
x1 x2 ln x1
x2 x1 ln x2
x2
x1
若数据的分布具有对数特性,则宜使用对数平均值
对数平均值≤算术平均值
如果1/2≤x1/x2≤2 时,可用算术平均值代替
1.2.2 相对误差(relative error)
(1)定义:
相对误差
绝对误差 真值
或
ER
x xt
x
xt xt
(2)说明:
真值未知,常将Δx与试验值或平均值之比作为相对误差:
ER
x x
或
ER
x x
可以估计出相对误差的大小范围:
ER
x xt
x xt max
相对误差限或相对误差上界
∴ xt x(1 ER )
(2)产生的原因: 实验人员粗心大意造成
(3)特点: 可以完全避免 没有一定的规律
1.4 试验数据的精准度
1.4.1 精密度(precision)
(1)含义: 反映了随机误差大小的程度 在一定的试验条件下,多次试验值的彼此符合程度