试验数据处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.1.2 常用统计量
一. 极差R
又称为变异幅,是一组数据中最大值同最小值 之差。 R xmax xmin 它表示一组数据中的最大离散程度。
二. 和、平均值
和指数据的总和, 常用T表 x i 为观察值。 示: T x , 平均值是表示平均水平的定量指标,
n i 1 i
x
1 n
N
E(x) 表示了 {xi } 的集聚中心位置。 标准差 表示确定了分布曲线的胖瘦。 越小, {xi } 分布的越窄,说明测定时误差小的占 优势,测定值对真值的离散程度小、精度高。
(1) 的大小决定于测定条件。尽管N次等精度测定的误差 的大小和正负都不同,但它们的 是相同的,单次测定的 质量都可用一个 来评定。 (2)标准差计算时,必须具备以下条件: a 已知真差 b 测量中不存在系统误差 c 测量次数尽量多,最好是 N
2.3.1 出现“坏值”时先做以下处理
(1)检查测量过程中是否读错、记错、写 错,如肯定无误,则应从某瞬变原因方面 查找(如电压突变等),原因找到后即可 去掉坏值。 (2)如条件允许,可在误差大处加大测量 次数,借以发现大误差的原因。 (3)用已知的统计学判据,确认“坏值” 的存在。
2.3.2 剔除坏值的莱依塔判据
S T ( xi x )
i 1
四.自由度与平均偏差平方和(方 差)、标准差
• 自由度f就是平均偏差平方和中独立平方的数据个 数。 • 存在目标值 x0 时 , f n • 不存在目标值 x0 时, f n 1 1 n VT ( xi x0 ) 2 • 存在目标值时,总的方差: n i 1 • 不存在目标值时,总的方差: 1 n 2
3. 随机变量x、y的协方差
x,y 分别为随机变量,则它们的协方差为
Cov( x, y ) E{( x x )( y y )}
x, y相互独立时,Cov(x,y)=0
4. 相关系数
两随机变量的相关程度通常用相关系数表示:
Cov( x, y ) ( x, y ) ( x ) ( y )
对试验指标可能有影响的原因或因素称 为试验因素,简称因素,有时称为因子, 它是试验中重点考察的内容。用大写字母 表示,如:因素A,因素B。 用是否可控,把因素分为
水 平可以比较并且可以人为选择的因素。如:压力、催化剂的 各类、电阻值、电容值等。
可控因素(如温度、压力、切削速度、走刀量等)
不可控因素(如:刀具的振动、磨损等)
N
2.2.2 随机量的表示
1. 数学期望值 E{x}或<x> (1)一阶矩 (p(x)为概率密度函数)
E{x} x
(2)二阶矩
xp( x )d x
2 x p( x )dx
E{x 2 } x 2
(3)n 阶矩
n n
E{x } x
按因素的作用,可以分为:
标示因素:指外界环境条件(如:湿度、温度等)、
产品的使用条件(如:电压、频率、转速等)等。它不 能人为的选择和控制。
区组因素:为了减少试验误差而确定的因素,如:加
工某零件时,不同的操作者、不同的原料批次、不同 班次、不同机床等。
信号因素:可人为调整并影响目标值的因素。如:在
x
i 1
n
i
三. 偏差与偏差平方和
1 . x1 , x2 ,...xn 为观测值 (1)与目标值的偏差: x1-x0, x2-x0,…xn-x0 (2)与平均值 x 的偏差: x1 x, x2 x,...xn x 2. 表征数据的分散程度时,采用偏差平方和, 常用S表示。 n 2 S ( x x ) i 0 存在目标值时: i 1 n 不存在目标值时: 2
2.4.2 系统误差的发现
一 实验对比法 对不同实验条件下的结果进行对比,若具有相 同的误差,则可以认为存在系统误差。 高精度的仪器的测量结果同一般仪器的结果相对比, 若有误差,则认为一般仪器存在系统误差。 二 剩余误差观察法 计算均值 x 和各剩余误差 Si , (Si xi x, i 1,2,n) , 做出 Si 图,并观察大致趋势,以便判断是否存在系 统误差。
某量的真值为u,测量值xi,其中包含有系统误差和 随机误差,即: xi u i i
ˆ 0.0225 Rmax R14 0.05 x 40.413 ˆ Rmax 3
所以,剩余的23个数据无异常。 (5)结论 原测量的24个数据中,X21是坏值应当除去,其余数据均有效。
2.3.3 剔除坏值的其它判据
其它判据主要有: 概率积分判据 肖维涅判据 格拉布斯判据 等 由于课时有限,这些不详细介绍,有 兴趣的同学可以参考《实验数据处理与曲 线拟合》石振东、刘国庆编 哈尔滨船舶工 程学院出版社
2.1 试验设计与数据处理的基本概念
2.1.1 常用术语
一. 质量特性值 表现质量特性的数据称为质量特性值,简 称为特性值。根据其性质可以分为三类:
1. 计量特性值:用连续变化的变量表示的特性 值(即浮点数)。 2. 计数特性值:用离散变量表示的特性值(即 整型数) 。 3. 0、1数据:实际上是布尔数,如“真”与 “假”、“合格”与“不合格”。
VT ( x x) n 1
i 1 i
标准差 又称为均方差或根方差,也是 数据离散程度的一个特征值。 存在目标值 x0时, 1 n ( x x ) 2
n
i 1
i
0
不存在目标值时,
1 n 2 ( x x ) i n 1 i 1
2.2 随机变量及随机误差
二. 试验指标
在试验设计中,根据试验目的而选定的用来判 断试验结果的特性值称为试验指标。
试验指标分为二种:
数量指标(定量):可用数量来表示,如重量、
强度、合格率等。
非数量指标(定性):难以用数量来表示,如
光泽、味道、手感等。 试验指标可以是一个或多个,应尽量选取计数计 量特性值作为试验指标。
三. 试验因素
切削加工时,改变切削速度V可以影响加工质量,切 削速度就是信号因素。
误差因素:影响试验结果或产品质量的内外干扰、随机
干扰的总和。
四. 因素水平 不同的因素状态和条件(大 小)可引起试验指标的变化。 因素变化的状态和条件叫做水 平或级位。
选择水平时应注意以下几点
•水平宜选取三水平(因为三水平因素的试验 结果分析的效因图分布多呈二次函数曲线,而 二次函数曲线有利于观察试验结果的趋势 ) •水平取等间隔原则 • 所选水平应具体(水平具体是指水平应该是可 以直接控制的,并且水平的变化可能直接影响 试验指标的变化。 )
x
n
p( x )dx
2. 随机变量x的方差 x的真差平方的期望值称为方差,记为 Var(x)或 2 D(x),则: Var( x) E{( x E ( x)) } ( x x )2 ( x)dx x服从正态分布时, ( x) Var( x) ( x )称为 x的标准误差。 方差越大,说明x在其期望值符近的波动越大,分 布越不集中,故越不精确。
标准差意义的说明
实际做法是:
a 选定一标准件或检定过的仪表,真值就算已知了。 b 测量条件要非常严格、稳定,以便消除系统误差 c 测量次数尽量多。
3 标准误差的估计-贝塞尔公式
由最小二乘原理,算术平均值 x 是测量的最佳估计 值: ˆ B表示, 标准差的估计值用
1 ˆB { ( xi x ) } N 1 i 1
2.4 系统误差的测定方法与技巧
系统误差的数值往往远大于随机 误差,数据里必须对系统误差及时发 现并做适当处理,否则一定会歪曲测 定结果。
2.4.1 系统误差的特点及处理方法
系统误差分为两种:
(1)大小及符号固定不变,称为系统常差 (2)按一定的规律变化称为系统变差
系统误差产生的原因:
(1)仪器、设备、实验装备的不完备, 或环境条件发生变化。 (2)试验方案、试验方法、试验原理不 完善、不正确。
1 2 N
i xi X
i
是测量的真差,是一个随机变量。
1 最小二乘法
在多组等精度、误差不同且相互独立的测量中, 其最可信赖值是当测量值的“剩余误差平方和”为 最小时所求得的值。 设最可信赖值为 X 0,剩余误差平方和为:
必须满足: 可以求得:
Q i 1 ( xi X 0 ) 2
2.2.1 常用术语
1. 频率与概率 在既定条件下进行N次试验,而事件A发生的 次数为 N A ,则,事件A的频率为 N A / N 。 N趋于 无穷大时的频率即为概率, 记为p(A) 即: 2. 总体与样本 研究对象的全体称为总体。 从总体中随机抽取的n个用来研究的个体称为 样本。
( N A / N ) p( A)
第二章 试验数据处理
试验的目的通常是要以最小的代价 从一系列的方案(工艺、配方)中选出最 佳方案,方案效果要通过试验结果来表 现,试验结果只能从实际测得的数据得 到反映。 由于各种因素的影响,测量的数据 往往不一致,常常具有随机变化成份。 要得到可以真正反映试验结果的信息, 必须对测得的数据进行必要的处理。
例1 对某合金导线的电阻值进行了24次测量,结果如下 表所示,试用伊莱达准则判断结果中有无异常数据。
解: (1)计算数据的平均值和标准差: x和
1 N 1 24 x xi xi 40.41 N i 1 24 i 1
ˆ 1 N ( xi x ) 2 0.0321 N 1 i 1
(2)求数据的最大残差 计算结果如下表所示:
可见,第21次测量值的残差最大, (3)比较 ˆ 3 * 0.0321 0.0963 3
ˆ Rmax 3
Rmax R21 0.11
因此,X21是异常数据,应予以剔除。 (4)剔除X21后,重新计算均值和标准差,并判断是否存在数据异常:
1 找出 ( x1, x2 ,, xN )中的最大值 xmax 和最小值 xmin 2 计算 x和 xmax 3 分别对 和 xmin 进行判断,如果: R 3 (其中 )则予以剔除( R称为残 差)。 Ri xi x 4 剔除后,再按1,2,3步骤进行处理,直到 以上不等式不成立为止。 以上是假定测量值x满足正态分布
N
1 2 2
ˆ B是标准误差 上式称为贝塞尔公式。该式求出的 的最佳估计。
2.3 坏值剔除
对某一量进行了N次测量,得到样
本 ( x1, x2 ,, xN ) 通常,各个测量值同真值相比,出现大误 差的可能性是很小的。如果某个测量值 x i同其 它相比明显超出正常范围,则称其为“坏值”。 产生较大的影 坏值的存在势必对 x和 响。
N
dQ
dX0
0
N
说明,有限次直接测量后的算术平均值就是最 可信赖值。
1 X0 N
i 1
xi
2 标准误差及其意义
通常假定测量值满足正态分布的:
E ( x) 1 NN NhomakorabeaN
i 1
xi
N
2
1 N
2 ( x E ( x )) i 1 i
1 N
2 i 1 i N
减少系统误差的有效方法
(1)试验前,尽可能考虑全面些,充分预 计试验中可能产生系统误差的来源和因素, 并设法消除它们的影响或将这些影响减弱 到最小。 (2)试验中,采用合理、正确的测定方法, 以减弱系统误差的影响。 (3)试验后,若发现存在系统误差,应查 明原因,等消除后再重做试验,以达到满 意结果。
它是个无量纲量。
( x, y) 0 则x, y线性无关
( x, y) 0, y随x的增大而增大, 即正相关
( x, y) 0, y随x的增大而减小, 即负相关
( x, y) 1 则x, y呈线性关系
2.2.3 随机误差的测量理论
对某量直接测量时,都是在有限次测量条件下 获得的,只能得到随机变量的一个样本。只能利用 数理统计的有关理论,对被测量做出可靠的估计。 某量的真值为X,在一定条件下测量N次测得的 结果为 x , x ,, x,