粗大误差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7
8 9 10
20.39
20.30 20.40 20.43
v
i 1
15
2 i
n1
0.014960 0.033 15 1
x8 20.30为可疑数据
v8 0.104 3 s 0.099
11
12 13 14 15
20.42
20.41 20.39 20.39 20.40
x8为异常值,应剔除
思考与练习题
4-1 4-2 4-3 4-10
1 55.2 -0.44
2 54.6 -1.04
3 56.1 0.46
4 55.4 -0.24
5 55.5 -0.14
6 54.9 -0.74
7 56.8 1.16
8 55.0 -0.64
9 54.6 -1.04
10 58.3 2.66
解:首先根据测量数据计算算术平均值和标准差
1 10 x xi 55.64 10 i 1
2)然后用3s来检查所有的残余误差vi, 若某一个| vi |>3s, 则可视为粗大误差予以剔除。 3)然后重新计算标准偏差 s ,再将新算出的残余误差 进行判断,每一次只能剔除一个vi绝对值最大的测值作为 粗大误差,直到不存在粗大误差为止。
例4-1
n
1 2 3 4 5 6
xi
20.42 20.43 20.40 20.43 20.42 20.43
因此就有一个确立判别异常值 (粗大误差)界 限的问题。
判别和剔除异常值 ,不可凭主观臆断, 轻易地剔除主观认定为反常的数据,从而人 为地使测得数据一致起来,是不对的;但不 敢舍弃任一个测得数据,一概当作是正常信 息,也是不对的。
原则(即分析解决问题的思路):
异常值的界限应以随机误差的实际分布 范围作为依据,即超出该范围的误差,可被 视为异常值而予以剔除。
补充测量次数
粗大误差处理原则
用统计方法进行判别
在测量完成后,还不能确定测量可疑值是否为 异常值时,可以用统计方法对可疑值进行判别 和确定。
保留不剔
统计方法还不能充分肯定可疑值为异常值时 ,建议保留可疑数据,以确保评定的可靠性。
判别粗大误差应注意的问题
1. 准确找出可疑测量值
测量列中残差绝对值最大者即可为可疑值。它 是测量列中最大测得值或最小测得值之一,仅 比较这两个残差的大小即可确定。
【例4-3】
重复测量某电阻共10次,101.0,101.1,101.2,101.2, 101.3,101.3,101.3,101.4,101.5,101.7。数据已按大 小顺序排列,用狄克逊准则判断其中是否有粗差。
x10 x9 101.7 101.5 r11 0.333 x10 x2 101.7 101.1 x2 x1 101.1 101.0 r11 0.2 x9 x1 101.5 101.0
狄克逊(Dixon)准则
正态测量总体的一个样本 x1 , x2 ,..., xn ,按从小到大 顺序排列为 x1 x2 xn
构造统计量
r10 r11 r21 r22 xn xn 1 xn x1 xn xn 1 xn x2 xn xn 2 xn x2 与 与 r10 r11 x2 x1 xn x1 x2 x1 xn1 x1 x3 x1 xn1 x1 n3~7 n 8 ~ 10 n 11 ~ 13 n 14 ~ 30
判别粗大误差应注意的问题
3. 全部测量数据的否定
若在有限次数测量列中出现两个以上异常值时 ,通常可以认为整个测量结果是在不正常的条 件下得到的。对此应采取措施完善测量方法, 重新进行测量。 由判别准则确定为异常值的可疑数据,不能简 单剔除了事,还要仔细分析,找出产生异常值 的原因,作出正确的判断。
4. 查找产生异常值的原因
剔除可疑数据
百度文库
一、根据测量次数n选择判别准则 二、根据测量数据的可靠性要求,选择置信概率, 当可靠性要求 较高时 p 0.99 ,一般可取 p 0.95 三、根据选择的准则和置信概率差相应的数表,确 定粗大误差的界限 四、由测量数据计算统计量 五、计算出的统计量与误差界限比较,若超出界限 ,将其对应值剔除 六、对剩余的数据重新计算,重复上述步骤进行判 断。
vi
+0.016
+0.026 -0.004 +0.026
判别下列等权测量某一物理量15 次所得的测得值中是否有异常值。
解:首先根据测量数据计算 算术平均值和标准差
1 15 x xi 20.404 15 i 1
s
+0.016
+0.026 -0.014 -0.104 -0.004 +0.026 +0.016 +0.006 -0.014 -0.014 -0.004
对剩余的14个测量值重新判别
格拉布斯(Grubbs)准则
对某个可疑数据xd ,若
xd x G ( , n) s
xd 含有粗差,可剔除;否则予以保留
s 贝塞尔公式计算的标准差
G( , n)
查表获得
【例4-2】
用格拉布斯准则判别下列一组等权测量所得的测得值中是 否有异常值
n
xi
vi
粗大误差对测量数据的影响
粗大误差 可疑数据
在一列重复测量数据中,有个别数据 xd 与其他数据有明显差异,他可能是含有 粗大误差(简称粗差)的数据,也可能 是正常的大误差数据。
指明显超出统计规律预期值的误差。
f(x)
随机误差分布
异常值
确定混有粗大误差的数据
不恰当地剔除含大 误差的正常数据, 会造成测量重复性 偏好的假象 未加剔除, 必然会造成 测量重复性 偏低的后果
2. 合理选择判别准则
可根据测量准确度要求和测量次数选择判别准 则。准确度要求高的选择显著性水平=0.01, 要求低的选择显著性水平=0.05。测量次数 n30时,选择3s准则;测量次数n30时,选择 拉依达准则或狄克逊准则;当3n30时,格拉 布斯准则适宜于判别单个异常值,狄克逊准则 适宜于判别多个异常值。
s
v
i 1
10
x10 58.3为可疑数据
12.024 1.16 n1 10 1
2 i
v10 2.66 G (0.01,10) s 2.41 1.16 2.8
x10不含粗大误差,不是异常值,应保留 x10为异常值,应剔除 v10 2.66 G(0.05,10) s 2.176 1.16 2.52
避免可能造成环境 严重干扰的情形工 作。如:快下班时 间,周围正在施工. 对操作人员严格要求; 如检查精神状态与疲 劳程度如果不佳,应停 止其操作,不是靠增加 重复测量次数能解决 问题的.
第二节 统计判断准则
异常值 (粗大误差)是测量过程中操作者的 偶然失误或环境的突发干扰造成的。含有粗大误 差的测量数据,相对于正常数据来说相差较大。 对已确知是在受到外界不正常干扰下测得的数 据,或经检查是错读、错记的数据,则应舍弃。 但不能在不知原因的情况下不加分析就轻易舍 弃测量列中最大或最小的数据,这样可能造成错 觉,会对余下数据的精度作出过高的估计。
若不能确定粗大误差是由上述两个原因产生时,其原 因可认为是测量仪器内部的突然故障。
测量仪器内部的突然故障
粗大误差的危害及消除方法
(1) 测量前,排除粗大误差的物 理源;
(2) 测量中,采用防止可能造 成粗大误差的措施; (3) 测量后,对采集的测量 数据进行适当处理 ,剔除含 粗大误差的数据;或采用稳健 的数据处理方法。
粗大误差
x_3 x0 x xi x+3 xd x
粗大误差产生的原因
客观外界条件的原因
机械冲击、外界震动、电网供电电压突变、电磁干扰 等测量条件意外地改变 ,引起仪器示值或被测对象位 置的改变而产生粗大误差。
测量人员的主观原因
测量者工作责任性不强,工作过于疲劳,对仪器熟悉 与掌握程度不够等原因,引起操作不当,或在测量过 程中不小心、不耐心、不仔细等,从而造成错误的读 数或错误的记录
统计方法的基本思想
给定一个显著性水平,按一定分布确定一 个临界值,凡超过这个界限的误差,就认 为它不属于随机误差的范畴,而是粗大误 差,该数据应予以剔除。
3σ准则 格拉布斯(Grubbs)准则 狄克逊(Dixon)准则
3σ 准则(拉依达准则 )
对某个可疑数据xd ,若
d xd x 3s
与 r21
xn xn 2 x x1 与 r22 3 x n x3 xn 2 x1
以上的r10,r10,r11,r11,r21,r21,r22,r22,分别简记为rij,rij,
判断准则
选定显著性水平,查表得D( , n), 选取计算出的rij 、rij 中的数值大者, 即: 若rij rij , 则选rij, 若rij D ( , n), 则xn为异常值, 若rij rij , 则选rij, 若rij D ( , n), 否则判断为没有异常值。 则x1为异常值,
【解】
计算统计量
查表
D(0.05,10) 0.530
r11 r11 , r11 D(0.05,10)
故数据中无异常值。
粗大误差处理原则
直观判断,及时剔除
通过对可疑数据的分析,确认是由于错读、错记、 错误操作、测量条件突发变化、数据处理或计算差 错而得到的测量值,可以随时将该次测量得到的结 果从测量记录中剔除。但是,必须注明剔除原因。 这种剔除方法称为物理判别法,也称直观判别法。 如果在测量过程中不能用直观判别法充分肯定可疑 值为异常值时,可以在相同的重复测量条件下补充 适当的测量数据。根据随机误差的对称性,补充测 量数据很可能出现与上述结果绝对值相近而符号相 反地另一测量值,这时它们对测量结果的影响将可 能彼此抵消。
xd 含有粗差,可剔除;否则予以保留
s 贝塞尔公式计算的标准差 样本数 n 50 时适用
在n≤10的情形,用3σ准则剔除粗差注定失效
xd x ( xi x ) 2 n 1s
因为,当取n≤10时
xd x 3s
恒成立
具体步骤:
1)先按Bessel公式算出实验标准偏差s,
第4 章 粗大误差
教学目标
本章介绍在测量前或测量后如何发现粗大 误差,如果无法发现并剔除粗大误差,则 又如何在测量数据处理中去减小其对测量 结果的影响。具体介绍三个常用的统计判 断准则。
教学重点和难点
粗大误差产生的原因 3 准则 格拉布斯准则 狄克逊准则
第一节 粗大误差问题概述