粗大误差

合集下载

粗大误差

粗大误差

r22
xn xn 2 xn x3

r22
x3 x1 xn 2 x1
n 14 ~ 30
以上的r10,r10,r11,r11,r21,r21,r22,r22,分别简记为rij,rij,
判断准则
选定显著性水平,查表得D( , n),
选取计算出的rij 、rij 中的数值大者, 即:
若rij rij , 则选rij,
2. 合理选择判别准则
可根据测量准确度要求和测量次数选择判别准
则。准确度要求高的选择显著性水平=0.01, 要求低的选择显著性水平=0.05。测量次数 n30时,选择3s准则;测量次数n30时,选择 拉依达准则或狄克逊准则;当3n30时,格拉 布斯准则适宜于判别单个异常值,狄克逊准则 适宜于判别多个异常值。
v10 2.66 G(0.01,10)s 2.411.16 2.8
x10不含粗大误差,不是异常值,应保留 v10 2.66 G(0.05,10)s 2.1761.16 2.52 x10为异常值,应剔除
狄克逊(Dixon)准则
正态测量总体的一个样本 x1, x2 ,..., xn ,按从小到大
但不能在不知原因的情况下不加分析就轻易舍 弃测量列中最大或最小的数据,这样可能造成错 觉,会对余下数据的精度作出过高的估计。
因此就有一个确立判别异常值 (粗大误差)界 限的问题。
判别和剔除异常值 ,不可凭主观臆断, 轻易地剔除主观认定为反常的数据,从而人 为地使测得数据一致起来,是不对的;但不 敢舍弃任一个测得数据,一概当作是正常信 息,也是不对的。
对操作人员严格要求; 如检查精神状态与疲 劳程度如果不佳,应停 止其操作,不是靠增加 重复测量次数能解决 问题的.
第二节 统计判断准则

粗大误差处理方法

粗大误差处理方法

粗大误差处理方法在一组条件完全相同的重复试验中,个别的测量值可能会出现异常。

如测量值过大或过小,这些过大或过小的测量数据是不正常的,或称为可疑的。

对于这些可疑数据应该用数理统计的方法判别其真伪,并决定取舍。

常用的方法有拉依达法、肖维纳特(Chavenet)法。

格拉布斯(Grubbs)法等。

一、拉依达法当试验次数较多时,可简单地用3倍标准偏差(3S)作为确定可疑数据取舍的标准。

当某一测量数据(xi)与其测量结果的算术平均值(x-‘)之差大于3倍标准偏差时,用公式表示为:︳xi -x-‘︳>3S则该测量数据应舍弃。

这是美国混凝土标准中所采用的方法,由于该方法是以3倍标准偏差作为判别标准,所以亦称3倍标准偏差法,简称3S法。

取3S的理由是:根据随机变量的正态分布规律,在多次试验中,测量值落在x-‘一3S与x-‘十3S之间的概率为99.73%,出现在此范围之外的概率仅为0.27%,也就是在近400次试验中才能遇到一次,这种事件为小概率事件,出现的可能性很小,几乎是不可能。

因而在实际试验中,一旦出现,就认为该测量数据是不可靠的,应将其舍弃。

另外,当测量值与平均值之差大于2倍标准偏差(即︳xi -x-‘︳>2S)时,则该测量值应保留,但需存疑。

如发现生产(施工)、试验过程屯有可疑的变异时,该测量值则应予舍弃。

拉依达法简单方便,不需查表,但要求较宽,当试验检测次数较多或要求不高时可以应用,当试验检测次数较少时(如n<10)在一组测量值中即使混有异常值,也无法舍弃。

二、肖维纳特法进行n次试验,其测量值服从正态分布,以概率1/(2n)设定一判别范围(一knS,knS),当偏差(测量值xi与其算术平均值x-‘之差)超出该范围时,就意味着该测量值xi 是可疑的,应予舍弃。

判别范围由下式确定:肖维纳特法可疑数据舍弃的标准为:︳xi一x-‘︳/S≥kn三、格拉布斯法格拉布斯法假定测量结果服从正态分布,根据顺序统计量来确定可疑数据的取舍。

粗大误差的检验与坏值的剔除

粗大误差的检验与坏值的剔除

-K
K
s 2s 2s 3s 3s 正态分布 ( x s , x ) (x , x ) (x , x ) n n n n n n
68.27% 95.45% 99.73% ② 单次测量结果的表示 事前误差分析、以往的同等条件、详尽条件下多次测量的统计结果、 检测器具说明书中给出的误差限 --- 标准偏差的估计值
2.785
2.821 2.854 2.884 2.912 2.939 2.963 2.987 3.009 3.103 3.178 3.240 3.292 3.336
2.6 系统误差
恒值系统误差 变值系统误差 变值系统误差存在与否的检验 系统误差的估计 间接测量中系统误差的传递

恒值系统误差
则:
y y f ( x1 x1, x2 x 2,, xm xm )
式中, y 的随机误差。

xi
为间接测量值和各直接测量值
间接测量中系统误差的传递(续)

由于一般情况下测量值远大于不确定度,故按 台劳级数展开上式,并略去高次项得:
f y i i 1 xi
例:有一组重复测量值(C),Xi (i=1,2,…,16):
39.44 39.27 39.94 39.44 38.91 39.69 39.48 40.56 39.78 39.35 39.68 39.71 39.46 40.12 39.39 39.76 试分别用依拉达准则和格拉布斯准则检验粗大误差和剔除坏值。
1.155
1.492 1.749 1.944 2.097 2.221 2.323 2.410 2.485 2.550 2.607 2.659 2.705 2.747
17

系统误差粗大误差随机误差处理顺序

系统误差粗大误差随机误差处理顺序

系统误差粗大误差随机误差处理顺序下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。

文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!本店铺为大家提供各种类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you! In addition, this shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!系统误差、粗大误差和随机误差的处理顺序在进行任何测量或实验过程中,测量结果都会受到各种误差的影响。

粗大误差的检验与坏值的剔除课件

粗大误差的检验与坏值的剔除课件
特点
粗大误差通常表现为离群孤立的 值,与周围的测量值存在明显的 差异。
粗大误差产生的原因
人为因素
如操作失误、读数错误、记录错 误等。
设备故障
如传感器失灵、外表显示特殊等。
环境干扰
如电磁干扰、振动、温度突变等。
粗大误差对数据的影响
01
02
03
歪曲数据真实情况
粗大误差会使得数据出现 特殊波动,从而影响对数 据真实情况的准确判断。
影响数据分析结果
在进行数据分析和处理时 ,粗大误差会导致计算结 果出现偏差,进而影响最 终的分析结论。
降低数据可信度
存在粗大误差的数据会导 致人们对数据的信任度降 低,从而影响数据的进一 步应用。
02
CATALOGUE
粗大误差的检验方法
格拉布斯准则
总结词
基于正态散布的统计检验方法,通过计算格拉布斯统计量,对观测值进行检验 。
03
CATALOGUE
坏值的剔除方法
直观判断法
直接视察
通过直接视察数据,可以发现一些明显的特殊值。例如,一个数据点明显高于或 低于其他数据点,或者与整体趋势不符。
统计检验法
基于统计原理
通过使用统计检验方法,如z分数、IQR等,可以确定哪些数据点是特殊值或坏值。这种方法基于概率散布,能够更科学地剔 除坏值。
案例二:模拟数据中的粗大误差检验与剔除
总结词:模拟实验
详细描述:模拟数据为研究者提供了一个可控制的环境, 用于测试和比较不同粗大误差检验方法的性能。通过模拟 具有不同散布和特性的数据集,可以评估各种方法的准确 性和可靠性,从而选择最合适特定数据集的方法。
案例三:多元数据中的粗大误差检验与剔除
总结词

1.2.3 粗大误差判别

1.2.3 粗大误差判别
2
1.2.3 粗大误差判别
肖维勒准则:假设多次重复测量所得n个测量 值中, 某个测量值的残余误差|vi|>Zcσ,则剔 除此数据。实用中Zc<3, 所以在一定程度上弥 补了3σ准则的不足。
3
1.2.3 粗大误差判别
格拉布斯准则:某个测量值的残余误差的绝对值|vi| >Gσ, 则判断此值中含有粗大误差,据中某个测量值的残余误差的绝对值v则该测量值为可疑值坏值应剔除
1.2.3 粗大误差判别
1. 3σ准则 2. 肖维勒准则 3. 格拉布斯准则
1
1.2.3 粗大误差判别
3σ准则(莱以达准则):如果一组测量数据中某个 测量值的残余误差的绝对值|vi|>3σ时, 则该测量值 为可疑值(坏值), 应剔除。最常用,应用于测量次 数充分多的情况。
4

2.3 粗大误差

2.3 粗大误差

对某角度α进行两组测量,测量结果为:
α1:24°13´36″±6.0″
(k=2) α2:24°13 ´24″〒15.0″ (k=3) 计算角度α的测量结果(k=3)。 解:σ1=6.0/2=3.0 σ2=15/3=5.0 P1:P2=1/σ21:1/ σ22=25:9
p1 x1 p 2 x 2 25 12 9 0 xp 24 1324 241332 .8 p1 p 2 25 9 s x p s1 p1 25 3.0 2.6 p1 p 2 25 9 x p 3s x p 24 1333 7.8
3s x p 7.8 测量结果为

K (n, ) t (n 2) n n 1

还是用上例数据,首先怀疑第八个测量值含有粗大 误差,将其剔除得算术平均值和标准差为
n 1 x xi 20 .411 n 1 i 1 i 8 2 i n 1 i 1
s
v
n2
0.016
选择显著度α=0.05,n=15,查表得
查表
D(0.05,10) 0.530
r11 r11 , r11 D(0.05,10)
故数据中无异常值。
小结
(1)大样本情形(n>10),用3σ准则最简单方便; 小样本情形,用罗曼诺夫斯基准则、Grubbs准则效果 较好,Dixon准则适用于不用计算标准差,因此计算简 单,但是后面3种方法都需要查表。
v 0.016 0.026 -0.004 0.026 0.016 0.026 -0.014 -0.104 -0.004 0.026 0.016 0.006 -0.014 -0.014 -0.004
v2 0.000256 0.000676 0.000016 0.000676 0.000256 0.000676 0.000196 0.010816 0.000016 0.000676 0.000256 0.000036 0.000196 0.000196 0.000016

粗大误差

粗大误差

81 361 121 361 81 361 441 (已剔除) 121 361 81 1 441 441 121
t15 =
t
i 1
15
i
15
=20.404
vi =0.01496
i 1
15
2
v '
i i 1
14
2
=0.003374
t14 =
t
i 1
14
σ=
i
0.01496 =0.033 15 1
除以上准则外,还有狄克逊(Dixon)准则等其他准则,可参阅有关文献。 要指出,以上各准则都是人为主观拟定的,直到目前为止,还没有统一的规定。 此外,所有准则,又都是以数据按正态分布为前提的,当偏离正态分布时,判断 的可靠性将受影响,特别是测量次数很少时更不可靠。因此,对待粗大误差,除 从测量结果中及时发现和利用剔除准则鉴别外, 更重要的是要提高工作人员的技 术水平和工作责任心,不要在情绪不宁和过于疲劳的情况下,进行重要的测量工 作, 另外, 要保证测量条件的稳定, 防止因环境条件剧烈变化而产生的突变影响。
n Zc
40 2.49
50 2.58
3.格拉布斯(Grubbs )准则
格拉布斯准则的来源推导较繁,这里只介绍具体用法。 在测量数值(测量列)中某一数据的残差的绝对值|v|>Gσ时,则判断此值 中含有粗大误差,应予剔除,此即格拉布准则。G 值按重复测量次数 n 及置信概 率 P ɑ由表 4-2 查出。 表 4-2 格拉布斯准则中的 G 值 测 量 测 量 置信概率 P ɑ 置信概率 P ɑ 次数 次数 n n 0.99 0.95 0.99 0.95 3 4 5 6 7 13 14 15 1.16 1.49 1.75 1.94 2.10 2.61 2.66 2.70 1.15 1.46 1.67 1.82 1.94 2.33 2.37 2.41 8 9 10 11 12 16 18 20 2.22 2.32 2.41 2.48 2.55 2.74 2.82 2.88 2.03 2.11 2.18 2.23 2.28 2.44 2.50 2.56

粗大误差判断准则

粗大误差判断准则

粗大误差判断准则摘要: 当在测量数据中发现某个数据可能是异常数据时,一般不要不加分析就轻易将该数据直接从测量记录中删除,最好能分析出该数据出现的主客观原因。

判断粗大误差可从定性分析和定量判断两方面来考虑。

定性分析就是对测量环境、测量条...当在测量数据中发现某个数据可能是异常数据时,一般不要不加分析就轻易将该数据直接从测量记录中删除,最好能分析出该数据出现的主客观原因。

判断粗大误差可从定性分析和定量判断两方面来考虑。

定性分析就是对测量环境、测量条件、测量设备、测量步骤进行分析,看是否有某种外部条件或测量设备本身存在突变而瞬时破坏;测量操作是否有差错或等精度测量过程中是否存在其他可能引发粗大误差的因素;也可由同一操作者或另换有经验操作者再次重复进行前面的(等精度)测量,然后再将两组测量数据进行分析比较,或再与由不同测量仪器在同等条件下获得的结果进行对比,以分析该异常数据出现是否“异常”,进而判定该数据是否为粗大误差。

这种判断属于定性判断,无严格的规则,应细致和谨慎地实施。

定量判断,就是以统计学原理和误差理论等相关专业知识为依据,对测量数据中的异常值的“异常程度”进行定量计算,以确定该异常值是否为应剔除的坏值。

这里所谓的定量计算是相对上面的定性分析而言,它是建立在等精度测量符合一定的分布规律和置信概率基础上的,因此并不是绝对的。

下面介绍两种工程上常用的粗大误差判断准则。

1.拉伊达准则拉伊达准则是依据对于服从正态分布的等精度测量,其某次测量误差|Xi -X0|大于3σ的可能性仅为0.27%。

因此,把测量误差大于标准误差σ(或其估计值)的3 倍的测量值作为测量坏值予以舍弃。

由于等精度测量次数不可能无限多,因此,工程上实际应用的拉伊达准则表达式为(1)式中,Xk 为被疑为坏值的异常测量值;为包括此异常测量值在内的所有测量值的算术平均值;为包括此异常测量值在内的所有测量值的标准误差估计值;KL(=3)为拉伊达准则的鉴别值。

粗大误差四种判别准则的比较

粗大误差四种判别准则的比较

粗大误差四种判别准则的比较粗大误差是指在测量过程中,偶尔产生的某些不应有的反常因素造成的测量数值超出正常测量误差范围的小概率误差。

含有粗大误差的数据会干扰对实验结果的分析,甚至歪曲实验结果。

若不按统计的原理剔除异常值,而把一些包含较大正常误差但不属于异常值的数据舍弃或保留一些包含较小粗大误差的异常值,就会错估了仪器的精确等级。

因此,系统检验测量数据是否含有粗大误差是保证原始数据的可靠及其有关计算的准确的前提。

排除异常数据有四种较常用的准则,分别是拉伊达准则、格拉布斯准则、肖维勒准则和狄克逊准则。

每种判别准则都有其处理方法,导致用不同准则对异常值判别的结果有时会不一致。

目前异常值的剔除还没有统一的准则,本文综合判别粗大误差四种方法的特点,系统归纳各种准则的应用,以便更好地发现和判别含有粗大误差的数据。

1.四种判别粗大误差准则的特点1.1拉伊达准则拉伊达准则[4]是以三倍测量列的标准偏差为极限取舍标准,其给定的置信概率为99.73%,该准则适用于测量次数n>10或预先经大量重复测量已统计出其标准误差σ的情况。

Xi为服从正态分布的等精度测量值,可先求得它们的算术平均值X、残差vi和标准偏差σ。

若|Xi- X|>3σ,则可疑值Xi含有粗大误差,应舍弃;若|Xi- X|≤3σ,则可疑值Xi为正常值,应保留。

把可疑值舍弃后再重新算出除去这个值的其他测量值的平均值和标准偏差,然后继续使用判别依据判断,依此类推。

1.2格拉布斯准则格拉布斯准则适用于测量次数较少的情况(n<100),通常取置信概率为95%,对样本中仅混入一个异常值的情况判别效率最高。

其判别方法如下:先将呈正态分布的等精度多次测量的样本按从小到大排列,统计临界系数G(a,n)的值为G0, 然后分别计算出G1、Gn:G1=( X-X1)/σ,Gn=(Xn- X)/σ (1)若G1≥Gn且G1>G0,则X1应予以剔除;若Gn≥G1且Gn>G0,则Xn应予以剔除;若G1<G0且Gn<G0,则不存在“坏值”。

电快速脉冲群试验中粗大误差分析及解决方案

电快速脉冲群试验中粗大误差分析及解决方案

电快速脉冲群试验中粗大误差分析及解决方案电快速脉冲群试验(EFT)是电子设备电磁干扰测试的一种常见方法,该测试可以模拟现实环境中的瞬态电磁干扰,评估设备是否能够正常工作。

而在EFT测试过程中,由于种种因素造成的粗大误差是不可避免的,因此需要对其进行分析及解决。

本文就对此展开探讨。

一、EFT试验中的粗大误差在EFT试验中,当测试设备受到高能脉冲时,会产生电磁波并进入线路中,可能导致线路中出现峰值电压或电流,可能引起设备闪烁,重新启动或直接崩溃。

如果这些峰值过大,就会超出设备能够忍受的范围,从而可能导致损坏设备。

粗大误差通常是由于EFT测试(ENE(N)、CENELAC、SABS/IEC等标准)中电路的共振或谐振引起的,如下所示:1. 瞬间负载变化这是EFT试验中的常见粗大误差之一,由于大量电流在极短时间内瞬间产生并消失,通常是由于电容器的共振引起的,这会导致测试设备电压波动,设备可能会重新启动或直接崩溃。

2. 阻抗不匹配由于由于测试设备输入端和电源之间的组件的电抗不匹配,导致试验中发生共振,产生粗大误差。

阻抗不匹配通常是由于路由、线路等组件的电抗不匹配引起的。

3. 内部共振当测试设备的内部结构共振时,测试电路也会共振,这会导致测试电压过大,从而损坏测试设备。

以上就是EFT试验中常见的三种粗大误差,它们都带来了极大的威胁。

所以必须采取一些措施来减少它们带来的风险。

二、降低粗大误差的解决方案要对EFT测试中的粗大误差加以解决,可以采取以下几个方面的策略:1. 降低测试设备的灵敏度这是最常见的解决方法。

降低测试设备的灵敏度可以减少测试辐射,从而降低线路中电磁波的能量,减少测试设备的电压波动。

2. 保护设备采用各种保护电路,如电源线滤波器、抑制器、隔离变压器等,或采用专用的电磁兼容性测试电源来减少瞬时负载变化。

3. 更换组件可以更换测试设备中有问题的组件来解决粗大误差问题。

更换组件可使测试设备的谐振频率发生变化,从而避免谐振,减少粗大误差。

粗大误差理论(精)

粗大误差理论(精)

一、粗大误差问题概述
1、什么是粗大误差? 粗大误差,亦称过失误差或反常误差, 它是由于测试人员主观因素或者由于测试 条件突然变化引起的明显与测量结果不符 的误差,比如仪器操作不当,读数错误、 记录和计算错误、测试系统的突然故障和 环境条件(如仪器的灵敏度、电源电压和 频率、环境温度)等疏忽因素而造成的误 差,因而又简称粗差。

v
i 1
n
2 i
n2
3、格罗布斯准则
设对某量作多次等精度独立测量,得 x1 , x2 ,..., xn
当x j 服从正态分布时,计算
1 x x n
vi xi x

2 v
n 1
为了检验 xi (i 1,2,...,n)中是否存在粗大误差,将 x i 按大小顺 序排列成顺序统计量 xi ,而 x1 x2 ... xn 格罗布斯导出了gn 及 g1 的分布,取定显著 (一般为0.05或0.01),可以得到格罗布斯系数 g0 (n, ) 度 而 x x1 x x
2、粗大误差对测量数据的影响 ▫可疑数据:在一列重复测量的数据中,有个别数 据xd 与其它数据有明显差异,它可能是含有粗大 误差(简称粗差)的数据。 ▫异常值:确定混有粗大误差的数据。
不恰当地剔除 含大误差的正 常数据,会造 成测量重复性 偏好的假象
未加剔除,必 然会造成极差比的方法,得到简化而严 密的结果。
狄克松研究了x1 , x2 ,..., xn的顺序统计量 xi 的分布,当 x i 服从正 态分布时,得到 xn 的统计量 xn xn1 xn xn1
r10
xn x1
xn xn2 xn x2
xn x
x x1

粗大误差

粗大误差
所以|V i’|值均小于 (4)按 t 检验准则 先将可疑值 t 8 除外,按余下的 14 个数据计算得:
Gσ’ ,故无坏值。
t 1 4 =20.411
σ’=0.016 取显著度ɑ=0.01(即置信概率为 0.99).已知 n=15,查表 4-3 得系数 k=3.12。 则 kσ’ =3.12×0.016=0.05 因 | t 8 - t 1 4 |=|20.30-20.411|=0.111>0.05
vi ' 2 10 6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
20.42 20.43 20.40 20.43 20.42 20.43 20.39 20.30 20.40 20.43 20.42 20.41 20.39 20.39 20.40
+0.016 +0.026 -0.004 +0.026 +0.016 +0.026 -0.014 (-0.104) -0.004 +0.026 +0.016 +0.006 -0.014 -0.014 -0.004
4.t 检验准则
t 检验准则又称罗曼诺夫斯基准则, 它是按 t 分布的实际误差分布范围来判 断粗大误差,这对重复测量次数较少的情况比较合理,而一般测量的重复测量次 数总是很有限的。 t 检验准则的特点是将测量列的 n 个测得值中可疑的测得值 x j 先剔除,然 后按余下的(n-1)个数据计算算术平均值 x ’和标准差σ’值,再判断数据 x j 是否含有粗大误差。
故可判断数据 t8 含有粗大误差,应予以剔除。 再对余下的 14 个数据继续判断,先提出 t7(|V 7 ’|最大) ,
t 13 =20.4103

判别粗大误差的准则

判别粗大误差的准则

判别粗大误差的准则引言在测量和统计领域,精确度和准确度是非常重要的概念。

准确度是指测量结果与真实值之间的接近程度,而精确度是指多次测量结果之间的一致性。

然而,在实际应用中,由于各种原因,可能会出现误差,其中包括粗大误差。

粗大误差是指显著偏离真实值的异常观测值或数据点。

它可能由仪器故障、操作失误、环境变化等多种因素引起。

为了保证数据的可靠性和准确性,判别并排除这些粗大误差是必要的。

本文将介绍判别粗大误差的准则,并提供一些常用的方法和技术来检测和处理这些异常观测值。

判别粗大误差的准则1. 样本点与平均值之间的偏离程度判断一个样本点是否为粗大误差可以通过计算其与平均值之间的偏离程度来进行。

常用的方法有使用标准差或者残差来衡量。

•标准差:计算所有样本点与平均值之间的差异,并根据标准差的大小来判断是否为粗大误差。

一般来说,如果一个样本点与平均值之间的差异超过平均差异的两倍或三倍,就可以被视为粗大误差。

•残差:对于回归分析等情况,可以计算每个样本点的残差(观测值与拟合值之间的偏差),并根据残差的大小来判别是否为粗大误差。

通常情况下,如果一个样本点的残差超过平均残差的两倍或三倍,就可以被视为粗大误差。

2. 离群点检测离群点是指在数据集中与其他数据点明显不同的观测值。

离群点可能是由于异常情况、错误测量、记录错误等原因导致。

判别离群点可以使用以下方法:•离群因子(Outlier Factor):通过计算每个观测值周围其他观测值的密度来判断其是否为离群点。

如果一个观测值周围其他观测值的密度较低,则可以被认为是离群点。

•基于距离的方法:通过计算观测值与其他观测值之间的距离来判断其是否为离群点。

如果一个观测值与其他观测值之间的距离明显大于平均距离,则可以被认为是离群点。

•箱线图(Box Plot):通过绘制数据的箱线图来判断是否存在离群点。

箱线图展示了数据的四分位数和异常值,如果一个观测值超过上下四分位数的1.5倍或3倍,可以被视为离群点。

误差理论第二章-3粗大误差处理

误差理论第二章-3粗大误差处理
例题见书P49。
5
§2-4 测量结果的数据处理实例
一、等精度直接测量列测量结果的数据处理实例 例1、对某一轴径等精度测量10次,测得值如下(单位 mm), 26.2025;26.2022;26.2028;26.2025;26.2026;
26.2028;26.2023;26.2025;26.2026;26.2022.
即x 1 x 2 r10 r21
设对一组等精度测量列x1 , x2 , x n x n 1 , x n x 1 x n x n 2 , x n x 2
x n ,当xi 服从正态分布时,得最大值x n 的统计量: r11 r22 x n x n 1 x n x 2 x n x n 2 x n x 3
求最后测量结果。
见备课笔记P25
6
二、不等精度直接测量列测量结果的数据处理 例2、对某一角度进行六组不等精度测量,各组测量结 果如下:
测6次得: 1 751806; 测30次得: 2 751810 测26次得:3 751808; 测12次得: 4 751816 测12次得:5 751813; 44 上的例题
(二)罗曼诺夫斯基准则(t检验准则)测量次数很小时用 当测量次数较少时,按t分布较为合理。先剔除一个可疑的测得 值,按t分布检验被剔除的测量值是否含有粗大误差。
对一等精度测量列,x1 , x2 , 除后计算平均值:
, xn , 若认为xj为可疑数据,将其剔
2
n 1 x xi n 1 i 1,i j
r21
x 1 x 3 x 1 x 3 , r22 x 1 x n 1 x 1 x n 2

笔记五、粗大误差的处理方法

笔记五、粗大误差的处理方法

当测量列中,有 2 个以上的测量值含有粗大误差时,判别时,应该 先剔除含有最大误差的测得值,然后再重新计算测量列中的算术平 均值、 标准差; 然后再对余下的测得值进行判别, 直至所有测得值都 不含粗大误差为止。
r0 (n, ) ;
判断最大值 x( n ) :计算极差比 rij ,若 rij r0 (n, ) ,则该值含 有粗大误差,应剔除;否则保留。 判断最小值 x(1) :计算极差比 rij ,若 rij r0 (n, ) ,则该值含 有粗大误差,应剔除;否则保留。 剔除完数据后,再重新排序计算最大值、最小值极差,查表 得临界统计量 r0 (n ' , ) (注意:次数发生了变化) ,重复上述判 断方法,直至最大、最小值不含有粗大误差为止。 参数选择: ①测量次数 n 7 ,使用 r10 判断; 8 n 10 ,使用 r11 判断; 测量次数 11 n 13 ,使用 r21 判断; n 14 ,使用 r22 判断;
x(1) x
所以应该先怀疑 x(1) : g(1)


20.404 20.30 3.15 0.033
选取显著度 0.05 ,查表得 g(0) (15,0.05) 故此测量值含有粗大误差, 应该 g(1) 3.15 g(0) (15,0.05) 2.41 , 剔除。 剔除后再重新计算平均值、标准差: x 20.411 , ' 0.016 计算 g( n )
x1 , x2 ,..., xn
计算平均值、残余差、标准差:
x
1 v2 x , vi =xi x , = n 1 n
将测量值 xi (i=1,2,3…n)按照从小到大进行排序,找到最小值
x(1) 和最大值 x(n)

4第三章粗大误差

4第三章粗大误差

计算结果
测量电阻的极限误差
t0.05 9 s 0.14 0.2
10 故该电阻的测量结果为
101.3 0.2
总结
(1)大样本情形(n>50),用3σ准则最简单方 便;30<n<50情形,用Grubbs准则效果较好;
3 n 30 情形,用Grubbs准则适用于剔除单个
异常值,用Dixon准则适用于剔除多个异常值。
三、判别粗大误差应注意的几个问题
(五)全部测量数据的否定
➢ 若在有限次的测量列中,出现两个以上异 常值时,通常可认为整个测量结果是在不 正常的条件下得到的,对此应改进完善测 量方法,重新进行有效测量。
欢迎进入下一章的学习: 《非等精度测量》
二、增加测量次数,继续观察
如果在测量过程中,发现可疑测量值又 不能充分肯定它是异常值时,可以在维 持等精密度测量条件的前提下,多增加 一些测量次数。根据随机误差的对称性, 以后的测量很可能出现与上述结果绝对 值相近仅符号相反的另一测量值,此时 它们对测量结果的影响便会彼此近于抵 消。
三、用统计方法进行判别
在测量完毕后,还不能确定可疑测量 值是否为含有粗大误差的异常值时, 可按照依据统计学方法导出的粗大误 差判别准则进行判别、确定。
四、保留不剔,确保安全
利用上述三种原则还不能充分肯定 的可疑值,为保险起见,一般以不 剔除为好。
第三节 粗大误差的统计判别方法
一、统计方法的基本思想
给定一个显著性水平,按一定分布确定一个 临界值,凡超过这个界限的误差,就认为它 不属于随机误差的范畴,而是粗大误差,该 数据应予以剔除.
xn xn2 xn x3

r22
x3 x1 xn2 x1
n 14 ~ 30
判断准则:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x9 10.0012 10.0007 x10 0.625 x2 10.0012 10.0004 x10 x x 10.0004 10.0003 2 1 r11 0.25 x1 10.0007 10.0003 x9 r11
' 计算出最小值和最大值的检验统计量,对 x1' 计算 rij' ,对 x n 计算 rij
,按从大到小顺序排列为 x1 , x2 ,..., xn
r10
xn 1 xn x1 xn
r10

r11
x1 x2 x1 xn
n 3~ 7
G1 x x1 S
xn x S
设 xn 是可疑的,则:
G n
式中: x
1 n xi , S n i 1
1 n Vi 2 n 1 i 1
⑶ 查表 5-2/p76 相应于 n 和 的 Gn, 的Байду номын сангаас; ⑷ 如 Gi Gn, ,则所怀疑的数据是异常值,应予舍弃.这样的判断出错的概 率为 ,如果 Gi Gn, ,则不应以显著性水平 舍弃. 【例 4-1】 在检定杠杆千分尺的示值极限误差时, 用五等标准量块重复测量了 20 次, 20.002, 20.000, 20.000, 20.001, 20.000, 19.998, 20.000, 20.001, 19.998, 20.002, 20.002, 20.000,20.004,20.000,20.002,19.992,19.998,20.002,19.998。其中 疑数据,判断是否该剔除? 【解】
计算 x 20.000 mm , s 2.5um ,查表 : 20) 2.88 G (0.01,
为可
v17 8 G(0.01, 20) s 2.28 2.5 7.2
故应剔除 .例 2-20/P49 4、狄克松准则 上面几种判断粗大误差的准则都需要先求出样本的标准差 S,为了避免计算 S 的 麻烦, 狄克逊根据顺序统计的原理, 利用极差比构成统计量,经严密推算和简化, 在 1953 年提出了狄克逊准则。即对 正态测量总体的一个样本 x1 , x2 ,..., xn 构造统计量
s( xi ) n

x x
n n 1
i
2
重复测量某电阻共 10 次,其数据如下 10.0003,10.0004,10.0004,10.0005,10.0005,10.0005,10.0006,10.0006,10.0007, 10.0012, 试分别用粗差准则和稳健算法处理测量结果。 (显著性水平α=0.05)
例 2-19/P48(费业泰书) 3、格拉布斯(Grubbs)准则 设 X 服从正态分布,X 的一个随机子样(即实验测定值)为:x1,x2,…xn.将子 样数据按其大小排成数据列,x1' ,x2' , . . .xn' ,如果怀疑最小或最大的数据为可疑数 据,其判断方法如下: ⑴ 选定显著性水平 (0.01,0.05,0.025), 即是否定假设的概率,亦即判定出 错的概率; ⑵ 计算 Gi 的值,设 x 1 是可疑的,则:
3、测量仪器内部的突然故障
若不能确定粗大误差是由上述两个原因产生时,其原因可认为是测量仪器内部的 突然故障。统计判断准则 一、统计方法的基本思想
给定一个显著性水平,按一定分布确定一个临界值,凡超过这个界限的误差,就 认为它不属于随机误差的范畴,而是粗大误差,该数据应予以剔除 测量数据含有随机误差和系统误差是正常现象,只要误差值不超过规定的允许 值,所得测量结果就应该接受。但是粗大误差超出了正常的误差分布范围,对测量结 果造成歪曲,含有粗大误差的测量结果称为异常值。二、粗大误差的防止与消除 对于粗大误差, 除了设法从测量结果中发现和鉴别而加以剔除外, 更重要的是要 加强测量者的工作责任心和以严格的科学态度对待测量工作;此外,还要保证测量条 件的稳定,或者避免在外界条件发生变化时进行测量。如能达到以上要求,一般情况 下是可以防止粗大误差的产生的。 在某些情况下,为了及时发现与防止测量值中含有粗大误差,可以采用不等精度 测量和互相之间进行校核的方法。 三、粗大误差的判别准则 1、莱以特准则( 3 准则) 对某个可疑数据 x d ,若
第一节
一、粗大误差对测量数据的影响
粗大误差问题概述
可疑数据 :在一列重复测量数据中,有个别数据 与其他数据有明显差异,他可能
是含有粗大误差(简称粗差)的数据。 异常值:确定混有粗大误差的数据 ⑴不恰当地剔除含大误差的正常数据,会造成测量重复性偏好的假象。 ⑵未加剔除,必然会造成测量重复性偏低的后果。粗大误差的数值比较大,它会 对测量结果产生的明显的歪曲,一旦发现含有粗大误差的测量值,应将其从测量结果 中剔除。 二 粗大误差产生的原因
s ( x0.1 )

i2
9
2 i
10 10 2 (0.1 10)
0.00003
n [ n ]
3.求 截尾均值。 x0.1 有可疑 无可疑 常取
0
n 2[ n]
[ n ]1

xi
0.1
不截尾,即常规的算术平均值
n [ n ] [ n ]1
4.标准差估计 有可疑
s ( x )

2 i
n(n 2[ n])
,无可疑
s( x )
1 x xn r11 n x2 xn xn 2 xn x2 xn
与 与
r21
x1 x2 1 x1 xn
n 8 ~ 10
r21
x1 x3 1 x1 xn
n 11~ 13
判断准则: 若:
少,因此 3 只是一个近似的准则) 例 2-18/P46(费业泰书) 2、罗曼诺夫斯基准则(t 检验准则) 特点——首先剔除一个可疑的测量值,然后按 t 分布检验被剔除的测量值是否含 有粗大误差。 设:对某量作多次等精度测量得: x1 , x 2 ,, x n ,若认为测量值 x j 为可疑的数据, 将其剔除后计算平均值为(计算时不包括 x j ) ①x
, r11 D(0.05,10) r11 r11 故数据中无异常值。
计算结果: 测量电阻的极限误差:

t0.05 9 10
s 0.14 0.2
故该电阻的测量结果为 : 101.3 0.2
总结:
(1)大样本情形(n>50) ,用 3σ 准则最简单方便;30<n<50 情形,用 Grubbs 准则 效果较好; 情形,用 Grubbs 准则适用于剔除单个异常值,用 Dixon 准则适 用于剔除多个异常值。 (2)在实际应用中,较为精密的场合可选用二三种准则同时判断,若一致认为应当剔 除时,则可以比较放心地剔除;当几种方法的判定结果有矛盾时,则应当慎重考虑, 通常选择,且在可剔与不可剔时,一般以不剔除为妥。 第三节 测量数据的稳健处理
d xd x 3s
xd
含有粗差,可剔除;否则予以保留
S--贝塞尔公式计算的标准差, 样本数 n 50 时适用.在 n≤10 的情形, 用 3σ准则剔除粗差注定失效
xd x
(x x )
i
2
n 1s
取 n≤10,
xd x 3s
恒成立前提—测量次数充分大(通常测量次数皆较
1、客观外界条件的原因:
机械冲击、外界震动、电网供电电压突变、电磁干扰等测量条件意外地改变 ,引 起仪器示值或被测对象位置的改变而产生粗大误差。 2、测量人员的主观原因 测量者工作责任性不强,工作过于疲劳,对仪器熟悉与掌握程度不够等原因,引 起操作不当,或在测量过程中不小心、不耐心、不仔细等,从而造成错误的读数或错 误的记录。
稳健处理的步骤:
一组测量数据 稳健处理的步骤如下: 1.计算数据的标准差 S 2.判别可疑数据
, x2 ,..., xn ,按从大到小顺序排列为 x1 x1 , x2 ,..., xn
i10, xi x n k0 k 0.6, k 3 0 k s n 10, k0 0.7, k n 1
x9 101.7 101.5 计算统计量: r x10 0.333 11 x2 101.7 101.1 x10 x x 101.1 101.0 2 1 r11 0.2 x1 101.5 101.0 x9
查表: D(0.05,10) 0.530
【解】: 计算统计量
查表:
D(0.05,10) 0.530
, r11 D(0.05,10) r11 r11
故根据狄克逊准则数据中 x10 10.0012 为异常值。
格拉布斯准则计算结果:
计算:
x 10.00057
G(0.05,10) 2.18
s 0.00025
v10 0.00063 G (0.05,10) s 2.18 0.00025 0.00055
rij rij , rij D( , n)
为异常值。
‘ 则判断 x n
否则,判断没有异常值。
若:
rij rij , rij D( , n)
’ 则判断 x1 为异常值。
【例 4-2】
重复测量某电阻共10次,101.0,101.1,101.2,101.2,101.3,101.3,101.3,101.4, 101.5,101.7。数据已按大小顺序排列,用狄克逊准则判断其中是否有粗差,并写出 测量结果。
1 n xj n 1 i 1
i j
②求测量列的标准偏差(计算时不包括 U j x j x )

v
i 1
n
2 i
n2
③根据测量次数 n 和选取的显著度 ,即可由表 2-12 查得 t 分布的检验系数
相关文档
最新文档