4第三章:粗大误差
粗大误差
r22
xn xn 2 xn x3
与
r22
x3 x1 xn 2 x1
n 14 ~ 30
以上的r10,r10,r11,r11,r21,r21,r22,r22,分别简记为rij,rij,
判断准则
选定显著性水平,查表得D( , n),
选取计算出的rij 、rij 中的数值大者, 即:
若rij rij , 则选rij,
2. 合理选择判别准则
可根据测量准确度要求和测量次数选择判别准
则。准确度要求高的选择显著性水平=0.01, 要求低的选择显著性水平=0.05。测量次数 n30时,选择3s准则;测量次数n30时,选择 拉依达准则或狄克逊准则;当3n30时,格拉 布斯准则适宜于判别单个异常值,狄克逊准则 适宜于判别多个异常值。
v10 2.66 G(0.01,10)s 2.411.16 2.8
x10不含粗大误差,不是异常值,应保留 v10 2.66 G(0.05,10)s 2.1761.16 2.52 x10为异常值,应剔除
狄克逊(Dixon)准则
正态测量总体的一个样本 x1, x2 ,..., xn ,按从小到大
但不能在不知原因的情况下不加分析就轻易舍 弃测量列中最大或最小的数据,这样可能造成错 觉,会对余下数据的精度作出过高的估计。
因此就有一个确立判别异常值 (粗大误差)界 限的问题。
判别和剔除异常值 ,不可凭主观臆断, 轻易地剔除主观认定为反常的数据,从而人 为地使测得数据一致起来,是不对的;但不 敢舍弃任一个测得数据,一概当作是正常信 息,也是不对的。
对操作人员严格要求; 如检查精神状态与疲 劳程度如果不佳,应停 止其操作,不是靠增加 重复测量次数能解决 问题的.
第二节 统计判断准则
随机误差和粗大误差
标准误差σ :又称为标准偏差
1 n = ( M i A0 ) 2 n i 1
§2-5、误差分析的基本概念:
三、测量 的准确度与精密度:
反映测量结果与真值接近程度的量称为精度。它与 误差的大小相对应,因此可用相对误差大小来表示精度 的高低,相对误差小则精度高,相对误差大则精度低, 但这种描述也不够准确,具体又分下面几种情况:
x ik 平均值为A i 两组测量值 x jk 平均值为A j 1 n 2 xi x j ( xik Ai )(x jk A j ) 协方差定义为: n k 1 2 x ixj 相关系数是标准化的协 方差,定义为: r ( xi , x j ) xi x j
§2-5、误差分析的基本概念: 二、和误差相关的几个基本概念: 4、协方差与相关系数:
②.相关系数:两误差间有线性关系时,其相关性强弱
由相关系数来反映。由概率论可知,相关系数的取值范 围是: 注意: 当r很小,甚至等于0时,两误差间不存在线性关系,但并 不表示它们之间不存在其它的函数关系。
1 r ( xi , x j ) 1
时间而发生劣化;
3、电气、气压、油压等动力源的噪声及容量的影响; 4、检测线路接头之间存在接触电势或接触电阻; 5、检测系统的惯性即迟延传递特性不符和检测的目的 要求,因此要同时考虑系统静态特性和动态特性;
§2-3、误差原因分析:
测量过程中,误差产生的原因可归纳为以下几个方面:
6、检测环境的影响,包括温度、湿度、气压、振动、 辐射等; 7、不同采样所得测量值的差异造成的误差; 8、人为的疏忽造成误读,包括个人读表偏差,知识
但就总体而言,具有统计规律性。其测量值具有可
抵消性。
粗大误差四种判别准则的比较
粗大误差四种判别准则的比较粗大误差是指在测量过程中,偶尔产生的某些不应有的反常因素造成的测量数值超出正常测量误差范围的小概率误差。
含有粗大误差的数据会干扰对实验结果的分析,甚至歪曲实验结果。
若不按统计的原理剔除异常值,而把一些包含较大正常误差但不属于异常值的数据舍弃或保留一些包含较小粗大误差的异常值,就会错估了仪器的精确等级。
因此,系统检验测量数据是否含有粗大误差是保证原始数据的可靠及其有关计算的准确的前提。
排除异常数据有四种较常用的准则,分别是拉伊达准则、格拉布斯准则、肖维勒准则和狄克逊准则。
每种判别准则都有其处理方法,导致用不同准则对异常值判别的结果有时会不一致。
目前异常值的剔除还没有统一的准则,本文综合判别粗大误差四种方法的特点,系统归纳各种准则的应用,以便更好地发现和判别含有粗大误差的数据。
1.四种判别粗大误差准则的特点1.1拉伊达准则拉伊达准则[4]是以三倍测量列的标准偏差为极限取舍标准,其给定的置信概率为99.73%,该准则适用于测量次数n>10或预先经大量重复测量已统计出其标准误差σ的情况。
Xi为服从正态分布的等精度测量值,可先求得它们的算术平均值 X、残差vi和标准偏差σ。
若|Xi- X|>3σ,则可疑值Xi含有粗大误差,应舍弃;若|Xi- X|≤3σ,则可疑值Xi为正常值,应保留。
把可疑值舍弃后再重新算出除去这个值的其他测量值的平均值和标准偏差,然后继续使用判别依据判断,依此类推。
1.2格拉布斯准则格拉布斯准则适用于测量次数较少的情况(n<100),通常取置信概率为95%,对样本中仅混入一个异常值的情况判别效率最高。
其判别方法如下:先将呈正态分布的等精度多次测量的样本按从小到大排列,统计临界系数G(a,n)的值为G0, 然后分别计算出G1、Gn:G1=( X-X1)/σ,Gn=(Xn- X)/σ (1)若G1≥Gn且G1>G0,则X1应予以剔除;若Gn≥G1且Gn>G0,则Xn应予以剔除;若G1<G0且Gn<G0,则不存在“坏值”。
笔记五、粗大误差的处理方法
1 n xi n 1 i 1
i j
v
标准差
i 1 i j
n
2
i
n 1 根据测量次数 n,选取显著度 ,查表得到检验系数
K (n, ) ,若被剔除测量值 x j 满足如下:
x j x K ,则认为含有粗大误差,剔除 x j 是正确的
例子 2:试用此法判断上述例子 1 中的测量值中有无粗大误差?
查表,显著度 =0.05 ,统计临界值 r0 (n, ) r0 (14,0.05) 0.546 判断最大值 x (14) : r22
'
x( n ) x( n2) x( n ) x(3)
x '(14) x '(12) x (14) x (3)
' '
20.43 20.43 0 20.43 20.39
'
x(n) x
'
'
20.43 20.411 1.18 0.016
查表得 g(0) (15-1,0.05) 2.37 g(15) 1.18 则 x(15) 不含有粗大误差,应保留。 ➢ 狄克松准则 适用范围:测量次数少,但可靠性要求高。 优点:判断测量列中的粗大误差的速度较快 判别方法: 测量值: x1 , x2 ,...xn ;次数为 n 将测量值按照从小到大排列: x(1) , x(2) ,...x( n) 选定显著度 (一般为 0.01 或 0.05) ,查表得到临界统计量
判别 r22 0 r0 (15,0.05) 0.525 ,故 x '(14) 不含粗大误差,应保留 判断最小值 x '(1) : r22
粗大误差的检验与坏值的剔除课件
粗大误差通常表现为离群孤立的 值,与周围的测量值存在明显的 差异。
粗大误差产生的原因
人为因素
如操作失误、读数错误、记录错 误等。
设备故障
如传感器失灵、外表显示特殊等。
环境干扰
如电磁干扰、振动、温度突变等。
粗大误差对数据的影响
01
02
03
歪曲数据真实情况
粗大误差会使得数据出现 特殊波动,从而影响对数 据真实情况的准确判断。
影响数据分析结果
在进行数据分析和处理时 ,粗大误差会导致计算结 果出现偏差,进而影响最 终的分析结论。
降低数据可信度
存在粗大误差的数据会导 致人们对数据的信任度降 低,从而影响数据的进一 步应用。
02
CATALOGUE
粗大误差的检验方法
格拉布斯准则
总结词
基于正态散布的统计检验方法,通过计算格拉布斯统计量,对观测值进行检验 。
03
CATALOGUE
坏值的剔除方法
直观判断法
直接视察
通过直接视察数据,可以发现一些明显的特殊值。例如,一个数据点明显高于或 低于其他数据点,或者与整体趋势不符。
统计检验法
基于统计原理
通过使用统计检验方法,如z分数、IQR等,可以确定哪些数据点是特殊值或坏值。这种方法基于概率散布,能够更科学地剔 除坏值。
案例二:模拟数据中的粗大误差检验与剔除
总结词:模拟实验
详细描述:模拟数据为研究者提供了一个可控制的环境, 用于测试和比较不同粗大误差检验方法的性能。通过模拟 具有不同散布和特性的数据集,可以评估各种方法的准确 性和可靠性,从而选择最合适特定数据集的方法。
案例三:多元数据中的粗大误差检验与剔除
总结词
2.3 粗大误差
对某角度α进行两组测量,测量结果为:
α1:24°13´36″±6.0″
(k=2) α2:24°13 ´24″〒15.0″ (k=3) 计算角度α的测量结果(k=3)。 解:σ1=6.0/2=3.0 σ2=15/3=5.0 P1:P2=1/σ21:1/ σ22=25:9
p1 x1 p 2 x 2 25 12 9 0 xp 24 1324 241332 .8 p1 p 2 25 9 s x p s1 p1 25 3.0 2.6 p1 p 2 25 9 x p 3s x p 24 1333 7.8
3s x p 7.8 测量结果为
K (n, ) t (n 2) n n 1
还是用上例数据,首先怀疑第八个测量值含有粗大 误差,将其剔除得算术平均值和标准差为
n 1 x xi 20 .411 n 1 i 1 i 8 2 i n 1 i 1
s
v
n2
0.016
选择显著度α=0.05,n=15,查表得
查表
D(0.05,10) 0.530
r11 r11 , r11 D(0.05,10)
故数据中无异常值。
小结
(1)大样本情形(n>10),用3σ准则最简单方便; 小样本情形,用罗曼诺夫斯基准则、Grubbs准则效果 较好,Dixon准则适用于不用计算标准差,因此计算简 单,但是后面3种方法都需要查表。
v 0.016 0.026 -0.004 0.026 0.016 0.026 -0.014 -0.104 -0.004 0.026 0.016 0.006 -0.014 -0.014 -0.004
v2 0.000256 0.000676 0.000016 0.000676 0.000256 0.000676 0.000196 0.010816 0.000016 0.000676 0.000256 0.000036 0.000196 0.000196 0.000016
【精品】[误差理论与数据处理][课件][第02章][第3节][粗大误差]教学资料
与
r22
x3 x1 xn 2 x1
n14~30
4- 13
误差误差与数据处理 第二章误差的基本性质与处理
判断准则
若
rij rij, rij D (,n)
则判断 x n 为异常值。
若
rij rij, rijD (,n)
则判断 x 1 为异常值。 否则,判断没有异常值。
4- 14
误差误差与数据处理 第二章误差的基本性质与处理 【例4-2】
4- 6
误差误差与数Байду номын сангаас处理 第二章误差的基本性质与处理
二、判别粗大误差的准则
4- 7
误差误差与数据处理 第二章误差的基本性质与处理
统计方法的基本思想
给定一个显著性水平,按一定分布确 定一个临界值,凡超过这个界限的误差, 就认为它不属于随机误差的范畴,而是 粗大误差,该数据应予以剔除
▪3σ准则 ▪罗曼诺夫斯基准则 ▪格罗布斯(Grubbs)准则 ▪狄克松(Dixon)准则
顺序排列为 x1,x2,...,xn
构造统计量
r10
xn xn1 xn x1
与
r10
x 2 x1 x n x1
n3~7
r11
xn xn1 xn x2
与
r11
x2 x1 xn 1 x1
n8~10
r21
xn xn2 xn x2
与
r21
x3 x1 xn 1 x1
n11~13
r22
xn xn2 xn x3
(2)偶然误差服从统计规律,无法消除但适当增加次数可 减小之;系统误差服从确定性规律,要采取适当的措施 消除或减小它;粗大误差既违背统计规律又违背确定性 规律,可用物理或统计的方法判断后剔除。
粗大误差判断准则
粗大误差判断准则摘要: 当在测量数据中发现某个数据可能是异常数据时,一般不要不加分析就轻易将该数据直接从测量记录中删除,最好能分析出该数据出现的主客观原因。
判断粗大误差可从定性分析和定量判断两方面来考虑。
定性分析就是对测量环境、测量条...当在测量数据中发现某个数据可能是异常数据时,一般不要不加分析就轻易将该数据直接从测量记录中删除,最好能分析出该数据出现的主客观原因。
判断粗大误差可从定性分析和定量判断两方面来考虑。
定性分析就是对测量环境、测量条件、测量设备、测量步骤进行分析,看是否有某种外部条件或测量设备本身存在突变而瞬时破坏;测量操作是否有差错或等精度测量过程中是否存在其他可能引发粗大误差的因素;也可由同一操作者或另换有经验操作者再次重复进行前面的(等精度)测量,然后再将两组测量数据进行分析比较,或再与由不同测量仪器在同等条件下获得的结果进行对比,以分析该异常数据出现是否“异常”,进而判定该数据是否为粗大误差。
这种判断属于定性判断,无严格的规则,应细致和谨慎地实施。
定量判断,就是以统计学原理和误差理论等相关专业知识为依据,对测量数据中的异常值的“异常程度”进行定量计算,以确定该异常值是否为应剔除的坏值。
这里所谓的定量计算是相对上面的定性分析而言,它是建立在等精度测量符合一定的分布规律和置信概率基础上的,因此并不是绝对的。
下面介绍两种工程上常用的粗大误差判断准则。
1.拉伊达准则拉伊达准则是依据对于服从正态分布的等精度测量,其某次测量误差|Xi -X0|大于3σ的可能性仅为0.27%。
因此,把测量误差大于标准误差σ(或其估计值)的3 倍的测量值作为测量坏值予以舍弃。
由于等精度测量次数不可能无限多,因此,工程上实际应用的拉伊达准则表达式为(1)式中,Xk 为被疑为坏值的异常测量值;为包括此异常测量值在内的所有测量值的算术平均值;为包括此异常测量值在内的所有测量值的标准误差估计值;KL(=3)为拉伊达准则的鉴别值。
误差理论-粗大误差处理
粗大误差的处理粗大误差的数值比较大,它会对测量结果产生明显的歪曲,一旦发现含有粗大误差的测量值,应将其从测量结果中剔除。
设计思路:1.学习并掌握粗大误差处理的一般原理及处理过程;2.定义所需的变量及数组,然后提示输入测量次数n;3.输入测量数据次数n,然后提示输入测量数据;4.输入测量数据之后,提示选择判别粗大误差的准则方式Way;5.选择判别方式,则开始调用相应判别准则的处理函数,在需要查表的函数里,再调用相应的表函数查表;6.开始进行计算并判别是否含有粗大误差,如有应予剔除;7.最后显示处理结果。
参考文献:1)误差理论与数据处理/费业泰主编-5版--北京:机械工业出版社2004.62)C程序设计语言/(美)克尼汉(Kernighan,B.W.)(美)里奇(Ritchie,D.M.)著;徐宝文,李志泽。
2版--北京:机械工业出版社,2004.13)C程序设计/谭浩强著-3版--北京:清华出版社,2005源代码:/*----------粗大误差的处理----------*/#include"stdafx.h"#include"stdio.h"#include"math.h"#define NUM1 50#define NUM2 10void main(){float K(int n,int a);//罗曼诺夫斯基准则的检验系数K(n,a)表的声明float g0(int n,int a);//格罗布斯准则的临界值g0(n,a)表的声明float r0(int n,int a);//狄克松准则的临界值r0(n,a)表的声明void Way1(int n,float array1[],float array2[]);//3σ准则(莱以特准则的函数声明void Way2(int n,float array1[],float array2[]);//罗曼诺夫斯基准则的函数声明void Way3(int n,float array1[],float array2[]);//格罗布斯准则的函数声明void Way4(int n,float array1[],float array2[]);//狄克松准则的函数声明int n,i,t=1,Way;float array1[NUM1]={0},array2[NUM2]={0};printf("*--*--*--*--*--*粗大误差的处理*--*--*--*--*--*\n");printf(">>>请输入测量次数n:(n<50)\n>>");scanf("%d",&n);printf(">>>请输入%d 个测量数据:\n",n);for(i=0;i<n;i++){printf("%2d.",i+1);scanf("%f",&array1[i]);}printf(">>>通常用来判别粗大误差的准则有:\n");printf(">>>1:3σ准则(莱以特准则)\n");printf(">>>2:罗曼诺夫斯基准则\n");printf(">>>3:格罗布斯准则\n");printf(">>>4:狄克松准则\n");printf(">>>请输入所采用的准则方式Way:\n>>");scanf("%d",&Way);switch(Way){case 1:Way1(n,array1,array2);break;case 2:Way2(n,array1,array2);break;case 3:Way3(n,array1,array2);break;case 4:Way4(n,array1,array2);break;}printf(">>>含有粗大误差的测得值:\n");i=0;if(array2[i]){while(array2[i]){printf("%6.2f\n",array2[i]);i++;}}else{printf(">>无\n");}printf(">>不含有粗大误差的测得值:\n");i=0;while(array1[i]){printf("%6.2f\n",array1[i]);i++;}getchar();printf(">>>按Enter键结束:\n");if(getchar())t=0;while(t);}/*3σ准则(莱以特准则的函数*/void Way1(int n,float array1[],float array2[]) {int i,j=0,k,q=1;float x,σ,V1,V2;float v1[NUM1]={0};while(q){q=0;x=0;σ=0;V1=0;V2=0;for(i=0;i<n;i++)x+=array1[i]/n;//测量数据的算术平均值for(i=0;i<n;i++){v1[i]=array1[i]-x;//第i个测得值的残余误差V1+=v1[i];//测得值的残余误差的代数和V2+=pow(v1[i],2);//测得值的残余误差的平方和 }σ=sqrt(V2/(n-1));//由残余误差求得单次测量的标准差的估计值for(i=0;i<n;i++){if(fabs(v1[i])>3*σ){q=1;array2[j]=array1[i];j++;for(k=i;k<(n-1);k++){array1[k]=array1[k+1];v1[k]=v1[k+1];}array1[n-1]=0;n--;i--;}}}}/*罗曼诺夫斯基准则的函数*/void Way2(int n,float array1[],float array2[]){float K(int n,int a);int i,j,a,k,q=1,r=0;float x=0,σ,t,V1,V2=0;float v1[NUM1]={0};printf(">>请选择显著度a:\n");printf(">>1 a=0.01\n");printf(">>2 a=0.05\n");scanf("%d",&a);while(q){q=0;x=0;V2=0;for(i=0;i<n;i++)x+=array1[i]/n;//测量数据的算术平均值for(i=0;i<n;i++)v1[i]=array1[i]-x;//第i个测得值的残余误差for(i=0;i<n;i++){if(fabs(v1[0])<=fabs(v1[i])){j=i;t=v1[0];v1[0]=v1[i];v1[i]=t;}}x=0;for(i=0;i<n;i++){if(i!=j)x+=array1[i]/(n-1);//不含x(j)的测量数据的算术平均值 }for(i=0;i<n;i++)v1[i]=array1[i]-x;//第i个测得值的残余误差for(k=j;k<(n-1);k++)v1[k]=v1[k+1];v1[n-1]=0;for(i=0;i<(n-1);i++)V2+=pow(v1[i],2);//不含x(j)的测得值的残余误差的平方和σ=sqrt(V2/(n-1));//由残余误差求得单次测量的标准差的估计值if(fabs(array1[j]-x)>K(n,a)*σ){printf(">>第%d个测得值%6.2f含有粗大误差,将其剔除。
系统误差和粗大误
一、用标准器具(物质)检定
在计量工作中,常用标准器具或标准物质作为检定工具, 来检定某测量器具的标称值或测量值中是否含有显著的系 统误差。标准器具所提供的标准量值的准确度应该比被检 定测量器具的要高出1~2个等级或至少高几倍以上。
定值系统误差:是指在一定测量条件下,误
差的符号和绝对值保持不变的系统误差。典型例子 是仪器仪表的零点误差,在测量过程中对个点的影 响是一个常差。
线性变换的系统误差:是指在测量过程中,
误差按线性规律变化的系统误差。典型例子是温度 变化对无题长度计量影响而产生的误差为线性变化 的系统误差。
周期性变化的系统误差:是指在
上述三类误差中,随机误差和系统误差是属于不可避免的正常性误 差,而粗大误差则属于能够避免的非正常性误差,是不容许的。因 此,在误差数据处理中,对含有粗大误差的测量结果应予以剔除, 使得测量结果只含有随机误差和系统误差的影响。
可疑值处理的基本原则
1直观判断,及时剔除
若某可疑值经分析确认是由于错读,错记,错误操作以 及确实为测量条件发生意外的突然变化而得到的测量值, 可以随时讲该次测量得到的数据从测量记录中剔除。但在 剔除时必须注明原因,不注明原因而随意剔除可疑值是不 正确的。
设有一组常量测量数据 x1, x2 ,..... xn 中分别存在系统误差
1, 2,......, n和随机误差1,2,......, n ,真值记为 x0
则这组测量数据的算术平均值
x
1
n
x0
i
i
粗大误差
所有 14 个|Vi’|值均小于 3σ’ ,故无再需剔除的坏值。 表 4-4 测量顺序 测 得 值 例 4-1 数据表 (℃) 按 15 个数据计算 按 14 个数据计算
ti
vi = t - t
i
15
vi 2 10 6
vi ' = ti - t14
所有|V i’|值均小于 Z cσ’ ,故已无坏值。 (3)按格拉布斯准则 以 n=15 取置信概率 P ɑ=0.99,查表 4-2 得 G 值为 2.70。
Gσ=2.7×0.033=0.09<|V8|
故 t8 应剔除,再按 n=14,β=0.99 查表 4-2,得 G 值为 2.66。
Gσ’=2.66×0.016=0.04
再取一个 x ' j 值继续判断,直到数据不含粗大误差为止。 表 4-3 t 检验准则中的系数 k 值 ɑ n 4 5 6 7 8 9 10 11 12 ɑ 0.05 4.97 3.56 3.04 2.78 2.62 2.51 2.43 2.37 2.33 0.01 11.46 6.53 5.04 4.36 3.96 3.71 3.54 3.41 3.31 n 13 14 15 16 17 18 19 20 21 0.05 2.29 2.26 2.24 2.22 2.20 2.18 2.17 2.16 2.15 0.01 3.23 3.17 3.12 3.08 3.04 3.01 3.00 2.95 2.93 n 22 23 24 25 26 27 28 29 30 ɑ 0.05 2.14 2.13 2.12 2.11 2.10 2.10 2.09 2.09 2.08 0.01 2.91 2.90 2.88 2.86 2.85 2.84 2.83 2.82 2.81
粗大误差的检验与坏值的剔除
变值系统误差(续)
采用适当的测量方法有助于消除或减少变值系统误差 对测量结果的影响。 1用对称观测法来消除线形变化的累积系统误差的影响。 如用电位差计测量电阻阻值时,为消除电池电压下降 引起的工作电流减小带来的误差,在相等的时间间隔 上先测标准电阻的电压降,再测被测电阻上的电压降, 最后再测标准电阻上的电压降,用两次测得的标准电 阻上的电压降的平均值、被测电阻的电压降和标准电 阻值来计算被测电阻值。 2用半周期偶数观测法来消除周期性变化的系统误差, 当误差变化周期已知时,在测得一数据后,时间间隔 半个周期再测一个数据,取两者平均值作为测量结果。
-K
K
正态分布 ( x s , s ) ( x 2s , 2s ) ( x 3s , 3s ) x x x n n n n n n 68.27% 95.45% 99.73% ② 单次测量结果的表示 事前误差分析、以往的同等条件、详尽条件下多次测量的统计结果、 检测器具说明书中给出的误差限 --- 标准偏差的估计值
二、格拉布斯准则 将重复测量值按大小顺序重新排列,
x1 x2 xn
用下式计算首、尾测量值的格拉布斯准则数
Ti
vi S
xi x S (i为1或n)
_
然后根据子样容量n和所选取的判断显著性水平a,从下表中查得相 应的格拉布斯准则临界值T(n,a)。若Ti>= T(n,a)
则可认为Xi 为坏值,应剔除,注意每次只能剔除一个测量值。 若T1和Tn都大于或等于T(n,a),则应先剔除两者中较大者,再 重新计算算术平均值和标准误差估计值S,这时子样容量只有(n1),再行判断,直至余下的测量值中再未发现坏值。 显著性水平a一般可取0.05或0.01,其含意是按临界值判定为坏值而 其实非坏值的概率,即判断失误的可能性。 例题:见吴书P20例1-6
粗大误差理论(精)
一、粗大误差问题概述
1、什么是粗大误差? 粗大误差,亦称过失误差或反常误差, 它是由于测试人员主观因素或者由于测试 条件突然变化引起的明显与测量结果不符 的误差,比如仪器操作不当,读数错误、 记录和计算错误、测试系统的突然故障和 环境条件(如仪器的灵敏度、电源电压和 频率、环境温度)等疏忽因素而造成的误 差,因而又简称粗差。
v
i 1
n
2 i
n2
3、格罗布斯准则
设对某量作多次等精度独立测量,得 x1 , x2 ,..., xn
当x j 服从正态分布时,计算
1 x x n
vi xi x
2 v
n 1
为了检验 xi (i 1,2,...,n)中是否存在粗大误差,将 x i 按大小顺 序排列成顺序统计量 xi ,而 x1 x2 ... xn 格罗布斯导出了gn 及 g1 的分布,取定显著 (一般为0.05或0.01),可以得到格罗布斯系数 g0 (n, ) 度 而 x x1 x x
2、粗大误差对测量数据的影响 ▫可疑数据:在一列重复测量的数据中,有个别数 据xd 与其它数据有明显差异,它可能是含有粗大 误差(简称粗差)的数据。 ▫异常值:确定混有粗大误差的数据。
不恰当地剔除 含大误差的正 常数据,会造 成测量重复性 偏好的假象
未加剔除,必 然会造成极差比的方法,得到简化而严 密的结果。
狄克松研究了x1 , x2 ,..., xn的顺序统计量 xi 的分布,当 x i 服从正 态分布时,得到 xn 的统计量 xn xn1 xn xn1
r10
xn x1
xn xn2 xn x2
xn x
x x1
粗大误差
Gσ’ ,故无坏值。
t 1 4 =20.411
σ’=0.016 取显著度ɑ=0.01(即置信概率为 0.99).已知 n=15,查表 4-3 得系数 k=3.12。 则 kσ’ =3.12×0.016=0.05 因 | t 8 - t 1 4 |=|20.30-20.411|=0.111>0.05
vi ' 2 10 6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
20.42 20.43 20.40 20.43 20.42 20.43 20.39 20.30 20.40 20.43 20.42 20.41 20.39 20.39 20.40
+0.016 +0.026 -0.004 +0.026 +0.016 +0.026 -0.014 (-0.104) -0.004 +0.026 +0.016 +0.006 -0.014 -0.014 -0.004
4.t 检验准则
t 检验准则又称罗曼诺夫斯基准则, 它是按 t 分布的实际误差分布范围来判 断粗大误差,这对重复测量次数较少的情况比较合理,而一般测量的重复测量次 数总是很有限的。 t 检验准则的特点是将测量列的 n 个测得值中可疑的测得值 x j 先剔除,然 后按余下的(n-1)个数据计算算术平均值 x ’和标准差σ’值,再判断数据 x j 是否含有粗大误差。
故可判断数据 t8 含有粗大误差,应予以剔除。 再对余下的 14 个数据继续判断,先提出 t7(|V 7 ’|最大) ,
t 13 =20.4103
粗大误差判断准则
粗大误差判断准则
摘要: 当在测量数据中发现某个数据可能是异常数据时,一般不要不加分析就轻易将该数据直接从测量记录中删除,最好能分析出该数据出现的主客观原因。
判断粗大误差可从定性分析和定量判断两方面来考虑。
定性分析就是对测量环境、测量条...
当在测量数据中发现某个数据可能是异常数据时,一般不要不加分析就轻易将该数据直接从测量记录中删除,最好能分析出该数据出现的主客观原因。
判断粗大误差可从定性分析和定量判断两方面来考虑。
定性分析就是对测量环境、测量条件、测量设备、测量步骤进行分析,看是否有某种外部条件或测量设备本身存在突变而瞬时破坏;测量操作是否有差错或等精度测量过程中是否存在其他可能引发粗大误差的因素;也可由同一操作者或另换有经验操作者再次重复进行前面的(等精度)测量,然后再将两组测量数据进行分析比较,或再与由不同测量仪器在同等条件下获得的结果进行对比,以分析该异常数据出现是否“异常”,进而判定该数据是否为粗大误差。
这种判断属于定性判断,无严格的规则,应细致和谨慎地实施。
定量判断,就是以统计学原理和误差理论等相关专业知识为依据,对测量数据中的异常值的“异常程度”进行定量计算,以确定该异常值是否为应剔除的坏值。
这里所谓的定量计算是相对上面的定性分析而言,它是建立在等精。
笔记五、粗大误差的处理方法
当测量列中,有 2 个以上的测量值含有粗大误差时,判别时,应该 先剔除含有最大误差的测得值,然后再重新计算测量列中的算术平 均值、 标准差; 然后再对余下的测得值进行判别, 直至所有测得值都 不含粗大误差为止。
r0 (n, ) ;
判断最大值 x( n ) :计算极差比 rij ,若 rij r0 (n, ) ,则该值含 有粗大误差,应剔除;否则保留。 判断最小值 x(1) :计算极差比 rij ,若 rij r0 (n, ) ,则该值含 有粗大误差,应剔除;否则保留。 剔除完数据后,再重新排序计算最大值、最小值极差,查表 得临界统计量 r0 (n ' , ) (注意:次数发生了变化) ,重复上述判 断方法,直至最大、最小值不含有粗大误差为止。 参数选择: ①测量次数 n 7 ,使用 r10 判断; 8 n 10 ,使用 r11 判断; 测量次数 11 n 13 ,使用 r21 判断; n 14 ,使用 r22 判断;
x(1) x
所以应该先怀疑 x(1) : g(1)
20.404 20.30 3.15 0.033
选取显著度 0.05 ,查表得 g(0) (15,0.05) 故此测量值含有粗大误差, 应该 g(1) 3.15 g(0) (15,0.05) 2.41 , 剔除。 剔除后再重新计算平均值、标准差: x 20.411 , ' 0.016 计算 g( n )
x1 , x2 ,..., xn
计算平均值、残余差、标准差:
x
1 v2 x , vi =xi x , = n 1 n
将测量值 xi (i=1,2,3…n)按照从小到大进行排序,找到最小值
x(1) 和最大值 x(n)
粗大误差ppt
n
判别下列等权测量某一物理量15 次所得的测得值中是否有异常值。
1 2
3
解:首先根据测量数据计算
4
算术平均值和标准差
5
1 15
x 15 i1 xi 20.404
6 7
15
s
vi2 i1
0.014960 0.033
8 9
n1
15 1
10
x8 20.30为可疑数据
11
v8 0.104 3s 0.099
x8为异常值,应剔除
12 13 14
对剩余的14个测量值重新判别
15
xi
20.42 20.43 20.40 20.43 20.42 20.43 20.39 20.30 20.40 20.43 20.42 20.41 20.39 20.39 20.40
vi
+0.016 +0.026 -0.004 +0.026 +0.016 +0.026 -0.014 -0.104 -0.004 +0.026 +0.016 +0.006 -0.014 -0.014 -0.004
vi -0.44 -1.04 0.46 -0.24 -0.14 -0.74 1.16 -0.64 -1.04 2.66
解:首先根据测量数据计算算术平均值和标准差
1 10
x 10 i1 xi 55.64
x10 58.3为可疑数据
10
s
vi2 i1
12.024 1.16
n 1 10 1
教学目标
本章介绍在测量前或测量后如何发现粗大 误差,如果无法发现并剔除粗大误差,则 又如何在测量数据处理中去减小其对测量 结果的影响。具体介绍三个常用的统计判 断准则。
4第三章粗大误差
计算结果
测量电阻的极限误差
t0.05 9 s 0.14 0.2
10 故该电阻的测量结果为
101.3 0.2
总结
(1)大样本情形(n>50),用3σ准则最简单方 便;30<n<50情形,用Grubbs准则效果较好;
3 n 30 情形,用Grubbs准则适用于剔除单个
异常值,用Dixon准则适用于剔除多个异常值。
三、判别粗大误差应注意的几个问题
(五)全部测量数据的否定
➢ 若在有限次的测量列中,出现两个以上异 常值时,通常可认为整个测量结果是在不 正常的条件下得到的,对此应改进完善测 量方法,重新进行有效测量。
欢迎进入下一章的学习: 《非等精度测量》
二、增加测量次数,继续观察
如果在测量过程中,发现可疑测量值又 不能充分肯定它是异常值时,可以在维 持等精密度测量条件的前提下,多增加 一些测量次数。根据随机误差的对称性, 以后的测量很可能出现与上述结果绝对 值相近仅符号相反的另一测量值,此时 它们对测量结果的影响便会彼此近于抵 消。
三、用统计方法进行判别
在测量完毕后,还不能确定可疑测量 值是否为含有粗大误差的异常值时, 可按照依据统计学方法导出的粗大误 差判别准则进行判别、确定。
四、保留不剔,确保安全
利用上述三种原则还不能充分肯定 的可疑值,为保险起见,一般以不 剔除为好。
第三节 粗大误差的统计判别方法
一、统计方法的基本思想
给定一个显著性水平,按一定分布确定一个 临界值,凡超过这个界限的误差,就认为它 不属于随机误差的范畴,而是粗大误差,该 数据应予以剔除.
xn xn2 xn x3
与
r22
x3 x1 xn2 x1
n 14 ~ 30
判断准则:
粗大误差处理方法
粗大误差处理方法在一组条件完全相同的重复试验中,个别的测量值可能会出现异常。
如测量值过大或过小,这些过大或过小的测量数据是不正常的,或称为可疑的。
对于这些可疑数据应该用数理统计的方法判别其真伪,并决定取舍。
常用的方法有拉依达法、肖维纳特(Chavenet)法。
格拉布斯(Grubbs)法等。
一、拉依达法当试验次数较多时,可简单地用3倍标准偏差(3S)作为确定可疑数据取舍的标准。
当某一测量数据(xi)与其测量结果的算术平均值(x-‘)之差大于3倍标准偏差时,用公式表示为:︳xi -x-‘︳>3S则该测量数据应舍弃。
这是美国混凝土标准中所采用的方法,由于该方法是以3倍标准偏差作为判别标准,所以亦称3倍标准偏差法,简称3S法。
取3S的理由是:根据随机变量的正态分布规律,在多次试验中,测量值落在x-‘一3S与x-‘十3S之间的概率为99.73%,出现在此范围之外的概率仅为0.27%,也就是在近400次试验中才能遇到一次,这种事件为小概率事件,出现的可能性很小,几乎是不可能。
因而在实际试验中,一旦出现,就认为该测量数据是不可靠的,应将其舍弃。
另外,当测量值与平均值之差大于2倍标准偏差(即︳xi -x-‘︳>2S)时,则该测量值应保留,但需存疑。
如发现生产(施工)、试验过程屯有可疑的变异时,该测量值则应予舍弃。
拉依达法简单方便,不需查表,但要求较宽,当试验检测次数较多或要求不高时可以应用,当试验检测次数较少时(如n<10)在一组测量值中即使混有异常值,也无法舍弃。
二、肖维纳特法进行n次试验,其测量值服从正态分布,以概率1/(2n)设定一判别范围(一knS,knS),当偏差(测量值xi与其算术平均值x-‘之差)超出该范围时,就意味着该测量值xi 是可疑的,应予舍弃。
判别范围由下式确定:肖维纳特法可疑数据舍弃的标准为:︳xi一x-‘︳/S≥kn三、格拉布斯法格拉布斯法假定测量结果服从正态分布,根据顺序统计量来确定可疑数据的取舍。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三,判别粗大误差应注意的几个问题
(五)全部测量数据的否定
若在有限次的测量列中, 若在有限次的测量列中,出现两个以上异 常值时, 常值时,通常可认为整个测量结果是在不 正常的条件下得到的, 正常的条件下得到的,对此应改进完善测 量方法,重新进行有效测量. 量方法,重新进行有效测量.
欢迎进入下一章的学习: 《非等精度测量》
三,判别粗大误差应注意的几个问题
(三)查找粗大误差产生的原因
对由判别准则确定为"异常值" 对由判别准则确定为"异常值"的可疑 不能简单剔除了事,还要仔细分析, 值,不能简单剔除了事,还要仔细分析, 找出产生异常值的具体原因, 找出产生异常值的具体原因,以做出正 确的判断. 确的判断.
三,判别粗大误差应注意的几个问题
【解】
计算统计量
′ ′ x10 x9 101.7 101.5 r11 = = = 0.333 ′ ′ x10 x2 101.7 101.1 ′ ′ x2 x1 101.1 101.0 ′ r11 = = = 0.2 ′ ′ x9 x1 101.5 101.0
查表
D (0.05,10) = 0.530
(四)判别准则的比较
用一种判别准则不能充分肯定的可疑值, 用一种判别准则不能充分肯定的可疑值,建议按 如下方法处理:若测量列中, 如下方法处理:若测量列中,仅存在一个不能充 分肯定的可疑值时, 分肯定的可疑值时,应以格拉布斯准则判别结果 为准;若同时存在两个不能充分肯定的可疑值时, 为准;若同时存在两个不能充分肯定的可疑值时, 应以狄克逊准则判别结果为准. 应以狄克逊准则判别结果为准.
�
例
题
重复测量某电阻共10次 101.0,101.1, 重复测量某电阻共10次,101.0,101.1, 10 101.2,101.2,101.3,101.3,101.3,101.4, 101.2,101.2,101.3,101.3,101.3,101.4, 101.5,101.7.数据已按大小顺序排列, 101.5,101.7.数据已按大小顺序排列,用狄 克逊准则判断其中是否有粗差, 克逊准则判断其中是否有粗差,并写出测量结 果.
二,增加测量次数,继续观察 增加测量次数,
如果在测量过程中, 如果在测量过程中,发现可疑测量值又 不能充分肯定它是异常值时, 不能充分肯定它是异常值时,可以在维 持等精密度测量条件的前提下, 持等精密度测量条件的前提下,多增加 一些测量次数.根据随机误差的对称性, 一些测量次数.根据随机误差的对称性, 以后的测量很可能出现与上述结果绝对 值相近仅符号相反的另一测量值,此时 值相近仅符号相反的另一测量值, 它们对测量结果的影响便会彼此近于抵 消.
第四章 粗大误差
主讲:马冰
主要内容: 主要内容:
粗大误差的产生原因和特点:产生原因, 1,粗大误差的产生原因和特点:产生原因,主 要特点. 要特点. 可疑值处理的基本原则:直观判断, 2,可疑值处理的基本原则:直观判断,及时剔 增加测量次数,继续观察; 除;增加测量次数,继续观察;用统计法判 保留不剔,确保安全. 别;保留不剔,确保安全. 粗大误差的统计学判别方法: 3,粗大误差的统计学判别方法:统计判别方法 的基本依据,常用的统计判别方法, 的基本依据,常用的统计判别方法,判别粗 大误差应注意的几个问题. 大误差应注意的几个问题.
′ r11 > r11 , r11 < D(0.05,10)
故数据中无异常值. 故数据中无异常值.
计算结果
测量电阻的极限误差
=
t0.05 ( 9 ) 10
× s = 0.14 ≈ 0.2
故该电阻的测量结果为
101.3 ± 0.2
总
结
大样本情形( 50) ( 1) 大样本情形( n> 50) , 用3σ 准则最简单方 30< 50情形 情形, Grubbs准则效果较好 准则效果较好; 便;30<n<50情形,用Grubbs准则效果较好; 3 ≤ n ≤ 30 情形 , 用 Grubbs 准则适用于剔除单个 情形, Grubbs准则适用于剔除单个 异常值, Dixon准则适用于剔除多个异常值 准则适用于剔除多个异常值. 异常值,用Dixon准则适用于剔除多个异常值. 在实际应用中, ( 2) 在实际应用中 , 较为精密的场合可选用二三 种准则同时判断, 若一致认为应当剔除时, 种准则同时判断 , 若一致认为应当剔除时 , 则可 以比较放心地剔除; 以比较放心地剔除 ; 当几种方法的判定结果有矛 盾时, 则应当慎重考虑, 通常选择, 盾时 , 则应当慎重考虑 , 通常选择 , 且在可剔与 不可剔时,一般以不剔除为妥. 不可剔时,一般以不剔除为妥.
三,用统计方法进行判别
在测量完毕后, 在测量完毕后,还不能确定可疑测量 值是否为含有粗大误差的异常值时, 值是否为含有粗大误差的异常值时, 可按照依据统计学方法导出的粗大误 差判别准则进行判别,确定. 差判别准则进行判别,确定.
四,保留不剔,确保安全 保留不剔,
利用上述三种原则还不能充分肯定 的可疑值,为保险起见, 的可疑值,为保险起见,一般以不 剔除为好. 剔除为好.
′ x 3 x1′ ′ ′ xn xn 2 与 r2′2 = r22 = ′ ′ ′ xn x3 x n 2 x1′
判断准则:
若
rij > rij′ , rij > D(α , n)
′ 为异常值. 则判断 xn为异常值.
若
rij < rij′ , rij′ > D(α , n)
为异常值. 则判断 x1′ 为异常值. 否则,判断没有异常值. 否则,判断没有异常值.
三,判别粗大误差应注意的几个问题
(一)准确找出可疑测量值
测量列中残余误差绝对值最大者即为可 疑值. 疑值.它为测量列中最大测得值或最小 测得值之一,仅比较两者残余误差的大 测得值之一, 小即可确定. 小即可确定.
三,判别粗大误差应注意的几个问题
(二)合理选择判别准则 依据测量准确度的要求和测量次数来选择 判别准则.一般情况下可这样考虑: 判别准则.一般情况下可这样考虑:当测 量次数n≥30 或当n 10做粗略判别时 n≥30, 做粗略判别时, 量次数n≥30,或当n>10做粗略判别时, 可采用莱因达准则. n≤30时 可采用莱因达准则.当n≤30时,可采用 格拉布斯准则或狄克逊准则. 格拉布斯准则或狄克逊准则.
xd x ≤
∑ (x x )
i
2
≤ n 1σ
xd x < 3σ
2,格拉布斯(Grubbs)准则 ,格拉布斯 准则
xd
对某个可疑数据
,若
xd x ≥ G(a, n )σ
x d 含有粗差,可剔除;否则予以保留 含有粗差,可剔除;
σ
G (a , n )
贝塞尔公式计算的标准差 查表获得
例
题
在检定杠杆千分尺的示值极限误差时, 在检定杠杆千分尺的示值极限误差时,用五 等标准量块重复测量了20 20次 20.002,20.000, 等标准量块重复测量了20次,20.002,20.000, 20.000,20.001,20.000,19.998,20.000, 20.000,20.001,20.000,19.998,20.000, 20.001,19.998,20.002,20.002,20.000, 20.001,19.998,20.002,20.002,20.000, 20.004,20.000,20.002,19.992,19.998, 20.004,20.000,20.002,19.992,19.998, x17 20.002,19.998. 为可疑数据, 20.002,19.998.其中 为可疑数据,判断是 否该剔除? 否该剔除?
【解】
计算 查表
x = 20.000mm
G (0.01, 20) = 2.88
σ = 2.5m
v17 = 8 > G (0.01,20)σ = 2.28 × 2.5 = 7.2
故应剔除
x17
3,狄克逊(Dixon)准则 ,狄克逊 准则
正态测量总体的一个样本x1 , x2 ,..., xn ,按从大到小 ′ ′ ′ 顺序排列为 x1 , x2 ,..., xn ′ ′ x2 x1 ′ ′ xn xn 1 r′ = 构造统计量 r10 = n=3~7 与 10 x′ x′ ′ ′ xn x1 n 1
二, 常用统计判别方法
1,莱因达准则 (3σ准则 ) , 准则
对某个可疑数据 xd,若
vd = xd x ≥ 3σ
xd 含有粗差,可剔除;否则予以保留 含有粗差,可剔除;
σ贝塞尔公式计算的标准差
样本数 n>50 时适用
Байду номын сангаас
1,莱因达准则 (3σ准则 ) , 准则
n≤10的情形 的情形, 3σ准则剔除粗差注定失效 准则剔除粗差注定失效. 在n≤10的情形,用3σ准则剔除粗差注定失效.
x′ x ′ r11 = n n 1 ′ ′ xn x2
与 与
r1′1 =
′ x 2 x1′ ′ x n 1 x1′
n = 8 ~ 10 n = 11 ~ 13 n = 14 ~ 30
x′ x′ r21 = n n 2 ′ ′ xn x2
′ x 3 x1′ r2′1 = ′ x n 1 x1′
测量仪器内部的突然故障
若不能确定粗大误差是由上述两个原 因产生时,其原因可认为是测量仪器 因产生时, 内部的突然故障. 内部的突然故障.
第二节 可疑值处理的基本原则
一,直观判断,及时剔除 直观判断,
若某可疑值经分析确认是由于错读,错记, 若某可疑值经分析确认是由于错读,错记, 错误操作以及确实为测量条件发生意外的 突然变化而得到的测量值, 突然变化而得到的测量值,可以随时将该 次测量得到的数据从测量记录中剔除. 次测量得到的数据从测量记录中剔除.但 在剔除时必须注明原因, 在剔除时必须注明原因,不注明原因而随 意剔除可疑值是不正确的. 意剔除可疑值是不正确的.这种方法称为 物理判别法,也叫直观判别法. 物理判别法,也叫直观判别法.