粗大误差处理方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
粗大误差处理方法
在一组条件完全相同的重复试验中,个别的测量值可能会出现异常。如测量值过大或过小,这些过大或过小的测量数据是不正常的,或称为可疑的。对于这些可疑数据应该用数理统计的方法判别其真伪,并决定取舍。常用的方法有拉依达法、肖维纳特(Chavenet)法。格拉布斯(Grubbs)法等。
一、拉依达法
当试验次数较多时,可简单地用3倍标准偏差(3S)作为确定可疑数据取舍的标准。当某一测量数据(xi)与其测量结果的算术平均值(x-‘)之差大于3倍标准偏差时,用公式表示为:
︳xi -x-‘︳>3S
则该测量数据应舍弃。
这是美国混凝土标准中所采用的方法,由于该方法是以3倍标准偏差作为判别标准,所以亦称3倍标准偏差法,简称3S法。
取3S的理由是:根据随机变量的正态分布规律,在多次试验中,测量值落在x-‘一3S与x-‘十3S之间的概率为99.73%,出现在此范围之外的概率仅为0.27%,也就是在近400次试验中才能遇到一次,这种事件为小概率事件,出现的可能性很小,几乎是不可能。因而在实际试验中,一旦出现,就认为该测量数据是不可靠的,应将其舍弃。
另外,当测量值与平均值之差大于2倍标准偏差(即︳xi -x-‘︳>2S)时,则该测量值应保留,但需存疑。如发现生产(施工)、试验过程屯有可疑的变异时,该测量值则应予舍弃。
拉依达法简单方便,不需查表,但要求较宽,当试验检测次数较多或要求不高时可以应用,当试验检测次数较少时(如n<10)在一组测量值中即使混有异常值,也无法舍弃。
二、肖维纳特法
进行n次试验,其测量值服从正态分布,以概率1/(2n)设定一判别范围(一knS,knS),当偏差(测量值xi与其算术平均值x-‘之差)超出该范围时,就意味着该测量值xi 是可疑的,应予舍弃。判别范围由下式确定:
肖维纳特法可疑数据舍弃的标准为:
︳xi一x-‘︳/S≥kn
三、格拉布斯法
格拉布斯法假定测量结果服从正态分布,根据顺序统计量来确定可疑数据的取舍。
进行n次重复试验,试验结果为x1、x2、…、xi、…、xn ,而且xi服从正态分布。
为了检验(i=1,2,…,n)中是否有可疑值,可将按其值由小到大顺序重新排列,根据顺序统计原则,给出标准化顺序统计量g:
当最小值x(1)可疑时,则: g=( x-‘一x(1) )/S
当最大值x(n)可疑时,则: g=( x(n) 一x-‘)/S
根据格拉布斯统计量的分布,在指定的显著性水平β(一般β=0.05)下,求得判别可疑值的临界值g0(β,n),格拉布斯法的判别标准为:
g≥g0(β,n)
利用格拉布斯法每次只能舍弃一个可疑值,若有两个以上的可疑数据,应该一个一个数据的舍弃,舍弃第一个数据后,试验次数由n变为n一1,以此为基础再判别第二个可疑数据。
四. 分布图法
将多次独立测量的测量结果按从小到大排列为
X1,X2,…,X N
定义中位数Xm为:
定义上四分位点F0为区间[Xm, X N]的中位数;
下四分位点F1为区间[X1 , Xm]的中位数。
四分位数离散度dF = F0-F1
则,认定无效数据的判定区间为:
,
其中为常数,与测量精度有关,在本程序中取定为2。
淘汰点定义为:
区间[,]的测量数据被认为是有效的一致性测量数据,利用这一有效区间的数
据选定可以排除50%的离异值干扰。而且中位数Xm和四分位数离散度dF的选择与极值点的大小无关,仅与数据的分布位置有关。有效区间的获取与需要排除的可疑值关系不大。因此,用分布图法来获得的一致性策略数据的方法能够增强对不确定因素的适应度。具有一定的鲁棒性。
本程序中采用的粗大误差排除方法是:
1.拉依达法
为了实现的简洁性以及误差判别的精确性,省略了后期的2S的判断,而将3S准
则修订为2.8S准则,有利于严格的排除可能的粗大误差。
2.分布图法
没有采用肖维纳特法与格拉布斯法的原因:这两种方法都需要查表求参数,不利于计算机的自动实现。