格拉布斯法Grubbs检验法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
罿格拉布斯法 (Grubbs) 查验法
螇▲概括:一组丈量数据中,假如个别数据偏离均匀值很远,那么这个 ( 这些 ) 数据称作“可疑值” 。
假如用统计方法—比如格拉布斯 (Grubbs) 法判断,能将“可疑值”此后组丈量数据中剔除而不参加均匀值的计算,那么该“可疑值”就称作“异样值 ( 粗大偏差 ) ”。
羄本文就是介绍怎样用格拉布斯法(Grubbs) 判断“可疑值”能否为“异样值”。
蒂▲丈量数据:比如丈量 10 次( n=10) ,获取以下数据: 8.2 、 5.4 、14.0 、7.3 、4.7 、 9.0 、 6.5 、10.1 、7.7 、6.0 。
莀▲摆列数据:将上述丈量数据按从小到大的次序摆列,获取 4.7 、5.4 、6.0 、6.5 、7.3 、7.7 、8.2 、9.0 、10.1 、14.0 。
能够一定,可疑值不是最小值就是最大值。
膅▲计算均匀值 x
-和标准差 s:x-= 7.89 ;标准差 s= 2.704 。
计算时,一定将所有 10 个数据所有包
括在内。
s ( x x)2 n1
螃▲计算偏离值:均匀值与最小值之差为7.89 -4.7 = 3.19 ;最大值与均匀值之差为14.0 - 7.89 =6.11 。
薂▲确立一个可疑值:比较起来,最大值与均匀值之差 6.11 大于均匀值与最小值之差 3.19 ,所以以为最大值 14.0 是可疑值。
螁▲计算 G i值: G i=( x i-x- )/ s;此中 i 是可疑值的摆列序号
袇
—— 10 号;所以
10
=(
x 10 x -
)/ s =
-7.89)/2.704 =2.260 。
因为 x 10 x - 是残差,而 s
是标
G
-
-
准差,因此可以为 G
是残差与标准差的比值。
下边要把计算值
G i 与格拉布斯表给出的临界值
( )
10
值大于表中的临界值 G P
G P n
比较,假如计算的 G i n ,则能判断该丈量数据是异样值,能够剔除。
可是
n ( ) 与置信概率 P 相关 和丈量次数 n 与自由度 f
要提示,临界值 G
与两个参数相关:检出水平 α
P ( )
(
)
(
相关 ) 。
袆
▲定检出水平 α:假如要求严格,检出水平 α能够定得小一些,比如定 α =0.01 ,那么置信概率P =
1-α= 0.99 ;假如要求不严格, α能够定得大一些,比如定 α=0.10 ,即 P = 0.90 ;往常定 α
= 0.05 ,P =0.95 。
薂
▲查格拉布斯表获取临界值: 依据选定的 P 值 此处为 0.95) 和丈量次数 n 此处为 10)
,查格拉布
( ( 斯表,横竖订交得临界值
G 95= 。
(10)
袈
▲比较计算值 G i 和临界值 G 95(10) :G i =2.260 ,G 95(10) =2.176 ,G i >G 95 (10) 。
虿
▲判断能否为异样值:因为
G i >G 95 ,能够判断丈量值
为异样值,将它从
10
个丈量数据
(10)
中剔除。
薅 ▲余下数据考虑:节余的 9 个数据再按以上步骤计算,假如计算的
G i > G (9) ,仍旧是异样值,
95
剔除;假如 G i <G 95
,不是异样值,则不剔除。
本例余下的
9 个数据中没有异样值。
(9) 蚂
格拉布斯表 —— 临界值 G P ( n)
艿
P
蚀
P
莄
螂 膂
袂
肇
n
螈
n
肀 3芆膅羂 17芇418
519
620
721
822
923
1024
1125
1230
1335
1440
1545
1650
对异样值及统计查验法的解说
■丈量过程是对一个无穷大整体的抽样:对固定条件下的一种丈量,理论上能够无穷次丈量下去,
能够获取无量多的丈量数据,这些丈量数据组成一个容量为无穷大的整体;或许换一个角度看,原来就存在一个包括无量多丈量数据的整体。
实质的丈量只可是是从该无穷大整体中随机抽取一个容量为
n( 比如 n=10) 的样本。
这类样本也能够有无数个,每个样真相当于整体所含丈量数据的不一样
随机组合。
样本中的正常值应该来自该整体。
往常的目的是用样本的统计量来预计整体参量。
整体一般假定为正态散布。
■异样值划分:样本中的正常值应该属于同一整体;而异样值有两种状况:第一种状况异样值不属于该整体,抽样抽错了,从此外一个整体抽出一个 ( 一些 ) 数据,其值与整体均匀值相差较大;第二种状况异样值虽属于该整体,但可能是该整体固有随机变异性的极端表现,比方说超出 3σ的数据,出现的概率很小。
用统计判断方法就是将异样值找出来,舍去。
■犯错误 1:将原来不属于该整体的、第一种状况的异样值判断出来舍去,不会犯错误;将原来属
于该整体的、出现的概率小的、第二种状况的异样值判断出来舍去,就会犯错误。
■犯错误 2:还有一种状况,不属于该整体但数值又和该整体均匀值靠近的数据被抽样抽出来,统
计查验方法判断不出它是异样值,就会犯此外一种错误。
■异样值查验法:判断异样值的统计查验法有好多种,比如格拉布斯法、狄克逊法(Q法)、偏度-峰度法、拉依达法、奈尔法等等。
每种方法都有其合用范围和优弊端。
■格拉布斯法最正确:每种统计查验法都会犯犯错误 1 和错误 2。
可是有人做过统计,在所有方法中,格拉布斯法犯这两种错误的概率最小,所以介绍使用格拉布斯法。
■多种方法联合使用:为了减少犯错误的概率,能够将 3 种以上统计查验法联合使用,依据多半方
法的判断结果,确立可疑值能否为异样值。
■异样值根源:丈量仪器不正常,丈量环境偏离正常值较大,计算机犯错,看错,读错,抄错,算
错,转移错误。