Grubbs格拉布斯检验临界值表

格拉布斯法Grubbs检验法

罿格拉布斯法 (Grubbs) 查验法螇▲概括：一组丈量数据中，假如个别数据偏离均匀值很远，那么这个 ( 这些 ) 数据称作“可疑值” 。

假如用统计方法—比如格拉布斯 (Grubbs) 法判断，能将“可疑值”此后组丈量数据中剔除而不参加均匀值的计算，那么该“可疑值”就称作“异样值 ( 粗大偏差 ) ”。

羄本文就是介绍怎样用格拉布斯法(Grubbs) 判断“可疑值”能否为“异样值”。

蒂▲丈量数据：比如丈量 10 次( n＝10) ，获取以下数据： 8.2 、 5.4 、14.0 、7.3 、4.7 、 9.0 、 6.5 、10.1 、7.7 、6.0 。

莀▲摆列数据：将上述丈量数据按从小到大的次序摆列，获取 4.7 、5.4 、6.0 、6.5 、7.3 、7.7 、8.2 、9.0 、10.1 、14.0 。

能够一定，可疑值不是最小值就是最大值。

膅▲计算均匀值 x-和标准差 s：x-＝ 7.89 ；标准差 s＝ 2.704 。

计算时，一定将所有 10 个数据所有包括在内。

s ( x x)2 n1螃▲计算偏离值：均匀值与最小值之差为7.89 －4.7 ＝ 3.19 ；最大值与均匀值之差为14.0 － 7.89 ＝6.11 。

薂▲确立一个可疑值：比较起来，最大值与均匀值之差 6.11 大于均匀值与最小值之差 3.19 ，所以以为最大值 14.0 是可疑值。

螁▲计算 G i值： G i＝( x i－x- )/ s；此中 i 是可疑值的摆列序号袇—— 10 号；所以10＝(x 10 x -)/ s ＝－7.89)/2.704 ＝2.260 。

因为 x 10 x - 是残差，而 s是标G－－准差，因此可以为 G是残差与标准差的比值。

下边要把计算值G i 与格拉布斯表给出的临界值( )10值大于表中的临界值 G PG P n比较，假如计算的 G i n ，则能判断该丈量数据是异样值，能够剔除。

可是n ( ) 与置信概率 P 相关和丈量次数 n 与自由度 f要提示，临界值 G与两个参数相关：检出水平 αP ( )()(相关 ) 。

格拉布斯法Grubbs检验法

格拉布斯法(Grubbs)检验法▲概述：一组测量数据中，如果个别数据偏离平均值很远，那么这个(这些)数据称作“可疑值”。

如果用统计方法—例如格拉布斯(Grubbs)法判断，能将“可疑值”从此组测量数据中剔除而不参与平均值的计算，那么该“可疑值”就称作“异常值(粗大误差)”。

本文就是介绍如何用格拉布斯法(Grubbs)判断“可疑值”是否为“异常值”。

▲测量数据：例如测量10次(n ＝10)，获得以下数据：8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0。

▲排列数据：将上述测量数据按从小到大的顺序排列，得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。

可以肯定，可疑值不是最小值就是最大值。

▲计算平均值x -和标准差s ：x -＝7.89；标准差s ＝2.704。

计算时，必须将所有10个数据全部包含在内。

▲计算偏离值：平均值与最小值之差为7.89－4.7＝3.19；最大值与平均值之差为14.0－7.89＝6.11。

▲确定一个可疑值：比较起来，最大值与平均值之差6.11大于平均值与最小值之差3.19，因此认为最大值14.0是可疑值。

▲计算G i 值：G i ＝(x i －x -)/s ；其中i 是可疑值的排列序号——10号；因此G 10＝(x 10－x -)/s ＝(14.0－7.89)/2.704＝2.260。

由于x 10－x -是残差，而s 是标准差，因而可认为G 10是残差与标准差的比值。

下面要把计算值G i 与格拉布斯表给出的临界值G P (n )比较，如果计算的G i 值大于表中的临界值G P (n )，则能判断该测量数据是异常1)(2--=∑n x x s值，可以剔除。

但是要提醒，临界值G P(n)与两个参数有关：检出水平α(与置信概率P有关)和测量次数n(与自由度f有关)。

▲定检出水平α：如果要求严格，检出水平α可以定得小一些，例如定α＝0.01，那么置信概率P＝1－α＝0.99；如果要求不严格，α可以定得大一些，例如定α＝0.10，即P＝0.90；通常定α＝0.05，P＝0.95。

格拉布斯法(Grubbs)检验法

格拉布斯法(Grubbs)检验法之蔡仲巾千创作▲概述：一组丈量数据中，如果个别数据偏离平均值很远，那么这个(这些)数据称作“可疑值”。

如果用统计方法—例如格拉布斯(Grubbs)法判断，能将“可疑值”从此组丈量数据中剔除而不介入平均值的计算，那么该“可疑值”就称作“异常值(粗大误差)”。

本文就是介绍如何用格拉布斯法(Grubbs)判断“可疑值”是否为“异常值”。

▲丈量数据：例如丈量10次(n ＝10)，获得以下数据：、、、、、、、、、。

▲排列数据：将上述丈量数据按从小到大的顺序排列，得到、、、、、、、、、。

可以肯定，可疑值不是最小值就是最大值。

▲计算平均值x -和尺度差s ：x -＝；尺度差s ＝。

计算时，必须将所有10个数据全部包含在内。

▲计算偏离值：平均值与最小值之差为－＝；最大值与平均值之差为－＝。

▲确定一个可疑值：比较起来，最大值与平均值之差大于平均值与最小值之差，因此认为最大值是可疑值。

1)(2--=∑n x x s▲计算G i值：G i＝(x i－x-)/s；其中i是可疑值的排列序号——10号；因此G10＝( x10－x-)/s＝－＝。

由于x10－x-是残差，而s是尺度差，因而可认为G10是残差与尺度差的比值。

下面要把计算值G i与格拉布斯表给出的临界值G P(n)比较，如果计算的G i 值大于表中的临界值G P(n)，则能判断该丈量数据是异常值，可以剔除。

但是要提醒，临界值G P(n)与两个参数有关：检出水平α(与置信概率P有关)和丈量次数n(与自由度f有关)。

▲定检出水平α：如果要求严格，检出水平α可以定得小一些，例如定α＝，那么置信概率P＝1－α＝；如果要求不严格，α可以定得大一些，例如定α＝，即P＝；通常定α＝，P＝。

▲查格拉布斯表获得临界值：根据选定的P值(此处为0.95)和丈量次数n(此处为10)，查格拉布斯表，横竖相交得临界值G95(10)＝。

▲比较计算值G i和临界值G95(10)：G i＝，G95(10)＝，G i＞G95(10)。

格拉布斯法检验法

格拉布斯法(Grubbs)检验法▲概述：一组测量数据中，如果个别数据偏离平均值很远，那么这个(这些)数据称作“可疑值”。

如果用统计方法—例如格拉布斯(Grubbs)法判断，能将“可疑值”从此组测量数据中剔除而不参与平均值的计算，那么该“可疑值”就称作“异常值(粗大误差)”。

本文就是介绍如何用格拉布斯法(Grubbs)判断“可疑值”是否为“异常值”。

▲测量数据：例如测量10次(n ＝10)，获得以下数据：8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0。

▲排列数据：将上述测量数据按从小到大的顺序排列，得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。

可以肯定，可疑值不是最小值就是最大值。

▲计算平均值x -和标准差s ：x -＝7.89；标准差s ＝2.704。

计算时，必须将所有10个数据全部包含在内。

▲计算偏离值：平均值与最小值之差为7.89－4.7＝3.19；最大值与平均值之差为14.0－7.89＝6.11。

▲确定一个可疑值：比较起来，最大值与平均值之差6.11大于平均值与最小值之差3.19，因此认为最大值14.0是可疑值。

▲计算G i 值：G i ＝(x i －x - )/s ；其中i 是可疑值的排列序号——10号；因此G 10＝( x 10－x - )/s ＝(14.0－7.89)/2.704＝2.260。

由于 x 10－x -是残差，而s 是标准差，因而可认为G 10是残差与标准差的比值。

下面要把计算值G i 与格拉布斯表给出的临界值G P (n )比较，如果计算的G i 值大于表中的临界值G P (n )，则能判断该测量数据是异常值，可以剔除。

但是要提醒，临界值G P (n )与两个参数有关：检出水平α (与置信概率P 有关)和测量次数n (与自由度f 有关)。

▲定检出水平α：如果要求严格，检出水平α可以定得小一些，例如定α＝0.01，那么置信概率P ＝1－α＝0.99；如果要求不严格，α可以定得大一些，例如定α＝0.10，即P ＝0.90；通常定α＝0.05，P ＝0.95。

格拉布斯法Grubbs检验法

格拉布斯法G r u b b s检验法集团公司文件内部编码：（TTT-UUTT-MMYB-URTTY-ITTLTY-格拉布斯法(Grubbs)检验法▲概述：一组测量数据中，如果个别数据偏离平均值很远，那么这个(这些)数据称作“可疑值”。

如果用统计方法—例如格拉布斯(Grubbs)法判断，能将“可疑值”从此组测量数据中剔除而不参与平均值的计算，那么该“可疑值”就称作“异常值(粗大误差)”。

本文就是介绍如何用格拉布斯法(Grubbs)判断“可疑值”是否为“异常值”。

▲测量数据：例如测量10次(n ＝10)，获得以下数据：8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0。

▲排列数据：将上述测量数据按从小到大的顺序排列，得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。

可以肯定，可疑值不是最小值就是最大值。

▲计算平均值x -和标准差s ：x -＝7.89；标准差s ＝2.704。

计算时，必须将所有10个数据全部包含在内。

▲计算偏离值：平均值与最小值之差为7.89－4.7＝3.19；最大值与平均值之差为14.0－7.89＝6.11。

▲确定一个可疑值：比较起来，最大值与平均值之差6.11大于平均值与最小值之差3.19，因此认为最大值14.0是可疑值。

▲计算G i 值：G i ＝(x i －x -)/s ；其中i 是可疑值的排列序号——10号；因此G 10＝(x 10－x -)/s ＝(14.0－7.89)/2.704＝2.260。

由于x 10－x -是残差，而s 是标准差，因而可认为G 10是残差与标准差的比值。

下面要把计算值G i 与格拉布斯表给出的临界值G P (n )比较，如果计算的G i 值大于表中的临界值G P (n )，则能判断该测量数据1)(2--=∑n x x s是异常值，可以剔除。

但是要提醒，临界值G P(n)与两个参数有关：检出水平α(与置信概率P有关)和测量次数n(与自由度f有关)。

格拉布斯法Grus检验法

格拉布斯法G r u s检验法文件编码（GHTU-UITID-GGBKT-POIU-WUUI-8968）格拉布斯法(Grubbs)检验法▲概述：一组测量数据中，如果个别数据偏离平均值很远，那么这个(这些)数据称作“可疑值”。

如果用统计方法—例如格拉布斯(Grubbs)法判断，能将“可疑值”从此组测量数据中剔除而不参与平均值的计算，那么该“可疑值”就称作“异常值(粗大误差)”。

本文就是介绍如何用格拉布斯法(Grubbs)判断“可疑值”是否为“异常值”。

▲测量数据：例如测量10次(n ＝10)，获得以下数据：8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0。

▲排列数据：将上述测量数据按从小到大的顺序排列，得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。

可以肯定，可疑值不是最小值就是最大值。

▲计算平均值x -和标准差s ：x -＝7.89；标准差s ＝2.704。

计算时，必须将所有10个数据全部包含在内。

▲计算偏离值：平均值与最小值之差为7.89－4.7＝3.19；最大值与平均值之差为14.0－7.89＝6.11。

▲确定一个可疑值：比较起来，最大值与平均值之差6.11大于平均值与最小值之差3.19，因此认为最大值14.0是可疑值。

▲计算G i 值：G i ＝(x i －x -)/s ；其中i 是可疑值的排列序号——10号；因此G 10＝(x 10－x -)/s ＝(14.0－7.89)/2.704＝2.260。

由于x 10－x -是残差，而s 是标准差，因而可认为G 10是残差与标准差的比值。

下面要把计算值G i 与格拉布斯表给出的临界值G P (n )比较，如果计算的G i 值大于表中的临界值G P (n )，则能判断该测量数据1)(2--=∑n x x s是异常值，可以剔除。

但是要提醒，临界值G P(n)与两个参数有关：检出水平α(与置信概率P有关)和测量次数n(与自由度f有关)。

格拉布斯Grubbs检验法

格拉布斯(Grubbs)法▲概述：一组测量数据中，如果个别数据偏离平均值很远，那么这个(这些)数据称作“可疑值”。

如果用统计方法—例如格拉布斯(Grubbs)法判断，能将“可疑值”从此组测量数据中剔除而不参与平均值的计算，那么该“可疑值”就称作“异常值(粗大误差)”。

本文就是介绍如何用格拉布斯法判断“可疑值”是否为“异常值”。

▲测量数据：例如测量10次(n＝10)，获得以下数据：8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0。

▲排列数据：将上述测量数据按从小到大的顺序排列，得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。

可以肯定，可疑值不是最小值就是最大值。

▲计算平均值x-和标准差s：x-＝7.89；标准差s＝2.704。

计算时，必须将所有10个数据全部包含在内。

▲计算偏离值：平均值与最小值之差为7.89－4.7＝3.19；最大值与平均值之差为14.0－7.89＝6.11。

▲确定一个可疑值：比较起来，最大值与平均值之差6.11大于平均值与最小值之差3.19，因此认为最大值14.0是可疑值。

▲计算G i值：G i＝(x i－x-)/s；其中i是可疑值的排列序号——10号；因此G10＝( x10－x-)/s＝(14.0－7.89)/2.704＝2.260。

由于x10－x-是残差，而s是标准差，因而可认为G10是残差与标准差的比值。

下面要把计算值G i与格拉布斯表给出的临界值G P(n)比较，如果计算的G i值大于表中的临界值G P(n)，则能判断该测量数据是异常值，可以剔除。

但是要提醒，临界值G P(n)与两个参数有关：检出水平α(与置信概率P有关)和测量次数n(与自由度f有关)。

▲定检出水平α：如果要求严格，检出水平α可以定得小一些，例如定α＝0.01，那么置信概率P＝1－α＝0.99；如果要求不严格，α可以定得大一些，例如定α＝0.10，即P＝0.90；通常定α＝0.05，P＝0.95。

格拉布斯法(Grubbs)检验法

格拉布斯法(Grubbs)检验法▲概述：一组测量数据中，如果个别数据偏离平均值很远，那么这个(这些)数据称作“可疑值”。

如果用统计方法—例如格拉布斯(Grubbs)法判断，能将“可疑值”从此组测量数据中剔除而不参与平均值的计算，那么该“可疑值”就称作“异常值(粗大误差)”。

本文就是介绍如何用格拉布斯法(Grubbs)判断“可疑值”是否为“异常值”。

▲测量数据：例如测量10次(n ＝10)，获得以下数据：8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0。

▲排列数据：将上述测量数据按从小到大的顺序排列，得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。

可以肯定，可疑值不是最小值就是最大值。

▲计算平均值x -和标准差s ：x -＝7.89；标准差s ＝2.704。

计算时，必须将所有10个数据全部包含在内。

▲计算偏离值：平均值与最小值之差为7.89－4.7＝3.19；最大值与平均值之差为14.0－7.89＝6.11。

▲确定一个可疑值：比较起来，最大值与平均值之差6.11大于平均值与最小值之差3.19，因此认为最大值14.0是可疑值。

▲计算G i 值：G i ＝(x i －x - )/s ；其中i 是可疑值的排列序号——10号；因此G 10＝( x 10－x - )/s ＝(14.0－7.89)/2.704＝2.260。

由于 x 10－x -是残差，而s 是标准差，因而可认为G 10是残差与标准差的比值。

下面要把计算值G i 与格拉布斯表给出的临界值G P (n )比较，如果计算的G i 值大于表中的临界值G P (n )，则能判断该测量数据是异常值，可以剔除。

但是要提醒，临界值G P (n )与两个参数有关：检出水平α (与置信概率P 有关)和测量次数n (与自由度f 有关)。

▲定检出水平α：如果要求严格，检出水平α可以定得小一些，例如定α＝0.01，那么置信概率P ＝1－α＝0.99；如果要求不严格，α可以定得大一些，例如定α＝0.10，即P ＝0.90；通常定α＝0.05，P ＝0.95。

格拉布斯法(Grubbs)检验法

格拉布斯法(Grubbs)检验法之答禄夫天创作▲概述：一组丈量数据中,如果个别数据偏离平均值很远,那么这个(这些)数据称作“可疑值”.如果用统计方法—例如格拉布斯(Grubbs)法判断,能将“可疑值”从此组丈量数据中剔除而不介入平均值的计算,那么该“可疑值”就称作“异常值(粗年夜误差)”. 本文就是介绍如何用格拉布斯法(Grubbs)判断“可疑值”是否为“异常值”.▲丈量数据：例如丈量10次(n ＝10),获得以下数据：8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0.▲排列数据：将上述丈量数据按从小到年夜的顺序排列,获得4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0.可以肯定,可疑值不是最小值就是最年夜值.▲计算平均值x -和标准差s ：x -＝7.89；标准差s ＝2.704.计算时,必需将所有10个数据全部包括在内. ▲计算偏离值：平均值与最小值之差为7.89－4.7＝3.19；最年夜值与平均值之差为14.0－7.89＝6.11.1)(2--=∑n x x s▲确定一个可疑值：比力起来,最年夜值与平均值之差6.11年夜于平均值与最小值之差3.19,因此认为最年夜值14.0是可疑值.▲计算G i值：G i＝(x i－x-)/s；其中i是可疑值的排列序号——10号；因此G10＝( x10－x-)/s＝(14.0－7.89)/2.704＝2.260.由于x10－x-是残差,而s是标准差,因而可认为G10是残差与标准差的比值.下面要把计算值G i与格拉布斯表给出的临界值G P(n)比力,如果计算的G i值年夜于表中的临界值G P(n),则能判断该丈量数据是异常值,可以剔除.可是要提醒,临界值G P(n)与两个参数有关：检出水平α(与置信概率P有关)和丈量次数n(与自由度f有关).▲定检出水平α：如果要求严格,检出水平α可以定得小一些,例如定α＝0.01,那么置信概率P＝1－α＝0.99；如果要求不严格,α可以定得年夜一些,例如定α＝0.10,即P＝0.90；通常定α＝0.05,P＝0.95.▲查格拉布斯表获得临界值：根据选定的P值(此处为0.95)和丈量次数n(此处为10),查格拉布斯表,横竖相交得临界值G95(10)＝2.176.▲比力计算值G i和临界值G95(10)：G i＝2.260,G95(10)＝2.176,G i ＞G95(10).▲判断是否为异常值：因为G i＞G95(10),可以判断丈量值14.0为异常值,将它从10个丈量数据中剔除.▲余下数据考虑：剩余的9个数据再按以上步伐计算,如果计算的G i＞G95(9),仍然是异常值,剔除；如果G i＜G95(9),不是异常值,则不剔除.本例余下的9个数据中没有异常值.格拉布斯表——临界值G P(n)对异常值及统计检验法的解释■丈量过程是对一个无限年夜总体的抽样：对固定条件下的一种丈量,理论上可以无限次丈量下去,可以获得无穷多的丈量数据,这些丈量数据构成一个容量为无限年夜的总体；或者换一个角度看,原本就存在一个包括无穷多丈量数据的总体.实际的丈量只不外是从该无限年夜总体中随机抽取一个容量为n(例如n＝10)的样本.这种样本也可以有无数个,每个样秘闻当于总体所含丈量数据的分歧随机组合.样本中的正常值应当来自该总体.通常的目的是用样本的统计量来估计总体参量.总体一般假设为正态分布.■异常值区分：样本中的正常值应当属于同一总体；而异常值有两种情况：第一种情况异常值不属于该总体,抽样抽错了,从另外一个总体抽出一个(一些)数据,其值与总体平均值相差较年夜；第二种情况异常值虽属于该总体,但可能是该总体固有随机变异性的极端暗示,比如说超越3σ的数据,呈现的概率很小.用统计判断方法就是将异常值找出来,舍去.■犯毛病1：将原本不属于该总体的、第一种情况的异常值判断出来舍去,不会犯毛病；将原本属于该总体的、呈现的概率小的、第二种情况的异常值判断出来舍去,就会犯毛病.■犯毛病2：还有一种情况,不属于该总体但数值又和该总体平均值接近的数据被抽样抽出来,统计检验方法判断不出它是异常值,就会犯另外一种毛病.■异常值检验法：判断异常值的统计检验法有很多种,例如格拉布斯法、狄克逊法（Q法）、偏度-峰度法、拉依达法、奈尔法等等.每种方法都有其适用范围和优缺点.■格拉布斯法最佳：每种统计检验法城市犯犯毛病1和毛病2.可是有人做过统计,在所有方法中,格拉布斯法犯这两种毛病的概率最小,所以推荐使用格拉布斯法.■多种方法结合使用：为了减少犯毛病的概率,可以将3种以上统计检验法结合使用,根据大都方法的判断结果,确定可疑值是否为异常值.■异常值来源：丈量仪器不正常,丈量环境偏离正常值较年夜,计算机犯错,看错,读错,抄错,算错,转移毛病.。

格拉布斯法Grubbs检验法

格拉布斯法Grubbs 检验法▲概述：一组测量数据中;如果个别数据偏离平均值很远;那么这个这些数据称作“可疑值”..如果用统计方法—例如格拉布斯Grubbs 法判断;能将“可疑值”从此组测量数据中剔除而不参与平均值的计算;那么该“可疑值”就称作“异常值粗大误差”..本文就是介绍如何用格拉布斯法Grubbs 判断“可疑值”是否为“异常值”.. ▲测量数据：例如测量10次n ＝10;获得以下数据：8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0..▲排列数据：将上述测量数据按从小到大的顺序排列;得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0..可以肯定;可疑值不是最小值就是最大值.. ▲计算平均值x -和标准差s ：x -＝7.89；标准差s ＝2.704..计算时;必须将所有10个数据全部包含在内..▲计算偏离值：平均值与最小值之差为7.89－4.7＝3.19；最大值与平均值之差为14.0－7.89＝6.11..▲确定一个可疑值：比较起来;最大值与平均值之差6.11大于平均值与最小值之差3.19;因此认为最大值14.0是可疑值..▲计算G i 值：G i ＝x i －x - /s ；其中i 是可疑值的排列序号——10号；因此G 10＝ x 10－x - /s ＝14.0－7.89/2.704＝2.260..由于 x 10－x -是残差;而s 是标准差;因而可认为G 10是残差与标准差的比值..下面要把计算值G i 与格拉布斯表给出的临界值G P n 比较;如果计算的G i 值大于表中的临界值G P n ;则能判断该测量数据是异常值;可以剔除..但是要提醒;临界值G P n 与两个参数有关：检出水平α 与置信概率P 有关和测量次数n 与自由度f 有关..▲定检出水平α：如果要求严格;检出水平α可以定得小一些;例如定α＝0.01;那么置信概率P ＝1－α＝0.99；如果要求不严格;α可以定得大一些;例如定α＝0.10;即P ＝0.90；通常定α＝0.05;P ＝0.95..▲查格拉布斯表获得临界值：根据选定的P 值此处为0.95和测量次数n 此处为10;查格拉布斯表;横竖相交得临界值G 9510＝2.176..▲比较计算值G i 和临界值G 9510：G i ＝2.260;G 9510＝2.176;G i ＞G 9510..1)(2--=∑n x x s▲判断是否为异常值：因为G i＞G9510;可以判断测量值14.0为异常值;将它从10个测量数据中剔除..▲余下数据考虑：剩余的9个数据再按以上步骤计算;如果计算的G i＞G959;仍然是异常值;剔除；如果G i＜G959;不是异常值;则不剔除..本例余下的9个数据中没有异常值..对异常值及统计检验法的解释■测量过程是对一个无限大总体的抽样：对固定条件下的一种测量;理论上可以无限次测量下去;可以得到无穷多的测量数据;这些测量数据构成一个容量为无限大的总体；或者换一个角度看;本来就存在一个包含无穷多测量数据的总体..实际的测量只不过是从该无限大总体中随机抽取一个容量为n例如n＝10的样本..这种样本也可以有无数个;每个样本相当于总体所含测量数据的不同随机组合..样本中的正常值应当来自该总体..通常的目的是用样本的统计量来估计总体参量..总体一般假设为正态分布..■异常值区分：样本中的正常值应当属于同一总体；而异常值有两种情况：第一种情况异常值不属于该总体;抽样抽错了;从另外一个总体抽出一个一些数据;其值与总体平均值相差较大；第二种情况异常值虽属于该总体;但可能是该总体固有随机变异性的极端表现;比如说超过3σ的数据;出现的概率很小..用统计判断方法就是将异常值找出来;舍去..■犯错误1：将本来不属于该总体的、第一种情况的异常值判断出来舍去;不会犯错误；将本来属于该总体的、出现的概率小的、第二种情况的异常值判断出来舍去;就会犯错误..■犯错误2：还有一种情况;不属于该总体但数值又和该总体平均值接近的数据被抽样抽出来;统计检验方法判断不出它是异常值;就会犯另外一种错误..■异常值检验法：判断异常值的统计检验法有很多种;例如格拉布斯法、狄克逊法Q法、偏度-峰度法、拉依达法、奈尔法等等..每种方法都有其适用范围和优缺点..■格拉布斯法最佳：每种统计检验法都会犯犯错误1和错误2..但是有人做过统计;在所有方法中;格拉布斯法犯这两种错误的概率最小;所以推荐使用格拉布斯法..■多种方法结合使用：为了减少犯错误的概率;可以将3种以上统计检验法结合使用;根据多数方法的判断结果;确定可疑值是否为异常值..■异常值来源：测量仪器不正常;测量环境偏离正常值较大;计算机出错;看错;读错;抄错;算错;转移错误..。

grubbs临界值表

grubbs临界值表
Grubbs临界值表是一种用于判断一组数据中是否存在异常值的工具，由美国统计学家Robert Grubbs于1969年提出。

它基于t分布理论，利用t分布的临界值来判断数据中是否存在异常值。

t分布是正态分布的一种变形，计算简便且形态可变。

Grubbs临界值表根据t分布的特性，计算出一组临界值，用于判断数据中的异常值。

该表格中的数值对应于不同显著性水平下的临界值，如%、%、%、%等。

这些临界值可用于比较数据中的最大值或最小值与表格中的数值，从而判断是否存在异常值。

请注意，Grubbs临界值表是一种常用的方法，但并非唯一的方法，其他方法如IQR、Z-score等也可以用于异常值的检测。

在实际应用中，应根据数据的特性和分析需求选择合适的方法。

Grubbs检验法

▲概述：一组测量数据中，如果个别数据偏离平均值很远，那么这个(这些)数据称作“可疑值”。

如果用统计方法—例如格拉布斯(Grubbs)法判断，能将“可疑值”从此组测量数据中剔除而不参与平均值的计算，那么该“可疑值”就称作“异常值(粗大误差)”。

本文就是介绍如何用格拉布斯法判断“可疑值”是否为“异常值”。

▲测量数据：例如测量10次(n＝10)，获得以下数据：8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0。

▲排列数据：将上述测量数据按从小到大的顺序排列，得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。

可以肯定，可疑值不是最小值就是最大值。

▲计算平均值x-和标准差s：x-＝7.89；标准差s＝2.704。

计算时，必须将所有10个数据全部包含在内。

▲计算偏离值：平均值与最小值之差为7.89－4.7＝3.19；最大值与平均值之差为14.0－7.89＝6.11。

▲确定一个可疑值：比较起来，最大值与平均值之差6.11大于平均值与最小值之差3.19，因此认为最大值14.0是可疑值。

▲计算G i值：G i＝(x i－x-)/s；其中i是可疑值的排列序号——10号；因此G10＝( x10－x-)/s＝(14.0－7.89)/2.704＝2.260。

由于x10－x-是残差，而s是标准差，因而可认为G10是残差与标准差的比值。

下面要把计算值G i与格拉布斯表给出的临界值G P(n)比较，如果计算的G i值大于表中的临界值G P(n)，则能判断该测量数据是异常值，可以剔除。

但是要提醒，临界值G P(n)与两个参数有关：检出水平α(与置信概率P有关)和测量次数n(与自由度f有关)。

▲定检出水平α：如果要求严格，检出水平α可以定得小一些，例如定α＝0.01，那么置信概率P＝1－α＝0.99；如果要求不严格，α可以定得大一些，例如定α＝0.10，即P＝0.90；通常定α＝0.05，P＝0.95。