GBT 正态样本离群值的判断和处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
GB/T4883 正态样本离群值的判断和处理
离群值outlier
样本中的一个或几个观测值,它们离开其他观测 值较远,暗示它们可能来自不同的总体。
注:离群值按显著性的程度分为歧离值和统计离群 值。 别名:可疑值、异常值
离群值的判断
GB/T 4883 作者:于振凡
1
第一章 格拉布斯(Grubbs)检验法
i 1
( xi
x
)
2
3
/
2
GB/T 4883 作者:于振凡
13
第三节 双侧离群值的判断
GB/T 4883 作者:于振凡
4
第二节 下侧离群值的判断
1、将样本数据排列成次序统计量
2、计算样本均值
3、计算样本标准差
4、计算Grubbs下统计量G’n 当G’n大于临界值,判定x (1)为离群值;否则判未发
现离群值。若发现了离群值,去掉一个离群值后, 进入下一轮的检验,直到未发现离群值为止。
离群值;去掉一个离群值后,进入下一轮的检验, 直到未发现离群值为止。
GB/T 4883 作者:于振凡
9
第三节 双侧离群值的判断
1、将样本数据排列成次序统计量
2、同时计算Dixon上、下统计量Dn 、D’n
3、 判断 ①当Dn>D’n且Dn 大于临界值, D’n 不大于临界值,判
定x (n)为离群值;去掉x (n)后进入下一轮的检验。
4.7,5.4,6.0,6.5,7.3,7.7,8.2,9.0,10.1, 14.0
经验表明这种砖的抗压强度服从正态分布,检查这些 数据中是否存在上侧离群值。
本例中,样本量n=10, 计算得:
n10,x7.89,s27.312,s2.704
G 10(x(10)x)/s(147.89)/2.7042.260
判定x (1)为离群值;去掉x (1)去后进入下一轮的 检验。
GB/T 4883 作者:于振凡
6
③当Gn>G’n且G’n大于临界值,判定x (1) 与x (n)两个均 为离群值;去掉x (1) 和x (n)后进入下一轮的检验。
④当G’n>Gn且Gn大于临界值,判定x (1) 与x (n)两个 均为离群值;去掉x (1) 和x (n)后进入下一轮的检验。
⑤当Gn=G’n,且Gn大于临界值时,判定x (1) 与x (n)两 个均为离群值;去掉x (1) 和x (n)后进入下一轮的检 验。
否则判未发现离群值。
GB/T 4883 作者:于振凡
7
第二章 狄克逊(Dixon)检验法(2<n<31)
第一节 上侧离群值的判断
1、将样本数据排列成次序统计量
2、计算Dixon上统计量Dn 3、用 Dixon上统计量Dn与临界值相比较 当Dn大于临界值,判定x (n)为离群值,否则未发现离
均为离群值;去掉x (1) 和x (n)后进入下一轮的检验。
⑤当Dn= D’n ,且Dn大于临界值时,判定x (1) 与x (n)
两个均为离群值;去掉x (1) 和x (n)后进入下一轮的 检验。 否则判未发现离群值。
GB/T 4883 作者:于振凡
11
第三章 偏度一峰度检验法
第一节 上侧离群值的判断
1、将样本数据排列成次序统计量
2、计算偏度统计量bs 3、用 统计量bs与临界值相比较 当bs大于临界值,判定x (n)为离群值,否则未发现离群值;若
发现了离群值,剔除一个离群值后,进入下一轮的检验,直 到未发现离群值为止。
n
n ( xi x )3
bs
n i 1
i 1
( xi
x
)
2
3
/
2
GB/T 4883 作者:于振凡
群值;若发现了离群值,去掉一个离群值后,进 入下一轮的检验,直到未发现离群值为止。
GB/T 4883 作者:于振凡
8
第二节 下侧离群值的判断
1、将样本数据排列成次序统计量
2、计算Dixon下统计量
3、用 Dixon下统计量D’n与临界值相比较 当D’n大于临界值,判定x (1)为离群值,否则未发现
第一节 上侧离群值的判断
1、将样本数据排列成次序统计量
2、计算样本均值
3、计算样本标准差
4、计算Grubbs上统计量Gn 5、当Gn大于临界值,判定x (n)为离群值;否则判未
发现离群值。若发现了离群值,去掉一个离群值 后,进入下一轮的检验,直到未发现离群值为止。
GB/T 4883 作者:于振凡
2
对某种砖的抗压强度测试10个样品,其数据经排列后 为(单位:MPa):
GB/T 4883 作者:于振凡
5
第三节 双侧离群值的判断
1、将样本数据排列成次序统计量 2、计算样本均值 3、计算样本标准差 4、同时计算Grubbs上下统计量Gn、G’n ; 5、判断 ①当Gn>G’n且Gn大于临界值,G’n不大于临界值,判定
x (n)为离群值;去掉x (n)后进入下一轮的检验。 ②当G’n>Gn且G’n大于临界值, Gn不大于临界值, ,
GB/T 4883 作者:于振凡
3
确定检出水平,在附录A表A2中查出临界值2.176, 因,判定14.0为离群值。
n 9 ,x 7 .2 1 1 ,s 1 .7 4 4
G 9 (x (9 ) x )/s (1 0 .1 7 .2 1 )/1 .7 4 4 1 .6 5 7
仅有一个歧离值 。
样本均值、样本标准差和Grubbs统计量的保留位数 至少要比原始数据多一位;即原始数据的修约间隔 为10n、 10-n时,样本均值、样本标准差和Grubbs 统计量的修约间隔为10n+1、 10-n-1。(n为正整数 和零)。比原始数据多几位,要在相关的文件中作 出明确规定。
பைடு நூலகம்
12
第二节 下侧离群值的判断
1、将样本数据排列成次序统计量
2、计算偏度统计量bs 3、用 统计量-bs与临界值相比较 当-bs大于临界值,x判定x (1)为离群值,否则未发现离群值;
若发现了离群值,剔除一个离群值后,进入下一轮的检验, 直到未发现离群值为止。
n
n ( xi x )3
bs
n i1
②当D’n>Dn 且D’n大于临界值, Dn不大于临界值, ,
判定x (1)为离群值;去掉x (1)去后进入下一轮的检 验。
GB/T 4883 作者:于振凡
10
③当Dn> D’n且D’n大于临界值,判定x (1) 与x (n)两个
均为离群值;去掉x (1) 和x (n)后进入下一轮的检验。
④当D’n >Dn且Dn大于临界值,判定x (1) 与x (n)两个
离群值outlier
样本中的一个或几个观测值,它们离开其他观测 值较远,暗示它们可能来自不同的总体。
注:离群值按显著性的程度分为歧离值和统计离群 值。 别名:可疑值、异常值
离群值的判断
GB/T 4883 作者:于振凡
1
第一章 格拉布斯(Grubbs)检验法
i 1
( xi
x
)
2
3
/
2
GB/T 4883 作者:于振凡
13
第三节 双侧离群值的判断
GB/T 4883 作者:于振凡
4
第二节 下侧离群值的判断
1、将样本数据排列成次序统计量
2、计算样本均值
3、计算样本标准差
4、计算Grubbs下统计量G’n 当G’n大于临界值,判定x (1)为离群值;否则判未发
现离群值。若发现了离群值,去掉一个离群值后, 进入下一轮的检验,直到未发现离群值为止。
离群值;去掉一个离群值后,进入下一轮的检验, 直到未发现离群值为止。
GB/T 4883 作者:于振凡
9
第三节 双侧离群值的判断
1、将样本数据排列成次序统计量
2、同时计算Dixon上、下统计量Dn 、D’n
3、 判断 ①当Dn>D’n且Dn 大于临界值, D’n 不大于临界值,判
定x (n)为离群值;去掉x (n)后进入下一轮的检验。
4.7,5.4,6.0,6.5,7.3,7.7,8.2,9.0,10.1, 14.0
经验表明这种砖的抗压强度服从正态分布,检查这些 数据中是否存在上侧离群值。
本例中,样本量n=10, 计算得:
n10,x7.89,s27.312,s2.704
G 10(x(10)x)/s(147.89)/2.7042.260
判定x (1)为离群值;去掉x (1)去后进入下一轮的 检验。
GB/T 4883 作者:于振凡
6
③当Gn>G’n且G’n大于临界值,判定x (1) 与x (n)两个均 为离群值;去掉x (1) 和x (n)后进入下一轮的检验。
④当G’n>Gn且Gn大于临界值,判定x (1) 与x (n)两个 均为离群值;去掉x (1) 和x (n)后进入下一轮的检验。
⑤当Gn=G’n,且Gn大于临界值时,判定x (1) 与x (n)两 个均为离群值;去掉x (1) 和x (n)后进入下一轮的检 验。
否则判未发现离群值。
GB/T 4883 作者:于振凡
7
第二章 狄克逊(Dixon)检验法(2<n<31)
第一节 上侧离群值的判断
1、将样本数据排列成次序统计量
2、计算Dixon上统计量Dn 3、用 Dixon上统计量Dn与临界值相比较 当Dn大于临界值,判定x (n)为离群值,否则未发现离
均为离群值;去掉x (1) 和x (n)后进入下一轮的检验。
⑤当Dn= D’n ,且Dn大于临界值时,判定x (1) 与x (n)
两个均为离群值;去掉x (1) 和x (n)后进入下一轮的 检验。 否则判未发现离群值。
GB/T 4883 作者:于振凡
11
第三章 偏度一峰度检验法
第一节 上侧离群值的判断
1、将样本数据排列成次序统计量
2、计算偏度统计量bs 3、用 统计量bs与临界值相比较 当bs大于临界值,判定x (n)为离群值,否则未发现离群值;若
发现了离群值,剔除一个离群值后,进入下一轮的检验,直 到未发现离群值为止。
n
n ( xi x )3
bs
n i 1
i 1
( xi
x
)
2
3
/
2
GB/T 4883 作者:于振凡
群值;若发现了离群值,去掉一个离群值后,进 入下一轮的检验,直到未发现离群值为止。
GB/T 4883 作者:于振凡
8
第二节 下侧离群值的判断
1、将样本数据排列成次序统计量
2、计算Dixon下统计量
3、用 Dixon下统计量D’n与临界值相比较 当D’n大于临界值,判定x (1)为离群值,否则未发现
第一节 上侧离群值的判断
1、将样本数据排列成次序统计量
2、计算样本均值
3、计算样本标准差
4、计算Grubbs上统计量Gn 5、当Gn大于临界值,判定x (n)为离群值;否则判未
发现离群值。若发现了离群值,去掉一个离群值 后,进入下一轮的检验,直到未发现离群值为止。
GB/T 4883 作者:于振凡
2
对某种砖的抗压强度测试10个样品,其数据经排列后 为(单位:MPa):
GB/T 4883 作者:于振凡
5
第三节 双侧离群值的判断
1、将样本数据排列成次序统计量 2、计算样本均值 3、计算样本标准差 4、同时计算Grubbs上下统计量Gn、G’n ; 5、判断 ①当Gn>G’n且Gn大于临界值,G’n不大于临界值,判定
x (n)为离群值;去掉x (n)后进入下一轮的检验。 ②当G’n>Gn且G’n大于临界值, Gn不大于临界值, ,
GB/T 4883 作者:于振凡
3
确定检出水平,在附录A表A2中查出临界值2.176, 因,判定14.0为离群值。
n 9 ,x 7 .2 1 1 ,s 1 .7 4 4
G 9 (x (9 ) x )/s (1 0 .1 7 .2 1 )/1 .7 4 4 1 .6 5 7
仅有一个歧离值 。
样本均值、样本标准差和Grubbs统计量的保留位数 至少要比原始数据多一位;即原始数据的修约间隔 为10n、 10-n时,样本均值、样本标准差和Grubbs 统计量的修约间隔为10n+1、 10-n-1。(n为正整数 和零)。比原始数据多几位,要在相关的文件中作 出明确规定。
பைடு நூலகம்
12
第二节 下侧离群值的判断
1、将样本数据排列成次序统计量
2、计算偏度统计量bs 3、用 统计量-bs与临界值相比较 当-bs大于临界值,x判定x (1)为离群值,否则未发现离群值;
若发现了离群值,剔除一个离群值后,进入下一轮的检验, 直到未发现离群值为止。
n
n ( xi x )3
bs
n i1
②当D’n>Dn 且D’n大于临界值, Dn不大于临界值, ,
判定x (1)为离群值;去掉x (1)去后进入下一轮的检 验。
GB/T 4883 作者:于振凡
10
③当Dn> D’n且D’n大于临界值,判定x (1) 与x (n)两个
均为离群值;去掉x (1) 和x (n)后进入下一轮的检验。
④当D’n >Dn且Dn大于临界值,判定x (1) 与x (n)两个