GBT4883 正态样本离群值的判断和处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
GB/T 4883 作者:于振凡
5
第三节 双侧离群值的判断
1、将样本数据排列成次序统计量 2、计算样本均值 3、计算样本标准差 4、同时计算Grubbs上下统计量Gn、G’n ; 5、判断 ①当Gn>G’n且Gn大于临界值,G’n不大于临界值,判定
x (n)为离群值;去掉x (n)后进入下一轮的检验。 ②当G’n>Gn且G’n大于临界值, Gn不大于临界值, ,
i 1
( xi
x
)2
3/
2
GB/T 4883 作者:于振凡
13
第三节 双侧离群值的判断
1、将样本数据排列成次序统计量
2、计算峰度统计量bk 3、用 统计量bk与临界值相比较 当bk大于临界值,判定离均值最远的观测值为离群值;否则判
未发现离群值 ;若发现了离群值,去掉一个离群值后,进 入下一轮的检验,直到未发现离群值为止。
均为离群值;去掉x (1) 和x (n)后进入下一轮的检验。
⑤当Dn= D’n ,且Dn大于临界值时,判定x (1) 与x (n)
两个均为离群值;去掉x (1) 和x (n)后进入下一轮的 检验。 否则判未发现离群值。
GB/T 4883 作者:于振凡
11
第三章 偏度一峰度检验法
第一节 上侧离群值的判断
12
第二节 下侧离群值的判断
1、将样本数据排列成次序统计量
2、计算偏度统计量bs 3、用 统计量-bs与临界值相比较 当-bs大于临界值,x判定x (1)为离群值,否则未发现离群值;
若发现了离群值,剔除一个离群值后,进入下一轮的检验, 直到未发现离群值为止。
n
n (xi x )3
bs
n i1
1、将样本数据排列成次序统计量
2、计算偏度统计量bs 3、用 统计量bs与临界值相比较 当bs大于临界值,判定x (n)为离群值,否则未发现离群值;若
发现了离群值,剔除一个离群值后,进入下一轮的检验,直 到未发现离群值为止。
n
n (xi x )3
bs
n i 1
i 1
( xi
3/ 2
x
)2
GB/T 4883 作者:于振凡
4.7,5.4,6.0,6.5,7.3,7.7,8.2,9.0,10.1, 14.0
经验表明这种砖的抗压强度服从正态分布,检查这些 数据中是否存在上侧离群值。
本例中,样本量n=10, 计算得:
n 10, x 7.89, s2 7.312, s 2.704
G10 (x(10) x) / s (14 7.89) / 2.704 2.260
群值;若发现了离群值,去掉一个离群值后,进 入下一轮的检验,直到未发现离群值为止。
GB/T 4883 作者:于振凡
8
第二节 下侧离群值的判断
1、将样本数据排列成次序统计量
2、计算Dixon下统计量
3、用 Dixon下统计量D’n与临界值相比较 当D’n大于临界值,判定x (1)为离群值,否则未发现
GB/T 4883 作者:于振凡
3
确定检出水平,在附录A表A2中查出临界值2.176, 因,判定14.0为离群值。
n 9, x 7.211, s 1.744
G9 (x(9) x) / s (10.1 7.21) /1.744 1.657
仅有一个歧离值 。
样本均值、样本标准差和Grubbs统计量的保留位数 至少要比原始数据多一位;即原始数据的修约间隔 为10n、 10-n时,样本均值、样本标准差和Grubbs 统计量的修约间隔为10n+1、 10-n-1。(n为正整数 和零)。比原始数据多几位,要在相关的文件中作 出明确规定。
D、n>30,正态概率纸上线性不好,使用 Grubbs检验法
GB/T 4883 作者:于振凡
18
练习1:
A、n>30,限定检出离群值的个数可以超过1时,正态概率纸 上线性好,使用 —— 检验法。
B、n>30,限定检出离群值的个数不可以超过1时,正态概率 纸上线性好,使用——检验法
C、n>30,限定检出离群值的个数可以超过1时,正态概率纸 上线性不好,使用 ——检验法
n
n (xi x )4
bk
i 1
n i 1
( xi
2
x
)2
GB/T 4883 作者:于振凡
14
当x (n)与均值的距离等于x (1)与均值的距离, 同时去掉x (n) 和x (1),进入下一轮的检验。
GB/T 4883 作者:于振凡
15
第四章 三种方法的选择:
一、限定检出离群值的个数不超过1时 A、n<31,使用Grubbs检验法 B、n>30,正态概率纸上线性好,使用偏度-峰度检验法 C、n>30,正态概率纸上线性不好,使用Grubbs检验法 二、限定检出离群值的个数可以超过1时 A、n<31,使用Dixon检验法 B、n>30,正态概率纸上线性好,使用偏度-峰度检验法 C、n>30,正态概率纸上线性不好,使用Grubbs检验法
离群值;去掉一个离群值后,进入下一轮的检验, 直到未发现离群值为止。
GB/T 4883 作者:于振凡
9
第三节 双侧离群值的判断
1、将样本数据排列成次序统计量
2、同时计算Dixon上、下统计量Dn 、D’n
3、 判断 ①当Dn>D’n且Dn 大于临界值, D’n 不大于临界值,判
定x (n)为离群值;去掉x (n)后进入下一轮的检验。
判定x (1)为离群值;去掉x (1)去后进入下一轮的 检验。
GB/T 4883 作者:于振凡
6
③当Gn>G’n且G’n大于临界值,判定x (1) 与x (n)两个均 为离群值;去掉x (1) 和x (n)后进入下一轮的检验。
④当G’n>Gn且Gn大于临界值,判定x (1) 与x (n)两个 均为离群值;去掉x (1) 和x (n)后进入下一轮的检验。
⑤当Gn=G’n,且Gn大于临界值时,判定x (1) 与x (n)两 个均为离群值;去掉x (1) 和x (n)后进入下一轮的检 验。
否则判未发现离群值。
GB/T 4883 作者:于振凡
7
第二章 狄克逊(Dixon)检验法(2<n<31)
第一节 上侧离群值的判断
1、将样本数据排列成次序统计量
2、计算Dixon上统计量Dn 3、用 Dixon上统计量Dn与临界值相比较 当Dn大于临界值,判定x (n)为离群值,否则未发现离
GB/T4883 正态样本离群值的判断和处理
离群值outlier
样本中的一个或几个观测值,它们离开其他观测 值较远,暗示它们可能来自不同的总体。
注:离群值按显著性的程度分为歧离值和统计离群 值。 别名:可疑值、异常值
离群值的判断
GB/T 4883 作者:于振凡
1
第一章 格拉布斯(Grubbs)检验法
GB/T 4883 作者:于振凡
16
正态概率纸 横坐标x(i) ,纵坐标(i-3/8)/(n+1/4)
GB/T 4883 作者:于振凡
17
A、n<31,限定检出离群值的个数不超过1时, 使用Grubbs检验法
B、 n<31,限定检出离群值的个数可以超过1 时使用Dixon检验法
C、 n>30,正态概率纸上线性好,使用偏度峰度检验法
第一节 上侧离群值的判断
1、将样本数据排列成次序统计量
2、计算样本均值
3、计算样本标准差
4、计算Grubbs上统计量Gn 5、当Gn大于临界值,判定x (n)为离群值;否则判未
发现离群值。若发现了离群值,去掉一个离群值 后,进入下一轮的检验,直到未发现离群值为止。
GB/T 4883 作者:于振凡
2
对某种砖的抗压强度测试10个样品,其数据经排列后 为(单位:MPa):
D、n>30,限定检出离群值的个数不可以超过1时,正态概率 纸上线性不好,使用 ——检验法
E、n<31,限定检出离群值的个数可以超过1时,使用 —— 检验法。
F、 n<31,限定检出离群值的个数不可以超过1时,使用 — — 检验法。
GB/T 4883 作者:于振凡
19
练习1: A、Grubbs检验法的上统计量是——。 B、Grubbs检验法的下统计量是——。 C、偏度-峰度检验法中的偏度统计量是 ——。 D、 当n=9时,Dixon检验法的上统计量是——。 E、当n=9时,Dixon检验法的下统计量是——。
②当D’n>Dn 且D’n大于临界值, Dn不大于临界值, ,
判定x (1)为离群值;去掉x (1)去后进入下一轮的检 验。
GB/T 4883 作者:于振凡
10
③当Dn> D’n且D’n大于临界值,判定x (1) 与x (n)两个
均为离群值;去掉x (1) 和x (n)后进入下一轮的检验。
④当D’n >Dn且Dn大于临界值,判定x (1) 与x (n)两个
GB/T 4883 作者:于振凡
4
第二节 下侧离群值的判断
1、将样本数据排列成次序统计量
2、计算样本均值
3、计算样本标准差
4、计算Grubbs下统计量G’n 当G’n大于临界值,判定x (1)为离群值;否则判未发
现离群值。若发现了离群值,去掉一个离群值后, 进入下一轮的检验,直到未发现离群值为止。
GB/T 4883 作者:于振凡
20
第五章 假设检验的原理
GB/T 4883 作者:于振凡
21
wenku.baidu.com