粗大误差演示文稿
合集下载
2 误差理论(第二章第三节粗大误差)-2015版
• 但不能在不知原因的情况下,不加分析就轻易舍弃测量列 中最大或最小的数据,这样可能造成错觉。
对数据中异常值的正确判断与处理,是获得客观的测量结果的重要方法第三节 粗大误差来自一、粗大误差产生的原因
产生粗大误差的原因是多方面的,大致可归纳为: ① 测量人员的主观原因
测量者工作责任感不强、工作 过于疲劳、缺乏经验操作不当, 或在测量时不小心、不耐心、 不仔细等,造成错误的读数或 记录。
1 n x xi n 1 i 1
i j
特点:首先剔除一个可疑的测得值,然后按 t 分布检验被剔除的值是否是
v
i 1 i j
n
2 i
并求得测量列的标准差(计算时不包括 vj xj x ): n2 根据测量次数n 和选取的显著度 ,即可由表2-12查得 t 分布的检验系数K (n, )。 若 x j x K 则认为测量值 x j 含有粗大误差,剔除 x j 是正确的,否则认为 x j 不含有粗大误 差,应予保留。
② 客观外界条件的原因
测量条件意外地改变(如机械 冲击、外界振动、电磁干扰 等)。
第三节 粗大误差
二、可疑值处理的基本原则
两个错误做法:
• 凭主观臆断,轻易地剔除主观认定为反常的数据,从而 人为地使测得数据一致起来;
• 不敢舍弃任一个测得数据,一概当作是正常信息。
处理原则:
• • • • 直观判断、及时处理 增加测量次数、继续观察 用统计的方法继续判断 保留不剔、确保安全
x(15) 可怀疑,
第三节 粗大误差
三、粗大误差的统计判别方法
因
x x(1) 20.404 20.30 0.104 x(15) x 20.43 20.404 0.026
4粗大误差
v10 = 0.00063 > G (0.05,10) s = 2.18 × 0.00025 = 0.00055
故按格拉布斯准则应剔除 x′
10
4- 21
误差分析与测量不确定度评定
第四章粗大误差
稳健估计来处理数据
n = 10
取
k0 = 0.6, k = 3
因 故 x′
10
ν10 = 0.00063 > 0.6 × 3 × s = 0.00045
与 与
r1′1 =
r21 =
′ ′ xn − xn − 2 ′ ′ xn − x2
′ x 2 − x1′ ′ x n − 1 − x1′ x ′ − x1′ ′1 = 3 r2 ′ x n − 1 − x1′
n = 8 ~ 10 n = 11 ~ 13 n = 14 ~ 30
4- 12
′ x 3 − x1′ ′ ′ xn − xn −2 与 r2′2 = r22 = ′ ′ ′ x n − 2 − x1′ xn − x3
【解】
计算 x = 20.000mm 查表
s = 2.5µ m
G (0.01, 20) = 2.88
v17 = 8 > G (0.01, 20) s = 2.28 × 2.5 = 7.2
故应剔除 x17
4- 11
误差分析与测量不确定度评定
第四章粗大误差
狄克逊(Dixon)准则 狄克逊(Dixon)准则
= 10.0012
可疑
9 i =2 i
x0.1 =
∑x
(10 − 2 ⋅ (0.1×10) )
= 10.00054
s( x0.1 ) =
∑ν
i =2
9
故按格拉布斯准则应剔除 x′
10
4- 21
误差分析与测量不确定度评定
第四章粗大误差
稳健估计来处理数据
n = 10
取
k0 = 0.6, k = 3
因 故 x′
10
ν10 = 0.00063 > 0.6 × 3 × s = 0.00045
与 与
r1′1 =
r21 =
′ ′ xn − xn − 2 ′ ′ xn − x2
′ x 2 − x1′ ′ x n − 1 − x1′ x ′ − x1′ ′1 = 3 r2 ′ x n − 1 − x1′
n = 8 ~ 10 n = 11 ~ 13 n = 14 ~ 30
4- 12
′ x 3 − x1′ ′ ′ xn − xn −2 与 r2′2 = r22 = ′ ′ ′ x n − 2 − x1′ xn − x3
【解】
计算 x = 20.000mm 查表
s = 2.5µ m
G (0.01, 20) = 2.88
v17 = 8 > G (0.01, 20) s = 2.28 × 2.5 = 7.2
故应剔除 x17
4- 11
误差分析与测量不确定度评定
第四章粗大误差
狄克逊(Dixon)准则 狄克逊(Dixon)准则
= 10.0012
可疑
9 i =2 i
x0.1 =
∑x
(10 − 2 ⋅ (0.1×10) )
= 10.00054
s( x0.1 ) =
∑ν
i =2
9
粗大误差
v10 2.66 G(0.01,10)s 2.411.16 2.8
x10不含粗大误差,不是异常值,应保留 v10 2.66 G(0.05,10)s 2.1761.16 2.52 x10为异常值,应剔除
狄克逊(Dixon)准则
正态测量总体的一个样本 x1, x2 ,..., xn ,按从小到大
原则(即分析解决问题的思路):
异常值的界限应以随机误差的实际分布 范围作为依据,即超出该范围的误差,可被 视为异常值而予以剔除。
统计方法的基本思想
给定一个显著性水平,按一定分布确定一 个临界值,凡超过这个界限的误差,就认 为它不属于随机误差的范畴,而是粗大误 差,该数据应予以剔除。
3σ准则 格拉布斯(Grubbs)准则 狄克逊(Dixon)准则
测量仪器内部的突然故障
若不能确定粗大误差是由上述两个原因产生时,其原 因可认为是测量仪器内部的突然故障。
粗大误差的危害及消除方法
(1) 测量前,排除粗大误差的物 理源;
(2) 测量中,采用防止可能造 成粗大误差的措施;
避免可能造成环境 严重干扰的情形工 作。如:快下班时 间,周围正在施工.
(3) 测量后,对采集的测量 数据进行适当处理,剔除含 粗大误差的数据;或采用稳健 的数据处理方法。
第4 章 粗大误差
教学目标
本章介绍在测量前或测量后如何发现粗大 误差,如果无法发现并剔除粗大误差,则 又如何在测量数据处理中去减小其对测量 结果的影响。具体介绍三个常用的统计判 断准则。
教学重点和难点
粗大误差产生的原因 3 准则 格拉布斯准则 狄克逊准则
第一节 粗大误差Βιβλιοθήκη 题概述粗大误差对测量数据的影响
偏好的假象
偏低的后果
粗大误差理论(精)
一、粗大误差问题概述
1、什么是粗大误差? 粗大误差,亦称过失误差或反常误差, 它是由于测试人员主观因素或者由于测试 条件突然变化引起的明显与测量结果不符 的误差,比如仪器操作不当,读数错误、 记录和计算错误、测试系统的突然故障和 环境条件(如仪器的灵敏度、电源电压和 频率、环境温度)等疏忽因素而造成的误 差,因而又简称粗差。
v
i 1
n
2 i
n2
3、格罗布斯准则
设对某量作多次等精度独立测量,得 x1 , x2 ,..., xn
当x j 服从正态分布时,计算
1 x x n
vi xi x
2 v
n 1
为了检验 xi (i 1,2,...,n)中是否存在粗大误差,将 x i 按大小顺 序排列成顺序统计量 xi ,而 x1 x2 ... xn 格罗布斯导出了gn 及 g1 的分布,取定显著 (一般为0.05或0.01),可以得到格罗布斯系数 g0 (n, ) 度 而 x x1 x x
2、粗大误差对测量数据的影响 ▫可疑数据:在一列重复测量的数据中,有个别数 据xd 与其它数据有明显差异,它可能是含有粗大 误差(简称粗差)的数据。 ▫异常值:确定混有粗大误差的数据。
不恰当地剔除 含大误差的正 常数据,会造 成测量重复性 偏好的假象
未加剔除,必 然会造成极差比的方法,得到简化而严 密的结果。
狄克松研究了x1 , x2 ,..., xn的顺序统计量 xi 的分布,当 x i 服从正 态分布时,得到 xn 的统计量 xn xn1 xn xn1
r10
xn x1
xn xn2 xn x2
xn x
x x1
粗大误差
所以|V i’|值均小于 (4)按 t 检验准则 先将可疑值 t 8 除外,按余下的 14 个数据计算得:
Gσ’ ,故无坏值。
t 1 4 =20.411
σ’=0.016 取显著度ɑ=0.01(即置信概率为 0.99).已知 n=15,查表 4-3 得系数 k=3.12。 则 kσ’ =3.12×0.016=0.05 因 | t 8 - t 1 4 |=|20.30-20.411|=0.111>0.05
vi ' 2 10 6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
20.42 20.43 20.40 20.43 20.42 20.43 20.39 20.30 20.40 20.43 20.42 20.41 20.39 20.39 20.40
+0.016 +0.026 -0.004 +0.026 +0.016 +0.026 -0.014 (-0.104) -0.004 +0.026 +0.016 +0.006 -0.014 -0.014 -0.004
4.t 检验准则
t 检验准则又称罗曼诺夫斯基准则, 它是按 t 分布的实际误差分布范围来判 断粗大误差,这对重复测量次数较少的情况比较合理,而一般测量的重复测量次 数总是很有限的。 t 检验准则的特点是将测量列的 n 个测得值中可疑的测得值 x j 先剔除,然 后按余下的(n-1)个数据计算算术平均值 x ’和标准差σ’值,再判断数据 x j 是否含有粗大误差。
故可判断数据 t8 含有粗大误差,应予以剔除。 再对余下的 14 个数据继续判断,先提出 t7(|V 7 ’|最大) ,
t 13 =20.4103
Gσ’ ,故无坏值。
t 1 4 =20.411
σ’=0.016 取显著度ɑ=0.01(即置信概率为 0.99).已知 n=15,查表 4-3 得系数 k=3.12。 则 kσ’ =3.12×0.016=0.05 因 | t 8 - t 1 4 |=|20.30-20.411|=0.111>0.05
vi ' 2 10 6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
20.42 20.43 20.40 20.43 20.42 20.43 20.39 20.30 20.40 20.43 20.42 20.41 20.39 20.39 20.40
+0.016 +0.026 -0.004 +0.026 +0.016 +0.026 -0.014 (-0.104) -0.004 +0.026 +0.016 +0.006 -0.014 -0.014 -0.004
4.t 检验准则
t 检验准则又称罗曼诺夫斯基准则, 它是按 t 分布的实际误差分布范围来判 断粗大误差,这对重复测量次数较少的情况比较合理,而一般测量的重复测量次 数总是很有限的。 t 检验准则的特点是将测量列的 n 个测得值中可疑的测得值 x j 先剔除,然 后按余下的(n-1)个数据计算算术平均值 x ’和标准差σ’值,再判断数据 x j 是否含有粗大误差。
故可判断数据 t8 含有粗大误差,应予以剔除。 再对余下的 14 个数据继续判断,先提出 t7(|V 7 ’|最大) ,
t 13 =20.4103
误差理论第二章-3粗大误差处理
例题见书P49。
5
§2-4 测量结果的数据处理实例
一、等精度直接测量列测量结果的数据处理实例 例1、对某一轴径等精度测量10次,测得值如下(单位 mm), 26.2025;26.2022;26.2028;26.2025;26.2026;
26.2028;26.2023;26.2025;26.2026;26.2022.
即x 1 x 2 r10 r21
设对一组等精度测量列x1 , x2 , x n x n 1 , x n x 1 x n x n 2 , x n x 2
x n ,当xi 服从正态分布时,得最大值x n 的统计量: r11 r22 x n x n 1 x n x 2 x n x n 2 x n x 3
求最后测量结果。
见备课笔记P25
6
二、不等精度直接测量列测量结果的数据处理 例2、对某一角度进行六组不等精度测量,各组测量结 果如下:
测6次得: 1 751806; 测30次得: 2 751810 测26次得:3 751808; 测12次得: 4 751816 测12次得:5 751813; 44 上的例题
(二)罗曼诺夫斯基准则(t检验准则)测量次数很小时用 当测量次数较少时,按t分布较为合理。先剔除一个可疑的测得 值,按t分布检验被剔除的测量值是否含有粗大误差。
对一等精度测量列,x1 , x2 , 除后计算平均值:
, xn , 若认为xj为可疑数据,将其剔
2
n 1 x xi n 1 i 1,i j
r21
x 1 x 3 x 1 x 3 , r22 x 1 x n 1 x 1 x n 2
5
§2-4 测量结果的数据处理实例
一、等精度直接测量列测量结果的数据处理实例 例1、对某一轴径等精度测量10次,测得值如下(单位 mm), 26.2025;26.2022;26.2028;26.2025;26.2026;
26.2028;26.2023;26.2025;26.2026;26.2022.
即x 1 x 2 r10 r21
设对一组等精度测量列x1 , x2 , x n x n 1 , x n x 1 x n x n 2 , x n x 2
x n ,当xi 服从正态分布时,得最大值x n 的统计量: r11 r22 x n x n 1 x n x 2 x n x n 2 x n x 3
求最后测量结果。
见备课笔记P25
6
二、不等精度直接测量列测量结果的数据处理 例2、对某一角度进行六组不等精度测量,各组测量结 果如下:
测6次得: 1 751806; 测30次得: 2 751810 测26次得:3 751808; 测12次得: 4 751816 测12次得:5 751813; 44 上的例题
(二)罗曼诺夫斯基准则(t检验准则)测量次数很小时用 当测量次数较少时,按t分布较为合理。先剔除一个可疑的测得 值,按t分布检验被剔除的测量值是否含有粗大误差。
对一等精度测量列,x1 , x2 , 除后计算平均值:
, xn , 若认为xj为可疑数据,将其剔
2
n 1 x xi n 1 i 1,i j
r21
x 1 x 3 x 1 x 3 , r22 x 1 x n 1 x 1 x n 2
2 误差理论(第二章第三节粗大误差)-2015版
第三节 粗大误差
三、粗大误差的统计判别方法
(一) 3σ 准则(莱以特准则)
前提条件:测量次数充分大,不会含有系统误差。
, xn 对某量等精度测量n次,得测得值 x1 , x2 ,莱以特准则认为:
如果某测得值的残余误差的绝对值大于三倍的标准差时,即
vi 3
则认为它含有粗大误差,应予剔除。
课堂问题讨论:
a
统计量
a
0.05
n
0.01
统计量
n
0.01
0.05
r0 (n, a)
r0 (n, a)
15 16 17 18 19 20 21 22 23 24 25 0.616 0.595 0.577 0.561 0.547 0.535 0.524 0.514 0.505 0.497 0.489 0.525 0.507 0.490 0.475 0.462 0.450 0.440 0.430 0.421 0.413 0.406
1 n x xi n 1 i 1
i j
特点:首先剔除一个可疑的测得值,然后按 t 分布检验被剔除的值是否是
v
i 1 i j
n
2 i
并求得测量列的标准差(计算时不包括 vj xj x ): n2 根据测量次数n 和选取的显著度 ,即可由表2-12查得 t 分布的检验系数K (n, )。 若 x j x K 则认为测量值 x j 含有粗大误差,剔除 x j 是正确的,否则认为 x j 不含有粗大误 差,应予保留。
第三节 粗大误差
三、粗大误差的统计判别方法
测量中出现的随机误差大多服从正态分布,由正态 分布的单峰性和有界限可知,大误差出现的机会很 少(对有限次测量而言,可看做小概率事件) 粗大误差统计判别方法的基本依据:
粗大误差ppt
n
判别下列等权测量某一物理量15 次所得的测得值中是否有异常值。
1 2
3
解:首先根据测量数据计算
4
算术平均值和标准差
5
1 15
x 15 i1 xi 20.404
6 7
15
s
vi2 i1
0.014960 0.033
8 9
n1
15 1
10
x8 20.30为可疑数据
11
v8 0.104 3s 0.099
x8为异常值,应剔除
12 13 14
对剩余的14个测量值重新判别
15
xi
20.42 20.43 20.40 20.43 20.42 20.43 20.39 20.30 20.40 20.43 20.42 20.41 20.39 20.39 20.40
vi
+0.016 +0.026 -0.004 +0.026 +0.016 +0.026 -0.014 -0.104 -0.004 +0.026 +0.016 +0.006 -0.014 -0.014 -0.004
vi -0.44 -1.04 0.46 -0.24 -0.14 -0.74 1.16 -0.64 -1.04 2.66
解:首先根据测量数据计算算术平均值和标准差
1 10
x 10 i1 xi 55.64
x10 58.3为可疑数据
10
s
vi2 i1
12.024 1.16
n 1 10 1
教学目标
本章介绍在测量前或测量后如何发现粗大 误差,如果无法发现并剔除粗大误差,则 又如何在测量数据处理中去减小其对测量 结果的影响。具体介绍三个常用的统计判 断准则。
2-4粗大误差(精)
i
1 2 3 5 6 7 8 9 10 11 12 13 14
xi
39.44 39.27 39.94 39.44 38.91 39.69 39.48 40.56 39.78 39.68 39.35 39.71 39.46 40.12
Vi(1)
-0.184 -0.353 +0.316 -0.184 -0.714 +0.066 -0.144 +0.936 +0.156 +0.056 -0.274 +0.086 -0.164 +0.496
二、坏值判别准则
拉伊达准则方法简单,它不需要查表,
便于应用,但在理论上不够严谨,只适 用于重复测量次数较多(n>50)的场合。
二、坏值判别准则
格拉布斯准则 凡残余误差大于格拉布斯鉴别值的误差 就是粗大误差,相应的测量值就是坏值, 应予以剔除。
二、坏值判别准则
数学表达式为
式中,xb
vb xb x g 0 n,
应用格拉布斯准则时,先计算测量列的
算术平均值和标准偏差;再取定置信水 平α,根据测量次数n查出相应的格拉布 斯临界系数g0(n,α),计算格拉布斯 鉴别值〔g0(n,α)〕s;将各测量值的 残余误差vi与格拉布斯鉴别值相比较,若 满足鉴别式,则可认为对应的测量值xi为 坏值,应予剔除;否则xi不是坏值,不予 剔除。
二、坏值判别准则
计算算术平均值
x
i 1
n
i
633.98
x xi
i 1
n
633.98 n 39.624 16
计算各测量值的残余误差vi及vi2,并填入
表2-8。
二、坏值判别准则
计算标准差
v
i 1
2 v i i 1 n
粗大误差的检验与坏值的剔除课件
特点
粗大误差通常表现为离群孤立的 值,与周围的测量值存在明显的 差异。
粗大误差产生的原因
人为因素
如操作失误、读数错误、记录错 误等。
设备故障
如传感器失灵、外表显示特殊等。
环境干扰
如电磁干扰、振动、温度突变等。
粗大误差对数据的影响
01
02
03
歪曲数据真实情况
粗大误差会使得数据出现 特殊波动,从而影响对数 据真实情况的准确判断。
影响数据分析结果
在进行数据分析和处理时 ,粗大误差会导致计算结 果出现偏差,进而影响最 终的分析结论。
降低数据可信度
存在粗大误差的数据会导 致人们对数据的信任度降 低,从而影响数据的进一 步应用。
02
CATALOGUE
粗大误差的检验方法
格拉布斯准则
总结词
基于正态散布的统计检验方法,通过计算格拉布斯统计量,对观测值进行检验 。
03
CATALOGUE
坏值的剔除方法
直观判断法
直接视察
通过直接视察数据,可以发现一些明显的特殊值。例如,一个数据点明显高于或 低于其他数据点,或者与整体趋势不符。
统计检验法
基于统计原理
通过使用统计检验方法,如z分数、IQR等,可以确定哪些数据点是特殊值或坏值。这种方法基于概率散布,能够更科学地剔 除坏值。
案例二:模拟数据中的粗大误差检验与剔除
总结词:模拟实验
详细描述:模拟数据为研究者提供了一个可控制的环境, 用于测试和比较不同粗大误差检验方法的性能。通过模拟 具有不同散布和特性的数据集,可以评估各种方法的准确 性和可靠性,从而选择最合适特定数据集的方法。
案例三:多元数据中的粗大误差检验与剔除
总结词
粗大误差通常表现为离群孤立的 值,与周围的测量值存在明显的 差异。
粗大误差产生的原因
人为因素
如操作失误、读数错误、记录错 误等。
设备故障
如传感器失灵、外表显示特殊等。
环境干扰
如电磁干扰、振动、温度突变等。
粗大误差对数据的影响
01
02
03
歪曲数据真实情况
粗大误差会使得数据出现 特殊波动,从而影响对数 据真实情况的准确判断。
影响数据分析结果
在进行数据分析和处理时 ,粗大误差会导致计算结 果出现偏差,进而影响最 终的分析结论。
降低数据可信度
存在粗大误差的数据会导 致人们对数据的信任度降 低,从而影响数据的进一 步应用。
02
CATALOGUE
粗大误差的检验方法
格拉布斯准则
总结词
基于正态散布的统计检验方法,通过计算格拉布斯统计量,对观测值进行检验 。
03
CATALOGUE
坏值的剔除方法
直观判断法
直接视察
通过直接视察数据,可以发现一些明显的特殊值。例如,一个数据点明显高于或 低于其他数据点,或者与整体趋势不符。
统计检验法
基于统计原理
通过使用统计检验方法,如z分数、IQR等,可以确定哪些数据点是特殊值或坏值。这种方法基于概率散布,能够更科学地剔 除坏值。
案例二:模拟数据中的粗大误差检验与剔除
总结词:模拟实验
详细描述:模拟数据为研究者提供了一个可控制的环境, 用于测试和比较不同粗大误差检验方法的性能。通过模拟 具有不同散布和特性的数据集,可以评估各种方法的准确 性和可靠性,从而选择最合适特定数据集的方法。
案例三:多元数据中的粗大误差检验与剔除
总结词
精选粗大误差的检验与坏值的剔除热能与动力工程实验教学示范中
变值系统误差
根据变化的特点,变值系统误差可分为:1累积系统误差:测量过程中它随时间增大或减小,其产生原因往往是元件老化或磨损、工作电池电压下降等;2周期性系统误差:测量过程中它的大小和符号按一定周期发生变化,如秒表指针与度盘不同心就会产生这样的误差。3复杂变化的系统误差:变化规律仍未被认识的系统误差,即未定系统误差,其上下限值常常确定了测量值的系统不确定度。
① 多次测量结果的表示
测量结果 = 样本平均值 不确定度
② 单次测量结果的表示
-- 消除系统误差、剔除粗大误差
随机误差数据处理 --- 被测量真值的取值范围(概率)
不确定度(Uncertainty)
测量可以置信的限度 --- K
K ---置信系数(K=1, 2, 3等)
直接测量
概率 --- 置信概率
格拉布斯准则临界值T(n,a)表
2.6 系统误差
恒值系统误差变值系统误差变值系统误差存在与否的检验系统误差的估计间接测量中系统误差的传递
恒值系统误差
恒值系统误差的存在只影响结果的正确度,而不影响结果的精密度,可用更准确的测量系统和测量方法相比较来发现恒值系统误差,并提供修正值。采用交换法测量技术对消除恒值系统误差有一定的作用。例如,用天平称重时,交换砝码和被测物的位置,取两次称重的平均值,可消除天平臂长不等引起的误差。
二、格拉布斯准则将重复测量值按大小顺序重新排列,用下式计算首、尾测量值的格拉布斯准则数
然后根据子样容量n和所选取的判断显著性水平a,从下表中查得相应的格拉布斯准则临界值T(n,a)。若Ti>= T(n,a)则可认为Xi 为坏值,应剔除,注意每次只能剔除一个测量值。若T1和Tn都大于或等于T(n,a),则应先剔除两者中较大者,再重新计算算术平均值和标准误差估计值S,这时子样容量只有(n-1),再行判断,直至余下的测量值中再未发现坏值。显著性水平a一般可取0.05或0.01,其含意是按临界值判定为坏值而其实非坏值的概率,即判断失误的可能性。例题:见吴书P20例1-6例:有一组重复测量值(C),Xi (i=1,2,…,16):39.44 39.27 39.94 39.44 38.91 39.69 39.48 40.5639.78 39.35 39.68 39.71 39.46 40.12 39.39 39.76 试分别用依拉达准则和格拉布斯准则检验粗大误差和剔除坏值。
粗大误差演示文稿
第三节
粗大误差
(二)格拉布斯准则 1950年格拉布斯(Grubbs)根据顺序统计量的某种 分布规律提出一种判别粗大误差的准则。1974年我国有 人用电子计算机做过统计模拟试验与其它几个准则相
比,对样本中仅混入一个异常值的情况,用格拉 布斯准则检验的功率最高。
第三节
当 xi 服从正态分布时,计算得
表 2-11
序号
l
20.42 20.43 20.40 20.43 20.42 20.43 20.39 20.30 20.40 20.43 20.42 20.41 20.39 20.39 20.40
x
v
+0.016 +0.026 -0.004 +0.026 +0.016 +0.026 -0.014 -0.104 -0.004 +0.026 +0.016 +0.006 -0.014 -0.014 -0.004
v2
0.000256 0.000676 0.000016 0.000676 0.000256 0.000676 0.000196 0.010816 0.000016 0.000676 0.000256 0.000036 0.000196 0.000196 0.000016
v
+0.009 +0.019 -0.011 +0.019 +0.009 +0.019 -0.021 —— -0.011 +0.019 +0.009 -0.001 -0.021 -0.021 -0.011
x(1) x( 2) x( n )
第三节
ij
粗大误差
构造检验高端异常值 x(n ) 和低端异常值 x(1) 的统 计量分别为 rij和 r , 分以下几种情形:
粗大误差
81 361 121 361 81 361 441 (已剔除) 121 361 81 1 441 441 121
t15 =
t
i 1
15
i
15
=20.404
vi =0.01496
i 1
15
2
v '
i i 1
14
2
=0.003374
t14 =
t
i 1
14
σ=
i
0.01496 =0.033 15 1
除以上准则外,还有狄克逊(Dixon)准则等其他准则,可参阅有关文献。 要指出,以上各准则都是人为主观拟定的,直到目前为止,还没有统一的规定。 此外,所有准则,又都是以数据按正态分布为前提的,当偏离正态分布时,判断 的可靠性将受影响,特别是测量次数很少时更不可靠。因此,对待粗大误差,除 从测量结果中及时发现和利用剔除准则鉴别外, 更重要的是要提高工作人员的技 术水平和工作责任心,不要在情绪不宁和过于疲劳的情况下,进行重要的测量工 作, 另外, 要保证测量条件的稳定, 防止因环境条件剧烈变化而产生的突变影响。
n Zc
40 2.49
50 2.58
3.格拉布斯(Grubbs )准则
格拉布斯准则的来源推导较繁,这里只介绍具体用法。 在测量数值(测量列)中某一数据的残差的绝对值|v|>Gσ时,则判断此值 中含有粗大误差,应予剔除,此即格拉布准则。G 值按重复测量次数 n 及置信概 率 P ɑ由表 4-2 查出。 表 4-2 格拉布斯准则中的 G 值 测 量 测 量 置信概率 P ɑ 置信概率 P ɑ 次数 次数 n n 0.99 0.95 0.99 0.95 3 4 5 6 7 13 14 15 1.16 1.49 1.75 1.94 2.10 2.61 2.66 2.70 1.15 1.46 1.67 1.82 1.94 2.33 2.37 2.41 8 9 10 11 12 16 18 20 2.22 2.32 2.41 2.48 2.55 2.74 2.82 2.88 2.03 2.11 2.18 2.23 2.28 2.44 2.50 2.56
粗大误差的检验与坏值的剔除-热能与动力工程实验教学示范中
^
^
^
均方根误差 剩余误差 P1 x1 x,P2 x2 x,Pm xm x
测量结果的表示方法
① 多次测量结果的表示 -- 消除系统误差、剔除粗大误差
随机误差数据处理 --- 被测量真值的取值范围(概率)
测量结果 = 样本平均值 不确定度 不确定度(Uncertainty)
测量可以置信的限度 --- K
则: y y f (x1 x1, x2 x2,, xm xm )
式中, y
的随机误差。
xi 为间接测量值和各直接测量值
间接测量中系统误差的传递(续)
由于一般情况下测量值远大于不确定度,故按 台劳级数展开上式,并略去高次项得:
y
m i 1
f xi
i
但由于各直接测量值的系统不确定度带有正负
故又称为3Ơ准则,实际使用时标准误差Ơ可用其估计值S代替。 按上述准则剔除坏值后,应重新计算提出坏值后测量列的算术平均 值和标准误差估计值S,再行判断,直至余下测量值中无坏值存在。
用3Ơ准则判断粗大误差的存在,虽然方法简单,但它是依据正 态分布得出的。当子样容量不很大时,由于所取界限太宽,坏值不 能剔除的可能性较大。特别是当子样容量n<10时,尤其严重,所以 目前都推荐使用以t分布为基础的格拉布斯准则。
变值系统误差存在与否的检验(续)
3用阿贝准则检验 按测量先后顺序排列测量值,求出测量
列标准残差估计值S,计算统计量
n1
C vivi1 i 1
若 C n 1 S2
则可以认为该测量列中含有周期性系统 误差。
例题
见吴书P23例1-7 例:对某恒温箱温度进行了10次测量,
依测量的先后顺序获得如下测量值(C) 20.06 20.07 20.06 20.08 20.10 20.12 20.14 20.18 20.18 20.21 试检验该测量列中是否含有变值系统误
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
v2
0.000256 0.000676 0.000016 0.000676 0.000256 0.000676 0.000196 0.010816 0.000016 0.000676 0.000256 0.000036 0.000196 0.000196 0.000016
v
+0.009 +0.019 -0.011 +0.019 +0.009 +0.019 -0.021 —— -0.011 +0.019 +0.009 -0.001 -0.021 -0.021 -0.011
第三节
粗大误差
(一) 3 准则 3 准则是最常用也是最简单的判别粗大误差的
准则,它是以测量次数充分大为前提,但通常测 量次数比较少,因此该准则只是一个近视的准则。 实际测量中,常以贝塞尔公式算得 ,以 x 代 替真值。对某个可疑数据 x d ,若其残差满足: (2-90) | vd || xd x | 3
表 2-11
序号
l
20.42 20.43 20.40 20.43 20.42 20.43 20.39 20.30 20.40 20.43 20.42 20.41 20.39 20.39 20.40
x
v
+0.016 +0.026 -0.004 +0.026 +0.016 +0.026 -0.014 -0.104 -0.004 +0.026 +0.016 +0.006 -0.014 -0.014 -0.004
x x(1) 20.404 20.30 0.104
故应先怀疑
x (1)
是否含有粗大误差,计算 20.404 20.30 g (1) 3.15 0.033
查表2-12得
g 0 (15,0.05) 2.41
则
g (1) 3.15 g 0 (15,0.05) 2.41
第三节 粗大误差 二、判别粗大误差的准则
在测量过程中,确实是因读错记错数据,仪器的突 然故障,或外界条件的突变等异常情况引起的异常值, 一经发现,就应在记录中除去,但需注明原因。这种从 技术上和物理上找出产生异常值的原因,是发现和剔除 粗大误差的首要方法。有时,在测量完成后也不能确知 数据中是否含有粗大误差,这时可采用统计的方法进行 判别。统计法的基本思想是:给定一个显著性水平,按 一定分布确定一个临界值,凡超过这个界限的误差,就 认为它不属于偶然误差的范围,而是粗大误差,该数据 应予以剔除。 xd 在判别某个测得值是否含有粗大误差时,要特别慎 重,应作充分的分析和研究,并根据判别准则予以确定。 常用的判别准则有:
皆小于
1.18,故可认为其余测得值也不含粗大误差。
第三节
(三)狄克松准则
粗大误差
1950年狄克松(Dixon)提出另一种无需估 算 x 和 的方法,它是根据测量数据按大小 排列后的顺序差来判别是否存在粗大误差。有人 指出,用Dixon准则判断样本数据中混有一个以 上异常值的情形效果较好。以下介绍一种狄克松 双侧检验准则。 设正态测量总体的一个样本 x1 , x2 ,, xn , 将 xi 按大小顺序排列成顺序统计量 x(i ) ,即
g(n) x( n ) x
粗大误差
及
g 0 (n, )
(一般为0.05或0.01),可得如表2-12所列的临 ,而
g (1)
x x (1)
的分布,
P(
及
x( n ) x
P(
若认为 x
x x(1)
g 0 (n, ))
g 0 (n, ))
故表2-11中第八个测得值
x8 含有粗大误差,应予剔除。
第三节
粗大误差
是否含
剩下的14个数据,再重复上述步骤,判别 x(15) 有粗大误差。 解:
x 20.411 ,
0.016
g (15)
20.43 20.411 1.18 0.016
故可判别 x(15) 不包含粗大误差,而各 g (i )
则可认为该数据含有粗大误差,应予以剔除。
第三节
粗大误差
利用贝塞尔公式容易说明:在n≤10的情形,用3 准则剔除粗误差注定失败。为此,在测量次数较少时, 最好不要选用3 准则。下表是3 准则的“弃真”概率, 从表中看出3 准则犯“弃真”错误的概率随n的增大而 减小,最后稳定于0.3%。
n a
x(1) x( 2) x( n )
第三节
ij
粗大误差
构造检验高端异常值 x(n ) 和低端异常值 x(1) 的统 计量分别为 rij和 r , 分以下几种情形:
x( n ) x( n 1) x( 2 ) x(1) ' 与 r10 r10 x( n ) x(1) x( n ) x(1) r x( n ) x( n 1) 与 r ' x( 2 ) x(1) 11 11 x( n ) x( 2 ) x( n 1) x(1) x( n ) x( n 2 ) x( 3) x(1) ' r21 与 r21 x( n ) x( 2 ) x( n 1) x(1) x( n ) x( n 2 ) x( 3) x(1) ' 与 r22 r22 x( n ) x( 3) x( n 2 ) x(1) n7 n : 8 ~ 10 n : 11 ~ 13 n 14
根据 3
准则,第八测得值的残余误差为:
v8 0.104 0.099
即它含有粗大误差,故将此测得值剔除。再根据剩下的14个 测得值重新计算,得: x 20.411
v
i 1
n
'2 i
n 1
0.003374 0.016 13
由表2-11知,剩下的14个测得值的残余误差均满 足 vi' 3 ,故可以认为这些测得值不再含有粗大误差。
粗大误差
x1 , x2 , xn
,
设对某量作多次等精度独立测量,得
x
1 x n
vi xi x
[v 2 ] ( n 1)
为了检验 x 中是否含有粗大误差,将 xi 按大小顺序排列成顺序 i 统计量 x(i ) ,而
x(1) x( 2) x( n )
第三节
格拉布斯导出了 取定显著度 界值
第三节
粗大误差
在一系列重复测量数据中,如有个别数据与其它 的有明显差异,则它(或它们)很可能含有粗大误差 (简称粗差),称其为可疑数据,记为 x d 。根据随 机误差理论,出现大误差的概率虽然小,但也是可能 的。因此,如果不恰当剔除含大误差的数据,会造成 测量精密度偏高的假象。反之如果对混有粗大误差的 数据,即异常值,未加剔除,必然会造成测量精密度 偏低的后果。以上两种情况还都严重影响对 x 的估 计。因此,对数据中异常值的正确判断与处理,是获 得客观的测量结果的一个重要方法。
第三节
粗大误差
(二)格拉布斯准则 1950年格拉布斯(Grubbs)根据顺序统计量的某种 分布规律提出一种判别粗大误差的准则。1974年我国有 人用电子计算机做过统计模拟试验与其它几个准则相
比,对样本中仅混入一个异常值的情况,用格拉 布斯准则检验的功率最高。
第三节
当 xi 服从正态分布时,计算得
r0 (n, a)
0.641 0.616 0.595 0.577 0.561 0.547 0.535 0.524 0.514 0.505 0.497 0.489 0.546 0.525 0.507 0.490 0.475 0.462 0.450 0.440 0.430 0.421 0.413 0.406
(1)
可疑,则有
g (1)
x x(1)
第三节
若认为 当
粗大误差
(2-91)
可疑,则有 g x( n ) x x(n ) (n)
g (i ) g 0 (n, )
表 2 12
即判别该测得值含有粗大误差,应予剔除。
a
0.05
g 0 (n, a)
3 4 5 6 7 8 9 10 11 12 13 14 15 16 1.15 1.46 1.67 1.82 1.94 2.03 2.11 2.18 2.23 2.28 2.33 2.37 2.41 2.44 1.16 1.49 1.75 1.94 2.10 2.22 2.32 2.41 2.48 2.55 2.61 2.66 2.70 2.75 17 18 19 20 21 22 23 24 25 30 35 40 50 100
l
i 1
15
i
n
20.404
vi 0
i 1
15
v 0.01496
i 1 2 i
15
v
i 1
15
ቤተ መጻሕፍቲ ባይዱ
'2 i
0.003374
第三节
由表2-11可得
vi2
i 1 n
粗大误差
x 20.404
n 1
0.01496 0.033 14
3 3 0.033 0.099
(2-92)
以上的 r10 , r10 ,, r22 , r22 简记为 rij 和 rij 。狄 克松导出了它们的概率密度函数。
第三节
粗大误差
表 2-13
选定显著性水平 ,查表2-13得临界值 r0 (n, ) 。当测量的统计值 rij或 rij ' 大于临界值时,则认为 x(n ) 或 x(1) 含有粗大误差。