3误差和分析数据的处理第三讲

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
则: x 0.1012 0.1014 0.1016 0.1014(mol / L) 3
d 0.0002 0 0.0002 0.00013 3
0.1019 0.1014 0.0005 4d 0.00052
即由四倍法可判断这些数据应全部采信。
(二)Q检验法 Q检验法属于半经验半统计检验方法,适用于测定次数为3~10
x u x u x u
x
n
但在实际工作中,一般的定量分析为3~5次的有限次测定,即
μ和σ是不可知的。而消除系统误差的前提下,有限次测定的结果
服从t分布规律。因此,在一定置信水平下由有限次测定结果的平
均值,通过t分布规律,也可给出真值的置信区间。该置信区间不
仅与置信度有关,而且与测定次数有关。即:


x

tP,
f
s x

x tP, f
s n
所以,定量分析结果必须由平行测定次数n,平行
测定结果的平均值 x及测定结果的精密度S共同来表达。
二、可疑测定值的取舍
平行测定的数据中,有时会出现一二个与其结果相差较大的测 定值,称为可疑值或异常值。对于为数不多的测定数据,可疑值的 取舍往往对平均值和精密度造成相当显著的影响。
比较教材P90表4-3与P88表4-2中的数据可知:随着自由度的 增加,t值逐渐减小并与u值接近。
当f=20时,t与u已经比较接近。当f→∞时,t→u,S→σ。 在引用t值时,一般取0.95置信度。
根据样本的单次测定值x或平均值 x 分别表示μ的置信区间时,
根据t分布也可以得出类似的以下的关系:
x tP, f s


x tP, f
s x

x tP, f
s n
两式的意义在于:真值虽然不为所知(σ也未知),但可以期望
由有限的测定值计算出一个范围,它将以一定的置信度将真值包含在
内。该范围越小,测定的准确度越高。
例1 标定HCl溶液的浓度时,先标定3次,结果为0.2001mol/L、 0.2005mol/L和0.2009mol/L;后来又标定2次,数据为0.2004mol/L 和0.2006mol/L。试分别计算3次和5次标定结果计算总体平均值μ的 置信区间(P=0.95)。 解: 标定3次时,
表4-5。若Q计>QP,n,则舍弃可疑值;反之则保留。
QP,n值表
Pn
Q0.9 Q0.95 Q0.99
34 0.94 0.76 0.97 0.84 0.99 0.93
5 6 7 8 9 10 0.64 0.56 0.51 0.47 0.44 0.41 0.73 0.64 0.59 0.54 0.51 0.49 0.82 0.74 0.68 0.63 0.60 0.57
出 和x S。而且当测定次数较少时,测定值或随机误差也不呈正态
分布,这就给少量测定数据的统计处理带来了困难。
此时若用S代替σ从而对μ作出估计必然会引起偏离,而且测定次 数越少,偏离就越大。如果采用另一新统计量tP,f取代u(仅与P有关), 上述偏离即可得到修正。
t分布 t分布是英国统计学家兼化学家戈塞特在1908年提出的,因当时
结果的准确度也将无法提高。
例2 测定某试样中SiO2质量分数得s=0.05%。若测定的精密度保持不变,
当P=0.95时,欲使置信区间的置信限
tP, f
s x

0.0,5%问至少应对
试样平行测定多少次?
解:由


x

tP, f
s x
x tP, f
s 可知: n
tP, f
s x
tP, f

s 0.05% n
s 0.05%
tP, f 0.05% 1 n 0.05%
即:当 tP, f 1 时,可满足题目要求。 n
查t值表可知:当P=0.95 ,f=6-1=5时, t0.95,5=2.57,
2.57 1.05 1 6
当P=0.95 ,f=7-1=6时,有 t0.95,6=2.45,
测定次数 置信度(P)
n
95% 99%
12 2.29 2.55
13 2.33 2.61
14 2.37 2.66
15 2.41 2.71
16 2.44 2.75
17 2.47 2.79
18 2.50 2.82
19 2.53 2.85
20 2.56 2.88
例题: 六次标定某NaOH溶液的浓度,其结果分别为:0.1050、 0.1042、0.1086、0.1063、0.1051、0.1064mol/L。试用G检验法 判断所有测定结果是否采信(P=0.95)。
解: 将三次平行测定结果排序,分别记作:
x1=1mg/L,x2=2mg/L,x3=9mg/L R=9-1=8(mg/L)
因x3-x2> x2-x1,所以x3=9mg/L为最可疑数据。
则:Q计

x3
x2 R

92 9 1

0.875
置信度P=0.95,n=3时,查QP,n表值得:Q0.95,3=0.97
4.计算出统计量 x? x 和4d并比较 x? x 和4d
若 x? x 4d,则可疑值应舍弃,否则应保留。
例题: 标定某溶液的浓度得:0.1014、0.1012、0.1019、0.1016mol/L, 试用四倍法判断数据是否全部采信。
解: 将四次平行测定结果排序,分别记作: x1=0.1012,x2=0.1014,x3=0.1016 ,x4=0.1019 因x4-x3> x2-x1,所以x4=0.1019为最可疑数据。
t值 f(n-1)
1 2 3 4 5 6 7 8 9 10 20 30 60 120 ∞
tP,f值表(双边)
P 90%
95%
99%
6.31 2.92 2.35 2.13 2.02 1.94 1.90 1.86 1.83 1.81 1.72 1.70 1.67 1.66 1.64
12.71 4.30 3.18 2.78 2.57 2.45 2.36 2.31 2.26 2.23 2.09 2.04 2.00 1.98 1.96
时,其中最可疑的数据的的检验。
Q检验法具体检验步骤是: 1.排序:将测定值由小至大按顺序排列
2.计算极差R:R=xn-x1
3.确定可疑值:可疑值不是x1就是xn 。邻差大者最可疑。
邻差即为xn或x1与相邻数据之差。
4.计算出统计量Q计:Q计

xn
xn1 R
或Q计

x2
R
x1
5.根据测定次数n和所要求的置信度P查QP,n表值(教材P97,
因Q计<Q表,
所以,在置信度为0.95时,所有测定结果均应采信。
(二)格鲁布斯法(G法)
G检验法属于统计检验方法,适用于3次以上有限次平行测定值
的检验,可舍弃其中1~2个可疑数据。
G检验法具体检验步骤是:
1.排序: (略)
2.计算整组数据的平均值 x 及标准偏差S。
3.确定可疑值:可疑值不是x1就是xn 。与平均值的差大者最可疑。 4.计算出统计量G计:
x =0.2005mol/L, S=0.0004mol/L
当 f=3-1=2,P=0.95时,查t值表可知:t0.95,2=4.30
x tP, f
s 0.2005 4.30 0.0004 0.2005 0.0010
n
3
标定5次时,
x =0.2005mol/L, S=0.0003mol/L
2.45 0.93 1 7
所以,至少应对试样平行测定7次方可满足题目要求。
P114,习题17为类似题目
小结
测定结果准确度的评价
1.定性说明: 在消除系统误差的前提下,精密度越高,测定结果准确 度就越高。
2.定量说明: 测定结果准确度用误差来衡量,误差越小,测定结果的 准确度越高。
因真值不可知,导致误差无法计算。而统计学表明:在消除系 统误差的前提下,无限次测定结果的平均值可做为真值的估计值。 在总体平均值已知时,在一定置信水平下由单次测定结果或测定结 果的平均值,通过正态分布规律,可给出真值的置信区间。即:
63.66 9.92 5.84 4.60 4.03 3.71 3.50 3.35 3.25 3.17 2.84 2.75 2.66 2.62 2.58
99.5%
127.32 14.98 7.45 5.60 4.77 4.32 4.03 3.83 3.69 3.58 3.15 (3.01) (2.87) 2.81 2.81
(一)四倍法 四倍法属于经验检验方法,适用于测定次数为4~8时,其中一
个最可疑的数据的的检验。 四倍法具体检验步骤是: 1.排序:将测定值由小至大按顺序排列 2.确定可疑值:可疑值不是x1就是xn 。邻差大者最可疑。 邻差即为xn或x1与相邻数据之差。
3.计算“好数据”(不包括可疑值)的平均值x 和平均偏差d
他采用Student为笔名,故将该方法称为t分布法。t值的定义是:
tP, f

x
s
式中tp,f是随置信度P和自由度f而变化的统计量。
t分布是有限测定数据及其随机误差的分布规律。t分布曲线见 下图:
t分布曲线
t分布曲线的特点: 在置信度相同时,t分布曲线的形状随f(f=n-1)而变化,反映了t分
对可疑值的取舍实质是区分可疑值与其它测定值之间的差异到 底是由过失、还是随机误差引起的。如果已经确证测定中发生过失, 则无论此数据是否异常,一概都应舍去;而在原因不明的情况下, 就必须按照一定的统计方法进行检验,然后再作出判断。根据随机 误差分布规律,在为数不多的测定值中,出现大偏差的概率是极小 的,因此通常就认为这样的可疑值是由过失所引起的,而应将其舍 去,否则就予以保留。
当 f=5-1=4,P=0.95时,查t值表可知:t0.95,2=2.78
x tP, f
s 0.2005 2.78 0.0003 0.2005 0.0004
n
5
通过以上计算可知,当P一定时,置信区间的大小与tP,f、S、 n均有关,而且tP,f与S实际也都受n的影响,即n值越大,置信区间 越小。但只增加平行测定次数,而忽略测定数据的精密度,测定
1.69
置信度P=0.95,n=6时,查GP,n表值得:Q0.95,6=1.82 因Q计<Q表,所以,在置信度为0.95时,所有测定结果均应采信。
解: 将六次平行测定结果排序,分别记作:
x1=0.1042,x2=0.1050,x3=0.1051 ,
x4=0.1063,x5=0.1064,x6=0.1086
x =0.1059,S=0.0016
因 x6- x > x -x1,所以x6=0.1086为最可疑数据。
则:
G计

x6 S
x

0.1086 0.1059 0.0016
若x1可疑,则
G计

x
s
x1
若xn可疑,则
G计

xn s
x
5.根据测定次数n和所要求的置信度P查GP,n表值(教材P98,表
Βιβλιοθήκη Baidu
4-6。若G计>GP,n,则舍弃该可疑值;反之则保留。
GP,n值表
测定次数 n
3 4 5 6 7 8 9 10 11
置信度(P) 95% 99%
1.15 1.15 1.46 1.49 1.67 1.75 1.82 1.94 1.94 2.10 2.03 2.22 2.11 2.32 2.18 2.41 2.23 2.48
如果测定数据较少,测定的精密度也不高,因Q与QP,n值 接近而对可疑值的取舍难以判断时,最好补测1-2次再进行检 验就更有把握。如果没有条件再做测定,则宜用中位数代替平 均值报告结果。因是否取舍可疑值对平均值的影响较大,对中 位数的影响较小。
例题: 测定水中砷的含量,三次测定的结果分别是1、2、9mg/L。 试用Q检验法判断所有测定结果是否采信(P=0.95)。
第四节 有限测定数据的统计处理
一、置信度与μ的置信区间
(一) 已知总体标准偏差σ时
用单次测定值x来估计μ可能存在范围的表达式为:
x u
用样本平均值 x 来估计μ所在的范围的表达式为:
x u x u
x
n
(二)已知样本标准偏差S时
在实际工作中,通过有限次的测定是无法得知μ和σ的,只能求
布与测定次数有关的实质。 随着测定次数增加,t分布曲线愈来愈陡峭,测定值的集中趋势亦
更加明显。当f→∞时,t分布曲线就与正态分布曲线合为一体,因此可 以认为正态分布就是t分布的极限。
与正态分布曲线一样,t分布曲线下面某区间的面积也表示随 机误差在此区间的概率。但t值与标准正态分布中的u值不同,它不 仅与概率有关,而且还与测定次数有关。不同置信度和自由度所对 应的t值见教材P90表4-3中。
相关文档
最新文档