5第三章 误差与数据处理 3-3
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2010-122010-12-25 12
第三章
误差及数据处理
3-4
注意: 注意:
1. F表以自由度 f 值来划分,故要确定两组 值来划分, 数据的自由度; 数据的自由度; 2. F 表值为单边值,即要求s1 ≥ s2 ,而不能 表值为单边值,即要求s s1 < s2 3. F 表为 P = 95%时的值,当进行双边检验 95%时的值, 时,α值是单边时的两倍,即: P = 90%。 值是单边时的两倍, 90%
2010-122010-12-25
4
µ = x ± tP, f s
µ = x ± tP, f sx = x ± tP, f
2010-122010-12-25
s n
5
第三章 误差及数据处理
3-4 显著性检验
2010-122010-12-25
6
第三章
误差及数据处理
3-4
用统计的方法检验测定值之间是否存在显著 性差异,以此推断它们之间是否存在系统误差, 性差异,以此推断它们之间是否存在系统误差, 从而判断测定结果或分析方法的可靠性, 从而判断测定结果或分析方法的可靠性,这一过 显著性检验。 程称为显著性检验 定量分析中常用的有t 程称为显著性检验。定量分析中常用的有t 检验法 检验法。 和F 检验法。 (一) t 检验法 t 检验法用来检验样本平均值与标准值或两 组数据的平均值之间是否存在显著性差异,从而 组数据的平均值之间是否存在显著性差异, 对分析方法的准确度作出评价( 对分析方法的准确度作出评价(是否存在系统误 差)。
解:
F=
0.12 0.10
2 2
= 1.44
n1 = 5,f1 = 4; n2 = 4,f2 = 3 ;s2 > s1 ,f大 = 3, f小 = 4 查得 F表 ( F3,4)= 6.59 > F计,即两方法的精密度无显 著 差异。 差异。
2010-122010-12-25
14
第三章: 第三章:误差及数据处理
2010-12-25 17
第三章
误差及和数据处理
3-5
法简单,不必查表, 法简单,不必查表,但计算却颇不容 其处理方法在理论上是不严格的, 易。其处理方法在理论上是不严格的,方 法应用也有局限性。其结果与Grubbs(T) 法应用也有局限性。其结果与 ( 检验法矛盾时,以后两法为准。 检验法及Q检验法矛盾时,以后两法为准。
2010-12-25 16
第三章
误差及和数据处理
3-5
一、 4d 法
根据正态分布规律,偏差超过3σ 根据正态分布规律,偏差超过 的个别测量值 出现的概率小于0.3%,故这一测量值可以舍去。 因 出现的概率小于 , 故这一测量值可以舍去。 大于4 的个别测量值也可以舍去。 为δ=0.8σ,大于 δ的个别测量值也可以舍去。
3-4
2、两组平均值的比较
x1 − x2 t= s
(3-34)
n1n2 n1 + n2
( n1 − 1) s + (n2 − 1) s2 S= n1 + n2 − 2
2 1
2
(3-35)
在一定置信度时,查出表值tP,f,若t <tP,f, 在一定置信度时,查出表值 说明两个平均值不存在系统误差, 说明两个平均值不存在系统误差,可以认为 两个平均值属于同一总体.若t > tP,f,说明两 两个平均值属于同一总体. 个平均值不属于同一总体, 个平均值不属于同一总体,两组平均值之间 存在着系统误差. 存在着系统误差.
上节课回顾
3-3 分析化学中的数据处理
一、随机误差的正态分布
2010-122010-12-25
1
第三章
误差及数据处理
3-3
|u| 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
2010-122010-12-25
表3-2 正态分布概率积分表 |u| |u| 面积 面积 面积 0.0000 1.1 0.3643 2.2 0.4821 0.0398 1.2 0.3849 2.2 0.4861 0.0793 1.3 0.4032 2.3 0.4893 0.1179 1.4 0.4192 2.4 0.4918 0.1554 1.5 0.4332 2.5 0.4938 0.1915 1.6 0.4452 2.58 0.4951 0.2258 1.7 0.4554 2.6 0.4953 0.2580 1.8 0.4641 2.7 0.4965 0.2881 1.9 0.4713 2.8 0.4974 0.3159 1.96 0.4950 3.0 0.4987 0.3413 2.0 0.4773 ∞ 0.5000
2010-122010-12-25 9
注意: 注意:
比较两组平均值有无显著性差异时, 比较两组平均值有无显著性差异时, 应首先用 F 检验法检验两组数据精密度 s1 之间有无显著性差异, 和 s2 之间有无显著性差异,如证明它们之 间无显著性差异, 间无显著性差异,才可以用 t 检验法检验两 组平均值有无显著性差异。 组平均值有无显著性差异。
2010-122010-12-25
11
第三章
误差及数据处理
3-4
(二) F 检验法
比较两组数据的方差以确定其精密度是否 存在系统误差. 存在系统误差. 方法简便, 方法简便,只需比较两个标准偏差即可 (s 值大的在分子上以确保 F > 1): 2 S1 F = 2 (3-36) S2 再将该F 值与P64的 比较, 再将该F 值与P64的F表比较,F > F表 则 有显著性差异存在。 有显著性差异存在。
3-5 可疑值取舍
2010-122010-12-25
15
第三章
误差及和数据处理
3-5
平行测定的数据中, 平行测定的数据中,有时会出现一二个与 结 果相差较大的测定值,称为可疑值或异常值。 果相差较大的测定值,称为可疑值或异常值。对于 为数不多的测定数据, 为数不多的测定数据,可疑值的取舍往往对平均值 和精密度造成相当显著的影响。 和精密度造成相当显著的影响。 对可疑值的取舍实质是区分可疑值与其它测定 值之间的差异到底是由过失、还是随机误差引起的。 值之间的差异到底是由过失、还是随机误差引起的。 如果已经确证测定中发生过失, 如果已经确证测定中发生过失,则无论此数据是否 异常,一概都应舍去;而在原因不明的情况下, 异常,一概都应舍去;而在原因不明的情况下,就 必须按照一定的统计方法进行检验, 必须按照一定的统计方法进行检验,然后再作出判 根据随机误差分布规律, 断。根据随机误差分布规律,在为数不多的测定值 出现大偏差的概率是极小的, 中,出现大偏差的概率是极小的,因此通常就认为 这样的可疑值是由过失所引起的,而应将其舍去, 这样的可疑值是由过失所引起的,而应将其舍去, 否则就予以保留。 否则就予以保留。
2010-12-25 19
第三章
误差及和数据处理
3-5
二、格鲁布斯法
将测定值由小至大按顺序排列, 将测定值由小至大按顺序排列 , 其中可 疑值为x 疑值为 1 或 xn 。 先计算该组数据的平均值和 标准偏差,再计算统计量T。 标准偏差,再计算统计量 。 可疑, 若x1可疑,T= 可疑, 若xn可疑,
2010-122010-12-25
10
第三章
误差及数据处理
3-4
进行显著性检验时, 如置信度定得过低, 则容 进行显著性检验时 , 如置信度定得过低 , 易将随机误差引起的差异判断为显著性差异, 易将随机误差引起的差异判断为显著性差异 , 如置 信度定得过高, 信度定得过高 , 又可能将系统误差引起的不一致认 同为正常差异, 从而得出不合理的结论。 同为正常差异 , 从而得出不合理的结论 。 在定量分 析中,常采用0.95或0.90的置信度。 的置信度。 析中,常采用 或 的置信度 在显著性检验中, 将具有显著性差异的测定值 在显著性检验中 , 在随机误差分布中出现的概率称为显著性水平 显著性水平, 在随机误差分布中出现的概率称为显著性水平,用α 表示, 表示 , 即这些测定值位于一定置信度所对应的随机 误差界限之外。如置信度P=0.95,则显著水平 误差界限之外。如置信度 ,则显著水平α=0.05, , 即α=1-P。 。
x-µ t= √n s
(3-33)
2010-122010-12-25
说明与µ之差已超出随机误差的界限 之差已超出随机误差的界限, 若t >tP,f,说明与 之差已超出随机误差的界限, 就可以按照相应的置信度判断它们之间存在显著性 差异(即存在系统误差) 差异(即存在系统误差)。
8
第三章
误差及数据处理
2010-122010-12-25 13
第三章
误差及数据处理
3-4
例1:以两种方法测定碱灰中Na2CO3含量,结果为: 以两种方法测定碱灰中Na 含量,结果为: 方法一 X1=42.34% s1=0.10 n1=5 x x 方法二 X2=42.44% s2=0.12 n2=4 两种方法的精密度是否有显著性差异? 两种方法的精密度是否有显著性差异?
2010-12-25
21
第三章
wenku.baidu.com误差及和数据处理
3-5
表3-5 Tα,n值表
显著性水平( ) 显著性水平( 测定次数 显著性水平(α) 测定次数 显著性水平( α ) n 0.05 0.01 n 0.05 0.01
3 4 5 6 7 8 9 10 11
2010-12-25
1.15 1.46 1.67 1.82 1.94 2.03 2.11 2.18 2.23
2010-122010-12-25 7
第三章
误差及数据处理
3-4
1、平均值与标准值的比较 、 当检验一种分析方法的准确度时, 当检验一种分析方法的准确度时,采用该方法 对某标准试样进行数次测定, 对某标准试样进行数次测定,再将样本平均值与标 进行比较。则根据置信区间的定义可知, 准值 µ 进行比较。则根据置信区间的定义可知,经 次测定后, 过 n次测定后 , 如果以平均值为中心的某区间已经 次测定后 按指定的置信度将真值µ包含在内 包含在内, 按指定的置信度将真值 包含在内 , 那么它们之间 就不存在显著性差异, 分布, 就不存在显著性差异,根据 t 分布,这种差异是仅 由随机误差引起的。 可由下式计算: 由随机误差引起的。t 可由下式计算:
4d
2010-12-25
18
第三章
误差及和数据处理
3-5
),四次 例2:测定某药物中钼的含量(µg/g),四次 :测定某药物中钼的含量( ), 测量结果分别为: 测量结果分别为:1.25,1.27,1.31,1.40, , , , , 试问1.40这个数据是否应保留? 这个数据是否应保留? 试问 这个数据是否应保留 先求出除1.40外的数据的平均值和平均 解:先求出除 外的数据的平均值和平均 偏差为 x = 1.28 d =0.023 可疑值与平均值之差绝对值为 ︱1.40-1.28︱=0.12>4 d (0.092) 应舍去。 故1.40应舍去。 应舍去
2
二、总体平均值的估计 1、已知总体标准偏差 时 已知总体标准偏差σ时
µ = x± uσ
µ = x ± uσ x = x ± u
2010-122010-12-25
σ
n
3
2、已知样本标准偏差s时 已知样本标准偏差s t分布是有限测定数据及其随机误差的分布 分布是有限测定数据及其随机误差的分布 规律。 规律。
x-x1 s
xn-x s
(3-37a) )
T=
(3-37b) )
2010-122010-12-25
20
第三章
误差及和数据处理
3-5
根据事先确定的置信度和测定次数查表 3-5。若 T>Tα,n , 说明可疑值对相对平均值的 。 偏离较大,则以一定的置信度弃去可疑值, 偏离较大 , 则以一定的置信度弃去可疑值, 反之则保留。 反之则保留。 在运用格鲁布斯法判断可疑值的取舍时 由于引入了t分布中最基本的两个参数 ,由于引入了 分布中最基本的两个参数 x 和 s,故该方法的准确度较 法高,因此得到普 法高, ,故该方法的准确度较Q法高 遍采用。 遍采用。
对于少量实验数据,可以用 对于少量实验数据,可以用s 代替σ, 代替 , , 代替δ, d 的个别测量值舍去。 因此可以将偏差大于 的个别测量值舍去。 4d 先求出除可疑值外实验数据的平均值和平均偏 然后将可疑值与平均值进行比较, 差 , 然后将可疑值与平均值进行比较 , 如绝对值大 倍平均偏差则可舍去。 于4倍平均偏差则可舍去。 倍平均偏差则可舍去
第三章
误差及数据处理
3-4
注意: 注意:
1. F表以自由度 f 值来划分,故要确定两组 值来划分, 数据的自由度; 数据的自由度; 2. F 表值为单边值,即要求s1 ≥ s2 ,而不能 表值为单边值,即要求s s1 < s2 3. F 表为 P = 95%时的值,当进行双边检验 95%时的值, 时,α值是单边时的两倍,即: P = 90%。 值是单边时的两倍, 90%
2010-122010-12-25
4
µ = x ± tP, f s
µ = x ± tP, f sx = x ± tP, f
2010-122010-12-25
s n
5
第三章 误差及数据处理
3-4 显著性检验
2010-122010-12-25
6
第三章
误差及数据处理
3-4
用统计的方法检验测定值之间是否存在显著 性差异,以此推断它们之间是否存在系统误差, 性差异,以此推断它们之间是否存在系统误差, 从而判断测定结果或分析方法的可靠性, 从而判断测定结果或分析方法的可靠性,这一过 显著性检验。 程称为显著性检验 定量分析中常用的有t 程称为显著性检验。定量分析中常用的有t 检验法 检验法。 和F 检验法。 (一) t 检验法 t 检验法用来检验样本平均值与标准值或两 组数据的平均值之间是否存在显著性差异,从而 组数据的平均值之间是否存在显著性差异, 对分析方法的准确度作出评价( 对分析方法的准确度作出评价(是否存在系统误 差)。
解:
F=
0.12 0.10
2 2
= 1.44
n1 = 5,f1 = 4; n2 = 4,f2 = 3 ;s2 > s1 ,f大 = 3, f小 = 4 查得 F表 ( F3,4)= 6.59 > F计,即两方法的精密度无显 著 差异。 差异。
2010-122010-12-25
14
第三章: 第三章:误差及数据处理
2010-12-25 17
第三章
误差及和数据处理
3-5
法简单,不必查表, 法简单,不必查表,但计算却颇不容 其处理方法在理论上是不严格的, 易。其处理方法在理论上是不严格的,方 法应用也有局限性。其结果与Grubbs(T) 法应用也有局限性。其结果与 ( 检验法矛盾时,以后两法为准。 检验法及Q检验法矛盾时,以后两法为准。
2010-12-25 16
第三章
误差及和数据处理
3-5
一、 4d 法
根据正态分布规律,偏差超过3σ 根据正态分布规律,偏差超过 的个别测量值 出现的概率小于0.3%,故这一测量值可以舍去。 因 出现的概率小于 , 故这一测量值可以舍去。 大于4 的个别测量值也可以舍去。 为δ=0.8σ,大于 δ的个别测量值也可以舍去。
3-4
2、两组平均值的比较
x1 − x2 t= s
(3-34)
n1n2 n1 + n2
( n1 − 1) s + (n2 − 1) s2 S= n1 + n2 − 2
2 1
2
(3-35)
在一定置信度时,查出表值tP,f,若t <tP,f, 在一定置信度时,查出表值 说明两个平均值不存在系统误差, 说明两个平均值不存在系统误差,可以认为 两个平均值属于同一总体.若t > tP,f,说明两 两个平均值属于同一总体. 个平均值不属于同一总体, 个平均值不属于同一总体,两组平均值之间 存在着系统误差. 存在着系统误差.
上节课回顾
3-3 分析化学中的数据处理
一、随机误差的正态分布
2010-122010-12-25
1
第三章
误差及数据处理
3-3
|u| 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
2010-122010-12-25
表3-2 正态分布概率积分表 |u| |u| 面积 面积 面积 0.0000 1.1 0.3643 2.2 0.4821 0.0398 1.2 0.3849 2.2 0.4861 0.0793 1.3 0.4032 2.3 0.4893 0.1179 1.4 0.4192 2.4 0.4918 0.1554 1.5 0.4332 2.5 0.4938 0.1915 1.6 0.4452 2.58 0.4951 0.2258 1.7 0.4554 2.6 0.4953 0.2580 1.8 0.4641 2.7 0.4965 0.2881 1.9 0.4713 2.8 0.4974 0.3159 1.96 0.4950 3.0 0.4987 0.3413 2.0 0.4773 ∞ 0.5000
2010-122010-12-25 9
注意: 注意:
比较两组平均值有无显著性差异时, 比较两组平均值有无显著性差异时, 应首先用 F 检验法检验两组数据精密度 s1 之间有无显著性差异, 和 s2 之间有无显著性差异,如证明它们之 间无显著性差异, 间无显著性差异,才可以用 t 检验法检验两 组平均值有无显著性差异。 组平均值有无显著性差异。
2010-122010-12-25
11
第三章
误差及数据处理
3-4
(二) F 检验法
比较两组数据的方差以确定其精密度是否 存在系统误差. 存在系统误差. 方法简便, 方法简便,只需比较两个标准偏差即可 (s 值大的在分子上以确保 F > 1): 2 S1 F = 2 (3-36) S2 再将该F 值与P64的 比较, 再将该F 值与P64的F表比较,F > F表 则 有显著性差异存在。 有显著性差异存在。
3-5 可疑值取舍
2010-122010-12-25
15
第三章
误差及和数据处理
3-5
平行测定的数据中, 平行测定的数据中,有时会出现一二个与 结 果相差较大的测定值,称为可疑值或异常值。 果相差较大的测定值,称为可疑值或异常值。对于 为数不多的测定数据, 为数不多的测定数据,可疑值的取舍往往对平均值 和精密度造成相当显著的影响。 和精密度造成相当显著的影响。 对可疑值的取舍实质是区分可疑值与其它测定 值之间的差异到底是由过失、还是随机误差引起的。 值之间的差异到底是由过失、还是随机误差引起的。 如果已经确证测定中发生过失, 如果已经确证测定中发生过失,则无论此数据是否 异常,一概都应舍去;而在原因不明的情况下, 异常,一概都应舍去;而在原因不明的情况下,就 必须按照一定的统计方法进行检验, 必须按照一定的统计方法进行检验,然后再作出判 根据随机误差分布规律, 断。根据随机误差分布规律,在为数不多的测定值 出现大偏差的概率是极小的, 中,出现大偏差的概率是极小的,因此通常就认为 这样的可疑值是由过失所引起的,而应将其舍去, 这样的可疑值是由过失所引起的,而应将其舍去, 否则就予以保留。 否则就予以保留。
2010-12-25 19
第三章
误差及和数据处理
3-5
二、格鲁布斯法
将测定值由小至大按顺序排列, 将测定值由小至大按顺序排列 , 其中可 疑值为x 疑值为 1 或 xn 。 先计算该组数据的平均值和 标准偏差,再计算统计量T。 标准偏差,再计算统计量 。 可疑, 若x1可疑,T= 可疑, 若xn可疑,
2010-122010-12-25
10
第三章
误差及数据处理
3-4
进行显著性检验时, 如置信度定得过低, 则容 进行显著性检验时 , 如置信度定得过低 , 易将随机误差引起的差异判断为显著性差异, 易将随机误差引起的差异判断为显著性差异 , 如置 信度定得过高, 信度定得过高 , 又可能将系统误差引起的不一致认 同为正常差异, 从而得出不合理的结论。 同为正常差异 , 从而得出不合理的结论 。 在定量分 析中,常采用0.95或0.90的置信度。 的置信度。 析中,常采用 或 的置信度 在显著性检验中, 将具有显著性差异的测定值 在显著性检验中 , 在随机误差分布中出现的概率称为显著性水平 显著性水平, 在随机误差分布中出现的概率称为显著性水平,用α 表示, 表示 , 即这些测定值位于一定置信度所对应的随机 误差界限之外。如置信度P=0.95,则显著水平 误差界限之外。如置信度 ,则显著水平α=0.05, , 即α=1-P。 。
x-µ t= √n s
(3-33)
2010-122010-12-25
说明与µ之差已超出随机误差的界限 之差已超出随机误差的界限, 若t >tP,f,说明与 之差已超出随机误差的界限, 就可以按照相应的置信度判断它们之间存在显著性 差异(即存在系统误差) 差异(即存在系统误差)。
8
第三章
误差及数据处理
2010-122010-12-25 13
第三章
误差及数据处理
3-4
例1:以两种方法测定碱灰中Na2CO3含量,结果为: 以两种方法测定碱灰中Na 含量,结果为: 方法一 X1=42.34% s1=0.10 n1=5 x x 方法二 X2=42.44% s2=0.12 n2=4 两种方法的精密度是否有显著性差异? 两种方法的精密度是否有显著性差异?
2010-12-25
21
第三章
wenku.baidu.com误差及和数据处理
3-5
表3-5 Tα,n值表
显著性水平( ) 显著性水平( 测定次数 显著性水平(α) 测定次数 显著性水平( α ) n 0.05 0.01 n 0.05 0.01
3 4 5 6 7 8 9 10 11
2010-12-25
1.15 1.46 1.67 1.82 1.94 2.03 2.11 2.18 2.23
2010-122010-12-25 7
第三章
误差及数据处理
3-4
1、平均值与标准值的比较 、 当检验一种分析方法的准确度时, 当检验一种分析方法的准确度时,采用该方法 对某标准试样进行数次测定, 对某标准试样进行数次测定,再将样本平均值与标 进行比较。则根据置信区间的定义可知, 准值 µ 进行比较。则根据置信区间的定义可知,经 次测定后, 过 n次测定后 , 如果以平均值为中心的某区间已经 次测定后 按指定的置信度将真值µ包含在内 包含在内, 按指定的置信度将真值 包含在内 , 那么它们之间 就不存在显著性差异, 分布, 就不存在显著性差异,根据 t 分布,这种差异是仅 由随机误差引起的。 可由下式计算: 由随机误差引起的。t 可由下式计算:
4d
2010-12-25
18
第三章
误差及和数据处理
3-5
),四次 例2:测定某药物中钼的含量(µg/g),四次 :测定某药物中钼的含量( ), 测量结果分别为: 测量结果分别为:1.25,1.27,1.31,1.40, , , , , 试问1.40这个数据是否应保留? 这个数据是否应保留? 试问 这个数据是否应保留 先求出除1.40外的数据的平均值和平均 解:先求出除 外的数据的平均值和平均 偏差为 x = 1.28 d =0.023 可疑值与平均值之差绝对值为 ︱1.40-1.28︱=0.12>4 d (0.092) 应舍去。 故1.40应舍去。 应舍去
2
二、总体平均值的估计 1、已知总体标准偏差 时 已知总体标准偏差σ时
µ = x± uσ
µ = x ± uσ x = x ± u
2010-122010-12-25
σ
n
3
2、已知样本标准偏差s时 已知样本标准偏差s t分布是有限测定数据及其随机误差的分布 分布是有限测定数据及其随机误差的分布 规律。 规律。
x-x1 s
xn-x s
(3-37a) )
T=
(3-37b) )
2010-122010-12-25
20
第三章
误差及和数据处理
3-5
根据事先确定的置信度和测定次数查表 3-5。若 T>Tα,n , 说明可疑值对相对平均值的 。 偏离较大,则以一定的置信度弃去可疑值, 偏离较大 , 则以一定的置信度弃去可疑值, 反之则保留。 反之则保留。 在运用格鲁布斯法判断可疑值的取舍时 由于引入了t分布中最基本的两个参数 ,由于引入了 分布中最基本的两个参数 x 和 s,故该方法的准确度较 法高,因此得到普 法高, ,故该方法的准确度较Q法高 遍采用。 遍采用。
对于少量实验数据,可以用 对于少量实验数据,可以用s 代替σ, 代替 , , 代替δ, d 的个别测量值舍去。 因此可以将偏差大于 的个别测量值舍去。 4d 先求出除可疑值外实验数据的平均值和平均偏 然后将可疑值与平均值进行比较, 差 , 然后将可疑值与平均值进行比较 , 如绝对值大 倍平均偏差则可舍去。 于4倍平均偏差则可舍去。 倍平均偏差则可舍去