03第3章误差与数据处理

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

x1 , x2 , x3 ......... xn
x x1 (2)设第一个数据可疑,计算 T计 算 s xn x 或 设第n 个数据可疑,计算
T计 算
s
(3)查表: T计算> T表, 舍弃。
3.Q 检验法 Dixon’s Q-test
(1)将测量的数据按大小顺序排列。 x1 , x2 , x3 ......... xn (2)计算测定值的极差: R =xn‒x1。 (3)计算可疑值与相邻值之差(应取绝对值)d。
设对y 作n 次独立的观测,得到一系列观测值。
( xi , yi ) i 1,2,3......n
根据最小二乘法的原理, 最佳的回归线应是各观 测值yi 与相对应的落在 回归线上的值之差的平 方和(Q)为最小。
一元线性回归方程表 示为 y a bx
y yi
Q
(y
i 1
n
i
a bxi )
b
( xi x )( yi y )
i 1
n

i 1
n
( xi x ) 2
其中
1 n y yi , n i 1
1 n x xi n i 1
相关系数 Correlation coefficient 应怎样估计线性的好坏?——相关系数的问题
判断一元回归线是否有意义,可用相关系数来检验。
三、显著性检验 Significant Test
(1)对含量真值为T 的某物质进行分析, 但 x T 0 得到平均值 x (2)用两种不同的方法、或两台不同的仪器、 或两个不同的实验室对同一样品进行分析,得到 但 x1 x2 0 平均值 x1 , x2 问题:是由随机误差引起,或存在系统误差?
d (4)计算Q值:Q计 算 R
(5)比较: Q计算 Q表 舍弃。
测定次数n Q 0.90 Q 0.95 3 4 5 6 7 8
舍弃商Q值
9 10
0.94 0.76 0.64 0.56 0.51 0.47 0.44 0.41 0.97 0.84 0.73 0.64 0.59 0.54 0.51 0.49
x2 , n2 , s2
1 假设不存在系统误差,有:
2 T
x1 x2 0 是由于随机误差引起的,应满 足自由度 f =(n1 + n2 –2) 的 t 分布,
x1 x2 t计 算 s
2 2 n1 n2 ( n1 1) s1 ( n2 1) s2 s n1 n2 2 n1 n2
2. 当 y 与 x 之间不存在直线关系时,R = 0。 3. 当R 的绝对值在0与1之间时,可根据测量的 次数及置信水平与相应的相关系数临界值比较 ,绝对值大于临界值时,则可认为这种线性关 系是有意义的。
相关系数的临界值表(部分)
f = n-2 1 2 0.10 0.05 0.01 0.001
小结 一、有关误差的一些基本概念 (一)准确度与精密度:x、T、 (二)误差与偏差:E、d、s、RSD%等 (三)系统误差与随机误差:辨别、减免 (五)有效数字:正确给出分析结果
二、随机误差的分布: 规律、区间概率、x、 y、μ、σ、x‒μ、u、p、 有限数据的统计处理 • 集中趋势: • 分散程度: 偏差 •平均值的置信区间: σ ‒ u 、 s – t
例题:某炼铁厂生产的铁水,从长期经验知道它的碳含量服从 正态分布,T为4.55%,为0.08%。现在又生产了5炉铁水, 其碳含量分别为4.28%,4.40%, 4.42%, 4.35%, 4.37%。试问 均值有无变化?(给定 = 0.05) 解 假设: = T
x (4.28 4.40 4.42 4.35 4.37) / 5 4.36(%)
u计算
查表
x
x

x

n

4.36 4.55 0.08 5
5.3
u0.05 1.96
比较:
u计算 u表
结论:均值比原来的降低了。(表明生产过程有差异) 问题:如果分析方法存在系统误差,这个结果可靠吗?
(二)两组测量结果的比较 两个实验室对同一标样进行分析,得到:
x1 , n1 , s1 和
查表 ta,f t0.05,5 2.57 说明 和T 有显著差 比较: t计算 t表 异,此测定有系统误 差。
2. u 检验法( 已知) (1) 提出假设: μ = μ0 (2) 给定显著水平α (3) 计算 x 0
u计

n
(4) 查u 表,若 u计 > u , 否定假设, 即μ 与μ0 有显著差异, 测定存在系统误差.
2. t 检验 (给定 = 0.05)
x1 x2 t计算 sp n1 n2 1.36 t0.05 (7) 2.37 n1 n2
两种方法不存在系统误差。
四、异常值的检验 Outlier rejection 1. 4 d 法
统计学方法证明,当测定次数非常多(如n20),总 体标准偏差与总体平均偏差有关系 0.80
0.988 0.997 0.9998 0.999999 0.900 0.950 0.990 0.999
3
0.805 0.878
0.959
0.991
例:做了一条工作曲线,测量次数 n = 5, R = 0.920, 因变量与自变量之间有无相关性 (置信度95%)?
解: f = 5 – 2 = 3, = 0.05, 查表 R0 = 0.878, R > R0, 有相关性
3
4 5 6
20.0
30.0 40.0 试样
0.140
0.175 0.236 0.200
A
¨È Å ¶ £ ¨ug / mL)
1.每个测量值都有误差,标准曲线应怎样作才合理? 2.应怎样估计线性的好坏?
线性回归 Linear regression
最小二乘法 method of least squares
六、测定方法的选择与测定准确度的提高
1. 选择合适的分析方法:根据待测组分的含 量、性质、试样的组成及对准确度的要求 选方法; 2. 减小测量误差:取样量、滴定剂体积等; 3. 平行测定4~6次,使平均值更接近真值; 4. 消除系统误差: (1) 显著性检验确定有无系统误差存在. (2) 找出原因, 对症解决.
源自文库显著性检验
x T 0
x1 x2 0
显著性 检验
显著性差异
非显著性差异
系统误差
校正
正常
随机误差
(一)平均值与标准值的比较
1.t 检验法
假设不存在系统误差, T x T 0 是由随机误差引起的,测量误差
应满足t 分布, t x / s x
步骤: ① 根据 x , T , s, n 算出t 值; ② 给出显著性水平或置信度 ③ 将计算出的t 值与表上查得的t 值进行比较, 若 t计
查表 n = 6 , Q表 = 0.56
舍弃
五、 标准曲线及线性回归
标样浓度 吸收 No. 值 g / L 1 5.00 0.045 2 10.0 0.093
ê × ± ¼ ¹ ¤÷ ×ú Ç Ï ß
0.400 0.300 0.200 0.100 0.000 0.0 10.0 20.0 30.0 40.0 50.0 y = 0.0056x + 0.0161 R 2 = 0.984
f n1 n2 2
第四步:比较 t计算 t表
非显著差异,无系统误差
置信度95%时部分F值(单边) 置信度90%时部分F值(双边)
f大 f小 2 3 4 5 6 2 19.00 9.55 6.94 5.79 5.14 3 19.16 9.28 6.59 5.41 4.76 4 19.25 9.12 6.39 5.19 4.53 5 19.30 9.01 6.16 5.05 4.39 6 19.33 8.94 6.09 4.95 4.28
例:测定碱灰总碱量(%Na2O)得到6个数据,按 其大小顺序排列为40.02,40.12,40.16,40.18, 40.18,40.20。第一个数据可疑,判断是否应舍弃? (置信度为90%)。
解 1. 4d 法 2. 格鲁布斯(Grubbs)法 3.
40.12 40.02 Q计 算 0.56 40.20 40.02
第一步: F 检验—比较两组的精密度有无显著差异
F计 算
2 s大 2 s小
查表
F计算 F表 精密度无显著差异。
第二步:t 检验确定两组平均值有无显著性差异 2 2 x1 x2 n1 n2 ( n1 1) s1 ( n2 1) s2 t计 算 s s n1 n2 n1 n2 2 第三步:查表 t表 ta ( f ),
t表
表明有系统误差存在。
½
0
拒绝域 接受域
½
拒绝域
-u
u
拒绝域和接受域
例题
某化验室测定CaO的质量分数为30.43%的某样品 中CaO的含量得出结果:n 6, x 30.51%, s 0.05% 问此测定有无系统误差?(给定 = 0.05) 解
假设: = T
x x 30.51 30.43 t计算 3.9 sx s n 0.05 6
2
x
Q ( yi a bxi ) 2
i 1
n

n Q 2 xi ( yi a bxi ) 0 b i 1 n Q 2 ( yi a bxi ) 0 a i 1
解得
a
yi b xi
i 1 i 1
n
n
n
y bx ,

用两种方法测定w(Na2CO3)
方法1 n1 = 5 x1 = 42.34% s1 = 0.10%
方法2 n2 = 4 x2 = 42.44%, s2 = 0.12%
解: 1. F 检验 (给定 = 0.10)
F计算
2 s大 2 =0.122/0.102=1.44 s小
F计<F0.05(3,4)=6.59, σ1 和σ2 无显著差异;
(1)求可疑值除外其余数据的平均值和平均偏差 ;
4 3,偏差超过4 的测量值可以舍弃(概率 0.3%)。
d n1 (2)求可疑值x与平均值 xn 1 之差的绝对值
xn 1
x xn1
(3)判断 x xn1 4d n1
2.
格鲁布斯(Grubbs)法
(1)将测量的数据按大小顺序排列。
三、显著性检验: u 检验法、t 检验法、F检验 +t 检验法 4d 法、格鲁布斯法 四、离群值的取舍: Q检验法、 五、提高分析准确度的方法
作业: p75: 4, 9, 12
相关系数的定义为:
2 ( x x ) i n
Rb
(y
i 1
i 1 n

(x
i 1 n i 1
n
i
x )( yi y )
n
i
y)
2
2 2 ( x x ) ( y y ) i i i 1
相关系数的意义
y x R=1
y
R = ‒1 x
y
x
R=0
1. 当所有的 yi 值都在回归线上时,R = 1。
相关文档
最新文档