分析化学中的数据处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分一下组(10组)就会发现这些数据既有分散性又有集中性。
位于1.36-1.44%有65个数, 小于1.27%或大于1.55%数据很少。 每组测量值出现的次数称为频数; 出现次数/100为相对频数(概率密度)。
0.12
0.10
0.08
0.06
y
0.04
0.02
0.00
2017/10/11
0
1
2
3
4
5
6
2017/10/11
2
三、
偏差 平均值
总体(无限次测量)
lim x i
n
样本(有限次测量)
1 n
i
x
d
x
n
i
平均偏差
x n
( x )2 i n
x x
i
n
( x x )2 i n1
标准偏差 平均值标准偏差 平均值平均偏差
2017/10/11
t 计=
∴ 有显著性差异,新方法存在系统误差
2017/10/11
22
2005年中科院考研题(10分) 电分析法测定某患者血糖的浓度(mmol/L)10次测定结果: 7.5 7.4 7.7 7.6 7.5 7.6 7.6 7.5 7.6 7.6.
求(1)相对标准偏差(RSD)
(2)置信区间(p=95%) (3)正常人血糖标准值为6.7mmol/L, 问此人血糖是否异常
概率,为单边区间不用乘2
2017/10/11 11
u检验:在无系统误差的情况下,检验±u (或单边)范围 内分析结果(或随机误差)出现的概率。
用单次测量值:μ= x±uσ 用平均量值:
x u x x u
n
并且u检验适用于已知的正态分布方程N(μ,σ2 )
例题p58
8
2017/10/11
2 ( x x ) i S 0.08% n1
95%
99%时,
解: X=47.60%
P=90%,t0.10,3=2.35
P=95%,t0.05,3=3.18 P=99%,t0.01,3=5.84
2017/10/11
x
t , f . S n
(47.60 0.09)%
(47.60 0.13)%
查表知:p=95%时
u 表 =1.96
∵ u计=3.93>u表=1.96
分析结果不在要求的范围内,这炉铁水不合格
2017/10/11 13
§3
少量数据的统计处理
x μ 正态分布 u = σ
一、t 分布曲线 (有限次测量)
x μ n t= S
∞
2017/10/11
14
t分布曲线与正态分布曲线相似, t分布曲线下一定区间内的积 分面积就是该 区间内随机误差或测量值出现的概率, t分布曲 线不仅随t值改变还与f有关。 P61表3-3列出不同f值及p值所对应的tα,f 值 f(自由度): f=n-1
§1 总体、样本、偏差
分析化学中的
数据处理
§2 偶然误差的正态分布 §3 少量数据的统计处理
2017/10/11
1
§1
总体、样本、偏差
一、总体: 对于所考察对象的全体称为总体 二、样本:
自总体中随机抽出一部分供分析用的试样称为样本;
样本中所含测量值的数目称为样本大小(样本容量) 它能回答总体的含量。
∴ 两组数据的精密度无显著性差异
( n1 1) S12 ( n2 1) S 22 0.11 t检验: S 合= n1 n2 2
2017/10/11 30
t 计=
x1 x 2 S合
n1 .n2 1.49 n1 n2
知f总=n1+n2-2=7 查表t0.10,7=1.90 >t计 说明两组数据的平均值无显著性差异
2017/10/11 15
二、平均值的置信区间(分析结果的表示方法)
μ x
总体平均值
t ,f .S n
置信区间
X — 测得数据的平均值 S — 标准偏差
n — 测量次数 tα,f — 表值
表示在一定置信度下,以平均值 X 为 中心,
包括总体平均值μ的范围.
2017/10/11 16
对某未知试样中Cl-%测定4次,47.64% 47.69% 47.52% 47.55%计算置信度90% 总体平均值μ置信区间
解:(1)
x 7.6
2 ( x x ) i S 0.084 n1
S 0.084 RSD 100% 100% 1.1% 7.6 x
2017/10/11 23
(2) x
t , f . S n
(7.6 0.1)mmol / L
(3) t 计
P(置信度): 指在某一t值下,测定值落在(μ±ts) 范围内的概率.
α(显著性水准): α=1-P, 指测定值落在(μ±ts) 范围之外的概率. 如:t0.05 ,10 =2.23表示95%置信度,自由度为10的t值(2.23) t0.01 ,8 =3.36…… 99%……………………..8…… (3.36)
2017/10/11 25
例题:甲、乙二人对同一试样用不同方法进行测定: 甲:1.26, 1.25, 1.22 乙:1.35, 1.31, 1.33, 1.34
问两种方法的精密度之间有无显著性差异?
解:n甲 = 3 n乙 = 4
x甲 1.24
S甲 = 0.021
S乙 = 0.017
x乙 1.33
说明:查p61中表tα,f
f=n1+n2-2(总自由度)
2017/10/11
29
例题:用两种方法测得Na2CO3% 方法一、 n1=5 方法二、 n2=4 x1=42.34 x2=42.44% S1=0.10 S2=0.12
问两组数据的平均值是否有显著性差异(p=90%)
2 S大 0.12 2 解: F计= 2 = 1.44 < 查表F3,4=6.59 2 S小 0.10
2 偏差平方和 (n1 1) S12 (n2 1) S 2 S合= = 总自由度 n1 n2 2
再进行 t 计=
2017/10/11
x1 x 2 S合
n1 .n2 n1 n2
28
若t计≥t表说明两组数据的平均值有显著性差异
若t计<t表 ………………………..无…………….
x S
n 33.88
>t表=2.26
存在显著性差异, 此人血糖有异常。
2017/10/11
24
2. F检验
检验来自同一总体两组测量值的精密度有无显著性差异
设:
Байду номын сангаас甲 乙
n1 次 n 2次
x1 x2
S1=0.037 S2=0.040
2 S大 F计 2 ≥F表 有显著性差异(表P64) S小
<F表 无显著性差异
1 u 2 / 2 .e .du 1 2
说明:(1) 正态分布曲线与横坐标-∞到+∞之间所夹面积, 代表所有数据出现的几率总和其值等于1
(2) 若改变积分区间,可得围成的不同面积。
2017/10/11 9
随机误差在某一区间出现的概率,可以取不同的u值进行积分.
68.3%
-∞
-3 -2 -1
F计算
2 S大 (0.021) 2 2 1.53 < 查表F2,3=9.55 2 S小 (0.017 )
说明两组的精密度无显著性差异(p=90%)
2017/10/11 26
说明:判断某组数据的精密度是否大于、等于、小于或
者优于另一组数据的精密度为单边(α=0.05 p=95%); 若
判断两组数据的精密度有无显著性差异为双边(α=0.10
(47.60 0.23)%
17
说明:要求的p不同,包括总体平均值μ的范围不同。
置信度越高(p越大),置信区间越宽即所估计的区间
包括μ的可能性就越大; p越小, 置信区间越窄, 精密 度好但可靠性差即包括μ的可能性就小。所以我们
即要考虑到可靠性又要考虑到置信区间, 一般在分
析工作中选p=95%或p=90%.
2017/10/11 19
1. t检验
在一定的置信度下, 检验一组测量值在测量过程中有无系统 误差;也可检验一种分析方法是否存在系统误差;或者与
标准值比较是否存在显著性差异。
t计=
x S
n
同tα,f表值进行比较
若t计<t表 说明无显著性差异,不存在系统误差 若t计≥t表 说明有显著性差异,存在系统误差
5. μ σ是正态分布方程两个非常重要的参数,可用 N(μ , σ2 )表示正态分布方程。
2017/10/11 7
平均值相同, 精密度不同
2017/10/11
8
三、偶然误差的区间概率
x μ 将正态分布曲线横坐标以u表示,令 u = σ
得 y=
1 2π
e
u2 2
对其进行积分: p
2017/10/11 6
2. 曲线以x=μ这点的垂线为对称轴,说明正负误差
出现的几率相等。
3. 当x
+∞或x
-∞曲线以x轴为渐近线,说明小误差
1
出现的几率大,很大误差出现的几率很小,趋近于零。
4. 当x=μ时 ymax = σ 2π ,σ 越大y越小,曲线越平坦
测得数据越分散,反之则相反。
σ代表了数据的离散程度
2017/10/11 18
三、显著性检验
在实际工作中往往会遇到下列几种情况: a. 某一分析人员对标准试样进行多次分析, 所得平均值与
标准值进行比较存在差异
b. 采用两种不同的方法, 分析同一试样所得两组数据的平均 值有差异 c. 两个不同的分析人员或不同实验室, 对同一试样进行分析 所得结果也存在差异 判断是系统误差引起的还是偶然误差引起的要 进行t检验和F检验。
7
8
9
10
x
5
二、正态分布曲线
(一) 正态分布方程(高斯分布)
y f ( x) 1
2
e
( x )2 2 2
σ
+
y: 概率密度 μ: 总体平均值
x: 测量值 σ : 总体标准偏差 -∞
x
+∞
说明:
0
1. x = μ时,y值最大, 对应于正态分布曲线的最高点, 此时误差等于零;μ代表了数据的集中趋势。
s
σ σx n
S Sx n
x n
d dx n
3
说明:(1)对测量次数很多, 统计学证明δ=0.80σ
(2)在有限次测量中, 增加测量次数可提高精密度 一般平行测定3-4次;要求高精密测量,可测 5-9次。
2017/10/11
4
§2
一、频数分布
偶然误差的正态分布
有一矿石试样在相同条件下, 用AAS法测定其Cu%, 得如下 数据:1.36 1.41 1.44 1.37 1.39 1.46 1.37 1.35 1.42 1.42 1.49 1.36 1.42 1.34 1.46 1.35 1.45 1.47 1.40 1.43 1.37 1.50 1.40 1.38 1.55 1.41 1.46 1.39 1.45…..(100个数)
2017/10/11 20
2000年中科院考题(10分) 采用一种新的分光光度法测定不锈钢中Ni%结果:
1.56
1.40
1.48
1.42 1.46 1.48 已知标样中Ni含量
的标准值为1.40,当置信度95%时 问(1) 求出测量结果的置信区间
(2) 新方法是否存在系统误差
解:(1)
x 1.47%
12
例题:某炼铁炉中铁水含C量符合正态分布方程( 4.55∽0.1082 ) 现对某日一炉铁水分析5次4.28 4.43 4.42 4.35 4.30, 如果 分析正常(无系统误差),问这炉铁水是否合格(p=95%)
解
x =4.36
u计=
x
n
4.36 4.55 5 0.108
3.93
p=90%)
2017/10/11
27
3. 检验来自同一总体两组数据的平均值是否存在显著性差异 (先F检验,再进行t检验)
2 S大 a.先通过F检验若F计= 2 <F表 说明两组数据的精密度无 S小
显著性差异, 再进行t检验。否则存在显著性差异。 b.通过F检验后,S1与S2无显著性差异;求它们的合并偏差
P=95%查表,
( x x) S 5.6 10 %
2 i 2
n1
t0.05,5=2.57
x
2017/10/11
t , f . S n
(1.47 0.06)%
21
(2) t检验
x S 1.47 1.40 n 6 3.06 >t表=2.57 2 5.6 10
0
1
2
3
+∞
x μ u= σ
2017/10/11
(x=μ+uσ)
10
随机误差出现区间 u=±1
u=±1.96
测量值出现区间 x=μ±1σ
x=μ±1.96σ
概率 68.3%
95.0%
u=±2
u=±2.58
x=μ±2σ
x=μ±2.58σ
95.5%
99.0%
u=±3
x=μ±3σ
99.7%
说明:若是求测量值在±u区间出现的概率,p57表值×2 因为它列出是u 的单边。若是求0到+u或-u区间出现