分析化学中的数据处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5. μ σ是正态分布方程两个非常重要的参数,可用 N(μ , σ2 )表示正态分布方程。
2019/9/23
7
平均值相同, 精密度不同
2019/9以u表示,令
u
=
x μ σ
得 y=
1
u2
e2
2π
对其进行积分: p 1 .eu2 /2.du 1
2019/9/23
11
u检验:在无系统误差的情况下,检验±u (或单边)范围 内分析结果(或随机误差)出现的概率。
用单次测量值:μ= x±uσ
用平均量值:
x u x u
x
n
并且u检验适用于已知的正态分布方程N(μ,σ2 )
例题p58 8
2019/9/23
12
例题:某炼铁炉中铁水含C量符合正态分布方程( 4.55∽0.1082 ) 现对某日一炉铁水分析5次4.28 4.43 4.42 4.35 4.30, 如果 分析正常(无系统误差),问这炉铁水是否合格(p=95%)
2
说明:(1) 正态分布曲线与横坐标-∞到+∞之间所夹面积, 代表所有数据出现的几率总和其值等于1
(2) 若改变积分区间,可得围成的不同面积。
2019/9/23
9
随机误差在某一区间出现的概率,可以取不同的u值进行积分. 68.3%
-∞ -3 -2 -1 0 1 2 3 +∞
u
=
x μ σ
n
∞
x μ 正态分布 u = σ
2019/9/23
14
t分布曲线与正态分布曲线相似, t分布曲线下一定区间内的积 分面积就是该 区间内随机误差或测量值出现的概率, t分布曲 线不仅随t值改变还与f有关。
P61表3-3列出不同f值及p值所对应的tα,f 值 f(自由度): f=n-1 P(置信度): 指在某一t值下,测定值落在(μ±ts) 范围内的概率. α(显著性水准): α=1-P, 指测定值落在(μ±ts) 范围之外的概率.
5
二、正态分布曲线
(一) 正态分布方程(高斯分布)
( x )2
e y f ( x) 1
2 2
2
y: 概率密度 x: 测量值
σ
-
+
μ: 总体平均值 σ : 总体标准偏差
-∞
x +∞
0 说明:
1. x = μ时,y值最大, 对应于正态分布曲线的最高点,
此时误差等于零;μ代表了数据的集中趋势。
如:t0.05 ,10 =2.23表示95%置信度,自由度为10的t值(2.23)
t0.01 ,8 =3.36…… 99%……………………..8…… (3.36)
2019/9/23
15
二、平均值的置信区间(分析结果的表示方法)
μ x t ,f .S
总体平均值
n
置信区间
X — 测得数据的平均值
2019/9/23
2
三、 偏差 平均值
总体(无限次测量)
lim n
1 n
xi
平均偏差
xi
n
标准偏差
( x )2
i
n
平均值标准偏差 平均值平均偏差
2019/9/23
σ
σ
x
n
x
n
样本(有限次测量)
x xi
n
d xi x
n
( x x)2
n — 测量次数
S — 标准偏差
tα,f — 表值
表示在一定置信度下,以平均值 X 为 中心,
包括总体平均值μ的范围.
2019/9/23
16
对某未知试样中Cl-%测定4次,47.64% 47.69% 47.52% 47.55%计算置信度90% 95% 99%时, 总体平均值μ置信区间
2019/9/23
6
2. 曲线以x=μ这点的垂线为对称轴,说明正负误差 出现的几率相等。
3. 当x +∞或x -∞曲线以x轴为渐近线,说明小误差 出现的几率大,很大误差出现的几率很小,趋近于零。 1
4. 当x=μ时 ymax = σ 2π ,σ 越大y越小,曲线越平坦
测得数据越分散,反之则相反。 σ代表了数据的离散程度
§1 总体、样本、偏差
分析化学中的 数据处理 §2 偶然误差的正态分布
§3 少量数据的统计处理
2019/9/23
1
§1 总体、样本、偏差
一、总体: 对于所考察对象的全体称为总体 二、样本:
自总体中随机抽出一部分供分析用的试样称为样本; 样本中所含测量值的数目称为样本大小(样本容量) 它能回答总体的含量。
(x=μ+uσ)
2019/9/23
10
随机误差出现区间
u=±1 u=±1.96 u=±2 u=±2.58 u=±3
测量值出现区间
x=μ±1σ x=μ±1.96σ x=μ±2σ x=μ±2.58σ x=μ±3σ
概率
68.3% 95.0% 95.5% 99.0% 99.7%
说明:若是求测量值在±u区间出现的概率,p57表值×2 因为它列出是u 的单边。若是求0到+u或-u区间出现 概率,为单边区间不用乘2
s
i
n1
S
S
x
n
d dx
n
3
说明:(1)对测量次数很多, 统计学证明δ=0.80σ (2)在有限次测量中, 增加测量次数可提高精密度 一般平行测定3-4次;要求高精密测量,可测 5-9次。
2019/9/23
4
§2 偶然误差的正态分布
一、频数分布
有一矿石试样在相同条件下, 用AAS法测定其Cu%, 得如下 数据:1.36 1.41 1.44 1.37 1.39 1.46 1.37 1.35 1.42 1.42 1.49 1.36 1.42 1.34 1.46 1.35 1.45 1.47 1.40 1.43 1.37 1.50 1.40 1.38 1.55 1.41 1.46 1.39 1.45…..(100个数)
分一下组(10组)就会发现这些数据既有分散性又有集中性。 位于1.36-1.44%有65个数, 小于1.27%或大于1.55%数据很少。 每组测量值出现的次数称为频数; 出现次数/100为相对频数(概率密度)。
0.12
0.10
0.08
y
0.06
0.04
0.02
0.00
2019/9/23 0 1 2 3 4 5 6 7 8 9 10 x
解 x =4.36
x u计=
n 4.36 4.55 5
0.108
3.93
查表知:p=95%时 u =1.96 表
∵ u计=3.93>u表=1.96
分析结果不在要求的范围内,这炉铁水不合格
2019/9/23
13
§3 少量数据的统计处理
一、t 分布曲线 (有限次测量)
x μ t= S
2019/9/23
7
平均值相同, 精密度不同
2019/9以u表示,令
u
=
x μ σ
得 y=
1
u2
e2
2π
对其进行积分: p 1 .eu2 /2.du 1
2019/9/23
11
u检验:在无系统误差的情况下,检验±u (或单边)范围 内分析结果(或随机误差)出现的概率。
用单次测量值:μ= x±uσ
用平均量值:
x u x u
x
n
并且u检验适用于已知的正态分布方程N(μ,σ2 )
例题p58 8
2019/9/23
12
例题:某炼铁炉中铁水含C量符合正态分布方程( 4.55∽0.1082 ) 现对某日一炉铁水分析5次4.28 4.43 4.42 4.35 4.30, 如果 分析正常(无系统误差),问这炉铁水是否合格(p=95%)
2
说明:(1) 正态分布曲线与横坐标-∞到+∞之间所夹面积, 代表所有数据出现的几率总和其值等于1
(2) 若改变积分区间,可得围成的不同面积。
2019/9/23
9
随机误差在某一区间出现的概率,可以取不同的u值进行积分. 68.3%
-∞ -3 -2 -1 0 1 2 3 +∞
u
=
x μ σ
n
∞
x μ 正态分布 u = σ
2019/9/23
14
t分布曲线与正态分布曲线相似, t分布曲线下一定区间内的积 分面积就是该 区间内随机误差或测量值出现的概率, t分布曲 线不仅随t值改变还与f有关。
P61表3-3列出不同f值及p值所对应的tα,f 值 f(自由度): f=n-1 P(置信度): 指在某一t值下,测定值落在(μ±ts) 范围内的概率. α(显著性水准): α=1-P, 指测定值落在(μ±ts) 范围之外的概率.
5
二、正态分布曲线
(一) 正态分布方程(高斯分布)
( x )2
e y f ( x) 1
2 2
2
y: 概率密度 x: 测量值
σ
-
+
μ: 总体平均值 σ : 总体标准偏差
-∞
x +∞
0 说明:
1. x = μ时,y值最大, 对应于正态分布曲线的最高点,
此时误差等于零;μ代表了数据的集中趋势。
如:t0.05 ,10 =2.23表示95%置信度,自由度为10的t值(2.23)
t0.01 ,8 =3.36…… 99%……………………..8…… (3.36)
2019/9/23
15
二、平均值的置信区间(分析结果的表示方法)
μ x t ,f .S
总体平均值
n
置信区间
X — 测得数据的平均值
2019/9/23
2
三、 偏差 平均值
总体(无限次测量)
lim n
1 n
xi
平均偏差
xi
n
标准偏差
( x )2
i
n
平均值标准偏差 平均值平均偏差
2019/9/23
σ
σ
x
n
x
n
样本(有限次测量)
x xi
n
d xi x
n
( x x)2
n — 测量次数
S — 标准偏差
tα,f — 表值
表示在一定置信度下,以平均值 X 为 中心,
包括总体平均值μ的范围.
2019/9/23
16
对某未知试样中Cl-%测定4次,47.64% 47.69% 47.52% 47.55%计算置信度90% 95% 99%时, 总体平均值μ置信区间
2019/9/23
6
2. 曲线以x=μ这点的垂线为对称轴,说明正负误差 出现的几率相等。
3. 当x +∞或x -∞曲线以x轴为渐近线,说明小误差 出现的几率大,很大误差出现的几率很小,趋近于零。 1
4. 当x=μ时 ymax = σ 2π ,σ 越大y越小,曲线越平坦
测得数据越分散,反之则相反。 σ代表了数据的离散程度
§1 总体、样本、偏差
分析化学中的 数据处理 §2 偶然误差的正态分布
§3 少量数据的统计处理
2019/9/23
1
§1 总体、样本、偏差
一、总体: 对于所考察对象的全体称为总体 二、样本:
自总体中随机抽出一部分供分析用的试样称为样本; 样本中所含测量值的数目称为样本大小(样本容量) 它能回答总体的含量。
(x=μ+uσ)
2019/9/23
10
随机误差出现区间
u=±1 u=±1.96 u=±2 u=±2.58 u=±3
测量值出现区间
x=μ±1σ x=μ±1.96σ x=μ±2σ x=μ±2.58σ x=μ±3σ
概率
68.3% 95.0% 95.5% 99.0% 99.7%
说明:若是求测量值在±u区间出现的概率,p57表值×2 因为它列出是u 的单边。若是求0到+u或-u区间出现 概率,为单边区间不用乘2
s
i
n1
S
S
x
n
d dx
n
3
说明:(1)对测量次数很多, 统计学证明δ=0.80σ (2)在有限次测量中, 增加测量次数可提高精密度 一般平行测定3-4次;要求高精密测量,可测 5-9次。
2019/9/23
4
§2 偶然误差的正态分布
一、频数分布
有一矿石试样在相同条件下, 用AAS法测定其Cu%, 得如下 数据:1.36 1.41 1.44 1.37 1.39 1.46 1.37 1.35 1.42 1.42 1.49 1.36 1.42 1.34 1.46 1.35 1.45 1.47 1.40 1.43 1.37 1.50 1.40 1.38 1.55 1.41 1.46 1.39 1.45…..(100个数)
分一下组(10组)就会发现这些数据既有分散性又有集中性。 位于1.36-1.44%有65个数, 小于1.27%或大于1.55%数据很少。 每组测量值出现的次数称为频数; 出现次数/100为相对频数(概率密度)。
0.12
0.10
0.08
y
0.06
0.04
0.02
0.00
2019/9/23 0 1 2 3 4 5 6 7 8 9 10 x
解 x =4.36
x u计=
n 4.36 4.55 5
0.108
3.93
查表知:p=95%时 u =1.96 表
∵ u计=3.93>u表=1.96
分析结果不在要求的范围内,这炉铁水不合格
2019/9/23
13
§3 少量数据的统计处理
一、t 分布曲线 (有限次测量)
x μ t= S