第二章 分析化学中的数据处理
分析化学中的数据处理
分析化学中的数据处理分析化学中的数据处理是指针对实验数据进行整理、统计、分析和解释的一系列过程。
对数据进行适当的处理能够提取出更有意义的信息,从而为后续的研究和实验提供有效的支持。
下面将从数据处理的步骤、常用方法和应用领域等方面进行详细展开。
数据处理的步骤通常包括数据整理、数据检查、数据统计和数据分析等过程。
首先,数据整理是将实验数据进行归类、清理和排序的过程,以便后续的操作和分析。
其次,数据检查是指对数据进行质量控制,包括检查数据的完整性、准确性和可靠性等方面。
第三,数据统计是指对数据进行一定分组、计数和总结等统计分析的过程,从而得到特定指标和特征的统计结果。
最后,数据分析是指对统计结果进行解释和推理,从而得出一定的结论和判断。
在实际的数据处理中,常用的方法包括描述统计方法、回归分析方法、因子分析方法和聚类分析方法等。
描述统计方法主要用于对数据的中心趋势、离散程度和分布特征等进行描述和总结,常用的统计指标包括均值、中位数、标准差等。
回归分析方法主要用于研究两个或多个变量之间的关系,可通过拟合线性或非线性模型进行分析。
因子分析方法则用于确定一组变量之间的潜在关系,并提取出影响变量的主成分。
而聚类分析方法则用于对一组数据进行分类和归类,以找出相似性较高的样本或因素。
分析化学中的数据处理广泛应用于样品分析、光谱分析、色谱分析和电化学分析等领域。
在样品分析中,数据处理可以帮助提取出目标物质的浓度或含量信息,并估计分析结果的可靠性和准确性。
在光谱分析中,数据处理可以对光谱数据进行寻峰、峰面积计算和谱图解析等,以获得有关物质结构和组成的信息。
在色谱分析中,数据处理可以用于峰识别、峰分离和峰面积计算等,从而确定样品中的目标物质和杂质。
在电化学分析中,数据处理可以用于电流-电位曲线的拟合和分析,以确定反应的机理和动力学参数。
2第二章、分析化学中的数据处理2
X
样本容量为n的一组测量数据的算数平均值 X 为:
3 中位数(median) Xm
一组测量数据按大小顺序排列,中间一个数据即 为中位数Xm。当测量值的个数为偶数时,中位数 为中间相邻两个测量值的平均值。
4.误差(error):测定结果(X)与真实值(XT)之间的 差值称为误差(E)
Ei = Xi - XT Xi > XT , Ei >0 Xi > XT , Ei >0 ,正误差 ,负误差
例:A、B、C、D四个分析人员对同一铁标样 (WFe=37.40%)中的铁含量进行测量,结果如图示,比 较其准确度和精密度? A、精密度低,准确度低 B、精密度高,准确度低 C、精密度高,准确度高 D、精密度低,准确度高
但不可靠
准确度与精密度的关系
1.精密度好是准确度好的前提; 2.精密度好不一定准确度高
x
i 1
n
i
x 100%
nx
8.标准偏差:s
s
x x
n i 1 i
2
n 1
9.相对标准偏差:RSD
s RSD 100% x
10. 极差(range) (R) 一组数据中有Xmax 和 Xmin 两值之差,又称全距或范围 误差(range error) R = Xmax - Xmin 11.相对极差(relative range):R/ X ×100%
• 2、精密度(precision) 精密度表征几次平行测量值相互符合 程度。精密度的高低用偏差来衡量。平行 测定所得数据间差别越小,则分析结果的 精密度越高。(Precicion is measure of the reproducibility)
• 3、精密度与准确度的关系(the relationship of precision and accuracy) 精密度高, 准确度不一定高,因为此时可能存 在较大的系统误差,例如P43图3-1中的 “乙”。 准确度高,一定要求精密度高,精密度是保证 准确度的先决条件, 精密度低说明所测结 果不可靠,自然失去了衡量准确度的前提
第二节分析化学中的数据处理
1. 概念:一个数据中所有确定的数字再加一位不定数字。
确定的数字:指某一量经多次测定的结果,总是固定不变 的数字。 例如:三次称量Na2CO3 (g)为0.3561、0.3562、0.3560 有效数字的最后一位可疑数字,可能有±1个单位的误差
二、有效数字的位数
质量 分析天平(称至0.1 mg): 12.8218 g (6)、0.2338 g (4)、0.0500 g (3)
4、相对误差或标准偏差只需保留1~2位
5、化学平衡计算中,平衡浓度一般保留2位有效数字
6、分析结果的一般表示法,
组分含量>10%, 要求4位 (化学分析)
组分含量1%~10% 要求3位 (仪器分析)
<1%
2位
7、改变单位不能任意改变有效数字的位数
19.82 mL (4)
0.01982 L (4)
四、运算规则:计算结果中只能有一位可疑数字
d 1 n | d | 1 n | x x |
n i1
n i1
相对平均偏差 d 100 % x
例如:测定NaCl试样中氯的质量分数,6次测量值分别为 0.6012,0.6018,0.6030,0.6045,0.6020018 0.6030 0.6045 0.6020 0.6037 6
举例
1.0008 0.1000 0.0382
54 0.05 3600
43181 10.98% 1.98×10-10 0.0040 2×105
3/2
5位 4位 3位 2位 1位 不确定
数据中“0”是否为有效数字
(1)只起到定位作用,不算,
例如: 0.0382,
0.05
(2) 作为普通的数字使用,算,
分析化学2第二章 分析化学中的误差和数据处理
误差的客观性: 误差是客观的,是不以人的意志而改变的。
根据误差的性质与产生的原因,可将误差 分为系统误差、偶然误差两类。
三、系统误差和随机误差
1.系统误差
也叫可测误差,它是由于分析过程中某 些经常发生的、比较固定的原因所造成的。 系统误差的性质是:
一、 有效数字
4.与实验有关的注意点
(2)称量仪器 分析天平即万分之一天平(称至0.1mg): 12.8212g, 0.2338g,1.4562g,0.0561g 千分之一天平(称至0.001g): 0.234g,1.356g,10.324g 百分之一天平(称至0.01g): 1.26g,0.23g,14.26g 台秤(称至0.1g):4.0g,0.5g,16.8g
X>XT,误差为正值,表示测定结果偏高; X<XT,误差为负值,表示测定结果偏低。
E越小,表示测定结果与真实值越接近, 准确度越高;反之,E越大,准确度越低。
可见,误差的大小是衡量准确度高低的尺度。
二、准确度和精密度
2. 精密度
在实际工作中,真实值通常是不知道的,因此
无法求出分析结果的准确度,所以不得不用另一种
使用相对平均偏差表示分析结果的好坏比较简 单,但这个方法有不足之处,因为在一系列的测 定中,小偏差的测定总是占多数,而大偏差的测 定总是占少数,按总的测定次数求相对平均偏差 所得的值偏小,大偏差得不到充分的反映。所以 相对平均偏差在数理统计上一般不采用。
近年来,在分析化学的教学中,越来越广泛地 采用数理统计方法来处理各种测定数据。
方式来判断分析结果的好坏。这种方法是:在相同
的条件下重复测定多次,然后计算n次测定结果的
分析化学:第二章_误差和分析数据处理二
化学分析
第二章 误差和分析数据处理
4
• 对于很小的数字,可用指数形式表示。例如,离 解常数Ka=0.000018,可写成Ka=1.8×10-5;很大的 数字也可采用这种表示方法。例如2500L,若为 三位有效数字,可写成2.50×103L。
• 例如,0.0121×25.64×1.0578=0.328,其中,有 效数字位数最少的0.0121相对误差最大,故计 算结果应修约为三位有效数字。
化学分析
第二章 误差和分析数据处理
11
• 3. 百分数表示 • 高含量组分(>10%),保留四位有效数字; • 中含量组分(1~10%),保留三位有效数字; • 低含量组分(<1%),保留两位有效数字。 • 4. 其他运算 • 乘方或开方,结果的有效数字位数不变,
化学分析
第二章 误差和分析数据处理
19
3.正态分布曲线规律:
• (1) x=μ时,y值最大,体现了测量值的集中趋 势。说明误差为零的测量值出现的概率最大。 大多数测量值集中在算术平均值的附近。
• (2) 曲线以x=μ这一直线为其对称轴,说明绝对 值相等的正、负误差出现的概率相等。
• (3) 当x趋于-∞或+∞时,曲线以x轴为渐近线。 即小误差出现概率大,大误差出现概率小。
化学分析
第二章 误差和分析数据处理
5
• 对pH、pM、lgc、lgK等对数值,其有效数字的
位数仅取决于小数部分数字的位数,整数部分 只说明其真数的方次。如pH=11.02,即[H+]= 9.6×10-12mol/L,其有效数字为两位而非四位。
分析化学第二章误差与分析数据处理
根据待测组分的性质和含量选择合适的分析 方法。
空白实验
通过扣除空白值来减小误差。
标准化样品分析
使用标准样品对实验过程进行质量控制。
回收率实验
通过添加已知量的标准物质来评估分析方法 的准确性。
04
有效数字及其运算规则
有效数字的定义与表示
01
有效数字是指测量或计算中能够反映被测量大小的部分数字 ,其位数与被测量的精密度有关。
数据统计
计算平均值、中位数、众数等统计量,以反映数据的集 中趋势和离散程度。
实验结果的评价与表达
误差分析
计算误差、偏差、相对误差 等,评估实验结果的可靠性
。
1
精密度与偏差
通过多次重复实验,评估实 验结果的精密度和偏差。
置信区间
根据实验数据,计算结果的 置信区间,反映结果的可靠 性。
结果表达
选择合适的单位和量纲,将 实验结果以表格、图表等形 式表达,便于分析和比较。
02
表示有效数字时,需保留一位不确定位,采用指数或修约的 形式表示。
03
有效数字的表示方法:科学记数法(a x 10^n)或一般表示法。
有效数字的运算规则
加减法
以小数点后位数最少的数字为标准,对 其他数字进行修约,然后再进行运算。
乘方和开方
运算结果的有效数字位数与原数相同。
乘除法
以有效数字位数最少的数为标准,对 其他数字进行修约,然后再进行运算。
THANKS
准确度检验
通过标准物质或标准方法对比,检验分析结 果的准确性。
线性检验
验证测量系统是否符合线性关系,确保数据 在一定范围内准确可靠。
范围检验
评估分析方法在一定浓度或含量范围内的适 用性。
分析化学中的数据处理
2019/9/23
7
平均值相同, 精密度不同
2019/9以u表示,令
u
=
x μ σ
得 y=
1
u2
e2
2π
对其进行积分: p 1 .eu2 /2.du 1
2019/9/23
11
u检验:在无系统误差的情况下,检验±u (或单边)范围 内分析结果(或随机误差)出现的概率。
用单次测量值:μ= x±uσ
用平均量值:
x u x u
x
n
并且u检验适用于已知的正态分布方程N(μ,σ2 )
例题p58 8
2019/9/23
12
例题:某炼铁炉中铁水含C量符合正态分布方程( 4.55∽0.1082 ) 现对某日一炉铁水分析5次4.28 4.43 4.42 4.35 4.30, 如果 分析正常(无系统误差),问这炉铁水是否合格(p=95%)
2
说明:(1) 正态分布曲线与横坐标-∞到+∞之间所夹面积, 代表所有数据出现的几率总和其值等于1
(2) 若改变积分区间,可得围成的不同面积。
2019/9/23
9
随机误差在某一区间出现的概率,可以取不同的u值进行积分. 68.3%
-∞ -3 -2 -1 0 1 2 3 +∞
u
=
x μ σ
n
∞
x μ 正态分布 u = σ
2019/9/23
14
t分布曲线与正态分布曲线相似, t分布曲线下一定区间内的积 分面积就是该 区间内随机误差或测量值出现的概率, t分布曲 线不仅随t值改变还与f有关。
分析化学中的数据处理
第二章误差与数据处理1.测定某样品中的含氮量,六次平行测定的结果是20.48%,20.55%,20.58%,20.60%,20.53%,20.50%。
(1)计算这组数据的平均值、中位数、极差、平均偏差、标准偏差、变异系数和平均值的标准偏差。
(2)若此样品是标准样品,含氮量为20.45%,计算以上测定的绝对误差和相对误差。
2. 测定试样中CaO的质量分数时,得到如下结果:35.65%、35.69%、35.72%、35.60%。
问:(1)统计处理后的分析结果应如何表示?(2)比较95%和90%置信度下总体平均值的置信区间。
3. 根据以往的经验,用某一种方法测定矿样中锰的含量的标准偏差(即δ)是0.12%。
现测得含锰量为9.56%,如果分析结果分别是根据一次、四次、九次测定得到的,计算各次结果平均值的置信区间(95%置信度)。
4. 某人测定一溶液浓度(mol·L-1),获得以下结果:0.2038、0.2042、0.2052、0.2039。
第三个结果应否弃去?结果应如何表示?测定了第五次,结果为0.2041,这时第三个结果可以弃去吗?(置信度为90%)5. 在不同温度下对某试样作分析,所得结果(%)如下:10℃: 96.5, 95.8, 97.1, 96.037℃: 94.2, 93.0, 95.0, 93.0, 94.5试比较两组结果是否有显著差异。
(置信度为95%)6. 某分析人员提出了测定氯的新方法。
用此法分析某标准样品(标准值为16.62%),四次测定的平均值为16.72%,标准差为0.08%。
问此结果与标准值相比有无显著差异(置信度为95%)。
7. 标定0.1 mol·L-1; HCl,欲消耗HCl溶液25 mL左右,应称取基准物多少克?从称量误差考虑能否达到0.1%的准确度?若改用硼砂为基准物,结果又如何?8. 下列各数含有的有效数字是几位?9. 按有效数据计算下列结果:(1) 213.64 + 4.4 + 0.324410. 某人用络合滴定返滴定法测定样品中铝的百分含量。
第二章分析化学中的误差与数据处理
3.0 3.0
3.1 3.0
3.1 3.2
dr
2.76 2.76
s
0.08 0.14
R x x max min
2018/12/8
8
2.1.2 准确度与精密度的关系
x1
x2
x3
2018/12/8
x4
9
准确度与精密度的关系 1.精密度好是准确度好的前提; 2.精密度好不一定准确度高
2018/12/8
ER=mEA+nEB-pEC ER/R=EA/A+EB/B-EC/C
ER/R=nEA/A
ER=0.434mEA/A
13
2. 随机误差 a. 加减法 R=mA+nB-pC b. 乘除法 R=mA×nB/pC c. 指数运算 R=mAn d. 对数运算 R=mlgA
sR2=m2sA2+n2sB2+p2sC2 sR2/R2=sA2/A2+sB2/B2+sC2/C2 sR/R=nsA/A sR=0.434msA/A
2018/12/8
11
随机误差: 又称偶然误差 不可校正,无法避免,服从统计规律 不存在系统误差的情况下,测定次数越多其 平均值越接近真值。一般平行测定4-6次 过失 2.1.4 公差 是生产部门根据实际情况规定的误差范围。
2018/12/8 12
由粗心大意引起,可以避免的
2.1.5 误差的传递 1. 系统误差 a. 加减法 R=mA+nB-pC b. 乘除法 R=mA×nB/pC c. 指数运算 R=mAn d. 对数运算 R=mlgA
正态分 布概率 积分表
2
第二章分析化学中的数据处理
三.平均值的置信区间(P61)
在一定置信度上,根据 x(样本)估计µ(总体
平均值)可能存在的区间,只有当 n,x ,
显然做不到,少数测量得到的总带有一定的不
确定性,所以只能在一定置信度上,根据 x 对µ
可能存在的区间作出估计
• •
由t分布(2-8)式
xts xt
许多随机变量都服从或近似服从正态分布,
分析测定中的随机误差也是这样的,P55图
3-3即为正态分布曲线,它的数学表达式为
: • •
y=f(x)= 1 e- (x2-2) 2
2
(2-5)
• 20式20/3/5中y-为概率密度 x-为测量值
• µ-为总体平均值,即无限次测定数据的 平均值,相应于曲线最高点的横坐标值 ,在没有系统误差时,它即为真值 ,
2020/3/5
•四 测定数据的评价
• (一)显著性检验 • 在分析工作中常遇到这样的情况,某人对标样
进行分析,得到的平均值( x )与标准值( µ
)不一致;或采用两种不同的分析方法分析同 一试样,得到的两组测定数据的平均值 • x1 与 x2 不一致;或两个不同分析人员对同一 试不样 一进 致行 。分 如析 这时种,差两异组是数由据随的机平误均差值引起x1,与则是x2 不可避免的(正常的),可以认为差异不显著 ;如这种差异是由系统误差引起,则认为它们 之间存在“显著性”差异
对式(2-7)进行定积分,求得面积(即为概率),并
制得标准正态分布概率积分表。由于积分上下限不同,
表的形式有很多种,为了区别,在表上方一般绘图说明
表中所列值是什么区间的概率,表中列出的面积与图中
阴影部分相对应(P57表3-2),表示随机误差在此区
分析化学--分析结果的数据处理
§2-2 分析结果的数据处理一、可疑测定值的取舍1、可疑值:在平行测定的数据中,有时会出现一二个与其它结果相差较大的测定值,称为可疑值或异常值(离群值、极端值)2、方法㈠、Q 检验法:由迪安(Dean )和狄克逊(Dixon )在1951年提出。
步骤:1、将测定值由小至大按顺序排列:x 1,x 2,x 3,…x n-1,x n ,其中可疑值为x 1或x n 。
2、求出可疑值与其最邻近值之差x 2-x 1或x n -x n-1。
3、用上述数值除以极差,计算出QQ=11χχχχ---n n n 或Q=112χχχχ--n4、根据测定次数n 和所要求的置信度P 查Q p ,n 值。
(分析化学中通常取0.90的置信度)5、比较Q 和Q p ,n 的大小:若Q >Q p ,n ,则舍弃可疑值;若Q <Q p ,n ,则保留可疑值。
例:4次测定铁矿石中铁的质量分数(%)得40.02, 40.16,40.18和40.20。
㈡、格鲁布斯法:步骤:1、将测定值由小至大按顺序排列:x 1,x 2,x 3,…x n-1,x n ,其中可疑值为x 1或x n 。
2、计算出该组数据的平均值x 和标准偏差s 。
3、计算统计量G :若x 1为可疑值,则G==s1χχ-若x n 为可疑值,则G==s n χχ-4、根据置信度P 和测定次数n 查表得G p ,n ,比较二者大小若G >G p ,n ,说明可疑值相对平均值偏离较大,则舍去;若G <G p ,n ,则保留。
注意:置信度通常取0.90或0.95。
例1:分析石灰石铁含量4次,测定结果为:1.61%, 1.53%,1.54%和1.83%。
问上述各值中是否有应该舍弃的可疑值。
(用格鲁布斯检验法检验 P=0.95)例 2 测定碱灰中总碱量(以w Na 2O 表示),5次测定结果分别为:40.10%,40.11%,40.12%,40.12%和40.20% (1)用格鲁布斯法检验40.20%是否应该舍去;(2)报告经统计处理后的分析结果;(3)用m 的置信区间表示分析结果(P=0.95)二、显著性检验用统计的方法检验测定值之间是否存在显著性差异,以此推测它们之间是否存在系统误差,从而判断测定结果或分析方法的可靠性,这一过程称为显著性检验。
分析化学--分析结果的数据处理
1§2-2分析结果的数据处理一、可疑测定值的取舍1、 可疑值:在平行测定的数据中,有时会出现一二个与其它结果相差较大的测 定值,称为可疑值或异常值(离群值、极端值)2、 方法㈠、Q 检验法:由迪安(Dean )和狄克逊(Dixon )在1951年提出。
步骤:1、 将测定值由小至大按顺序排列:X i , X 2, X 3,…X n-1 , X n ,其中可疑值为X i 或X n o2、 求出可疑值与其最邻近值之差 X 2-X 1或X n -X n-1。
3、 用上述数值除以极差,计算出 Q4、 根据测定次数n 和所要求的置信度P 查Q, n 值。
(分析化学中通常取的置信度)5、 比较Q 和Q , n 的大小:若Q>Q ,n ,则舍弃可疑值;若Q< Q ,n ,贝M 呆留可疑值。
例:4次测定铁矿石中铁的质量分数(%得,,和。
㈡、格鲁布斯法:步骤:1、将测定值由小至大按顺序排列:X 1, X 2, X 3,…X n-1 , X n ,其中可疑值为X 1或X n 。
2、计算出该组数据的平均值X 和标准偏差s3、计算统计量 G:若X 1为可疑值,则G== s Q=n 1 或 Q= n 1若X n为可疑值,则G = = S4、根据置信度P和测定次数n查表得G, n,比较二者大小若G> G,n,说明可疑值相对平均值偏离较大,则舍去;若G< G, n,则保留。
注意:置信度通常取或。
例1:分析石灰石铁含量4次,测定结果为:%, %,%和%问上述各值中是否有应该舍弃的可疑值。
(用格鲁布斯检验法检验P=)例2测定碱灰中总碱量(以wNa t0表示),5次测定结果分别为:%,%,%,彌%(1)用格鲁布斯法检验%是否应该舍去;(2)报告经统计处理后的分析结果;(3)用m 的置信区间表示分析结果(P=二、显著性检验用统计的方法检验测定值之间是否存在显著性差异,以此推测它们之间是否存在系统误差,从而判断测定结果或分析方法的可靠性,这一过程称为显著性检验。
第2章 分析化学中的数据处理
S=
(0.01 + 0.02 + 0.02 + 0.03 )
2 2 2
2
5 - 1 = 0.022(%)
f = n -1 = 5 -1 = 4 查表;t0.05,4 = 2.78 则95%置信度时平均值的置信区间: = 1.13 2.78×0.022/51/2 = 1.13 0.027(%) (2)已知 =0.022%,则相应的自由度 f ∞ ,查表得:t0.05, (即95%置信度下的 u 值)。 = 1.13 1.96×0.022/51/2 = 1.13 0.019(%) 说明增大标准偏差的自由度 ,可使置信区间变窄。
1、求出结果的平均值
x
好
和平均偏差
d
好
(不含可疑值)
2、若
x疑 - x好
4d
好
,可疑值舍弃,否则保留。
2.2.2 Grubbs法
Q值检验法从统计学角度出发的Fra bibliotek种检验方法,比较严格 而且使用较为简便。
步骤:
1.将测定值从小到大排列: x1<x2<…..<xn, 2.计算出平均值和标准偏差: 3.计算G计:
偶然误差 u ( u = x - μ
1 f (u ) = σ 2π e
-u 2
2
1 σ 2π e
σ
) 的几率密度为:
2
-u 2
正态分布曲线:
2 置信度和置信区间
置信度/置信水平:测定值(或误差)在某一范围内出现的概率(可能性). 置信区间:在选定的置信度下,真实值出现的范围.
xi 测定值的范围:
准确度和误差:准确度即测定值与真实值相符合的程度,常用误差来表 示。 绝对误差:
分析化学中的数据处理
x x
再进行
t计=
1
S合
2
.
n1.n2 n1 n2
28
若t计≥t表说明两组数据的平均值有显著性差异 若t计<t表 ………………………..无…………….
说明:查p61中表tα,f f=n1+n2-2(总自由度)
.
29
例题:用两种方法测得Na2CO3%
方法一、 n1=5 x1=42.34
S1=0.10
5. μ σ是正态分布方程两个非常重要的参数,可用 N(μ , σ2 )表示正态分布方程。
.
7
平均值相同, 精密度不同
.
8
三、偶然误差的区间概率
将正态分布曲线横坐标以u表示,令
u
=
x
σ
μ
得 y=
1
u2
e2
2π
对其进行积分: p 1 .eu2/2.du1
2
说明:(1) 正态分布曲线与横坐标-∞到+∞之间所夹面积, 代表所有数据出现的几率总和其值等于1
如:t0.05 ,10 =2.23表示95%置信度,自由度为10的t值(2.23)
t0.01 ,8 =3.36…… 99%……………………..8…… (3.36)
.
15
二、平均值的置信区间(分析结果的表示方法)
μ x t,f .S
总体平均值
n
置信区间
X — 测得数据的平均值
n — 测量次数
S — 标准偏差
分一下组(10组)就会发现这些数据既有分散性又有集中性。 位于1.36-1.44%有65个数, 小于1.27%或大于1.55%数据很少。 每组测量值出现的次数称为频数; 出现次数/100为相对频数(概率密度)。
分析化学 第二章 定量分析中的误差及数据处理
一、分析测试的误差与偏差
误差和准确度 偏差和精密度 准确度和精密度的关系
1.误差和准确度
准确度: 测定值与真实值的接近程度。 准确度的高低用误差来衡量。
误差: 测定值与真实值之间的差值。 一般用绝对误差和相对误差来表示。
绝对误差(E):
测定值(X)与真实值(XT)之间的差值。 E = X ̶ XT
注: 当舍去后,余下数据较少时,应适当补做数据。
例. p.15, 例3
四、 分析测试结果准确度的评价
(一) 分析测试结果准确度的评价 1.用标准物质评价分析结果的准确度 2.用标准方法评价分析结果的准确度 3.通过测定回收率评价分析结果的准确度
(二) 显著性检验
1.F检验法
检验两种方法的精密度有无显著性差异。如果
2. 检验顺序: G检验 → F 检验 → t检验
离群值的 取舍
精密度显著性 检验
准确度或系统误 差显著性检验
五、有效数字及其运算规则 思考题: 下列数据各包括了几位有效数字? (1)0.0330 (2)10.030 (3)89.6 (4)3.30×10-2 (5)pKa 4.74 (6)pH10.2 (7)3.3×10-2
误差的种类及其性质 误差产生的原因及减免方法
(一) 误差的种类及其性质 1. 系统误差 2. 偶然误差 3. 过失误差
1. 系统误差 特点: (1)对分析结果的影响比较恒定; (2)在同一条件下,重复测定,重复出现; (3)影响准确度,不影响精密度; (4)可以消除。
2. 偶然误差 特点:
(1)不恒定 (2)难以校正 (3)服从正态分布
步骤:
(1) 数据从小至大排列x1,x2 ,…… ,xn (2) 计算该组数据的平均值和标准偏差S
分析化学 第二章 定量分中误差和数据处理
例
用沉淀滴定法测定纯NaCl(0.6066)中氯的质量
分数,得到下列结果:0.5982,0.6006,
0.6046,0.5986,0.6024。
则平均结果为_______ 0.6009 ____;
平均结果的绝对误差为_____-_0__._0057 ____;
相对误差为___ -0.94%_____;
(1)系统误差产生的主要原因(或分类) :
a. 方法误差 b. 仪器误差 c. 试剂误差 d. 操作误差
e. 主观误差
a.方法误差
这种误差是由于分析方法本身所造成的。例如: 在重量分析中,沉淀的溶解损失或吸附某些杂质而产 生的误差;在滴定分析中,反应进行不完全,干扰离 子的影响,滴定终点和化学计量点的不符合,以及其 他副反应的发生等,都会系统地影响测定结果。
0.0,+0.1, -0.7,+0.2,-0.1,-0.2, +0.5,-0.2,+0.3,+0.1 两组数据平均偏差均为0.24
(二)标准偏差和相对标准偏差
近年来,在分析化学的教学中,愈来愈广泛地采用数理统 计方法来处理各种测定数据。在数理统计中,我们常把所 研究对象的全体称为总体(或母体);自总体中随机抽出 的一部分样品称为样本(或子样);样本中所含测量值的 数目称为样本大小(或容量)。例如,我们对某一批煤中 硫的含量进行分析,首先是按照有关部门的规定进行取 样、粉碎、缩分,最后制备成一定数量的分析试样,这就 是供分析用的总体。如果我们从中称取10份煤样进行平 行测定,得到10个测定值,则这一组测定结果就是该试 样总体的一个随机样本,样本容量为10。
0.0,+0.1, -0.7,+0.2,-0.1,-0.2, +0.5,-0.2,+0.3,+0.1 S2=0.33
分析化学 第二章
( x )2
i 1
n
μ为总体平均值,在校正了系统误差情况下, n 为测定次数无限 多时,μ即代表真值。 有限次测定时,标准偏差称为样本标准偏差,以 s 表示:
s ( xi x ) 2
i 1 n
n -1
(n-1)称为自由度,表示 n 个测定值中具有独立偏差的数目。
相对标准偏差:s与平均值之比称为相对标准偏差,以 sr 表示:
5位有效数字 2位有效数字
(2)常数如:ln5、π……,以及分数、倍数等非测量数 据其有效数字为无限多位,计算时可不与考虑。 (3)pH、pKa、pKb、lgK、pM等对数值,其小数部分 为有效数字。 例如: pH = 2.38,C=4.210-3 mol/L (4)改变单位并不改变有效数字的位数。
di xi x
b. 相对偏差d r:绝对偏差占平均值的百分比
dr
xi x x
100%
在实际工作中(如分析化学实验),对于分析结果 的精密度经常用平均偏差和相对平均偏差来表示。 c. 平均偏差又称算术平均偏差,各测量值绝对偏差的算术 平均值,用来表示一组数据的精密度。
d
i 1
例如,甲、乙、丙、丁四人同时测定铜合金中Cu的百分 含量,各分析6次。设真值=10.00%,结果如下:
真值 x
•精密度好,准确 度不好,系统误 差大
• • • •
甲 乙 丙 丁
•准确度、精密度都 好,系统误差、偶然 误差小
•精密度较差,接近 真值是因为正负误 差彼此抵销 •精密度、准确度差。 系统误差、偶然误差大
二、有效数字的修约规则 1.修约规则: 用“四舍六入五成双”对数字进行修约。其作法是, (1)当数据中被修约的数字小于或等于4时则舍去; 当数据中被修约的数字大于或等于6时则进入。 (2)当数据中被修约的数字等于5时,分两种情况: a. 5后面的数字为“0”时, 若“5”前面为偶数则舍去,为奇数则进入。
分析化学第二章 误差及分析数据的处理
性质 影响 消除或减 小的方法
重现性、单向性 、可测 服从概率统计规律、
性
准确度 校正
不可测性
精密度 增加测定的次数
六、提高分析结果准确度的Байду номын сангаас法
1. 选择恰当的分析方法 2. 减小测量误差
与经典方法进行比较 校准仪器 4. 消除测量中的系统误差 空白试验 对照试验 回收试验
3. 减小偶然误差
1.选择合适的分析方法
系统误差 产生的原因
a.方法误差——选择的方法不够完善
例:重量分析中沉淀的溶解损失;
滴定分析中指示剂选择不当。 b.仪器误差——仪器本身的缺陷 例: 天平两臂不等,砝码未校正; 滴定管,容量瓶未校正。
c.试剂误差——所用试剂有杂质
例:去离子水不合格; 试剂纯度不够(含待测组份或干扰离子)。 d.操作误差——操作人员主观因素造成 例:对指示剂颜色辨别偏深或偏浅; 滴定管读数不准
d
i 1
n
i
n
0.11% 0.14% 0.16% 0.04% 0.09% 0.11% 5
相对平均偏差
d 0.11% d r 100% 100% 0.29% x 37.34%
标准偏差
2 ( x i x ) i 1 n
s
n 1
(0.11%) 2 (0.14%) 2 (0.16%) 2 (0.04%) 2 (0.09%) 2 0.13% 5 1
回收率越接近100%,方法准确度越高
方法误差 仪器误差 系统误差 试剂误差 操作误差
选择适当的分析方法 校正仪器 空白实验 对照实验
误差
分析测试中,一般对同一试样平行 偶然误差 测定 3~4 次,精密度符合要求即可。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 在实际分析测定中,测定次数一般不多, n<20,而总体平均值又不知道。一般是用 抽样的方法对样品进行测定。只能用样本 标准偏差反映该组数据的分散程度。
样本标准偏差
• 当测定次数非常多时,测定次数n与自
由度(n-1)的区别就变小, x 。
例如: 1.0008, 0.0040
三、其它需注意的事项:
1、数字后的0含义不清楚时, 最好用指数形式表示 例:1000 1.0×103 (2)、1.00×103 (3)、1.000×103 (4)
2、自然数可看成具有无限多位数(如倍数关系、分数关系); 常数亦可看成具有无限多位数
3、对数与指数的有效数字位数按尾数计( pH, pKa) 例:10-2.34 (2);pH=11.02 (2),则[H+]=9.5×10-12 (2)
又称变异系数CV (coefficient of variation)
CV s 100% x
例:重铬酸钾法测得铁的百分含量为:20.03%, 20.04%, 20.02%, 20.05%和20.06%。计算分 析结果的平均值,标准偏差和相对标准偏差。
解:
x x i 20.03 20.04 20.06 20.04(%)
由操作者、仪器、方法的 由操作者、仪器、方法的
偏差造成
不确定性造成
原则上可以认识且可减小 不可消除,但可通过仔细的
(部分甚至全部)
操作而减小
由平均值与真值之间的不一 可通过在平均值附近的分散
致程度辨认
度辨认
影响准确度
影响准确度、精密度
以平均值和真值之间的差值 定量
通过精密度的大小定量
2.2 有效数字
•即
lim (x i x)2 (xi )2
n n 1
n
此时,s。
比较 d 、d / x 、s的异同
例:测消毒剂H2O2的含量,KMnO4标准液的体积为 第1组:25.98, 26.02, 26.02, 25.98, 25.98, 25.98, 26.02,26.02
(三)准确度与精密度的关系
准确且精密 不准确但精密 准确但不精密 不准确且不精密
1.精密度是保证准确度的先决条件; 2.精密度高,不一定准确度高.
二、分析测试中误差的产生及减免办法 1. 系统误差(systematic error)或称可测误差
具单向性、数值大小基本固定、重现性,为可测误差。
方法误差: 溶解损失、终点误差-用其它方法校正 仪器误差: 刻度不准、砝码磨损-校准(绝对、相对) 试剂误差: 不纯-空白实验 操作误差: 洗涤、称量(操作粗心、马虎引起的误差称失误) 主观误差: 颜色观察、读数
4、相对误差或标准偏差只需保留1~2位
5、化学平衡计算中,平衡浓度一般保留2位有效数字
6、分析结果的一般表示法,
组分含量>10%, 要求4位 (化学分析)
组分含量1%~10% 要求3位 (仪器分析)
<1%
2位
7、改变单位不能任意改变有效数字的位数
19.82 mL (4)
0.01982 L (4)
四、运算规则:计算结果中只能有一位可疑数字
举例
1.0008 0.1000 0.0382
54 0.05 3600
43181 10.98% 1.98×10-10 0.0040 2×105
3/2
5位 4位 3位 2位 1位 不确定
数据中“0”是否为有效数字
(1)只起到定位作用,不算,
例如: 0.0382,
0.05
(2) 作为普通的数字使用,算,
2. 正态分布规律
• 1) 测量值分布的集中趋势()
• x =时,y值最大,此即分布曲线的最高点。
• 大多数测量值集中在算术平均值的附近,或 者说算术平均值是最可信赖值或最佳值。
• 它能很好地反映测定的集中趋势。
2) 测量值分布的分散趋势()
x=时的概率密度
y
1
2
乘以dx就是测量值落在dx范围内的概率。 • 越小,y越大,测量值分布越集中。 • 越大,y越小,测量值分布越分散。
d 100% x
d 1 n | d | 1 n | x x |
n i1
n i1
相对平均偏差 d 100 % x
例如:测定NaCl试样中氯的质量分数,6次测量值分别为 0.6012,0.6018,0.6030,0.6045,0.6020,0.6037
x 0.6012 0.6018 0.6030 0.6045 0.6020 0.6037 6
第二章 分析化学中的数据处理
2.1 准确度和精密度 2.2 有效数字 2.3 有限实验数据的统计处理 2.4 提高分析结果准确度的方法
2.1误差的产生及表示方法
一、关于误差的一些基本概念
(一)单次测定值与真值的关系
1、准确度 测定结果(x)与真实值(xT)之间相符的程度
绝对误差 E x xT
s可以反映出较大偏差的存在及测定次数的影响
二、随机误差的正态分布
1.正态分布(高斯分布)
测量值的分布(x分布) 以测量值x为横坐标,测量值的概率密度函数f(x)
为纵坐标所做的曲线。
f(x) σ
1 2π
exp
1 2
x σ
μ
2
f(x):测量值的概率密度函数;
n
5
s
x
2 i
1 n
(
xi )2
n 1
2008.009 2008.008 0.016(%) 5 1
CV s 100% 0.016100% 0.080%
x
20.04
总体标准偏差 • 计算总体标准偏差时,对单次测定的偏差
平方作用:
(1) 避免单次测定偏差相加时正负抵销
一、有效数字
1. 概念:一个数据中所有确定的数字再加一位不定数字。
确定的数字:指某一量经多次测定的结果,总是固定不变 的数字。 例如:三次称量Na2CO3 (g)为0.3561、0.3562、0.3560 有效数字的最后一位可疑数字,可能有±1个单位的误差
二、有效数字的位数
质量 分析天平(称至0.1 mg): 12.8218 g (6)、0.2338 g (4)、0.0500 g (3)
3) 正误差和负误差出现的概率相等
正态分布曲线以 x= 这一直线为其对称 轴。 4) 小误差出现的概率大,大误差出现的概 率小 出现很大误差的概率极小,趋近于零。因 为当x趋向于-或+时,曲线以x轴为渐 近线。
3. 随机误差的区间概率
从以上的概率的计算结果看,
1)分析结果落在 3范围内的概率达 99.7%,即误差超过3的分析结果是很 少的,只占全部分析结果的0.3%。
X:测量值;
:总体平均值(真实值);
:无限次测量的标准偏差;
(x μ) σ
:以标准偏差作为单位偏差;
exp:2.718,e的指数式
正态分布曲线 y σ=1
σ=2
µx 0 x-µ
• 正态分布曲线呈钟形对称,两头小,中 间大。
• 分布曲线有最高点,通常就是总体平均 值的坐标。
• 分布曲线以值的横坐标为中心,和 是正态分布的两个基本参数。
x1 26.00 d1 0.02 s1 0.021 n1 8
第2组:25.98, 26.02, 25.98, 26.02
x2 26.00 d2 0.02 s2 0.023 n2 4
第3组:26.01, 26.02, 25.96, 26.01
x3 26.00 d3 0.02 s3 0.027 n3 4
千分之一天平(称至0.001 g):0.234 g (3) 百分之一天平(称至0.01 g):4.03 g (3)、0.23 g (2) 台秤(台式天平)(称至0.1 g): 4.0 g (2)、 0.2 g (1) 体积 滴定管(量至0.01 mL):26.32 mL (4)、3.97 mL (3) 容量瓶:100.0 mL (4)、250.0 mL (4) 移液管:25.00 mL (4) 量筒(量至1 mL或0.1 mL):25 mL (2)、4.0 mL (2)
0.6027
d 0.0015,0.0009,0.0003,0.0018,0.0007,0.0010
d 0.0015 0.0009 0.0003 0.0018 0.0007 0.0010 6
0.0010
d 0.0010 100 % 0.17% x 0.6027
数。(与小数点后位数最少的数一致) 例:50.1 + 1.46 + 0.5812 =?
50.1 1.46 + 0.5812 52.1412 52.1
±0.1 ±0.01 ±0.0001
±0.1
50.1 1.5 + 0.6 52.2 52.2
乘除法:结果的相对误差应与各因数中相对误差最大的 数相适应。(即与有效数字位数最少的一致)
对照实验:标准方法、标准样品、标准加入
2、随机误差(random error)、偶然误差,
不可避免,服从统计规律 既影响准确度又影响精密度 增加测定次数可减少偶然误差
3、过失(mistake)
由粗心大意引起,完全可以避免的;必须重做实验!
随机误差和系统误差的最显著的特征
系统(可测)误差
随机(不可测)误差
Er 0.1% 1%
(二)单次测定值与平均值的关系 1、算术平均值(简称平均值):数据的集中趋势