分析化学第六版第二章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正态分布曲线: 置信区间:
σ μ xu n
样本容量 n n x μ 0.8
x ta , f
自由度 f = n-1 n-1 n s d与s相差较大
s n
例3 p15
公差
公差是生产部门对分析结果误差允许的一种限量,若果误差超 出允许的公差范围,该项分析工作就应重做。
准确度与精密度的关系
高的精密度不一定保证高的准确度; 但精密度高是准确度高的前提。
例2 p10
误差的分类及减免误差的方法
在定量分析中,对于各种原因导致的误差,根据误差的 来源和性质的不同,可以分为系统误差和随机误差两大类。
根据产生的具体原因,系统误差可分为:方法误差; 仪器和试剂误差;操作误差;主观误差。
x t n s
以t为统计量的分布称为t分布。t分布可说明当n不大时 (n<20)随机误差分布的规律。
t分布曲线的纵坐标仍为概率密度,但横坐标为统计量t。
t分布与标准正态分布的区别: 1.横坐标不同t u; 2.随测定次数减少,t分布曲线 趋于平坦,即t分布曲线随着自 由度(f=n-1)而改变:
第2章 误差及分析数据的统计处理
2.1 定量分析中的误差 2.2 分析结果的数据处理 2.3 误差的传递 2.4 有效数字及其运算规则
2.5 标准曲线的回归分析
分析化学中的误差
定量分析的任务是准确测定组分在试样中的含量。在 测定过程中,即使采用最可靠的分析方法,使用最精密的 仪器,由技术很熟练的人员进行操作,也不可能得到绝对 准确的结果。因为在任何测量过程中,误差是客观存在的。
亦称偶然误差,由难以控制且无法避免的偶然因素造成 ,如测定过程中温度、湿度、气压等变化引起的误差。 由于疏忽或错误引起,实质是一种错误,不能成为误差。
消除系统误差
1. 2. 3. 4. 对照试验:检验系统误差 空白试验:扣除系统误差 校正仪器 分析结果校正
消除随机误差
增加平行测定次数
思考
① 砝码受腐蚀:系统误差(仪器误差),更换砝码 ② 天平的两臂不等长:系统误差(仪器误差),校正仪器。 ③ 容量瓶与移液管未经校准:系统误差(仪器误差),校正 仪器。 ④ 在重量分析中,试样的非被测组分被共沉淀: 系统误差(方法误差),修正方法,严格沉淀条件。 ⑤ 天平称量时最后一位读数估计不准: 偶然误差;严格按操作规程操作,增加测定次数。 ⑥ 以含量为99%的邻苯二甲酸氢钾作基准物标定碱溶液: 系统误差,做对照试验或提纯试剂。
公差范围的确定,与诸多因素有关:
首先,根据实际情况对分析结果准确度的要求而定;
其次,公差范围常依据试样组成及待测组分含量而不同,组成 愈复杂,引起误差的可能性就愈大,允许的误差范围则宽一些。 此外,由于各种分析方法所能达到的准确度不同,则公差的范 围也不同。
பைடு நூலகம்
2.2 分析结果的数据处理
分析工作者获得了一系列数据后,需要对这些数据进行
因此,应该了解分析过程中误差产生的原因及其出现的 规律,以便采取相应措施,尽可能使误差减小。另一方面 需要对测试数据进行正确的统计处理,以获得最可靠的数 据信息。
2.1 定量分析中的 误差
误差与准确度
准确度(accuracy)是指测定平均值与真值接近的程度,
常用误差大小表示。误差小,准确度高。
偏差与精密度
精密度(precision)是指在确定条件下,将 测试方法实施多次,求出所得结果之间的一致程 度。精密度的大小常用偏差来表示。
偏差(deviation)
在实际分析工作中,一般要对试样进行多次平行测定,以
求得分析结果的平均值。
为了说明分析结果的精密度,将各单次测定偏差的绝对值
直方图的两个特点: (1)离散特性 (2)集中趋势
相对频数分布直方图
当测定次数无限多时,其标准偏差称为总体标准 偏差,用符号σ来表示。 (x )
n 2
i 1
i
n
其中μ为总体平均值,即无限多次测定的平均值。
在确认消除系统误差的前提下总体平均值就是真值xT。此 时总体平均偏差δ为 1 xi n 当测定次数非常多(>20)时,总体标准偏差(σ)与总 体平均偏差(δ)有下列关系 = 0.797σ 0.8
标准正态分布曲线
这样,曲线的横坐标就变为μ,纵坐标为概率密度,用μ和概率密度
表示的正态分布曲线称为标准正态分布曲线,用符号N(0,1)表示。这样, 曲线的形状与σ大小无关,即不论原来正态分布曲线是瘦高的还是扁平的 ,经过这样的变换后都得到相同的一条标准正态分布曲线。
误差在某些区间出现的概率
标准正态分布曲线与横坐标之间所加的面积,代表了某 一区间的测量值或某一范围 随机误差出现的概率。
应当理解为:在 47.50% 0.10% 的区间内包括总体平
均值μ的概率为95%。 注意:μ是个客观存在的恒定值,没有随机性,谈不上什 么概率问题,不能说μ落在某一区间的概率是多少。
臵信度越低,同一体系的臵信区间就越窄;臵信 度越高,同一体系的臵信区间就越宽,即所估计 的区间包括真值的可能性也就越大; 臵信度过高会使臵信区间过宽,这种判断往往就 失去了意义;臵信度定的太低,其判断的可靠性 不能保证;
臵信度的高低应定得合适,要使臵信区间的宽度 足够窄,而臵信度又足够高。
在分析化学中,一般将臵信度定在95%或90%。
总体标准偏差:
样本标准偏差:
( xi ) 2 n
σ x n
s
( x x)
i
2
n 1
平均值的标准偏差:
平均值的标准偏差:
s sx n
t分布曲线: 置信区间:
1.频数分布
频数是指每组中测量值出现的次数,频数与数据 总数之比为相对频数,即概率密度。
整理上述数据,按组距0.03来分成10组,得频数分布表:
分 组
1.265% 1.295% 1.295% 1.325% 1.325% 1.355% 1.355% 1.385% 1.385% 1.415% 1.415% 1.445% 1.445% 1.475% 1.475% 1.505% 1.505% 1.535% 1.535% 1.565%
值(xT)的百分率,即:
相对误差(Er)是绝对误差(E)相当于真实
1.相对误差和绝对误差一样,有正有负。 2.相对误差反映的是误差在真实值中所占的比例大小,因此 绝对误差相同的条件下,待测组分含量越高。相对误差越 小;反之,相对误差越大。
真实值(XT)
某一物理量本身具有的客观存在的真实数值。真值是未知
2.正态分布
在分析化学中,测量数据一般符合正态分布规律。正态分 布是德国数学家高斯首先提出的,又称高斯曲线,下图即为正 态分布曲线N(μ,σ2),其数学表达式为
1 y f(x) e 2
(x ) 2 2 2
y表示概率密度;x表示测量值; μ是总体平均值;σ是总体标准偏差 μ决定曲线在x轴的位臵;σ决定 曲线的形状:σ小,数据的精密度好, 曲线瘦高;σ大,数据分散,曲线较扁平。
有限次测定中随机误差服从t分布
正态分布是无限次测量数据的分布规律,而实际分析 工作中,只能对随机抽样进行有限次测量,其随机误差的
分布不服从正态分布。那么如何以统计的方法处理有限次
测量数据,使其合理地反映总体的特征?
(1)t分布曲线
当测量数据不多时,无法求得总体平均值μ和总体标准偏 差σ,只能用样本的标准偏差s来估计测量数据的分散情况。用s 代替σ,必然引起分布曲线变得平坦,从而引起误差。为了得到 同样的臵信度(面积),必须用一个新的因子代替u,这个因子 是由英国统计学家兼化学家Gosset提出来的,称为臵信因子t, 定义为
区间概率不仅随t值而改变,还与f值有关。
不同f值及概率所对应的t值已由统计学家计算出来,见 。
表中臵信度用P表示,它表示在某一t值时,测定值落在 (μ〒t s)范围内的概率。显然,测定值落在此范围之外的概率 为(1-P),称为显著性水准。
臵信区间概念的理解:
= 47.50% 0.10% (P=95%)
频 数
1 4 7 17 24 24 15 6 1 1
相对频数
0.01 0.04 0.07 0.17 0.24 0.24 0.15 0.06 0.01 0.01
100
1.00
以各组区间为底,相对频数为高做成一排矩形的相对频数 分布直方图。如果测量数据非常多,组距可更小些,组就分得 更多些,直方图的形状趋于一条平滑的曲线。
随机误差的分布服从正态分布
随机误差是由某些难以控制且无法避免的偶然因 素造成的,它的大小、正负都不定,具有随机性。尽 管单个随机误差的出现无规律,但在系统误差已排除 的情况下,进行多次重复平行测定,会发现随机误差 是服从一定的统计规律的。
用数理统计的方法研究发现,随机误差的分布符合 正态分布(即高斯分布)。
两组精密度不同的测量值的正态分布曲线
正态分布规律
(1)x=μ时,y最大。即多数测量值集中在μ附近,或者说
总体平均值是最可信赖值或最佳值。 (2)x=μ时的直线为对称轴。即正负误差出现的概率相等。 (3)x→〒≦时,曲线以x轴为渐近线。即大误差出现的 概率小,出现很大误差的测定值概率趋近零。 (4) ↗, y↘ ,即测量精密度越差,测量值分布越分散, 曲线平坦。
u2 e 2
y (u )
1 2
正态分布概率积分表或简称u表
----不同u值对应的积分值(面积)做成的表
由u值可查表得到面积,也即是某一区间的测量值或某一范围 随机误差出现的概率。
测定值或误差出现的概率称为臵信度或臵信水平, 上表中68.3%、95.5%、99.7%即为臵信度,其意义可理 解为某一定范围的测定值(或误差值)出现的概率。 μ±σ、 μ±2σ、 μ±3σ等称为臵信区间,其意义为真实值 在指定概率下,分布在某一个区间。 臵信度选得高,臵信区间就宽。
的、客观存在的量,严格地说,任何物质中各组分的真实 含量是不知道的,用测量的方法得到的仅是测量值。
在分析化学中常将以下的值当作真值来处理:
a、理论真值(如化合物的理论组成,例如硫酸铵含氮量)
b、计量学约定真值(如国际计量大会确定的长度、质量、 物质的量单位等,例如原子量、分子量。 ) c、相对真值(如高一级精度的测量值相对于低一级精度 的测量值。例如,标准样品的标准值)
的平均值称为单次测定结果的平均偏差(d),公式如下:
单次测定结果的相对平均偏差为(dr),公式如下:
当测定次数较多时,常使用标准偏差(s)或相对标准偏差
(RSD,sr)来表示一组平行测定值的精密度。公式如下:
标准偏差通过平方运算,它能将较大的偏差更显著地表现出来,
因此,标准偏差能更好地反映测定值的精密度。实际工作中, 都用RSD表示分析结果的精密度。
f<10, t分布曲线与标准正态分布 曲线差别较大; f>20,t分布曲线与标准正态分布曲 线很接近; f t,分布曲线与标准正态分布曲 线严格一致。
t分布曲线
与标准正态分布曲线一样,t分布曲线下面一定区间内
的积分面积,就是该区间内随机误差出现的概率。 不同的是,对于标准正态分布曲线,只要u值一定,相 应的概率也一定;但对于t分布曲线,当t值一定时,由于 f值的不同,相应曲线所包括的面积也不同,即t分布中的
误差(Error) :
表示测量值与真值之差,表征测量
结果的准确度。 误差有两种表示方法:绝对误差(E)和相对误差(Er)。
绝对误差(E)是测量值(x)与真实值(xT)之间的
差值,即:
1.绝对误差的单位与测量值的单位相同,误差越小,表示测量值与真实 值越接近,准确度越高;反之,误差越大,准确度越低。 2.测量值大于真实值时,误差为正误差,表示测定结果偏高;反之,误 差为负值,表示测定结果偏低。
处理,譬如有个别偏离较大的数据(称为可疑值)是保留还 是该弃去,测得的平均值与真值或标准值的差异是否合理, 相同方法测得的两组数据或两种不同方法对同一试样测得的 两组数据间的差异是否在允许的范围内,都应做出判断,不 能随意舍去。
可疑数据的取舍
在实验中,当对同一试样进行进行多次平行测定时,常常 发现某一组测量值中,往往有个别数据与其他数据相差较大, 这一数据称为可疑值(也称离群值或极端值)。 如果确定这是由于过失造成的,则可以弃去不要,否则不 能随意舍弃或保留,应该用统计检验的方法,确定该可疑值是 否与其他数据来源于同一总体,以决定取舍。 统计学中对可疑值的取舍有几种方法,本章介绍处理方法 较简单的Q值检验法及效果较好的格鲁布斯(Grubbs)法。