第七章分析化学中的数据处理
分析化学中的数据处理
分析化学中的数据处理分析化学中的数据处理是指针对实验数据进行整理、统计、分析和解释的一系列过程。
对数据进行适当的处理能够提取出更有意义的信息,从而为后续的研究和实验提供有效的支持。
下面将从数据处理的步骤、常用方法和应用领域等方面进行详细展开。
数据处理的步骤通常包括数据整理、数据检查、数据统计和数据分析等过程。
首先,数据整理是将实验数据进行归类、清理和排序的过程,以便后续的操作和分析。
其次,数据检查是指对数据进行质量控制,包括检查数据的完整性、准确性和可靠性等方面。
第三,数据统计是指对数据进行一定分组、计数和总结等统计分析的过程,从而得到特定指标和特征的统计结果。
最后,数据分析是指对统计结果进行解释和推理,从而得出一定的结论和判断。
在实际的数据处理中,常用的方法包括描述统计方法、回归分析方法、因子分析方法和聚类分析方法等。
描述统计方法主要用于对数据的中心趋势、离散程度和分布特征等进行描述和总结,常用的统计指标包括均值、中位数、标准差等。
回归分析方法主要用于研究两个或多个变量之间的关系,可通过拟合线性或非线性模型进行分析。
因子分析方法则用于确定一组变量之间的潜在关系,并提取出影响变量的主成分。
而聚类分析方法则用于对一组数据进行分类和归类,以找出相似性较高的样本或因素。
分析化学中的数据处理广泛应用于样品分析、光谱分析、色谱分析和电化学分析等领域。
在样品分析中,数据处理可以帮助提取出目标物质的浓度或含量信息,并估计分析结果的可靠性和准确性。
在光谱分析中,数据处理可以对光谱数据进行寻峰、峰面积计算和谱图解析等,以获得有关物质结构和组成的信息。
在色谱分析中,数据处理可以用于峰识别、峰分离和峰面积计算等,从而确定样品中的目标物质和杂质。
在电化学分析中,数据处理可以用于电流-电位曲线的拟合和分析,以确定反应的机理和动力学参数。
分析化学中的数据处理
第7章Management of Experimental Data in AnalyticalChemistry分析化学中的数据处理7.1 统计学(statistics)中常用术语1、总体:所考察的对象的全体。
2、样本(子样):自总体中随机抽出的一组测量值。
3、样本大小(或容量):样本中所含测量值的数目。
3、值表:f t ,α体现t , f , P 之间的关系已知f , P 时,可从表中查出相应的t 值。
表中置信度就是概率P ,它表示t 值一定时,测定值落在范围内的概率。
) (s t ⋅±μ显著性水准P −=1 α自由度n n f , 1−=为测定次数双边:表示P 是从-t 到+t 积分而得的面积。
检验时的标准置信度=P%95检验步骤a. 根据题意计算t计b. 计算出α , f, 查t表c. 比较t计与t表,然后作出结论计算α , f ,05.095.011 =−=−=P α3141=−=−=n f 查表7-3,得18.33,05.0=t 因为t 计= 8>t 0.05,3所以,平均值与标准值存在显著性差异。
分析结果存在系统误差。
•由F 的定义式可计算得F值若F→1,则s1与s2 相差不大;若F 较大,则s1与s2存在显著性差异。
检验步骤a. 计算F值,b. 计算f大,f小,查F值表得F表c. 比较:若F计>F表,存在显著性差异;反之,不存在显著性差异。
(3) 查F 值表:计算自由度516=−==小大f f 由表7-4 查得F 表= 5.05(4) 由于F 计= 2.22 , 故F 计<F 表所以,该两组数据的精密度无显著性差异。
作出此判断的置信度为90%。
检验步骤:①用F检验法:检验s1与s2 之间是否存在显著性差异。
如s1与s2 之间存在显著性差异,则两组分析数据存在显著性差异。
如s1与s2 之间不存在显著性差异,则可认为s1≈s2 ,可计算合并标准偏差继续进行下述检验。
查t 值表,得t表值。
第7章 分析化学中的数据处理
可以用数学方法方便 地计算出某一指定区 间的概率。列出下表:
2020/5/7
Analytical Chemistry
上一页 下一页
材料科学与化学工程学院
7.2.4 随机误差的区间概率(2)
要注意单边与双边的问题
例:测量值在μ±2σ间的概率
(双边)
测量值在μ>2σ间的概率
(单边)
2020/5/7
Analytical Chemistry
2020/5/7
Analytical Chemistry
上一页 下一页
7.2.2 频数分布
材料科学与化学工程学院
2020/5/7
既分散 又集中
Analytical Chemistry
上一页 下一页
7.2.3 正态分布(1)
如果将上述的实验重复无数多次,则该 频数分布表符合正态分布规律。
材料科学与化学工程学院
单侧置信区间:指μ> XU或μ< XL 的范围。
除了指明求算在一定置信水平时总体平均值大于或小于 某值外,一般都是求算双侧置信区间。
2020/5/7
Analytical Chemistry
上一页 下一页
材料科学与化学工程学院
7.3.2 平均值的置信区间(3)
例:用8-羟基喹啉法测定Al含量,9次测定的 标准偏差为0.042%,平均值为10.79%。 估计真实值在95%和99%置信水平时应是 多大?
对于有限测定次数,测定值的
偶然误差的分布不符合正态分布,
而是符合t 分布,应用t 分布来处
理有限测量数据。
t 分布曲线:用t 代替正态分
布u,样本标准偏差s代替总体标准
偏差σ有
x
t
分析化学中的数据处理
2019/9/23
7
平均值相同, 精密度不同
2019/9以u表示,令
u
=
x μ σ
得 y=
1
u2
e2
2π
对其进行积分: p 1 .eu2 /2.du 1
2019/9/23
11
u检验:在无系统误差的情况下,检验±u (或单边)范围 内分析结果(或随机误差)出现的概率。
用单次测量值:μ= x±uσ
用平均量值:
x u x u
x
n
并且u检验适用于已知的正态分布方程N(μ,σ2 )
例题p58 8
2019/9/23
12
例题:某炼铁炉中铁水含C量符合正态分布方程( 4.55∽0.1082 ) 现对某日一炉铁水分析5次4.28 4.43 4.42 4.35 4.30, 如果 分析正常(无系统误差),问这炉铁水是否合格(p=95%)
2
说明:(1) 正态分布曲线与横坐标-∞到+∞之间所夹面积, 代表所有数据出现的几率总和其值等于1
(2) 若改变积分区间,可得围成的不同面积。
2019/9/23
9
随机误差在某一区间出现的概率,可以取不同的u值进行积分. 68.3%
-∞ -3 -2 -1 0 1 2 3 +∞
u
=
x μ σ
n
∞
x μ 正态分布 u = σ
2019/9/23
14
t分布曲线与正态分布曲线相似, t分布曲线下一定区间内的积 分面积就是该 区间内随机误差或测量值出现的概率, t分布曲 线不仅随t值改变还与f有关。
初中化学知识点归纳化学实验中的数据处理和分析
初中化学知识点归纳化学实验中的数据处理和分析初中化学知识点归纳:化学实验中的数据处理和分析化学实验是学习化学知识的重要方式之一,它不仅能够帮助学生理论与实践相结合,更能培养学生的动手能力和科学思维。
然而,在进行化学实验过程中,我们常常需要进行数据处理和分析,以便得出准确的实验结果和结论。
本文将介绍初中化学实验中的数据处理和分析的方法和技巧。
一、数据处理在进行化学实验时,我们通常会得到大量的实验数据,如质量、体积、温度、浓度等。
为了方便进行数据处理,我们需要掌握一些常用的数学方法和技巧。
1. 平均值的计算平均值是最常用的数据处理方法之一,它可以帮助我们得到相对准确的结果。
计算平均值的方法很简单,只需要将所有数据相加,然后除以数据的个数即可。
例如,实验中测得的某物质的质量为10g、12g、11g,那么其平均质量即为(10+12+11)g/3=11g。
2. 百分比的计算百分比可以帮助我们了解某一组分在混合物中的比例或者某种物质的纯度。
计算百分比的方法是将某一组分的质量除以混合物的总质量,然后乘以100%。
例如,某混合物中含有25g的盐和75g的水,那么盐的质量占混合物总质量的百分比即为(25g/(25g+75g))*100%=25%。
3. 固体溶解度的计算在化学实验中,我们常常需要计算某些物质在溶液中的溶解度。
计算固体溶解度的方法是将固体溶质的质量除以溶液的体积,然后乘以密度。
例如,某固体在100ml的溶液中溶解了2g,溶液的密度为0.8g/ml,那么该固体的溶解度即为(2g/100ml)*0.8g/ml=0.016g/ml。
二、数据分析除了数据处理,数据分析也是化学实验中必不可少的一环。
通过数据分析,我们可以得出实验结果的规律性,并进一步探索化学的本质。
1.数据的图表表示图表可以直观地展现实验数据的变化趋势和规律,帮助我们更好地理解实验结果。
常见的图表包括柱状图、折线图和饼图等。
在制作图表时,我们需要选择合适的表达方式,并注意坐标轴的标注和比例的选择。
第七章 分析化学中的数据处理
回归分析法
• 设自变量为Xi,对应测量的物理量为Yi,独立观测m次, 则回归直线的数学模型为:
• Y = a + bX + ε
• 其中a和b是待定的常数,ε属于Y的偶然误差。根据
最小二乘法原理,最佳的回归线应是各观测值Yi与落 在回归线上相对应的Yi之间差的平方和为最小,即a与
b的估算值应使 Q m 2 m (Yi Yi )2 最小
第七章 分析化学中的数据处理
• 总体(母体):所考察对象的全体
• 样本(子样):自总体中随机抽出的一组测量 值
• 样本大小(容量):样本中所含测量值的数目。
• 样本平均值: • 总体平均值:
x
1 n
n i 1
xi
lim
n
1 n
n i 1
xi
• 平均偏差:
n
xi
i1
n
n
xi
或 d i1 n
7.1 标准偏差
• 总体标准偏差:
• 样本标准偏差: s
n
(xi )2
i 1
n
n
(xi x)2
i 1
n 1
• 相对标准偏差(变异系数) s 100%
x
标准偏差与平均偏差 及平均值的标准偏差
• 标准偏差与平均偏差:δ=0.7979σ
异常值的取舍
• Grubbs法评价可疑数据
• Grubbs法最大的优点是在判断可疑值的过程中,将正
态分布中的两个最重要的样本参数 及s引入进来,故方
法的准确度较好。
x
• Grubbs法评价可疑数据的步骤如下:
• ①首先把数据从小到大排列,计算全组数据的平均值
分析化学实验数据处理与结果解析要点
分析化学实验数据处理与结果解析要点在分析化学实验中,数据处理和结果解析是非常重要的步骤。
通过准确处理实验数据并解析结果,我们能够得出有关样品性质和组成的重要信息。
下面将介绍分析化学实验数据处理和结果解析的要点。
一、数据处理要点1.数据收集与整理在进行分析化学实验时,首先需要收集实验所需的数据。
在收集数据时,确保数据的准确性和完整性,避免出现误差。
同时,要将数据按照一定的规则进行整理,方便后续的数据处理和结果解析。
2.数据的平均值与标准偏差在处理数据时,常常需要计算数据的平均值和标准偏差。
平均值反映了数据的集中趋势,而标准偏差则表示了数据的离散程度。
通过计算平均值和标准偏差,我们能够对实验数据进行更加准确的分析和判断。
3.误差分析误差是不可避免的,在进行数据处理时需要对误差进行合理的分析。
常见的误差包括系统误差和随机误差。
通过分析误差,我们可以评估实验数据的可靠性,并进行相应的修正和调整。
二、结果解析要点1.结果的可靠性评价在进行结果解析时,首先需要评价结果的可靠性。
可靠性的评价可以通过误差分析、实验重复性等方法进行判断。
只有在结果被认为是可靠的情况下,才能进行进一步的解析和推断。
2.结果与理论比较将实验结果与理论的预期进行比较,可以帮助我们对实验进行解释和理解。
如果实验结果与理论预期相符,那么可以认为实验结果是可靠的,并从中得出结论。
如果实验结果与理论预期存在较大差异,需要进一步分析可能的原因,并进行进一步的实验或修正。
3.结果的图表展示图表是整理和展示实验结果的重要工具。
通过绘制图表,可以更直观地观察和比较实验结果。
在制作图表时,要注明坐标轴、数据单位等重要信息,并保证图表的清晰、准确和美观。
4.结果的讨论和推断在解析实验结果时,要进行充分的讨论和推断。
分析实验结果所得到的性质和组成信息,并与已有的知识进行结合,从而得出合理的推断和结论。
在讨论和推断过程中,要注意逻辑严密、合理性和可重复性。
综上所述,分析化学实验数据处理与结果解析是十分重要的环节。
第7章 分析化学中的数据处理 7.1 标准偏差(标准差或均方误差)
例1:某年全国参加高考的学生化学成绩平均值为μ=75分,
σ=10分,若满分为100分,总分为120分,计算:高于100分和 不及格(低于60分)学生的概率。
解:∵
∴
x =μ±σu
x =100时: | u ||
x
|
100 75 2.5 10
60 75 1.5 x =60时: 10 查P248-表7-2知:|u|=2.5时,P=0.4938 | u || |
y 1 0.399 2
(2)正负误差出现的机会均等;
(3)大误差出现的概率小,小 误差出现的概率大。
7.2.3随机误差的区间概率
实际分析工作中,对误差有两类问题需回答:
(1)某一给定范围的测定,这些测定出现的机会是
多少?
(2)为保证测定有一定把握,这些测定的误差可以
要求在什么范围内? 以上这些问题的回答都要知道误差的区间概率, (即概率密度的积分)
同理:
单次测量的 d (δ)与平均值的 d X ( X 间也有: )
X
n
(无限次测量)
dX
d n
(有限次测量)
7.2 随机误差的正态分布
7.2.1频数分布 频数(ni)——每组中出现的数据个数
ni n ni ——相对频数(或频率) ni
ni ns
——频率密度
ni 以频数(或频率密度) ~组值范围 ns 作图,得频数(或频率密度)分布
例4:某班学生117个数据基本遵从正态分布N(66.62,(0.21)2),
求测量值落在(66.15~67.04)中的概率。 x | u || | 解:∵μ=66.62,σ=0.21,而 ∴当 x1=67.04时, | u || 67.04 66.62 | 2.0 ,查得P1=0.4773
分析化学数据的处理
x
ts n
t计
x
s
n
如果 t计>t表, 则存在显著性差异, 否则不存在显著性差异(P=95%)
例6 用新方法分析结果:10.74%、10.77%、 10.77% 、 10.77% 、 10.81% 、 10.82% 、 10.73%、10.86%、10.81%,已知=10.77%, 试问采用新方法,是否引起系统误差?
解:
F计
s大2 s小2
0.602 0.212
8.2
双边检验, P=90%
f大 9 1 8,f小 11 1 10,F表 3.07
F计 F表,故两方法之间存在显著性差异
四、异常值(可疑值)的取舍
在一组测定值中,常出现个别与其它 数据相差很大的异常值(可疑值)。如 果确定知道此数据由实验差错引起,可 以舍去,否则,应根据一定的统计学方 法决定其取舍。统计学处理取舍的方法 有多种,下面仅介绍三种常用的方法。
y
S代替σ
y
引起偏离
-0.4 -0.3 -0.2 -0.1
-3 -2 -1 0 1 2 3
u x
-0.4 -0.3 -0.2 -0.1
-3 -2 -1 0 1 2 3
u x
一、t 分布曲线:用t 代替正态分布u,样本 标准偏差s代替总体标准偏差σ有
t x
s
u x
y
y
-0.4 -0.3 -0.2 -0.1
解:
F表 9.0(1 f大 6 1 5,f小 4 1 3)
F计
s大2 s小2
0.0552 0.0222
6.25
可见,F计 F表
不 存 在 显 著 性 差 异 ( 单边 检 验 ,95%)
分析化学中的数据处理
x x
再进行
t计=
1
S合
2
.
n1.n2 n1 n2
28
若t计≥t表说明两组数据的平均值有显著性差异 若t计<t表 ………………………..无…………….
说明:查p61中表tα,f f=n1+n2-2(总自由度)
.
29
例题:用两种方法测得Na2CO3%
方法一、 n1=5 x1=42.34
S1=0.10
5. μ σ是正态分布方程两个非常重要的参数,可用 N(μ , σ2 )表示正态分布方程。
.
7
平均值相同, 精密度不同
.
8
三、偶然误差的区间概率
将正态分布曲线横坐标以u表示,令
u
=
x
σ
μ
得 y=
1
u2
e2
2π
对其进行积分: p 1 .eu2/2.du1
2
说明:(1) 正态分布曲线与横坐标-∞到+∞之间所夹面积, 代表所有数据出现的几率总和其值等于1
如:t0.05 ,10 =2.23表示95%置信度,自由度为10的t值(2.23)
t0.01 ,8 =3.36…… 99%……………………..8…… (3.36)
.
15
二、平均值的置信区间(分析结果的表示方法)
μ x t,f .S
总体平均值
n
置信区间
X — 测得数据的平均值
n — 测量次数
S — 标准偏差
分一下组(10组)就会发现这些数据既有分散性又有集中性。 位于1.36-1.44%有65个数, 小于1.27%或大于1.55%数据很少。 每组测量值出现的次数称为频数; 出现次数/100为相对频数(概率密度)。
环境分析化学 第七章 分析化学中的数据处理
6
格鲁布斯(Grubbs)检验法
基本步骤: (1)排序:X1, (3)计算G值:
G计算
X 2,
X 3,
X4……
(2)求X和标准偏差s
Xn X X X1 或 G计算 S S
(4)由测定次数和要求的置信度,查表得G 表 (5)比较 若G计算> G 表,弃去可疑值,反之保留。
( x x ) ( y y)
2
2
⑴若x增大,y也相应增大,称x与y呈正相关。 ⑵若x增大,y相应减少,称x与呈负相关。 ⑶若x与y的变化无关,称x与不相关,此时r=0 。 对于环境分析与监测工作中的标准曲线,应力求相关系数 ∣r∣≥0.999,否则,应找出原因,加以纠正,并重新进行 测定和绘制。
不同置信度下,舍弃可疑数据的Q值表 测定次数 3 4 8 Q90 0.94 0.76 0.47 Q95 0.98 0.85 0.54 Q99 0.99 0.93 0.63
(6)将Q与QX (如 Q90 )相比, 若Q > QX 舍弃该数据, (过失误差造成)
若Q < QX 保留该数据, (偶然误差所致)
13
2.减小测量的相对误差
过小的取样量将影响测定的准确度。如用分 析天平称量,一般要求称量至少为0.2g,滴定管 用于滴定,一般要求滴定液体积至少20mL。
例1:万分之一天平,称量一次的绝对误差为0.0001g。 称量一个试样的绝对误差则为0.0002g。 如欲使称量的相对误差不大于0.1%,那么,应称量 的最小质量为多少?
4
Q 检验法 步骤:
(1) 数据排列
(2) 求极差
X1 X2 …… Xn
Xn - X1
分析化学中的数据处理教案
分析化学中的数据处理教案数据处理在分析化学中是一个重要的环节,它涉及到数据的收集、整理、处理和分析等过程,对于研究、探索和解决化学问题具有重要的意义。
下面是一份关于数据处理的教案,旨在帮助学生掌握如何进行数据处理的基本方法和技巧。
一、教学目标与要求1.了解数据处理在分析化学中的重要性和作用;2.掌握数据收集和整理的方法;3.掌握常用的数据处理方法,包括平均值、标准差、回归分析等;4.培养学生分析和解决化学问题的能力。
二、教学内容及方法1.引入与导入阶段通过引入一些实际的化学数据问题,让学生意识到数据处理的重要性,并讨论数据处理的作用和意义。
2.知识讲解阶段讲解数据的整理和分析的基本原则和方法,包括数据的收集、整理和处理等。
并通过实例讲解常用的统计学方法,例如平均值、标准差、回归分析等。
3.操作训练阶段让学生通过实际操作来进行数据处理,包括收集实验数据、整理实验数据、计算平均值和标准差等。
同时,让学生使用回归分析方法来处理实验数据,并进行结果的解释和分析。
4.问题解决阶段给学生提供一些实际问题,让他们应用所学的数据处理方法进行解决,培养学生独立分析和解决问题的能力。
三、教学过程设计1.引入与导入:通过引入一些实际的化学数据问题,让学生认识到数据处理的重要性和作用。
例如,给学生出示一组实验数据,要求他们分析这组数据是否可靠,他们有什么样的处理方法等。
2.知识讲解:讲解数据的整理和分析的基本原则和方法,包括数据的收集、整理和处理等。
通过实例讲解常用的统计学方法,例如平均值、标准差、回归分析等。
同时,讲解这些方法的原理和应用。
3.操作训练:让学生通过实际操作来进行数据处理,包括收集实验数据、整理实验数据、计算平均值和标准差等。
让学生使用回归分析方法来处理实验数据,并进行结果的解释和分析。
同时,引导学生思考实验数据的合理性和可靠性,并让他们总结出数据处理的一般步骤和方法。
4.问题解决:给学生提供一些实际问题,让他们应用所学的数据处理方法进行解决。
第7章 分析化学中的数据处理
第7章分析化学中的数据处理一、选择题1. 下列各项定义中不正确的是(A) 绝对误差是测定值与真值之差(B) 相对误差是绝对误差在真值中所占的百分比(C) 偏差是指测定值与平均值之差(D) 总体平均值就是真值2. 下列有关偶然误差的论述中不正确的是(A) 偶然误差具有随机性(B) 偶然误差具有单向性(C) 偶然误差在分析中是无法避免的(D) 偶然误差是由一些不确定的偶然因素造成的3. 分析测定中偶然误差的特点是(A) 数值有一定范围(B) 数值无规律可循(C) 大小误差出现的概率相同(D) 正负误差出现的概率相同4. 以下关于偶然误差的叙述正确的是(A) 大小误差出现的概率相等(B) 正负误差出现的概率相等(C) 正误差出现的概率大于负误差(D) 负误差出现的概率大于正误差5. 在量度样本平均值的离散程度时, 应采用的统计量是(A) 变异系数CV(B) 标准差s(D) 全距R(C) 平均值的标准差sx6. 对置信区间的正确理解是(A) 一定置信度下以真值为中心包括测定平均值的区间(B) 一定置信度下以测定平均值为中心包括真值的范围(C) 真值落在某一可靠区间的概率(D) 一定置信度下以真值为中心的可靠范围7. 测定铁矿中Fe 的质量分数, 求得置信度为95%时平均值的置信区间为35.21%±0.10%。
对此区间的正确理解是(A) 在已测定的数据中有95%的数据在此区间内(B) 若再作测定, 有95%将落入此区间内(C) 总体平均值μ落入此区间的概率为95%(D) 在此区间内包括总体平均值μ的把握有95%8. 实验室中一般都是进行少数的平行测定,则其平均值的置信区间为(A)μσ=±x u (B) μσ=±x u n (C) μα=±x t s f , (D) μα=±t s nf ,9. 指出下列表述中错误的表述(A) 置信水平愈高,测定的可靠性愈高(B) 置信水平愈高,置信区间愈宽(C) 置信区间的大小与测定次数的平方根成反比(D) 置信区间的位置取决于测定的平均值10. 若已知一组测量数据的总体标准差σ,要检验该组数据是否符合正态分布,则应当用(A) t 检验 (B) u 检验 (C) F 检验 (D) Q 检验11. 有两组分析数据,要比较它们的精密度有无显著性差异,则应当用(A) F 检验 (B) t 检验 (C) u 检验 (D) Q 检验12. 有一组平行测定所得的数据,要判断其中是否有可疑值,应采用(A) t 检验 (B) u 检验 (C) F 检验 (D) Q 检验13. 以下各项措施中,可以减小偶然误差的是(A) 进行仪器校正 (B) 做对照试验(C) 增加平行测定次数 (D) 做空白试验14. 称取含氮试样0.2g,经消化转为NH 4+后加碱蒸馏出NH 3,用10 mL 0.05 mol/LHCl 吸收,回滴时耗去0.05 mol/L NaOH 9.5 mL 。
第七章分析化学中的数据处理
这种差异是由偶然误差引起的,还是系统误差引起 的?
这类问题在统计学中属于“假设检验”。如果分析 结果之间存在“显著性差异”,就认为它们之间有 明显的系统误差;否则就认为没有系统误差,纯属 偶然误差引起的,认为是正常的。
t0.01,3 5.84, (47.60 0.23)%
从本例可看出,置信度越高,置信区间就越大, 即所估计的区间包括真值的可能性就越大,在 分析化学中,一般置信度在95%或90%。
显著性检验- t 检验法
在实际工作中,往往会遇到对标准或纯物质进行测 定时,所得到的平均值与标准值不完全一致;
线呈对称钟形,两头小,中间大,分
布曲线有最高点。
y
1
x
0
x-
正态分布的数学表达式: y
y f (x) 1 e(x )2 / 2 2
2
式中:
y-概率密度 x-测量值 -总体平均值 -标准偏差 (x- )-随机误差
x
0
x-
y f (x) 1 e(x )2 / 2 2
2
若以x- (随机误差)为横坐标,y(概率密度) 为纵坐标,那么随机误差的正态分布曲线为:
于20,那么这时平均偏差可用 d 表示。
d xi x n
平均偏差表示精密度比较简单,但有不足之处。因 为在一组测定数据中,小偏差的测定次数总是占多数,
而大偏差测定次数总是占少数,按平均偏差结果,那 么大偏差得不到充分的反映。
例如: 测定铁矿石中铁含量8次,数据如下: 56.12、 56.30、 56.32、 56.38、 56.34、 56.40、 56.42、 56.50。 平均值为56.35
分析化学中的数据处理教案
第7章 分析化学中的数据处理教学目的:用数理统计的方法处理实验数据,将会更好地表达结果,既能显示出测量的精细度,又能表达出结果的准确度;介绍显著性检验的方法,用于检验样本值与标准值的比较、两个平均值的比较和可疑值的取舍。
教学重点:总体平均值的估计;t 检验法教学难点:对随机变量正态分布的理解;各种检验法的正确使用,双侧和单侧检验如何查表。
1.总体与样本总体:在统计学中,对于所考察的对象的全体,称为总体〔或母体〕。
个体:组成总体的每个单元。
样本〔子样〕:自总体中随机抽取的一组测量值〔自总体中随机抽取的一局部个体〕。
样本容量:样品中所包含个体的数目,用n 表示。
例题:分析延河水总硬度,依照取样规那么,从延河取来供分析用2000ml 样品水,这2000ml 样品水是供分析用的总体,如果从样品水中取出20个试样进展平行分析,得到20个分析结果,那么这组分析结果就是延河样品水的一个随机样本,样本容量为20。
2.随机变量 来自同一总体的无限多个测量值都是随机出现的,叫随机变量。
1i x x n=∑,1lim in x n μ→∞=∑〔总体平均值〕,x n μδ-=∑〔单次测量的平均偏差〕7.1 标准偏差7.1.1总体标准偏差〔无限次测量〕σ=-测量次数7.1.2样本标准偏差〔有限次测量〕S =〔n -1〕-自由度7.1.3相对标准偏差相对标准偏差〔变异系数〕100%sCV x =⨯100%dx=⨯相对平均偏差 7.1.4标准偏差与平均偏差当测定次数非常多〔n 大于20〕时,0.7970.8δσσ=≈,但是00.8d S ≠7.1.5平均值的标准偏差统计学可证明平均值的标准偏差与单次测量结果的标准偏差存在以下关系:x σ,x δ=〔无限次测量〕x s =x d d =〔有限次测量〕 增加测定次数,可使平均值的标准偏差减少,但测定次数增加到一定程度时,这种减少作用不明显,因此在实际工作中,一般平行测定3-4次即可;当要求较高时,可适当增加平行测量次数<例>7.2 随机误差的正态分布7.2.1频数分布频数:每组中数据的个数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章分析化学中的数据处理
一、大纲要求及考点提示
掌握准确度、精密度的概念和表示方法;了解误差产生原因及减免方法;了解统计学的基本概念;熟悉有限次实验数据的统计处理;熟悉有效数字及运算规则。
二、主要概念、重要定理与公式
(一)基本概念
1. 平行测定:由同一个人,用同一种方法,对同一个样品进行的多次测定,称平行测定。
2. 平均值
3. 平均偏差
偏差是用于衡量分析结果的精密度。
平均偏差是用来表示一组测定结果的精密度。
4. 相对平均偏差
5. 样本标准偏差
这是最常用的表示分析结果精密度的方法,用标准偏差衡量数据的分散程度比平均偏差更为恰当。
对有限次测量所得到的分析数据,标准偏差为样本标准偏差
6. 总体标准偏差
当测量次数为无限多次时,各测量值对总体平均值的偏差,用总体标准偏差表示。
7. 相对标准偏差
相对标准偏差(也叫变异系数)
8. 标准偏差与平均偏差
当测量次数非常多时,标准偏差与标准偏差有下列关系:δ=0.797σ≈0.80σ
9. 平均值的标准偏差
(二)随机误差的正态分布
1.正态分布
分析化学中测量结果的数据一般都符合正态分布的规律。
2.随机误差的区间概率
3.少量数据的统计处理
(1) t检验法:
对于少量实验数据要用t分布进行统计处理,以合理推断总体的特性。
t分布曲线下一定范围内的积分面积就是t值在该范围内出现的概率。
:
(2) F检验法
检验两组数据的精密度是否存在差异,要用F检验法。
4.异常值的取舍
一组平行测定数据,有时会有个别离群数据。
对不能确定的异常值要进行校验后进行取舍。
常用的异常值的检验方法有Q检验法、4d法、Groubbs法等。
5.误差传递
(1)系统误差的传递规则:
加减法运算时,分析结果的巨额多误差是各部绝对误差的代数和,如果有关项有系数,
则要将系数考虑在内;乘除运算时,,分析结果的相对误差是各部相对误差的代数和。
(2)随机误差的传递规则
加减法运算时,分析结果的标准偏差的平方是各部标准偏差平方的总和,如果有关项有系数,则要将系数考虑在内;乘除法运算时,分析结果的相对标准偏差的平方是各步相对标准偏差的平方的总和。
极值误差是指在最不利的情况下,各种误差相叠加而产生的最大的误差。
加减法计算时,极值误差为各步绝对误差绝对值的代数和,乘除法运算时,极值误差为各步相对误差绝对值的代数和。
6.回归分析法
分析化学中常用回归分析法来研究测量值和组分含量之间的关系。
7.提高分析结果准确度的方法
分析时常用减小测量误差、增加平行测定次数、消除测量中的系统误差、选择合适的分析方法等措施来提高分析结果准确度。
因为系统误差是由某些固定的原因造成的,因而可以采取对照实验、空白实验、校准仪器和对分析结果进行校正等方法来消除。
三、典型例题
1. 测定试样中CaO含量,得到如下结果:35.65%,35.69%,35.72%,35.60%,问:(1)统计处理后的分析结果应该如何表示?
(2)比较95%和90%置信度下总体平均值和置信区间。
解:
(2) 当置信度为95%,t=3.18 :
即总体平均值的置信区间为(35.58,35.74);
当置信度为90%,t=2.35 :
即总体平均值的置信区间为(35.60,35.72)。
2. 根据以往的经验,用某一种方法测定矿样中锰的含量的标准偏差(即δ)是0.12%。
现测得含锰量为9.56%,如果分析结果分别是根据一次、四次、九次测定得到的,计算各次结果平均值的置信区间(95%置信度)。
答:
平均值的置信区间分别为:
一次:(9.32%,9.80%);四次:(9.44%,9.68%);九次:(9.48%,9.64%)。
3. 根据以往的经验,用某一种方法测定矿样中锰的含量的标准偏差(即δ)是0.12%。
现测得含锰量为9.56%,如果分析结果分别是根据一次、四次、九次测定得到的,计算各次结果平均值的置信区间(95%置信度)。
解:
平均值的置信区间分别为:
一次:(9.32%,9.80%);四次:(9.44%,9.68%);九次:(9.48%,9.64%)。
4. 在不同温度下对某试样作分析,所得结果(%)如下:
10℃ : 96.5, 95.8, 97.1, 96.0
37℃ : 94.2, 93.0, 95.0, 93.0, 94.5
试比较两组结果是否有显著差异。
(置信度为95%)
解:
表明和没有显著差异。
所以两组数据存在着显著差异。
5. 某人测定一溶液的摩尔浓度(mol·L-1),获得以下结果:0.2038,0.2042,0.2052,0.2039。
第三个结果应否弃去?结果应该如何表示?测了第五次,结果为0.2041,这时第三个结果可以弃去吗?
解:
第三个结果不应该弃去。
这时如果置信度为0.90,第三个结果应该舍去。