定量分析中的数据处理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

方差
总体方差:测定值与真值的差的平方和 总体方差: 除以测定次数n。 除以测定次数 。
σ
2
∑ (x ) =
i
2
n
( n → ∞)
样本方差: 样本方差:
S
2
∑ (x X ) =
i
2
n 1
(n< 20)
Biblioteka Baidu
标准差
标准差:方差的平方根为标准偏差。 标准差:方差的平方根为标准偏差。 总体的标准差也称标准误差,对真值言。 总体的标准差也称标准误差,对真值言。 标准误差
x
工业生产中还常用极差和公差来表示,具体采用哪 工业生产中还常用极差和公差来表示 具体采用哪 极差 来表示 一种表示法、 分析结果的要求决定。 一种表示法、由分析结果的要求决定。 另外:表示误差的数值时, 另外:表示误差的数值时,用1-2位有效数字 位有效数字 即可。 即可。

例:有两位分析人员对同一样品进行分析,都平 两位分析人员对同一样品进行分析 分析人员对同一样品进行分析, 行做了8 得到以下两组数据, 行做了 8 次 , 得到以下两组数据 , 计算两组数据 的平均偏差( 与标准偏差( 的平均偏差( d)与标准偏差(s): 1. X : 0.11, -0.73, 0.24, 0.51, . X -0.14, 0.00, 0.30, -0.21, n= 8 d1 =0.28 s1=0.38 2 X X :0.18, 0.26,-0.25,-0.37, , , , , 0.32 , -0.28,0.31, -0.27 , , s2=0.29 n=8 d 2 =0.28 , s1>s2 d1 = d 2 用标准偏差比用平均偏差更能显示数据的离散性, 标准偏差比用平均偏差更能显示数据的离散性, 比用平均偏差更能显示数据的离散性 因而更科学更准确。 因而更科学更准确。
1.43 1.40 1.39 1.37 1.39 1.50 1.39 1.39 1.41 1.43
1.41 1.34 1.42 1.46 1.53 1.43 1.45 1.40 1.37 1.42
1.37 1.42 1.42 1.44 1.36 1.45 1.31 1.38 1.46 1.41
1.40 1.42 1.30 1.45 1.48 1.43 1.41 1.35 1.36 1.41
(3)精密度的表示法 )
在误差概念的讨论中己知 可用误差和偏差来表 在误差概念的讨论中己知,可用误差和偏差来表 示测定数据的准确度和精密度。 示测定数据的准确度和精密度。而精密度是对 有限次测定数据的离散程度。 、 有限次测定数据的离散程度。d、d 、 d 、 R(极差 和公差来表示。 极差) R(极差)和公差来表示。 X 根据对数据处理的要求不同,数据的精密度还 根据对数据处理的要求不同,数据的精密度还 常用以下几种方法表示。 常用以下几种方法表示。 几种方法表示
2
S
__
-相对标准偏差也称变异系数。 相对标准偏差也称变异系数。 称变异系数
X
在要求较严格的测定数据时, 在要求较严格的测定数据时,一般用变异系数 来表示误差。 来表示误差。
标准误差与标准偏差的特点
1. 标准误差相对真值而言,测定次 数为 标准误差相对真值而言, 真值而言 n→∞ 2. 标准偏差相对平均值而言,计算公式中 标准偏差相对平均值而言, 平均值而言 称为自由度( 的n-1称为自由度(通俗的理解可为:做 称为自由度 通俗的理解可为: 次实验, 次可以做对比)。 了n次实验,有n-1次可以做对比)。 次实验 次可以做对比
(1)总体、样本、个体和样本容量 )总体、样本、
总体:研究对象的全体称为总体(或母 总体:研究对象的全体称为总体( 全体称为总体 体); 样本:(或子样):自总体中随机抽出 样本: 或子样):自总体中随机抽出 ):自总体中 一部分样品称为样本 或子样); 样品称为样本( 的 一部分样品称为样本(或子样); 个体:组成总体的每一个单元称之为个 个体: 体; 样本容量:样本中所含个体的数目称为 样本容量:样本中所含个体的数目 个体的数目称为 样本大小(或样本容量) 样本大小(或样本容量)
频数分布表(图表)
分组 1.265~1.295 1.295~1.325 1.325~1.355 1.355~1.385 1.385~1.415 1.415~1.445 1.445~1.475 1.475~1.505 1.505~1.535 1.535~1.565 频数 1 4 7 17 24 24 15 6 1 1 100 相对频数 0.01 0.04 0.07 0.17 0.24 0.24 0.15 0.06 0.01 0.01 1
频数分布
对上表100个数据的分析: 个数据的分析: 对上表 个数据的分析 1. 有两个极值,最小为1.27,最大为1.55。 两个极值,最小为 ,最大为 。 2. R(极值)=1.55-1.27=0.28≈0.30(方便 (极值) ( 处理) 处理) 3. 把数据分为 组则组距为 把数据分为10组则组距为0.03,将各测 , 量值对号编入。 量值对号编入。 4. 制频数分布表。 制频数分布表。
2. 随机误差的分布
随机误差(偶然误差)是由一些偶然因 随机误差(偶然误差) 素造成的误差, 素造成的误差,它的大小和方向难以估 计,似乎没有什么规律,但如果用统计 似乎没有什么规律,
学方法处理,就会发现它服从一定的统 方法处理,
计规律。为了弄清随机误差的统计规律, 计规律。为了弄清随机误差的统计规律, 弄清随机误差的统计规律 下面我们来讨论以下两个问题。 下面我们来讨论以下两个问题。 (1)频数分布 ) (2)正态分布 )
Σ(xi ) σ= (n →∞) n
2
由于真值不知道,所以标准误差少用。 由于真值不知道,所以标准误差少用。
样本标准差(标准偏差) 样本标准差(标准偏差)与变异系数
样本标准差也称为标准偏差: 平均值而言。 样本标准差也称为标准偏差:对平均值而言。 标准偏差
Σ(xi X ) S= (n<20) n 1
2-2 定量分析中的数据处理 及评价
1、数据处理中的几个术语及其意义 、
在实际的分析测试工作中,测试所得的 实际的分析测试工作中, 的分析测试工作中 数据总是参差不齐 误差是客观存在的。 参差不齐, 数据总是参差不齐,误差是客观存在的。 如何对所得的数据进行处理和评价, 如何对所得的数据进行处理和评价,找 出其规律,判断分析结果的可靠性, 出其规律,判断分析结果的可靠性,并 用于指导实践。数理统计法是处理与评 用于指导实践。数理统计法是处理与评 价数据的科学方法。 价数据的科学方法。先介绍有关的的几 个术语: 个术语: (1)总体、样本和个体 )总体、 (2)平均值和中位数 ) (3)精密度的表示方法 )
1 Y = f (X) = σ 2π
e
( x )2
2σ 2
举例说明
对某一批软锰矿中二氧化锰含量的测定。分析 对某一批软锰矿中二氧化锰含量的测定。 人员按分析标准规定,对物料进行处理(取样、 进行处理 人员按分析标准规定,对物料进行处理(取样、 粉碎、过筛和缩分等前处理的过程),最后得 粉碎、过筛和缩分等前处理的过程),最后得 前处理的过程),最后 到约500g供分析用的试样,这就是总体。从 供分析用的试样, 总体。 到约 供分析用的试样 这就是总体 500g的试样(总体)中取12份软锰矿样品来进 的试样( 样品来进 的试样 总体) 份软锰矿样品 行分析,得到12个测定值 这一组测定值( 个测定值, 行分析,得到 个测定值,这一组测定值(12 个数据)称为本软锰矿试样总体的随机样本 随机样本, 个数据)称为本软锰矿试样总体的随机样本, 样本容量为12。 样本容量为 。 由于不可能对总体中的每一个个体都进行研究, 由于不可能对总体中的每一个个体都进行研究, 应用统计学的方法对样本(有限的个体) 应用统计学的方法对样本(有限的个体)的研究 来研究总体。如上例中,通过12次的测定的数值 次的测定的数值, 来研究总体。如上例中,通过 次的测定的数值, 来确定该批软锰矿中二氧化锰的含量。 来确定该批软锰矿中二氧化锰的含量。
1.32 1.45 1.34 1.32 1.40 1.41 1.44 1.42 1.37 1.44
1.42 1.35 1.42 1.48 1.39 1.48 1.44 1.43 1.27 1.48
1.47 1.42 1.37 1.40 1.38 1.39 1.42 1.42 1.47 1.55
1.39 1.39 1.36 1.45 1.40 1.45 1.47 1.42 1.38 1.37
精密度表示法小结
测定结果数据精密度的表示法有: 测定结果数据精密度的表示法有:
– – – – – 偏差( ) 偏差(d) 平均偏差( 平均偏差( d) __ d 相对平均偏差( 即精密度) 相对平均偏差( __ 即精密度) 标准偏差( 标准偏差(s) x S 相对标准偏差( 变异系数) 相对标准偏差( __ 即 :变异系数)
1 n X = Σx n i=1 i
中位数
中位数:位于一系列按递增或递减排列数据中 中位数:位于一系列按递增或递减排列数据中 间的数据称为中位数。 间的数据称为中位数。 (1)数据的数目 为奇数时,居于中间的数值 为奇数时 )数据的数目n为奇数 一个; 仅一个; (2)数据的数目 为偶数时,居于中间的数值 为偶数时 )数据的数目n为偶数 两个,此时中位数为它们的平均值 中位数为它们的平均值; 有两个,此时中位数为它们的平均值; (3)采用中位数的优点是:计算简便,它与 优点是 计算简便, )采用中位数的优点 两端极值的变化无关,当测量次数较少、 两端极值的变化无关,当测量次数较少、而且 又有大误差出现,数据处理有困难时, 又有大误差出现,数据处理有困难时,采用中 位数较好。 位数较好。 小结:平均值和中位数表示数据的集中趋势 即 小结:平均值和中位数表示数据的集中趋势,即 数据集中在平均值或中位数附近。 数据集中在平均值或中位数附近。
测定数据表
有一矿石试样, 有一矿石试样,在相同条件下用吸光光度法测定其中铜的百 分含量,共有100个测量值。这些测量值属随机变量 个测量值。 分含量,共有 个测量值
1.36 1.41 1.44 1.37 1.39 1.46 1.37 1.35 1.42 1.42
1.49 1.36 1.42 1.34 1.46 1.45 1.46 1.36 1.40 1.34
(2 )平均值和中位数
平均值 总体平均值:当测量次数和测量数据无 总体平均值:当测量次数和测量数据无 限多时, 限多时,其平均值称为总体平均值或均 即为真值。真值: 值,即为真值 。真值:
1 = lim ∑xi n→ ∞ n
样本算术平均值(也称平均值、均值,测定有限 样本算术平均值(也称平均值、均值 测定有限 次,在分析测试工作中一般 n<20),将所得 < ) 数据的总和除于测定次数而得: 数据的总和除于测定次数而得:

数据频数分布规律
由以上数据,我们可以发现位于中 由以上数据, 间数值1.36~1.44之间的数据多一些, 之间的数据多一些, 间数值 ~ 之间的数据多一些 其他范围的数据少一些,小于1.27或 其他范围的数据少一些,小于 或 大于1.55的数据更少一些。这就是说 的数据更少一些。 大于 的数据更少一些 测量数据中有明显的集中趋势。 测量数据中有明显的集中趋势。测 量数据的这种既分散又集中的特性, 量数据的这种既分散又集中的特性, 就是其规律性。 就是其规律性。
频数分布图
在位于中间数 值1.36~1.44之 ~ 之 间的数据多一 些,其他范围 的数据少一些, 的数据少一些, 小于1.27或大 或大 小于 于1.55的数据 的数据 更少一些。 更少一些。测 量数据有明显 的集中趋势。 的集中趋势。
2.随机误差的正态分布 随机误差的正态分布
定量分析的随机测量值或偶然误差的分布 都符合正态分布规律 正态分布规律, 都符合正态分布规律,正态分布就是数学 上的高斯分布 可用高斯方程描述: 高斯分布, 上的高斯分布,可用高斯方程描述:
相关文档
最新文档