最新分析化学中的数据处理教学讲义ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
次数的平方根成反比.②增加测定次数,
可使平均值的标准偏差减小。
作
s x
n 关系图如P59图3-5所示。
s
s x
开始时,s 随 n 减 少 很快,n>5变化较 慢,而当n>10时, 变化很小,进一步增 加测定次数,徒劳无 益,对提高分析结果 可靠性并无更多好处。 实际中,一般的分析 作3~5次平行测定 即可,而标样、物理 常数、原子量的测定 则次数较多
分布曲线与正态分布曲线 相似,只是① t分布曲线 随自由度f(f= n-1)而改
变,当 n时,f ,
t分布曲线即正态分布曲 线。
②与正态分布曲线一样,t分布曲线下面一
定范围内的面积,即是该范围内测定值出
现的概率,但应注意,对于正态分布曲线,
Fra Baidu bibliotek
只要u值一定,相应的概率也就一定;但对
于t分布曲线,当t一定时,由于f不同,相
(x )2
n
②样本标准偏差
(2-2)
当测量值不多,总体平均值又不知道时, 用样本的标准偏差s来衡量该组数据的分 散程度。
s (x x)2 n 1
当测量次数非常多时,测量次数n与自由度
(n-1)的区别就很小了,此时 x
即
lim(xx)2 (x)2
n n1
n
同时s
③平均值的标准偏差(P58)
单次测定值的标准差S反映的是单次测定
值x1, x2, x3xn
之间的离散性
平各均平值均的值标准差X反1,映X2的...是之.X若间n 干的组离平散行性测定,
若对某试样作若干批测定,每批又作n个 平行测定
则
S X=
S n
由此可见:
(2-4)
①平均值的精密度比单次测定的精密度
更好,S X S ;平均值的标准偏差与测定
分析测定中的随机误差也是这样的,P55图 3-3即为正态分布曲线,它的数学表达式为:
式中y-y为=f概(率x)= 密度12x-e- ( 为x2-测2) 2 量值
(2-5)
µ-为总体平均值,即无限次测定数据的 平均值,相应于曲线最高点的横坐标值, 在没有系统误差时,它即为真值 ,它
反映x T 无限个测量数据分布的集中趋势
分析化学中的数据处理
设样本容量为n,则其平均值为 x
x
1 n
x
当测量次数无限多时,所得平均值 即为 总体平均值μ:
lim 1 x
n n
(2-1)
若没有系统误差,则总体平均值µ就是真
实值 x T
在分析化学中,广泛采用标准偏差来衡 量数据的分散(离散)程度
①总体标准偏差
当测量次数为无限多次时,各测量值对总 体平均值µ的偏离,用总体标准偏差σ表示:
y=f(x)= 1
-u2
e2
2
又 dx=du
所以
f( x) dx=1
-u2
e 2du(u)du
2
即将式(2-5)转化为只有变量u的方程
y=(u)
1
-u2
e2
2
(2-6)
因此曲线的形状与σ大小无关,即不同σ
曲线皆合为一条
标准正态分布曲线见P56图3-4
2.随机误差的区间概率
正态分布曲线与横坐标-∞到+∞之间所夹的面积代表
99.1%
u 3
x3
2×0.4987= 99.7%
从计算结果可知,95%以上的测量值都会 落在范围内,随机误差x-μ超过 3 的 大误差(或测量值)出现的概率<0.3%,一 般化学分析是作几次测定,所以可以认为 实际上是不可能出现的,如一旦出现,可 认为其不是由于随机因素引起的,应弃去。
例:P57 例7、例8、例9
§2.3 少量数据的统计处理
对无限次测量而言,总体平均值µ衡量数 据的集中趋势,总体标准差σ反映了数据 的离散程度,但是,分析化学中常常只 作有限次测定。下面将讨论如何通过有 限次测定结果对µ和σ进行估计,从而合 理地推断总体的特性
一.有限次测量时的随机误差
正态分布是无限次测量数据的分布规律,
而实际测定只能是有限次,其分布规律
全部数据出现概率的总和,显然应当是100%,即为1
P=
(u)du 1
u2
e 2du1
2
(2-7)
随机误差或测量值在某一区间出现的概率可取不同u值
对式(2-7)进行定积分,求得面积(即为概率),并
制得标准正态分布概率积分表。表的形式有很多种,为
了区别,在表上方一般绘图说明表中所列值是什么区间
不可能完全相同。 英国的统计学家兼化
学家戈塞特(W.S.GOSSET)提出了t分
布规律 t x x n
s
s
(平2-均8值)的(书标P准60偏公x差式3-s 29有误s)
x
n
µ-总体平均值,无系统 误差时就是真值,t分布 曲线如图2-2(P60图3 -6)所示,纵坐标仍为 概率密度,横坐标为t,t
σ-总体标准偏差,是µ到曲线两拐点之一 的距离,它表征数据的分散程度,σ小, 数据集中,曲线瘦高;σ大,数据分散, 曲线矮胖。
X-µ表示随机误差,若以X-µ为横坐标, 则曲线最高点横坐标为0,即为随机误差 的正态分布曲线
由图可看到随机误差有以下 规律性:
1)偏差大小相等、符号相反的 测定值出现的概率大致相等
的概率,表中列出的面积与图中阴影部分相对应(P57
表3-2),表示随机误差在此区间的概率,若是求
区间的概率,利用正 态u 分布的对称性,必须乘以2
随机误差出现 的区间
u 1
测量值出现的 概率P 区间
2×0.3413=
x1 68.3%
u 2
x2
2×0.4773= 95.5%
u2.6
x2.6 2×0.4953=
应曲线所包括的面积,即概率也就不同。
为此引入置信度的概念,置信度P-人们对
所作判断的把握程度,其实质为某事件出
现的概率,在此表示某一t值时,平均值落
§2.2随机误差的正态分布(P53)
随机误差是由一些偶然因素造成的误 差,其大小、方向都不固定,难以预 计,不能测量也无法消除。它的出现 似乎很不规律,但实质上,它的出现 和分布服从统计规律
1.正态分布(高斯GAUSS分布)
它在概率统计中占有特别重要的地位,因为 许多随机变量都服从或近似服从正态分布,
2)偏差小的测定值比偏差较大 的测定值出现的概率大,偏 差很大的测定值出现的概率 极小,趋近于0
3)大多数测定值集中在µ的附 近,所以µ为最可信赖值或 最佳值
正态分布曲线随µ、σ值不同而不同,应
用起来不方便,为此,采用变量转换的
方法,将其化为同一分布-标准正态分
布
即
u= x-
令 代入(2-5)式得
可使平均值的标准偏差减小。
作
s x
n 关系图如P59图3-5所示。
s
s x
开始时,s 随 n 减 少 很快,n>5变化较 慢,而当n>10时, 变化很小,进一步增 加测定次数,徒劳无 益,对提高分析结果 可靠性并无更多好处。 实际中,一般的分析 作3~5次平行测定 即可,而标样、物理 常数、原子量的测定 则次数较多
分布曲线与正态分布曲线 相似,只是① t分布曲线 随自由度f(f= n-1)而改
变,当 n时,f ,
t分布曲线即正态分布曲 线。
②与正态分布曲线一样,t分布曲线下面一
定范围内的面积,即是该范围内测定值出
现的概率,但应注意,对于正态分布曲线,
Fra Baidu bibliotek
只要u值一定,相应的概率也就一定;但对
于t分布曲线,当t一定时,由于f不同,相
(x )2
n
②样本标准偏差
(2-2)
当测量值不多,总体平均值又不知道时, 用样本的标准偏差s来衡量该组数据的分 散程度。
s (x x)2 n 1
当测量次数非常多时,测量次数n与自由度
(n-1)的区别就很小了,此时 x
即
lim(xx)2 (x)2
n n1
n
同时s
③平均值的标准偏差(P58)
单次测定值的标准差S反映的是单次测定
值x1, x2, x3xn
之间的离散性
平各均平值均的值标准差X反1,映X2的...是之.X若间n 干的组离平散行性测定,
若对某试样作若干批测定,每批又作n个 平行测定
则
S X=
S n
由此可见:
(2-4)
①平均值的精密度比单次测定的精密度
更好,S X S ;平均值的标准偏差与测定
分析测定中的随机误差也是这样的,P55图 3-3即为正态分布曲线,它的数学表达式为:
式中y-y为=f概(率x)= 密度12x-e- ( 为x2-测2) 2 量值
(2-5)
µ-为总体平均值,即无限次测定数据的 平均值,相应于曲线最高点的横坐标值, 在没有系统误差时,它即为真值 ,它
反映x T 无限个测量数据分布的集中趋势
分析化学中的数据处理
设样本容量为n,则其平均值为 x
x
1 n
x
当测量次数无限多时,所得平均值 即为 总体平均值μ:
lim 1 x
n n
(2-1)
若没有系统误差,则总体平均值µ就是真
实值 x T
在分析化学中,广泛采用标准偏差来衡 量数据的分散(离散)程度
①总体标准偏差
当测量次数为无限多次时,各测量值对总 体平均值µ的偏离,用总体标准偏差σ表示:
y=f(x)= 1
-u2
e2
2
又 dx=du
所以
f( x) dx=1
-u2
e 2du(u)du
2
即将式(2-5)转化为只有变量u的方程
y=(u)
1
-u2
e2
2
(2-6)
因此曲线的形状与σ大小无关,即不同σ
曲线皆合为一条
标准正态分布曲线见P56图3-4
2.随机误差的区间概率
正态分布曲线与横坐标-∞到+∞之间所夹的面积代表
99.1%
u 3
x3
2×0.4987= 99.7%
从计算结果可知,95%以上的测量值都会 落在范围内,随机误差x-μ超过 3 的 大误差(或测量值)出现的概率<0.3%,一 般化学分析是作几次测定,所以可以认为 实际上是不可能出现的,如一旦出现,可 认为其不是由于随机因素引起的,应弃去。
例:P57 例7、例8、例9
§2.3 少量数据的统计处理
对无限次测量而言,总体平均值µ衡量数 据的集中趋势,总体标准差σ反映了数据 的离散程度,但是,分析化学中常常只 作有限次测定。下面将讨论如何通过有 限次测定结果对µ和σ进行估计,从而合 理地推断总体的特性
一.有限次测量时的随机误差
正态分布是无限次测量数据的分布规律,
而实际测定只能是有限次,其分布规律
全部数据出现概率的总和,显然应当是100%,即为1
P=
(u)du 1
u2
e 2du1
2
(2-7)
随机误差或测量值在某一区间出现的概率可取不同u值
对式(2-7)进行定积分,求得面积(即为概率),并
制得标准正态分布概率积分表。表的形式有很多种,为
了区别,在表上方一般绘图说明表中所列值是什么区间
不可能完全相同。 英国的统计学家兼化
学家戈塞特(W.S.GOSSET)提出了t分
布规律 t x x n
s
s
(平2-均8值)的(书标P准60偏公x差式3-s 29有误s)
x
n
µ-总体平均值,无系统 误差时就是真值,t分布 曲线如图2-2(P60图3 -6)所示,纵坐标仍为 概率密度,横坐标为t,t
σ-总体标准偏差,是µ到曲线两拐点之一 的距离,它表征数据的分散程度,σ小, 数据集中,曲线瘦高;σ大,数据分散, 曲线矮胖。
X-µ表示随机误差,若以X-µ为横坐标, 则曲线最高点横坐标为0,即为随机误差 的正态分布曲线
由图可看到随机误差有以下 规律性:
1)偏差大小相等、符号相反的 测定值出现的概率大致相等
的概率,表中列出的面积与图中阴影部分相对应(P57
表3-2),表示随机误差在此区间的概率,若是求
区间的概率,利用正 态u 分布的对称性,必须乘以2
随机误差出现 的区间
u 1
测量值出现的 概率P 区间
2×0.3413=
x1 68.3%
u 2
x2
2×0.4773= 95.5%
u2.6
x2.6 2×0.4953=
应曲线所包括的面积,即概率也就不同。
为此引入置信度的概念,置信度P-人们对
所作判断的把握程度,其实质为某事件出
现的概率,在此表示某一t值时,平均值落
§2.2随机误差的正态分布(P53)
随机误差是由一些偶然因素造成的误 差,其大小、方向都不固定,难以预 计,不能测量也无法消除。它的出现 似乎很不规律,但实质上,它的出现 和分布服从统计规律
1.正态分布(高斯GAUSS分布)
它在概率统计中占有特别重要的地位,因为 许多随机变量都服从或近似服从正态分布,
2)偏差小的测定值比偏差较大 的测定值出现的概率大,偏 差很大的测定值出现的概率 极小,趋近于0
3)大多数测定值集中在µ的附 近,所以µ为最可信赖值或 最佳值
正态分布曲线随µ、σ值不同而不同,应
用起来不方便,为此,采用变量转换的
方法,将其化为同一分布-标准正态分
布
即
u= x-
令 代入(2-5)式得