分析化学中的数据处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
以上这些问题的回答都要知道误差的区间概率,
(即概率密度的积分)
CHENLI
17
记作: N(,2)
CHENLI
14
2、标准正态分布曲线
为一方便求出某区间的概率,将横坐标进行变量代换。
定义: u x
(即:以σ为单位来表征随机误差)
则:
yf(x) 1 eu2/2
2
x u dxdu
∴ f(x )d x1e u 2/2d u1e u 2/2 d u (u )d—u—概率
(1) ——数据的集中趋势
(2) ——数据的离散倾向
1、正态分布曲线
e(
x)2 2 2
y f (x)
2
CHENLI
11
( x )2
y f (x) e 22
2
式中:
y——相当于测量值x出现的频率密度
(或概率密度)
μ——相当于总体平均值
x
相当于曲线最高点对应的横坐标值,表征数据的集中趋势
σ——总体标准差
以频数(或频率密度) n i ~组值范围 ns
作图,得频数(或频率密度)分布
直方图。(见P245-图7-1) CHENLI
10
7.2.2正态分布(高斯G.F.Gauss分布)
对上述分析数据进行整理时,数据具有以下特性:
①向某中心值集中的趋势;②偏离此中心值的倾向。
为明确表达数据的特性,我们通常
用两个特性参数来表征一组数据:
式中: ——差方和
(它能更(好x地说)明2数Q 据的分散程度)
CHENLI
4
7.1.2 样本标准偏差S
S (xx)2 n1 (n为有限值,一般<20且无系统误差)
同样:式中 (xx)2 Q ——差方和(即偏差的平方和)
S与σ比较:(1)用 x 代替了μ;(2)用n-1代替了n。
式中:n-1 = f ——自由度
标准偏差的计算:
∵
(等 效( 式x ,x ) 可2 直 接x 2 利 用( 测x ) 量2 /数n据计算)
∴
S
x2 C(HxE)N2LI/n
5
n1
7.1.3 相对标准偏差(变异系数或变动系数)
相对标准偏差 = S/x10% 0 (或1000‰)
7.1.4标准偏差σ(或s)与平均偏差δ(或 d)的异同点
相当于μ到曲线两拐点之一的距离,表征数据的分散程度
x(自变量)——个别测量值
x-μ——代表测量值对μ的偏离CH(ENL表I 征随机误差)
12
随机误差有以下规律:
(1)单峰性 当x=μ时(无系统误差时μ=xT),ymax体现了测量 值的集中趋势,或μ( )是x 最佳值或最可信赖值; (2)对称性 曲线以x=μ为对称轴,呈钟形对称,说明正负
或某一次测定。 3、样本(子样)
从总体中随机抽出的一组测量值或指总体的 一个部分。 4、样本容量(样本大小)
指样本中个体的数目,或样本中测量值数目。
CHENLI
2
总体、个体、样本、样本容量间的关系
样本平均值
x
1 n
n i 1
xi
当n→∞时: 总体平均值
又∵
lim
n
1n n i1
xi
d1n|(xi x)|
酬答依次减小
CHENLI
8
同理:
单次测量的 d (δ)与平均值的 d X ( X 间) 也有:
X
n
(无限次测量)
dX d n
(有限次测量)
CHENLI
9
7.2 随机误差的正态分布 7.2.1频数分布 频数(ni)——每组中出现的数据个数
ni ni
n ni
——相对频数(或频率)
n i ——频率密度 ns
个体
样本容量 样本平均偏差
n<20次,有限次测量,且无系统误差
当n→∞时:
1n| xx|
n>20次,无限次测量,且无系统误差
总体平均偏差
CHENLI
3
7.1 标准偏差(标准差或均方误差) 7.1.1总体标准偏差σ 当n→∞时:测量值x对总体平均值μ的偏离用σ表示。
(x)2
(此式应用于n→∞,μn= xT;无系统误差)
6
7.1.5平均值的标准偏差
统计学上证明:
X
n
(无限次测量)
或: S S
X
n
(有限次测量)
CHBiblioteka BaiduNLI
7
可见:
(1)S S 且是S的 1 倍,即:平
X
n
均值的误差按测定次数的比例减小;
(2)上式的意义:
(3)增加测定次数n,可以提高测
定结果的精密度,但事实上增加n
所取得的效果是有限制的。
即:4次测量时:S 是S的1/2倍 X 9次测量时: S 是S的1/3倍 X 25次测量时: S X 是S的1/5倍
1、不必考虑偏差的正负号
2、σ(或s)增强了大偏差数据的作用
如P243-二组数据:
Xmin
Xmax
d
S
可见: S> d
数据1 -0.4
+0.4
0.24
0.28
数据2 -0.7 d +0.5
0.24
0.33
3、δ与σ的关系
统计学证明:
当n→∞时,δ= 0.8σ(即σ>δ),或4δ=3σ
(但有的书中也有 dCHEN=LI0.8 S 或 4 d = 3S)。
误差出现的机率相等;
(3)有界性 当x→+∞或x→-∞时,曲线以x轴为渐近线,即:
大误差出现机率小,小误差出现机率大;
(4)当x=μ时
y(X)
1
2
—— 概率密度
ydx 1 dx
2
——测CH量ENL值I 落在μ±dx 范围内的概率 13
①当σ↑时,数据分散,分布曲线 平坦(矮胖);当σ↓时,数据集 中,分布曲线尖锐(高瘦)。 ②当σ相同,μ不同时,曲线形状 一致,而位置发生左(或右)移, 所以μ的大小代表数据集中于何处。 (5)所以只要μ、σ确定之后, 分布曲线便确定下来,这种分布曲线
2
2
即
y(u) 1 eu2/2
2
这样的曲线称之标准正态分布曲线,记作N(0,1)
CHENLI
15
标准正态分布曲线的特征是:
(1)当X=μ时,y有极值, 当σ=1时
y 1 0.399
2
(2)正负误差出现的机会均等; (3)大误差出现的概率小,小 误差出现的概率大。
CHENLI
16
7.2.3随机误差的区间概率 实际分析工作中,对误差有两类问题需回答: (1)某一给定范围的测定,这些测定出现的机会是 多少? (2)为保证测定有一定把握,这些测定的误差可以 要求在什么范围内?
第7章 分析化学中的数据处理
7.1 标准偏差(标准差或均方误差) 7.2 随机误差的正态分布 7.3 少量数据的统计处理 7.4 误差的传递 7.5 回归分析 7.6 提高分析结果准确度的方法
CHENLI
1
几个概念(术语)
1、总体(母体) 所研究对象的某特性值的全体。
2、个体 总体中的每一个单元,指全体中的一个单位
(即概率密度的积分)
CHENLI
17
记作: N(,2)
CHENLI
14
2、标准正态分布曲线
为一方便求出某区间的概率,将横坐标进行变量代换。
定义: u x
(即:以σ为单位来表征随机误差)
则:
yf(x) 1 eu2/2
2
x u dxdu
∴ f(x )d x1e u 2/2d u1e u 2/2 d u (u )d—u—概率
(1) ——数据的集中趋势
(2) ——数据的离散倾向
1、正态分布曲线
e(
x)2 2 2
y f (x)
2
CHENLI
11
( x )2
y f (x) e 22
2
式中:
y——相当于测量值x出现的频率密度
(或概率密度)
μ——相当于总体平均值
x
相当于曲线最高点对应的横坐标值,表征数据的集中趋势
σ——总体标准差
以频数(或频率密度) n i ~组值范围 ns
作图,得频数(或频率密度)分布
直方图。(见P245-图7-1) CHENLI
10
7.2.2正态分布(高斯G.F.Gauss分布)
对上述分析数据进行整理时,数据具有以下特性:
①向某中心值集中的趋势;②偏离此中心值的倾向。
为明确表达数据的特性,我们通常
用两个特性参数来表征一组数据:
式中: ——差方和
(它能更(好x地说)明2数Q 据的分散程度)
CHENLI
4
7.1.2 样本标准偏差S
S (xx)2 n1 (n为有限值,一般<20且无系统误差)
同样:式中 (xx)2 Q ——差方和(即偏差的平方和)
S与σ比较:(1)用 x 代替了μ;(2)用n-1代替了n。
式中:n-1 = f ——自由度
标准偏差的计算:
∵
(等 效( 式x ,x ) 可2 直 接x 2 利 用( 测x ) 量2 /数n据计算)
∴
S
x2 C(HxE)N2LI/n
5
n1
7.1.3 相对标准偏差(变异系数或变动系数)
相对标准偏差 = S/x10% 0 (或1000‰)
7.1.4标准偏差σ(或s)与平均偏差δ(或 d)的异同点
相当于μ到曲线两拐点之一的距离,表征数据的分散程度
x(自变量)——个别测量值
x-μ——代表测量值对μ的偏离CH(ENL表I 征随机误差)
12
随机误差有以下规律:
(1)单峰性 当x=μ时(无系统误差时μ=xT),ymax体现了测量 值的集中趋势,或μ( )是x 最佳值或最可信赖值; (2)对称性 曲线以x=μ为对称轴,呈钟形对称,说明正负
或某一次测定。 3、样本(子样)
从总体中随机抽出的一组测量值或指总体的 一个部分。 4、样本容量(样本大小)
指样本中个体的数目,或样本中测量值数目。
CHENLI
2
总体、个体、样本、样本容量间的关系
样本平均值
x
1 n
n i 1
xi
当n→∞时: 总体平均值
又∵
lim
n
1n n i1
xi
d1n|(xi x)|
酬答依次减小
CHENLI
8
同理:
单次测量的 d (δ)与平均值的 d X ( X 间) 也有:
X
n
(无限次测量)
dX d n
(有限次测量)
CHENLI
9
7.2 随机误差的正态分布 7.2.1频数分布 频数(ni)——每组中出现的数据个数
ni ni
n ni
——相对频数(或频率)
n i ——频率密度 ns
个体
样本容量 样本平均偏差
n<20次,有限次测量,且无系统误差
当n→∞时:
1n| xx|
n>20次,无限次测量,且无系统误差
总体平均偏差
CHENLI
3
7.1 标准偏差(标准差或均方误差) 7.1.1总体标准偏差σ 当n→∞时:测量值x对总体平均值μ的偏离用σ表示。
(x)2
(此式应用于n→∞,μn= xT;无系统误差)
6
7.1.5平均值的标准偏差
统计学上证明:
X
n
(无限次测量)
或: S S
X
n
(有限次测量)
CHBiblioteka BaiduNLI
7
可见:
(1)S S 且是S的 1 倍,即:平
X
n
均值的误差按测定次数的比例减小;
(2)上式的意义:
(3)增加测定次数n,可以提高测
定结果的精密度,但事实上增加n
所取得的效果是有限制的。
即:4次测量时:S 是S的1/2倍 X 9次测量时: S 是S的1/3倍 X 25次测量时: S X 是S的1/5倍
1、不必考虑偏差的正负号
2、σ(或s)增强了大偏差数据的作用
如P243-二组数据:
Xmin
Xmax
d
S
可见: S> d
数据1 -0.4
+0.4
0.24
0.28
数据2 -0.7 d +0.5
0.24
0.33
3、δ与σ的关系
统计学证明:
当n→∞时,δ= 0.8σ(即σ>δ),或4δ=3σ
(但有的书中也有 dCHEN=LI0.8 S 或 4 d = 3S)。
误差出现的机率相等;
(3)有界性 当x→+∞或x→-∞时,曲线以x轴为渐近线,即:
大误差出现机率小,小误差出现机率大;
(4)当x=μ时
y(X)
1
2
—— 概率密度
ydx 1 dx
2
——测CH量ENL值I 落在μ±dx 范围内的概率 13
①当σ↑时,数据分散,分布曲线 平坦(矮胖);当σ↓时,数据集 中,分布曲线尖锐(高瘦)。 ②当σ相同,μ不同时,曲线形状 一致,而位置发生左(或右)移, 所以μ的大小代表数据集中于何处。 (5)所以只要μ、σ确定之后, 分布曲线便确定下来,这种分布曲线
2
2
即
y(u) 1 eu2/2
2
这样的曲线称之标准正态分布曲线,记作N(0,1)
CHENLI
15
标准正态分布曲线的特征是:
(1)当X=μ时,y有极值, 当σ=1时
y 1 0.399
2
(2)正负误差出现的机会均等; (3)大误差出现的概率小,小 误差出现的概率大。
CHENLI
16
7.2.3随机误差的区间概率 实际分析工作中,对误差有两类问题需回答: (1)某一给定范围的测定,这些测定出现的机会是 多少? (2)为保证测定有一定把握,这些测定的误差可以 要求在什么范围内?
第7章 分析化学中的数据处理
7.1 标准偏差(标准差或均方误差) 7.2 随机误差的正态分布 7.3 少量数据的统计处理 7.4 误差的传递 7.5 回归分析 7.6 提高分析结果准确度的方法
CHENLI
1
几个概念(术语)
1、总体(母体) 所研究对象的某特性值的全体。
2、个体 总体中的每一个单元,指全体中的一个单位