分析化学PPT课件:第二章-误差与分析数据处理-第三节-偏差和置信区间

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n
置信区间:一定置信度(概率)下,以平均值为中心,
能够包含真值的区间(范围)
置信度越高,置信区间越大
2020/8/25
P20,表2-3
总体平均值的置信区间
置信度(概率)
区间大小
例:
x 80.00
m 包含在 区间 80.00 0.15 几率相对大
80.00 0.05 几率 相对小
2020/8/25
2020/8/25
置信水平(置信度)
(1)在某一 t 值时,测定值 x 落在μ±tS 范围内 的概率,用 P 表示;
(2)测量值 x 落在μ±tS 范围之外的概率 (1-P), 称为显著性水平,用α表示;
(3)由于t 值与α、f 有关,故引用时需要加脚注, 用tα,f 表示。
(4)不同α、f 所相应的 t 值如表2-2所示(P19)
见P19
2020/8/25
例题:
分析铁矿中的铁的质量分数,得到如下数据:37.45, 37.20,37.50,37.30,37.25(%)。
(1)计算此结果的平均值、中位值、极差、平均偏差、标 准偏差、相对标准偏差和平均值的标准偏差。
(2)求置信度分别为95%和99%的置信区间。
解(1):
平均值:x 37.45 37.20 37.50 37.30 37.25 % 37.34% 5
m个n次平行测定的平均值:
X1, X 2 , X 3,X m
由统计学可得: sX s / n
由sX/ s—— n 作图: 由关系曲线,当n 大于5时, sX/ s 变化不大,实际测
定5次即可。
2020/8/25
讨论:
(1)增加测量次数可以提高精密度。 (2)增加(过多)测量次数的代价不一定能从减 小误差得到补偿。
有时根据情况也采用90%、99%等置信水平。
2020/8/25
内容选择:
第一节 定量分析中的误差 第二节 分析结果的数据处理 第三节 定量分析数据的评价 第四节 有效数字及其运算规则 第五节 标准曲线的线性方程拟合
2020/8/25
结束
分组细化 测量值的正态分布
0.12 0.10 0.08 0.06 0.04 0.02 0.00
0 1 2 3 4 5 6 7 8 9 10
x
2020/8/25
y
偶然误差的正态分布
y f ( x) 1 e( xm )2 / 2 2
2
离散特性:各数据是分散的,波动的
: 总体标准偏差
n
xi m 2
置信度为95%,即1- = 0.95, = 0.05,查表 P19 t 0.05, 4 = 2.78 m 的95%置信区间:
(x ta,f
s n
,
x
ta,
f
s) n
(37.34% 2.78´ 0.13%,37.34% 2.78´ 0.13%)
5
5
(37.18%,37.50%)
置信度为99%,即1- = 0.99, = 0.01,查表 P19 ห้องสมุดไป่ตู้ 0.01,4= 4.60
xM 37.30%
R 37.50%37.20% 0.30%
2020/8/25
平均偏差:
d 1 n
di
1 n
xi x
1 5
(0.11
0.14
0.04
0.16
0.09)%
0.11%
标准偏差: s
di2 (xi x)2
n 1
n 1
(0.11)2 (0.14)2 (0.04)2 (0.16)2 (0.09)2 5 1
80.00
几率为100%
无意义
置信度与置信区间
偶然误差的正态分布曲线:
2020/8/25
置信度与置信区间
讨论: 1. 置信度不变时:n 增加, t 变小,置信区间变小; 2. n不变时:置信度增加,t 变大,置信区间变大; 置信度——真值在置信区间出现的几率 ; 置信区间——以平均值为中心,真值出现的范围;
5.标准偏差与平均偏差的关系 d=0.7979σ
6.平均值的标准偏差
σ = σ/ n1/2,s = s / n1/2 s 与n1/2成反比
2020/8/25
x
x
x
四、置信度与置信区间
1. 偶然误差的正态分布
系统误差:可校正消除 偶然误差:不可测量,无法避免,可用统计方法研究
测量值的频率(概率密度)分布
6次测量,随机误差落
在±2.57 s范x 围内
的概率为95%。
无限次测量,随机误 差落在±1.96 范围内 的概率为95%。
(1) 置信区间分为双侧置信区间与单侧置信区间两种; (2)双侧置信区间是指同时存在大于和小于总体平均值的 置信范围。在一定置信水平下,μ存在于XL至XU范围内, XL<μ< XU; (3)单侧置信区间是指μ<XU或μ>XL的范围; (4)除了指明求算在一定置信水平时总体平均值大于或小 于某值外,一般都要求算双侧置信区间
见P17
2020/8/25
x
2. 有限次测量数据的统计处理
t分布曲线(见P18) n →∞: 偶然误差符合正态分布(高斯分布) (m,) n 有限: t分布 (平均值)和s(标准偏差) 代替m(总体平均值),
(总体标准偏差)
t分布曲线下一定区间的积分面积,即为该区间内随机误 差出现的概率 f → ∞时,t分布→正态分布 t分布与正态分布曲线相似,只是由于测量次数少,数据 的离散程度较大,分布曲线的形状将变得低而钝
0.13%
相对标准偏差:CV
s x
100%
0.13 37.34
100%
0.35%
平均值的标准偏差: sx
s 0.13% 0.058% 0.06% n5
分析结果:
n 5, x 37.34%,s 0.13%
2020/8/25
解(2) 求置信度分别为95%和99%的置信区间。
(1)的结果 n 5, x 37.34%,s 0.13%
2020/8/25
置信度为(1-)100%的 m 的置信区间为
(x ta,f
s n
,x
ta,
f
s) n

m x ta,f
s n
2020/8/25
t 分布值表
自由度 f =(n-1)
1 2 3 4 5 6 7 8 9 10 20
2020/8/25
显著水平 0.50 0.10 0.05 0.01 1.00 6.31 12.71 63.66 0.82 2.92 4.30 9.93 0.76 2.35 3.18 5.84 0.74 2.13 2.78 4.60 0.73 2.02 2.57 4.03 0.72 1.94 2.45 3.71 0.71 1.90 2.37 3.50 0.71 1.86 2.31 3.36 0.70 1.83 2.26 3.25 0.70 1.81 2.23 3.17 0.69 1.73 2.09 2.85 0.67 1.65 1.96 2.58
平均偏差又称算术平均偏差, 用来表示一组数据的精密度。
平均偏差: d X X
n 特点:简单; 缺点:大偏差得不到应有反映。
2020/8/25
二、标准偏差
标准偏差又称均方根偏差; 标准偏差的计算分两种情况:
1.当测定次数趋于无穷大时
总体标准偏差 : X m2 / n
μ 为无限多次测定 的平均值(总体平均值); 即:
lim X m n
当消除系统误差时,μ即为真值。
2.有限测定次数
标准偏差 : s X X 2 /n 1
相对标准偏差 :(变异系数)CV% = S / X
2020/8/25
例题
用标准偏差比用平均偏差更科学更准确。 例: 两组数据 (1) X-X: 0.11, -0.73, 0.24, 0.51,
m 的99%置信区间
2020/8/25
(x ta,f
s n
,
x
ta, f
s) n
(37.07%,37.61%)
结论:
• 置信度高,置信区间大; • 但置信水平定得过高,判断失误的可能性虽然很小,
却往往因置信区间过宽而实用价值不大; • 区间的大小反映估计的精度,置信度的高低说明估
计的把握程度; • 分析化学中作统计推断是通常取95%的置信水平,
数据的可信程度多大?如何确定?
2020/8/25
小结:
1.总体标准偏差σ
无限次测量;单次偏差均方根
2.样本标准偏差 s
n
xi m 2
i 1
n
x
样本均值
n→∞时, →μ , s→σ
n
xi x2
S i1 n 1
3.相对标准偏差(变异系数RSD)
2020/8/25
RSD S 100% x
4.衡量数据分散度: 标准偏差比平均偏差合理
第二章
一、平均偏差
误差与分析数据处理
二、标准偏差
第三节 分析结果的数据处理
三、平均值的标准偏差 四、置信度与置信区间
2020/8/25
x
有限数据的统计处理
总体 样本 样本容量 n, 自由度 f=n-1 样本平均值 总体平均值 m 真值 xT 标准偏差 s
2020/8/25
一、平均偏差
以 X± sX的形式表示分析结果更合理。
2020/8/25
例题
例:水垢中 Fe2O3 的百分含量测定数据为 (测 6次) : 79.58%,79.45%,79.47%, 79.50%,79.62%,79.38% X = 79.50% s = 0.09% sX= 0.04%
则真值所处的范围为(无系统误差) : 79.50% + 0.04%
2020/8/25
平均值的精密度
(1)平均值的精密度可用平均值的标准偏差sX表示, 平均值的标准偏差与测量次数 n 的平方根成反比
sX s / n
(2)过多增加测量次数并不能使精密度显著提高, 反而费时费力
2020/8/25
平均值的置信区间
某一区间包含真值(总体平均值)的概率(可能性)
m X t s
i1
n
集中趋势:有向某个值集中的趋势
m: 总体平均值
lim
1
n
x
m
n n
i
i 1
d: 总体平均偏差
n
xi
m
d i 1
n
2020/8/25
m
d 0.797
讨论:
(1) σ : 总体标准偏差,表示数据的离散程度; (2)当σ较小时,曲线高而锐,数据较集中;当σ 较大时,曲线低而钝,数据较分散; (3)如已知μ与σ ,正态分布曲线的位置与形状即 可确定下来。
-0.14, 0.00, 0.30, -0.21, n=8 d1=0.28 s1=0.38 (2) X-X:0.18,0.26,-0.25,-0.37,
0.32 , -0.28, 0.31, -0.27 n=8 d2=0.28 s2=0.29
d1=d2, s1>s2
2020/8/25
三、平均值的标准偏差
相关文档
最新文档