误差及数理统计基础

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

D
准确而且精 密
§1.1.4 偶然误差的传递
1.线性加和 如y为测定量a, b和c等的线性组合:
y K K a a Kbb Kc c
式中Ka,Kb,和Kc等为常数,则加和或差值的标准偏差是各 量方差加和的平方根:
y ( K a a ) 2 ( K b b ) 2 ( K c c ) 2
dA lg e / T 0.434 / T dT
由此可得A的标准偏差为: s=|0.001×(-0.434/0.501)|=0.00087
§1.1.5 系统误差的传递 1.线性组合 如测试量a, b, c等中的系统误差分别为a, b和c 等, 则y中的系统误差 y 为: y k a a kb b kc c 2. 乘除表达式 如 y=kabc/d 则,相对系统误差为:
对应的matlab函数 normpdf(x,mu,sigma)
x=[-5:0.2:5]';
y1=[];
y2=[]; mu1=[-1,0,0,0,1]; sig1=[1,0.1,1,10,1]; sig1=sqrt(sig1); for i=1:length(mu1) y1=[y1,normpdf(x,mu1(i),sig1(i))]; y2=[y2,normcdf(x,mu1(i),sig1(i))]; end plot(x,y1),figure;
I f / kcLI 0 e

的相对标准偏差为:
r.s.d . 2 2 0.2 2 0.2 2 0.52 12 2.3(%)
由此可见,最终结果的相对标准偏差略大于上述分量中具有 最大相对标准偏差的那个分量 (If).这一结果给我们的启示 是,若拟提高测试的精度,则首先应该设法改善具有最大相 对标准偏差的那个分量的测试精度. 另外,对于某一量的乘方,如 y=bn 则y的相对标准偏差为
σx σ / n
故标准误差 x 服从 N ( μ, σ 2 / n ) 的正态分布. 4. 正态分布 在数学上常用正态分布(即高斯分布)来描述某试 ( x μ )2 样的总体: 1 2 p e 2σ σ 2π
其中,x为试样测量值,p为测量值的概率密度。正态分布 具有如下重要性质(见图1.1): (1) 数据关于为对称分布; (2) 值越大,数据的离散程度越大; (1) 样本值落入任意区间(a, b)的概率记作p(a<x<b), 等于x=a, x=b线段和 曲线组成的面积,即:
y a b c d y a b c d
同样,若
y bn

则y的相对系统误差为: y nb
y b
3. 其他函数 dy y x 和偶然误差具有相类似的表达式,即 dx
§1.2 基础统计学概念
1.总体、个体和样本 所研究对象的全体称为总体,其中每个单位称为个体。 从总体中随机抽取若干个体的集合称为样本。样本中所含 个体的数目 n 称为样本容量。如, 某产品设为总体, 考察 某产品中铅的含量, 随机选取该类产品100个, 那么100个 产品铅的含量 x1, x2, …, x100 就是来自总体的容量为100 的样本. 在分析化学中,样本的英文(sample)一词为一 分析实物。而在分析数据处理时(即在统计学中),此词 指的是一组数据,即自总体中随机抽取的一组测量值。为 了避免混淆,在分析化学中的“样本”可用“试样”一词 。
1.均值和标准偏差 对某试样作无限次测定,所得数据称为总体的均值(亦 称期望值)常用表示. 若无系统偏差, 则为真值。事实上不 x 可能作无限次测定. 若作n次测定,其均值(即算数平均值)为 n x 是 的估计. x 的表达式为:
x ( xi ) / n
i 1
同样,若总体的标准偏差为,有限次如n 次测定的标准偏 差为s,则s为 的估计 .当 n趋于无穷大时,s将趋近于。 s 的表达式为:
第一章
误差及数理统计基础
§1.1 误差 §1.1.1 误差的定义 测量值x带有误差E,测量值去掉误差就等于真值0, 0=x-E。所以误差的定义为:E=x-0,即测量值偏离 真值的程度,也就是测量值的不确定度. §1.1.2 误差的类型 1. 绝对误差 测量值大于真值时误差为正数,表示结果偏高;反之, 误差为负数时表示结果偏低. 这里的误差都是绝对误差, 它具有与测量值和真值相对应的量纲.
重复性是指在完全相同条件下,即同一操作者、 同一仪器、 同一实验室,在较短时间内分析同一样品所得结果的精密度; 再现性是指在不同的条件下,即不同的操作者、非同一台仪 器、不同的实验室、不同的时间,但是用相同的分析方法和 分析相同样品所得结果的精密度. 准确度表示测量值与真值的 偏离程度,它由系统误差和偶然误差共同决定. 如由4个学生用浓度准确为0.1mol/L的盐酸滴定浓度准确为 0.1mol/L的氢氧化钠, 氢氧化钠的体积准确为10.00ml. 每个学 生重复测量5次, 其结果示于表1.1.
图1.1 均值相同, 标准偏差不同的 正态分布 图1.2 正态分布 的性质
§1.3 区间估计
在前面介绍中对于总体参数即均值(期望值)和方差的估计 仅是参数的近似值,而与参数的真值可能会存在差异, 因此, 在 一定的要求下, 估计出未知参数的一个数值范围, 即确定一个 区间, 使这一区间内包含参数真值的概率达到我们预先所要求 的程度, 这就是参数的区间估计问题. §1.3.1容许区间 容许区间是对总体而言. Z 区间内的分布曲线称为覆 在有限次测定中用样本的 x 和 s 分别代替总体的 和 时, x 和s是随样本而异的随机变量,致使由选定的k值所组成的 x ks 区间也是随机的,即对覆盖域难以进行定量. 但是在 选择P和k的同时再加一个出现P值的概率,便能回答所需 要的问题. 如欲知使覆盖率不小于P的可能性为应该取什么k 值,表1.2给出了常用的P和和对应的k值。
2. 相对误差 绝对误差在真值中所占的比率称相对误差,一般用百分率表 x μ0 示 x 相对误差(%)=
μ0 当真值为未知时,可用多次重复测定结果的算术平均值代替 。相对误差没有量纲.
3. 粗差 粗差也称过失误差,是由于非正常实验条件或非正常操作所 造成的. 如测量时对错了标志, 误读了数码, 实验仪器未达到预想 的指标等. 含有粗差的测量值常称为坏值或异常值, 应予以剔除. 4. 系统误差 由于某种原因所产生,并遵循一定的规律进行变化. 例如,随样 品或试剂用量的大小按比例进行变化. 系统误差有一定的指向,
y
n b y b
因为b和bn不是分别独立的量.
2.3. 其他函数
若y是x的函数
y f (x) 则x和y的标准偏差具有如下关系:
dy y x dx
如某溶液的吸收值A为光透过率的函数: A
lg(T )
若T的测定值为0.501,标准偏差为0.001,则A的值及其 dA/dT分别为: A lg 0.501 0.300 和
计 算 得 到 容 许 区 间 为 15.32-3.959x0.24 到
15.32+3.959x0.24, 即由14.37~16.27%。这个答案是, 如果产品中某组分的含量遵从正态分布,便能以90 % 的 把 握 断 定 99 % 的 产 品 中 该 组 分 含 量 在 区 间 14.37~16.27%中.
( x μ) 2 p( a x b) a e xp[ 2σ 2 ]dx σ 2π 1
b
经计算,样本落入 的范围内约为总体的68%;落入 2 的范围内约为总体的95%;落入 3 的范围内约为 总体的99.7% (见图1.2)。在分析化学中,绝大部分情况下 其测量符合正态分布。
例如称量一种吸湿性物质,其误差总是正值. 从系统误差 的来源看,它属于方法和技术问题,知道了产生的原因, 便可消除或修正,所以此种误差也称可定误差.
5. 随机误差 在相同条件下重复多次测定同一物理量时,误差大小或 正负变化纯属偶然而毫无规律,这种误差称为随机误差, 也叫偶然误差. 单个地看是无规律性的,但就其总体来 说,由于正负有相消的机会,随着变量个数的增加,误 差的平均值将趋近于零. 这种低偿正是统计规律的表现, 所以随机误差是可以用概率统计来处理的.
由给定P和k值组成的样本区间x k ( p, )s 称为统计容许 区间。例如,从同一批产品小包装中随机抽样10个
测定某组分的含量,得 x 15.32% 和s=0.24%,若以90
%的把握估准至少为99%的产品的含量,可以从表 1.2查出=0.90, P=0.99, n=10时的k值为3.959, 由此
如滴定中,移液管的初值和终值分别为:3.51ml 和 15.67ml, 其标准偏差均为0.02ml,则用去滴定液的体积及标 准偏差分别为: 消耗的滴定液体积=15.67-3.51=12.16(ml)
标准偏差= (0.02) 2 (0.02) 2 0.028 (ml)
此例说明,组合的标准偏差大于单个读数的标准偏差,但小 于各量的标准偏差之和.
学 生 结果 (ml) 注释
A
wenku.baidu.com
10.08 10.11 10.09 10.10 10.12 9.88 10.14 10.02 9.80 10.21 10.19 9.79 9.69 10.05 9.78 10.04 9.98 10.02 9.97 10.04
精密但不准 确
B
准确但不精 密
C
不准确也不 精密
表1.1 用盐酸进行氢氧 化钠的滴定结果 由表1.1可见, 学生A尽管测试结果 重复性较好, 即精密, 但是准确性较差 (A的均值为10.10), 所有结果均偏高. 这是由于系统误差所致. 学生B的测试 落到准确值(即真值)的两侧, 其均值为 10.01. 此结果较准确, 但精密度较差, 主要受到了偶然误差的影响. 学生C测 量中既有偶然误差的影响, 又有系统误 差的影响, 所以既不精密, 也不准确. 只 有学生D测试结果比较精密(范围为 9.97-10.04ml), 又 比 较 准 确 ( 均 值 为 10.01).
§1.1.3 精密度和准确度
误差表示测量的不精密度和不准确度,即不确定度. 精密 度和准确度是两个不同的概念.精密度表示一组测定数据相互 接近的程度或分散的程度,它的大小完全决定于偶然误差.在 分析化学中,常用重复性(repeatability)和再现性 (reproducibility)来表示精密度.
s ( x i x ) 2 /( n 1)
i 1 n
标准偏差可以表征测定结果对于均值的离散程度,但却不 能指示这些数据的分布情况。而表征数据的分布情况要用 直方图(或频谱图). 如对某一溶液作50次测定,其均值为
0.50ug/ml. 其中,0.46ug/ml 出现1次,0.47ug/ml出现3 次,0.48ug/ml出现5次,0.49ug/ml出现10次,等等. 将每 一测定值出现的频率对测定值作图即为直方图(或频谱 图)。 3. 平均值的标准偏差 将一组独立重复测定值进行平均时,一部分偶然误差相 互抵消,使平均值带有的误差比原测定值要小. 平均值的标 准偏差 x 又称“标准误差”,与单次测量值的之间的关 系为
表1.2 正态分布容许限因子
=0.90
n P n
=0.95
P n
=0.99
P
0.90
0.95
0.99
0.90
0.95
0.99
0.90
0.95
0.99
2 3 4 5 6 7 8 9 10 11 12 20 30 60 120 200
2. 2. 乘除表达式 若计算y的表达式为: y=kab/cd 式中a, b, c和d分别为测定量,k为常数,则相对标准偏差有 如下关系:
y a 2 b 2 c 2 d 2 ( ) ( ) ( ) ( ) y a b c d
如荧光的量子产率可用下式计算: 式中各量的相对标准偏差是: I0为入射光强度,0.5%; If 为荧光强度,2%; E 为摩尔吸收,1%; c为浓度,0.2%;
相关文档
最新文档