大物实验之实验数据的处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
前一页
休息
例
某合金导线的电阻值 测量次序 1 2 3 4 5 6 7 8
前一页 休息
电阻值/W 测量次序 40.42 40.43 40.38 40.44 40.46 40.42 40.40 40.43 9 10 11 12 13 14 15 16
电阻值/W 测量次序 40.40 40.43 40.42 40.43 40.39 40.36 40.40 40.43 17 18 19 20 21 22 23 24
因此,测量次数较多时,均值会趋于真值
前一页
休息
随机误差的估算
算术平均误差 用算 术平均代替真值, 可以计算绝对误差 的平均值。 标准误差(方差) 反映数据偏离真值 的分散程度,即均 值与真值之间的接 近程度。
前一页 休息
几个精度概念
精密度:多次测量结果之间的符合程 度,反映随机误差的大小,重现性 正确度:系统误差的大小 准确度:测量值与真值的一致程度, 反映系统误差与随机误差的综合
前一页 休息
在剔除某一数据xi后,重新计算均值和方 差,如果时,剔除坏值xi
i k ( , n)s
其中
k ( , n) t ( , f ) [n /(n 1)]
1 2
T为t分布,自由度f=n-2
前一页
休息
Dixon 准则
狄克松(Dixon)准则采用了极差比的方法,不必求方差。 对于某一等精度重复测量,按测量值的大小排列为 x1<x2<…<xn 如果上述测量值中有含有粗大误差的测量数据,首先值得怀 疑的是x1、xn。 狄克松首先定义了一个与x1,xn和、n有关的极差比统计量f(f 的计算公式见表),如果 f>临界值f(a,n) 则认为在显著性水平下, x1、xn含有粗大误差,应予以剔除。 狄克松准则一次能判别两个数据x1,xn ,如果这两个数据都 不含粗大误差,判断结束。 如果这两个数据中有含粗大误差的数据,则予以剔除。剔除 后的数据列当做新的数据列,重新进行判断
12 13 14 15 16 17 18 19 20
2.55 2.61 2.66 2.70 2.74 2.78 2.82 2.85 2.88
2.29 2.33 2.37 2.41 2.41 2.47 2.50 2.53 2.56
21 22 23 24 25 30 35 40 50
2.91 2.94 2.95 2.99 3.01 3.10 3.18 3.21 3.34
前一页
休息
前一页
休息
实验结果的表示
测量结果最常用的表示方式是均值和标准偏差。前 者表征测试量的大小,后者表征测试的精密度。 与之有关的是有效位的取舍. 所谓有效位是指某种 测量所达到的精度. 如下列测试值: 10.09,10.11,10.09,10.10和10.12,其均值为 10.102,标准偏差为0.0130.但测试值仅准确到小 数点后面第一位,而第二位为可疑位,故结果的表 示为:
第二章 实验数据处理
前一页
在自然科学领域,常用函数表达变量之间的数量 关系 –例如扩散层厚度与时间的关系,利用公式便于 分析规律 如何利用有限的实验数据拟合出一个近似公式,这 就是参数拟合问题。 –确定参数的方法主要有最小二乘法和最大似然 法。 如要判断一组数据是否在某个精度范围内与理论 公式一致,就是假设检验问题。 采用代数多项式来表示复杂的函数,可用插值法
电阻值/W 40.42 40.41 40.39 40.39 40.30 40.42 40.43 40.43
24个测量值的均值为40.41 24个测量值的标准差S=0.0321 3S=0.0963 与平均值偏差最大的是21次测量结果 40.30,偏差=0.11,超过3S,坏值 去掉该值后,均值40.41,S=0.0225 偏差最大(5,14)0.05<3S,有效
2 实验数据处理
在自然界中,有很多的现象是不能用我们 以前所学的知识所能解决的-研究动机 比如我们在耐液锌蚀腐蚀合金研究过程中, 它是由许多种元素配合,再通过高温熔炼 而成。可以用多少种成份来配料,熔炼温 度需要多高,后续如何处理?这些往往都 是未知数。而且没有一定的规律可言。那 就需要我们进行大量的试验来寻找它的配 方及烧制温度。
前一页 休息
相对误差
误差限的大小还不能完全表示近似值 的好坏,如10±1与1000±5两个量, 虽然前者绝对误差较小,但是显然后 者更精确。 所以除了考虑误差的大小以外,还应 考虑准确值本身的大小,误差与准确 值的比值称为近似值的相对误差。
前一页
休息
系统误差与随机误差
系统误差 由于某种原因所产生,并遵循一定的规 律进行变化. 例如,随样品或试剂用量的大小按比 例进行变化. 系统误差有一定的指向,例如称量一种吸湿性物 质,其误差总是正值. 它属于方法和技术问题,知 道了产生的原因,便可消除或修正,所以此种误 差也称可定误差. 随机误差 在相同条件下重复多次测定同一物理 量时,误差大小或正负变化纯属偶然而毫无规律, 这种误差称为随机误差,也叫偶然误差.
前一页
休息
• 在热工、电工仪表中,正确度等级一 般都用引用误差来表示,通常分为0.1, 0.2, 0.5, 1.0, 1.5, 2.5, 5.0 七级。 • 例如,某仪表正确度等级为 R 级(引 用误差R%),满量程的刻度为X,实 际使用时的测量值为 x (x ≤ X),则 测量值的绝对误差 X R% X R% 测量值的相对误差 x 前一页 休息
2.58 2.60 2.62 2.64 2.66 2.74 2.81 2.87 2.96
前一页
休息
t检验法
该准则又可称为罗曼诺夫准则。当测 量次数较小时,按t分布的实际误差分 布范围来判断粗大误差较为合理。 t检验准则的原则是:首先剔除一个与 均值偏离最大的数据,然后对剩余的 数据进行统计计算,以判定该次剔除 是否合理,即判定已被剔除的那个数 据是否含有粗大误差。
前一页 休息
坏值剔除
用统计法进行坏值剔除的基本思想是: 给定一显著性水平,并确定一门限 值,凡超过这个门限的误差就认为它 不属于随机误差的范畴,而是粗差, 并予以剔除.
前一页
休息
拉依达( Ρайта)准则
拉依达准则又被简称为3σ准则。由于随 机误差服从正态分布规律,因此 P{|ε|≤ 3σ}=99.7% 有限次测量误差超过3σ的几率很小,可 以剔除 由于实际上σ未知,如果 xi x 3S 可以剔除,弃真几率很小
前一页
休息
Grubbs系数数值表
n
0.01
0.05
n
0.01
0.05
n
0.01
0.05
3 4 5 6 7 8 9 10 11
1.15 1.49 1.75 1.91 2.10 2.22 2.32 2.41 2.48
1.15 1.46 1.67 1.82 1.91 2.03 2.11 2.18 2.24
通过上面的分析,可知为了减少
仪表测量的误差,提高正确度, 应该使仪表尽可能在靠近满量程 刻度的2/3以上的区域内使用的原 则。
前一页
休息
提高实验数据准确度的方法
减少系统误差的途径
对照实验 校准仪器 空白实验 校正方法
减少偶然误差的途径
多次测量、取平均值
防范过失!
前一页 休息
粗大误差
粗大误差也称过失误差,是一种不应发生, 而仅由于粗心、疏忽等引起的误差。 往往是由于非正常实验条件或非正常操作 所造成的. 如测量时对错了标志, 误读了数 码, 实验仪器未达到预想的指标,记录计算 错误,加错了试剂等 粗大误差的数值远大于系统误差和随机误 差,实际上已超出了误差范围 含有粗差的测量值常称为坏值或异常值, 应 予以剔除,否则会影响结果
23 24 25 30 40 50 75 100 200 500
2.30 2.31 2.33 2.39 2.49 2.58 2.71 2.81 3.02 3.20
Grubbs准则
格拉布斯(F.E.Grubbs)准则同样适用于 对同一参数进行重复测量得到的一列测量 数据的处理。 这个准则经蒙持卡罗法考验后,认为是最 有效的判别方法。 同上,当 i ( , n) s 时则认为xi是含有粗值 的坏值,应予剔除
– P(X - σ≤ Xo ≤ X + σ)≈0.68 – P(X -2σ≤ Xo ≤ X +2σ)≈0.95 – P(X -3σ≤ Xo ≤ X +3σ)≈0.9974
前一页
显然,区间越宽,置信度越高。
休息
三、不同分布的区间估计
1. 对于正态分布样本,可以用若干样 本平均值估计总体平均值
x
如果总体方差已知, 使用如下公式估计
/ n
x s/ n
Βιβλιοθήκη Baidu
~ N (0,1)
如果总体方差未知, 使用如下公式估计
~ t (n 1)
式中, x 样本均值,总体均值,n 样本 数,s 样本方差
前一页 休息
举例
例如,经过大量试验已知样本总体服从正态分布X~(μ , 0.09) , 随机取得的4个观察值12.6,13.4,12.8 和13.2,求总 体均值的95%置信区间。 样本均值 x 是μ 的一个估计值,且 / 即 1.96
x s 10.10 0.01( N 5)
x s 10.102 0.013 ( N 5)
前一页
休息
二、置信度与置信区间
设一未知参数X(例如材料的硬度),虽然其精 确值未知,但是可由若干试验值(样本) 估计它在某个范围内。如果有区间[x1,x2], 对于给定值m(0< m<1),X值在X1-X2之 间出现的概率满足 P (X1≤X≤X2)=m 则称随机区间[x1,x2]是X的100m%置信区 间,X1是置信下限,X2是置信上限,百分 数100m%称为置信度。
前一页
休息
系统误差的特点
重现性 单向性
数值基本恒定
系统误差可以校正。可用一定的方 法消除。
前一页
休息
随机误差分布
随机误差是不可预测、不可避免的 根据统计理论,随机误差服从高斯分布 (正态分布) 随机误差具有
– 单峰性:较小误差出现的几率较大 – 对称性:绝对值相等的正负误差出现的几率相 等 – 有界性:大误差出现的几率较低
前一页 休息
置信区间举例
假如真值为Xo,拟合出参数的值X±ΔX, 意味着在某个概率下,多次测量的X估计值 (近似等于Xo)可以落在以上范围内。 如果估计值X服从正态分布,X在某范围(如 [X1,X2]区间)选值的概率等于高斯概率密度 曲线下X1到X2的面积。若采用标准误差σ和 测量值X来表示测得的真值Xo范围,则
前一页 休息
在实验过程中将要利用各种方法对样品进 行分析测试,产生许多测量数据。 按测量值获得的方法分为:直接测量、间 接测量和组合测量 直接测量:如用米尺测量长度 间接测量:利用直接测量结果,根据特定 关系计算特定物理量,如晶面间距测量 组合测量:测量长宽,计算面积
前一页
休息
前一页 休息
Chauvenet系数的数值表
n
i
n
i
n
i
3 4 5 6 7 8 9 10 11 12
前一页 休息
1.38 1.53 1.65 1.73 1.80 1.86 1.92 1.96 2.00 2.03
13 14 15 16 17 18 19 20 21 22
2.07 2.10 2.13 2.15 2.17 2.20 2.22 2.24 2.26 2.28
前一页 休息
肖维勒准则
肖维勒认为,在n次测 量中,某误差可能出现 的次数小于半次时,则 舍去这个误差值。 误差等于或大于δ出现 的相对频数可近似地取 为1-Pδ 测量次数为n,误差等 于或大于出现的次数 为n( 1-Pδ)<0.5 实用上,如果误差 ε >ω S,即可判断为粗 差
休息
§2.1 误差理论简介
误差的含义
– 绝对误差 – 相对误差
置信区间
– 贝叶斯理论 – 区间估计
不同分布样本的区间估计
前一页
休息
一、误差的含义
可以通过一定的试验测试或运算用估 计值表示理论值的近似值。试验值 (估计值)与理论值(真值)之间的 差值称绝对误差,简称误差。 真值往往很难得到,因而误差的绝对 值也是无法知道的。但是根据测量工 具或计算情况可以估计误差值上限或 估计值的精确程度。