误差分析与数据处理
误差分析与数据处理.
误差分析与数据处理.《误差分析与数据处理》在我们的日常生活和各种科学研究、工程实践中,数据无处不在。
然而,数据往往并非绝对准确,总是存在着一定的误差。
理解误差的来源、性质,并掌握有效的数据处理方法,对于获取准确可靠的信息至关重要。
误差,简单来说,就是测量值与真实值之间的差异。
它的产生可能源于多个方面。
首先,测量工具本身就可能存在精度限制。
比如,我们用一把尺子去测量物体的长度,如果这把尺子的刻度不够精细,那么测量结果就可能存在误差。
其次,测量的环境条件也会影响结果。
例如,温度、湿度、压力等环境因素的变化,可能导致测量对象的性质发生改变,从而引入误差。
再者,测量者的操作水平和方法也不容忽视。
测量时的读数不准确、测量姿势不正确等,都可能导致误差的产生。
误差可以分为系统误差和随机误差两大类。
系统误差是指在相同条件下,多次测量同一量时,误差的大小和符号保持恒定,或者按照一定规律变化的误差。
这种误差通常是由于测量仪器的不完善、测量方法的不正确或者测量环境的影响等原因造成的。
例如,使用未经校准的仪器进行测量,每次测量都会得到偏大或偏小的结果,这就是系统误差。
与之相对的是随机误差,也称为偶然误差。
它是指在相同条件下,多次测量同一量时,误差的大小和符号以不可预知的方式变化的误差。
随机误差是由许多微小的、独立的、不可控的因素共同作用产生的。
比如,测量时的微小震动、电源电压的波动等。
虽然随机误差的具体值无法预测,但从大量的测量数据来看,随机误差的分布通常遵循一定的统计规律,比如正态分布。
了解了误差的类型,接下来我们要探讨如何进行误差分析。
误差分析的第一步是识别误差的来源。
这需要我们对测量过程进行仔细的观察和思考,找出可能导致误差的各个环节。
然后,通过对测量数据的统计分析,可以定量地评估误差的大小。
常用的误差分析方法包括计算平均值、标准差、相对误差等。
平均值是一组数据的算术平均值,它可以反映数据的集中趋势。
但平均值并不能完全反映数据的离散程度,这时候就需要用到标准差。
实验误差分析及数据处理
u + Δu = f (x + Δx, y + Δy,z + Δz)
由泰勒公式,并略去误差的高次项,得
115
地球物理实验
u + Δu = f (x, y,z) + ∂f Δx + ∂f Δy + ∂f Δz
∂x ∂y ∂z
或
Δu = ∂f Δx + ∂f Δy + ∂f Δz
∂x ∂y ∂z
该式即为误差传递公式。 例如我们通过直接测量圆柱形试件的直径D及高H来计算试件的体积V。
前面提到测量值=真值+误差,这里误差包含了系统误差和偶然误差,则测量值=真值+
系统误差+偶然误差,当系统误差修正后,误差主要即是偶然误差。在多次测量中,偶然误
差是一随机的变量,那么测量值也就是一随机变量,我们则可用算术平均值和标准误差来
描述它。
算术平均值 X :
X
=
1 n
n
∑
i =1
xi
式中xi为第i次测量的测量值,n为测量次数,当n→∞时, X →xt(真值),但是当n增加到 一定程度时, X 的精度的提高就不显着了,所以一般测量中n只要大于10就可以了。
明误差在 ± 1.96s 以外的值都要舍去,这里
1.96s=1.96×1.12=2.19
我们以算术平均值代表真值,表中第4个测量值的偏差 di 为2.4,在 ± 2.19 以外,应当舍
去,再计算其余9个数据的算术平均值和标准误差,有
m = ∑ mi = 416.0 = 46.2
n
9
∑ s =
d
2 i
偶然误差是一种不规则的随机的误差,无法予测它的大小,其误差没有固定的大小和 偏向。
误差分析和数据处理讲解
误差和分析数据处理1 数据的准确度和精度在任何一项分析工作中,我们都可以看到用同一个分析方法,测定同一个样品,虽然经过多少次测定,但是测定结果总不会是完全一样。
这说明在测定中有误差。
为此我们必须了解误差产生的原因及其表示方法,尽可能将误差减到最小,以提高分析结果的准确度。
1.1 真实值、平均值与中位数(一)真实值真值是指某物理量客观存在的确定值。
通常一个物理量的真值是不知道的,是我们努力要求测到的。
严格来讲,由于测量仪器,测定方法、环境、人的观察力、测量的程序等,都不可能是完善无缺的,故真值是无法测得的,是一个理想值。
科学实验中真值的定义是:设在测量中观察的次数为无限多,则根据误差分布定律正负误差出现的机率相等,故将各观察值相加,加以平均,在无系统误差情况下,可能获得极近于真值的数值。
故“真值”在现实中是指观察次数无限多时,所求得的平均值(或是写入文献手册中所谓的“公认值”)。
(二)平均值然而对我们工程实验而言,观察的次数都是有限的,故用有限观察次数求出的平均值,只能是近似真值,或称为最佳值。
一般我们称这一最佳值为平均值。
常用的平均值有下列几种:(1)算术平均值这种平均值最常用。
凡测量值的分布服从正态分布时,用最小二乘法原理可以证明:在一组等精度的测量中,算术平均值为最佳值或最可信赖值。
n x n x x x x ni in ∑=++==121 式中: n x x x 21、——各次观测值;n ――观察的次数。
(2)均方根平均值n x n x x x x n i in∑=++==1222221 均(3)加权平均值设对同一物理量用不同方法去测定,或对同一物理量由不同人去测定,计算平均值时,常对比较可靠的数值予以加重平均,称为加权平均。
∑∑=++++++===n i i n i ii n n n w x w w w w x w x w x w w 11212211式中;n x x x 21、——各次观测值;n w w w 21、——各测量值的对应权重。
实验数据误差分析与数据处理
第一章实验数据误差分析与数据处理第一节实验数据误差分析一、概述由于实验方法和实验设备的不完善,周围环境的影响,以及人的观察力,测量程序等限制,实验测量值和真值之间,总是存在一定的差异,在数值上即表现为误差;为了提高实验的精度,缩小实验观测值和真值之间的差值,需要对实验数据误差进行分析和讨论;实验数据误差分析并不是即成事实的消极措施,而是给研究人员提供参与科学实验的积极武器,通过误差分析,可以认清误差的来源及影响,使我们有可能预先确定导致实验总误差的最大组成因素,并设法排除数据中所包含的无效成分,进一步改进实验方案;实验误差分析也提醒我们注意主要误差来源,精心操作,使研究的准确度得以提高;二、实验误差的来源实验误差从总体上讲有实验装置包括标准器具、仪器仪表等、实验方法、实验环境、实验人员和被测量五个来源;1.实验装置误差测量装置是标准器具、仪器仪表和辅助设备的总体;实验装置误差是指由测量装置产生的测量误差;它来源于:1标准器具误差标准器具是指用以复现量值的计量器具;由于加工的限制,标准器复现的量值单位是有误差的;例如,标准刻线米尺的0刻线和1 000 mm刻线之间的实际长度与1 000 mm单位是有差异的;又如,标称值为1kg的砝码的实际质量真值并不等于1kg等等;2仪器仪表误差凡是用于被测量和复现计量单位的标准量进行比较的设备,称为仪器或仪表.它们将被测量转换成可直接观察的指示值;例如,温度计、电流表、压力表、干涉仪、天平,等等;由于仪器仪表在加工、装配和调试中,不可避免地存在误差,以致仪器仪表的指示值不等于被测量的真值,造成测量误差;例如,天平的两臂不可能加工、调整到绝对相等,称量时,按天平工作原理,天平平衡被认为两边的质量相等;但是,由于天平的不等臂,虽然天平达到平衡,但两边的质量并不等,即造成测量误差;3附件误差为测量创造必要条件或使测量方便地进行而采用的各种辅助设备或附件,均属测量附件;如电测量中的转换开关及移动测点、电源、热源和连接导线等均为测量附件,且均产生测量误差;又如,热工计量用的水槽,作为温度测量附件,提供测量水银温度计所需要的温场,由于水槽内各处温度的不均匀,便引起测量误差,等等;按装置误差具体形成原因,可分为结构性的装置误差、调整性的装置误差和变化性的装置误差;结构性的装置误差如:天平的不等臂,线纹尺刻线不均匀,量块工作面的不平行性,光学零件的光学性能缺陷,等等;这些误差大部分是由于制造工艺不完善和长期使用磨损引起的;调整性的装置误差如投影仪物镜放大倍数调整不准确,水平仪的零位调整不准确,千分尺的零位调整不准确,等等;这些误差是由于仪器仪表在使用时,未调整到理想状态引起的;变化性的装置误差如:激光波长的长期不稳定性,电阻等元器件的老化,晶体振荡器频率的长期漂移,等等;这些误差是由于仪器仪表随时间的不稳定性和随空间位置变化的不均匀性造成的;2.环境误差环境误差系指测量中由于各种环境因素造成的测量误差;被测量在不同的环境中测量,其结果是不同的;这一客观事实说明,环境对测量是有影响的,是测量的误差来源之一;环境造成测量误差的主要原因是测量装置包括标准器具、仪器仪表、测量附件同被测对象随着环境的变化而变化着;测量环境除了偏离标准环境产生测量误差以外,从而引起测量环境微观变化的测量误差;3.方法误差方法误差系指由于测量方法包括计算过程不完善而引起的误差;事实上,不存在不产生测量误差的尽善尽美的测量方法;由测量方法引起的测量误差主要有下列两种情况:第一种情况:由于测量人员的知识不足或研究不充分以致操作不合理,或对测量方法、测量程序进行错误的简化等引起的方法误差;第二种情况:分析处理数据时引起的方法误差;例如,轴的周长可以通过测量轴的直径d,然后由公式:L=πd计算得到;但是,在计算中只能取其近似值,因此,计算所得的L也只能是近似值,从而引起周长L的误差;4.人员误差人员误差系指测量人员由于生理机能的限制,固有习惯性偏差以及疏忽等原因造成的测量误差;由于测量人员在长时间的测量中,因疲劳或疏忽大意发生看错、读错、听错、记错等错误造成测量误差,这类误差往往相当大是测量所不容许的;为此,要求测量人员养成严格而谨慎的习惯,在测量中认真操作并集中精力,从制度上规定,对某些准确性较高而又重要的测量,由另一名测量人员进行复核测量;5.测量对象变化误差被测对象在整个测量过程中处在不断地变化中;由于测量对象自身的变化而引起的测量误差称为测量对象变化误差;例如,被测温度计的温度,被测线纹尺的长度,被测量块的尺寸等,在测量过程中均处于不停地变化中,由于它们的变化,使测量不准而带来误差;三、误差的分类误差是实验测量值包括间接测量值与真值客观存在的准确值之差别,误差可以分为下面三类:1. 系统误差由某些固定不变的因素引起的;在相同条件下进行多次测量,其误差的数值大小正负保持恒定,或误差随条件按一定规律变化;单纯增加实验次数是无法减少系统误差的影响,因为它在反复测定的情况下常保持同一数值与同一符号,故也称为常差;系统误差有固定的偏向和确定的规律,可按原因采取相应的措施给予校正或用公式消除;2. 随机误差偶然误差由一些不易控制的因素引起,如测量值的波动,肉眼观察误差等等;随机误差与系统误差不同,其误差的数值和符号不确定,它不能从实验中消除,但它服从统计规律,其误差与测量次数有关;随着测量次数的增加,出现的正负误差可以相互抵消,故多次测量的算术平均值接近于真值;3.过失误差由实验人员粗心大意,如读数错误,记录错误或操作失误引起;这类误差与正常值相差较大,应在整理数据时加以剔除;四、实验数据的真值与平均值1.真值真值是指某物理量客观存在的确定值,它通常是未知的;虽然真值是一个理想的概念,但对某一物理量经过无限多次的测量,出现的误差有正、有负,而正负误差出现的概率是相同的;因此,若不存在系统误差,它们的平均值相当接近于这一物理量的真值;故真值等于测量次数无限多时得到的算术平均值;由于实验工作中观测的次数是有限的,由此得出的平均值只能近似于真值,故称这个平均值为最佳值;2.平均值油气储运实验中常用的平均值有:1算术平均值设x,x,.,x为各次测量值, n 为测量次数,则算术平均值为:算术平均值是最常用的一种平均值,因为测定值的误差分布一般服从正态分布,可以证明算术平均值即为一组等精度测量的最佳值或最可信赖值;2均方根平均值3几何平均值五、误差的表示方法1.绝对误差测量值与真值之差的绝对值称为测量值的误差,即绝对误差;在实际工作中常以最佳值代替真值,测量值与最佳值之差称为残余误差,习惯上也称为绝对误差;设测量值用x 表示,真值用X 表示,则绝对误差D 为D=|X-x|如在实验中对物理量的测量只进行了一次,可根据测量仪器出厂鉴定书注明的误差,或取测量仪器最小刻度值的一半作为单次测量的误差;如某压力表精确度为级,即表明该仪表最大误差为相当档次最大量程的%,若最大量程为,该压力表的最大误差为:×%=如实验中最常用的U 形管压差计、转子流量计、秒表、量筒等仪表原则上均取其最小刻度值为最大误差,而取其最小刻度值的一半作为绝对误差计算值;2.相对误差绝对误差D 与真值的绝对值之比,称为相对误差:式中真值X 一般为未知,用平均值代替;3.算术平均误差算术平均误差的定义为:x——测量值,i=1,2,3, .,n ;d——测量值与算术平均值x 之差的绝对值,d= x x i . ;4.标准误差均方误差对有限测量次数,标准误差表示为:标准误差是目前最常用的一种表示精确度的方法,它不但与一系列测量值中的每个数据有关,而且对其中较大的误差或较小的误差敏感性很强,能较好地反映实验数据的精确度,实验愈精确,其标准误差愈小;六、精密度、正确度和准确度1、精密度精密度是指对同一被测量作多次重复测量时,各次测量值之间彼此接近或分散的程度;它是对随机误差的描述,它反映随机误差对测量的影响程度;随机误差小,测量的精密度就高;如果实验的相对误差为%且误差由随机误差引起,则可以认为精密度为10-4;2、正确度正确度是指被测量的总体平均值与其真值接近或偏离的程度;它是对系统误差的描述,它反映系统误差对测量的影响程度;系统误差小,测量的正确度就高;如果实验的相对误差为%且误差由系统误差引起,则可以认为正确度为10-4;3、准确度准确度是指各测量值之间的接近程度和其总体平均值对真值的接近程度;它包括了精密度和正确度两方面的含义;它反映随机误差和系统误差对测量的综合影响程度;只有随机误差和系统误差都非常小,才能说测量的准确度高;若实验的相对误差为%且误差由系统误差和随机误差共同引起,则可以认为精确度为10-4;七、实验数据的有效数与记数法任何测量结果或计算的量,总是表现为数字,而这些数字就代表了欲测量的近似值;究竟对这些近似值应该取多少位数合适呢应根据测量仪表的精度来确定,一般应记录到仪表最小刻度的十分之一位;例如:某液面计标尺的最小分度为1mm,则读数可以到;如在测定时液位高在刻度524mm 与525mm 的中间,则应记液面高为,其中前三位是直接读出的,是准确的,最后一位是估计的,是欠准的,该数据为4 位有效数;如液位恰在524mm刻度上,该数据应记为,若记为524mm,则失去一位末位欠准数字;总之,有效数中应有而且只能有一位末位欠准数字;由上可见,当液位高度为时,最大误差为±,也就是说误差为末位的一半;在科学与工程中,为了清楚地表达有效数或数据的精度,通常将有效数写出并在第一位数后加小数点,而数值的数量级由10 的整数幂来确定,这种以10 的整数幂来记数的方法称科学记数法;例如:应记为×10-3,88000有效数3 位记为×104;应注意科学记数法中,在10 的整数幂之前的数字应全部为有效数;有效数字进行运算时,运算结果仍为有效数字;总的规则是:可靠数字与可靠数字运算后仍为可靠数字,可疑数字与可疑数字运算后仍为可疑数字,可靠数字与可疑数字运算后为可疑数字,进位数可视为可靠数字;对于已经给出了不确定度的有效数字,在运算时应先计算出运算结果的不确定度,然后根据它决定结果的有效数字位数;加减运算规则:A.如果已知参与加减运算的各有效数字的不确定度,则先算出计算结果的不确定度,并保留1-2位,然后确定计算结果的有效位数;B.如果没给出参与加减运算的各有效数字的不确定度,则先找出可疑位最高的那个有效数字,计算结果的可疑位应与该有效数字的可疑位对齐;乘除运算规则若干个有效数字相乘除时,计算结果积或商的有效数字位数在大多数情况下与参与运算的有效数字位数最少的那个分量的有效位数相同; 乘方、开方运算规则有效数字在乘方或开方时,若乘方或开方的次数不太高,其结果的有效数字位数与原底数的有效数字位数相同; 对数运算规则有效数字在取对数时,其有效数字的位数与真数的有效数字位数相同或多取1位;第二节 实验数据处理基本方法数据处理是指从获得数据开始到得出最后结论的整个加工过程,包括数据记录、整理、计算、分析和绘制图表等;数据处理是实验工作的重要内容,涉及的内容很多,这里仅介绍一些基本的数据处理方法; 一、列表法对一个物理量进行多次测量或研究几个量之间的关系时,往往借助于列表法把实验数据列成表格;其优点是,使大量数据表达清晰醒目,条理化,易于检查数据和发现问题,避免差错,同时有助于反映出物理量之间的对应关系;所以,设计一个简明醒目、合理美观的数据表格,是每一个同学都要掌握的基本技能;列表没有统一的格式,但所设计的表格要能充分反映上述优点,应注意以下几点: 1.各栏目均应注明所记录的物理量的名称符号和单位;2.栏目的顺序应充分注意数据间的联系和计算顺序,力求简明、齐全、有条理;3.表中的原始测量数据应正确反映有效数字,数据不应随便涂改,确实要修改数据时,应将原来数据画条杠以备随时查验;4.对于函数关系的数据表格,应按自变量由小到大或由大到小的顺序排列,以便于判断和处理; 二、图解法图线能够直观地表示实验数据间的关系,找出物理规律,因此图解法是数据处理的重要方法之一;图解法处理数据,首先要画出合乎规范的图线,其要点如下:1.选择图纸 作图纸有直角坐标纸即毫米方格纸、对数坐标纸和极坐标纸等,根据作图需要选择;在物理实验中比较常用的是毫米方格纸,其规格多为cm 2517⨯;2.曲线改直 由于直线最易描绘,且直线方程的两个参数斜率和截距也较易算得;所以对于两个变量之间的函数关系是非线性的情形,在用图解法时应尽可能通过变量代换将非线性的函数曲线转变为线性函数的直线;下面为几种常用的变换方法;1c xy =c 为常数;令xz 1=,则cz y =,即y 与z 为线性关系; 2y c x =c 为常数;令2x z =,则z cy 21=,即y 与z 为线性关系;3b ax y =a 和b 为常数;等式两边取对数得,x b a y lg lg lg +=;于是,y lg 与x lg 为线性关系,b 为斜率,a lg 为截距;4bx ae y =a 和b 为常数;等式两边取自然对数得,bx a y +=ln ln ;于是,y ln 与x 为线性关系,b 为斜率,a ln 为截距;3.确定坐标比例与标度 合理选择坐标比例是作图法的关键所在;作图时通常以自变量作横坐标x 轴,因变量作纵坐标y 轴;坐标轴确定后,用粗实线在坐标纸上描出坐标轴,并注明坐标轴所代表物理量的符号和单位;坐标比例是指坐标轴上单位长度通常为cm 1所代表的物理量大小;坐标比例的选取应注意以下几点:1原则上做到数据中的可靠数字在图上应是可靠的,即坐标轴上的最小分度m m 1对应于实验数据的最后一位准确数字;坐标比例选得过大会损害数据的准确度;2坐标比例的选取应以便于读数为原则,常用的比例为“1∶1”、“1∶2”、“1∶5”包括“1∶”、“1∶10”…,即每厘米代表“1、2、5”倍率单位的物理量;切勿采用复杂的比例关系,如“1∶3”、“1∶7”、“1∶9”等;这样不但不易绘图,而且读数困难;坐标比例确定后,应对坐标轴进行标度,即在坐标轴上均匀地一般每隔cm 2标出所代表物理量的整齐数值,标记所用的有效数字位数应与实验数据的有效数字位数相同;标度不一定从零开始,一般用小于实验数据最小值的某一数作为坐标轴的起始点,用大于实验数据最大值的某一数作为终点,这样图纸可以被充分利用;4.数据点的标出 实验数据点在图纸上用“+”符号标出,符号的交叉点正是数据点的位置;若在同一张图上作几条实验曲线,各条曲线的实验数据点应该用不同符号如×、⊙等标出,以示区别;5.曲线的描绘 由实验数据点描绘出平滑的实验曲线,连线要用透明直尺或三角板、曲线板等拟合;根据随机误差理论,实验数据应均匀分布在曲线两侧,与曲线的距离尽可能小;个别偏离曲线较远的点,应检查标点是否错误,若无误表明该点可能是错误数据,在连线时不予考虑;对于仪器仪表的校准曲线和定标曲线,连接时应将相邻的两点连成直线,整个曲线呈折线形状;6.注解与说明 在图纸上要写明图线的名称、坐标比例及必要的说明主要指实验条件,并在恰当地方注明作者姓名、日期等;7.直线图解法求待定常数 直线图解法首先是求出斜率和截距,进而得出完整的线性方程;其步骤如下:1选点;在直线上紧靠实验数据两个端点内侧取两点),(11y x A 、22,(y x B ,并用不同于实验数据的符号标明,在符号旁边注明其坐标值注意有效数字;若选取的两点距离较近,计算斜率时会减少有效数字的位数;这两点既不能在实验数据范围以外取点,因为它已无实验根据,也不能直接使用原始测量数据点计算斜率;2求斜率;设直线方程为bx a y +=,则斜率为1212x x y y b --=1-5-13求截距;截距的计算公式为11bx y a -= 1-5-2三、逐差法当两个变量之间存在线性关系,且自变量为等差级数变化的情况下,用逐差法处理数据,既能充分利用实验数据,又具有减小误差的效果;具体做法是将测量得到的偶数组数据分成前后两组,将对应项分别相减,然后再求平均值;例如,在弹性限度内,弹簧的伸长量x 与所受的载荷拉力F 满足线性关系kx F =实验时等差地改变载荷,测得一组实验数据如下表:求每增加1Kg 砝码弹簧的平均伸长量x ∆;若不加思考进行逐项相减,很自然会采用下列公式计算[])(71)()()(7118782312x x x x x x x x x -=-++-+-=∆ 结果发现除1x 和8x 外,其它中间测量值都未用上,它与一次增加7个砝码的单次测量等价;若用多项间隔逐差,即将上述数据分成前后两组,前一组),,,(4321x x x x ,后一组),,,(8765x x x x ,然后对应项相减求平均,即[])()()()(44148372615x x x x x x x x x -+-+-+-⨯=∆ 这样全部测量数据都用上,保持了多次测量的优点,减少了随机误差,计算结果比前面的要准确些;逐差法计算简便,特别是在检查具有线性关系的数据时,可随时“逐差验证”,及时发现数据规律或错误数据; 四、最小二乘法由一组实验数据拟合出一条最佳直线,常用的方法是最小二乘法;设物理量y 和x 之间的满足线性关系,则函数形式为bx a y +=最小二乘法就是要用实验数据来确定方程中的待定常数a 和b ,即直线的斜率和截距;我们讨论最简单的情况,即每个测量值都是等精度的,且假定x 和y 值中只有y 有明显的测量随机误差;如果x 和y 均有误差,只要把误差相对较小的变量作为x 即可;由实验测量得到一组数据为),2,1;,(n i y x i i =,其中i x x =时对应的i y y =;由于测量总是有误差的,我们将这些误差归结为i y 的测量偏差,并记为1ε,2ε,…,n ε,见图1-5-2;这样,将实验数据),(i i y x 代入方程bx a y +=后,得到⎪⎪⎭⎪⎪⎬⎫=+-=+-=+-n n n bx a y bx a y bx a y εεε)()()(222111我们要利用上述的方程组来确定a 和b ,那么a 和b 要满足什么要求呢 显然,比较合理的a 和b 是使1ε,2ε,…,n ε数值上都比较小;但是,每次测量的误差不会相同,反映在1ε,2ε,…,n ε大小不一,而且符号也不尽相同;所以只能要求总的偏差最小,即min 21→∑=i ni ε 令 2121)(i in i i ni bx a yS --==∑∑==ε使S 为最小的条件是0=∂∂a S ,0=∂∂bS ,022>∂∂a S ,022>∂∂b S由一阶微商为零得y⎪⎪⎭⎪⎪⎬⎫=--∑-=∂∂=--∑-=∂∂==0)(20)(211i i i n i i i n i x bx a y b Sbx a y aS 解得 212112111)(i ni i ni ini i ni i i n i i n i x n x y x y x x a ======∑-⎪⎭⎫ ⎝⎛∑∑∑-∑∑=1-5-32121111)(ini i ni i i ni i ni i ni x n x y x n y x b =====∑-⎪⎭⎫ ⎝⎛∑∑-∑∑=1-5-4令111x n x n i =∑=,i n i y n y 11=∑=,21121⎪⎭⎫⎝⎛∑==x n x n i ,2121i n i x n x =∑=,)(111i n i y x n xy =∑=,则x b y a -= 1-5-5 22xx xyy x b --⋅=1-5-6如果实验是在已知y 和x 满足线性关系下进行的,那么用上述最小二乘法线性拟合又称一元线性回归可解得斜率a 和截距b ,从而得出回归方程bx a y +=;如果实验是要通过对x 、y 的测量来寻找经验公式,则还应判断由上述一元线性拟合所确定的线性回归方程是否恰当;这可用下列相关系数r 来判别))((2222y y x x yx xy r --⋅-= 1-5-7其中21121⎪⎭⎫ ⎝⎛∑==y n y n i ,2121i n i y n y =∑=;可以证明,||r 值总是在0和1之间;||r 值越接近1,说明实验数据点密集地分布在所拟合的直线的近旁,用线性函数进行回归是合适的;1||=r 表示变量x 、y 完全线性相关,拟合直线通过全部实验数据点;||r 值越小线性越差,一般9.0||≥r 时可认为两个物理量之间存在较密切的线性关系,此时用最小二乘法直线拟合才有实际意义;。
数据处理及误差分析
数据处理及误差分析1. 引言数据处理及误差分析是科学研究和工程实践中一个至关重要的领域。
在收集和处理数据的过程中,往往会受到各种因素的干扰和误差的影响。
因此,正确地处理这些数据并进行误差分析,对于准确得出结论和进行科学决策至关重要。
2. 数据处理数据处理是指对收集到的数据进行整理、分析和解释的过程。
它包括了数据清洗、数据转换、数据提取和数据集成等步骤。
2.1 数据清洗数据清洗是指对原始数据进行筛选、剔除异常值和填充缺失值等处理。
清洗后的数据更加可靠和准确,能够更好地反映实际情况。
2.2 数据转换数据转换主要是将原始数据转化为符合分析需求的形式。
比如,将连续型数据离散化、进行数据标准化等。
2.3 数据提取数据提取是指从庞大的数据集中挑选出有意义和相关的数据进行分析。
通过合理选择变量和提取特征,可以提高数据分析的效率和准确性。
2.4 数据集成数据集成是指将来自不同数据源的数据进行整合和合并,以满足分析需求。
通过数据集成,可以获得更全面、更综合的数据集,提高分析结果的可信度。
3. 误差分析误差分析是对数据处理过程中产生的误差进行评估和分析。
误差可以分为系统误差和随机误差两种类型。
3.1 系统误差系统误差是由于数据收集和处理过程中的系统性偏差导致的。
它们可能是由于仪器精度不高、实验环境变化等原因引起的。
系统误差一般是可纠正的,但要确保误差产生的原因被消除或减小。
3.2 随机误差随机误差是由于抽样误差、观察误差等随机因素导致的。
它们是不可预测和不可消除的,只能通过多次重复实验和统计方法进行分析和控制。
4. 误差分析方法误差分析通常采用统计学和数学方法进行。
其中,常用的方法有误差传递法、误差平均法、误差椭圆法等。
4.1 误差传递法误差传递法是将各个步骤中产生的误差逐步传递,最终计算出整个数据处理过程中的总误差。
它能够帮助我们了解每个步骤对最终结果的影响程度,并找出影响结果准确性的关键因素。
4.2 误差平均法误差平均法是通过多次实验重复测量,并计算平均值来减小随机误差的影响。
误差分析和数据处理
Ⅱ-1 误差的基本概念
五、不确定度
根据国家计量局《关于表达不确定度的建议 草案》,把不确定度按估计其权值所用的方法不 同归并成两类:
A类分量:对一系统多次重复测量后,用统计方法计 算出的标准偏差。
B类分量:用其他方法估算出的近似的标准偏差。
Ⅱ-1 误差的基本概念
而后用方和根的方法合成A类分量和B类分量, 合成后仍以标准偏差的形式表征,称为合成不确 定度。合成不确定度乘以一系数,从而得到总不 确定度,用下式表示:
误差分析和数据处理是判断科学实验和科学 测试结果质量和水平的主要手段。
Ⅱ-1 误差的基本概念
一、误差的定义和表示方法
(一)误差定义:
测量误差:是指被测量的实测值与其真值的 差别。
Ⅱ-1 误差的基本概念
(二)表示方法 1、绝对误差
绝对误差=测量值-真值
其中真值在以下情况下被认为是已知的。
Ⅱ-1 误差的基本概念
U K信系数; U 总不确定度。
Ⅱ-2 随机误差的性质与处理
一、正态分布规律
在工程应用中,大多数随机误差的分布具有 以下几个特点:
(一)对称性:绝对值相等的正、负误差出现的概 率相等。
(二)单峰性:绝对值得误差出现的概率大, 绝对值大的出现的概率小。
Ⅱ-2 随机误差的性质与处理
次测量,大约有68次的值是落在 的范围的。
Ⅱ-2 随机误差的性质与处理
当置信区间宽为 2时,对应概率为95.4%
当置信区间宽为 3 时,对应概率为99.7%
因此可认为绝对值大于3 的误差几乎不可能
出现,所以通常又把 3 的误差称为单次测量误
差,用lim 表示。
lim 3
(三)算术平均值的概率误差
实验数据误差分析和数据处理
实验数据误差分析和数据处理数据误差分析是首要的步骤,它通常包括以下几个方面:1.随机误差:随机误差是指在重复实验的过程中,由于个体差异等原因引起的测量结果的离散性。
随机误差是不可避免的,并且符合一定的统计规律。
通过进行多次重复测量,并计算平均值和标准差等统计指标,可以评估随机误差的大小。
2.系统误差:系统误差是由于仪器、测量方法或实验条件所引起的,使得测量结果与真实值的偏离。
系统误差可能是由于仪器刻度的不准确、环境温度的变化等原因导致的。
通过合理校准仪器、控制环境条件等方式可以减小系统误差。
在数据误差分析的基础上,进行数据处理是必不可少的步骤。
数据处理的目的是通过对实验结果的合理处理,得到更为准确的结论。
1.统计处理:统计方法是最常用的数据处理方法之一、通过使用统计学中的概率分布、假设检验、方差分析等方法,可以对实验数据进行科学、客观的分析和处理。
2.回归分析:回归分析是一种通过建立数学模型来研究变量之间关系的方法。
通过对实验数据进行回归分析,可以确定变量之间的数学关系,并预测未知数据。
3.误差传递与不确定度评定:在实验中,不同参数之间的误差如何相互影响,以及这些误差如何传递到最终结果中,是一个重要的问题。
通过不确定度评定方法,可以定量评估各个参数的不确定度,并估计最终结果的不确定度。
4.数据可视化和图表展示:通过绘制合适的图表,可以更直观地展示实验数据的分布规律、趋势以及变化情况。
例如,折线图、散点图、柱状图等可以有效地展示数据的分布和相关关系。
综上所述,实验数据误差分析和数据处理是进行科学研究的重要环节。
准确评估和处理数据误差可以提高实验结果的可靠性和准确性,为研究结果的正确性提供基础。
通过合理选择和应用适当的数据处理方法,可以从实验数据中得出有意义的结论,并为进一步研究提供指导。
分析化学第二章误差与分析数据处理
根据待测组分的性质和含量选择合适的分析 方法。
空白实验
通过扣除空白值来减小误差。
标准化样品分析
使用标准样品对实验过程进行质量控制。
回收率实验
通过添加已知量的标准物质来评估分析方法 的准确性。
04
有效数字及其运算规则
有效数字的定义与表示
01
有效数字是指测量或计算中能够反映被测量大小的部分数字 ,其位数与被测量的精密度有关。
数据统计
计算平均值、中位数、众数等统计量,以反映数据的集 中趋势和离散程度。
实验结果的评价与表达
误差分析
计算误差、偏差、相对误差 等,评估实验结果的可靠性
。
1
精密度与偏差
通过多次重复实验,评估实 验结果的精密度和偏差。
置信区间
根据实验数据,计算结果的 置信区间,反映结果的可靠 性。
结果表达
选择合适的单位和量纲,将 实验结果以表格、图表等形 式表达,便于分析和比较。
02
表示有效数字时,需保留一位不确定位,采用指数或修约的 形式表示。
03
有效数字的表示方法:科学记数法(a x 10^n)或一般表示法。
有效数字的运算规则
加减法
以小数点后位数最少的数字为标准,对 其他数字进行修约,然后再进行运算。
乘方和开方
运算结果的有效数字位数与原数相同。
乘除法
以有效数字位数最少的数为标准,对 其他数字进行修约,然后再进行运算。
THANKS
准确度检验
通过标准物质或标准方法对比,检验分析结 果的准确性。
线性检验
验证测量系统是否符合线性关系,确保数据 在一定范围内准确可靠。
范围检验
评估分析方法在一定浓度或含量范围内的适 用性。
误差分析与数据处理
误差分析与数据处理在我们的日常生活和各种科学研究、工程实践中,数据的获取和处理是至关重要的环节。
然而,由于各种因素的影响,我们所获得的数据往往存在一定的误差。
这些误差可能会对我们的分析结果产生误导,甚至导致错误的决策。
因此,误差分析与数据处理就成为了确保数据质量和可靠性的关键步骤。
首先,我们需要了解误差的来源。
误差大致可以分为两类:系统误差和随机误差。
系统误差是由于测量仪器的不准确、测量方法的不完善或者环境因素的恒定影响等原因导致的,其特点是误差的大小和方向具有一定的规律性。
例如,使用未经校准的温度计测量温度,每次测量结果都会偏高或偏低一个固定的值,这就是系统误差。
随机误差则是由一些不可预测的偶然因素引起的,其特点是误差的大小和方向没有明显的规律。
比如,在测量物体的长度时,由于人的读数瞬间的差异,每次测量结果可能会有所不同,这就是随机误差。
在进行误差分析时,我们需要对误差的大小和性质进行评估。
常用的误差衡量指标包括绝对误差、相对误差和标准误差等。
绝对误差是测量值与真实值之间的差值,它直接反映了误差的大小。
相对误差则是绝对误差与真实值的比值,能够更直观地反映测量的准确度。
标准误差则用于衡量多次测量结果的离散程度。
为了减小误差,我们可以采取多种措施。
在测量前,要对测量仪器进行校准和调试,选择合适的测量方法,并控制好测量环境。
在测量过程中,要严格按照操作规程进行操作,多次测量取平均值可以有效地减小随机误差。
此外,还可以采用更先进的测量技术和设备来提高测量的精度。
数据处理是对测量得到的数据进行整理、分析和计算的过程。
在数据处理中,我们需要对异常数据进行识别和处理。
异常数据是指与其他数据明显不符的数据点,可能是由于测量错误或者特殊情况导致的。
对于异常数据,我们不能简单地将其舍去,而需要进行仔细的分析和判断。
如果确定是由于测量错误导致的异常数据,应该予以剔除;如果异常数据是真实存在的,我们需要对其原因进行研究,并在后续的分析中给予适当的考虑。
误差分析和数据处理
误差分析、数据处理和物理实验不同,电子电路基础实验通常采用的是单次测量,对误差处理要求相对较低。
1.误差绝对误差设被测量量的真值为Ao,测量仪器的示值为X,则绝对值为△X=X-Ao在某一时间及空间条件下,被测量量的真值虽然是客观存在的,但一般无法测得,只能尽量逼近它。
故常用高一级标准测量仪器的测量值A代替真值Ao,则△X=X-A相对误差是用绝对误差△X与被测量的实际值A的比值的百分数来表示的相对误差。
在电子电路一般的实验中,由于已经可以利用已有的公式计算,所以一般直接用理论值代替真值A,然后进行误差计算。
2.测量数据处理1.测量结果的数据处理(1)有效数字由于存在误差,所以测量资料总是近似值,它通常由可靠数字和欠准数字两部分组成。
例如,由电流表测得电流为12.6mA,这是个近似数,12是可靠数字,而末位6为欠准数字,即12.6为三位有效数字。
有效数字对测量结果的科学表述极为重要。
对有效数字的正确表示,应注意以下几点:①与计量单位有关的"0"不是有效数字,例如,0.054A与54mA这两种写法均为两位有效数字。
②小数点后面的"0"不能随意省略,例如,18mA与18.00mA是有区别的,前者为两位有效数字,后者则是四位有效数字。
③对后面带"0"的大数目数字,不同写法其有效数字位数是不同的,例如,3000如写成30×10 2,则成为两位有效数字;若写成3×103,则成为一位有效数字;如写成3000±1,就是四位有效数字。
④如已知误差,则有效数字的位数应与误差所在位相一致,即:有效数字的最后一位数应与误差所在位对齐。
如;仪表误差为±0.02V,测得数为3.2832V,其结果应写作3.28V。
因为小数点后面第二位"8"所在位已经产生了误差,所以从小数点后面第三位开始后面的"32"已经没有意义了,写结果时应舍去。
误差分析与数据处理
误差分析与数据处理物理化学实验是研究物质的物理性质以及这些物理性质与其化学反应间关系的一门实验科学。
在实验研究工作中,一方面要拟定实验的方案,选择一定精度的仪器和适当的方法进行测量;另一方面必须将所测得的数据加以整理归纳,科学地分析并寻求被研究变量间的规律。
但由于仪器和感觉器官的限制,实验测得的数据只能达到一定程度的准确性。
因此,在着手实验之前要了解测量所能达到的准确度以及在实验以后合理地进行数据处理,都必须具有正确的误差概念,在此基础上通过误差分析,选用最合适的仪器量程,寻找适当的实验方法,得出测量的有利条件。
下面首先简要介绍有关误差等几个基本概念。
一、一、基本概念1.误差。
在任何一种测量中,无论所用仪器多么精密,方法多么完善,实验者多么细心,所得结果常常不能完全一致而会有一定的误差或偏差。
严格地说,误差是指观测值与真值之差,偏差是指观测值与平均值之差。
但习惯上常将两者混用而不加区别。
根据误差的种类、性质以及产生的原因,可将误差分为系统误差、偶然误差和过失误差三种。
系统误差:这种误差是由于某种特殊原因所造成的恒定偏差,或者偏大或者偏小,其数值总可设法加以确定,因而一般说来,它们对测量结果的影响可用改正量来校正。
系统误差起因很多,例如:(1)仪器误差。
这是由于仪器构造不够完善,示数部分的刻度划分得不够准确所引起,如天平零点的移动,气压表的真空度不高,温度计、移液管、滴定管的刻度不够准确等。
(2)测量方法本身的限制。
如根据理想气体方程式测量某蒸汽的相对分子质量时,由于实际气体对理想气体有偏差,不用外推法求得的相对分子质量总较实际的相对分子质量为大。
(3)个人习惯性误差。
这是由于观测者有自己的习惯和特点所引起,如记录某一信号的时间总是滞后、有人对颜色的感觉不灵敏、滴定等当点总是偏高等。
系统误差决定测量结果的准确度。
它恒偏于一方,偏正或偏负,测量次数的增加并不能使之消除。
通常是用几种不同的实验技术或用不同的实验方法或改变实验条件、调换仪器等以确定有无系统误差存在,并确定其性质,设法消除或使之减少,以提高准确度。
误差分析与数据处理
第一章 误差分析与数据处理1-1 误差分析的意义何在?1-2 误差有几种类型?总结系统误差与随机误差的异同点。
1-3 试验数据的准确度和精密度如何表示,它们之间有何关系? 1-4 什么叫有效数字,有效数字的误差如何计算? 1-5 数据有几种表示方法,各有何优缺点? 1-6 可疑观测值的取舍有哪些方法?简述其步骤。
1-7 测得某三角块的三个角度之和为180º00′02″,试求测量的绝对误差和相对误差。
1-8 在万能测长仪上,测量某一被测件的长度为50 mm ,已知其最大绝对误差为1 m ,试问该被测件的真实长度为多少?1-9 在测量某一长度时,读数值为2.31 m ,其最大绝对误差为20 m ,试求其最大相对误差。
1-10 使用凯特摆时,g 由公式2212/)(4T h h g +=π给定。
今测出长度(h 1+h 2)为(1.04230±0.00005) m ,振动时间T 为(2.0480±0.0005) s 。
试求g 及其最大相对误差。
如果(h 1+h 2)测出为(1.04220±0.0005) m ,为了使g 的误差能小于0.001 m/s 2,T 的测量必须精确到多少?1-11 检定2.5级(即引用误差为2.5%)、量程为100 V 的电压表,发现50 V 刻度点的示值误差2 V 为最大误差,问该电压表是否合格?1-12 为什么在使用微安表等各种电表时,总希望指针在全量程的2/3范围内使用?1-13用两种方法测量L 1=50 mm ,L 2=80 mm ,测量结果为50.004 mm ,80.006 mm 。
试评定两种方法测量精度的高低。
1-14 多级弹导火箭的射程为10000 km 时,其射击偏离预定点不超过0.1 km ,优秀射手能在距离50 m 远处准确地射中直径为2 cm 的靶心,试评述哪一个射击精度高?1-15 测量某物体重量共8次,测得数据(单位为g)为236.45,236.37,236.51,236.34,236.39,236.48,236.47,236.40。
1误差分析与数据处理
26
再例如:
某电阻值为 20000(欧姆),保留三位有效数字时写 成 2.00104
又 如 数 据 为 0.0000325m , 使 用 科 学 记 数 法 写 成 3.2510-5m
980cm / s2 9.80m / s2 0.00980km/ s2 9.8m / s2
(4)缓变误差: 是指数值上随时间缓慢变化的误差,一般它是由零部件的
老化、机械零件内应力变化引起的。由于它有不平稳随机 过程的特点,误差值在单调缓慢变化,因此不能象对系统 误差那样引进一次修正量即能校正,又不能象对一般随机 误差那样按平稳随机过程的特点来处理,因而常需不断进 行校正,测量准确度与对仪器仪表的校正周期有关。
7
➢发现系统误差的简单方法
通过观察偏差发现系统误差
1)将观测值依次排列,如偏差的大小有规则地向一个方向变化,即前面 为负号,后面为正号,且符号为(一一一一一十++十+)或相反(+ 十++十一一一一一),则说明该组观测值含有累进的系统误差。如中 间有微小波动,则说明有随机误差的影响。
2)将观测值依次排列,如偏差符号作有规律交替变化,则测量中含有周期 性误差。如中间有微小波动,则说明有随机误差的影响。
1) 直接测量和间接测量
➢ 直接测量: 凡是使用仪器 ➢间接测量:从一个或几个直接测
或量具就可直接得到被测量 量结果按一定的函数关系计算出来
值的测量;
的过程,称为间接测量。
➢例如:用直尺测量长度;
以表计时间;
天平称质量;
M
安培表测电流。
d
V hd 2
h
4
M V
4M
d 2h
1
2)等精度测量和非等精度测量
工程测量中的数据处理与误差分析
工程测量中的数据处理与误差分析工程测量是工程领域中非常重要的一项工作,它涉及到测量数据的采集、处理和分析。
在测量过程中,获取准确的数据,进行合理的数据处理,并对可能出现的误差进行分析,对于工程的设计、施工和质量控制都具有重要意义。
本文将就工程测量中的数据处理与误差分析进行详细讨论。
一、数据处理方法在工程测量中,数据处理通常包括数据采集、数据预处理和数据后处理三个环节。
数据采集是通过测量仪器对被测对象进行测量,得到一系列测量数据。
数据采集的准确性直接影响到后续数据处理的可靠性。
在数据采集之后,需要对原始数据进行预处理。
预处理的目的是对原始数据进行加工和清理,消除或减小数据中的噪音和随机误差。
常用的预处理方法包括滤波、平滑和插值等。
滤波是在信号处理中常用的方法,可以通过去除高频部分来减小数据的噪音干扰。
平滑技术可以用来减少数据的波动,使得数据更加平稳。
插值则是通过已知数据点来推测未知数据点的值,从而填补数据中的空缺部分。
数据预处理完成后,需要进行数据后处理。
数据后处理是对预处理后的数据进行分析、计算和评估,最终得到所需的测量结果。
常用的数据后处理方法有统计分析、回归分析和误差分析等。
统计分析可以从整体上对数据进行描述性分析,包括均值、标准差、方差和偏度等。
回归分析可以通过已知数据点来建立数学模型,并拟合出未知数据点的值,用于预测和估计。
误差分析是对数据误差进行量化和评估,通过计算误差的大小和分布来评估测量结果的可靠性。
二、误差分析方法误差是工程测量中不可避免的问题,它来源于多方面的因素,包括仪器精度、环境条件、人为因素等。
误差的存在会影响到测量结果的准确性和可靠性,因此对误差进行分析和控制是工程测量的关键。
常用的误差分析方法包括误差源分析、误差传递分析和误差评定分析。
误差源分析是对误差产生的原因进行分析和归纳。
误差可以分为系统误差和随机误差两类。
系统误差是由于系统的固有特性而产生的误差,主要影响测量结果的准确性和偏差。
分析误差及数据处理
正确的做法是:
修约前是:15.4546
修约后是:15
不正确的做法是:
修约前:15.4546
一次修约:15.455
二次修约:15.46
三次修约:15.5
四次修约:16
四、有效数字及其运算规则
在分析过程中,记录和计算分析结果时,要使记录数字及计算结果的准确程度与计量仪器的准确度相适应。
标准中极限数值的表示形式及书写位数应该适当。它的有效位数应全部给出,应能保证或其它标准化对象的应用性能和质量,从而也规定了为检测实际标准化对象而得到的测定值或其计算应具有的相应精确程度。
2、表达极限数值的用语及其涵义
基本用语
符号
特定情形下的基本用语
涵义
大于A
<A
(不足A)
多于A
高于A
A值不符合标准要求
例:
项目
极限数值
测定值
或写成
符合(否)
例1
NaOH含量,%
≧97%
97.01
97.00
96.98
96.94
97.0(+)
97.0
97.0(-)
96.9(+)
符合
符合
不符合
不符合
例2
硅含量,%
≦0.05
0.049
0.050
0.051
0.056
0.05(-)
0.05
0.05(+)
0.06
符合
符合
不符合
不符合
减免方法:
加强基本功练习
2.偶然误差:偶然因素,如温度、压力、振动、湿度、操作丢失、玷污等不被发现特点,误差数值不恒定,大小、正负,无法避免,影响精密度
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
误差理论与数据处理一.绪论当你能对世界进行测量的时候,就可以把世界变成数据来了解。
1.研究误差的意义分析误差产生原因,从而消除误差;正确处理所得数据,从而接近真值;选择合理的方法,设计合理的系统。
2.误差的基本概念误差=测量值—真值约定真值:对于给定用途具有适当不确定度的、赋予特定量的值。
绝对误差=|测量值—真值|相对误差=绝对误差/|真值|=绝对误差/|测量值|修正值:与误差大小近似相等,但方向相反。
修正值本身还有误差。
引用误差=示值误差/测量范围上限3.误差来源测量装置误差:标准量具的误差、一起误差、附件误差环境误差:温度、湿度、气压、振动、照明、加速度、电磁场等。
方法误差人员误差4.误差分类系统误差:在相同条件下,多次测量同一量值时,该误差的绝对值和符号保持不变,或者在条件改变时,按某一确定规律变化的误差。
(均值和真值之差)系统误差分类:已定系统误差、未定系统误差、不变系统误差、变化系统误差(线性、周期性、复杂规律)随机误差:大小、方向均随机不定,不可预见,不可修正。
(抑制、统计分布规律)粗大误差:明显超出统计规律预期值的误差。
(异常因素或疏忽)5.精度准确度:系统误差的大小(偏移程度)精密度:随机误差的大小(分散程度)精确度:测量结果与被测量真值之间的一致程度精确度(精度)在数值上一般多用相对误差来表示,但不用百分数。
如某一测量结果的相对误差为0.001%,则其精度为10-5。
重复性:指在相同条件下在短时间内对同一个量进行多次测量所得测量结果之间的一致程度,一般用测量结果的分散性来定量表示。
复现性:指在变化条件下,对同一个量进行多次测量所得测量结果之间的一致程度,一般用测量结果的分散性来定量表示。
稳定性:测量仪器保持其计量特性随时间恒定的能力。
示值误差:指测量仪器的示值与对应输入量的真值之差。
由于真值不能确定,故在实际应用中常采用约定真值。
偏移:指系统误差最大允许误差:给定的测量仪器,规范、规程等所允许的误差极限值。
有时也称为允许误差限。
不确定度:与测量结果相关联的、用于合理表征被测量值分散性大小的参数。
6.有效数字最末一位数字是不可靠的,而倒数第二位数字是可靠的。
在进行重要的测量时,测量结果和测量误差可再多取一位数字作为参考。
二.误差基本性质与处理1.随机误差产生原因测量装置、环境因素、人为因素。
随机误差整体具有统计学规律,多数随机误差服从正态分布。
(单峰、对称、有界、均值趋于零)2.算术平均值由于实际上都是有限次测量,因此,我们只能把算术平均值近似地作为被测量的真值。
一般情况下,被测量的真值为未知,这时可用算术平均值代替被测量的真值进行计算。
此时的随机误差称为残余误差,简称残差残余误差代数和为零这一性质,可用来校核算术平均值及其残余误差计算的正确性。
但当实际得到的为经过凑整的非准确数,存在舍入误差。
<A*n/2;当n为偶数时,Σvi<A*(n+1)/2。
当n为奇数时,Σvi式中的A为实际求得的算术平均值末位数的一个单位。
3.测量的标准差均方根误差σ(标准偏差)、或然误差ρ、算术平均误差θ(1)高斯参数h为精密度。
由于h值无法以实验中得到,故以σ值代之。
(2)ρ将整个测量列分为两半。
一半落在区间[-ρ,+ρ]之内。
ρ=σ*2/3(3)θ是随机偏差的绝对值的算术平均值①σ的平方恰好是随机变量的数字特征之一(方差),σ本身又恰好是高斯误差方程f(δ)式中的一个参数,所以采用σ,正好符合概率论原理,又与最小二乘法最切合;δ是随机误差②σ对大的随机误差很敏感,能更准确地说明测量列的精度;③极限误差与标准偏差的关系简单δ=+3σ.标准偏差的几种算法:(1)贝塞尔公式(2)极差法ωn=x max -x min, σ=ωn/d n(3)最大误差法σ= |δ|max *1/k n贝塞尔公式的计算精度较高,但计算麻烦;极差法非常方便,可用来作为校对公式,当n<10时可用来计算σ,此时计算精度高于贝氏公式;用最大误差法计算σ更为简捷,当n<10时可用最大误差法,计算精度大多高于贝氏公式,尤其是对于破坏性实验(n=1)只能应用最大误差法。
不等精度测量:测量条件的改变则为不等精度测量,如果这些测量结果是相互一致的。
那么测量结果就是真正可以信赖的。
根据可靠性来定权值。
4.系统误差来源:测量装置、环境因素、测量方法、测量人员分类:恒定系统误差、变化系统误差定值系统误差:在数据处理中只影响算术平均值,而不影响残差及标准差,所以除了要设法找出该恒定系统误差的大小和符号,对其算术平均值加以修正外,不会影响其他数据处理的过程。
只引起分布密度曲线的位置变化变化系统误差:于它对算术平均值和残差均产生影响,所以应在处理测量数据的过程中,必须要同时设法找出该误差的变化规律,进而消除其对测量结果的影响。
不仅使随机误差的分布密度曲线的形状和分布范围发生变化 ,也使曲线的位置产生平移。
⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎨⎧⎪⎪⎩⎪⎪⎨⎧⎪⎪⎩⎪⎪⎨⎧秩和检验法检验法计算数据比较法,正态检验法检验法组间不同公式计算标准差法残余误差校核法残余误差观察法实验对比法组内发现系统误差的方法F t系统误差的消除:消误差源法、加修正值法、改进测量方法 消除恒定系统误差的方法:反向补偿法、代替、抵消、交换 消除线性系统误差的方法——对称法 消除周期性系统误差的方法——半周期法消除复杂规律变化系统误差的方法:通过构造合适的数学模型,进行实验回归统计,对复杂规律变化的系统误差进行补偿和修正。
5.粗大误差来源:测量人员、客观外界条件判断方法:给定一个显著性水平,按一定分布确定一个临界值,凡超过这个界限的误差,就认为它不属于偶然误差的范围,而是粗大误差,该数据应予以剔除。
(3σ准则、格拉布斯准则、狄克松准则、罗曼诺夫斯基准则)① 大样本情况(n>50)用3σ准则最简单方便,虽然这种判别准则的可靠性不高,但它使用简便,不需要查表,故在要求不高时经常使用;30<n ≤50情形,用格拉布斯准则效果较好;3≤n<30情形,用格拉布斯准则适于剔除一个异常值,用狄克逊准则适于剔除一个以上异常值。
当测量次数比较小时,也可根据情况采用罗曼诺夫斯基准则 。
② 在较为精密的实验场合,可以选用二、三种准则同时判断,当一致认为某值应剔除或保留时,则可以放心地加以剔除或保留。
当几种方法的判断结果有矛盾时,则应慎重考虑,一般以不剔除为妥。
因为留下某个怀疑的数据后算出的σ只是偏大一点,这样较为安全。
另外,可以再增添测量次数,以消除或减少它对平均值的影响。
6.三种误差的性质① 随机误差具有抵偿性,这是它最本质的特性,算术均值和标准差是表示测量结果的两个主要统计量;系统误差则违背抵偿性,因而会影响算术均值,变化的系统误差还影响标准差;粗大误差则存在于个别的可疑数据中,也会影响算术均值和标准差。
② 随机误差服从统计规律,是无法消除的,但通过适当增加测量次数可提高测量精度;系统误差则是有确定性规律,在掌握这个规律后,可以采取适当的措施消除或减小它;粗大误差既违背统计规律,又违背确定性规律,可用物理或统计的方法判断后剔除。
③ 为处理一组测量数据,往往先找出个别可疑数据,经统计判断确认无粗大误差后,再用适当的方法检验数据中是否含有明显的系统误差,如确认已无系统误差,最后处理随机误差,统计算术平均值、标准差及极限误差,以正确的表达方式给出测量结果。
三.误差合成与分配 1.函数误差通过直接测得的量与被测量之间的函数关系计算出被测量,称为间接测量。
由此所得误差称为函数误差。
2.函数随机误差函数一般形式:f(x 1,x 2,……,x n )变量只含随机误差:y+δy=f(x 1+δx 1,x 2+δx 2,……,x n +δx n )2222222121122n yx x xn ij xi xj i j n i j f f f f f x x x x x σσσσρσσ≤<⎛⎫⎛⎫⎛⎫⎛⎫∂∂∂∂∂=++++ ⎪ ⎪ ⎪ ⎪ ⎪∂∂∂∂∂⎝⎭⎝⎭⎝⎭⎝⎭∑ 若各测量值的随机误差是相互独立的,当各个测量值的随机误差都为正态分布时,标准差用极限误差代替.ρij 反映了各随机误差分量相互间的线性关联对函数总误差的影响.3.随机误差合成合成方式:标准差合成、极限误差合成(误差传播系数、误差相关性影响 ) 标准差合成:σ=误差传播系数:由间接测量的显函数模型求得、根据实际经验给出、δy=a i σi 极限误差合成:单项极限误差:δi =k i σi (k i 为单项极限误差的置信系数)合成极限误差:δ=k σ4..系统误差合成已定系统误差合成:∑=ri ii a ∆∆未定系统误差合成:服从一定的概论分布,具有随机误差的特性。
只需估计出其不致超过某一范围+e 的系统误差.合成方法和随机误差合成相似。
标准差合成:()∑∑<≤=+=sji ji j i ij si i i u u a a u a u 1122ρ极限误差合成:e=+t*u()∑∑<≤=+±=sji ji j i ij si i i u u a a u a te 1122ρ5.随机和系统误差合成合成方式:标准差合成、极限误差合成极限误差合成(单次测量):(R 为各个误差之间的协方差之和)Rt t e tqi iisi i i ri i+⎪⎪⎭⎫ ⎝⎛+⎪⎪⎭⎫⎝⎛±=∑∑∑===12121δ∆∆总极限误差合成(n 次重复测量情况):随机误差间具有低偿性、系统误差(包括未定系统误差)不存在低偿性,总误差合成公式中的随机误差项应除以重复测量次数n 。
∑∑==+±=qi i si i ne 12121δ∆总标准差合成(单次测量):Ru qi i si i ++=∑∑==1212σσ标准差合成(n 次重复测量情况):∑∑==+±=qi i si i nu 12121σσ6.误差分配给定测量结果允许的总误差,合理确定各个单项误差。
在误差分配时,随机误差和未定系统误差同等看待。
等影响原则:12y y yn σσσ===i σ=i δ==按等影响原则分配误差的不合理性(按可能性调整误差):(1) 对各分项误差平均分配的结果,会造成对部分测量误差的需求实现颇感容易,而对令一些测量误差的要求难以达到。
(2) 当各个部分误差一定时,则相应测量值的误差与其传播系数成反比。
所以各个部分误差相等,相应测量值的误差并不相等,有时可能相差较大。
(3) 根据具体情况进行适当调整。
对难以实现测量的误差项适当扩大,对容易实现的误差项尽可能缩小,其余误差项不予调整。
验算调整后的总误差 :误差按等影响原理确定后,应按照误差合成公式计算实际总误差,若超出给定的允许误差范围,应选择可能缩小的误差项再进行缩小。