计量测试中异常数据的处理方式

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计量测试中异常数据的处理方式

摘要:在计量测试中,由于受到一些因素的影响,从而使得常常会出现异常数据,为确保计量测试结果的准确性,必须对异常数据进行剔除。基于此点,本文

从计量测试中异常数据的成因分析入手,提出计量测试异常数据的处理方式。期

望通过本文的研究能够对计量测试数据精度的提升有所帮助。

关键词:计量测试异常数据处理

引言

计量测量,其本身便是一项对数据精准性有着极高要求的工作。而要确保数

据获取的精准性,除了需科学处理计量测量所得出的数据外,尚需找出其中的异

常数据并将之剔除,如此方能作为相关科学的参考依据。当前,国内已然根据计

量测量中异常数据的出现原因提出了4种有针对性的异常数据剔除方法,这些方

法可独立使用,亦可综合利用,其目的均在于判定异常值并将之剔除,以确保计

量测量数据的准确性。

1对于计量测试的作用分析

计量测试是对日常生产科学性的体现,也会对每天的实际数据类别予以分析,而后再应用专业的测量设备进行评估和审计,对评估的最终结果进行分析,再对

其实际工作情况进行探究,判定其是否符合实际的生产标准和规章制度的内容。

数据的检测也是极为重要的环节,只有通过数据的核实和校对,才会对生产中的

各个环节和所生产的最终产品进行检验,才会对其检测参数予以合理的判定和分析,最终判定检测结果是否符合实际的生产需求。不具备精准度的测量方式就无

法对实际的生产工艺予以指导,也无法对数据进行针对性的判断,最终也不能对

工艺流程予以合理的控制,导致后期的产品生产的合格以及工作落实的科学性均

无法得到切实的保障。

2计量仪器出现误差的原因

由于计量仪器对外部环境有着极高的要求,加之其本身也是一种高精密的仪器,因而任何外部环境的变化都可能导致仪器测试结果产生偏差,并最终影响到

检测结果的准确性。

(1)仪器受到了外界诸如震动、机械动荡一类的自然或人为因素影响;

(2)受电磁干扰或因供电电压不稳而导致的检测仪器出现故障;

(3)操作人员本身经验不足,加之操作事物所因其的检测不准确;

(4)仪器本身存在如元件损坏、零件松动一类的质量问题,这类问题一旦发生,将直接导致检测结果不准确,从而影响到工作人员的正常测量。

对于以上影响因素,操作人员在实际的操作过程中,务必全面排除,如此方

能确保测量结果的准确性。当然,在此过程中,针对异常值的剔除尚需注意采取

合适的剔除方法,若剔除方法选择不当则可能收获适得其反的效果。

3计量测试异常数据的处理方式

3.1异常数据的判断方法

在计量测试过程中,对异常数据进行判断时,应当选择正确的方法。目前,

较为常用的判断方法有以下几种:

3.1.1拉依达判断法

这种方法基于的是拉依达准则,具体的判定原理如下:假定某一组测试数据

当中只包含随机误差,通过计算处理可以获得标准偏差,根据特定的概率可确定

出一个区间范围,如果误差超出这个区间范围,则可将之判定为粗大误差,含有

粗大误差的数据则为异常数据,需要进行剔除。该方法可对正态或是接近正态分

布的数据进行有效处理,应用时,需要确保测试次数充分,若是测试次数不足,

则会造成粗大误差的可靠性降低。所以当测试次数较少时,不宜采用该方法对异

常数据进行判断。该方法具体的判断过程如下:对被测试量进行等精度测量,由

此可获得x1,x2,…xn,随后求取算术平均值x和剩余误差vi,其中vi可用下式表示:vi=xi-x(1)上式中i=(1,2,…n),在根据贝赛尔公式可以计算出标准偏差σ。如果某

个测量值xb的剩余误差vb(1≤b≤n),并满足下式:|vb|=|xb-x|>3σ(2)则可认为

xb是含有粗大误差值的坏值,应当予以剔除。

3.1.2格拉布斯判断法

这种方法是以测试量的正态分布作为判断前提,从理论的角度上讲,该方法

较为严谨,操作过程也比较简便。该方法的判定原理如下:当某个测量值的残余

误差的绝对值|vi|>Gg时,则可判定该值当中存在相对较大的误差,应当对误差

进行剔除。该方法对异常数据的判断过程如下:

按照测量结果偏离真值的程度(误差理论),想要对偶然误差进行有效剔除,至少需要进行10次以上的测量,为了确保测量精度和响应速度,可将15次确定

为一个单位,当获得15次测量数据后,其中可能会含有较大的误差,可以通过

分检的方法,将可疑值剔除掉。当测量值xi对应的残差vi满足下式时应当该数据舍去:

在上式当中,x表示n次采集到的平均值(∑xi)/n;σ(x)表示测量数据组的标准差,可由贝

赛尔公式求取;中的n表示测量次数,表示显著性水平(可取0.01或0.05)。当测量次数

n=15,显著性水平=0.05时,则

=2.41。随后可将15次的采集值存入到同一个数组当中,求取平均值,对残差进行计算,进而求出σ(x),并将残差的绝对值与2.41倍的σ(x)进行比较,剔除可疑值后再次求取平均值,然后重复上述步骤验证是否仍有可疑值。在实际应用中发现,基本不需要重复,通常第一遍

即可达到要求。

3.1.3t-检验法

这是一种假设检验的方法,可在测量次数n<30的条件下使用,通过对随机变量的数学期

望进行检验,看是否与某个已知的值相等。该方法的检验过程如下:假设(x1,x2,…xn)为正态

随机变量x的样本,期望Mx与已知值m0相等。按照统计理论,如果上述假设成立,则统

计量服从自由度n-1的t-分布。当正态随机变量小于样本时,可用该方法对数学期望进行检验,看是否存在较为显著的差异,若是有则可将之剔除。

4实例判定

以下为结合实例所判定的异常值判断准则:如经过某测量得出了如下一系列的测量数据:10.002,10.204,0.218,10.228,10.230,10.312,10.320,10.342,10.346,结合以上方式进行判断并剔

除异常值,那么置信概念的可取值可设定为95%,那么相应地。此时,我们将异常值怀疑为10.346,之后通过计算可得出这十个数的平均值为10.2317,那么对应的X1的平均值则为

10.2231,,经过综合计算,得出10.346为异常值,应将其剔除。通过采用四种方法来进行

判定,其10346为异常值,而G(a,n)与10.002-10.2317非常相近,这在一定程度上说明

了应用格拉布斯准则的效果较好。在整个判定过程中,作为判定异常数值的基本思想是:先

做好某一个统计量,如果这个统计量在规定的范围之内,便可以认为是服从止态分布,否则

就认为相关的数据并不服从止态分布,这则说明了其中的数据存在一定的误差。

结语

综上所述,在实际的生产和运作过程中,都会通过各类的科学的手段对生产精准度予以

确定,而后为生产产品的质量提供保障,而这一发展趋势,为计量测试的应用普遍性奠定了

基础。计量测试是一项较为复杂且系统的工作,在具体的测试过程中,为提高结果的准确性,

相关文档
最新文档