数据的统计处理和解释:重复性限和再现性限
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据的统计处理和解释:重复性限和再现性限
@智慧的弟弟
2012年08月
(微博:/201292986博客:/wisdomtang)
摘要:本文简要说明重复性限和再现性限的定义以及它们在方法验证中的应用。
关键词:重复性限,再现性限,精密度,标准差,临界极差
Abstract:The definitions and their application in the method validation of repeatability limit and reproducibility limit were briefly described in this paper.
Key word:Repeatability limit,Reproducibility limit,Precision,Standard deviation,Critical difference
在日常分析与测试中,我们会经常接触到精密度试验,即在重复性和再现性(复现性)条件下对同一被测物质重复测试,并对测试(或测量)结果进行估算,最后以标准差(或变异系数)来度量测试(或测量)结果的分散性。
然而在通常的实验室工作中往往要求对两个(或多个)测试(或测量)结果观测值的差进行检查,为此需要确定一些类似临界差之类的度量,而不仅仅是标准差(或变异系数)。
一、术语和定义
1.接受参照值
用作比较的经协商同意的标准值。
2.准确度
测试结果或测量结果与真值间的一致程度。
注:准确度是正确度和精密度的组合,在过去一段时间只用来表示现在称为正确度的部分,在很多标准及文献中此情况如今依旧普遍存在。
在实际情中,真值用接受参照值代替。
3.正确度
测试结果或测量结果的期望与真值间的一致程度。
4.精密度
在规定条件下,所获得独立测试/测量结果间的一致程度。
5.重复性条件
为获得独立测试/测量结果,由同一操作员按相同的方法、使用相同的测试或测量设施、
在短时间间隔内对同一测试/测量对象进行测试/测量的观测条件。
6.再现性条件
由不同的操作员按相同的方法,使用不同的测试或测量设施,对同一测试/测量对象进行观测以获得独立测试/测量结果的观察条件。
7.重复性临界差
一个数值,在重复性条件下,两个测试结果或测量结果的最终值的绝对差以一定的概率小于等于此数。
注:最终值的例子包括结果序列的平均值或中位数,而序列本身可能含有一个或多个结果。
8.再现性临界差(复现性临界差)
一个数值,在再现性条件下,两个测试结果或测量结果的最终值的绝对差以一定的概率小于等于此数。
9.重复性限
指定概率为95%的重复性临界差。
10.再现性限(复现性限)
指定概率为95%的再现性临界差。
以上术语和定义引自GB/T3358.2-2009《统计学词汇及符号第2部分:应用统计》,更多术语和定义见GB/T3358.2-2009,以上术语的定义与GB/T6379.1-2004中存在部分差异。
二、临界差的来源
如果一个估计量是n个独立估计量的和或差,每个估计量的标准差均为σ,则和或差σ。
重复性限r和再现性限R均为两个测试结果之间的差,因而相应的标准的标准差为n
σ。
差为2
在常规的统计工作中,为了检查两个测试(或测量)结果之间的差异,往往用这个标准差的Z倍作为临界差。
临界差系数Z的值依赖于与临界差相应的概率水平及测量结果所服从的分布。
对于重复性限和再现性限,概率水平规定为95%。
在准确度(正确度与精密度)的分析中,我们一般假定基本分布是近似正态的。
对于标准正态分布,95%的概率水平
下,Z =1.96,因此77.22=Z 。
对于一般的统计使用,将2Z 修约为2.8。
注:标准正态分布N (0,1),查标准正态分布表)(x Φ可知,对概率
975
.0)96.1()96.1(=Φ=≤Z P 那么95.01)96.1(2)96.1()96.1()96.196.1(=−Φ=−Φ−Φ=≤≤
−Z P ,即表示落在区间
μ±1.96σ范围内的概率为95%。
Z 被称为是标准正态分布N (0,1)的0.975分位数。
在对重复性条件或再现性条件下得到的两个单一测试(或测量)结果进行检验时,应与重复性限r r σ8.2=或再现性限R R σ8.2=进行比较。
也就是说,在进行精密度试验得到的两个测试(或测量)结果(这两个结果可能是的多个结果平均值或中位数)的差值与重复性限r r σ8.2=或再现性限R R σ8.2=进行比较,小于等于重复性限r r σ8.2=或再现性限
R R σ8.2=则表示这两个测试(或测量)结果是可接受的。
注:在实际中,当标准差的真值σ未知时(我们不能进行完全精密度实验,只能基于有限次的测试(或测量)),用标准差的估计值s 替代真值σ。
由GB/T 6379.1-2004和GB/T 6379.2-2004可知重复性限和再现性限是通过实验室间比对试验的测试(或测量)结果来确定。
对于标准中的重复性限和再现性限也就是标准起草单位组织多个实验室进行比对试验来确定的。
所以,一般情况我们不需要深入的了解标准中重复性限和再现性限是怎么得来的,只需要利用它来验证标准方法及其他证明实验室有能力控制精密度的证据。
如有兴趣深入了解重复性限和再现性限,可参见GB/T 6379.1-2004和GB/T 6379.2-2004等相关标准。
三、重复性限(再现性限)在方法验证中的应用
1.以《水质氨氮的测定纳氏试剂分光光度法》(HJ 535-2009)为例,这份标准里面出现了
两个新术语——重复性限和再现性限(至少对于我来说,这两个是新术语),标准中表述如下:
对于我们这类非研究级别的实验室来说,可以不去追究重复性限和再现性限来源,但是我们需要对方法进行验证,就必须弄清以下问题:
1)重复性限和再现性限的定义
2)如果按标准所述,怎么进行精密度试验?跟以往用标准差(或变异系数)来评价
的精密度试验又有何区别?
从字面上理解,标准中确定的重复性限和再现性限的数据应该类似于一个限值,也就是如果需要验证此方法,我们得到相关数据就应该小于或等于重复性限和再现性限。
2.HJ535-2009中精密度试验的验证方法如下:
1)首先,分别配制氨氮浓度为1.21mg/L和1.47mg/L的标准溶液(如果能购买,最好
是购买有证标准溶液/样品)。
2)每种浓度进行两组测定(在重复性条件和再现性条件下),每组可以仅测定一次,
即每组仅测定得出一个数据(此为极端情况)。
3)对每组测定结果进行统计处理,剔除错误值和离群值(如利用格拉布斯(Grubbs)
检验法检验离群值),求得每组数据的平均值或中位数,所得的平均值或中位数即
为我们最终所需要的数据。
4)将两组所得的平均值或中位数相减(大减小)的差与重复性限或再现性限进行比
较,如差值小于等于重复性限或再现性限即为合格。
表1HJ535-2009中精密度试验结果表
测试条件重复性再现性
氨氮标准溶液 1.21 1.47 1.21 1.47序号平行1平行2平行1平行2平行1平行2平行1平行2
1 1.200 1.223 1.450 1.459 1.140 1.234 1.450 1.495
2 1.195 1.231 1.467 1.471 1.238 1.190 1.405 1.423
3 1.188 1.201 1.469 1.485 1.231 1.139 1.499 1.520
4 1.234 1.238 1.474 1.487 1.276 1.280 1.411 1.4565
1.215
1.227
1.473
1.477
1.201
1.159
1.472
1.487
注:假设测试结果中无异常和离群数据5)
统计检验
1.21
2.80.028r r σ==1.47 2.80.024
r r σ==1.21
1.238 1.1880.050.028R ′=−=>1.47
1.487 1.4500.0370.024R ′=−=>可以看出在重复性条件下的试验,结果的极差(两组平均值相减)均大于标准中的重复性限,由此可证明该重复性试验是不可接受的,需要重新或追加试验。
同理求证复现性试验(这里不一一列出)。
6)
重复性条件下结果可接受性检验
表2重复性条件下测试结果可接受性检验规则
结果数(n )
情形种类
是否接受
最终报告补救办法
1
不可取2
极差≤r
是
两者均值
极差>r 否不报告再取2个结果
2+2
极差≤r
是
四者平均值
极差>r 否四者中位数2+1
极差≤r
是
三者平均值
极差>r 否
三者中位数(无第4个结果)
不报告
再取1个结果(如可以)
2+1+1
极差≤r
是
四者平均值
极差>r 否四者中位数
n >2
极差≤r
是
n 者平均值
极差>r
否
A :不报告
再取n 个结果
B :n 者中位数
C :不报告
再取m 个结果
注:1)“2+2”为测试过程费用较低的情况,“2+1”、“2+1+1”为测试过程费用较高的
情况;2)A为测试过程费用较低的情况,B、C为测试过程费用较高的情况;3)对于方法验证中进行重复性限或再现性限试验时,极差>r的情况是不被接受的,必须追加或重新试验;4)m为满足n/3≤m≤n/2的整数;5)在最终检验之前,应先剔除异常和离群的结果;6)再现性条件下结果可接受性检验见GB/T6379.6-2009中的“5.3”。
四、临界极差的计算
第“三”部分是对标准方法中重复性限和再现性限的验证,因为标准已提供参考的限,所以我们只需要计算测试结果的极差(用极差与标准中的限比较即可),而不需要计算测试结果本身之间的临界极差。
在部分试验中,我们需要计算一组数据的标准差(或称标准偏差)、变异系数或临界极差。
1.重复性临界极差
重复性临界极差计算公式如下:
0.95()()
r
CR n f nσ
=
其中:n——测试结果数;
f(n)——临界极差系数;
r
σ——标准差的真值,实际可用标准差的估计值s代替;
0.95()
CR n——在n次测试在95%概率下的重复性临界极差。
f(n)可通过下表查询得到:
表3临界极差系数(f(n))表
2.再现性临界极差
参考GB/T6379.2-2009中的“4.2”和“5.3”条款,这里不再阐述。
五、小结
1)在进行精密度试验时,建议尽量采用多次平行测定,这样可以检验内部环境和时间
变化所引起的误差;
2)在进行精密度试验时,计算结果之前,应先剔除异常和离群的数据,可使用奈尔
(Nair)、格拉布斯(Grubbs)、狄克逊(Dixon)等检验法检查离群值,具体详见
GB/T4483-2008;
3)关于再现性(复现性)的定义,GB/T6379.1-2004与GB/T3358.2-2009存在差异,
前者强调是不同实验室,根据个人实践及经验的理解与GB/T3358.2-2009相同。
从
GB/T6379.6-2009中对再现性临界极差的检验似乎只针对不同的实验室。
个人认为
将其二者综合起来理解,不管是否不同实验室,再现性都是存在的,再现性临界极
差可参考GB/T6379.6-2009中“5.3”条款;
4)在方法验证过程中,如测试结果的极差大于标准中的重复性限或再现性限,建议重
新试验,相应的数据也应丢弃不用;其他需要计算测试结果临界极差的情况,特别
是测试过程费用较高的情况,才建议参考GB/T6379.6-2009对重复性临界极差和再
现性临界极差的检验情况处理,并报告最终结果。
六、致谢
感谢四川大学华西公共卫生学院郑波老师给与的帮助和指导!
七、参考文献:
[1]GB/T6379.1-2004,测量方法与结果的准确度(正确度与精密度)第1部分:总则与定义[S].
[2]GB/T6379.2-2004,测量方法与结果的准确度(正确度与精密度)第2部分:确定标准测量方法重复性与再现性的基本方法[S].
[3]GB/T6379.6-2009,测量方法与结果的准确度(正确度与精密度)第6部分:准确度值的实际应用[S].
[4]GB/T3358.2-2009,统计学词汇及符号第2部分:应用统计[S].
[5]GB/T3358.1-2009,统计学术语第1部分:一般统计术语与用于概率的术语[S].
[6]ISO5725-1:1994,Accuracy(trueness and precision)of measurement methods and results--Part1:General principles and definitions[S].
[7]GB6379-1986,测试方法的精密度通过实验室间试验确定标准测试方法的重复性和再现性[S].
[8]GB/T11792-1989,测试方法的精密度在重复性或再现性条件下所得测试结果可接受性的检查和最终测试结果的确定[S].
[9]GB/T19889.2-2005,声学建筑和建筑构件隔声测量第2部分:数据精密度的确定、验证和应用[S].
[10]全国质量专业技术人员职业资格考试办公室.2010年质量专业理论与实务(中级)[M].北京:中国人事出版社,2010.
[11]HJ535-2009,水质氨氮的测定纳氏试剂分光光度法[S].
[12]GB/T4483-2008,数据的统计处理和解释正态样本离群值的判断和处理[S].。