传统统计法与稳健统计法评价医学检验实验室能力验证结果比较
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
传统统计法与稳健统计法评价医学检验实验室能力验证结果比
较
郭晓俊;朱岭峰;徐翀;居漪
【摘要】目的探讨传统统计法(Dixon检验法剔除离群值后计算x和s)与稳健统计法[计算中位值和标准化四分位间距(NIQR)]医学检验实验室能力验证结果评价的适用范围.方法对2016年上海市临床检验中心快速C反应蛋白检测能力验证计划上报结果按检测系统分为A组(29家实验室)、B组(15家实验室)和C组(9家实验室).应用传统统计法和稳健统计法分别对各组的统计量进行比较分析.结果对于A 组结果,稳健统计法和传统统计法的指定值基本相同,但前者计算出的NIQR和指定值的标准不确定度(ux)都小于后者计算出的s和指定值的ux;对于B组结果,Dixon 检验法剔除离群值后用传统统计法计算的指定值与稳健统计法计算所得较为接近,但前者所得到的ux<0.3σ,而后者所得到的ux>0.3σ;对于C组结果,Dixon检验法剔除离群值后用传统统计法计算的指定值与稳健统计法计算所得较为接近,2种方法计算所得的ux>0.3σ,但前者计算所得的s均小于后者计算所得的NIQR.结论当实验室的数量较多(>18)时,可采用稳健统计法给出严格的评价结论;当利用Dixon 检验法剔除离群值后,参加实验室的数量较少(12~18)的情况下,应对余下的数据采用传统统计法进行统计和分析;当剔除离群值后实验室的数量更少(≤12)时,除了对余下的数据采用传统统计法进行统计和分析,还需考虑指定值的ux的影
响.%Objective To investigate the scopes of conventional statistics(x and s after removal of outliers by Dixon method) and robust statistics [median and normalized interquartile range(NIQR)] for proficiency testing in laboratory medicine.Methods Participants of the Proficiency Testing Program 2016 on C-reactive protein organized by Shanghai Center for
Clinical Laboratory were classified into group A(29 laboratories),group B(15 laboratories)and group C(9 laboratories)according to determination systems. The results of conventional statistics and robust statistics were analyzed and compared.Results As for group A,the designated values were same for the 2 methods. However,the NIQR and standard uncertainty(ux)of designated values by conventional statistics were smaller thans anduxby robust statistics. As for group B,the designated values were close betweenthe 2 methods. Convention al statistics hadux<0.3σ,and robust method hadux>0.3σ. As for group C,the designated values were close between the 2 methods. Both methods hadux>0.3σ. Thesof conventional statistics was smaller than the NIQR of robust statistics.Conclusions When the number of participants is >18,robust statistics can be used. When the number of participants is 12-18,conventional statistics may be used. When the number is≤12,besides conventional statistics should be used,theuxof designated values should be considered as well.
【期刊名称】《检验医学》
【年(卷),期】2017(032)005
【总页数】5页(P435-439)
【关键词】统计方法;医学检验实验室;能力验证;稳健统计法;传统统计法;Dixon检验法;不确定度
【作者】郭晓俊;朱岭峰;徐翀;居漪
【作者单位】上海市临床检验中心,上海 200126;上海市临床检验中心,上海200126;上海市临床检验中心,上海 200126;上海市临床检验中心,上海 200126
【正文语种】中文
【中图分类】R446.1
Key words:Statistical methods;Clinical laboratories;Profi ciency testing;Robust statistics;Conventional statistics;Dixon method;Uncertainty
能力验证利用实验室间比对,按照预先制定的准则评价参加者的能力,也称为能力验证活动[1]。
能力验证的结果可以多种形式出现,并构成各种统计分布。
分析数
据的统计方法应与数据类型及其分布特性相适应。
使用不同的统计方法,对同一能力验证结果的分析结论不尽相同,特别是在离群值的判别上,可能存在较大差异,因此选用统计方法时必须注重其适用性。
我们试从几种统计方法的计算过程及应用实例上探讨其适用范围,避免单纯采用稳健统计法而出现误判或脱离实际的评价结果,使能力验证工作更加完善。
1.1 方法
目前,在我国医学检验实验室的能力验证计划中,常用的统计方法有传统统计法和稳健统计法,判别离群值时采用Dixon检验法。
1.1.1 传统统计法[2-3] 用Dixon检验法剔除离群值后计算和s。
(1)Dixon检验法[4]用于一组测量值的一致性检验,可用于检出1个或多个异常值。
(2)用作为指定值,计算公式为:
(3)用s作为能力评定标准差(σ),计算公式为:
(4)指定值的标准不确定度(ux)计算公式为:
式中P为参加的实验室数。
1.1.2 稳健统计法[3] (1)用中位值(med)作为指定值。
将数据从小到大排列后计算中位值,公式为:
(2)用标准化四分位间距(normalized interquartile range,NIQR)作为能力评定标准差。
NIQR=四分位间距(interquartile range,IQR)×因子0.741 3。
IQR是高四分位数和低四分位数的差值。
对1组由小到大排列的数据,居于中间位置的数据为中位值,有1/2的数据高于它,1/2的数据低于它;居于下1/4位置的数据为下四分位数或低四分位数(Q1),该组数据的1/4低于Q1,3/4高于Q1;居于上1/4位置的数据为上四分位数或高四分位数(Q3),该组数据的1/4高于Q3,3/4低于Q3。
IQR和NIQR计算公式为:
(3)指定值的ux计算公式为[5]:
式中s*为NIQR,P为参加的实验室数。
1.2 数据来源
收集2016年上海市临床检验中心快速C反应蛋白检测能力验证计划结果报告,并按照检测系统的不同分为A组(29个实验室参加)、B组(15个实验室参加)和C(9个实验室参加)3个组,均测定5个水平的能力验证样本(单位为
mg/L)。
(1)按照检测系统分组后A组共有29个实验室参加,测定结果见表1;对A组结果分别用上述2种统计方法进行统计计算,结果见表2。
从表1可见,该组数据用传统统计法使用Dixon检验法未能剔除离群值,稳健统计法检出的不满意数据有14个,而传统统计法得到的不满意数据为2个。
从表2可见,虽然稳健统计法和传统统计法计算的指定值基本相同,但前者计算出的NIQR和指定值的ux都小于后者计算出的s和指定值的ux,且ux<0.3σ。
(2)按照检测系统分组后B组共有15个实验室参加,测定结果见表3;对B组结果分别用2种统计方法进行统计计算,结果见表4。
从表3和表4可见,该组用Dixon检验法剔除离群值后用传统统计法计算的指定值与稳健统计法计算所得较为接近,出现的不满意结果也相同。
但前者所得到的ux<0.3σ,而后者所得到的ux> 0.3σ。
(3)按照检测系统分组后C组共有9个实验室参加,测定结果见表5;对C组结果分别用2种统计方法进行统计计算,结果见表6。
从表5和表6可见,该组用Dixon检验法剔除离群值后用传统统计法计算的指定值与稳健统计法计算所得较为接近,出现的不满意结果也相同。
2种方法计算所得的ux>0.3σ,但前者计算所得的s均小于后者计算所得的NIQR。
目前,医学检验实验室的能力验证计划提供者在处理能力验证室间比对数据时,都习惯采用中国合格评定国家认可委员会在CNASGL02中推荐使用的稳健统计法进行能力评定统计量的计算。
因为稳健统计法是一种能使观测数列中极端结果对统计影响降至最小程度的统计方法[6]。
但在应用时,由于各医学检验实验室使用的方法、仪器和试剂的不同会出现不同的数据分布特征,从而需要对其进行分组,进而考虑稳健统计法在能力验证结果评价中存在的问题[7]。
对实验室能力验证结果的分析需要考虑能力验证数据的分布特征,应选用合适的统计方法,其在一定程度上与参加比对的实验室的数量有关。
ISO 13528标准附录D也对参加实验室不同数量的统计分析进行了表述[5]。
本研究通过数据分析表明,当参加实验室的数量较多>18时,可采用稳健统计法给出严格的评价结论;当利用Dixon检验法剔除离群值后,参加实验室的数量较少(12~18)的情况下,应对余下的数据采用传统统计法进行统计和分析;当剔除离群值后参加实验室的数量更少(≤12)时,除了对余下的数据采用传统统计法进行统计和分析,还需考虑指定值ux的影响。
在评估指定值ux时,当用Dixon检验法剔除离群值后实验室数为(12~18)时,就要考虑指定值的ux:当指定值的ux≤0.3σ时,可忽略;当ux>0.3σ时,不可忽略并需合成入能力评定s。
当用Dixon检验法剔除离群值后实验室数≤12时,
指定值的ux>0.3σ可能性较大,需合成入能力评定s。
基于上述理由,能力验证
提供者对于参加实验室数≤18的分组进行能力评定时,当指定值的ux远大于能力验证中所使用的能力评定s时,会存在一定的风险,即某些实验室因指定值不准确而被判为结果不满意,而并非是实验室内部的任何原因。
指定值的ux不可忽略时将其合成入能力评定s并报告给参加能力验证的实验室,增加了实验室评价的科学性和可靠性,并为医学实验室计算测量不确定度提供了更直接的数据来源。
医学检验实验室大多数定量检测项目的能力验证结果评价是以所有参加实验室的原始数据或分组后的原始数据的算数平均值加/减k倍(k=2、2.5或3)s范围外的数据作为离群值[2]。
剔除离群值后以剩余数据的算数平均值作为靶值(指定值),但这只有在数据服从正态分布的情况下才能符合要求。
实际上原始数据往往并不符合正态分布,一个极端的离群值就可以严重地影响和s等统计参数,并导致靶值(指定值)的极度增宽和偏移,影响能力验证评价结果的可靠性[8]。
所以,对于
选用离群值的判别和剔除方法也显得尤为重要。
对离群数据的判别一般用数理统计的方法,如拉依达检验法(3σ准则)、格拉布斯检验法、Dixon检验法、t检验法、F检验法等。
由于这些方法都有各自的特点,效果也不尽相同,例如,拉依达检验法不能检验样本量较小(显著水平为0.01时,n必须大于10)的情况。
因此,在国际上,常推荐格拉布斯检验法和Dixon检验法[9]。
综上所述,各个国家和地区所使用的主流检验仪器和试剂各不相同,关注的检验项目专业类型和所用方法学也有差异,参加能力验证计划的实验室数量各不相同,专业分类和分组方法各异。
因此,在设计统计方法时应考虑诸多影响因素,为能力验证项目的顺利实施奠定坚实的基础。
【相关文献】
[1] International Organization for Standardization. Accredition criteria for profi ciency testing provider[S]. ISO 17043,ISO,2010.
[2] 周琦,李少男,李小鹏,等. 临床检验室间质量评价数据中离群值的研究[J]. 中华检验医学杂志,2007,30(2):214-216.
[3] 中国合格评定国家认可委员会. CNAS-GL02:2014能力验证结果的统计处理和能力评价指南[S].2014
[4] 张德然. 统计数据中异常值的检验方法[J]. 统计研究,2003,20(5):53-55.
[5] International Organization for Standardization. Statistical methods for use in proficiency testing by interlaboratory comparisons [S].ISO 13528,ISO,2015.
[6] 王承忠.实验室间比对的能力验证及稳健统计技术第五讲稳健统计技术(一)[J].理化检验(物理分册),2004,42(11):589-593.
[7] 尹江伟,吴礼康,肖惠贞. 能力验证的结果评价和存在问题探讨[J]. 现代测量与实验室管理,2012,20(5):39-40.
[8] 肖亚玲,王薇,王治国. ISO15189:2012与室间质量评价[J]. 现代检验医学杂志,2014,29(5):161-163.
[9] 刘洪,黄燕. 我国统计数据质量的评估方法研究——趋势模拟评估及其应用[J]. 统计研究,2007,24(8):17-21.。