乳腺X线影像诊断报告医学审计的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

乳腺X线影像诊断报告医学审计的应用
何健龙1,罗琳1,姚薇薇1,石剑2,李莹1,沈新平1*
1.香港大学深圳医院医学影像科放射医学中心,广东深圳518053;
2.香港大学深圳医院医学影像科乳腺外科,广东深圳518053;*通讯作者沈新平 shenxp@
【基金项目】广东省医学科学技术研究基金项目(A2018194)
【关键词】乳腺影像报告和数据系统;乳房X线摄影术;敏感性与特异性;病理学,外科
【中图分类号】R445.4 【DOI】10.3969/j.issn.1005-5185.2019.09.007
根据2008年美国放射学会(American College of Radiology,ACR)发表的工作指南[1]以及1992年美国食品及药物管理局(Food and Drug Administration,FDA)颁布的《乳腺X线影像质量标准法案》(mammography quality standards act,MQSA)[2],所有开展乳腺X线检查的医疗机构均应每年进行医学审计,以评估诊断报告的准确性与合理性。

这项评审是对影像医师表现的最佳评价工具,并为开展教学与提升诊断水平提供客观依据[3]。

目前,许多国家均报道其乳腺X线诊断效能的数据,并提供了多个参考基准值[4-6]。

本研究拟建立香港大学深圳医院的乳腺X线诊断报告审计项目,回顾性分析本院数据与美国乳腺癌监测联盟(Breast Cancer Surveillance Consortium,BCSC)[7]的差异。

1 资料与方法
1.1 研究对象收集2014年7月—2015年6月在香港大学深圳医院放射医学中心进行的诊断性乳腺X线检查资料,诊断性乳腺X线检查定义为由于患者具有乳腺症状或体征,而由临床医师转介至放射科进行的检查。

排除筛查性检查以及临床医师转介的无症状患者。

所有检查确保有24个月以上的随访期,以发现假阴性患者和等待活检手术。

由1名固定的统计员负责采集影像和病理报告数据。

1.2 乳腺X线报告及乳腺影像报告和数据系统(breast imaging reporting and data system,BI-RADS)分类诊断报告由2位经过专科培训的放射科医师负责。

5名医师具有初诊报告资格,负责初次分析影像,并决定是否召回患者进行X线加压、放大、特殊体位或超声检查。

3名医师具有审核报告资格,负责诊断报告的最终修改与发布。

若审核医师发现仍有可疑病灶,有权召回患者进行摄片。

所有诊断报告均按照ACR发布的第5版BI-RADS[8]进行标准化描述与分类,并根据其指南提供随访或活检建议。

在统计过程中,BI-RADS 1~3类定义为乳腺X线阴性,4类和5类定义为乳腺X线阳性。

对于0类患者,待其进一步乳腺X线或超声检查后再次进行BI-RADS分类,如果患者不按建议进行检查、不在我院检查或无法联系,则按失访处理,保留分类为0,不纳入统计。

BI-RADS 6类患者收录至数据库但不纳入统计。

1.3 原始数据收集需要收集的原始数据包括患者基本资料、诊断医师、BI-RADS分类、是否召回。

在病理结果方面,统计员定期搜索我院病理科数据库,以获得所有乳腺穿刺和手术活检的报告,经过与本项目数据库对比,填写病理结果。

对于X线阳性患者,若不考虑或等待活检手术,在检查后12个月和24个月再次进行影像或电话随访。

不在我院进行手术的患者进行电话随访,尽可能详细地了解病理结果。

经2次随访后未发现恶性病变,则定义为阴性结局。

对X线阴性患者亦安排至少24个月的观察期,以影像随访复查,在观察期内未发现其恶性病理报告者确定为阴性结局,反之为病理阳性。

MQSA根据乳腺X线和病理报告之间的关系作出以下定义[2]:①影像阳性、病理恶性者为真阳性(TP);
②影像阴性、病理良性者为真阴性(TN)(2年观察等待期);③影像阴性、病理恶性者为假阴性(FN);④影像阳性、病理良性者为假阳性(FP)。

FP有3种定义,分别为,①FP1:筛查性乳腺X线检查中被召回的患者,经2年观察期未发现恶性病理报告,本文不涉及此项计算;②FP2:诊断性乳腺X线检查中建议活检的患者,经2年观察期未发现恶性病理报告;③FP3:根据乳腺X线结果而进行活检的患者,经2年观察期未发现恶性病理报告。

FP2和FP3必须有所区分,因为并非所有获得活检建议的患者均会进行活检,或者无法得知其活检结果。

1.4 质量审计指标计算根据上述数据各分类的总数,根据公式(1)~(5)计算敏感度、特异度、阳性预测值(PPV)、癌症发现率(CDR),其中PPV根据FP定义的不同分别计算,以粗针穿刺或手术切除病理结果作为“金标准”。

敏感度(真阳性率)=TP/(TP+FN)(1)特异度(真阴性率)=TN/(FP+TN)(2)PPV2(建议活检)=TP/(TP+FP2),或TP/建议活检数(3)PPV3(实施活检)=TP/(TP+FP3),或TP/实施活检数(4)CDR=TP/检查总数(5)其中CDR是每千例乳腺X线检查中发现恶性病变的数量。

1.5 差距分析对比1994年ACR早期公布的要求目标以及2017年BCSC根据实际数据计算出的目标范围,寻找本科室数据的差异,并探讨可能的原因。

2 结果
2.1 样本基础背景在统计期内共4453例乳腺X线检查,其中1452例为筛查性检查,3001例为诊断性检查。

在诊断性检查中,失访的BI-RADS 0类患者412例,BI-RADS 6类49例。

最终纳入的检查数为2540例。

患者平均年龄(45.1±8.1)岁,其中107例(4.2%)有乳腺癌家族背景。

1930例(76%)腺体类型为多量腺体型及致密型。

2.2 乳腺X线影像及病理结果2540例患者详细的BI-RADS分类与病理活检结果比较见表1。

其中X线阳性312例,阳性率为12.3%。

193例(61.9%)进行穿刺活检,共发现96例恶性病变。

X线阴性2228例,其中6例随访期间发现病理报告为乳腺癌。

乳腺X线和病理报告之间的关系见表2。

真阳性96例,假阳性216例,真阴性2222例,假阴性6例。

典型病例见图1。

质量审计指标见表3。

诊断符合率为91.3%,经X线发现的乳腺癌96例,癌症发现率为37.8‰,对比ACR推荐的目标值和BCSC计算的参考范围,敏感度和PPV3偏高,其余统计值在推荐值范围内。

表1 乳腺X线影像BI-RADS分类与病理结果比较(个)
BI-RADS分类手术或活检
病理
合计
良性恶性
1类061061
2类5158551590
3类15761577
4类
148
21651267
5类4504545
合计19924381022540
注:*为FP2
图1乳腺X线与病理结果比较。

A.假阴性(FN),右斜位,报告为BI-RADS 2类,外上部结节(黄框区域)穿刺病理为浸润性导管癌;B.假阳性(FP),左斜位,报告为BI-RADS 4b类,外上部结节(黄框区域)穿刺病理为纤维腺瘤;C.真阳性(TP),右头尾位,报告为BI-RADS 5类,外侧结节伴钙化灶(黄框区域)穿刺病理为浸润性导管癌;D.真阴性(TN),双侧头尾位,报告为BI-RADS 2类,2年影像随访复查为阴性
表3 诊断性乳腺X线的质量指标
指标本项目MQSA
BCSC
第25百分位第50百分位第75百分位
敏感度(%)94.1>8582.688.292.3特异度(%)91.1>9088.591.694.8阳性率(%)12.3-8.211.614.8 PPV2(%)30.825~4022.831.640.3 PPV3(%)49.7-26.136.646.2 CDR‰(每千例)37.8-26.234.444.7
3 讨论
高质量的乳腺X线摄影是乳腺癌筛查和诊断的有力工具[9-10]。

尽管BI-RADS系统已经对诊断报告进行了一定程度的规范化和格式化,但不同年资、不同地域的医师对诊断的把握仍有差异[11-12]。

因此,MQSA 和ACR的工作指南均要求定期对诊断报告进行系统性的回顾分析,以供诊断医师自我反馈和提高。

诊断质量审计的作用为:①反映乳腺X线诊断医师检出乳腺癌的能力,特别是检出早期无肿块乳腺癌的能力,并与本地或全国的数据进行横向比较;②个人和诊断组的数据可以作为教学工具,相互比较和改善;③检出漏诊病例,分析原因,以改善技术上和诊断上的缺陷。

由于缺乏国内相关数据的参考,本研究与MQSA 的建议范围以及BCSC的全美国大数据分析结果进行对比。

本组的诊断报告敏感度和阳性率略偏高,而特异度略低,可能与相关医师对乳腺癌的警惕性较高、诊断较为谨慎有关。

本组诊断报告的各项审计指标达到MQSA推荐水平,并位于BCSC的第25~75百分位中,反映诊断医师的表现与美国大部分执业医师类似。

MQSA中对PPV的定义和解读有一定的复杂性,其中PPV1指筛查性检查中有异常征象,需要进一步行影像评估的患者中病理活检阳性的比例,反映体检筛查乳腺癌的能力[13]。

PPV2定义为诊断性检查建议活检的患者,即X线阳性病例中病理阳性的比例。

若PPV2过低,提示诊断医师报告了大量的“阳性”,建议了过多的活检,而实际上有乳腺癌的患者并不多。

如一些散在的点状钙化,或局限性致密影,有经验的影像医师会诊断为BI-RADS 3类病变,让患者短期内复查,而经验不足的医师可能会建议活检,导致活检患者的阳性率低下,造成过多的患者紧张、焦虑以及过度的医疗行为和医疗费用的浪费。

相反,PPV2过高并非提示诊断效能高,表明诊断医师仅识别了比较典型的恶性病例,而对于一些中间征象、可疑恶性的征象识别较少,导致一部分可疑的患者未被建议活检,造成漏诊。

PPV2应该处于适中和合理的范围,这个范围并无一个绝对客观的标准,受患者构成、平均年龄、腺体密度、筛查水平以及地区发病率的影响[14]。

因此,评价PPV2时需要与同一地区的诊断数据进行比较,这也是BCSC持续每年更新全美国乳腺X线影像诊断质量数据的原因。

PPV3指X线阳性患者中真正进行了活检且病理阳性的比例。

选择不活检的患者大部分均为恶性可能性较低者,排除这些患者后阳性率会有所提高,因此PPV3高于PPV2。

本组数据显示PPV2位于理想范围内,但PPV3显著增高,远远超出BCSC第75百分位水平,表明仅恶性可能性较大的患者进行了活检,较多恶性可能性相对较小者无视医师的建议,不进行活检,从而错过了早期诊断和治疗的时机,表明患者对活检建议不够重视,或者不太接纳,需要临床医师加强医患沟通,做好患者的教育工作。

本组患者平均年龄(45.1±8.1)岁,大部分患者小于50岁。

而BCSC数据的样本平均年龄为55.6岁。

50岁以下人群腺体密度相对较大,容易掩盖病变,PPV 显著下降[15]。

亚洲女性乳腺腺体较西方女性致密,亦会影响诊断质量[16]。

因此,在与国外数据比较时应该考虑到这些因素,尽量采用相近地区的数据,进一步提示应该尽快建立我国的乳腺X线诊断质量大数据。

本研究的局限性为样本量较小,不能完全代表本地区、本院所有医师的水平,后续研究将增加样本量验证研究结果,并考虑进一步行多中心研究以获得更具代表性的结论。

总之,本研究根据严格的MQSA规则进行乳腺X线诊断质量监测,结果显示本院医师诊断质量达到美国FDA要求的水平,与美国执业医师水平有一定的相似性。

此评价体系能够客观地反映医师发现癌症
的能力,并能在不同医师、不同机构之间进行对比,适合推广使用。

但需要持续进行更多、更精细化的质量监测,为改善诊断质量提供完整的反馈信息和参考数据。

参考文献
[1]Aco R. ACR practice guideline for the performance of
screening and diagnostic mammography, 2008. http://www.
/p-903972244093.html.
[2]Linver MN, Osuch JR, Brenner RJ, et al. The mammography
audit: a primer for the mammography quality standards act (MQSA). Am J Roentgenol, 1995, 165(1): 19-25.
[3]Miglioretti DL, Ichikawa L, Smith RA, et al. Criteria for
identifying radiologists with acceptable screening mammography interpretive performance on basis of multiple performance measures. Am J Roentgenol, 2015, 204(4): W486-W491.
[4]Cook AJ, Elmore JG, Zhu WW, et al. Mammographic
interpretation: radiologists' ability to accurately estimate their performance and compare it with that of their peers. Am J Roentgenol, 2012, 199(3): 695-702.
[5]Geller BM, Ichikawa L, Miglioretti DL, et al. Web-based
mammography audit feedback. Am J Roentgenol, 2012, 198(6): W562-W567.
[6]Carney PA, Parikh J, Sickles EA, et al. Diagnostic
mammography: identifying minimally acceptable interpretive performance criteria. Radiology, 2013, 267(2): 359-367. [7]Sprague BL, Arao RF, Miglioretti DL, et al. National
performance benchmarks for modern diagnostic digital mammography: update from the breast cancer surveillance consortium. Radiology, 2017, 283(1): 59-69.[8]Sickles EDCB. ACR BI-RADS® Mammography//ACR BI-
RADS® Atlas, Breast Imaging Reporting and Data System.
Reston, V A, American College of Radiology, 2013.
[9]刘佩芳, 鲍润贤. 乳腺X线检查用于乳腺癌筛查有效性的
争论. 中华放射学杂志, 2014, 48(10): 797-799.
[10]马文娟, 赵玉梅, 季宇, 等. 乳腺癌X线摄影的影像组学
表现特征. 中国医学影像学杂志, 2018, 26(7): 515-518. [11]Gur D, Wallace LP, Klym AH, et al. Trends in recall, biopsy,
and positive biopsy rates for screening mammography in an academic practice. Radiology, 2005, 235(2): 396-401. [12]Elmore JG, Jackson SL, Abraham L, et al. Variability in
interpretive performance at screening mammography and radiologists' characteristics associated with accuracy.
Radiology, 2009, 253(3): 641-651.
[13]Jackson SL, Cook AJ, Miglioretti DL, et al. Are Radiologists’
Goals for Mammography Accuracy Consistent with Published Recommendations? Academic Radiology, 2012, 19(3): 289-295.
[14]Carney PA, Sickles EA, Monsees BS, et al. Identifying
minimally acceptable interpretive performance criteria for screening mammography. Radiology, 2010, 255(2): 354-361.
[15]Kennedy G, Markert M, Alexander JR. Predictive value of BI-
RADS classification for breast imaging in women under age
50. Breast Cancer Res Treat, 2011, 130(3): 819-823.
[16]彭文静, 徐凯, 刘正立, 等. 乳腺X线图像纹理分析鉴别
乳腺小结节良恶性的价值. 中国医学影像学杂志, 2018, 26(12): 890-893.
【收稿日期】2019-04-28 【修回日期】2019-07-19
(本文编辑张春辉)。

相关文档
最新文档