诊断试验评价(ROC敏感率特异性介绍)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
∑ P( B
i
m
1
| Ai ) P( B2 | Ai ) L P ( Bn | Ai ) P( Ai )
i = 1, 2, L, m 对于表13-1 资料,A为金标准诊断结果 D− 与 D+ , B 为诊断试验检测结果 T− 与 T+ ,具体到 式(13-1) , B只取 T+ 。
2
第二节 例13-2
本例 J = 0.8 − 0.05 = 0.75 ,即 Youden指数为0.75 ;其标准误为: SE J = 0.8(1 − 0.8) 520 + 0.95(1 − 0.95) 180 = 0.0239 Youden指数的取值范围在(-1, +1)之间,其值越接近于+1 ,诊断准确性越好。 五、阳性似然比 真阳性率与假阳性率之比,即灵敏度与误诊率之比就是阳性似然比(positive likelihood ratio, LR+ ),
4
诊 断界点 对照组 特异 度 (1 - α ) 灵 敏度 ( 1- β ) 病 例组
漏 诊 率 (β )
图 13-1
误 诊 率 (α )
灵敏度,特异度,漏诊率,误诊率图示
灵敏度与特异度具有不受患病率影响的优点, 其取值范围均在(0, 1)之间,其值越接近于1, 说明其诊断试验的价值越好。 当比较两个诊断试验时,单独使用灵敏度或特异度,可能出现一个诊断试验的灵敏度高、 特异度低,而另一个诊断试验的灵敏度低、特异度高,无法判断哪一个诊断试验更好。由此, 有人提出了将灵敏度和特异度结合的诊断试验评价指标,如 Youden指数、阳性似然比、阴性似 然比等。 四、 Youden指数 真阳性率与假阳性率之差就是 Youden指数(Youden’s index, J) ,即: J = Sen + Spe − 1 = TPR − FPR 其标准误为: SE J = TP × FN (TP + FN ) 3 + FP × TN ( FP + TN ) 3 = Sen (1 − Sen) /(TP + FN ) + Spe(1 − Spe) /( FP + TN ) (13-5)
三、特异度 实际未患病且被诊断为阴性的概率就是特异度 (specificity, Spe) ,即: Spe = P (T− | D− ) = TN ( FP + TN ) 其标准误为: SEspe = FP × TN ( FP + TN ) 3 = Spe(1 − Spe ) /( FP + TN ) 本例Spe =171/180=0.95, 即 95%未出现心肌梗塞患者诊断结果为阴性。其标准误为 SEspe = 0.95(1 − 0.95) / 180 = 0.0162 = 1.62% 该指标只与对照组有关,反映了诊断试验排除非病例的能力。 由式 (13-3) 可导出漏诊率 β = 1 − Sen = FN (TP + FN ) ,漏诊率也就是假阴性率;由式(13-4) 可导出误诊率 α = 1 − Spe = FP ( FP + TN ) ,误诊率也就是假阳性率 (false positive rate,FPR) 。 本例漏诊率 β = 1 − Sen = 1-0.8=0.2 ;误诊率 α = 1 − Spe = 1 − 0.95 = 0.05 ,即假阳性率 FPR=0.05。灵敏度、特异度、漏诊率、误诊率之间的关系可用图13-1 表示。此图中间的垂线与 横轴的交点称为诊断界点,它是定义诊断试验为阳性与阴性的临界点。 (13-4)
第一节 贝叶斯公式 对于诊断试验 (diagnostic test)的评价, 首先应知道受试者( 人、动物或影像等) 的真实类别, 即哪些属于对照组 (或无病组,正常组,噪声组等) ,哪些属于病例组( 或有病组,异常组,信号 组等 )。划分病例与对照这两个组的标准就是金标准(gold standard)。医学研究中常见的金标准 有:活组织检查、尸体解剖、手术探查和跟踪随访结果等。尽管金标准不需要十全十美,但是 它们应比评价的诊断试验更加可靠,且与评价的诊断试验无关。对于按金标准确定的二项分类 总体,如病例与对照 ( 分别记为 D+ 与 D− ),采用诊断试验检测的结果可分别写成阳性与阴性( 记 为 T+ 与 T− ),资料可列成表 13-1的四格表形式。表中有四个可能结果,其中两个是正确的,即 病例被诊断为阳性 (真阳性,TP)和对照被诊断为阴性( 真阴性,TN);两个是错误的,即病例被诊 断为阴性 (假阴性 ,FN) 和对照被诊断为阳性 (假阳性 ,FP)。
二、灵敏度 实际患病且被诊断为阳性的概率就是灵敏度 (sensitivity,Sen),也称为真阳性率 (true positive rate , TPR) ,即: Sen = P (T+ | D+ ) = TP (TP + FN ) = TPR
3
(13-3)
其标准误为: SEsen = TP × FN (TP + FN ) 3 = Sen(1 − Sen ) (TP + FN ) 本例Sen =416/520= 0.8, 即真阳性率 TPR=0.8, 80% 出现心肌梗塞患者被 ECG诊断为阳性; 其标准误为 SEsen = 0.8(1 − 0.8) / 520 = 0.0175 = 1.75% 该指标只与病例组有关,反映了诊断试验检出病例的能力。
为了确定诊断试验检测结果阳性时患病的概率有多大,可利用下列贝叶斯 (Bayes) 公式:
1
P( D+ | T+ ) =
P (T+ | D+ ) P( D+ ) P (T+ | D+ ) P( D+ ) + P(T+ | D− ) P( D− )
(13-1)
式中 P( D+ ) 称为先验概率 (prior probability) ,它不依赖于其它变量的变化而变化,在人群研 究中称为患病率, 此概率一般可从各种有关报道或参考书中获得, 也可通过流行病学调查得到; P( D− ) = 1 − P ( D+ ) ; P(T+ | D+ ) 是病例组中诊断试验检测结果为阳性的概率,也就是后面提到的 灵敏度或真阳性率; P(T+ | D− ) 是对照组中诊断试验检测结果为阳性的概率,也就是后面提到 的(1 -特异度) 或假阳性率; P( D+ | T+ ) 为后验概率 (posterior probability) ,也就是后面提到的阳 性预报值,一般情况下该指标难以直接得到,需要采用贝叶斯公式计算。
例 13- 1
以 往 调 查 得 知 , 某 人 群 2000 名 成 年 男 子 中 有 1 人 患 有 冠 心 病 。 采 用 心 电 图
(electrocardiogram,ECG) 作为诊断工具,金标准确诊的冠心病病例组中 98 %为 ECG阳性,未患 该病的对照组中 1%为 ECG阳性,问 ECG诊断为阳性时成年男子实际患冠心病的概率是多少? 解:已知 P( D+ ) = 1 2000 = 0.0005 , P(T+ | D+ ) = 98% = 0.98 , P(T+ | D− ) = 1% = 0.01 , P( D− ) = 1 − P( D+ ) = 1 − 0.0005 = 0.9995 根据式(13-1) 有: P( D+ | T+ ) = 0.98 × 0.0005 = 0.0467 0.98 × 0.0005 + 0.01 × 0.9995
由此得到诊断为阳性时成年男子实际患有冠心病的概率是4.67%,这说明 ECG阳性提供的患冠 心病信息很少,说明心电图(ECG)用于该人群的诊断价值很低。 但在临床上,ECG仅用于怀疑患有冠心病者,这样先验概率 P( D+ ) 较高,获得的后验概率 P( D+ | T+ ) 将比以上要高得多,如当 P( D+ ) =10 %=0.1 时,得到 P( D+ | T+ ) =91.59 %,因此在临 床上 ECG具有较好的诊断价值。 实际上, Bayes公式的通用形式应该是: P( Am | B1 B2 L Bn ) = P( B1 | Am ) P( B2 | Am ) L P( Bn | Am ) P( Am ) (13-2)
425 275 700(N)
评价诊断试验的常用指标有一致百分率、灵敏度、特异度、Youden指数、阳性似然比、阴 性似然比、阳性预报值和阴性预报值。 一.一致百分率 一致百分率是病例正确诊断为阳性与对照正确诊断为阴性的例数之和占总例数的百分率。 计算公式为: 一致百分率 = 其标准误为 SE一致百分率 = (TP + TN )( FP + FN ) / N 3 TP + TN ×100% N
wk.baidu.com
诊断试验中常用的评价指标
采用 ECG对具有急性持久胸痛的700名患者进行诊断,经证实有520例出现心肌梗
塞,其余180 例没有出现( 见表 13-2) ,试计算 ECG诊断试验的几个常用评价指标。
表13-2 ECG诊断结果 阳 性 阴 性 合计 出现 416(TP) 104(FN) 520 ECG诊断试验的结果 心肌梗塞 不出现 9(FP) 171(TN) 180 合 计
本例的一致百分率 =
416 + 171 × 100 % = 0. 8386 = 83. 86% 700
SE一致百分率 = (416 + 171)( 9 + 104 ) / 7003 = 0.0139 = 1.39% 一致百分率很大程度上依赖于患病率,如某病的患病率为5% ,即使不采用诊断试验,且 将所有研究个体划归为阴性,也可得到一致百分率为95% ;其次,它没有利用假阴性和假阳性 的信息,相同的一致百分率可能有十分不同的假阴性和假阳性;第三,它还受诊断界点 (cut-off point)( 见图13-1)的限制。因此,诊断试验评价只用该指标粗略地表达诊断试验的一致性,更常 用的诊断试验评价指标是灵敏度、特异度等。
LR − = (1 − TPR ) (1 − FPR ) = (1 − Sen ) Spe
(13-7)
本例 LR− = (1 − 0.8) 0.95 = 0.2105 ,即阴性似然比为 0.2105 。 LR− 的取值范围为 (0, ∞ ),其值越小,检测方法排除疾病的能力越好。 七、阳性预报值 在通常的情况下,当要对某疾病作出诊断时,并不知道金标准的结果,只知道诊断试验是 阳性或阴性。而临床医生更想知道的是:当诊断试验阳性时,受试者真正有病的概率有多大; 阴性时又有多大把握排除此病。这就需要引入阳性预报值(positive predictive value , PV+ )与阴 性预报值的概念。 试验结果阳性时,受试者实际为病例的概率就是阳性预报值,这实际上就是本章开始时提 到的贝叶斯公式的后验概率, PV+ = P( D+ | T+ ) = P(T+ | D+ ) P( D+ ) P (T+ | D+ ) P( D+ ) + P(T+ | D− ) P( D− ) (1 − Spe )(1 − P0 ) 1 + SenP0 (13-8)
表13-1 诊断资料 2 × 2 四格表 诊 断 结 果 ( T ) 阳 性( T+ ) 阴 性( T− ) 合计 金标准( D ) 病例( D + ) TP(真阳性) FN(假阴性) TP+FN 对照( D − ) FP(假阳性) TN(真阴性) FP+TN 合 计 TP+FP FN+TN N
5
LR+ = TPR FPR = Sen (1 − Spe) 本例 LR+ = 0.8 0.05 = 16 ,即阳性似然比为 16 。
(13-6)
LR+ 的取值范围为 (0, ∞ ),其值越大,检测方法证实疾病的能力越强。 LR+ 的标准误涉及到对数变换,这里不予给出;以下几个指标的标准误计算也较复杂,也 不予给出。 六、阴性似然比 假阴性率与真阴性率之比,即漏诊率与特异度之比为阴性似然比 (negative likelihood ratio, LR− ),
第十三章 诊断试验的评价
摘录自“宇传华, 诊断试验的评价. 见:余松林主编《医学统计学》 (全国高等医药七年制规划教材). 人民卫生出版社 ,2002.3. p164~178” (作者联系方式:http://statdtedm.6to23.com yuchua@163.com )
随着先进技术的迅猛发展,各种诊断试验 (包括诊断设备、试剂、方法等) 层出不穷,但并 不是每一种诊断试验肯定比常规或旧试验好,经过一段时间的临床应用,不少试验被淘汰。如 果医学工作者,特别是临床医生,能够掌握一些评价与解释诊断试验的有关知识,及时取舍或 灵活运用新的诊断试验,不但可提高自身的业务素质,而且还能减少患者的不必要经济开支, 更好地为患者服务。