分类评价指标
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
诊断界值=5
诊断 金标准 结果 异常 正常 + 33 2 18 56
诊断界值=4
诊断 金标准 结果 异常 正常 + 44 13 7 45
诊断界值=3
FPR 0.0345 TPR 0 0.6471
0.2241 0.8627
0.3296 0.9020
0.4310 0.9412
诊断界值=2
1
诊断 金标准 结果 异常 正常 + 46 19 5 39
诊断准确度较低( <0.7 )
ï Ï Õ ¶ × ¼ È ·¶ È Ö Ð µ È £ ¨ 0.7~0.9 £ ©
0.8 1.0 FPR
0.8 1.0 FPR
(> 0.9 ) 诊断准确度较高
特点
ROC曲线反映了灵敏度与特异度间的平衡 (增加灵敏 度将降低特异度;增加特异度将降低灵敏度)。 在ROC曲线空间,如果曲线沿着左边线,然后沿着 上边线越紧密,则试验准确度越高。 在ROC曲线空间,如果曲线沿着机会线(45度对角 线)越紧密,则试验准确度越低。 在诊断界值(cutpoint)处的正切线的斜率就是该试 验值对应的阳性似然比(likelihood ratio,LR)。在 ROC曲线空间的左下角LR+最大,随着曲线从左下往 右上方移动,LR+逐渐减小。 ROC曲线下面积是重要的试验准确度指标。
有序分类数据的
ROC曲线工作点(TPR,FPR)计算
某放射医生对 109 份 CT 影像的分类
诊 断 分 类 将诊断分类数据按 金标准 合计 1 2 3 4 5 大到小排序,以前4个分 3 2 2 11 33 51 异常 33 6 6 11 2 58 类作为诊断界值,大于 正常 等于诊断界值者为阳性, 小于该值者为阴性。这 样,可整理出4个四格表, 该资料不同诊断界值的 FPR 和 TPR 值 每个四格表对应的ROC 诊断界值(诊断分类) 1 5 4 3 2 曲线的工作点见下表。 0 1
(三)样本大小的计算
与筛检试验研究的样本量有关的因素: ①对试验灵敏度的要求,即假阴性率控制在什么 水平; ②对试验特异度的要求,即假阳性率控制在什么 水平; ③显著性检验水平(a值),一般为0.05 , u0.05=1.96 ; ④容许误差,一般为0.05-0.10。
二、试验评价的指标
(一)真实性 1 灵敏度(sensitivity)(真阳性率) 即实际有病而按该筛检标准被正确地判为有 病的百分率。 灵敏度=[a/(a+c)]×100% 2 特异度(Specificity)(真阴性率) 实际无病按该诊断标准被正确地判为无病的 百分率。 特异度=[ d/(b+d)]×100%
受试者工作特性曲线(receiver operator characteristic curve, ROC)
是用真阳性率和假阳性率作图得出的曲线,它可 表示灵敏度和特异度之间的关系。
ROC曲线常用来决定最佳临界点,通常最接近左 上角那一点,可定为最佳临界点。
ROC曲线也可用来比较两种和两种以上诊断试 验的诊断价值,从而帮助临床医师作出最佳选择。
一、ROC曲线工作点的计算与曲线绘制
主要任务: 计算ROC曲线工作点 连接相邻两点
连续型数据的
ROC曲线工作点(TPR,FPR)计算
将这9个数据从 大到小排列,以前8 个数,分别作为诊断 界值,大于等于诊断 界值者判为阳性,小 于该值者判为阴性。 这样,可整理成8个 四格表
表:假想的连续型数据
(2)灵敏度和特异度对预测值的影响
在患病率不变的情况下,随着灵敏度的升高,阴 性预测值上升;随着特异度的升高,阳性预测值上 升。
(3)患病率、灵敏度和特异度对预测值的影 响
100 80
© ¨%£ µ £ â Ö ¤² Ô
60 40 20 0 0 20 40 ¼² » ¡Â Ê£ ¨%£ © Í ¼ 15£ 10 Ô ¤² âÖ µÓ ë» ¼² ¡Â Ê¡ ¢Á éà ô¶ Ⱥ ÍÌ ×Ò ì¶ Èµ Ĺ ×Ï µ 60 80 100
ROC曲线是一种全面、准确评价诊断试 验非常有效的方法,并可以比较两种或 多种诊断试验的诊断价值,除了直观方 法比较外,还可以计算ROC曲线下的面积, 来比较几种诊断试验的诊断效率。 ROC曲 线下的面积越大,越接近1.0,其诊断的 真实度越高,越接近0.5,其诊断的真实 度越差。
ROC曲线下面积(Area)与诊断准确度高低 高 0.90-1.00 = excellent (A) 中 0.80-0.90 = good (B) 0.70-0.80 = fair (C) 低 0.60-0.70 = poor (D) 0.50-0.60 = fail (F)
ROC曲线下面积 (Area)
部分ROC曲线下的面积 FPR为某值对应的TPR值
第三节 筛检效果的评价
一、估计筛检阳性或阴性者患病的临床意义
1 阳性预测值(positive predictive value): 是指试验阳性结果中真正患病(真阳性)的比例。 阳性预测值= a/(a+b) 2 阴性预测值(negative predictive value): 是指试验阴性结果中真正未患病(真阴性)的比例。 阴性预测值=d/(c+d)
诊断界值=13.5
诊断 金标准 结果 病例 对照 + 2 0 3 4
诊断界值=12.8
金标准 病例 对照 3 0 2 4
诊断界值=11.2
诊断 金标准 结果 病例 对照 + 4 0 1 4
诊断界值=8.5
诊断 金标准 结果 病例 对照 + 4 1 1 3
诊断界值=6.4
诊断 金标准 结果 病例 对照 + 4 2 1 2
诊断 金标准 结果 异常 正常 + 48 25 3 33
1.0 T P R 0.8 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 ¼ 2 Ó Í Ð Ð ò · Ö À à × Ê Á Ï µ Ä Î ´ ¹ â » ¬ ROCÇ ú Ï ß FPR
二、ROC曲线下面积的计算
理想的预测方法,其灵敏度、特异度均应接 近100%。但在实际工作中很难达到,往往表 现为灵敏度高者,则特异度低;反之亦然。 两者高低的转换与确定筛检试验阳性结果的 截断值(cut off point)或临界点的选择密切相关。
糖尿病血糖试验不同血糖水平的灵敏度和特异度分布
餐后2小时血糖 70 (mg/100ml) 80 90 100 110 120 130 140 150 160 170 180 190 200 灵敏度(%) 98.6 97.1 94.3 88.6 85.7 71.4 64.3 57.1 50.0 47.1 42.9 38.6 34.3 27.1 特异度(%) 8.8 25.5 47.6 69.8 84.1 92.5 96.9 99.4 99.6 99.8 100.0 100.0 100.0 100.0
诊断界值=5.0
诊断 结果 + 金标准 病例 对照 5 2 0 2
诊断界值=4.6
诊断 金标准 结果 病例 对照 + 5 3 0 1
表13.4 表13.3资料不同诊断界值的FPR和TPR值
诊 断 界 值 16.5 FPR TPR 0 1/5 13.5 0 2/5 12.8 0 3/5 11.2 0 4/5 8.5 1/4 4/5 6.4 2/4 4/5 5.0 2/4 5/5 4.6 3/4 5/5
预测性能的计算和检验
1. 样本/检验数据:阳性数据(P),阴性数据(N)
a. 阳性数据(P):真实的,被实验所证实的数据 b. 阴性数据(N):被实验所证明为无功能的数据
2. 对于预测结果的评测,定义:
a. 真阳性 (TP): 阳性数据中被预测为阳性的数据 b. 假阳性 (FP): 阴性数据中被预测为阳性的数据 c. 真阴性 (TN): 阴性数据中被预测为阴性的数据
1.0 0.8 0.6 0.4 0.2 0.0
1.0 T 0.8 P R 0.6 0.4 0.2 0.0
0.0 0.2 0.4 0.6 0.8 1.0 FPR
1.0 T 0.8 P R 0.6 0.4 0.2 0.0
A =0.664
A = 0.830
0.0 0.2 0.4 0.6
A = 0.938
0.0 0.2 0.4 0.6
即实际有病,但根据该诊断标准被定为非病者的百 分率。 假阴性率=[c/( a+c)] ×100%=l-灵敏度
4 假阳性率(false positive rate)(误诊率、第一类 错误)
即实际无病,但根据该诊断标准被定为有病的百分 率。 假阳性率=[b/(b+d)] ×100%=1-特异度
5 正确指数/约登指数(Youden’s index)
算。
(1)阳性似然比: 诊断试验中,真阳性在‘有病’患者中的比例与 假阳性在‘无病’例数中比例的比值。 表明诊断试验阳性时患病与不患病机会的比值。比 值越大患病的概率越大。 +LR=[a/(a+c)/b/(b+d)]=灵敏度/(1-特异度) (2)阴性似然比 诊断试验中,假阴性在‘有病’例数中之比与真阴 性在‘无病’例数中比例的比值。 -LR=[c/(a+c)/d/(b+d)]=(1-灵敏度)/特异度
分类效果的评价
一、分类效果的评价方法(医学为例)
(一)确定‘金标准’ ‘金标准’:是指当前临床医学界公认 的诊断疾病的最可靠的方法。也称为标准 诊断。 通常包括:活检、手术发现、微生物培 养、尸检、特殊检查和影像诊断,以及长 期随访的结果。
(二)选择研究对象
(1)病例组:是指用金标准确诊‘有病’ 的病例,应包含典型的、不典型病例,早、 中、晚期病例,轻、中、重病例、有和无 并发症的患者。 (2)对照组:是指用金标准证实没有目标 疾病的其他病例,特别是与该病容易混淆 的病例。正常人一般不宜纳入对照组。
是灵敏度和特异度之和减去1。 指数范围介于0~1之间。 表示筛检方法发现真正病人与非病人总的 能力。指数越大,其真实性越高。
正确指数= (灵敏度十特异度)- 1 =l-(假阳性率十假阴性率)
6 似然比(likelihood ratio, LR)
是反映真实性的一种指标,是可以同时反映灵敏 度和特异度的复合指标。 即有病者中得出某一筛检试验结果的概率与病 者得出这一概率可能性的比值。 该指标避免了将试验结果简单地划为正常和异 常,全面反映筛检试验的诊断价值,且非常稳定, 比灵敏度、特异度更稳定,更不受患病率的影响。 不足之处是:它是比而不是率,应用时需要换
响,其取值范围均在(0, 1)之间,其值 越接近于1,说明其诊断准确性越好。 缺点:当比较两个诊断试验时,单独使 用灵敏度或特异度,可能出现矛盾。 解决办法:将两指标结合:Youden指数、 阳性似然比、阴性似然比等
3 假阴性率(false negative rate)(漏诊率、第二类 错误)
7 符合率(agreement/consistency rate)
试验判定的结果与标准诊断的结果相比 时,二者相同的百分率叫符合率。
符合率(粗一致率)=[(a+d)/(a+b+c+d)]×100%
调整一致率=1/4[a/(a+b)+a/(a+c)+d/(c+d)+d/(b+d)]×100%
8 评价真实性时阳性界定值的选择
金标准 病例组 对照组 16.5 8.5 13.5 6.4 检测结果 12.8 4.6 11.2 1.7 5.0
表13.3
金标准 病例组 对照组 16.5 8.5
假想的连续性资料
检测结果 13.5 12.8 6.4 4.6 诊断 结果 + 11.2 1.7 5.0
Baidu Nhomakorabea
诊断界值=16.5
诊断 金标准 结果 病例 对照 + 1 0 4 4
d. 假阴性 (FN): 阳性数据中被预测为阴性的数据
常用的检验指标
1. 灵敏度 (Sensitivity, Sn): 对于真实的数据,能够预 测成“真”的比例是多少 - (Type II error) 2. 特异性 (Specificity, Sp): 对于阴性的数据,能够预 测成“假”的比例是多少 - (Type I error) 3. 准确性 (Accuracy, Ac): 对于整个数据集(包括阳性 和阴性数据),预测总共的准确比例是多少 4. 马修相关系数(Mathew correlation coefficient, MCC): 当阳性数据的数量与阴性数据的数量差别较 大时,能够更为公平的反映预测能力,值域[-1,1]
Test variable
灵敏度,特异度,假阴性率,假阳性率
百分率(%) 100
80 60 40 20 0
50 60 70 80 90 100
特异度 灵敏度
Test variable 不同诊断界值时
灵敏度与特异度间的平衡(trade off)
灵敏度与特异度的优缺点
优点:灵敏度与特异度不受患病率的影
诊断 金标准 结果 异常 正常 + 33 2 18 56
诊断界值=4
诊断 金标准 结果 异常 正常 + 44 13 7 45
诊断界值=3
FPR 0.0345 TPR 0 0.6471
0.2241 0.8627
0.3296 0.9020
0.4310 0.9412
诊断界值=2
1
诊断 金标准 结果 异常 正常 + 46 19 5 39
诊断准确度较低( <0.7 )
ï Ï Õ ¶ × ¼ È ·¶ È Ö Ð µ È £ ¨ 0.7~0.9 £ ©
0.8 1.0 FPR
0.8 1.0 FPR
(> 0.9 ) 诊断准确度较高
特点
ROC曲线反映了灵敏度与特异度间的平衡 (增加灵敏 度将降低特异度;增加特异度将降低灵敏度)。 在ROC曲线空间,如果曲线沿着左边线,然后沿着 上边线越紧密,则试验准确度越高。 在ROC曲线空间,如果曲线沿着机会线(45度对角 线)越紧密,则试验准确度越低。 在诊断界值(cutpoint)处的正切线的斜率就是该试 验值对应的阳性似然比(likelihood ratio,LR)。在 ROC曲线空间的左下角LR+最大,随着曲线从左下往 右上方移动,LR+逐渐减小。 ROC曲线下面积是重要的试验准确度指标。
有序分类数据的
ROC曲线工作点(TPR,FPR)计算
某放射医生对 109 份 CT 影像的分类
诊 断 分 类 将诊断分类数据按 金标准 合计 1 2 3 4 5 大到小排序,以前4个分 3 2 2 11 33 51 异常 33 6 6 11 2 58 类作为诊断界值,大于 正常 等于诊断界值者为阳性, 小于该值者为阴性。这 样,可整理出4个四格表, 该资料不同诊断界值的 FPR 和 TPR 值 每个四格表对应的ROC 诊断界值(诊断分类) 1 5 4 3 2 曲线的工作点见下表。 0 1
(三)样本大小的计算
与筛检试验研究的样本量有关的因素: ①对试验灵敏度的要求,即假阴性率控制在什么 水平; ②对试验特异度的要求,即假阳性率控制在什么 水平; ③显著性检验水平(a值),一般为0.05 , u0.05=1.96 ; ④容许误差,一般为0.05-0.10。
二、试验评价的指标
(一)真实性 1 灵敏度(sensitivity)(真阳性率) 即实际有病而按该筛检标准被正确地判为有 病的百分率。 灵敏度=[a/(a+c)]×100% 2 特异度(Specificity)(真阴性率) 实际无病按该诊断标准被正确地判为无病的 百分率。 特异度=[ d/(b+d)]×100%
受试者工作特性曲线(receiver operator characteristic curve, ROC)
是用真阳性率和假阳性率作图得出的曲线,它可 表示灵敏度和特异度之间的关系。
ROC曲线常用来决定最佳临界点,通常最接近左 上角那一点,可定为最佳临界点。
ROC曲线也可用来比较两种和两种以上诊断试 验的诊断价值,从而帮助临床医师作出最佳选择。
一、ROC曲线工作点的计算与曲线绘制
主要任务: 计算ROC曲线工作点 连接相邻两点
连续型数据的
ROC曲线工作点(TPR,FPR)计算
将这9个数据从 大到小排列,以前8 个数,分别作为诊断 界值,大于等于诊断 界值者判为阳性,小 于该值者判为阴性。 这样,可整理成8个 四格表
表:假想的连续型数据
(2)灵敏度和特异度对预测值的影响
在患病率不变的情况下,随着灵敏度的升高,阴 性预测值上升;随着特异度的升高,阳性预测值上 升。
(3)患病率、灵敏度和特异度对预测值的影 响
100 80
© ¨%£ µ £ â Ö ¤² Ô
60 40 20 0 0 20 40 ¼² » ¡Â Ê£ ¨%£ © Í ¼ 15£ 10 Ô ¤² âÖ µÓ ë» ¼² ¡Â Ê¡ ¢Á éà ô¶ Ⱥ ÍÌ ×Ò ì¶ Èµ Ĺ ×Ï µ 60 80 100
ROC曲线是一种全面、准确评价诊断试 验非常有效的方法,并可以比较两种或 多种诊断试验的诊断价值,除了直观方 法比较外,还可以计算ROC曲线下的面积, 来比较几种诊断试验的诊断效率。 ROC曲 线下的面积越大,越接近1.0,其诊断的 真实度越高,越接近0.5,其诊断的真实 度越差。
ROC曲线下面积(Area)与诊断准确度高低 高 0.90-1.00 = excellent (A) 中 0.80-0.90 = good (B) 0.70-0.80 = fair (C) 低 0.60-0.70 = poor (D) 0.50-0.60 = fail (F)
ROC曲线下面积 (Area)
部分ROC曲线下的面积 FPR为某值对应的TPR值
第三节 筛检效果的评价
一、估计筛检阳性或阴性者患病的临床意义
1 阳性预测值(positive predictive value): 是指试验阳性结果中真正患病(真阳性)的比例。 阳性预测值= a/(a+b) 2 阴性预测值(negative predictive value): 是指试验阴性结果中真正未患病(真阴性)的比例。 阴性预测值=d/(c+d)
诊断界值=13.5
诊断 金标准 结果 病例 对照 + 2 0 3 4
诊断界值=12.8
金标准 病例 对照 3 0 2 4
诊断界值=11.2
诊断 金标准 结果 病例 对照 + 4 0 1 4
诊断界值=8.5
诊断 金标准 结果 病例 对照 + 4 1 1 3
诊断界值=6.4
诊断 金标准 结果 病例 对照 + 4 2 1 2
诊断 金标准 结果 异常 正常 + 48 25 3 33
1.0 T P R 0.8 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 ¼ 2 Ó Í Ð Ð ò · Ö À à × Ê Á Ï µ Ä Î ´ ¹ â » ¬ ROCÇ ú Ï ß FPR
二、ROC曲线下面积的计算
理想的预测方法,其灵敏度、特异度均应接 近100%。但在实际工作中很难达到,往往表 现为灵敏度高者,则特异度低;反之亦然。 两者高低的转换与确定筛检试验阳性结果的 截断值(cut off point)或临界点的选择密切相关。
糖尿病血糖试验不同血糖水平的灵敏度和特异度分布
餐后2小时血糖 70 (mg/100ml) 80 90 100 110 120 130 140 150 160 170 180 190 200 灵敏度(%) 98.6 97.1 94.3 88.6 85.7 71.4 64.3 57.1 50.0 47.1 42.9 38.6 34.3 27.1 特异度(%) 8.8 25.5 47.6 69.8 84.1 92.5 96.9 99.4 99.6 99.8 100.0 100.0 100.0 100.0
诊断界值=5.0
诊断 结果 + 金标准 病例 对照 5 2 0 2
诊断界值=4.6
诊断 金标准 结果 病例 对照 + 5 3 0 1
表13.4 表13.3资料不同诊断界值的FPR和TPR值
诊 断 界 值 16.5 FPR TPR 0 1/5 13.5 0 2/5 12.8 0 3/5 11.2 0 4/5 8.5 1/4 4/5 6.4 2/4 4/5 5.0 2/4 5/5 4.6 3/4 5/5
预测性能的计算和检验
1. 样本/检验数据:阳性数据(P),阴性数据(N)
a. 阳性数据(P):真实的,被实验所证实的数据 b. 阴性数据(N):被实验所证明为无功能的数据
2. 对于预测结果的评测,定义:
a. 真阳性 (TP): 阳性数据中被预测为阳性的数据 b. 假阳性 (FP): 阴性数据中被预测为阳性的数据 c. 真阴性 (TN): 阴性数据中被预测为阴性的数据
1.0 0.8 0.6 0.4 0.2 0.0
1.0 T 0.8 P R 0.6 0.4 0.2 0.0
0.0 0.2 0.4 0.6 0.8 1.0 FPR
1.0 T 0.8 P R 0.6 0.4 0.2 0.0
A =0.664
A = 0.830
0.0 0.2 0.4 0.6
A = 0.938
0.0 0.2 0.4 0.6
即实际有病,但根据该诊断标准被定为非病者的百 分率。 假阴性率=[c/( a+c)] ×100%=l-灵敏度
4 假阳性率(false positive rate)(误诊率、第一类 错误)
即实际无病,但根据该诊断标准被定为有病的百分 率。 假阳性率=[b/(b+d)] ×100%=1-特异度
5 正确指数/约登指数(Youden’s index)
算。
(1)阳性似然比: 诊断试验中,真阳性在‘有病’患者中的比例与 假阳性在‘无病’例数中比例的比值。 表明诊断试验阳性时患病与不患病机会的比值。比 值越大患病的概率越大。 +LR=[a/(a+c)/b/(b+d)]=灵敏度/(1-特异度) (2)阴性似然比 诊断试验中,假阴性在‘有病’例数中之比与真阴 性在‘无病’例数中比例的比值。 -LR=[c/(a+c)/d/(b+d)]=(1-灵敏度)/特异度
分类效果的评价
一、分类效果的评价方法(医学为例)
(一)确定‘金标准’ ‘金标准’:是指当前临床医学界公认 的诊断疾病的最可靠的方法。也称为标准 诊断。 通常包括:活检、手术发现、微生物培 养、尸检、特殊检查和影像诊断,以及长 期随访的结果。
(二)选择研究对象
(1)病例组:是指用金标准确诊‘有病’ 的病例,应包含典型的、不典型病例,早、 中、晚期病例,轻、中、重病例、有和无 并发症的患者。 (2)对照组:是指用金标准证实没有目标 疾病的其他病例,特别是与该病容易混淆 的病例。正常人一般不宜纳入对照组。
是灵敏度和特异度之和减去1。 指数范围介于0~1之间。 表示筛检方法发现真正病人与非病人总的 能力。指数越大,其真实性越高。
正确指数= (灵敏度十特异度)- 1 =l-(假阳性率十假阴性率)
6 似然比(likelihood ratio, LR)
是反映真实性的一种指标,是可以同时反映灵敏 度和特异度的复合指标。 即有病者中得出某一筛检试验结果的概率与病 者得出这一概率可能性的比值。 该指标避免了将试验结果简单地划为正常和异 常,全面反映筛检试验的诊断价值,且非常稳定, 比灵敏度、特异度更稳定,更不受患病率的影响。 不足之处是:它是比而不是率,应用时需要换
响,其取值范围均在(0, 1)之间,其值 越接近于1,说明其诊断准确性越好。 缺点:当比较两个诊断试验时,单独使 用灵敏度或特异度,可能出现矛盾。 解决办法:将两指标结合:Youden指数、 阳性似然比、阴性似然比等
3 假阴性率(false negative rate)(漏诊率、第二类 错误)
7 符合率(agreement/consistency rate)
试验判定的结果与标准诊断的结果相比 时,二者相同的百分率叫符合率。
符合率(粗一致率)=[(a+d)/(a+b+c+d)]×100%
调整一致率=1/4[a/(a+b)+a/(a+c)+d/(c+d)+d/(b+d)]×100%
8 评价真实性时阳性界定值的选择
金标准 病例组 对照组 16.5 8.5 13.5 6.4 检测结果 12.8 4.6 11.2 1.7 5.0
表13.3
金标准 病例组 对照组 16.5 8.5
假想的连续性资料
检测结果 13.5 12.8 6.4 4.6 诊断 结果 + 11.2 1.7 5.0
Baidu Nhomakorabea
诊断界值=16.5
诊断 金标准 结果 病例 对照 + 1 0 4 4
d. 假阴性 (FN): 阳性数据中被预测为阴性的数据
常用的检验指标
1. 灵敏度 (Sensitivity, Sn): 对于真实的数据,能够预 测成“真”的比例是多少 - (Type II error) 2. 特异性 (Specificity, Sp): 对于阴性的数据,能够预 测成“假”的比例是多少 - (Type I error) 3. 准确性 (Accuracy, Ac): 对于整个数据集(包括阳性 和阴性数据),预测总共的准确比例是多少 4. 马修相关系数(Mathew correlation coefficient, MCC): 当阳性数据的数量与阴性数据的数量差别较 大时,能够更为公平的反映预测能力,值域[-1,1]
Test variable
灵敏度,特异度,假阴性率,假阳性率
百分率(%) 100
80 60 40 20 0
50 60 70 80 90 100
特异度 灵敏度
Test variable 不同诊断界值时
灵敏度与特异度间的平衡(trade off)
灵敏度与特异度的优缺点
优点:灵敏度与特异度不受患病率的影