ROC曲线

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

ROC曲线介绍
• ROC的全称是Receiver Operating Characteristic Curve,中文名字叫“受 试者工作特征曲线”。
• 是用来解决二分类的问题的”小专家”。
FPR,False Positive Rate
• 假阳性率。 没得病,这个方法误诊其有病的概率。 假阳性率=没得病但却被诊断为有病的被试个数/没得病被试个数。 FPR=FP/N。 FP:假的被判断成真的的个数 N:真实的假的的个数
认识混淆矩阵
• TP:True Positive,正例里面的被 判断出来的正例个数。
• FP:False Positive,反例里面的被 判断成正例的个数。
• FN:False Negtive,正例里面的被 判断成反例的个数。
• TN:True Negtive,反例里面被预 测成反例的个数。
• P:Postive,真实的正例个数。 • N:Negtive,真实的反例个数。
P:Positive,正例 N:Negtive,反例
ROC曲线怎么得到的?
• 由上图可以知道真实的结果中有十个正例,十个假例。 • 根据Score设置阈值来计算该阈值下的FPR与TPR。 • 在以FPR为横坐标以TPR为纵坐标的坐标图中描点。 • 连线。
ROC曲线怎么得到的?
现在我们指定一个阈值为0.9,那么 只有第一个样本(0.9)会被归类为 正例,而其他所有样本都会被归为 负例,因此,对于0.9这个阈值,我 们可以计算出FPR为0,TPR为0.1 (因为总共10个正样本,预测正确 的个数为1),那么我们就知道曲线 上必有一个点为(0, 0.1)。
ROC曲线
20191011 黄国峰
认识ROC曲线
ROC曲线相关名词解释
• ROC的全称是Receiver Operating Characteristic Curve,中文名字叫“受 试者工作特征曲线”。
• AUC (Area Under roc Curve),ROC曲线下面的面积。 • FPR (False Positive Rate),假阳性率。 • TPR (True Positive Rate),真阳性率。 • 混淆矩阵,confusion matrix。 • CI:置信区间,Confidence interval。 • 约登指数,TPR+FPR-1(敏感性+特异性-1),最佳截断点。
ຫໍສະໝຸດ Baidu
TPR,True Positive Rate
• 真阳性率。 得病了,这个方法诊断其有病的概率。 真阳性率=得病并且被诊断为有病的被试个数/得病被试个数。 TPR=TP/P。 TP:真的被判断成真的的个数。 P:真实的真的的个数。
ROC曲线怎么得到的?
• 先看例子:下图是一个二分模型真实的输出结果,一共有20个样本, 输出的概率就是模型判定其为正例的概率,第二列是样本的真实标 签。
在阈值最大的时候得到(0,0),阈值 最小的时候得到(1,1),其它点如上 所述计算方式依次类推。
改变阈值计算的到的最终的ROC曲线
文献中的ROC曲线
ROC曲线结果结果怎么看
相关文档
最新文档