通过三个直观步骤理解ROC曲线
创作时间:
作者:
@小白创作中心
通过三个直观步骤理解ROC曲线
引用
CSDN
1.
https://blog.csdn.net/deephub/article/details/106799969
ROC曲线是评估分类模型性能的重要工具。本文通过三个直观的步骤,帮助读者理解ROC曲线的概念和计算方法。
ROC曲线是一个用于评估分类模型效果好坏的可视化表示。在这篇文章中,我将分三个步骤来构建ROC曲线。
步骤1:获取分类模型预测
当我们训练一个分类模型时,模型会输出每个样本属于正类的概率。以贷款偿还为例,模型会给出借款人偿还贷款的概率。概率值通常在0到1之间,数值越高表示借款人越有可能偿还贷款。
接下来,我们需要选择一个阈值,将概率值分为“会偿还”和“不会偿还”两类。例如,如果选择0.35作为阈值:
- 所有概率值达到或超过0.35的预测,被归类为“会偿还”
- 所有概率值低于0.35的预测,被归类为“不会偿还”
然后,我们需要评估这些分类是否正确。通过比较预测结果和实际结果,我们可以构建一个混淆矩阵:
- 所有真正积极的样本(实际会偿还的)用蓝点表示
- 如果被正确分类为“会偿还”,则为真正例(TP)
- 如果被错误分类为“不会偿还”,则为假阴性(FN)
- 所有负样本(实际不会偿还的)用红点表示
- 如果被正确分类为“不会偿还”,则为真负例(TN)
- 如果被错误分类为“会偿还”,则为假阳性(FP)
步骤2:计算真阳性率和假阳性率
有了混淆矩阵,我们可以计算两个重要指标:
- 真阳性率(TPR):所有实际会偿还的样本中,被正确分类的比例
- 假阳性率(FPR):所有实际不会偿还的样本中,被错误分类的比例
计算公式如下:
以图4为例,当阈值为0.35时:
- 正确分类90%的阳性样本(TPR = 90%)
- 错误分类40%的阴性样本(FPR = 40%)
从图中可以看出,随着阈值的增加:
- TPR和FPR都会降低
- 阈值为0时,所有样本都被分类为“会偿还”,因此TPR = 100%,FPR = 100%
- 阈值为1时,所有样本都被分类为“不会偿还”,因此TPR = 0%,FPR = 0%
步骤3:绘制每个阈值点的TPR和FPR
为了绘制ROC曲线,我们需要计算多个不同阈值下的TPR和FPR(这一步通常由相关库自动完成,如scikit-learn)。
对于每个阈值,在坐标系中:
- x轴表示FPR
- y轴表示TPR
然后用一条线将这些点连接起来。这就是ROC曲线!
曲线下方的面积称为AUC(Area Under the Curve)。AUC值越高,表示模型在区分正负样本方面表现越好。理想情况下,我们希望ROC曲线尽可能靠近左上角,以获得更高的AUC值。
热门推荐
跟腱损伤后如何快速恢复?五种科学治疗方法详解
什么是DApp?DApp开发指南
霸王别姬程蝶衣:张国荣演绎的京剧名伶传奇
山石有那么多画法,你知道几种?画山水必备教程!
如何安全赎回理财产品?这种赎回操作的注意事项有哪些?
异人之下人物关系介绍 异人之下人物关系是怎样
嵌甲的日常护理和预防
三呼渡河:宗泽的英雄传奇
“科技感”满满!“智慧春运”让回家的路安全、便捷又通畅
迟桂友:河北钢铁行业绿色低碳转型发展成绩斐然
开车必须具备的 3 种空间意识,能全部掌握的都是经验丰富的老司机
烟味空气净化器哪个好一点的?去除烟味好的空气净化器总结分享
上热下寒的中药方子大总结,清上温下,有效调理,再也不怕用错药
神经代码智能综述:2024年最新进展与未来展望
如何将本地视频生成在线链接:三种实用方法详解
为什么救护车要收费?叫一次救护车究竟得花多少钱?
金属牙套托槽掉了能自己粘上吗?托槽掉落该如何科学处理?
丹道修炼的秘诀,提升修炼者的身心健康与精神境界!
用人工智能写作:专业作家利用 ChatGPT 的五种方式
梅花易的源起:图解北宋邵康节观梅之术
高铁上充电伤不伤手机?答案来了!很多人想错
如何提高折弯机的折弯精度?
姜茶的正确做法,家庭自制姜茶最简单的做法
如何分析分时趋势中的背离现象?这种分析对短线交易有何指导意义?
意甲第26轮焦点战:罗马vs蒙扎,红狼欲擒垫底之师
你同意吗?美媒:东契奇对于詹姆斯的适配程度超过韦德!
新时代直销公司合法吗
给新车打蜡的最佳时间
任丘一中率先实行高中双休,家长反应不一:有人欢喜有人忧
电子产品领域关键课题:高效散热常用的几大导热材料方案