了解 ROC 曲线和 AUC 如何评估 AI/ML 中分类器的性能,优化欺诈检测和医疗诊断等任务的 TPR 与 FPR。
接收者工作特征曲线(ROC)是一种图形图像,用于说明二元分类器系统的诊断能力随其判别阈值的变化而变化。它有助于直观地显示机器学习模型区分两个类别(如正类与负类、垃圾邮件与非垃圾邮件)的能力。该曲线是通过绘制不同阈值设置下的真阳性率 (TPR) 与假阳性率 (FPR) 的对比图而形成的。了解 ROC 曲线对于评估和比较分类模型的性能至关重要,尤其是在医学图像分析和模式识别等领域。它起源于信号检测理论,但现在已广泛应用于人工智能和深度学习(DL)领域。
要解释 ROC 曲线,必须了解其坐标轴:
ROC 曲线说明了给定二元分类模型的 TPR 和 FPR 之间的权衡。随着分类阈值的变化(决定一个实例是阳性还是阴性的临界点),模型可能会识别出更多的真阳性(增加 TPR),但可能会以识别出更多的假阳性(增加 FPR)为代价。可视化这种权衡有助于根据应用的具体需求选择最佳阈值。
ROC 曲线的形状和位置可以帮助我们了解模型的性能:
从 ROC 曲线得出的一个常用指标是曲线下面积(AUC)。AUC 提供了一个单一的标量值,概括了分类器在所有可能阈值下的性能。AUC 值为 1.0 表示分类器完美,而 AUC 值为 0.5 则表示模型性能随机(就像掷硬币)。Scikit-learn等工具提供了轻松计算 AUC 的功能,Ultralytics HUB等平台通常集成了此类可视化功能,用于模型监控。
ROC 曲线广泛应用于对二元分类性能评估至关重要的各个领域:
其他应用还包括垃圾邮件过滤、天气预测(如预测降雨)和制造业质量控制。
虽然准确率、精确率和召回率(或 TPR)等指标能提供有价值的信息,但 ROC 曲线和 AUC 能提供更全面的视图,尤其是在不平衡数据集中,一类明显多于另一类的情况下。
值得注意的是,ROC 曲线主要用于二元分类任务。对于多类问题或物体检测等任务,常见的模型有 Ultralytics YOLO等模型常用的多类问题或物体检测任务,其他指标,如平均精度 (mAP)和联合交叉 (IoU)则更为标准。有关评估Ultralytics YOLO 等模型的详细见解,请参阅我们的YOLO 性能指标指南。通常可以使用与Ultralytics HUB等平台或TensorBoard 等库集成的工具来实现这些指标的可视化。您可以探索以下框架 PyTorch和 TensorFlow等框架,它们提供了构建和评估这些模型的工具。了解这些指标对于负责任的人工智能开发和确保模型公平性(人工智能伦理)至关重要。