Area Under the Curve (AUC)
Apprends comment l'aire sous la courbe (AUC) mesure la performance d'un modèle. Découvre son rôle dans la classification, la santé et la finance en utilisant Ultralytics YOLO26.
L'aire sous la courbe (AUC) est une mesure de performance complète utilisée en machine learning (ML) pour évaluer la puissance discriminante d'un modèle de classification. Plus précisément, elle mesure l'aire bidimensionnelle située sous la courbe ROC (Receiver Operating Characteristic), fournissant une valeur scalaire unique allant de 0 à 1. Une AUC de 1,0 indique un classificateur parfait, tandis qu'une AUC de 0,5 suggère que le modèle ne performe pas mieux qu'un choix aléatoire. Comme elle agrège les performances à travers tous les seuils de classification possibles, l'AUC est particulièrement efficace pour évaluer les capacités de modélisation prédictive dans des scénarios où la frontière de décision optimale est inconnue ou variable.
Link to this sectionLa relation entre ROC et AUC#
Pour bien comprendre l'AUC, tu dois saisir la courbe ROC sous-jacente. Ce graphique trace le taux de vrais positifs (rappel) par rapport au taux de faux positifs à différents réglages de seuil. L'AUC quantifie essentiellement la probabilité que le modèle classe une instance positive choisie au hasard plus haut qu'une instance négative choisie au hasard.
- Séparabilité : L'AUC mesure la capacité du modèle à distinguer les classes (par ex., "chien" vs "chat"). Une meilleure séparabilité signifie de meilleures prédictions.
- Invariance de seuil : Contrairement au F1-score, qui dépend d'un point de coupure spécifique, l'AUC offre une vue d'ensemble large de la qualité du modèle.
- Invariance d'échelle : Elle mesure la qualité du classement des prédictions, plutôt que leurs valeurs de probabilité absolues.
Link to this sectionApplications concrètes#
L'AUC est une mesure privilégiée dans les secteurs traitant de la prise de décision critique et des datasets déséquilibrés, où une classe est nettement plus rare que l'autre.
-
Diagnostics médicaux : Dans le domaine de l'IA dans la santé, les modèles sont entraînés à identifier des pathologies à partir de l'analyse d'images médicales. Par exemple, un modèle détectant des tumeurs rares doit prioriser la sensibilité. Une AUC élevée garantit que le système attribue de manière fiable des scores de risque plus élevés aux vrais patients par rapport aux individus sains, réduisant ainsi les faux négatifs dangereux.
-
Détection de la fraude financière : Les institutions financières utilisent l'IA dans la finance pour repérer les transactions frauduleuses. Puisque les transactions légitimes sont bien plus nombreuses que les frauduleuses, un modèle pourrait atteindre 99 % de précision en qualifiant simplement tout de "légitime". L'AUC empêche cela en évaluant la capacité du modèle à séparer les tentatives de fraude réelles du comportement normal, indépendamment de la distribution des classes.
Link to this sectionDistinguer l'AUC des mesures connexes#
Il est crucial de différencier l'AUC des autres informations sur l'évaluation des modèles pour choisir le bon outil pour ton projet.
- AUC vs Précision : La précision est simplement le ratio de prédictions correctes sur le total des prédictions. Sur des datasets très biaisés, la précision peut être trompeusement élevée. L'AUC est robuste au déséquilibre des classes, fournissant une évaluation plus honnête de la performance du classificateur.
- AUC vs Précision-Rappel : Alors que la ROC-AUC est standard pour des résultats équilibrés, l'aire sous la courbe Précision-Rappel (AUPRC) est souvent préférée lorsque la classe "positive" est extrêmement rare et que les faux positifs sont une préoccupation majeure.
- AUC vs mAP : Dans les tâches de détection d'objets utilisant des modèles comme YOLO26, la mesure standard est la Mean Average Precision (mAP). Bien que la mAP soit conceptuellement similaire — calculant l'aire sous la courbe Précision-Rappel à travers différents seuils d'Intersection sur Union (IoU) — l'AUC fait strictement référence à la courbe ROC dans la classification binaire ou multi-classes.
Link to this sectionExemple de code#
L'exemple suivant montre comment charger un modèle de classification pré-entraîné YOLO26 et exécuter une validation. Bien que les modèles YOLO rapportent principalement la précision top-1 et top-5, le processus de validation génère les données de prédiction nécessaires pour analyser les mesures basées sur les courbes.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Validate the model on a standard dataset (e.g., imagenet10)
# This generates precision, recall, and accuracy metrics
results = model.val(data="imagenet10")
# Access top-1 accuracy, a key point on the ROC curve
print(f"Top-1 Accuracy: {results.top1:.4f}")
print(f"Top-5 Accuracy: {results.top5:.4f}")Pour une gestion complète du cycle de vie, incluant l'annotation de datasets et l'entraînement dans le cloud où ces mesures sont visualisées automatiquement, les développeurs peuvent utiliser la plateforme Ultralytics. Cela simplifie le processus d'interprétation de mesures complexes comme l'AUC sans calcul manuel.






