Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024
Glossaire

Courbe ROC (Receiver Operating Characteristic)

Découvrez comment les courbes ROC et l'AUC évaluent la performance des classificateurs en IA/ML, en optimisant le TPR par rapport au FPR pour des tâches telles que la détection de fraude et le diagnostic médical.

Une courbe ROC (Receiver Operating Characteristic) est un graphique qui illustre la capacité de diagnostic d'un modèle de classification binaire lorsque son seuil de discrimination est modifié. C'est un outil fondamental en apprentissage automatique (ML) pour évaluer et comparer les performances des classificateurs. La courbe est créée en traçant le taux de vrais positifs (TPR) par rapport au taux de faux positifs (FPR) à différents seuils, offrant une vue complète des performances d'un modèle à travers tous les seuils de classification possibles. Cela en fait un atout précieux pour comprendre les compromis entre la sensibilité et la spécificité dans les tâches d'apprentissage supervisé.

Comprendre la courbe ROC

Pour saisir le concept d'une courbe ROC, il est essentiel de comprendre ses deux axes :

  • Taux de vrais positifs (TVP) : Également appelé rappel ou sensibilité, le TVP mesure la proportion de positifs réels qui sont correctement identifiés. Par exemple, dans un test médical, il s’agirait du pourcentage de patients atteints d’une maladie qui sont correctement diagnostiqués.
  • Taux de faux positifs (FPR) : Le FPR mesure la proportion de négatifs réels qui sont incorrectement identifiés comme positifs. Dans le même exemple de test médical, ce serait le pourcentage de patients sains qui sont diagnostiqués à tort avec la maladie.

Un modèle de classification génère généralement une probabilité ou un score de confiance pour chaque instance. Un seuil est ensuite appliqué à ce score pour prendre une décision binaire finale (par exemple, positive ou négative). La courbe ROC est générée en faisant varier systématiquement ce seuil de 0 à 1 et en traçant les paires TPR et FPR résultantes pour chaque valeur. La visualisation des performances du modèle peut souvent être effectuée à l'aide d'outils tels que TensorBoard ou via des plateformes comme Ultralytics HUB.

Comment interpréter une courbe ROC

La forme et la position de la courbe ROC révèlent beaucoup sur la performance d'un modèle.

  • Classificateur Aléatoire : Une ligne diagonale de (0,0) à (1,1) représente un modèle sans pouvoir de discrimination—il équivaut à une devinette aléatoire.
  • Bon classificateur : Une courbe qui s'incline vers le coin supérieur gauche indique un bon classificateur. Plus la courbe est proche du coin supérieur gauche, meilleures sont ses performances, car elle atteint un taux de vrais positifs (TVP) élevé tout en maintenant un faible taux de faux positifs (TFP).
  • Classificateur parfait : Un classificateur parfait aurait une courbe qui va de (0,0) directement jusqu'à (0,1) puis jusqu'à (1,1), atteignant un TPR de 100 % avec un FPR de 0 %.

Une métrique courante dérivée de la courbe ROC est l'Aire Sous la Courbe (AUC). L'AUC représente la probabilité que le classificateur classe une instance positive choisie au hasard plus haut qu'une instance négative choisie au hasard. Une AUC de 1.0 signifie un modèle parfait, tandis qu'une AUC de 0.5 correspond à un modèle aléatoire. Cette valeur scalaire unique est utile pour comparer différents modèles.

Applications concrètes

Les courbes ROC sont largement utilisées dans divers secteurs pour évaluer et sélectionner les modèles optimaux pour le déploiement.

  1. Diagnostic médical : Dans l'analyse d'images médicales, un modèle d'apprentissage profond pourrait être entraîné pour détecter le cancer à partir de mammographies. La courbe ROC aide les radiologues et les ingénieurs à évaluer la capacité du modèle à distinguer les tumeurs malignes et bénignes. En analysant la courbe, ils peuvent choisir un seuil de classification qui équilibre la nécessité de détecter autant de cancers que possible (TPR élevé) par rapport au risque de provoquer des biopsies inutiles en raison de fausses alarmes (FPR faible). Il s'agit d'une étape essentielle dans le développement responsable de l'IA et pour garantir que le modèle répond aux normes cliniques établies par des organismes comme la FDA.

  2. Détection de la fraude à la carte de crédit : Les institutions financières utilisent des modèles de ML pour identifier les transactions frauduleuses en temps réel. Une courbe ROC peut être utilisée pour évaluer la capacité d'un modèle à séparer les transactions frauduleuses des transactions légitimes. Une banque peut utiliser la courbe pour sélectionner un seuil qui maximise la détection de la fraude tout en minimisant le nombre de transactions légitimes qui sont incorrectement refusées, ce qui pourrait frustrer les clients. Cela contribue à la mise en place de systèmes robustes pour l'IA dans la finance.

Courbe ROC vs. Autres métriques

Bien que les courbes ROC soient puissantes, il est important de comprendre en quoi elles diffèrent des autres métriques d'évaluation.

  • Précision : Cette métrique peut être trompeuse, en particulier avec les ensembles de données déséquilibrés où une classe domine. Un modèle pourrait atteindre une précision élevée en prédisant simplement la classe majoritaire. La courbe ROC et l'AUC offrent une vue indépendante du seuil qui est plus robuste dans ces scénarios.

  • Précision et Rappel : Ces métriques se concentrent sur la performance de la classe positive. La précision mesure l'exactitude des prédictions positives, tandis que le rappel (TPR) mesure la couverture des positifs réels. Le score F1 combine ces deux éléments, mais reste dépendant d'un seuil spécifique. En revanche, la courbe ROC évalue le compromis entre le TPR et le FPR pour tous les seuils. Pour les tâches où la classe négative est vaste et de peu d'intérêt, une courbe Précision-Rappel peut être plus informative.

  • mAP et IoU : Les courbes ROC sont conçues pour la classification binaire. Pour les tâches plus complexes comme la détection d'objets ou la segmentation d'instance courantes avec des modèles comme Ultralytics YOLO, d'autres métriques sont standard. La précision moyenne (mAP) et l'Intersection sur Union (IoU) sont utilisées pour évaluer à la fois la classification et la précision de la localisation. Pour plus de détails, consultez notre guide sur les métriques de performance de YOLO. La visualisation de ces métriques peut être effectuée avec des frameworks comme PyTorch ou TensorFlow.

Rejoignez la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant
Lien copié dans le presse-papiers