Glossaire

Surface sous la courbe (SSC)

Apprenez l'importance de l'aire sous la courbe (AUC) dans l'évaluation des modèles ML. Découvrez ses avantages, des informations sur la courbe ROC et des applications dans le monde réel.

L'aire sous la courbe (AUC) est une mesure de performance largement utilisée dans l'apprentissage automatique pour évaluer l'efficacité des modèles de classification binaire. Elle représente la probabilité qu'un modèle classe une instance positive choisie au hasard plus haut qu'une instance négative choisie au hasard. Essentiellement, la SSC résume la capacité d'un modèle à faire la distinction entre les classes pour tous les seuils de classification possibles, fournissant ainsi une mesure unique et globale de la performance. Une valeur AUC plus élevée indique un modèle plus performant, ce qui en fait un outil crucial pour comparer différents modèles et pour le réglage des hyperparamètres.

Qu'est-ce que la courbe Roc ?

La SSC est intrinsèquement liée à la courbe ROC (Receiver Operating Characteristic). La courbe ROC est un graphique qui représente le taux de vrais positifs (TPR), également appelé rappel, par rapport au taux de faux positifs (FPR) à différents seuils. La SSC est simplement l'aire sous la courbe ROC. Alors que la courbe ROC fournit une représentation visuelle des compromis d'un modèle entre la sensibilité et la spécificité, le score AUC quantifie ce compromis en un seul chiffre, ce qui simplifie la comparaison des modèles.

Interprétation du score Auc

La valeur de l'AUC est comprise entre 0 et 1, un score plus élevé indiquant un meilleur modèle.

  • AUC = 1 : Cela représente un modèle parfait qui classifie correctement toutes les instances positives et négatives. Chaque échantillon positif a une probabilité de prédiction supérieure à celle de chaque échantillon négatif.
  • SSC = 0,5 : Cela indique que le modèle n'a aucune capacité de discrimination, ce qui équivaut à une supposition aléatoire. La courbe ROC pour un tel modèle serait une ligne droite diagonale.
  • AUC < 0.5: A score below 0.5 suggests the model is performing worse than random chance. In practice, this often points to an issue with the model or data, such as inverted predictions.
  • 0.5 < AUC < 1: This range signifies that the model has some ability to discriminate. The closer the value is to 1, the better the model's performance.

Des outils tels que Scikit-learn fournissent des fonctions permettant de calculer facilement les scores AUC, qui peuvent être visualisés à l'aide de plateformes telles que TensorBoard.

Applications dans le monde réel

L'AUC est une mesure précieuse dans de nombreux domaines où la classification binaire est essentielle.

  1. Analyse d'images médicales : Dans le domaine de l'IA dans les soins de santé, des modèles sont développés pour des tâches telles que la détection de tumeurs à partir de scanners médicaux. Un score AUC est utilisé pour évaluer la capacité d'un modèle à distinguer les cas malins (positifs) des cas bénins (négatifs). Une AUC élevée est essentielle pour construire des outils de diagnostic fiables qui peuvent aider les radiologues, en garantissant une sensibilité élevée sans un nombre excessif de fausses alarmes. Cet aspect est crucial pour les modèles qui analysent des ensembles de données tels que l'ensemble de données sur les tumeurs cérébrales.
  2. Détection des fraudes : Dans le secteur financier, les modèles d'IA sont utilisés pour identifier les transactions frauduleuses. Les ensembles de données dans ce domaine sont généralement très déséquilibrés, avec beaucoup plus de transactions légitimes que de transactions frauduleuses. L'AUC est particulièrement utile dans ce cas, car elle fournit une mesure de performance robuste qui n'est pas faussée par la classe majoritaire, contrairement à la précision. Elle aide les institutions financières à construire des systèmes qui détectent efficacement les fraudes tout en minimisant les faux positifs qui pourraient gêner les clients. Les principales institutions financières s'appuient sur ces mesures pour évaluer les risques.

Auc Vs. Autres indicateurs

Bien que la SSC soit une mesure précieuse, il est important de comprendre en quoi elle diffère des autres mesures d'évaluation utilisées dans le domaine de la vision artificielle (CV) et de la ML :

  • AUC vs. précision : La précision mesure l'exactitude globale des prédictions, mais peut être trompeuse sur des ensembles de données déséquilibrés. La SSC fournit une mesure de séparabilité indépendante des seuils, ce qui la rend plus fiable dans de tels cas.
  • SSC vs. Précision-Recall : Pour les ensembles de données déséquilibrés où la classe positive est rare et d'un intérêt primordial (par exemple, la détection de maladies rares), la courbe Précision-Recall et sa surface correspondante (AUC-PR) peuvent être plus informatives que l'AUC ROC. Les mesures telles que la précision et le rappel se concentrent spécifiquement sur les performances concernant la classe positive. Le score F1 équilibre également la précision et le rappel.
  • AUC vs. mAP/IoU : L'AUC est principalement utilisé pour les tâches de classification binaire. Pour les tâches de détection d'objets communes à des modèles comme Ultralytics YOLO, des mesures telles que la précision moyenne (mAP) et l'intersection sur l'union (IoU) sont la norme. Ces mesures évaluent à la fois la précision de la classification et la précision de la localisation des objets détectés à l'aide de boîtes englobantes. Pour en savoir plus sur les mesures de performance de YOLO, cliquez ici.

Le choix de la bonne métrique dépend du problème spécifique, des caractéristiques de l'ensemble de données (comme l'équilibre des classes) et des objectifs du projet d'IA. L'AUC reste la pierre angulaire de l'évaluation des performances de la classification binaire en raison de sa robustesse et de sa facilité d'interprétation. Le suivi des expériences à l'aide d'outils comme Ultralytics HUB peut aider à gérer et à comparer ces métriques de manière efficace.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers