Glossaire

Apprentissage supervisé

Découvrez comment l'apprentissage supervisé alimente l'IA avec des données étiquetées, permettant des prédictions précises et des applications telles que la détection d'objets et l'analyse des sentiments.

L'apprentissage supervisé est un paradigme fondamental de l'apprentissage machine (ML) dans lequel un algorithme apprend à partir de données qui ont été manuellement étiquetées avec les résultats corrects. L'objectif principal est d'apprendre une fonction de mappage capable de prédire la sortie pour de nouvelles données inédites. Il s'agit en quelque sorte d'apprendre avec un enseignant ou un "superviseur" qui fournit les bonnes réponses (étiquettes) pendant la phase de formation. Cette approche constitue l'épine dorsale de nombreuses applications réussies de l'intelligence artificielle (IA), en particulier dans le domaine de la vision par ordinateur (VA).

Fonctionnement de l'apprentissage supervisé

Le processus d'apprentissage supervisé commence par un ensemble de données contenant des caractéristiques d'entrée et des étiquettes de sortie correspondantes. Cet ensemble de données étiquetées est divisé en données de formation, données de validation et données de test.

  1. Formation : Le modèle reçoit les données d'apprentissage. Il fait des prédictions pour chaque entrée et les compare aux étiquettes correctes.
  2. Correction d'erreur : La différence entre la prédiction du modèle et l'étiquette réelle est quantifiée par une fonction de perte. Un algorithme d'optimisation, tel que la descente de gradient, ajuste les paramètres internes du modèle, ou les poids du modèle, afin de minimiser cette erreur.
  3. Itération : Ce processus est répété pendant de nombreuses époques, ce qui permet au modèle d'apprendre les modèles sous-jacents dans les données. Les performances du modèle sont contrôlées sur l'ensemble de validation afin d'éviter les problèmes de surajustement.
  4. Prédiction : Une fois entraîné, le modèle peut faire des prédictions sur de nouvelles données non étiquetées. La qualité de ces prédictions est évaluée à l'aide de l'ensemble de test et des mesures de performance.

L'ensemble de ce flux de travail est rationalisé sur des plateformes comme Ultralytics HUB, qui simplifie la gestion des ensembles de données, la formation des modèles et le déploiement.

Types de problèmes d'apprentissage supervisé

Les tâches d'apprentissage supervisé sont généralement classées en deux catégories principales :

  • Classification: L'objectif est de prédire une catégorie discrète ou une étiquette de classe. Par exemple, un modèle de classification d'images peut être entraîné à classer les images comme contenant un "chat" ou un "chien". D'autres exemples incluent la détection des spams et l'analyse des sentiments. Des modèles comme Ultralytics YOLO peuvent être entraînés pour des tâches de classification très performantes. Pour en savoir plus, consultez cette introduction à la classification.
  • Régression: L'objectif est de prédire une valeur numérique continue. Par exemple, un modèle pourrait prédire le prix d'une maison en fonction de caractéristiques telles que sa taille et son emplacement. Parmi les autres applications, citons la prévision du cours des actions et la prévision de la température. Vous trouverez un aperçu de la régression dans ce guide de l'analyse de régression.

Applications dans le monde réel

L'apprentissage supervisé est le moteur d'innombrables systèmes d'IA modernes. En voici deux exemples marquants :

  1. Détection d'objets dans les véhicules autonomes : Les voitures autonomes s'appuient sur des modèles de détection d'objets pour identifier et localiser les piétons, les autres véhicules et les panneaux de signalisation. Ces modèles sont entraînés sur de vastes ensembles de données où les objets dans les images sont étiquetés avec des boîtes de délimitation. Le modèle formé peut ensuite traiter les flux vidéo en temps réel pour prendre des décisions de conduite critiques. Ultralytics fournit des solutions puissantes pour l'IA dans l'industrie automobile.
  2. Analyse d'images médicales : Dans le domaine des soins de santé, les modèles d'apprentissage supervisé sont utilisés pour l'analyse d'images médicales, comme la détection de tumeurs dans les IRM ou les tomodensitogrammes. Les radiologues étiquettent un grand nombre de scanners, indiquant la présence ou l'absence de tumeurs. Un réseau neuronal convolutif (CNN) est ensuite formé sur ces données pour aider au diagnostic précoce. Par exemple, des modèles peuvent être formés sur des ensembles de données pour la détection des tumeurs cérébrales.

Comparaison avec d'autres paradigmes d'apprentissage

L'apprentissage supervisé se distingue des autres paradigmes primaires d'apprentissage automatique :

  • Apprentissage non supervisé: Cette approche utilise des données non étiquetées, pour lesquelles l'algorithme tente de trouver des modèles ou des structures par lui-même, comme le regroupement de points de données similaires(clustering) ou la réduction des dimensions des données. Il n'apprend pas de correspondance directe entre les entrées et les sorties à partir de réponses connues. Lire un aperçu de l'apprentissage non supervisé.
  • Apprentissage auto-supervisé (SSL): Un sous-ensemble de l'apprentissage non supervisé dans lequel les signaux de supervision (étiquettes) sont générés automatiquement à partir des données d'entrée elles-mêmes. Il s'agit d'une technique puissante permettant de pré-entraîner des modèles de base sur de grandes quantités de données non étiquetées avant de les affiner pour une tâche spécifique.
  • Apprentissage par renforcement: Dans ce paradigme, un agent apprend à prendre des séquences de décisions en interagissant avec un environnement et en recevant des récompenses ou des pénalités en fonction de ses actions. Il apprend les comportements optimaux par essais et erreurs, plutôt qu'à partir d'un ensemble de données statiques et étiquetées. Explorer une vue d'ensemble de l'apprentissage par renforcement.

En résumé, l'apprentissage supervisé est une technique puissante et largement utilisée qui s'appuie sur des données étiquetées pour former des modèles à des tâches prédictives. Il constitue l'épine dorsale de nombreuses applications d'IA réussies, y compris celles développées et soutenues par Ultralytics, et est une compétence cruciale pour toute personne travaillant dans le domaine de la science des données ou de l'IA.

Rejoindre la communauté Ultralytics

Rejoignez l'avenir de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

S'inscrire
Lien copié dans le presse-papiers