Apprentissage supervisé
Découvrez comment l'apprentissage supervisé alimente l'IA avec des données étiquetées, permettant des prédictions précises et des applications telles que la détection d'objets et l'analyse des sentiments.
L'apprentissage supervisé est un paradigme fondamental de l'apprentissage automatique (ML) où un algorithme apprend à partir de données qui ont été étiquetées manuellement avec les résultats corrects. L'objectif principal est d'apprendre une fonction de mappage qui peut prédire la sortie pour de nouvelles données non vues. Considérez cela comme un apprentissage avec un enseignant ou un "superviseur" qui fournit les bonnes réponses (étiquettes) pendant la phase d'entraînement. Cette approche est l'épine dorsale de nombreuses applications d'Intelligence Artificielle (IA) réussies, en particulier dans la vision par ordinateur (CV).
Comment fonctionne l’apprentissage supervisé
Le processus d'apprentissage supervisé commence par un ensemble de données organisé contenant des caractéristiques d'entrée et des étiquettes de sortie correspondantes. Cet ensemble de données étiquetées est divisé en données d'entraînement, données de validation et données de test.
- Entraînement : Le modèle reçoit les données d'entraînement. Il fait des prédictions pour chaque entrée et les compare aux labels corrects.
- Correction d'erreur : La différence entre la prédiction du modèle et l'étiquette réelle est quantifiée par une fonction de perte. Un algorithme d'optimisation, tel que la descente de gradient, ajuste les paramètres internes du modèle, ou poids du modèle, pour minimiser cette erreur.
- Itération : Ce processus est répété pendant de nombreuses époques, ce qui permet au modèle d'apprendre les modèles sous-jacents dans les données. Les performances du modèle sont surveillées sur l'ensemble de validation pour éviter des problèmes tels que le surapprentissage.
- Prédiction : Une fois entraîné, le modèle peut faire des prédictions sur de nouvelles données non étiquetées. La qualité de ces prédictions est évaluée à l'aide de l'ensemble de test et des métriques de performance.
L'ensemble de ce flux de travail est simplifié sur des plateformes comme Ultralytics HUB, qui simplifie la gestion des ensembles de données, l'entraînement des modèles et le déploiement.
Types de problèmes d'apprentissage supervisé
Les tâches d'apprentissage supervisé sont généralement classées en deux types principaux :
- Classification : L'objectif est de prédire une catégorie discrète ou une étiquette de classe. Par exemple, un modèle de classification d'images peut être entraîné pour classer les images comme contenant un « chat » ou un « chien ». D'autres exemples incluent la détection de courriers indésirables et l'analyse des sentiments. Des modèles comme Ultralytics YOLO peuvent être entraînés pour des tâches de classification à haute performance. Pour en savoir plus, consultez cette introduction à la classification.
- Régression : L’objectif est de prédire une valeur numérique continue. Par exemple, un modèle pourrait prédire le prix d’une maison en fonction de caractéristiques telles que sa taille et son emplacement. D’autres applications incluent la prévision du cours des actions et la prédiction de la température. Un aperçu de la régression est disponible dans ce guide d’analyse de régression.
Applications concrètes
L'apprentissage supervisé est au cœur d'innombrables systèmes d'IA modernes. Voici deux exemples marquants :
- Détection d'objets dans les véhicules autonomes : Les voitures autonomes s'appuient sur des modèles de détection d'objets pour identifier et localiser les piétons, les autres véhicules et les panneaux de signalisation. Ces modèles sont entraînés sur de vastes jeux de données où les objets dans les images sont étiquetés avec des boîtes englobantes. Le modèle entraîné peut ensuite traiter des flux vidéo en temps réel pour prendre des décisions de conduite critiques. Ultralytics fournit des solutions puissantes pour l'IA dans l'industrie automobile.
- Analyse d’images médicales : Dans le domaine de la santé, les modèles d’apprentissage supervisé sont utilisés pour l’analyse d’images médicales, comme la détection de tumeurs dans les IRM ou les tomodensitométries. Les radiologues étiquettent un grand nombre d’images, indiquant la présence ou l’absence de tumeurs. Un réseau neuronal convolutif (CNN) est ensuite entraîné sur ces données pour aider au diagnostic précoce. Par exemple, les modèles peuvent être entraînés sur des ensembles de données pour la détection des tumeurs cérébrales.
Comparaison avec d'autres paradigmes d'apprentissage
L'apprentissage supervisé se distingue des autres paradigmes principaux de l'apprentissage automatique :
- Apprentissage non supervisé : Cette approche utilise des données non étiquetées, où l'algorithme essaie de trouver des schémas ou des structures par lui-même, comme le regroupement de points de données similaires (clustering) ou la réduction des dimensions des données. Il n'apprend pas un mappage direct entrée-sortie à partir de réponses connues. Lisez une Présentation de l'apprentissage non supervisé.
- Apprentissage Auto-Supervisé (SSL) : Un sous-ensemble de l'apprentissage non supervisé où les signaux de supervision (étiquettes) sont générés automatiquement à partir des données d'entrée elles-mêmes. Il s'agit d'une technique puissante pour le pré-entraînement des modèles de fondation sur de vastes quantités de données non étiquetées avant de les affiner pour une tâche spécifique.
- Apprentissage par renforcement : Dans ce paradigme, un agent apprend à prendre des séquences de décisions en interagissant avec un environnement et en recevant des récompenses ou des pénalités en fonction de ses actions. Il apprend les comportements optimaux par essais et erreurs, plutôt qu’à partir d’un ensemble de données statique et étiqueté. Explorez un aperçu de l’apprentissage par renforcement.
En résumé, l'apprentissage supervisé est une technique puissante et largement utilisée qui exploite les données étiquetées pour entraîner des modèles pour des tâches prédictives. Il constitue l'épine dorsale de nombreuses applications d'IA réussies, y compris celles développées et prises en charge par Ultralytics, et est une compétence essentielle pour quiconque travaille dans le domaine de la science des données ou de l'IA.