Découvrez comment l'apprentissage supervisé alimente l'IA avec des données étiquetées, permettant des prédictions précises et des applications telles que la détection d'objets et l'analyse des sentiments.
L'apprentissage supervisé est un paradigme dominant dans le domaine de l'apprentissage automatique. l'apprentissage automatique (ML), où un algorithme est un algorithme est formé sur des données d'entrée qui ont été étiquetées avec la sortie correcte. Contrairement à d'autres méthodes dans lesquelles un système peut explorer les données de manière autonome, cette approche repose sur un "superviseur". données de manière autonome, cette approche s'appuie sur un "superviseur" - les données étiquetées - pour guider l'apprentissage. données étiquetées pourguider le processus d'apprentissage. L'objectif L'objectif principal est que le modèle apprenne une fonction de correspondance entre les variables d'entrée et les variables de sortie avec suffisamment de précision pour qu'il puisse prédire les résultats pour de nouvelles variables d'entrée. avec suffisamment de précision pour pouvoir prédire les résultats de nouvelles données inédites. Cette méthodologie sert de base à de nombreux modèles commerciaux intelligence artificielle (IA) d'intelligence artificielle (IA), allant des filtres anti-spam aux systèmes systèmes avancés de vision artificielle (CV).
Le flux de travail commence par un ensemble de données contenant des paires d'entrées (caractéristiques) et de sorties souhaitées (étiquettes). Cette collection est généralement divisée en sous-ensembles distincts : données de formation pour l'apprentissage du modèle, données de validation de validation pour le réglage des paramètres, et les données de l'évaluation finale.
Pendant la phase d'apprentissage du modèle, l'algorithme traite les données d'entrée et fait une prédiction. données d'entrée et fait une prédiction. Une formule mathématique connue sous le nom de fonction de perte calcule la différence entre cette prédiction et l'étiquette réelle. Pour minimiser cette erreur, un algorithme d'optimisation, tel que la descente de gradient, ajuste itérativement les poids du modèle internes du modèle. Ce cycle se poursuit pendant de nombreuses passes, ou époques, jusqu'à ce que le modèle atteigne des performances satisfaisantes sans suradaptation à l'ensemble d'apprentissage. Pour approfondir approfondie de ces mécanismes, vous pouvez explorer le guide de Scikit-learn sur l'apprentissage supervisé.
La plupart des problèmes d'apprentissage supervisé se répartissent en deux catégories principales en fonction du type de variable de sortie :
L'entraînement d'un modèle supervisé est devenu de plus en plus accessible grâce à des API de haut niveau. L'exemple Python suivant suivant montre comment entraîner un modèle YOLO11 sur le jeu de données MNIST , une référence standard pour la classification des chiffres.
from ultralytics import YOLO
# Load a pretrained classification model
model = YOLO("yolo11n-cls.pt")
# Train the model on the MNIST dataset
# Ultralytics handles the download of the 'mnist160' dataset automatically
results = model.train(data="mnist160", epochs=5, imgsz=64)
# Run inference on a sample image to verify the supervised learning
print(model("https://ultralytics.com/images/bus.jpg"))
L'apprentissage supervisé alimente des technologies essentielles dans divers secteurs d'activité. En voici deux exemples marquants :
Il est important de différencier l'apprentissage supervisé des autres paradigmes d'apprentissage automatique :