Apprentissage automatique automatisé (AutoML)
Rationalisez les projets d'apprentissage automatique avec AutoML ! Automatisez la préparation des données, la sélection des modèles et le réglage pour gagner du temps et rendre l'IA accessible à tous.
L'apprentissage automatique des machines (Automated Machine Learning, AutoML) est un sous-domaine de l'intelligence artificielle (IA) qui évolue rapidement.
l'Intelligence Artificielle (IA) qui évolue rapidement et qui vise à
automatiser le processus de bout en bout de l'application
Machine Learning (ML) aux problèmes du monde réel.
En systématisant les tâches complexes et itératives impliquées dans la construction de modèles d'apprentissage automatique, AutoML vise à rendre la puissance du Deep Learning (DL) et de la modélisation statistique plus efficace.
Deep Learning (DL) et de la modélisation statistique
et de la modélisation statistique aux non-experts tout en augmentant l'efficacité des data scientists professionnels. Le développement
traditionnel nécessite un effort manuel important dans des domaines tels que
le prétraitement des données, la sélection des caractéristiques et
réglage de l'algorithme. AutoML rationalise ces flux de travail, ce qui permet aux entreprises de développer leurs capacités d'IA sans avoir besoin d'une équipe massive d'ingénieurs spécialisés.
sans avoir besoin d'une équipe massive d'ingénieurs spécialisés.
Le flux de travail AutoML
L'objectif principal d'AutoML est de supprimer l'aspect essai-erreur de la création de modèles performants. Un pipeline
AutoML gère automatiquement plusieurs étapes critiques :
-
Préparation des données: Les données brutes sont rarement prêtes pour la formation. Les outils AutoML automatisent
le nettoyage des données, le traitement des valeurs manquantes
le formatage des entrées. Cela permet de s'assurer que les
données de formation sont normalisées et fiables.
-
Ingénierie des caractéristiques: Il est essentiel d'identifier les variables qui contribuent le plus à une prédiction.
Grâce à l'extraction et à la sélection automatisées des
automatisées, le système détermine les données d'entrée les plus pertinentes, créant souvent de nouvelles caractéristiques que les analystes humains pourraient négliger.
négliger.
-
Sélection du modèle: Il existe d'innombrables algorithmes, de la simple régression linéaire à des modèles complexes.
régression linéaire simple aux réseaux
complexes . AutoML teste intelligemment
teste intelligemment diverses architectures pour trouver celle qui correspond le mieux à l'ensemble
spécifique.
-
Optimisation des hyperparamètres: Le réglage de paramètres tels que le taux d'apprentissage ou la taille du lot est essentiel pour maximiser la productivité.
le taux d'apprentissage ou la taille du lot est essentiel pour maximiser la
précision. Des techniques avancées telles que l
l 'optimisation bayésienne sont utilisées pour rechercher
pour rechercher efficacement la configuration optimale dans l'espace des hyperparamètres.
Applications concrètes
AutoML transforme les industries en permettant un déploiement plus rapide de solutions intelligentes. Deux exemples marquants
sont les suivants :
-
Diagnostics de santé: Dans le domaine de
l'analyse d'images médicales, les hôpitaux utilisent
AutoML pour développer des systèmes d'aide aux radiologues. En testant automatiquement différents
réseaux neuronaux convolutifs (CNN)
ces outils peuvent detect avec une grande précision des anomalies telles que des tumeurs dans des radiographies ou des IRM.
précision. Cela accélère la création d'aides au diagnostic
diagnostiques qui améliorent les résultats pour les patients.
-
Commerce de détail et gestion des stocks: Les détaillants s'appuient sur
modèles de vision artificielle (CV) pour contrôler les
les niveaux de stock sur les étagères. Les plates-formes AutoML permettent aux entreprises de former des
modèles de détection d'objets sur leurs produits
spécifiques sans avoir besoin d'une expertise technique approfondie. Cela permet une gestion efficace et automatisée des stocks, réduisant ainsi le gaspillage et les coûts.
efficace, en réduisant le gaspillage et en veillant à ce que les
en garantissant que les articles les plus demandés sont toujours en stock.
Automatiser l'optimisation avec du code
L'une des utilisations les plus courantes des principes d'AutoML dans les flux de travail modernes est l'automatisation des processus de production.
Réglage des hyperparamètres. Les
ultralytics simplifie ce processus, permettant aux utilisateurs de rechercher automatiquement la meilleure configuration d'entraînement pour les modèles.
pour des modèles tels que YOLO11.
L'exemple suivant montre comment lancer une session de réglage automatique pour optimiser les performances du modèle sur un jeu de données spécifique.
sur un jeu de données spécifique :
from ultralytics import YOLO
# Load a standard YOLO11 model
model = YOLO("yolo11n.pt")
# Start automated hyperparameter tuning
# This process searches for optimal settings (lr, momentum, etc.)
# to maximize metrics like mAP on the provided data
model.tune(data="coco8.yaml", epochs=10, iterations=5)
Distinguer AutoML des concepts apparentés
Il est important de différencier AutoML des autres termes de l'écosystème de l'IA pour comprendre son rôle spécifique :
-
AutoML vs. MLOps: Alors qu'AutoML se concentre sur la création du modèle (formation et réglage), les opérations d'apprentissage automatique (MLOps) se concentrent sur la création du modèle (formation et réglage),
Machine Learning Operations (MLOps)
englobe l'ensemble du cycle de vie. MLOps comprend
le déploiement, la surveillance et la gouvernance du modèle dans
dans les environnements de production. AutoML est souvent un composant d'une stratégie MLOps plus large.
-
AutoML vs. recherche d'architecture neuronale (NAS):
La recherche d'architecture neuronale (NAS)
est un sous-ensemble spécialisé d'AutoML. Alors qu'AutoML générique peut choisir entre une forêt aléatoire et un réseau neuronal, NAS automatise spécifiquement la conception de la structure du réseau neuronal lui-même (par exemple, le nombre de couches),
NAS automatise spécifiquement la conception de la structure du réseau neuronal lui-même (par exemple, le nombre de couches, les connexions entre les nœuds).
connexions de nœuds). NAS est très gourmand en ressources informatiques et se concentre uniquement sur l'architecture.
l 'architecture.
-
AutoML vs. apprentissage par transfert:
L'apprentissage par transfert consiste à prendre un modèle
et de l'adapter à une nouvelle tâche. Bien qu'AutoML utilise souvent des stratégies d'apprentissage par transfert pour accélérer la formation, il s'agit de concepts distincts,
il s'agit de concepts distincts. L'apprentissage par transfert est une technique, tandis qu'AutoML est un cadre d'automatisation des processus.
Outils et plateformes
L'adoption d'AutoML est motivée par une variété d'outils puissants allant des bibliothèques open-source aux services cloud des entreprises.
d'entreprise. Les principaux fournisseurs de services en nuage proposent des solutions robustes telles que
Google Cloud AutoML,
AWS SageMaker Autopilot, et
Azure Automated ML, qui fournissent des interfaces graphiques pour la construction de modèles. Dans la communauté des logiciels libres, des bibliothèques comme
Auto-sklearn étendent le célèbre framework
scikit-learn pour inclure la sélection automatisée de modèles.
En ce qui concerne plus particulièrement la vision par ordinateur, la prochaine plateformeUltralytics intégrera les capacités AutoML
afin de simplifier l'apprentissage de modèles avancés pour des tâches telles que
l 'estimation de la pose et
segmentation d'images, rendant ainsi l'IA de pointe
de pointe aux développeurs de tous niveaux.