Hyperparameter Tuning
Explore le réglage des hyperparamètres pour optimiser les performances des modèles. Apprends des techniques comme l'optimisation bayésienne et comment utiliser Ultralytics YOLO26 pour un réglage automatisé.
Le réglage des hyperparamètres est le processus itératif d'optimisation des variables de configuration externes qui régissent le processus d'entraînement d'un modèle de machine learning (ML). Contrairement aux paramètres internes — tels que les poids et les biais qui sont appris à partir des données pendant l'entraînement — les hyperparamètres sont définis par le data scientist ou l'ingénieur avant que le processus d'apprentissage ne commence. Ces réglages contrôlent la structure du modèle et le comportement de l'algorithme, agissant comme les « boutons et cadrans » qui affinent les performances. Trouver la combinaison idéale de ces valeurs est essentiel pour maximiser des métriques comme la précision et l'efficacité, faisant souvent la différence entre un modèle médiocre et une solution de pointe.
Link to this sectionConcepts et techniques fondamentaux#
L'ensemble de toutes les combinaisons d'hyperparamètres possibles crée un espace de recherche de haute dimension. Les praticiens utilisent diverses stratégies pour naviguer dans cet espace afin de trouver la configuration optimale qui minimise la fonction de perte.
- Grid Search : Cette méthode exhaustive évalue le modèle pour chaque combinaison de paramètres spécifiée dans une grille. Bien que minutieuse, elle est coûteuse en calcul et souffre de la malédiction de la dimensionnalité lors de la gestion de nombreuses variables.
- Random Search : Au lieu de tester chaque combinaison, cette technique sélectionne des combinaisons aléatoires d'hyperparamètres. La recherche suggère que cela est souvent plus efficace que la recherche sur grille, car elle explore l'espace de recherche plus efficacement pour les paramètres les plus impactants.
- Optimisation Bayésienne : Cette approche probabiliste construit un modèle de substitution pour prédire quels hyperparamètres donneront les meilleurs résultats en fonction des évaluations passées, en concentrant la recherche sur les zones les plus prometteuses.
- Algorithmes évolutionnaires : Inspirée par l'évolution biologique, cette méthode utilise des mécanismes comme la mutation et le croisement pour faire évoluer une population de configurations au fil des générations. C'est la méthode principale utilisée par la bibliothèque
ultralyticspour optimiser des architectures modernes comme YOLO26.
Link to this sectionRéglage des hyperparamètres vs Entraînement du modèle#
Il est essentiel de distinguer le réglage de l'entraînement, car ils représentent des phases distinctes dans le cycle de vie MLOps :
- Entraînement du modèle : Le processus où l'algorithme itère sur des données d'entraînement pour apprendre les paramètres internes via la rétropropagation. L'objectif est de minimiser l'erreur sur l'ensemble d'entraînement.
- Réglage des hyperparamètres : Le méta-processus de sélection des paramètres opérationnels — tels que le taux d'apprentissage, la taille du batch et le momentum — avant que l'entraînement ne commence. L'objectif est de maximiser les performances sur les données de validation pour éviter le surapprentissage.
Link to this sectionApplications concrètes#
Des modèles efficacement réglés sont essentiels pour déployer des solutions robustes dans des environnements complexes.
Link to this sectionAgriculture de précision#
Dans l'IA en agriculture, les drones autonomes utilisent la vision par ordinateur pour identifier les mauvaises herbes et les maladies des cultures. Ces modèles tournent souvent sur des périphériques de périphérie avec une autonomie limitée. Les ingénieurs utilisent le réglage des hyperparamètres pour optimiser le pipeline d'augmentation de données et la résolution d'entrée, garantissant que le modèle équilibre des vitesses d'inférence élevées avec la précision nécessaire pour ne pulvériser que les mauvaises herbes, réduisant ainsi l'utilisation de produits chimiques.
Link to this sectionDiagnostics médicaux#
Pour l'IA en santé, spécifiquement dans l'analyse d'images médicales, un faux négatif peut avoir des conséquences graves. Lors de l'entraînement de modèles pour détecter des anomalies dans les scanners IRM, les praticiens règlent agressivement les hyperparamètres liés à la pondération des classes et à la focal loss. Ce réglage maximise le rappel, garantissant que même les signes subtils de pathologie soient signalés pour une révision humaine, aidant ainsi de manière significative au diagnostic précoce.
Link to this sectionRéglage automatisé avec Ultralytics#
La bibliothèque ultralytics simplifie l'optimisation en incluant un tuner intégré qui utilise des algorithmes génétiques. Cela permet aux utilisateurs de rechercher automatiquement les meilleurs hyperparamètres pour leurs datasets personnalisés sans essai-erreur manuel. Pour les opérations à grande échelle, les équipes peuvent tirer parti de la Plateforme Ultralytics pour gérer les datasets et visualiser ces expériences de réglage dans le cloud.
L'exemple suivant démontre comment initier le réglage des hyperparamètres pour un modèle YOLO26. Le tuner fera muter les hyperparamètres sur plusieurs itérations pour maximiser la Précision Moyenne (mAP).
from ultralytics import YOLO
# Initialize a YOLO26 model (using the 'nano' weight for speed)
model = YOLO("yolo26n.pt")
# Start tuning hyperparameters on the COCO8 dataset
# The tuner runs for 30 epochs per iteration, evolving parameters like lr0 and momentum
model.tune(data="coco8.yaml", epochs=30, iterations=100, optimizer="AdamW", plots=False)En automatisant ce processus, les développeurs peuvent se rapprocher du concept d'Apprentissage Automatique Automatisé (AutoML), où le système s'auto-optimise pour atteindre les meilleures performances possibles pour une tâche spécifique.






