Apprenez à identifier, prévenir et traiter le sous-apprentissage dans les modèles de machine learning grâce à des conseils d'experts, des stratégies et des exemples concrets.
Le sous-ajustement se produit dans l'apprentissage l'apprentissage automatique (ML) lorsqu'un modèle ou un algorithme est trop simple pour capturer la structure sous-jacente des données. Il décrit un scénario dans lequel le modèle ne peut pas apprendre les relations entre les variables d'entrée et les variables cibles de manière adéquate. Comme le modèle ne parvient pas à le signal dans les données, il présente des performances médiocres sur les données d'apprentissage et se généralise mal à de nouvelles données. sur les données d'apprentissage et se généralise mal à de nouvelles données données inédites. Un modèle sous-adapté souffre généralement d'un biais élevé, ce qui signifie qu'il émet de fortes hypothèses, souvent erronées, sur les données. souvent erronées sur les données, ce qui se traduit par des schémas manqués et une faible de la précision.
La détection d'un sous-ajustement est généralement simple au cours de la phase d'évaluation du modèle. L'indicateur principal est un mauvais performance, tels que des taux d'erreur élevés ou une faible précision, à la fois sur l'ensemble d'apprentissage et sur les données de validation. données de validation. Si la fonction de perte fonction de perte reste élevée et ne diminue pas significativement au fil du temps, le modèle est probablement sous-adapté. Contrairement à l'overfitting, où le modèle est performant sur les données d'apprentissage sur les données d'apprentissage mais mal sur les données de validation, le sous-ajustement représente un échec de l'apprentissage de la tâche essentiellement dès le début. départ. L'analyse des courbes d'apprentissage peut L'analyse des courbes d'apprentissage peut confirmer visuellement ce comportement ; un modèle sous-adapté présentera des courbes d'apprentissage et de validation qui convergent rapidement, mais avec un taux d'erreur élevé. convergent rapidement mais avec un taux d'erreur élevé.
Pour comprendre l'underfitting, il est utile de l'opposer à son contraire, l 'overfitting. Ces deux concepts représentent les extrêmes du compromis biais-variance, qui est au cœur de la construction de systèmes d'IA robustes. qui est au cœur de la construction de systèmes d'intelligence artificielle robustes.
L'objectif de l'apprentissage profond et d'autres disciplines de l'IA est de trouver le "point idéal" entre ces deux extrêmes. est de trouver le "sweet spot" entre ces deux extrêmes, en créant un modèle suffisamment complexe pour apprendre les modèles, mais suffisamment simple pour les généraliser.
Plusieurs facteurs peuvent conduire à un sous-ajustement, mais ils peuvent souvent être corrigés en ajustant l'architecture du modèle ou le pipeline de traitement des données. traitement des données.
Dans le contexte de la vision par ordinateur, le sous-ajustement se produit souvent lorsqu'on utilise une variante de modèle trop petite pour la difficulté de la tâche (par exemple, la détection de petits objets dans des images de drones à haute résolution).
la difficulté de la tâche (par exemple, la détection de petits objets dans des images de drone à haute résolution). Le modèle suivant
Python exemple montre comment passer d'un modèle plus petit à un modèle plus grand et plus performant
à l'aide de la fonction ultralytics pour résoudre les problèmes d'ajustement insuffisant.
from ultralytics import YOLO
# If 'yolo11n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo11l.pt' (Large).
model = YOLO("yolo11l.pt")
# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
En passant à une plus grande Ultralytics YOLO11 et en garantissant une durée d'entraînement durée d'entraînement adéquate, le système acquiert les paramètres nécessaires à l'apprentissage de modèles complexes, ce qui permet d'atténuer efficacement la sous-adaptation. d'apprendre des modèles complexes, ce qui permet d'atténuer efficacement l'insuffisance d'adaptation. Pour les tâches extrêmement complexes, les architectures futures telles que YOLO26 (actuellement en cours de développement) visent à fournir une densité et une précision encore plus grandes. actuellement en cours de développement) visent à fournir une densité et une précision encore plus grandes. Pour vérifier que votre modèle n'est plus sous-adapté, il faut toujours toujours l'évaluer par rapport à un ensemble de données de test robuste.