Apprenez à identifier et à résoudre le sous-ajustement dans l'apprentissage automatique. Découvrez les causes, les indicateurs et comment optimiser les modèles Ultralytics pour une meilleure précision.
Le sous-ajustement se produit lorsqu'un modèle d'apprentissage automatique est trop simple ou n'a pas la capacité de saisir les tendances et les modèles sous-jacents dans les données d'entraînement. Conceptuellement, cela revient à essayer d'ajuster une ligne droite à des points de données qui forment une courbe distincte ; le modèle ne parvient pas à saisir la complexité de la relation entre les entrées et les sorties. Comme le modèle n'a pas appris les données de manière efficace, il affiche de de mauvaises performances non seulement sur l'ensemble d'apprentissage, mais aussi sur les données de validation non vues, ce qui conduit à une faible précision prédictive. Ce phénomène est souvent le résultat d'un biais élevé dans l'IA, où l'algorithme fait des hypothèses trop simplistes sur la fonction cible.
Plusieurs facteurs peuvent conduire à un modèle sous-ajusté. La cause la plus courante est l'utilisation d'une architecture de modèle qui n'est pas assez complexe pour la tâche à accomplir, comme l'application d'une régression linéaire à des données non linéaires. Une durée d'entraînement insuffisante, où le modèle ne dispose pas d'un nombre suffisant d' époches pour converger, empêche également un apprentissage adéquat. En outre, une régularisationexcessive, une technique généralement utilisée pour éviter le problème inverse, peut trop contraindre le modèle, l'empêchant ainsi de saisir des caractéristiques importantes .
Les ingénieurs peuvent identifier le sous-ajustement en surveillant les fonctions de perte pendant l'entraînement. Si l'erreur d'entraînement et l'erreur de validation restent élevées et ne diminuent pas de manière significative, le modèle est probablement sous-ajusté. Contrairement à une ingénierie des caractéristiques efficace, qui aide les modèles à comprendre les données, fournir trop peu de caractéristiques peut également priver le modèle des informations nécessaires.
Il est essentiel de distinguer le sous-ajustement de son contraire, le surajustement. Ces deux concepts représentent les extrémités opposées du compromis biais-variance.
Trouver le « juste milieu » entre ces deux extrêmes est l'objectif principal de l' optimisation des modèles.
Il est essentiel de comprendre le sous-ajustement pour développer des systèmes d'IA fiables dans divers secteurs.
Dans vision par ordinateur, le sous-ajustement se produit souvent
lorsqu'on utilise une variante de modèle trop petite pour la difficulté de la tâche (par exemple, la détection de petits objets dans des
images de drones à haute résolution). Les éléments suivants Python Cet exemple montre comment
passer d'un modèle plus petit à un modèle plus grand et plus performant à l'aide du ultralytics bibliothèque pour résoudre
un éventuel sous-ajustement.
from ultralytics import YOLO
# If 'yolo26n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo26l.pt' (Large).
model = YOLO("yolo26l.pt")
# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
En passant à un modèle Ultralytics plus grand et en garantissant une durée de formation adéquate, le système acquiert les paramètres nécessaires pour apprendre des modèles complexes, ce qui permet de réduire efficacement le sous-ajustement. Pour vérifier que votre modèle n'est plus sous-ajusté, évaluez-le toujours par rapport à un ensemble de données de test robuste . Pour gérer les ensembles de données et suivre les expériences afin de détecter rapidement le sous-ajustement, la Ultralytics offre des outils complets de visualisation et d'analyse.