Underfitting
Apprends comment identifier et résoudre le sous-apprentissage (underfitting) en apprentissage automatique. Explore les causes, les indicateurs et comment optimiser les modèles Ultralytics YOLO26 pour une meilleure précision.
Le sous-apprentissage survient lorsqu'un modèle de machine learning est trop simple ou manque de capacité pour capturer les tendances et les motifs sous-jacents dans les données d'entraînement. Conceptuellement, c'est analogue à essayer de faire passer une ligne droite à travers des points de données qui forment une courbe distincte ; le modèle échoue à saisir la complexité de la relation entre les entrées et les sorties. Parce que le modèle n'a pas appris les données efficacement, il affiche de mauvaises performances non seulement sur l'ensemble d'entraînement, mais aussi sur les données de validation inédites, ce qui conduit à une faible précision prédictive. Ce phénomène est souvent le résultat d'un biais en IA élevé, où l'algorithme fait des hypothèses trop simplistes sur la fonction cible.
Link to this sectionCauses et indicateurs#
Plusieurs facteurs peuvent conduire à un modèle en sous-apprentissage. La cause la plus fréquente est l'utilisation d'une architecture de modèle qui n'est pas assez complexe pour la tâche en cours, comme l'application d'une régression linéaire à des données non linéaires. Une durée d'entraînement insuffisante, où le modèle ne reçoit pas assez d'époques pour converger, empêche également un apprentissage adéquat. De plus, une régularisation excessive — une technique habituellement utilisée pour prévenir le problème opposé — peut trop contraindre le modèle, l'empêchant de capturer des caractéristiques importantes.
Les ingénieurs peuvent identifier le sous-apprentissage en surveillant les fonctions de perte pendant l'entraînement. Si l'erreur d'entraînement et l'erreur de validation restent élevées et ne diminuent pas de manière significative, le modèle est probablement en sous-apprentissage. Contrairement à l'ingénierie des caractéristiques (feature engineering) efficace, qui aide les modèles à comprendre les données, fournir trop peu de caractéristiques peut aussi priver le modèle d'informations nécessaires.
Link to this sectionSous-apprentissage vs. Surapprentissage#
Il est crucial de distinguer le sous-apprentissage de son homologue, le surapprentissage. Ces deux concepts représentent les extrémités opposées du compromis biais-variance.
- Sous-apprentissage (Biais élevé) : Le modèle est trop rigide. Il fonctionne mal à la fois sur les données d'entraînement et les données de test car il n'a pas appris le signal de base.
- Surapprentissage (Variance élevée) : Le modèle est trop flexible. Il mémorise les données d'entraînement, y compris le bruit, fonctionnant exceptionnellement bien pendant l'entraînement mais échouant à généraliser à de nouveaux exemples.
Trouver le « juste milieu » entre ces deux extrêmes est l'objectif principal de l'optimisation de modèle.
Link to this sectionApplications concrètes#
Comprendre le sous-apprentissage est vital pour développer des systèmes d'IA fiables dans diverses industries.
- Conduite autonome : Dans le contexte des véhicules autonomes, un modèle de détection d'objets en sous-apprentissage pourrait échouer à distinguer un piéton d'un lampadaire dans des environnements urbains complexes. Parce que le modèle manque de paramètres pour apprendre les différences visuelles subtiles, il compromet la sécurité de l'IA.
- Diagnostics médicaux : Lors de l'application de l'analyse d'imagerie médicale pour détecter des anomalies comme des tumeurs, un modèle trop simple pourrait manquer des excroissances petites ou irrégulières. Si le réseau neuronal est trop peu profond, il ne peut pas apprendre les textures complexes requises pour une sensibilité et une spécificité élevées, conduisant à des diagnostics manqués.
Link to this sectionTraiter le sous-apprentissage avec du code#
En vision par ordinateur, le sous-apprentissage se produit souvent lors de l'utilisation d'une variante de modèle trop petite pour la difficulté de la tâche (par exemple, détecter de petits objets dans une imagerie de drone haute résolution). L'exemple Python suivant démontre comment passer d'un modèle plus petit à un modèle plus grand et plus performant en utilisant la bibliothèque ultralytics pour résoudre un sous-apprentissage potentiel.
from ultralytics import YOLO
# If 'yolo26n.pt' (Nano) is underfitting and yielding low accuracy,
# upgrade to a model with higher capacity like 'yolo26l.pt' (Large).
model = YOLO("yolo26l.pt")
# Train the larger model.
# Increasing epochs also helps the model converge if it was previously underfitting.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)En passant à un modèle Ultralytics YOLO26 plus grand et en garantissant une durée d'entraînement adéquate, le système gagne les paramètres nécessaires pour apprendre des modèles complexes, atténuant efficacement le sous-apprentissage. Pour vérifier que ton modèle n'est plus en sous-apprentissage, évalue-le toujours par rapport à un jeu de données de test robuste. Pour gérer les jeux de données et suivre les expériences afin de détecter le sous-apprentissage rapidement, la plateforme Ultralytics offre des outils complets pour la visualisation et l'analyse.






