Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Entraînez plus rapidement YOLO grâce à Ultralytics

Découvrez comment entraîner plus rapidement YOLO grâce à Ultralytics , un environnement de bout en bout conçu pour accélérer le processus, de la collecte des données au déploiement.

Développez vos projets de vision par ordinateur avec Ultralytics

Démarrer

La semaine dernière, Ultralytics la Ultralytics , un espace de travail unifié conçu pour simplifier la manière dont les équipes développent, entraînent et déploient des modèles de vision par ordinateur. Plutôt que de jongler entre plusieurs outils, la plateforme regroupe toutes ces fonctionnalités en un seul endroit. Passer de l'idée au déploiement avec des modèles d'IA de vision par ordinateur devient ainsi un jeu d'enfant. 

C'est essentiel, car la vision par ordinateur est en train de devenir rapidement un élément central de nombreux secteurs. Elle est à la base d'applications telles que le contrôle qualité en fabrication, l'analyse des données dans le commerce de détail et la navigation autonome.

La fiabilité de ces applications basées sur la vision dépend de la qualité de l'entraînement des modèles. L'entraînement d'un modèle consiste à lui faire apprendre à partir de données étiquetées afin qu'il puisse reconnaître des schémas et établir des prévisions précises. En général, des modèles bien entraînés offrent de meilleures performances et des résultats plus fiables dans les applications concrètes.

Cependant, l'entraînement d'un modèle de vision par ordinateur n'est pas toujours simple. Il comporte plusieurs étapes, telles que la configuration des environnements, le choix des ressources informatiques adaptées, le réglage des hyperparamètres et le suivi de multiples expériences d'entraînement. Lorsque ces étapes sont réparties entre différents outils et systèmes, le processus d'entraînement devient rapidement complexe et difficile à gérer.

Ultralytics résout ce problème en regroupant l'ensemble du processus de formation au sein d'un tableau de bord unique et unifié. Vous pouvez configurer, exécuter et surveiller les tâches de formation depuis un seul et même endroit, que vous travailliez dans le cloud, en local ou sur Google . 

Fig. 1. Aperçu de l'entraînement des modèles au sein de Ultralytics (Source)

Dans cet article, nous allons voir comment Ultralytics optimise l'entraînement des modèles et pourquoi elle peut vous donner un avantage dans vos projets d'IA visuelle. C'est parti !

Les modèles de vision par ordinateur apprennent à partir des données grâce à l'entraînement des modèles

Avant d'aborder le fonctionnement de l'entraînement des modèles sur Ultralytics , prenons d'abord un peu de recul pour voir en quoi consiste l'entraînement des modèles et ce qu'il implique.

L'entraînement d'un modèle est le processus par lequel un modèle de vision par ordinateur apprend à interpréter des données visuelles. Il analyse des images ou des vidéos et ajuste progressivement ses paramètres internes afin d'effectuer avec précision des tâches de vision telles que la détection d'objets, la classification d'images et la segmentation d'instances. Au fil du temps, le modèle s'améliore en apprenant des schémas directement à partir des données qu'il observe.

La qualité de l'apprentissage dépend fortement des ensembles de données. On peut comparer un ensemble de données à un jeu de fiches qu'un enseignant utiliserait pour former un élève, chaque exemple aidant le modèle à comprendre ce qu'il doit rechercher.

Un ensemble de données typique pour la vision par ordinateur comprend des images, généralement au format JPG ou PNG, ainsi que des annotations décrivant ce qui figure sur chaque image. Ces annotations, souvent stockées sous forme de fichiers JSON ou TXT, fournissent les étiquettes et le contexte dont le modèle a besoin pour apprendre efficacement.

Mais l'apprentissage ne se résume pas à simplement introduire des données dans un modèle. Il comporte plusieurs étapes clés, allant de la préparation de l'ensemble de données au choix du modèle approprié, en passant par la configuration du processus d'apprentissage. Voyons maintenant de plus près quelques-unes de ces étapes.

Un aperçu de la manière dont les ensembles de données sont préparés

On pourrait croire qu'une fois que l'on dispose d'un ensemble de données, on peut immédiatement commencer à entraîner un modèle, mais il y a quelques étapes à suivre au préalable, comme le fractionnement de l'ensemble de données.

En général, un ensemble de données est divisé en trois parties : l'ensemble d'apprentissage, l'ensemble de validation et l'ensemble de test. Les images d'apprentissage servent à enseigner au modèle les schémas présents dans les données, tandis que l'ensemble de validation permet de contrôler et d'affiner les performances pendant l'apprentissage. 

L'ensemble de test est utilisé à la fin pour évaluer les performances du modèle sur des données totalement nouvelles et non vues auparavant. Cette approche permet de s'assurer que le modèle ne se contente pas de mémoriser les données, mais qu'il est capable de généraliser à des situations réelles.

Choisir le bon modèle pour la formation

Une autre étape importante avant le formation consiste à choisir le modèle que vous souhaitez utiliser. Dans de nombreux cas, cela implique de sélectionner un modèle pré-entraîné. Les modèles tels queYOLO Ultralytics YOLO ont déjà été entraînés sur de vastes ensembles de données et ont appris à reconnaître des schémas visuels généraux, ce qui en fait un excellent point de départ.

L'utilisation de ces modèles est un exemple d'apprentissage par transfert, qui consiste à s'appuyer sur des connaissances existantes et à adapter le modèle à une tâche spécifique. Cette approche permet d'accélérer l'apprentissage et d'améliorer les résultats, en particulier lorsque l'on dispose de données limitées.

Ces modèles sont également disponibles en différentes tailles, chacune offrant un compromis entre vitesse et précision. Les modèles plus petits sont plus rapides et plus efficaces, tandis que les modèles plus grands offrent généralement une meilleure précision, mais nécessitent davantage de puissance de calcul.

Configuration des paramètres d'apprentissage pour les modèles de vision

Une fois que vous disposez d'un ensemble de données préparé et que vous avez sélectionné un modèle, l'étape suivante consiste à configurer le processus d'apprentissage du modèle.

Un modèle de vision par ordinateur est entraîné à l'aide d'un ensemble de paramètres qui déterminent la manière dont il traite les données, met à jour ses poids et s'améliore au fil du temps. Ces paramètres ont une incidence directe tant sur la vitesse d'entraînement que sur la précision finale, ce qui les rend essentiels pour obtenir d'excellents résultats.

Voici quelques-uns des paramètres d'entraînement les plus couramment utilisés :

  • Époques: ce paramètre indique le nombre de fois où le modèle parcourt l'intégralité de l'ensemble de données pendant l'entraînement. Augmenter le nombre d'époques donne au modèle davantage d'occasions d'apprendre des modèles à partir des données.
  • Taille du lot: il s'agit du nombre d'images traitées simultanément lors d'une seule étape d'apprentissage. Des lots plus volumineux peuvent accélérer l'apprentissage, mais nécessitent davantage de mémoire.
  • Taille de l'image: elle définit la résolution des images d'entrée utilisées pendant l'apprentissage. Des résolutions plus élevées peuvent améliorer la précision de la détection, mais augmentent la charge de calcul.
  • Taux d'apprentissage: il s'agit de la vitesse à laquelle le modèle met à jour ses paramètres internes pendant l'entraînement. Des valeurs trop élevées ou trop faibles peuvent rendre l'entraînement instable.
  • Optimiseur: il s'agit de l'algorithme chargé de mettre à jour les paramètres du modèle en fonction de l'erreur calculée à chaque itération d'apprentissage.

Dans les workflows Ultralytics YOLO, ces configurations sont généralement définies dans un fichier YAML. Ce fichier spécifie les chemins d'accès aux ensembles de données, les noms des classes et la manière dont les données sont segmentées. Il sert de configuration centrale qui indique au modèle comment interpréter l'ensemble de données.

Des processus de travail fragmentés à une expérience unifiée grâce à Ultralytics

Nous venons d'évoquer certaines des étapes clés de l'entraînement d'un modèle de vision par ordinateur, depuis la préparation des ensembles de données jusqu'au choix du modèle et à la configuration des paramètres d'entraînement. Dans la pratique, le processus va souvent plus loin et comprend notamment la réalisation d'expériences de suivi, la comparaison de plusieurs cycles d'entraînement et l'amélioration continue des modèles au fil du temps.

Ces étapes sont rarement gérées au même endroit. Les ensembles de données peuvent être préparés dans un outil, les sessions d'apprentissage exécutées dans un autre environnement, et le suivi des expériences géré séparément. À mesure que les projets prennent de l'ampleur, cette fragmentation accroît la complexité, ralentit les itérations et rend plus difficile la gestion de l'organisation globale.

Ultralytics élimine cette complexité en regroupant l'ensemble du processus de formation au sein d'un seul environnement. Au lieu de passer d'un outil à l'autre, vous pouvez gérer les ensembles de données, configurer la formation, mener des expériences et suivre les résultats, le tout depuis un seul et même endroit.

Voyons maintenant comment Ultralytics optimise l'entraînement des modèles. 

Options de formation prises en charge par Ultralytics

Dans les applications concrètes, l'entraînement d'un modèle de vision par ordinateur nécessite souvent des environnements flexibles. En fonction de la taille de votre ensemble de données, de la complexité du modèle et du matériel disponible, vous pouvez choisir d'effectuer l'entraînement dans le cloud, sur une machine locale ou via des environnements de notebook externes.

Ultralytics propose les options de formation suivantes pour répondre à ces besoins :

  • Formation sur le cloud: la formation s'effectue sur des processeurs graphiques (GPU) Ultralytics. Cette option est idéale pour les ensembles de données volumineux ou les modèles plus complexes qui nécessitent d'importantes ressources de calcul.
  • Formation locale: cette option utilise le matériel disponible sur votre machine et est idéale pour réaliser des expériences rapides, tester des configurations ou travailler avec des ensembles de données de petite taille. Pour les charges de travail nécessitant une plus grande évolutivité, la formation peut également être exécutée dans votre propre environnement cloud, tel qu'AWS ou GCP.
  • Google : grâce à Ultralytics , vous pouvez exécuter des modèles d'apprentissage dans l'environnement de notebooks hébergé Google , ce qui vous permet de bénéficier d'un flux de travail flexible et accessible via un navigateur, sans avoir à configurer un ordinateur local.

Découvrir les formations sur le cloud sur Ultralytics

Dans le cadre de projets de vision par ordinateur, il n'est pas toujours facile de former des modèles en local ou via des environnements de notebook.

Par exemple, dans le cas d'un apprentissage sur site, les performances dépendent entièrement de votre matériel, ce qui peut limiter la puissance de calcul et ralentir les expérimentations. Les GPU sont indispensables pour un apprentissage efficace, mais toutes les configurations ne disposent pas d'un accès fiable à ces derniers. 

Si les environnements de notebook tels que Google offrent une alternative en mettant à disposition des GPU dans le cloud, les sessions sont souvent temporaires et peuvent interrompre les sessions d'entraînement de longue durée. À mesure que les ensembles de données s'étoffent et que les flux de travail se complexifient, ces limitations peuvent rapidement se transformer en goulots d'étranglement, ralentissant ainsi l'entraînement et le rendant moins fiable.

Ultralytics répond à ce besoin grâce à son option de formation dans le cloud. Elle offre un environnement prêt à l'emploi dans lequel Python et les frameworks tels que PyTorch préconfigurés, ce qui vous permet de commencer la formation sans configuration supplémentaire.

Depuis un tableau de bord unique, vous pouvez lancer des tâches d'entraînement et suivre leur progression en temps réel. Cela vous permet de vous concentrer davantage sur l'amélioration de vos modèles plutôt que sur la gestion de l'infrastructure.

Voyons maintenant comment se lancer dans la formation au cloud sur Ultralytics .

Étape 1 : Choisissez un modèle de base

La première étape consiste à choisir un modèle de base pour votre session d'entraînement. Vous pouvez sélectionner un YOLO Ultralytics YOLO pré-entraîné, cloner un modèle de la communauté ou importer vos propres paramètres pré-entraînés afin de répondre à des besoins spécifiques.

La plateforme prend en charge tousYOLO Ultralytics YOLO , y compris Ultralytics , Ultralytics YOLO11, Ultralytics YOLOv8et Ultralytics YOLOv5, chacun disponible en différentes tailles telles que nano (n), petite (s), moyenne (m), grande (l) et très grande (x). Les différentes variantes de modèles offrant un compromis entre vitesse et précision, vous pouvez choisir celui qui correspond à vos exigences en matière de performances et de puissance de calcul.

Ces modèles prennent en charge toute une série de tâches de vision par ordinateur queYOLO Ultralytics YOLO connaissent déjà bien, notamment la détection d'objets, la segmentation d'instances, la classification d'images, la détection de cadres de sélection orientés (OBB) et l'estimation de la pose.

Si vous avez des besoins spécifiques, vous pouvez également importer vos propres paramètres de modèle pré-entraînés. Cela vous permet de poursuivre l'entraînement ou d'affiner un modèle existant, tel qu'un détecteur d'objets, directement sur la plateforme, plutôt que de repartir de zéro. Cette fonctionnalité est particulièrement utile si vous avez déjà entraîné un modèle ailleurs ou si vous souhaitez adapter un modèle à un cas d'utilisation plus spécifique.

Étape 2 : Sélectionnez un ensemble de données

L'étape suivante consiste à sélectionner un ensemble de données pour l'entraînement. Sur la Ultralytics , vous pouvez utiliser des ensembles de données préexistants, tels que COCO , cloner des ensembles de données provenant de la communauté ou télécharger votre propre ensemble de données personnalisé, adapté à votre application spécifique.

La plateforme prend en charge les formats d'annotation courants tels que Ultralytics YOLO COCO, et permet également de télécharger des images brutes si vous prévoyez d'annoter des données personnalisées directement sur la plateforme.

Une fois téléchargés, les ensembles de données sont automatiquement traités : validation, normalisation, analyse des étiquettes et génération de statistiques. Cela vous offre une visibilité immédiate sur vos données, notamment sur la répartition des classes et la structure de l'ensemble de données, et vous permet de vous assurer que tout est prêt pour l'entraînement.

Les ensembles de données sont également automatiquement associés aux cycles d'entraînement, ce qui vous permet de track données ont été utilisées pour chaque modèle et d'assurer la cohérence entre les différentes expériences.

Étape 3 : Configurer les paramètres d'entraînement

Une fois l'ensemble de données sélectionné, vous pouvez configurer les paramètres d'entraînement qui déterminent la manière dont le modèle apprend. Il s'agit notamment du nombre d'époques, de la taille des lots, de la taille des images et du nom de la session pour le journal d'entraînement. Bon nombre de ces paramètres ont une incidence à la fois sur la durée de l'entraînement et sur les performances finales du modèle.

Pour un apprentissage plus contrôlé, la plateforme vous permet également de régler des paramètres avancés tels que le taux d'apprentissage, le type d'optimiseur, les paramètres d'augmentation des couleurs et d'autres options d'apprentissage. Ces paramètres permettent d'affiner le processus d'apprentissage afin d'améliorer la précision et la stabilité du modèle.

Étape 4 : Sélectionnez un GPU

Vous pouvez ensuite sélectionner la GPU pour votre session d'entraînement. Le choix du GPU approprié GPU de facteurs tels que la taille de l'ensemble de données, la taille des lots, la résolution des images et la complexité du modèle. Trouver le bon équilibre permet de garantir l'efficacité de l'entraînement sans utiliser plus de ressources de calcul que nécessaire.

Ultralytics propose 22 GPU avec différents niveaux de VRAM (mémoire GPU) et de puissance de calcul, permettant de prendre en charge aussi bien les petites tâches que les charges de travail à grande échelle.

Cela vous permet d'adapter le matériel à vos besoins spécifiques, que vous entraîniez des modèles légers ou que vous travailliez avec des ensembles de données volumineux et complexes. Pour en savoir plus, consultez la liste des GPU disponibles sur la pagede la documentation relative à l'entraînement de la plateforme Ultralytics .

Fig. 2. Quelques-unes des GPU activées via Ultralytics (Source)

Étape 5 : Commencer la formation sur le cloud

Une fois que vous avez sélectionné le modèle, l'ensemble de données, les paramètres d'entraînement et l'option de calcul, le lancement d'une session d'entraînement est très rapide. Depuis le tableau de bord, vous pouvez lancer l'entraînement d'un simple clic ; la plateforme se charge ensuite de tout le reste en initialisant l'environnement et en exécutant la tâche sur le GPU sélectionné.

Dès le début de l'entraînement, vous pouvez suivre les progrès directement depuis la plateforme. L'onglet « Entraînement » offre une visibilité en temps réel sur les indicateurs clés, notamment les mesures de performance, les courbes de perte, l'utilisation du système et les journaux d'entraînement en direct.

Pour en savoir plus sur la formation en ligne ou sur l'utilisation de Google avec Ultralytics , vous pouvez consulter d'autres tutoriels dans ladocumentation officiellede la plateforme Ultralytics .

Évaluation et comparaison de modèles sur Ultralytics

Une fois l'entraînement terminé, l'étape suivante consiste à évaluer les performances de votre modèle. Sur Ultralytics , vous pouvez comparer plusieurs cycles d'entraînement au sein d'un même projet, ce qui vous permet d'avoir une vision claire des performances des différentes expériences.

Lors du développement de modèles, l'entraînement est souvent répété à plusieurs reprises avec des paramètres différents, par exemple en modifiant le taux d'apprentissage, la taille des lots ou la taille du modèle, afin d'améliorer les résultats. Chacune de ces exécutions produit un modèle légèrement différent, c'est pourquoi il est essentiel de les comparer.

Les projets servent de plateforme centrale où les modèles et les expériences sont regroupés. Vous pouvez track , examiner les résultats et rester concentré sans avoir à passer d'un outil ou d'une vue à l'autre.

À partir de cette vue d'ensemble, vous pouvez également analyser des indicateurs de performance clés tels que la précision, le rappel et mAP précision moyenne) afin de comprendre les performances de votre modèle pour différentes classes. Vous pouvez également comparer côte à côte les sessions d'entraînement afin d'identifier les configurations qui donnent les meilleurs résultats. 

Pour compléter ces indicateurs, vous pouvez utiliser l'onglet « Predict » afin de tester rapidement les modèles entraînés sur des images ou des données d'échantillon, ce qui vous permet de valider visuellement leurs performances et de repérer d'éventuels problèmes.

Grâce à ces informations, vous pouvez sélectionner le modèle le plus performant, généralement enregistré sous le nom de point de contrôle « best.pt », et passer à l'étape suivante, qu'il s'agisse d'une évaluation plus approfondie, de l'utilisation du modèle pour effectuer des inférences ou du déploiement du modèle via la plateforme.

Fig. 3. Exemple d'affichage des indicateurs sur Ultralytics (Source)

Estimation des coûts de formation au sein de la Ultralytics

L'entraînement de modèles de détection d'objets dans le cloud engendre des coûts de calcul, en particulier lorsque l'on utilise des GPU haute performance. Pour faciliter cette démarche, Ultralytics fournit une estimation des coûts avant le début de l'entraînement.

Cela vous offre une vision claire de l'utilisation prévue, ce qui vous aide à planifier les charges de travail, à gérer les budgets et à éviter les dépenses imprévues avant de lancer une tâche d'entraînement. Voici comment vous pouvez vérifier les coûts estimés avant de commencer l'entraînement.

Comment est estimée la durée de la formation

Pour estimer le coût avec précision, la plateforme calcule d'abord la durée d'une seule époque d'entraînement. Celle-ci dépend de facteurs tels que la taille de l'ensemble de données, la taille du modèle, la résolution des images, la taille des lots et la vitesse du GPU sélectionné.

À partir de ces données, il détermine la durée estimée par époque et l'extrapole à l'ensemble du cycle d'entraînement. La durée totale est calculée en additionnant le temps de toutes les époques, auquel s'ajoute un léger temps de démarrage.

Ces frais généraux couvrent des tâches telles que l'initialisation de l'environnement, le chargement des ensembles de données et la préparation du GPU, garantissant ainsi que l'estimation reflète l'ensemble du processus d'entraînement, et pas seulement la boucle d'entraînement.

Comment le coût de la formation est-il calculé ?

Une fois la durée totale de l'entraînement estimée, la plateforme la convertit en coût en utilisant le tarif horaire GPU sélectionné.

En combinant la durée de l'entraînement et GPU , on peut obtenir une estimation précise du coût de l'exécution avant même qu'elle ne commence.

Disposer d'une visibilité dès le départ facilite l'ajustement de votre configuration, par exemple en optimisant les paramètres d'entraînement ou en choisissant un autre GPU, ce qui vous permet de trouver un meilleur équilibre entre performances et coûts.

Fig. 4. Configuration de l'entraînement du modèle et estimation des coûts dans Ultralytics (Source)

Principaux avantages de l'utilisation de la Ultralytics pour l'entraînement des modèles

Jusqu'à présent, nous avons passé en revue les principales étapes de l'entraînement des modèles de vision par ordinateur et la manière dont elles s'articulent au sein de la Ultralytics . 

Au-delà de ces fonctionnalités de base, d'autres fonctionnalités viennent optimiser le processus de formation. Voici un aperçu de certains des principaux avantages liés à l'utilisation Ultralytics pour la formation des modèles :

  • Reproductibilité intégrée des expériences: chaque session d'entraînement est automatiquement enregistrée avec sa configuration complète, y compris le modèle, l'ensemble de données, les paramètres et la configuration de calcul. Cela permet de revenir facilement sur les expériences et de reproduire les résultats de manière fiable.
  • Aperçu de l'entraînement au fil du temps: au lieu de vous contenter d'examiner les résultats finaux, vous pouvez track des performances au fil des époques, ce qui vous aide à mieux comprendre le comportement du modèle pendant l'entraînement.
  • Réduction des frais généraux opérationnels: en gérant en arrière-plan la configuration de l'environnement, la gestion des dépendances et l'infrastructure, la plateforme vous permet de vous concentrer davantage sur le développement de modèles et moins sur la configuration.
  • Organisation centralisée des expériences: les projets constituent un point central pour la gestion des modèles, des ensembles de données et des sessions d'entraînement, ce qui permet de maintenir une structure claire des expériences à mesure que les flux de travail gagnent en complexité.

Principaux points à retenir

L'entraînement est l'une des étapes les plus importantes du cycle de vie d'un modèle d'apprentissage automatique. Il détermine la précision avec laquelle un modèle est capable de reconnaître et d'interpréter les données visuelles. 

En regroupant la configuration des données d'entraînement, la surveillance, la comparaison des expériences et l'estimation des coûts au sein d'un même environnement, la Ultralytics simplifie le processus de création de modèles de vision par ordinateur hautement performants et de préparation de ceux-ci en vue de leur déploiement.

Découvrez notre communauté en pleine expansion et notre dépôt GitHub pour en savoir plus sur la vision par ordinateur. Si vous souhaitez développer des solutions de vision, consultez nos options de licence. Parcourez nos pages consacrées aux solutions pour en savoir plus sur les avantages de la vision par ordinateur dans le secteur manufacturier et de l'IA dans l'agriculture.

Construisons ensemble l'avenir de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique