Connectez-vous à YOLO Vision 2025 !
25 septembre 2025
10:00 — 18:00, heure d'été britannique
Événement hybride
Yolo Vision 2024

Entraînement personnalisé d'Ultralytics YOLO11 avec des ensembles de données de vision par ordinateur

Abirami Vina

4 min de lecture

7 janvier 2025

Découvrez comment l'intégration de Roboflow peut simplifier la formation personnalisée d'Ultralytics YOLO11 en rendant les ensembles de données de vision par ordinateur open source facilement accessibles.

L'entraînement d'un modèle de vision par ordinateur tel que Ultralytics YOLO11 implique généralement la collecte d'images pour votre jeu de données, leur annotation, la préparation des données et le réglage fin du modèle pour répondre à vos exigences spécifiques. Bien que le package Python Ultralytics rende ces étapes simples et conviviales, le développement de la Vision AI peut toujours prendre du temps.

Cela devient particulièrement vrai lorsque vous travaillez avec des délais serrés ou que vous développez un prototype. Dans ces situations, le fait de disposer d'outils ou d'intégrations qui simplifient certaines parties du processus, comme la rationalisation de la préparation des ensembles de données ou l'automatisation des tâches répétitives, peut faire une grande différence. En réduisant le temps et les efforts nécessaires, ces solutions vous aident à vous concentrer sur la construction et l'affinage de votre modèle. C'est exactement ce que propose l'intégration Roboflow.

L'intégration de Roboflow vous permet d'accéder facilement aux ensembles de données de Roboflow Universe, une vaste bibliothèque d'ensembles de données de vision par ordinateur open source. Au lieu de passer des heures à collecter et à organiser des données, vous pouvez rapidement trouver et utiliser des ensembles de données existants pour démarrer votre processus d'entraînement YOLO11. Cette intégration rend beaucoup plus rapide et plus simple l'expérimentation et l'itération sur le développement de votre modèle de vision par ordinateur.

Dans cet article, nous allons explorer comment vous pouvez tirer parti de l'intégration de Roboflow pour un développement de modèle plus rapide. Commençons !

Qu'est-ce que Roboflow Universe ?

Roboflow Universe est une plateforme maintenue par Roboflow, une entreprise axée sur la simplification du développement de la vision par ordinateur. Elle comprend plus de 350 millions d'images, 500 000 ensembles de données et 100 000 modèles affinés pour des tâches telles que la détection d'objets, la classification d'images et la segmentation. Avec les contributions de développeurs et de chercheurs du monde entier, Roboflow Universe est une plaque tournante collaborative pour tous ceux qui cherchent à démarrer ou à améliorer leurs projets de vision par ordinateur.

Fig. 1. Exemples de datasets de détection d'objets sur Roboflow Universe.

Roboflow Universe comprend les principales fonctionnalités suivantes :

  • Outils d'exploration des ensembles de données : Explorez, filtrez et visualisez les ensembles de données pour trouver rapidement les ressources qui correspondent aux exigences de votre projet.
  • Options d'exportation : Exportez les données dans des formats tels que COCO, YOLO, TFRecord, CSV, et plus encore pour adapter à votre flux de travail.
  • Analyse des ensembles de données : Obtenez des informations sur divers ensembles de données grâce à des outils d'analyse qui fournissent des visualisations des distributions d'étiquettes, des déséquilibres de classes et de la qualité des ensembles de données. 
  • Suivi des versions : Affichez et accédez aux différentes versions des ensembles de données téléchargés par les contributeurs, ce qui vous permet de suivre les mises à jour, de comparer les modifications et de choisir la version qui convient le mieux aux besoins de votre projet. 

L'intégration de Roboflow vous aide à trouver les bonnes données

Trouver le bon jeu de données est souvent l'une des parties les plus difficiles de la construction d'un modèle de vision par ordinateur. La création d'un jeu de données implique généralement la collecte de grandes quantités d'images, en s'assurant qu'elles sont pertinentes pour votre tâche, puis en les étiquetant avec précision. 

Ce processus peut prendre beaucoup de temps et de ressources, surtout si vous expérimentez différentes approches sur une courte période. Même trouver des ensembles de données préexistants peut être délicat, car ils sont souvent dispersés sur différentes plateformes, mal documentés ou ne comportent pas les annotations spécifiques dont vous avez besoin.

Par exemple, si vous développez une application de vision par ordinateur pour détecter les mauvaises herbes dans les champs agricoles, vous pourriez vouloir tester différentes approches de Vision IA, comme la détection d'objets par rapport à la segmentation d'instance. Cela vous permet d'expérimenter et de déterminer quelle méthode fonctionne le mieux avant de consacrer du temps et des efforts à la collecte et à l'étiquetage de votre propre ensemble de données.

Fig 2. Détection de pièces automobiles à l'aide de YOLO11.

En utilisant l'intégration Roboflow, vous pouvez parcourir une variété d'ensembles de données liés à l'agriculture, y compris ceux axés sur la détection des mauvaises herbes, la santé des cultures ou la surveillance des champs. Ces ensembles de données prêts à l'emploi vous permettent d'essayer différentes techniques et d'affiner votre modèle sans l'effort initial de création de vos propres données. 

Comment fonctionne l'intégration Roboflow

Maintenant que nous avons vu comment vous pouvez utiliser l'intégration de Roboflow pour trouver les bons ensembles de données, voyons comment elle s'intègre à votre flux de travail. Une fois que vous avez choisi un ensemble de données dans Roboflow Universe, vous pouvez l'exporter ou le télécharger au format YOLO11. Une fois votre ensemble de données exporté, vous pouvez l'utiliser pour entraîner YOLO11 de manière personnalisée à l'aide du package Python Ultralytics. 

Pendant que vous téléchargez votre ensemble de données, vous remarquerez peut-être que Roboflow Universe prend également en charge d'autres formats pour l'entraînement de différents modèles. Alors, pourquoi devriez-vous entraîner Ultralytics YOLOv8 personnalisé ? 

YOLO11 est la dernière version des modèles Ultralytics YOLO et est conçu pour offrir une détection d'objets plus rapide et plus précise. Il utilise 22 % de paramètres en moins (les valeurs internes qu'un modèle ajuste pendant l'entraînement pour faire des prédictions) que YOLOv8m, tout en atteignant une précision moyenne (mAP) plus élevée sur l'ensemble de données COCO. Cet équilibre entre vitesse et précision fait de YOLO11 un choix polyvalent pour un large éventail d'applications de vision par ordinateur, en particulier lors de la formation de modèles personnalisés pour répondre à des tâches spécifiques.

Voici un aperçu plus détaillé du fonctionnement de l'entraînement personnalisé de YOLO11 :

  • Alimentation des données : Le modèle YOLO11 traite votre ensemble de données, apprenant à détecter et à classer les objets à partir des images et de leurs annotations.
  • Prédiction et rétroaction : Le modèle fait des prédictions sur les objets dans les images et les compare aux réponses correctes fournies dans l’ensemble de données.
  • Suivi des performances : Des métriques telles que la précision (détections correctes), le rappel (détections manquées) et la perte (erreurs de prédiction) sont surveillées pour évaluer les progrès.
  • Apprentissage itératif : Le modèle ajuste ses paramètres sur plusieurs cycles (époques) afin d'améliorer la précision de la détection et de minimiser les erreurs.
  • Sortie finale du modèle : Après l'entraînement, le modèle optimisé est enregistré et prêt à être déployé.

Autres intégrations axées sur le développement de la vision par ordinateur

En explorant l'intégration de Roboflow, vous remarquerez d'autres intégrations mentionnées dans la documentation d'Ultralytics. Nous prenons en charge une variété d'intégrations liées aux différentes étapes du développement de la vision par ordinateur. 

Ceci a pour but de fournir à notre communauté un éventail d'options, afin que vous puissiez choisir ce qui convient le mieux à votre flux de travail spécifique.

Fig 3. Un aperçu des intégrations prises en charge par Ultralytics.

En plus des ensembles de données, d'autres intégrations prises en charge par Ultralytics se concentrent sur diverses parties du processus de vision par ordinateur, telles que l'entraînement, le déploiement et l'optimisation. Voici quelques exemples d'autres intégrations que nous prenons en charge :

  • Intégrations d'entraînement : Les intégrations telles qu'Amazon SageMaker et Paperspace Gradient rationalisent les flux de travail d'entraînement en offrant des plateformes basées sur le cloud pour le développement et les tests efficaces de modèles.
  • Intégrations de suivi des flux de travail et des expériences : ClearML, MLFlow et Weights & Biases (W&B) aident à automatiser les flux de travail, à suivre les expériences et à améliorer la collaboration, ce qui facilite la gestion des projets d'apprentissage automatique.
  • Intégrations d'optimisation et de déploiement : CoreML, ONNX et OpenVINO permettent un déploiement optimisé sur divers appareils et frameworks, garantissant des performances efficaces sur des plateformes telles que le matériel Apple et les CPU Intel.
  • Intégrations de surveillance et de visualisation : TensorBoard et Weights & Biases fournissent des outils pour visualiser la progression de la formation et surveiller les performances, offrant des informations détaillées pour affiner les modèles.

Applications de YOLO11 et rôle des intégrations

Les intégrations qui prennent en charge le développement de la vision par ordinateur, combinées aux capacités fiables de YOLO11, facilitent la résolution des défis du monde réel. Prenons l'exemple des innovations telles que la vision par ordinateur dans la fabrication, où la vision IA est utilisée pour détecter les défauts sur une chaîne de production, comme les rayures sur les pièces métalliques ou les composants manquants. La collecte des données appropriées pour de telles tâches peut souvent être lente et difficile, nécessitant l'accès à des environnements spécialisés. 

Il s'agit généralement de mettre en place des caméras ou des capteurs le long des chaînes de production pour capturer des images des produits. Ces images doivent être prises en grand volume, souvent sous un éclairage et des angles constants, afin de garantir la clarté et l'uniformité. 

Une fois capturées, les images doivent être méticuleusement annotées avec des étiquettes précises pour chaque type de défaut, tels que les rayures, les bosses ou les composants manquants. Ce processus nécessite beaucoup de temps et de ressources, ainsi qu'une expertise, pour s'assurer que l'ensemble de données reflète fidèlement la variabilité du monde réel. Des facteurs tels que les différentes tailles, formes et matériaux des défauts doivent être pris en compte pour créer un ensemble de données robuste et fiable.

Les intégrations qui fournissent des ensembles de données prêts à l'emploi facilitent les tâches telles que le contrôle qualité industriel, et grâce aux capacités de détection en temps réel de YOLO11, les fabricants peuvent surveiller les chaînes de production, détecter instantanément les défauts et améliorer l'efficacité.

Fig. 4. Un exemple d'utilisation d'Ultralytics YOLO11 pour détecter et compter les canettes en cours de fabrication.

Au-delà de la fabrication, les intégrations liées aux ensembles de données peuvent être utilisées dans de nombreux autres secteurs. En combinant la vitesse et la précision de YOLO11 avec des ensembles de données facilement accessibles, les entreprises peuvent rapidement développer et déployer des solutions adaptées à leurs besoins spécifiques. Prenons, par exemple, le secteur de la santé : les intégrations d'ensembles de données peuvent aider à développer des solutions pour analyser les images médicales afin de détecter des anomalies telles que des tumeurs. De même, dans le domaine de la conduite autonome, ces intégrations peuvent aider à identifier les véhicules, les piétons et les panneaux de signalisation afin d'améliorer la sécurité.

Principaux points à retenir

Trouver le bon jeu de données est souvent l'une des parties les plus chronophages de la construction d'un modèle de vision par ordinateur. Cependant, l'intégration de Roboflow facilite la recherche du meilleur jeu de données pour l'entraînement personnalisé de vos modèles Ultralytics YOLO, même si vous êtes novice en vision par ordinateur. 

Avec l'accès à une vaste collection d'ensembles de données pour les tâches de vision par ordinateur telles que la détection d'objets, la classification d'images ou la segmentation d'instances, Roboflow Universe simplifie le processus de découverte des données. Il vous aide à démarrer rapidement et à vous concentrer sur la construction de votre modèle plutôt que de passer du temps à collecter et à organiser les données. Cette approche rationalisée permet aux développeurs de prototyper, d'itérer et de développer des solutions de vision par ordinateur plus efficacement.

Pour en savoir plus, consultez notre dépôt GitHub et échangez avec notre communauté. Explorez les innovations dans des domaines tels que l'IA dans les voitures autonomes et la vision par ordinateur dans l'agriculture sur nos pages de solutions. 🚀

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement
Lien copié dans le presse-papiers