Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

Entraînement personnalisé d'Ultralytics YOLO11 avec des ensembles de données de vision par ordinateur

Abirami Vina

4 min de lecture

7 janvier 2025

Découvrez comment l'intégration de Roboflow peut simplifier la formation personnalisée Ultralytics YOLO11 en rendant facilement accessibles des ensembles de données de vision par ordinateur en source ouverte.

Entraînement d'un modèle de vision par ordinateur comme Ultralytics YOLO11 implique généralement de collecter des images pour votre ensemble de données, de les annoter, de préparer les données et d'affiner le modèle pour qu'il réponde à vos besoins spécifiques. Bien que le packageUltralytics Python rende ces étapes simples et conviviales, le développement d'un modèle de vision artificielle peut encore prendre beaucoup de temps.

Cela est particulièrement vrai lorsque vous travaillez dans des délais serrés ou que vous développez un prototype. Dans ces situations, disposer d'outils ou d'intégrations qui simplifient certaines parties du processus - comme la rationalisation de la préparation des ensembles de données ou l'automatisation des tâches répétitives - peut faire une grande différence. En réduisant le temps et les efforts nécessaires, ces solutions vous aident à vous concentrer sur la construction et l'affinement de votre modèle. C'est exactement ce qu'offre l'intégration Roboflow .

L'intégration de Roboflow vous permet d'accéder facilement aux ensembles de données de Roboflow Universe, une grande bibliothèque d'ensembles de données de vision par ordinateur à source ouverte. Au lieu de passer des heures à collecter et à organiser des données, vous pouvez rapidement trouver et utiliser des ensembles de données existants pour démarrer votre processus d'apprentissage YOLO11 . Cette intégration accélère et simplifie l'expérimentation et l'itération dans le développement de votre modèle de vision par ordinateur.

Dans cet article, nous allons voir comment vous pouvez tirer parti de l'intégration de Roboflow pour accélérer le développement des modèles. Commençons par le commencement !

Qu'est-ce que Roboflow Universe ?

Roboflow Universe est une plateforme gérée par Roboflow, une entreprise qui vise à simplifier le développement de la vision par ordinateur. Elle comprend plus de 350 millions d'images, 500 000 ensembles de données et 100 000 modèles affinés pour des tâches telles que la détection d'objets, la classification d'images et la segmentation. Avec les contributions de développeurs et de chercheurs du monde entier, Roboflow Universe est un centre de collaboration pour tous ceux qui cherchent à démarrer ou à améliorer leurs projets de vision par ordinateur.

Fig. 1. Exemples d'ensembles de données de détection d'objets sur Roboflow Universe.

Roboflow Universe comprend les caractéristiques clés suivantes :

  • Outils d'exploration des ensembles de données : Explorez, filtrez et visualisez les ensembles de données pour trouver rapidement les ressources qui correspondent aux exigences de votre projet.
  • Options d'exportation: Exportez les données dans des formats tels que COCO, YOLO, TFRecord, CSV, etc. pour les adapter à votre flux de travail.
  • Analyse des ensembles de données : Obtenez des informations sur divers ensembles de données grâce à des outils d'analyse qui fournissent des visualisations des distributions d'étiquettes, des déséquilibres de classes et de la qualité des ensembles de données. 
  • Suivi des versions: Visualisez et accédez aux différentes versions des jeux de données téléchargés par les contributeurs, ce qui vous permet de track mises à jour, de comparer les changements et de choisir la version qui répond le mieux aux besoins de votre projet. 

L'intégration de Roboflow vous aide à trouver les bonnes données

Trouver le bon jeu de données est souvent l'une des parties les plus difficiles de la construction d'un modèle de vision par ordinateur. La création d'un jeu de données implique généralement la collecte de grandes quantités d'images, en s'assurant qu'elles sont pertinentes pour votre tâche, puis en les étiquetant avec précision. 

Ce processus peut prendre beaucoup de temps et de ressources, surtout si vous expérimentez différentes approches sur une courte période. Même trouver des ensembles de données préexistants peut être délicat, car ils sont souvent dispersés sur différentes plateformes, mal documentés ou ne comportent pas les annotations spécifiques dont vous avez besoin.

Par exemple, si vous créez une application de vision artificielle pour detect mauvaises herbes dans les champs agricoles, vous voudrez peut-être tester différentes approches de vision artificielle, comme la détection d'objets par rapport à la segmentation d'instances. Cela vous permet d'expérimenter et de déterminer quelle méthode fonctionne le mieux avant de consacrer du temps et des efforts à la collecte et à l'étiquetage de votre propre ensemble de données.

Fig. 2. Détection de pièces de voiture à l'aide de YOLO11.

En utilisant l'intégration Roboflow , vous pouvez parcourir une variété d'ensembles de données liées à l'agriculture, y compris celles qui sont axées sur la détection des mauvaises herbes, la santé des cultures ou la surveillance des champs. Ces ensembles de données prêts à l'emploi vous permettent d'essayer différentes techniques et d'affiner votre modèle sans l'effort initial de création de vos propres données. 

Comment fonctionne l'intégration de Roboflow

Maintenant que nous avons vu comment vous pouvez utiliser l'intégration Roboflow pour trouver les bons ensembles de données, voyons comment elle s'intègre dans votre flux de travail. Une fois que vous avez choisi un ensemble de données dans Roboflow Universe, vous pouvez l'exporter ou le télécharger au format YOLO11 . Une fois votre ensemble de données exporté, vous pouvez l'utiliser pour entraîner YOLO11 de manière personnalisée à l'aide du package Ultralytics Python . 

Lors du téléchargement de votre ensemble de données, vous remarquerez peut-être que Roboflow Universe prend en charge d'autres formats pour l'entraînement de différents modèles. Alors, pourquoi choisir d'entraîner Ultralytics YOLO11 sur mesure ? 

YOLO11 est la dernière version des modèlesYOLO d'Ultralytics . Elle est conçue pour permettre une détection plus rapide et plus précise des objets. Il utilise 22 % de paramètres en moins (les valeurs internes qu'un modèle ajuste pendant l'entraînement pour faire des prédictions) que YOLOv8m, tout en atteignant une précision moyenne plus élevéemAP sur l'ensemble de données COCO . Cet équilibre entre vitesse et précision fait de YOLO11 un choix polyvalent pour un large éventail d'applications de vision par ordinateur, en particulier lors de l'entraînement personnalisé des modèles pour répondre à des tâches spécifiques.

Voici un aperçu du fonctionnement de la formation personnalisée YOLO11:

  • Alimentation en données: Le modèle YOLO11 traite votre ensemble de données, en apprenant à detect et à classify objets à partir des images et de leurs annotations.
  • Prédiction et rétroaction : Le modèle fait des prédictions sur les objets dans les images et les compare aux réponses correctes fournies dans l’ensemble de données.
  • Suivi des performances : Des métriques telles que la précision (détections correctes), le rappel (détections manquées) et la perte (erreurs de prédiction) sont surveillées pour évaluer les progrès.
  • Apprentissage itératif : Le modèle ajuste ses paramètres sur plusieurs cycles (époques) afin d'améliorer la précision de la détection et de minimiser les erreurs.
  • Sortie finale du modèle : Après l'entraînement, le modèle optimisé est enregistré et prêt à être déployé.

Autres intégrations axées sur le développement de la vision par ordinateur

En explorant l'intégration Roboflow , vous remarquerez d'autres intégrations mentionnées dans la documentationUltralytics . Nous prenons en charge une variété d'intégrations liées aux différentes étapes du développement de la vision par ordinateur. 

Ceci a pour but de fournir à notre communauté un éventail d'options, afin que vous puissiez choisir ce qui convient le mieux à votre flux de travail spécifique.

Fig. 3. Vue d'ensemble des intégrations prises en charge par Ultralytics.

Outre les ensembles de données, d'autres intégrationsUltralytics se concentrent sur diverses parties du processus de vision par ordinateur, telles que l'entraînement, le déploiement et l'optimisation. Voici quelques exemples d'autres intégrations que nous prenons en charge :

  • Intégrations de formation : Les intégrations telles que Amazon SageMaker et Paperspace Gradient rationalisent les flux de travail de formation en offrant des plateformes basées sur le cloud pour un développement et des tests de modèles efficaces.
  • Intégrations de flux de travail et de suivi des expériences : ClearML, MLFlow et Weights & Biases (W&B) permettent d'automatiser les flux de travail, de track expériences et d'améliorer la collaboration, facilitant ainsi la gestion des projets d'apprentissage automatique.
  • Intégration de l'optimisation et du déploiement : CoreML, ONNX et OpenVINO permettent un déploiement optimisé sur différents appareils et cadres, garantissant des performances efficaces sur des plateformes telles que le matériel Apple et les processeurs Intel .
  • Intégrations de suivi et de visualisation : TensorBoard et Weights & Biases fournissent des outils permettant de visualiser la progression de l'entraînement et de contrôler les performances, ce qui permet d'obtenir des informations détaillées pour affiner les modèles.

Applications de YOLO11 et rôle des intégrations

Les intégrations qui soutiennent le développement de la vision par ordinateur, combinées aux capacités fiables de YOLO11, facilitent la résolution des défis du monde réel. Prenons l'exemple d'innovations telles que la vision par ordinateur dans l'industrie manufacturière, où l'IA est utilisée pour detect défauts sur une chaîne de production, comme des rayures sur des pièces métalliques ou des composants manquants. La collecte des données appropriées pour de telles tâches peut souvent être lente et difficile, nécessitant l'accès à des environnements spécialisés. 

Il s'agit généralement de mettre en place des caméras ou des capteurs le long des chaînes de production pour capturer des images des produits. Ces images doivent être prises en grand volume, souvent sous un éclairage et des angles constants, afin de garantir la clarté et l'uniformité. 

Une fois capturées, les images doivent être méticuleusement annotées avec des étiquettes précises pour chaque type de défaut, tels que les rayures, les bosses ou les composants manquants. Ce processus nécessite beaucoup de temps et de ressources, ainsi qu'une expertise, pour s'assurer que l'ensemble de données reflète fidèlement la variabilité du monde réel. Des facteurs tels que les différentes tailles, formes et matériaux des défauts doivent être pris en compte pour créer un ensemble de données robuste et fiable.

Les intégrations qui fournissent des ensembles de données prêts à l'emploi facilitent des tâches telles que le contrôle de la qualité industrielle. Grâce aux capacités de détection en temps réel de YOLO11, les fabricants peuvent surveiller les chaînes de production, détecter instantanément les défauts et améliorer l'efficacité.

Fig. 4. Exemple d'utilisation de Ultralytics YOLO11 pour detect et compter les boîtes de conserve en cours de fabrication.

Au-delà de l'industrie manufacturière, les intégrations liées aux ensembles de données peuvent être utilisées dans de nombreux autres secteurs. En associant la rapidité et la précision de YOLO11à des ensembles de données facilement accessibles, les entreprises peuvent rapidement développer et déployer des solutions adaptées à leurs besoins spécifiques. Prenons l'exemple de la santé : les intégrations de données peuvent aider à développer des solutions d'analyse d'images médicales pour detect anomalies telles que des tumeurs. De même, dans le domaine de la conduite autonome, ces intégrations peuvent aider à identifier les véhicules, les piétons et les panneaux de signalisation afin d'améliorer la sécurité.

Principaux points à retenir

Trouver le bon jeu de données est souvent l'une des parties les plus fastidieuses de la construction d'un modèle de vision par ordinateur. Cependant, l'intégration de Roboflow facilite la recherche du meilleur ensemble de données pour l'entraînement personnalisé de vos modèles Ultralytics YOLO , même si vous êtes novice en matière de vision par ordinateur. 

Avec l'accès à une vaste collection d'ensembles de données pour les tâches de vision artificielle telles que la détection d'objets, la classification d'images ou la segmentation d'instances, Roboflow Universe élimine les difficultés du processus de découverte de données. Il vous aide à démarrer rapidement et à vous concentrer sur la construction de votre modèle plutôt que de passer du temps à collecter et à organiser des données. Cette approche rationalisée permet aux développeurs de prototyper, d'itérer et de développer des solutions de vision artificielle plus efficacement.

Pour en savoir plus, consultez notre dépôt GitHub et échangez avec notre communauté. Explorez les innovations dans des domaines tels que l'IA dans les voitures autonomes et la vision par ordinateur dans l'agriculture sur nos pages de solutions. 🚀

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement