Comment utiliser Ultralytics YOLO11 pour la détection d'objets ?

Abirami Vina

3 minutes de lecture

29 novembre 2024

Découvrez comment le nouveau modèle YOLO11 d'Ultralytics peut être utilisé pour la détection d'objets afin d'obtenir une plus grande précision dans diverses applications à travers une gamme d'industries.

La vision par ordinateur est un domaine de l'intelligence artificielle (IA) qui aide les machines à interpréter et à comprendre les informations visuelles afin de réaliser des tâches essentielles telles que la détection d'objets. Contrairement à la classification des images, la détection d'objets permet non seulement d'identifier les objets présents dans une image, mais aussi de déterminer leur emplacement exact. Cela en fait un outil essentiel pour les applications d'IA de vision telles que les voitures autonomes, les systèmes de sécurité en temps réel et l'automatisation des entrepôts.

Au fil du temps, la technologie de détection d'objets est devenue plus avancée et plus facile à utiliser. Une avancée majeure a été annoncée lors de l'événement hybride annuel d'Ultralytics, YOLO Vision 2024 (YV24), avec le lancement du modèle Ultralytics YOLO11. YOLO11 améliore la précision et les performances tout en prenant en charge les mêmes tâches que YOLOv8, ce qui facilite la transition pour les utilisateurs des modèles précédents.

Fig. 1. Exemple d'utilisation du modèle Ultralytics YOLO11 pour la détection d'objets.

Dans cet article, nous allons expliquer ce qu'est la détection d'objets, en quoi elle diffère des autres tâches de vision par ordinateur, et explorer ses applications dans le monde réel. Nous vous expliquerons également comment utiliser le modèle YOLO11 avec le package Ultralytics Python et la plateforme Ultralytics HUB. C'est parti !

Qu'est-ce que la détection d'objets ?

La détection d'objets est une tâche essentielle de la vision par ordinateur qui ne se limite pas à l'identification d'objets dans une image. Contrairement à la classification d'images, qui détermine uniquement si un objet spécifique est présent, la détection d'objets reconnaît plusieurs objets et détermine leur emplacement exact à l'aide de boîtes de délimitation. 

Par exemple, il peut identifier et localiser des visages sur une photo de groupe, des voitures dans une rue animée ou des produits sur une étagère de magasin. La combinaison de la reconnaissance d'objets et de la localisation la rend particulièrement utile pour des applications telles que la surveillance, le contrôle des foules et la gestion automatisée des stocks.

Fig. 2. Utilisation de YOLO11 pour détecter les visages.

Ce qui distingue la détection d'objets d'autres tâches telles que la segmentation sémantique ou la segmentation d'instances, c'est sa focalisation et son efficacité. 

La segmentation sémantique étiquette chaque pixel d'une image mais ne différencie pas les objets individuels du même type (par exemple, tous les visages d'une photo seraient regroupés sous le terme "visage"). La segmentation par instance va plus loin en séparant chaque objet et en définissant sa forme exacte, même pour les objets de la même classe. 

La détection d'objets, en revanche, offre une approche plus rationnelle en identifiant et en classant les objets tout en marquant leur position. Elle est donc idéale pour les tâches en temps réel telles que la détection de visages dans les vidéos de sécurité ou l'identification d'obstacles pour les véhicules autonomes.

Applications de YOLO11 et détection d'objets

Les fonctions avancées de détection d'objets de YOLO11 le rendent utile dans de nombreux secteurs d'activité. Voyons quelques exemples.

Utiliser YOLO11 pour l'analyse du commerce de détail

YOLO11 et la détection d'objets redéfinissent l'analyse du commerce de détail en rendant la gestion des stocks et le contrôle des rayons plus efficaces et plus précis. La capacité du modèle à détecter rapidement et de manière fiable les objets aide les détaillants à suivre les niveaux de stock, à organiser les rayons et à réduire les erreurs d'inventaire.

Par exemple, YOLO11 peut détecter des articles spécifiques tels que des lunettes de soleil sur les étagères d'un magasin. Mais pourquoi un détaillant voudrait-il surveiller une étagère ? Il est essentiel que les rayons soient bien rangés et organisés pour que les clients puissent trouver ce dont ils ont besoin, ce qui a un impact direct sur les ventes. En surveillant les étagères en temps réel, les détaillants peuvent rapidement repérer les articles en rupture de stock, mal placés ou surchargés, ce qui les aide à maintenir une présentation organisée et attrayante qui améliore l'expérience d'achat.

Fig. 3. Exemple d'utilisation de YOLO11 pour détecter des produits sur des étagères.

YOLO11 dans les applications de la ville intelligente

Une ville animée a besoin d'un trafic fluide et de rues sûres pour fonctionner efficacement, et YOLO11 peut aider à rendre cela possible. En fait, de nombreuses applications de ville intelligente peuvent être intégrées à YOLO11. 

Un cas intéressant consiste à utiliser la détection d'objets pour identifier les plaques d'immatriculation des véhicules en mouvement. YOLO11 permet ainsi d'accélérer la perception des péages, de mieux gérer le trafic et d'accélérer l'application des réglementations. 

Fig. 4. Utilisation de la détection d'objets et de YOLO11 pour détecter les plaques d'immatriculation.

Les informations fournies par les systèmes Vision AI qui surveillent les routes peuvent alerter les autorités sur les infractions au code de la route ou les embouteillages avant qu'ils ne se transforment en problèmes plus graves. YOLO11 peut également détecter les piétons et les cyclistes, ce qui rend les rues plus sûres et plus efficaces pour tous. 

En fait, la capacité de YOLO11 à traiter des données visuelles en fait un outil puissant pour améliorer l'infrastructure des villes. Par exemple, il peut aider à optimiser la synchronisation des feux de circulation en analysant les mouvements des véhicules et des piétons. Il peut également améliorer la sécurité dans les zones scolaires en détectant les enfants et en alertant les conducteurs pour qu'ils ralentissent. Avec YOLO11, les villes peuvent prendre des mesures proactives pour relever les défis et créer un environnement plus efficace pour tous.

Détection vidéo en temps réel avec YOLO11 : plus d'accessibilité

La détection d'objets en temps réel fait référence à la capacité d'un système à identifier et à classer des objets dans un flux vidéo en direct au fur et à mesure qu'ils apparaissent. YOLO11 est conçu pour des performances supérieures en temps réel et excelle dans la prise en charge de cette capacité. Ses applications vont au-delà de la simple rationalisation des processus - il peut également contribuer à créer un monde plus inclusif et plus accessible.

Par exemple, YOLO11 peut aider les personnes malvoyantes en identifiant les objets en temps réel. En fonction des détections, des descriptions audio peuvent être fournies, ce qui aide les utilisateurs à naviguer dans leur environnement avec une plus grande indépendance.

Prenons l'exemple d'une personne malvoyante qui fait ses courses. Choisir les bons articles peut s'avérer difficile, mais YOLO11 peut l'aider. Lorsqu'elle place les articles dans son panier, un système intégré à YOLO11 pourrait être utilisé pour identifier chaque article - comme des bananes, des avocats ou une brique de lait - et fournir des descriptions audio en temps réel. Ils peuvent ainsi confirmer leurs choix et s'assurer qu'ils ont tout ce dont ils ont besoin. En reconnaissant les articles de tous les jours, YOLO11 peut simplifier les achats.

Fig. 5. La détection d'objets peut contribuer à rendre le monde plus accessible aux malvoyants.

Guide étape par étape pour la détection d'objets avec YOLO11 

Maintenant que nous avons abordé les bases de la détection d'objets et ses diverses applications, voyons comment vous pouvez commencer à utiliser le modèle YOLO11 d'Ultralytics pour des tâches telles que la détection d'objets.

Il y a deux façons simples d'utiliser YOLO11 : par le biais du package Ultralytics Python ou du HUB Ultralytics. Explorons ces deux méthodes, en commençant par le paquetage Python.

Effectuer des déductions avec YOLO11

On parle d'inférence lorsqu'un modèle d'IA analyse des données nouvelles et inédites pour faire des prédictions, classer des informations ou donner des indications sur la base de ce qu'il a appris au cours de sa formation. En ce qui concerne la détection d'objets, il s'agit d'identifier et de localiser des objets spécifiques dans une image ou une vidéo, de dessiner des boîtes de délimitation autour d'eux et de les étiqueter sur la base de la formation du modèle.

Pour inférer à l'aide du modèle de détection d'objets YOLO11, vous devez d'abord installer le paquetage Ultralytics Python via pip, conda ou Docker. Si vous rencontrez des problèmes d'installation, consultez le guide de dépannage pour obtenir des conseils et des astuces qui vous aideront à les résoudre. Une fois installé, vous pouvez utiliser le code suivant pour charger le modèle de détection d'objets YOLO11 et faire des prédictions sur une image.

Fig. 6. Exécution d'une inférence sur une image à l'aide de YOLO11n.

Formation d'un modèle YOLO11 personnalisé

YOLO11 prend également en charge la formation personnalisée pour mieux s'adapter à vos cas d'utilisation spécifiques. En affinant le modèle, vous pouvez l'adapter à la détection d'objets pertinents pour votre projet. Par exemple, lors de l'utilisation de la vision par ordinateur dans le domaine de la santé, un modèle YOLO11 entraîné sur mesure pourrait être utilisé pour détecter des anomalies spécifiques dans des images médicales, telles que des tumeurs dans des IRM ou des fractures dans des radiographies, afin d'aider les médecins à établir des diagnostics plus rapides et plus précis.

L'extrait de code ci-dessous montre comment charger et entraîner un modèle YOLO11 pour la détection d'objets. Vous pouvez partir d'un fichier de configuration YAML ou d'un modèle pré-entraîné, transférer des poids et vous entraîner sur des ensembles de données tels que COCO pour obtenir des capacités de détection d'objets plus fines.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.yaml")  # build a new model from YAML
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo11n.yaml").load("yolo11n.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Après avoir formé un modèle, vous pouvez également exporter le modèle formé dans différents formats pour le déployer dans différents environnements.

Détection d'objets YOLO11 sur Ultralytics HUB

Pour ceux qui recherchent une alternative sans code, Ultralytics HUB fournit une plateforme Vision AI facile à utiliser pour la formation et le déploiement des modèles YOLO, y compris YOLO11.

Pour lancer la détection d'objets sur des images, il suffit de créer un compte, de se rendre dans la section "Modèles" et de sélectionner la variante du modèle de détection d'objets YOLO11. Téléchargez votre image et la plateforme affichera les objets détectés dans une section de prévisualisation.

Fig. 7. Exécution d'inférences sur Ultralytics HUB.

En combinant la flexibilité du paquetage Python et la facilité du HUB, YOLO11 permet aux développeurs et aux entreprises d'exploiter facilement la puissance d'une technologie avancée de détection d'objets.

Principaux enseignements

YOLO11 établit une nouvelle norme en matière de détection d'objets, combinant haute précision et polyvalence pour répondre aux besoins de divers secteurs d'activité. Qu'il s'agisse d'améliorer l'analyse de la vente au détail ou de gérer l'infrastructure d'une ville intelligente, YOLO11 est conçu pour des performances fiables et en temps réel dans d'innombrables applications.

Avec des options de formation personnalisée et une interface facile à utiliser via Ultralytics HUB, l'intégration de YOLO11 dans vos flux de travail n'a jamais été aussi simple. Que vous soyez un développeur explorant la vision par ordinateur ou une entreprise cherchant à innover avec l'IA, YOLO11 offre les outils dont vous avez besoin pour réussir.

Pour en savoir plus, consultez notre dépôt GitHub et participez à la vie de notre communauté. Explorez les applications de l'IA dans les voitures auto-conduites et la vision par ordinateur pour l'agriculture sur nos pages de solutions. 🚀

Construisons ensemble le futur
de l'IA !

Commencez votre voyage avec l'avenir de l'apprentissage automatique

Commencer gratuitement
Lien copié dans le presse-papiers