Découvre YOLO26 : l'IA de vision de nouvelle génération.
Ultralytics
Guides

Qu'est-ce que la segmentation d'instance ? Un guide rapide

Rejoins-nous pour examiner de plus près ce qu'est la segmentation d'instance, comment elle fonctionne, son utilisation dans diverses applications de vision par ordinateur, et l'impact qu'elle peut avoir.

ABAbirami Vina
6 min read
Segmentation d'instance d'objets dans une image

Les applications de vision par ordinateur deviennent de plus en plus courantes dans notre vie quotidienne, des caméras de surveillance routière aux systèmes de paiement automatique en magasin. En permettant aux machines de comprendre les données visuelles d'une manière similaire aux humains, l'IA visuelle a un impact dans de nombreux secteurs.

Beaucoup de ces applications reposent sur la détection d'objets, une tâche de vision par ordinateur qui place des boîtes englobantes (bounding boxes) autour des objets clés dans les images. Bien que cette approche fonctionne souvent bien, certaines solutions d'analyse d'images nécessitent une précision encore plus grande.

Par exemple, l'imagerie médicale nécessite bien plus qu'une simple détection de tumeur : il est crucial d'en délimiter la forme exacte. De même, en robotique, les machines doivent reconnaître les contours précis d'un objet pour le saisir correctement. Pour relever ces défis, la segmentation d'instance offre une solution plus précise.

La segmentation d'instance est une tâche de vision par ordinateur conçue pour prendre en charge les cas d'utilisation où la simple détection d'objets ne suffit pas ; elle offre une précision au niveau du pixel. Des modèles de vision par ordinateur comme Ultralytics YOLO11 peuvent être utilisés pour appliquer facilement la segmentation d'instance aux images et aux vidéos.

Utilisation de YOLO11 pour la segmentation d'instances

Fig 1. Exemple d'utilisation de YOLO11 pour la segmentation d'instance.

Dans ce guide, nous expliquerons comment fonctionne la segmentation d'instance, ses applications et comment Ultralytics YOLO11 peut être entraîné sur mesure pour des tâches de segmentation spécifiques.

Link to this sectionQu'est-ce que la segmentation d'instance ?#

Imaginons une photo de groupe où les personnes sont proches les unes des autres. La détection d'objets peut aider à dessiner des boîtes autour de chaque personne, mais cela ne t'indique pas leur forme exacte.

La segmentation d'instance, quant à elle, revient à tracer soigneusement le contour de chaque personne pour que tu puisses voir leur silhouette complète, même si elles se chevauchent. Au lieu de simplement marquer l'emplacement de quelque chose avec une boîte, elle identifie la forme exacte de chaque objet au niveau du pixel, facilitant ainsi la compréhension d'images complexes.

Le résultat est un masque détaillé qui remplit la forme d'un objet, en identifiant exactement quels pixels lui appartiennent. Ce niveau de précision est utile dans de nombreuses applications réelles où il est important de comprendre la forme et les limites exactes des objets.

Prise en charge de YOLO11 pour la segmentation d'instances

Fig 2. Présentation du support de YOLO11 pour la segmentation d'instance.

Link to this sectionSegmentation d'instance vs segmentation sémantique#

En explorant la segmentation d'instance, tu pourrais rencontrer le concept de segmentation sémantique.

Les deux techniques aident les ordinateurs à comprendre les images au niveau du pixel, mais elles servent des objectifs différents. La segmentation sémantique étiquette chaque pixel en fonction de sa catégorie, regroupant tous les objets du même type. Par exemple, sur une image avec plusieurs voitures, la segmentation sémantique les marquerait toutes comme "voiture" sans distinguer les véhicules individuels.

La segmentation d'instance, en revanche, va plus loin en identifiant chaque objet séparément. Elle attribue des étiquettes uniques aux instances individuelles et crée des masques précis autour de leurs formes. Ainsi, dans la même image, la segmentation d'instance ne se contenterait pas d'étiqueter tout comme "voiture", mais reconnaîtrait et délimiterait chaque voiture individuellement.

La principale différence entre les deux est que la segmentation sémantique regroupe les objets par catégorie, tandis que la segmentation d'instance distingue chaque objet comme une entité unique avec des limites claires. Le choix de la tâche à utiliser dépend de l'application spécifique : s'il suffit de savoir ce qu'il y a dans une image ou s'il est important de différencier les objets individuels.

Segmentation d'instances versus segmentation sémantique

Fig 3. Segmentation d'instance vs segmentation sémantique (à droite et à gauche, respectivement).

Link to this sectionModèles de segmentation d'instance populaires#

Il existe aujourd'hui divers modèles de segmentation d'instance à la disposition de la communauté de l'IA visuelle. Certains sont plus rapides, d'autres plus précis, et certains sont plus faciles à utiliser.

Ces options, bien qu'utiles, peuvent soulever la question : lequel est le bon à utiliser pour une tâche spécifique ? Parmi ces options, les modèles Ultralytics YOLO sont très populaires car ils se concentrent sur la vitesse et la précision.

De plus, ces modèles ont considérablement évolué au fil des ans. Par exemple, Ultralytics YOLOv5 a simplifié le déploiement en utilisant des frameworks comme PyTorch, rendant l'IA visuelle avancée accessible à un public plus large sans nécessiter d'expertise technique approfondie.

Poursuivant sur cette lancée, Ultralytics YOLOv8 a introduit un support amélioré pour les tâches de vision par ordinateur telles que la segmentation d'instance, l'estimation de pose et la classification d'images.

Maintenant, YOLO11 porte les performances à un nouveau niveau. Il atteint une mAP (précision moyenne) plus élevée sur le jeu de données COCO avec 22 % de paramètres en moins que YOLOv8m, ce qui signifie qu'il peut reconnaître les objets plus précisément tout en utilisant moins de ressources.

Évaluation des performances de YOLO11

Fig 4. Benchmarking de YOLO11.

En termes simples, YOLO11 offre une précision de pointe sans compromettre l'efficacité, ce qui en fait un changement majeur dans le domaine.

Link to this sectionComprendre le fonctionnement de la segmentation d'instance#

Ensuite, explorons le fonctionnement typique de la segmentation d'instance. Les anciens modèles de vision par ordinateur utilisent une approche en deux étapes.

Tout d'abord, ils détectent les objets en dessinant des boîtes englobantes autour d'eux. Ensuite, ils génèrent un masque au niveau du pixel pour délimiter la forme exacte de chaque objet. Un exemple bien connu est Mask R-CNN, qui s'appuie sur des modèles de détection d'objets en ajoutant une étape de prédiction de masque. Bien que cette méthode soit efficace, elle peut être lente car elle traite l'image en plusieurs étapes, rendant les applications en temps réel plus difficiles.

Pendant ce temps, des modèles comme YOLO11 traitent les images en une seule fois, prédisant simultanément les boîtes englobantes des objets et les masques de segmentation d'instance. Cette approche rationalisée le rend beaucoup plus rapide tout en conservant une grande précision. En conséquence, il est particulièrement utile pour les applications en temps réel comme la conduite autonome, l'analyse vidéo et la robotique, où la vitesse et la précision sont cruciales.

Link to this sectionEntraînement personnalisé de YOLO11 pour la segmentation d'instance#

Prêt à l'emploi, YOLO11 est fourni en tant que modèle pré-entraîné. Il a été entraîné sur le jeu de données COCO-Seg, qui couvre les objets du quotidien pour la segmentation d'instance. Cependant, le package Python Ultralytics prend en charge l'entraînement personnalisé, ce qui est essentiel pour les applications spécialisées où des objets uniques doivent être segmentés.

Pourquoi l'entraînement personnalisé ou le réglage fin d'un modèle est-il important ? L'entraînement personnalisé tire parti de l'apprentissage par transfert en s'appuyant sur les connaissances déjà intégrées dans les modèles pré-entraînés. Plutôt que de repartir de zéro, il adapte un modèle existant à de nouvelles tâches en utilisant des jeux de données plus petits et moins de ressources informatiques, tout en conservant une grande précision.

Link to this sectionComment entraîner YOLO11 de manière personnalisée#

Voici un aperçu plus détaillé des étapes nécessaires pour affiner YOLO11 pour la segmentation d'instance :

  • Préparation des données : Collecte et annote tes images en fonction de ton application spécifique. Ultralytics fournit un support pour plusieurs jeux de données d'images, mais tu peux aussi entraîner le modèle avec ton propre jeu de données en préparant les images et les annotations dans le format YOLO requis.
  • Utilisation d'un modèle pré-entraîné : Au lieu de commencer à zéro, utilise un modèle Ultralytics YOLO11 pré-entraîné.
  • Entraînement du modèle : Ajuste les paramètres d'entraînement essentiels comme la taille du lot (images traitées par itération), la taille de l'image (résolution d'entrée cible) et les époques (cycles d'entraînement totaux) puis entraîne le modèle.
  • Évaluation des performances : Une fois l'entraînement du modèle terminé, tu peux tester la précision du modèle à l'aide de mesures de performance comme la mAP. Le package Python Ultralytics fournit également des fonctions intégrées pour l'évaluation du modèle.

Link to this sectionApplications de segmentation d'instance activées par YOLO11#

La segmentation d'instance peut être utilisée pour résoudre des défis réels en aidant les machines à voir et à comprendre les objets avec plus de précision. De l'amélioration de l'automatisation à la protection de l'environnement, elle joue un rôle clé dans de nombreux domaines. Passons en revue quelques exemples où elle a un impact.

Link to this sectionSécurité et surveillance des chantiers de construction avec YOLO11#

La segmentation d'instance peut être un élément essentiel pour garantir la sécurité et l'efficacité sur les chantiers de construction. Par exemple, elle peut être utilisée pour surveiller les engins lourds.

YOLO11 peut être affiné pour segmenter et identifier avec précision différents types d'équipements, tels que des grues, des excavatrices et des bulldozers, et suivre leurs positions en temps réel. Cela permet aux responsables de site de s'assurer que les machines fonctionnent strictement dans les zones désignées et n'empiètent pas sur les zones où se trouvent des travailleurs ou où existent des dangers.

De plus, l'intégration de telles solutions avec des systèmes d'alerte en temps réel permet de prendre des mesures correctives rapides. Au-delà de cela, les informations recueillies peuvent aider à optimiser l'aménagement du site et le flux de travail, réduisant encore les risques et augmentant la productivité.

Surveillance d'engins lourds à l'aide de YOLO11

Fig 5. Surveillance d'engins lourds avec YOLO11.

Link to this sectionSurveillance des animaux avec la segmentation et YOLO11#

La surveillance du comportement animal aide les chercheurs, les éleveurs et les défenseurs de l'environnement à mieux prendre soin des animaux dans différents environnements. La segmentation d'instance joue un rôle utile dans ces systèmes en identifiant et en segmentant les animaux individuels dans les fermes, les zoos et les habitats naturels. Contrairement à la détection d'objets traditionnelle qui utilise des boîtes englobantes, la segmentation d'instance fournit une délimitation au niveau du pixel de chaque animal, ce qui est particulièrement utile lorsque les animaux sont très proches les uns des autres.

Une segmentation détaillée facilite un suivi plus précis des mouvements et des comportements. Les animaux qui se chevauchent ou qui sont étroitement regroupés peuvent être distinctement reconnus, permettant une analyse plus précise des interactions, des évaluations de santé et des modèles d'activité. Dans l'ensemble, des informations plus approfondies sur le comportement animal améliorent les pratiques de soins et de gestion des animaux.

Surveillance du bétail à l'aide de la segmentation d'instances

Fig 6. Surveillance du bétail avec la segmentation d'instance.

Link to this sectionYOLO11 dans l'analyse sportive et le suivi des joueurs#

Le suivi précis des joueurs et des événements est une part importante de l'analyse sportive. Les méthodes de suivi traditionnelles reposent sur le marquage manuel, qui peut ne pas capturer les interactions détaillées. La vision par ordinateur peut être utilisée pour segmenter des détails comme chaque joueur, le ballon et chaque événement clé au niveau du pixel pour obtenir des informations détaillées.

Par exemple, la segmentation d'instance peut aider à détecter des événements comme des fautes ou des incidents sans ballon en séparant clairement chaque joueur et objet. Ce suivi granulaire permis par des modèles comme YOLO11 offre aux analystes des informations plus claires pour étudier les modèles de mouvement, le positionnement spatial et les interactions avec une grande précision. Un avantage clé de ces informations est qu'elles aident les équipes à affiner leurs stratégies et à améliorer leurs performances globales.

Link to this sectionAvantages et inconvénients de la segmentation d'instance#

Voici quelques-uns des principaux avantages que la segmentation d'instance peut apporter à diverses industries :

  • Automatisation améliorée : En automatisant des tâches telles que le contrôle qualité et la surveillance de la sécurité, la segmentation d'instance réduit le besoin d'intervention manuelle et minimise l'erreur humaine.
  • Meilleure compréhension de la scène : En délimitant avec précision chaque objet, la segmentation d'instance contribue à une compréhension plus profonde des scènes complexes, favorisant une prise de décision plus éclairée.
  • Post-traitement efficace : La sortie au niveau du pixel simplifie des tâches telles que la suppression de l'arrière-plan, le comptage d'objets et l'analyse spatiale, réduisant ainsi le besoin d'étapes de traitement supplémentaires.

Bien que ces avantages mettent en évidence l'impact de la segmentation d'instance sur différents cas d'utilisation, il est également essentiel de prendre en compte les défis liés à sa mise en œuvre.

Voici quelques-unes des principales limites de la segmentation d'instance :

  • Défis liés à la transparence : Segmenter des objets transparents ou réfléchissants comme le verre et l'eau est difficile, ce qui conduit à des limites imprécises.
  • Frais de maintenance : Pour garder les modèles précis et pertinents, des mises à jour et un réglage fin continus sont nécessaires à mesure que les conditions environnementales et les jeux de données changent.
  • Effort d'annotation élevé : L'entraînement de modèles de segmentation d'instance nécessite des annotations détaillées au niveau du pixel, ce qui augmente considérablement le temps et les coûts liés à la préparation des données.

Link to this sectionPoints clés#

La segmentation d'instance permet de distinguer des objets individuels avec précision, même lorsqu'ils se chevauchent. En capturant les limites des objets au niveau du pixel, elle offre une compréhension plus profonde des données visuelles par rapport aux tâches de vision par ordinateur traditionnelles comme la détection d'objets.

Les progrès récents en vision par ordinateur ont rendu la segmentation d'instance plus rapide et plus facile à utiliser. En particulier, des modèles de vision par ordinateur comme Ultralytics YOLO11 simplifient le processus, permettant une segmentation en temps réel avec une configuration minimale, la rendant plus accessible pour diverses industries et applications.

Curieux à propos de l'IA ? Visite notre dépôt GitHub et connecte-toi avec notre communauté pour continuer à explorer. Apprends-en davantage sur des innovations comme l'IA dans les voitures autonomes et l'IA de vision en agriculture sur nos pages de solutions. Consulte nos options de licence et lance-toi dans un projet de vision par ordinateur !

Explore solutions

Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus
Real-time AI that works with your team

IA dans la robotique

Équipe tes machines plus intelligentes avec les modèles Ultralytics YOLO. La vision par IA dans la robotique propulse la navigation autonome, la perception, le suivi d'objets et le contrôle en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans la logistique

Simplifie la logistique avec les modèles Ultralytics YOLO. La vision par IA permet l'inspection des colis, le tri, le suivi des véhicules et la surveillance de la sécurité des entrepôts en temps réel.
En savoir plus
Real-time AI that works with your team

IA dans le commerce de détail

Réinvente le commerce de détail avec les modèles Ultralytics YOLO. La vision par IA alimente le suivi des stocks, la surveillance des étagères, la gestion des files d'attente et des informations plus intelligentes sur les clients.
En savoir plus
Real-time AI that works with your team

IA dans la santé

Construis des solutions de santé avec les modèles Ultralytics YOLO. L'IA de vision dans la santé permet une imagerie médicale plus rapide, des diagnostics plus intelligents et une surveillance des patients.
En savoir plus
Real-time AI that works with your team

IA dans la fabrication

Optimise la fabrication avec les modèles Ultralytics YOLO. La vision par IA favorise le contrôle qualité, la détection des défauts, la conformité aux EPI et l'automatisation des chaînes de montage.
En savoir plus
Real-time AI that works with your operation

IA dans l'automobile

Applique la vision par ordinateur dans l'automobile avec les modèles Ultralytics YOLO. L'IA de vision améliore la sécurité routière, l'assistance à la conduite et l'automatisation des véhicules pour des routes plus intelligentes.
En savoir plus
Real-time AI tailored to your operation

IA en agriculture

Intègre l'IA de vision à l'agriculture intelligente avec les modèles Ultralytics YOLO. Optimise la surveillance des cultures, le suivi du bétail et l'agriculture de précision pour des rendements plus élevés et plus intelligents.
En savoir plus

Construisons ensemble le futur de l'IA !

Commence ton aventure avec le futur de l'apprentissage automatique