Rejoignez-nous pour examiner de plus près ce qu'est la segmentation d'instance, comment elle fonctionne, son utilisation dans diverses applications de vision par ordinateur et l'impact qu'elle peut avoir.

Rejoignez-nous pour examiner de plus près ce qu'est la segmentation d'instance, comment elle fonctionne, son utilisation dans diverses applications de vision par ordinateur et l'impact qu'elle peut avoir.
Les applications de vision par ordinateur sont de plus en plus courantes dans notre vie quotidienne, qu'il s'agisse des caméras de surveillance de l'état des routes ou des systèmes d'encaissement automatique dans les magasins. En permettant aux machines de comprendre les données visuelles d'une manière similaire à celle des humains, l'IA de vision a un impact dans un grand nombre d'industries.
Nombre de ces applications reposent sur la détection d'objets, une tâche de vision par ordinateur qui consiste à placer des boîtes de délimitation autour d'objets clés dans les images. Si cette approche fonctionne souvent bien, certaines solutions d'analyse d'images nécessitent une précision encore plus grande.
Par exemple, en imagerie médicale, il ne suffit pas de détecter une tumeur, il est essentiel d'en dessiner la forme exacte. De même, en robotique, les machines doivent reconnaître les contours exacts d'un objet pour le saisir correctement. Pour relever ces défis, la segmentation d'instances offre une solution plus précise.
La segmentation d'instances est une tâche de vision par ordinateur conçue pour prendre en charge les cas d'utilisation où la détection d'objets n'est pas suffisante - elle permet d'obtenir une précision au niveau du pixel. Les modèles de vision artificielle comme Ultralytics YOLO11 peuvent être utilisés pour appliquer facilement la segmentation d'instances aux images et aux vidéos.
Dans ce guide, nous allons expliquer comment fonctionne la segmentation d'instance, ses applications, et comment Ultralytics YOLO11 peut être formé sur mesure pour des tâches de segmentation spécifiques.
Imaginons une photo de groupe avec des personnes proches les unes des autres. La détection d'objets peut aider à dessiner des boîtes autour de chaque personne, mais cela ne permet pas de connaître leur forme exacte.
La segmentation des instances, quant à elle, revient à tracer soigneusement le contour de chaque personne afin d'en voir la silhouette complète, même si elle se chevauche. Au lieu de simplement marquer l'emplacement d'un objet avec une boîte, la segmentation identifie la forme exacte de chaque objet au niveau du pixel, ce qui facilite la compréhension d'images complexes.
Le résultat est un masque détaillé qui remplit la forme d'un objet, en indiquant exactement les pixels qui lui appartiennent. Ce niveau de précision est utile dans de nombreuses applications du monde réel où il est important de comprendre la forme et les limites exactes des objets.
En explorant la segmentation des instances, vous rencontrerez peut-être le concept de segmentation sémantique.
Ces deux techniques aident les ordinateurs à comprendre les images au niveau des pixels, mais elles ont des objectifs différents. La segmentation sémantique étiquette chaque pixel en fonction de sa catégorie, en regroupant tous les objets du même type. Par exemple, dans une image comportant plusieurs voitures, la segmentation sémantique les marque toutes comme "voiture" sans faire de distinction entre les véhicules individuels.
La segmentation des instances, quant à elle, va plus loin en identifiant chaque objet séparément. Elle attribue des étiquettes uniques aux instances individuelles et crée des masques précis autour de leurs formes. Ainsi, dans la même image, la segmentation par instance ne se contenterait pas de tout étiqueter comme "voiture", mais reconnaîtrait et décrirait chaque voiture individuellement.
La principale différence entre les deux est que la segmentation sémantique regroupe les objets par catégorie, tandis que la segmentation par instance distingue chaque objet en tant qu'entité unique avec des limites claires. Le choix de la tâche à utiliser dépend de l'application spécifique - s'il suffit de savoir ce que contient une image ou s'il est important de différencier les objets individuels.
La communauté Vision AI dispose aujourd'hui de plusieurs modèles de segmentation d'instances. Certains sont plus rapides, d'autres plus précis et d'autres encore plus faciles à utiliser.
Ces options, bien qu'utiles, peuvent conduire à la question suivante : laquelle est la bonne pour une tâche spécifique ? Parmi ces options, les modèles YOLO d'Ultralytics sont très populaires car ils mettent l'accent sur la vitesse et la précision.
En outre, ces modèles ont considérablement évolué au fil des ans. Par exemple, Ultralytics YOLOv5 a simplifié le déploiement en utilisant des frameworks comme PyTorch, rendant l'IA visionnaire avancée accessible à un public plus large sans nécessiter d'expertise technique approfondie.
Fort de ce succès, Ultralytics YOLOv8 a introduit une prise en charge améliorée des tâches de vision artificielle telles que la segmentation des instances, l'estimation de la pose et la classification des images.
Aujourd'hui, YOLO11 atteint un nouveau niveau de performance. Il atteint une précision moyenne plus élevée (mAP) sur l'ensemble de données COCO avec 22 % de paramètres en moins que YOLOv8m, ce qui signifie qu'il peut reconnaître des objets avec plus de précision tout en utilisant moins de ressources.
En d'autres termes, YOLO11 offre une précision de pointe sans compromettre l'efficacité, ce qui change la donne sur le terrain.
Ensuite, examinons comment fonctionne généralement la segmentation des instances. Les anciens modèles de vision par ordinateur utilisent une approche en deux étapes.
Tout d'abord, ils détectent les objets en traçant des boîtes de délimitation autour d'eux. Ensuite, ils génèrent un masque au niveau des pixels pour définir la forme exacte de chaque objet. Un exemple bien connu est le R-CNN de masque, qui s'appuie sur les modèles de détection d'objets en ajoutant une étape de prédiction de masque. Bien que cette méthode soit efficace, elle peut être lente car elle traite l'image en plusieurs étapes, ce qui complique les applications en temps réel.
En revanche, des modèles comme YOLO11 traitent les images en une seule fois, en prédisant simultanément les boîtes de délimitation des objets et les masques de segmentation des instances. Cette approche rationalisée est beaucoup plus rapide tout en conservant une grande précision. Elle est donc particulièrement utile pour les applications en temps réel telles que la conduite autonome, l'analyse vidéo et la robotique, où la vitesse et la précision sont cruciales.
YOLO11 est livré avec un modèle pré-entraîné. Il a été entraîné sur l'ensemble de données COCO-Seg, qui couvre les objets de la vie quotidienne pour la segmentation d'instances. Cependant, le package Ultralytics Python prend en charge l'entraînement personnalisé, ce qui est essentiel pour les applications spécialisées dans lesquelles des objets uniques doivent être segmentés.
Pourquoi la formation personnalisée ou l'affinement d'un modèle sont-ils importants ? La formation personnalisée tire parti de l'apprentissage par transfert en s'appuyant sur les connaissances déjà intégrées dans les modèles pré-entraînés. Plutôt que de partir de zéro, il adapte un modèle existant à de nouvelles tâches en utilisant des ensembles de données plus petits et moins de ressources informatiques, tout en conservant une grande précision.
La segmentation des instances peut être utilisée pour résoudre des problèmes concrets en aidant les machines à voir et à comprendre les objets avec plus de précision. De l'amélioration de l'automatisation à la protection de l'environnement, elle joue un rôle clé dans de nombreux domaines. Voyons quelques exemples de domaines dans lesquels elle a un impact.
La segmentation des instances peut être un élément essentiel pour garantir la sécurité et l'efficacité sur les chantiers de construction. Par exemple, elle peut être utilisée pour surveiller les machines lourdes.
YOLO11 peut être affiné pour segmenter et identifier avec précision différents types d'équipements, tels que les grues, les excavateurs et les bulldozers, et suivre leur position en temps réel. Les gestionnaires de sites peuvent ainsi s'assurer que les machines fonctionnent strictement dans les zones désignées et qu'elles n'empiètent pas sur les zones où des travailleurs sont présents ou des dangers existent.
En outre, l'intégration de ces solutions à des systèmes d'alerte en temps réel permet de prendre rapidement des mesures correctives. En outre, les informations recueillies peuvent contribuer à optimiser l'agencement du site et le déroulement des opérations, ce qui permet de réduire encore les risques et de stimuler la productivité.
La surveillance du comportement des animaux aide les chercheurs, les agriculteurs et les défenseurs de l'environnement à mieux s'occuper des animaux dans différents environnements. La segmentation d'instances joue un rôle utile dans ces systèmes en identifiant et en segmentant les animaux individuels dans les fermes, les zoos et les habitats naturels. Contrairement à la détection d'objets traditionnelle qui utilise des boîtes de délimitation, la segmentation d'instances fournit une délimitation au niveau du pixel de chaque animal, ce qui est particulièrement utile lorsque les animaux sont proches les uns des autres.
Une segmentation détaillée facilite un suivi plus précis des mouvements et des comportements. Les animaux qui se chevauchent ou qui sont étroitement regroupés peuvent être reconnus distinctement, ce qui permet une analyse plus précise des interactions, des évaluations de santé et des modèles d'activité. Dans l'ensemble, une meilleure compréhension du comportement des animaux permet d'améliorer les soins aux animaux et les pratiques de gestion.
Le suivi précis des joueurs et des événements constitue une part importante de l'analyse sportive. Les méthodes traditionnelles de suivi reposent sur le marquage manuel, qui ne permet pas toujours de saisir les interactions détaillées. La vision par ordinateur peut être utilisée pour segmenter des détails tels que chaque joueur, chaque ballon et chaque événement clé au niveau du pixel afin d'obtenir des informations détaillées.
Par exemple, la segmentation des instances peut aider à détecter des événements tels que des fautes ou des incidents hors ballon en séparant clairement chaque joueur et chaque objet. Ce suivi granulaire rendu possible par des modèles comme YOLO11 offre aux analystes des informations plus claires pour étudier les schémas de mouvement, le positionnement spatial et les interactions avec une grande précision. L'un des principaux avantages de ces informations est qu'elles aident les équipes à affiner leurs stratégies et à améliorer leurs performances globales.
Voici quelques-uns des principaux avantages que la segmentation des instances peut apporter à diverses industries :
Si ces avantages mettent en évidence l'impact de la segmentation des instances sur les différents cas d'utilisation, il est également essentiel de prendre en compte les défis liés à sa mise en œuvre.
Voici quelques-unes des principales limites de la segmentation par instance :
La segmentation des instances permet de distinguer les objets individuels avec précision, même lorsqu'ils se chevauchent. En capturant les limites des objets au niveau du pixel, elle permet une compréhension plus approfondie des données visuelles par rapport aux tâches traditionnelles de vision par ordinateur telles que la détection d'objets.
Les progrès récents dans le domaine de la vision par ordinateur ont rendu la segmentation des instances plus rapide et plus facile à utiliser. En particulier, les modèles de vision par ordinateur comme Ultralytics YOLO11 simplifient le processus, permettant une segmentation en temps réel avec une configuration minimale, ce qui le rend plus accessible pour diverses industries et applications.
Curieux de l'IA ? Visitez notre dépôt GitHub et rejoignez notre communauté pour continuer à explorer. Découvrez des innovations telles que l 'IA dans les voitures auto-conduites et l'IA de vision dans l'agriculture sur nos pages de solutions. Consultez nos options de licence et lancez-vous dans un projet de vision par ordinateur !
Comment personnaliser la formation de YOLO11
Voici un examen plus approfondi des étapes nécessaires à l'affinement de YOLO11 pour la segmentation des instances :