Instance Segmentation
Apprends comment la segmentation d'instance permet la détection d'objets au niveau du pixel. Découvre comment utiliser Ultralytics YOLO26 pour la génération de masques haute vitesse et bien plus.
La segmentation d'instance est une technique sophistiquée en vision par ordinateur (CV) qui identifie et délimite chaque objet distinct d'intérêt au sein d'une image au niveau du pixel. Alors que la détection d'objets standard localise les éléments à l'aide de boîtes englobantes rectangulaires, la segmentation d'instance approfondit l'analyse en générant un masque précis pour chaque entité détectée. Cette capacité permet aux modèles d'intelligence artificielle (IA) de distinguer des objets individuels d'une même classe — comme séparer deux personnes qui se chevauchent — offrant ainsi une compréhension plus riche et plus détaillée de la scène visuelle par rapport aux méthodes de classification plus simples.
Link to this sectionDistinguer les types de segmentation#
Pour bien saisir l'utilité de la segmentation d'instance, il est utile de la différencier d'autres tâches connexes de traitement d'image. Chaque méthode offre un niveau de granularité différent selon les exigences de l'application.
- Segmentation sémantique : Cette approche classe chaque pixel d'une image dans une catégorie (par exemple, "route", "ciel", "voiture"). Cependant, elle ne distingue pas les objets séparés d'une même catégorie. Si trois voitures sont garées les unes à côté des autres, la segmentation sémantique les considère comme une seule région "voiture".
- Segmentation d'instance : Cette méthode traite chaque objet comme une entité unique. Elle détecte les instances individuelles et attribue une étiquette unique aux pixels de chacune. Dans l'exemple des voitures garées, la segmentation d'instance créerait trois masques distincts, identifiant séparément la "Voiture A", la "Voiture B" et la "Voiture C".
- Segmentation panoptique : Une approche hybride qui combine l'étiquetage d'arrière-plan de la segmentation sémantique avec l'identification des objets dénombrables de la segmentation d'instance.
Link to this sectionLa mécanique de l'analyse au niveau du pixel#
Les modèles modernes de segmentation d'instance s'appuient généralement sur des architectures avancées d'apprentissage profond (DL), en particulier les réseaux de neurones convolutifs (CNN). Ces réseaux extraient des caractéristiques d'une image pour prédire à la fois la classe d'un objet et son contour spatial. Historiquement, les architectures à deux étapes comme Mask R-CNN étaient la norme, proposant d'abord des régions d'intérêt puis les affinant en masques.
Cependant, des avancées récentes ont conduit à des détecteurs à une seule étape comme YOLO26, qui effectuent la détection et la segmentation simultanément. Cette approche "de bout en bout" améliore considérablement les vitesses d'inférence en temps réel, permettant d'appliquer une segmentation de haute précision aux flux vidéo en direct sur du matériel grand public.
Link to this sectionApplications concrètes#
Les limites précises fournies par la segmentation d'instance sont essentielles pour les secteurs où la compréhension de la forme et de la position exactes d'un objet est nécessaire à la prise de décision.
- IA dans la santé : Dans le diagnostic médical, l'identification de la taille et de la forme exactes des tumeurs ou des lésions est vitale. La segmentation d'instance permet aux modèles de délimiter les anomalies dans les scans IRM avec une grande précision, aidant les radiologues dans la planification des traitements et le suivi de la progression de la maladie.
- Véhicules autonomes : Les voitures autonomes s'appuient sur la segmentation pour naviguer dans des environnements complexes. En utilisant des jeux de données comme Cityscapes, les véhicules peuvent identifier les surfaces carrossables, reconnaître les marquages au sol et séparer les piétons individuels sur les passages cloutés encombrés pour assurer la sécurité.
- IA dans l'agriculture : L'agriculture de précision utilise la segmentation pour surveiller la santé des cultures. Les robots équipés de systèmes de vision peuvent identifier des fruits individuels pour une récolte automatisée ou détecter des mauvaises herbes spécifiques pour une application ciblée d'herbicide, réduisant ainsi l'utilisation de produits chimiques et optimisant le rendement.
Link to this sectionImplémenter la segmentation avec Python#
Les développeurs peuvent facilement implémenter la segmentation d'instance en utilisant la bibliothèque ultralytics. L'exemple suivant montre comment charger un modèle YOLO26 pré-entraîné et générer des masques de segmentation pour une image.
from ultralytics import YOLO
# Load a pre-trained YOLO26 instance segmentation model
# The 'n' suffix denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image
# This predicts classes, bounding boxes, and masks
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results
# Displays the image with overlaid segmentation masks
results[0].show()Link to this sectionDéfis et entraînement des modèles#
Bien que puissante, la segmentation d'instance est intensive en calcul par rapport à la simple détection par boîte englobante. La génération de masques parfaits au niveau du pixel nécessite d'importantes ressources GPU et une annotation de données précise. L'annotation des données pour ces tâches implique de dessiner des polygones serrés autour de chaque objet, ce qui peut prendre du temps.
Pour rationaliser ce processus, les équipes utilisent souvent des outils comme la Ultralytics Platform, qui offre des fonctionnalités de gestion de jeux de données, d'annotation automatique et d'entraînement basé sur le cloud. Cela permet aux développeurs d'affiner les modèles sur des données personnalisées — comme des pièces industrielles spécifiques ou des spécimens biologiques — et de les déployer efficacement sur des appareils d'IA en périphérie en utilisant des formats optimisés comme ONNX ou TensorRT.






