Découvrez comment la segmentation d'instance affine la détection d'objets avec une précision au niveau du pixel, permettant des masques d'objets détaillés pour les applications d'IA.
La segmentation des instances est une technique sophistiquée de technique sophistiquée de vision par ordinateur (VA) qui identifie, localise et délimite des objets individuels dans une image au niveau du pixel, localise et délimite des objets individuels dans une image au niveau du pixel. Contrairement à la détection d'objets, qui approxime l'emplacement d'un l'emplacement d'un objet à l'aide d'une boîte de délimitation rectangulaire, la segmentation génère un masque précis qui décrit la forme exacte de chaque objet distinct. Ce niveau de détail granulaire Ce niveau de détail granulaire permet aux systèmes de faire la distinction entre plusieurs instances d'une même classe, par exemple en séparant deux voitures qui se chevauchent ou des personnes individuelles dans une foule, ce qui rend la segmentation plus efficace. ou des personnes dans une foule, ce qui en fait un composant essentiel de l'intelligence artificielle (IA) avancée. l'intelligence artificielle (IA) (IA).
Pour bien comprendre la segmentation des instances, il est utile de la comparer à d'autres tâches fondamentales de vision par ordinateur. fondamentales de la vision par ordinateur:
La segmentation par instance fusionne efficacement les capacités de localisation de la détection d'objets avec la précision au niveau du pixel de la segmentation sémantique. pixel de la segmentation sémantique.
Les modèles de segmentation des instances utilisent généralement des architectures d'apprentissage profond (DL), en particulier réseaux neuronaux convolutifs (CNN), pour extraire les caractéristiques d'une image. Le processus comporte généralement deux étapes parallèles :
Les premières approches comme le R-CNN de Mask utilisaient un processus en deux étapes, générant d'abord des propositions de régions et les affinant ensuite. d'abord en générant des propositions de régions, puis en les affinant. Les architectures modernes, telles que Ultralytics YOLO11ont révolutionné ce processus en réalisant détection et la segmentation en une seule étape. Cela permet l 'inférence en temps réel, ce qui permet de de segment objets dans des flux vidéo en direct avec une vitesse et une précision élevées.
La détection précise des frontières offerte par la segmentation des instances est indispensable dans de nombreux secteurs :
Les développeurs peuvent facilement mettre en œuvre la segmentation des instances à l'aide de la fonction ultralytics Paquet Python . La bibliothèque
prend en charge YOLO11 modèles pré-entraînés sur le
Ensemble de données COCOqui peut detect et segment 80 catégories d'objets courants.
la boîte.
Voici un exemple concis de chargement d'un modèle et d'exécution d'une segmentation sur une image :
from ultralytics import YOLO
# Load a pre-trained YOLO11 instance segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image
# The model predicts classes, boxes, and masks simultaneously
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Visualize the results with masks plotted
results[0].show()
Pour les utilisateurs qui souhaitent appliquer cette méthode à leurs propres données, le cadre prend en charge les éléments suivants formation sur des ensembles de données personnalisés, permettant au modèle d'apprendre de nouvelles classes spécifiques à des applications de niche. classes spécifiques à des applications de niche.