Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant
Glossaire

Segmentation d'image

Découvrez la puissance de la segmentation d'images avec Ultralytics YOLO. Explorez la précision au niveau du pixel, les types, les applications et les cas d'utilisation de l'IA dans le monde réel.

La segmentation d'images est une technique de base en vision par ordinateur (VA) qui consiste à diviser une image numérique en plusieurs sous-groupes de pixels, communément appelés segments d'image. L'objectif premier est de L'objectif premier est de simplifier la représentation d'une image en quelque chose de plus significatif et de plus facile à analyser. Contrairement à la détection d'objets, qui localise les objets à l'intérieur d'une dans une boîte rectangulaire, la segmentation d'image fournit une carte précise, au niveau des pixels, de la forme d'un objet. Ce processus attribue une étiquette à chaque pixel d'une image, ce qui permet aux modèles d'intelligence artificielle (IA) d'identifier les objets les plus significatifs et les plus faciles à analyser. aux modèles d'intelligence artificielle (IA) de de comprendre les limites et les contours exacts des entités au sein d'une scène.

L'importance de la précision au niveau du pixel

Dans de nombreux flux de travail modernes d'apprentissage machine (ML), il ne suffit pas de connaître l'emplacement approximatif d'un objet, la connaissance de l'emplacement approximatif d'un objet est insuffisante. Les applications nécessitant une interaction avec le monde physique physique, comme un robot saisissant un paquet ou une voiture naviguant sur une route sinueuse, exigent une compréhension granulaire de la géométrie. géométrie. La segmentation d'images comble cette lacune en convertissant les données visuelles brutes en un ensemble de régions classées. Cette capacité Cette capacité est alimentée par des architectures d'apprentissage profond (DL), en particulier les réseaux neuronaux Les réseaux neuronaux convolutifs (CNN), qui extraient des caractéristiques spatiales pour différencier les objets de premier plan de l'arrière-plan.

Types de segmentation d'image

Il est essentiel de comprendre la tâche de segmentation spécifique pour sélectionner l'architecture de modèle appropriée. Les trois catégories catégories sont les suivantes :

  • Segmentation sémantique: Cette méthode traite plusieurs objets de la même catégorie comme une seule entité. Par exemple, dans une scène de rue, tous les pixels appartenant à la catégorie "route" sont colorés en gris et tous les pixels appartenant à la catégorie "voiture" sont colorés en bleu. Cette méthode ne fait pas de distinction entre deux voitures différentes ; elle identifie simplement qu'il s'agit de deux véhicules. Cette approche est souvent mise en œuvre à l'aide d'architectures telles que le U-Net, développé à l'origine pour la segmentation d'images biomédicales.
  • Segmentation des instances: Cette technique va plus loin en identifiant des objets individuels distincts. Si une image contient cinq voitures, la segmentation par instance générera cinq masques distincts, ce qui permettra au système de compter et de suivre chaque véhicule, la segmentation par instance générera cinq masques distincts, ce qui permettra au système de compter et de track chaque véhicule de manière indépendante. indépendamment. Il s'agit de la principale tâche effectuée par Ultralytics YOLO11 qui concilient vitesse et précision pour les vitesse et la précision pour les applications en temps réel.
  • Segmentation panoptique: A approche hybride qui combine la segmentation sémantique et la segmentation d'instance. Elle permet une compréhension globale de la scène en en attribuant une étiquette de classe à chaque pixel (arrière-plan comme le ciel et la route) tout en identifiant de manière unique les objets dénombrables (personnes et voitures). objets dénombrables (personnes et voitures).

Applications concrètes

La capacité à délimiter des frontières précises rend la segmentation indispensable dans de nombreux secteurs d'activité :

  • Analyse d'images médicales: La segmentation est essentielle dans le domaine des soins de santé pour l'analyse de scanners tels que l IRM ou CT ou CT. En délimitant précisément les tumeurs, les organes ou les lésions, les modèles d'IA aident les radiologues à diagnostiquer et à planifier les interventions chirurgicales. chirurgicale. Par exemple, l'identification du volume exact d'une tumeur cérébrale permet de mieux cibler la radiothérapie, minimiser les dommages causés aux tissus sains.
  • Véhicules autonomes: Les voitures autonomes s'appuient fortement sur la segmentation pour naviguer en toute sécurité. Les modèles traitent les flux vidéo afin d'identifier les voies les voies praticables, les trottoirs, les piétons et les obstacles. Des organisations telles que la SAE International définissent des niveaux d'autonomie qui requièrent cette perception détaillée de l'environnement pour prendre des décisions en une fraction de seconde. détaillée de l'environnement pour prendre des décisions en une fraction de seconde.
  • Agriculture de précision : En l 'IA dans l'agriculture, la segmentation aide à la surveillance de la santé des cultures. Les drones équipés de caméras multispectrales peuvent segment champs pour identifier les infestations de mauvaises herbes ou les carences en nutriments feuille par feuille, ce qui permet une application ciblée d'herbicides. Les drones équipés de caméras multispectrales peuvent segmenter les champs pour identifier les infestations de mauvaises herbes ou les carences en nutriments, feuille par feuille, ce qui permet de cibler l'application d'herbicides.

Mise en œuvre technique avec YOLO

Les cadres modernes ont simplifié la mise en œuvre des tâches de segmentation. Alors que les anciens détecteurs en deux étapes comme R-CNN du masque étaient précis mais lents, les modèles en une seule étape ont ont révolutionné le domaine en offrant une l 'inférence en temps réel. Les modèles à une étape ont révolutionné le domaine en offrant une inférence en temps réel. Ultralytics YOLO11 par exemple, prend en charge la segmentation des instances de manière native. L'avenir, YOLO26 est en cours de développement afin d'optimiser ces capacités avec un traitement de bout en bout. capacités avec un traitement de bout en bout.

Les développeurs peuvent utiliser des bibliothèques standard comme OpenCV pour le prétraitement et la visualisation, tout en utilisant PyTorch pour l'inférence des modèles. l'inférence du modèle.

Voici un exemple concis de segmentation d'instances à l'aide d'un modèle YOLO11 pré-entraîné en Python:

from ultralytics import YOLO

# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference on an image (can be a local path or URL)
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with segmentation masks overlaid
results[0].show()

Cet extrait de code gère automatiquement les tâches complexes d'extraction des caractéristiques, de régression de la boîte englobante et de génération de masques, ce qui permet aux développeurs de se concentrer sur l'intégration de l'outil dans le système. permettant aux développeurs de se concentrer sur l'intégration des résultats de la segmentation dans leurs applications plus vastes.

Rejoindre la communauté Ultralytics

Rejoignez le futur de l'IA. Connectez-vous, collaborez et évoluez avec des innovateurs mondiaux.

Rejoindre maintenant