Découvrez U-Net, la puissante architecture CNN pour la segmentation sémantique. Découvrez ses applications dans l'imagerie médicale, satellitaire et autonome.
U-Net est une architecture spécialisée pour réseaux neuronaux convolutifs (CNN) conçus pour effectuer une classification précise au niveau du pixel, connue sous le nom de segmentation sémantique. Contrairement aux modèles de classification traditionnels qui attribuent une seule étiquette à l'ensemble de l'image, U-Net prédit une classe pour chaque pixel, créant ainsi une carte détaillée qui décrit la forme exacte de l'emplacement des objets. chaque pixel, créant ainsi une carte détaillée qui indique la forme et l'emplacement exacts des objets. Développé à l'origine pour pour l'analyse d'images biomédicales, il est devenu une structure fondamentale dans le domaine de l'analyse d'images biomédicales et de l'analyse d'images biomédicales. vision par ordinateur (VA) en raison de sa sa capacité à travailler efficacement avec des données d'apprentissage tout en produisant des résultats des résultats de haute résolution.
Le nom "U-Net" est dérivé de son diagramme symétrique en forme de U, qui modifie un diagramme standard. autoencodeur standard. L'architecture est composée de trois sections principales qui collaborent pour extraire les caractéristiques et reconstruire l'image avec des masques de segmentation détaillés. avec des masques de segmentation détaillés.
U-Net a été présenté dans l'article fondateur "U-Net : Réseaux convolutifs pour la segmentation d'images biomédicales" et a depuis été adapté à de nombreux secteurs d'activité exigeant une segmentation précise des images. localisation.
Dans le domaine des soins de santé, la précision est essentielle. U-Net est largement utilisé dans l'analyse d'images médicales pour automatiser la détection des anomalies. Par exemple, il aide les radiologues à segmenter les tumeurs dans les IRM ou à compter les cellules individuelles dans les images de microscopie. ou en comptant les cellules individuelles dans les images de microscopie. l'IA dans les soins de santé.
L'architecture est également essentielle pour l'analyse de l'imagerie satellitaire. Les modèles U-Net peuvent segment types d'occupation du sol - en distinguant l'eau, les forêts et les zones urbaines - afin de track déforestation ou de track santé des cultures. la déforestation ou surveiller la santé des cultures pour l'agriculture intelligente.
Pour comprendre U-Net, il faut le distinguer des autres tâches de vision :
Alors que la mise en œuvre d'un U-Net brut implique souvent l'écriture d'un code verbeux dans des frameworks tels que PyTorch ou TensorFlowdes bibliothèques modernes simplifient ce processus. L'écosystème Ultralytics offre des modèles de segmentation optimisés qui qui s'appuient sur des principes architecturaux similaires pour des performances en temps réel.
L'exemple suivant montre comment utiliser un modèle pré-entraîné de modèle de segmentationYOLO11 pré-entraîné pour générer des des masques au niveau des pixels :
from ultralytics import YOLO
# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image to detect and segment objects
results = model("path/to/image.jpg")
# Display the results with segmentation masks overlaid
results[0].show()
Ce flux de travail rationalisé permet aux développeurs d'intégrer des fonctionnalités de segmentation complexes dans les applications pour déploiement de modèles sur les appareils périphériques. Lors de l'entraînement de ces modèles sur des ensembles de données personnalisés, l'utilisation de la technologie augmentation des données est fortement de données est fortement recommandée afin d'éviter surajustementun problème courant lorsque l'on travaille avec des annotations précises au niveau du pixel.