Entdecken Sie, wie Instanzsegmentierung die Objekterkennung mit Pixel-genauer Präzision verfeinert und detaillierte Objektmasken für KI-Anwendungen ermöglicht.
Die Segmentierung von Instanzen ist eine hochentwickelte Computer Vision (CV) Technik, die einzelne Objekte in einem einzelne Objekte innerhalb eines Bildes auf Pixelebene lokalisiert und abgrenzt. Im Gegensatz zu Objekterkennung, die den Standort eines Objekts Position eines Objekts mit einer rechteckigen Bounding Box annähert, erzeugt die Segmentierung eine präzise Maske, die die genaue Form jedes einzelnen Objekts umreißt. Diese granulare Ebene der Detail ermöglicht es Systemen, zwischen mehreren Instanzen derselben Klasse zu unterscheiden, z. B. zwischen zwei sich überlappenden Autos oder einzelne Personen in einer Menschenmenge - und ist damit eine wichtige Komponente für fortschrittliche Künstliche Intelligenz (KI) Anwendungen.
Um die Instanzsegmentierung vollständig zu verstehen, ist es hilfreich, sie mit anderen grundlegenden Computer Vision Aufgaben zu vergleichen:
Die Instanzsegmentierung verbindet die Lokalisierungsfähigkeiten der Objekterkennung mit der Präzision der semantischen Segmentierung auf Pixelebene. Präzision der semantischen Segmentierung.
Modelle zur Instanzsegmentierung verwenden im Allgemeinen Deep Learning (DL) Architekturen, insbesondere Convolutional Neural Networks (CNNs), um Merkmale aus einem Bild zu extrahieren. Der Prozess umfasst in der Regel zwei parallele Schritte:
Frühe Ansätze wie Mask R-CNN verwendeten einen zweistufigen Prozess, bei dem zunächst der zunächst Regionsvorschläge generiert und diese dann verfeinert. Moderne Architekturen, wie z. B. Ultralytics YOLO11haben dies revolutioniert, indem sie die Erkennung und Segmentierung in einem einzigen Schritt. Dies ermöglicht Echtzeit-Inferenz, die es ermöglicht, Objekte Objekte in Live-Videoströmen mit hoher Geschwindigkeit und Genauigkeit segment .
Die präzise Grenzerkennung, die die Instanzsegmentierung bietet, ist in verschiedenen Branchen unverzichtbar:
Entwickler können die Instanzsegmentierung einfach mit der ultralytics Python . Die Bibliothek
unterstützt YOLO11 Modelle, die auf den
COCOdie 80 gängige Objektkategorien sofort detect und segment kann.
der Box.
Hier ein kurzes Beispiel für das Laden eines Modells und die Segmentierung eines Bildes:
from ultralytics import YOLO
# Load a pre-trained YOLO11 instance segmentation model
model = YOLO("yolo11n-seg.pt")
# Run inference on an image
# The model predicts classes, boxes, and masks simultaneously
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Visualize the results with masks plotted
results[0].show()
Für Benutzer, die dies auf ihre eigenen Daten anwenden wollen, unterstützt das Framework Training auf benutzerdefinierten Datensätzen, so dass das Modell neue Klassen zu lernen, die für Nischenanwendungen spezifisch sind.