Instance Segmentation
Lerne, wie Instanzsegmentierung Objekterkennung auf Pixelebene ermöglicht. Entdecke, wie du Ultralytics YOLO26 für schnelle Echtzeit-Maskengenerierung und mehr verwendest.
Die Instanzsegmentierung ist ein hochentwickeltes Verfahren im Bereich Computer Vision (CV), das jedes einzelne Objekt von Interesse innerhalb eines Bildes auf Pixelebene identifiziert und abgrenzt. Während die Standard-Objekterkennung Elemente mithilfe rechteckiger Bounding Boxes lokalisiert, geht die Instanzsegmentierung einen Schritt weiter und generiert für jedes erkannte Objekt eine präzise Maske. Diese Fähigkeit ermöglicht es Modellen der Künstlichen Intelligenz (KI), zwischen einzelnen Objekten derselben Klasse zu unterscheiden – etwa beim Trennen zweier sich überschneidender Personen – und bietet so ein reichhaltigeres und detaillierteres Verständnis der visuellen Szene im Vergleich zu einfacheren Klassifizierungsmethoden.
Link to this sectionUnterscheidung der Segmentierungsarten#
Um den Nutzen der Instanzsegmentierung vollständig zu erfassen, ist es hilfreich, sie von anderen verwandten Bildverarbeitungsaufgaben abzugrenzen. Jede Methode bietet je nach Anwendungsanforderung einen unterschiedlichen Grad an Granularität.
- Semantische Segmentierung: Dieser Ansatz klassifiziert jedes Pixel in einem Bild in eine Kategorie (z. B. "Straße", "Himmel", "Auto"). Er unterscheidet jedoch nicht zwischen separaten Objekten derselben Kategorie. Wenn drei Autos nebeneinander geparkt sind, betrachtet die semantische Segmentierung sie als eine einzige "Auto"-Region.
- Instanzsegmentierung: Diese Methode behandelt jedes Objekt als ein einzigartiges Entität. Sie erkennt einzelne Instanzen und weist den Pixeln jeder Instanz ein eindeutiges Label zu. Im Beispiel der geparkten Autos würde die Instanzsegmentierung drei verschiedene Masken erstellen und "Auto A", "Auto B" und "Auto C" separat identifizieren.
- Panoptische Segmentierung: Ein hybrider Ansatz, der die Hintergrundmarkierung der semantischen Segmentierung mit der zählbaren Objekterkennung der Instanzsegmentierung kombiniert.
Link to this sectionDie Mechanismen der Analyse auf Pixelebene#
Moderne Instanzsegmentierungsmodelle stützen sich typischerweise auf fortschrittliche Deep Learning (DL)-Architekturen, insbesondere Convolutional Neural Networks (CNNs). Diese Netzwerke extrahieren Merkmale aus einem Bild, um sowohl die Klasse eines Objekts als auch dessen räumliche Kontur vorherzusagen. Historisch gesehen waren zweistufige Architekturen wie Mask R-CNN der Standard, bei denen zuerst Regionen von Interesse vorgeschlagen und dann zu Masken verfeinert wurden.
Neuere Fortschritte haben jedoch zu einstufigen Detektoren wie YOLO26 geführt, die Erkennung und Segmentierung gleichzeitig durchführen. Dieser "End-to-End"-Ansatz verbessert die Echtzeit-Inferenz-Geschwindigkeiten erheblich, wodurch es möglich wird, hochpräzise Segmentierung auf Live-Videostreams auf Consumer-Hardware anzuwenden.
Link to this sectionPraxisanwendungen#
Die präzisen Grenzen, die durch die Instanzsegmentierung bereitgestellt werden, sind entscheidend für Branchen, in denen das Verständnis der genauen Form und Position eines Objekts für die Entscheidungsfindung erforderlich ist.
- KI im Gesundheitswesen: In der medizinischen Diagnostik ist die Identifizierung der genauen Größe und Form von Tumoren oder Läsionen von entscheidender Bedeutung. Die Instanzsegmentierung ermöglicht es Modellen, Anomalien in MRT-Scans mit hoher Präzision abzugrenzen, was Radiologen bei der Behandlungsplanung und der Überwachung des Krankheitsverlaufs unterstützt.
- Autonome Fahrzeuge: Selbstfahrende Autos sind auf Segmentierung angewiesen, um sich in komplexen Umgebungen zurechtzufinden. Unter Verwendung von Datensätzen wie Cityscapes können Fahrzeuge befahrbare Oberflächen identifizieren, Fahrbahnmarkierungen erkennen und einzelne Fußgänger an überfüllten Zebrastreifen trennen, um die Sicherheit zu gewährleisten.
- KI in der Landwirtschaft: Die Präzisionslandwirtschaft nutzt Segmentierung zur Überwachung der Pflanzengesundheit. Roboter, die mit Bildverarbeitungssystemen ausgestattet sind, können einzelne Früchte für die automatisierte Ernte identifizieren oder spezifische Unkräuter für die gezielte Herbizidausbringung erkennen, was den Chemieeinsatz reduziert und den Ertrag optimiert.
Link to this sectionImplementierung von Segmentierung mit Python#
Entwickler können die Instanzsegmentierung einfach mit der ultralytics-Bibliothek implementieren. Das folgende Beispiel zeigt, wie du ein vortrainiertes YOLO26-Modell lädst und Segmentierungsmasken für ein Bild erzeugst.
from ultralytics import YOLO
# Load a pre-trained YOLO26 instance segmentation model
# The 'n' suffix denotes the nano version, optimized for speed
model = YOLO("yolo26n-seg.pt")
# Run inference on an image
# This predicts classes, bounding boxes, and masks
results = model("https://ultralytics.com/images/bus.jpg")
# Visualize the results
# Displays the image with overlaid segmentation masks
results[0].show()Link to this sectionHerausforderungen und Modelltraining#
Obwohl die Instanzsegmentierung leistungsstark ist, ist sie im Vergleich zur einfachen Bounding-Box-Erkennung rechenintensiv. Die Generierung von pixelgenauen Masken erfordert erhebliche GPU-Ressourcen und eine präzise Datenannotation. Das Annotieren von Daten für diese Aufgaben erfordert das Zeichnen enger Polygone um jedes Objekt, was zeitaufwändig sein kann.
Um diesen Prozess zu rationalisieren, verwenden Teams häufig Tools wie die Ultralytics Platform, die Funktionen für Datensatzverwaltung, Auto-Annotation und cloudbasiertes Training bietet. Dies ermöglicht es Entwicklern, Modelle auf benutzerdefinierten Daten – wie spezifischen industriellen Teilen oder biologischen Proben – feinabzustimmen und sie effizient auf Edge AI-Geräten mithilfe optimierter Formate wie ONNX oder TensorRT bereitzustellen.






