Schalten Sie ein zu YOLO Vision 2025!
25. September 2025
10:00 — 18:00 Uhr BST
Hybride Veranstaltung
Yolo Vision 2024
Glossar

Instanzsegmentierung

Entdecken Sie, wie Instanzsegmentierung die Objekterkennung mit Pixel-genauer Präzision verfeinert und detaillierte Objektmasken für KI-Anwendungen ermöglicht.

Die Instanzsegmentierung ist eine fortgeschrittene Computer-Vision (CV)-Aufgabe, die einzelne Objekte innerhalb eines Bildes auf Pixelebene identifiziert und abgrenzt. Im Gegensatz zu anderen Vision-Aufgaben klassifiziert sie nicht nur ein Bild oder zeichnet einen Bounding Box um Objekte, sondern erzeugt eine präzise Pixelweise-Maske für jede einzelne Objektinstanz. Diese Technik ermöglicht ein viel tieferes Verständnis einer Szene, da sie zwischen überlappenden Objekten derselben Klasse unterscheiden kann.

Instanz- vs. semantische Segmentierung und Objekterkennung

Es ist wichtig, Instanzsegmentierung von anderen verwandten Computer-Vision-Aufgaben zu unterscheiden.

  • Objekterkennung: Diese Aufgabe identifiziert das Vorhandensein und die Position von Objekten, typischerweise durch das Zeichnen rechteckiger Bounding Boxes um sie herum und das Zuweisen einer Klassenbezeichnung. Sie beantwortet die Frage "Was ist in dem Bild und wo ist es?", liefert aber keine Forminformationen.
  • Semantische Segmentierung: Diese Aufgabe klassifiziert jedes Pixel in einem Bild in eine bestimmte Kategorie. Zum Beispiel würde sie alle Pixel, die zu Autos gehören, als „Auto“ kennzeichnen, aber sie würde nicht zwischen zwei verschiedenen Autos im Bild unterscheiden. Sie beantwortet die Frage: „Zu welcher Kategorie gehört jedes Pixel?“
  • Instanzsegmentierung: Dies kombiniert die Fähigkeiten der Objekterkennung und der semantischen Segmentierung. Sie erkennt jede Objektinstanz und generiert eine eindeutige Segmentierungsmaske dafür. In einem Bild mit drei Autos würde die Instanzsegmentierung drei separate Masken ausgeben, die jeweils einem bestimmten Auto entsprechen.
  • Panoptic Segmentation: Dies ist die umfassendste der Segmentierungsaufgaben, die Semantic und Instance Segmentation zusammenführt. Sie weist jedem Pixel eine Klassenbezeichnung und eine eindeutige Instanz-ID zu und bietet so ein vollständiges, einheitliches Verständnis der Szene.

Wie Instanzsegmentierung funktioniert

Instanzsegmentierungsmodelle führen typischerweise zwei Hauptfunktionen aus: Erstens erkennen sie alle Objektinstanzen in einem Bild, und zweitens erzeugen sie eine Segmentierungsmaske für jede erkannte Instanz. Dieser Prozess wurde durch Architekturen wie Mask R-CNN bekannt gemacht, die Objektdetektoren wie Faster R-CNN erweitert, indem sie einen parallelen Zweig hinzufügt, der eine binäre Maske für jede Region von Interesse vorhersagt. Moderne Modelle haben diesen Prozess weiter verfeinert, um eine bessere Geschwindigkeit und Genauigkeit zu erzielen und Echtzeit-Inferenz in vielen Anwendungen zu ermöglichen. Die Entwicklung stützt sich oft auf leistungsstarke Deep-Learning-Frameworks wie PyTorch und TensorFlow.

Anwendungsfälle in der Praxis

Die detaillierten Objektumrisse, die durch die Instanzsegmentierung bereitgestellt werden, sind in zahlreichen Bereichen wertvoll.

  • Autonome Fahrzeuge: Selbstfahrende Autos sind auf die Instanzsegmentierung angewiesen, um die Form und Position einzelner Fußgänger, Fahrzeuge und Radfahrer präzise zu identifizieren. Diese granularen Details sind entscheidend für eine sichere Navigation und Pfadplanung, insbesondere in komplexen städtischen Umgebungen mit vielen sich überschneidenden Objekten. Datensätze wie Cityscapes haben maßgeblich zur Weiterentwicklung dieses Bereichs beigetragen.
  • Medizinische Bildanalyse: In der Radiologie wird die Instanzsegmentierung verwendet, um Tumore, Läsionen und Organe aus CT- oder MRT-Scans mit hoher Präzision abzugrenzen. Dies hilft Ärzten, die Größe eines Tumors zu messen, Operationen zu planen und die Wirksamkeit der Behandlung zu überwachen. In unserem Blogbeitrag über die Verwendung von YOLO11 zur Tumorerkennung erfahren Sie mehr darüber.
  • Robotik: Roboter nutzen die Instanzsegmentierung, um ihre Umgebung zu verstehen, bestimmte zu greifende Objekte zu identifizieren und Hindernisse mit größerer Genauigkeit zu vermeiden. Dies ist entscheidend für Aufgaben in der Fertigung und Logistik.
  • Satellitenbildanalyse: Diese Technik wird verwendet, um einzelne Bäume in einem Wald zu zählen, Gebäude in einer Stadt zu kartieren oder Veränderungen in der Landnutzung im Laufe der Zeit mit Daten von Organisationen wie der NASA zu verfolgen.
  • Landwirtschaft: Sie kann verwendet werden, um einzelne Früchte zur Ertragsschätzung zu identifizieren und zu zählen oder um bestimmte Unkräuter für eine gezielte Herbizidanwendung zu erkennen, ein wichtiger Bestandteil der Präzisionslandwirtschaft.

Instanzsegmentierung mit Ultralytics YOLO

Ultralytics bietet hochmoderne Modelle, die eine effiziente Instanzsegmentierung ermöglichen. Modelle wie YOLOv8 und das neueste YOLO11 sind darauf ausgelegt, eine hohe Leistung bei verschiedenen Bildverarbeitungsaufgaben, einschließlich der Instanzsegmentierung, zu erzielen. Weitere Einzelheiten finden Sie in unserer Dokumentation zur Segmentierungsaufgabe. Benutzer können vortrainierte Modelle nutzen oder ein Fine-Tuning auf benutzerdefinierten Datensätzen wie COCO mit Tools wie der Ultralytics HUB Plattform durchführen, die den Machine-Learning (ML)-Workflow von der Datenverwaltung bis zur Modellbereitstellung vereinfacht. Für die praktische Implementierung stehen Ressourcen wie unser Tutorial zur Segmentierung mit vortrainierten Ultralytics YOLOv8 Modellen oder unser Leitfaden zur Isolierung von Segmentierungsobjekten zur Verfügung. Sie können auch lernen, wie man Ultralytics YOLO11 für die Instanzsegmentierung verwendet.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert