Triff YOLO26: Vision-KI der nächsten Generation.
Ultralytics
Anleitungen

Was ist Schwellenwertbildung in der Bildverarbeitung?

Erkunde die Schwellenwertbildung (Thresholding) in der Bildverarbeitung mit diesem Leitfaden. Lerne, was Thresholding ist und welche verschiedenen Techniken es gibt, einschließlich der Otsu-Schwellenwertbildung.

ABAbirami Vina
5 min read
Ein Graustufenbild, das mittels Schwellenwertbildung in Schwarz-Weiß konvertiert wurde

Für eine visuelle Übersicht der in diesem Artikel behandelten Konzepte, schau dir das Video unten an.

Als Menschen nehmen wir Bilder als zusammenhängende, aussagekräftige Motive wahr, während Computer sie als Raster aus winzigen Pixeln sehen, den kleinsten Bestandteilen eines digitalen Bildes. In einem Prozess namens Bildverarbeitung können diese Pixel angepasst oder analysiert werden, um das Bild zu verbessern und nützliche Informationen zu extrahieren.

Eine gängige Technik der Bildverarbeitung wird Bildschwellenwertbildung genannt. Diese Methode wandelt Graustufenbilder (bei denen jedes Pixel einen Grauton darstellt) in Schwarz-Weiß-Bilder um, indem jedes Pixel mit einem festgelegten Wert verglichen wird. Dadurch entsteht eine klare Trennung zwischen wichtigen Bereichen und dem Hintergrund.

Die Schwellenwertbildung wird häufig bei der Bildsegmentierung verwendet, einer Technik, die ein Bild in aussagekräftige Regionen unterteilt, um die Analyse zu erleichtern. Dies ist in der Regel einer der ersten Schritte, um Maschinen bei der Interpretation visueller Daten zu unterstützen. In diesem Artikel betrachten wir, was Schwellenwertbildung ist, wie sie funktioniert und wo sie in realen Szenarien eingesetzt wird. Fangen wir an!

Link to this sectionGrundlegende Terminologie der Bildschwellenwertbildung#

Bevor wir uns damit befassen, wie die Schwellenwertbildung funktioniert, werfen wir zunächst einen genaueren Blick auf die grundlegenden Konzepte dahinter und wie sie in der Bildverarbeitung eingesetzt wird.

Link to this sectionBinärer Bildschwellenwert#

Stell dir vor, du arbeitest mit einem Bild und möchtest die Objekte darin vom Hintergrund trennen. Eine Möglichkeit hierfür ist die Schwellenwertbildung. Sie vereinfacht das Bild so, dass jedes Pixel entweder vollständig schwarz oder vollständig weiß ist. Das Ergebnis ist ein binäres Bild, bei dem jedes Pixel einen Wert von 0 (schwarz) oder 255 (weiß) hat. Dieser Schritt ist in der Bildverarbeitung oft nützlich, da er wichtige Bildteile klar hervortreten lässt.

Ein Graustufenbild und seine binäre Ausgabe nach dem Thresholding

Abb. 1: Ein Graustufenbild und seine binäre Ausgabe nach der Schwellenwertbildung. (Quelle: blog.devops.dev)

Link to this sectionHistogramm#

Wenn du verstehen möchtest, wie die Helligkeitswerte in einem Bild verteilt sind, kann dir ein Histogramm helfen. Es ist eine Grafik, die zeigt, wie häufig jede Pixelintensität vorkommt, von schwarz (0) bis weiß (255).

Durch den Blick auf das Histogramm kannst du sehen, ob das Bild dunkel, hell oder mittelmäßig ist. Dies erleichtert die Wahl eines guten Schwellenwerts bei der Umwandlung des Bildes in Schwarz-Weiß, da du Muster und Kontraststufen auf einen Blick erkennen kannst.

Link to this sectionVordergrund und Hintergrund#

Sobald ein Bild einer Schwellenwertbildung unterzogen wurde, wird es in zwei Teile unterteilt: den Vordergrund und den Hintergrund. Der Vordergrund, typischerweise in Weiß dargestellt, hebt die wichtigen Elemente hervor, wie Text, Formen oder Objekte, die du erkennen möchtest. Der Hintergrund, in Schwarz dargestellt, ist alles andere. Diese Trennung hilft Maschinen, sich auf das Wesentliche im Bild zu konzentrieren.

Link to this sectionSegmentierung#

Wie bereits erwähnt, unterteilt die Segmentierung ein Bild in bedeutungsvolle Regionen basierend auf Merkmalen wie Helligkeit oder Textur. Die Schwellenwertbildung ist eine einfache Methode, dies zu erreichen, und oft einer der ersten Schritte in einer Computer-Vision-Pipeline.

Computer Vision ist ein Zweig der KI, der Maschinen in die Lage versetzt, visuelle Daten ähnlich wie Menschen zu verarbeiten und zu interpretieren. Durch die Verwendung von Schwellenwertbildung früh im Prozess können Computer-Vision-Systeme Objekte von ihrem Hintergrund trennen, was spätere Schritte wie die Erkennung oder Identifizierung präziser macht.

Link to this sectionGlobale Schwellenwertbildung#

Nachdem wir nun ein besseres Verständnis davon haben, was Schwellenwertbildung ist, gehen wir durch, wie man ein Bild schwellwertbasiert verarbeitet und welche verschiedenen Arten der Schwellenwertbildung es in der Bildverarbeitung gibt.

Beispielsweise ist die globale Schwellenwertbildung eine der einfachsten Methoden, um ein binäres Bild zu erzeugen. Sie wendet einen einzigen Intensitätswert auf das gesamte Bild an. Pixel, die heller als dieser Schwellenwert sind, werden weiß, während dunklere schwarz werden. Dies hilft dabei, das Objekt vom Hintergrund zu trennen.

Sie funktioniert am besten, wenn das Bild eine gleichmäßige Beleuchtung und einen starken Kontrast aufweist. Bei ungleichmäßiger Beleuchtung oder Bereichen mit geringem Kontrast kann ein einzelner Schwellenwert jedoch Details übersehen oder Kanten verwischen.

Um dem entgegenzuwirken, werden Methoden wie die Otsu-Schwellenwertbildung verwendet. Anstatt einen Wert manuell festzulegen, analysiert die Otsu-Methode das Histogramm des Bildes und wählt einen Schwellenwert, der die Pixelintensitäten am besten in Vordergrund und Hintergrund trennt.

Ein Bild von Saturn vor und nach der Anwendung von Otsu-Thresholding

Abb. 2: Ein Bild des Saturn vor und nach der Anwendung der Otsu-Schwellenwertbildung. (Quelle)

Link to this sectionLokale (adaptive) Schwellenwertbildung#

Im Gegensatz zur globalen Schwellenwertbildung berechnet die adaptive oder lokale Schwellenwertbildung den Schwellenwert separat für verschiedene Teile des Bildes. Das macht sie effektiver bei Bildern mit ungleichmäßiger Beleuchtung, wie zum Beispiel bei eingescannten Dokumenten mit Schatten oder strukturierten Oberflächen.

Sie funktioniert, indem das Bild in kleine Regionen unterteilt wird und ein lokaler Schwellenwert für jeden Block berechnet wird, was dazu beiträgt, den Kontrast zwischen Vordergrund und Hintergrund zu erhalten. Dieser Ansatz wird häufig bei Aufgaben wie Texterkennung, medizinischer Bildgebung und Oberflächeninspektion verwendet, bei denen die Beleuchtung über das Bild hinweg variiert.

Einige gängige Ansätze zur adaptiven Schwellenwertbildung in der Bildverarbeitung sind die adaptive Mittelwert-Schwellenwertbildung und die adaptive Gauß-Schwellenwertbildung. Bei der adaptiven Mittelwert-Schwellenwertbildung wird die durchschnittliche Pixelintensität in einer lokalen Nachbarschaft als Schwellenwert für das zentrale Pixel verwendet. Die adaptive Gauß-Schwellenwertbildung hingegen verwendet einen gewichteten Mittelwert mit einem Gauß-Fenster, wobei Pixeln, die näher am Zentrum liegen, mehr Bedeutung beigemessen wird.

Link to this sectionReale Anwendungen der Schwellenwertbildung in der Bildverarbeitung#

Als Nächstes erkunden wir, wo Bildschwellenwertbildung in realen Anwendungen eingesetzt wird.

Link to this sectionBildschwellenwertbildung für Dokumenten-Binarisierung und OCR#

Alte Bücher und handschriftliche Briefe werden häufig gescannt, um sie zu bewahren oder mithilfe von OCR (Optische Zeichenerkennung), einer Technologie zum Lesen gedruckter oder handschriftlicher Zeichen, in digitalen Text umzuwandeln. Bevor der Text extrahiert werden kann, muss das Dokument meist gereinigt oder vorverarbeitet werden. Scans weisen oft Schatten, verblasste Tinte oder ungleichmäßige Beleuchtung auf, was die Zeichenerkennung erschweren kann.

Um die Klarheit zu verbessern, wird die Schwellenwertbildung verwendet, um Graustufenbilder in ein binäres Format zu konvertieren, was hilft, den Text vom Hintergrund zu isolieren. Dunklere Bereiche, wie die Buchstaben, werden schwarz, während der hellere Hintergrund weiß wird – was es OCR-Systemen erheblich erleichtert, den Text zu lesen.

Ein historisches Dokument und sein thresholded Bild

Abb. 3: Ein Beispiel für ein historisches Dokument und sein schwellwertbasiertes Bild. (Quelle)

Link to this sectionVerwendung von Schwellenwertbildung in der medizinischen Bildverarbeitung#

Ähnlich wird in der medizinischen Bildgebung die Schwellenwertbildung häufig verwendet, um spezifische Strukturen in Scans zu isolieren, wie etwa Knochen oder Lungen in Röntgenbildern. Durch die Konvertierung von Graustufenbildern in ein binäres Format wird es einfacher, Regionen von Interesse vom umliegenden Gewebe zu trennen und das Bild für eine weitere Analyse vorzubereiten. In komplexeren Fällen kann eine mehrstufige Schwellenwertbildung angewendet werden, um das Bild in mehrere unterschiedliche Regionen zu unterteilen, wodurch verschiedene Arten von Gewebe oder Strukturen gleichzeitig identifiziert werden können.

Anwendung von Multi-Level-Thresholding-Methoden auf Röntgenaufnahmen des Brustkorbs

Abb. 4: Verwendung von mehrstufigen Schwellenwertmethoden bei Röntgenaufnahmen der Brust. (Quelle: sciencedirect.com)

Link to this sectionVor- und Nachteile der Schwellenwertbildung in der Bildverarbeitung#

Hier sind einige der wichtigsten Vorteile der Verwendung von Schwellenwertbildung in der Bildverarbeitung:

  • Ressourcenschonend: Die Schwellenwertbildung funktioniert gut auf Geräten mit geringer Leistung und benötigt keinen Cloud-Zugriff oder High-End-Hardware, was sie für eingebettete Systeme und Offline-Setups geeignet macht.
  • Leicht zu interpretieren: Ihre einfache Logik macht die Ergebnisse der Schwellenwertbildung leicht verständlich und debuggbar, was in Bereichen wie dem Gesundheitswesen oder der Dokumentenverarbeitung, wo Transparenz wichtig ist, von entscheidender Bedeutung ist.
  • Schnelles Testen: Die Schwellenwertbildung ermöglicht es Teams, schnell Segmentierungsideen in Projekten der Frühphase zu erkunden, bevor sie zu komplexeren Modellen übergehen.

Obwohl die Bildschwellenwertbildung in vielen Szenarien nützlich ist, bringt sie auch gewisse Einschränkungen mit sich. Hier sind einige Herausforderungen im Zusammenhang mit der Schwellenwertbildung, die es zu berücksichtigen gilt:

  • Mangelnde Anpassungsfähigkeit: Die Schwellenwertbildung folgt festen Regeln und passt sich nicht ohne manuelle Anpassung an neue Lichtverhältnisse oder Datenvariationen an.
  • Empfindlich gegenüber Rauschen: Kleine Helligkeitsänderungen durch Schatten oder Reflexionen können die Ergebnisse verfälschen, insbesondere bei der Arbeit mit detaillierten oder strukturierten Bildern.
  • Statisch und regelbasiert: Im Gegensatz zu KI-Modellen lernt die Schwellenwertbildung nicht aus Daten und verbessert sich nicht mit der Zeit. Sie funktioniert nur unter den engen Bedingungen, für die sie konzipiert wurde.

Link to this sectionJenseits der Bildschwellenwertbildung: Wann Computer Vision das richtige Werkzeug ist#

Die Schwellenwertbildung funktioniert gut für einfache Segmentierungsaufgaben in kontrollierten Umgebungen. Sie hat jedoch oft Probleme bei der Verarbeitung komplexer Bilder, die mehrere Objekte oder Hintergrundrauschen enthalten. Da sie auf festen Regeln basiert, fehlt der Schwellenwertbildung die Flexibilität, die für die meisten realen Anwendungen erforderlich ist.

Um über diese Grenzen hinauszugehen, nutzen viele moderne Systeme heute Computer Vision. Im Gegensatz zur Schwellenwertbildung sind Vision-KI-Modelle darauf trainiert, komplexe Muster und Merkmale zu erkennen, was sie weitaus genauer und anpassungsfähiger macht.

Beispielsweise können Computer-Vision-Modelle wie Ultralytics YOLO11 Objekte in Echtzeit erkennen und Bilder segmentieren. Dies macht sie ideal für Aufgaben wie das Erkennen von Ampelsignalen bei autonomen Fahrzeugen oder das Identifizieren von Ernteproblemen in der Landwirtschaft.

Insbesondere unterstützt YOLO11 eine Reihe von Computer-Vision-Aufgaben, wie die Instanzsegmentierung, bei der jedes Objekt in einem Bild separat segmentiert wird. Es kann auch andere visionbasierte Aufgaben ausführen, einschließlich Posenschätzung (Bestimmung der Position oder Haltung eines Objekts) und Objektverfolgung (Verfolgen eines Objekts, während es sich über Videoframes hinweg bewegt).

YOLO11 beim Erkennen und Segmentieren von Objekten in einem Bild

Abb. 5: YOLO11 macht die Erkennung und Segmentierung von Objekten einfach. (Quelle)

Während die Schwellenwertbildung für einfache Aufgaben oder das Testen erster Ideen gut funktioniert, sind Anwendungen, die Geschwindigkeit, Genauigkeit und Flexibilität erfordern, in der Regel mit Computer Vision besser bedient.

Link to this sectionWichtige Erkenntnisse#

Die Schwellenwertbildung ist ein wichtiges Werkzeug in der Bildverarbeitung, da sie schnell und einfach zur Trennung von Objekten vom Hintergrund eingesetzt werden kann. Sie funktioniert gut bei eingescannten Dokumenten, medizinischen Bildern und der Überprüfung von Produktfehlern in Fabriken.

Wenn Bilder und Videos jedoch komplexer werden, können grundlegende Methoden der Bildverarbeitung wie die Schwellenwertbildung an ihre Grenzen stoßen. Genau hier können fortschrittliche Computer-Vision-Modelle einspringen. Modelle wie YOLO11 können mehr Aufgaben verstehen und ausführen, viele Objekte gleichzeitig erkennen und in Echtzeit arbeiten, was sie für viele Anwendungsfälle nützlich macht.

Möchtest du mehr über KI wissen? Schau dir unsere Community und unser GitHub-Repository an. Erkunde unsere Lösungsseiten, um mehr über KI in der Robotik und Computer Vision in der Landwirtschaft zu erfahren. Entdecke unsere Lizenzierungsoptionen und beginne noch heute mit der Entwicklung von Computer Vision!

Explore solutions

Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr
Real-time AI that works with your team

KI in der Robotik

Stärke intelligentere Maschinen mit Ultralytics YOLO Modellen. Vision AI in der Robotik treibt autonome Navigation, Wahrnehmung, Objektverfolgung und Echtzeitsteuerung voran.

Erfahre mehr
Real-time AI that works with your team

KI in der Logistik

Optimiere die Logistik mit Ultralytics YOLO-Modellen. Vision AI ermöglicht Paketkontrolle, Sortierung, Fahrzeugverfolgung und Echtzeit-Überwachung der Lagersicherheit.

Erfahre mehr
Real-time AI that works with your team

KI im Einzelhandel

Erfinde den Einzelhandel neu mit Ultralytics YOLO-Modellen. Vision AI fördert Bestandsverfolgung, Regalüberwachung, Warteschlangenmanagement und intelligentere Kundeneinblicke.

Erfahre mehr
Real-time AI that works with your team

KI im Gesundheitswesen

Baue Gesundheitslösungen mit Ultralytics YOLO Modellen. Vision AI im Gesundheitswesen ermöglicht schnellere medizinische Bildgebung, intelligentere Diagnostik und Patientenüberwachung.

Erfahre mehr
Real-time AI that works with your team

KI in der Fertigung

Optimiere die Fertigung mit Ultralytics YOLO-Modellen. Vision AI treibt Qualitätskontrolle, Fehlererkennung, PSA-Einhaltung und die Automatisierung von Montagelinien voran.

Erfahre mehr
Real-time AI that works with your operation

KI in der Automobilbranche

Nutze Computer Vision in der Automobilindustrie mit Ultralytics YOLO Modellen. Vision AI steigert die Verkehrssicherheit, Fahrerassistenz und Fahrzeugautomatisierung für intelligentere Straßen.

Erfahre mehr
Real-time AI tailored to your operation

KI in der Landwirtschaft

Bringe Vision AI mit Ultralytics YOLO Modellen in die smarte Landwirtschaft. Optimiere die Ernteüberwachung, Viehverfolgung und Präzisionslandwirtschaft für höhere, intelligentere Erträge.

Erfahre mehr

Lass uns gemeinsam die Zukunft der KI bauen!

Beginne deine Reise mit der Zukunft des maschinellen Lernens