Glossar

Bild-Klassifizierung

Entdecken Sie die Bildklassifizierung mit Ultralytics YOLO: Trainieren Sie mithilfe modernster Tools benutzerdefinierte Modelle für das Gesundheitswesen, die Landwirtschaft, den Einzelhandel und mehr.

Die Bildklassifizierung ist eine grundlegende Aufgabe in der Computer Vision (CV), bei der es darum geht, ein einzelnes, spezifisches Etikett für ein ganzes Bild aus einem vordefinierten Satz von Kategorien zuzuweisen. Das Hauptziel besteht darin, das Hauptmotiv eines Bildes zu identifizieren und es entsprechend zu kategorisieren. Ein Klassifizierungsmodell würde zum Beispiel ein Bild analysieren und eine Bezeichnung wie "Katze", "Hund" oder "Auto" ausgeben. Diese Aufgabe bildet die Grundlage für viele komplexere Lebenslaufanwendungen und ist eine Kernkomponente des maschinellen Lernens (ML). Der Prozess stützt sich auf Algorithmen, vor allem auf Convolutional Neural Networks (CNNs), um aus großen markierten Datensätzen Unterscheidungsmerkmale zu lernen.

Wie die Bildklassifizierung funktioniert

Bildklassifizierungsmodelle werden mit Hilfe von überwachtem Lernen trainiert, wobei sie mit einer großen Anzahl von Bildern gefüttert werden, die bereits manuell mit der richtigen Klasse gekennzeichnet wurden. Während des Trainings lernt das neuronale Netz, Muster, Texturen, Formen und Farbkombinationen zu erkennen, die mit jeder Kategorie verbunden sind. Dieses Lernen wird durch einen Prozess namens Backpropagation erreicht, der die internen Parameter oder Gewichte des Modells anpasst, um die Differenz zwischen den Vorhersagen und den tatsächlichen Kennzeichnungen zu minimieren.

Moderne Klassifizierungsmodelle verwenden oft Deep-Learning-Architekturen mit vielen Schichten. Frühe Schichten können lernen, einfache Merkmale wie Kanten und Ecken zu erkennen, während tiefere Schichten diese kombinieren, um komplexere Strukturen wie Augen, Räder oder Gesichter zu erkennen. Die letzte Schicht des Netzwerks verwendet in der Regel eine Softmax-Funktion, um eine Wahrscheinlichkeitsbewertung für jede mögliche Klasse zu erstellen. Die Klasse mit der höchsten Wahrscheinlichkeit wird als endgültige Vorhersage ausgewählt. Der Schlüssel zu diesem Prozess ist die Merkmalsextraktion, bei der das Modell automatisch die informativsten Merkmale für die Klassifizierungsaufgabe erlernt.

Anwendungen der Bildklassifikation

Die Bildklassifizierung wird in zahlreichen Branchen eingesetzt, um visuelle Erkennungsaufgaben zu automatisieren und zu skalieren. Zwei prominente Beispiele sind:

  1. Medizinische Bildanalyse: Im Gesundheitswesen analysieren Klassifizierungsmodelle medizinische Aufnahmen wie Röntgenbilder, MRTs und CT-Scans, um Radiologen bei der Erkennung von Krankheiten zu helfen. So kann beispielsweise ein Modell auf Tausenden von Mammogrammen trainiert werden, um Bilder als "gutartig" oder "bösartig" zu klassifizieren und so die Früherkennung von Brustkrebs zu unterstützen. Dies kann zu schnelleren Diagnosen und weniger menschlichen Fehlern führen. Weitere Informationen hierzu finden Sie in der Übersicht der American Cancer Society über KI in der Krebserkennung.
  2. Landwirtschaftliche Technologie: Landwirte nutzen die Bildklassifizierung, um den Gesundheitszustand von Pflanzen anhand von Drohnen- oder Satellitenbildern zu überwachen. Ein Modell kann Bilder von Pflanzenblättern in Kategorien wie "gesund", "krank" oder "Schädlingsbefall" einteilen. Dies ermöglicht den gezielten Einsatz von Pestiziden oder Düngemitteln, verbessert die Ernteerträge und fördert eine nachhaltige Landwirtschaft. Erfahren Sie mehr darüber, wie Ultralytics KI in der Landwirtschaft unterstützt.

Bildklassifizierung im Vergleich zu verwandten Aufgaben

Die Bildklassifizierung ist zwar eng mit anderen Bildverarbeitungsaufgaben verwandt, hat aber einen anderen Zweck. Es ist wichtig, sie von anderen Aufgaben zu unterscheiden:

  • Objekt-Erkennung: Diese Aufgabe geht einen Schritt weiter als die Klassifizierung. Anstatt dem gesamten Bild ein Etikett zuzuweisen, werden bei der Objekterkennung mehrere Objekte in einem Bild identifiziert und ein Begrenzungsrahmen um jedes einzelne gezeichnet, wobei jedem Rahmen ebenfalls ein Klassenetikett zugewiesen wird. So wird ein Bild beispielsweise nicht nur als "Straßenszene" bezeichnet, sondern es werden auch einzelne "Autos", "Fußgänger" und "Ampeln" lokalisiert und klassifiziert.
  • Bildsegmentierung: Diese Aufgabe liefert das detaillierteste Verständnis eines Bildes, indem jedes Pixel klassifiziert wird. Es gibt verschiedene Arten, darunter die semantische Segmentierung, bei der jedem Pixel eine Klasse zugewiesen wird (z. B. sind alle Pixel, die zu Autos gehören, einfarbig), und die Instanzsegmentierung, bei der zwischen verschiedenen Instanzen desselben Objekts unterschieden wird (z. B. hat jedes Auto eine andere Farbe). Dieser Detaillierungsgrad ist für Anwendungen wie autonome Fahrzeuge entscheidend.

Zusammenfassend lässt sich sagen, dass die Klassifizierung Aufschluss darüber gibt , was in einem Bild vorhanden ist, die Erkennung gibt Aufschluss darüber, was und wo es zu finden ist, und die Segmentierung liefert eine detaillierte Karte auf Pixelebene von allem, was sich in der Szene befindet.

Bildklassifizierung mit Ultralytics

Die YOLO-Modelle von Ultralytics sind nicht nur für die Objekterkennung bekannt, sondern eignen sich auch hervorragend für Bildklassifizierungsaufgaben. Hochmoderne Modelle wie YOLO11 können mit dem intuitiven Ultralytics Python-Paket oder der programmierfreien Ultralytics HUB-Plattform leicht auf benutzerdefinierten Datensätzen trainiert oder feinabgestimmt werden.

Unsere Dokumentation bietet umfangreiche Ressourcen, darunter Tipps zum Training von Modellen und eine detaillierte Anleitung zur Verwendung von YOLO11 für die Bildklassifizierung. Entwickler können vortrainierte Modelle auf Benchmark-Datensätzen wie ImageNet, CIFAR-100 und Caltech-101 nutzen oder ein neues Modell von Grund auf trainieren. Für diejenigen, die sich für die neuesten Fortschritte interessieren, bieten Ressourcen wie Papers With Code einen umfassenden Überblick über die leistungsfähigsten Modelle. Sie können auch die Leistung von YOLO-Modellen mit Standard-Benchmarks vergleichen. Frameworks wie PyTorch und TensorFlow bieten die Grundlage für den Aufbau und das Training dieser Modelle.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert