Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Bildklassifizierung

Entdecken Sie die Bildklassifizierung mit Ultralytics YOLO: Trainieren Sie benutzerdefinierte Modelle für das Gesundheitswesen, die Landwirtschaft, den Einzelhandel und mehr mit modernsten Tools.

Die Bildklassifizierung ist eine grundlegende Aufgabe im Bereich Computer Vision (CV), bei der einem gesamten Bild eine einzelne, spezifische Bezeichnung aus einem vordefinierten Satz von Kategorien zugewiesen wird. Das Hauptziel besteht darin, das Hauptobjekt eines Bildes zu identifizieren und es entsprechend zu kategorisieren. Beispielsweise würde ein Klassifizierungsmodell ein Bild analysieren und eine Bezeichnung wie „Katze“, „Hund“ oder „Auto“ ausgeben. Diese Aufgabe bildet die Grundlage für viele komplexere CV-Anwendungen und ist eine Kernkomponente des maschinellen Lernens (ML). Der Prozess stützt sich auf Algorithmen, insbesondere Convolutional Neural Networks (CNNs), um Unterscheidungsmerkmale aus großen, beschrifteten Datensätzen zu lernen.

Wie Bildklassifizierung funktioniert

Bildklassifizierungsmodelle werden mithilfe von überwachtem Lernen trainiert, wobei sie mit einer großen Anzahl von Bildern gefüttert werden, die bereits manuell mit der richtigen Klasse beschriftet wurden. Während des Trainings lernt das neuronale Netzwerk, Muster, Texturen, Formen und Farbkombinationen zu identifizieren, die mit jeder Kategorie verbunden sind. Dieses Lernen wird durch einen Prozess namens Backpropagation erreicht, der die internen Parameter des Modells oder Gewichte anpasst, um die Differenz zwischen seinen Vorhersagen und den tatsächlichen Bezeichnungen zu minimieren.

Moderne Klassifizierungsmodelle verwenden oft Deep-Learning-Architekturen mit vielen Schichten. Frühe Schichten lernen möglicherweise, einfache Merkmale wie Kanten und Ecken zu erkennen, während tiefere Schichten diese kombinieren, um komplexere Strukturen wie Augen, Räder oder Gesichter zu identifizieren. Die letzte Schicht des Netzwerks verwendet typischerweise eine Softmax-Funktion, um eine Wahrscheinlichkeitsbewertung für jede mögliche Klasse zu erzeugen. Die Klasse mit der höchsten Wahrscheinlichkeit wird als endgültige Vorhersage ausgewählt. Entscheidend für diesen Prozess ist die Feature Extraction, bei der das Modell automatisch die informativsten Merkmale für die Klassifizierungsaufgabe lernt.

Anwendungen der Bildklassifizierung

Die Bildklassifizierung wird in zahlreichen Branchen eingesetzt, um visuelle Erkennungsaufgaben zu automatisieren und zu skalieren. Zwei prominente Beispiele sind:

  1. Medizinische Bildanalyse: Im Gesundheitswesen analysieren Klassifikationsmodelle medizinische Scans wie Röntgenaufnahmen, MRTs und CT-Scans, um Radiologen bei der Erkennung von Krankheiten zu helfen. Beispielsweise kann ein Modell auf Tausenden von Mammogrammen trainiert werden, um Bilder entweder als „gutartig“ oder „bösartig“ zu klassifizieren und so die Früherkennung von Brustkrebs zu unterstützen. Dies kann zu schnelleren Diagnosen und weniger menschlichen Fehlern führen. Weitere Informationen hierzu finden Sie in der Übersicht der American Cancer Society über KI in der Krebserkennung.
  2. Landwirtschaftstechnologie: Landwirte nutzen die Bildklassifizierung, um die Gesundheit von Feldfrüchten anhand von Bildern zu überwachen, die von Drohnen oder Satelliten aufgenommen wurden. Ein Modell kann Bilder von Pflanzenblättern in Kategorien wie "gesund", "krank" oder "von Schädlingen befallen" einteilen. Dies ermöglicht eine gezielte Ausbringung von Pestiziden oder Düngemitteln, wodurch die Ernteerträge verbessert und eine nachhaltige Landwirtschaft gefördert werden. Erfahren Sie mehr darüber, wie Ultralytics KI in der Landwirtschaft unterstützt.

Bildklassifizierung vs. verwandte Aufgaben

Obwohl die Bildklassifizierung eng mit anderen Computer-Vision-Aufgaben verwandt ist, hat sie einen eigenen Zweck. Es ist wichtig, sie von Folgendem zu unterscheiden:

  • Objekterkennung: Diese Aufgabe geht einen Schritt weiter als die Klassifizierung. Anstatt dem gesamten Bild eine Bezeichnung zuzuweisen, identifiziert die Objekterkennung mehrere Objekte innerhalb eines Bildes und zeichnet eine Bounding Box um jedes Objekt, wobei jeder Box auch eine Klassenbezeichnung zugewiesen wird. Zum Beispiel würde es ein Bild nicht nur als "Straßenszene" bezeichnen, sondern einzelne "Autos", "Fußgänger" und "Ampeln" lokalisieren und klassifizieren.
  • Bildsegmentierung: Diese Aufgabe liefert das detaillierteste Verständnis eines Bildes, indem jedes Pixel klassifiziert wird. Es gibt verschiedene Arten, darunter die semantische Segmentierung, die jedem Pixel eine Klasse zuweist (z. B. alle Pixel, die zu Autos gehören, haben eine Farbe), und die Instanzsegmentierung, die zwischen verschiedenen Instanzen desselben Objekts unterscheidet (z. B. jedes Auto hat eine andere Farbe). Dieser Detaillierungsgrad ist entscheidend für Anwendungen wie autonome Fahrzeuge.

Zusammenfassend lässt sich sagen, dass die Klassifizierung Ihnen sagt, was sich in einem Bild befindet, die Erkennung sagt Ihnen was und wo, und die Segmentierung liefert eine detaillierte, pixelgenaue Karte von allem, was sich in der Szene befindet.

Bildklassifizierung mit Ultralytics

Obwohl Ultralytics YOLO-Modelle für die Objekterkennung bekannt sind, zeichnen sie sich auch bei Bildklassifizierungsaufgaben aus. Modernste Modelle wie YOLO11 können einfach mit dem intuitiven Ultralytics Python-Paket oder der No-Code-Plattform Ultralytics HUB auf benutzerdefinierten Datensätzen trainiert oder feinabgestimmt werden.

Unsere Dokumentation bietet umfangreiche Ressourcen, einschließlich Tipps zum Modelltraining und eine detaillierte Anleitung zur Verwendung von YOLO11 für die Bildklassifizierung. Entwickler können vortrainierte Modelle auf Benchmark-Datensätzen wie ImageNet, CIFAR-100 und Caltech-101 nutzen oder ein neues Modell von Grund auf trainieren. Für diejenigen, die an den neuesten Fortschritten interessiert sind, bieten Ressourcen wie Papers With Code einen umfassenden Überblick über die leistungsstärksten Modelle. Sie können auch die YOLO-Modellleistung auf Standard-Benchmarks vergleichen. Frameworks wie PyTorch und TensorFlow bilden die Grundlage für den Aufbau und das Training dieser Modelle.

Treten Sie der Ultralytics-Community bei

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert