Entdecken Sie die Bildklassifizierung mit Ultralytics YOLO: Trainieren Sie mithilfe modernster Tools benutzerdefinierte Modelle für das Gesundheitswesen, die Landwirtschaft, den Einzelhandel und mehr.
Die Bildklassifizierung ist eine grundlegende Aufgabe in der Computer Vision (CV), bei der es darum geht, ein einzelnes, spezifisches Etikett für ein ganzes Bild aus einem vordefinierten Satz von Kategorien zuzuweisen. Das Hauptziel besteht darin, das Hauptmotiv eines Bildes zu identifizieren und es entsprechend zu kategorisieren. Ein Klassifizierungsmodell würde zum Beispiel ein Bild analysieren und eine Bezeichnung wie "Katze", "Hund" oder "Auto" ausgeben. Diese Aufgabe bildet die Grundlage für viele komplexere Lebenslaufanwendungen und ist eine Kernkomponente des maschinellen Lernens (ML). Der Prozess stützt sich auf Algorithmen, vor allem auf Convolutional Neural Networks (CNNs), um aus großen markierten Datensätzen Unterscheidungsmerkmale zu lernen.
Bildklassifizierungsmodelle werden mit Hilfe von überwachtem Lernen trainiert, wobei sie mit einer großen Anzahl von Bildern gefüttert werden, die bereits manuell mit der richtigen Klasse gekennzeichnet wurden. Während des Trainings lernt das neuronale Netz, Muster, Texturen, Formen und Farbkombinationen zu erkennen, die mit jeder Kategorie verbunden sind. Dieses Lernen wird durch einen Prozess namens Backpropagation erreicht, der die internen Parameter oder Gewichte des Modells anpasst, um die Differenz zwischen den Vorhersagen und den tatsächlichen Kennzeichnungen zu minimieren.
Moderne Klassifizierungsmodelle verwenden oft Deep-Learning-Architekturen mit vielen Schichten. Frühe Schichten können lernen, einfache Merkmale wie Kanten und Ecken zu erkennen, während tiefere Schichten diese kombinieren, um komplexere Strukturen wie Augen, Räder oder Gesichter zu erkennen. Die letzte Schicht des Netzwerks verwendet in der Regel eine Softmax-Funktion, um eine Wahrscheinlichkeitsbewertung für jede mögliche Klasse zu erstellen. Die Klasse mit der höchsten Wahrscheinlichkeit wird als endgültige Vorhersage ausgewählt. Der Schlüssel zu diesem Prozess ist die Merkmalsextraktion, bei der das Modell automatisch die informativsten Merkmale für die Klassifizierungsaufgabe erlernt.
Die Bildklassifizierung wird in zahlreichen Branchen eingesetzt, um visuelle Erkennungsaufgaben zu automatisieren und zu skalieren. Zwei prominente Beispiele sind:
Die Bildklassifizierung ist zwar eng mit anderen Bildverarbeitungsaufgaben verwandt, hat aber einen anderen Zweck. Es ist wichtig, sie von anderen Aufgaben zu unterscheiden:
Zusammenfassend lässt sich sagen, dass die Klassifizierung Aufschluss darüber gibt , was in einem Bild vorhanden ist, die Erkennung gibt Aufschluss darüber, was und wo es zu finden ist, und die Segmentierung liefert eine detaillierte Karte auf Pixelebene von allem, was sich in der Szene befindet.
Die YOLO-Modelle von Ultralytics sind nicht nur für die Objekterkennung bekannt, sondern eignen sich auch hervorragend für Bildklassifizierungsaufgaben. Hochmoderne Modelle wie YOLO11 können mit dem intuitiven Ultralytics Python-Paket oder der programmierfreien Ultralytics HUB-Plattform leicht auf benutzerdefinierten Datensätzen trainiert oder feinabgestimmt werden.
Unsere Dokumentation bietet umfangreiche Ressourcen, darunter Tipps zum Training von Modellen und eine detaillierte Anleitung zur Verwendung von YOLO11 für die Bildklassifizierung. Entwickler können vortrainierte Modelle auf Benchmark-Datensätzen wie ImageNet, CIFAR-100 und Caltech-101 nutzen oder ein neues Modell von Grund auf trainieren. Für diejenigen, die sich für die neuesten Fortschritte interessieren, bieten Ressourcen wie Papers With Code einen umfassenden Überblick über die leistungsfähigsten Modelle. Sie können auch die Leistung von YOLO-Modellen mit Standard-Benchmarks vergleichen. Frameworks wie PyTorch und TensorFlow bieten die Grundlage für den Aufbau und das Training dieser Modelle.