Entdecken Sie die Bildklassifizierung mit Ultralytics YOLO: Trainieren Sie mithilfe modernster Tools benutzerdefinierte Modelle für das Gesundheitswesen, die Landwirtschaft, den Einzelhandel und mehr.
Die Bildklassifizierung ist eine grundlegende Aufgabe der Computervision (CV), bei der ein ganzes Bild analysiert und ihm eine einzige Bezeichnung aus einer vordefinierten Reihe von Kategorien zugewiesen wird. Dieser Prozess ermöglicht es Maschinen, visuelle Daten zu interpretieren, indem sie die spezifische Frage „Was stellt dieses Bild dar?“ beantworten. Als Kernkomponente der künstlichen Intelligenz (KI) dient die Bildklassifizierung als Baustein für komplexere Erkennungssysteme und ermöglicht es automatisierter Software, riesige Mengen visueller Informationen effizient zu sortieren und zu organisieren.
Der Mechanismus hinter der Bildklassifizierung stützt sich in hohem Maße auf Algorithmen des maschinellen Lernens (ML), insbesondere auf Deep-Learning-Architekturen (DL), die als Convolutional Neural Networks (CNNs) bekannt sind. Diese Netzwerke sind so konzipiert, dass sie die visuelle Verarbeitung des Menschen nachahmen. Durch einen Prozess namens Feature-Extraktion analysiert das Modell Pixeldaten , um Low-Level-Attribute wie Kanten und Texturen zu identifizieren, die dann in tieferen Schichten kombiniert werden, um komplexe Formen und Objekte zu erkennen.
Um einen effektiven Klassifikator zu erstellen, setzen Entwickler auf überwachtes Lernen. Dabei wird das Modell mit einer großen Menge an Trainingsdaten gefüttert, die aus bereits beschrifteten Bildern bestehen. Bekannte Datensätze wie ImageNet bieten Millionen von Beispielen, die Modellen helfen, neue Daten gut zu verallgemeinern. Während der Inferenzphase berechnet das Modell die Wahrscheinlichkeit, dass ein neues Bild zu jeder Klasse gehört, wobei häufig eine Softmax-Funktion verwendet wird, um das Endergebnis zu bestimmen.
Es ist entscheidend, die Bildklassifizierung von anderen Funktionen der Bildverarbeitung zu unterscheiden, um sicherzustellen, dass das richtige Werkzeug für die jeweilige Aufgabe verwendet wird:
Die Einfachheit und Geschwindigkeit der Bildklassifizierung machen sie in verschiedenen Branchen allgegenwärtig.
Im Gesundheitswesen unterstützen Klassifizierungsmodelle medizinisches Fachpersonal durch die Vorauswahl diagnostischer Daten. Beispielsweise können medizinische Bildanalyse -Tools Röntgenbilder oder MRT-Aufnahmen als „normal“ oder „abnormal“ kategorisieren und Radiologen so dabei helfen, dringende Fälle zu priorisieren. Weitere Informationen zu praktischen Anwendungen finden Sie in unserem Leitfaden zur Verwendung von YOLO11 Tumordiagnostik.
Fertigungslinien verwenden Klassifizierungen, um fehlerhafte Teile auf einem Förderband automatisch zu identifizieren und sicherzustellen, dass nur hochwertige Produkte den Verbraucher erreichen. In ähnlicher Weise unterstützt KI im Einzelhandel visuelle Suchmaschinen, mit denen Kunden ein Foto eines Kleidungsstücks hochladen und ähnliche Produkte in einem Online-Katalog finden können. Plattformen wie Google Vision und AWS Rekognition bieten APIs, die diese Funktionen für kommerzielle Zwecke nutzen.
Das Ultralytics ist zwar für die Erkennung bekannt, bietet aber auch robuste Unterstützung für Bildklassifizierungsaufgaben. Die neuesten YOLO26-Modelle bieten modernste Genauigkeit und Geschwindigkeit und eignen sich daher ideal für den Einsatz am Netzwerkrand, wo die Rechenressourcen möglicherweise begrenzt sind.
Nachfolgend finden Sie ein kurzes Beispiel dafür, wie Sie ein vortrainiertes Modell verwenden können, um classify Bild mithilfe der
ultralytics Python . Dies zeigt, wie einfach moderne KI in Anwendungen integriert werden kann.
from ultralytics import YOLO
# Load a pre-trained classification model
model = YOLO("yolo11n-cls.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Print the top predicted class name
print(f"Predicted class: {results[0].names[results[0].probs.top1]}")
Für Nutzer, die an speziellen Anwendungsfällen interessiert sind, ist es unkompliziert, benutzerdefinierte Modelle auf einzigartigen Datensätzen wie CIFAR-10 oder MNIST zu trainieren. Ob die Bereitstellung über ONNX aus Gründen der Interoperabilität oder Optimierung für Mobilgeräte mit TFLite, moderne Klassifizierungs-Workflows auf Flexibilität und Skalierbarkeit