Glossar

Bildklassifizierung

Entdecken Sie die Bildklassifizierung mit Ultralytics YOLO: Trainieren Sie mithilfe modernster Tools benutzerdefinierte Modelle für das Gesundheitswesen, die Landwirtschaft, den Einzelhandel und mehr.

Die Bildklassifizierung ist eine grundlegende Aufgabe in der Computer Vision (CV), bei der es darum geht, einem einem gesamten digitalen Bild auf der Grundlage seines visuellen Inhalts ein einziges Etikett oder eine Kategorie zuzuweisen. Dieser Prozess ermöglicht es Maschinen die Welt zu "sehen" und zu interpretieren, indem sie Muster, Objekte oder Szenen in visuellen Daten erkennen. Als eine Kern Komponente der künstlichen Intelligenz (KI) dient es als als Baustein für komplexere visuelle Erkennungssysteme und ermöglicht es automatisierten Systemen, große Mengen an visuellen Informationen effizient zu kategorisieren.

Wie Bildklassifizierung funktioniert

Auf technischer Ebene stützt sich die Bildklassifizierung auf Algorithmen des maschinellen Lernens (ML), insbesondere Modelle des tiefen Lernens (DL), bekannt als Convolutional Neural Networks (CNNs). Diese Netze sind darauf ausgelegt, Pixeldaten zu verarbeiten und automatisch Merkmalsextraktion und identifizieren Low-Level Attribute wie Kanten und Texturen in frühen Schichten und komplexe Formen in tieferen Schichten.

Der Prozess folgt in der Regel einem überwachten Lernansatz:

Training: Das Modell wird mit einem beschrifteten Datensatz gefüttert, z. B. ImageNetder Tausende oder Millionen von Bildern mit bekannten Kategorien enthält.
Lernen: Durch Backpropagation passt das Netz seine internen Modellgewichte an, um Vorhersagefehler zu minimieren.
Inferenz: Einmal trainiert, kann das Modell neue, ungesehene Bilder analysieren und eine Wahrscheinlichkeitsbewertung für jede Klasse mithilfe einer Softmax-Funktion ausgeben. Die Kategorie mit der höchsten Wahrscheinlichkeit wird als endgültige Bezeichnung zugewiesen.

Beliebte Frameworks wie PyTorch und TensorFlow bieten die notwendigen Werkzeuge zum Aufbau und Training dieser anspruchsvollen Architekturen.

Unterscheidung zwischen Klassifizierung und verwandten Aufgaben

Während die Bildklassifizierung die Frage "Was ist in diesem Bild?" beantwortet, wird sie oft mit anderen Computer-Vision-Aufgaben verwechselt. Das Verständnis der Unterscheidungen ist entscheidend für die Auswahl des richtigen Werkzeugs für ein Projekt:

Objekt-Erkennung: Im Gegensatz zur Klassifizierung, bei der das gesamte Bild beschriftet wird, wird bei der Objekterkennung festgestellt, wo sich die Objekte befinden. befinden. Sie zeichnet einen Begrenzungsrahmen um jedes Objekt und klassifiziert sie einzeln.
Bild-Segmentierung: Dies bietet Präzision auf Pixelebene. Die semantische Segmentierung klassifiziert jedes Pixel in eine Kategorie ein (z. B. Straße vs. Himmel), während Instanz-Segmentierung unterscheidet zwischen einzelnen Objekten der gleichen Klasse unterscheidet.

Anwendungsfälle in der Praxis

Die Bildklassifizierung ist in allen Branchen allgegenwärtig und trägt zur Automatisierung und Verbesserung von Entscheidungsprozessen bei.

1. Medizinische Bildgebung und Gesundheitswesen

Auf dem Gebiet der medizinischen Bildanalyse, Klassifizierungsmodelle den Radiologen bei der Vorauswahl von Scans. So können Algorithmen beispielsweise Röntgenaufnahmen classify Brust oder MRTs als "normal" oder "abnormal" klassifizieren und potenzielle Probleme wie Lungenentzündungen oder Tumore zur vorrangigen Überprüfung. Eine Studie der National Institutes of Health (NIH ) zeigt, wie KI zur frühzeitigen Krankheitsdiagnose beiträgt und damit die Ergebnisse für die Patienten deutlich verbessert. Lesen Sie mehr über unsere Arbeit im Bereich Tumorerkennung mit YOLO11.

2. Intelligente Landwirtschaft

In der Präzisionslandwirtschaft wird die Bildklassifizierung zur Überwachung der Pflanzengesundheit eingesetzt. Mit Kameras ausgestattete Drohnen nehmen Bilder von Feldern auf, die dann analysiert werden, um classify Pflanzen als gesund, nährstoffarm oder krank zu classify . Dies ermöglicht gezielte Eingriffe, die den Einsatz von Chemikalien reduzieren und den Ertrag steigern. Die Website Landwirtschaftsministerium der Vereinigten Staaten (USDA) hebt hervor, wie solche Technologien nachhaltige landwirtschaftliche Praktiken fördern. Erfahren Sie, wie Ultralytics die AI in der Landwirtschaft unterstützt, um die moderne Landwirtschaft zu revolutionieren.

Implementierung der Klassifizierung mit YOLO11

Obwohl sie für ihre Aufdeckung bekannt ist, ist die Ultralytics YOLO11 Architektur ist auch hocheffizient bei der Bildklassifizierungsaufgaben. Sie bietet ein ausgewogenes Verhältnis von Geschwindigkeit und Genauigkeit, wodurch sie sich für Echtzeitanwendungen eignet.

Hier ist ein kurzes Beispiel für die Verwendung eines vortrainierten YOLO11 zur classify eines Bildes mit Hilfe der ultralytics Python :

from ultralytics import YOLO

# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Run inference on an external image URL
results = model("https://ultralytics.com/images/bus.jpg")

# Print the top predicted class name
print(f"Predicted class: {results[0].names[results[0].probs.top1]}")

Für Benutzer, die ihre eigenen Lösungen erstellen möchten, können Sie benutzerdefinierte Modelle auf bestimmte Datensätze trainieren, indem sie die gleiche einfache API. Ob Sie nun auf Edge-Geräten mit Tools wie OpenCV oder Skalierung Cloud-Infrastruktur, moderne Klassifizierungsmodelle bieten die Vielseitigkeit, die für verschiedene Szenarien.

Bildklassifizierung

Trainieren Sie Ultralytics YOLO zur Rationalisierung von Arbeitsabläufen in verschiedenen Branchen

Flexible Enterprise-Lizenzlösung zur Förderung Ihrer Innovationen

Trainieren Sie AI-Modelle in Sekundenschnelle mit Ultralytics YOLO

Wie Bildklassifizierung funktioniert

Unterscheidung zwischen Klassifizierung und verwandten Aufgaben

Anwendungsfälle in der Praxis

1. Medizinische Bildgebung und Gesundheitswesen

2. Intelligente Landwirtschaft

Implementierung der Klassifizierung mit YOLO11

Mehr in dieser Kategorie lesen

Verstehen, warum Annotationen durch Menschen entscheidend sind

Was ist Datensatzdestillation? Ein kurzer Überblick

Die Oakley Meta AI-Brille definiert mit Vision AI die Welt der Brillen neu.

Werden Sie Mitglied der Ultralytics