Yolo Vision Shenzhen
Shenzhen
Jetzt beitreten
Glossar

Überwachtes Lernen

Entdecken Sie, wie überwachtes Lernen KI mit gelabelten Daten antreibt und genaue Vorhersagen und Anwendungen wie Objekterkennung und Sentimentanalyse ermöglicht.

Überwachtes Lernen ist ein vorherrschendes Paradigma auf dem Gebiet des Maschinelles Lernen (ML), bei dem ein Algorithmus auf Eingabedaten trainiert wird, die mit der richtigen Ausgabe gekennzeichnet wurden. Im Gegensatz zu anderen Methoden, bei denen ein System Daten erforscht, stützt sich dieser Ansatz auf einen "Supervisor" - die gekennzeichneten Daten, umden Lernprozess zu steuern. Das Hauptziel ist es, dass das Modell eine Abbildungsfunktion von Eingangsvariablen auf Ausgangsvariablen mit ausreichender dass es die Ergebnisse für neue, noch nicht gesehene Daten vorhersagen kann. Diese Methodik dient als Grundlage für viele kommerziellen Künstliche Intelligenz (KI) Anwendungen, von Spamfiltern bis hin zu fortgeschrittenen Computer Vision (CV) Systemen.

Wie das Verfahren funktioniert

Der Arbeitsablauf beginnt mit einem Datensatz, der Paare von Eingaben (Features) und gewünschten Ausgaben (Labels) enthält. Diese Sammlung wird in der Regel in verschiedene Teilmengen unterteilt: Trainingsdaten zum Anlernen des Modells, Validierungsdaten für die Einstellung der Parameter und Testdaten für die endgültige Bewertung.

Während der Modelltrainingsphase verarbeitet der Algorithmus die Eingabedaten und erstellt eine Vorhersage. Eine mathematische Formel, bekannt als Verlustfunktion bekannt ist, berechnet die Differenz zwischen dieser Vorhersage und der tatsächlichen Kennzeichnung. Um diesen Fehler zu minimieren, wird ein Optimierungsalgorithmus, wie z. B. Gradientenabstieg, iterativ die internen Modellgewichte Modellgewichte an. Dieser Zyklus setzt sich über viele Durchgänge oder Epochen, bis das Modell eine zufriedenstellende Leistung erreicht erreicht, ohne sich zu stark an die Trainingsmenge anzupassen. Für einen tieferen tieferen Einblick in diese Mechanismen erhalten Sie in der Scikit-learn-Leitfaden zum überwachten Lernen.

Kernkategorien des überwachten Lernens

Die meisten Probleme des überwachten Lernens lassen sich anhand der Art der Ausgangsvariablen in zwei Hauptkategorien einteilen:

  • Bildklassifizierung: Die Ausgangsvariable ist eine Kategorie oder Klasse. Das Ziel ist die Vorhersage von diskreten Bezeichnungen, z. B. die Bestimmung, ob eine E-Mail "Spam" oder "kein Spam" ist, oder ob ein Bild eine "Katze" oder einen "Hund" enthält. Moderne Architekturen wie Ultralytics YOLO11 zeichnen sich bei diesen Klassifizierungsaufgaben, indem sie schnell Muster in visuellen Daten erkennen.
  • Regression: Die Ausgangs Variable ist ein kontinuierlicher realer Wert. Beispiele sind die Vorhersage von Immobilienpreisen auf der Grundlage der Quadratmeterzahl oder die Vorhersage von Börsentrends. Mehr über die statistischen Grundlagen dieser Methoden erfahren Sie in IBMs Überblick über die Regressionsanalyse.

Implementierung eines Klassifizierungsmodells

Das Trainieren eines überwachten Modells ist mit Hilfe von High-Level-APIs immer einfacher geworden. Das folgende Python zeigt, wie ein YOLO11 auf dem MNIST trainiert wird, einem Standard-Benchmark für die Klassifizierung von Zahlen.

from ultralytics import YOLO

# Load a pretrained classification model
model = YOLO("yolo11n-cls.pt")

# Train the model on the MNIST dataset
# Ultralytics handles the download of the 'mnist160' dataset automatically
results = model.train(data="mnist160", epochs=5, imgsz=64)

# Run inference on a sample image to verify the supervised learning
print(model("https://ultralytics.com/images/bus.jpg"))

Anwendungsfälle in der Praxis

Überwachtes Lernen ist die Grundlage für wichtige Technologien in verschiedenen Branchen. Zwei prominente Beispiele sind:

  1. Autonome Fahrzeuge: Selbstfahrende Autos verlassen sich stark auf Objekterkennungssystemen, die durch überwachtes Lernen Lernen. Mit Kommentaren versehene Datensätze mit Tausenden von Bildern von Fußgängern, Ampeln und anderen Fahrzeugen ermöglichen die KI des Fahrzeugs, Gefahren in Echtzeit zu erkennen und zu lokalisieren. Unternehmen wie NVIDIA setzen Deep Learning ein, um diese umfangreichen Sensordaten für eine sichere Navigation zu verarbeiten.
  2. Medizinische Bildanalyse: Im Gesundheitswesen werden Modelle auf Scans trainiert, die von erfahrenen Radiologen beschriftet wurden, um die Diagnose zu unterstützen. Zum Beispiel kann ein Modell lernen, frühe Anzeichen von Pathologien in Röntgenbildern oder MRTs zu erkennen. Forscher nutzen oft Ressourcen wie den Datensatz zur Erkennung von Hirntumoren, um Systeme zu Systeme zu entwickeln, die die klinische Entscheidungsfindung unterstützen.

Unterscheidung von verwandten Konzepten

Es ist wichtig, das überwachte Lernen von anderen Paradigmen des maschinellen Lernens zu unterscheiden:

  • Unüberwachtes Lernen: Im Gegensatz zum überwachten Lernen arbeitet diese Methode mit unmarkierten Daten. Das Ziel ist es, versteckte Strukturen zu entdecken, wie wie die Gruppierung von Kunden mit ähnlichen Kaufgewohnheiten durch Cluster-Analyse.
  • Verstärkungslernen: Anstatt aus einem statischen Datensatz richtiger Antworten zu lernen, lernt ein Agent durch Interaktion mit seiner Umgebung. Er erhält Rückmeldung in Form von Belohnungen oder Strafen, ein Konzept, das in Sutton und Barto's Reinforcement Learning Einführung.
  • Semi-überwachtes Lernen: Dieser Ansatz stellt einen Mittelweg dar, bei dem eine kleine Menge an gekennzeichneten Daten neben einer größeren Menge an nicht gekennzeichneten Daten verwendet wird. Daten, um die Lerneffizienz zu verbessern. Er wird häufig verwendet, wenn die Kennzeichnung von Daten teuer oder zeitaufwändig ist.

Werden Sie Mitglied der Ultralytics

Gestalten Sie die Zukunft der KI mit. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten