Entdecken Sie, wie überwachtes Lernen KI mit gelabelten Daten antreibt und genaue Vorhersagen und Anwendungen wie Objekterkennung und Sentimentanalyse ermöglicht.
Überwachtes Lernen ist ein vorherrschendes Paradigma auf dem Gebiet des Maschinelles Lernen (ML), bei dem ein Algorithmus auf Eingabedaten trainiert wird, die mit der richtigen Ausgabe gekennzeichnet wurden. Im Gegensatz zu anderen Methoden, bei denen ein System Daten erforscht, stützt sich dieser Ansatz auf einen "Supervisor" - die gekennzeichneten Daten, umden Lernprozess zu steuern. Das Hauptziel ist es, dass das Modell eine Abbildungsfunktion von Eingangsvariablen auf Ausgangsvariablen mit ausreichender dass es die Ergebnisse für neue, noch nicht gesehene Daten vorhersagen kann. Diese Methodik dient als Grundlage für viele kommerziellen Künstliche Intelligenz (KI) Anwendungen, von Spamfiltern bis hin zu fortgeschrittenen Computer Vision (CV) Systemen.
Der Arbeitsablauf beginnt mit einem Datensatz, der Paare von Eingaben (Features) und gewünschten Ausgaben (Labels) enthält. Diese Sammlung wird in der Regel in verschiedene Teilmengen unterteilt: Trainingsdaten zum Anlernen des Modells, Validierungsdaten für die Einstellung der Parameter und Testdaten für die endgültige Bewertung.
Während der Modelltrainingsphase verarbeitet der Algorithmus die Eingabedaten und erstellt eine Vorhersage. Eine mathematische Formel, bekannt als Verlustfunktion bekannt ist, berechnet die Differenz zwischen dieser Vorhersage und der tatsächlichen Kennzeichnung. Um diesen Fehler zu minimieren, wird ein Optimierungsalgorithmus, wie z. B. Gradientenabstieg, iterativ die internen Modellgewichte Modellgewichte an. Dieser Zyklus setzt sich über viele Durchgänge oder Epochen, bis das Modell eine zufriedenstellende Leistung erreicht erreicht, ohne sich zu stark an die Trainingsmenge anzupassen. Für einen tieferen tieferen Einblick in diese Mechanismen erhalten Sie in der Scikit-learn-Leitfaden zum überwachten Lernen.
Die meisten Probleme des überwachten Lernens lassen sich anhand der Art der Ausgangsvariablen in zwei Hauptkategorien einteilen:
Das Trainieren eines überwachten Modells ist mit Hilfe von High-Level-APIs immer einfacher geworden. Das folgende Python zeigt, wie ein YOLO11 auf dem MNIST trainiert wird, einem Standard-Benchmark für die Klassifizierung von Zahlen.
from ultralytics import YOLO
# Load a pretrained classification model
model = YOLO("yolo11n-cls.pt")
# Train the model on the MNIST dataset
# Ultralytics handles the download of the 'mnist160' dataset automatically
results = model.train(data="mnist160", epochs=5, imgsz=64)
# Run inference on a sample image to verify the supervised learning
print(model("https://ultralytics.com/images/bus.jpg"))
Überwachtes Lernen ist die Grundlage für wichtige Technologien in verschiedenen Branchen. Zwei prominente Beispiele sind:
Es ist wichtig, das überwachte Lernen von anderen Paradigmen des maschinellen Lernens zu unterscheiden: