Überwachtes Lernen
Entdecken Sie, wie überwachtes Lernen KI mit gelabelten Daten unterstützt und genaue Vorhersagen und Anwendungen wie Objekterkennung und Stimmungsanalyse ermöglicht.
Überwachtes Lernen ist ein grundlegendes Paradigma des maschinellen Lernens (ML), bei dem ein Algorithmus aus Daten lernt, die manuell mit den richtigen Ergebnissen gekennzeichnet wurden. Das Hauptziel besteht darin, eine Abbildungsfunktion zu erlernen, die die Ausgabe für neue, ungesehene Daten vorhersagen kann. Stellen Sie sich das so vor, als würden Sie mit einem Lehrer oder "Supervisor" lernen, der während der Trainingsphase die richtigen Antworten (Labels) liefert. Dieser Ansatz ist das Rückgrat vieler erfolgreicher Anwendungen der Künstlichen Intelligenz (KI), insbesondere im Bereich der Computer Vision (CV).
Wie das überwachte Lernen funktioniert
Der überwachte Lernprozess beginnt mit einem kuratierten Datensatz, der Eingabemerkmale und entsprechende Ausgabekennzeichnungen enthält. Dieser beschriftete Datensatz wird in Trainingsdaten, Validierungsdaten und Testdaten aufgeteilt.
- Training: Das Modell wird mit den Trainingsdaten gefüttert. Es macht Vorhersagen für jede Eingabe und vergleicht sie mit den richtigen Bezeichnungen.
- Fehlerkorrektur: Die Differenz zwischen der Vorhersage des Modells und der tatsächlichen Bezeichnung wird durch eine Verlustfunktion quantifiziert. Ein Optimierungsalgorithmus, wie z. B. der Gradientenabstieg, passt die internen Parameter des Modells oder die Modellgewichte an, um diesen Fehler zu minimieren.
- Iteration: Dieser Prozess wird für viele Epochen wiederholt, damit das Modell die zugrunde liegenden Muster in den Daten lernen kann. Die Leistung des Modells wird anhand der Validierungsmenge überwacht, um Probleme wie eine Überanpassung zu vermeiden.
- Vorhersage: Sobald das Modell trainiert ist, kann es Vorhersagen für neue, nicht beschriftete Daten treffen. Die Qualität dieser Vorhersagen wird anhand des Testsatzes und der Leistungsmetriken bewertet.
Dieser gesamte Arbeitsablauf wird durch Plattformen wie Ultralytics HUB gestrafft, die die Datensatzverwaltung, die Modellschulung und die Bereitstellung vereinfachen.
Arten von Problemen des überwachten Lernens
Überwachte Lernaufgaben werden in der Regel in zwei Haupttypen eingeteilt:
- Klassifizierung: Das Ziel ist die Vorhersage einer diskreten Kategorie oder Klassenbezeichnung. Ein Bildklassifizierungsmodell könnte zum Beispiel so trainiert werden, dass es Bilder mit einer "Katze" oder einem "Hund" klassifiziert. Weitere Beispiele sind die Erkennung von Spam-E-Mails und die Stimmungsanalyse. Modelle wie Ultralytics YOLO können für leistungsstarke Klassifizierungsaufgaben trainiert werden. Weitere Informationen finden Sie in dieser Einführung in die Klassifizierung.
- Regression: Das Ziel ist die Vorhersage eines kontinuierlichen numerischen Wertes. So könnte ein Modell beispielsweise den Preis eines Hauses auf der Grundlage von Merkmalen wie Größe und Lage vorhersagen. Weitere Anwendungen sind die Vorhersage von Aktienkursen und die Vorhersage von Temperaturen. Einen Überblick über die Regression finden Sie in diesem Leitfaden zur Regressionsanalyse.
Anwendungen in der realen Welt
Überwachtes Lernen ist die Grundlage zahlreicher moderner KI-Systeme. Hier sind zwei prominente Beispiele:
- Objekterkennung in autonomen Fahrzeugen: Selbstfahrende Autos sind auf Objekterkennungsmodelle angewiesen, um Fußgänger, andere Fahrzeuge und Verkehrsschilder zu erkennen und zu lokalisieren. Diese Modelle werden anhand umfangreicher Datensätze trainiert, in denen die Objekte in den Bildern mit Begrenzungsrahmen gekennzeichnet sind. Das trainierte Modell kann dann Echtzeit-Videomaterial verarbeiten, um wichtige Fahrentscheidungen zu treffen. Ultralytics bietet leistungsstarke Lösungen für KI in der Automobilindustrie.
- Medizinische Bildanalyse: Im Gesundheitswesen werden überwachte Lernmodelle für die medizinische Bildanalyse eingesetzt, z. B. zur Erkennung von Tumoren in MRT- oder CT-Scans. Radiologen kennzeichnen eine große Anzahl von Scans und geben an, ob ein Tumor vorhanden ist oder nicht. Ein Faltungsneuronales Netzwerk (CNN) wird dann auf diese Daten trainiert, um die Frühdiagnose zu unterstützen. So können beispielsweise Modelle für die Erkennung von Hirntumoren auf Datensätzen trainiert werden.
Vergleich mit anderen Lernparadigmen
Das überwachte Lernen unterscheidet sich von anderen primären Paradigmen des maschinellen Lernens:
- Unüberwachtes Lernen: Bei diesem Ansatz werden nicht beschriftete Daten verwendet, wobei der Algorithmus versucht, selbständig Muster oder Strukturen zu finden, z. B. die Gruppierung ähnlicher Datenpunkte(Clustering) oder die Verringerung der Datengröße. Er lernt kein direktes Input-Output-Mapping aus bekannten Antworten. Lesen Sie einen Überblick über unüberwachtes Lernen.
- Selbst-überwachtes Lernen (SSL): Ein Teilbereich des unüberwachten Lernens, bei dem die Überwachungssignale (Labels) automatisch aus den Eingabedaten selbst generiert werden. Dies ist eine leistungsstarke Technik für das Vortraining von Basismodellen auf großen Mengen von nicht beschrifteten Daten, bevor sie für eine bestimmte Aufgabe feinabgestimmt werden.
- Verstärkungslernen: In diesem Paradigma lernt ein Agent, eine Reihe von Entscheidungen zu treffen, indem er mit einer Umgebung interagiert und auf der Grundlage seiner Aktionen Belohnungen oder Bestrafungen erhält. Er lernt optimales Verhalten durch Versuch und Irrtum und nicht anhand eines statischen, markierten Datensatzes. Überblick über Reinforcement Learning.
Zusammenfassend lässt sich sagen, dass das überwachte Lernen eine leistungsstarke und weit verbreitete Technik ist, die markierte Daten nutzt, um Modelle für Vorhersageaufgaben zu trainieren. Es bildet das Rückgrat vieler erfolgreicher KI-Anwendungen, einschließlich derer, die von Ultralytics entwickelt und unterstützt werden, und ist eine entscheidende Fähigkeit für jeden, der im Bereich Datenwissenschaft oder KI arbeitet.