Glossar

Überwachtes Lernen

Entdecken Sie, wie überwachtes Lernen KI mit gelabelten Daten unterstützt und genaue Vorhersagen und Anwendungen wie Objekterkennung und Stimmungsanalyse ermöglicht.

Überwachtes Lernen ist eine grundlegende Kategorie des maschinellen Lernens (ML), bei der Algorithmen aus einem Datensatz lernen, der Eingabe-Ausgabe-Paare enthält, die als markierte Daten bezeichnet werden. Im Wesentlichen ist der Algorithmus "überwacht", weil er lernt, indem er seine Vorhersagen zu den Eingabedaten mit den bekannten korrekten Ausgaben (Labels) vergleicht, die in den Trainingsdaten enthalten sind. Ziel ist es, dass der Algorithmus eine Zuordnungsfunktion lernt, die die Ausgabe für neue, unbekannte Eingaben genau vorhersagen kann. Dieser Ansatz ist für viele moderne Anwendungen der Künstlichen Intelligenz (KI) von zentraler Bedeutung, da er es Systemen ermöglicht, Vorhersagen oder Entscheidungen auf der Grundlage historischer Beispiele zu treffen, die in Benchmark-Datensätzen oder benutzerdefinierten Datensätzen gefunden wurden.

Wie das überwachte Lernen funktioniert

Der Prozess beginnt mit einem sorgfältig vorbereiteten Datensatz, bei dem jeder Datenpunkt aus Eingangsmerkmalen und einer entsprechenden korrekten Ausgangsbezeichnung besteht. Dies erfordert oft einen erheblichen Aufwand bei der Datenerfassung und -beschriftung. Bei einer Bildklassifizierungsaufgabe wären die Eingaben beispielsweise Bilder (die vielleicht mit Techniken aus Bibliotheken wie OpenCV vorverarbeitet wurden), und die Beschriftungen wären die Kategorien, zu denen sie gehören (z. B. "Katze", "Hund"). Der Algorithmus macht iterativ Vorhersagen für die Trainingsdaten und passt seine internen Parameter (oder Modellgewichte) mithilfe eines Optimierungsalgorithmus wie Stochastic Gradient Descent (SGD) oder Adam an, um die Differenz zwischen seinen Vorhersagen und den tatsächlichen Bezeichnungen zu minimieren. Diese Differenz wird durch eine Verlustfunktion gemessen. Dieses Training wird fortgesetzt, oft über mehrere Epochen hinweg, bis das Modell ein zufriedenstellendes Maß an Genauigkeit oder andere relevante Leistungskennzahlen auf separaten Validierungsdaten erreicht, wodurch sichergestellt wird, dass es sich gut auf neue Daten verallgemeinern lässt und eine Überanpassung vermieden wird.

Relevanz und Anwendungen

Überwachtes Lernen ist unglaublich vielseitig und ermöglicht eine Vielzahl von Anwendungen, bei denen historische Daten zukünftige Ereignisse vorhersagen oder neue Informationen klassifizieren können. Durch seine Fähigkeit, direkt von markierten Beispielen zu lernen, eignet es sich für Aufgaben, die eine hohe Präzision erfordern. Viele Computer-Vision-Aufgaben (CV) beruhen in hohem Maße auf überwachtem Lernen, einschließlich solcher, die von hochmodernen Modellen wie Ultralytics YOLO durchgeführt werden.

Hier sind zwei konkrete Beispiele:

  • Medizinische Bildanalyse: Modelle des überwachten Lernens können auf medizinischen Scans (wie MRT- oder CT-Scans) trainiert werden, die von Radiologen beschriftet wurden, um Tumore in der medizinischen Bildgebung zu erkennen. Dies unterstützt medizinisches Fachpersonal bei der Diagnose und bildet einen Kernbestandteil vieler KI-Lösungen im Gesundheitswesen. Siehe verwandte Forschungsarbeiten aus Quellen wie Radiologie: Künstliche Intelligenz.
  • Stimmungsanalyse: Algorithmen lernen aus Textdaten, die mit Stimmungskategorien (z. B. positiv, negativ, neutral) gekennzeichnet sind, um automatisch die Stimmung zu bestimmen, die in neuen Texten wie Kundenrezensionen oder Beiträgen in sozialen Medien zum Ausdruck kommt. Dies ist wertvoll für die Marktforschung und die Markenüberwachung. Erfahren Sie mehr über Sentiment-Analyse.

Weitere gängige Anwendungen sind die Objekterkennung in Bildern und Videos (für autonome Fahrzeuge und Sicherheitssysteme), die Filterung von Spam-E-Mails, die Vorhersage von Immobilienpreisen (eine Regressionsaufgabe ) und die Gesichtserkennung. Sie wird auch in der KI für eine intelligentere Bestandsverwaltung im Einzelhandel und in KI-Lösungen für die Landwirtschaft eingesetzt.

Wichtige Konzepte

Mehrere Konzepte sind für das Verständnis und die effektive Anwendung des überwachten Lernens von zentraler Bedeutung:

Vergleich mit anderen Lernparadigmen

Das überwachte Lernen unterscheidet sich von anderen primären Paradigmen des maschinellen Lernens:

  • Unüberwachtes Lernen: Bei diesem Ansatz werden nicht beschriftete Daten verwendet, wobei der Algorithmus versucht, selbständig Muster oder Strukturen zu finden, z. B. die Gruppierung ähnlicher Datenpunkte(Clustering) oder die Verringerung der Datengröße. Er lernt kein direktes Input-Output-Mapping aus bekannten Antworten. Lesen Sie einen Überblick über unüberwachtes Lernen.
  • Verstärkungslernen: In diesem Paradigma lernt ein Agent, eine Reihe von Entscheidungen zu treffen, indem er mit einer Umgebung interagiert und auf der Grundlage seiner Aktionen Belohnungen oder Bestrafungen erhält. Er lernt optimale Verhaltensweisen durch Versuch und Irrtum und nicht anhand etikettierter Beispiele. Überblick über Reinforcement Learning.

Zusammenfassend lässt sich sagen, dass das überwachte Lernen eine leistungsstarke und weit verbreitete Technik ist, die markierte Daten nutzt, um Modelle für Vorhersageaufgaben zu trainieren. Es bildet das Rückgrat vieler erfolgreicher KI-Anwendungen, einschließlich derer, die von Ultralytics entwickelt und unterstützt werden, und ist eine entscheidende Fähigkeit für jeden, der im Bereich Datenwissenschaft oder KI arbeitet.

Werden Sie Mitglied der Ultralytics-Gemeinschaft

Beteiligen Sie sich an der Zukunft der KI. Vernetzen Sie sich, arbeiten Sie zusammen und wachsen Sie mit globalen Innovatoren

Jetzt beitreten
Link in die Zwischenablage kopiert