Entdecke, wie überwachtes Lernen KI mit gelabelten Daten antreibt und genaue Vorhersagen und Anwendungen wie Objekterkennung und Stimmungsanalyse ermöglicht.
Überwachtes Lernen ist eine grundlegende Kategorie des maschinellen Lernens (ML), bei der Algorithmen aus einem Datensatz lernen, der Eingabe-Ausgabe-Paare enthält, die als gelabelte Daten bezeichnet werden. Im Wesentlichen ist der Algorithmus "überwacht", weil er lernt, indem er seine Vorhersagen für die Eingabedaten mit den bekannten korrekten Ausgaben (Labels) vergleicht, die in den Trainingsdaten enthalten sind. Das Ziel ist, dass der Algorithmus eine Zuordnungsfunktion lernt, die die Ausgabe für neue, unbekannte Eingaben genau vorhersagen kann. Dieser Ansatz ist für viele moderne Anwendungen der Künstlichen Intelligenz (KI) von zentraler Bedeutung. Er ermöglicht es Systemen, Vorhersagen oder Entscheidungen auf der Grundlage von historischen Beispielen zu treffen, die in Benchmark-Datensätzen oder eigenen Datensätzen gefunden wurden.
Der Prozess beginnt mit einem sorgfältig vorbereiteten Datensatz, bei dem jeder Datenpunkt aus Eingangsmerkmalen und einem entsprechenden korrekten Ausgangslabel besteht. Dies erfordert oft einen erheblichen Aufwand bei der Datenerfassung und -beschriftung. Bei einer Bildklassifizierungsaufgabe wären die Eingaben beispielsweise Bilder (die vielleicht mit Techniken aus Bibliotheken wie OpenCV vorverarbeitet wurden), und die Beschriftungen wären die Kategorien, zu denen sie gehören (z. B. "Katze", "Hund"). Der Algorithmus macht iterativ Vorhersagen für die Trainingsdaten und passt seine internen Parameter (oder Modellgewichte) mithilfe eines Optimierungsalgorithmus wie Stochastic Gradient Descent (SGD) oder Adam an, um die Differenz zwischen seinen Vorhersagen und den tatsächlichen Bezeichnungen zu minimieren. Dieser Unterschied wird durch eine Verlustfunktion gemessen. Dieses Training wird fortgesetzt, oft über mehrere Epochen hinweg, bis das Modell eine zufriedenstellende Genauigkeit oder andere relevante Leistungskennzahlen auf separaten Validierungsdaten erreicht hat.
Überwachtes Lernen ist unglaublich vielseitig und ermöglicht eine Vielzahl von Anwendungen, bei denen historische Daten zukünftige Ereignisse vorhersagen oder neue Informationen klassifizieren können. Durch seine Fähigkeit, direkt aus markierten Beispielen zu lernen, eignet es sich für Aufgaben, die eine hohe Präzision erfordern. Viele Aufgaben im Bereich Computer Vision (CV) beruhen in hohem Maße auf überwachtem Lernen, einschließlich der Aufgaben, die von modernen Modellen wie Ultralytics YOLO.
Hier sind zwei konkrete Beispiele:
Weitere gängige Anwendungen sind die Objekterkennung in Bildern und Videos (für autonome Fahrzeuge und Sicherheitssysteme), die Filterung von Spam-E-Mails, die Vorhersage von Immobilienpreisen (eine Regressionsaufgabe ) und die Gesichtserkennung. Sie wird auch in der KI für ein intelligenteres Bestandsmanagement im Einzelhandel und in der KI in der Landwirtschaft eingesetzt.
Mehrere Konzepte sind für das Verständnis und die effektive Anwendung von überwachtem Lernen von zentraler Bedeutung:
Überwachtes Lernen unterscheidet sich von anderen primären Paradigmen des maschinellen Lernens:
Zusammenfassend lässt sich sagen, dass das überwachte Lernen eine leistungsstarke und weit verbreitete Technik ist, bei der markierte Daten genutzt werden, um Modelle für Vorhersageaufgaben zu trainieren. Es bildet das Rückgrat vieler erfolgreicher KI-Anwendungen, einschließlich derer, die von Ultralytics entwickelt und unterstützt werden, und ist eine wichtige Fähigkeit für alle, die im Bereich Data Science oder KI arbeiten.